徐穎 黃素珍
摘 要:大數(shù)據(jù)時(shí)代推動(dòng)了房地產(chǎn)市場(chǎng)思維方式、管理方式和商業(yè)模式的變革。本文利用百度搜索數(shù)據(jù),以江蘇省南京市為例建立了新建住宅銷售價(jià)格指數(shù)的多元線性回歸、完全二次多項(xiàng)式回歸和逐步回歸模型,仿真結(jié)果表明,逐步回歸模型預(yù)測(cè)精度高,穩(wěn)定性好。
關(guān)鍵詞:大數(shù)據(jù) 百度指數(shù) 新房?jī)r(jià)格 逐步回歸模型
中圖分類號(hào):F726 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-0298(2017)02(a)-134-04
1 引言
2016年12月中旬,中央經(jīng)濟(jì)工作會(huì)議提出,要堅(jiān)持“房子是用來(lái)住的,不是用來(lái)炒的”的定位,要求回歸住房居住屬性。住房?jī)r(jià)格高居民承受能力低,居住水平和居住質(zhì)量會(huì)由此下降;反之住房?jī)r(jià)格水平低,能增強(qiáng)居民的購(gòu)房能力,相應(yīng)提高居民的居住水平和居住質(zhì)量。因此,住房?jī)r(jià)格的高低成為關(guān)系到居民切身利益的重大經(jīng)濟(jì)問(wèn)題和社會(huì)問(wèn)題。
影響房地產(chǎn)價(jià)格的因素有很多,如果把所有可能影響的因素全部考慮進(jìn)去,所建立起來(lái)的回歸方程卻不一定是最好的。首先由于自變量過(guò)多,使用不便,而且在回歸方程中引入無(wú)意義的量,會(huì)使誤差方差的估計(jì)值增大,降低預(yù)測(cè)的精確性及回歸方程的穩(wěn)定性。另一方面,通常希望回歸方程中包含的變量盡可能多一些,特別是對(duì)房?jī)r(jià)有顯著影響的自變量,這樣會(huì)減小誤差方差的估計(jì)值,從而提高預(yù)測(cè)的精度。
本文嘗試?yán)冒俣纫嫣峁┑挠绊懛績(jī)r(jià)的因素搜索指數(shù),建立新建住宅銷售價(jià)格指數(shù)和二手住宅銷售價(jià)格指數(shù)的多元線性回歸、完全二次多項(xiàng)式回歸和逐步回歸模型,仿真結(jié)果表明,逐步回歸模型預(yù)測(cè)精度高,穩(wěn)定性好。
2 房?jī)r(jià)預(yù)測(cè)模型構(gòu)建
3 數(shù)據(jù)的獲取與處理
因變量分別是新建商品住宅銷售價(jià)格指數(shù)。采用2014年1月~2016年8月共32個(gè)月的月度同比數(shù)據(jù),來(lái)源于國(guó)家統(tǒng)計(jì)局網(wǎng)站。
解釋變量是與新房?jī)r(jià)格相關(guān)的某些關(guān)鍵詞的網(wǎng)絡(luò)搜索指數(shù)。根據(jù)董倩等在文中的方法[2],對(duì)于新房?jī)r(jià)格預(yù)測(cè),最終選取了8個(gè)關(guān)鍵詞,分別是房?jī)r(jià)走勢(shì)、房源、裝修、房產(chǎn)網(wǎng)、公積金、房貸利率、新樓盤、保障房。
為了與因變量保持一致,我們對(duì)所有關(guān)鍵詞的搜索指數(shù)做如下處理:首先將根據(jù)日搜索指數(shù)計(jì)算月度平均搜索指數(shù),然后將月度平均搜索指數(shù)轉(zhuǎn)換為同比數(shù)據(jù),最終得到所有關(guān)鍵詞從2014年1月到2016年8月的月度同比數(shù)據(jù)。
最后將因變量和解釋變量的月度同比數(shù)據(jù)先加1再取對(duì)數(shù)。
4 仿真分析
本文采用matlab技術(shù),以南京市為例建立和分析新房?jī)r(jià)格預(yù)測(cè)模型。
4.1 可視化相關(guān)性分析
對(duì)表1中的數(shù)據(jù)按照上述方法進(jìn)行數(shù)據(jù)處理,并在matlab中讀入處理后的數(shù)據(jù),建立因變量矩陣和解釋變量矩陣,計(jì)算變量間的相關(guān)系數(shù)矩陣R和線性相關(guān)性檢驗(yàn)的P值矩陣P,繪制相關(guān)系數(shù)矩陣圖如圖1。
4.2 多元線性回歸
第一步,模型的建立。
從圖3可以看出,殘差基本服從正態(tài)分布。
第五步,模型改進(jìn)。
4.4 擬合效果圖
上面調(diào)用fi t函數(shù)作了8元線性回歸擬合、6元線性回歸擬合和完全二次多項(xiàng)式擬合,得出了3個(gè)經(jīng)驗(yàn)回歸方程⑻⑼⑽。擬合效果圖如圖4所示。
單純從擬合的準(zhǔn)確性來(lái)看,完全二次多項(xiàng)式回歸擬合的擬合效果較好,8元和6元線性回歸擬合的擬合效果差不多,相對(duì)都比較差。
4.5 逐步回歸
在完全二次多項(xiàng)式回歸模型的基礎(chǔ)上,利用linearmodel類對(duì)象的stepwise方法,經(jīng)過(guò)19次回歸,得到二次多項(xiàng)式回歸方程如下:
5 結(jié)語(yǔ)
房地產(chǎn)行業(yè)多年畸形發(fā)展催生了畸高的房?jī)r(jià),從嚴(yán)調(diào)控、保持房地產(chǎn)市場(chǎng)的平穩(wěn)健康發(fā)展被寫入多個(gè)省份的政府工作報(bào)告。本文以百度搜索數(shù)據(jù)為基礎(chǔ),建立了房?jī)r(jià)預(yù)測(cè)的“最優(yōu)”模型——逐步回歸模型,該模型不但可以即時(shí)預(yù)測(cè)房?jī)r(jià)的走勢(shì),而且為地方政府制定調(diào)控房?jī)r(jià)措施提供有效的參考依據(jù)。另外,本文建立的房?jī)r(jià)預(yù)測(cè)模型還可以拓展到其他城市新房?jī)r(jià)格的預(yù)測(cè)和二手房?jī)r(jià)格的預(yù)測(cè),可以預(yù)見(jiàn),在人們利用網(wǎng)絡(luò)搜索房產(chǎn)信息越來(lái)越多的將來(lái),由于搜索數(shù)據(jù)量越來(lái)越大,從而預(yù)測(cè)的精度會(huì)越來(lái)越高.
參考文獻(xiàn)
[1] 謝中華.MATLAB統(tǒng)計(jì)分析與應(yīng)用[M].北京:北京航空航天大學(xué)出版社,2015.
[2] 董倩,等.基于網(wǎng)絡(luò)搜索數(shù)據(jù)的房地產(chǎn)價(jià)格預(yù)測(cè)[J].統(tǒng)計(jì)研究,2014(10).
[3] 成鴻飛,等.基于MATLAB的房?jī)r(jià)預(yù)測(cè)與調(diào)控模型研究[J].科技論壇,2010(6).
[4] 楊志輝,等.基于MATLAB的房地產(chǎn)銷售預(yù)測(cè)的科學(xué)計(jì)算[J].統(tǒng)計(jì)與決策,2005(1).
[5] 劉悅婷,等.基于MATLAB的蘭州市商品住宅價(jià)格變動(dòng)分析及預(yù)測(cè)[J].甘肅科學(xué)學(xué)報(bào),2011(9).