張娟
[提要] 為科學分析網(wǎng)絡搜索數(shù)據(jù)與房地產(chǎn)價格之間的變動關系,本文以百度搜索指數(shù)為基礎,選取與房地產(chǎn)價格相關度較高的7個關鍵詞構建全新的綜合網(wǎng)絡搜索指數(shù),并運用自回歸分布滯后模型對房地產(chǎn)價格指數(shù)進行擬合與預測,得到房地產(chǎn)價格指數(shù)預測模型。最后把該模型用于河北省石家莊市、唐山市和秦皇島市房地產(chǎn)市場的驗證和預測,結果表明:本文構建的綜合網(wǎng)絡搜索指數(shù)與新建商品住宅價格指數(shù)之間的ADL模型能夠及時、客觀、準確地預測房地產(chǎn)價格變動趨勢,具有明顯的可操作性。
關鍵詞:網(wǎng)絡搜索;數(shù)據(jù)分析;房地產(chǎn)價格;ADL模型
基金項目:河北省統(tǒng)計科學研究計劃項目:“基于網(wǎng)絡搜索數(shù)據(jù)的河北省房地產(chǎn)價格預測研究”(2014HY27);河北省科技廳軟科學研究計劃項目:“基于互聯(lián)網(wǎng)征信數(shù)據(jù)的中小微企業(yè)信用評估體系研究”(154576271)
中圖分類號:C812 文獻標識碼:A
收錄日期:2017年7月19日
近年來,伴隨著各地限購、限貸或其他抑制房價政策的出臺,房地產(chǎn)市場的價格走勢已經(jīng)成為各類購房者、房地產(chǎn)商以及房產(chǎn)信息網(wǎng)站共同關注的關鍵問題。國家統(tǒng)計局每月中旬發(fā)布的房地產(chǎn)價格指數(shù)明顯具有時效性的欠缺,難以作為房地產(chǎn)價格走勢的即時性參考,而本文提出的網(wǎng)絡搜索關鍵詞綜合指數(shù)法則可以有效地預測未來房地產(chǎn)價格的走勢。
一、網(wǎng)絡搜索數(shù)據(jù)測度
在互聯(lián)網(wǎng)信息化時代人們使用各種搜索引擎獲取各類信息,搜索引擎的搜索數(shù)據(jù)逐漸在社會科學研究中得到應用。利用網(wǎng)絡算法技術搜索與輸入性關鍵詞和索引相匹配的網(wǎng)頁和數(shù)據(jù)已經(jīng)成為經(jīng)濟預測的重要手段之一,可以這樣說,分析網(wǎng)絡搜索數(shù)據(jù)不僅能夠找到經(jīng)濟主體預期行為的基本規(guī)律和變化趨勢,而且還會發(fā)現(xiàn)比經(jīng)濟主體實際行為更具時效性的資料和數(shù)據(jù)。在國內(nèi)三大主流搜索引擎百度、Google和搜狗的篩選中,Google存在著對中文支持不足的缺點、搜狗具有數(shù)據(jù)庫信息不對稱的特征,唯有百度搜索引擎最具說服力和代表性,為此本文選用百度搜索引擎作為數(shù)據(jù)分析的基礎。為了對百度搜索欄中出現(xiàn)的關鍵詞進行熱度分析,本文借用了百度網(wǎng)站經(jīng)常使用的百度搜索指數(shù)來構建全新的網(wǎng)絡搜索指數(shù)。百度搜索指數(shù)是指百度官方計算的各個關鍵詞在百度網(wǎng)頁中出現(xiàn)頻率的加權和、網(wǎng)絡搜索數(shù)據(jù)的測度以百度關鍵詞的指數(shù)數(shù)據(jù)為基礎。盡管目前的網(wǎng)絡搜索技術已經(jīng)非常成熟,但國內(nèi)外真正利用百度搜索數(shù)據(jù)來預測房價走勢的研究成果相對較少,零星的研究仍處于起步階段。為此,本文首先構建了綜合網(wǎng)絡搜索指數(shù)并借此研究該指數(shù)與房地產(chǎn)價格的相關性。
(一)關鍵詞的選定。首先,篩選與房地產(chǎn)價格有關的關鍵詞,關鍵詞指數(shù)數(shù)據(jù)選取百度中整體趨勢的搜索指數(shù)。初始關鍵詞依據(jù)人們關注房地產(chǎn)價格時考慮的主要因素,具體包含房地產(chǎn)市場的總體狀況、房地產(chǎn)的相關政策、房地產(chǎn)市場的交易信息等,據(jù)此得到相關聯(lián)的關鍵詞75個。由于百度搜索引擎會推薦一些與我們搜索內(nèi)容有關的其他關鍵詞,因此綜合起來所有的關鍵詞達到了90個;其次,依據(jù)百度指數(shù)中的需求圖譜及相關詞分類的相關度,將相關度低的或類似的關鍵詞刪掉,剩余的關鍵詞再進行進一步的關聯(lián)度對比,最終保留相關度較高的7個關鍵詞:房價(k1)、房源(k2)、房產(chǎn)網(wǎng)(k3)、新樓盤(k4)、房貸利率(k5)、公積金(k6)、裝修(k7)。
(二)綜合網(wǎng)絡搜索指數(shù)的構建。為科學的分析河北省的情況,選取最具代表性的三個城市:石家莊市、唐山市和秦皇島市。以三個城市為例,依據(jù)2011年1月1日至2016年12月31日的關鍵詞周平均指數(shù),利用移動平均法計算得到2011年1月至2016年12月的月平均指數(shù),為將所選關鍵詞的百度搜索指數(shù)合成一個綜合網(wǎng)絡搜索指數(shù)WI,構建合成指數(shù)計算公式:WI=■Iiwi。其中,Ii為第i個關鍵詞的百度搜索指數(shù),wi為第i個指數(shù)的權重,權重的確定利用主成分分析進行。由此根據(jù)所選三個城市7個關鍵詞的百度搜索指數(shù)數(shù)據(jù),利用SAS軟件進行主成分分析,得到第一主成分的特征向量如表1所示。將各系數(shù)進行歸一化處理后作為各個關鍵詞指數(shù)的權重。根據(jù)表1得到的權重分別計算得到石家莊市、唐山市、秦皇島市的綜合網(wǎng)絡搜索指數(shù),記為WIS、WIT、WIQ,如圖1所示。(表1、圖1)
二、網(wǎng)絡搜索指數(shù)與房地產(chǎn)價格之間的相關性
購房者借助網(wǎng)絡搜索技術找到所需相關信息,實現(xiàn)了購買房產(chǎn)時的較高參與度。這說明網(wǎng)絡搜索數(shù)據(jù)能夠顯示出房地產(chǎn)參與主體的預期,也展示了房地產(chǎn)業(yè)各參與主體的購買習慣和行為走向,進而對房地產(chǎn)的價格產(chǎn)生影響。
(一)理論分析。供求因素是影響房地產(chǎn)價格的重要因素,互聯(lián)網(wǎng)的搜索引擎為房地產(chǎn)參與主體提供了便利的信息供應。通常情況下,消費者在購房的時候會抱有謹慎的態(tài)度,并且由于房地產(chǎn)的位置固定性、價值量大、流動性差等特點,使房地產(chǎn)市場的供求信息處于一種不對稱狀態(tài)。消費者在購房需求產(chǎn)生之后通常都會花費大量時間搜集相關信息,消費者對這些信息的關注程度展示了消費者對房地產(chǎn)市場供需狀況的反應,進而影響到預期的購買行為。就房地產(chǎn)市場的參與各方而言,面對宏觀經(jīng)濟政策的變化都存在一個心理預期的形成過程。政策變動時,其投資行為或購買行為會考慮新政策下的預期收益和成本變動等問題。也就是說,房地產(chǎn)價格的變化并不會隨著宏觀經(jīng)濟政策的變化立即產(chǎn)生,而是存在明顯的時滯性。這說明購房者及房地產(chǎn)商的行為都可以在互聯(lián)網(wǎng)上和實際市場中反映出來,互聯(lián)網(wǎng)絡搜索關鍵詞的變化成為各參與主體預期行為的表現(xiàn),而各參與方的實際行為則反映在房地產(chǎn)價格的滯后變化上。
(二)網(wǎng)絡搜索指數(shù)與房地產(chǎn)價格互相關分析。房地產(chǎn)價格選取新建商品住宅價格環(huán)比指數(shù)(FI)作為研究變量,三個城市的新建商品住宅價格指數(shù)分別記為FIS、FIT、FIQ,選取國家統(tǒng)計局公布的2011年1月到2016年12月數(shù)據(jù),如圖2所示。(圖2)
由圖1和圖2可以看出,網(wǎng)絡搜索指數(shù)與新建商品住宅價格指數(shù)之間存在較明顯的共同變化趨勢,為進一步研究二者之間的關系,采用時間序列互相關函數(shù)進一步分析。
1、平穩(wěn)性檢驗。首先對各變量進行平穩(wěn)性檢驗,檢驗結果如表2所示??梢钥闯觯篎IS、FIT、FIQ、WIS、WIT、WIQ的ADF統(tǒng)計量在10%的顯著水平下都是平穩(wěn)的。(表2)
2、互相關函數(shù)分析?;ハ嚓P函數(shù)能夠測度兩變量之間的相關強度和方向,利用Eviews8.0作互相關函數(shù)圖,分別對石家莊市、唐山市、秦皇島市的網(wǎng)絡搜索指數(shù)與新建商品住宅價格指數(shù)進行互相關分析。(表3、表4、表5)
表3顯示石家莊市的網(wǎng)絡搜索指數(shù)與新建商品住宅價格指數(shù)存在明顯滯后的正相關關系。FIS與WIS(-i)之間的關系中可以看出,滯后的WIS與FIS相關性較顯著,相關關系一直持續(xù)到滯后第9期,滯后第10期開始逐漸減弱,尤其是WIS(-6)、WIS(-7)、WIS(-8)與FIS的正相關性較強,說明人們進行網(wǎng)絡搜索的變化與半年以后的房價相關聯(lián);在FIS與WIS(+i)之間的關系中,顯示出FIS與未來的WIS也存在一定的相關性,尤其是未來4期的負相關關系明顯,說明房價變化與未來網(wǎng)絡搜索量的反向變動關系明顯,人們對石家莊市房價的反應較敏感。
表4顯示唐山市的網(wǎng)絡搜索指數(shù)與新建商品住宅價格指數(shù)的正相關關系滯后作用期更長一些,WIT與FIT的相關關系稍弱于石家莊市。FIT與WIT(-i)之間的關系中,從滯后第6期,WIT與FIT的相關性才開始增強,WIT(-9)與FIT的相關性最顯著,一直持續(xù)到滯后11期,然后逐漸減弱;在FIT與WIT(+i)的關系中,F(xiàn)IT與未來WIT的負相關性顯現(xiàn)的較緩慢,未來的8期之后負相關關系才逐漸增強,說明唐山市房價發(fā)生變化后,網(wǎng)絡搜索的反應較慢,人們對唐山市房價的反應不夠敏感。
表5顯示秦皇島市的網(wǎng)絡搜索指數(shù)與新建商品住宅價格指數(shù)之間的滯后相關也較明顯,與唐山市相似,但正相關關系更強一點。FIQ與WIQ(-i)之間的關系中,WIQ與FIQ的滯后相關關系不斷增強,WIQ(-9)與FIQ的相關關系最強,滯后相關持續(xù)到滯后11期,第12期開始逐漸減弱;在FIQ與WIQ(+i)之間的關系中,F(xiàn)IT與未來WIT的負相關性顯現(xiàn)的也較緩慢,負相關程度顯現(xiàn)的比唐山市的稍強一些,說明人們對秦皇島市房價的反應比唐山市敏感一些。
三、基于ADL模型的預測分析
(一)模型的構建與估計。通過互相關函數(shù)的分析可以看出,網(wǎng)絡搜索指數(shù)(WI)與新建商品住宅價格指數(shù)(FI)存在明顯的滯后關系,而且滯后期較長,因此構建能夠反映滯后影響關系的自回歸分布滯后模型ADL(1,n)模型:
FIt=c+?琢FIt-1+?茁0WIt+?茁1WIt-1+?茁2WIt-2+…+ut
模型中,下標t表示第t月,u為隨機擾動項。由于FI與WI互相關函數(shù)分析的滯后期較長,因此模型的構建中加入了FIt-1,并且對WI的滯后期沒有加以限制,但WI的滯后期長度需要在模型的估計中進行驗證。根據(jù)AIC、SC信息準則,從滯后11階開始驗證模型,以此得到最顯著的滯后階數(shù)。運用Eviews8.0對三個城市分別進行模型的驗證與估計,估計方法采用阿爾蒙多項式法,最終驗證的模型及結果如表6所示。(表6)
模型估計結果表明,網(wǎng)絡搜索指數(shù)對房地產(chǎn)價格確實存在滯后影響,石家莊市的滯后影響在第4~8個月比較顯著,唐山市的為第7~11個月,秦皇島的為第6~9個月,說明對河北省房價感興趣的購房者通常會提前半年左右甚至提前更長時間搜索相關信息,換言之,根據(jù)當前用戶的網(wǎng)絡搜索數(shù)據(jù)可以預測半年以后的房地產(chǎn)價格。
(二)基于ADL模型的預測。根據(jù)2017年1月和2月的百度搜索數(shù)據(jù)計算得到網(wǎng)絡搜索指數(shù)的WI,利用表6的驗證模型分別對石家莊市、唐山市和秦皇島市的新建商品住宅價格指數(shù)進行預測,預測結果如表7所示。三個模型進行預測的平均相對預測誤差MAPE分別是0.21%、0.21%、0.29%。(表7)
預測結果顯示,2017年1月和2月河北省石家莊市、唐山市和秦皇島市的新建商品住宅價格指數(shù)均大于1,說明房價均有所上漲,與實際國家統(tǒng)計局公布的實際數(shù)據(jù)相比,三個模型的預測誤差很小,預測結果與實際相符,模型的預測效果很好。
四、結論
通過理論分析網(wǎng)絡搜索數(shù)據(jù)與房地產(chǎn)價格之間的關系,利用互相關函數(shù)分析進一步證實網(wǎng)絡搜索指數(shù)與新建商品住宅價格指數(shù)之間的滯后相關,據(jù)此建立的自回歸分布滯后模型更具體展現(xiàn)了二者之間的滯后影響關系。石家莊市、唐山市、秦皇島市的數(shù)據(jù)經(jīng)過模型的驗證都充分說明房地產(chǎn)參與主體的網(wǎng)絡搜索行為與房地產(chǎn)價格之間存在的滯后關系。綜合來看,滯后影響在滯后第4~11個月之間較顯著。這一結果表明購房者一般會提前半年至一年的時間搜索相關信息,而當前搜索行為的數(shù)據(jù)為以后房地產(chǎn)價格的預測提供了信息基礎。本文構建的綜合網(wǎng)絡搜索指數(shù)與新建商品住宅價格指數(shù)之間的ADL模型,能夠比較及時、客觀、準確地預測房地產(chǎn)價格的變動,相對于其他方法來說,消除了主觀因素的影響,預測的時效性更強,體現(xiàn)出網(wǎng)絡搜索數(shù)據(jù)對房地產(chǎn)價格具有較好的預測效果。
主要參考文獻:
[1]孟彩云,王聰.房地產(chǎn)價格、泰勒規(guī)則與宏觀經(jīng)濟調(diào)控——基于2000~2010年我國宏觀經(jīng)濟數(shù)據(jù)的檢驗[J].當代財經(jīng),2012.2.
[2]董紀昌,李秀婷.基于網(wǎng)絡關鍵詞搜索的房地產(chǎn)價格影響因素研究[J].新疆財經(jīng)大學學報,2013.3.
[3]劉枬,劉小娟.房地產(chǎn)大數(shù)據(jù)的研究現(xiàn)狀和趨勢分析[J].建筑經(jīng)濟,2015.6.