□文/賈培佩 張 泰 張文良
(1.河北金融學院;2.河北軟件職業(yè)技術學院河北·保定)
網(wǎng)絡搜索數(shù)據(jù)與消費者信心指數(shù)自回歸模型研究
□文/賈培佩1張?zhí)?張文良1
(1.河北金融學院;2.河北軟件職業(yè)技術學院河北·保定)
[提要]本文建立網(wǎng)絡搜索數(shù)據(jù)與消費者信心指數(shù)自回歸時間序列模型,對消費者信心指數(shù)進行分析,發(fā)現(xiàn)網(wǎng)絡搜索數(shù)據(jù)和消費者信心指數(shù)之間存在顯著相關性。
網(wǎng)絡搜索數(shù)據(jù);消費者信心指數(shù);相關性
收錄日期:2015年8月19日
隨著互聯(lián)網(wǎng)科技的發(fā)展,以及我國固定網(wǎng)絡和移動網(wǎng)絡的迅速普及,人們獲取信息的方式正在由傳統(tǒng)渠道向信息化渠道發(fā)展。本文主要對網(wǎng)絡搜索數(shù)據(jù)和消費者信心指數(shù)之間的相關性進行了探討。關鍵詞初選是整個研究的第一歩,搜索引擎的推薦、Googlecorrelate關鍵詞挖掘工具、SEO關鍵字挖掘和ICTCLAS漢語分詞系統(tǒng)是確定初選網(wǎng)絡搜索詞的四個重要方法,然后基于關鍵詞搜索量的相對值與消費者信心指數(shù)的實際變化的相關性強弱,來確定最終用于研究的關鍵詞,同時還可以在運用時差相關分析法確定相關性大小的過程中,發(fā)現(xiàn)其不同關鍵詞的領先或滯后階數(shù)。最后,將關鍵詞搜索指數(shù)與消費者信心指數(shù)進行相關性分析。
(一)關鍵詞初選。網(wǎng)絡搜索數(shù)據(jù)反映的是在某段時期,該關鍵詞的被關注度和搜索熱度。消費者信心指數(shù)同比數(shù)據(jù)來自于我國國家統(tǒng)計局官方網(wǎng)站數(shù)據(jù)庫的統(tǒng)計數(shù)據(jù)。兩種數(shù)據(jù)選取的時段是從2009年11月到2013年6月。
本文根據(jù)消費者信心指數(shù)的編制結構,選定了經(jīng)濟發(fā)展形勢、家庭收入和就業(yè)、物價水平、消費或購買意愿等構成和影響因素,選擇了“GDP”、“就業(yè)率”、“貨幣供應量”、“黃金”和“二手房”等比較原始的網(wǎng)絡搜索關鍵詞。除了百度搜索風云榜等比較簡單的關鍵詞挖掘方法對與消費者信心比較相關的領域進行了初步的關鍵詞搜集外,還運用了數(shù)據(jù)挖掘工具Correlate、SEO關鍵字挖掘工具及ICTCLAS(漢語詞法分析系統(tǒng)),使得關鍵詞的選取工作更加的有章可循。通過上述的操作,得到1,500多個與初始關鍵詞相關的詞,之后對關鍵詞做了進一步的搜集和整理工作。剔除重復的關鍵詞后,在谷歌趨勢搜索字詞欄中逐一進行輸入,如“公積金買房”、“柴油價格”、“上證指數(shù)”、“理財產(chǎn)品”、“居民消費價格指數(shù)”等,最終得到有搜索量并且各個月份數(shù)字相對比較完整的關鍵詞約600個。為了使最終的結果更具科學性和客觀性,需要把從谷歌趨勢中下載下來的網(wǎng)絡搜索關鍵詞數(shù)據(jù)進行如下數(shù)據(jù)預處理:
1、由于關鍵詞數(shù)據(jù)是以周為單位的,而消費者信心指數(shù)國家統(tǒng)計局是按月公布的,因此為了更好地確定兩者之間存在的相關關系就有必要把網(wǎng)絡搜索關鍵詞的周數(shù)據(jù)合并轉換成以月度量化的月度數(shù)據(jù)。
2、為了解決季節(jié)變動要素和不規(guī)則要素往往掩蓋經(jīng)濟發(fā)展中客觀變化給研究所帶來的問題,消除其短期波動,需要對關鍵詞進行平滑處理,對網(wǎng)絡搜索關鍵詞,數(shù)據(jù)進行三期的移動平均,從而達到突出各網(wǎng)絡搜索數(shù)據(jù)長期變化規(guī)律的效果。
3、由于消費者信心指數(shù)的數(shù)據(jù)是同比數(shù)據(jù),而網(wǎng)絡搜索關鍵詞數(shù)據(jù)并不是同比數(shù)據(jù),因此為了更準確地去發(fā)現(xiàn)兩者之間的相關關系,需要與消費者信心指數(shù)的數(shù)據(jù)保持一致,有必要將平滑之后的網(wǎng)絡搜索關鍵詞數(shù)據(jù)轉換成同比數(shù)據(jù)。
(二)關鍵詞評價。根據(jù)消費者信心指數(shù)的構成和影響因素,利用百度等搜索引擎的關鍵詞推薦工具,以及SEO長尾關鍵詞挖掘工具,對網(wǎng)絡搜索的原始關鍵字詞進行了挖掘和篩選過濾,保留下來大約600個與消費者信心指數(shù)相關的網(wǎng)絡搜索初始關鍵詞。為了比較系統(tǒng)的評價網(wǎng)絡搜索關鍵詞搜索量的變化情況與消費者信心指數(shù)之間的關系,對網(wǎng)絡搜索關鍵詞的評價主要從網(wǎng)絡搜索關鍵詞的領先性和相關性角度為衡量指標。
文章中采用了時差相關分析法分別計算各個初選網(wǎng)絡搜索關鍵詞的領先階數(shù)和相關性。時差相關分析具體表達式為:
式中,p為某一網(wǎng)絡搜索關鍵詞相對與消費者信心指數(shù)的領先階數(shù),rp表示當時差為p的兩個變量之間的相關系數(shù),x表示網(wǎng)絡搜索關鍵詞搜索熱度的月度變化率,y表示消費者信心指數(shù),而這個最大值即為關鍵詞與消費者信心指數(shù)兩者之間的相關系數(shù)。
本文在關鍵詞評價過程中,符合要求的關鍵詞其p值必須大于0。同時為網(wǎng)絡搜索數(shù)據(jù)與消費者信心指數(shù)的相關系數(shù)設定一個臨界值標準(本文中的臨界值為0.5),對于小于這一標準的網(wǎng)絡搜索關鍵詞,不予考慮,進行剔除處理。
(三)搜索指數(shù)合成與檢驗。表1從消費者預期和消費者滿意兩方面列出部分網(wǎng)絡搜索關鍵詞的皮爾森相關指數(shù)。(表1)
表1
圖1 擬合效果圖
(四)消費者信心指數(shù)自回歸模型。本文選擇消費者信心指數(shù)(Y)為被解釋變量,消費者預期搜索指數(shù)(X1)和消費者滿意搜索指數(shù)(X2)為解釋變量,建立時間序列模型,為了確定各個研究變量是否平穩(wěn),采用ADF檢驗法,檢驗結果為所有變量在5%的置信水平都已平穩(wěn)。接下來建立自回歸模型:
采用Engle和Granger的兩步協(xié)整關系檢驗法來檢驗其長期趨勢。結果顯示,殘差項具有穩(wěn)定性,因此網(wǎng)絡搜索指數(shù)與消費者信心指數(shù)之間具有長期穩(wěn)定的協(xié)整關系。并且自回歸方程(1)擬合效果是最優(yōu)的,擬合方程見(2)、(3)式。該模型量化了網(wǎng)絡搜索數(shù)據(jù)與消費者信心指數(shù)之間的關系,表明消費者信心指數(shù)的變化是由消費者未來生活預期的變化和消費者對現(xiàn)有生活滿意情況的變化以及歷史的消費者信心水平來共同決定。
模型當中,解釋變量X1t-2和X2t-1代表的是消費者通過網(wǎng)絡搜索相關內(nèi)容對消費者信心指數(shù)刻畫的貢獻,從宏觀和微觀兩個層面,以消費者預期和消費者滿意為代表,反映了在網(wǎng)絡生活中,消費者預期和消費者滿意網(wǎng)絡關注度和熱度的變化。兩個搜索指數(shù)變量的系數(shù)不同,這說明消費者預期和消費者滿意兩個影響因素的變化對消費者信心的影響程度是不同的。消費者預期搜索指數(shù)和消費者預期搜索指數(shù)兩個指數(shù)各變化1%,對應的消費者信心指數(shù)變化的幅度分別為106.87%和2.10%。
我們把消費者信心指數(shù)的真實值和模型得到的消費者信心指數(shù)的擬合曲線圖繪制在一起。(圖1)可以看出本模型對于消費者信心指數(shù)的擬合效果基本上令人滿意,兩者的走勢基本上是同步的。即:網(wǎng)絡搜索數(shù)據(jù)可以在一定程度上對消費者信心指數(shù)進行預測,但是在某些時段,消費者信心指數(shù)的模型擬合值和消費者信心指數(shù)的真實值之間還是存在較大的偏差。
通過建立網(wǎng)絡搜索數(shù)據(jù)與消費者信心指數(shù)之間的自回歸模型,我們發(fā)現(xiàn):1、網(wǎng)絡搜索數(shù)據(jù)與消費者信心指數(shù)之間是協(xié)整的。消費者預期搜索指數(shù)的提高會引起消費者信心指數(shù)的下降;消費者滿意搜索指數(shù)的提高會引起消費者信心指數(shù)的上升。這表明消費者預期也就是消費者對宏觀層面的評估和預判對消費者信心的影響要遠遠大于消費者滿意即微觀層面的影響;2、網(wǎng)絡搜索數(shù)據(jù)中的部分數(shù)據(jù)和消費者信心之間具有顯著的相關性;3、利用網(wǎng)絡搜索數(shù)據(jù)合成的消費者預期搜索指數(shù)和消費者滿意搜索指數(shù)與消費者信心指數(shù)之間存在不同時間的時差。消費者預期搜索指數(shù)領先消費者信心指數(shù)兩個月,消費者滿意搜索指數(shù)領先消費者信心指數(shù)一個月;4、引入網(wǎng)絡搜索指數(shù)后的自回歸模型對消費者信心指數(shù)的擬合和預測都比較好,可以比官方公布的消費者信心指數(shù)提前1個月左右,基本實現(xiàn)了對消費者信心指數(shù)的實時監(jiān)測。
主要參考文獻:
[1]國敏.基于網(wǎng)絡搜索技術的游客量預測方法研究[D].北京:首都師范大學,2012.
[2]郭洪偉.我國消費者信心指數(shù)的編制及存在的問題[J].商業(yè)時代,2010.
河北省統(tǒng)計科學研究計劃項目(2014HY39)
F713.55
A