彭若弘+宋佳
【摘 要】隨著近幾年互聯(lián)網(wǎng)金融的快速發(fā)展,具有操作便捷、收益率高等優(yōu)點的P2P網(wǎng)絡(luò)借貸成為投融資關(guān)注的重點。伴隨著眾多優(yōu)點,P2P網(wǎng)絡(luò)借貸也因其存在的風(fēng)險和監(jiān)管問題讓投融資者望而卻步。本研究引入百度指數(shù),通過建立不含P2P網(wǎng)絡(luò)搜索量和含P2P網(wǎng)絡(luò)搜索量的ARIMA對比模型預(yù)測P2P網(wǎng)絡(luò)借貸的交易規(guī)模。對比研究發(fā)現(xiàn),包含P2P關(guān)鍵詞搜索量數(shù)據(jù)的預(yù)測模型比不包含P2P關(guān)鍵詞搜索量數(shù)據(jù)的預(yù)測模型預(yù)測結(jié)果更好,該變量的引入有利于提高模型的預(yù)測準(zhǔn)確度。
【關(guān)鍵詞】互聯(lián)網(wǎng)搜索量;百度指數(shù);P2P網(wǎng)絡(luò)借貸交易額;ARIMA模型
一、引言
國外網(wǎng)絡(luò)借貸平臺模式引入中國以來,讓很多敢于嘗試互聯(lián)網(wǎng)投資的投資者認(rèn)識了P2P網(wǎng)絡(luò)借貸模式。P2P網(wǎng)絡(luò)借貸作為互聯(lián)網(wǎng)金融的重要組成部分,發(fā)展迅速。但由于我國P2P發(fā)展的年限較短,監(jiān)管和制度法規(guī)還在逐步完善,仍存在很多風(fēng)險和隱患,使得部分用戶因為看不到其未來的發(fā)展,所以面對操作簡單,收益可觀的P2P網(wǎng)絡(luò)借貸望而卻步。許多學(xué)者研究發(fā)現(xiàn)互聯(lián)網(wǎng)搜索量與實際的市場需求之間具有顯著的相關(guān)關(guān)系,并且在預(yù)測模型中引入互聯(lián)網(wǎng)搜索量有助于提高預(yù)測模型的精度。為幫助用戶合理預(yù)估借貸風(fēng)險與P2P網(wǎng)絡(luò)借貸市場的發(fā)展趨勢,本文引入百度指數(shù),通過預(yù)測P2P網(wǎng)絡(luò)交易規(guī)模給用戶提供決策參考。
二、研究理論與模型建立
隨著谷歌公司谷歌趨勢和百度公司百度指數(shù)的推出,對于某一關(guān)鍵字的互聯(lián)網(wǎng)搜索量數(shù)據(jù)不再難于獲取,兩類產(chǎn)品的推出為互聯(lián)網(wǎng)環(huán)境下預(yù)測模型研究的發(fā)展奠定了基礎(chǔ)。
Yan Carrière-Swallow ,F(xiàn)elipe Labbé(2010)[1]在智利運用谷歌指數(shù)構(gòu)建一個谷歌汽車趨勢指數(shù),以普通自回歸移動平均模型為基準(zhǔn),建立了加入谷歌汽車指數(shù)的對比模型,通過對模型的研究得出ARMA3b(2,2)模型最優(yōu),帶有Google參數(shù)的擬合度更好。
在宏觀經(jīng)濟預(yù)測方面,Simeon Vosen ,Torsten Schmidt(2011)[2]在預(yù)測私人消費時引入了互聯(lián)網(wǎng)搜索變量谷歌指數(shù)。學(xué)者以自回歸模型為基準(zhǔn)模型,以加入了谷歌指數(shù)的模型作為對比模型,比較兩類模型的擬合優(yōu)度。通過對比兩類模型,發(fā)現(xiàn)在0.01置信水平下,加入谷歌指數(shù)的模型較基本模型擬合優(yōu)度(R2)提高了0.03。
(一)不含互聯(lián)網(wǎng)搜索量的預(yù)測模型建立
本文選取的數(shù)據(jù)是以月為跨度的P2P網(wǎng)絡(luò)借貸成交額數(shù)據(jù),也稱P2P網(wǎng)絡(luò)借貸成交額的時間序列數(shù)據(jù)。所謂時間序列就是按照時間的順序記錄的一系列有序數(shù)據(jù),通過對時間序列進(jìn)行觀察、研究,尋找其變化發(fā)展的規(guī)律,預(yù)測未來走勢[3]。在時間序列的預(yù)測中,對于存在波動的時間序列的預(yù)測方法有自回歸模型,移動平均模型和自回歸移動平均模型等。以自回歸模型為例,本文構(gòu)建的基本模型如下:
其中:
y為產(chǎn)品或服務(wù)的市場需求量;
t為時間;
表示隨機變量;
(二)引入互聯(lián)網(wǎng)搜索量的預(yù)測模型建立
時間序列除了在模型上擴展外,在模型的變量上也有所拓展。在一些研究中,學(xué)者們在基本模型中引入外生變量,通過探討變量之間的相關(guān)性,提高預(yù)測的準(zhǔn)確度。謝蒙萌(2013)[4]在研究多元線性回歸模型在ETC客戶發(fā)展的預(yù)測中,引入了本地區(qū)ETC網(wǎng)點數(shù)量、本地區(qū)高速公路入口流量、本地區(qū)GDP和本地區(qū)機動車新增車輛數(shù)等解釋變量,研究結(jié)果發(fā)現(xiàn)結(jié)合引入變量能夠更好的實現(xiàn)預(yù)測效果。隨著互聯(lián)網(wǎng)的不斷發(fā)展,互聯(lián)網(wǎng)中蘊含的信息越來越得到學(xué)者們的重視。在2006年,谷歌公司推出谷歌趨勢后,一些學(xué)者的注意力開始轉(zhuǎn)向了互聯(lián)網(wǎng)搜索量,分析互聯(lián)網(wǎng)中某個關(guān)鍵詞的搜索量與現(xiàn)實社會行為之間的關(guān)系。研究發(fā)現(xiàn)互聯(lián)網(wǎng)中用戶的相關(guān)關(guān)鍵詞搜索量數(shù)據(jù)與客流量、股票價格等存在顯著的相關(guān)關(guān)系[5]。
基于以上學(xué)者的研究成果,本文將探索互聯(lián)網(wǎng)搜索量與P2P網(wǎng)貸成交額之間的關(guān)系,并在預(yù)測模型(1)式中引入互聯(lián)網(wǎng)搜索量,比較其與基本模型的預(yù)測效果,建立對比模型如下:
其中:
y為產(chǎn)品或服務(wù)的市場需求量;
t為時間;
s為該產(chǎn)品或服務(wù)的搜索量數(shù)據(jù);
表示隨機變量;
三、實證研究
(一)樣本數(shù)據(jù)
1.P2P網(wǎng)貸成交額
(二)P2P網(wǎng)貸成交額數(shù)據(jù)分析
根據(jù)圖1的散點圖,可以發(fā)現(xiàn)P2P的百度搜索量越高,其實際網(wǎng)貸成交額越大,說明二者之間相關(guān)性較強,所以本文我們選用百度指數(shù)來預(yù)測P2P網(wǎng)貸成交規(guī)模。
1.平穩(wěn)性分析
根據(jù)圖1的散點圖可以看出,P2P網(wǎng)貸成交額沒有穩(wěn)定的均值和方差,大體呈現(xiàn)上升趨勢,說明該時間序列不具有平穩(wěn)性,需要對其進(jìn)行差分變換。
2.自相關(guān)與偏自相關(guān)分析
運用SPSS對P2P網(wǎng)絡(luò)借貸成交額進(jìn)行一階差分自相關(guān)和偏自相關(guān)分析后可發(fā)現(xiàn),自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的值都比較小,沒有超過±0.5的置信上限和置信下限,說明一節(jié)差分后的數(shù)據(jù)具有平穩(wěn)性,可以在此基礎(chǔ)上建立預(yù)測模型。
(三)時間序列預(yù)測模型分析
1.不含互聯(lián)網(wǎng)搜索量的預(yù)測模型擬合
根據(jù)擬合結(jié)果表2可以看出,R方的值為0.722,說明ARIMA(1,1,0)模型用于預(yù)測P2P網(wǎng)貸成交額的擬合結(jié)果較好,可以解釋實際數(shù)據(jù)的72.2%。預(yù)測模型的均方根誤差RMSE為128.570,說明該模型的觀測值和真值之間有一定偏差,模型擬合的準(zhǔn)確度有待提升。
根據(jù)表3中的參數(shù)可以得出不含互聯(lián)網(wǎng)搜索量的預(yù)測模型如下:
根據(jù)P2P網(wǎng)貸成交額數(shù)據(jù)預(yù)測得出的擬合曲線如下:
2.引入互聯(lián)網(wǎng)搜索量的預(yù)測模型擬合
從擬合結(jié)果表4可以看出,加入互聯(lián)網(wǎng)搜索量的P2P網(wǎng)貸預(yù)測模型R方值為0.794,高出不含互聯(lián)網(wǎng)搜索量的R方值0.722,說明加入互聯(lián)網(wǎng)搜索量的預(yù)測模型比不加互聯(lián)網(wǎng)搜索量的預(yù)測模型的擬合效果更好,解釋度更優(yōu)。MAPE為5.333,說明原始數(shù)據(jù)中的誤差占比低,從誤差角度說明P2P預(yù)測模型擬合效果較好。
預(yù)測模型的均方根誤差RMSE為100.661,說明該模型的觀測值和真值之間有一定偏差,分析原因是2015年7月出臺的《關(guān)于促進(jìn)互聯(lián)網(wǎng)金融健康發(fā)展的指導(dǎo)意見》,由此才將P2P的地位合法化。同年8月,最高法出臺的《最高人民法院關(guān)于審理民間借貸案件適用法律若干問題的規(guī)定》中明確指出P2P平臺作為提供媒介服務(wù)的中介平臺,無須履行擔(dān)保責(zé)任。這類良性政策的推出致使2015年7、8月“P2P”互聯(lián)網(wǎng)搜索量大量增加,影響了預(yù)測模型的參數(shù)值。
從表5的參數(shù)估計表中得到預(yù)測模型的系數(shù)為-0.014,P2P網(wǎng)貸月關(guān)注度系數(shù)為0.001,檢驗顯著性值為0.032,小于0.05,模型系數(shù)顯著。
引入互聯(lián)網(wǎng)搜索量的P2P網(wǎng)貸成交額預(yù)測模型如下:
引入互聯(lián)網(wǎng)搜索量的預(yù)測模型的擬合曲線如下:
3.模型擬合效果分析
根據(jù)表6,我們可以發(fā)現(xiàn):
在模型擬合優(yōu)度(R方),平均絕對誤差百分比(MAPE),平均絕對誤差(MAE)的對比中,包含互聯(lián)網(wǎng)搜索量的預(yù)測模型的統(tǒng)計量都比不包含互聯(lián)網(wǎng)搜索量的預(yù)測模型的統(tǒng)計量小,因此包含互聯(lián)網(wǎng)搜索量的預(yù)測模型擬合效果更優(yōu)。在貝葉斯信息準(zhǔn)則(BIC)檢驗中,包含互聯(lián)網(wǎng)搜索量的預(yù)測模型比不包含互聯(lián)網(wǎng)搜索量的預(yù)測模型小0.272,這說明變量的引入并不影響模型的有效性。
根據(jù)上述對比分析結(jié)果,可以得出加入互聯(lián)網(wǎng)搜索量(百度指數(shù))的P2P網(wǎng)貸成交額預(yù)測模型比不含互聯(lián)網(wǎng)搜索量(百度指數(shù))的P2P網(wǎng)貸成交額預(yù)測模型擬合效果好,預(yù)測的有效性高。
四、研究結(jié)論
本研究以國內(nèi)搜索引擎百度搜索提供的百度指數(shù)為基礎(chǔ),以P2P網(wǎng)絡(luò)借貸成交額為研究對象,探索互聯(lián)網(wǎng)搜索量與市場需求之間的關(guān)系。研究發(fā)現(xiàn):
1.互聯(lián)網(wǎng)搜索量與產(chǎn)品的市場需求之間存在顯著相關(guān)關(guān)系。在對P2P網(wǎng)絡(luò)借貸成交額的研究中,其與互聯(lián)網(wǎng)搜索量之間的相關(guān)系數(shù)為0.769,關(guān)系顯著。投融資者很可能在有相關(guān)投融資需求之前先上網(wǎng)了解P2P網(wǎng)絡(luò)借貸的平臺、產(chǎn)品和政策等信息,形成一種潛在需求,以確保在信息對等的條件下作出決策。
2.包含百度指數(shù)數(shù)據(jù)的預(yù)測模型比不包含百度指數(shù)數(shù)據(jù)的預(yù)測模型預(yù)測準(zhǔn)確度更高。通過對P2P網(wǎng)絡(luò)借貸交易額的數(shù)據(jù)分析,我們發(fā)現(xiàn)包含百度指數(shù)預(yù)測模型的平均百分比誤差(MAPE)、平均絕對誤差(MAE)都顯著低于不包含百度指數(shù)的預(yù)測模型,這說明傳統(tǒng)的預(yù)測存在的干擾因素及誤差,有一部分可以被包含互聯(lián)網(wǎng)搜索量數(shù)據(jù)的預(yù)測剔除,因此該變量的引入有利于提高模型的預(yù)測準(zhǔn)確度,幫投融資決策者降低風(fēng)險,提供更好的決策參考。
【參考文獻(xiàn)】
[1]Yan Carriere-Swallow, Felipe Labbe Central Bank of Chile, Santiago, Chile.Nowcasting with Google Trends in an Emerging Market[J]. Journal of Forecasting, J. Forecast, 2013, (32): 289–298.
[2]Simeon Vosen, Torsten Schmidt Rwi, Essen. Forecasting Private Consumption: Survey-Based Indicators vs. Google Trends[J]. Journal of Forecasting J. Forecast, 2011, (30): 565–578.
[3]張金艷, 郭鵬江. 確定性時間序列模型及ARIMA模型的應(yīng)用[J]. 西安郵電學(xué)院學(xué)報, 2009, (3): 128-132.
[4]謝蒙萌. 多元線性回歸模型在ETC 客戶發(fā)展預(yù)測中的應(yīng)用研究[J]. 公路交通科技, 2013, (11): 405-408.
[5]劉穎, 呂本富, 彭賡. 網(wǎng)絡(luò)搜索對股票市場的預(yù)測能力: 理論分析與實證檢驗[J]. 經(jīng)濟管理, 2011, (1): 172-180.