路亦康
摘 要:通過(guò)查找CPI,商品零售價(jià)格指數(shù),工業(yè)生產(chǎn)者出廠價(jià)格指數(shù),固定資產(chǎn)投資價(jià)格指數(shù),全國(guó)主要農(nóng)產(chǎn)品生產(chǎn)價(jià)格指數(shù),工業(yè)生產(chǎn)者購(gòu)進(jìn)價(jià)格指數(shù),場(chǎng)內(nèi)價(jià)格指數(shù),網(wǎng)上價(jià)格指數(shù),訂單價(jià)格指數(shù)和出口價(jià)格指數(shù)等指標(biāo)的歷年數(shù)據(jù),建立了三個(gè)模型:偏最小二乘回歸模型,BP神經(jīng)網(wǎng)模型,支持向量機(jī)非線性擬合模型(SVM),用模型進(jìn)行求解,得出2019年的預(yù)測(cè)值,通過(guò)比較誤差的大小,得知SVM模型的預(yù)測(cè)具有很好的效果。
關(guān)鍵詞:CPI;神經(jīng)網(wǎng)絡(luò);SVM;偏最小二乘回歸
隨著中國(guó)經(jīng)濟(jì)的發(fā)展,居民消費(fèi)價(jià)格指數(shù)(CPI)一方面同人民群眾的生活密切相關(guān),同時(shí)也在整個(gè)國(guó)民經(jīng)濟(jì)價(jià)格體系中也具有重要的地位。它是進(jìn)行經(jīng)濟(jì)分析和決策、價(jià)格總水平監(jiān)測(cè)和調(diào)控及國(guó)民經(jīng)濟(jì)核算的重要指標(biāo)。因此,運(yùn)用數(shù)據(jù)挖掘技術(shù)探索市場(chǎng)價(jià)格指數(shù)與居民消費(fèi)價(jià)格指數(shù)的關(guān)系,使其能更好的應(yīng)用于宏觀經(jīng)濟(jì)的發(fā)展。
1 模型建立
1.1 基于偏最小二乘回歸的擬合
用R語(yǔ)言的plsr函數(shù)求解,首先根據(jù)交叉驗(yàn)證的PRESS結(jié)果確定自變量個(gè)數(shù),在選擇的成分個(gè)數(shù)盡可能小的前提下,選擇使PRESS最小或幾乎不變的成分個(gè)數(shù),結(jié)果如表1所示。
其中,CV表示不同成分個(gè)數(shù)對(duì)應(yīng)的PRESS值,adjcv為調(diào)整后的PRESS值,“TRAINING:%variance explained”一欄表示成分對(duì)各變量的累積貢獻(xiàn)率。由回歸結(jié)果可知,在不同的主成分個(gè)數(shù)下PRESS總和相差不大,選用前4個(gè)主成分可使累積貢獻(xiàn)率近似達(dá)到85%,因此綜合考慮之后確定主成分的個(gè)數(shù)為4。
確定主成分個(gè)數(shù)后,用plsr函數(shù)求解模型,并用predict函數(shù)對(duì)2019年1至4月的CPI值作出預(yù)測(cè),以計(jì)算預(yù)測(cè)值誤差,所得結(jié)果如表2所示。
1.2 基于神經(jīng)網(wǎng)絡(luò)的擬合
BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程是使用最速下降法,通過(guò)反向傳播來(lái)不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,使網(wǎng)絡(luò)的誤差平方和最小。我們通過(guò)建立BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)得到如下結(jié)果:
1.3 基于支持向量機(jī)(SVM)的非線性模型擬合
支持向量機(jī)是一種分類(lèi)?;驹硎羌俣ㄆ淠康氖前芽臻g中的兩類(lèi)點(diǎn)(y=1或y= -1)用超平面ωTx+b=0分開(kāi)(在嚴(yán)格線性可分的情況下,存在這樣的超平面),而且希望這個(gè)超平面距離兩類(lèi)點(diǎn)的距離最大。我們得到預(yù)測(cè)結(jié)果如下:
2 結(jié)果
三種模型的預(yù)測(cè)值及預(yù)測(cè)誤差如下表所示。
將上述結(jié)果繪制成折線圖可更直觀地對(duì)比模型的優(yōu)良:
可以看出,幾種預(yù)測(cè)模型的預(yù)測(cè)效果由好到壞依次是支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)、偏最小二乘回歸模型。三種模型在短期預(yù)測(cè)時(shí),效果較好,在進(jìn)行長(zhǎng)期預(yù)測(cè)時(shí),預(yù)測(cè)誤差會(huì)顯著增加。