摘要:貴州省農(nóng)業(yè)總產(chǎn)值是反映貴州省農(nóng)業(yè)生產(chǎn)的總規(guī)模和總水平的重要指標(biāo)。文章利用時間序列分析理論,對1978年至2010年的貴州省農(nóng)業(yè)總產(chǎn)值進行了分析,建立了ARIMA模型并以此對貴州省農(nóng)業(yè)總產(chǎn)值做了分析與短期預(yù)測。
關(guān)鍵詞:貴州?。晦r(nóng)業(yè)總產(chǎn)值;ARIMA模型;短期預(yù)測
一、引言
農(nóng)業(yè)總產(chǎn)值反映的是一個國家或地區(qū)農(nóng)業(yè)生產(chǎn)的總規(guī)模和總水平。隨著改革開放的深入,農(nóng)業(yè)問題一直都是我國政府工作的重中之重。時間序列分析是用一段時間的一組屬性數(shù)值發(fā)現(xiàn)模式從而來預(yù)測未來值,ARIMA 模型是較為常用的用來擬合平穩(wěn)序列的預(yù)測模型。
二、ARIMA模型簡介
ARIMA模型全稱為差分自回歸移動平均模型,又被稱為Box-Jenkins模型或博克思-詹金斯法。模型的基本思想是:預(yù)測對象會隨著時間推移而形成的數(shù)據(jù)序列被視為一個隨機序列,用數(shù)學(xué)模型來近似描述這個序列,并認為該序列會按蘊含的規(guī)律遵循下去。這個模型被識別后就可以從時間序列的過去值及現(xiàn)在值進行外推,以此來預(yù)測未來值。而ARIMA模型在實證研究中被研究人員廣泛運用于時間序列分析和模型預(yù)測領(lǐng)域。ARIMA模型研究的對象是平穩(wěn)時間序列,因此對一個離散的時間序列進行建模時,應(yīng)當(dāng)首先考察其平穩(wěn)性,再分析和判斷時間序列的生成過程。根據(jù)生成機制的不同,ARIMA模型實包含3種類型的模型:
(一)AR模型
AR模型也稱為自回歸模型。它是通過過去的觀測值和現(xiàn)在的干擾值的線性組合預(yù)測, 它是僅用時間序列{Yt}的不同滯后項作為解釋變量的模型,其數(shù)學(xué)形式為:
Yt=?覬1Yt-1+?覬2Yt-2+?覬3Yt-1+......+?覬pYt-p+et
式中:p為自回歸模型的階數(shù);?覬i(i=1,2,......p)為模型的自回歸系數(shù),et為誤差,Yt為一個時間序列。
(二)MA模型
MA模型也稱為移動平均模型。它是通過過去的干擾值和現(xiàn)在的干擾值的線性組合預(yù)測,它是僅用誤差的不同滯后項作為解釋變量的模型,其數(shù)學(xué)形式為:
Yt=et-θ1et-1-θ2et-2-θ3et-3-......-θqet-q
式中:p為模型平均移動階數(shù);θj(j=1,2,......q)為模型的移動平均系數(shù);et為誤差; Yt為觀測值。
(三)ARMA模型
ARMA模型是自回歸模型(AR)和移動平均模型(MA)的組合,構(gòu)成了用于描述平穩(wěn)隨機過程的自回歸滑動平均模型ARMA,數(shù)學(xué)形式為:
Yt=?覬1Yt-1+?覬2Yt-2+?覬3Yt-1+......+?覬pYt-p+et-θ1et-1-θ2et-2-θ3et-3-......-θqet-q
三、ARIMA模型的建立
(一)數(shù)據(jù)的選取
本研究選用貴州省1978年至2010 年農(nóng)業(yè)總產(chǎn)值的統(tǒng)計數(shù)據(jù),數(shù)據(jù)來源于《貴州省統(tǒng)計年鑒》,經(jīng)整理后見表1。
令進出口總額為Xt,根據(jù)貴州省1978年至2010年農(nóng)業(yè)總產(chǎn)值數(shù)據(jù),在Eviews軟件中建立時序圖(見圖1)可以看出,該折線圖是向右上方傾斜的,表明此時間序列存在增長的趨勢。所以貴州省1978年至2010年農(nóng)業(yè)總產(chǎn)值的時間序列數(shù)據(jù)是不穩(wěn)定的。
進一步對該時間序列進行單位根檢驗,從輸出結(jié)果可知ADF檢驗p的值為0.9996,沒有通過檢驗,因此{Xt}序列是非平穩(wěn)的,因此先對數(shù)據(jù)做平穩(wěn)化處理。
(二)數(shù)據(jù)平穩(wěn)化處理
對貴州省1978年至2010年農(nóng)業(yè)總產(chǎn)值時間數(shù)據(jù)取對數(shù)得,并進行二階差分。并對二階差分的數(shù)據(jù)作單位根檢驗。
對貴州省1978年至2010年進農(nóng)業(yè)總產(chǎn)值時間序列數(shù)據(jù)取對數(shù)并進行二階差分后,得到的ADF檢驗p的值為接近零,因此能通過檢驗,拒絕原假設(shè)。對處理后的數(shù)據(jù)作時序圖(見圖2),可知此圖圍繞某條水平線上下波動,數(shù)據(jù)無明顯的上升或下降趨勢,說明處理后的數(shù)據(jù)已經(jīng)是平穩(wěn)的,且d=2。
(三)參數(shù)的估計與模型的定階
對處理后的數(shù)據(jù)作滯后16期的自相關(guān)(autocorrelation function,ACF)圖和偏相關(guān)(partial autocorrelation function,PACF)圖,如圖3。
從該圖可以看到,自相關(guān)函數(shù)在12步后截尾,所以q=12;偏自相關(guān)函數(shù)在12步后截尾,所以p=12。
對模型進行檢驗,由于常數(shù)項C沒有通過顯著性檢驗,即C對模型沒有顯著性影響故舍掉。AR(12)的p值為0.008,MA(12)的p值接近于零,均能通過單個系數(shù)的顯著性檢驗;且擬合優(yōu)度R2=0.827,擬合情況還算是可以的。因此,p=12,q=12,d=2處理后數(shù)據(jù)的模型為。由此得到的估計方程為:
D[D(logXt)]=-0.4353D[D(logXt-12)] -0.9408εt-12+εt①
(四)模型的檢驗
如果殘差序列是白噪聲序列即純隨機序列,則表明所建立的模型包含原序列的所有趨勢,模型用于預(yù)測是合適的。反之,殘差序列不是白噪聲,說明殘差序列中還有某種信息即還有規(guī)律,所建模型不合適,應(yīng)重新建模??梢岳脷埐畹淖韵嚓P(guān)分析圖直觀判斷,其準(zhǔn)則是:殘差序列的自相關(guān)與零無顯著不同,或者說基本落入隨機區(qū)間,殘差序列為白噪聲;反之殘差序列不是白噪聲。
由圖4可以看出,所有Q值都小于檢驗水平為0.05的卡方分布臨界值,最后得出結(jié)論:模型的隨機誤差序列是一個白噪聲序列。
建立模型的目的之一是對未來值進行預(yù)測。對未來貴州省農(nóng)業(yè)總產(chǎn)值進行預(yù)測前, 先檢驗?zāi)P偷念A(yù)測能力。模型的預(yù)測能力一般用平均絕對百分比誤差(mean absolute percentage error,)度量, 它的計算公式如下:
MAPE=■·■■×100%
通過計算MAPE=1.106<10,說明模型的預(yù)測精度較高。通過實際值與預(yù)測值的擬合圖可以看出(見圖5),擬合情況是比較理想。
(五)對貴州省農(nóng)業(yè)總產(chǎn)值的預(yù)測
通過估計方程①對2011年貴州省農(nóng)業(yè)總產(chǎn)值的預(yù)測值為:D[D(logX2011)]=09,925234,經(jīng)計算得出X2011=670.63億元(2011年的實際值為655.30億元),誤差為2.33%。同時預(yù)測貴州省2012年農(nóng)業(yè)總產(chǎn)值為773.85億元。
四、總結(jié)
本文構(gòu)建的貴州省農(nóng)業(yè)總產(chǎn)值自回歸預(yù)測模型,經(jīng)統(tǒng)計檢驗估計方程整體顯著性很好,由此證實了ARIMA模型是一種很好的短期時間序列農(nóng)業(yè)總產(chǎn)值的預(yù)測方法,適用于貴州農(nóng)業(yè)總產(chǎn)值的預(yù)測研究,可以為貴州農(nóng)業(yè)經(jīng)濟發(fā)展規(guī)劃提供決策依據(jù)。
值得注意的是,ARIMA模型的短期預(yù)測效果好,長期預(yù)測效果不好,盡管如此,與其他的預(yù)測方法相比,其預(yù)測的準(zhǔn)確度還是比較高的。
參考文獻:
[1]徐國祥,統(tǒng)計預(yù)測與決策(第二版)[M].上海:上海財經(jīng)大學(xué)出版社,2005.
[2]張曉峒.計量經(jīng)濟學(xué)(第三版)[M].天津:南開大學(xué)出版社,2007.
[3]易丹輝.時間序列分析方法與應(yīng)用[M].北京:中國人民大學(xué)出版社,2011.
[4]王燕.應(yīng)用時間序列分析[M].北京:中國人民大學(xué)出版社,2005.
(作者單位:貴州大學(xué)經(jīng)濟學(xué)院)