王爽 汪海飛
[摘 要]選取1978—2019年海南省GDP數(shù)據(jù)為研究樣本,依據(jù)Box-Jenkins方法建立ARIMA模型,通過1978—2017年樣本內(nèi)數(shù)據(jù)建立ARIMA(1,1,2)模型,來預(yù)測2018—2021年樣本外的海南省GDP數(shù)值。通過對模型診斷與檢驗(yàn),發(fā)現(xiàn)ARIMA(1,1,2)模型能較好地達(dá)到預(yù)測效果,預(yù)測平均誤差控制在5%之內(nèi),能較好地對海南省GDP做出短期預(yù)測,為海南省政府制定經(jīng)濟(jì)發(fā)展目標(biāo)提供參考。
[關(guān)鍵詞] ARIMA模型;GDP預(yù)測;ADF檢驗(yàn);時間序列
Abstract: This paper selects the GDP data of Hainan Province from 1978 to 2019 as the research sample, establishes ARIMA model based on box-Jenkins method, and forecasts the GDP value of Hainan province outside the sample from 2018 to 2021 by establishing ARIMA (1,1,2) model. Through the diagnosis and test of the model, it is found that ARIMA (1,1,2) model can better achieve the prediction effect, the average error of prediction is controlled within 5%, and it can make a short-term prediction of GDP of Hainan Province, which provides a reference for the government of Hainan Province to formulate economic development goals.
Key Words: ARIMA Model; GDP Forecast; ADF Test; Time Series
國內(nèi)生產(chǎn)總值(Gross Domestic Product),簡稱為GDP,是指一個國家或地區(qū)在一定時期內(nèi)(通常為1年)所有常住單位所生產(chǎn)的全部最終產(chǎn)品和勞務(wù)的市場價值,反映了該國或地區(qū)經(jīng)濟(jì)的實(shí)力和發(fā)展?fàn)顩r。1988年海南省建省和開放為中國最大的經(jīng)濟(jì)特區(qū),2010年海南開放為國際旅游島,2018年海南全島開始自由貿(mào)易試驗(yàn)區(qū)建設(shè),海南的GDP增長也可劃分為四個階段:第一階段(1978—1992年),GDP增長率最高達(dá)到1992年的53.4%,平均增長率為19.5%,這個階段GDP增長率波動幅度較大,但總體呈上升態(tài)勢;第二階段(1993—1997年),GDP增長率開始走低,最高為1993年的40.8%,之后一路下滑到1997年的5.5%,平均增長率為18.1%,這個階段GDP增長率迅速下滑;第三階段(1998—2010年),GDP增長率緩慢上升,最高為2010年的24.8%,平均增長率為13.3%;第四階段(2011—2019年),GDP增長率迅速下滑,最高為2011年的22.2%,平均增長率為11.1%。影響一個地區(qū)GDP的因素較為復(fù)雜,當(dāng)前海南正處于建設(shè)自由貿(mào)易試驗(yàn)區(qū)的關(guān)鍵時期,影響海南經(jīng)濟(jì)發(fā)展的因素愈發(fā)復(fù)雜與深刻,因此,本文通過構(gòu)建ARIMA模型對海南國內(nèi)生產(chǎn)總值進(jìn)行預(yù)測,以期為政府決策提供參考。
一、ARIMA模型簡介
ARIMA模型,稱為單整自回歸移動平均模型,又稱B-J模型,是由博克斯(Box)、詹金斯(Jenkins)于1970年首次提出的,它是擬合非平穩(wěn)時間序列的常用隨機(jī)時序模型,是一種精度較高的時序短期預(yù)測法。其基本思想是:某些時間序列是依賴于時間的一組隨機(jī)變量,構(gòu)成該時序的單個序列值雖然具有不確定性,但整個序列的變化卻是有規(guī)律的,可以用相應(yīng)的數(shù)學(xué)模型來表述。在宏觀經(jīng)濟(jì)研究領(lǐng)域,大多數(shù)的經(jīng)濟(jì)時間序列都是非平穩(wěn)的,比如:消費(fèi)、對外貿(mào)易、收入、匯率等,對于非平穩(wěn)的時間序列,其均值和方差等數(shù)字特征會隨著時間的變化而變化,隨機(jī)規(guī)律在不同時點(diǎn)是不同的,因此,B-J模型可有效提高模型的預(yù)測精度。B-J模型基本模型包括AR模型、MA模型、ARIMA模型,后者通過適當(dāng)?shù)牟罘诌\(yùn)算將非平穩(wěn)時間序列轉(zhuǎn)化為平穩(wěn)時間序列,然后與ARMA模型相結(jié)合,綜合考查了預(yù)測變量的過去值、現(xiàn)在值和誤差值更好地預(yù)測未來值。
(一)ARIMA模型形式
(二)ARIMA模型建模過程
博克斯-詹金斯提出了針對非平穩(wěn)時間序列建模具有廣泛影響的建模思想,能夠?qū)?shí)際建模起到指導(dǎo)作用。其建模思想分為以下4個步驟:
1.對原序列進(jìn)行平穩(wěn)性檢驗(yàn),如果序列不滿足平穩(wěn)性條件,可以通過差分變換或者其他變換,如對數(shù)差分變換使序列滿足平穩(wěn)性條件。
2.模型識別。通過計算能夠描述序列特征的一些統(tǒng)計量(如自相關(guān)系數(shù)和偏自相關(guān)系數(shù)),來確定ARIMA模型中的階數(shù)p和q,并在初始估計中選擇盡可能少的階數(shù),并根據(jù)AIC準(zhǔn)則或SC準(zhǔn)則綜合定階。
3.模型估計。采用OLS或者極大似然估計法來估計模型的未知參數(shù),并檢驗(yàn)參數(shù)的顯著性,以及根據(jù)模型所得特征根來判斷其倒數(shù)是否在單位圓內(nèi),從而檢驗(yàn)?zāi)P捅旧淼暮侠硇浴?/p>
4.模型檢驗(yàn)。對模型進(jìn)行診斷檢驗(yàn),如模型的殘差序列能否滿足白噪聲序列的要求,能否提升模型的擬合優(yōu)度以及降低AIC值和BIC值等,以證實(shí)所得模型確實(shí)與所觀察到的數(shù)據(jù)特征相符。
5.模型預(yù)測。利用上述所建的模型對時間序列進(jìn)行預(yù)測,并對預(yù)測效果進(jìn)行評價。
二、實(shí)證研究
(一)樣本選擇與數(shù)據(jù)收集
本文選取海南省GDP數(shù)據(jù)作為研究樣本,時間為1978—2019年數(shù)據(jù),所有數(shù)據(jù)均來源于《海南統(tǒng)計年鑒》,如表1所示。因本文是在現(xiàn)有數(shù)據(jù)的基礎(chǔ)上,根據(jù)ARIMA模型對海南省GDP進(jìn)行預(yù)測,因此,樣本內(nèi)數(shù)據(jù)區(qū)間為1978—2017年,將樣本外2018—2019年的實(shí)際數(shù)據(jù)與預(yù)測數(shù)據(jù)進(jìn)行對比,從而判斷模型的擬合效果,進(jìn)而再預(yù)測2020—2021年海南省GDP的發(fā)展情況。
(二)數(shù)據(jù)預(yù)處理
經(jīng)濟(jì)數(shù)據(jù)所構(gòu)成的時間序列往往都是非平穩(wěn)的,將1978—2017年海南省GDP做折線圖,如圖1所示:隨著時間的推移,海南省GDP呈現(xiàn)指數(shù)增長趨勢,增長速度迅速,初步判斷其是非平穩(wěn)的時間序列。因此,為了消除異方差以及指數(shù)趨勢,對其進(jìn)行對數(shù)化處理,記為lGDP。
(三)序列的平穩(wěn)性檢驗(yàn)
為了更精確地檢驗(yàn)時間序列的平穩(wěn)性,對lGDP采用ADF單位根檢驗(yàn),檢驗(yàn)結(jié)果如表1所示,由表1可知,ADF統(tǒng)計量為-1.838831,該值明顯高于各顯著性水平下的臨界值,且P值大于各顯著性水平,因此,說明該時間序列存在單位根,序列是非平穩(wěn)的。
而建立ARIMA模型的前提是該序列是平穩(wěn)的,為了進(jìn)一步消除lGDP的線性趨勢,對lGDP進(jìn)行一階差分處理,其一階差分序列記為DlGDP,再次進(jìn)行ADF單位根檢驗(yàn),結(jié)果如表2所示,ADF檢驗(yàn)的統(tǒng)計量為-3.813250,該值小于5%顯著性水平下的臨界值-3.533083,說明單位根是不存在的,因此,DlGDP在5%顯著性水平下是平穩(wěn)的時間序列。由此可知,DlGDP序列是一階單整過程,存在一個單位根,ARIMA( p,d,q )模型中的=1,即lGDP~I(xiàn)(1),平穩(wěn)的lGDP可構(gòu)建ARIMA( p,q)模型。
(四)模型識別
在ARIMA模型中,d=1,通過觀察平穩(wěn)的DlGDP序列的自相關(guān)圖和偏自相關(guān)圖初步識別p與q。
由圖2可知,DlGDP的自相關(guān)函數(shù)和偏自相關(guān)函數(shù)均是拖尾的,因此可構(gòu)建ARIMA(p,q)模型。由的偏自相關(guān)函數(shù)可以初步確定p=1,由自相關(guān)函數(shù)可以初步確定q=1,但是僅通過自相關(guān)函數(shù)和偏自相關(guān)函數(shù)確定p與q,此方法較為粗糙,精確度較低,因此需要通過信息準(zhǔn)則進(jìn)一步確定模型形式。本文在ARIMA(1,1,1),AR(1),MA(1),ARIMA(1,1,2),MA(2),ARIMA(2,1,1),AR(2)中再次根據(jù)AIC準(zhǔn)則和SC準(zhǔn)則進(jìn)行模型篩選。結(jié)果如表3所示:
(五)模型建立
通過表4可知,該模型通過了F檢驗(yàn),擬合優(yōu)度較低,但是5%顯著性水平下,變量系數(shù)均顯著,模型的特征根的倒數(shù)均處于單位圓之內(nèi),因此,ARIMA(1,1,2)模型較合理。根據(jù)表4結(jié)果,ARIMA(1,1,2)模型如下:
(六)模型診斷與檢驗(yàn)
對模型的診斷與檢驗(yàn)是檢驗(yàn)殘差序列是否滿足白噪聲序列,如果殘差序列滿足白噪聲序列要求,則模型擬合有效,否則需重新建模。因此對殘差進(jìn)行ADF單位根檢驗(yàn)和Q統(tǒng)計量檢驗(yàn),結(jié)果如表5與圖3所示,根據(jù)表5可知,即使在1%顯著性水平下,殘差序列都是平穩(wěn)的;從圖3可知,殘差的自相關(guān)函數(shù)與偏自相關(guān)函數(shù)均處于置信區(qū)間內(nèi),P值較大,殘差滿足白噪聲檢驗(yàn),基本不存在可提取的信息,因此,模型擬合效果較好。
(七)模型預(yù)測
根據(jù)所建模型對海南省2018—2021年GDP進(jìn)行預(yù)測,預(yù)測值如下:
利用ARIMA(1,1,2)模型對2018—2021年海南省GDP進(jìn)行預(yù)測,繪制預(yù)測值與實(shí)際值比較表,得到兩年的平均誤差為4.8%,控制在5%之內(nèi),預(yù)測效果較好。在2018年預(yù)測值與實(shí)際值之間的差距較大,到2019年時,二者之間的差距逐漸縮小,說明模型的預(yù)測效果逐漸增強(qiáng),從預(yù)測可知,海南省GDP隨著時間的推移呈現(xiàn)出明顯的上升趨勢,且發(fā)展速度逐年加快。
三、結(jié)束語
本文通過建立ARIMA(1,1,2)模型,實(shí)現(xiàn)了對海南省GDP非平穩(wěn)時間序列的建模,通過模型檢驗(yàn)可知,依據(jù)B-J法建立的ARIMA(1,1,2)模型具有較好的預(yù)測能力,ARIMA(1,1,2)模型可用于對海南省GDP的短期預(yù)測,為海南省經(jīng)濟(jì)發(fā)展目標(biāo)的制定提供決策參考。
[參考文獻(xiàn)]
[1]王周偉,崔百勝,朱敏,等.經(jīng)濟(jì)計量研究指導(dǎo)[M].北京:北京大學(xué)出版社,2015.
[2]龔國勇.ARIMA模型在深圳GDP預(yù)測中的應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識,2008(2).
[3]劉勇,汪旭輝.ARIMA模型在我國能源消費(fèi)預(yù)測中的應(yīng)用[J].經(jīng)濟(jì)經(jīng)緯,2007(5).
[4]邢國繁,王爽,劉運(yùn)良.海南省對外貿(mào)易與經(jīng)濟(jì)增長的關(guān)系實(shí)證分析[J].對外經(jīng)貿(mào),2017(12).
[5]邢國繁,王爽,王濤.吉林省宏觀經(jīng)濟(jì)波動影響因素的長短期動態(tài)研究[J].對外經(jīng)貿(mào),2016(11).
(責(zé)任編輯:張彤彤 梁宏偉)