劉 潔
(仲愷農(nóng)業(yè)工程學(xué)院 經(jīng)貿(mào)學(xué)院,廣州 510220)
時間序列是將某個統(tǒng)計量的數(shù)值按照時間先后的順序排列而成的序列,即同一個體在不同時點上的數(shù)據(jù)。在現(xiàn)實的經(jīng)濟(jì)、金融領(lǐng)域中有很多問題,如股票價格、石油價格、利率變動或匯率變動都是時間序列。而股票價格雖影響因素眾多,變幻莫測,表面看上去毫無規(guī)律,但利用時間序列的分析也可找出一些變化規(guī)律,不管是對需要及時了解價格波動的投資者,還是需要把握市場動態(tài)、維護(hù)穩(wěn)定交易環(huán)境的市場管理者來說都意義重大。ARMA 模型在處理平穩(wěn)時間序列的問題上有較好的擬合效果,是處理時間序列非常有效的工具。將ARMA 模型應(yīng)用在股票價格的擬合和應(yīng)用方面,可以讓我們更好地了解股市波動特點,總結(jié)相關(guān)規(guī)律,不管是對理論還是實踐都有重要的指導(dǎo)意義。
本文將根據(jù)格力電器股票價格的歷史數(shù)據(jù),利用ARMA理論建立模型并進(jìn)行預(yù)測,從而推斷格力電器股價未來變化趨勢。
ARMA 是自回歸移動平均過程(Auto Regressive Moving Average)的縮寫,由G.E.P.Box 和G.M.Jenkins 在1970 年出版的《Time Series Analysis Forecasting and Control》中提出,ARMA就是由自回歸和移動平均兩部分共同構(gòu)成的一個隨機(jī)過程,通常記為ARMA(p,q),數(shù)學(xué)表達(dá)式如下:
其中,{et}是白噪聲序列,其中p、q 分別表示自回歸和移動平均部分的滯后階數(shù)。當(dāng)p 等于0 時,ARMA(p,q)模型退化成AR(p)模型;當(dāng)q 等于0 時,ARMA(p,q)模型退化成MA(q)模型。
需要注意的是,ARMA 模型僅可對平穩(wěn)時間序列進(jìn)行分析,如果某時間序列非平穩(wěn),則需要進(jìn)行預(yù)處理,生成一個新的平穩(wěn)時間序列后才能應(yīng)用。在實踐中,通常采用對數(shù)差分或差分的方式進(jìn)行預(yù)處理,而經(jīng)過d 次差分后平穩(wěn)的序列,可以寫成ARIMA(p,d,q)的形式,d 的取值通常不會超過2。
滯后階數(shù)p、q 的確定可以通過自相關(guān)圖和偏自相關(guān)圖來確定。若某平穩(wěn)序列的自相關(guān)函數(shù)是拖尾的,偏自相關(guān)函數(shù)是截尾的,則該序列可建立AR(p)模型;若某平穩(wěn)序列的自相關(guān)函數(shù)是截尾的,偏自相關(guān)函數(shù)是拖尾的,則該序列可建立MA(q)模型;若某平穩(wěn)序列的自相關(guān)函數(shù)與偏自相關(guān)函數(shù)都是拖尾的,則可建立ARMA(p,q)模型。此外,還需要利用AIC 信息準(zhǔn)則和SC 信息準(zhǔn)則來判斷,p、q 的選取若能使AIC 和SC 取值最小,即為最佳的階數(shù)。
第一步,判斷時間序列是否平穩(wěn),可以通過建立該組序列的時序圖,或用統(tǒng)計軟件Eviews10 生成自相關(guān)和偏自相關(guān)圖來判斷。第二步,如果該序列平穩(wěn),便可以建立ARMA(p,q)模型;若該序列不平穩(wěn),則需要進(jìn)行預(yù)處理,將其轉(zhuǎn)換成平穩(wěn)序列,而通常轉(zhuǎn)化的方法是進(jìn)行差分或?qū)?shù)差分。第三步,利用Eviews10 生成新序列的自相關(guān)圖和偏自相關(guān)圖,預(yù)估p,q 的階數(shù)。第四步,估計參數(shù)并進(jìn)行檢驗,選出符合AIC 和SC 信息準(zhǔn)則最小化的模型。第五步,對生成的殘差序列實施白噪聲檢驗。最后,檢驗?zāi)P蛿M合結(jié)果,對序列進(jìn)行短期預(yù)測。
本文選取格力電器(000651)2018 年12 月3 日至2019 年11 月29 日的股票收盤價格,共240 個數(shù)據(jù)建立模型,最后對2019 年11 月29 日數(shù)據(jù)進(jìn)行預(yù)測,并與真實交易價格對比,由此來檢測本模型預(yù)測的效果和準(zhǔn)確性。
將格力電器原始收盤價(記為X)導(dǎo)入Eviews10 得到圖1,該組數(shù)據(jù)(2018 年12 月3 日至2019 年11 月29 日)不是一個平穩(wěn)的時間序列,雖有波動,但總體是一個向上的趨勢。為了驗證原收盤價格非平穩(wěn),需要對該組數(shù)據(jù)進(jìn)行ADF 單位根檢驗。由圖2 的檢驗結(jié)果可知,P 值為0.320 7 不具有顯著性,T統(tǒng)計量也大于10%的臨界值,因此存在一個單位根,該組數(shù)據(jù)是非平穩(wěn)時間序列。此外,還可以對原序列做出自相關(guān)-偏自相關(guān)圖,由圖4 可以發(fā)現(xiàn)原序列相關(guān)系數(shù)減弱很慢,也可以說明該組數(shù)據(jù)是非平穩(wěn)時間序列。
圖1 格力電器(000651)股價時序圖
圖2 股價原序列X 的ADF 單位根檢驗
圖3 對數(shù)差分序列DX 的ADF 單位根檢驗
圖4 原序列X 的自相關(guān)-偏自相關(guān)圖
由于原序列非平穩(wěn),如需建立ARMA 模型進(jìn)行分析預(yù)測,則必須消除這種不平穩(wěn)特征,因此嘗試在原序列基礎(chǔ)上進(jìn)行差分。對于股票價格來說我們更應(yīng)該關(guān)心收益率,因此我們先對原始收盤價格取對數(shù),再求差分。在此首先利用Excel 求得對數(shù)差分后的新序列(記為DX),并將其導(dǎo)入Eviews 10,做出時序圖(如圖5 所示)。由圖5 可知,一階差分后序列看起來更加平穩(wěn),除了個別時刻波動較大,整體圍繞0 值上下波動,可以大致判斷經(jīng)過對數(shù)差分后的序列為平穩(wěn)時間序列。但是僅僅從圖形得出結(jié)論是不準(zhǔn)確的,為了驗證這一結(jié)論,需要對新序列進(jìn)行ADF 單位根檢驗,得到結(jié)果如圖3。由圖3 可以看出,P 值小于0.05 具有顯著性,且T 統(tǒng)計量為-7.607 414,均小于1%、5%和10%的臨界值,因此可以拒絕原假設(shè),新序列不存在單位根,新序列是一組平穩(wěn)的時間序列,可以在此基礎(chǔ)上建立模型。
圖5 對數(shù)差分后新序列DX 時序圖
根據(jù)ARMA 的識別準(zhǔn)則,若某平穩(wěn)序列的自相關(guān)函數(shù)是拖尾的,偏自相關(guān)函數(shù)是截尾的,則該序列可建立AR 模型;若某平穩(wěn)序列的自相關(guān)函數(shù)是截尾的,偏自相關(guān)函數(shù)是拖尾的,則該序列可建立MA 模型;若某平穩(wěn)序列的自相關(guān)函數(shù)與偏自相關(guān)函數(shù)都是拖尾的,則可建立ARMA 模型。作為時間序列分析的始祖,Box,Jenkins and Reinsel 認(rèn)為,對于大多數(shù)情況,p≤2與q≤2 就足夠了。為了保險起見,可以讓p 與q 更大些,但具體如何確定p 和q,需要根據(jù)信息法則來判斷。
因此運用Eviews10 可得,格力電器股票價格經(jīng)過一階差分后的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)圖。由圖6 可見,序列DX的ACF 和PACF 都是拖尾,又因一階差分,因此可以建立ARIMA(p,1,q)模型,而模型的滯后階數(shù)p、q 則要根據(jù)p 值、AIC 準(zhǔn)則和SC 準(zhǔn)則加以確定。
圖6 對數(shù)差分后序列DX 的自相關(guān)-偏自相關(guān)圖
根據(jù)對數(shù)差分后序列DX 的自相關(guān)-偏自相關(guān)圖,本文嘗試了ARIMA(1,1,1),ARIMA(1,1,2),ARIMA(2,1,1),ARIMA(2,1,2)四種模型,并根據(jù)AIC 準(zhǔn)則和SC 準(zhǔn)則最小的原則,建立ARIMA(2,1,1)模型。從圖7 可以看出,ARIMA(2,1,1)模型p 值小于0.05,系數(shù)的顯著性符合要求,并且AIC 和SC 均為最小。更進(jìn)一步我們可以加大滯后階數(shù)對模型進(jìn)行過度擬合,發(fā)現(xiàn)效果仍然沒有很大改善,因此可以確定ARIMA(2,1,1)就是合適的模型。最后,該模型的數(shù)學(xué)表達(dá)式可寫為:
圖7 ARIMA(2,1,1)模型輸出結(jié)果
式中,et為殘差序列。
在經(jīng)過參數(shù)估計后,還需要對殘差進(jìn)行白噪聲檢測以確認(rèn)建立的ARIMA 模型是否合適。因此對Eviews10 中對殘差進(jìn)行時序圖分析和Ljung-Box 檢驗(即Q 統(tǒng)計量檢測),得到結(jié)果如圖8 和圖9。圖8 顯示殘差基本在0 值上下波動,殘差是一個平穩(wěn)的時間序列。圖9 的自相關(guān)和偏自相關(guān)圖顯示,兩個系數(shù)都在兩條虛線內(nèi),且p 值大于0.05,說明Q 統(tǒng)計量小于檢測水平為0.05 的卡方分布臨界值,即已經(jīng)建立的模型的隨機(jī)誤差項是一個白噪聲序列,因此該模型是合理的。此外我們還可以通過檢驗殘差的正態(tài)性來檢驗?zāi)P?,如果模型正確,則分位數(shù)-分位數(shù)圖應(yīng)該有一條直線穿過眾多的點,而從圖10 中也可以看到,除了少數(shù)幾個點偏離直線較多,其余點都分布在直線附近,從而驗證了模型的準(zhǔn)確性。
圖8 殘差時序圖
圖9 殘差自相關(guān)-偏自相關(guān)圖
圖10 序列分位數(shù)-分位數(shù)圖
由于已經(jīng)建立好的ARIMA(2,1,1)模型通過了白噪聲檢測,因而其可以對格力電器股票未來收盤價格進(jìn)行預(yù)測。在Eviews10 軟件中可以選擇靜態(tài)預(yù)測或動態(tài)預(yù)測,首先進(jìn)行動態(tài)預(yù)測,而動態(tài)預(yù)測值基本呈水平線,說明動態(tài)預(yù)測效果不好。然后進(jìn)行靜態(tài)預(yù)測,由于靜態(tài)預(yù)測只能一步向前,得到結(jié)果見圖11,可以看出靜態(tài)預(yù)測效果還是比較好的。這是因為股票價格變動較大,隨著預(yù)測期數(shù)的增加,所得到的結(jié)果誤差也增大,因此應(yīng)用ARIMA 模型對股票價格進(jìn)行預(yù)測短期效果比較合適。
圖11 靜態(tài)預(yù)測圖
由已建立的ARIMA(2,1,1)模型對格力電器2019 年11月29 日的收盤價進(jìn)行短期預(yù)測,可得結(jié)果為57.62,當(dāng)天實際收盤價為57.71,誤差為0.09,比較接近,也由此可以證明用ARIMA 模型對股票價格進(jìn)行預(yù)測短期效果比較好。
綜上所述,ARMA 對描述股價波動有一定參考性,對股價短期的預(yù)測效果也比較好,對投資者有一定參考價值。但是應(yīng)用ARMA 模型對于股票價格的長期預(yù)測就有較大偏差,因為ARMA 模型只是對時間序列本身的屬性進(jìn)行分析,而股票價格的預(yù)測一直是一個難題,且股票市場的影響因素眾多,如市場規(guī)則、國家宏觀經(jīng)濟(jì)政策和公司內(nèi)部結(jié)構(gòu)的變化等都會對股票價格產(chǎn)生重大影響,因此對股票價格的預(yù)測還需要結(jié)合其他條件進(jìn)行綜合判斷。