吳玉霞,溫 欣
(1.河北金融學(xué)院 河北省科技金融重點(diǎn)實(shí)驗(yàn)室,河北 保定 071051;2.財(cái)政部財(cái)政科學(xué)研究所博士后流動(dòng)站,北京 100142;3.南京財(cái)經(jīng)大學(xué) 經(jīng)濟(jì)學(xué)院,南京 210023)
基于ARIMA模型的短期股票價(jià)格預(yù)測(cè)
吳玉霞1,2,溫 欣3
(1.河北金融學(xué)院 河北省科技金融重點(diǎn)實(shí)驗(yàn)室,河北 保定 071051;2.財(cái)政部財(cái)政科學(xué)研究所博士后流動(dòng)站,北京 100142;3.南京財(cái)經(jīng)大學(xué) 經(jīng)濟(jì)學(xué)院,南京 210023)
文章選取“華泰證券”250期的股票收盤價(jià)作為時(shí)間序列實(shí)證分析數(shù)據(jù),通過建立ARIMA模型對(duì)創(chuàng)業(yè)板市場(chǎng)股票價(jià)格變動(dòng)的規(guī)律和趨勢(shì)進(jìn)行了預(yù)測(cè)。實(shí)證結(jié)果表明,該模型短期動(dòng)態(tài)、靜態(tài)預(yù)測(cè)效果較好,可以為投資者和企業(yè)在進(jìn)行相關(guān)決策時(shí)提供有益參考。
時(shí)間序列分析;股票價(jià)格預(yù)測(cè);創(chuàng)業(yè)板;ARIMA模型
創(chuàng)業(yè)板股價(jià)較主板股價(jià)波動(dòng)幅度更大,預(yù)測(cè)難度也更大。時(shí)間序列預(yù)測(cè)方法是比較常用的預(yù)測(cè)方法,它有一系列完善的理論基礎(chǔ),隨著人們對(duì)股市的追捧,不少學(xué)者也嘗試將時(shí)間序列預(yù)測(cè)應(yīng)用于股票的價(jià)格預(yù)測(cè),具體的講時(shí)間序列預(yù)測(cè)股價(jià)是將股票價(jià)格或者價(jià)格指數(shù)看作變化的時(shí)間序列,通過建立合理的時(shí)間序列模型以預(yù)測(cè)未來發(fā)展變化的規(guī)律和趨勢(shì)。但目前對(duì)股票價(jià)格的預(yù)測(cè)更多地是對(duì)主板市場(chǎng)的研究,鮮有對(duì)創(chuàng)業(yè)板市場(chǎng)股票價(jià)格的預(yù)測(cè)。本文選取“華泰證券”250期的股票收盤價(jià)作為時(shí)間序列實(shí)證分析數(shù)據(jù),通過建立ARIMA模型對(duì)創(chuàng)業(yè)板市場(chǎng)股票價(jià)格變動(dòng)的規(guī)律和趨勢(shì)進(jìn)行預(yù)測(cè)。需要指出的是,股票市場(chǎng)的行情是千變?nèi)f化的,時(shí)間序列分析法只是利用歷史數(shù)據(jù),期望從中獲取有用信息來預(yù)測(cè)將來走勢(shì),而并沒有考慮影響股價(jià)變動(dòng)的原因,故一般只是直觀分析,僅做短時(shí)間內(nèi)的預(yù)測(cè)。
1.1 股票價(jià)格預(yù)測(cè)理論
股票價(jià)格序列預(yù)測(cè)就是利用事物發(fā)展的歷史數(shù)據(jù),綜合考慮各種影響股價(jià)的因素,采用某種科學(xué)的方法,對(duì)將來某一期或者某幾期的股票價(jià)格進(jìn)行估計(jì),已知時(shí)間序列{Y1,Y2,…, }
YT,預(yù)測(cè)YT+1,···,YT+m的股票價(jià)格,公式定義為:
其中,只進(jìn)行一步預(yù)測(cè),即僅求YT+1稱為單步預(yù)測(cè),當(dāng)預(yù)測(cè)YT+m,m>1,稱m步預(yù)測(cè)。顯然m步預(yù)測(cè)可以拆分成多個(gè)單步預(yù)測(cè)的組合,即式(1)可以寫成:
預(yù)測(cè)研究的是未來的狀態(tài)或發(fā)展趨勢(shì),它之所以受到廣泛關(guān)注是因?yàn)槿藗儸F(xiàn)在的行為可能影響到未來的結(jié)果,將各種預(yù)測(cè)方法應(yīng)用于股票價(jià)格預(yù)測(cè),給本文投資決策提供建議,可能會(huì)關(guān)系到以后的股票投資收益,因此股價(jià)預(yù)測(cè)是非?,F(xiàn)實(shí)的預(yù)測(cè)問題。
1.2 時(shí)間序列分析法
時(shí)間序列預(yù)測(cè)方法是將股票價(jià)格或者價(jià)格指數(shù)看作變化的時(shí)間序列,通過建立合理的時(shí)間序列模型以預(yù)測(cè)未來發(fā)展變化的規(guī)律和趨勢(shì),而時(shí)間預(yù)測(cè)方法正迎合股指的變化發(fā)展的隨機(jī)性及其時(shí)變性等特點(diǎn),有較好的短期預(yù)測(cè)效果。常用的時(shí)間序列分析法有自回歸模型(AR)、移動(dòng)平均模型(MA)及自回歸移動(dòng)(ARMA)平均模型等。預(yù)測(cè)方法又有兩種:一種是動(dòng)態(tài)預(yù)測(cè):只能進(jìn)行一期預(yù)測(cè),在由實(shí)際值預(yù)測(cè)出第一期的值之后,將第一期預(yù)測(cè)值帶入時(shí)間序列,和歷史數(shù)據(jù)一期再進(jìn)行第二期的預(yù)測(cè),以此遞推,對(duì)于長(zhǎng)期預(yù)測(cè),可能會(huì)產(chǎn)生累計(jì)誤差;另一種是靜態(tài)預(yù)測(cè):用原序列的實(shí)際值來進(jìn)行預(yù)測(cè),只有當(dāng)真實(shí)數(shù)據(jù)可以獲得時(shí)才可以使用這種方法。
2.1 模型介紹
C.P.Box和G M.Jenkins[1]最早提出的自回歸求和移動(dòng)平均模型(簡(jiǎn)稱為ARIMA模型),是將非平穩(wěn)時(shí)間序列先經(jīng)過d階差分平穩(wěn)化,再對(duì)得到的平穩(wěn)時(shí)間序列利用自回歸(AR(p)process)和滑動(dòng)平均過程(MA(q)process),并通過樣本自相關(guān)系數(shù)(ACF)和偏自相關(guān)系數(shù)(PCF)等數(shù)據(jù)對(duì)建立的模型進(jìn)行辨識(shí),同時(shí)還提出了一整套的建模、估計(jì)、檢驗(yàn)和控制方法。設(shè){} Yt為零均值的平穩(wěn)時(shí)間序列,p階自回歸q階滑動(dòng)平均的ARMA(p,q)公式表述為:
可簡(jiǎn)寫為?(B)Yt=θ(B)εt。ARIMA(p,d,q)模型中的d是差分階數(shù),金融市場(chǎng)上的時(shí)間序列數(shù)據(jù)一般都是非平穩(wěn)的,差分是平穩(wěn)化的途徑之一,差分后的ARIMA建模過程基本與ARMA相同。
2.2 模型的建立
在數(shù)據(jù)選取方面,隨機(jī)選取個(gè)股。華泰證券股票發(fā)行以來,股票價(jià)格沒有明顯的異常波動(dòng),選取的250期時(shí)間序列內(nèi)無重大財(cái)務(wù)、違法違規(guī)事件。之所以選250期是因?yàn)槿暨x取數(shù)據(jù)過少則無法充分提取歷史數(shù)據(jù)中的信息,數(shù)據(jù)選取過多又會(huì)因間隔較長(zhǎng)時(shí)的股價(jià)會(huì)對(duì)后期的預(yù)測(cè)股價(jià)影響較小造成不必要的誤差。本文最終選取華泰證券2014年3月24日至2015年3月31日間250期的股票的收盤價(jià)作為時(shí)間序列數(shù)據(jù),(數(shù)據(jù)來源于大智慧和同花順歷史股價(jià))。剔除7個(gè)無效數(shù)據(jù),對(duì)243期股票的收盤價(jià)做ARIMA模型擬合,并進(jìn)行短期預(yù)測(cè)。命名收盤價(jià)時(shí)間序列為y,對(duì)y進(jìn)行ADF平穩(wěn)性檢驗(yàn),發(fā)現(xiàn)y序列非平穩(wěn)。接下來要進(jìn)行平穩(wěn)化處理,對(duì)其進(jìn)行差分,直至平穩(wěn)。一階差分結(jié)果如下:
表1 一階差分序列ADF檢驗(yàn)
可以看出dy的ADF統(tǒng)計(jì)值的絕對(duì)值為12.03473,大于顯著性水平為0.05時(shí)的2.873339,故接受存在一個(gè)單位根的原假設(shè),并且P值很小,均說明一階差分序列是平穩(wěn)的,因此d=1。
圖1 一階差分的時(shí)序圖
圖2 一階差分自相關(guān)圖
dy的時(shí)序圖圍繞一個(gè)常數(shù)值上下波動(dòng),且波動(dòng)范圍不大。自相關(guān)圖中自相關(guān)系數(shù)迅速衰減為零,也表明一階差分序列是平穩(wěn)的,不需再進(jìn)行二階差分檢驗(yàn)。
由圖1序列相關(guān)圖可知,P值都小于5%,數(shù)據(jù)為非白噪聲序列,存在相關(guān)性,有一定規(guī)律可循。偏自相關(guān)系數(shù)在k=1后很快趨于0,偏自相關(guān)1階截尾,可以試著擬合AR(1)模型,在k=3時(shí)在2倍標(biāo)準(zhǔn)差的置信帶邊緣,可嘗試AR(3)模型;自相關(guān)系數(shù)在k=1時(shí)顯著不為零,在k=3、6處在2倍標(biāo)準(zhǔn)差的置信帶的邊緣,是可以嘗試擬合MA(1)、MA(3)、MA(6)模型;同時(shí)可以建立ARIMA(1,1,1),ARIMA(3,1,1)模型等。由模型定階發(fā)現(xiàn),p可能等于1、3、6,q可能等于1,表2、表3分別是各模型的估計(jì)結(jié)果和預(yù)測(cè)的參數(shù)對(duì)比表。
表2 方程的P值比較
比較表2中的P值,綜合c、ar(p)、ma(q)三項(xiàng)的P值,發(fā)現(xiàn)模型ARIMA(3,1,1)的最小,都小于顯著性水平5%。
表3 各種模型的精度指標(biāo)對(duì)比
比較各模型的檢驗(yàn)統(tǒng)計(jì)量,根據(jù)AIC準(zhǔn)則、SC小的為較優(yōu)模型,也是ARIMA(3,1,1)比較好,優(yōu)于其他三個(gè)模型。F統(tǒng)計(jì)量9.814915在四項(xiàng)中最大,P值也最小。綜上擬選定ARIMA(3,1,1)模型。
較優(yōu)的模型ARIMA(3,1,1)用公式表述為:
2.3 模型的診斷檢驗(yàn)
在確定參數(shù)的估計(jì)值后,還需要對(duì)擬合模型的適應(yīng)性進(jìn)行診斷檢驗(yàn)。本文利用Eviews軟件建立殘差的自相關(guān)圖,對(duì)殘差進(jìn)行純隨機(jī)性檢驗(yàn),ARIMA(3,1,1)的殘差自相關(guān)檢驗(yàn)結(jié)果如圖3所示。
圖3 ARMA(3,1,1)模型殘差相關(guān)圖
殘差相關(guān)圖顯示自相關(guān)函數(shù)基本在95%的置信區(qū)域內(nèi),且P值大于0.05,殘差為白噪聲,也即殘差是純隨機(jī)性的,圖4 ARIMA(3,1,1)模型擬合圖也顯示擬合模型有效。
圖4 ARMA(3,1,1)模型擬合圖
2.4 模型的應(yīng)用
用擬合的有效模型ARIMA(3,1,1)進(jìn)行短期預(yù)測(cè)。首先進(jìn)行動(dòng)態(tài)預(yù)測(cè),預(yù)測(cè)圖如下:
圖5 序列動(dòng)態(tài)預(yù)測(cè)圖
圖6 動(dòng)態(tài)預(yù)測(cè)效果圖
預(yù)測(cè)值存放在DYF序列中,作出dy和dyf動(dòng)態(tài)關(guān)系圖。如圖6,動(dòng)態(tài)預(yù)測(cè)值幾乎是一條直線,說明動(dòng)態(tài)預(yù)測(cè)效果不好。
再進(jìn)行靜態(tài)預(yù)測(cè),靜態(tài)預(yù)測(cè)只能進(jìn)行向前一步預(yù)測(cè),預(yù)測(cè)結(jié)果見圖8,可以看出靜態(tài)預(yù)測(cè)效果還是很理想的。
圖7 靜態(tài)預(yù)測(cè)圖
圖8 動(dòng)態(tài)預(yù)測(cè)效果圖
根據(jù)存放在dyf中的預(yù)測(cè)值,利用公式反推第一期預(yù)測(cè)值,將預(yù)測(cè)值加入歷史時(shí)間序列,同樣的過程可得出第二期預(yù)測(cè)值及直到m期。由于模型的局限性,這里只給出三期真實(shí)值與預(yù)測(cè)值的比較情況,結(jié)果如表4所示。
表4 ARIMA(3,1,1)模型預(yù)測(cè)結(jié)果
從預(yù)測(cè)擬合圖可以看出,該模型的預(yù)測(cè)效果較好,絕對(duì)誤差還是比較小的,相對(duì)誤差只有0.0135,從預(yù)測(cè)結(jié)果分析不難得出以下結(jié)論:
第一,ARIMA模型作為華泰證券指數(shù)的短期預(yù)測(cè)模型是可行的,從擬合圖可以看出擬合效果較好,說明此時(shí)間序列包含了華泰證券股價(jià)指數(shù)的大部分信息,并且可以看出靜態(tài)預(yù)測(cè)效果好于動(dòng)態(tài)預(yù)測(cè)。比如,華泰證券2015年3月31日的股價(jià)為30.11,之前幾期的股價(jià)以次為28.79、27、26.46、26.71,預(yù)測(cè)的結(jié)果分別為30.34、30.17、30.08,明顯股價(jià)有增長(zhǎng)趨勢(shì),這時(shí)可以考慮買進(jìn),以期獲利。
第二,模型倒推去計(jì)算預(yù)測(cè)值很可能產(chǎn)生累計(jì)誤差,從表4 ARIMA(3,1,1)結(jié)果圖中就可以看出,向前一期預(yù)測(cè)的誤差值是0.28,向前兩期是-0.18,向前三期絕對(duì)值大于前兩期的誤差為2.53,因?yàn)槎诘念A(yù)測(cè)值是由一期預(yù)測(cè)值推算的而非通過一期的真實(shí)值計(jì)算,這一特點(diǎn)不利于長(zhǎng)期預(yù)測(cè),但從相對(duì)誤差及平均相對(duì)誤差看,這三期的誤差還是很小的,預(yù)測(cè)效果還是比較理想的。
第三,時(shí)間序列本身的特性就是從歷史數(shù)據(jù)中提取有用信息,來對(duì)未來走勢(shì)進(jìn)行預(yù)測(cè),影響股價(jià)的其他因素僅以隨機(jī)項(xiàng)來反映,這也是時(shí)間序列模型的一個(gè)缺陷,本文不能對(duì)其他影響股價(jià)的因素進(jìn)行控制,在進(jìn)行數(shù)據(jù)選擇的時(shí)候,還要盡量避免受政策等影響產(chǎn)生重大波動(dòng)的情況,以降低預(yù)測(cè)誤差。
股票價(jià)格預(yù)測(cè)是一個(gè)充滿挑戰(zhàn)性的問題,但時(shí)間序列預(yù)測(cè)理論一直被認(rèn)為是對(duì)股價(jià)變化進(jìn)行統(tǒng)計(jì)預(yù)測(cè)的有效手段。因?yàn)闀r(shí)間序列預(yù)測(cè)理論具有很好的短期預(yù)測(cè)效果,雖然本文僅用了一步靜態(tài)預(yù)測(cè)的方法,但理論上時(shí)間序列可實(shí)現(xiàn)動(dòng)態(tài)的連續(xù)預(yù)測(cè),本文的實(shí)證分析也表明ARIMA模型作為華泰證券指數(shù)的短期預(yù)測(cè)模型是可行的,此時(shí)間序列包含了華泰證券股價(jià)指數(shù)的大部分信息,且擬合效果較好,從而ARIMA模型的應(yīng)用對(duì)本文把握住創(chuàng)業(yè)板買賣時(shí)機(jī)及回避風(fēng)險(xiǎn)也有一定參考價(jià)值。
由于時(shí)間有限,本文只針對(duì)華泰證券部分收盤價(jià)價(jià)格指數(shù)實(shí)際數(shù)據(jù)的變化做了建模分析,并且當(dāng)樣本數(shù)據(jù)發(fā)生變化時(shí),模型的參數(shù)結(jié)構(gòu)會(huì)隨之變化,這表明模型對(duì)樣本的變化十分敏感,對(duì)股價(jià)預(yù)測(cè)的波動(dòng)模式有短期穩(wěn)定性,預(yù)測(cè)的精度也因樣本變化而變化,結(jié)論可能缺乏普遍性,這就要求在利用ARIMA模型進(jìn)行股價(jià)預(yù)測(cè)時(shí),對(duì)發(fā)展比較穩(wěn)定,無因突發(fā)事件、政策出臺(tái)等外界因素產(chǎn)生較大異常波動(dòng)的歷史數(shù)據(jù)效果更好。
總之,本文通過建立時(shí)間序列模型,利用歷史價(jià)格作為序列數(shù)據(jù),對(duì)未來幾期價(jià)格進(jìn)行短期的預(yù)測(cè),希望能夠幫助投資者降低投資風(fēng)險(xiǎn)和發(fā)現(xiàn)投資機(jī)會(huì)。同時(shí)可以考慮結(jié)合其他預(yù)測(cè)方法,加強(qiáng)對(duì)股票市場(chǎng)自身體制因素、國家宏觀經(jīng)濟(jì)政策、國民經(jīng)濟(jì)發(fā)展方向等各種因素的關(guān)注,常常這些不定因素對(duì)股票的長(zhǎng)期走勢(shì)也有著重要的應(yīng)用價(jià)值。
[1]賀本嵐.股票價(jià)格預(yù)測(cè)的最優(yōu)選擇模型[J].統(tǒng)計(jì)與決策,2008,(6).
[2]曹冬.中國創(chuàng)業(yè)板市場(chǎng)發(fā)展的思考[J].理論前沿,2008,(1).
[3]李秀琴,梁滿發(fā).基于ARIMA模型的股票行情預(yù)測(cè)[J].長(zhǎng)春教育學(xué)院學(xué)報(bào),2013,(7).
[4]厲雨靜,程宗毛.時(shí)間序列模型在股票價(jià)格預(yù)測(cè)中的應(yīng)用[J].商場(chǎng)現(xiàn)代化,2011,(33).
[5]徐國祥.統(tǒng)計(jì)預(yù)測(cè)與決策[M].上海:上海財(cái)經(jīng)大學(xué)出版社,2008.
[6]楊陽.股票價(jià)格預(yù)測(cè)方法研究[J].經(jīng)營管理者,2011,(16).
[7]翟志榮,白艷萍.時(shí)間序列分析方法在股票市場(chǎng)中的應(yīng)用[J].太原師范學(xué)院學(xué)報(bào)(自然科學(xué)版),2011,(1).
(責(zé)任編輯/浩 天)
F830.91
A
1002-6487(2016)23-0083-04
吳玉霞(1971—),女,河北邢臺(tái)人,博士后,副教授,研究方向:國民經(jīng)濟(jì)統(tǒng)計(jì)分析。溫 欣(1993—),女,江蘇徐州人,碩士研究生,研究方向:金融統(tǒng)計(jì)分析。