李秀琴,梁滿(mǎn)發(fā)
李秀琴/中山火炬職業(yè)技術(shù)學(xué)院公共課部講師,碩士(廣東中山528437);梁滿(mǎn)發(fā)/華南理工大學(xué)理學(xué)院副教授,碩士(廣東廣州510640)。
股市行情預(yù)測(cè)方法研究是投資人或金融投資研究者的難題,時(shí)間序列模型是一種重要的現(xiàn)代統(tǒng)計(jì)分析方法,ARIMA模型就是一種重要的時(shí)間序列模型[1]。雖然股市行情數(shù)據(jù)貌似雜亂無(wú)章,但大量文獻(xiàn)實(shí)證研究表明,常常在某一時(shí)期市場(chǎng)行情模式也會(huì)反復(fù)重現(xiàn),這正是ARIMA模型的應(yīng)用前提條件,因此探索ARIMA模型在股票投資預(yù)測(cè)方面應(yīng)用是可行的,有價(jià)值的。
時(shí)間序列分析是決策、預(yù)測(cè)的主要方法,SAS軟件提供了強(qiáng)大的時(shí)間序列分析功能,即ARIMA()過(guò)程[2]。模型表達(dá)形式為 ARIMA(p,d,q),其中 p 為自回歸項(xiàng)數(shù),q 為移動(dòng)平均項(xiàng)數(shù),d表示差分的階數(shù)。若時(shí)間序列是平穩(wěn)的可直接運(yùn)用ARIMA模型,若時(shí)間序列是不平穩(wěn)的,則需要經(jīng)過(guò)d階差分,將非平穩(wěn)的時(shí)間序列轉(zhuǎn)化為平穩(wěn)的時(shí)間序列[3]。ARIMA模型數(shù)學(xué)表達(dá)式如下:?(B)·Δdpt=θ(B)·εt。 式中 ?(B)是自回歸算子 , △=1-B是差分算子 , ?(B)為移動(dòng)平均算子[4]。
本文主要通過(guò)應(yīng)用ARIMA時(shí)間序列模型對(duì)上證指數(shù)進(jìn)行模型識(shí)別,模型擬合及檢驗(yàn),并運(yùn)用擬合模型預(yù)測(cè)上證指數(shù)短期的走勢(shì),對(duì)預(yù)測(cè)誤差分析檢驗(yàn),判斷模型的可靠性及預(yù)測(cè)效果。
1.樣本數(shù)據(jù)。本文數(shù)據(jù)來(lái)源于Wind資訊金融終端,選取上證指數(shù)2005年4月1日至2006年3月31日一年間的日-收盤(pán)指數(shù)作為預(yù)測(cè)模型的建模輸入數(shù)據(jù)。本文將用ARIAM模型預(yù)測(cè)2006年4月份的收盤(pán)指數(shù)。
2.數(shù)據(jù)處理。本文以日-收盤(pán)指數(shù)作為預(yù)測(cè)模型的輸入數(shù)據(jù),即時(shí)間間隔的單位按日計(jì)算,這樣會(huì)出現(xiàn)缺值。本文采用了較普遍的線性插值法,若某一天缺值,則以前一天和后一天的收盤(pán)指數(shù)相加,再除以2得出那天的值。連續(xù)多天缺值也按這種方法插值。經(jīng)處理后的時(shí)間序列共有261個(gè)數(shù)據(jù),是從2005年4月1日至2006年3月31日,部分樣本如表1所示。
表1 時(shí)間序列部分樣本的數(shù)據(jù)
1.數(shù)據(jù)導(dǎo)入。運(yùn)行Enterprise Guide 3.0,打開(kāi)儲(chǔ)存在Excel中的數(shù)據(jù),并轉(zhuǎn)換成SAS的數(shù)據(jù)格式。原來(lái)的數(shù)據(jù)的日期表示形式為:年年月月日日(YYMMDD)。但在轉(zhuǎn)換時(shí),SAS軟件默認(rèn)的讀取輸入格式為:MMDDYY。因此要更改日期顯示方法,生成SAS數(shù)據(jù)格式的過(guò)程為,日線(2005年4月-2006年3月)(sheet1$)→導(dǎo)入數(shù)據(jù)→SASUSER.1,運(yùn)行后生成SAS格式的數(shù)據(jù)文件。
2.建模過(guò)程。利用上述生成的SAS數(shù)據(jù)文件,作為輸入數(shù)據(jù),創(chuàng)建時(shí)間序列分析及預(yù)測(cè)模型--ARIMA模型。SAS的“ARIMA建模和預(yù)測(cè)”任務(wù)分為三個(gè)階段:認(rèn)別階段、估計(jì)階段和預(yù)測(cè)階段。在此之前先要對(duì)該模型設(shè)置“任務(wù)角色”,把“收盤(pán)指數(shù)”設(shè)為時(shí)間序列變量,把“日期”設(shè)為時(shí)間ID變量。
(1)識(shí)別階段。在此階段首先要設(shè)置的是“差分滯后”,這是模型中較為重要的參數(shù)之一。若時(shí)間序列是平穩(wěn)的,那么就不需要進(jìn)行差分,但本文所研究的時(shí)間序?yàn)榉瞧椒€(wěn)的,因此對(duì)時(shí)間序列要進(jìn)行兩次一步滯后的差分即在差分滯后中填上 (1,1),這時(shí)序列的自相關(guān)和偏相關(guān)函數(shù)都呈緩慢的收斂,時(shí)間序列經(jīng)過(guò)差分后,近似平穩(wěn),數(shù)據(jù)的個(gè)數(shù)由261個(gè)變?yōu)?59個(gè)。
下一個(gè)要設(shè)置的就是平隱性檢驗(yàn)及圖形和結(jié)果,圖形和結(jié)果主要設(shè)置自相關(guān)圖形的滯后個(gè)數(shù),以及圖形顯示和儲(chǔ)存問(wèn)題。
(2)參數(shù)估計(jì)階段。選取了“執(zhí)行估計(jì)步驟”后,就要設(shè)置模型定義,也是就該模型的核心內(nèi)容,需要設(shè)置“自回歸p(AR模型因子)”以及另一參數(shù)“移動(dòng)平均Vq(MA模型因子)”。這里p和q的選取比較復(fù)雜,除了會(huì)互相影響t率外,根據(jù)文獻(xiàn)[1]亦受 AIC準(zhǔn)則要求限制,AIC的值越小越好。 例如選了 1至 7作為 q值, MA1,1、MA1,2、MA1,3和MA1,4 參數(shù)的 t Value分別為-0.01、0.91、-0.10 和-1.07,由于t率太小,所以該項(xiàng)q的假設(shè)檢驗(yàn)并不顯著,故可以丟棄這幾項(xiàng)。
在不斷調(diào)試后,得出了一個(gè)比較合理的p和q的值:P=24,26 ;q=9,10,19,22,30。 下一步就是模型選項(xiàng),本文使用的是“無(wú)條件最小二乘法”。
(3)預(yù)測(cè)階段。首先選取了“執(zhí)行預(yù)測(cè)步驟”,在“觀測(cè)間的時(shí)間”選項(xiàng)中選擇“每日,不計(jì)周末”,以及確定“要預(yù)測(cè)的時(shí)間間隔”為“20”,即要預(yù)測(cè)06年4月份的收盤(pán)指數(shù)?!爸眯潘健倍?5%,最后在圖形和結(jié)果介面中勾取“預(yù)測(cè)數(shù)據(jù)”以及“實(shí)際值和向前一步預(yù)測(cè)值”。至此,模型參數(shù)設(shè)置完成!
建模完成的過(guò)程圖為:日線(2005年4月-2006年3月)(sheet1$)→導(dǎo)入數(shù)據(jù)→SASUSER.1→ARIMA
運(yùn)行結(jié)果顯示:AIC的值為 2254.895,SBS的值為2283.35,兩者的值也不算太大,說(shuō)明模型擬合可以接受。通過(guò)ARIMA建模和預(yù)測(cè)得到的收盤(pán)指數(shù)與模型預(yù)測(cè)的將來(lái)值如圖1所示。
圖1 收盤(pán)指數(shù)及模型預(yù)測(cè)的將來(lái)值
模型預(yù)測(cè)了06年4月3日至4月28日的上證指數(shù)收盤(pán)指數(shù),使用Enterprise的圖形工具,現(xiàn)將它與實(shí)際的收盤(pán)指數(shù)作比較,通過(guò)如下過(guò)程:實(shí)際指數(shù)與預(yù)測(cè)指數(shù)→導(dǎo)入數(shù)據(jù)→SASUSER.1→線圖→HTML-線圖,得到如圖2所示。由此反映出模型的實(shí)際預(yù)測(cè)能力,以及預(yù)測(cè)模型在股票分析中的存在價(jià)值。
圖2 上證指數(shù)收盤(pán)指數(shù)的預(yù)測(cè)指數(shù)與真實(shí)指數(shù)
從圖2中能看出,預(yù)測(cè)指數(shù)雖然與真實(shí)指數(shù)在一定的差別,但已經(jīng)能夠很好地預(yù)測(cè)出上證指數(shù)收盤(pán)指數(shù)的基本走勢(shì),當(dāng)中更有部分?jǐn)?shù)值幾乎與真實(shí)價(jià)相同了。
以下將參考文獻(xiàn)[5]方法,列表計(jì)算對(duì)預(yù)測(cè)與實(shí)際值之間的誤差,相對(duì)誤差,如表2所示。
其中:誤差=收盤(pán)指數(shù)-預(yù)測(cè)指數(shù);相對(duì)誤差=誤差/收盤(pán)指數(shù)*100%
從表2中看出,相對(duì)誤差全部都少于2%,擬合程度非常高,進(jìn)一步確認(rèn)了ARIMA模型在短期預(yù)測(cè)中的準(zhǔn)確性。
表2 誤差分析
本文選取上證收盤(pán)指數(shù)作為研究對(duì)象,使用SAS軟件操作了ARIMA模型建立過(guò)程,并借此來(lái)探尋股市的預(yù)測(cè)方法。本文通過(guò)ARIMA模型各種搭配反復(fù)試算,建立精度較理想的預(yù)測(cè)模型,提供了能進(jìn)行股票指數(shù)短期預(yù)測(cè)的量化投資方法。由于我們選取的數(shù)據(jù)不夠充分,實(shí)證結(jié)果還存在局限性,結(jié)果僅作投資參考。
[1]王波,張鳳玲.神經(jīng)網(wǎng)絡(luò)與時(shí)間序列模型在股票預(yù)測(cè)中的比較[J].武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版),2005, 27(6):69-73
[2]賈勇寧.分析、預(yù)測(cè)方法在決策支持中的應(yīng)用[J].鐵路通信信號(hào),2004,40(5):12-14
[3]厲雨靜,程宗毛.時(shí)間序列模型在股票價(jià)格預(yù)測(cè)中的應(yīng)用[J].商場(chǎng)現(xiàn)代化,2011,(33):61-63
[4]趙志峰.對(duì)建立中國(guó)股票價(jià)格指數(shù)時(shí)間序列模型的探討[J].統(tǒng)計(jì)與信息論壇,2003,18(1):66-69
[5]李民,鄒捷中,李俊平,梁建武.用ARMA模型預(yù)測(cè)深滬股市[J].長(zhǎng)沙鐵道學(xué)院學(xué)報(bào),2002, 18(1):81-87