王若星, 張德生, 彭瀟熟
(西安理工大學(xué)理學(xué)院, 陜西 西安 710054)
從以往眾多的對(duì)中國(guó)證券市場(chǎng)的實(shí)證分析中我們可以知道:證券市場(chǎng)的波動(dòng)性不僅隨時(shí)間變化,而且過去回報(bào)的干擾項(xiàng)不對(duì)稱地影響著未來的波動(dòng)性.投機(jī)性價(jià)格的變化和收益率的變化具有穩(wěn)定時(shí)期和易變時(shí)期,即價(jià)格波動(dòng)呈現(xiàn)集群性,方差隨時(shí)間變化.基于以上特點(diǎn)的模型有很多,其中廣義自回歸條件異方差(GARCH)模型族是比較常用的選擇.如談琳琳[1]基于GARCH模型對(duì)滬深兩市的波動(dòng)性進(jìn)行了分析;劉妹伶等[2]基于GARCH模型對(duì)人民幣/美元匯率進(jìn)行了預(yù)測(cè).
由于人工神經(jīng)網(wǎng)絡(luò)能夠較好地體現(xiàn)過去的干擾項(xiàng)與未來波動(dòng)性的非線性關(guān)系,所以人工神經(jīng)網(wǎng)絡(luò)對(duì)證券市場(chǎng)的分析也比較成功,并且神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)滿足以下條件的問題時(shí)特別有效: (1)自變量和因變量之間的關(guān)系沒有已知的數(shù)學(xué)方程;(2)預(yù)測(cè)比解釋更重要;(3)有足夠多的數(shù)據(jù)可供建模.這正好是金融時(shí)間序列所需要的.NN-GARCH模型就是將神經(jīng)網(wǎng)絡(luò)應(yīng)用于金融時(shí)間序列建模的方法,它是一個(gè)在均值方程中具有非線性神經(jīng)網(wǎng)絡(luò)參數(shù),方差方程中具有線性GARCH參數(shù)的模型,同時(shí)優(yōu)點(diǎn)還體現(xiàn)在每一步建模過程都被清楚的論證并且實(shí)施,包括輸入變量的選擇,神經(jīng)網(wǎng)絡(luò)隱含單元的個(gè)數(shù)都是通過嚴(yán)格的檢驗(yàn)得到的.因此,相對(duì)于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)研究方法,NN-GARCH模型更加科學(xué),更具有實(shí)用性.
另外,在以往的建模過程中,往往不考慮數(shù)據(jù)中的噪聲影響而直接對(duì)原始數(shù)據(jù)建立模型,實(shí)際上,噪聲會(huì)影響分析、預(yù)測(cè)的準(zhǔn)確度,相比其它的濾波方法,小波變換具有良好的時(shí)域和頻域分析能力,它將時(shí)間序列作為信號(hào)序列分解為具有不同振幅、相位和頻率的周期分量的疊加,可以尋找序列中隱含的內(nèi)在因素,因而在處理非平穩(wěn)信號(hào)上有其特殊的效果.鄧凱旭等[3]將小波多分辨分析理論與自回歸(AR)模型結(jié)合起來進(jìn)行線性預(yù)測(cè),得到了優(yōu)于傳統(tǒng)AR模型的預(yù)測(cè)效果.
本文首先將神經(jīng)網(wǎng)絡(luò)與GARCH模型結(jié)合,得到含單隱含層的前饋神經(jīng)網(wǎng)絡(luò)時(shí)間序列模型(NN-GARCH),然后將小波多分辨分析與NN-GARCH模型結(jié)合,建立了基于小波的NN-GARCH模型,最后對(duì)上證指數(shù)進(jìn)行了實(shí)證分析.
小波多分辨分析可以通過Mallat算法實(shí)現(xiàn).Mallat分解算法如下:
(1)
當(dāng)分解進(jìn)行到J-1層時(shí),原始信號(hào)被分解為J-1個(gè)高頻信號(hào)和一個(gè)低頻信號(hào).對(duì)這些信號(hào)再進(jìn)行重構(gòu)結(jié)果如下
Vj=HVj+1+GWj+1
(2)
ARCH模型[5]的主要思想為擾動(dòng)項(xiàng)εt的條件方差依賴于它的前期值的大小,通過對(duì)序列的均值和方差同時(shí)建模.設(shè)yt為因變量,xt為解釋變量,在t時(shí)刻可獲得的信息集為Ωt-1的條件下,誤差項(xiàng)εt以0為期望值,ht為條件方差的正態(tài)分布.以ARCH(q)為例,均值方程為:
yt=Xtβ+εt
(3)
隨機(jī)干擾項(xiàng)的平方ε2服從AR(p)過程,可用下面方程表示:
(4)
(5)
其中,vt獨(dú)立分布,E(vt)=0,D(vt)=1;a0>0,ai≥0(i=1,2,…,q),且a0+a1+…+aq<1,則稱誤差項(xiàng)εt服從q階的ARCH過程,計(jì)作εt~ARCH(q)過程.ARCH(q)模型表明過去的波動(dòng)對(duì)市場(chǎng)未來的不斷有著正向而緩解的影響,因此波動(dòng)會(huì)持續(xù),從而模擬了市場(chǎng)波動(dòng)的集群性現(xiàn)象.
在實(shí)際應(yīng)用中,ARCH模型往往難以估計(jì)參數(shù)數(shù)量眾多的模型.為克服這一困難,Bollerslev(1986)[6]提出了廣義ARCH模型,即GARCH模型或GARCH(p,q)模型.與ARCH模型一樣,GARCH模型通常也用于對(duì)回歸或自回歸模型的隨機(jī)擾動(dòng)項(xiàng)進(jìn)行建模.GARCH模型的條件方差表達(dá)如下:
(6)
為保證條件方差ht>0,要求a0>0,ai≥0,i=1,2,…,q,βj≥0,j=1,2,…,p.
用GARCH(p,q)表示階數(shù)為p和q的GARCH過程.為了保證GARCH(p,q)是寬平穩(wěn)的,存在參數(shù)約束條件α+β<1.
Nikos S.Thomaidis等(2005)[7]定義均值方程為線性自回歸和神經(jīng)網(wǎng)絡(luò)參數(shù)的混合模型,它的一般形式為:
(7)
εt|Zt~N(0,ht)
(8)
(9)
(10)
我們的目標(biāo)是得到既能較準(zhǔn)確的對(duì)股票數(shù)據(jù)進(jìn)行擬合和預(yù)測(cè),又能得到最簡(jiǎn)潔的模型.以下是我們建模的具體過程:
(1) 對(duì)原始信號(hào)選用適當(dāng)?shù)男〔ê瘮?shù),使用式(1)進(jìn)行小波分解,根據(jù)小波多分辯分析的理論[4],分解的層次越高,去掉的低頻成份就越多,丟失的有用信息也越多.為了建立合理的模型,一般分解不應(yīng)超過3層.然后利用式(2)對(duì)分解后的各層信號(hào)進(jìn)行單支重構(gòu),即得單支重構(gòu)后的信號(hào)W1,W2,…,WJ-1和VJ-1;
(2) 對(duì)WJ(1≤J≤J-1)和VJ-1分別建立NN-GARCH模型,并估計(jì)其參數(shù);
(3) 對(duì)建立的模型的合理性進(jìn)行檢驗(yàn);
從而得到原時(shí)間序列的預(yù)測(cè)值為
(11)
NN-GARCH模型的建模過程為:
(1)由一個(gè)線性模型開始,在同方差假定下,依據(jù)最小二乘準(zhǔn)則(LS criterion)估計(jì)一個(gè)無GARCH效應(yīng)的線性AR(p)方程:
(12)
(2)設(shè)定一個(gè)顯著性水平(如a%),檢驗(yàn)原假設(shè)真實(shí)數(shù)據(jù)的生成過程是一個(gè)線性過程;備擇假設(shè):
數(shù)據(jù)的生成過程是含有單隱含層的神經(jīng)網(wǎng)絡(luò)模型(Ⅰ).如果在給定的顯著性水平下線性性不被拒絕,則停止.否則,用NLS方法估計(jì)含有單一神經(jīng)元的神經(jīng)網(wǎng)絡(luò)模型,并在αρ,0<ρ<1的顯著性水平下,檢驗(yàn)備擇假設(shè):再加入一個(gè)額外神經(jīng)元(即含有兩個(gè)神經(jīng)元)的神經(jīng)網(wǎng)絡(luò)模型(Ⅱ).如果零假設(shè)不被拒絕,則停止.否則,對(duì)于含有h個(gè)神經(jīng)元的神經(jīng)網(wǎng)絡(luò)模型(h=2,3,…)重復(fù)上面的過程,直到首次接受零假設(shè)為止.在每一次接下來的檢驗(yàn)中都將顯著性水平降低,直到收斂至0為止,在本文中,我們?nèi)ˇ?1/2,這樣就可以避免過度擬合數(shù)據(jù),也避免估計(jì)出過于冗余的模型,從而控制住整個(gè)過程的顯著性水平.
(3)估計(jì)出了合適的條件均值方程,利用Engle(1982)[5]提出的LM檢驗(yàn),在給定的階數(shù)下檢驗(yàn)方程有無ARCH效應(yīng),即檢驗(yàn)原假設(shè):模型的殘差序列中不存在ARCH效應(yīng),備擇假設(shè):殘差序列在給定的階數(shù)下存在ARCH效應(yīng).如果原假設(shè)不被拒絕,則停止.否則:
(a) 開始用條件均值方程的殘差序列估計(jì)一個(gè)GARCH(l,1)模型.
(b) 聯(lián)合估計(jì)NN-GARCH(1,1)模型的參數(shù).
(c) 刪掉不顯著的參數(shù)并重新估計(jì)模型.
本文對(duì)上證指數(shù)進(jìn)行了實(shí)證研究.取樣時(shí)間是從2008年4月23日至2010年6月10日,不包括沒有交易的日子,共523個(gè)數(shù)據(jù),原始數(shù)據(jù)來源于大智慧軟件.原始數(shù)據(jù)見圖1.
圖1 原始數(shù)據(jù)
首先進(jìn)行小波分解,將數(shù)據(jù)分解得到一個(gè)逼近序列和2個(gè)細(xì)節(jié)序列,然后采用ADF方法進(jìn)行平穩(wěn)性檢驗(yàn),結(jié)果表明:逼近序列不平穩(wěn),而兩個(gè)細(xì)節(jié)序列是平穩(wěn)的.對(duì)逼近序列采用對(duì)數(shù)差分進(jìn)行平穩(wěn)化處理:Yt=100(lnXt-lnXt-1).用前508個(gè)數(shù)據(jù)建立模型,用剩下的15個(gè)數(shù)據(jù)評(píng)價(jià)模型.本文用 Eviews 6.0處理時(shí)間序列,用Matlab處理神經(jīng)網(wǎng)絡(luò)及其診斷檢驗(yàn).
經(jīng)過多次實(shí)驗(yàn),本文利用Daubechies小波系中的db2對(duì)原信號(hào)進(jìn)行2尺度分解,得到一個(gè)逼近序列和2個(gè)細(xì)節(jié)序列(圖2).
對(duì)分解后的不同子序列采用ADF檢驗(yàn)法進(jìn)行平穩(wěn)性檢驗(yàn),然后對(duì)非平穩(wěn)的序列進(jìn)行平穩(wěn)化處理.從圖3得出重構(gòu)近似系數(shù)CA2,經(jīng)ADF檢驗(yàn)為非平穩(wěn)序列,對(duì)其取對(duì)數(shù)再一階差分進(jìn)行平穩(wěn)化處理,通過ADF檢驗(yàn)平穩(wěn)(表1),得到序列{xt},最后利用第三部分介紹的方法分別建立NN-GARCH模型,利用AIC準(zhǔn)則和SBIC準(zhǔn)則選擇結(jié)點(diǎn)的個(gè)數(shù)和滯后變量.并對(duì)單支重構(gòu)后的時(shí)間序列(圖3)分別進(jìn)行預(yù)測(cè),最后,把預(yù)測(cè)值相加得到原始序列的預(yù)測(cè)值.
圖2 小波分解 圖3 小波重構(gòu)
表1 近似細(xì)節(jié)數(shù)對(duì)數(shù)差分后的ADF檢驗(yàn)結(jié)果
利用3中方法對(duì)經(jīng)過平穩(wěn)化處理后的重構(gòu)近似系數(shù){xt}進(jìn)行建模,用2008年4月23日~2010年5月20日共508個(gè)數(shù)值建立模型和預(yù)報(bào)方程,其中變量的選擇采用AIC、BIC及SBIC準(zhǔn)則進(jìn)行選取.并對(duì)2010年5月21日~6月3日共10個(gè)數(shù)值進(jìn)行預(yù)報(bào).用Matlab編程,并經(jīng)過還原處理,得到近似系數(shù)序列的擬合結(jié)果和預(yù)測(cè)結(jié)果.
再分別對(duì)重構(gòu)細(xì)節(jié)系數(shù)CD1序列和CD2序列按照3中的步驟建立NN-GARCH模型,將它們的擬合、預(yù)測(cè)結(jié)果和重構(gòu)近似細(xì)節(jié)CA2的擬合、預(yù)測(cè)結(jié)果相加,作為最終的擬合、預(yù)測(cè)結(jié)果.最后,將此模型的預(yù)測(cè)結(jié)果與未加小波的NN-GARCH模型以及AR-NN模型的預(yù)測(cè)結(jié)果進(jìn)行比較,結(jié)果見表2.
CA2序列建模結(jié)果:
yt= -99.21-3.99yt-1-6.05yt-4-7.86yt-8+191.90F[0.23(0.42yt-1+0.52yt-4+0.74yt-8
ht=0.73-0.03εt2+0.26ht-1
(13)
CD1序列建模結(jié)果:
yt= 2.49-0.99yt-1-1.39yt-2-0.96yt-3-0.21yt-4
+41.47F[0.19(0.59yt-1+0.76yt-2+0.29yt-4-0.15)]
ht=109.39+0.45εt2-0.07ht-1
(14)
CD2序列建模結(jié)果:
yt= 18.29+1.24yt-1-2.10yt-2+0.92yt-3-1.05yt-4
-185.94F[0.12(1.07yt-1+1.40yt-2+0.63yt-4+0.88)]
ht=13.63+0.10εt2+0.82ht-1
(15)
表2 各模型預(yù)測(cè)結(jié)果對(duì)比
注相對(duì)誤差=(實(shí)際值-預(yù)測(cè)值)/實(shí)際值.
利用平均絕對(duì)誤差MAE與均方誤差MSE比較預(yù)測(cè)效果,結(jié)果見表3,計(jì)算公式為:
(16)
從表2可以看出:基于小波的NN-GARCH模型的預(yù)測(cè)結(jié)果的相對(duì)誤差比NN-GARCH和GARCH兩個(gè)模型的預(yù)測(cè)結(jié)果的相對(duì)誤差小.從表3也可以看出:基于小波的NN-GARCH模型的預(yù)測(cè)結(jié)果的MAE和MSE比其它兩個(gè)模型的預(yù)測(cè)結(jié)果的MAE和MSE小.
表3 各模型預(yù)測(cè)結(jié)果MAE、MSE對(duì)比
本文對(duì)上證指數(shù)建立了基于小波的NN-GARCH模型,并與加入神經(jīng)元的NN-GARCH模型以及單純的GARCH模型的預(yù)測(cè)結(jié)果進(jìn)行了比較,從實(shí)證研究結(jié)果可以看出:加入神經(jīng)元(NN)的小波GARCH模型的預(yù)測(cè)效果比只含有神經(jīng)元的GARCH模型的預(yù)測(cè)效果好,同時(shí)只含有神經(jīng)元的GARCH模型的預(yù)測(cè)效果優(yōu)于單純的GARCH模型的預(yù)測(cè)效果.這主要是因?yàn)椴粌HGARCH模型可以消除異方差性,小波多分辨分析還可以去除偶然因素造成的噪聲影響,提高預(yù)測(cè)的精度,而加入神經(jīng)元又可以更好的利用神經(jīng)網(wǎng)絡(luò)的特性來擬合數(shù)據(jù)的非線性性.所以,基于小波的NN-GARCH模型可以對(duì)時(shí)間序列作出更準(zhǔn)確的預(yù)測(cè).
參考文獻(xiàn)
[1] 談琳琳. 基于GARCH模型的滬深兩市波動(dòng)性分析[J]. 當(dāng)代經(jīng)濟(jì),2008,(8): 154-156.
[2] 劉妹伶,溫 濤,葛 軍.人民幣匯率預(yù)測(cè)及方法選擇——基于ARIMA與GARCH模型[J]. 技術(shù)經(jīng)濟(jì)與管理研究,2008,159(4):91-93.
[3] 鄧凱旭,宋寶瑞. 小波變換在金融數(shù)據(jù)分析中的應(yīng)用[J]. 數(shù)理統(tǒng)計(jì)與管理,2006,25(2):215-219.
[4] 程正興. 小波分析算法與應(yīng)用[M]. 西安:西安交通大學(xué)出版社,1998.
[5] Engel. Auto regressive conditional hetero skedasticity with estimates of U.K inflation[J]. Econometrics,1982,(50):987-1008.
[6] Bollerslew Tim. Generalized auto regressive conditional hetero scedasticity[J].Journal of Econometric-s, 1986,(2):31-32.
[7] N.S. Thomaidis, G.Dounias, N. Kondakis. Financial statistical modeling with a new nature-inspired technique[C]. Proc. of the 1st European Symposium on Nature-Inspired Smart-Information Systems(NISIS), Albufeira, Portugal, 2005.