林鋒權(quán)
(福建師范大學(xué)經(jīng)濟(jì)學(xué)院 福建 福州 350000)
金融時(shí)間序列的波動(dòng)率會(huì)隨著時(shí)間變化,這在實(shí)證金融中已經(jīng)是廣為熟悉和被接受的典型事實(shí)。但是,波動(dòng)率的不可預(yù)測性使得度量和預(yù)測它成為一件難度非常大的任務(wù)。通常,以下三種經(jīng)驗(yàn)觀察推動(dòng)了波動(dòng)率模型的演變。
1.波動(dòng)性聚集:它指的是金融市場上,大波動(dòng)往往跟著大波動(dòng);小波動(dòng)往往也跟著小波動(dòng)。兩者的界限和明顯。
2.資產(chǎn)收益率的非正態(tài)性:實(shí)證分析顯示,相對于正態(tài)分布,資產(chǎn)收益率分布趨向于厚尾性。
3.杠桿效應(yīng):這會(huì)導(dǎo)致一種現(xiàn)象,波動(dòng)率對正價(jià)格變動(dòng)或負(fù)價(jià)格變動(dòng)的反應(yīng)往往不同。價(jià)格下降時(shí)波動(dòng)率的增大幅度大于相似規(guī)模的價(jià)格上漲帶來的波動(dòng)率的變動(dòng)。
正是有了實(shí)證的觀察,推動(dòng)了無數(shù)的學(xué)者對金融時(shí)間序列的異方差性進(jìn)行詳細(xì)的實(shí)證研究,也使得一系列估計(jì)波動(dòng)率的模型得以推出,其中就包括了著名的ARCH模型。ARCH模型(Autoregressive conditional heteroskedasticity model)全稱“自回歸條件異方差模型”,解決了傳統(tǒng)的計(jì)量經(jīng)濟(jì)學(xué)對時(shí)間序列變量的第二個(gè)假設(shè)(方差恒定)所引起的問題。這個(gè)模型是獲得2003年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的計(jì)量經(jīng)濟(jì)學(xué)成果之一。
ARCH模型的介紹:
(1.1)
其中α0>0,αi≥0,i>0,即各期收益以非負(fù)數(shù)線性組合,常數(shù)項(xiàng)為正數(shù)。
GARCH模型的介紹:
如果方差用ARMA模型來表示,則ARCH模型的變形為GARCH模型(波勒斯勒(Bollerslev),1986年)
本次作業(yè)的樣本數(shù)據(jù)選自恒生指數(shù)收盤價(jià)的月度對數(shù)收益率,時(shí)間從2000.01.01至2020.05.01。在做具體的建模過程之前,首先要做的就是對該時(shí)間序列數(shù)據(jù)進(jìn)行簡單又直觀的觀察。波動(dòng)率的分析始于觀察自相關(guān)以及偏相關(guān)函數(shù),因此先計(jì)算出該序列以及平方后序列的ACF、PACF進(jìn)行觀察。結(jié)果如下圖所示:
從圖1可知,對數(shù)收益率的平方值出現(xiàn)了顯著的自相關(guān)性。這意味著對數(shù)收益率不相關(guān),也不獨(dú)立。
圖1
GARCH模型可以用如下的公式表示
εt=σtηt
(3.2)
(3.3)
在實(shí)證研究中,GARCH(1,1)模型常常為數(shù)據(jù)提供了合適的擬合。它很好的捕捉到了波動(dòng)的自回歸特性(波動(dòng)聚集性)和資產(chǎn)收益率分布的尖峰效應(yīng)。而且GARCH模型中出現(xiàn)波動(dòng)聚集符合經(jīng)驗(yàn)觀察的結(jié)果。模型中的ηt正且大的沖擊會(huì)增大εt的值,進(jìn)而會(huì)增加σt的值,并導(dǎo)致更大的εt并且沖擊是會(huì)持續(xù)的。這就可以解釋波動(dòng)率的聚集效應(yīng)。
在訓(xùn)練模型之前,為了驗(yàn)證模型的有效性以及與后面的隨機(jī)森林模型進(jìn)行橫向?qū)Ρ取R虼藢颖緮?shù)據(jù)劃分成兩大部分:訓(xùn)練集數(shù)據(jù)以及測試機(jī)數(shù)據(jù)。由于樣本數(shù)據(jù)是從2000.01.-2020.03,因此將2000.1-2019.05作為訓(xùn)練集,共計(jì)232個(gè)樣本;2019.06-2020.03共計(jì)9個(gè)樣本。下面使用GARCH模型對序列數(shù)據(jù)進(jìn)行擬合:在R中GARCH程序包包含了各種形式的數(shù)據(jù)分布假設(shè),由于本文假設(shè)數(shù)據(jù)是服從正態(tài)分布的。故采用GARCH(1,1)-N模型進(jìn)行模型參數(shù)的估計(jì)。
上文中將原始數(shù)據(jù)劃分成兩部分:訓(xùn)練集(2000.1-2019.06),測試集(2019.06-2020.03)。在建立完GARCH(1,1)模型后,需要用測試集數(shù)據(jù)對其估計(jì)的結(jié)果進(jìn)行檢測。具體做法是:首先用模型進(jìn)行估計(jì),再計(jì)算出測試集數(shù)據(jù)的均值和標(biāo)準(zhǔn)差,最后,進(jìn)行橫向?qū)Ρ?。下面給出具體的結(jié)果:
從表1,可以看出:雖然模型預(yù)測不可避免的會(huì)帶來誤差,但是GARCH模型仍然較好地?cái)M合了測試集數(shù)據(jù)。其模型的預(yù)測能力明顯優(yōu)于ARIMA模型。但是其與機(jī)器學(xué)習(xí)的模型預(yù)測能力孰優(yōu)孰劣,還要看下文的對比。
表1
隨機(jī)森林是基于決策樹的組合模型。若因變量為連續(xù)變量則建立非線性回歸分析模型,若因變量為分類變量則建立分類判別模型。隨機(jī)森林在分類中返回得票數(shù)最多的分類選項(xiàng),而在回歸中返回所有決策樹輸出的平均值。它與bagging非常類似,也是Beriman(2001)發(fā)明的。隨機(jī)森林是從原始數(shù)據(jù)提取有一定數(shù)量的自助法樣本。對每一個(gè)樣本都建立一棵決策樹,其中每個(gè)節(jié)點(diǎn)都是隨機(jī)選擇競爭變量的,不需要人工選擇競爭變量;隨機(jī)森林的每棵樹都不需要剪枝,讓其充分的生長。最終預(yù)測結(jié)果是對所有決策樹結(jié)果的加權(quán)平均。而且隨機(jī)森林的這種隨機(jī)選擇少數(shù)自變量來競爭節(jié)點(diǎn)拆分變量的做法使得一些弱勢變量也有機(jī)會(huì)參加建模,因此可能會(huì)揭示一些尚未被人們發(fā)現(xiàn)的數(shù)據(jù)規(guī)律。同時(shí)隨機(jī)森林也可以計(jì)算OOB交叉驗(yàn)證誤差,來從不同角度驗(yàn)證自變量的重要性。隨機(jī)森林還能夠處理所謂的“維數(shù)咀咒”問題,并能處理自變量具有高階交互作用以及自變量相關(guān)的問題。
本次實(shí)驗(yàn)選擇的因變量依舊是恒生指數(shù),自變量選擇了恒生指數(shù)滯后一階、上證指數(shù)(SSEC)、日經(jīng)225指數(shù)(N225)、道瓊斯工業(yè)指數(shù)(DJI)以及標(biāo)普500指數(shù)(SNP)。之所以選擇這些變量的原因在于,在全球金融市場背景下,不同區(qū)域市場之間存在很強(qiáng)的聯(lián)動(dòng)性,但是區(qū)域市場也會(huì)有自己的獨(dú)特的個(gè)性。
采用R語言中的randomForest函數(shù)包進(jìn)行擬合。下面展示變量的重要性:
表2
從上表可以看出,對于恒生指數(shù)而言,自變量中標(biāo)普500、道瓊斯指數(shù),以及上證指數(shù)對其影響較大,其滯后一階的指數(shù)反而對其影響不大。這說明,香港的股票市場主要受到發(fā)達(dá)國家尤其是美國股市的影響,其次影響較大的是中國的股票市場。
從當(dāng)前國內(nèi)國外的金融局勢來看,美國依舊是世界的金融中心,它的一舉一動(dòng)的確會(huì)對全球其他金融市場的股市產(chǎn)生比較大的影響。隨著國內(nèi)在香港上市的公司不斷增加,國內(nèi)股票市場也或大或小的影響著香港的股票市場。
根據(jù)誤差的結(jié)果可以看到,隨著隨機(jī)森林決策樹數(shù)目的增多,誤差(MSE)會(huì)不斷降低;同時(shí)隨著解釋變量的增多,誤差(MSE)也在降低。但是如果用太多的決策樹或者變量反而會(huì)出現(xiàn)過學(xué)習(xí)的結(jié)果。因此在此案例中,選擇100棵決策樹,且選擇四個(gè)解釋變量為最佳的方案。
本次案例節(jié)選了后面9期的數(shù)據(jù)作為測試集數(shù)據(jù)。
計(jì)算GARCH與隨機(jī)森林模型各自的MSE后為了更加直觀的看出兩者的區(qū)別,畫出兩個(gè)模型MSE的散點(diǎn)圖:
從圖2可以得到K折交叉驗(yàn)證后的結(jié)果:在較短短期內(nèi),GARCH模型與隨機(jī)森林模型預(yù)測能力相當(dāng);在較長期內(nèi),GARCH模型的誤差顯著的提高,而隨機(jī)森林模型預(yù)測能力精度在提高。由此可以得到,時(shí)間期限較長的時(shí),隨機(jī)森林模型預(yù)測能力優(yōu)于GARCH模型。
圖2