郭 婧,何幼樺
(上海大學(xué) 理學(xué)院,上海 200444)
傳統(tǒng)的線性回歸模型是對(duì)響應(yīng)變量的條件均值進(jìn)行建模,它描述了解釋變量在均值上對(duì)響應(yīng)變量的影響。用普通最小二乘方法對(duì)回歸參數(shù)進(jìn)行統(tǒng)計(jì)分析要求模型的誤差項(xiàng)的分布具有正態(tài)假設(shè)。但很多實(shí)際經(jīng)濟(jì)金融數(shù)據(jù)常常并不滿(mǎn)足這些假設(shè),例如數(shù)據(jù)出現(xiàn)尖峰或厚尾的分布,存在顯著的異方差性以及不對(duì)稱(chēng)性等。此時(shí)的最小二乘法估計(jì)將不再具有穩(wěn)健性。為了能夠更好地刻畫(huà)解釋變量在分布各個(gè)位置上對(duì)被解釋變量的影響,以及在數(shù)據(jù)不滿(mǎn)足均值回歸的假設(shè)時(shí)提高估計(jì)的穩(wěn)健性,Koenker和Bassett(1978)[1]提出了分位數(shù)回歸的思想。他們?cè)谀P椭袑㈨憫?yīng)變量的條件分位數(shù)表示為協(xié)變量的線性函數(shù),通過(guò)最小化樣本的絕對(duì)殘差的非對(duì)稱(chēng)函數(shù),得到隨機(jī)變量y的條件分位數(shù)的估計(jì)。類(lèi)似于一般的線性模型,分位數(shù)回歸模型對(duì)誤差項(xiàng)的分布也有相應(yīng)的假設(shè):對(duì)于固定的分位數(shù),誤差項(xiàng)的條件分位數(shù)為零。
在分位數(shù)模型的基礎(chǔ)上,R.Koenker和Z.Xiao(2006)[2]提出了分位數(shù)自回歸模型,給出了模型的估計(jì)方法,以及在不同分位數(shù)上的平穩(wěn)性檢驗(yàn)統(tǒng)計(jì)量。Hideo Kozumi和Genya Kobayashi(2011)[3]最先給出了分位數(shù)回歸有效的Gibbs抽樣方法。而在實(shí)際應(yīng)用方面,陳耀輝等(2015)[4]使用分位數(shù)回歸基本思想,引入自回歸分布滯后效應(yīng),借助非對(duì)稱(chēng)Laplace分布進(jìn)行貝葉斯估計(jì),構(gòu)建基于Gibbs抽樣的貝葉斯自回歸分布滯后分位數(shù)回歸模型。之前學(xué)者對(duì)各類(lèi)分位數(shù)模型的研究表明,使用貝葉斯方法可以很好地解決該類(lèi)模型復(fù)雜的參數(shù)估計(jì)問(wèn)題。
近二十年來(lái),關(guān)于變點(diǎn)問(wèn)題研究在理論和應(yīng)用等方面都有了快速的發(fā)展。LY Vostrikova(1981)[5]提出的二分分段法能夠同時(shí)檢測(cè)出變點(diǎn)的數(shù)量和位置,并能夠節(jié)省計(jì)算時(shí)間。陳希孺(1988)[6]利用局部法,研究了變點(diǎn)的檢驗(yàn)問(wèn)題;1991年又對(duì)變點(diǎn)問(wèn)題的研究進(jìn)行了綜述[7-10]。
近年來(lái)對(duì)于變點(diǎn)問(wèn)題的貝葉斯方法研究,都是基于對(duì)聯(lián)合概率密度求積分而得到各個(gè)參數(shù)的邊際后驗(yàn)。但是當(dāng)模型比較復(fù)雜,或者對(duì)于分布假設(shè)更加一般的情況下,對(duì)聯(lián)合概率密度求積分的方法就不可行了。本文將研究分位數(shù)自回歸變點(diǎn)模型貝葉斯分析方法,由于假設(shè)分布的復(fù)雜性,擬采用MCMC抽樣方法得到參數(shù)的后驗(yàn)分布。
Koenker和Xiao(2006)[2]提出可以將分位數(shù)自回歸模型當(dāng)作特殊的隨機(jī)系數(shù)自回歸模型,考慮模型:
如果等式右邊的函數(shù)都關(guān)于隨機(jī)變量Ut單調(diào)遞增,具有函數(shù)依賴(lài)關(guān)系,并設(shè)隨機(jī)變量Ut~U(0,1),則上式可以寫(xiě)為:
為解決滯后項(xiàng)之間的共線性問(wèn)題,陳耀輝等(2015)[4]使用ADF檢驗(yàn)的模型形式:
考慮有變點(diǎn)的分位數(shù)自回歸模型。假設(shè)序列在時(shí)刻k滯后項(xiàng)的回歸系數(shù)發(fā)生了突變,模型表示為:
設(shè)yt服從非對(duì)稱(chēng)的拉普拉斯分布:
f(x;μ,σ,τ)=στ exp(- σρ(x- μ))
記為 x~ALD(μ,σ,τ),其中0< τ<1是偏度參數(shù),σ>0是尺度參數(shù),-∞<μ<∞ 是位置參數(shù),函數(shù) ρτ(u)=u(τ-I(u≤0))。可以證明,如果隨機(jī)變量 x 服從 ALD(μ,σ.τ),則有即位置參數(shù)μ就是分布的τ分位數(shù)。所以在序列yt服從ALD的假設(shè)下,估計(jì)模型的參數(shù)與求序列的τ分位數(shù)是等價(jià)的。
在序列存在變點(diǎn)的假設(shè)下,使用非對(duì)稱(chēng)的拉普拉斯分布
為了得到更容易抽樣的后驗(yàn)分布,Tsionas(2003)[11]對(duì)非對(duì)稱(chēng)的拉普拉斯分布進(jìn)行了研究。如果一個(gè)隨機(jī)變量服從三參數(shù)的拉普拉斯分布,x~ALD(μ,σ,p),那么 x可以等價(jià)表示成
得到給定參數(shù)下樣本的聯(lián)合密度函數(shù):
所以參數(shù)的聯(lián)密度函數(shù):
根據(jù)上述得到的參數(shù)聯(lián)合后驗(yàn)密度函數(shù),結(jié)合文獻(xiàn)[4]和文獻(xiàn)[11]的計(jì)算結(jié)果,通過(guò)推導(dǎo)計(jì)算可以得到變點(diǎn)分位數(shù)模型各參數(shù)的后驗(yàn)核密度函數(shù)。
假設(shè)先驗(yàn),α1~N(α10,Σ10),得到其后驗(yàn):
α2有類(lèi)似的結(jié)論。
由于 zt|σ ~E(1 σ),σ1的后驗(yàn):
π(σ1|y, α1, α2, k, zt)
即σ1服從逆伽馬分布有類(lèi)似的結(jié)論。
設(shè)zt的先驗(yàn)分布為參數(shù)λ=1的指數(shù)分布,得到后驗(yàn):
其中:
即zt從廣義逆高斯分布
假設(shè)k先驗(yàn)密度為π(k),則其后驗(yàn)分布:
由于k的后驗(yàn)核密度函數(shù)較復(fù)雜,所以在MCMC抽樣中k的抽取使用M-H方法。在各參數(shù)的滿(mǎn)條件分布的基礎(chǔ)上,給出了MCMC抽樣算法。
(6)計(jì)算接受概率
(7)從均勻分布 U(0,1)中抽取 ui,如果 ui<a(k(*),k(i-1)),接受 k(*),記 k(i)=k(*);否則,拒絕 k(*),記 k(i)=
(8)重復(fù)步驟(2)到步驟(7),直到完成設(shè)定的抽樣次數(shù)。
為了驗(yàn)證上述MCMC抽樣方法的有效性,在實(shí)證研究之前先進(jìn)行仿真實(shí)驗(yàn)。仿真數(shù)據(jù)根據(jù)模型產(chǎn)生:
其中,Ut~U(0,1),滯后項(xiàng)階數(shù)為2,記樣本量為 n,每次抽樣變點(diǎn)時(shí)刻k設(shè)為n 2。模型變點(diǎn)前后僅滯后項(xiàng)系數(shù)之和 α1變化,變點(diǎn)前各個(gè)分位數(shù)上| α1(τ)|的值都小于1。而在變點(diǎn)之后,高分位數(shù)上| α1(τ)|接近甚至超過(guò)1。本文使用無(wú)信息先驗(yàn),選取τ=0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,共9個(gè)分位數(shù)進(jìn)行抽樣。
在抽樣過(guò)程中,預(yù)設(shè)MCMC抽樣次數(shù)為2500次。截去前500數(shù)據(jù),使用后2000抽樣樣本對(duì)參數(shù)的后驗(yàn)密度進(jìn)行估計(jì)。為了驗(yàn)證抽樣鏈條可以有效地估計(jì)參數(shù)的后驗(yàn)密度,使用Geweke統(tǒng)計(jì)量[12]對(duì)MCMC抽樣鏈條的收斂性進(jìn)行檢驗(yàn),檢驗(yàn)方法是將抽樣鏈條作為時(shí)間序列數(shù)據(jù),取前10%數(shù)據(jù)作為子序列1,后50%數(shù)據(jù)作為子序列2,比較兩條子序列均值差異程度。檢驗(yàn)統(tǒng)計(jì)量為:
其中μ1和μ1分別是兩序列的均值;N1和N1為兩子序列的樣本量;S1(·)和 S2(·)為兩子序列的譜密度函數(shù)估計(jì)。如果統(tǒng)計(jì)量絕對(duì)值大于2,就說(shuō)明鏈條不收斂。表1給出了樣本量為500時(shí)變點(diǎn)時(shí)刻k在各分位數(shù)上抽樣鏈條的檢驗(yàn)結(jié)果,表明鏈條均是收斂的。
表1 參數(shù)k抽樣鏈條的Geweke檢驗(yàn)結(jié)果
圖1給出了樣本量為500時(shí)的抽樣結(jié)果,可以看出抽樣鏈條比較穩(wěn)定。
圖1 樣本量n=500時(shí)k在各分位數(shù)(tau)下的MCMC抽樣結(jié)果
表2給出了在樣本量分別為200、300和500時(shí),在各分位數(shù)上變點(diǎn)相對(duì)位置k/n估計(jì)的均方誤差(MSE)。使用數(shù)據(jù)k/n是為了保證不同樣本量下得到估計(jì)結(jié)果的MSE的可比性。
表2 不同樣本量下抽樣鏈條的MSE
同之前所有分位數(shù)模型的估計(jì)方法一樣,當(dāng)樣本量較少時(shí),在高低兩側(cè)分位數(shù)上會(huì)存在有效樣本量過(guò)少的問(wèn)題。隨著樣本量增加,各分位數(shù)上的MSE明顯下降,而當(dāng)樣本量大于或等于500時(shí),MSE已經(jīng)非常小了。
本文針對(duì)2013年8月底到2015年底的中小板綜合指數(shù)極差數(shù)據(jù)建立具有單個(gè)變點(diǎn)的分位數(shù)自回歸模型。在非主板市場(chǎng)中,中小板股票市場(chǎng)一直是波動(dòng)性較大的板塊。從表3可以看出,相對(duì)于中小板綜指極差數(shù)據(jù)的均值,標(biāo)準(zhǔn)差的數(shù)值表明了市場(chǎng)的波動(dòng)性比較大;通過(guò)偏度和峰度可以知道數(shù)據(jù)具有右偏以及尖峰厚尾的性質(zhì)。而Jarque-Bera統(tǒng)計(jì)量在1%的水平上是顯著的,說(shuō)明數(shù)據(jù)并不服從正態(tài)分布。而傳統(tǒng)條件均值模型無(wú)法刻畫(huà)出這些特征,對(duì)極端值也沒(méi)有很強(qiáng)的穩(wěn)健性。下頁(yè)圖2給出極差數(shù)據(jù)的時(shí)間圖。
表3 中小板極差數(shù)據(jù)基本描述統(tǒng)計(jì)量
圖2 中小板極差時(shí)間圖
根據(jù)Koenker和Xiao(2006)所使用BIC信息準(zhǔn)則對(duì)變量進(jìn)行選擇。用4階分位數(shù)自回歸對(duì)數(shù)據(jù)進(jìn)行建模是合適的(見(jiàn)表4)。
表4 BIC變量選擇
在對(duì)實(shí)證數(shù)據(jù)建模時(shí),MCMC抽樣次數(shù)預(yù)設(shè)為5000次,參數(shù)后驗(yàn)密度使用鏈條后4000數(shù)據(jù)進(jìn)行估計(jì)。
表5給出了對(duì)實(shí)證數(shù)據(jù)建模得到的估計(jì)結(jié)果(由于篇幅原因,表中只給出了變點(diǎn)時(shí)刻和各階滯后項(xiàng)系數(shù)之和,即模型單位根的估計(jì)值),表6是鏈條收斂性的Geweke檢驗(yàn)結(jié)果。記變點(diǎn)時(shí)刻前的系數(shù)為 θ1=(a0,a1,a2,a3,a4),變點(diǎn)時(shí)刻后的系數(shù)記為 θ2=(b0,b1,b2,b3,b4)。結(jié)果表明各參數(shù)的抽樣鏈條都是收斂的。
表5 估計(jì)結(jié)果
表6 參數(shù)k抽樣鏈條的Geweke檢驗(yàn)結(jié)果
圖3表明,在高分位數(shù)上變點(diǎn)發(fā)生時(shí)刻較早,從0.6到0.9位數(shù)上均為2015年3月16日。而在從中間分位數(shù)一直到低分位數(shù)上,變點(diǎn)的估計(jì)時(shí)間滯后了一到四周,在最低分位數(shù)τ=0.1上為2015年4月14日。圖4畫(huà)出了在不同分位數(shù)上變點(diǎn)時(shí)刻前后的自回歸模型單位根的估計(jì)??梢悦黠@地看出,在較高的分位數(shù)上,中小板極差數(shù)據(jù)有相應(yīng)較高的單位根;在變點(diǎn)后單位根(b1)比變點(diǎn)前(a1)大,并且在不同分位數(shù)上,表現(xiàn)出分位數(shù)越高差別越大的趨勢(shì)。在變點(diǎn)后的0.8和0.9分位數(shù)上,單位根已經(jīng)分別達(dá)到0.978和1.104。
圖3 在各分位數(shù)(tau)上變點(diǎn)時(shí)刻k的估計(jì)結(jié)果
圖4 在各個(gè)分位數(shù)(tau)上變點(diǎn)時(shí)刻前后單位根的估計(jì)結(jié)果
不同于主板市場(chǎng),中小板市場(chǎng)通常會(huì)出現(xiàn)比如信息披露不及時(shí)、公司利潤(rùn)數(shù)據(jù)造假以及一直較高的IPO抑價(jià)率等現(xiàn)象,所以對(duì)于中小板市場(chǎng)的學(xué)術(shù)研究大多都關(guān)注于該市場(chǎng)收益的波動(dòng)性。作為我國(guó)資本市場(chǎng)的重要組成部分,中小板市場(chǎng)給企業(yè)和投資者帶來(lái)了更多的直接融資和投資的機(jī)會(huì)。也正因?yàn)槿绱?該市場(chǎng)投機(jī)氛圍對(duì)市場(chǎng)波動(dòng)性的影響也一直受到廣泛關(guān)注。
對(duì)圖3和圖4中估計(jì)結(jié)果的解釋如下:隨著分位數(shù)的增高,各自回歸項(xiàng)系數(shù)之和增大,說(shuō)明在波動(dòng)性增加的情況下,市場(chǎng)的大幅波動(dòng)有更強(qiáng)的滯后性,并且伴隨著更高的膨脹(單位根非平穩(wěn))性,突變也較早地發(fā)生在高分位數(shù),即在市場(chǎng)波動(dòng)較大時(shí);在低分位數(shù)上,自回歸滯后項(xiàng)系數(shù)相應(yīng)較小,說(shuō)明市場(chǎng)在波動(dòng)幅度較小時(shí),波動(dòng)程度的滯后性較弱,相應(yīng)檢測(cè)出的變點(diǎn)位置也更遲一些。
從高分位數(shù)到低分位數(shù),對(duì)變點(diǎn)時(shí)刻的估計(jì)從2015年3月16日到4月14日。在這近一個(gè)月的時(shí)間內(nèi),中小板綜指開(kāi)啟了劇烈的漲勢(shì)。事實(shí)上從2015年初該指數(shù)已經(jīng)開(kāi)始呈現(xiàn)較為平穩(wěn)的上漲趨勢(shì),而投資者在此期間表現(xiàn)出非常積極的投機(jī)情緒。圖5是中小板綜指的成交量數(shù)據(jù)時(shí)間圖,圖中實(shí)心三角符表示對(duì)該板塊估計(jì)出的最早的變點(diǎn)時(shí)刻。
圖5 中小板綜指成交量數(shù)據(jù)時(shí)間圖
在變點(diǎn)時(shí)刻之前,指數(shù)的成交量數(shù)據(jù)從2014年下半年以來(lái)已經(jīng)處于漲勢(shì),表明了市場(chǎng)的投機(jī)情緒一直處于積極上漲狀態(tài),而市場(chǎng)的波動(dòng)數(shù)據(jù)在各個(gè)分位數(shù)上是平穩(wěn)的(圖2);而在變點(diǎn)時(shí)刻之后,成交量數(shù)據(jù)波動(dòng)突然變大,說(shuō)明了在這段時(shí)間內(nèi),投資者的投機(jī)情緒是十分不穩(wěn)定的。數(shù)據(jù)向上和向下的波動(dòng)幅度都很大,說(shuō)明市場(chǎng)中同時(shí)存在正負(fù)兩向態(tài)度差別很大的投機(jī)情緒。由于不同態(tài)度的投資者對(duì)收益預(yù)期、風(fēng)險(xiǎn)容忍度以及投資策略的異質(zhì)性給市場(chǎng)帶來(lái)了劇烈變化,在變點(diǎn)時(shí)刻之后市場(chǎng)的波動(dòng)性開(kāi)始大幅增加,特別是在高分位數(shù)上,數(shù)據(jù)的平穩(wěn)性已經(jīng)被打破(圖4)。
用分位數(shù)自回歸模型在對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行建模時(shí),能較好地捕捉到數(shù)據(jù)動(dòng)態(tài)的非對(duì)稱(chēng)性,以及在長(zhǎng)期保持平穩(wěn)的前提下,出現(xiàn)的局部單位根非平穩(wěn)現(xiàn)象。研究加入變點(diǎn)的分位數(shù)自回歸模型,不僅可以刻畫(huà)模型在不同分位數(shù)上結(jié)構(gòu)的突變情況,而且可以反映出數(shù)據(jù)的信息滯后性和非平穩(wěn)性在變點(diǎn)出現(xiàn)前后的差異。
由于分位數(shù)自回歸模型分布假設(shè)的復(fù)雜性,使得對(duì)加入變點(diǎn)之后的模型進(jìn)行貝葉斯分析時(shí),一般很難寫(xiě)出各參數(shù)后驗(yàn)分布的解析表達(dá)式。本文給出模型參數(shù)的MCMC抽樣算法,解決了這一問(wèn)題。通過(guò)仿真實(shí)驗(yàn),驗(yàn)證了MCMC抽樣方法對(duì)于分位數(shù)自回歸變點(diǎn)模型估計(jì)的有效性。
對(duì)于中小板綜指的極差數(shù)據(jù),成功地檢測(cè)出了序列結(jié)構(gòu)在不同分位數(shù)上的突變時(shí)刻,并估計(jì)出變點(diǎn)前后各分位數(shù)上模型的滯后項(xiàng)系數(shù),表明在變點(diǎn)時(shí)刻前后數(shù)據(jù)的信息滯后性和各分位數(shù)上的單位根非平穩(wěn)性的變化。結(jié)合中小板綜指的成交量數(shù)據(jù),分析了在中小板市場(chǎng)投資者的投機(jī)情緒的變化和市場(chǎng)波動(dòng)性突變之間的相互影響和作用,從市場(chǎng)投機(jī)層面解釋系數(shù)變點(diǎn)檢測(cè)結(jié)果的經(jīng)濟(jì)意義。
[1]Koenker Roger,Gilbert Bassett.Regression Quantiles[J].Econometri?ca,1978,46(1).
[2]Koenker Roger,Xiao Z.Quantile Autoregression[J].Journal of the American Statistical Association,2006,101(475).
[3]Hideo Kozumi,Genya Kobayashi.Gibbs Sampling Methods for Bayes?ian Quantile Regression[J].Journal of Statistical Computation and Simulation,2011,81(11).
[4]陳耀輝,郭俊峰,殷文超.人民幣升值對(duì)中小板市場(chǎng)波動(dòng)的影響——基于貝葉斯分位數(shù)回歸的分析[J].系統(tǒng)工程,2015,33(1).
[5]LY Vostrikova,Detecting’Disorder’in Multidimensional Random Processes[J].Soviet Mathemat-ics Doklady,1981,(24).
[6]陳希孺.只有一個(gè)轉(zhuǎn)變點(diǎn)的模型的假設(shè)檢驗(yàn)和區(qū)間估計(jì)[J].中國(guó)科學(xué),1988,(8).
[7]宿成建,陳潔.應(yīng)用變點(diǎn)模型來(lái)研究滬深股股市波動(dòng)性突變行為[J].重慶大學(xué)學(xué)報(bào),2003,26(10).
[8]葉五一,繆柏其,譚常春.基于分位點(diǎn)回歸模型變點(diǎn)檢測(cè)的金融傳染分析[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2007,24(10).
[9]葉五一,繆柏其.基于Copula變點(diǎn)檢測(cè)的美國(guó)次級(jí)債金融危機(jī)傳染分析 [J].中國(guó)管理科學(xué),2009,17(3).
[10]王維國(guó),宿成建,王霞.基于貝葉斯推斷的上證指數(shù)突變點(diǎn)研究[J].中國(guó)管理科學(xué),2009,17(3).
[11]Efthymios G.Tsionas.Bayesian Quantile Inference[J],Journal of Sta?tistical Computation and Simulation,2003,73(9).
[12]J Geweke.Ecaluating the Accuracy of Sampling-based Approaches to the Calculation of Posterior Moments[J].Sta Report,1991,(4).