劉宇欣,范 宏
(東華大學(xué) 旭日工商管理學(xué)院,上海 200051)
我國(guó)股票市場(chǎng)是一個(gè)年輕且成長(zhǎng)迅猛的市場(chǎng).據(jù)統(tǒng)計(jì),到2016年4月底,上交所股票個(gè)數(shù)高達(dá)1140只,股票市價(jià)總值高達(dá)249 670.56億元,中國(guó)股市已經(jīng)成為中國(guó)金融體系中越來(lái)越重要的一份子.中國(guó)股市在飛速發(fā)展的過(guò)程中伴隨著多樣的波動(dòng)性特征,對(duì)股票的統(tǒng)計(jì)特征規(guī)律進(jìn)行全面的挖掘研究為風(fēng)險(xiǎn)管理及投資管理提供了堅(jiān)實(shí)的理論基礎(chǔ).
國(guó)外對(duì)股票波動(dòng)規(guī)律的研究起步較早,目前已有的經(jīng)典理論有如:投資組合理論、資本資產(chǎn)定價(jià)模型、有效市場(chǎng)理論、期權(quán)定價(jià)模型等.但上述經(jīng)典理論中,學(xué)者們通常認(rèn)為股票收益率是一個(gè)服從高斯分布,且標(biāo)準(zhǔn)差為某常數(shù)的獨(dú)立序列.然而20世紀(jì)60年代后,有學(xué)者提出股票收益率不服從正態(tài)分布,卻具有“尖峰厚尾”的特征[1].于是,國(guó)外學(xué)者開(kāi)始考慮不同時(shí)間范圍、股票指數(shù)、個(gè)股市值下的股票收益率不同的分布特征.如 Dro?d?等[2](2007)收集了 S&P、DAX和WIG200股票市場(chǎng)從2004年至2006年的股票收益率,并將時(shí)間刻度從高頻的4 min逐漸調(diào)整到120 min,發(fā)現(xiàn)標(biāo)準(zhǔn)化后的股票收益的累計(jì)分布大致從q-正態(tài)分布.Lillo等[3](2000)研究了紐約交易市場(chǎng)中個(gè)股流通市值對(duì)個(gè)股的收益率分布特征的影響,發(fā)現(xiàn)流通市值越高,股票收益率越收斂于正態(tài)分布.另外,國(guó)外學(xué)者們也開(kāi)始利用各種模型針對(duì)股票的聚類性、持續(xù)性以及“肥尾”的特點(diǎn)對(duì)收益率進(jìn)行擬合,如Yanhui Xi等[4](2015)通過(guò)建立基于學(xué)生t分布的市場(chǎng)微觀模型來(lái)擬合金融時(shí)間序列,并發(fā)現(xiàn)這種模型優(yōu)于帶學(xué)生t分布的SV-t模型.Horváth等[5](2016)采用帶有學(xué)生t分布和正態(tài)分布的GARCH模型對(duì)S&P 500股票市場(chǎng)的尾部進(jìn)行了估計(jì).國(guó)內(nèi)方面,較早的有陶亞民,蔡明超等[6](1999)通過(guò)非參數(shù)的擬合檢驗(yàn)和收益率的統(tǒng)計(jì)參數(shù)考察上海股票市場(chǎng)的收益率,發(fā)現(xiàn)股票收益率不服從正態(tài)分布,而且與股票持有期有關(guān).后來(lái)王志誠(chéng)、鄧召明[7](2001)采用滬深A(yù)股1995年至2000年的市場(chǎng)交易數(shù)據(jù),研究了每只股票和每個(gè)時(shí)間這兩個(gè)截面的數(shù)據(jù),并發(fā)現(xiàn)收益計(jì)算周期的延長(zhǎng),會(huì)導(dǎo)致資產(chǎn)收益的峰度逐漸消失.近年來(lái),國(guó)內(nèi)學(xué)者主要采用GARCH族模型和SV模型對(duì)收益率進(jìn)行擬合,如劉玄和馮彩[8](2009)、吳鑫育等[9](2014).縱觀國(guó)內(nèi)外文獻(xiàn),我們可以發(fā)現(xiàn)國(guó)內(nèi)外學(xué)者大多利用某固定的時(shí)間范圍和時(shí)間刻度的股票數(shù)據(jù),并通常選擇某股票指數(shù)如上證指數(shù)、滬深300指來(lái)研究股市的總體變化.然而這不僅不能靈活調(diào)控時(shí)間范圍和時(shí)間刻度,而且沒(méi)有很好地反映個(gè)股之間具體屬性的差異(如流通市值和所屬行業(yè))對(duì)股票收益率帶來(lái)的影響.因此,本文旨在研究多時(shí)間范圍、多時(shí)間刻度下的單只股票或不同股票行業(yè)的收益率統(tǒng)計(jì)特征,而如果手工搜集不同范圍的股票數(shù)據(jù)且利用相同方法進(jìn)行研究,這無(wú)疑工作量巨大且效率低下.為此,本文基于上證A股的每日、周、月行情數(shù)據(jù)建立數(shù)據(jù)庫(kù)系統(tǒng),同時(shí)建立Matlab GUI界面以便于查詢相應(yīng)數(shù)據(jù)和挖掘研究.
本篇論文的結(jié)構(gòu)如下.第1部分介紹了數(shù)據(jù)選取及建立的數(shù)據(jù)庫(kù)系統(tǒng).第2部分的研究對(duì)象是單只股票截面下的收益率,探究了收益率的概率密度分布特征受個(gè)股流通市值的影響,結(jié)果表明個(gè)股的流通市值越大,收益率的概率密度分布越為尖峰.同時(shí),本文還通過(guò)改變研究的時(shí)間刻度和股票行業(yè)類別來(lái)分析分布特征的變化情況.第3部分的研究對(duì)象是單位時(shí)間截面下股票集合的收益率,并討論了收益率的統(tǒng)計(jì)特征,包括均值的概率密度分布、股票之間與時(shí)間之間的相關(guān)性、波動(dòng)率及其自相關(guān)性.最后為結(jié)論.
本文選取上證A股(共765只)的歷史行情數(shù)據(jù),時(shí)間刻度是日/周/月,時(shí)間范圍為2006年1月4日到2015年12月31日共10年,除去周末及節(jié)假日,共有2429個(gè)交易日,513周,120個(gè)月.經(jīng)統(tǒng)計(jì),日股票綜合數(shù)據(jù)量約為175萬(wàn),周股票綜合數(shù)據(jù)量約為36.2萬(wàn),月股票綜合數(shù)據(jù)量約為8.5萬(wàn).
股票數(shù)據(jù)具體介紹:本文中的日/周/月股票數(shù)據(jù)來(lái)自于RESSET金融研究數(shù)據(jù)庫(kù).由于上交所成立時(shí)間為1990年12月19日,因此選擇上市日期在1990年12月19日至2005年12月31日,當(dāng)前狀態(tài)為“正常上市”的所有A股股票,共765只.因此對(duì)于這個(gè)上市時(shí)間區(qū)間內(nèi)的所有股票都擁有完整的近十年數(shù)據(jù).此時(shí),對(duì)于所選擇的上市日期區(qū)間內(nèi)的股票,當(dāng)前狀態(tài)共有5種可能:正常上市、ST、*ST、暫停上市、退市及三板市場(chǎng),本文只選擇正常上市的股票.
利用股票的收盤(pán)價(jià)數(shù)據(jù),本文首先根據(jù)公式(1)計(jì)算股票收益率Ri(t),然后將股票收益率數(shù)據(jù)存入數(shù)據(jù)庫(kù)SQL SERVER中.
上式中,i=1,2,3,…,n;τ=1 日/周/月;Yi(t)是單位時(shí)間t下第i只股票的收盤(pán)價(jià).Ri(t)則代表第i只股票t時(shí)刻下的股票收益率.
建立股票收益率數(shù)據(jù)庫(kù)后,將Matlab通過(guò)ODBC與數(shù)據(jù)庫(kù)連接,達(dá)到在Matlab GUI端調(diào)控時(shí)間范圍、時(shí)間刻度和股票行業(yè)的目的,進(jìn)而靈活地挖掘多個(gè)時(shí)間子區(qū)域、多種時(shí)間刻度以及不同股票行業(yè)下股票收益率的統(tǒng)計(jì)特征.
不同上市公司具有不同的公司規(guī)模,本文用流通市值代表公司規(guī)模.為了研究公司規(guī)模、時(shí)間刻度以及股票行業(yè)對(duì)股票收益率分布特征的影響,下面具體按照五個(gè)步驟進(jìn)行研究:
步驟1.對(duì)每只股票的收益率按公式[Ri(t)-μi]/σi進(jìn)行標(biāo)準(zhǔn)化處理,其中μi和σi是單只股票截面Ri(t)中的均值和標(biāo)準(zhǔn)差,分別見(jiàn)公式(2)和(3).
步驟2.按2015年12月31日的流通市值大小對(duì)所選股票由大到小排序,并重新編號(hào).
步驟3.按流通市值大小順序同步繪制單只股票收益率的概率密度分布圖,其反映在坐標(biāo)系中是以股票的經(jīng)驗(yàn)概率密度分布曲線為X-Z面,以個(gè)股流通市值排序后的序號(hào)為Y軸的三維圖,從而在三維圖中可直觀判斷單只股票收益率分布的形狀及其與流通市值的關(guān)系.其中,Z軸采用自然對(duì)數(shù)坐標(biāo).
步驟4.步驟3是通過(guò)直接觀察分布圖定性地概括分布特征與流通市值的關(guān)系.而為了更定量地得出結(jié)論,在此采用Lillo[3]文中檢驗(yàn)正態(tài)分布的方法,度量單只股票收益率的經(jīng)驗(yàn)概率密度分布與正態(tài)分布的差距,并分析這種差距與流通市值的關(guān)系.
下面是具體的檢驗(yàn)正態(tài)分布的量化方法,即1)-3):
1)對(duì)每一組數(shù)據(jù)按照公式(4)計(jì)算h值.公式中,〈···〉代表其平均值.
2)利用正態(tài)分布的函數(shù)表達(dá)式得出hG的計(jì)算公式,見(jiàn)公式(5):
由公式(5)可知參數(shù)hG是比率μG/σG的函數(shù),取值范圍從最低的(當(dāng)μG/σG=0的時(shí)候)變化到無(wú)窮大.
3)比較h和hG的距離,來(lái)量化經(jīng)驗(yàn)概率密度分布正態(tài)分布的差距.與此同時(shí),本文通過(guò)繪制個(gè)股h值隨流通市值變化的散點(diǎn)圖反映收益率分布特征與流通市值的關(guān)系.
步驟5.改變所研究股票的行業(yè)類別和時(shí)間刻度,按公式(4)計(jì)算相應(yīng)的h值,對(duì)比分析后得出更多結(jié)論.
由于文章篇幅限制,本節(jié)只改變時(shí)間刻度和股票行業(yè)的取值,而時(shí)間范圍則均為全部十年.因此分為三塊進(jìn)行挖掘研究:(1)時(shí)間刻度為日,股票行業(yè)為全部行業(yè);(2)時(shí)間刻度為月和周,其他不變;(3)股票行業(yè)為各個(gè)子行業(yè),其他不變.
(1)時(shí)間刻度為日,股票行業(yè)為全部行業(yè).1)由步驟3系統(tǒng)可以得出圖1、圖2.
圖1 由每只股票收益率的概率密度分布與其流通市值繪制而成的三維圖
圖2 圖1的X-Z視圖
圖1展示了每只股票收益率的經(jīng)驗(yàn)概率密度分布,按個(gè)股流通市值的大小依次排列形成的三維圖.由圖1我們可以觀察到每只股票的形狀大多數(shù)都是相似的,為鈴鐺形狀,只有個(gè)別股票更加尖峰.但由于曲線較為密集,我們很難看出不同股票的分布特征與其流通市值的關(guān)系,因此下面對(duì)圖1的X-Z視圖(圖2)進(jìn)一步分析.
為便于觀察,在仿真中,本文將不同流通市值的股票用深淺不同的顏色表示,即流通市值越大,顏色越淺.圖2表示所有股票的收益率概率密度分布的X-Z視圖.從圖2中我們可以觀察到圖形的中部顏色較深,因此,流通市值高的股票的密度分布比流通市值少的股票的密度分布更具高狹峰.
2)由步驟4,系統(tǒng)可以得出圖3.
圖3 正態(tài)分布檢驗(yàn)圖
圖3 中每個(gè)點(diǎn)的縱坐標(biāo)表示單只股票收益率分布的h值,橫坐標(biāo)表示該股票流通市值的常用對(duì)數(shù)值.最上方的虛線表示,該值是收益率分布為正態(tài)分布時(shí)hG的最小值.
由圖3我們可以觀察到基本上所有股票都滿足h (2)時(shí)間刻度為月和周,其他不變. 為研究收益率的分布規(guī)律與時(shí)間刻度的關(guān)系,下面按公式(4)計(jì)算時(shí)間刻度為周和月的h值:hm和hw,它們的均值分別是:0.7023和0.7108.對(duì)比hd、hw和hm的均值可知:當(dāng)時(shí)間刻度增加時(shí),h值向移動(dòng).即,隨著研究的時(shí)間刻度由日依次轉(zhuǎn)變?yōu)橹?、月時(shí),股票收益率的經(jīng)驗(yàn)概率密度分 布更加收斂于正態(tài)分布. (3)股票行業(yè)為各個(gè)子行業(yè),其他不變. 股票行業(yè)種類不同,相應(yīng)的分布特征亦不同.對(duì)該規(guī)律的探索可以加強(qiáng)投資者對(duì)行業(yè)動(dòng)態(tài)的關(guān)注.本文采用的股票行業(yè)分類標(biāo)準(zhǔn)是證監(jiān)會(huì)行業(yè)分類2012版,共19個(gè)一類分類. 表1即為不同股票行業(yè)種類的h值由大到小排序后的結(jié)果.居民服務(wù)、修理和其他服務(wù)業(yè)種類的股票數(shù)量為0,未列入表中. 表1 不同行業(yè)的h值 對(duì)比表1中各行業(yè)的h值,我們可以發(fā)現(xiàn)金融業(yè)的h值最低,約為0.6550;科學(xué)研究和技術(shù)服務(wù)業(yè)的h值最高,約為0.7740.經(jīng)計(jì)算,h均值為0.69989,而制造業(yè)與h均值的差值最小,因此,制造業(yè)反映了所有股票行業(yè)分布特征的一個(gè)平均狀況,投資者需要更加關(guān)注制造業(yè)的發(fā)展動(dòng)態(tài). 第3部分研究的是單只股票截面下股票收益率的統(tǒng)計(jì)特征,而對(duì)每個(gè)交易日來(lái)講,所有股票形成一個(gè)股票集合.此部分則研究單位時(shí)間股票集合的統(tǒng)計(jì)特征,包括均值的概率密度分布、股票兩兩之間與時(shí)間兩兩之間的相關(guān)性、波動(dòng)率及其自相關(guān)性(本節(jié)均利用日股票收益率數(shù)據(jù)). 為研究2013.01-2015.12這三年所有股票的收益率均值的分布特征,系統(tǒng)首先利用公式(2)和公式(6)分別計(jì)算相應(yīng)時(shí)間范圍內(nèi)的μ(t)和μi,即每日股票集合的收益率均值和每只股票的收益率均值,然后分別繪制兩個(gè)變量的概率密度分布圖,最后可得出圖4. 圖4采用對(duì)數(shù)-對(duì)數(shù)坐標(biāo)系,圖(a)表示μ(t)的密度分布,圖(b)表示μi的密度分布.直觀來(lái)看,變量μ(t)和μi的統(tǒng)計(jì)特征明顯不同:μ(t)的概率密度分布圖像比μi的更寬,具體原因?qū)⒃?.1.2中討論. 圖4μ(t)和μi的概率密度分布對(duì)比圖 為探究μ(t)和μi的概率密度分布特征不同的原因,下面先假設(shè)市場(chǎng)中共T個(gè)交易日,N只股票.那么,我們可得到公式(7). 雖然μi和μ(t)的均值相同,但它們的方差一般是不相同的.接下來(lái)按公式(8)表示μ(t)的方差,公式(10)表示μi的方差. 經(jīng)推導(dǎo)后得到公式(12)[3]: 因此,相關(guān)強(qiáng)度的大小則可以轉(zhuǎn)化為兩個(gè)均值的方差大小.從圖4中我們可以發(fā)現(xiàn),并且系統(tǒng)計(jì)算出,也證明了這一點(diǎn).這表明股票之間的相關(guān)性強(qiáng)于兩個(gè)不同交易日的相關(guān)性,也解釋了圖4中兩個(gè)變量的密度分布圖形寬度不同的原因. 本文通過(guò)計(jì)算單位時(shí)間股票集合的收益率標(biāo)準(zhǔn)差σ(t),來(lái)測(cè)定股票集合的波動(dòng)性,見(jiàn)公式(13). 其中,nt代表單位時(shí)間t下的股票總數(shù).標(biāo)準(zhǔn)差σ(t)是股票集合收益率密度分布的寬度,它反映了單位時(shí)間下不同公司收益率的差距.因此,標(biāo)準(zhǔn)差也被稱為股票的波動(dòng)率. 關(guān)于波動(dòng)率的一個(gè)重要的統(tǒng)計(jì)特征是它們的自相關(guān)性.為研究波動(dòng)率σ(t)關(guān)于自身的相關(guān)性,本文利用公式(14)所示的自相關(guān)函數(shù): 在公式(14)中,設(shè)置τ的最大值為100日,通過(guò)改變時(shí)間間距τ的大小(從1逐一變化到100),可以計(jì)算出標(biāo)準(zhǔn)差σ(t)的一組的自相關(guān)函數(shù)值,共100個(gè);然后系統(tǒng)對(duì)得出的自相關(guān)函數(shù)值進(jìn)行冪律函數(shù)(見(jiàn)公式(15))擬合,得到具體的函數(shù)表達(dá)式.具體擬合結(jié)果見(jiàn)圖5. 由圖5可知波動(dòng)率σ(t)的自相關(guān)函數(shù)服從冪律分布,得到擬合系數(shù)-7.006,即δ=7.006,并且擬合誤差很小,這表明變量σ(t)在市場(chǎng)中具有長(zhǎng)期記憶性. 圖5 自相關(guān)函數(shù)值的冪律函數(shù)擬合圖 本文從單只股票截面和單位時(shí)間截面的兩個(gè)角度出發(fā),建立股票收益率挖掘系統(tǒng)對(duì)上證A股近十年的收益率數(shù)據(jù)進(jìn)行挖掘.在系統(tǒng)上適當(dāng)改變時(shí)間范圍、股票行業(yè)和時(shí)間刻度的基礎(chǔ)上,本文得出以下結(jié)論:(1)個(gè)股收益率的分布特征與其流通市值確實(shí)有關(guān)系,從整體趨勢(shì)上來(lái)看,流通市值越大,收益率的概率密度分布越尖峰.(2)當(dāng)股票收益率的時(shí)間刻度由小到大發(fā)生變化時(shí),h會(huì)變大,即收益率更加收斂于正態(tài)分布.(3)股票收益率的分布特征與行業(yè)種類密切相關(guān),金融業(yè)更加尖峰,而制造業(yè)則反映了所有行業(yè)的平均水平.(4)時(shí)間截面上股票集合收益率均值的概率密度分布的寬度明顯大于個(gè)股收益率均值的相應(yīng)寬度,這是因?yàn)楣善眱蓛芍g的相關(guān)性強(qiáng)度遠(yuǎn)大于時(shí)間之間的相關(guān)性.(5)股票波動(dòng)率的自相關(guān)函數(shù)符合冪律函數(shù),這說(shuō)明股票波動(dòng)率具有長(zhǎng)期記憶性. 本文為挖掘股票收益率的統(tǒng)計(jì)特征提供了簡(jiǎn)便靈活的仿真過(guò)程.如今股市發(fā)展迅速,數(shù)據(jù)亦爆發(fā)式增長(zhǎng),而通過(guò)對(duì)股市數(shù)據(jù)的統(tǒng)計(jì)特征的觀察可以讓人們更加清楚金融市場(chǎng)更本質(zhì)的運(yùn)行特征和規(guī)律.因此如何處理好股票大數(shù)據(jù)與適合中國(guó)國(guó)情的多種統(tǒng)計(jì)模型之間的快捷交互是未來(lái)的研究重點(diǎn). 1Mandelbrot B.The variation of certain speculative prices.The Journal of Business,1963,36(4):394-419.[doi:10.1086/jb.1963.36.issue-4] 2Dro?d? S,Forczek M,Kwapień J,et al.Stock market return distributions:From past to present.Physica A:Statistical Mechanics and Its Applications,2007,383(1):59-64.[doi:10.1016/j.physa.2007.04.130] 3Lillo F,Mantegna RN.Variety and volatility in financial markets.Physical Review.E,Statistical Physics,Plasmas,Fluids,and Related Interdisciplinary Topics,2000,62:6126-6134. 4Xi YH,Peng H,Qin YM,et al.Bayesian analysis of heavytailed market microstructure model and its application in stock markets.Mathematics and Computers in Simulation,2015,117:141-153.[doi:10.1016/j.matcom.2015.06.006] 5Horváth R,?opov B.GARCH models,tail indexes and error distributions:An empirical investigation.The North American Journal of Economics and Finance,2015,37:1-15. 6陶亞民,蔡明超,楊朝軍.上海股票市場(chǎng)收益率分布特征的研究.預(yù)測(cè),1999,(2):57-58,78. 7王志誠(chéng),鄧召明.中國(guó)A股股票收益率的統(tǒng)計(jì)特征.經(jīng)濟(jì)問(wèn)題,2001,(12):46-47,53.[doi:10.3969/j.issn.1004-972X.2001.12.020] 8劉玄,馮彩.中國(guó)股市波動(dòng)特征及非對(duì)稱效應(yīng)研究——以股改以來(lái)上證綜指為例.財(cái)會(huì)通訊,2010,(1):76-78. 9吳鑫育,馬超群,汪壽陽(yáng).隨機(jī)波動(dòng)率模型的參數(shù)估計(jì)及對(duì)中國(guó)股市的實(shí)證.系統(tǒng)工程理論與實(shí)踐,2014,34(1):35-44.[doi:10.12011/1000-6788(2014)1-35]3 時(shí)間截面下股票集合的統(tǒng)計(jì)特征
3.1 股票集合的收益率均值
3.1.1 均值的概率密度分布
3.1.2 股票之間與時(shí)間序列之間的相關(guān)性
3.2 波動(dòng)率及其自相關(guān)函數(shù)
3.2.1 波動(dòng)率
3.2.2 波動(dòng)率的自相關(guān)性
4 結(jié)語(yǔ)