□文/劉明成
(1.重慶工商大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院;2.社會(huì)經(jīng)濟(jì)應(yīng)用統(tǒng)計(jì)重慶市重點(diǎn)實(shí)驗(yàn)室 重慶)
[提要]對(duì)股票分組引入聚類分析,通過對(duì)股票收益率的分析完成中央?yún)R金投資機(jī)構(gòu)所持有的20支股票的聚類,建立t-Copula聚類-VaR模型,得出各置信度下的VaR值,且計(jì)算出的VaR通過Kupiec似然比檢驗(yàn),由此避免金融產(chǎn)品自身屬性對(duì)Copula分組-VaR模型的影響,為金融產(chǎn)品投資者提供新的風(fēng)險(xiǎn)價(jià)值衡量方向。
組合投資一直是金融機(jī)構(gòu)的投資主題,對(duì)其聚合風(fēng)險(xiǎn)的評(píng)定是一個(gè)繞不開的話題。VaR風(fēng)險(xiǎn)度量法在1963年被Baumol提出,現(xiàn)如今已成為風(fēng)險(xiǎn)測(cè)量的主流路徑,將各種模型結(jié)合VaR度量方法能夠得到更加精確的風(fēng)險(xiǎn)價(jià)值。傳統(tǒng)的VaR計(jì)算方法包括歷史模擬法、方差-協(xié)方差法、蒙特卡洛模擬的方法,此種方法已經(jīng)被秦拯、楊楊等學(xué)者探討研究過,對(duì)于衡量單一資產(chǎn)的金融風(fēng)險(xiǎn)有很好的效果,但對(duì)于存在復(fù)雜相依結(jié)構(gòu)的組合投資有很大的局限性,會(huì)忽略多個(gè)金融資產(chǎn)之間的聯(lián)合分布。而Sklar提出的Copula函數(shù),便成為了描述多個(gè)金融資產(chǎn)風(fēng)險(xiǎn)之間的相依關(guān)系的有利工具,王明哲、魯志軍、曹輝利用Copula-VaR模型將組合投資的整體風(fēng)險(xiǎn)進(jìn)行了測(cè)量,得到了比傳統(tǒng)var測(cè)量方式更優(yōu)越的結(jié)果。但混業(yè)經(jīng)營(yíng)下金融機(jī)構(gòu)所擁有的基礎(chǔ)金融產(chǎn)品的維度數(shù)量龐大,若是單純地利用一個(gè)Copula函數(shù)對(duì)它們之間的相依關(guān)系進(jìn)行度量,會(huì)出現(xiàn)“維數(shù)災(zāi)難”,而周全、陳振龍?jiān)诮鹑跈C(jī)構(gòu)的混業(yè)經(jīng)營(yíng)情況下提出分組的Copula-VaR模型在一定程度上有效地緩解了這一問題,但他們兩人提出的分組是基于判定金融產(chǎn)品所屬類型上,具有一定主觀性,而且若是所有產(chǎn)品都屬于同一類別也會(huì)造成無(wú)法“降維”的窘迫情況。為解決這兩個(gè)問題,本文提出Copula-聚類-VaR分析方法,通過金融收益率之間的相似程度為啟發(fā)方向進(jìn)行探索。
(一)傳統(tǒng)風(fēng)險(xiǎn)度量工具VaR的定義。VaR是value at risk(在險(xiǎn)價(jià)值)的縮寫,是進(jìn)行風(fēng)險(xiǎn)測(cè)度的重要工具。其意義是在資產(chǎn)價(jià)值波動(dòng)的情況下,在一定的概率水平下,投資者或金融機(jī)構(gòu)所持有的資產(chǎn)在未來(lái)的一段時(shí)間內(nèi)產(chǎn)生最大可能的損失。用公式表示如下:
△P為單一資產(chǎn)或是組合資產(chǎn)在持有期內(nèi)的損失,VaR為執(zhí)行水平α下的風(fēng)險(xiǎn)價(jià)值,而在實(shí)際運(yùn)用中,風(fēng)險(xiǎn)價(jià)值的度量往往是通過對(duì)數(shù)收益率來(lái)計(jì)算,本文也采用這種方法。
(二)VaR模型的準(zhǔn)確性檢驗(yàn)。本文采用Kupiec(1995)提出的失敗頻率檢驗(yàn)法進(jìn)行模型的檢驗(yàn),即假定CoVaR估計(jì)具有相互獨(dú)立性,實(shí)際損失超過估計(jì)出的CoVaR為失敗,否則為成功,p*=1-a(a為置信度)。實(shí)際考察天數(shù)為T,失敗天數(shù)為N,那么失敗頻率為p(N/T)。零假設(shè)為p=p*,如此對(duì)VaR模型準(zhǔn)確性的評(píng)估就轉(zhuǎn)化為檢驗(yàn)失敗頻率p是否顯著不同于p*。便提出了對(duì)零假設(shè)最為適合的似然比率檢驗(yàn):
在零假設(shè)條件下,統(tǒng)計(jì)量LP服從自由度為1的χ2分布。如,當(dāng)置信度為0.05時(shí),臨界值為3.841,若計(jì)算出的LR統(tǒng)計(jì)量小于這個(gè)值,則接受原假設(shè),認(rèn)為模型通過檢驗(yàn)。
(三)K-均值聚類算法。相比于用一個(gè)Copula函數(shù)去測(cè)量整個(gè)組合資產(chǎn)的風(fēng)險(xiǎn)價(jià)值,Copula分組模型得到的效果更加優(yōu)良,而對(duì)金融序列進(jìn)行分組是通過其所屬的產(chǎn)品和行業(yè)的類別來(lái)判別,忽略了數(shù)據(jù)本身的波動(dòng)情況,所以本文將從多個(gè)金融產(chǎn)品的波動(dòng)率方面進(jìn)行分類,然后再采用多個(gè)Copula模型進(jìn)行蒙特卡洛模擬得到最后的風(fēng)險(xiǎn)價(jià)值。
K-均值聚類算法是動(dòng)態(tài)聚類中歷史悠長(zhǎng)的典型算法,在1968年由MacQuean提出,在各領(lǐng)域具有廣泛的影響力。算法開始時(shí)先將要被分類的數(shù)據(jù)分為K個(gè)組,之后隨機(jī)挑選出K個(gè)對(duì)象作為聚類中心,由此計(jì)算每個(gè)數(shù)據(jù)與K個(gè)聚類中心之間的距離,進(jìn)行臨近分配。聚類中心和分給它們的數(shù)據(jù)對(duì)象就形成一個(gè)新的類別,由此不斷重復(fù)直到滿足聚類中心不再發(fā)生變化時(shí),即誤差平方和局部最小,就形成了最終的聚類情況。
(四)copula函數(shù)理論。Copula函數(shù)的概念最早是由Sklar提出的,其在統(tǒng)計(jì)學(xué)上的作用是將多個(gè)單獨(dú)的分布函數(shù)通過Copula函數(shù)作用成一個(gè)聯(lián)合分布。
1、Copula函數(shù)定義。d維Copula函數(shù)C是指有如下性質(zhì)的一類多元函數(shù):
·C對(duì)它的每個(gè)變量都是單調(diào)增加的;
·C(u1,…,uk-1,0,uk+1,…,ud)=0且C(1,…,1,uk,1,…,1)=uk,其中u1,…,ud∈[0,1]。
所以,存在一個(gè)具有邊緣分布F1,…,F(xiàn)d的d維聯(lián)合分布函數(shù)F,則有一個(gè)Copula函數(shù)C,使得:
F(x1,…,xd)=C(F1(x1),F(xiàn)2(x2),…,F(xiàn)d(xd)),-∞≤x1,…,xd≤+∞成立。
2、Copula函數(shù)。目前已經(jīng)出現(xiàn)了多種Copula函數(shù),可大致分為橢圓Copula和Archimidean Copula兩類,而橢圓Copula函數(shù)根據(jù)隨機(jī)變量所服從的具體分布可分為多元正態(tài)Copula和t-Copula。
由于金融數(shù)據(jù)的尖峰厚尾性,本文不妨將各金融數(shù)據(jù)擬合成t分布,利用t-Copula函數(shù)進(jìn)行組合資產(chǎn)的風(fēng)險(xiǎn)價(jià)值的測(cè)量。t-Copula滿足下式:
上式中,tR.v(·)為自由度是v的相關(guān)系數(shù)矩陣為R的多元t分布,tv-1(·)為自由度是v的t分布函數(shù)的逆函數(shù)。
其分布函數(shù)和密度函數(shù)分別為:
其中,參數(shù)可以由兩階段法的極大似然估計(jì)求出,即先估計(jì)出各邊緣分布的參數(shù),確定邊緣分布后,代入收益率數(shù)據(jù)進(jìn)行(0,1)之間的映射,再由映射后的數(shù)據(jù)得出Copula函數(shù)的參數(shù)。
(五)基于Copula的蒙特卡洛模擬。使用蒙特卡洛模擬的算法,生成大量隨機(jī)的收益率數(shù)據(jù),再利用VaR定義確定置信度下的風(fēng)險(xiǎn)價(jià)值。其具體步驟如下:(1)確定各組內(nèi)各收益率的邊際分布;(2)通過映射的數(shù)據(jù)確定各組Copula函數(shù)的參數(shù),由此確定各組的Copula函數(shù);(3)利用擬合好的Copula函數(shù)生成大量的隨機(jī)數(shù);(4)將上一步生成的隨機(jī)數(shù)通過邊緣分布函數(shù)的逆得出相應(yīng)的收益率;(5)將得出的收益率以等權(quán)重的方式求和計(jì)算不同置信度下的VaR值。
為滿足研究方向的潛在條件,即所有的股票是都被同一家機(jī)構(gòu)所持有。故選擇中央?yún)R金資產(chǎn)管理公司所投資的20支股票進(jìn)行研究,數(shù)據(jù)來(lái)源于東方財(cái)富choice金融終端,時(shí)間段為2015年6月1日至2021年3月23日的日收盤數(shù)據(jù),去除缺失值后,數(shù)量為948,股票名稱及類別如表1所示。(表1)
表1 股票分類及名稱一覽表
之后,通過利用對(duì)數(shù)收益率公式:
計(jì)算出每只股票的波動(dòng)率,再進(jìn)行K-均值聚類,這里是將每支股票作為樣本,將其每天的收益率作為特征進(jìn)行計(jì)算,得到了聚類的數(shù)量為5組,由此產(chǎn)生新的分組。聚類的結(jié)果如表2所示。(表2)
表2 聚類后樣本分類情況一覽表
由此我們完成了對(duì)收益率情況相似的股票進(jìn)行劃分。然后,將各收益率數(shù)據(jù)擬合成t分布,計(jì)算出所有邊緣分布函數(shù)的參數(shù),之后每一組邊緣函數(shù)都由一個(gè)t-Copula函數(shù)進(jìn)行連接,再估計(jì)出各組的參數(shù)(ρ,v),其中(ρ,v)分別表示t-Copula函數(shù)的相關(guān)系數(shù)和自由度,其結(jié)果如表3所示。(表3)
表3 參數(shù)估計(jì)情況一覽表
通過估計(jì)出的5組參數(shù),可以得出5個(gè)t-Copula函數(shù)。接著采用蒙特卡洛模擬的方法,對(duì)每一組t-Copula函數(shù)隨機(jī)生成出5組共20支股票的50,000個(gè)收益率,接著按每支股票權(quán)重相等的方式進(jìn)行簡(jiǎn)單平均計(jì)算,得到組合資產(chǎn)的總收益率。然后按照風(fēng)險(xiǎn)價(jià)值的定義找出置信度為1%、2.5%、5%相應(yīng)的VaR值,并且計(jì)算出各自的LR統(tǒng)計(jì)量以檢驗(yàn)?zāi)P褪欠裢ㄟ^,結(jié)果如表4所示。(表4)
表4 置信度對(duì)應(yīng)的VaR一覽表
由表4可知,在1%、2.5%、5%三個(gè)置信度情形下,其收益率的損失大小分別為10.819%、5.08%、2.96%,其含義是在越極端的情況下,其損失的價(jià)值越大。相應(yīng)的LR統(tǒng)計(jì)量都小于相對(duì)應(yīng)的χ2(1)值,即結(jié)果通過了Kupiec似然比檢驗(yàn)。
基于資產(chǎn)類型分組之后再利用Copula函數(shù)進(jìn)行VaR值計(jì)算的方式雖然被人提出,但卻需要對(duì)金融產(chǎn)品的類型或者按產(chǎn)品所屬行業(yè)進(jìn)行分組,忽略了數(shù)據(jù)本身衍生出的收益率波動(dòng)情況,而本文表明,針對(duì)各產(chǎn)品收益率的波動(dòng)情況進(jìn)行聚類分組,再進(jìn)行Copula-VaR計(jì)算從理論與實(shí)際操作兩個(gè)方面都是能夠完成的。這樣可以為投資者提供新的風(fēng)險(xiǎn)衡量方向,進(jìn)一步完善了風(fēng)險(xiǎn)價(jià)值測(cè)量方法。