吳建華 張穎 王新軍
(1.濟南大學數(shù)學科學學院,山東 濟南 250022;2.山東大學經濟學院,山東 濟南 250100)
隨著我國宏觀經濟低位運行和供給側結構性改革步入深水區(qū),各個行業(yè)企業(yè)被迫轉型發(fā)展,這導致了國內商業(yè)銀行不良資產余額和不良率持續(xù)上升。公開數(shù)據1顯示,截至2017年第一季度,國內商業(yè)銀行不良貸款規(guī)模約1.58萬億元,不良貸款率為1.74%,不良貸款規(guī)模保持穩(wěn)步上升趨勢。分機構看,我國各類銀行機構的不良貸款余額的絕對數(shù)在不斷增加,農村商業(yè)銀行不良貸款率在五類機構中最高,截至一季度為2.55%,然而同期的外資銀行不良率則明顯較低為0.89%。以上數(shù)據表明相比外資銀行,國內商業(yè)銀行在信用風險量化和控制能力方面有待進一步提高。在這種背景下,研究銀行貸款的違約損失率及其影響因素,對進一步防范出現(xiàn)和處置不良貸款有重要的現(xiàn)實意義。根據Basel II/III對信用風險的經濟資本的要求,實施內部評級高級法的商業(yè)銀行需違約概率和違約損失率等重要的參數(shù)。中國銀監(jiān)會也于2012年6月在Basel Ⅲ的基礎上公布了《商業(yè)銀行資本管理辦法(試行)》,辦法規(guī)定采用內部評級法計量信用風險加權資產的商業(yè)銀行需要估計違約概率(PD)、違約損失率(LGD)、違約風險暴露(EAD)、相關性(Cor)和有效期限(M)。其中最關鍵也是最難估計的兩個參數(shù)就是PD和LGD。實際上,除了資本監(jiān)管要求之外,PD和LGD的準確預測也是商業(yè)銀行進行貸款風險調整定價、經濟資本計算和資產支持證券或者信用衍生品定價的基礎。
然而,從早期的相關研究來看,學界主要關注違約概率PD的估計,較少關注違約損失LGD的估計,隨著2004年Basel II協(xié)議的推出,學界和業(yè)界對于LGD的研究開始大量增長。從理論研究層面來看,國外對LGD的研究最早始于1990s年代中期,隨后陸續(xù)出現(xiàn)了一些關于LGD的理論和實證的研究。從現(xiàn)有的研究來看,基本思路主要是采用某種統(tǒng)計方法分析LGD的影響因素和對LGD進行擬合和預測。
在分析LGD的影響因素方面,比如Hibbeln and Gürtler(2011)[5]等研究發(fā)現(xiàn),債務結構(抵押/保證及清償優(yōu)先級別)、債務人的信用質量或者違約概率、清償過程、債務人所屬行業(yè)和宏觀經濟狀況對LGD的影響較為顯著,但對于企業(yè)規(guī)模、貸款規(guī)模和貸款期限等因素對LGD的影響的結論并不一致。國內的相關研究可以參考陳光忠等(2010)[15]、曹萍(2015)[14]和吳建華等(2016)[18]等代表性文獻。
從LGD擬合和預測中所采用的統(tǒng)計學方法來看,由于LGD數(shù)據具有典型的非正態(tài)性和雙峰的U型分布,而標準的線性回歸無法有效的對LGD擬合和預測,為此需要利用其他的回歸技術進行處理。Cribarineto(2004)[4]利用了貝塔分布擬合LGD的分布,它不需要正態(tài)性假設和同方差假設,所以適用范圍廣泛。Bellotti and Crook(2007)[1]利用比例響應回歸FRR對LGD進行擬合。Yashkir and Yashkir(2013)[13]對比研究了幾個最為流行的LGD模型(LSM,Tobit,三層Tobit,貝塔回歸,膨脹貝塔回歸,截斷伽馬回歸)的預測績效。最近陳暮紫等(2015)[16]基于預期效用分布理論框架下,構建了違約回收率的貝塔分布修正模型。
縱觀以上已有的LGD研究,無論是采用參數(shù)方法還是采用非參數(shù)方法,本文發(fā)現(xiàn)其中的分析基本結果大都是對LGD的均值預測,要么直接進行均值回歸,要么最終的結果以均值的形式體現(xiàn)。眾所周知,均值只是對概率分布的基本特征的描述,它無法刻畫完整的概率分布,尤其是對于LGD的非正態(tài)、偏斜和雙峰分布特征來說,問題更嚴重。然而,無論是從資本監(jiān)管要求和信用風險量化,還是從各種信用產品的定價來看,都需要對LGD的完整分布的估計和預測。
實際上,在統(tǒng)計學理論研究的領域,針對均值回歸不能完整描述響應變量的分布這一缺點,Koenker and Bassett(1978)[7]提出了分位數(shù)回歸(QR)模型。自從分位數(shù)回歸被提出以來,分位數(shù)回歸得到了大量的研究,并獲得了廣泛的應用,其應用領域包括醫(yī)學、環(huán)境科學、生物學、經濟和金融領域等。特別是在金融風險量化研究中,分位數(shù)回歸被廣泛用于估計市場風險中的在險價值,比如Wong and Ting(2016)[12]等將分位數(shù)回歸技術應用于市場風險中的各種在險價值模型,發(fā)現(xiàn)分位數(shù)回歸具有顯著的優(yōu)勢。
不過,以上這些研究大都集中于利用QR來量化市場風險。在信用風險量化中,尤其是在LGD估計中運用QR的研究非常少,比如Sopitpongstorn et al.(2016)[10]提出了利用非參數(shù)分位數(shù)回歸和部分線性附加分位數(shù)回歸來模型化平均違約回收率RR的思路。然而,從國內的相關研究來看,在這方面的研究幾乎是個空白。
不同于以上的研究,本文不是利用QR估計最終的平均LGD,而是直接模型化LGD的整個分布。基于不同的分位數(shù),區(qū)分了協(xié)變量對極低、適中和極高LGD的影響。利用HMI和HWMI兩個指標來進行模型對比,然后通過樣本內和樣本外的對比分析以評估LGD的整個分布的擬合性。這樣,本文就從一個全新的視角量化了協(xié)變量對LGD的全面的影響。
本文首先簡要介紹分位數(shù)回歸方法,通過模擬試驗驗證分位數(shù)回歸刻畫具有非正態(tài)、偏斜和雙峰分布的適用性。然后,對實證分析的數(shù)據進行描述統(tǒng)計,并根據分位數(shù)回歸模型實證分析的結果,對比其他幾個不同模型的樣本內和樣本外的預測績效,最后得出結論。
根據上述文獻綜述可知,LGD具有非正態(tài)性、極端偏斜和雙峰U型分布的特征,而且在信用風險資本監(jiān)管中計算非預期損失時,需要完整的損失分布。而現(xiàn)有的關于LGD的估計的方法中大都是均值回歸,均值只能刻畫分布的平均特征,而不能完整的描述LGD的分布,尤其是對于LGD的具有U型分布設定來說問題更嚴重。本文試圖利用分位數(shù)回歸解決以上的問題。
下面首先給出分位數(shù)回歸的簡要概述,然后通過隨機模擬驗證分位數(shù)回歸在刻畫非正態(tài)、極端偏斜和雙峰分布設定中的適用性。
沿用Koenker(2005)[7]提出的分位數(shù)回歸思路,假設隨機變量Y的分布函數(shù)為
Y的第τ分位數(shù)的定義為滿足F(y)≥τ的最小的y值,即
回歸分析的基本思想是使樣本值與擬合值之間的距離最短,那么樣本分位數(shù)回歸就是使加權誤差絕對值之和最小。具體來說,對于Y的一組樣本{y1,…,yn},需要求出滿足下式的ξ
其中τ為分位數(shù)權重,ξ為目標擬合值。上式可以等價的表示為:
其中,ρτ(u)=(τ-I(u<0))u,I(z)為指示函數(shù),z是條件關系式,當z為真時,I(z)=1;當z為假時,I(z)=0。以上基于Y的一組樣本{y1,…,yn},估計ξ的過程就被稱為是分位數(shù)回歸。
假設因變量Y可以由k個自變量組成的矩陣X線性表示。
其中誤差u滿足非自相關假設。設(X,Y)的一組隨機樣本為{(x1, y1),…,(xn ,yn)},那么,Y的第τ分位數(shù)的樣本條件分位數(shù)函數(shù)為
其中x,βτ都是k×1階列向量。那么,估計Y的第τ分位數(shù)回歸方程系數(shù)βτ的方法是,使得下面的目標函數(shù)或者說加權誤差絕對值之和最小的系數(shù),即
以上基于(X,Y)的一組樣本{(x1, y1),…,(xn ,yn)}估計βτ的過程被稱為是條件分位數(shù)回歸。為了表達的方便,在不引起歧義的情況下,本文不區(qū)分“分位數(shù)回歸”和“條件分位數(shù)回歸”,而是統(tǒng)一稱為分位數(shù)回歸。
由于目標函數(shù)(7)是不可微的,傳統(tǒng)的對目標函數(shù)求導的方法不再適用,因此需要采用線性規(guī)劃方法來估計分位數(shù)回歸方程參數(shù)比如單純形算法、內點算法和平滑算法等。許多常見的計量經濟和統(tǒng)計軟件都可以實現(xiàn)對分位數(shù)回歸模型的估計和假設檢驗。本文在分位數(shù)回歸模型分析中主要采用統(tǒng)計軟件R語言進行處理。
值得一提的是,在分位數(shù)回歸模型設定中,對于誤差u來說,除了非自相關假設外,沒有更多的模型假設,因此可以處理較高水平的誤差異質性。相對于最小二乘法,加權最小絕對離差和法的假設條件更為寬松。顯然,對于LGD分布的非正態(tài)性、偏斜和雙峰特征,都可以利用分位數(shù)回歸容易處理。
下面通過數(shù)值模擬試驗檢驗分位數(shù)回歸QR在處理LGD分布的非正態(tài)性、偏斜和雙峰特征方面的適用性。
為了生成LGD分布所具有的非正態(tài)、偏斜和雙峰特征,給定如下的數(shù)據生成過程,yi=β1τi+β2τixi+ui,其中自變量xi來自N(0,0.01)中的隨機抽樣,為了模擬數(shù)據的雙峰特征,令β1τi=zτi,β2τi=zτi-0.5,zτi=B(0.2),設誤差項u是高斯分布,即u~N(0,0.04)。重復以上的模擬過程5000次,可以得到5000模擬個樣本點。圖1給出了模擬的結果的散點圖和直方圖。
下面利用QR估計數(shù)據生成模型的參數(shù)。圖2給出了模擬數(shù)據的QR參數(shù)估計,同時也給出了OLS估計作為對比,其中的置信區(qū)間是基于95%的置信水平給出的。
圖1 模擬數(shù)據
圖2 模擬數(shù)據的參數(shù)估計
從圖2中可以看出,對于截距項和斜率系數(shù)來說,普通最小二乘估計估計給出了常數(shù)估計,而分位數(shù)給出的截距項和斜率系數(shù)估計是變動的,它隨著不同的分位數(shù)而變化,它全面的反應了隨機變動的截距和偏斜的信息。顯然,普通最小二乘估計既不能捕獲非常數(shù)的截距項,也不能捕獲協(xié)變量的顯著的作用。這會導致對截距項和斜率的錯誤估計。相反,分位數(shù)能夠捕獲較低和較高分位數(shù)的差異。對于水平和正態(tài)分布誤差項來說,截距項包含了兩個顯著不同的取值。我們所估計得到的斜率,是具有可變影響的統(tǒng)計顯著的協(xié)方差。
圖3 OLS和QR的樣本內預測
對于數(shù)據生成過程來說,圖3展示了基于5000個獨立模擬的觀測值的分位數(shù)回歸(實線)和普通最小二乘估計(虛線)的樣本內預測直線,顯然,從圖3可知,普通最小二乘法回歸只能生成一條擬合曲線,顯然完全不能擬合具有雙峰特征的數(shù)據,而分位數(shù)回歸用多條分位數(shù)直線,能夠更好的擬合雙峰數(shù)據。
綜上所述,上面的模擬試驗表明,對于非正態(tài),偏斜和雙峰特征的數(shù)據來說,分位數(shù)回歸可以有效的進行參數(shù)估計和擬合。實際上,由于不同分位數(shù)下的回歸系數(shù)估計量通常是不同的,即解釋變量對不同水平被解釋變量的影響不同,所以分位數(shù)回歸能夠更加全面的描述被解釋變量條件分布的全貌。而且與最小二乘估計相比,“加權最小絕對離差和法”的估計結果對離群值則表現(xiàn)的更加穩(wěn)健。此外,分位數(shù)回歸對誤差項沒有很強的假設,因此分位數(shù)回歸估計更適合于估計非正態(tài)分布假設下的模型。顯然,對于LGD分布的非正態(tài)性、偏斜和雙峰特征,都可以利用分位數(shù)回歸容易處理。
傳統(tǒng)的LGD模型和校驗方法重點關注均值的預測。已有的文獻中使用了標準的可決系數(shù)R2和平均絕對值MAE或者根均方誤差RMSE。這些測度指標側重于檢驗依賴變量的均值的績效,而無法捕獲依賴變量的完整分布的行為。為此,在評估整個分布的擬合度時,我們采用了其他的測度。沿用Wagenvoort(2006)[11]的思路,下面給出Harmonic Mass Index(HMI)和Harmonic Weighted Mass Index(HWMI)兩個指標作為均值絕對和均值平方差,如下:
另一個績效測度指標是Kolmogorov-Smirnov (KS)檢驗,原假設是數(shù)據服從回歸方法對應的被估計的分布。檢驗統(tǒng)計量D、關鍵值c和顯著性水平α,如下給出
KS的取值越高,表明擬合效果越差。KS檢驗校驗了最大偏差,但是不是整個的擬合優(yōu)度。結果應該被謹慎的對待。
在后面的估計檢驗中,我們將利用擬合優(yōu)度R2、HMI、HWMI和KS這四個測度指標,從樣本內和樣本外兩個角度,對比QR與其他的4個模型。
本文所使用的數(shù)據為山東省某城市商業(yè)銀行在2009年7月~2015年8月處置完畢的全部不良貸款數(shù)據。針對可能存在的數(shù)據異常點問題,參照Betz et al.(2016)[2]提出的選擇準則以確保數(shù)據的一致性。考慮了所有的現(xiàn)金流之和為未結清的違約暴露的90~110%之間的貸款,貸款的支付為未結清的處理暴露的-10%到120%之間。通過對數(shù)據進行篩選和清洗,最終得到信息比較完整的貸款7155筆及其違約之后2年的清收處置資料。數(shù)據指標包括:貸款期限、信用評級、保證、抵押和企業(yè)所屬行業(yè)。在債務追償方面,通過數(shù)據實錄,獲得了債務違約時間、核銷金額、追償金額、追償持續(xù)時間、追償成本等。其中追償成本包括基本追償費用(短信、電話和信函等方式)和專項追償費用(登門追償、司法追償、處理抵押物等方式)。有關違約暴露及追償費用的描述統(tǒng)計如表1所示。
本文采用銀行業(yè)實踐中常用的清收違約損失率公式計算實際發(fā)生的LGD,計算公式如下∶
其中,f為衡量單位回收金額所支付的費用,Rij(r)為第i筆貸款以貼現(xiàn)率rj計算的第j期貸款回收額的現(xiàn)值,EADi為為第i筆違約貸款的風險暴露(包括違約貸款余額和欠息金額),N為貸款的總筆數(shù),T為自違約起直到清償終結時的時間跨度。
顯然,實際LGD計算中的一個困難是清收過程中形成的各種成本f的確定。比如與特定資產相聯(lián)系的各種抵押品的評估費用等,在貸款清收過程中需要支付的清償部門的各種管理費用等。此外,在我國銀行業(yè)實踐當中,不良貸款的清收往往需要多個部門相互協(xié)調才能完成,這就加大了成本核算和分攤的難度,造成難以測算回收違約債項的直接與間接成本。本文對相關清收費用進行了實際統(tǒng)計,并以此為基礎測算了單位回收金額所花費的平均成本作為f的代替。
表1 違約暴露及追償費用的描述統(tǒng)計 (單位:萬元)
對于回收金額Rij的構成。本文使用貸款余額差額法來確定主要回收金額,即計算違約時點與T年后相同時點貸款余額之差作為現(xiàn)金回收部分,再加上以物抵債、債務轉移回收部分,并減去新發(fā)放貸款部分。
對于貼現(xiàn)率rj的設定。采用在回收期限上與違約貸款相對應的貸款利率作為貼現(xiàn)率比較合理。因此在后面的實證分析中,本文采用中國人民銀行公布的不同期限的貸款基準利率作為相應的貼現(xiàn)率。
對于的貸款的清償持續(xù)時間T的設定。根據貸款回收的歷年數(shù)據統(tǒng)計分析確定清償持續(xù)時間T的取值是一個比較合理的方法。本文利用獲取的貸款回收的歷年數(shù)據統(tǒng)計分析可知,貸款回收額在違約后1年內占全部回收額的65%,2年內占比達到83%,第三年僅占8%,因此,將違約后2年作為清收的終結時間是一個較好的近似。
通過(9)式,我們可以計算得到所有的7155筆貸款的實際LGD。圖4給出了最終LGD數(shù)據的頻率分布直方圖。
圖4 實際LGD的分布
從圖4可以看出,大多數(shù)LGD幾乎分布在0和1的附近。整體上看,它具有雙峰特征,違約損失率較低(5%左右)或違約損失率較高(90%左右)的債項較多,大多數(shù)違約損失率較低的債項位于這兩者之間。從兩個典型的位置統(tǒng)計指標來看,均值為0.41,中位數(shù)為0.11,即LGD是高度偏斜的。顯然,大多數(shù)標準的統(tǒng)計回歸方法都不能充分的捕獲雙峰和偏斜的特征分布的這些性質,因此本文嘗試利用分位數(shù)回歸來處理這些數(shù)據。另外,值得一提的是,本文結果與楊軍等(2009)[29]和陳榮達等(2014)[26]的研究結果有某些相似之處,這表明,國內商業(yè)銀行LGD分布大都是近似的“U”型分布。不過值得一提的是,本文測算的實際LGD的最大值超過了1,這說明,在債務清收過程中所存在的各種管理成本、法律成本、清算費用或者手續(xù)費和傭金以及較高的擔保回收成本是不能忽略的。
已有的研究文獻表明影響LGD的因素大致包括三類:債務人因素、債項因素和宏觀經濟因素。對于債務人來說,所處的行業(yè)和信用等級等因素會直接影響后期的債務償還。從債項因素來看,期限、擔保和逾期時間對后期的違約損失都具有顯著的影響。此外,逾期時間顯然會直接影響到債務回收的結果,追償過程持續(xù)的時間越長,債務的LGD越大。
結合以上的討論,選擇了七類指標:違約暴露、貸款期限、信用、擔保、抵押、行業(yè)和宏觀金融變量作為分位數(shù)回歸中的協(xié)變量。表2給出了五個分類變量的實際LGD的均值和分位數(shù)以及相應的樣本容量。
在表2中,我們根據貸款是否在1年以內,區(qū)分了短期和其他期限,相比短期債項,其他期限的債項隱含著更高的LGD。例如,短期項的實際平均LGD是0.22,而其他期限的債項的實際LGD的均值為0.34。高級的債項對于損失起著重要的作用。平均來說,AAA級信用貸款的LGD為0.17,A,AA級信用貸款的LGD為0.27,而其他級別的信用貸款的LGD為0.51。我們也區(qū)分了有無保證的貸款,即是否對貸款有額外的保證。從均值來看,對于是否有保證的貸款來說,LGD的差距較小。然而,從中位數(shù)來看,有保證的貸款為0.16,沒有保證的貸款為0.07。這種反常的現(xiàn)象可以被解釋為,雖然保證可能會降低未來的損失,但是它給出了非對稱的信息問題,比如道德風險,這會導致更高的損失。此外,我們區(qū)分了城市房產抵押、非城市房產抵押、機器設備抵押和其他抵押的貸款。具有城市房產抵押和非城市房產抵押的貸款的平均LGD差距不大,分別為0.17和0.19,而機器設備抵押的貸款的平均LGD較高為0.44,其他的非實物抵押具有更高的平均LGD為0.52。對于大多數(shù)行業(yè)來說,平均LGD大都分布在0.15~0.45之間。最大值對應著農林牧漁為0.46,最小值對應著建筑行業(yè)為0.16。建筑行業(yè)較低的平均LGD也能解釋目前我國商業(yè)銀行的貸款很大一部分流向房地產行業(yè)的現(xiàn)象,商業(yè)銀行更愿意把貸款發(fā)放到違約損失率較低的行業(yè)。
表2 各種變量下LGD的均值和分位數(shù) (單位 :%/筆)
已有的研究也表明,宏觀經濟和金融狀況對LGD也有顯著的影響。本文選擇GDP的年度增長率作為宏觀經濟狀況的代理變量。Chava et al.(2011)[3]研究發(fā)現(xiàn)10年和3個月的國庫券收益率之間的絕對期限價差可以作為驅動LGD的顯著變量。沿著這個思路,本文利用基于3個月期的國庫券收益率的期限價差刻畫未來金融和貨幣狀況的預期的顯著的變量。
1.參數(shù)估計結果
由于上面所分析的影響LGD因素中,除了兩個宏觀金融變量GDP增速和期限價差之外,其他的都是定性因素,為了在回歸分析中反映這些定性因素對LGD產生的影響,本文通過設置虛擬變量來反映定性因素中所包含的信息:貸款期限(其他期限)、信用(其他級別)、保證(無保證)、抵押(無抵押)和行業(yè)(金融保險),然后引入到分位數(shù)回歸模型中。這些虛擬變量的設置規(guī)則如下:
松嫩平原是一個潛水普遍分布的大型蓄水盆地,東部高平原和西側的大興安嶺山前傾斜平原,既是山區(qū)基巖裂隙水的排泄區(qū),又是中部承壓水盆地的主要補給區(qū)。
(1)貸款期限(其他期限)。貸款的期限會顯著影響到違約以及違約損失率。期限越長違約概率越大,反之亦然??紤]到處理的方便,本文區(qū)分了短期和其他期限的兩類貸款期限。本文以1年期為參照設置了虛擬變量“貸款期限”:如果期限在1年及以內,則貸款期限取值為1,否則取值為0。
(2)信用(其他級別)。對于企業(yè)來說,信用評級通常包括A類級(AAA級、AA級、A級),B類級(BBB級、BB級、B級),C類級(CCC級、CC級、C級)和D類級。從實際的違約狀況來考慮,本文以B類級及其以下為參照,設置了兩個虛擬變量“信用”:。如果貸款企業(yè)屬于“AAA級”或者“A,AA級”則信用相應的取值為1,否則取值為0。
(3)保證(無保證)。根據貸款有無保證,貸款可以分為有保證貸款和無保證貸款。本文以無保證為參照,設置了一個虛擬變量“保證”:如果有房產抵押,則保證取值為1,否則取值為0。
表3 分位數(shù)回歸模型和OLS的參數(shù)估計結果
(4)抵押(無抵押)。根據貸款的抵押品類型大致包括:城市房產,非城市房產,機器設備,非實物抵押和無抵押??紤]到抵押的金額的大小和處理的方便,本文以房產抵押為參照,設置了一個虛擬變量“抵押”:如果有房產抵押,則抵押取值為1,否則取值為0。
(5)行業(yè)(金融保險)。根據行業(yè)實踐來看,相比其他的行業(yè),金融保險行業(yè)是一個特殊的行業(yè),其違約率相對較低。本文以金融保險為參照,設置了八個虛擬變量“行業(yè)”:如果行業(yè)屬于農林牧漁、煤炭礦產、建筑房產、機械制造、交通通訊、批發(fā)零售、醫(yī)藥衛(wèi)生和電力油氣中的任何一個,則信用相應的取值為1,否則取值為0。
表3給出了針對以上的變量進行的第0.05, 0.25, 0.50,0.75和0.95分位數(shù)的估計結果和相應的OLS估計結果。括號中的標準誤是利用核估計方法計算的。
從表3的結果可以看到,參數(shù)估計的水平和顯著性依賴于各種的分位數(shù)。截距項表示了協(xié)變量為零時的LGD的演變方式。對于較低的分位數(shù)來說,截距項幾乎是完全收斂到零,而且在中位數(shù)之前呈現(xiàn)單調遞增的趨勢,直到在更高的分位數(shù)上達到總損失的最大值。
在分布的左尾部分(即0.05和0.25分位數(shù)),只有如下的較小的影響可以被觀測到:短期債務影響系數(shù)為-2.3%和-2.4%。AAA級信用貸款的LGD影響較小會降低4.7~5.9個百分點。有趣的是,保證的存在會提高損失2.3到3.1個百分點,這或許是有額外的管理成本導致的,因為此時保證人會變得很積極。在中位數(shù)的情形中,該影響會更大,會上升5.7個百分點。
大多數(shù)的控制變量在中位數(shù)和第三分位數(shù)上表現(xiàn)出了顯著的影響。這里,短期債務給出的最低的LGD影響,其他貸款具有最高的LGD影響。根據0.75分位數(shù),債務類型會導致8個百分點的波動。AAA級貸款在很大程度上決定了中位數(shù)。A、AA級的貸款可能會創(chuàng)造出61個百分點,與同等級別的其他債務相比,它是在中位數(shù)情形中的更高的損失。在第三個四分位點,相比同等級別的其他債務,AAA級貸款會降低損失18.6個百分點。
關于信用質量因素,這里可以看到QR的優(yōu)勢:OLS提供了24.5個百分點的變動,它沒有區(qū)分分位數(shù)的高級別。相反,QR所表現(xiàn)出的變動范圍是56.5個百分點,事實上,在第50個分位數(shù)上,有7.5 (AAA級)+49.0(A,AA級)=56.5。
另外,我們證實了抵押是影響可違約貸款的回收的重要的因素。房產抵押會降低LGD高達51.7個百分點。其他的抵押類型會降低26.8個百分點。OLS會有超過50個百分點的低估影響,為13.5和23個百分點。
本文觀測到了主要在第三個四分位數(shù)處的行業(yè)的影響。不同的行業(yè)之間的影響程度的差距最高可達40.8的百分點,其中煤炭礦產行業(yè)具有最低的LGD影響系數(shù)為-0.1902,批發(fā)零售和服務行業(yè)具有最高的LGD影響系數(shù)為0.2177。相反,OLS會得到錯誤的結論,因為煤炭礦產行業(yè)的行為沒有被識別為統(tǒng)計學顯著的不同于金融保險行業(yè)。
對于宏觀經濟變量,在中位數(shù)情形有一個GDP增長率的降低,系數(shù)為-0.0818,即表明經濟增長的較差的發(fā)展,損失顯著的上升。對于第三個四分位數(shù),只有期限價差影響是顯著的系數(shù)為0.0724,更高的期限價差也生成了較高的損失。再一次,OLS低估了宏觀金融協(xié)變量的影響,系數(shù)分別為-0.0463和0.0131。而對于極端的分位數(shù),模型沒有識別任何宏觀經濟的影響。
總之,QR的參數(shù)估計會因分位數(shù)的不同而不同,并且估計結果與OLS十分的不同。顯然,從更為綜合的視角來看,分位數(shù)回歸QR拓展了標準的回歸的結果。協(xié)變量的影響會在分位數(shù)之間顯著的變化,這是對控制變量經濟學影響的新啟示。
2.模型結果檢驗
為了檢驗分位數(shù)回歸在估計LGD方面的優(yōu)勢,本文在對分位數(shù)回歸模型進行檢驗的同時,也將在同樣的檢驗測度指標下,對比分位數(shù)回歸模型與其他四個模型的績效,即標準的OLS模型、Beta回歸模型(BRM)、分數(shù)響應模型(FRM)和有限混合模型(FMM)。
由于Beta回歸模型(BR)和分數(shù)響應模型(FRM)都有一個潛在的假設:依賴變量是一個比率,即位于0和1之間。而對于實際的LGD,由于存在管理費用,法律成本和清償費用或者財務費用(費用和傭金)以及較高的抵押回收,因此實際LGD通常要超出0和1范圍。為了在對比中運用模型BRM和FRM,我們將實際的LGD變換到了0和1區(qū)間中,具體的變換公式為如下
實際的LGD經過轉換之后,LGD[0,1]近似服從正態(tài)分布。實際上這種轉換類似Perraudinand Hu(2006)[9]所采用的逆正態(tài)回歸轉換,其中利用正態(tài)分布的逆累積密度函數(shù)對LGD進行了轉換。
利用模型BRM和FRM基于LGD[0,1]實施估計之后,我們將會對被預測的估計值重新進行再變換,使之回到實際LGD的刻度上來。
對于標準的OLS模型和有限混合模型(FMM)來說,我們沒有對實際的LGD進行轉換,而是使用了原始的數(shù)據來實施估計和對比。事實上,這兩類模型沒有依賴變量屬于[0, 1]的假設,它們可以直接模型化取值確切為0或者1的數(shù)據,此時數(shù)據變換反而會降低模型的擬合優(yōu)度。
下面在擬合優(yōu)度R2、HMI、HWMI和KS這四個測度指標下,從樣本內和樣本外兩個角度,對比QR與其他的4個模型。我們沒有僅僅局限于分析均值,而是分析了整個分布的擬合狀況。
(1)樣本內對比檢驗
首先,我們檢驗了全樣本的擬合優(yōu)度?;谡麄€時期的全樣本數(shù)據,我們估計了所有模型的樣本內取值。表4給出了所有模型的樣本內擬合度的四個測度指標值。此外,表4也報告了所有模型的p-值,如果p-值較低,則表明對分布充分擬合的原假設的拒絕。
從表4可知,所有的模型的R2取值都較低,介于0.077和0.101之間,這是由于LGD的雙峰特征所決定的。
在所有的模型中,只有QR給出的HMI和HWMI的取值最低,其中HMI=0.0030,而HWMI=0,兩個指標都低于0.001的顯著性水平,而其他的模型的兩個指標的取值分別為0.0480~0.1644和0.0020~0.0179都超過了0.001。
根據KS檢驗,在0.05顯著性水平下,除了QR之外,基于全樣本計算的KS檢驗拒絕了其他的四個模型的原假設,這表明分位數(shù)回歸QR的擬合效果最好。
表4 模型樣本內檢驗的結果
另外,也可以利用Michael(1983)[8]提出的P-P圖直觀的展示分布擬合的精確水平,它可以對比理論分位數(shù)和經驗分位數(shù),PP曲線越靠近對角線表明理論分位數(shù)同經驗分位數(shù)相匹配程度越高。圖5給出了五個模型的P-P圖。
從圖5的各個模型的PP曲線與對角線的靠近程度可以看出,分位數(shù)回歸QR估計的LGD的理論分位數(shù)和實際LGD的經驗分位數(shù)幾乎是完全擬合的,而其他的四個模型的PP曲線,都表現(xiàn)出了在尾部或中部的系統(tǒng)性的偏倚。顯然,根據PP圖給出的信息,模型幾乎擬合了每一個分位數(shù)的樣本內的數(shù)據,所以說分位數(shù)回歸QR的樣本內擬合幾乎是完美的,這正是分位數(shù)回歸模型相比其他的均值回歸模型的優(yōu)勢所在。
綜上所述,從對LGD的均值擬合來說,分位數(shù)回歸QR會導致一個相對適中的樣本內擬合。然而,如果考慮到LGD所服從的整個分布,分位數(shù)回歸QR則表現(xiàn)出了顯著的優(yōu)勢,因為樣本內擬合優(yōu)度表明,每一個分位數(shù)都幾乎被確切的擬合了。
(2)樣本外對比檢驗
為了實施樣本外檢驗,我們把所有的數(shù)據劃分成用于估計的訓練樣本和用于預測的檢驗樣本。訓練樣本包括2000~2009年的子樣本數(shù)據,該子樣本大約是全部數(shù)據的60%。檢驗樣本是從剩余的2010~2013年的數(shù)據中隨機抽取了10000次,所構成的子樣本組合,其中每一步中都包含300個可違約貸款,它在我們的數(shù)據集合中近似為每年違約的平均次數(shù)。
首先基于訓練樣本我們估計了所有的模型,然后基于檢驗樣本計算了每個子組合的擬合優(yōu)度,并且匯報了所有10000次步驟的數(shù)據的均值,見表5。
圖5 樣本內擬合的P-P
表5 模型樣本外檢驗的結果
表5所示,QR給出了均值的較為適中的擬合,其可決系數(shù)R2為0.0344,而基于其他四個模型計算得到的R2取值介于0.0241和0.0512之間。對于測度指標HMI和HWMI來說,QR的取值是分別為0.0965和0.0056,而對于其他的方法來說,取值位于0.1516~0.18748和0.0175~0.0220。顯然,分位數(shù)回歸QR的取值是最佳的。對于KS檢驗來說,除了FMM和QR大于5%之外,其他的三個方法的平均p值都要低于1%。事實上,在KS檢驗中,基于三種顯著性水平10%,5%和1%,對于FMM的拒絕率為55.7%,41.4%和18.8%,對于QR的拒絕率為89.0%,81.6%和57.3%。
3.違約損失率分布預測
在理論上,應估計每一筆貸款的模型并進行預測,但因為協(xié)變量的特定選擇會影響到貸款LGD的分布,所以本文僅選擇其中某個行業(yè)的典型的短期貸款,債務人全部來自煤炭行業(yè)。宏觀經濟和金融狀況被選為中間性的場景,即GDP增長率假設為6%,期限價差為2.63個百分點。其他的協(xié)變量是從煤炭行業(yè)的典型情形中選擇的。
圖6 實際LGD與預測LGD的分布
首先利用全樣本數(shù)據進行了模型的參數(shù)估計,然后針對該典型貸款的相應的協(xié)變量,對LGD進行了預測。圖6(a)給出了該典型貸款的實際LGD的頻率直方圖,圖6(b)給出了該典型貸款的LGD的概率分布密度曲線的預測。
從圖6可以看出,標準的OLS模型和分數(shù)響應模型FRM都不能捕獲LGD的非正態(tài)性。雖然這兩個方法預測到了分布的中部和尾部的較多的概率,但是對于總的損失來說過小。貝塔回歸模型BRM雖然捕獲了非正態(tài)性,但是也不能捕獲已實現(xiàn)的極端的雙峰形狀。
有限混合模型FMM給出了較為靈活的密度形狀。它捕獲了雙峰特征,并且預測到了在零和1附近的極端值的情形。不過,對于較為稀少的中間部分卻給予了太多的概率。
分位數(shù)回歸QR看起來給出了最佳的預測。較好的擬合了左右兩個尾部和中間部分的形狀。最小值和最大值意味著較為準確的分布密度的估計。0和1附近的尾部擬合的較好,非常極端的值較少,相比尾部,中間部分的預測也是較為充分的。
已有的各種損失模型主要關注均值預測。然而貸款損失數(shù)據表明違約損失率LGD具有強烈的變異特征,而且損失分布具有極端的偏斜和雙峰特征。但是,大多數(shù)現(xiàn)存的模型和均值預測的校驗都沒有解釋這種行為。為此,本文提出了基于分位數(shù)回歸的LGD建模方法。它考慮了協(xié)變量對LGD的影響隨著LGD的整個分布的不同范圍而變化,并且反映了損失的較強的不確定性。我們的結論表明,較低的LGD對具有信用級別、保證和抵押個具有較高的敏感性。在中位數(shù)情形下,LGD會額外的受到抵押類型,財務類型,還有行業(yè)和宏觀經濟環(huán)境的影響。而較高的LGD則沒有受到任何協(xié)變量的影響。這表明總損失的剩余的尾部風險不能被銀行實踐或者監(jiān)管者所控制。此外,我們也使用了校驗模型預測績效測度的新的測度指標。樣本內和樣本外的分析表明,同大多數(shù)現(xiàn)有的模型方法相比,QR優(yōu)于其他信用風險模型。另外,研究發(fā)現(xiàn)宏觀經濟和金融狀況的影響會隨著LGD分位數(shù)的不同而變化。
基于本文提出的量化LGD的分位數(shù)回歸模型,可以構建一套完整的貸款違約損失率估計和違約風險預測體系,為商業(yè)銀行進行貸款風險調整定價、經濟資本計算和資產支持證券或者信用衍生品的定價提供重要的借鑒。從而提高我國商業(yè)銀行在貸款的違約損失率的計量科學性,有助于防范和處置不良貸款問題。另外,本文的模型也有助于金融監(jiān)管部門在制定信用風險加權資產等規(guī)則方面提供新的方法啟示。
本文的不足之處在于,限于數(shù)據可得性,只是使用了某家城市商業(yè)銀行的部分數(shù)據,而沒有對更大范圍的數(shù)據驗證本文模型的有效性,從而無法校驗“區(qū)域性特征”對LGD的影響程度,而“區(qū)域性特征”可能是中國銀行業(yè)在貸款發(fā)放時經??紤]的一個重要因素。因此下一步研究思路就是利用更大范圍的數(shù)據樣本檢驗模型的適用性。
注釋