閆 春,邱藝偉,陳祥輝
(山東科技大學(xué) 數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院,山東 青島266590)
在未決賠款準(zhǔn)備金的評估中需要處理大量數(shù)據(jù),這些流量三角形的數(shù)據(jù)可能會由于突發(fā)事件、信用欺詐、人為的疏忽大意等因素而包含一些明顯偏離該批賠款數(shù)據(jù)的異常數(shù)據(jù)。如果不對這些離群值進(jìn)行處理,將會對準(zhǔn)備金估計結(jié)果產(chǎn)生一定影響,最終影響到保險公司的運營決策。因此,為了減少誤差,保證非壽險準(zhǔn)備金評估數(shù)據(jù)分析的準(zhǔn)確性,必須對流量三角形中的數(shù)據(jù)進(jìn)行檢驗,并對離群值進(jìn)行處理。同時,對穩(wěn)健的準(zhǔn)備金評估模型探討也是十分必要的。
在國外,研究統(tǒng)計診斷和異常值影響的文獻(xiàn)較多。Cook和Weisberg系統(tǒng)介紹了統(tǒng)計診斷的基本原理和判定識別異常點的方法,給出了統(tǒng)計模型影響分析系統(tǒng)的評價方法[1]198-229。在非壽險精算領(lǐng)域,Carroll和Pederson研究了準(zhǔn)備金評估模型對原始數(shù)據(jù)中異常值的敏感程度,但求出的影響函數(shù)是無界的[2]。在這種情況下,當(dāng)解釋變量中出現(xiàn)異常值時,解釋變量均值出現(xiàn)的細(xì)小變化就會對評估結(jié)果產(chǎn)生巨大的影響。Cantoni和Ronchetti在廣義線性模型中應(yīng)用了擬似然估計的方法,使得估計結(jié)果的偏差和預(yù)測值的影響函數(shù)有界,解決了前面的問題[3]。Verdonck考慮了流量三角形中異常賠款對準(zhǔn)備金估計值的影響,提出了穩(wěn)健的鏈梯法模型,對多種準(zhǔn)備金評估方法存在離群值的情況進(jìn)行了實證研究,并進(jìn)一步修正了此前的模型,定量分析了異常賠款數(shù)據(jù)對廣義線性模型下準(zhǔn)備金的影響程度,構(gòu)造出診斷方程,對異常值存在的位置進(jìn)行有效識別[4-5]。
在國內(nèi)的非壽險行業(yè)中,考慮異常賠款數(shù)據(jù)的研究起步較晚。孟生旺等運用多種混合泊松回歸模型來反映真實索賠頻率數(shù)據(jù)中的過離散現(xiàn)象,改善了費率厘定的效果[6]。姜興坤等在用 Merton模型對存款保險定價時,對每日股價進(jìn)行2日移動平均數(shù)平滑,減小了數(shù)據(jù)異常波動造成的影響[7]。關(guān)于流量三角形中的離群值問題,逯敏分析了索賠準(zhǔn)備金對離群值的高度依賴性,之后引入了兩種改進(jìn)的準(zhǔn)備金評估模型——穩(wěn)健鏈梯模型和穩(wěn)健廣義線性模型,并在此基礎(chǔ)上提出了穩(wěn)健的兩階段廣義線性模型,用自舉法對估計結(jié)果進(jìn)行了統(tǒng)計檢驗[8]。段白鴿等改進(jìn)了以上的穩(wěn)健鏈梯模型,擴(kuò)大了異常值的檢索范圍,用比利時非壽險業(yè)務(wù)的真實數(shù)據(jù)做了實證分析[9]。
準(zhǔn)備金進(jìn)展法同時考慮了兩種賠款數(shù)據(jù),能充分利用保險公司的歷史數(shù)據(jù)。在對準(zhǔn)備金進(jìn)展法的改進(jìn)上,國內(nèi)的文獻(xiàn)并不多。張連增等將Bootstrap方法應(yīng)用到準(zhǔn)備金進(jìn)展法中,得到了未決賠款準(zhǔn)備金的預(yù)測分布和各個分位數(shù)以及相關(guān)的分布度量,并提出了基于成對抽數(shù)的非參數(shù)Bootstrap方法、二元正態(tài)分布和Copulas函數(shù)三種考慮已決賠款與已報案賠款相關(guān)性的隨機(jī)性準(zhǔn)備金進(jìn)展法,不但考慮了兩類賠款數(shù)據(jù)之間的相關(guān)性,而且體現(xiàn)了不同事故年已發(fā)生已報案未決賠款準(zhǔn)備金進(jìn)展情況之間的差異[10-12]。
本文在準(zhǔn)備金進(jìn)展法中考慮離群值的影響,對已決賠款數(shù)據(jù)和已報案賠款數(shù)據(jù)中的離群值進(jìn)行檢驗和調(diào)整,提出了計算支付率和結(jié)轉(zhuǎn)率的穩(wěn)健方法,并應(yīng)用經(jīng)典數(shù)據(jù)進(jìn)行實證分析,對估計結(jié)果進(jìn)行對比。
傳統(tǒng)的準(zhǔn)備金進(jìn)展法考慮到兩類賠款數(shù)據(jù)的關(guān)系。令表示第i個事故年在第j個進(jìn)展年的累計已決賠款,表示第i個事故年在第j個進(jìn)展年的增量已決賠款,表示第i個事故年在第j個進(jìn)展年的累計已報案賠款,表示第i個事故年在第j個進(jìn)展年的增量已報案賠款。已發(fā)生已報案未決賠款準(zhǔn)備金記為支付率,結(jié)轉(zhuǎn)率。支付率表明在年初的未決賠款估計之中有多少在當(dāng)年已經(jīng)支付。結(jié)轉(zhuǎn)率表明當(dāng)年初的未決賠款估計之中有多少結(jié)轉(zhuǎn)為下年初的未決賠款。
對事故年i,先估計和。在第j個進(jìn)展年末的逐案估計值可用式(1)遞推計算。
在未來第j個進(jìn)展年的已決賠款可用式(2)計算:
診斷流量三角形數(shù)據(jù)中的離群值是非常重要的。在使用準(zhǔn)備金進(jìn)展法的過程中,如果流量三角形中的一個或者多個觀測值的進(jìn)展模式與大部分?jǐn)?shù)值有顯著差別,即出現(xiàn)了異常值,這些異常值可能會造成不合理的準(zhǔn)備金估計結(jié)果,影響保險公司估計和預(yù)留準(zhǔn)備金。所以,當(dāng)流量三角形中存在離群值時,我們需要知道準(zhǔn)備金進(jìn)展法對離群值的敏感程度。
下面選取由《保險公司非壽險業(yè)務(wù)準(zhǔn)備金評估實務(wù)指南》得到的一組數(shù)據(jù)進(jìn)行分析,探究異常賠款觀測值對估計結(jié)果產(chǎn)生的影響[13]90-96。原始數(shù)據(jù)如表1和表2所示。
表1 增量已決賠款(單位:千元)
表2 增量已報案賠款(單位:千元)
按照準(zhǔn)備金進(jìn)展法的基本思路,得到的支付率和結(jié)轉(zhuǎn)率估計值如表3所示,增量已決賠款的下三角估計值如表4所示。加總表4下三角所有增量已決賠款,得到索賠準(zhǔn)備金的估計值為103 216千元。
表3 各進(jìn)展年支付率、結(jié)轉(zhuǎn)率和進(jìn)展率的算術(shù)平均數(shù)
表4 準(zhǔn)備金進(jìn)展法估計的增量已決賠款(單位:千元)
將某一增量已決賠款乘以一個常數(shù),計算添加離群值前后準(zhǔn)備金進(jìn)展法估計結(jié)果的變化,進(jìn)而來研究準(zhǔn)備金進(jìn)展法對離群值的敏感性。事故年為1、進(jìn)展年為2的增量已決賠款額擴(kuò)大10倍,考慮這一離群值對評估結(jié)果的影響。在這種情況下,應(yīng)用準(zhǔn)備金進(jìn)展法得到的支付率和結(jié)轉(zhuǎn)率估計值如表5所示。增量已決賠款的估計值如表6所示,索賠準(zhǔn)備金的估計值為72 606千元,比原來的流量三角形評估結(jié)果103 216千元減少了約30%。若在增量已報案賠款中加入離群值,把事故年為1、進(jìn)展年為2的增量已報案賠款額擴(kuò)大10倍,得到索賠準(zhǔn)備金的估計值為87 352千元,比原來的流量三角形評估結(jié)果103 216千元減少了15.4%??梢姡瑐鹘y(tǒng)的準(zhǔn)備金進(jìn)展法對單一的離群值較敏感。我們需要探索一種新的方法來降低其敏感性。
表5 增加離群值的各進(jìn)展年支付率、結(jié)轉(zhuǎn)率和進(jìn)展率的算術(shù)平均數(shù)
表6 增加離群值的準(zhǔn)備金進(jìn)展法估計的增量已決賠款(單位:千元)
準(zhǔn)備金進(jìn)展法的估計結(jié)果容易受到異常賠款數(shù)據(jù)的影響。因此,本文對準(zhǔn)備金進(jìn)展法進(jìn)行改進(jìn),嘗試建立更加合理的準(zhǔn)備金估計模型。
可以在一定程度上減少準(zhǔn)備金估計的偏差。
在以上的案例中運用這種方法,將會得到更加合理的支付率和結(jié)轉(zhuǎn)率,此時準(zhǔn)備金的估計值為101 084千元。把事故年為1、進(jìn)展年為2的增量已決賠款擴(kuò)大10倍,索賠準(zhǔn)備金的估計值為80 191千元,比真實流量三角形評估結(jié)果減少了20.7%;把事故年為1、進(jìn)展年為2的增量已報案賠款擴(kuò)大10倍,索賠準(zhǔn)備金的估計值為83 565千元,比真實流量三角形評估結(jié)果減少了17.3%。
如果異常值出現(xiàn)在流量三角形的最后兩列,則用中位數(shù)代替均值后,支付率和結(jié)轉(zhuǎn)率沒有變化,故最后兩個數(shù)據(jù)可用前幾個進(jìn)展年的支付率和結(jié)轉(zhuǎn)率數(shù)據(jù)進(jìn)行曲線擬合或其他方式來修正。
目前比較常用的離群值檢驗方法主要有正態(tài)分布、指數(shù)分布、韋伯分布檢驗法等。每一種方法都有特定的局限性,如大多數(shù)檢驗方法只能檢驗特定分布的樣本是否含有離群值,有的只能檢驗樣本中只含異常大值或者異常小值的情況,有的只能檢驗同時含有異常大值和異常小值的情況等。本文采用了一種簡單的在流量三角形中檢驗異常值的方法。
首先查找首列的異常值。因為結(jié)轉(zhuǎn)率是由累計數(shù)據(jù)計算得到,首列的一個異常值不僅會影響第一列的殘差,可能導(dǎo)致后幾列的殘差也出現(xiàn)異常,因此先只對首列的異常值進(jìn)行判定。由估計的結(jié)轉(zhuǎn)率和已發(fā)生已報案未決賠款流量三角形日歷年為t的對角線上的數(shù)據(jù)依次反推出除對角線之外的上三角部分,得到新的RV流量三角形,即:
計算原始已發(fā)生已報案未決賠款準(zhǔn)備金流量三角形與新流量三角形的殘差。有:
通過以上計算,流量三角形對角線位置對應(yīng)的未決賠款與原始數(shù)據(jù)相等,殘差為0。
處理離群值的方式主要有四種:一是全部保留;二是找到實際原因并修正,否則保留;三是剔除,不追加觀測值;四是剔除并追加新的觀測值或者用合適的插補值代替。本文在充分考慮數(shù)據(jù)性質(zhì)和錯誤剔除正常值的風(fēng)險后,決定采用第四種方法來處理離群值。
如果在同一行中,前兩列的數(shù)據(jù)均異常,則首列中的異常值用首列數(shù)據(jù)的中位數(shù)代替,即:
如果同一行中,第二列數(shù)據(jù)不是異常值,那么首列的異常值由第二列的數(shù)據(jù)和相應(yīng)的結(jié)轉(zhuǎn)率得到,即:
首列最后一個事故年的數(shù)據(jù)如果出現(xiàn)異常值,這種方法是無法測度的。可以直接做出第一列所有數(shù)據(jù)的箱線圖來判定最后一個事故年的數(shù)據(jù)是否是離群值。
然后,查找其他列的異常值仍然借助于殘差,但擬合值的獲得是通過另外一種方式。通過前面的調(diào)整,第一列已經(jīng)不存在異常值。因此,我們以增量未決賠款的第一列數(shù)據(jù)為基準(zhǔn)計算新的支付率和結(jié)轉(zhuǎn)率:
將各列的結(jié)轉(zhuǎn)率乘以第一列數(shù)據(jù)得到擬合的上三角形,這樣就得到了一個新的增量未決賠款流量表。此時,一個異常數(shù)據(jù)只會對它對應(yīng)的殘差產(chǎn)生影響。殘差仍然采用箱線圖判定,離群的本列殘差用中位數(shù)代替,最后的估計值由調(diào)整后的殘差反推得到。
依然采用表1和表2的數(shù)據(jù),經(jīng)驗證,該流量三角形中沒有離群值。通過對比添加離群值前后改進(jìn)的準(zhǔn)備金進(jìn)展法和傳統(tǒng)模型評估結(jié)果的差異,來度量兩種方法對離群值的敏感程度。通過將某一增量已決賠款擴(kuò)大10倍的方式引入離群值,該數(shù)值可以推測為小數(shù)點右移一位的人為輸入錯誤所致。
表7給出了對增量已決賠款數(shù)據(jù)添加離群值前后,分別使用改進(jìn)的準(zhǔn)備金進(jìn)展法和傳統(tǒng)的準(zhǔn)備金進(jìn)展法得到的索賠準(zhǔn)備金估計值,其中,第二行表示沒有添加離群值得到的結(jié)果。從表7中看出,兩種方法得到的準(zhǔn)備金估計值相差不大,即使用改進(jìn)的準(zhǔn)備金進(jìn)展法對不含離群值的數(shù)據(jù)是安全的。其余行依次考慮已決賠款流量三角形的上三角每一位置的增量賠款擴(kuò)大10倍后兩種方法得到的估計結(jié)果??梢钥闯?,單一離群值使得兩種方法的準(zhǔn)備金評估結(jié)果存在很大差異。
表7 增量已決賠款添加離群值前后兩種評估方法的估計結(jié)果比較(單位:千元)
圖1清楚地顯示了兩種方法對增量已決賠款中單一離群值出現(xiàn)位置的敏感程度。
圖1 兩種評估方法對增量已決賠款中單一離群值的敏感程度比較
我們用同樣的方法可以對增量已報案賠款添加單一離群值,分別使用改進(jìn)的準(zhǔn)備金進(jìn)展法和傳統(tǒng)的準(zhǔn)備金進(jìn)展法求得索賠準(zhǔn)備金。兩種評估方法對增量已報案賠款中單一離群值的敏感程度如圖2所示。
圖2 兩種評估方法對增量已報案賠款中單一離群值的敏感程度比較
由圖1和圖2可以看出,無論是在增量已決賠款還是增量已報案賠款中引進(jìn)離群值,改進(jìn)的準(zhǔn)備金進(jìn)展法對準(zhǔn)備金的評估結(jié)果序列較傳統(tǒng)的準(zhǔn)備金進(jìn)展法都平穩(wěn)得多,證明這種調(diào)整離群值的方法確實能夠降低異常值對準(zhǔn)備金評估的影響。
本文用反推的方法計算出新的RV流量上三角形,計算其與原流量上三角形的殘差,對殘差做出箱線圖來檢驗RV流量三角形的離群值。此處有個假設(shè),即增量已決賠款或者增量已報案賠款數(shù)據(jù)出現(xiàn)異常時,已發(fā)生已報案未決賠款也會出現(xiàn)異常。首先通過修正RV流量三角形的數(shù)據(jù)來達(dá)到減少離群值影響的目的,若前者效果不顯著,即已決賠款殘差仍然有離群值,再考慮對增量已決賠款或者增量已報案賠款進(jìn)行調(diào)整。對于計算支付率和結(jié)轉(zhuǎn)率,最后兩個進(jìn)展年的支付率或結(jié)轉(zhuǎn)率采用其前兩個進(jìn)展年的估計值與本年數(shù)據(jù),取中位數(shù)得到。這樣即使最后兩列的異常值沒有被有效識別,總的準(zhǔn)備金估計值也不會受到太大的影響。
數(shù)值結(jié)果表明,改進(jìn)的準(zhǔn)備金進(jìn)展法能夠有效識別和調(diào)整離群值,對原始數(shù)據(jù)中的異常值、離群值起到了很好的規(guī)避作用,大大降低了其對準(zhǔn)備金估計的影響,保險公司可以得到與不存在異常值時相類似的準(zhǔn)備金。通過比較與傳統(tǒng)評估方法的估計結(jié)果,精算人員可以進(jìn)一步分析造成異常賠款數(shù)據(jù)的原因,根據(jù)具體情況對異常數(shù)據(jù)作出相應(yīng)的處理方法,提高準(zhǔn)備金估計的合理性。
[1] Cook R D,Weisberg S.Residuals and Influence in Regression[M].New York:Chapman and Hall,1982.
[2] Carroll R J,Pederson S.On Robustness in the Logistic Regression Model[J].Journal of the Royal Statistical Society,Series B,1993,55(3).
[3] Cantoni E,Ronchetti E.Robust Inference for Generalized Linear Models[J].Journal of the American Statistical Association,2001,96(455).
[4] Verdonck T,Van Wouwe M,Dhaene J.A Robustification of the Chain-ladder Method[J].North American Actuarial Journal,2009,13(2).
[5] Verdonck T,Debruyne M.The Influence of Individual Claims on the Chain-ladder Estimates:Analysis and Diagnostic Tool[J].Insurance:Mathematicsand Economics,2011,48(1).
[6] 孟生旺,徐昕.非壽險費率厘定的索賠頻率預(yù)測模型及其應(yīng)用[J].統(tǒng)計與信息論壇,2012(9).
[7] 姜興坤,孫健,宋玉.引入所得稅的Merton模型存款保險定價研究[J].統(tǒng)計與信息論壇,2013(3).
[8] 逯敏.保險公司異常賠款數(shù)據(jù)對準(zhǔn)備金估計的影響研究[D].天津:天津財經(jīng)大學(xué)碩士學(xué)位論文,2013.
[9] 段白鴿,張連增.考慮離群值的穩(wěn)健鏈梯法[J].?dāng)?shù)理統(tǒng)計與管理,2014(7).
[10]張連增,段白鴿.基于Bootstrap方法的隨機(jī)性準(zhǔn)備金進(jìn)展法及R實現(xiàn)[J].山西財經(jīng)大學(xué)學(xué)報,2011(4).
[11]張連增,段白鴿.基于已決賠款與已報案賠款相關(guān)性的隨機(jī)性準(zhǔn)備金進(jìn)展法[J].管理評論,2013(5).
[12]段白鴿,張連增.考慮兩類賠款數(shù)據(jù)相關(guān)性的隨機(jī)性準(zhǔn)備金進(jìn)展法及改進(jìn)[J].中國管理科學(xué),2014(4).
[13]吳小平.保險公司非壽險業(yè)務(wù)準(zhǔn)備金評估實務(wù)指南[M].北京:中國財政經(jīng)濟(jì)出版社,2005.