姚正錕 南開大學(xué)金融學(xué)院
財產(chǎn)保險的一個特點是,損失的大小取決于事故或損失的嚴重程度。投保的保額只有在非常嚴重或完全損失的情況下才支付。在大多數(shù)情況下,損失是以低于最大保額的方式結(jié)算的。由于這種“部分損失”的特點,任何一種風(fēng)險的保險金額增加或減少都不需要按比例改變保險費。這種非比例或非線性關(guān)系會導(dǎo)致定價的復(fù)雜化,特別是當(dāng)它與承保范圍的限制相結(jié)合時。對保險金額的限制可以采取多種形式。免賠額、特許權(quán)、超額保險、保留金、共同保險和最高限額都是限制保險范圍的方式。為了正確評估有限保險保障的成本,有必要衡量已消除損失的比例或剩余損失的比例。而風(fēng)險曲線就是為了解決這一問題而產(chǎn)生的。
風(fēng)險曲線的概念最早由Ruth E.Salzmann(1963)提出,該研究以北美保險公司(INA)的索賠數(shù)據(jù)為基礎(chǔ),對1960 年至1961 年間發(fā)生的火災(zāi)損失進行了分析,得出按保險價值百分比計算的累積損失成本的經(jīng)驗數(shù)據(jù)分布,并表明對于同質(zhì)風(fēng)險組,這種分布是穩(wěn)定的。隨后S.Ludwig(1991)對Salzmann曲線進行進一步修正,并將此方法應(yīng)用到更新的數(shù)據(jù)。而在行業(yè)中被廣泛應(yīng)用的Swiss Re curves(瑞士再保險曲線)和Lloyds curves(勞合社曲線)在S. Bernegger(1997)提出的MBBEFD 分布得到證明。MBBEFD(Maxwell-Boltzmann,Bose-Einstein,F(xiàn)ermi-Dirac distribution)是物理學(xué)中統(tǒng)計力學(xué)的分布,該分布被Bernegger發(fā)現(xiàn)非常適合[0,1]區(qū)間上的經(jīng)驗損失分布建模,其通過使用MBBEFD 分布成功擬合了Swiss Re curves 和Lloyds curves,此后MBBEFD 被作為歐洲主要的風(fēng)險曲線的模型基礎(chǔ)。而Clive L.Keatinge(1999)提出了一種通過混合指數(shù)模型進行保險數(shù)據(jù)損失分布擬合的新的方法,本文就是在其基礎(chǔ)上運用EM算法對風(fēng)險曲線進行構(gòu)建。
假設(shè)F(x)是區(qū)間在[0,1]上的損失分布函數(shù),有限期望函數(shù)L(d)=E[min(d,x)],X是實際損失,M是最大可能損失,并且X≤M,D是財產(chǎn)險的免賠額或險位超賠再保險的最大自留額。其中d=D/M,x=X/M分別代表了標準化后的免賠額和標準化后的損失。
根據(jù)定義可看出,M·L(d)是財產(chǎn)險免賠額以下或再保險分出公司自留部分的期望損失,M·(L(1)-L(d))是財產(chǎn)險免賠額以上或再保險分入公司的期望損失。因此,這部分純風(fēng)險保費比率就是風(fēng)險曲線G(d)。
其中,G(0)=0,G(1)=1。
因為1-F(x)≥0,并且F'(x)=f(x)≥0,所以G(d)在區(qū)間[0,1]上是一個遞增的凹函數(shù)。
風(fēng)險曲線描述的是免賠額與損失扣減率(給定免賠額以下的賠付成本占總賠付成本的比率)的關(guān)系。風(fēng)險曲線的橫軸數(shù)值代表免賠額占總保險金額或者最大可能損失(MPL)的比例,它的縱軸對應(yīng)的數(shù)值代表損失扣減率(LER)。在對含有免賠額的財產(chǎn)險保單和險位超賠再保險合同的定價過程中,定價人員經(jīng)常借助風(fēng)險曲線解決相關(guān)問題,風(fēng)險曲線是基于歷史索賠數(shù)據(jù)的傳統(tǒng)建模方法的有力替代方法,尤其對于新興的中小保險公司來說,在定價中具有很大的參考意義。
?圖1 風(fēng)險曲線示例
以圖1 為例,對于非比例的險位超賠再保險來說,假設(shè)每層保額為2000萬元,占全部保額比例為10%,橫軸10%對應(yīng)的曲線縱坐標為55%,橫軸20%對應(yīng)的曲線縱坐標為70%,那么再保險承保在10%到20%部分的保費為(70%-55%)×原保費。
對于直保公司免賠額定價來說,從圖1 可看出,其自變量為10%時所對應(yīng)的因變量為55%,那么對于該類風(fēng)險,當(dāng)免賠額相當(dāng)于保額的10%時,該免賠額可以去除55%的預(yù)期損失強度。換句話說,扣去免賠額后的預(yù)期損失強度僅相當(dāng)于無免賠額時的45%。
根據(jù)損失數(shù)據(jù)的特性,我們使用的是混合指數(shù)分布的離散形式,其中x是損失數(shù)據(jù),pi是與λi對應(yīng)的混合權(quán)重。
基于混合模型的特性,我們將使用EM 算法對模型進行參數(shù)估計。
1.參數(shù)估計方法
EM 算法又稱期望最大化(Expectation Maximization)算法,是基于極大似然估計(Maximum Likelihood Estimation, MLE)理論的優(yōu)化算法,十分適合解決具有缺失數(shù)據(jù)或者隱變量的模型的求參問題,而這種特性可以很好地應(yīng)用在混合模型之中。給定相互獨立的觀測數(shù)據(jù)x=(x1,...,xn),模型的參數(shù)為θ,概率密度函數(shù)為p(xi;θ),根據(jù)MLE 理論,極大化的對數(shù)似然函數(shù)為:
假設(shè)觀測數(shù)據(jù)中存在隱變量z=(z1,z2,…,zk),隱變量可以表示缺失數(shù)據(jù),或概率模型中任何無法直接觀測的隨機變量,在混合分布中,隱變量的意義是表示樣本中的數(shù)據(jù)屬于哪個分布,根據(jù)邊緣概率的求解,再加入隱變量之后,概率密度函數(shù)p(xi;θ)可以表示為:
其中第一行是隱變量為連續(xù)變量的情況,第二行為隱變量為離散變量的情況。
在這里我們以離散變量為例進行相關(guān)的推導(dǎo)說明。此時極大化的對數(shù)似然函數(shù)為:
由于隱變量zj的存在,所以我們無法直接求出參數(shù)θ,這時我們引入與隱變量有關(guān)的概率分布Qj(zj),由Jensen 不等式觀測數(shù)據(jù)的對數(shù)似然有如下不等關(guān)系:
這個過程相當(dāng)于確定了似然函數(shù)的下界,再假設(shè)θ固定的情況下,那么所求的似然函數(shù)的值是由Qj(zj)和p(xi;zj)決定的,我們需要不斷調(diào)整這兩個概率來逼近真實值,而當(dāng)滿足上式的等號時,所得結(jié)果大致滿足真實值。
若要滿足不等式的等號條件,需要滿足p(xi;zj;θ)/(Qj(zj))=m,其中m為常數(shù)。
因為Qj(zj)是關(guān)于隱變量的概率分布,所以滿足,因此
由上面兩個式子,我們可以得到:
從中我們可以看到,在滿足等號條件下,Qj(zj)應(yīng)該是隱變量對觀測數(shù)據(jù)的后驗概率,所以在確定了Qj(zj)的情況下,我們讓因此我們的求解目標為:
總的來說,EM 標準算法是一組迭代計算,迭代分為兩部分,即E步和M 步,其中E 步“固定”前一次迭代的θ(t-1),求解Q(t),使L(θ,Q)取極大值;M步使用Q(t),求解θ(t),使L(θ,Q)取極大值。EM算法需要給定一個參數(shù)初值θ(0)后開始迭代,迭代中E 步和M 步交替進行,當(dāng)∥θ(t)-θ(t-1)∥小于某個給定的閾值時停止迭代。
2.應(yīng)用EM算法求混合指數(shù)模型的參數(shù)
朱利平、盧一強、茆詩松(2006)提到,以單參數(shù)混合指數(shù)分布為例,使用EM算法進行參數(shù)估計,密度函數(shù)為:
其中:
xi服從混合指數(shù)分布fi。如果Ii為示性變量,那么,Ii=1表示xi來自密度函數(shù)f1i的指數(shù)總體,Ii=0表示xi來自密度函數(shù)f2i的指數(shù)總體??芍琁i服從二項分布,P(Ii=1)=p,P(Ii=0)=1-p。因為我們不知道xi來自f1i還是f2i的指數(shù)總體,因而,Ii是不能被觀測到的隨機變量。
xi和Ii的聯(lián)合分布為g(xi,Ii,θ)=(pf1i)Ii [(1-p)f2i](1-Ii),從而Ii在xi給定的條件分布為:
給定初值θ(0),EM算法步驟為:
E步——求期望值。
其中,
M步——極大化求θ(m),使得Q(θm,θ(m-1))=maxQ(θ,θ(m-1))。
以θm作為θ(m-1的更新值,重復(fù)第1和第2步,當(dāng)∥θ(m)-θ(m-1)∥小于某個給定的閾值時停止迭代。由于EM算法的收斂性是有理論保證的,因此上述迭代過程一定收斂。
本文采用同質(zhì)性的一般責(zé)任險的336條損失數(shù)據(jù),并使用Python進行風(fēng)險曲線的構(gòu)建,數(shù)據(jù)來源于Klugman、Panjer、Willmot(1998)。首先我們使用EM算法對經(jīng)驗數(shù)據(jù)進行混合指數(shù)的參數(shù)估計,結(jié)果如表1所示。
?表1 EM算法對混合指數(shù)模型的參數(shù)估計結(jié)果
我們采用DNML(Decomposed Normalized Maximum Likelihood)作為擬合優(yōu)度的檢驗標準,DNML 值越低,說明擬合效果越好。所以我們可以看到當(dāng)k的初值為2時,模型的擬合結(jié)果最好,其中最優(yōu)結(jié)果見表2,擬合曲線見圖2。
?表2 最優(yōu)DNML下的參數(shù)估計結(jié)果
?圖2 經(jīng)驗數(shù)據(jù)與混合指數(shù)的擬合曲線
在得到混合指數(shù)形式的損失分布函數(shù)F(x)后,進行風(fēng)險曲線G(x)的構(gòu)建,因為我們數(shù)據(jù)中最大損失為1972367,所以我們選取M 為2000000(假設(shè)最大可能損失等于保額),從而構(gòu)造出對應(yīng)的風(fēng)險曲線,如圖3所示。
?圖3 基于混合指數(shù)模型構(gòu)建的風(fēng)險曲線
從圖3 中,我們可以看出,絕大多數(shù)的索賠損失集中在最大損失的30%以內(nèi),其中一半以上的損失集中在最大損失的10%以內(nèi)。所以僅根據(jù)此例來說,對于該責(zé)任險的免賠額定價,當(dāng)免賠額為保額的10%,所收取的保費應(yīng)為無免賠額情況下的40%。
從文中圖2的經(jīng)驗數(shù)據(jù)和混合指數(shù)的擬合曲線來看,擬合效果很好,說明混合指數(shù)模型確實比較適合保險業(yè)的損失分布,可以在實務(wù)中加以應(yīng)用。而目前在美國普遍使用的是基于ISO's PSOLD方法構(gòu)建的風(fēng)險曲線,其采用的損失模型就是混合指數(shù)模型。這也說明基于混合指數(shù)模型的風(fēng)險曲線在實務(wù)中已經(jīng)具有了一定的實踐意義。
但仍需注意的是,就實務(wù)中風(fēng)險曲線的構(gòu)建而言,對于數(shù)據(jù)的要求是比較高的。首先是需要大量的行業(yè)損失數(shù)據(jù)(比如水險、家財險、企財險)。僅靠單一保險公司很難有足夠的數(shù)據(jù)量積累,所以最好是行業(yè)內(nèi)的保險公司可以聯(lián)合起來共同構(gòu)建相應(yīng)的風(fēng)險曲線,在大量數(shù)據(jù)的基礎(chǔ)上,才能使風(fēng)險曲線的精度更高,從而更準確地幫助相應(yīng)的定價工作。
其次是對同質(zhì)性數(shù)據(jù)的篩選和處理。同一行業(yè)內(nèi)部可能存在許多差異,比如對于電廠的企財險來說,火電廠和水電廠的風(fēng)險就不同質(zhì),所以需要對行業(yè)小類進行區(qū)分。同時,在同一行業(yè)小類內(nèi)部的很多保單也存在保額差異很大的情況,這時就要對風(fēng)險曲線進行保額分段的處理,不同的保額段構(gòu)建不同的風(fēng)險曲線,這樣可以更好地滿足同質(zhì)性要求。