閆 春,董婷婷,邱藝偉,劉 倩
(山東科技大學(xué) 數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院,山東 青島 266590)
未決賠款準(zhǔn)備金評(píng)估模型的平滑化研究始于上世紀(jì)70年代,早期指的是進(jìn)展因子的平滑處理,后來(lái)由于隨機(jī)模型框架的建立,又產(chǎn)生了模型參數(shù)的平滑與非參數(shù)平滑方法的研究。90年代,廣義線(xiàn)性模型被引入到精算領(lǐng)域,在非壽險(xiǎn)費(fèi)率厘定與準(zhǔn)備金估計(jì)方面都有廣泛的應(yīng)用。隨著研究的不斷深入,廣義線(xiàn)性模型在其應(yīng)用中也得到不斷改進(jìn)。
在準(zhǔn)備金評(píng)估方法中的隨機(jī)方法中,廣義線(xiàn)性模型應(yīng)用廣泛,且相對(duì)能夠較好的適用于實(shí)際的非壽險(xiǎn)評(píng)估中。但廣義線(xiàn)性模型存在著一些不足,在相當(dāng)多的實(shí)際案例中,其參數(shù)模型并不能夠充分的描述索賠數(shù)據(jù)。因此,本文將非參數(shù)引入廣義線(xiàn)性模型,通過(guò)多種平滑方法,將事故年和進(jìn)展年抽象為位置數(shù)據(jù)融入到廣義線(xiàn)性可加模型中,是將非參數(shù)方法與準(zhǔn)備金評(píng)估方法的一次結(jié)合,來(lái)實(shí)現(xiàn)對(duì)GLM準(zhǔn)備金評(píng)估模型的非參數(shù)平滑改進(jìn)。
廣義線(xiàn)性模型(GAM)最早由Nelder和Wedderbum在1972年提出,是對(duì)線(xiàn)性回歸模型的推廣。GLM涵蓋了一大類(lèi)統(tǒng)計(jì)模型,不僅包括經(jīng)典的線(xiàn)性回歸模型和方差分析模型,還包括對(duì)數(shù)線(xiàn)性模型、泊松回歸模型、Logistic和Probit模型及多分類(lèi)反應(yīng)變量模型等。廣義線(xiàn)性模型可以有效處理各類(lèi)離散型的觀測(cè)數(shù)據(jù),在生物醫(yī)學(xué)、社會(huì)調(diào)查和工業(yè)產(chǎn)品質(zhì)量評(píng)估領(lǐng)域都有廣泛的應(yīng)用。
廣義線(xiàn)性模型有三個(gè)組成部分:隨機(jī)部分、系統(tǒng)部分和聯(lián)結(jié)函數(shù)。
隨機(jī)部分。屬于指數(shù)分布族的相互獨(dú)立的隨機(jī)變量yi,密度函數(shù)為:
其中θi和φ為參數(shù),b和c為函數(shù)。yi的期望為μi,方差為均值的函數(shù),即有θb′(θi)。其中b′(θ)和b′(θ)分別表示函數(shù)b的一階和二階導(dǎo)數(shù)。
系統(tǒng)部分。假設(shè)x1,x2,…,xp為對(duì)應(yīng)于y1,y2,…,yn的p維自變量的值,存在某線(xiàn)性預(yù)估量η,是參數(shù)β1,β2,…,βp的線(xiàn)性函數(shù),有:
聯(lián)結(jié)函數(shù)。聯(lián)結(jié)函數(shù)是指觀測(cè)值xi與指數(shù)散布族的期望μi之間的函數(shù)關(guān)系。隨機(jī)部分和系統(tǒng)部分通過(guò)ηi=g(μi)連接在一起,g(·)稱(chēng)為聯(lián)結(jié)函數(shù)。容易得到:
其中,β為未知實(shí)參數(shù)表示第i個(gè)觀測(cè)向量。
前面提到,廣義線(xiàn)性模型的隨機(jī)部分屬于指數(shù)型分布。常見(jiàn)的指數(shù)型分布有正態(tài)分布N(μ,σ2)、二項(xiàng)分布B(1,p)、泊松分布P(λ)、伽瑪分布 Γ(μ,γ)和逆高斯分布IG(μ,σ2)等。這些分布如表1所示。
表1 指數(shù)型分布的幾個(gè)例子
在準(zhǔn)備金評(píng)估的廣義線(xiàn)性模型中,觀測(cè)值通常是已知的賠案數(shù)據(jù),此時(shí)的賠案數(shù)據(jù)稱(chēng)為反應(yīng)變量。反應(yīng)變量不同,模型也不同,如對(duì)案均賠款、索賠次數(shù)分別建模的兩階段廣義線(xiàn)性模型和對(duì)增量已決賠款、增量已報(bào)案賠款分別建模的隨機(jī)性準(zhǔn)備金進(jìn)展模型。本文僅討論對(duì)已決賠款建立的廣義線(xiàn)性模型。
觀測(cè)值Xi,j的分布可以由數(shù)據(jù)樣本分析得出,也可以由精算人員假定。精算人員通常在不同分布假設(shè)下分別建立不同的模型,再其對(duì)樣本的擬合效果結(jié)合實(shí)際進(jìn)行選擇。
聯(lián)結(jié)函數(shù)一般采用對(duì)數(shù)聯(lián)結(jié),見(jiàn)England(2001)。此時(shí)未決賠款準(zhǔn)備金廣義線(xiàn)性模型為:
模型假設(shè)增量已決賠款Xi,j屬于指數(shù)分布族,mij為Xi,j的均值,方差函數(shù)為散度參數(shù)。p=0,1, 2, 3 時(shí)Xi,j分別對(duì)應(yīng)為正態(tài)分布、Poisson分布、Gamma分布和逆高斯分布。
在準(zhǔn)備金評(píng)估的廣義線(xiàn)性模型中,考慮不同的影響因素,線(xiàn)性估計(jì)量ηij也不同,主要有:
在模型求解時(shí),不妨建立約束條件α1=β1=γ2=0,以保證參數(shù)估計(jì)的唯一性。在余下的模型參數(shù)中需要估計(jì)的變量數(shù)為3t-2個(gè)。由統(tǒng)計(jì)軟件得到各參數(shù)的估計(jì)值計(jì)算得到m?ij,則可求得準(zhǔn)備金的估計(jì)值。隨機(jī)部分是根據(jù)線(xiàn)性估計(jì)量選定的設(shè)計(jì)矩陣。
在相當(dāng)多的實(shí)際案例中,參數(shù)模型并不能夠充分的描述索賠數(shù)據(jù),因此非參數(shù)模型就被應(yīng)用到了索賠數(shù)據(jù)的評(píng)估中。通常將這種在傳統(tǒng)廣義線(xiàn)性模型中引入非參數(shù)部分的模型叫做廣義可加模型(GAM)。
這種非參數(shù)模型與廣義線(xiàn)性模型有著密切的聯(lián)系,但GAM改變了傳統(tǒng)GLM的線(xiàn)性預(yù)估量。對(duì)于模型(5)和(7),即不考慮通脹因素,GAM的預(yù)估量可以寫(xiě)為:
其中sθi(i)是與事故年有關(guān)的連續(xù)變量,sθj(j)是與進(jìn)展年有關(guān)的連續(xù)變量,θ是由精算人員確定的平滑因子。
GAM的預(yù)估量可以通過(guò)局部加權(quán)回歸平滑(LOESS)、平滑樣條函數(shù)或者核光滑來(lái)創(chuàng)建。三次平滑樣條可以通過(guò)最小化懲罰殘差的平方和來(lái)得到:
在該模型中,平滑參數(shù)θ取值越大,模型的方差就越小,但偏差會(huì)增加。若θ接近于零,函數(shù)完全擬合每個(gè)點(diǎn),模型更像鏈梯估計(jì)。若θ接近無(wú)窮大,模型趨于線(xiàn)性,因此更像GLM。
sθ的LOESS估計(jì)能夠通過(guò)以下算法計(jì)算:
(1)定義N(x0)為區(qū)間(x0-k,x0+k)上數(shù)據(jù)的集合。
(3)對(duì)N(x0)中的每個(gè)點(diǎn)計(jì)算權(quán)重wi,有:
其中T為三次權(quán)函數(shù):
(4)用權(quán)重{w1,w2,…,wm}作Y對(duì)N(x0)中X的回歸。
當(dāng)誤差服從非正態(tài)分布并且來(lái)自于一個(gè)指數(shù)類(lèi),可以適用上述帶加權(quán)的公式。此外,GAM要求各列損失的和大于或等于零,如果不能滿(mǎn)足,可以添加常數(shù)項(xiàng)進(jìn)行適當(dāng)調(diào)整。
模型的預(yù)估量由一個(gè)參數(shù)組合和一個(gè)非參數(shù)的函數(shù)組成:
其中,p為預(yù)估量的個(gè)數(shù),r為預(yù)估量參數(shù)的個(gè)數(shù)。
在對(duì)有關(guān)位置的數(shù)據(jù)進(jìn)行分析時(shí),傳統(tǒng)的線(xiàn)性回歸模型是全局的空間回歸模型,通常假定模型參數(shù)與樣本數(shù)據(jù)的位置無(wú)關(guān),那么得到的回歸參數(shù)β?MLE既是該點(diǎn)的最優(yōu)估計(jì),也是整個(gè)研究區(qū)域內(nèi)所有點(diǎn)的最優(yōu)估計(jì)。然而在實(shí)際問(wèn)題中,回歸參數(shù)在不同位置上往往表現(xiàn)不同,回歸參數(shù)估計(jì)值就不能反映回歸參數(shù)的真實(shí)空間特征,也不能精確地探測(cè)研究對(duì)象在空間上的非平穩(wěn)性。
為了解決這一問(wèn)題,F(xiàn)oster&Gorr(1986)提出了空間變參數(shù)回歸模型,將數(shù)據(jù)的空間結(jié)構(gòu)嵌入到回歸模型中,使回歸參數(shù)變成有關(guān)觀測(cè)點(diǎn)地理位置的函數(shù)。Fortheringham等(1997)在此基礎(chǔ)上利用局部光滑的思想,提出了地理加權(quán)回歸模型(GWR)。對(duì)于全局的普通線(xiàn)性回歸模型:
GWR擴(kuò)展了傳統(tǒng)的回歸框架,引入了能夠估計(jì)每個(gè)樣本數(shù)據(jù)空間位置的參數(shù)值。有:
其中(ui,vi)表示位置i的坐標(biāo)。
這樣可以定義位置加權(quán)廣義線(xiàn)性回歸模型。設(shè)y1,y2,…,yn為因變量的n個(gè)獨(dú)立觀測(cè),概率密度函數(shù)為:
這樣,β(kui,vi)就是連續(xù)函數(shù)β(ku,v)在點(diǎn)i的值,從而參數(shù)值β(ku,v)表現(xiàn)為一個(gè)連續(xù)的空間平面。
由GWR理論的思想,結(jié)合應(yīng)用非參數(shù)廣義線(xiàn)性模型評(píng)估準(zhǔn)備金的方法,對(duì)于模型(5)和模型(6)都可以由式(17)來(lái)假定評(píng)估模型的線(xiàn)性預(yù)估量。
對(duì)于最簡(jiǎn)單的模型(5),引入位置參數(shù)(u,v),有:
對(duì)模型(6),有:
其中,wi為對(duì)角線(xiàn)參數(shù)。
由于位置加權(quán)廣義線(xiàn)性回歸模型中的回歸參數(shù)在每個(gè)數(shù)據(jù)采樣點(diǎn)上都不同,因此其未知參數(shù)為n×(p+1)個(gè),遠(yuǎn)遠(yuǎn)大于觀測(cè)個(gè)數(shù)n,這樣就不能直接利用參數(shù)回歸估計(jì)其中的未知參數(shù)。Brunsdon等(1996)采用了一類(lèi)非參數(shù)光滑方法為該模型的擬合提供了一個(gè)可行的思路,即在局部多項(xiàng)式光滑的思想上提出了偏差和方差折衷的解題思路。假設(shè)回歸參數(shù)為一連續(xù)平面,以采樣點(diǎn)i和其鄰域采樣點(diǎn)上的觀測(cè)值構(gòu)成局域子樣,建立全局的線(xiàn)性回歸模型,然后采用最小二乘方法得到回歸參數(shù)估計(jì)。對(duì)于其它采樣點(diǎn),采用另一個(gè)相應(yīng)的局域子樣來(lái)估計(jì),以此類(lèi)推。
為了充分利用己有觀測(cè)值并減少子樣規(guī)模擴(kuò)大引起的偏差增加,后來(lái)Brunsdon又對(duì)這種方法進(jìn)行了修正。在估算采樣點(diǎn)i的回歸參數(shù)時(shí),距離點(diǎn)i越近的觀測(cè)值重要性越大,越遠(yuǎn)的觀測(cè)值重要性越小,根據(jù)加權(quán)最小二乘方法(WLS),得到i點(diǎn)的回歸參數(shù)βi1,βi2,…,βip。根據(jù)上述思想,則第i點(diǎn)的回歸參數(shù)的估計(jì)方程為:
其中Wij(ui,vi)為位置 (ui,vi)的權(quán)重。解上述方程,矩陣形式表示的解為:
按上述方法逐點(diǎn)進(jìn)行回歸計(jì)算,得到所有點(diǎn)的回歸參數(shù)的估計(jì)值,不同采樣點(diǎn)上的估計(jì)值反映了對(duì)應(yīng)的變量間的關(guān)系在研究區(qū)域內(nèi)的變化情況。
本文用來(lái)實(shí)證分析的賠款額增量數(shù)據(jù)見(jiàn)表2,最早出現(xiàn)于Taylor和Ashe(1983)中。
采用表2中算例,使用R軟件中Chain Ladder包中的glmReserve()函數(shù),對(duì)模型(5)可以得到本文數(shù)據(jù)樣本下GLM的相關(guān)估計(jì)結(jié)果,見(jiàn)表3。此時(shí)假設(shè)反應(yīng)變量為過(guò)度分散泊松分布。表4為各參數(shù)估計(jì)表。
表2 賠款額增量流量三角形
表3 過(guò)度分散泊松分布GLM的計(jì)算結(jié)果
表4 參數(shù)估計(jì)表
表4顯示,從第6個(gè)進(jìn)展年開(kāi)始,有Pr(>|t|)>0.1。分別考慮從第6個(gè)進(jìn)展年參數(shù)開(kāi)始平滑與僅平滑最后三個(gè)進(jìn)展年,取本年及其前1、2個(gè)進(jìn)展年參數(shù)的權(quán)重分別為、和,遞歸計(jì)算,得到的IBNR評(píng)估對(duì)比結(jié)果如表5
所示。
表5 IBNR評(píng)估結(jié)果對(duì)比表
可見(jiàn),平滑3個(gè)進(jìn)展年參數(shù)的IBNR評(píng)估結(jié)果每一年都比傳統(tǒng)的廣義線(xiàn)性模型評(píng)估結(jié)果多,總準(zhǔn)備金比其多5.25%。而平滑6個(gè)進(jìn)展年參數(shù)的GLM評(píng)估結(jié)果要比傳統(tǒng)模型多14.3%,這都在可以接受的誤差范圍之內(nèi)。且后者每一事故年的IBNR評(píng)估結(jié)果都比前者多。因此要靈活選取需要平滑的參數(shù)。
分別把(1,8)、(5,4)、(7,2)位置的已決賠款擴(kuò)大10倍,以此來(lái)分析有異常值存在的情況,評(píng)估結(jié)果見(jiàn)表6。
表6 準(zhǔn)備金評(píng)估結(jié)果對(duì)比表
通過(guò)分析引入異常點(diǎn)與引入前的準(zhǔn)備金評(píng)估結(jié)果殘差,可知該方法對(duì)實(shí)現(xiàn)尾部數(shù)據(jù)的平滑有一定的效果。
引入位置參數(shù)(u,v),做位置加權(quán)的GAM平滑,事故年和進(jìn)展年分別產(chǎn)生的影響如圖1所示。
圖1 事故年和進(jìn)展年因素?cái)M合情況
參數(shù)u的p值為0.11,v的p值為2.45e-15,可見(jiàn)進(jìn)展年的影響已經(jīng)非常顯著。其中,位置加權(quán)的GAM增量賠款下三角估計(jì)值見(jiàn)表7。
可以得到,總準(zhǔn)備金估計(jì)值為18417168。對(duì)100個(gè)增量賠款數(shù)據(jù)繪制散點(diǎn)圖可以清晰地看到擬合以及預(yù)測(cè)情況。圖2中的誤差范圍顯示,模型能較好地平滑評(píng)估結(jié)果。
表7 增量賠款額下三角估計(jì)值
圖2 事故年和進(jìn)展年因素總擬合情況
在準(zhǔn)備金評(píng)估方法中的隨機(jī)方法中,廣義線(xiàn)性模型應(yīng)用廣泛,且相對(duì)能夠較好地適用于實(shí)際的非壽險(xiǎn)評(píng)估中。但廣義線(xiàn)性模型存在著一些不足,在相當(dāng)多的實(shí)際案例中,其參數(shù)模型并不能夠充分的描述索賠數(shù)據(jù)。因此,本文將廣義線(xiàn)性模型和地理回歸加權(quán)模型結(jié)合,在廣義線(xiàn)性模型引入非參數(shù),通過(guò)多種平滑方法,將事故年和進(jìn)展年抽象為位置數(shù)據(jù)融入到廣義線(xiàn)性可加模型中,來(lái)實(shí)現(xiàn)對(duì)GLM準(zhǔn)備金評(píng)估模型的非參數(shù)平滑改進(jìn),并利用R軟件對(duì)其平滑性作出了實(shí)證。通過(guò)實(shí)證結(jié)果可以看出,本文引入地理回歸加權(quán)的非參數(shù)平滑改進(jìn)廣義線(xiàn)性模型能夠較好地平滑評(píng)估結(jié)果,且對(duì)實(shí)現(xiàn)尾部數(shù)據(jù)的平滑也有一定的效果。
參考文獻(xiàn):
[1]Foster A S,Gorr W L.An Adaptive Filter for Estimating Spatially Varying Parameters:Application to Modeling Police Hours Spent In Response to Calls for Service[J].Management Science,1986,32(7).
[2]Fotheringham A S.Trends in Quantitative Methods I:Stressing the Lo?cal[J].Progress in Human Geographically,1997,21(1).
[3]Brunsdon C,Fotheringham A S,Charlton M.Geographically Weight?ed Regression:A Method for Exploring Spatial Nonstationarity[J].Geo?graphical Analysis,1996,28(4).
[4]Bjorkwall S,Hossjer O,Ohlsson E.Non-parametric and Parametric Bootstrap Techniques for Age-to-Age Development Factor Methods in Stochastic Claims Reserving[J].Scandinavian Actuarial Journal,2009,(4).
[5]Bjorkwall S,Hossjer O,Verrall R J.A Generalized Linear Model With Smoothing Effects for Claims[J].Insurance:Mathematics and Economics,2011,49(1).
[6]彭景云.評(píng)估IBNR準(zhǔn)備金的隨機(jī)方法[D].上海:華東師范大學(xué)碩士學(xué)位論文,2007.
[7]韋冬藝.基于平滑效應(yīng)的未決賠款準(zhǔn)備金廣義線(xiàn)性模型[D].天津:天津財(cái)經(jīng)大學(xué)碩士學(xué)位論文,2012.
[8]宋昕.個(gè)體數(shù)據(jù)模型準(zhǔn)備金評(píng)估:帶有插補(bǔ)值的多元核密度估計(jì)方法[D].上海:華東師范大學(xué)碩士學(xué)位論文,2013.
[9]段白鴿,張連增.索賠準(zhǔn)備金評(píng)估的貝葉斯非線(xiàn)性分層模型[J].山西財(cái)經(jīng)大學(xué)學(xué)報(bào),2013,(10).
[10]閆春,張良玉.非壽險(xiǎn)未決賠款準(zhǔn)備金評(píng)估的廣義線(xiàn)性模型平滑性改進(jìn)[J].系統(tǒng)工程,2014,(1).