曾 娟,吳興華,張洪昌
(武漢理工大學(xué) 汽車工程學(xué)院,湖北 武漢 430070)
針對細(xì)分市場設(shè)計差異化費(fèi)率體系,實現(xiàn)保險業(yè)務(wù)的差異化、精細(xì)化管理是保險經(jīng)營的終極目標(biāo)。近年來,從短租型個人用車,到長租型營運(yùn)車輛,再到以家庭為單位的長租型非營運(yùn)汽車,汽車租賃業(yè)務(wù)的發(fā)展對保險定價提出新的要求。由于租賃汽車所有權(quán)與使用權(quán)的分離,以擬合風(fēng)險分布函數(shù)為核心的定價方式不再適用。針對租賃汽車多人、分時的運(yùn)營特點,保費(fèi)定價如何從后驗估費(fèi)機(jī)制轉(zhuǎn)化為使用過程中的風(fēng)險估費(fèi)機(jī)制,是目前需要研究的重要問題。
20世紀(jì)40年代以前,先驗保費(fèi)定價機(jī)制以擬合風(fēng)險分布函數(shù)為核心,定價因子包括人的靜態(tài)因素,如年齡、駕齡、職業(yè)等。20世紀(jì)50年代開始引入賠付記錄作為費(fèi)率調(diào)整因子,稱為后驗估費(fèi)機(jī)制。VICKREY[1]指出了這種機(jī)制的弊端,認(rèn)為其(無賠款優(yōu)待(NCD))既沒有反映事故的外部成本,也沒有提供駕駛員調(diào)整行程和駕駛習(xí)慣的激勵,而且強(qiáng)迫低里程的駕駛員向高里程的駕駛員補(bǔ)貼保費(fèi)?;诖?,VICKREY首次從理論上探討將行駛里程引入保險定價中;BUTLER等[2]探討了在保險定價中引入行駛里程的實際操作方式;LEMAIRE[3]證實了越是忽略重要的定價因子(如使用狀況),依據(jù)索賠記錄調(diào)整浮動保費(fèi)的風(fēng)險錯配機(jī)會成本就越高。20世紀(jì)末以使用(usage)為基礎(chǔ)的保險定價UBI開始進(jìn)入商業(yè)化運(yùn)營階段。第一代UBI產(chǎn)品即UBP,從加油表或里程計獲得實際里程的數(shù)值,并計入保費(fèi)。這種計費(fèi)方式誤差較大。目前比利時Corona Direct和荷蘭Polis Direct保險公司仍然使用這種方式[4]。第二代UBI產(chǎn)品又稱TBI,是通過車載信息系統(tǒng)獲取數(shù)值??紤]里程數(shù)計入費(fèi)率調(diào)整因子稱為PAYD[5],考慮駕駛習(xí)慣計入費(fèi)率調(diào)整因子稱為PHYD。由于信號采集技術(shù)和數(shù)據(jù)挖掘算法的局限性,第二代UBI產(chǎn)品都存在風(fēng)險因子過多、結(jié)果失真的問題。
近年來,隨著車險費(fèi)率市場化改革和車聯(lián)網(wǎng)、大數(shù)據(jù)等新技術(shù)的發(fā)展,加快實現(xiàn)車險費(fèi)率的差異化已成為車險市場發(fā)展的必然趨勢[6]。現(xiàn)有保險費(fèi)率設(shè)計方法主要有基于廣義線性模型的先驗保費(fèi)模式與基于用量的后驗保險模式。先驗保費(fèi)模式費(fèi)率的厘定是基于車和人的靜態(tài)特征,如車齡、車型、新車購置價格、駕駛員性別、年齡及駕齡等[7]。這些特征較易獲得[8],在一定程度上確實有顯著的解釋風(fēng)險的能力[9]。但是這種模式下的車險費(fèi)率差異化較低,難以實現(xiàn)車險費(fèi)率厘定的差異化和個性化,因此對駕駛行為的分析與風(fēng)險評估成為學(xué)者研究的重點。如AL-SULTAN等[10]利用貝葉斯網(wǎng)絡(luò)構(gòu)建了一種駕駛行為狀態(tài)分析模型,通過預(yù)測駕駛?cè)诵袨閯幼靼l(fā)生的概率來對駕駛安全等級進(jìn)行評估。該方法的缺陷在于每個因子均為二元賦值,而離散化數(shù)值很難擬合風(fēng)險的連續(xù)性變化,因此無法識別駕駛員真正的意圖;WAHLSTR?M等[11]提出了一種基于智能手機(jī)的駕駛行為分析方法,該方法利用智能手機(jī)的GNSS接收器、慣性測量單元獲取車輛位置、速度、橫擺角速度等信息,通過相關(guān)算法實現(xiàn)對駕駛員的分類,并減少測量誤差,進(jìn)而實現(xiàn)對駕駛行為的識別與風(fēng)險評估;彭江琴[12]提出了一種對疲勞駕駛、變速行為和轉(zhuǎn)彎行為等駕駛行為的識別算法,并在此基礎(chǔ)上,提出了一種改進(jìn)型熵權(quán)層次分析法計算駕駛行為相關(guān)指標(biāo)的權(quán)重值。該方法可以依據(jù)較為精細(xì)的指標(biāo)對駕駛行為做出綜合評價,但該評價結(jié)果不能直接用于車險費(fèi)率的厘定。在風(fēng)險評價方面,米紅甫等[13]等將模糊層次分析法適用于風(fēng)險評價,將風(fēng)險等級分為很安全、一般安全、較不安全等模糊指標(biāo),但這種方式對于以人為中心的精細(xì)化費(fèi)率厘定精度不足。
針對以上問題,筆者提出一種改進(jìn)的因子分析與K-means聚類耦合的風(fēng)險分類方法,并將風(fēng)險分類結(jié)果引入保費(fèi)定價模型。該模型的優(yōu)化基于3點:①采用因子分析法提取駕駛行為因子,解決聚類算法無法識別駕駛行為因子相關(guān)性的問題;②以方差貢獻(xiàn)率加權(quán)均值為權(quán)重,構(gòu)建駕駛員綜合風(fēng)險評價因子S;③設(shè)計基于K-means聚類算法的分時保費(fèi)風(fēng)險因子分級方法。
K-means聚類算法是一個迭代算法,其主要思想是根據(jù)屬于該簇每個點的位置計算該簇的中心位置,然后將這些點劃分到距離其最近的中心,重復(fù)直到足夠收斂。其基本過程為:①為每一個聚類確定一個初始聚類中心,即隨機(jī)選擇k個樣本μ1,μ2,…,μk作為初始聚類中心;②將樣本按照最小距離原則分配到最鄰近聚類,即使目標(biāo)函數(shù)(式(1))減小,其中樣本間距離采用歐式距離,如式(2)所示;③使用每個聚類中的樣本均值作為新的聚類中心,聚類中心更新公式如式(3)所示;④重復(fù)步驟②和步驟③,直到聚類準(zhǔn)則函數(shù)(式(4))達(dá)到最小值。⑤結(jié)束,得到k個聚類。
(1)
(2)
(3)
(4)
式中:xi為聚類樣本;μj為聚類中心;d為樣本的維度;d(xi,xj)為樣本間歐式距離;Cj為聚類簇;V為聚類準(zhǔn)則函數(shù)。
但該聚類過程的缺陷在于不考慮因子的多重共線性,僅依據(jù)樣本間距離進(jìn)行迭代,最終可能導(dǎo)致聚類結(jié)果失真。
數(shù)據(jù)來源于某大型租賃公司,采集樣本為19輛純電動通勤車,且車型和行車路線一致。行車路線為武漢城市主干道,交通路況復(fù)雜。單程路線長12.782 km,為期45天,原始數(shù)據(jù)達(dá)400多萬條。去除車輛怠速時的數(shù)據(jù),剩余數(shù)據(jù)為有效數(shù)據(jù)。采集指標(biāo)包括車速與行車時間。采集頻率為1 Hz。采用駕駛行為特征值評價駕駛行為安全程度,駕駛行為特征值構(gòu)成如表1所示,計算結(jié)果如表2所示。
為了消除特征值量綱的不同對分析結(jié)果的影響,并使得不同屬性的特征值之間有可比性,采用Z-score標(biāo)準(zhǔn)化方法對特征值數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。然后采用SPSS19.0對駕駛行為的特征值進(jìn)行測量。KMO測度值為0.739,Bartlett檢驗的相伴概率p<0.000 1,說明問題變量間有共享因子的可能性,需要進(jìn)行因子分析以去除因子相關(guān)性。
2.2.1 主成分的提取
采用SPSS19.0對駕駛行為的8個特征值實施主成分提取。結(jié)果表明駕駛行為的8項特征值可提取為3個因子,因子分析碎石圖如圖1所示。方差解釋表如表3所示,從提取平方和載入一欄可知,提取后的3個因子方差總解釋率達(dá)到94.532%(>85.000%),原有變量信息丟失較少,因子分析效果較理想。
所提取的3個因子的載荷矩陣如表4所示,可看出主因子1(M1)與加速度標(biāo)準(zhǔn)差(載荷0.971)、正加速度均值(載荷0.964)、負(fù)加速度均
表1 駕駛行為特征值構(gòu)成
表2 駕駛行為特征值計算結(jié)果
圖1 因子分析碎石圖
值(載荷-0.929)、負(fù)加速度標(biāo)準(zhǔn)差(載荷0.914)密切相關(guān);主因子2(M2)與速度均值(載荷0.828)、超速時間占比(載荷0.943)密切相關(guān);主因子3(M3)既與速度標(biāo)準(zhǔn)差有關(guān)聯(lián)(載荷0.408),又與正加速度有關(guān)聯(lián)(載荷0.593),且關(guān)聯(lián)度都不大。由于3個因子實際含義模糊,需要做因子旋轉(zhuǎn)。
表3 方差解釋表
表4 因子載荷矩陣表(旋轉(zhuǎn)前)
2.2.2 因子的解釋
筆者采取最大方差法對因子載荷矩陣進(jìn)行正交旋轉(zhuǎn),保證新因子的不相關(guān)性[14]。表3旋轉(zhuǎn)平方和載入一欄表明因子旋轉(zhuǎn)后,累計方差貢獻(xiàn)率沒有改變(94.532%),但重新分配了各因子解釋原有變量的方差,使得因子更易于解釋。旋轉(zhuǎn)后因子載荷矩陣表如表5所示,結(jié)果表明,旋轉(zhuǎn)后的因子N1主要與正加速度均值(載荷0.831)、正加速度標(biāo)準(zhǔn)差(載荷0.966)密切相關(guān),而急加速、加速度范圍變化對應(yīng)正加速度標(biāo)準(zhǔn)差、正加速度均值的變化,因此N1是加速行為的綜合表現(xiàn);因子N2主要與負(fù)加速度均值(載荷-0.780)、負(fù)加速度標(biāo)準(zhǔn)差(載荷0.816)密切相關(guān),而急減速、負(fù)加速度變化范圍對應(yīng)負(fù)加速度均值、負(fù)加速度標(biāo)準(zhǔn)差的變化,因此N2是減速行為的綜合表現(xiàn);因子N3主要與速度均值(載荷0.706)、速度標(biāo)準(zhǔn)差(載荷0.820)、超速時間占比(0.980)密切相關(guān),是駕駛員速度行為的綜合表現(xiàn)。
表5 因子載荷矩陣表(旋轉(zhuǎn)后)
2.2.3 駕駛行為綜合評價因子的構(gòu)建
過猛、頻繁踩踏板均容易出現(xiàn)違章或引發(fā)交通事故。因此,N1、N2、N3可作為駕駛行為安全性評價因子。由于方差貢獻(xiàn)率反映了因子的重要性,以方差貢獻(xiàn)率的加權(quán)均值為權(quán)重,設(shè)計駕駛行為綜合風(fēng)險評價因子S,如式(5)所示。S值越高,表明駕駛行為對應(yīng)的風(fēng)險成本越高。19位駕駛員駕駛行為綜合風(fēng)險評價值如表6所示。
S=0.38×|N1|+0.33×|N2|+0.29×|N3|
(5)
其中,N1、N2、N3的計算可在SPSS中進(jìn)行,先采用回歸法估計因子得分系數(shù),再通過計算因子得分系數(shù)與對應(yīng)駕駛行為特征值的乘積總和,即可得到N1、N2、N3的值。
表6 駕駛行為綜合風(fēng)險評價值
對表6中樣本S值進(jìn)行K-means聚類處理。分別取K=3,K=5,K=8,聚類結(jié)果分別如表7~表9所示??梢钥闯鲭S著分組數(shù)K的增加,風(fēng)險劃分越來越細(xì)致,同組樣本的風(fēng)險特征越接近;隨著S值的增大,對應(yīng)組別的綜合風(fēng)險等級上升。
表8 基于S的駕駛行為聚類(K=5)
表9 基于S的駕駛行為聚類(K=8)
從不同組別采樣,其違章及出險事故數(shù)據(jù)如表10所示。數(shù)據(jù)來源于某保險公司和交警部門。通過對比表9和表10可以看出:聚類結(jié)果顯示的駕駛員風(fēng)險狀況分布與其交通違規(guī)、交通事故頻數(shù)、重大交通事故發(fā)生次數(shù)反映出的風(fēng)險狀況分布基本吻合,說明該聚類方法對駕駛員風(fēng)險狀況的識別過程基本符合實際情況,是可行的。
表10 駕駛員2014—2016年違章及出險事故數(shù)據(jù)
綜上所述,聚類結(jié)果與駕駛員風(fēng)險特性基本吻合,K-means聚類結(jié)果可直接作為費(fèi)率因子分層設(shè)計的依據(jù)。分時保費(fèi)設(shè)計思路可以表述為:分時保費(fèi)=基礎(chǔ)保費(fèi)×行駛里程因子系數(shù)×駕駛行為因子系數(shù)[15];因子系數(shù)等級形式如0.9,1.0,1.1,1.2,以此區(qū)分個體風(fēng)險,實現(xiàn)個體保費(fèi)的上浮或下調(diào)。
該研究為駕駛行為因子系數(shù)設(shè)計提供思路:①以S值為依據(jù),聚類的分組數(shù)即為費(fèi)率等級數(shù)。②由于K-means聚類算法可以調(diào)整分類數(shù),保險公司可以依據(jù)細(xì)分市場需求調(diào)整費(fèi)率因子層級數(shù)。層級數(shù)受投保金額、風(fēng)險因素復(fù)雜度的影響。對應(yīng)關(guān)系如表11所示。
表11 投保金額、風(fēng)險因素與費(fèi)率分級層數(shù)的對應(yīng)關(guān)系
在電動客車細(xì)分市場中,由于保險標(biāo)的的投保金額大,車輛損失險投保金額一般為30萬元~100萬元,第三者責(zé)任險的投保金額一般為100萬元左右,因子層級數(shù)上升或下調(diào)一個等級會導(dǎo)致保費(fèi)變化1 000元甚至幾萬元不等。因此,設(shè)計更多的費(fèi)率層級數(shù)有利于差異化保費(fèi)擬定,聚類分組數(shù)K=8比K=5、K=3更符合保險公司對電動客車市場風(fēng)險精細(xì)化管理的實際需求?;诖耍O(shè)計駕駛行為因子系數(shù)調(diào)整體系:1.4,1.3,1.2,1.1,1.0,0.9,0.8,0.7。1.4對應(yīng)聚類結(jié)果為一級,0.7對應(yīng)聚類結(jié)果為八級,以此類推。
由于租賃汽車所有權(quán)與使用權(quán)分離,以擬合風(fēng)險分布函數(shù)為核心的定價方式不再適用。筆者針對租賃汽車多人、分時的運(yùn)營特點,利用車聯(lián)網(wǎng)所提供的海量駕駛數(shù)據(jù),通過對駕駛行為的風(fēng)險分級,實現(xiàn)費(fèi)率制定的精細(xì)化目標(biāo)。
首先采用因子分析法從8項駕駛行為特征值中提取駕駛行為因子,去除因子之間的多重共線性;然后以方差貢獻(xiàn)率的加權(quán)均值為權(quán)重,構(gòu)建駕駛員綜合風(fēng)險評價因子S;最后基于該綜合風(fēng)險評價因子,利用K-means聚類算法對駕駛員進(jìn)行聚類,實現(xiàn)對駕駛員風(fēng)險的自動分級,分級結(jié)果可作為費(fèi)率分級的直接依據(jù)。以某大型租賃公司所提供的19位駕駛員1個多月的駕駛數(shù)據(jù)作為研究樣本,將所計算的綜合風(fēng)險因子結(jié)果與交警和保險部門的違章和出險數(shù)據(jù)進(jìn)行比對,發(fā)現(xiàn)二者結(jié)論基本吻合。由于K-means聚類數(shù)據(jù)來源于車體定位系統(tǒng),因此該方法對于研究互聯(lián)網(wǎng)使用環(huán)境下的風(fēng)險估費(fèi)機(jī)制,推動以人為中心的保費(fèi)定價模式發(fā)展,實現(xiàn)保險業(yè)務(wù)的差異化、精細(xì)化管理,具有積極的理論參考價值。
筆者的創(chuàng)新之處在于將因子分析與K-means聚類耦合的方法首次用于保費(fèi)定價領(lǐng)域,在利用因子分析提取駕駛行為因子的基礎(chǔ)上,提出了駕駛員的綜合風(fēng)險評價因子;利用K-means聚類算法實現(xiàn)對駕駛員風(fēng)險的自動分級,保證了費(fèi)率制定依據(jù)的客觀性;同時K-means聚類具有收斂快的優(yōu)點,特別適用于對車聯(lián)網(wǎng)海量數(shù)據(jù)的處理。但不足之處在于:駕駛行為風(fēng)險因子較多,筆者只考慮了縱向因子,未考慮急轉(zhuǎn)彎等駕駛風(fēng)險因子,另外樣本數(shù)僅19個,與實際操作中大樣本數(shù)據(jù)量有差異。
參考文獻(xiàn):
[1] VICKREY W.Automobile accidents, tort law, externalities and insurance: an economist′s critique[J]. Law and Contemporary Problems,1968,33(3):464-487.
[2] BUTLER P, BUTLER T. Driver record: a political red herring that reveals the basic flaw in automobile insurance pricing[J]. Journal of Insurance Regulation,1989,8(2):200-203.
[3] LEMAIRE J. Bonus-malus systems in automobile insurance[M].[S.l.]: Kluwer Academic Publishers,1995:277-278.
[4] 郁佳敏.車聯(lián)網(wǎng)大數(shù)據(jù)時代汽車保險業(yè)的機(jī)遇和挑戰(zhàn)[J].南方金融,2013(12):89-95.
[5] LITMAN T. Distance-based vehicle insurance feasibility, benefits and costs: comprehensive technical report[R]. Chicago:Victoria Transport Policy Institute,2001.
[6] 朱爽.車聯(lián)網(wǎng)環(huán)境下基于UBI的車險費(fèi)率厘定模式與方法研究[D].北京:北京交通大學(xué),2015.
[7] 劉瑞剛.廣義線性模型在UBI車險費(fèi)率厘定中的應(yīng)用[D].天津:天津商業(yè)大學(xué),2017.
[8] 孟生旺.精算師考試用書:非壽險精算學(xué)[M].北京:中國財政經(jīng)濟(jì)出版社,2011:98-115.
[9] 楊建.市場化背景下車險費(fèi)率厘定方法探究[D].大連:東北財經(jīng)大學(xué),2012.
[10] AL-SULTAN S, AL-BAYATTI A H, ZEDAN H. Context-aware driver behavior detection system in intelligent transportation systems[J]. IEEE Transactions on Vehicular Technology,2013,62(9):4264-4275.
[11] WAHLSTR?M J, SKOG I, HANDEL P. Driving behavior analysis for smartphone-based insurance telematics[C]∥ Proceedings of the 2nd Workshop on Workshop on Physical Analytics.Florence:ACM,2015:19-24.
[12] 彭江琴.基于GID的車聯(lián)網(wǎng)保險UBI費(fèi)率與駕駛行為評分研究[D].南京:南京郵電大學(xué),2016.
[13] 米紅甫,王文和,肖國清,等.基于FAHP的高層建筑火災(zāi)風(fēng)險評價研究[J].武漢理工大學(xué)學(xué)報(信息與管理工程版),2017,39(2):148-152.
[14] 薛薇.SPSS統(tǒng)計分析方法及應(yīng)用[M].北京:電子工業(yè)出版社,2009:327-349.
[15] 孫茜.車險UBI定價模式研究[D].北京:中國人民大學(xué),2017.