◆李思佳
(一)問題背景。近年來,車險在我國保險行業(yè)中所占比重最大,投保率也在不斷提高。我國目前的車險定價主要與車自身的情況(車型、車的購置價、座位數(shù)、排量、購車年限等)有關(guān),因此車型相似,車險保費(fèi)也差不多。
我們預(yù)見未來車險的定價將主要取決于駕駛?cè)俗陨淼那闆r(駕駛行為、年齡、職業(yè)、家庭狀況等),因此車險保費(fèi)將不再單調(diào)。
我們可以運(yùn)用數(shù)字化技術(shù)建立客戶精準(zhǔn)畫像,來制定不同的營銷方案。
(二)問題提出。針對客戶信息建立能夠刻畫每一位客戶續(xù)保率的數(shù)學(xué)模型。
(一)模型假設(shè)。為了使得問題更易于理解,我們作出以下合理假設(shè):
? 每種品牌的車輛的出險率是穩(wěn)定不變的。
? 假設(shè)已投保立案后必有已決賠款。
? 假設(shè)附件數(shù)據(jù)為同一個保險公司。
?假設(shè)投保類型為“單商業(yè)”時,其交強(qiáng)險已在其他公司繳納。
(一)數(shù)據(jù)預(yù)處理。題目提供了1個附件,附件中的數(shù)據(jù)給出了客戶車險的相關(guān)信息,對于眾多的客戶信息數(shù)據(jù),我們使用EXCEL對數(shù)據(jù)做了以下預(yù)處理:
清理數(shù)據(jù),剔除數(shù)據(jù)壞點:
①客戶類型為個人的時候,被保險人性別卻是NA等類似其他錯誤;②三者未投保后面三者險保額卻有金額等類似其他錯誤;③前面保單性質(zhì)為轉(zhuǎn)保后面是否續(xù)保卻寫的是等類似其他錯誤;
利用以上數(shù)據(jù),對問題進(jìn)行求解分析。
(二)模型建立與求解
1.模型的選取。一般來說,實際問題中影響因變量的因素可能很多,從應(yīng)用的角度既希望將所有對因變量影響顯著的自變量都納入回歸模型,又希望最終的模型盡可能簡單,既不包含那些對因變量影響不顯著的自變量,這就是所謂“變量選擇”。逐步回歸是一種迭代式的變量選擇方法,通過逐步回歸來選擇變量,建立多元線性回歸模型。
續(xù)保概率逐步回歸程序的最終輸出圖形如下圖所示:
圖1 MATLAB逐步回歸程序運(yùn)行的最終輸出圖形
通過圖1右側(cè)的Export菜單可以傳送輸出數(shù)據(jù),得到的結(jié)果如下表所示:
表1 逐步回歸的最終結(jié)果(=47898)
最終模型為: