楊鴻志 楊 杉(四川大學(xué)錦城學(xué)院計(jì)算機(jī)與軟件學(xué)院)
保險(xiǎn),是指投保人根據(jù)合同約定,向保險(xiǎn)人支付保險(xiǎn)費(fèi),保險(xiǎn)人對(duì)于合同約定可能發(fā)生的事故因其發(fā)生所造成的財(cái)產(chǎn)損失承擔(dān)賠償保險(xiǎn)金責(zé)任,或者被保險(xiǎn)人死亡、傷殘、疾病或者達(dá)到合同約定的年齡、期限等條件時(shí)承擔(dān)給付保險(xiǎn)金責(zé)任的商業(yè)保險(xiǎn)行為。
從經(jīng)濟(jì)角度看,保險(xiǎn)是分?jǐn)傄馔馐鹿蕮p失的一種財(cái)務(wù)安排;從法律角度看,保險(xiǎn)是一種合同行為,是一方同意補(bǔ)償另一方損失的一種合同安排;從社會(huì)角度看,保險(xiǎn)是社會(huì)經(jīng)濟(jì)保障制度的重要組成部分,是社會(huì)生產(chǎn)和社會(huì)生活“精巧的穩(wěn)定器”;從風(fēng)險(xiǎn)管理角度看,保險(xiǎn)是風(fēng)險(xiǎn)管理的一種方法。
為了盡可能規(guī)避保險(xiǎn)風(fēng)險(xiǎn),獲得更大的利益,并且在此過(guò)程中體會(huì)理財(cái)?shù)碾y度,為更多人的保險(xiǎn)選擇以及保費(fèi)范圍提出中肯的建議,我尋找到三份涉及新投保、續(xù)保、理賠的數(shù)據(jù)報(bào)告,并提出相應(yīng)問(wèn)題進(jìn)行探究。筆者帶著“過(guò)去三年平均年收入與總保費(fèi)之間是否相關(guān)”等3 個(gè)問(wèn)題,通過(guò)對(duì)新投保(續(xù)保信息內(nèi)容與新投保內(nèi)容較為一致)90 萬(wàn)條數(shù)據(jù)(包含投保機(jī)構(gòu),險(xiǎn)種,投保時(shí)間,繳費(fèi)方式,繳費(fèi)期限,投保份數(shù),總保費(fèi),保額,投??蛻舻目蛻籼?hào),性別,年齡,婚姻狀況,過(guò)去三年平均年收入,教育程度,職業(yè),家庭人口)的excel 數(shù)據(jù)表,提煉出關(guān)于投保機(jī)構(gòu),險(xiǎn)種,總保費(fèi),保額,客戶個(gè)人信息(性別,年齡,婚姻狀況,職業(yè),過(guò)去三年平均收入)這幾個(gè)重點(diǎn),對(duì)理賠21 萬(wàn)條數(shù)據(jù)(包含投保機(jī)構(gòu),險(xiǎn)種,案件號(hào),保單號(hào),賠款金額,賠款時(shí)間,費(fèi)用類型,總保費(fèi),保額,投保客戶個(gè)人信息),進(jìn)行SPSS 制圖和數(shù)據(jù)分析,探究以平均年收入與總保費(fèi)之間簡(jiǎn)單相關(guān)性為主的數(shù)據(jù)之間的關(guān)系,進(jìn)行數(shù)據(jù)分析并提出結(jié)論和建議,做此分析報(bào)告。
將三個(gè)excel 表進(jìn)行基礎(chǔ)整理,去掉對(duì)本分析無(wú)用的行列,從而減少數(shù)據(jù)數(shù)目,然后使用SPSS 打開,使用SPSS 的線性回歸分析、相關(guān)性分析、區(qū)間估計(jì)、分析描述統(tǒng)計(jì)中的探索功能等分析方法逐步分析,在探究投保數(shù)據(jù)時(shí)總保費(fèi)與保額年齡、過(guò)去三年平均收入的線性回歸數(shù)據(jù)分析,在續(xù)保的表格里探究不同性別的區(qū)間關(guān)系,在保額的數(shù)據(jù)表里面探究相關(guān)數(shù)據(jù),如不同性別與總保費(fèi)、保額之間的關(guān)系,在理賠的保險(xiǎn)里對(duì)總保額、保費(fèi)和賠款金額進(jìn)行SPSS 分析,分析其兩兩變量之間的影響,得出相對(duì)應(yīng)的計(jì)算公式,理清數(shù)據(jù)之間的影響因素,得出最終結(jié)論。
數(shù)據(jù)來(lái)源于某保險(xiǎn)公司新投保數(shù)據(jù)表(90 萬(wàn)條),續(xù)保數(shù)據(jù)表(21 萬(wàn)條),理賠數(shù)據(jù)表(21 萬(wàn)條)。
我們對(duì)excel 數(shù)據(jù)工作表做了兩方面的清洗工作:第一是對(duì)與研究問(wèn)題無(wú)關(guān)的行列進(jìn)行刪除和簡(jiǎn)單的整理排序,將無(wú)用的列或者是信息不完整的列或行進(jìn)行刪除,另外對(duì)部分不合理的數(shù)據(jù)進(jìn)行篩查,看其數(shù)值是否異常。第二是注釋性別F 指女性,M 指男性,婚姻狀況S 指未婚,M 指已婚,D 指離異,X 指未知。并且將客戶號(hào)一列的科學(xué)計(jì)數(shù)法變?yōu)槌R?guī)計(jì)數(shù)法。再用SPSS 軟件將其打開,并對(duì)數(shù)據(jù)進(jìn)行區(qū)間估計(jì)以及雙變量數(shù)據(jù)分析。
總保費(fèi)與保額、年齡、過(guò)去三年平均年收入的線性回歸數(shù)據(jù)分析。
圖1 總保費(fèi)與保額、年齡、過(guò)去三年平均年收入的線性回歸數(shù)據(jù)分析
如圖1 所示,先對(duì)總保費(fèi)、保額、年齡與過(guò)去三年平均收入分別做一個(gè)簡(jiǎn)單相關(guān)性分析,因顯著性大于0.01 則為相關(guān),由此我們可以分析得出結(jié)論,即根據(jù)斯皮爾遜相關(guān)性來(lái)分析,保額與年齡還有過(guò)去三年的平均收入都呈顯著相關(guān),這也就說(shuō)明在我們投保新的總保額時(shí),我們往往會(huì)考慮自身的收入和年齡以及保額的影響,從而根據(jù)我們自身的情況來(lái)進(jìn)行總保額的選擇。同時(shí)從保額的斯皮爾遜分析結(jié)果來(lái)看,保額和總保費(fèi)與過(guò)去三年平均收入均有顯著性相關(guān),由此結(jié)果我們可以知道,人們隨著年齡的增加可能個(gè)人的收入也在增加,從而加大了對(duì)保額的投保。從年齡的斯皮爾遜結(jié)果來(lái)看我們不難發(fā)現(xiàn),年齡和總保費(fèi)有著顯著相關(guān)結(jié)果。由此可見(jiàn),當(dāng)我們隨著年齡的增大時(shí),我們想要買入的保險(xiǎn)份額可能也隨之增加。當(dāng)我們看到過(guò)去三年平均收入的斯皮爾遜相關(guān)系數(shù)時(shí),我們不難發(fā)現(xiàn),過(guò)去三年平均收入和總保費(fèi)與保額均呈現(xiàn)顯著性相關(guān),由此結(jié)果我們可以看出,當(dāng)人們的收入提高時(shí),人們自然而然就會(huì)對(duì)所購(gòu)買保險(xiǎn)的費(fèi)用進(jìn)行加大,從而保費(fèi)的額度與之相應(yīng)增大。
圖2 不同性別之間續(xù)保額區(qū)間估計(jì)的數(shù)據(jù)分析
先點(diǎn)擊分析——描述統(tǒng)計(jì)——探索,再根據(jù)我們的問(wèn)題,將保額作為因變量,性別作為因子,接著點(diǎn)擊右上角的統(tǒng)計(jì)將置信區(qū)間改為95%,最后點(diǎn)擊繼續(xù),下方的輸出樣式選擇統(tǒng)計(jì)表。
對(duì)不同性別之間的保額做區(qū)間分析之后,由圖2 知道保額與續(xù)保額呈現(xiàn)逐相關(guān)性的。由圖2 可知:男女性的數(shù)據(jù)都為真實(shí)有效的,并且缺失值為0。又可知,男性女性的峰度都大于0,說(shuō)明不同性別與保額之間都成正態(tài)分布,而男性女性的偏度都大于0,則說(shuō)明其分布較正態(tài)、分布曲線更向右偏,稱為正偏或右偏,說(shuō)明存在偏大的極端值,并且男性的極大值大于女性的極大值。而在對(duì)于平均值95%置信區(qū)間的對(duì)比中我們看出,女性的續(xù)保額區(qū)間要比男性的高。由圖一可知這大概率是因?yàn)橐环矫嬗捎谀挲g的增加我們的過(guò)去三年平均收入也隨之增加,所以我們的續(xù)保額也隨之增加,由圖二又可知,女性在選擇續(xù)保保險(xiǎn)的類別范圍是比男性小的,在一定程度上導(dǎo)致了男性的選擇種類多,因?yàn)槔m(xù)保的金額不同,但并不是每個(gè)都會(huì)大筆投入。而女性選擇更加單一化,投入的資金更傾向于之前所買的,所以也隨之而增加了其續(xù)保額的投入,所以在對(duì)于平均值95%置信區(qū)間的對(duì)比中我們看出,女性的續(xù)保額區(qū)間要比男性的高。
不同性別理賠總保費(fèi)的區(qū)間估計(jì)。
圖3 不同性別總保費(fèi)的區(qū)間估計(jì)
步驟:先點(diǎn)擊分析——描述統(tǒng)計(jì)——探索,再根據(jù)我們的問(wèn)題,將總保費(fèi)作為因變量,性別作為因子,接著點(diǎn)擊右上角的統(tǒng)計(jì)將置信區(qū)間改為95%,最后點(diǎn)擊繼續(xù),下方的輸出樣式選擇統(tǒng)計(jì)表。
如圖3 所示,對(duì)不同性別保費(fèi)做區(qū)間估計(jì)后,得出結(jié)論:根據(jù)男性與女性的平均值數(shù)據(jù),男性的總保費(fèi)是要高于女性的,因?yàn)槟行栽谥懈邫n之間的保額是遠(yuǎn)大于女性的,又因?yàn)楸YM(fèi)和理賠額之間呈顯著相關(guān),且男性女性的峰度都大于0,說(shuō)明不同性別與理賠總保費(fèi)之間成正態(tài)分布,這也就可知,男性的保險(xiǎn)種類買的比較多,所以理賠總額也會(huì)比較高。而男性女性的偏度都大于0,則說(shuō)明其分布較正態(tài)、分布曲線更向右偏,稱為正偏或右偏,說(shuō)明存在偏大的極端值。而在對(duì)平均值95%置信區(qū)間的對(duì)比中我們看出,女性的總保費(fèi)區(qū)間要比男性的低。
而根據(jù)箱型圖我們可以得知,男性和女性總保費(fèi)的分布也不一樣,男性極端值大于女性的,但是女性有兩個(gè)極端值情況,在二十萬(wàn)到六十萬(wàn)的區(qū)間,男性的人數(shù)明顯多于女性,也因此說(shuō)明了男性的大金額的人數(shù)要比女性的多一點(diǎn)。而在二十萬(wàn)這個(gè)區(qū)間上下,女性的人數(shù)是明顯多于男性的。在二十萬(wàn)以下的情況里可以看到女性的人數(shù)是明顯比男性更加偏向底部,而男性的分布則更加均勻。
從三張不同的表格分析數(shù)據(jù)來(lái)看,保險(xiǎn)的保額、保費(fèi)、退保額與三年的平均收入成正比關(guān)系。不僅如此,對(duì)于推銷人員來(lái)說(shuō),從保險(xiǎn)數(shù)據(jù)的表格來(lái)看,男性和女性總保費(fèi)的大致分布有一定區(qū)別,男性更偏向于中高檔的保險(xiǎn)種類,但是其續(xù)保額可能不如女性的多一點(diǎn),女性的保額區(qū)間較高于男性,但是男性的賠大金額的人數(shù)要比女性的多一點(diǎn)。我們可以選擇將大額理賠推銷給男性顧客,在續(xù)保時(shí),我們可以嘗試將不同的保險(xiǎn)類型推銷給男性群體,將保額區(qū)間高一點(diǎn)的推銷給女性客戶,并且在續(xù)保時(shí)推銷同種或同類型的保險(xiǎn)種類給女性群體。對(duì)消費(fèi)者來(lái)說(shuō),從三張保險(xiǎn)的數(shù)據(jù)分析來(lái)看,在一定的年齡范圍內(nèi),我們對(duì)于保險(xiǎn)的額度會(huì)往較高的方向去選擇,而賠款金額也會(huì)相應(yīng)較高,自然而然的我們投保的金額也會(huì)增加。所以,我們不妨在選擇保險(xiǎn)時(shí)可以考慮保額時(shí)間較長(zhǎng)的險(xiǎn)種,這樣對(duì)我們后續(xù)的投入和保額的要求以及保額的賠款金額要求都會(huì)得到相應(yīng)滿足。