施鴻鈺 楊 杉
(四川大學錦城學院計算機與軟件學院 四川 成都 611731)
隨著經(jīng)濟越來越發(fā)達,人民的生活水平也日益提升,但是工業(yè)和經(jīng)濟的發(fā)展,也帶來了許多以前從未出現(xiàn)的難題。工業(yè)的發(fā)展帶來的是生活水源的污染,經(jīng)濟發(fā)展帶來的是越來越多的娛樂消遣,越來越的食品也被注入添加劑。這些的改變,讓人們的身體健康水平也日益下降,心腦血管疾病年輕化[1],所以越來越多的人為了保障自己日后的生活,都會多多少少為自己購買一些保險服務(wù)。面對風險,沒買保險是一種遺憾,而保障額度不足更是一種悲??!因為錢花了,“事”沒辦到位。理賠金額成倍增長與幾個因素有關(guān):人們的保險意識增強,買保險的人和個人擁有的保單數(shù)量上升,理賠件數(shù)相應(yīng)增加;由于社會壓力、環(huán)境污染等因素導(dǎo)致人們面臨更高的風險,出險率上升;醫(yī)療水平進步導(dǎo)致醫(yī)療費用上漲,人們對保險保額的需求提高,賠付更多。隨著時間推移,保險的價值正逐漸凸顯出來。為了研究怎樣讓賠款金額的利益能達到最大化,本文通過SPSS軟件[2]對費用類型和保額分別與賠款金額的關(guān)系進行了分析研究,得出能使賠款金額利益最大化的建議與結(jié)論。
以四川人壽保險的理賠數(shù)據(jù)為研究對象,針對研究費用類型與賠款金額之間的關(guān)系,采用先分組再通過探索分析方法分析哪種費用類型對賠款金額的影響最大,哪種費用類型對賠款金額的影響最??;針對研究保額與賠款金額之間的關(guān)系,采用簡單和等級相關(guān)分析方法進行分析研究。
數(shù)據(jù)來源于四川省某高校在線學習平臺,一張四川人壽保險理賠數(shù)據(jù)表,覆蓋了某段時間內(nèi)客戶理賠數(shù)據(jù)。數(shù)據(jù)表中包含了機構(gòu)、險種、案件號、保單號、賠款金額、賠款時間、費用類型、費用金額、保額、保額、客戶號、性別、年齡、婚姻、過去三年平均年收入、職業(yè)。16個字段共10萬多條數(shù)據(jù),64M。
在理賠數(shù)據(jù)表中,有很多數(shù)據(jù)我們都是用不到的,因此我們對數(shù)據(jù)進行了預(yù)處理,把一些不需要的數(shù)據(jù)進行了刪除,把重復(fù)缺失的數(shù)據(jù)進行了剔除。我們主要需要的是保額、賠款金額、費用類型、繳費期限等字段的數(shù)據(jù)類型進行分析和研究。由于費用類型太多,不利于在SPSS軟件中實現(xiàn)和展現(xiàn),通過使用SPSS重新對費用類型,并對其進行分類,再進一步進行探索與分析。
針對分析費用類型與賠償金額的關(guān)系,研究哪一費用類型的賠償金額最高,哪一費用類型的賠償金額最低,由于數(shù)據(jù)表中費用類型的種類多達四五十種,非常不利于在SPSS軟件中呈現(xiàn)出來,所以根據(jù)費用類型的相似程度,將費用類型進行了重新分組,分別將鼻咽癌、腸癌、肺癌、肝癌、宮頸癌、乳腺癌、食道癌、惡心腫瘤、甲狀腺癌、肝硬化這些癌癥疾病分為第1組;將傳染病、肺氣腫、肺心、肺炎、風心、肝炎、冠心、結(jié)核、泌尿生殖、內(nèi)分泌病、腦血管病、消化疾病、心臟病、呼吸疾病這些暫時不造成生命危險的二級疾病分為第2組;將疾病、精神病、潰瘍病、神經(jīng)病、其他惡心、其他疾病、這些三級病分為第3組;將車禍、觸電、火災(zāi)、勞動安全、雷擊、溺水、他殺、其他、下落不明、意外、窒息、中毒、自殺、墜樓、其他意外這些意外事故分為第4組;然后再通過SPSS中探索分析的方法對四組費用類型與賠款金額的關(guān)系做分析與研究。其結(jié)果如下。
表1 費用類型與賠款金額的探索分析結(jié)果
分析圖表關(guān)鍵性的詞語(偏度、峰度),偏度(Skewness)展現(xiàn)了數(shù)據(jù)偏斜方向與程度的度量,當左右分布對稱時,偏度系數(shù)為0,也是所謂的正態(tài)分布,在現(xiàn)實的數(shù)據(jù)中一般不會出現(xiàn)正態(tài)分布;當偏度小于0時,圖像分布為負偏離,表示數(shù)據(jù)位于均值的右邊比左邊多,大部分數(shù)據(jù)偏大;當偏度大于0時,則相反;同時偏度的絕對值越大,數(shù)據(jù)分布偏移程度越嚴重。峰度表示概率密度發(fā)布曲線在平均值處峰值高低的特征數(shù),用來描述分布形態(tài)的陡緩程度,峰度為0時,表現(xiàn)為正態(tài)分布;當峰度小于0時,則峰度分布平緩;當峰度大于0時,則峰度發(fā)布陡峭[3]。四組費用類型的賠款金額都明顯大于0,既四組費用類型的賠款金額都明顯右偏,說明大部分的賠款金額都低于均值,而是某些重大疾病或是重大意外拉高了均值。
分析四組類型的均值,第一組費用類型為癌癥的均值為14078.054,第二組費用類型為暫時不危害生命的二級疾病的均值為2582.707,第三組費用類型為一般疾病的三級疾病的均值為2081.647,第四組費用類型為意外事故的均值為4195.987。顯而易見,第一組費用類型為癌癥的賠款金額均值,是其他三組費用類型的6倍甚至是7倍,其中第三組費用類型為一般疾病的三級疾病其賠款金額均值是最低的。
針對探索和分析保額與賠款金額的關(guān)系,使用簡單和等級相關(guān)分析中的簡單相關(guān)分析[4]進行對保額與賠款金額雙變量之間的關(guān)系。簡單相關(guān)分析是通過Pearson相關(guān)系數(shù)的值,來衡量保額與賠款金額的相關(guān)性是否大。
圖2 保額與賠款金額相關(guān)性分析結(jié)果
相關(guān)性分析是指對兩個或多個具備相關(guān)性特征元素進行分析,從而衡量兩個特征因素的相關(guān)密切程度。在統(tǒng)計學中,常用Pearson相關(guān)系數(shù)來進行相關(guān)性分析。Pearson相關(guān)系數(shù)可以用來量度兩個特征X和Y之間的相互關(guān)系(線性相關(guān)的強弱),是最簡單的一種相關(guān)系數(shù),通常用r和p表示,取值范圍為[-1,1]。Pearson相關(guān)系數(shù)(Pearson Correlation Coefficient)是用來衡量兩個數(shù)據(jù)集合是否在一條線上面,它用來衡量定距變量間的線性關(guān)系。通過SPSS得出結(jié)果,保額與賠款金額的相關(guān)系數(shù)為0.676。從Pearson相關(guān)性看,保額和賠償金額的顯著性(雙側(cè))為0,小于α值,意味著拒絕原假設(shè),保額與賠償金額具有正向顯著相關(guān),并且它們的相關(guān)系數(shù)為0.676。
從Pearson可得,保額與賠償金額有顯著的相關(guān)性,保額的金額越高,賠償金額就越高,保額的金額越低,賠款金額就越低。
通過SPSS軟件,使用探索分析來分析費用類型與賠款金額的關(guān)系,發(fā)現(xiàn)不同費用類型與賠款金額也有較大差別,其中癌癥的賠款金額最高,一般疾病的賠款金額是最少。說明癌癥是重大疾病理賠重災(zāi)區(qū),使用簡單相關(guān)分析來分析保額與賠款金額的關(guān)系,得出保額與賠償金額有顯著的相關(guān)性,保額金額越高,賠償金額越高,保額金額越低,賠款金額就越低。
對個人而言,在實際生活中,要根據(jù)自身及其家庭的實際情況具體分析[5]。比如自己比較年輕可以選擇意外險;如果年齡比較大,這時需要選擇重疾險或購買養(yǎng)老保險,并且領(lǐng)取養(yǎng)老保險金對提升老人幸福感有正效用,對中等收入老人有顯著正效用[7]。在購買保險時最好先購買家長的,再購買孩子的,不過實際生活中很多人先買孩子的,其實這種方法不可取,畢竟家長才是家庭收入的主要來源,家長得不到保障,家庭的收入也就不能得到保障。
通過對研究分析費用類型與賠款金額的關(guān)系,以及保額與費用類型的關(guān)系,根據(jù)結(jié)論可以得出癌癥是理賠金額的重災(zāi)區(qū),惡性腫瘤的理賠金額極高。如今由于社會壓力、環(huán)境污染等因素導(dǎo)致人們面臨更高的風險,出險率上升,各種惡性腫瘤“層出不窮”,其中隨著超聲檢查的廣泛應(yīng)用,甲狀腺結(jié)節(jié)在人群中的檢出率越來越高[6]。在保險理賠中甲狀腺癌是所有癌癥的高頻癌,在購買保險業(yè)務(wù)的時候,如果沒有甲狀腺結(jié)節(jié),如果重疾險保額還不足,那么趕緊把重疾險保額補足。