岳紫蕊
摘 要 為了弄清醫(yī)療費用的影響因素有哪些,本文以現(xiàn)存的醫(yī)療保險公司數(shù)據(jù)資源為依托,進行數(shù)據(jù)整合并加以利用,從而更加清楚地了解醫(yī)療成本的影響因素,為醫(yī)療保險公司如何構(gòu)建其醫(yī)療保險產(chǎn)品作出更有價值的判斷,分析醫(yī)療保險公司是選擇向所有申請人提供保險,還是成為一家只向少數(shù)人提供保險的精品保險公司。本文應(yīng)用數(shù)據(jù)分析的方法從大量保險行業(yè)數(shù)據(jù)中較為科學(xué)地取得有價值的信息,使用SPSS(Statistical Product and Service Solutions,即“統(tǒng)計產(chǎn)品與服務(wù)解決方案”軟件)對一家醫(yī)療保險公司進行數(shù)據(jù)分析,找出醫(yī)療成本影響因素。
關(guān)鍵詞 醫(yī)療費用 影響因素 描述統(tǒng)計分析 假設(shè)檢驗分析
一、問題提出
隨著我國整體經(jīng)濟的飛速發(fā)展,人們的生活質(zhì)量得到了很大程度的改善,人們的目標從原本的解決溫飽轉(zhuǎn)變?yōu)楝F(xiàn)在的追求更加綠色、健康、有保障的高質(zhì)量生活,除了經(jīng)濟條件的改善更多的是源于人們觀念上的轉(zhuǎn)變。在著名的馬斯洛需求層次理論中,我國已經(jīng)超越了追求生理需求的階段,大部分國民開始追求安全層次需要,即人身安全、健康方面。當(dāng)人們醫(yī)療費用過于高昂時,人們往往會尋求醫(yī)療保險公司來為自己承擔(dān)風(fēng)險,所以很多人都會選擇購買保險。而醫(yī)療保險公司要怎樣構(gòu)建自己的醫(yī)療產(chǎn)品,是向所有申請人提供保險還是成為一家只向少數(shù)人提供精品保險的保險公司?這個問題值得我們思考。
在這個時候,對保險公司來說,哪些因素會影響醫(yī)療費用賬單就顯得至關(guān)重要,本文就依托保險公司的數(shù)據(jù),進行影響醫(yī)療費用賬單的因素分析。
二、數(shù)據(jù)的收集
本文想要分析醫(yī)療費用的影響因素,從而幫助醫(yī)療保險公司構(gòu)建其產(chǎn)品。因為個人醫(yī)療費用賬單和相關(guān)信息為個人隱私,國家相關(guān)的統(tǒng)計網(wǎng)站無法獲得,所以本文從美國某醫(yī)療保險公司獲取數(shù)據(jù),原始數(shù)據(jù)從GitHub上獲得。
三、數(shù)據(jù)的預(yù)處理
(一)數(shù)據(jù)審核
拿到數(shù)據(jù)之后,對數(shù)據(jù)進行了審核,檢查數(shù)據(jù)中是否有錯誤。
(二)數(shù)據(jù)篩選
在檢查了數(shù)據(jù)之后,對數(shù)據(jù)進行了挑選,挑選了幾個可能會影響醫(yī)療費用的因素。
(三)數(shù)據(jù)整理與排序
挑選完變量之后,將相關(guān)數(shù)據(jù)導(dǎo)入SPSS并排序,因為要對數(shù)據(jù)進行處理,所以要在SPSS軟件中對變量進行重新命名便于更好地分析,命名結(jié)果如下:1.年齡:主要受益人的年齡;2.性別:女性1,男性0;3.標準體重:體重指數(shù),理想的體重指數(shù)是18.5~25;4.兒童:健康保險覆蓋的兒童數(shù)量;5.糖尿?。喝绻翘悄虿』颊邉t為1,否則為0;6.地區(qū):美國境內(nèi)居民的居住地,東北(1)、西北(2)、東南(3)、西南(4);7.費用:如果健康保險收取的個人醫(yī)療費用很高則為1,否則為0。
四、數(shù)據(jù)分析
(一)頻數(shù)分析
通過對頻數(shù)的分析可以了解變量的取值情況。此次主要利用數(shù)據(jù)表分析性別、地區(qū)、糖尿病、健康保險覆蓋的兒童數(shù)量、費用這5個變量的分布特點。
1.性別。此次調(diào)查數(shù)據(jù)顯示男女的比例差距不大,男性為49.5%,女性為50.5%,女性略多于男性。
2.地區(qū)。此次調(diào)查數(shù)據(jù)顯示,分為來自東北、西北、東南、西南4個地區(qū),地區(qū)間的差距也不明顯,東南地區(qū)略多于其他3個地區(qū)。
3.糖尿病。由所取數(shù)據(jù)得知,未患糖尿病占79.5%,患糖尿病占20.5%,未患糖尿病的比例遠高于患糖尿病。
4.兒童數(shù)量。由所取數(shù)據(jù)得知,健康保險覆蓋的兒童數(shù)量為0的最多,健康保險覆蓋的兒童數(shù)量為5的最少。
5.醫(yī)療費用。由所取數(shù)據(jù)得知,醫(yī)療費用不高占14.8%,醫(yī)療費用很高占85.2%。保險費用整體較高。
(二)描述統(tǒng)計分析
在通過簡單的頻數(shù)統(tǒng)計分析了解了性別、地區(qū)、糖尿病、健康保險覆蓋的兒童數(shù)量的總體、費用分布狀況后,我們還需要對數(shù)據(jù)中的BMI(身體質(zhì)量指數(shù))、健康保險覆蓋的兒童數(shù)量、地區(qū)、年齡這4個變量的特征有更為精確的認識。
1. BMI。如表1所示,BMI均值為30.663,超過了理想的體重指數(shù)(18.5~25)的范圍;標準差不大,說明離散程度小,數(shù)據(jù)的代表性好;SK=0.284>0,表明BMI的分布為右偏分布,但偏斜程度不大;K=﹣0.51,表明BMI扁平分布更分散。
2.健康保險覆蓋的兒童數(shù)量。如表2所示,健康保險覆蓋的兒童數(shù)量的標準差不大,說明離散程度小,數(shù)據(jù)的代表性好;SK=0.938>0,表明健康保險覆蓋的兒童數(shù)量的分布為右偏分布,但偏斜程度不大;K=0.202,表明健康保險覆蓋的兒童數(shù)量的分布尖峰分布更集中。
3.地區(qū)分布。如表3所示,地區(qū)分布的標準差不大,說明離散程度小,數(shù)據(jù)的代表性好;SK=﹣0.38<0,表明地區(qū)分布為左偏分布,但偏斜程度不大;K=﹣1.328,表明地區(qū)分布扁平分布更分散。
4.年齡分布。如表4所示,年齡均值為42.21,標準差不大,說明離散程度小,數(shù)據(jù)的代表性好;SK=0.056>0,表明年齡的分布為右偏分布,但偏斜程度不大;K=﹣1.245,表明年齡分布為扁平分布更分散。
(三)假設(shè)檢驗分析
1.糖尿病因素。經(jīng)過初步統(tǒng)計,根據(jù)SPSS所得圖表來看,我們所關(guān)心的是在這些變量中哪些變量在作出決定時最重要,于是可以假設(shè):
H0:糖尿病不會影響醫(yī)療費用成本
H1:糖尿病會影響醫(yī)療費用成本
根據(jù)SPSS分析數(shù)據(jù)可得,P值=0<α=0.05,拒絕H0,說明糖尿病會對醫(yī)療成本造成影響。
2.年齡因素。當(dāng)未患糖尿病時,我們假設(shè):
H0:當(dāng)年齡≤47時對費用沒有顯著性差異
H1:當(dāng)年齡>47時對費用有顯著性差異
如表5所示,根據(jù)SPSS分析數(shù)據(jù)可得,P值=0<α=0.05,拒絕H0,說明當(dāng)年齡>47時對費用有顯著性差異,年齡>47時影響醫(yī)療費用因素。
當(dāng)患糖尿病時,我們假設(shè):
H0:當(dāng)BMI≥30.360對費用沒有顯著性差異
H1:當(dāng)BMI<30.360對費用有顯著性差異
如表6所示,根據(jù)SPSS分析數(shù)據(jù)可得,P值=0<α=0.05,拒絕H0,說明當(dāng)BMI≥30.360時對費用有顯著性差異。
3.性別因素。當(dāng)我們想研究性別與費用之間的關(guān)系時,可以假設(shè):
H0:性別對費用沒有顯著性差異
H1:性別對費用有顯著性差異
如表7所示,根據(jù)SPSS分析數(shù)據(jù)可得,P值=0.06>α=0.05,不拒絕H0,說明方差相等。根據(jù)SPSS分析數(shù)據(jù)可得,P值=0.06>α=0.05,不拒絕H0,說明性別對費用沒有顯著性差異。
4.兒童數(shù)量因素。當(dāng)我們想研究兒童數(shù)量與費用之間的關(guān)系時,可以假設(shè):
H0:兒童數(shù)量對費用沒有顯著性差異
H1:兒童數(shù)量對費用有顯著性差異
如表8所示,根據(jù)SPSS分析數(shù)據(jù)可得,P值=0.218>α=0.05,不拒絕H0,說明兒童數(shù)量對費用沒有顯著性差異。
5.地區(qū)分布因素。當(dāng)我們想研究地區(qū)與費用之間的關(guān)系時,可以假設(shè):
H0:地區(qū)對費用沒有顯著性差異
H1:地區(qū)對費用有顯著性差異
如表9所示,根據(jù)SPSS分析數(shù)據(jù)可得,P值=0.011<α=0.05,拒絕H0,說明地區(qū)對費用有顯著性差異。
五、得出結(jié)論
由上述分析可知,導(dǎo)致較高保險成本的主要因素有糖尿病、年齡≥47、BMI≥30.360、健康保險覆蓋的兒童數(shù)量。所以對保險公司來說,從上文的數(shù)據(jù)分析可以看出來,保險公司可以利用數(shù)據(jù)分析來對自己的產(chǎn)品進行設(shè)計,讓自己的產(chǎn)品帶來的利益更高,而且可以向少數(shù)的特定人群來進行產(chǎn)品銷售。
保險公司可用數(shù)據(jù)分析技術(shù),對現(xiàn)有的投保人信息進行分析,得到購買保險的客戶特征,做到精確定位,對客戶對象更有針對性地進行銷售,不僅可以節(jié)省時間,而且能夠在一定程度上提高效益,預(yù)測客戶需求,定制個性化方案。由于現(xiàn)在市面上的保險企業(yè)眾多,如何長久地在保險行業(yè)立足,靠的就是企業(yè)自身的能力與客戶的口碑,所以為了給客戶提供更好的體驗,建立穩(wěn)定的客戶群體,預(yù)測客戶的需求,定制其個性化選擇方案,使用大數(shù)據(jù)分析技術(shù)就可以分析出什么特征的人群對哪些險種的需求量較大,從而對客戶進行更加準確的種類推薦。
(作者單位為四川大學(xué)錦城學(xué)院金融學(xué)8班)
參考文獻
[1] 陳祺琦.大數(shù)據(jù)分析在保險行業(yè)中的應(yīng)用[J].電子世界,2020(10):36-38.