潘安
【摘要】 隨著大數(shù)據(jù)技術(shù)的發(fā)展,大數(shù)據(jù)技術(shù)正在廣泛的應(yīng)用于各行各業(yè)。隨著國家相關(guān)政策的出臺以及人民生活水平的提高,健康險的發(fā)展面臨著巨大的前景。健康險和大數(shù)據(jù)的結(jié)合能夠在健康險中數(shù)據(jù)的收集、處理、分析和應(yīng)用起到巨大的作用。大數(shù)據(jù)技術(shù)在健康險的應(yīng)用能夠促進健康險的發(fā)展,使得健康險能夠更好的服務(wù)人民。
【關(guān)鍵詞】 大數(shù)據(jù) 健康險 收集 處理 分析 應(yīng)用
當今信息技術(shù)的快速發(fā)展帶動了各行各業(yè)的發(fā)展,催生了物聯(lián)網(wǎng)、互聯(lián)網(wǎng)、電子商務(wù)等新興產(chǎn)業(yè)的發(fā)展。各行各業(yè)的業(yè)務(wù)帶來的數(shù)據(jù)正在以幾何級的形式爆發(fā),傳統(tǒng)的數(shù)據(jù)收集、存儲、分析和應(yīng)用技術(shù)已經(jīng)不能滿足要求,這點在互聯(lián)網(wǎng)行業(yè)尤為突出。互聯(lián)網(wǎng)行業(yè)面臨著海量的數(shù)據(jù)資源、快速的數(shù)據(jù)增長,現(xiàn)有的大數(shù)據(jù)技術(shù)已經(jīng)在互聯(lián)網(wǎng)企業(yè)得到了探索和應(yīng)用。
隨著新醫(yī)改的推出以及人民群眾的實際需求,健康險得到了迅猛的發(fā)展[1]。但是,健康險在發(fā)展過程中面臨著海量的數(shù)據(jù)資源,如何收集、處理、分析和應(yīng)用這些數(shù)據(jù)資源更好的服務(wù)健康險成為亟待解決的問題。
一、當前現(xiàn)狀
傳統(tǒng)健康險當前得到了迅猛的發(fā)展,但是當前健康險面臨兩大問題:大部分健康險業(yè)務(wù)處在虧損狀態(tài)和健康險不能滿足用戶的要求。從健康險公司的角度,當前需要利用大數(shù)據(jù)技術(shù)[2]對醫(yī)療數(shù)據(jù)等數(shù)據(jù)進行分析降低醫(yī)療風(fēng)險和經(jīng)營風(fēng)險。從用戶的角度,健康險公司能夠?qū)τ脩舻男袨楹歪t(yī)療數(shù)據(jù)進行分析,不僅做到理賠保障的作用,還能夠?qū)τ脩舻慕】禒顩r進行干預(yù),減少用戶產(chǎn)生醫(yī)療風(fēng)險的概率,使得健康險成為用戶的健康管家。
二、技術(shù)架構(gòu)
全面的數(shù)據(jù)資源是大數(shù)據(jù)技術(shù)應(yīng)用的基礎(chǔ),數(shù)據(jù)的處理是大數(shù)據(jù)技術(shù)應(yīng)用的關(guān)鍵,數(shù)據(jù)的分析是大數(shù)據(jù)技術(shù)應(yīng)用的核心,歸根結(jié)底,大數(shù)據(jù)技術(shù)都是為應(yīng)用服務(wù)的。本節(jié)將從健康險數(shù)據(jù)的收集、數(shù)據(jù)的處理、數(shù)據(jù)的分析和數(shù)據(jù)的應(yīng)用四個方面進行展開介紹。
2.1數(shù)據(jù)的收集
傳統(tǒng)的保險數(shù)據(jù)存在數(shù)據(jù)量小、數(shù)據(jù)來源單一、數(shù)據(jù)收集慢的問題?,F(xiàn)有包含的數(shù)據(jù)主要來源于客戶的保單信息以及發(fā)生理賠時的理賠信息。因此,首先,健康險公司要與外部醫(yī)療機構(gòu)合作獲取客戶部分醫(yī)療信息;其次,需要借助物聯(lián)網(wǎng)中可穿戴設(shè)備等技術(shù),實時并且全面的獲取客戶的血壓、心率等健康信息;最后,借助互聯(lián)網(wǎng)工具(APP、微信公眾號)獲取客戶的用戶社交信息、喜好信息等等。通過這些信息能夠建立全方位的客戶視圖,為數(shù)據(jù)分析做好基礎(chǔ)。
2.2數(shù)據(jù)的處理
數(shù)據(jù)的處理主要包括對收集的數(shù)據(jù)如何組織以及如何存儲?,F(xiàn)有的數(shù)據(jù)資源不僅包含傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),還包含實時產(chǎn)生的大量半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),因此需要借助現(xiàn)有的工具及方法(OCR技術(shù)等)把非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為有價值的結(jié)構(gòu)化數(shù)據(jù)。在數(shù)據(jù)的存儲上,傳統(tǒng)的集中式存儲已經(jīng)不能滿足要求,需要借助HBase等適用于海量數(shù)據(jù)實時存儲的數(shù)據(jù)存儲技術(shù)。
2.3數(shù)據(jù)的分析
首先,數(shù)據(jù)的分析需要對各種健康險數(shù)據(jù)、醫(yī)療數(shù)據(jù)建立分析模型。用深度學(xué)習(xí)[3]等機器學(xué)習(xí)方法進行數(shù)據(jù)的挖掘。例如,利用無標定的醫(yī)療數(shù)據(jù)進行無監(jiān)督訓(xùn)練,分層訓(xùn)練模型各層參數(shù)。
具體的,先用無標定數(shù)據(jù)訓(xùn)練第一層,訓(xùn)練時先學(xué)習(xí)第一層的參數(shù),在學(xué)習(xí)得到第n-1層后,將n-1層的輸出作為第n層的輸入,訓(xùn)練第n層,由此分別得到各層的參數(shù);基于上一步得到的各層參數(shù)進行自頂向下的監(jiān)督學(xué)習(xí)(就是通過帶標簽的數(shù)據(jù)去訓(xùn)練,誤差自頂向下傳輸,對網(wǎng)絡(luò)進行微調(diào)),對學(xué)習(xí)到的各層參數(shù)進一步優(yōu)化。
其次,數(shù)據(jù)分析需要借助強大的計算平臺實現(xiàn)分布式并發(fā)計算和實時計算。傳統(tǒng)的單服務(wù)器模式已經(jīng)不能滿足處理海量數(shù)據(jù)的要求。在處理海量數(shù)據(jù)的時候借助Hadoop等計算平臺實現(xiàn)對大量數(shù)據(jù)的分布式并發(fā)計算。Hadoop通過數(shù)據(jù)分塊及自恢復(fù)機制,能支持PB級的分布式的數(shù)據(jù)存儲,以及基于MapReduce分布式處理模式對這些數(shù)據(jù)進行分析和處理。
MapReduce編程模型可以很容易的將多個通用批數(shù)據(jù)處理任務(wù)和操作在大規(guī)模集群上并行化,而且有自動化的故障轉(zhuǎn)移功能。Hadoop以一種可靠、高效、可伸縮的方式進行處理依靠橫向擴展,通過不斷增加廉價的商用服務(wù)器來提高計算和存儲能力。
除此之外,借助Spark等實時數(shù)據(jù)分析系統(tǒng)實現(xiàn)海量數(shù)據(jù)的實時計算。Spark不僅啟用內(nèi)存分布數(shù)據(jù)集,提供交互式查詢,同時還可以優(yōu)化迭代工作負載。利用Spark可以支持分布式數(shù)據(jù)集上的迭代作業(yè),構(gòu)建大型的、低延遲的數(shù)據(jù)分析應(yīng)用程序。
2.4數(shù)據(jù)的應(yīng)用
基于數(shù)據(jù)分析可以從以下方面的應(yīng)用促進健康險的發(fā)展:
第一,通過建立慢病管理等疾病模型實現(xiàn)對用戶的健康狀況進行干預(yù),減少用戶的發(fā)病幾率,做用戶的健康管家;
第二,通過建立醫(yī)療付費模型對用戶的醫(yī)療行為進行干預(yù),一方面降低用戶過度醫(yī)療的可能性,另一方面減少用戶不必要的醫(yī)療費用支出;
第三,通過建立醫(yī)療風(fēng)險以及經(jīng)營風(fēng)險模型,健康險公司能夠有效防止保險欺詐以及控制經(jīng)營風(fēng)險。
三、技術(shù)難點
大數(shù)據(jù)已經(jīng)成為健康險公司發(fā)展的隱形資產(chǎn)。但是大數(shù)據(jù)在健康險的應(yīng)用存在以下難點:
第一,數(shù)據(jù)的互聯(lián)互通與數(shù)據(jù)共享問題?,F(xiàn)有的保險公司面臨的數(shù)據(jù)資源有限,多維度的數(shù)據(jù)資源是進行數(shù)據(jù)挖掘的關(guān)鍵,如何實現(xiàn)與醫(yī)療機構(gòu)、社交網(wǎng)絡(luò)等數(shù)據(jù)的互聯(lián)互通是需要解決的問題;
第二,大數(shù)據(jù)模型的應(yīng)用問題。以神經(jīng)網(wǎng)絡(luò)等為代表的機器學(xué)習(xí)模型在各行各業(yè)掀起了學(xué)習(xí)的浪潮,但是如何結(jié)合醫(yī)療知識和大量歷史數(shù)據(jù)結(jié)合設(shè)計相對準確實用的模型是需要解決的問題;
第三,數(shù)據(jù)安全性問題。大數(shù)據(jù)技術(shù)在健康險中的應(yīng)用涉及到用戶的醫(yī)療信息等敏感數(shù)據(jù),如何保護數(shù)據(jù)的存儲安全以及用戶隱私是需要解決的問題。
四、結(jié)束語
健康險和大數(shù)據(jù)技術(shù)有機結(jié)合是健康險發(fā)展的必然趨勢。健康險和大數(shù)據(jù)技術(shù)有機結(jié)合能夠促進健康險的快速健康的發(fā)展。
大數(shù)據(jù)技術(shù)能夠助力健康險公司整合健康險的保險保障、健康管理等功能,進一步打造大健康生態(tài)圈,實現(xiàn)健康險更好的服務(wù)人民的目標。
參 考 文 獻
[1]劉彥欣. 我國商業(yè)健康保險發(fā)展機遇與挑戰(zhàn)[J]. 對外經(jīng)貿(mào), 2015(4):51-54.
[2]徐子偉, 張陳斌, 陳宗海. 大數(shù)據(jù)技術(shù)概述[C]. 系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)論文集. 2014.
[3]孫志軍, 薛磊, 許陽明,等. 深度學(xué)習(xí)研究綜述[J]. 計算機應(yīng)用研究, 2012, 29(8):2806-2810.