王靈
摘要:城鄉(xiāng)居民醫(yī)保信息系統(tǒng)早期大部分采用了單一關(guān)系型數(shù)據(jù)庫存儲數(shù)據(jù),該方案擴展難,并發(fā)能力小,不適合處理半結(jié)構(gòu)化,非結(jié)構(gòu)化數(shù)據(jù)。而后隨著分布式技術(shù)如Hadoop等平臺的出現(xiàn),因其具備使用廉價的機器來存儲處理數(shù)據(jù)的優(yōu)點,城鄉(xiāng)居民醫(yī)保系統(tǒng)也開始使用該平臺。但Hadoop在設計之初是將數(shù)據(jù)均分給集群中的節(jié)點進行存儲和處理的,忽略了集群節(jié)點本身在存儲和計算能力存在差異,個別節(jié)點的性能甚至影響了整理系統(tǒng)的性能,且是主從節(jié)點方式處理數(shù)據(jù),存在數(shù)據(jù)可篡改,系統(tǒng)終端過于單一等問題。本文給出了城鄉(xiāng)居民醫(yī)保系統(tǒng)的整體架構(gòu)和技術(shù)路線,提出了異構(gòu)節(jié)點數(shù)據(jù)流動的優(yōu)化辦法,能有效節(jié)約集群規(guī)模和成本,借助區(qū)塊鏈技術(shù)保證數(shù)據(jù)安全性和可信性,優(yōu)化前端集群服務架構(gòu),支持多渠道高并發(fā)的關(guān)鍵信息推送模式,具備很好的推廣性。
關(guān)鍵詞:城鄉(xiāng)居民醫(yī)保系統(tǒng)優(yōu)化;Hadoop;區(qū)塊鏈;負載均衡
中圖分類號:TP311? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)27-0102-03
開放科學(資源服務)標識碼(OSID):
1引言
城鄉(xiāng)居民醫(yī)保制度[1-2]是由政府支持和引導,城鄉(xiāng)居民積極參加,是城鄉(xiāng)居民個人和政府等共同籌資的一項以大病統(tǒng)籌醫(yī)療為目的互助制度。為落實該項制度,國家出臺了關(guān)于城鄉(xiāng)居民醫(yī)保信息系統(tǒng)等一系列技術(shù)規(guī)范,主要規(guī)定了各省市主管部門應做好城鄉(xiāng)居民醫(yī)保系統(tǒng)的發(fā)展規(guī)劃,本著節(jié)約建設成本,結(jié)合當?shù)貙嵡?,建立和升級符合實際需要的城鄉(xiāng)居民醫(yī)保信息系統(tǒng),便于廣大城鄉(xiāng)居民享受這一政策。在城鄉(xiāng)居民醫(yī)保信息系統(tǒng)建設之初,其廣泛采用了單一的關(guān)系型數(shù)據(jù)系統(tǒng)來存儲數(shù)據(jù),隨著城鄉(xiāng)居民醫(yī)保系統(tǒng)數(shù)據(jù)不斷增加,數(shù)據(jù)類型的不斷豐富,該種數(shù)據(jù)存儲方案擴展困難,軟硬件升級成本越來越高,維護難度也不斷加大,特別是醫(yī)療檢查中存儲的圖像、視頻等半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù),存儲和分析異常困難。
由于城鄉(xiāng)居民醫(yī)保信息系統(tǒng)中涉及數(shù)據(jù)規(guī)模和復雜度的不斷增加,傳統(tǒng)的單節(jié)點數(shù)據(jù)處理所需的時間變得難以接受。因此,為了提高數(shù)據(jù)處理效率,許多學者一直在研究大數(shù)據(jù)的并行處理。過去,由于開發(fā)并行處理程序需要豐富的并行知識,開發(fā)難度極高,且并行計算框架也是為具有大量內(nèi)存空間和高網(wǎng)絡帶寬的環(huán)境(如超級計算機)而設計的。近十年中,由于Hadoop[3]等分布式框架的出現(xiàn),如下圖1所示,用戶能夠很容易地開發(fā)大規(guī)模并行程序。城鄉(xiāng)居民醫(yī)保信息系統(tǒng)也開始采用這種分布式并行處理技術(shù),統(tǒng)籌組織分析處理參合、門診、檢查、藥品等數(shù)據(jù)。但是目前系統(tǒng)中存在集群規(guī)模不恰當、建設成本過高、醫(yī)療數(shù)據(jù)易篡改,終端用戶數(shù)據(jù)推送不及時,系統(tǒng)針對性不強和并發(fā)性能較差等問題。 本文將著重優(yōu)化三個問題:1)搭建適當?shù)募阂?guī)模,優(yōu)化異構(gòu)節(jié)點數(shù)據(jù)流動,有效節(jié)約集群規(guī)模和能耗成本,提高MapReduce[4]的執(zhí)行速度;2)提高系統(tǒng)安全性和數(shù)據(jù)可信性,高層采用區(qū)塊鏈技術(shù)確保城鄉(xiāng)居民醫(yī)保系統(tǒng)關(guān)鍵數(shù)據(jù)可信,無法篡改,保證城鄉(xiāng)居民,政府,醫(yī)療系統(tǒng)利益不被侵害;3)優(yōu)化系統(tǒng)并發(fā)性能,提升前端集群服務架構(gòu),擴展終端形式,通過數(shù)據(jù)挖掘等技術(shù)及時推送不同角色的關(guān)聯(lián)數(shù)據(jù),提升城鄉(xiāng)居民醫(yī)保系統(tǒng)的用戶體驗。
2相關(guān)研究
城鄉(xiāng)居民醫(yī)保系統(tǒng)從傳統(tǒng)的關(guān)系型數(shù)據(jù)庫升級到Hadoop平臺,廣大工程師和科研人員主要圍繞三個問題進行探索建設。
(1)數(shù)據(jù)存儲能力和建設成本,優(yōu)化Hadoop底層文件存儲系統(tǒng)方面。不同分布式場景,存在著很大的性能差異和不穩(wěn)定性。究其原因在于城鄉(xiāng)居民醫(yī)保系統(tǒng)涉及的服務器性能存在明顯差異,這方面研究主要集中在Hadoop在具有不同性能能力的節(jié)點的異構(gòu)集群[5-6]上運行時,性能會降低。每個節(jié)點的吞吐量可能會存在差異,所有計算節(jié)點無法對相同數(shù)量的塊來執(zhí)行同樣操作。因此,空閑節(jié)點(即已經(jīng)完成工作的節(jié)點)可以通過網(wǎng)絡通信連續(xù)地接收未完成任務的數(shù)據(jù),從而導致網(wǎng)絡擁塞,嚴重影響整體性能。而在異構(gòu)環(huán)境中,因節(jié)點的計算能力與分配給它的塊數(shù)之間可能存在不匹配,數(shù)據(jù)局部性無法保持。國內(nèi)外相關(guān)學者已對這個問題進行了相關(guān)研究,例如,Xie[7]等提出了一種基于每個節(jié)點性能比的數(shù)據(jù)放置方案。方案包括兩個步驟:首先,初始數(shù)據(jù)放置是使用Preduce Application的Normalized Response Time來循環(huán)執(zhí)行,數(shù)據(jù)被重新分配到與測量的性能度量成比例的自定義數(shù)據(jù)放置。這是因為刪除或添加塊后,初始數(shù)據(jù)放置可能會折疊。盡管他們提出的方案解決了一些性能下降的問題,但是該方案不足以評估異構(gòu)環(huán)境中每個節(jié)點工作負載,因為它使用了簡單的性能度量。
(2)信息系統(tǒng)數(shù)據(jù)安全與可信性方面。城鄉(xiāng)居民醫(yī)保系統(tǒng)涉及資金、醫(yī)療病歷等原始數(shù)據(jù),具備很強的嚴謹性,是廣大城鄉(xiāng)居民結(jié)算報銷的重要依據(jù),是國家惠民政策的直接體現(xiàn),也是進行更深層次數(shù)據(jù)分析的依據(jù)。因此,務必確保數(shù)據(jù)無法修改,可在數(shù)據(jù)存儲層之上采用“區(qū)塊鏈”技術(shù),確保城鄉(xiāng)居民醫(yī)保系統(tǒng)關(guān)鍵性數(shù)據(jù)可信無法篡改[8]。對于這方面的研究有很多,“去中心化”的分布式系統(tǒng)和并行計算在很多領域的研究越來越受到廣大學者重視。目前“區(qū)塊鏈”研究屬于相對較新的領域,國內(nèi)外許多研究人員都在研究這一技術(shù),該技術(shù)對于互聯(lián)網(wǎng)將產(chǎn)生顛覆性的創(chuàng)新,而其去中心化、不可篡改、信息跟蹤等特點可以廣泛地應用于產(chǎn)品供應鏈、證券交易、電子銀行、政務系統(tǒng)、醫(yī)療管理等領域。近兩年學術(shù)界和工業(yè)界對于此技術(shù)給予了較高的關(guān)注,研究開發(fā)區(qū)塊鏈在諸多領域的應用場景也取得了進展。綜上,區(qū)塊鏈技術(shù)主要解決不同領域的數(shù)據(jù)可信問題,能實現(xiàn)跨時空交易,更加方便快捷。
區(qū)塊鏈技術(shù)不僅可應用在經(jīng)濟金融等領域,凡是對交易的真實性、不可篡改性、可回溯性、安全可靠性等有需求的各個領域都可以應用該技術(shù)。雖然“去中心化”的分布式系統(tǒng)在其他行業(yè)已經(jīng)逐步開始應用,但目前為止,根據(jù)相關(guān)文獻檢索結(jié)果顯示,對城鄉(xiāng)居民醫(yī)保系統(tǒng)進行整體“去中心化”分布式架構(gòu)與設計還鮮有報道。如果能夠借鑒該種架構(gòu)設計方案在電子商務中的成功應用經(jīng)驗,歸納匯總區(qū)塊鏈技術(shù)在醫(yī)療領域的零散應用,將其整合到城鄉(xiāng)居民醫(yī)保系統(tǒng)綜合信息系統(tǒng)中,將能大幅度降低系統(tǒng)擴充的軟硬件成本,提升系統(tǒng)的安全可信程度,也可為決策者、醫(yī)療工作者及廣大城鄉(xiāng)居民推送智能化信息,提升本區(qū)域城鄉(xiāng)居民的醫(yī)療服務質(zhì)量。
(3)信息系統(tǒng)高并發(fā)性能,系統(tǒng)友好性,挖掘關(guān)鍵信息并主動推送等方面。前端采用Web,App,微信小程序,微信公眾號等方式,多渠道對接城鄉(xiāng)居民醫(yī)保信息系統(tǒng)。通過優(yōu)化數(shù)據(jù)存儲,相關(guān)Web服務功能,采用負載均衡等策略,提高系統(tǒng)的并發(fā)性能。同時采用數(shù)據(jù)挖掘技術(shù),抓取并推送關(guān)鍵信息,便于智能化平臺的建立。通過改進傳統(tǒng)數(shù)據(jù)挖掘算法,挖掘出不同的數(shù)據(jù),建立給不同對象使用的智能化信息推送平臺。用戶可以通過微信、短信、郵件等各個平臺獲取相關(guān)信息。
3系統(tǒng)總體架構(gòu)
為了使系統(tǒng)具備很好的擴展性、可信性、安全性、智能性,系統(tǒng)使用分布式存儲技術(shù)解決數(shù)據(jù)擴展性問題,上層采用區(qū)塊鏈技術(shù)建立可信性認證,應用層將挖掘出相關(guān)數(shù)據(jù)進行高并發(fā)推送。具體系統(tǒng)架構(gòu)如圖2所示。
整個城鄉(xiāng)居民醫(yī)保信息系統(tǒng)主要采用了三層總體架構(gòu)。應用層面向不同對象,處理相應的業(yè)務邏輯,同時結(jié)合相應的感知設備,例如手機、智能穿戴設備、RFID等獲取相應輔助數(shù)據(jù),并特別提醒、推送或預警與城鄉(xiāng)居民息息相關(guān)的健康與結(jié)報數(shù)據(jù);網(wǎng)絡層除了傳輸數(shù)據(jù)外,對于關(guān)鍵性數(shù)據(jù),例如住院數(shù)據(jù)、診斷數(shù)據(jù)等進行區(qū)塊鏈網(wǎng)絡節(jié)點共同認證,確保數(shù)據(jù)可信無法篡改;在數(shù)據(jù)存儲層,則對不同數(shù)據(jù)采用不同的數(shù)據(jù)存儲方式,例如緩存數(shù)據(jù)進入Redis,涉及金額等數(shù)據(jù)進入Mysql,其他非結(jié)構(gòu)化,半結(jié)構(gòu)化數(shù)據(jù)進入Hbase、Mongodb等數(shù)據(jù)庫中,統(tǒng)籌處理。城鄉(xiāng)居民醫(yī)保信息管理系統(tǒng)建設是以衛(wèi)生部《關(guān)于城鄉(xiāng)居民醫(yī)保信息系統(tǒng)建設的指導意見》等一系列文件為立項依據(jù),城鄉(xiāng)居民醫(yī)保系統(tǒng)應提供費用智能測算、參合經(jīng)費撥付與收繳、報銷支付補償、監(jiān)督部門審計、醫(yī)療主管部門決策分析和相關(guān)政策公告等功能,能有效提高城鄉(xiāng)居民醫(yī)保系統(tǒng)資金的運轉(zhuǎn)效率、有效杜絕資金監(jiān)管漏洞、大力提升政府部門的服務質(zhì)量和監(jiān)管力度。該信息系統(tǒng)建設一般由各省招標建設,其省級管理信息系統(tǒng)基本功能為數(shù)據(jù)處理與交換、統(tǒng)計報表、會計報表、業(yè)務監(jiān)測、基金監(jiān)管、轉(zhuǎn)診管理、分析評價、配置維護、門戶網(wǎng)站等;縣級業(yè)務系統(tǒng)基本功能包括參合管理、補償管理、基金管理、會計核算、查詢統(tǒng)計、監(jiān)測分析、業(yè)務公示和配置維護等功能。為節(jié)約系統(tǒng)的存儲、系統(tǒng)總體功耗、人員管理成本,首先可對數(shù)據(jù)存儲層進行優(yōu)化。
4 區(qū)塊鏈技術(shù)應用
針對城鄉(xiāng)居民醫(yī)保系統(tǒng)的參保信息、住院費用、結(jié)算比例等關(guān)鍵性數(shù)據(jù),確保其是可信無法篡改的,筆者將從技術(shù)層面進行保障,建立多部門參與的區(qū)塊鏈節(jié)點,采用鏈式傳輸和普通傳輸相結(jié)合的方式與底層數(shù)據(jù)存儲層通信,構(gòu)建城鄉(xiāng)居民醫(yī)保系統(tǒng)信息安全管理模型,如圖3所示。
區(qū)塊鏈技術(shù)主要有公有鏈、私有鏈以及聯(lián)盟鏈三種常見方式,公有鏈的特點是所有人均可訪問,主要代表是比特幣、以太坊等應用,其明顯應用范圍超過城鄉(xiāng)居民醫(yī)保系統(tǒng)角色的應用范疇;私有鏈主要在企業(yè)內(nèi)部進行使用,其操作的權(quán)限一般被單個組織或機構(gòu)掌握,城鄉(xiāng)居民醫(yī)保系統(tǒng)是多方參與的,因此該種方案也不符合城鄉(xiāng)居民醫(yī)保系統(tǒng)。而聯(lián)盟鏈是非常適合多方參與和共同監(jiān)督的,采用相關(guān)共識算法,加入與退出鏈均需得到相關(guān)組織認定,具備去中心化的特點,其代表為Hyperledger。因此,城鄉(xiāng)居民醫(yī)保系統(tǒng)具體選擇上可采用聯(lián)盟鏈,可選用Hyperledger技術(shù)建立城鄉(xiāng)居民醫(yī)保系統(tǒng)的聯(lián)盟鏈,具備了高可信、隱私信息保護等優(yōu)勢明顯,既可以使監(jiān)管部門具備監(jiān)管權(quán),又能對醫(yī)療衛(wèi)生部門、廣大城鄉(xiāng)居民開放相應級別權(quán)限,符合城鄉(xiāng)居民醫(yī)保系統(tǒng)的要求。
5總結(jié)
城鄉(xiāng)居民醫(yī)保信息系統(tǒng)是涉及普通百姓的綜合醫(yī)療業(yè)務系統(tǒng),數(shù)據(jù)增長速度快、涉及業(yè)務流程復雜、資金量大。本文主要從數(shù)據(jù)存儲底層架構(gòu)優(yōu)化、可信網(wǎng)絡、多渠道并發(fā)訪問、前端服務架構(gòu)幾個方面做了一些研究,可對城鄉(xiāng)居民醫(yī)保信息系統(tǒng)的進一步建設優(yōu)化提供思路,也可為類似信息系統(tǒng)建設作為技術(shù)參考。同時本文所涉及的數(shù)據(jù)量為模擬器產(chǎn)生,數(shù)值較小僅在實驗環(huán)境中論證,下一步將繼續(xù)關(guān)注和優(yōu)化HDFS的文件塊調(diào)度算法及其應用,區(qū)塊鏈技術(shù)的發(fā)展以及前端服務器集群架構(gòu)技術(shù)更新,重點關(guān)注并研究分布式底層數(shù)據(jù)存儲與可信方法領域,以期在實驗室和現(xiàn)實環(huán)境中進一步論證,整合并優(yōu)化相關(guān)工程級技術(shù)并應用到城鄉(xiāng)居民醫(yī)保等系統(tǒng)中。
參考文獻:
[1] 李姝薈,李姝熠,張洋,等.新醫(yī)改環(huán)境下新型農(nóng)村合作醫(yī)療制度的發(fā)展現(xiàn)狀及對策研究[J].中國市場,2020(8):74,79.
[2] 王奧,陳虹,秦立建.我國新型農(nóng)村合作醫(yī)療制度高質(zhì)量發(fā)展研究[J].齊齊哈爾大學學報(哲學社會科學版),2020(1):19-21.
[3] 黃訸,易曉東,李姍姍,等.面向高性能計算機的海量數(shù)據(jù)處理平臺實現(xiàn)與評測[J].計算機研究與發(fā)展,2012,49(S1):357-361.
[4] 林偉偉.一種改進的Hadoop數(shù)據(jù)放置策略[J].華南理工大學學報(自然科學版),2012,40(1):152-158.
[5] 夏新岳.基于區(qū)塊鏈的股權(quán)資產(chǎn)購買和轉(zhuǎn)贈設計與實現(xiàn)[D].呼和浩特:內(nèi)蒙古大學,2016.
[6] 黃永剛.基于區(qū)塊鏈技術(shù)的電子健康檔案安全建設[J].中華醫(yī)學圖書情報雜志,2016,25(10):38-40,46.
[7] 蔡維德,郁蓮,王榮,等.基于區(qū)塊鏈的應用系統(tǒng)開發(fā)方法研究[J].軟件學報,2017,28(6):1474-1487.
[8] 薛騰飛,傅群超,王樅,等.基于區(qū)塊鏈的醫(yī)療數(shù)據(jù)共享模型研究[J].自動化學報,2017,43(9):1555-1562.
[9] 王海隆.區(qū)塊鏈技術(shù)在中醫(yī)藥領域中的應用展望[J].貴陽中醫(yī)學院學報,2017,39(3):1-4.
[10] 倪培昆.區(qū)塊鏈技術(shù)及其在醫(yī)療領域的價值研究[J].醫(yī)學信息學雜志,2018,39(2):9-13.
[11] 朱正望,朱平生,苗艷艷,等.基于數(shù)據(jù)挖掘的含大棗中成藥用藥特點分析[J].中國中藥雜志,2021,46(9):2344-2349.
[12] 譚定國,黃婉飛,貌俊偉,等.某醫(yī)院內(nèi)微信平臺用藥信息推送對提高臨床處方合理用藥的影響[J].抗感染藥學,2020,17(6):827-829.
【通聯(lián)編輯:唐一東】