周 建,付允彬,周 鵬
(1 高唐縣人民醫(yī)院 山東 聊城 252800)
(2 臨清市人民醫(yī)院 山東 聊城 252600)
隨著社會經(jīng)濟的不斷發(fā)展,人們對醫(yī)療服務水平也提出了更高要求?;谛碌臅r代背景,醫(yī)院應該與時俱進,不斷加強基礎設施建設,不斷提高醫(yī)療服務水平。將云計算與大數(shù)據(jù)技術應用于醫(yī)院信息化建設,能夠有效提高其靈活性與效率,促使醫(yī)院信息系統(tǒng)能夠實現(xiàn)整體部署,按需配置、集約管理,進而對醫(yī)療大數(shù)據(jù)進行統(tǒng)計集中管理與有效利用,促使醫(yī)療資源處理工作實現(xiàn)可持續(xù)發(fā)展。
在現(xiàn)代社會中,每天都會有海量的數(shù)據(jù)信息產(chǎn)生,而合理運用這些數(shù)據(jù)信息能夠創(chuàng)造出巨大的經(jīng)濟效益。大數(shù)據(jù)是指容量巨大、增長速度快,并且類型復雜,需要新的處理模式才能有效處理的高增長、多樣化海量信息資產(chǎn)[1]。傳統(tǒng)技術手段無法對大數(shù)據(jù)進行處理、分析等,因此需要更為先進的方法。大數(shù)據(jù)具有4 個特征,分別是數(shù)據(jù)容量大、數(shù)據(jù)類型多、增長變化快及數(shù)據(jù)價值大。大數(shù)據(jù)來源廣、類型多樣,比較注重數(shù)據(jù)處理的可用性與時效性?;诖髷?shù)據(jù)處理流程的不同,大數(shù)據(jù)技術可以分為以下4 種:(1)大數(shù)據(jù)采集技術,即運用多種方式獲得海量數(shù)據(jù),這是處理流程的重要環(huán)節(jié),借助該技術實現(xiàn)了數(shù)據(jù)的實時性和可靠性;(2)大數(shù)據(jù)存儲和管理技術,這項技術解決了數(shù)據(jù)在物理層面和邏輯層面存儲和管理問題;(3)大數(shù)據(jù)分析技術,在整個大數(shù)據(jù)處理流程中,分析是核心所在,主要目的是通過分析挖掘數(shù)據(jù)信息價值。大數(shù)據(jù)處理分析時要遵循相應原則,可以保證分析質量。對于大數(shù)據(jù)而言,傳統(tǒng)分析方式無法滿足實際所需,因此要運用新處理技術來完成;(4)大數(shù)據(jù)應用技術,大數(shù)據(jù)處理完成后,最終目的是服務用戶。由于大數(shù)據(jù)具有復雜性,因此要運用可視化技術,將結果直觀展現(xiàn)出來。在信息化背景下,將大數(shù)據(jù)應用于醫(yī)療數(shù)據(jù)管理是發(fā)展的必然趨勢,對數(shù)據(jù)信息進行分析、處理,為決策制定提供參考。
云計算是一種利用網(wǎng)絡對共享可配置的計算資源池進行方便快捷訪問的模式,采用最簡單的方法實現(xiàn)快速配置。云計算服務具有很強針對性,和傳統(tǒng)服務模式比較而言,云計算服務優(yōu)勢明顯,主要體現(xiàn)在服務成本降低、服務水平提升。云計算具有5 個特征,分別是廣泛的網(wǎng)絡接入、資源池化、快速彈性、可控服務及按需服務[2],將其運用在醫(yī)療領域,可以為患者提供良好服務,改善醫(yī)療服務效果。結合實際情況來看,明確云基礎設施部署有4 種模式,包括私有云、公有云、社區(qū)云及混合云,可以滿足多元化需求。其中,私有云是針對某個單位,可以保證數(shù)據(jù)資源安全;公有云是服務商提供免費的服務,例如計算、存儲等,有效利用互聯(lián)網(wǎng)來實現(xiàn)資源共享;社區(qū)云是多個單位共同使用一套云基礎設施,共同承擔風險、成本;混合云是兩種或者以上的部署模式混合體,例如將私有云和公有云結合起來。云計算在醫(yī)院工作中有著較高應用價值,未來發(fā)展前景廣闊,所以要加強研究,實現(xiàn)有效運用。
醫(yī)院信息化水平在不斷提升,傳統(tǒng)IT 架構逐漸暴露出滯后性,無法滿足發(fā)展所需,在這種情況下,醫(yī)療云構建成為人們研究的重點,是醫(yī)院信息化發(fā)展的主要方向。對醫(yī)院信息系統(tǒng)進行分析,其建設成本較高,增加了醫(yī)院的經(jīng)濟負擔。另外,對信息化系統(tǒng)開展維護、升級等需要投入人力和資金,因為缺乏合理配置,導致資源浪費。云計算應用可以大大降低成本,同時改善系統(tǒng)性能,更加安全、可靠。依據(jù)不同的云計算部署模式,可以對醫(yī)療云部署模式分類,包括醫(yī)療私有云、醫(yī)療公有云、醫(yī)療社區(qū)云和醫(yī)療混合云[3]。有關醫(yī)療云運行見圖1。
在醫(yī)療行業(yè)發(fā)展中,醫(yī)療信息的價值受到人們重視,通過合理運用可以推動醫(yī)療行業(yè)的發(fā)展。所謂醫(yī)療大數(shù)據(jù),是指在醫(yī)療領域中產(chǎn)生的數(shù)據(jù),主要來自制藥企業(yè)、臨床醫(yī)療、醫(yī)療費用及健康管理4 個方面。大數(shù)據(jù)分析對醫(yī)療信息進行挖掘、利用,可以發(fā)揮出有效作用。在新技術支持下,醫(yī)療服務行業(yè)會產(chǎn)生新的商業(yè)模式,例如建立起網(wǎng)絡健康平臺,患者和醫(yī)生可以及時、準確查詢到所需醫(yī)療信息。醫(yī)療大數(shù)據(jù)具有重大的應用價值,可以為行業(yè)服務水平提升提供充足動力。基于云關鍵技術的醫(yī)療數(shù)據(jù)挖掘平臺架構見圖2。
結合傳統(tǒng)醫(yī)療數(shù)據(jù)分析情況來看,由于處理手段的限制,導致數(shù)據(jù)處理規(guī)模不大,并且方式陳舊速率慢,無法處理海量信息,不利于醫(yī)療數(shù)據(jù)處理工作的順利開展。此外,算法更新速度慢,無法滿足醫(yī)院現(xiàn)代化建設,不利于醫(yī)院數(shù)據(jù)處理工作實現(xiàn)可持續(xù)發(fā)展。
在傳統(tǒng)醫(yī)療數(shù)據(jù)分析工作中,常見手段為問卷調查,根據(jù)醫(yī)療數(shù)據(jù)收集分析目的以及實況,確定問卷內容,通過向目標人群發(fā)放問卷、回收問卷,統(tǒng)計信息這一方式,對有關醫(yī)療數(shù)據(jù)進行統(tǒng)計。該手段不僅較為落后,工作效率與質量也難以提高。在大數(shù)據(jù)背景下,引進新分析手段與理念勢在必行,創(chuàng)新數(shù)據(jù)分析路徑,提高數(shù)據(jù)分析效率。
傳統(tǒng)數(shù)據(jù)分析因為受到工作方式的限制,無法對海量的醫(yī)療信息進行統(tǒng)計分析,只能對規(guī)模較小的數(shù)據(jù)進行處理,選取典型數(shù)據(jù)探究,或者隨機分析,導致數(shù)據(jù)處理速度慢,處理結果準確度有待提高?;诖?,創(chuàng)新數(shù)據(jù)處理手段十分必要,以此提高數(shù)據(jù)處理規(guī)模,促使數(shù)據(jù)處理工作得以高效開展。
雖然不少醫(yī)院對于信息化建設較為重視,但是由于現(xiàn)代化信息技術更新?lián)Q代速度快,信息化建設無法緊跟時代需求,基礎設施落實,導致有關醫(yī)療數(shù)據(jù)信息處理仍舊選用單機算法,無論是分析方法還是數(shù)據(jù)規(guī)模都存在一定約束,無法滿足現(xiàn)代社會的發(fā)展需求,不利于醫(yī)院信息化建設實現(xiàn)持續(xù)化發(fā)展[4]。
在新的時代背景下,大數(shù)據(jù)在醫(yī)療云關鍵技術中的應用主要從系統(tǒng)設計開發(fā)和算法設計實現(xiàn)兩個方面論述。
在系統(tǒng)整體架構設計層面,本文介紹一種基于Hadoop的醫(yī)療大數(shù)據(jù)處理系統(tǒng),由大數(shù)據(jù)收集模塊、大數(shù)據(jù)存儲管理模塊及大數(shù)據(jù)分析模塊3 個部分組成。在系統(tǒng)設計時應用大數(shù)據(jù)技術可以有針對性地采用分布式協(xié)同過濾算法,并引進虛擬技術,將其與醫(yī)院系統(tǒng)相結合,提高資源利用率,優(yōu)化醫(yī)療服務水平。
(1)大數(shù)據(jù)收集模塊設計與開發(fā)。受傳統(tǒng)技術條件的限制,醫(yī)療數(shù)據(jù)主要以半結構化和非結構化的形式存放在文件系統(tǒng)中,這兩種形式數(shù)據(jù)在非分布式環(huán)境下是無法運用的。Hadoop 大數(shù)據(jù)處理能力較強,可以滿足實際所需。Hadoop不方便訪問存放在文件系統(tǒng)中的醫(yī)療大數(shù)據(jù)。另外,以Hadoop 為基礎進行開發(fā),產(chǎn)生分布式應用程序,運用現(xiàn)有臨床數(shù)據(jù)中心數(shù)據(jù)資源,通過分析發(fā)現(xiàn)在遇到頻繁訪問的時候,會增加系統(tǒng)壓力,甚至會出現(xiàn)問題。為了改善面臨情況,可將醫(yī)療大數(shù)據(jù)存儲在HDFS 上,然后進行分析處理,這是最好的方式。在傳統(tǒng)模式下,數(shù)據(jù)傳輸速度較慢,存放在關系型數(shù)據(jù)庫系統(tǒng)中的結構化數(shù)據(jù),開發(fā)了基于Sqoop 的ETL 模塊。該模塊有分布處理特點,提升了醫(yī)療數(shù)據(jù)傳輸效率[5]。
(2)大數(shù)據(jù)存儲管理模塊的設計和開發(fā)。Hadoop 應用不便于訪問在關系型數(shù)據(jù)庫中存儲的結構化數(shù)據(jù),當數(shù)據(jù)集規(guī)模比較大時,無法實現(xiàn)高效處理,但用戶管理相對省心和方便。相比較于其他數(shù)據(jù),Hadoop 應用訪問存儲在HDFS 中的數(shù)據(jù)較為容易,適用于規(guī)模較大數(shù)據(jù)集。建立大數(shù)據(jù)存儲和管理模塊,可以滿足數(shù)據(jù)倉庫要求。
(3)大數(shù)據(jù)分析模塊的設計和開發(fā)。從目前情況來看,大數(shù)據(jù)分析的算法和大數(shù)據(jù)處理分布式平臺都比較多,大數(shù)據(jù)應用方式更是數(shù)不勝數(shù)。分析醫(yī)療大數(shù)據(jù)特征,發(fā)現(xiàn)臨床信息系統(tǒng)利用醫(yī)療大數(shù)據(jù)頻率較高,明確臨床信息系統(tǒng)對臨床決策支持系統(tǒng)的依賴,在該系統(tǒng)中基于Hadoop作為大數(shù)據(jù)處理的分布式平臺,實現(xiàn)相關推薦算法,保證大數(shù)據(jù)推薦系統(tǒng)具有可擴展性[6]。
在該系統(tǒng)中,在分析處理醫(yī)療大數(shù)據(jù)時主要采用協(xié)同過濾算法,設計出基于HL7 消息的推薦系統(tǒng)接口,可以和醫(yī)院信息實現(xiàn)對接,具有實時性。大數(shù)據(jù)分析模塊核心部分包括應用層、推薦系統(tǒng)層及數(shù)據(jù)存儲層[7]。
(4)虛擬化技術的引進。除了上述模塊之外,工作人員還需要重視虛擬化技術的引進。該技術作為大數(shù)據(jù)背景下的典型產(chǎn)物,想要保障醫(yī)療云得以實現(xiàn)持續(xù)發(fā)展,還要重視該模塊的引進。虛擬化技術的應用能夠對醫(yī)療云中已經(jīng)固定的資源進行重新配置與劃分,促使資源利用率提高。在該模塊當中,首先需要將醫(yī)療云系統(tǒng)虛擬為邏輯領域的計算機。隨后在虛擬環(huán)境中,結合醫(yī)療云系統(tǒng),使得復雜的資源配置簡單化、流暢化,保障資源管理效果的同時,降低整個系統(tǒng)運行成本。目前在醫(yī)療云當中,應用最為廣泛的虛擬技術有服務器虛擬、網(wǎng)絡虛擬化等,以此提高醫(yī)療拓撲結構安全性,對醫(yī)療大資源實現(xiàn)動態(tài)分配。最終推動醫(yī)院資源管理能力提升的同時,推動各項醫(yī)療服務工作順利開展。其虛擬化原理見圖3。
從本質上來看,大部分分析模塊可以看作集體指揮,從醫(yī)院收集的信息中尋找相關內容,可以形成重要認識。協(xié)同過濾算法是采用集體智慧的一種推薦算法,可以從大量信息中找到所需信息[8]。算法設計,一般情況下,實現(xiàn)協(xié)同過濾算法包括3 步:第1 步是收集用戶偏好數(shù)據(jù);第2 步是尋找相似用戶;第3 步是推薦的計算。有效運用相似度計算方法,可以得到相似度度量值,使用用戶的協(xié)同過濾和基于項目的協(xié)同過濾完成推薦。在該系統(tǒng)中,用于完成推薦流程的推薦方法比較多,同時運用算法評價機制實現(xiàn)最優(yōu)方法的自動選擇,算法提交到發(fā)布式平臺實現(xiàn)運行,會得到相應結果。
算法實現(xiàn),在分布式計算環(huán)境中,輸入算法和數(shù)據(jù)時有一定要求,設計要以分布式使用方法為參考依據(jù),并且要與MapReduce 分布式框架的要求相符合。要求所有數(shù)據(jù)可以轉化成Key/Value 對,分布式協(xié)同過濾算法實現(xiàn)要通過4 步來完成,其中每一步都是完整的MapReduce 流程,形成了序列化MapReduce 任務過程[9]。
算法評價,在信息檢索領域中,對結果質量開展評價時,主要評價指標是準確率和召回率,其中準確率是指檢索文檔數(shù)量占總文檔數(shù)量的比率,召回率是指檢索相關文檔數(shù)量占所有相關文檔數(shù)量的比率。算法設計架構流程圖見圖4。
在新時代背景下,隨著醫(yī)院信息化水平的提升,要加強大數(shù)據(jù)、云計算等技術的應用,發(fā)揮出醫(yī)療大數(shù)據(jù)的作用,為發(fā)展決策制定提供參考依據(jù)。信息是寶貴的資源,因此要充分利用大數(shù)據(jù)來挖掘醫(yī)療信息資源,建立起以患者為中心的服務模式,幫助醫(yī)院對外樹立起良好形象,從而實現(xiàn)醫(yī)院長遠的科學發(fā)展。