伍毅強
江門市新會區(qū)中醫(yī)院
基于醫(yī)療大數(shù)據(jù)處理的醫(yī)療云關(guān)鍵技術(shù)研究
伍毅強
江門市新會區(qū)中醫(yī)院
醫(yī)療數(shù)據(jù)具有數(shù)量龐大、隱私性強、參考價值高等特征,所以在醫(yī)療事業(yè)快速發(fā)展的過程中,推動醫(yī)療數(shù)據(jù)信息化建設(shè)具有必要性,現(xiàn)階段人們嘗試利用云計算在速度、可靠性、擴展性、按需服務(wù)性等方面的優(yōu)勢,進行醫(yī)療大數(shù)據(jù)處理,在此背景下,本文針對以醫(yī)療大數(shù)據(jù)處理為基礎(chǔ)的醫(yī)療云關(guān)鍵技術(shù)展開研究,為現(xiàn)代醫(yī)療領(lǐng)域進行針對醫(yī)療數(shù)據(jù)的信息化建設(shè)提供參考。
醫(yī)療大數(shù)據(jù)處理 醫(yī)療云 關(guān)鍵技術(shù)
考慮到不同醫(yī)院的醫(yī)療特征存在差異,而醫(yī)療數(shù)據(jù)以具體的患者為描述對象,所以在進行醫(yī)療數(shù)據(jù)信息化建設(shè)的過程中,必須保證訪問模式具有可控服務(wù)、按需服務(wù)、快速彈性等特征,而以網(wǎng)絡(luò)為渠道訪問相應(yīng)資源池的云計算模式,恰好具備相應(yīng)的功能,而且可靠性、通用性、經(jīng)濟性也十分突出,所以在醫(yī)療大數(shù)據(jù)處理的過程中,應(yīng)用醫(yī)療云具有可行性。
醫(yī)療行業(yè)的特殊性決定,其在發(fā)展的過程中必然面臨海量數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的難題,如單個CT掃描圖像、基因組序列文件、標準病理圖的網(wǎng)絡(luò)占用空間分別為150MB、750MB、5GB,預(yù)計2020年醫(yī)療數(shù)據(jù)儲量將超過35ZB,達到2009年醫(yī)療數(shù)據(jù)存儲總量的99倍以上,所以,近年來部分國家對醫(yī)療信息化建設(shè)進行和積極探索,使醫(yī)療大數(shù)據(jù)分析的資金供給大幅提升,推動醫(yī)療行業(yè)進入大數(shù)據(jù)處理時代。醫(yī)療數(shù)據(jù)處理經(jīng)歷了較漫長的發(fā)展過程,如BI概念、高級分析等均是過去較成功的技術(shù),大數(shù)據(jù)處理在數(shù)據(jù)處理規(guī)模、實時、多樣方面相比過去技術(shù)更具優(yōu)勢,而且商業(yè)價值更加突出,對提升醫(yī)療效率和醫(yī)療效果具有重要作用,現(xiàn)階段我國在臨床業(yè)務(wù)、藥用研發(fā)、公眾健康、運營模式、付款定價等醫(yī)療服務(wù)領(lǐng)域均進行了大數(shù)據(jù)處理,可見大數(shù)據(jù)處理已經(jīng)成為醫(yī)療行業(yè)發(fā)展的必然選擇。
3.1 虛擬化技術(shù)
虛擬化技術(shù)是重新配置和劃分已有固定資源,使資源的利用率達到盡可能高的技術(shù),其在運行的過程中,先要將真實存在的計算機系統(tǒng)虛擬成邏輯領(lǐng)域的計算機,然后在虛擬的環(huán)境中,結(jié)合實際需要運行計算機系統(tǒng),達到計算機運行效率大幅提升的效果,可見此項技術(shù)抽象性特征顯著,在醫(yī)療云中應(yīng)用可以使原本復雜的資源配置程序簡單化和流暢化,特別是在其虛擬特征的作用下,可以使其在運行的過程中,維護、配置的難度大幅縮減,在保證資源管理效果的同時,降低成本投入。目前,應(yīng)用比較廣泛的虛擬化技術(shù)有桌面虛擬化、網(wǎng)絡(luò)虛擬化、服務(wù)器虛擬化等多種,目前在醫(yī)療云建設(shè)的過程中,主要應(yīng)用服務(wù)器虛擬化和網(wǎng)絡(luò)虛擬化技術(shù),在提升醫(yī)療網(wǎng)絡(luò)拓撲結(jié)構(gòu)安全性的同時實現(xiàn)對醫(yī)療大數(shù)據(jù)資源的動態(tài)分配、對醫(yī)療大數(shù)據(jù)資源處理結(jié)果的有機整合、對醫(yī)療大數(shù)據(jù)的分配存儲等??梢娽t(yī)療云中虛擬化技術(shù)的應(yīng)用,一方面可以使計算機服務(wù)器的計算資源管理能力提升,另一方面可以實現(xiàn)醫(yī)療服務(wù)各項業(yè)務(wù)的連續(xù)開展。
3.2 大數(shù)據(jù)技術(shù)
大數(shù)據(jù)即數(shù)據(jù)容量、種類、價值均十分大,而且增長變化速度也非常快的,難以用傳統(tǒng)手段收集、存儲管理和處理的信息,在目前醫(yī)療云大數(shù)據(jù)處理過程中,主要應(yīng)用的大數(shù)據(jù)處理平臺包括處理離線、復雜數(shù)據(jù)能力突出的Hadoop;處理離線、快速變化數(shù)據(jù)能力突出的Spark;處理在線實時數(shù)據(jù)能力突出的Storm三種。大數(shù)據(jù)技術(shù)的按照需求又可以分為以下幾種:一種是數(shù)據(jù)采集技術(shù),即獲取結(jié)構(gòu)特征不同的海量數(shù)據(jù)的技術(shù),由于醫(yī)療云要求對海量醫(yī)療數(shù)據(jù)進行實時、可靠處理,所以大數(shù)據(jù)采集技術(shù)要基于分布式平臺,實現(xiàn)對數(shù)據(jù)全映像的高速可靠抓取、解析、轉(zhuǎn)換和裝載,使海量數(shù)據(jù)結(jié)構(gòu)一致、整體安全。一種是數(shù)據(jù)存儲與管理技術(shù),此技術(shù)要實現(xiàn)對物理計算機數(shù)據(jù)與虛擬化技術(shù)所產(chǎn)生的邏輯層面數(shù)據(jù)的存儲和管理,目前通常情況下,前者要采用HDFS等分布式文件系統(tǒng),后者要運用具有分布式非關(guān)系型數(shù)據(jù)管理性能的大數(shù)據(jù)建模技術(shù),達到異構(gòu)數(shù)據(jù)融合和組織的效果。一種是數(shù)據(jù)分析技術(shù),此項技術(shù)是通過對海量數(shù)據(jù)進行分析,挖掘數(shù)據(jù)潛在價值的過程,所以此項技術(shù)的應(yīng)用效果,直接關(guān)系到醫(yī)療云的實際應(yīng)用水平,在此項技術(shù)應(yīng)用的過程中,應(yīng)認識到分析的數(shù)據(jù)是全體數(shù)據(jù),具有顯著的混雜性特征,數(shù)據(jù)之間具有相關(guān)關(guān)系,現(xiàn)階段較常用的分析技術(shù)是并行處理的計算技術(shù),如MapReduce等。除此之外,還包括大數(shù)據(jù)應(yīng)用技術(shù),即將大數(shù)據(jù)分析結(jié)果向用戶呈現(xiàn)的技術(shù),由于大數(shù)據(jù)規(guī)模龐大、分析結(jié)果復雜,所以現(xiàn)階段用大數(shù)據(jù)可視化技術(shù)取代了原有的數(shù)據(jù)顯示技術(shù),以達到強化大數(shù)據(jù)分析結(jié)果可視化水平。
基于醫(yī)療大數(shù)據(jù)處理的醫(yī)療云,在合理的運用以上技術(shù)的情況下,可以取得較好的數(shù)據(jù)處理效果,例如,上海市在2013年通過建設(shè)“上海健康信息網(wǎng)云計算”項目,進行醫(yī)療數(shù)據(jù)大處理,運行一年數(shù)據(jù)清洗的數(shù)量就超過43億條,可以實現(xiàn)數(shù)據(jù)I/O層5000并發(fā)和1秒內(nèi)應(yīng)對所有,極大的提升了醫(yī)療大數(shù)據(jù)處理的水平。
通過上述分析可以發(fā)現(xiàn),現(xiàn)階段人們已經(jīng)認識到醫(yī)療大數(shù)據(jù)處理在醫(yī)療衛(wèi)生領(lǐng)域發(fā)展中的重要性,并結(jié)合醫(yī)療大數(shù)據(jù)處理的需要引入云計算技術(shù),形成滿足具有不同醫(yī)療特征的醫(yī)療機構(gòu)大數(shù)據(jù)處理實際需要的醫(yī)療云,這是醫(yī)療衛(wèi)生領(lǐng)域信息化水平提升的具體體現(xiàn),應(yīng)對相關(guān)的技術(shù)不斷的完善。
[1]李曌勛.淺談面向醫(yī)療大數(shù)據(jù)處理的醫(yī)療云關(guān)鍵技術(shù)[J].數(shù)碼世界,2016,03:56
伍毅強 (1981年生),男,廣東江門人,漢族,現(xiàn)職稱:工程師,學歷:本科,研究方向:計算機技術(shù)。