• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      健康醫(yī)療大數(shù)據(jù)云平臺(tái)研究綜述

      2020-05-20 01:55:06
      中國醫(yī)療設(shè)備 2020年5期
      關(guān)鍵詞:醫(yī)療

      1.華南理工大學(xué) 材料科學(xué)與工程學(xué)院 生物醫(yī)學(xué)工程系,廣東 廣州 510006;2.廣東省精神疾病轉(zhuǎn)化醫(yī)學(xué)工程技術(shù)研究中心,廣東 廣州 510370;3.廣州市惠愛醫(yī)院 廣州醫(yī)科大學(xué)附屬腦科醫(yī)院,廣東 廣州 510370;4.廣東省老年癡呆診斷與康復(fù)工程技術(shù)研究中心,廣東 廣州 510500;5.國家醫(yī)療保健器具工程技術(shù)研究中心,廣東 廣州 510500;6.日本東北大學(xué)加齡醫(yī)學(xué)研究所 機(jī)能畫像醫(yī)學(xué)研究室,仙臺(tái) 980-8575

      引言

      隨著互聯(lián)網(wǎng)時(shí)代的到來以及信息技術(shù)領(lǐng)域的快速發(fā)展,為了滿足人們?nèi)找嬖鲩L的需求,新技術(shù)不斷興起,從互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算再到現(xiàn)在的大數(shù)據(jù)。尤其是大數(shù)據(jù)的規(guī)模遠(yuǎn)超傳統(tǒng)數(shù)據(jù)集合,然而由于它數(shù)據(jù)規(guī)模龐大、數(shù)據(jù)流轉(zhuǎn)迅速、數(shù)據(jù)類型多樣以及價(jià)值密度低的特點(diǎn),在大數(shù)據(jù)的獲取、存儲(chǔ)、管理和分析上都更為困難。隨著我國科學(xué)技術(shù)和生產(chǎn)水平的提高,傳統(tǒng)醫(yī)療服務(wù)方式逐步完成了到數(shù)字醫(yī)療再到智慧醫(yī)療的轉(zhuǎn)變。通過健康醫(yī)療大數(shù)據(jù)云平臺(tái)技術(shù),能實(shí)現(xiàn)更加高效、便捷的醫(yī)療服務(wù),更大地滿足人們個(gè)性化的醫(yī)療需求,也能進(jìn)一步促進(jìn)醫(yī)學(xué)知識(shí)與技術(shù)的進(jìn)步。

      1 健康醫(yī)療大數(shù)據(jù)

      1.1 大數(shù)據(jù)簡介

      根據(jù)何非等[1]研究者的分類,大數(shù)據(jù)可以分為兩種類型:第一種大數(shù)據(jù)是指企業(yè)自身的產(chǎn)品和服務(wù)產(chǎn)生了大量的密集型“超大規(guī)?!被颉昂A繑?shù)據(jù)”,通過對(duì)這些數(shù)據(jù)進(jìn)行深入的挖掘分析,改進(jìn)自身業(yè)務(wù);改進(jìn)后的業(yè)務(wù)吸引更多用戶或客戶,產(chǎn)生更大量的數(shù)據(jù),形成正向的循環(huán)。第二種大數(shù)據(jù)是網(wǎng)絡(luò)大數(shù)據(jù),通常是指在互聯(lián)網(wǎng)上發(fā)生的、蘊(yùn)含有豐富的、可被發(fā)掘的具有社會(huì)價(jià)值、商業(yè)價(jià)值或科研價(jià)值的大數(shù)據(jù)。

      從復(fù)雜的專業(yè)性科學(xué)/商業(yè)計(jì)算到基于互聯(lián)網(wǎng)的消費(fèi)型計(jì)算的數(shù)據(jù),數(shù)據(jù)已經(jīng)滲透到當(dāng)今行業(yè)和業(yè)務(wù)職能的各個(gè)領(lǐng)域,這些時(shí)刻都在爆炸性增長的龐大數(shù)據(jù)記錄著各種目標(biāo)結(jié)果和可能性,成為重要的生產(chǎn)因素,形成了難以估價(jià)的數(shù)據(jù)資源及信息資產(chǎn)[2-3]。為對(duì)數(shù)據(jù)集合進(jìn)行信息處理和優(yōu)化,提取出其潛在的數(shù)據(jù)價(jià)值,必須使用大數(shù)據(jù)技術(shù)對(duì)所有數(shù)據(jù)進(jìn)行收集并實(shí)現(xiàn)對(duì)數(shù)據(jù)的分析處理。

      1.2 健康醫(yī)療大數(shù)據(jù)的來源

      信息技術(shù)的進(jìn)步也帶動(dòng)了醫(yī)療行業(yè)的發(fā)展,使得醫(yī)療行業(yè)的信息化程度提高的同時(shí),產(chǎn)生了龐大的健康醫(yī)療數(shù)據(jù),近年來其數(shù)據(jù)量更是呈幾何倍數(shù)增長[4]。

      結(jié)合實(shí)際分析,將醫(yī)療行業(yè)中產(chǎn)生的數(shù)據(jù)來源主要分為生物醫(yī)藥、臨床醫(yī)療及實(shí)驗(yàn)數(shù)據(jù)、電子病歷和互聯(lián)網(wǎng)數(shù)據(jù)四類[5-6](圖1)。

      圖1 健康醫(yī)療大數(shù)據(jù)的數(shù)據(jù)來源、特點(diǎn)以及應(yīng)用

      (1)生物醫(yī)藥:藥物研發(fā)是密集型的過程,即使是非大型企業(yè)所產(chǎn)生的數(shù)據(jù)容量,達(dá)到TB以上也是輕而易舉。在生命科學(xué)領(lǐng)域,隨著計(jì)算機(jī)技術(shù)的發(fā)展,其計(jì)算能力和基因預(yù)測能力逐漸增強(qiáng),有越來越多的基因組序列文件,而一個(gè)基因組序列文件就接近1 GB。

      (2)臨床醫(yī)療以及實(shí)驗(yàn)數(shù)據(jù):臨床醫(yī)療與相應(yīng)的實(shí)驗(yàn)所產(chǎn)生的數(shù)據(jù)整合在一起,使得醫(yī)療機(jī)構(gòu)的數(shù)據(jù)增長非常迅速。在日常工作中,一張CT圖像所占的存儲(chǔ)空間已經(jīng)達(dá)到了 150 MB,而一個(gè)標(biāo)準(zhǔn)的病理圖則已經(jīng)達(dá)到了5 GB。根據(jù)區(qū)域的人口以及壽命來計(jì)算,一個(gè)地區(qū)的醫(yī)院所產(chǎn)生的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)就能輕松達(dá)到TB甚至PB以上。

      (3)電子病歷:包含了大量的結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),如患者的個(gè)人健康信息,就診、復(fù)診的過程中對(duì)病情的描述、醫(yī)生的診斷以及用藥信息等。

      (4)互聯(lián)網(wǎng)數(shù)據(jù):包括用戶對(duì)健康網(wǎng)站的瀏覽與網(wǎng)絡(luò)尋醫(yī)、購藥等操作所產(chǎn)生的數(shù)據(jù),以及在用戶知情情況下使用移動(dòng)醫(yī)療產(chǎn)品與健康監(jiān)控設(shè)備等便攜化的生理設(shè)備所產(chǎn)生的數(shù)據(jù)。

      1.3 健康醫(yī)療大數(shù)據(jù)的數(shù)據(jù)特點(diǎn)

      從傳統(tǒng)醫(yī)療開始,醫(yī)療行業(yè)一直以來就面臨著海量的數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的挑戰(zhàn),而近年來很多國家都在推動(dòng)醫(yī)療信息化的發(fā)展,投入資金進(jìn)行大數(shù)據(jù)分析[7]。

      健康醫(yī)療大數(shù)據(jù)不僅擁有大數(shù)據(jù)的“4V”基本特點(diǎn),即容量(Volume)、種類(Variety)、價(jià)值(Value)、速度(Velocity)[8],還包含了:① 更大的容量,醫(yī)療行業(yè)的數(shù)據(jù)增長快,保留時(shí)間長,不同于其他行業(yè),醫(yī)療行業(yè)中患者的相關(guān)數(shù)據(jù)至少要保留50年;② 更快的生成速度,醫(yī)療信息服務(wù)的提供,需要進(jìn)行大量在線或?qū)崟r(shí)數(shù)據(jù)的分析處理,如臨床診斷和醫(yī)生建議等;③ 更豐富的種類,醫(yī)療數(shù)據(jù)的存儲(chǔ)形式多樣,包含各種結(jié)構(gòu)化數(shù)據(jù)表、非結(jié)構(gòu)化和半結(jié)構(gòu)化文本文檔、醫(yī)療影像等;④ 更高的價(jià)值,醫(yī)療數(shù)據(jù)的價(jià)值高,小至個(gè)人的正常健康生活,大至整個(gè)國家以及全世界的疾病治療、藥物研發(fā)和持續(xù)性發(fā)展,醫(yī)療數(shù)據(jù)的價(jià)值都能得以體現(xiàn)(圖1)。

      除此之外,醫(yī)學(xué)數(shù)據(jù)還具有明顯的多態(tài)性、不完整性、時(shí)間性、冗余性、隱私性的功能特點(diǎn)[9]。

      1.4 健康醫(yī)療大數(shù)據(jù)的應(yīng)用

      健康醫(yī)療大數(shù)據(jù)的應(yīng)用廣泛,通過對(duì)醫(yī)療數(shù)據(jù)的再分析利用,能獲取到數(shù)據(jù)的潛在價(jià)值,能促進(jìn)醫(yī)療服務(wù)、新藥研發(fā)、醫(yī)學(xué)研究、醫(yī)院管理等各個(gè)領(lǐng)域的發(fā)展(圖1)。主要包括以下四個(gè)領(lǐng)域:① 在醫(yī)療服務(wù)方面,通過大數(shù)據(jù)平臺(tái)建立統(tǒng)一的個(gè)人電子檔案,將患者的所有基本數(shù)據(jù)、就診記錄等保存下來,構(gòu)建便捷高效的醫(yī)療服務(wù),有利于患者的預(yù)防、治療、康復(fù)和自我管理;② 在藥物研發(fā)方面,通過大數(shù)據(jù)分析,可以獲取更多早期的研發(fā)數(shù)據(jù),以便改善開發(fā)流程、合理分配資源,能有效提高研發(fā)效率且降低失敗風(fēng)險(xiǎn);③ 在醫(yī)學(xué)研究方面,通過對(duì)醫(yī)學(xué)影像、心電、腦電等數(shù)據(jù)的分析,獲取特征數(shù)據(jù),挖掘出臨床應(yīng)用的相關(guān)知識(shí);④ 在醫(yī)院管理方面,通過大數(shù)據(jù)平臺(tái)的建立,能更好地對(duì)醫(yī)院進(jìn)行精細(xì)化管理,并且通過醫(yī)院數(shù)據(jù)的挖掘,能有效提升醫(yī)院的醫(yī)療質(zhì)量、藥品、設(shè)備等的管理水平,進(jìn)一步提升醫(yī)護(hù)人員服務(wù)質(zhì)量和患者滿意度。

      2 健康醫(yī)療大數(shù)據(jù)與云平臺(tái)

      基于健康醫(yī)療的海量數(shù)據(jù)以及多態(tài)性,數(shù)據(jù)挖掘有很大的難度,為了使得醫(yī)療中的數(shù)據(jù)得到有效應(yīng)用,現(xiàn)有的醫(yī)療應(yīng)用需要與時(shí)俱進(jìn),結(jié)合云計(jì)算等信息技術(shù)[10],依托于云平臺(tái),健康醫(yī)療大數(shù)據(jù)的存儲(chǔ)、計(jì)算以及分析處理更為靈活、方便和快捷。

      根據(jù)美國國家標(biāo)準(zhǔn)與技術(shù)研究院的定義,云計(jì)算是一種通過網(wǎng)絡(luò)對(duì)共享可配置的計(jì)算資源池進(jìn)行無處不在的、便捷的、按需訪問的模式,它可以通過最簡化的工作和交互進(jìn)行快速的配置和發(fā)布,用戶不再需要了解“云”中基礎(chǔ)設(shè)施的細(xì)節(jié),不必具有相應(yīng)的專業(yè)知識(shí),也無需直接進(jìn)行控制[11]。第三方云可以是組織專注其核心業(yè)務(wù),而不是在計(jì)算機(jī)基礎(chǔ)架構(gòu)和維護(hù)上花費(fèi)資源。相較于傳統(tǒng)服務(wù)模式,云服務(wù)提供了更大的靈活性,使用戶能夠以最低的成本享受最優(yōu)化的信息化服務(wù)[12]。

      云計(jì)算服務(wù)的三個(gè)標(biāo)準(zhǔn)模型分別是基礎(chǔ)架構(gòu)即服務(wù)(Infrastructure as a Service,IaaS)、平臺(tái)即服務(wù)(Platform as a Service,PaaS)和軟件即服務(wù)(Software as a Service,SaaS)。三者之間有一定的聯(lián)系,但沒有必須的依賴關(guān)系,例如可以在裸機(jī)上實(shí)現(xiàn)SaaS而無需使用底層PaaS或IaaS,也可以在IaaS上運(yùn)行程序并訪問而無需包裝成SaaS。IaaS的定義是消費(fèi)者能夠部署和運(yùn)行任意軟件,包括操作系統(tǒng)和應(yīng)用程序,消費(fèi)者不管理或控制底層的云基礎(chǔ)架構(gòu),但是具有操作系統(tǒng)、存儲(chǔ)和已部署的應(yīng)用程序的控制以及選定網(wǎng)絡(luò)組件(例如,主機(jī)防火墻)的控制權(quán)限。一般面向運(yùn)營管理人員。PaaS提供給消費(fèi)者的功能是消費(fèi)者可以將由提供者支持的編程語言、庫、服務(wù)和工具創(chuàng)建或獲取的應(yīng)用程序部署到云基礎(chǔ)設(shè)施上。主要提供平臺(tái)開發(fā)和測試環(huán)境,主要面向開發(fā)者。SaaS提供給消費(fèi)者的功能是使用在云基礎(chǔ)架構(gòu)上運(yùn)行的提供商的應(yīng)用程序。用戶通過一些接口從各種客戶端設(shè)備訪問應(yīng)用程序,而不需要關(guān)心底層云基礎(chǔ)設(shè)施及軟件本身的維護(hù)。IaaS、PaaS 和SaaS 的區(qū)別如圖2所示。

      圖2 IaaS、PaaS和SaaS的區(qū)別

      2.1 云平臺(tái)的發(fā)展現(xiàn)狀

      云計(jì)算在大數(shù)據(jù)背景下應(yīng)運(yùn)而生,在國外,IBM推出的“藍(lán)云”計(jì)劃為用戶提供云計(jì)算平臺(tái)。谷歌公司自2008年推出App Engine云計(jì)算服務(wù)以來,一直致力于谷歌云平臺(tái)的開發(fā),提供一系列模塊化云服務(wù)包括計(jì)算、存儲(chǔ)、分析和機(jī)器學(xué)習(xí)等。與之相似的還有亞馬遜的Amazon Web Services(AWS)、微軟的 Microsoft Azure、Oracle的 Oracle Cloud。根據(jù)Synergy Group的數(shù)據(jù),截至2017年底,AWS占所有云計(jì)算的34%,接下來的三個(gè)是微軟、谷歌和IBM分別占11%、8%和6%。在醫(yī)學(xué)領(lǐng)域很多研究組織和研究人員也開始使用Hadoop進(jìn)行醫(yī)療服務(wù)和臨床項(xiàng)目的研究[13]。

      國內(nèi)的醫(yī)療云和健康醫(yī)療大數(shù)據(jù)研究及應(yīng)用起步相對(duì)發(fā)達(dá)國家要落后,但是通過外國的云計(jì)算和大數(shù)據(jù)先進(jìn)技術(shù)的引用,分析國外醫(yī)療云服務(wù)的成功和失敗案例,再結(jié)合我國自身的醫(yī)療信息化特點(diǎn)和趨勢,國內(nèi)諸多醫(yī)院聯(lián)合國內(nèi)外云計(jì)算技術(shù)提供商都在進(jìn)行醫(yī)療云和健康醫(yī)療大數(shù)據(jù)相關(guān)的研究和應(yīng)用[14]。2018年,由中國衛(wèi)生信息與健康健康醫(yī)療大數(shù)據(jù)學(xué)會(huì)家庭健康專委會(huì)、騰訊云和微醫(yī)云三方共同發(fā)布了“全國健康醫(yī)療行業(yè)云平臺(tái)”。同時(shí),國家衛(wèi)健委公開《國家健康醫(yī)療大數(shù)據(jù)標(biāo)準(zhǔn)、安全和服務(wù)管理辦法(試行)》,旨在加強(qiáng)健康醫(yī)療大數(shù)據(jù)服務(wù)管理,促進(jìn)健康醫(yī)療大數(shù)據(jù)的相關(guān)業(yè)務(wù)發(fā)展,發(fā)揮健康醫(yī)療大數(shù)據(jù)的潛在價(jià)值。由此可見,國內(nèi)的健康醫(yī)療大數(shù)據(jù)云平臺(tái)建設(shè)受到政府的大力支持,也吸引了眾多的公司和企業(yè),發(fā)展的越來越迅速。

      2.2 云平臺(tái)計(jì)算框架

      為了對(duì)數(shù)據(jù)進(jìn)行分析處理,實(shí)現(xiàn)分布式計(jì)算,眾多云平臺(tái)得以開發(fā)與使用,其中以2005年開發(fā)的開源計(jì)算平臺(tái)Hadoop最為典型。

      Hadoop是Apache基金會(huì)的核心項(xiàng)目,歷經(jīng)多個(gè)版本的完善,已經(jīng)成為國際上分布式計(jì)算系統(tǒng)的一大標(biāo)準(zhǔn),得益于其開源特性,其技術(shù)生態(tài)圈也得以發(fā)展與豐富,涵蓋大數(shù)據(jù)處理的方方面面[15]。最基礎(chǔ)的Hadoop平臺(tái)根據(jù)Google三篇技術(shù)論文而來,且包括三個(gè)部分:其一采用MapReduce分布式計(jì)算框架;其二根據(jù)Google File System開發(fā)了分布式文件系統(tǒng)(Hadoop Distributed File System,HDFS);其三根據(jù)BigTable開發(fā)了HBase數(shù)據(jù)存儲(chǔ)系統(tǒng)。

      Spark是一個(gè)開源的分布式通用集群計(jì)算框架[16]。Spark提供了一個(gè)使用隱式數(shù)據(jù)并行和容錯(cuò)來編程整個(gè)集群的接口,在Hadoop的基礎(chǔ)上改良了架構(gòu)設(shè)計(jì)。Spark理論上的運(yùn)算速度遠(yuǎn)超Hadoop,最根本的原因在于Hadoop采用硬盤存儲(chǔ)包括源數(shù)據(jù)以及數(shù)據(jù)的處理過程與結(jié)果等所有數(shù)據(jù)信息,而Spark直接使用內(nèi)存來存儲(chǔ)這些數(shù)據(jù)。Spark的缺點(diǎn)在于,內(nèi)存數(shù)據(jù)會(huì)隨斷電問題而缺失,因此不利于處理需要長期存儲(chǔ)的數(shù)據(jù)。

      Apache Storm是一種主要以Clojure編程語言編寫的分布式流處理計(jì)算框架,也是一個(gè)開源項(xiàng)目。它使用自定義創(chuàng)建的“spouts”和“bolt”來定義信息源和操作,以允許批量分布式處理流數(shù)據(jù)。其在Hadoop的基礎(chǔ)上提供了對(duì)于實(shí)時(shí)運(yùn)算的支持,用于實(shí)時(shí)大數(shù)據(jù)流處理。與前兩個(gè)大數(shù)據(jù)處理平臺(tái)不同的是,Strom并不收集和存儲(chǔ)數(shù)據(jù),而是直接利用網(wǎng)絡(luò)實(shí)時(shí)接收流式數(shù)據(jù)并處理,最后通過網(wǎng)絡(luò)再講分析結(jié)果進(jìn)行回傳。

      云計(jì)算技術(shù)發(fā)展至今,Hadoop、Spark和Storm三者是當(dāng)下大數(shù)據(jù)領(lǐng)域最熱門最重要的三大分布式計(jì)算系統(tǒng)。三者都有自己的特點(diǎn),Hadoop適合處理離線的、復(fù)雜的數(shù)據(jù)類型,結(jié)合Spark可以更快速的處理數(shù)據(jù),而Strom的特點(diǎn)就在于實(shí)時(shí)、在線處理。根據(jù)三個(gè)平臺(tái)的特點(diǎn),以及醫(yī)療行業(yè)數(shù)據(jù)的復(fù)雜性,針對(duì)不同的應(yīng)用場景和用途,可以構(gòu)建出不同類型的健康醫(yī)療大數(shù)據(jù)云平臺(tái)或者開發(fā)部署特定用途的大數(shù)據(jù)應(yīng)用。

      2.3 云平臺(tái)的優(yōu)點(diǎn)及其應(yīng)用研究

      目前大部分的健康醫(yī)療大數(shù)據(jù)平臺(tái)以及研究需要,Hadoop平臺(tái)在大數(shù)據(jù)的分布式計(jì)算上具有快速、高效、兼容、靈活等優(yōu)勢。

      (1)能夠高速存儲(chǔ)和處理各種大量的數(shù)據(jù)。由于數(shù)據(jù)的數(shù)量和多樣性,特別是來自社交媒體和互聯(lián)網(wǎng)的數(shù)據(jù)來源不斷增加,這種能力非常重要。

      (2)計(jì)算性能強(qiáng)大。Hadoop的分布式計(jì)算模型可以快速處理大數(shù)據(jù),同時(shí)通過增加計(jì)算用的節(jié)點(diǎn),還可以進(jìn)一步增強(qiáng)其處理能力。

      (3)具備容錯(cuò)功能。保護(hù)數(shù)據(jù)和應(yīng)用程序的處理,使其免受硬件故障的損害。當(dāng)節(jié)點(diǎn)發(fā)生故障時(shí),作業(yè)會(huì)自動(dòng)重定向到另一個(gè)節(jié)點(diǎn),因此分布式計(jì)算永遠(yuǎn)不會(huì)停止。此外,還會(huì)自動(dòng)保存所有數(shù)據(jù)的多個(gè)副本。

      (4)有較好的靈活性。與傳統(tǒng)的數(shù)據(jù)庫不同,不需要在保存之前預(yù)處理數(shù)據(jù),可以根據(jù)需要存儲(chǔ)盡可能多的數(shù)據(jù),后續(xù)再?zèng)Q定如何使用,并且還可以保存非結(jié)構(gòu)化數(shù)據(jù),如文本、圖像、音頻、視頻等。

      (5)低成本。這個(gè)開源框架是免費(fèi)的,可以使用廉價(jià)的通用硬件存儲(chǔ)大量數(shù)據(jù)。

      (6)可伸縮性。只需添加節(jié)點(diǎn)即可擴(kuò)展系統(tǒng)大小,并且可以處理更多數(shù)據(jù)。

      基于Hadoop對(duì)醫(yī)療健康大數(shù)據(jù)進(jìn)行分布式并行處理,Ni等[17]基于Hadoop的分布式計(jì)算方法進(jìn)行醫(yī)療臨床數(shù)據(jù)的處理,將大數(shù)據(jù)技術(shù)應(yīng)用于醫(yī)療保健領(lǐng)域;Yao等[18]提出了一個(gè)基于五節(jié)點(diǎn)Hadoop集群執(zhí)行分布式MapReduce的算法,實(shí)現(xiàn)了醫(yī)療健康大數(shù)據(jù)的高效處理;IstePhan等[19]研究和實(shí)現(xiàn)了能夠挖掘非結(jié)構(gòu)化醫(yī)療數(shù)據(jù)的可擴(kuò)展框架,此框架能夠以可擴(kuò)展方式準(zhǔn)確、高效地分析非結(jié)構(gòu)化醫(yī)療數(shù)據(jù)。

      可以看出,健康醫(yī)療大數(shù)據(jù)的應(yīng)用發(fā)展,離不開云平臺(tái)的幫助,借助于云平臺(tái)的特點(diǎn),能更進(jìn)一步挖掘和利用健康醫(yī)療大數(shù)據(jù),充分發(fā)揮健康醫(yī)療大數(shù)據(jù)的價(jià)值。

      3 健康醫(yī)療大數(shù)據(jù)云平臺(tái)的開發(fā)研究

      圍繞著健康醫(yī)療大數(shù)據(jù)云平臺(tái),有許多的開發(fā)研究,國內(nèi)外有眾多研究都在健康醫(yī)療大數(shù)據(jù)云平臺(tái)上有所貢獻(xiàn)。吳宇皓等[20]設(shè)計(jì)了一個(gè)醫(yī)療大數(shù)據(jù)分析管理系統(tǒng),進(jìn)行面向?qū)ο蟮男枨蠓治?,引入了分布式存?chǔ)及分布式計(jì)算技術(shù),提高數(shù)據(jù)處理效率并且應(yīng)用于臨床科研。廖亮等[21]設(shè)計(jì)了一個(gè)基于Hadoop的健康醫(yī)療大數(shù)據(jù)分析系統(tǒng),提供輔助診斷和醫(yī)療數(shù)據(jù)統(tǒng)計(jì)兩大功能,同時(shí)融合了多節(jié)點(diǎn)分布式計(jì)算技術(shù),可以根據(jù)患者的醫(yī)檢數(shù)據(jù)快速生成初診結(jié)果,并能夠有效地改善傳統(tǒng)醫(yī)療數(shù)據(jù)信息系統(tǒng)分析效率較低的現(xiàn)狀。范煒瑋等[22]提出了一套基于Spark的并行計(jì)算解決方案,完成了醫(yī)療服務(wù)大數(shù)據(jù)交互式分析平臺(tái)的系統(tǒng)架構(gòu)設(shè)計(jì)。阮潤學(xué)[23]實(shí)現(xiàn)了基于心電動(dòng)力學(xué)圖和Storm實(shí)時(shí)流計(jì)算框架的心肌缺血早期診斷平臺(tái),為用戶提供實(shí)時(shí)可靠的計(jì)算服務(wù)。

      發(fā)達(dá)國家在健康醫(yī)療大數(shù)據(jù)平臺(tái)上的研究更成熟,并且在管理和技術(shù)上的改進(jìn)不斷。Khazaei等[24]提出了Artemis醫(yī)療健康大數(shù)據(jù)處理平臺(tái),可用于在線分析快速生成的大量臨床數(shù)據(jù),并且可以根據(jù)需要豐富其他臨床數(shù)據(jù),實(shí)現(xiàn)多患者、多流和多診斷的實(shí)時(shí)決策支持和臨床研究。Kaur等[25]提出了一種醫(yī)療保健領(lǐng)域的大數(shù)據(jù)架構(gòu),使用機(jī)器學(xué)習(xí)算法實(shí)時(shí)分析來自醫(yī)院的電子健康記錄,為早期預(yù)測個(gè)體健康狀況提供幫助。另外,Rahman等[26]提出了一種基于開源技術(shù)的新型大數(shù)據(jù)架構(gòu),詳細(xì)描述了系統(tǒng)所需的不同模塊的設(shè)計(jì)以及所使用的技術(shù),通過修改和定制模塊以處理醫(yī)療保健數(shù)據(jù),可以快速構(gòu)建實(shí)用有效的大數(shù)據(jù)解決方案,以解決不同的醫(yī)療挑戰(zhàn)。

      4 健康醫(yī)療大數(shù)據(jù)云平臺(tái)面臨的問題與對(duì)應(yīng)策略

      目前健康醫(yī)療大數(shù)據(jù)云平臺(tái)的建設(shè)有所成效,但不可避免地面臨著一些挑戰(zhàn)與問題。

      4.1 安全與隱私問題

      身處于大數(shù)據(jù)時(shí)代,數(shù)據(jù)的安全及隱私更是重中之重,數(shù)據(jù)的保密和安全性受到重大考驗(yàn)。根據(jù)相關(guān)統(tǒng)計(jì)顯示,僅在2018年,全球便發(fā)生了十余起10萬以上數(shù)據(jù)泄漏事件[27]。目前全國共有大約657家智慧醫(yī)療云平臺(tái),主分布如圖3所示,然而大部分的平臺(tái)都沒有做好平臺(tái)的安全管理和防范。根據(jù)網(wǎng)信辦對(duì)其中79家的抽查結(jié)果顯示,57家平臺(tái)有高危漏洞,13家平臺(tái)有中危漏洞,近90%的醫(yī)療機(jī)構(gòu)都存在較為嚴(yán)重的安全風(fēng)險(xiǎn)。以云平臺(tái)為基礎(chǔ),會(huì)有海量的醫(yī)療數(shù)據(jù)的錄入,而這些數(shù)據(jù)涉及到個(gè)人安全與隱私,在高效利用醫(yī)療數(shù)據(jù)實(shí)現(xiàn)健康管理的過程同時(shí),也要保證平臺(tái)的安全性,避免數(shù)據(jù)的損失或泄露。

      圖3 智慧醫(yī)療云平臺(tái)主分布

      針對(duì)云平臺(tái)的隱私安全問題,一方面要加強(qiáng)信息安全技術(shù)的應(yīng)用,比如數(shù)據(jù)加密、數(shù)據(jù)擾亂、數(shù)據(jù)隱匿等技術(shù),隱藏保護(hù)關(guān)鍵敏感信息,對(duì)數(shù)據(jù)進(jìn)行分級(jí)保護(hù),設(shè)置訪問權(quán)限。另一方面要加強(qiáng)管理制度,建立健康醫(yī)療大數(shù)據(jù)安全管理的規(guī)則、模式與流程,提高云平臺(tái)的監(jiān)測預(yù)警和應(yīng)對(duì)能力。Mohammed等[28]提出了一個(gè)安全和私密的醫(yī)療數(shù)據(jù)管理框架,解決了外包醫(yī)療數(shù)據(jù)庫管理中的安全和隱私問題;Wimmer等[29]研究的隱私保護(hù)技術(shù)能夠同時(shí)滿足多個(gè)醫(yī)療數(shù)據(jù)共享方的隱私保護(hù)需求。

      4.2 信息利用率問題

      大數(shù)據(jù)時(shí)代是一個(gè)信息膨脹期,近幾年所產(chǎn)生的信息量甚至超過過去幾千年,如今數(shù)據(jù)規(guī)模龐大,數(shù)據(jù)流轉(zhuǎn)非常迅速,數(shù)據(jù)類型也豐富多樣,然而如何在這海量的數(shù)據(jù)之中挖掘出有價(jià)值的信息是一個(gè)難點(diǎn)。健康醫(yī)療大數(shù)據(jù)云平臺(tái)不僅要對(duì)醫(yī)療數(shù)據(jù)進(jìn)行收集、管理,更關(guān)鍵的是如何進(jìn)行計(jì)算和分析,實(shí)現(xiàn)信息的有效使用,能產(chǎn)生實(shí)際應(yīng)用的價(jià)值。若僅僅將云平臺(tái)當(dāng)成一個(gè)存儲(chǔ)醫(yī)療數(shù)據(jù)的方式,而不對(duì)數(shù)據(jù)進(jìn)行有目的的分析處理,發(fā)掘相關(guān)知識(shí)并實(shí)際應(yīng)用,就喪失了意義。對(duì)于健康醫(yī)療領(lǐng)域來說,不僅需要揭示現(xiàn)有事物的聯(lián)系,最好能從大數(shù)據(jù)的分析結(jié)果提取相關(guān)醫(yī)學(xué)知識(shí),更進(jìn)一步將從數(shù)據(jù)挖掘結(jié)果中提取的醫(yī)學(xué)知識(shí)轉(zhuǎn)化為具體應(yīng)用。為了提高信息利用率,一方面可以加強(qiáng)數(shù)據(jù)挖掘技術(shù)的應(yīng)用,如Mccormick等[30]對(duì)如何從挖掘成果中提取相關(guān)知識(shí)進(jìn)行了初步探索。另一方面可以拓展更多的研究主題,目前以臨床領(lǐng)域的研究居多,其他領(lǐng)域研究相對(duì)較少,充分發(fā)揮信息的價(jià)值。

      4.3 數(shù)據(jù)質(zhì)量與標(biāo)準(zhǔn)問題

      醫(yī)療數(shù)據(jù)的采集和發(fā)布渠道眾多,數(shù)據(jù)的真實(shí)性和質(zhì)量難以保證,醫(yī)療信息檔案不完善,醫(yī)療信息化缺乏一個(gè)統(tǒng)一標(biāo)準(zhǔn),都會(huì)影響到對(duì)數(shù)據(jù)的分析,無法保證分析結(jié)果的準(zhǔn)確性和有效性。

      要提升數(shù)據(jù)質(zhì)量,就需要建立健全的信息管理機(jī)制,制定信息收集的標(biāo)準(zhǔn)和規(guī)范。而對(duì)于已收集的數(shù)據(jù),可以使用交叉驗(yàn)證等技術(shù)手段進(jìn)行驗(yàn)證,建立雙重保險(xiǎn),保證數(shù)據(jù)的真實(shí)性、準(zhǔn)確性和有效性,有效提高數(shù)據(jù)質(zhì)量。

      除此之外,作為一項(xiàng)跨學(xué)科的研究,研究過程存在一定難度,專業(yè)人才較為稀缺,傳統(tǒng)的醫(yī)療系統(tǒng)數(shù)據(jù)管制體系也導(dǎo)致了醫(yī)療健康大數(shù)據(jù)難以獲取、醫(yī)療信息孤島等問題,需要我們加強(qiáng)相關(guān)人才培養(yǎng)和引進(jìn),緊跟相關(guān)政策,促進(jìn)健康醫(yī)療大數(shù)據(jù)的發(fā)展。

      5 總結(jié)與展望

      本文首先介紹了醫(yī)療行業(yè)中大數(shù)據(jù)的來源和特點(diǎn),針對(duì)健康醫(yī)療大數(shù)據(jù),對(duì)能充分發(fā)揮健康醫(yī)療大數(shù)據(jù)價(jià)值的云平臺(tái)進(jìn)行了介紹,討論了Hadoop、Spark、Storm三種數(shù)據(jù)處理平臺(tái)的區(qū)別和應(yīng)用,并且分析了各自的優(yōu)勢,Hadoop適合處理大量離線、復(fù)雜的數(shù)據(jù),Spark可以加快數(shù)據(jù)的處理,Strom適合實(shí)時(shí)、在線處理數(shù)據(jù),舉例分析了國內(nèi)外健康醫(yī)療大數(shù)據(jù)平臺(tái)的研究進(jìn)展,最后總結(jié)了健康醫(yī)療大數(shù)據(jù)云平臺(tái)存在的一些問題以及相應(yīng)的對(duì)策研究。健康醫(yī)療大數(shù)據(jù)的發(fā)展與云平臺(tái)息息相關(guān),健康醫(yī)療大數(shù)據(jù)云平臺(tái)不僅能提供醫(yī)療數(shù)據(jù)的海量存儲(chǔ),平臺(tái)的可擴(kuò)展性與靈活性也能提供更高效便捷的醫(yī)療服務(wù),優(yōu)秀的計(jì)算能力更能使健康醫(yī)療大數(shù)據(jù)得到進(jìn)一步的分析處理和應(yīng)用,只要能結(jié)合國內(nèi)相關(guān)政策的支持,保障健康醫(yī)療大數(shù)據(jù)云平臺(tái)的規(guī)范與安全,基于云平臺(tái)建立完善一個(gè)完善的健康醫(yī)療大數(shù)據(jù)管理體制,一定能有效促進(jìn)臨床決策、遠(yuǎn)程醫(yī)療、電子檔案分析與公共健康等各個(gè)方面的醫(yī)療行業(yè)的發(fā)展。

      猜你喜歡
      醫(yī)療
      醫(yī)療UDI
      《現(xiàn)代儀器與醫(yī)療》2022年征訂回執(zhí)
      醫(yī)療合同中醫(yī)方違約責(zé)任的判定
      京張醫(yī)療聯(lián)合的成功之路
      我們?cè)鯓永斫忉t(yī)療創(chuàng)新
      遇到疾病,如何醫(yī)療
      醫(yī)療扶貧至關(guān)重要
      精準(zhǔn)醫(yī)療蓄勢待發(fā)
      推進(jìn)醫(yī)療責(zé)任保險(xiǎn)當(dāng)立法
      讓法治擁抱醫(yī)療
      通化市| 宁武县| 安岳县| 天峻县| 大姚县| 历史| 颍上县| 石台县| 沾化县| 阜南县| 涿州市| 太仓市| 哈尔滨市| 农安县| 杭锦后旗| 乌海市| 曲周县| 定兴县| 论坛| 蓝田县| 灵武市| 泸水县| 大英县| 长垣县| 崇义县| 太仆寺旗| 三亚市| 崇仁县| 库伦旗| 米林县| 邵阳县| 马尔康县| 南康市| 新平| 南阳市| 若尔盖县| 山丹县| 泰兴市| 阿拉善左旗| 临潭县| 漳浦县|