張怡++李柯
摘要:隨著衛(wèi)生信息化建設(shè)進(jìn)程的不斷加快,醫(yī)療衛(wèi)生領(lǐng)域也進(jìn)入了“大數(shù)據(jù)時(shí)代”。該文介紹了大數(shù)據(jù)的定義、醫(yī)療大數(shù)據(jù)的來源,并分析了醫(yī)療領(lǐng)域中的幾個(gè)重要角色包括醫(yī)療機(jī)構(gòu)、衛(wèi)生行政部門等對(duì)大數(shù)據(jù)分析的應(yīng)用前景。
關(guān)鍵詞:大數(shù)據(jù);醫(yī)療衛(wèi)生;應(yīng)用前景
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)21-0010-02
Application of Big Data in the Role of Medical Field
ZHANG Yi,LI Ke
(Wuxi Peoples Hospital, Affiliated with NanJing Medical University, Wuxi 214000, China)
Abstract: With the rapid development of hygienic information construction,medical health field has already entered into “big data era”. The paper introduces the concept of big data, describes the source of medical big data, and analyzes the important roles in the medical field the application prospects in big data era.
Key words: big data; healthcare; application prospects
近幾年來,大數(shù)據(jù)應(yīng)用在科技界、產(chǎn)業(yè)界和政府部門都成為研究熱點(diǎn)。2008年《Nature》出版???Big Data” [1],2011年《Science》推出關(guān)于數(shù)據(jù)處理的??癉ealing with data” [2],2012年3月奧巴馬宣布美國政府投資2億美元啟動(dòng)“大數(shù)據(jù)研究和發(fā)展計(jì)劃” [3]。美國政府認(rèn)為大數(shù)據(jù)是“未來的新石油”,將給未來的科技與經(jīng)濟(jì)發(fā)展帶來深遠(yuǎn)影響,并將“大數(shù)據(jù)研究”上升為國家意志。大數(shù)據(jù)之所以如此受關(guān)注,主要是因?yàn)榇髷?shù)據(jù)中隱藏著具有豐富價(jià)值的信息,通過數(shù)據(jù)挖掘等手段對(duì)這些數(shù)據(jù)進(jìn)行專業(yè)的分析,可以挖掘出信息價(jià)值來實(shí)現(xiàn)數(shù)據(jù)的“增值”。
醫(yī)療衛(wèi)生領(lǐng)域也進(jìn)入了“大數(shù)據(jù)時(shí)代”,我國衛(wèi)生行政部門近幾年大力推進(jìn)以健康檔案、電子病歷和公共服務(wù)信息平臺(tái)為基礎(chǔ)的區(qū)域衛(wèi)生信息化建設(shè)工作,醫(yī)療信息系統(tǒng)的深入應(yīng)用和醫(yī)療儀器和設(shè)備的數(shù)字化使得醫(yī)療數(shù)據(jù)在類型和規(guī)模上都迅速增長。這些積累起來的數(shù)據(jù)是寶貴的醫(yī)療衛(wèi)生信息,用信息化的大數(shù)據(jù)手段對(duì)這些數(shù)據(jù)進(jìn)行挖掘和分析,將會(huì)對(duì)醫(yī)療衛(wèi)生行業(yè)的診療、科研、管理、服務(wù)等都具有重要價(jià)值。
1 大數(shù)據(jù)定義
大數(shù)據(jù)科學(xué)家John Rauser給出了一個(gè)簡單的定義:大數(shù)據(jù)是任何超過一臺(tái)計(jì)算機(jī)處理能力的數(shù)據(jù)量。大數(shù)據(jù)有四個(gè)特征來定義,一般稱之為4V,即:1)Volume大量化,海量的數(shù)據(jù)規(guī)模;2)Velocity快速化,數(shù)據(jù)被創(chuàng)建和移動(dòng)的速度,以及數(shù)據(jù)實(shí)時(shí)處理的要求;3)Variety多樣化,種類多數(shù)據(jù)類型繁多,來源廣泛,既包括數(shù)值型,也包括文字、圖形、圖像、音頻等非數(shù)值型或者非結(jié)構(gòu)化數(shù)據(jù);4)Value價(jià)值化,通過深入的大數(shù)據(jù)分析挖掘,可以為各方面的經(jīng)營決策提供有效支持,創(chuàng)造經(jīng)濟(jì)及社會(huì)價(jià)值[4]。
關(guān)于大數(shù)據(jù)的應(yīng)用,“大數(shù)據(jù)商業(yè)應(yīng)用第一人”維克托·邁爾-舍恩伯格在其《大數(shù)據(jù)時(shí)代》一書中舉例甚多,主要是通過找出一個(gè)關(guān)聯(lián)物并監(jiān)控它,就可以預(yù)測(cè)未來。比如Google如何利用搜索記錄進(jìn)行數(shù)據(jù)挖掘從而預(yù)測(cè)流感爆發(fā)趨勢(shì),亞馬遜商店利用購買和瀏覽記錄數(shù)據(jù)進(jìn)行針對(duì)性地購買推薦以提升其銷售量等[5]。大數(shù)據(jù)的本質(zhì)不在于更多更快的數(shù)據(jù),而在于對(duì)數(shù)據(jù)中蘊(yùn)含信息價(jià)值的巨大掌控和應(yīng)用能力,更好地認(rèn)識(shí)數(shù)據(jù)中所蘊(yùn)含的巨大信息價(jià)值。
2 醫(yī)療大數(shù)據(jù)來源
醫(yī)療大數(shù)據(jù)指的是在醫(yī)療行業(yè)中產(chǎn)生的數(shù)據(jù),主要有以下四個(gè)來源: 1)臨床實(shí)驗(yàn)室數(shù)據(jù):醫(yī)療機(jī)構(gòu)的信息系統(tǒng)多而復(fù)雜,數(shù)據(jù)增長非???,一張CT圖像含有大約150MB的數(shù)據(jù),一個(gè)標(biāo)準(zhǔn)的病理圖接近5GB,以此計(jì)算,僅一個(gè)社區(qū)醫(yī)院的數(shù)據(jù)量就可達(dá)數(shù)TB甚至數(shù)PB之多。2)生命科學(xué)與制藥:藥物研發(fā)是密集型的過程,中小型的制藥企業(yè)產(chǎn)生的數(shù)據(jù)也在TB以上。在生命科學(xué)領(lǐng)域,DNA、基因序列、生物芯片等每時(shí)每刻都在產(chǎn)生新的數(shù)據(jù),比如說,DNA測(cè)序每年產(chǎn)生的數(shù)據(jù)都在PB級(jí)以上。3)費(fèi)用報(bào)銷:患者在就醫(yī)過程中產(chǎn)生的費(fèi)用、報(bào)銷、保險(xiǎn)理賠等信息。4)個(gè)體健康信息:移動(dòng)可穿戴設(shè)備正在不斷普及,個(gè)體健康信息都能連入互聯(lián)網(wǎng),由此產(chǎn)生海量數(shù)據(jù) [6]。
3大數(shù)據(jù)應(yīng)用角色
醫(yī)療領(lǐng)域中包含多個(gè)重要角色:1)醫(yī)療服務(wù)提供方,比如公立醫(yī)院、私立醫(yī)院、社區(qū)醫(yī)院等醫(yī)療機(jī)構(gòu);2)醫(yī)療政策制定和監(jiān)管方,比如衛(wèi)計(jì)委和地方各級(jí)衛(wèi)生廳局;3)醫(yī)療服務(wù)和產(chǎn)品的支付方,比如社會(huì)保險(xiǎn)以及商業(yè)保險(xiǎn)公司;4)醫(yī)藥和醫(yī)療產(chǎn)品生產(chǎn)和銷售方,比如藥企、醫(yī)療器械企業(yè)、藥店等;5)面向消費(fèi)者健康的產(chǎn)品生產(chǎn)和服務(wù)提供方,比如運(yùn)動(dòng)健康管理產(chǎn)品和服務(wù)提供商。如圖1所示:
圖1 醫(yī)療行業(yè)主要角色
醫(yī)療機(jī)構(gòu)如各級(jí)醫(yī)院積累了大量的醫(yī)療數(shù)據(jù),HIS(醫(yī)院信息管理系統(tǒng))、電子病歷、LIS(實(shí)驗(yàn)室信息系統(tǒng))、PACS(影像歸檔和通信系統(tǒng))以及體檢系統(tǒng)等幾乎每分每秒都在產(chǎn)生電子化數(shù)據(jù),一張CT圖像就含有大約150MB的數(shù)據(jù),數(shù)據(jù)量從TB到PB發(fā)展,醫(yī)療服務(wù)方所面臨的重要挑戰(zhàn)就是如何有效利用這些海量的醫(yī)療大數(shù)據(jù)為醫(yī)療衛(wèi)生行業(yè)的診斷、治療、科研、管理等服務(wù)。臨床決策支持系統(tǒng)、遠(yuǎn)程監(jiān)護(hù)醫(yī)療、個(gè)性化診療等都是醫(yī)療大數(shù)據(jù)領(lǐng)域的關(guān)注熱點(diǎn)。
各地衛(wèi)生主管部門都在發(fā)展區(qū)域醫(yī)療信息的共享,建設(shè)區(qū)域衛(wèi)生信息平臺(tái),平臺(tái)整合了各醫(yī)療衛(wèi)生機(jī)構(gòu)的部分?jǐn)?shù)據(jù)來實(shí)現(xiàn)數(shù)據(jù)共享,還通過自己的直報(bào)系統(tǒng)搜羅各地衛(wèi)生數(shù)據(jù),用專業(yè)的手段對(duì)這些數(shù)據(jù)進(jìn)行分析,可以對(duì)流行病、慢性病等疾病進(jìn)行趨勢(shì)分析和預(yù)警,從而制定防治、干預(yù)計(jì)劃防止疾病爆發(fā)及蔓延,履行衛(wèi)生主管部門政策制定和監(jiān)管職能。
政府醫(yī)療保險(xiǎn)機(jī)構(gòu)和商業(yè)保險(xiǎn)公司作為醫(yī)療支付方積累了病人理賠信息,涉及病人診斷、費(fèi)用、報(bào)銷及支付情況等相關(guān)數(shù)據(jù)。醫(yī)療支付方可以借這些數(shù)據(jù)來了解各種疾病的治療情況和費(fèi)用情況,通過大數(shù)據(jù)手段得到的分析結(jié)果可以幫助實(shí)現(xiàn)理賠運(yùn)營的精細(xì)化管理,為客戶定制保險(xiǎn)增值服務(wù),指導(dǎo)市場(chǎng)銷售和推廣。
醫(yī)藥研發(fā)企業(yè)通過收集臨床實(shí)驗(yàn)前期和結(jié)果的數(shù)據(jù),使用預(yù)測(cè)建??梢栽u(píng)價(jià)新藥的安全性、有效性、潛在的副作用以及整體的試驗(yàn)結(jié)果,降低研發(fā)成本,提高研發(fā)效率,幫助醫(yī)藥研發(fā)部門或企業(yè)提早將新藥推向市場(chǎng),最終受益于患者。
近幾年,醫(yī)療行業(yè)涌現(xiàn)出很多面向消費(fèi)者健康及運(yùn)動(dòng)的產(chǎn)品,他們通過可穿戴設(shè)備來記錄消費(fèi)者日?;顒?dòng)和生理指標(biāo),由此生成大量數(shù)字化信息,這也逐漸成為醫(yī)療大數(shù)據(jù)中的一大成員。
4 大數(shù)據(jù)應(yīng)用場(chǎng)景
各個(gè)角色都期待著借助有效的分析手段來挖掘大數(shù)據(jù)中蘊(yùn)含的價(jià)值,下面列舉了醫(yī)療機(jī)構(gòu)、衛(wèi)生行政部門、醫(yī)藥研發(fā)企業(yè)三個(gè)角色中大數(shù)據(jù)的典型應(yīng)用加以簡單介紹。
4.1 臨床決策支持系統(tǒng)
在傳統(tǒng)的診療過程中,醫(yī)生依靠實(shí)踐經(jīng)驗(yàn)、各項(xiàng)診斷指標(biāo)以及檢查檢驗(yàn)結(jié)果對(duì)疾病進(jìn)行診斷和治療,醫(yī)生的決策關(guān)系到病人的安危。臨床決策支持系統(tǒng)將醫(yī)學(xué)知識(shí)與臨床數(shù)據(jù)相結(jié)合,通過數(shù)據(jù)分析可以為臨床醫(yī)生提供大量的醫(yī)學(xué)知識(shí)和決策,臨床醫(yī)生可以在此基礎(chǔ)上進(jìn)行準(zhǔn)確診斷、選擇最佳的治療方案。同時(shí)系統(tǒng)還能通過比較醫(yī)生處方和醫(yī)療專家?guī)灬t(yī)學(xué)指導(dǎo),提醒醫(yī)生如過度使用抗菌藥物、藥品不良反應(yīng)等,從而有效降低醫(yī)療風(fēng)險(xiǎn)。
大數(shù)據(jù)分析技術(shù)不僅對(duì)結(jié)構(gòu)化數(shù)據(jù)有很強(qiáng)的處理能力,對(duì)非結(jié)構(gòu)化數(shù)據(jù)的分析能力也日益加強(qiáng),比如醫(yī)療影像(X光片、CT、MRI)數(shù)據(jù)可以使用圖像識(shí)別技術(shù)來分析,從而使得臨床決策支持系統(tǒng)更加智能,給醫(yī)生提供更合理的診療建議。
4.2 疫情監(jiān)測(cè)
大數(shù)據(jù)技術(shù)也可以用于疫情監(jiān)測(cè)。自從國家傳染病與突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)直報(bào)系統(tǒng)投入運(yùn)行后,每年有600多萬的個(gè)案信息由全國各地上報(bào)并存儲(chǔ),現(xiàn)在網(wǎng)絡(luò)直報(bào)系統(tǒng)覆蓋了全國所有縣級(jí)以上疾控機(jī)構(gòu)。上報(bào)的海量數(shù)據(jù)通過大數(shù)據(jù)技術(shù)能夠進(jìn)行全面的疫情監(jiān)測(cè)和分析,并通過集成疾病監(jiān)測(cè)和響應(yīng)程序,預(yù)測(cè)傳播途徑和時(shí)間,以便采取有力的措施降低疾病感染率,防止疫情爆發(fā) [7]。
谷歌公司對(duì)流感的準(zhǔn)確預(yù)測(cè)就是運(yùn)用大數(shù)據(jù)技術(shù)的成功案例。谷歌公司把美國人在網(wǎng)絡(luò)上頻繁使用的檢索關(guān)鍵字,與美國疾控中心流感傳播時(shí)期的數(shù)據(jù)進(jìn)行比較,通過大數(shù)據(jù)分析可以辨別出人們是否感染了流感。人們使用特定的檢索關(guān)鍵字,如“治療咳嗽和發(fā)熱的藥物”是為了在網(wǎng)絡(luò)上得到關(guān)于治療流感的信息[8],這樣通過特定檢索詞條的使用頻率與流感在傳播的時(shí)間和空間上建立聯(lián)系,能夠監(jiān)測(cè)流感傳播的路徑,而且他們的判斷非常及時(shí),比美國疾控中心的數(shù)據(jù)早一周以上的時(shí)間。
4.3醫(yī)藥研發(fā)
醫(yī)藥產(chǎn)品公司在大數(shù)據(jù)方面的應(yīng)用主要體現(xiàn)在醫(yī)藥研發(fā)方面,通過用大數(shù)據(jù)分析可以提高藥品研發(fā)效率,加快新藥研發(fā)入市。以往一種新藥從研發(fā)到推向市場(chǎng)大約需要13年,通過使用大數(shù)據(jù)預(yù)測(cè)模型可以縮短3-5年。在研發(fā)新藥物之前,可以通過數(shù)據(jù)建模和分析公眾對(duì)疾病藥品的需求趨勢(shì),從而確定最有效率的投入產(chǎn)出比,配備合理的資源組合,一定程度上降低研發(fā)成本。在藥物研發(fā)階段,通過搜集臨床實(shí)驗(yàn)前期和結(jié)果的數(shù)據(jù),可以評(píng)價(jià)新藥的有效性、安全性以及潛在的副作用。藥物試驗(yàn)階段,分析病人數(shù)據(jù)可以評(píng)估招募患者是否符合試驗(yàn)條件,幫助提升臨床實(shí)驗(yàn)的效率;通過分析臨床試驗(yàn)數(shù)據(jù)和病人記錄,可以確定藥品更多適應(yīng)證或副作用[9] [10] 。
5 結(jié)束語
大數(shù)據(jù)分析是各行各業(yè)的研究熱點(diǎn),對(duì)醫(yī)療衛(wèi)生領(lǐng)域也將產(chǎn)生巨大的影響和推動(dòng)作用,各個(gè)角色都期待大數(shù)據(jù)來解決以往無法解決的一些問題和難點(diǎn),然而如何利用好大數(shù)據(jù)有效發(fā)揮其作用還存在很多挑戰(zhàn),比如數(shù)據(jù)的整合、存儲(chǔ)、挖掘和安全保護(hù)等。大數(shù)據(jù)是一把雙刃劍,我們?cè)谡J(rèn)識(shí)到大數(shù)據(jù)帶來機(jī)遇的同時(shí),也要認(rèn)識(shí)到大數(shù)據(jù)可能帶來的風(fēng)險(xiǎn)。
參考文獻(xiàn):
[1] Lunch C. Big data:How do your data grow?[J]. Nature,2008,455(7209): 28-29.
[2] Kum HC,Ahalt S,Carsey TM. Dealing with data:governments records[J]. Science,2011,332(6035):1263.
[3] 李國杰,程雪旗.大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域-大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J].中國科學(xué)院院刊,2012,27(6):647-657.
[4] 劉曉亮,王坤,馬軍. 大數(shù)據(jù)時(shí)代的衛(wèi)生信息化建設(shè)思考[J].中國衛(wèi)生信息管理雜志,2014,11(1):43-46.
[5] 維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時(shí)代[M].杭州:浙江人民出版社,2013.
[6] 蔡佳慧,張濤,宗文紅.醫(yī)療大數(shù)據(jù)面臨的挑戰(zhàn)及思考[J].中國衛(wèi)生信息管理雜志,2013,10(4):292-295.
[7] 張昌明,朱紅.大數(shù)據(jù)及其在醫(yī)療領(lǐng)域的應(yīng)用[J].中國醫(yī)學(xué)教育技術(shù),2015,29(3):294-297.
[8] 相海泉.迎接大數(shù)據(jù)時(shí)代[J].中國信息界:e醫(yī)療,2013(5):38-39.
[9] 王永炎,謝雁鳴,王志飛.大數(shù)據(jù)時(shí)代中藥上市后數(shù)據(jù)的整合與應(yīng)用[J]. 中國中藥雜志,2013,59(18):2917-2918.
[10] Szlezak N,Evers M,Wang J,et al.The role of big data and advanced analytics in drug discovery,development,andcommercialization[J]. Clin Pharmacol Ther,2014,95(5):492-495.