,
隨著信息技術(shù)的發(fā)展,大數(shù)據(jù)成為新時(shí)代的代言詞,并被給予“未來新石油”的評(píng)價(jià)。對(duì)大數(shù)據(jù)的開發(fā)利用已成為國(guó)際競(jìng)爭(zhēng)及國(guó)家整體實(shí)力的重要體現(xiàn),世界各國(guó)先后制定和實(shí)施了大數(shù)據(jù)相關(guān)的戰(zhàn)略計(jì)劃,在醫(yī)療衛(wèi)生領(lǐng)域大數(shù)據(jù)的研究應(yīng)用也逐漸增多。
美國(guó)是大數(shù)據(jù)發(fā)展的引領(lǐng)者,2013年5月,奧巴馬政府宣布了“大數(shù)據(jù)的研究和發(fā)展計(jì)劃”,希望利用大數(shù)據(jù)在生物醫(yī)藥、科研教學(xué)、環(huán)境保護(hù)、工程技術(shù)、國(guó)土安全等領(lǐng)域?qū)崿F(xiàn)突破。2012年7月,英國(guó)商業(yè)創(chuàng)新技能部成立數(shù)據(jù)戰(zhàn)略委員會(huì),2013年即投資1.89億英鎊,其建成的英國(guó)國(guó)民醫(yī)療服務(wù)系統(tǒng)(National Health Service)擁有龐大而完備的英國(guó)醫(yī)療數(shù)據(jù),被英國(guó)社會(huì)譽(yù)為20世紀(jì)最偉大的成就[1]。2013年6月,日本安倍內(nèi)閣正式宣布了新IT戰(zhàn)略,即“創(chuàng)建最尖端IT國(guó)家宣言”,將大數(shù)據(jù)應(yīng)用于新醫(yī)療技術(shù)開發(fā)、社會(huì)化媒體等智能技術(shù)開發(fā)、傳統(tǒng)產(chǎn)業(yè)IT創(chuàng)新等公共領(lǐng)域。同年,韓國(guó)數(shù)據(jù)庫研究院與韓國(guó)國(guó)名健康保險(xiǎn)公司公司合作完成了國(guó)名健康數(shù)據(jù)認(rèn)證(DQC-V)和國(guó)民健康數(shù)據(jù)管理認(rèn)證(DQC-M)兩個(gè)系統(tǒng)的建設(shè)工作,憑借該數(shù)據(jù)庫,可以對(duì)1.3億條全體國(guó)民醫(yī)療信息進(jìn)行管理[2]。此外,德國(guó)、法國(guó)、歐洲多國(guó)也展開了大數(shù)據(jù)建設(shè)。
2013年,我國(guó)發(fā)改委與中科院?jiǎn)?dòng)了“基礎(chǔ)研究大數(shù)據(jù)服務(wù)平臺(tái)應(yīng)用示范項(xiàng)目”;2014年《政府工作報(bào)告》明確提出,設(shè)立新興產(chǎn)業(yè)創(chuàng)業(yè)創(chuàng)新平臺(tái),在大數(shù)據(jù)等方面趕超先進(jìn),引領(lǐng)未來產(chǎn)業(yè)發(fā)展;2015年第十二屆全國(guó)人民代表大會(huì)提出“互聯(lián)網(wǎng)+”,進(jìn)一步推進(jìn)大數(shù)據(jù)的發(fā)展。我國(guó)正處于醫(yī)療改革,衛(wèi)生信息化建設(shè)的關(guān)鍵時(shí)期,2015年3月國(guó)家衛(wèi)生計(jì)生委網(wǎng)絡(luò)安全和信息化工作組全體會(huì)議明確提出將積極推進(jìn)健康醫(yī)療大數(shù)據(jù)應(yīng)用示范,研究制定促進(jìn)健康醫(yī)療大數(shù)據(jù)應(yīng)用的指導(dǎo)意見,健全完善國(guó)家衛(wèi)生計(jì)生統(tǒng)計(jì)制度,推動(dòng)健康醫(yī)療大數(shù)據(jù)依法有序安全開放??梢姡t(yī)療大數(shù)據(jù)的“春天”已經(jīng)來臨,衛(wèi)生信息化進(jìn)程將加快。
大數(shù)據(jù)通常是指所涉及的資料容量規(guī)模巨大到無法通過目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理并整理成為人類所能解讀的信息,具有容量大、多樣性、速度快、價(jià)值高的特點(diǎn)。醫(yī)療大數(shù)據(jù)由大數(shù)據(jù)衍生而來,是指在一切與健康相關(guān)的活動(dòng)中產(chǎn)生的所有與生命健康和醫(yī)療相關(guān)的數(shù)據(jù)。除了擁有大數(shù)據(jù)的特點(diǎn)外,還具有以下5個(gè)特點(diǎn)。
在整個(gè)醫(yī)療行為中,雖然各種數(shù)據(jù)的記錄都以患者為中心,但不同數(shù)據(jù)使用者(如醫(yī)生、護(hù)士、醫(yī)技)所需信息不一、要求不一,我們不可能針對(duì)不同對(duì)象分別采取不同的格式記錄患者信息,只有依靠需求者自己摘取,導(dǎo)致醫(yī)療數(shù)據(jù)具有多維度的特點(diǎn)。
醫(yī)學(xué)中常見一詞多義、多詞一義現(xiàn)象,并且隨著醫(yī)學(xué)發(fā)展,醫(yī)學(xué)術(shù)語更新快速,各術(shù)語集不斷更新版本,再加上醫(yī)院信息系統(tǒng)不同、標(biāo)準(zhǔn)不統(tǒng)一等原因,導(dǎo)致醫(yī)學(xué)術(shù)語復(fù)雜,數(shù)據(jù)獲取困難,在我國(guó)中醫(yī)藥大數(shù)據(jù)發(fā)展方面尤為明顯。
大量醫(yī)療數(shù)據(jù)來源于醫(yī)務(wù)人員人工記錄,搜集者和處理者往往不同,導(dǎo)致數(shù)據(jù)記錄出現(xiàn)偏差和殘缺;而隨訪丟失,許多數(shù)據(jù)的表達(dá)不確定,造成了醫(yī)療大數(shù)據(jù)的不完整性。
病人初次就診、治療、復(fù)查,疾病的發(fā)生、發(fā)展、治愈或死亡,醫(yī)學(xué)檢測(cè)的波形、圖像都是時(shí)間函數(shù),各數(shù)據(jù)產(chǎn)生都具有一定的時(shí)序性。
我國(guó)信息化建設(shè)尚未完成,信息孤島、煙囪還普遍存在,一人在不同醫(yī)療機(jī)構(gòu)就診會(huì)產(chǎn)生相同醫(yī)療數(shù)據(jù),同一醫(yī)療機(jī)構(gòu)也存儲(chǔ)大量重復(fù)、無關(guān)緊要的信息。
醫(yī)療服務(wù)方主要指開展疾病診斷、治療活動(dòng)的衛(wèi)生機(jī)構(gòu)(圖1)。這些機(jī)構(gòu)各信息系統(tǒng)產(chǎn)生的數(shù)據(jù)由醫(yī)務(wù)人員以醫(yī)學(xué)專業(yè)方式所記錄,是最原始的臨床記錄,包括記錄不完整或錯(cuò)誤的數(shù)據(jù),都具有價(jià)值,都可能隱藏了有待發(fā)掘和利用的重要醫(yī)學(xué)信息。除此之外,還有醫(yī)院運(yùn)營(yíng)產(chǎn)生的數(shù)據(jù)。
圖1 醫(yī)療服務(wù)機(jī)構(gòu)數(shù)據(jù)來源
醫(yī)療保險(xiǎn)大數(shù)據(jù)主要來源于醫(yī)療保險(xiǎn)部門和商業(yè)保險(xiǎn)公司。我國(guó)基本醫(yī)療(新農(nóng)合、城鎮(zhèn)居民、城鎮(zhèn)職工)保險(xiǎn)參保人數(shù)超過13億,覆蓋率在95%以上[3],各商業(yè)健康保險(xiǎn)隨著人們健康意識(shí)的增強(qiáng)購(gòu)買率也增加?;颊咴诰歪t(yī)過程中將產(chǎn)生大量的費(fèi)用信息、報(bào)銷信息,使醫(yī)療保險(xiǎn)部門和商業(yè)保險(xiǎn)公司積累了大量病種、費(fèi)用等數(shù)據(jù)。
各醫(yī)療機(jī)構(gòu)通過統(tǒng)計(jì)直報(bào)系統(tǒng)上報(bào)的疾病、手術(shù)、醫(yī)院業(yè)務(wù)、衛(wèi)生人力等數(shù)據(jù)形成衛(wèi)生資源與衛(wèi)生服務(wù)利用、疾病報(bào)告與監(jiān)測(cè)、衛(wèi)生人力資源等大型數(shù)據(jù)資源庫[4]。例如基本藥物監(jiān)測(cè)評(píng)價(jià)管理系統(tǒng)、國(guó)家傳染病與突發(fā)公共衛(wèi)生網(wǎng)絡(luò)直報(bào)系統(tǒng)、國(guó)家衛(wèi)生監(jiān)督信息系統(tǒng)、婦幼保健業(yè)務(wù)信息系統(tǒng)都積累了大量醫(yī)療數(shù)據(jù);國(guó)家正在建立的人口健康數(shù)據(jù)中心和各區(qū)域衛(wèi)生服務(wù)平臺(tái)也是醫(yī)療大數(shù)據(jù)來源之一;衛(wèi)生行政部門基于大量人群的醫(yī)學(xué)研究和疾病監(jiān)測(cè)大數(shù)據(jù),如各種全國(guó)性抽樣調(diào)查、全國(guó)營(yíng)養(yǎng)和健康調(diào)查、出生缺陷監(jiān)測(cè)研究、傳染病及腫瘤登記報(bào)告數(shù)據(jù)等也是醫(yī)療大數(shù)據(jù)。
藥物及器械的研發(fā)是一個(gè)數(shù)據(jù)密集產(chǎn)生的過程,很多中小型企業(yè)產(chǎn)生的數(shù)據(jù)都會(huì)在TB量及以上;藥品流通和銷售環(huán)節(jié)也會(huì)產(chǎn)生大量產(chǎn)品流通和消費(fèi)者購(gòu)買行為數(shù)據(jù)。
首先,各大網(wǎng)站中關(guān)于疾病、健康、尋醫(yī)、購(gòu)藥等搜索內(nèi)容,健康網(wǎng)站的訪問、在線咨詢等產(chǎn)生的大量音視頻、圖片、文本數(shù)據(jù);其次,各商業(yè)公司開發(fā)的移動(dòng)醫(yī)療產(chǎn)品,便攜式生理設(shè)備產(chǎn)生的血壓、心跳、血糖、呼吸、睡眠、體育鍛煉等數(shù)據(jù);最后,各種網(wǎng)站的網(wǎng)絡(luò)掛號(hào)、網(wǎng)售藥品器材、網(wǎng)售健康服務(wù)等產(chǎn)生的數(shù)據(jù)。
在生命科學(xué)研究領(lǐng)域,生物信息大數(shù)據(jù)是關(guān)于生物標(biāo)本和基因測(cè)序的信息,一個(gè)基因組序列文件大小約為750MB,人類基因測(cè)序一次,產(chǎn)生的數(shù)據(jù)就可高達(dá)600G[5]。隨著生物信息學(xué)的發(fā)展,生命科學(xué)已經(jīng)成為大數(shù)據(jù)科學(xué)。
大數(shù)據(jù)可以應(yīng)用于藥品研發(fā)的每一個(gè)階段。藥品研發(fā)前,利用大數(shù)據(jù)對(duì)患者乃至大眾的行為和情緒進(jìn)行測(cè)量,挖掘患者癥狀特點(diǎn)、行為習(xí)慣、喜好等,找到符合患者癥狀的藥品和服務(wù),針對(duì)性地調(diào)整和優(yōu)化藥品[6];研發(fā)成功后,通過大數(shù)據(jù)分析公眾疾病藥品需求趨勢(shì),利用大數(shù)據(jù)確定最優(yōu)的投入產(chǎn)出比,從而實(shí)現(xiàn)最優(yōu)資源組合和節(jié)約成本。藥品上市前,通過大數(shù)據(jù)擴(kuò)大樣本數(shù)和采樣分布范圍,分析藥物副作用以及藥品不良反應(yīng),克服傳統(tǒng)臨床試驗(yàn)和副作用報(bào)告分析中樣本數(shù)小、采樣分布受限等因素的影響,使結(jié)果更具有說服力,有利于縮短藥品上市時(shí)間,降低企業(yè)成本;藥品上市后,通過整合上市后各研究階段可獲得的所有數(shù)據(jù),全面把握上市藥品的安全性、有效性和經(jīng)濟(jì)性,為臨床合理用藥提供更有價(jià)值的參考。醫(yī)藥公司還可以通過大數(shù)據(jù)技術(shù)優(yōu)化物流信息平臺(tái),提高管理效率。
通過大數(shù)據(jù)挖掘分析建立臨床決策支持系統(tǒng)和用藥、醫(yī)囑的自動(dòng)報(bào)錯(cuò)系統(tǒng);利用大數(shù)據(jù)全面分析患者特征數(shù)據(jù)和診療數(shù)據(jù),比較多種干預(yù)措施的有效性,可以找到針對(duì)特定患者的最佳治療途徑[7];對(duì)大量電子病歷中的數(shù)字化信息進(jìn)行分析處理,發(fā)現(xiàn)最有效的臨床路徑以及單病種等。利用互聯(lián)網(wǎng)、云計(jì)算等技術(shù)來打破點(diǎn)對(duì)點(diǎn)的傳統(tǒng)醫(yī)療,構(gòu)建靈活性強(qiáng)、數(shù)據(jù)全面、決策迅速、關(guān)聯(lián)能力強(qiáng)遠(yuǎn)程醫(yī)療服務(wù)體系,減少病人的住院時(shí)間,實(shí)現(xiàn)醫(yī)療資源的最優(yōu)配置,有效緩解當(dāng)前醫(yī)療資源緊張、看病難、看病貴的情況。大數(shù)據(jù)對(duì)循證醫(yī)學(xué)也有著巨大的作用,利用大數(shù)據(jù)技術(shù)分析個(gè)人數(shù)據(jù)集,為循證醫(yī)學(xué)提供最堅(jiān)實(shí)的證據(jù),發(fā)現(xiàn)小樣本無法發(fā)現(xiàn)的細(xì)微差別,為醫(yī)生提供最新的證據(jù),指導(dǎo)臨床實(shí)踐[8]。
利用醫(yī)療保險(xiǎn)大數(shù)據(jù),建立定價(jià)環(huán)節(jié)的自動(dòng)化系統(tǒng)模型,改進(jìn)費(fèi)用補(bǔ)償方式和降低醫(yī)療成本;通過對(duì)大量數(shù)據(jù)分析,確定病人健康保險(xiǎn)優(yōu)惠計(jì)劃的補(bǔ)償額度,更加有效地利用醫(yī)療資源,改進(jìn)醫(yī)療成本管理;利用軟件識(shí)別出高度使用醫(yī)療保險(xiǎn)患者,分析某個(gè)社區(qū)或衛(wèi)生系統(tǒng)的醫(yī)療成本趨勢(shì),使醫(yī)療服務(wù)提供者針對(duì)某類患者或某類疾病狀態(tài)制定成本控制策略,降低再入院率和控制成本,改善患者生活質(zhì)量。醫(yī)療保險(xiǎn)部門根據(jù)醫(yī)療大數(shù)據(jù)的分析,發(fā)現(xiàn)哪些醫(yī)療機(jī)構(gòu)存在騙保、套用保險(xiǎn)資金等不法行為,商業(yè)保險(xiǎn)公司和社會(huì)保險(xiǎn)之間可以共享數(shù)據(jù),形成互補(bǔ)的合作模式。成都市就利用大數(shù)據(jù)建立了智能輔助審核系統(tǒng)對(duì)住院治療費(fèi)用單據(jù)進(jìn)行審核,能篩出疑似過度醫(yī)療行為,初步判斷治療、用藥是否符合“臨床規(guī)則”。
傳統(tǒng)決策模式以人的意志為主導(dǎo),容易偏倚,通過大數(shù)據(jù)分析可實(shí)現(xiàn)智能客觀決策。衛(wèi)生管理部門可整合各部門上報(bào)的數(shù)據(jù),加強(qiáng)宏觀管理,優(yōu)化衛(wèi)生資源配置,為制定公共衛(wèi)生政策和評(píng)估醫(yī)療政策的有效性提供準(zhǔn)確依據(jù)。隨著醫(yī)療規(guī)模的擴(kuò)增,各類信息系統(tǒng)的應(yīng)用,醫(yī)療數(shù)據(jù)爆炸性增長(zhǎng),各醫(yī)療機(jī)構(gòu)可通過大數(shù)據(jù)分析技術(shù)找到醫(yī)院醫(yī)療質(zhì)量不足的環(huán)節(jié)和醫(yī)療資源分配不合理的地方,對(duì)醫(yī)療質(zhì)量和效益指標(biāo)進(jìn)行精確計(jì)算,監(jiān)控醫(yī)療行為過程中的各環(huán)節(jié),提高過程質(zhì)量管理、監(jiān)控,實(shí)現(xiàn)終末的質(zhì)量評(píng)價(jià),并進(jìn)行醫(yī)生績(jī)效分析、成本核算和控制、供應(yīng)鏈分析、市場(chǎng)數(shù)據(jù)挖掘等。
個(gè)性化醫(yī)療中的移動(dòng)醫(yī)療產(chǎn)品,如可穿戴設(shè)備、APP應(yīng)用等可實(shí)時(shí)收集使用者的血糖、血壓、呼吸、心跳等數(shù)據(jù),及時(shí)分析并反饋給使用者,干預(yù)用戶的行為,改善身體狀況,特別是針對(duì)慢性病患者和老年人進(jìn)行實(shí)時(shí)監(jiān)控,有效減少突發(fā)意外。生命科學(xué)研究中也可以利用基因測(cè)序完成個(gè)人健康的精確治療,例如喬布斯就在患胰腺癌以后通過基因測(cè)序,找出DNA中有缺陷的片段。
大數(shù)據(jù)時(shí)代,我們的思維方式也發(fā)生了重大的轉(zhuǎn)變。首先,分析與某事物相關(guān)的所有數(shù)據(jù),而不是依靠分析少量的數(shù)據(jù)樣本;其次,樂于接受數(shù)據(jù)的紛繁復(fù)雜,而不再追求精確性;最后,關(guān)注的焦點(diǎn)發(fā)生了轉(zhuǎn)變,不再探求難以捉摸的因果關(guān)系,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系[9]。因此,我們要更快速地處理數(shù)據(jù),從而有效地利用大數(shù)據(jù)。
醫(yī)療數(shù)據(jù)包含大量的結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù),傳統(tǒng)的方法只分析結(jié)構(gòu)化數(shù)據(jù),已經(jīng)不能滿足需求。而且這些數(shù)據(jù)以不同形式散布于不同系統(tǒng)和平臺(tái)中,數(shù)據(jù)結(jié)構(gòu)千差萬別。因此必須解決數(shù)據(jù)的異構(gòu)性、質(zhì)量問題,進(jìn)行有效的整合[10]。
不斷膨脹的醫(yī)療數(shù)據(jù)中混雜著大量異構(gòu)數(shù)據(jù),目前的存儲(chǔ)架構(gòu)已經(jīng)無法滿足大數(shù)據(jù)應(yīng)用的需求。其中,最大的挑戰(zhàn)就是建立一個(gè)可以存儲(chǔ)和實(shí)時(shí)處理的數(shù)據(jù)平臺(tái),并且能夠隨著醫(yī)療系統(tǒng)的升級(jí)而滿足數(shù)據(jù)模式的更新,具備水平擴(kuò)展能力[11]。
我國(guó)已經(jīng)開始建立一些數(shù)據(jù)共享中心,例如國(guó)家人口與健康科學(xué)數(shù)據(jù)共享平臺(tái),對(duì)基礎(chǔ)醫(yī)學(xué)、臨床醫(yī)學(xué)、公共衛(wèi)生、中醫(yī)藥學(xué)、藥學(xué)、人口與生殖健康方面的數(shù)據(jù)進(jìn)行共享,但目前并不成熟。一是平臺(tái)內(nèi)數(shù)據(jù)共享范圍有限,二是平臺(tái)之不同區(qū)域間的數(shù)據(jù)不能共享。此外,大量醫(yī)藥廠商、醫(yī)學(xué)研究成果等數(shù)據(jù)并沒有納入共享體系。因此,在我國(guó)開展醫(yī)學(xué)大數(shù)據(jù)研究數(shù)據(jù)共享還言之尚早。
人才是核心競(jìng)爭(zhēng)力,HIS需要數(shù)據(jù)庫、統(tǒng)計(jì)、數(shù)據(jù)分析技術(shù)方面的人才,同時(shí)還需要對(duì)醫(yī)療衛(wèi)生以及管理需求有比較深的了解。醫(yī)務(wù)人員必須提高對(duì)醫(yī)院信息化建設(shè)的認(rèn)識(shí),支持醫(yī)院信息化建設(shè),才能有效利用醫(yī)療大數(shù)據(jù)。
醫(yī)療個(gè)人數(shù)據(jù)是一種極具特殊性及敏感性的個(gè)人數(shù)據(jù),其使用面臨一系列法律和倫理問題,因此大數(shù)據(jù)環(huán)境中如何保護(hù)個(gè)人隱私將是一個(gè)亟需解決的問題。網(wǎng)絡(luò)信息平臺(tái)的應(yīng)用以及網(wǎng)上問醫(yī)的推廣,使隱私保護(hù)的難度上升,除通過技術(shù)手段在數(shù)據(jù)使用和傳遞過程中保護(hù)隱私外,法規(guī)制度也重要。
大數(shù)據(jù)作為一種新的技術(shù)進(jìn)入醫(yī)療,必然會(huì)對(duì)醫(yī)療衛(wèi)生領(lǐng)域產(chǎn)生巨大的影響和推動(dòng),同時(shí)會(huì)出現(xiàn)一系列技術(shù)、應(yīng)用方面問題。依靠技術(shù)、政策、資金同時(shí)推進(jìn),才能構(gòu)造完整的大數(shù)據(jù)應(yīng)用技術(shù),希望本文能夠給研究醫(yī)療大數(shù)據(jù)的學(xué)者提供一些參考。