魏志剛,劉小慶,魏燕飛
(江西省第五人民醫(yī)院,江西 南昌 330046)
在互聯(lián)網(wǎng)醫(yī)院中健康大數(shù)據(jù)的應(yīng)用主要表現(xiàn)在在線導(dǎo)診與健康數(shù)據(jù)監(jiān)測方面,在實(shí)體醫(yī)院數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)的基礎(chǔ)上,建立大數(shù)據(jù)分析計(jì)算模型,并與智能設(shè)備廠商合作,通過企業(yè)的數(shù)據(jù)分析處理平臺(tái),對(duì)智能設(shè)備與互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行分析,識(shí)別患者的需求,為其匹配醫(yī)生并提供有效的服務(wù),在健康數(shù)據(jù)監(jiān)測的幫助下,為患者提供有針對(duì)性的健康解決方案[1]。
通過健康大數(shù)據(jù)的應(yīng)用,建立患者電子病歷、健康檔案等數(shù)據(jù)庫,分析針對(duì)慢病患者可能出現(xiàn)的一切危險(xiǎn)因素,構(gòu)建慢病風(fēng)險(xiǎn)評(píng)估模型,對(duì)危險(xiǎn)因素指標(biāo)進(jìn)行綜合分析,根據(jù)高危人群發(fā)病概率的判斷為慢病患者提供幫助,使慢病患者能夠進(jìn)行自我評(píng)估、改善生活方式等,并通過大數(shù)據(jù)分析技術(shù)與設(shè)備的使用,對(duì)慢病患者的數(shù)據(jù)進(jìn)行獲取、跟蹤等,預(yù)警慢病患者發(fā)病的風(fēng)險(xiǎn)與可能性,開展個(gè)性化治療。
健康大數(shù)據(jù)在輔助診療方面主要表現(xiàn)在智能診斷與疾病預(yù)測,在醫(yī)院數(shù)據(jù)知識(shí)庫構(gòu)建的基礎(chǔ)上,與相關(guān)的電子病歷、健康檔案數(shù)據(jù)等相結(jié)合,積極引入數(shù)據(jù)挖掘技術(shù),分析數(shù)據(jù)中心檢查結(jié)果、疾病癥狀與用藥信息的聯(lián)系,構(gòu)建預(yù)測疾病系統(tǒng),對(duì)患者進(jìn)行有效的疾病預(yù)測,在醫(yī)療數(shù)據(jù)、圖片與準(zhǔn)假標(biāo)注樣本數(shù)據(jù)的基礎(chǔ)上,采取技術(shù)識(shí)別與處理醫(yī)學(xué)影像。
我國使用的大數(shù)據(jù)平臺(tái)主要是在Hadoop技術(shù)的基礎(chǔ)上構(gòu)建,如圖1所示,包括數(shù)據(jù)應(yīng)用層、數(shù)據(jù)分析層、編程模型層、數(shù)據(jù)存儲(chǔ)層、數(shù)據(jù)傳輸層、數(shù)據(jù)來源層。大數(shù)據(jù)平臺(tái)相關(guān)技術(shù)主要包括大數(shù)據(jù)處理技術(shù)、存儲(chǔ)技術(shù)、分析技術(shù)等,可通過批處理技術(shù)處理靜態(tài)數(shù)據(jù),利用流處理技術(shù)處理實(shí)時(shí)數(shù)據(jù),混合式處理技術(shù)可同時(shí)處理兩方面數(shù)據(jù),存儲(chǔ)技術(shù)是通過分布式文件系統(tǒng)、關(guān)系型與非關(guān)系型數(shù)據(jù)庫運(yùn)行,數(shù)據(jù)分析技術(shù)對(duì)數(shù)據(jù)進(jìn)行挖掘,再利用語義分析計(jì)算模型對(duì)數(shù)據(jù)進(jìn)行分析與處理[2]。在互聯(lián)網(wǎng)醫(yī)院中可在大數(shù)據(jù)平臺(tái)上開展在線診療等活動(dòng),有利于提升互聯(lián)網(wǎng)與實(shí)體醫(yī)院的診療水平。
圖1 大數(shù)據(jù)平臺(tái)架構(gòu)
傳統(tǒng)數(shù)據(jù)庫在傳輸數(shù)據(jù)的過程中,數(shù)據(jù)移動(dòng)次數(shù)較多,需經(jīng)過數(shù)據(jù)采集、集中存儲(chǔ)、組織數(shù)據(jù)、取出并分析數(shù)據(jù)等環(huán)節(jié),針對(duì)小數(shù)據(jù)量時(shí)易于接受,但當(dāng)前健康大數(shù)據(jù)量較多,且互聯(lián)網(wǎng)醫(yī)院需求較多,因此數(shù)據(jù)移動(dòng)成本較高。
傳統(tǒng)數(shù)據(jù)庫在解決主題變化時(shí)需將整個(gè)流程進(jìn)行修改,再重新加載數(shù)據(jù),但在此過程中,計(jì)算數(shù)據(jù)與時(shí)間成本較高,比較適合數(shù)據(jù)質(zhì)量高、主題變化少的數(shù)據(jù)分析模式,當(dāng)面臨互聯(lián)網(wǎng)醫(yī)院中的健康大數(shù)據(jù)分析時(shí),反應(yīng)能力不足,且健康大數(shù)據(jù)應(yīng)用主題變化較大,數(shù)據(jù)呈現(xiàn)多樣性。
傳統(tǒng)數(shù)據(jù)庫的硬件設(shè)備對(duì)存儲(chǔ)分析環(huán)節(jié)的要求較高,隨著健康大數(shù)據(jù)量與設(shè)備成本的增長,其分布式存儲(chǔ)計(jì)算架構(gòu)可采用大量高性能的計(jì)算機(jī)分布式存儲(chǔ)計(jì)算集群,成本較低。
通過大數(shù)據(jù)平臺(tái)中數(shù)據(jù)交換平臺(tái)能夠?qū)崿F(xiàn)數(shù)據(jù)采集工作,并結(jié)合“江西省人口健康信息平臺(tái)”“江西省預(yù)約掛號(hào)平臺(tái)”“江西省檢驗(yàn)檢查平臺(tái)”,接入方式較為多元化,按照系統(tǒng)的交換需求與特征進(jìn)行選擇,數(shù)據(jù)采集主要分為文檔與中間庫兩種。第一,基于文檔的數(shù)據(jù)采集主要是按照節(jié)點(diǎn)規(guī)范格式進(jìn)行,調(diào)用Web Service將交換文檔進(jìn)行上傳,大數(shù)據(jù)平臺(tái)再對(duì)文檔格式、信息等進(jìn)行審核與反饋,此方式具備實(shí)時(shí)的數(shù)據(jù)采集特征,可擴(kuò)展性較強(qiáng),維護(hù)成本低,但若采集數(shù)據(jù)內(nèi)容較多,將會(huì)為交換服務(wù)器帶來影響。上傳方式主要分為接入節(jié)點(diǎn)上傳文檔、上傳文檔庫中數(shù)據(jù)與數(shù)據(jù)轉(zhuǎn)換文檔格式上傳,包括PDF、XML等任何格式的文檔。第二,基于中間庫的數(shù)據(jù)采集是將中間庫作為介入節(jié)點(diǎn)的交換環(huán)節(jié),其安全性、數(shù)據(jù)傳輸效率與實(shí)時(shí)性較強(qiáng),工作量較少,流程簡單。
數(shù)據(jù)整合主要包括數(shù)據(jù)預(yù)處理與存儲(chǔ)兩種操作。第一,數(shù)據(jù)預(yù)處理是對(duì)健康大數(shù)據(jù)的元數(shù)據(jù)進(jìn)行分析與預(yù)處理操作。首先要進(jìn)行數(shù)據(jù)清洗,對(duì)缺失的數(shù)據(jù)值與噪聲數(shù)據(jù)進(jìn)行填充與處理。其次利用數(shù)據(jù)集成整合多個(gè)數(shù)據(jù)源,對(duì)其進(jìn)行抽取緩存、轉(zhuǎn)換與分析等,完成相對(duì)應(yīng)的數(shù)據(jù)集成轉(zhuǎn)換工作,另外利用數(shù)據(jù)規(guī)約,在壓縮數(shù)據(jù)集的同時(shí)保持?jǐn)?shù)據(jù)完整性,主要包括數(shù)量規(guī)約、數(shù)據(jù)壓縮與維規(guī)約三類;最后進(jìn)行數(shù)據(jù)變化,利用數(shù)據(jù)規(guī)范化、數(shù)據(jù)聚集、屬性構(gòu)造與離散化等形式,消除原始數(shù)據(jù)在類型與格式方面的差異性。第二,數(shù)據(jù)存儲(chǔ),傳統(tǒng)數(shù)據(jù)庫的存儲(chǔ)模式不足,因此采取底層文件系統(tǒng)、HDFS接口與外部調(diào)用,能夠有效存儲(chǔ)數(shù)據(jù)集。在數(shù)據(jù)清洗的過程中,主要針對(duì)檢查與檢驗(yàn)項(xiàng)目,分析其患者,在此過程中要將類似結(jié)構(gòu)進(jìn)行區(qū)分,明確檢查檢驗(yàn)項(xiàng)目。
數(shù)據(jù)分析環(huán)節(jié)主要包括數(shù)據(jù)分析與數(shù)據(jù)計(jì)算,在分析過程中采取查詢醫(yī)療數(shù)據(jù)集SQL方式與挖掘分析醫(yī)療數(shù)據(jù)集方式,如Pig分析方式與分類挖掘等。數(shù)據(jù)計(jì)算主要是采取分布式計(jì)算方式計(jì)算健康大數(shù)據(jù),提升計(jì)算效率。在數(shù)據(jù)分析過程中主要以治療方案為例,通過互聯(lián)網(wǎng)醫(yī)院系統(tǒng)整合患者醫(yī)療數(shù)據(jù),建立治療分析與患者診斷、檢查等方面的統(tǒng)計(jì)模型,指導(dǎo)醫(yī)生根據(jù)此決定治療方案,將患者特征輸入模型中,與數(shù)據(jù)進(jìn)行比對(duì)與分析,如圖2所示。具體數(shù)據(jù)分析過程包括患者分類與確定治療方案,在患者分類環(huán)節(jié)可通過層次聚類分析法分類,主要分為大部分治療、前期治療、后期治療均在本醫(yī)院進(jìn)行與其他類別,再根據(jù)K均值聚類法進(jìn)行聚類,比較利差平方和,根據(jù)患者不同特征制定治療方案。在此過程中,數(shù)據(jù)分析應(yīng)用能夠利用數(shù)據(jù)挖掘方法有效分析健康發(fā)數(shù)據(jù)在互聯(lián)網(wǎng)醫(yī)院中數(shù)據(jù)的規(guī)律,起到輔助治療的作用。通過IDMapping、數(shù)據(jù)清洗,標(biāo)簽建模等大數(shù)據(jù)技術(shù),為患者建立一份完整的電子病歷健康檔案,解決患者描述不清病史,醫(yī)師無法準(zhǔn)確掌握患者病情的情況。
圖2 治療方案選擇數(shù)據(jù)分析模型
數(shù)據(jù)應(yīng)用主要通過人機(jī)交互接口對(duì)數(shù)據(jù)分析結(jié)果進(jìn)行應(yīng)用,例如,互聯(lián)網(wǎng)醫(yī)院中可通過數(shù)據(jù)分析的可視化結(jié)果查閱數(shù)據(jù)的統(tǒng)計(jì)分析結(jié)果,醫(yī)生可通過輸入患者數(shù)據(jù)方式對(duì)比最優(yōu)治療方案的分析結(jié)果,選擇符合患者需求方案。以上通過對(duì)患者診斷、用藥、檢驗(yàn)檢查等數(shù)據(jù),結(jié)合物聯(lián)網(wǎng)監(jiān)測跟蹤患者情況,進(jìn)行大數(shù)據(jù)分析,實(shí)現(xiàn)智能干預(yù),加大患者依從性的AI慢病管理。
互聯(lián)網(wǎng)醫(yī)院的具體業(yè)務(wù)流程設(shè)計(jì)患者、醫(yī)生、醫(yī)院等多方參與,形成完整的診療過程。首先患者可通過互聯(lián)網(wǎng)醫(yī)院平臺(tái)、App等方式進(jìn)行注冊(cè)并登錄,填寫基本信息進(jìn)行掛號(hào)或者預(yù)約掛號(hào),掛號(hào)時(shí)要填寫就診人的姓名、身份證、具體病情等內(nèi)容,支付成功后等待醫(yī)生進(jìn)行問診,可采取文字、語音、圖片等方式與醫(yī)生溝通,還可為醫(yī)生發(fā)送檢查結(jié)果,溝通后患者可根據(jù)醫(yī)生給出的診斷建議評(píng)價(jià)醫(yī)院服務(wù)的滿意度。醫(yī)生在問診后要建立患者健康檔案,通過ID-Mapping、數(shù)據(jù)清洗、標(biāo)簽建模等技術(shù)建立健康檔案,并通過AI導(dǎo)診的方式為患者智能化分配醫(yī)生,對(duì)就診全過程進(jìn)行監(jiān)測。醫(yī)生還需寫處方,主要內(nèi)容為檢驗(yàn)檢查、診斷信息、醫(yī)囑等,問診后發(fā)送給患者,患者可根據(jù)處方購買藥品,或者到實(shí)體醫(yī)院進(jìn)行檢查等。就診過程中的記錄、視頻錄像以及電子處方都會(huì)被保存,形成云病歷,保存在醫(yī)院中,以便在下次就診時(shí)協(xié)助醫(yī)生進(jìn)行診治。
互聯(lián)網(wǎng)醫(yī)院系統(tǒng)架構(gòu)分為五個(gè)層次。第一層為基礎(chǔ)服務(wù)層,可通過網(wǎng)絡(luò)與計(jì)算機(jī)設(shè)施集成醫(yī)院系統(tǒng)軟件,建設(shè)網(wǎng)絡(luò)系統(tǒng)與多媒體設(shè)備等,可為互聯(lián)網(wǎng)醫(yī)院的數(shù)據(jù)采集、處理、存儲(chǔ)與挖掘奠定基礎(chǔ),通過多源異構(gòu)數(shù)據(jù)的集成與融合開發(fā)新型數(shù)據(jù)庫系統(tǒng),存儲(chǔ)健康數(shù)據(jù)。第二層為數(shù)據(jù)服務(wù)層,將健康數(shù)據(jù)分為線上與線下數(shù)據(jù),通過數(shù)據(jù)交換實(shí)現(xiàn)數(shù)據(jù)共享,利用Hadoop并行計(jì)算模式,堅(jiān)持“先分后和”的原則,對(duì)海量數(shù)據(jù)進(jìn)行計(jì)算與處理,收集醫(yī)療數(shù)據(jù)后對(duì)其進(jìn)行預(yù)處理、存儲(chǔ)與挖掘,在互聯(lián)網(wǎng)醫(yī)院實(shí)踐過程中應(yīng)用數(shù)據(jù),提升醫(yī)療的精準(zhǔn)性,實(shí)現(xiàn)結(jié)構(gòu)化存儲(chǔ)的數(shù)據(jù)管理服務(wù),對(duì)線上數(shù)據(jù)進(jìn)行分類,可利用檢查數(shù)據(jù)庫模式開展,進(jìn)行數(shù)據(jù)的結(jié)構(gòu)化存儲(chǔ),實(shí)現(xiàn)醫(yī)療資源的共享。第三層為公共服務(wù)層,通過建設(shè)基礎(chǔ)層實(shí)現(xiàn)對(duì)業(yè)務(wù)數(shù)據(jù)服務(wù)、數(shù)據(jù)管理服務(wù)等服務(wù)的組件化,整合與管理相關(guān)應(yīng)用組建,充分發(fā)揮功能模塊的作用。第四層為業(yè)務(wù)應(yīng)用層,將互聯(lián)網(wǎng)醫(yī)院系統(tǒng)分為圖文資源、視頻問診、電子處方等多個(gè)應(yīng)用體系,還可根據(jù)實(shí)體醫(yī)院管理模式設(shè)置實(shí)體醫(yī)院中的檢驗(yàn)流程、建檔流程等應(yīng)用體系。第五層為展現(xiàn)層,通過醫(yī)院官方設(shè)置互聯(lián)網(wǎng)醫(yī)院App、微信等方式,為患者提供多元化的醫(yī)療服務(wù)。
在健康大數(shù)據(jù)背景下,可通過互聯(lián)網(wǎng)醫(yī)院對(duì)實(shí)體醫(yī)院的醫(yī)療業(yè)務(wù)與患者進(jìn)行分流,進(jìn)而提升醫(yī)療能力。在我院實(shí)踐互聯(lián)網(wǎng)醫(yī)院后,已經(jīng)開通了多門科室的線上問診,并成立互聯(lián)網(wǎng)醫(yī)院診間,實(shí)現(xiàn)對(duì)互聯(lián)網(wǎng)醫(yī)院的規(guī)范運(yùn)營管理,引導(dǎo)患者進(jìn)行就診,并加強(qiáng)培訓(xùn)醫(yī)生的力度,在重點(diǎn)科室中實(shí)現(xiàn)一對(duì)一線上問診,線上問診人數(shù)呈增長趨勢。
綜上所述,通過對(duì)患者就診全過程監(jiān)測,對(duì)健康數(shù)據(jù)進(jìn)行專業(yè)化處理,助力醫(yī)院管理及運(yùn)營決策。為了滿足社會(huì)的發(fā)展,通過互聯(lián)網(wǎng)優(yōu)化醫(yī)院的就醫(yī)與診療流程,實(shí)現(xiàn)資源的合理配置,提升醫(yī)院的服務(wù)質(zhì)量,利用大數(shù)據(jù)技術(shù)改善患者的就診體驗(yàn),為患者提供更便捷的醫(yī)療服務(wù)?!?/p>