文/張祥儒
近年來(lái),在“互聯(lián)網(wǎng)+”的新形勢(shì)下,全國(guó)各地區(qū)都在建立醫(yī)療數(shù)據(jù)信息平臺(tái),加強(qiáng)區(qū)域醫(yī)療衛(wèi)生服務(wù)資源整合,充分利用互聯(lián)網(wǎng)、數(shù)據(jù)等手段,提高重大疾病和突發(fā)公共衛(wèi)生事件防控能力。從區(qū)域數(shù)據(jù)信息平臺(tái)、省市數(shù)據(jù)信息平臺(tái)到國(guó)家數(shù)據(jù)信息平臺(tái)的建設(shè)過(guò)程中,都會(huì)面對(duì)海量的各類醫(yī)療數(shù)據(jù),對(duì)數(shù)據(jù)的處理是一個(gè)關(guān)鍵性的工作,在數(shù)據(jù)處理的工作中如何獲得全面、有效的醫(yī)療數(shù)據(jù)是個(gè)重大的挑戰(zhàn)。
建立醫(yī)療數(shù)據(jù)信息平臺(tái),通過(guò)平臺(tái)進(jìn)行數(shù)據(jù)的分析、挖掘和應(yīng)用,都要建立在大量、全面和有效數(shù)據(jù)的基礎(chǔ)上,而要建立這個(gè)基礎(chǔ)就要進(jìn)行醫(yī)療數(shù)據(jù)的采集、整合和數(shù)據(jù)傳輸?shù)裙ぷ?就需要建立數(shù)據(jù)信息平臺(tái)數(shù)據(jù)采集系統(tǒng)。如何建立一個(gè)完整有效的數(shù)據(jù)采集系統(tǒng),就需要詳細(xì)的設(shè)計(jì)和實(shí)施工作來(lái)實(shí)現(xiàn)。
數(shù)據(jù)采集系統(tǒng)將各醫(yī)療機(jī)構(gòu)的HIS、LIS、電子病歷等系統(tǒng)的醫(yī)療數(shù)據(jù)經(jīng)過(guò)清洗、轉(zhuǎn)換之后上傳至醫(yī)療數(shù)據(jù)信息平臺(tái),從而實(shí)現(xiàn)醫(yī)院與平臺(tái)之間的數(shù)據(jù)采集與交換,實(shí)現(xiàn)醫(yī)療衛(wèi)生相關(guān)部門之間的數(shù)據(jù)共享和業(yè)務(wù)協(xié)同。
數(shù)據(jù)采集系統(tǒng)架構(gòu)分為:應(yīng)用區(qū)和數(shù)據(jù)庫(kù)區(qū)兩部分。如圖1所示。
第一部分應(yīng)用區(qū)直接與各醫(yī)療機(jī)構(gòu)前置機(jī)對(duì)接,用于存儲(chǔ)各醫(yī)療機(jī)構(gòu)上傳的數(shù)據(jù)并進(jìn)行數(shù)據(jù)清洗、上傳等操作,包含:數(shù)據(jù)、采集、清洗、轉(zhuǎn)換和監(jiān)控服務(wù),建立臨時(shí)數(shù)據(jù)庫(kù)。
第二部分?jǐn)?shù)據(jù)庫(kù)區(qū)用于接收應(yīng)用層的數(shù)據(jù),整合之后上傳數(shù)據(jù)信息平臺(tái),包含:數(shù)據(jù)整合、監(jiān)控和傳輸服務(wù),建立標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)。
數(shù)據(jù)采集系統(tǒng)包括:數(shù)據(jù)抽取、清洗轉(zhuǎn)換、數(shù)據(jù)傳輸和數(shù)據(jù)監(jiān)控4個(gè)模塊。
2.2.1 數(shù)據(jù)抽取模塊
數(shù)據(jù)抽取模塊是通過(guò)接口從醫(yī)療機(jī)構(gòu)的信息系統(tǒng)數(shù)據(jù)庫(kù)中抽取到數(shù)據(jù)采集系統(tǒng)數(shù)據(jù)庫(kù)中。接口可以采用中間庫(kù)或視圖兩種方式建立。數(shù)據(jù)抽取模塊可以定時(shí)從接口讀取數(shù)據(jù),并且可以對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)表和表中的字段選擇性的讀取。
系統(tǒng)處理流程:
(1)數(shù)據(jù)抽取模塊通過(guò)SQL語(yǔ)句對(duì)數(shù)據(jù)庫(kù)進(jìn)行查詢操作,并讀取醫(yī)院視圖或中間庫(kù)表數(shù)據(jù)。
(2)數(shù)據(jù)抽取模塊通過(guò)抽取時(shí)間比對(duì),發(fā)現(xiàn)增量數(shù)據(jù)并進(jìn)行增量數(shù)據(jù)的抽取。
圖1:系統(tǒng)架構(gòu)圖
數(shù)據(jù)抽取模塊分為數(shù)據(jù)庫(kù)連接、視圖連接和接口管理三部分功能。數(shù)據(jù)庫(kù)連接包括數(shù)據(jù)庫(kù)數(shù)據(jù)讀取設(shè)置和實(shí)時(shí)調(diào)度功能;視圖連接包括視圖數(shù)據(jù)讀取設(shè)置和實(shí)時(shí)調(diào)度功能;接口管理包括接口連接和接口配置功能。
2.2.2 數(shù)據(jù)清洗轉(zhuǎn)換模塊
數(shù)據(jù)清洗轉(zhuǎn)換是將數(shù)據(jù)抽取模塊抽取到的數(shù)據(jù)根據(jù)數(shù)據(jù)標(biāo)準(zhǔn)轉(zhuǎn)換為標(biāo)準(zhǔn)數(shù)據(jù)。
處理過(guò)程準(zhǔn)備如下:
數(shù)據(jù)處理的前提是:建立《數(shù)據(jù)信息平臺(tái)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范》,作為數(shù)據(jù)清洗轉(zhuǎn)換的依據(jù)。《數(shù)據(jù)信息平臺(tái)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范》要對(duì)數(shù)據(jù)的字段名、類型、大小以及數(shù)據(jù)字典進(jìn)行規(guī)范。
根據(jù)《數(shù)據(jù)信息平臺(tái)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范》為每個(gè)醫(yī)療機(jī)構(gòu)建立前置機(jī)數(shù)據(jù)庫(kù)。
系統(tǒng)處理流程:
(1)對(duì)抽取的數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換操作:先根據(jù)《數(shù)據(jù)信息平臺(tái)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范》對(duì)數(shù)據(jù)進(jìn)行校驗(yàn),補(bǔ)充缺少的表字段,過(guò)濾掉多余的表字段;將不合格的數(shù)據(jù)轉(zhuǎn)換為合格數(shù)據(jù)。
(2)每個(gè)醫(yī)療機(jī)構(gòu)配備一臺(tái)前置機(jī),將各醫(yī)療機(jī)構(gòu)傳入的數(shù)據(jù)全部轉(zhuǎn)換為標(biāo)準(zhǔn)數(shù)據(jù),傳入各自的前置機(jī)數(shù)據(jù)庫(kù)。
系統(tǒng)清洗轉(zhuǎn)換模塊分為清洗任務(wù)調(diào)度、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)庫(kù)管理三部分功能。清洗任務(wù)調(diào)度包括定時(shí)調(diào)度和實(shí)時(shí)調(diào)度功能;數(shù)據(jù)轉(zhuǎn)換包括數(shù)據(jù)輸入、轉(zhuǎn)換、過(guò)濾、輸出功能;數(shù)據(jù)庫(kù)管理包括前置機(jī)數(shù)據(jù)庫(kù)的增加、刪除、修改和查詢功能。
2.2.3 數(shù)據(jù)傳輸模塊
數(shù)據(jù)傳輸模塊實(shí)現(xiàn)了應(yīng)用區(qū)和數(shù)據(jù)庫(kù)區(qū)之間的數(shù)據(jù)傳輸。應(yīng)用層建立臨時(shí)數(shù)據(jù)庫(kù)存放各醫(yī)療機(jī)構(gòu)轉(zhuǎn)換后的標(biāo)準(zhǔn)數(shù)據(jù),數(shù)據(jù)庫(kù)區(qū)建立標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)存放臨時(shí)數(shù)據(jù)庫(kù)整合的數(shù)據(jù),最后將標(biāo)準(zhǔn)庫(kù)數(shù)據(jù)按照一定時(shí)間上傳數(shù)據(jù)信息平臺(tái)的數(shù)據(jù)庫(kù)。
系統(tǒng)處理流程:
(1)將各醫(yī)療機(jī)構(gòu)前置機(jī)數(shù)據(jù)庫(kù)數(shù)據(jù)同步到數(shù)據(jù)傳輸模塊的應(yīng)用區(qū)臨時(shí)數(shù)據(jù)庫(kù)。
(2)應(yīng)用區(qū)數(shù)據(jù)庫(kù)將數(shù)據(jù)按照區(qū)域等方式進(jìn)行合并,然后同步到的數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)區(qū)。
(3)數(shù)據(jù)庫(kù)區(qū)數(shù)據(jù)庫(kù)可以通過(guò)設(shè)置,實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)或定時(shí)上傳數(shù)據(jù)信息平臺(tái)核心數(shù)據(jù)庫(kù)庫(kù)。
數(shù)據(jù)傳輸模塊分為數(shù)據(jù)整合、數(shù)據(jù)傳輸和數(shù)據(jù)庫(kù)管理三部分功能。數(shù)據(jù)整合包括數(shù)據(jù)讀取、合并、寫入功能;數(shù)據(jù)傳輸包括:傳輸時(shí)間設(shè)置和方式設(shè)置功能;數(shù)據(jù)庫(kù)管理包括臨時(shí)數(shù)據(jù)庫(kù)和標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)的增加、刪除、修改和查詢功能。
2.2.4 數(shù)據(jù)監(jiān)控模塊
數(shù)據(jù)監(jiān)控模塊可以對(duì)數(shù)據(jù)抽取、轉(zhuǎn)換和傳輸情況進(jìn)行監(jiān)控。由于各醫(yī)療機(jī)構(gòu)通過(guò)VPN或?qū)>W(wǎng)與數(shù)據(jù)信息平臺(tái)聯(lián)通,還可以對(duì)網(wǎng)絡(luò)進(jìn)行監(jiān)控,對(duì)上傳過(guò)程中出現(xiàn)的問(wèn)題進(jìn)行顯示并報(bào)警。
系統(tǒng)處理流程:
(1)首先對(duì)數(shù)據(jù)抽取、轉(zhuǎn)換和傳輸模塊配置ETL、ssh、vpn等服務(wù)的監(jiān)控節(jié)點(diǎn)。
(2)定期對(duì)節(jié)點(diǎn)的相關(guān)服務(wù)進(jìn)行掃描監(jiān)控,對(duì)有問(wèn)題的監(jiān)控節(jié)點(diǎn)進(jìn)行郵件、短信等方式進(jìn)行報(bào)警。
(3)對(duì)各節(jié)點(diǎn)運(yùn)行情況進(jìn)行記錄,并保存日志。
數(shù)據(jù)監(jiān)控模塊分為節(jié)點(diǎn)管理、監(jiān)控管理和日志管理三部分功能。節(jié)點(diǎn)管理功能包括監(jiān)控節(jié)點(diǎn)的添加、修改、刪除;監(jiān)控管理包括監(jiān)控服務(wù)配置、定時(shí)輪詢、信息收集顯示和報(bào)警功能。日志管理包括日志的記錄、查看功能。
要完成以上4模塊功能,系統(tǒng)還應(yīng)實(shí)現(xiàn)以下設(shè)計(jì)要求:
為便于擴(kuò)展,整體采用SOA架構(gòu),它可以根據(jù)需求通過(guò)網(wǎng)絡(luò)對(duì)松散耦合的粗粒度應(yīng)用組件進(jìn)行分布式部署、組合和使用。在基于SOA架構(gòu)的系統(tǒng)中,具體應(yīng)用程序的功能是由一些松耦合并且具有統(tǒng)一接口定義方式的組件組合構(gòu)建起來(lái)的。
由于SOA的靈活性實(shí)現(xiàn)依賴于具有標(biāo)準(zhǔn)化接口的服務(wù)和業(yè)務(wù)流程編制,可以通過(guò)SOA實(shí)現(xiàn)對(duì)醫(yī)療機(jī)構(gòu)已有應(yīng)用系統(tǒng)的最大程度復(fù)用和廣泛的異構(gòu)系統(tǒng)兼容性,通過(guò)建立相應(yīng)的編碼規(guī)則、結(jié)構(gòu)規(guī)范、數(shù)據(jù)整合等規(guī)則實(shí)現(xiàn)高度的靈活性和擴(kuò)展性。
為了保證信息安全不受侵犯,可以采用多種技術(shù),如加密技術(shù)、訪問(wèn)控制技術(shù)、認(rèn)證技術(shù)以及安全審計(jì)技術(shù)等。數(shù)據(jù)采集系統(tǒng)建立http協(xié)議接口均在消息中添加了消息認(rèn)證;數(shù)據(jù)傳輸可以采用SSL技術(shù)在通信雙方之間建立加密通道的方法保證數(shù)據(jù)傳輸?shù)臋C(jī)密性??梢允褂脤徲?jì)技術(shù)讓系統(tǒng)自動(dòng)記錄系統(tǒng)的使用情況、系統(tǒng)運(yùn)行情況;監(jiān)控其中的敏感和違規(guī)操作等操作。
為保證數(shù)據(jù)的安全性,數(shù)據(jù)采集系統(tǒng)的運(yùn)行環(huán)境采用國(guó)產(chǎn)的服務(wù)器操作系統(tǒng)。數(shù)據(jù)庫(kù)軟件也采用國(guó)產(chǎn)數(shù)據(jù)庫(kù)軟件進(jìn)行數(shù)據(jù)存儲(chǔ),數(shù)據(jù)定時(shí)備份,各醫(yī)院間數(shù)據(jù)庫(kù)保持最大的獨(dú)立性。
準(zhǔn)確、有效的醫(yī)療數(shù)據(jù)具有極高價(jià)值,未來(lái)的利用前景十分廣闊,可以向醫(yī)生提供臨床診斷和臨床科研支持,向管理者提供管理輔助決策、疾病控制、行業(yè)監(jiān)管、績(jī)效考核支持,向居民提供健康監(jiān)測(cè)、疾病風(fēng)險(xiǎn)評(píng)估支持,向藥品研發(fā)提供統(tǒng)計(jì)學(xué)分析、就診行為分析支持等。通過(guò)數(shù)據(jù)采集系統(tǒng)可以實(shí)時(shí)、準(zhǔn)確的采集醫(yī)療數(shù)據(jù),為信息平臺(tái)的數(shù)據(jù)分析利用提供有力的支撐,但要建立在數(shù)據(jù)標(biāo)準(zhǔn)化的基礎(chǔ)上,否則會(huì)影響數(shù)據(jù)采集系統(tǒng)的采集質(zhì)量;同時(shí)系統(tǒng)的穩(wěn)定性和安全性也是一個(gè)值得重點(diǎn)關(guān)注的地方,設(shè)計(jì)時(shí)要采用安全穩(wěn)定的系統(tǒng)架構(gòu)和加密技術(shù),并不斷地加強(qiáng)完善。擁有了全面、高質(zhì)量的醫(yī)療數(shù)據(jù),醫(yī)療機(jī)構(gòu)就可以結(jié)合區(qū)塊鏈、機(jī)器學(xué)習(xí)、流計(jì)算、圖計(jì)算等技術(shù)進(jìn)行數(shù)據(jù)分析,從而為醫(yī)學(xué)研究提供強(qiáng)有力的數(shù)據(jù)支撐。