陳馮薏,俞剛
浙江大學(xué)醫(yī)學(xué)院附屬兒童醫(yī)院 信息中心,浙江 杭州 310052
浙江大學(xué)醫(yī)學(xué)院附屬兒童醫(yī)院(以下簡稱“我院”)的信息化建設(shè)可以追溯到20 世紀(jì)90 年代,架構(gòu)發(fā)展受限于建設(shè)周期長,各個信息系統(tǒng)分別通過視圖或Web Service 的方式進(jìn)行兩兩交互,造成接口混亂,基礎(chǔ)字典數(shù)據(jù)不統(tǒng)一。此外我院患者基本信息由于歷史原因數(shù)據(jù)管理較為混亂,存在同一病人多門診號,多住院號的情況,并且相關(guān)數(shù)據(jù)并缺少關(guān)聯(lián)。
近年來,國家健康衛(wèi)生委員會(簡稱“衛(wèi)健委”)出臺了各類文件標(biāo)準(zhǔn)推進(jìn)“互聯(lián)網(wǎng)+醫(yī)療健康”的發(fā)展,不斷強(qiáng)調(diào)了加強(qiáng)醫(yī)院建設(shè)信息化的重要意義。國家衛(wèi)健委于2018 年發(fā)布了新版的《電子病歷系統(tǒng)功能應(yīng)用水平分級評價方法及標(biāo)準(zhǔn)(試行)》[1-2]評價標(biāo)準(zhǔn),并要求2020 年所有三級醫(yī)院要達(dá)到4 級以上的評價。標(biāo)準(zhǔn)從3 級開始就對數(shù)據(jù)標(biāo)準(zhǔn)化有了明確的規(guī)范,要求有統(tǒng)一的數(shù)據(jù)字典,全院信息系統(tǒng)能夠數(shù)據(jù)共享,并為臨床科研工作提供數(shù)據(jù)挖掘功能。從5 級標(biāo)準(zhǔn)開始則要求醫(yī)院有統(tǒng)一的數(shù)據(jù)管理。因此我院從2015 年開始,投入大量的資源根據(jù)此標(biāo)準(zhǔn)開展醫(yī)院信息化建設(shè),現(xiàn)我們就過程中的主數(shù)據(jù)管理平臺建設(shè)實踐做一下回顧。
我院根據(jù)電子病歷系統(tǒng)的評級標(biāo)準(zhǔn),結(jié)合醫(yī)院的信息化實際情況,主要建設(shè)以電子病歷為核心,基于集成平臺和臨床數(shù)據(jù)中心的信息化架構(gòu)。改造升級了電子病歷系統(tǒng),新建了臨床決策輔助系統(tǒng),新建了基于醫(yī)療信息平臺、主數(shù)據(jù)管理平臺、醫(yī)療大數(shù)據(jù)服務(wù)平臺、醫(yī)院門戶集成平臺的醫(yī)院信息集成平臺[3-4]。整體建設(shè)平臺建設(shè)的第一步核心內(nèi)容就是——主數(shù)據(jù)管理平臺[5]的建設(shè)(梳理各系統(tǒng)相關(guān)的字典數(shù)據(jù),創(chuàng)建主索引系統(tǒng))。
主數(shù)據(jù)管理平臺搭建在獨(dú)立為Windows Server 上,通過企業(yè)服務(wù)總線(Enterprise Service Bus,ESB)的專門信息集成引擎所用消息隊列接口MQ 接口和Web Service 接口與各個業(yè)務(wù)系統(tǒng)關(guān)聯(lián)交互。數(shù)據(jù)管理平臺將所有的主索引、主數(shù)據(jù)信息都存儲在平臺數(shù)據(jù)庫服務(wù)器上。業(yè)務(wù)系統(tǒng)數(shù)據(jù)更新時同步至平臺,再由平臺下發(fā)至其他相關(guān)業(yè)務(wù)系統(tǒng)中。如果平臺宕機(jī),不會影響到業(yè)務(wù)系統(tǒng)的數(shù)據(jù)使用,僅會影響主數(shù)據(jù)的同步。管理人員通過Web 網(wǎng)頁對平臺進(jìn)行可視化管理。
主數(shù)據(jù)管理[6](Master Data Management,MDM)通過對核心數(shù)據(jù)的定義,并在主數(shù)據(jù)庫中實現(xiàn)統(tǒng)一存儲,實現(xiàn)所有相關(guān)系統(tǒng)的數(shù)據(jù)同步。主數(shù)據(jù)管理功能主要包括主數(shù)據(jù)存儲、主數(shù)據(jù)質(zhì)量管理、主數(shù)據(jù)共享和主數(shù)據(jù)生命周期管理等。醫(yī)院的主數(shù)據(jù)包含檢驗檢查項目、收費(fèi)項目、醫(yī)囑項目、藥品信息、手術(shù)編碼、診斷編碼等醫(yī)院基礎(chǔ)字典數(shù)據(jù),以及各種行業(yè)標(biāo)準(zhǔn)和國家標(biāo)準(zhǔn)[7]。主數(shù)據(jù)管理實現(xiàn)了基礎(chǔ)數(shù)據(jù)的全院統(tǒng)一管理,實現(xiàn)了基礎(chǔ)數(shù)據(jù)的同步或匹配,規(guī)范了數(shù)據(jù)的統(tǒng)計口徑,提高了數(shù)據(jù)質(zhì)量。
如圖1 所示,主數(shù)據(jù)管理基于面向服務(wù)框架 (Service-Oriented Architecture,SOA),將不同系統(tǒng)中的特定數(shù)據(jù)單元通過定義的接口聯(lián)系起來,使其可以以獨(dú)立于實現(xiàn)服務(wù)的硬件平臺、操作系統(tǒng)和編程語言進(jìn)行統(tǒng)一和通用的方式交互[8]。其中數(shù)據(jù)管理系統(tǒng)包含以下幾個功能模塊:值域管理,(Object Identifi er,OID 對象標(biāo)識符)管理,數(shù)據(jù)元管理,字典信息列表,版本管理。
圖1 主數(shù)據(jù)管理系統(tǒng)框架圖
EMPI[9](Enterprise Master Patient Index,主索引系統(tǒng))是主數(shù)據(jù)管理平臺的一個功能,利用概率統(tǒng)計學(xué)理念,制定一套完整的標(biāo)準(zhǔn)化算法及數(shù)據(jù)匹配算法,對主索引信息進(jìn)行更加準(zhǔn)確的驗證和判斷,對患者身份信息、職工信息、科室信息完成有效識別,實現(xiàn)唯一性標(biāo)識。主索引主要由患者主索引、職工主索引和科室主索引構(gòu)成。主索引系統(tǒng)支持衛(wèi)生信息交換標(biāo)準(zhǔn)(Health Level 7,HL7)和醫(yī)療信息系統(tǒng)集成(Integrating the Healthcare Enterprise,IHE)規(guī)范,通過主索引號關(guān)聯(lián)業(yè)務(wù)系統(tǒng)的歷史數(shù)據(jù),最終達(dá)到所有信息的互聯(lián)互通[10],解決業(yè)務(wù)系統(tǒng)累積的信息孤島問題。
由圖2 知,EMPI 與各業(yè)務(wù)系統(tǒng)通過ESB 中接口進(jìn)行集成,完成患者信息的查詢、交叉索引,患者信息新建與更新等[11]。主索引庫存儲著各個系統(tǒng)中同一患者,同一職工或同一科室在其他業(yè)務(wù)系統(tǒng)中的關(guān)聯(lián)管理。主索引應(yīng)用通過臨床數(shù)據(jù)倉庫(Clinical Data Repository,CDR)對主索引號進(jìn)行增刪改查與統(tǒng)計分析。主索引管理系統(tǒng)對主索引進(jìn)行管理操作,支持設(shè)定合并規(guī)則參數(shù)閾值,批量導(dǎo)入數(shù)據(jù)、疑似患者管理。支持手工匹配、合并、拆分相關(guān)數(shù)據(jù)。
圖2 主索引系統(tǒng)角色架構(gòu)
1.2.1 患者主索引建設(shè)
由于兒童醫(yī)院的特殊性,存在很多出生后仍未取名未取得身份證信息的患者。前一次就診可能仍未有姓名,后一次就診已有身份信息。一個有效的患者主索引匹配算法,對患者在我院整個兒童時期就診記錄的完整性,連續(xù)性尤為重要。我院的患者主索引系統(tǒng)匹配算法根據(jù)公式(1)計算匹配分?jǐn)?shù)。對于歷史的患者數(shù)據(jù),主要根據(jù)證件號碼、患者姓名、現(xiàn)住地址(由于歷史數(shù)據(jù)此字段基本不會更新,因此匹配可靠度高)、聯(lián)系人姓名、聯(lián)系人電話、聯(lián)系人證件號碼[12]進(jìn)行多字段疑似數(shù)據(jù)自動匹配[13]。由于歷史患者數(shù)據(jù)完整度低,所以匹配歷史數(shù)據(jù)時相似分?jǐn)?shù)設(shè)置較低。相似分?jǐn)?shù)大于60 的則自動判斷為相同患者,對于高于45的數(shù)據(jù)則判斷為相似患者進(jìn)行二次人工判斷解除疑似或者數(shù)據(jù)合并。部分歷史數(shù)據(jù)例如無姓名新生兒患者,聯(lián)系人信息不全或聯(lián)系人非父母則難以匹配。因此對于系統(tǒng)更新后的患者要求在就診時填入必要的基本信息,無身份證等證件信息的患者則要求填寫母親的姓名與身份證號,以保證之后大部分的“二無”患者(無姓名、無身份證)可以被主索引系統(tǒng)識別匹配。但若是“二無”的雙胞胎新生兒患者,則主索引系統(tǒng)將難以分辨。此外部分急診的“三無”患者(無姓名、無聯(lián)系人、無支付能力)將無法進(jìn)入主索引。
相似分?jǐn)?shù)=[證件號碼]×20+[患者姓名]×15+[出生日期]×10+[性別名稱]×5+[現(xiàn)住地址]×15+[聯(lián)系人姓名]×10+[聯(lián)系人電話]×10+[聯(lián)系人證件號碼]×10+[聯(lián)系電話]×5 (1)
式(1)中,“[]”內(nèi)為匹配字段,根據(jù)匹配方法“全匹配”或“最小編輯距離”計算字段匹配值,數(shù)字則為相應(yīng)字段對應(yīng)的權(quán)重。
1.2.2 職工主索引建設(shè)
由于各系統(tǒng)工號存在管理混亂,存在不同系統(tǒng)間員工編碼無法直接統(tǒng)一,且與人事系統(tǒng)無關(guān)聯(lián),所有人事基本信息更新嚴(yán)重延遲。建立一套有效的職工主索引制度,能夠規(guī)范化工號管理,所有人員信息能夠及時更新。對于職工主索引的建設(shè),我院設(shè)計了一套全新的工號申請流程,如圖3。對于正式員工,人事系統(tǒng)中的數(shù)據(jù)將自動導(dǎo)入主索引系統(tǒng)。主索引系統(tǒng)根據(jù)設(shè)定好的規(guī)則,根據(jù)不同類型的人員自動給予不同號段的工號,并將所有工號與基本信息同步入各個相關(guān)的業(yè)務(wù)系統(tǒng)。相關(guān)職能科室審批通過工號申請后,于相關(guān)系統(tǒng)中查找對應(yīng)工號并進(jìn)行權(quán)限設(shè)置。對于非正式員工的工號(如實習(xí)生、規(guī)培生等),則由員工向相關(guān)科室發(fā)起申請后,職能科室手動維護(hù)信息入主索引系統(tǒng),工號仍由主索引自動生成并同步至相關(guān)系統(tǒng)。
圖3 職工工號申請生成流程圖
我院在上線平臺前,對所有字典歷史數(shù)據(jù)與相關(guān)科室進(jìn)行了梳理核對確認(rèn),保證首次導(dǎo)入的所有字典數(shù)據(jù)的唯一性、完整性、正確性,并確認(rèn)了相關(guān)主數(shù)據(jù)的唯一維護(hù)入口和自動同步方式[14]。所有的主數(shù)據(jù)在主數(shù)據(jù)管理平臺現(xiàn)定義元數(shù)據(jù),再定義主數(shù)據(jù),經(jīng)過數(shù)據(jù)質(zhì)量管控后同步至所有相關(guān)系統(tǒng)中。此外對于每一次的數(shù)據(jù)更新,進(jìn)行版本管理,以防版本回退。主數(shù)據(jù)管理平臺上線后,整理導(dǎo)入了所有的字典數(shù)據(jù),數(shù)量如表1 所示。主數(shù)據(jù)除了業(yè)務(wù)系統(tǒng)的定時更新維護(hù)外,當(dāng)國家發(fā)布各類新版本字典時需要手動去平臺內(nèi)進(jìn)行版本更新。對于職工主索引,整理保留了歷史醫(yī)生工號,并整理重建了護(hù)士及其他人員的工號,保證了所有人員都有自己唯一的系統(tǒng)工號并能操作相應(yīng)的系統(tǒng)。整理關(guān)聯(lián)了患者歷史就診信息,但仍存在部分低質(zhì)量歷史數(shù)據(jù)無法關(guān)聯(lián)。建立的患者主索引中直接合并了466010 條相同數(shù)據(jù),判斷了868321 條疑似相同數(shù)據(jù)?;颊咧魉饕秊榛颊呷⒁晥D提供了數(shù)據(jù)基礎(chǔ)。
主數(shù)據(jù)管理平臺上線使用良好,但仍存在幾個問題。第一是如何保證維護(hù)的主數(shù)據(jù)的唯一性,重復(fù)主數(shù)據(jù)會影響數(shù)據(jù)質(zhì)量,不利于數(shù)據(jù)挖掘??梢栽谄脚_上建立重復(fù)數(shù)據(jù)檢測算法,自動檢測新增數(shù)據(jù)的可信度,是否存在相似或重復(fù)數(shù)據(jù),定期進(jìn)行主數(shù)據(jù)質(zhì)量維護(hù)。第二是數(shù)據(jù)安全。主數(shù)據(jù)管理平臺有獨(dú)立的數(shù)據(jù)庫存儲數(shù)據(jù),建立一套安全高效的數(shù)據(jù)傳輸體系和數(shù)據(jù)庫訪問權(quán)限設(shè)置將有效保護(hù)數(shù)據(jù)安全。第三是新生兒患者主索引的匹配算法持續(xù)改進(jìn)?;拘畔浫氲耐暾扔绊懟颊咧魉饕膽?yīng)用效果,如何設(shè)置更合理的基本信息采集方式,將影響新生兒患者進(jìn)入主索引的概率。
表1 主數(shù)據(jù)管理平臺導(dǎo)入字典數(shù)量(條)
所有系統(tǒng)數(shù)據(jù)的整合都是基于主數(shù)據(jù)的建設(shè)管理。我院根據(jù)國家電子病歷系統(tǒng)評級的要求搭建了基于各項標(biāo)準(zhǔn)規(guī)范的主數(shù)據(jù)管理平臺,結(jié)合兒童醫(yī)院的特色進(jìn)行了患者主索引、職工主索引以及主數(shù)據(jù)的維護(hù)流程設(shè)計,為之后的集成平臺建設(shè)、數(shù)據(jù)中心的創(chuàng)建打下了堅實基礎(chǔ)。