奈存劍 任宇飛
摘 要 為解決醫(yī)院存在的數(shù)據(jù)上報模塊分散、重復(fù)工作等問題,本文提出了基于數(shù)據(jù)中心的統(tǒng)一數(shù)據(jù)上報平臺,主要從系統(tǒng)設(shè)計和技術(shù)實(shí)現(xiàn)上進(jìn)行了闡述,設(shè)計了醫(yī)院數(shù)據(jù)統(tǒng)一上報平臺數(shù)據(jù)庫模型和醫(yī)院數(shù)據(jù)統(tǒng)一上報平臺模型,實(shí)現(xiàn)各系統(tǒng)上報統(tǒng)一入口,具有上報數(shù)據(jù)方式多樣化、上報向?qū)诵曰?、?shù)據(jù)校驗(yàn)準(zhǔn)確化等特性,優(yōu)化了數(shù)據(jù)上報流程,為創(chuàng)建優(yōu)質(zhì)醫(yī)院工作提供了客觀、準(zhǔn)確、可追溯性的質(zhì)量數(shù)據(jù)來源。
關(guān)鍵詞 數(shù)據(jù)中心;數(shù)據(jù)采集;統(tǒng)一上報平臺
Design and Application of Unified Reporting Platform for Hospital Data Based on Data Center
Nai Cunjian Ren Yufei
First-authors address Tongji Hospital, Tongji Medical College, Huazhong University of Science and Technology, Wuhan, Hubei, 430030, China
Abstract In order to solve the existing hospital data reporting module dispersion, duplication of work and other issues, this paper report based on a unified data reporting platform, mainly elaborated from the system design and technology, the design of the hospital data unified reporting platform database model and hospital data unified reporting platform model, the achievement of a unified reporting system entry, with diverse data reporting mode, reporting wizard user-friendly, accurate verification of data and other characteristics, to optimize the data reporting process provides an objective to create high-quality hospital and accurate traceability of quality data sources.
Key words Data center; Data acquisition; Unified reporting platform
前言
隨著醫(yī)院信息化的不斷發(fā)展,醫(yī)院通過多年的信息化建設(shè)建立了依托信息化基礎(chǔ)的業(yè)務(wù)處理系統(tǒng),實(shí)現(xiàn)了從醫(yī)療業(yè)務(wù)、物資管理、成本核算和客戶服務(wù)的信息化,并積累了大量的業(yè)務(wù)數(shù)據(jù),這些數(shù)據(jù)主要分布在HIS、EMR、LIS、PACS、心電、內(nèi)鏡、病理以及病案等系統(tǒng)中[1]。然而隨著醫(yī)療衛(wèi)生行業(yè)信息化的飛速發(fā)展,醫(yī)療衛(wèi)生部門也不斷加大對各醫(yī)療機(jī)構(gòu)的監(jiān)管力度,各級醫(yī)療衛(wèi)生部門也都需要醫(yī)療機(jī)構(gòu)按照不同的要求、方式報送各種報表或數(shù)據(jù),例如病案科、統(tǒng)計科、藥學(xué)部、護(hù)理部以及物價科等會按照不同的要求來上報數(shù)據(jù)。另外,各科室也加大了對科研數(shù)據(jù)的需求,需要提供相關(guān)臨床數(shù)據(jù)便于支持科研工作。
針對目前醫(yī)院存在的數(shù)據(jù)上報模塊分散、重復(fù)工作等問題,以及醫(yī)院數(shù)據(jù)中心的建立[2],設(shè)計并實(shí)現(xiàn)一種基于數(shù)據(jù)中心的統(tǒng)一數(shù)據(jù)上報平臺,可以將所有業(yè)務(wù)系統(tǒng)數(shù)據(jù)集成在一起,通過統(tǒng)一用戶管理平臺來管理上報/查詢權(quán)限,實(shí)現(xiàn)各系統(tǒng)上報統(tǒng)一入口,具有上報數(shù)據(jù)方式多樣化、上報向?qū)诵曰?、?shù)據(jù)校驗(yàn)準(zhǔn)確化等特性,系統(tǒng)將幫助主管部門實(shí)時掌握數(shù)據(jù)上報狀況,減少數(shù)據(jù)上報時間。
1系統(tǒng)設(shè)計
醫(yī)院數(shù)據(jù)統(tǒng)一上報平臺,是立足于解決醫(yī)院向醫(yī)療主管部門上報匯總數(shù)據(jù)統(tǒng)計分析和文件傳輸?shù)南到y(tǒng),自動及時、完整真實(shí)地完成數(shù)據(jù)對接工作,利用規(guī)范化的報表展現(xiàn)匯總、規(guī)則校驗(yàn)、統(tǒng)計分析、打印輸出等功能搭建一個高質(zhì)量的數(shù)據(jù)平臺。其設(shè)計原理也是整合了眾多報表和數(shù)據(jù)分析應(yīng)用,把占用大量存儲空間的數(shù)據(jù)價值挖掘出來。
1.1 醫(yī)院數(shù)據(jù)統(tǒng)一上報平臺數(shù)據(jù)庫模型研究
在構(gòu)建數(shù)據(jù)統(tǒng)一上報平臺之前首先要建立數(shù)據(jù)源,由于醫(yī)院的業(yè)務(wù)數(shù)據(jù)可以分為醫(yī)療數(shù)據(jù)、財務(wù)數(shù)據(jù)、后勤管理、科研數(shù)據(jù)、病案數(shù)據(jù)等,這些數(shù)據(jù)均來自不同的系統(tǒng),如果直接通過對不同系統(tǒng)所產(chǎn)生的數(shù)據(jù)進(jìn)行統(tǒng)計,數(shù)據(jù)比較混亂,且數(shù)據(jù)格式也不同,將數(shù)據(jù)展示給醫(yī)院領(lǐng)導(dǎo)層的時候,只能通過數(shù)據(jù)展現(xiàn),而不能通過圖表等形象化的形式來展示[3]。因此首先需要對醫(yī)院各種業(yè)務(wù)數(shù)據(jù)進(jìn)行預(yù)處理,并進(jìn)行抽取轉(zhuǎn)換,并根據(jù)醫(yī)院上報數(shù)據(jù)的指標(biāo),設(shè)計相應(yīng)的數(shù)據(jù)庫結(jié)構(gòu),以規(guī)范化保存醫(yī)院的各種上報數(shù)據(jù),并自動從醫(yī)院業(yè)務(wù)數(shù)據(jù)庫中獲取數(shù)據(jù)并進(jìn)行預(yù)處理后保存在醫(yī)院數(shù)據(jù)統(tǒng)一上報平臺數(shù)據(jù)庫中。醫(yī)院數(shù)據(jù)統(tǒng)一上報平臺數(shù)據(jù)庫的設(shè)計主要包括如下幾個方面:
(1)數(shù)據(jù)字段對照設(shè)計:主要是根據(jù)上報要求設(shè)計數(shù)據(jù)庫表字段,提供文件導(dǎo)入功能,格式包括CSV、DBF、XLS以及XLSX等,并根據(jù)文件字段生成數(shù)據(jù)表。
(2)標(biāo)準(zhǔn)對照管理:根據(jù)上報要求,實(shí)現(xiàn)我院本地標(biāo)準(zhǔn)與上報標(biāo)準(zhǔn)的對照工作,包括數(shù)據(jù)標(biāo)準(zhǔn)的新增、維護(hù)、查詢。
(3)數(shù)據(jù)填充:主要是將各業(yè)務(wù)的數(shù)據(jù)填充到新建的中間表中,并進(jìn)行字段對應(yīng)。
1.2 醫(yī)院數(shù)據(jù)統(tǒng)一上報平臺模型研究
對醫(yī)院各數(shù)據(jù)源進(jìn)行處理后,形成了醫(yī)院各業(yè)務(wù)上報數(shù)據(jù)的數(shù)據(jù)集,需要對各數(shù)據(jù)集進(jìn)行數(shù)據(jù)轉(zhuǎn)換、規(guī)則校驗(yàn)以及隱私信息屏蔽。
(1)患者主索引建立:患者主索引(Main Patient Index,縮寫MPI)是指病人的身份的唯一識別以何種方式在信息系統(tǒng)中表達(dá),MPI是醫(yī)療數(shù)據(jù)可以共享的基礎(chǔ)。主要元素信息應(yīng)包括:姓名、性別、出生日期、民族、證件類別、證件號碼、住址、電話等。
全院患者主索引系統(tǒng)(EMPI)用于全院范圍內(nèi)患者基本信息索引的創(chuàng)建、搜索和維護(hù),可以智能地協(xié)助醫(yī)療人員對病人有效地進(jìn)行搜索。通過建設(shè)主索引(EMPI)來識別、匹配、合并、取消重復(fù)的數(shù)據(jù),凈化病人記錄,利用主索引可獲得完整而單一的病人視圖。EMPI會為每個病人創(chuàng)建一個唯一標(biāo)識符,并和相關(guān)系統(tǒng)的醫(yī)療記錄的標(biāo)識之間建立映射,以確保同一病人分散在不同系統(tǒng)中的醫(yī)療信息可以完整和準(zhǔn)確地關(guān)聯(lián)、整合在一起。
(2)數(shù)據(jù)轉(zhuǎn)換:主要是根據(jù)上報要求,將醫(yī)院本地化非標(biāo)準(zhǔn)數(shù)據(jù)項按照標(biāo)準(zhǔn)對照對非標(biāo)準(zhǔn)數(shù)據(jù)進(jìn)行本地數(shù)據(jù)標(biāo)準(zhǔn)化轉(zhuǎn)換工作,包括本地數(shù)據(jù)標(biāo)準(zhǔn)轉(zhuǎn)換、標(biāo)準(zhǔn)數(shù)據(jù)存儲。
(3)規(guī)則校驗(yàn):主要是利用上報數(shù)據(jù)的規(guī)則校驗(yàn)我院數(shù)據(jù),對校驗(yàn)不通過的數(shù)據(jù)進(jìn)行提示處理。
(4)隱私信息屏蔽:指對患者個人信息中的敏感信息(如:患者姓名、身份證號、電話、地址等)通過脫敏或加密規(guī)則進(jìn)行數(shù)據(jù)的變形,實(shí)現(xiàn)敏感隱私數(shù)據(jù)的可靠保護(hù),同時依然保持其他數(shù)據(jù)的格式和屬性,保證其可識別性和可用性。參照美國HIPAA法案對于患者隱私處理的要求,針對以下常見的敏感字段進(jìn)行脫敏或加密處理:患者姓名、出生地、工作單位、工作單位及地址、工作電話、身份證號、家庭電話、現(xiàn)住址、戶口地址、聯(lián)系人姓名、聯(lián)系人地址、聯(lián)系人電話等進(jìn)行屏蔽處理,避免患者隱私信息泄露。
(5)上報數(shù)據(jù)導(dǎo)出:根據(jù)上報要求自動生成CSV、DBF、XLS以及XLSX等格式的數(shù)據(jù)文件,可以設(shè)置成立即導(dǎo)出或定時導(dǎo)出。
1.3 數(shù)據(jù)訪問控制研究
需要對上傳數(shù)據(jù)的訪問權(quán)限做全面的控制,不同級別的用戶的權(quán)限不同,登錄平臺看到的數(shù)據(jù)亦不同。除此之外,還需制定一系列的管理手段管理,包括但不限于以下內(nèi)容:
(1)單獨(dú)用戶群組、角色及權(quán)限管理;
(2)權(quán)限細(xì)化至每個人每個字段;
(3)用戶無法自行注冊,必須由管理員開通;
(4)平臺必須先登錄再使用;
(5)用戶賬號具有時效性,過期無法繼續(xù)登錄使用。
2系統(tǒng)實(shí)現(xiàn)
2.1 數(shù)據(jù)采集
采用ETL數(shù)據(jù)抽取工具對數(shù)據(jù)進(jìn)行抽取與支持。該工具內(nèi)置了大量數(shù)據(jù)采集、數(shù)據(jù)處理所需的控件,采用分布式部署,利用多主機(jī)集群同時并發(fā)處理大量數(shù)據(jù)采集和數(shù)據(jù)裝載任務(wù),將現(xiàn)有Oracle、SQL Server等各類數(shù)據(jù)按數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行清洗、轉(zhuǎn)換,并加載到新的平臺[4]。按統(tǒng)一的代碼標(biāo)準(zhǔn),整合數(shù)據(jù)類別,形成數(shù)據(jù)齊全、標(biāo)準(zhǔn)化、規(guī)范化的數(shù)據(jù)集市。同時ETL支持各類常用數(shù)據(jù)庫及MDB、XML、XLS、CSV、TXT等數(shù)據(jù)的全量與增量實(shí)時抽取,將各種源數(shù)據(jù)裝載到上報數(shù)據(jù)平臺上的基礎(chǔ)庫中。
2.2 數(shù)據(jù)整合與清洗
為了解決“臟數(shù)據(jù)”的數(shù)據(jù)質(zhì)量問題,還會在數(shù)據(jù)轉(zhuǎn)換步驟后加入數(shù)據(jù)清洗功能。在數(shù)據(jù)抽取過程中所有的代碼轉(zhuǎn)換都通過代碼轉(zhuǎn)換表進(jìn)行轉(zhuǎn)換。當(dāng)在代碼轉(zhuǎn)換表中找不到該代碼時,該條數(shù)據(jù)即為“臟數(shù)據(jù)”。當(dāng)確定數(shù)據(jù)為“臟數(shù)據(jù)”時需要將該信息記錄在“臟數(shù)據(jù)”表中。
ETL 抽取時“臟數(shù)據(jù)”處理流程:
(1)判斷是否為“臟數(shù)據(jù)”,即在代碼轉(zhuǎn)換表中找不到新代碼。
(2)判斷該記錄在“臟數(shù)據(jù)”表中是否存在。判斷條件為代碼種類 ID、業(yè)務(wù)系統(tǒng) ID、源表名、源字段名,源 ID 全部相等。如果存在跳到第 4步。
(3)將“臟數(shù)據(jù)”插入到“臟數(shù)據(jù)”表中。數(shù)據(jù)插入后直接到第 6 步。
(4)新“臟數(shù)據(jù)”的時間戳的值與舊“臟數(shù)據(jù)”時間戳的值進(jìn)行比較。如果大于則直接跳到第(6)步。
(5)更新新時間戳的值到“臟數(shù)據(jù)”表中。
(6)“臟數(shù)據(jù)”處理結(jié)束。
WEB 界面“臟數(shù)據(jù)”處理:
“臟數(shù)據(jù)”可以通過 WEB 界面展現(xiàn)出,由數(shù)據(jù)管理人員進(jìn)行處理決定。分為兩種情況:第一種是“臟數(shù)據(jù)”確實(shí)為“臟數(shù)據(jù)”,則維護(hù)該數(shù)據(jù)抽取相關(guān)參數(shù)文件,將該“臟數(shù)據(jù)”排除。另一種為該代碼為有效代碼,此時需要在 基礎(chǔ)庫中相應(yīng)的編碼表中新建一個編碼,并在代碼映射表中插入相應(yīng)的記錄。
2.3 數(shù)據(jù)導(dǎo)入與導(dǎo)出
(1)提供CSV、DBF、XLS以及XLSX格式文件導(dǎo)入功能,并根據(jù)文件字段動態(tài)生成數(shù)據(jù)表;
(2)根據(jù)上報要求將醫(yī)院本地化非標(biāo)準(zhǔn)數(shù)據(jù)項按照標(biāo)準(zhǔn)對照對非標(biāo)準(zhǔn)數(shù)據(jù)進(jìn)行本地數(shù)據(jù)標(biāo)準(zhǔn)化轉(zhuǎn)換工作,包括本地數(shù)據(jù)標(biāo)準(zhǔn)轉(zhuǎn)換、規(guī)則校驗(yàn)以及敏感信息處理等;
(3)根據(jù)上報要求,基于WEB界面可配置定時任務(wù)立即生成或定時生成CSV、DBF、XLS以及XLSX等格式的數(shù)據(jù)文件;
(4)數(shù)據(jù)生成之后可進(jìn)行權(quán)限控制,指定相應(yīng)工作組查看權(quán)限。
3結(jié)束語
醫(yī)院數(shù)據(jù)統(tǒng)一上報平臺的開發(fā)應(yīng)用避免了人工手動數(shù)據(jù)上傳遇到的各種問題,優(yōu)化了數(shù)據(jù)上報流程,提高了數(shù)據(jù)準(zhǔn)確性和真實(shí)性,提升了醫(yī)院精細(xì)化管理水平[5],實(shí)現(xiàn)了醫(yī)療質(zhì)量與安全持續(xù)改進(jìn),為創(chuàng)建優(yōu)質(zhì)醫(yī)院工作提供客觀、準(zhǔn)確、可追溯性的質(zhì)量數(shù)據(jù)來源。
參考文獻(xiàn)
[1] 吳正一,崔迎慧,陸耀,等.以臨床數(shù)據(jù)倉庫為核心的醫(yī)院大數(shù)據(jù)平臺構(gòu)建[J].中國醫(yī)院管理,2015,35(11):13-15.
[2] 奈存劍,任宇飛,李金,等.醫(yī)院臨床數(shù)據(jù)中心建設(shè)與應(yīng)用[J].中國醫(yī)院管理,2014,34(5):53-54.
[3] 李漢民,商建國,肖輝.區(qū)域衛(wèi)生信息上報平臺的體系架構(gòu)研究[J].中國數(shù)字醫(yī)學(xué),2017,12(8):54-56.
[4] 王少波,黃玉成,胡建中.醫(yī)院信息數(shù)據(jù)統(tǒng)一采集平臺建設(shè)實(shí)踐[J].中國數(shù)字醫(yī)學(xué),2017,12(12):75-77.
[5] 周阿華,童俊東,程超,等.基于運(yùn)營數(shù)據(jù)中心的醫(yī)保管控平臺設(shè)計與實(shí)現(xiàn)[J].中國醫(yī)院管理,2018,38(11):61-63.