方正
【摘 要】隨著數(shù)字化醫(yī)院的發(fā)展,醫(yī)院信息系統(tǒng)產(chǎn)生出大量的數(shù)據(jù),如何管理這些歷史數(shù)據(jù),讓信息發(fā)揮最大的作用,為決策者服務(wù)變得尤其重要。本文闡述了數(shù)據(jù)倉(cāng)庫(kù)在醫(yī)院信息管理的實(shí)際應(yīng)用,總結(jié)了醫(yī)院數(shù)據(jù)倉(cāng)庫(kù)的構(gòu)建及其OLAP應(yīng)用,采用某醫(yī)院的HIS數(shù)據(jù)庫(kù)作為數(shù)據(jù)源,構(gòu)建針對(duì)醫(yī)院主題進(jìn)行分析的數(shù)據(jù)倉(cāng)庫(kù)。實(shí)現(xiàn)了門診業(yè)務(wù)、住院業(yè)務(wù)、抗菌藥物管理等主題的多維數(shù)據(jù)分析,解決了現(xiàn)有系統(tǒng)中對(duì)歷史數(shù)據(jù)分析困難的問(wèn)題。
【關(guān)鍵詞】數(shù)字化 醫(yī)院智能決策系統(tǒng) 主題分析 實(shí)現(xiàn)
【Abstract】With the development of digital hospital, the hospital information system to generate a large amount of data, how to manage these historical data, make information play the biggest role, as policymakers become especially important. This paper describes the data warehouse in the practical application of hospital information management, summarizes the construction and application of OLAP data warehouse by the hospital, a hospital HIS database as the data source, the construction of data warehouse analysis for hospital theme. To realize the multidimensional data analysis of outpatient, inpatient service, business theme of antibacterial drug management, solves the problem of the analysis of historical data in the existing system.
【Key words】Digitization; Intelligent decision system of hospital; Subject analysis; Realization
引 言
目前,全球每天產(chǎn)生高達(dá)100,000T字節(jié)源自醫(yī)療信息(2010年)的數(shù)據(jù),且在近幾年來(lái)的所有數(shù)據(jù)中就有90%的數(shù)據(jù)是在過(guò)去兩年間產(chǎn)生的。我國(guó)信息化醫(yī)院的建設(shè)從80年代初期起步,經(jīng)過(guò)了近30年的發(fā)展已經(jīng)日趨成熟,醫(yī)院系統(tǒng)的數(shù)據(jù)庫(kù)中都存有大量的數(shù)據(jù)。在數(shù)據(jù)量爆炸式增長(zhǎng)的今天,如何管理這些歷史數(shù)據(jù),讓信息發(fā)揮最大作用、并易于理解和處理為決策者提供有價(jià)值的信息服務(wù),就變得尤為重要。這信息服務(wù)中需要滿足醫(yī)院不但要知道過(guò)去發(fā)生的事情,還要知道現(xiàn)在發(fā)生什么,未來(lái)可能會(huì)發(fā)生什么,以及應(yīng)采取哪些措施的各種信息需求。
通過(guò)數(shù)據(jù)倉(cāng)庫(kù)技術(shù),可以實(shí)現(xiàn)對(duì)醫(yī)院數(shù)據(jù)的整合,為決策者提供決策的數(shù)據(jù)基礎(chǔ)。目前,我國(guó)醫(yī)院的數(shù)字化平臺(tái)都是由多個(gè)子系統(tǒng)組成,各個(gè)子系統(tǒng)功能獨(dú)立,子系統(tǒng)之間通過(guò)接口進(jìn)行信息交互。由于子系統(tǒng)之間的供應(yīng)廠商不盡相同,在數(shù)據(jù)庫(kù)軟件的選擇和數(shù)據(jù)內(nèi)容的定義也會(huì)是不同的,因此需要選擇一個(gè)公共的平臺(tái)作為基礎(chǔ)數(shù)據(jù)的基礎(chǔ),在此平臺(tái)之上構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)。例如,可以選擇HIS(醫(yī)院管理信息)系統(tǒng)作為數(shù)據(jù)倉(cāng)庫(kù)的平臺(tái)是醫(yī)院信息化的基礎(chǔ),其提供藥房藥庫(kù)管理、財(cái)務(wù)管理、人事管理、住院門診收費(fèi)等眾多醫(yī)院運(yùn)營(yíng)的基礎(chǔ)管理功能。醫(yī)院其余子系統(tǒng)都有HIS系統(tǒng)接口,并通過(guò)接口傳輸信息。
1.醫(yī)院主題與重點(diǎn)績(jī)效指標(biāo)(KPI)
在醫(yī)院信息化管理中,為了更加深入、全面地掌握醫(yī)院各業(yè)務(wù)的運(yùn)營(yíng)狀況,我們采用分主題制定的醫(yī)院管理模式。醫(yī)院主題是指面向醫(yī)院各業(yè)務(wù)的一組業(yè)務(wù)指標(biāo)的集合。它可以針對(duì)不同的醫(yī)院業(yè)務(wù)設(shè)定其KPI(重點(diǎn)績(jī)效指標(biāo))予以衡量,并自主地選擇該業(yè)務(wù)下的多個(gè)維度進(jìn)行分析與比較。比如對(duì)人員構(gòu)成的分析就可以從編制、職級(jí)、工作性質(zhì)、部門等多個(gè)不同維度,對(duì)醫(yī)院的人員構(gòu)成,如在職員工數(shù)、平均年齡以及離職率進(jìn)行多維分析;多維分析是指按照預(yù)先設(shè)定的分析角度,對(duì)指標(biāo)進(jìn)行分析,比如機(jī)構(gòu)、時(shí)間、職稱、學(xué)歷、年齡段等。
目前,我們參考了《三級(jí)綜合醫(yī)院評(píng)審標(biāo)準(zhǔn)與評(píng)審細(xì)則》(2011年版)、《全國(guó)醫(yī)療衛(wèi)生系統(tǒng)“三好一滿意”活動(dòng)2012年工作方案》、《三級(jí)綜合醫(yī)院醫(yī)療資糧管理與控制指標(biāo)》等衛(wèi)生部指導(dǎo)文件,某醫(yī)院所有報(bào)表,醫(yī)療行業(yè)核心期刊(中國(guó)數(shù)字醫(yī)學(xué)、中國(guó)藥學(xué))等國(guó)內(nèi)外論文,人民醫(yī)院一、二期等數(shù)據(jù)決策系統(tǒng)實(shí)踐項(xiàng)目,從而大范圍地把醫(yī)院的主題分析分為:門診、藥房藥庫(kù)、住院、抗菌藥物、醫(yī)院感染、醫(yī)療保險(xiǎn)、基本監(jiān)測(cè)等醫(yī)院主題分析,并根據(jù)醫(yī)院的實(shí)際情況,為每個(gè)主題選取了多個(gè)能夠全面衡量主題業(yè)務(wù)情況的KPI。
在門診的主題分析中,我們選擇門診人次、急診人次、每診桌工作量、預(yù)付費(fèi)人次、門診收入、門診人均藥費(fèi)、平均處方金額等KPI來(lái)衡量門診業(yè)務(wù)與財(cái)務(wù),可以監(jiān)測(cè)門診業(yè)務(wù)的門診量是否異常,分析門診不同收費(fèi)類型的收入占比,并進(jìn)一步從時(shí)間、科室、病人、掛號(hào)類型等維度分析醫(yī)院門診的基本運(yùn)營(yíng)情況。
在藥房藥庫(kù)的主題分析中,我們選擇藥品收入、藥品收入占比、當(dāng)前藥房(藥庫(kù))總庫(kù)存額、藥品庫(kù)存周轉(zhuǎn)率、庫(kù)存藥品品規(guī)數(shù)、盤盈盤虧量、毒麻藥領(lǐng)取數(shù)量等KPI分別來(lái)衡量藥房與藥庫(kù)業(yè)務(wù)與財(cái)務(wù),并從藥品通用名、藥品規(guī)格、供應(yīng)商等維度分析醫(yī)院藥房藥庫(kù)的某個(gè)時(shí)間段的出入庫(kù)量、金額和各類藥品的庫(kù)存情況。
在住院的主題分析中,我們選擇了年住院患者出院例數(shù)、每住院人次費(fèi)用、住院患者實(shí)際占用總床日等KPI來(lái)衡量住院業(yè)務(wù)與財(cái)務(wù),從時(shí)間、病區(qū)、病種、科室等維度分析對(duì)住院床位使用情況進(jìn)行合理的了解并提出合理的解決方案,更重要的是能夠?qū)ψ≡褐委熧|(zhì)量做出實(shí)時(shí)的監(jiān)控,如住院死亡率、跌倒率、壓瘡率等。
在抗菌藥物的主題分析中,我們選擇了抗菌藥品金額、處方西藥金額、DDDs統(tǒng)計(jì)、DDDs強(qiáng)度、住院病人抗菌藥物使用率等KPI來(lái)衡量醫(yī)院抗菌藥物的使用情況,從時(shí)間、科室、醫(yī)生、藥品分級(jí)、藥品類型等維度分析醫(yī)院抗菌藥物的使用量、使用金額、使用品規(guī)數(shù),對(duì)超過(guò)規(guī)定使用的情況進(jìn)行控制,有效防止出現(xiàn)濫用抗菌藥物的情況。
在醫(yī)院感染的主題分析中,我們選擇了院感總發(fā)生率、手術(shù)部分總感染率、血管導(dǎo)管所致血行感染率等KPI從時(shí)間、科室、病房等維度分析患者在手術(shù)過(guò)程中發(fā)生感染的情況,監(jiān)測(cè)重點(diǎn)科室,比如重癥醫(yī)學(xué)科中患者在使用不同器械過(guò)程發(fā)生感染的例數(shù)等。
在醫(yī)保的主題分析中,我們選擇了醫(yī)保病人總費(fèi)用、醫(yī)保在院病人數(shù)、醫(yī)保費(fèi)用返還額等KPI從時(shí)間、病區(qū)、病人身份等維度來(lái)分析某時(shí)間段中不同身份不同病人的醫(yī)院患者的報(bào)銷費(fèi)用、費(fèi)用返還情況等,并實(shí)時(shí)地通過(guò)計(jì)算醫(yī)保病人的人均費(fèi)用判斷醫(yī)保收費(fèi)是否出現(xiàn)異常,實(shí)施適當(dāng)?shù)慕鉀Q措施。
最后,通過(guò)基本監(jiān)測(cè)主題分析,我們能夠以一個(gè)更加全面與簡(jiǎn)潔的方式去了解與監(jiān)測(cè)醫(yī)院所有的業(yè)務(wù)運(yùn)營(yíng)情況,因?yàn)樗殖少Y源配置、工作負(fù)荷、治療質(zhì)量、工作效率、患者負(fù)擔(dān)、資產(chǎn)運(yùn)營(yíng)和科研成果七個(gè)方面,多維度分析了醫(yī)院中基本設(shè)備使用管理、接收患者的業(yè)務(wù)量、治療服務(wù)質(zhì)量水平、各類型員工的工作狀態(tài)、患者的經(jīng)濟(jì)負(fù)擔(dān)、資產(chǎn)財(cái)務(wù)的合理規(guī)劃、醫(yī)院科研技術(shù)的成長(zhǎng)情況做出了最全面的展現(xiàn)。
2.醫(yī)院數(shù)據(jù)倉(cāng)庫(kù)總體方案與構(gòu)建
數(shù)據(jù)倉(cāng)庫(kù)自從1988年被Inomn提出后,經(jīng)歷快速的發(fā)展。目前有兩種數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)。Bill Inmon提出的CIF體系結(jié)構(gòu)與Ralph Kimball博士提出的MD(Multi-Dimension)體系結(jié)構(gòu)。兩種體系結(jié)構(gòu)都能實(shí)現(xiàn)數(shù)據(jù)的整合和數(shù)據(jù)分析功能。
2.1 CIF數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)與MD數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)
CIF數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)以企業(yè)數(shù)據(jù)模型驅(qū)動(dòng),采用自頂向下的開(kāi)發(fā)方式。自頂而下的開(kāi)發(fā)方式需對(duì)所有系統(tǒng)進(jìn)行分析,并要求系統(tǒng)相對(duì)穩(wěn)定,不能輕易更換系統(tǒng)。開(kāi)發(fā)周期長(zhǎng),可能不會(huì)很快看到結(jié)構(gòu)。
MD體系結(jié)構(gòu)是基于多維數(shù)據(jù)集市的數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu),它所有的BI分析都是以多維設(shè)計(jì)為基礎(chǔ)[1]。MD采用自下而上的開(kāi)發(fā)方式,采用迭代的方式逐一完成各個(gè)主題的數(shù)據(jù)集市。MD機(jī)構(gòu)中缺少的是一個(gè)獨(dú)立的數(shù)據(jù)倉(cāng)庫(kù)。在MD結(jié)構(gòu)中,數(shù)據(jù)倉(cāng)庫(kù)的是虛擬的,并且是由所有的獨(dú)立數(shù)據(jù)集市構(gòu)成的。
2.2 醫(yī)院數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)選擇與構(gòu)建
從復(fù)雜性來(lái)說(shuō),CIF數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)企業(yè)級(jí)的數(shù)據(jù)庫(kù),它所涉及的數(shù)據(jù)表必然包括所有主題的數(shù)據(jù)內(nèi)容,在初期構(gòu)建是異常的困難,很容易導(dǎo)致數(shù)據(jù)冗余或者數(shù)據(jù)的不規(guī)范。隨著企業(yè)的業(yè)務(wù)擴(kuò)展,會(huì)增加相應(yīng)主題的數(shù)據(jù)表,CIF數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)開(kāi)發(fā)會(huì)持續(xù)很長(zhǎng)時(shí)間,對(duì)于醫(yī)院大數(shù)據(jù)庫(kù)表的增加和維護(hù)也是一項(xiàng)艱巨的挑戰(zhàn)。而MD結(jié)構(gòu),將不同的主題拆分為不同的數(shù)據(jù)集市;把復(fù)雜的業(yè)務(wù)數(shù)據(jù)庫(kù)簡(jiǎn)化為面向主題的多維數(shù)據(jù)集。但是維度的復(fù)用將是數(shù)據(jù)集市設(shè)計(jì)的重點(diǎn)。醫(yī)院的系統(tǒng)經(jīng)常有更換的可能性,如果采用CIF結(jié)構(gòu),底層數(shù)據(jù)結(jié)構(gòu)發(fā)生變化,對(duì)整體的ETL和OLAP分析都會(huì)產(chǎn)生巨大的影響,而DM結(jié)構(gòu),只需要更新相關(guān)主題的ETL與數(shù)據(jù)維度即可,不會(huì)產(chǎn)生巨大的修改。綜上所述,采用MD結(jié)構(gòu)的數(shù)據(jù)倉(cāng)庫(kù)更適合醫(yī)院數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)。
多維模型數(shù)據(jù)庫(kù)設(shè)計(jì)方法的中心是星型連接[2]。中心也稱之事實(shí)表,圍繞著事實(shí)表是維度表。事實(shí)表數(shù)據(jù)由兩個(gè)部分組成,維度鍵與度量值。度量值(Measure)是決策者所關(guān)心的具有實(shí)際意義的數(shù)值。例如,門診人次、手術(shù)次數(shù)。事實(shí)表中存放的事實(shí)數(shù)據(jù)通常包含大量的數(shù)據(jù)行。事實(shí)數(shù)據(jù)表的主要特點(diǎn)是包含數(shù)值數(shù)據(jù),而這些數(shù)值可以統(tǒng)計(jì)匯總以提供有關(guān)單位運(yùn)作歷史信息。維度鍵是維度表的外鍵,事實(shí)表中一般不包括描述性信息。維度是人們觀察的角度。例如,我們想觀察抗菌藥和抗菌藥的使用比例,藥品就是一個(gè)維度;希望看看哪個(gè)藥庫(kù)庫(kù)存最多,藥庫(kù)就是一個(gè)維度。包含維度信息的表是維度表。維度表包含描述事實(shí)數(shù)據(jù)表中的事實(shí)記錄的特征。有些特性提供描述性的信息,如病人的性別,年齡,醫(yī)保類型,有些特性則用于指定如何匯總事實(shí)數(shù)據(jù)表數(shù)據(jù)以便為分析者提供有用的信息,如病人的性別。
3.醫(yī)院數(shù)據(jù)倉(cāng)庫(kù)ETL設(shè)計(jì)與實(shí)現(xiàn)
ETL是英文Extract、Transform、Load的英文縮寫,在數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目中代表數(shù)據(jù)從業(yè)務(wù)數(shù)據(jù)庫(kù)中抽取、轉(zhuǎn)換到最終裝載到數(shù)據(jù)倉(cāng)庫(kù)。通常后臺(tái)的ETL系統(tǒng)常常要花費(fèi)70%的時(shí)間和工作量[3]。
3.1醫(yī)院數(shù)據(jù)倉(cāng)庫(kù)ETL設(shè)計(jì)
第一步:統(tǒng)一維度處理。由于數(shù)字醫(yī)院由多個(gè)子系統(tǒng)組成,各個(gè)系統(tǒng)相互獨(dú)立。需要把維度進(jìn)行統(tǒng)一,讓不同主題的事實(shí)表共享相同的維度。以病人數(shù)據(jù)為例,HIS中病人信息、手麻系統(tǒng)中的病人信息與電子病歷中的病人信息數(shù)據(jù)存儲(chǔ)的內(nèi)容可能不盡相同。雖然后兩個(gè)系統(tǒng)可以獨(dú)立做成兩個(gè)主題,但是如果各自都有獨(dú)立的病人維度,會(huì)導(dǎo)致各個(gè)主題之間相互獨(dú)立。因此我們需要基于HIS系統(tǒng)中病人一個(gè)基礎(chǔ)病人表,然后在這張表基礎(chǔ)上添加其他系統(tǒng)中額外的病人的數(shù)據(jù),所有主題都能連接這唯一的病人維度即可進(jìn)行病人角度的分析。
第二步:臟數(shù)據(jù)清洗。業(yè)務(wù)數(shù)據(jù)庫(kù)都存在大量的臟數(shù)據(jù),臟數(shù)據(jù)如果導(dǎo)致數(shù)據(jù)報(bào)表的展現(xiàn)錯(cuò)誤,會(huì)影響到醫(yī)院管理者的決策,所以需要盡可能刪除業(yè)務(wù)數(shù)據(jù)中的臟數(shù)據(jù)。臟數(shù)據(jù)主要體現(xiàn)在:重復(fù)數(shù)據(jù),空數(shù)據(jù),錯(cuò)誤數(shù)據(jù)與應(yīng)該刪除但未刪除的數(shù)據(jù)。在ETL的過(guò)程中進(jìn)行數(shù)據(jù)清洗,修改明顯的錯(cuò)誤數(shù)據(jù),同時(shí)也需要各子系統(tǒng)的管理員對(duì)自己的歷史數(shù)據(jù)進(jìn)行維護(hù)。
第三步:增量抽取。由于子系統(tǒng)的維護(hù)人員會(huì)經(jīng)常修改歷史數(shù)據(jù),所以簡(jiǎn)單的抽取增量是不能保證數(shù)據(jù)的正確性。通過(guò)調(diào)研,我們定義一個(gè)時(shí)間點(diǎn)把業(yè)務(wù)數(shù)據(jù)庫(kù)中的數(shù)據(jù)分為穩(wěn)定歷史數(shù)據(jù)和非穩(wěn)定歷史數(shù)據(jù)。每日抽取時(shí)間點(diǎn)后的非穩(wěn)定里數(shù)據(jù)與穩(wěn)定數(shù)據(jù)拼成最新的全量數(shù)據(jù)。通過(guò)修改時(shí)間點(diǎn)來(lái)調(diào)整穩(wěn)定數(shù)據(jù)的范圍。
3.2醫(yī)院數(shù)據(jù)倉(cāng)庫(kù)的實(shí)現(xiàn)
住院的主題分析,我們可以先從HIS系統(tǒng)中抽取出與住院業(yè)務(wù)有關(guān)的數(shù)據(jù),如住院收費(fèi)信息數(shù)據(jù)、住院病人信息表、住院病人醫(yī)囑信息數(shù)據(jù)、出院病人信息數(shù)據(jù)、病房基本信息數(shù)據(jù)、藥房基本信息數(shù)據(jù)、藥品基本信息數(shù)據(jù)、病人基本情況信息數(shù)據(jù)、住院床位信息數(shù)據(jù)等相關(guān)數(shù)據(jù)信息,對(duì)這些數(shù)據(jù)進(jìn)行整合、統(tǒng)一維度處理、清洗與關(guān)聯(lián),搭建適合住院業(yè)務(wù)的數(shù)據(jù)倉(cāng)庫(kù),制定增量抽取方案。
在住院業(yè)務(wù)的數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)圖中,我們把住院病人信息數(shù)據(jù)、住院病人醫(yī)囑信息數(shù)據(jù)、出院病人信息數(shù)據(jù)作為數(shù)據(jù)倉(cāng)庫(kù)中的主表,時(shí)間信息、病房信息、藥品信息、病人信息、床位信息、醫(yī)囑類型信息、病人身份信息等作為附表,關(guān)聯(lián)于主表上,供OLAP應(yīng)用中的多維度分析。
4.數(shù)據(jù)倉(cāng)庫(kù)OLAP應(yīng)用
聯(lián)機(jī)分析處理(OLAP)的主要特點(diǎn),是直接仿照用戶的多角度思考模式,預(yù)先為用戶組建多維的數(shù)據(jù)模型,在這里,維度的是用戶的分析角度。例如對(duì)藥品收費(fèi)數(shù)據(jù)的分析,時(shí)間周期是一個(gè)維度,藥品類別、開(kāi)單科室、開(kāi)單醫(yī)生也分別是一個(gè)維度。一旦多維數(shù)據(jù)模型建立完成,用戶可以快速地從各個(gè)分析角度獲取數(shù)據(jù),也能動(dòng)態(tài)的在各個(gè)角度之間切換或者進(jìn)行多角度綜合分析,具有極大的分析靈活性。這也是聯(lián)機(jī)分析處理在近年來(lái)被廣泛關(guān)注的根本原因,它從設(shè)計(jì)理念和真正實(shí)現(xiàn)上都與舊有的管理信息系統(tǒng)有著本質(zhì)的區(qū)別。
綜合住院藥品主題的維度包括時(shí)間維度、藥品分類、藥品名稱、藥品劑型、藥房名稱、病人姓名。用戶可以從多個(gè)角度進(jìn)行數(shù)據(jù)的分析,例如:2010年整年藥占比值前十的患者情況,2011年Q1葡糖糖的使用情況;2012年7月科室抗菌藥物收費(fèi)排名。用戶不會(huì)局限于固定的報(bào)表格式,可以靈活的在各個(gè)角度靈活組合,找到自己想要的分析數(shù)據(jù)。
結(jié) 語(yǔ)
隨著信息技術(shù)的發(fā)展,醫(yī)院管理水平的提高,構(gòu)建科學(xué)、合理的數(shù)據(jù)倉(cāng)庫(kù)已經(jīng)是時(shí)代的趨勢(shì)。通過(guò)數(shù)據(jù)倉(cāng)庫(kù)技術(shù),對(duì)醫(yī)院的各個(gè)業(yè)務(wù)系統(tǒng)數(shù)據(jù)進(jìn)行整合,為醫(yī)院管理者提供決策的數(shù)據(jù)支持,進(jìn)而提高醫(yī)院的核心競(jìng)爭(zhēng)力。