吳桂芳
利用數(shù)據(jù)倉庫及聯(lián)機(jī)分析技術(shù)對(duì)病案信息進(jìn)行科學(xué)的管理分析將是醫(yī)院重大決策的主要依據(jù)。本文通過建立病案數(shù)據(jù)倉庫,借助于Analysis Service的聯(lián)機(jī)分析技術(shù)為醫(yī)院管理者作決策提供全方位、可靠的數(shù)據(jù)支持。
【關(guān)鍵詞】病案管理 數(shù)據(jù)倉庫 聯(lián)機(jī)分析 Analysisi Service
OLAP技術(shù)與數(shù)據(jù)倉庫技術(shù)、數(shù)據(jù)挖掘技術(shù)一起 , 是當(dāng)今決策支持系統(tǒng)的主流技術(shù)。OLAP 多用于支持復(fù)雜但目的比較明確的分析操作 , 通過對(duì)數(shù)據(jù)一系列交互的主動(dòng)查詢過程 ,對(duì)數(shù)據(jù)進(jìn)行多層次、多階段的分析處理, 為用戶提供靈活的信息訪問權(quán)利、豐富的數(shù)據(jù)分析和報(bào)表功能。盡管數(shù)據(jù)倉庫和聯(lián)機(jī)分析處理是現(xiàn)代優(yōu)秀的DDS中的核心技術(shù),但是在醫(yī)療衛(wèi)生領(lǐng)域,與醫(yī)院信息管理系統(tǒng)結(jié)合確是一個(gè)較新的嘗試。
本文正是圍繞基于建立病案數(shù)據(jù)倉庫的基礎(chǔ)上利用聯(lián)機(jī)分析技術(shù)來研究聯(lián)機(jī)分析技術(shù)在病案管理中的應(yīng)用。
1 數(shù)據(jù)倉庫和OLAP技術(shù)、Analysis service
通過創(chuàng)建多維數(shù)據(jù)集來組織和匯總用于進(jìn)行有效分析查詢的數(shù)據(jù),OLAP提供了數(shù)據(jù)倉庫數(shù)據(jù)的一種多維表達(dá)方法。數(shù)據(jù)倉庫結(jié)構(gòu)的設(shè)計(jì)可以影響這些多維數(shù)據(jù)集在設(shè)計(jì)和建立方面難易程度。
從數(shù)據(jù)挖掘的角度上來說,數(shù)據(jù)倉庫和OLAP技術(shù)為數(shù)據(jù)挖掘提供基礎(chǔ)。因?yàn)閿?shù)據(jù)挖掘應(yīng)建立在聯(lián)機(jī)分析處理(On Line Analytical Processing,OLAP)的數(shù)據(jù)環(huán)境基礎(chǔ)之上,而數(shù)據(jù)倉庫技術(shù)能夠滿足數(shù)據(jù)挖掘技術(shù)對(duì)數(shù)據(jù)環(huán)境的要求。
從OLAP是數(shù)據(jù)倉庫最典型的一個(gè)應(yīng)用角度來說,數(shù)據(jù)倉庫為OLAP提供數(shù)據(jù)來源,而數(shù)據(jù)倉庫想要實(shí)現(xiàn)從中提取有價(jià)值的數(shù)據(jù)信息為作決策服務(wù)就得靠OLAP技術(shù)來分析。因此,數(shù)據(jù)倉庫和OLAP技術(shù)存在相互制約的一面。
Analysis service是用于聯(lián)機(jī)分析處理(OLAP)和數(shù)據(jù)挖掘的中層服務(wù)器。
Analysis service將數(shù)據(jù)倉庫中的數(shù)據(jù)組織成包含預(yù)先計(jì)算聚合數(shù)據(jù)的多維數(shù)據(jù)集,以便為復(fù)雜的分析查詢提供快速解答。
2 病案數(shù)據(jù)倉庫的建立
2.1 病案管理需求分析
隨著HIS系統(tǒng)的發(fā)展及我國HIS系統(tǒng)應(yīng)用水平的提高,數(shù)據(jù)量越來越大,領(lǐng)導(dǎo)對(duì)決策的要求越來越高,希望能夠提供更高層次的數(shù)據(jù)分析功能,更好地輔助領(lǐng)導(dǎo)進(jìn)行管理決策。因此對(duì)病案進(jìn)行管理是必需的,而病案的管理現(xiàn)在的發(fā)展趨勢(shì)就是基于DW(Data Warehouse)的OLAP(聯(lián)機(jī)分析處理)數(shù)據(jù)資源。
在本實(shí)驗(yàn)中研究主要利用聯(lián)機(jī)分析實(shí)現(xiàn)的主題范圍是:
從地區(qū)、時(shí)間、性別、年齡、職業(yè)多維度分析與某種病的發(fā)病率之間的關(guān)系,如:2005年患肺結(jié)核的是本院附近地區(qū)占50%,可以層層分析下去具體那個(gè)季、月,那個(gè)區(qū)的多。
從科室和醫(yī)生維分析對(duì)某種病的治愈情況,如:內(nèi)科對(duì)腦出血病治愈的占百分之幾,好轉(zhuǎn)、未愈的、死亡的各占多少,層層分析下去到那個(gè)醫(yī)生。
新生兒的出生其性別與時(shí)間、地區(qū)的關(guān)系。
2.2 數(shù)據(jù)倉庫建立流程
2.2.1 數(shù)據(jù)倉庫的源數(shù)據(jù)分析
針對(duì)病案數(shù)據(jù)具有的隱私性及多樣性特點(diǎn),創(chuàng)建出面向主題的數(shù)據(jù)倉庫實(shí)現(xiàn)聯(lián)機(jī)分析。識(shí)別源數(shù)據(jù),從源數(shù)據(jù)庫中的四十幾個(gè)表中排除不必要的表和屬性。取源數(shù)據(jù)庫表中的病人基本信息、病人住院信息、病人診斷信息、婦嬰卡等及自己創(chuàng)建一個(gè)年齡段表。
2.2.2 建立數(shù)據(jù)倉庫模型
數(shù)據(jù)倉庫模型的好壞將直接影響下來的聯(lián)機(jī)分析工作性能,及在以后對(duì)數(shù)據(jù)倉庫數(shù)據(jù)更新操作的難易程度、用時(shí)多少。因此在本實(shí)驗(yàn)中采用以下數(shù)據(jù)倉庫模型(見圖1)。
2.2.3 數(shù)據(jù)的提取及加載
利用SQL SERVER 2000中的數(shù)據(jù)轉(zhuǎn)換服務(wù)工具DTS(Datastore Transmission Service)來抽取數(shù)據(jù)。在提取過程中,首先建立數(shù)據(jù)源與目標(biāo)數(shù)據(jù)源,然后在目標(biāo)數(shù)據(jù)源服務(wù)器中完成維表、事實(shí)表的創(chuàng)建,建立的包圖如圖2所示。其中事實(shí)表的數(shù)據(jù)加載SQL語句如下:
If exists (select * from dbo.sysobjects where id = object_id(N'[dbo].[shisi]') and OBJECTPROPERTY(id, N'IsUserTable') = 1)
drop table [dbo].[shisi]
GO
CREATE TABLE [dbo].[shisi] (
[prn] [varchar] (16) COLLATE Chinese_PRC_CI_AS NOT NULL ,
[sex] [varchar] (2) COLLATE Chinese_PRC_CI_AS NULL ,
[job] [varchar] (10) COLLATE Chinese_PRC_CI_AS NULL ,
[rydate] [varchar] (10) COLLATE Chinese_PRC_CI_AS NULL ,
[source] [varchar] (1) COLLATE Chinese_PRC_CI_AS NULL ,
[rynum] [varchar] (10) COLLATE Chinese_PRC_CI_AS NULL ,
[zljg] [varchar] (4) COLLATE Chinese_PRC_CI_AS NULL ,
[ryzd10] [varchar] (16) COLLATE Chinese_PRC_CI_AS NULL ,
[age_id] [varchar] (1) COLLATE Chinese_PRC_CI_AS NULL ,
[TOTAL] [int] NULL
) ON [PRIMARY]
GO
3 疾病及新生兒的多維分析
多維數(shù)據(jù)是OLAP的靈魂,那么如何組織多維數(shù)據(jù)實(shí)現(xiàn)對(duì)病案數(shù)據(jù)從地區(qū)維、時(shí)間維、年齡段維、職業(yè)維、科室和醫(yī)生維、新生兒維進(jìn)行聯(lián)機(jī)分析,首先建立系統(tǒng)數(shù)據(jù)源連接,然后建立數(shù)據(jù)庫和數(shù)據(jù)源,再建立多維數(shù)據(jù)集,設(shè)計(jì)存儲(chǔ)和處理多維數(shù)據(jù)集,最后多維分析。
3.1 創(chuàng)建多維數(shù)據(jù)集
建立多維數(shù)據(jù)集這一步是非常重要的,因?yàn)檫@是直接影響分析時(shí)數(shù)據(jù)的訪問靈活性、時(shí)效性。本實(shí)驗(yàn)中的事實(shí)數(shù)據(jù)表包括的字段有:病案號(hào)(PRN)、性別代號(hào)(SEX)、職業(yè)代號(hào)(JOB)、入院時(shí)間(RYDATE)、病人來源代號(hào)(SOURCE)、入院科號(hào)(RYNUM)、年齡段代號(hào)(AGE-ID)、診斷號(hào)(RYZD10)、治療代號(hào)(ZLJG)、患病人數(shù)(TOTOL)等。其他維度表有,地區(qū)維表、年齡維表、性別維表、時(shí)間維表、職業(yè)維表和嬰兒維表等,這些維表都是使用星型模式架構(gòu)的,而科室和醫(yī)生維表是使用雪花模式架構(gòu)的。
3.2 瀏覽多維數(shù)據(jù)
從圖3能看出330號(hào)醫(yī)生在這個(gè)科內(nèi)其技能是較好的,他有較多的病人,而那些病人數(shù)少的其技能就有待提高了。另在實(shí)驗(yàn)中還可以看出,對(duì)于不同的科室來說其病人的結(jié)構(gòu)都不同,如 03號(hào)科室的主要病人來源是“醫(yī)院所在區(qū)縣”, 10號(hào)科室的主要病人來源是“本省其它市”。醫(yī)院管理者在作決策時(shí)都能有相關(guān)信息作支持,做好戰(zhàn)略計(jì)劃,提高醫(yī)院的管理水平,造福人們,同時(shí)能獲得最高的經(jīng)濟(jì)效益。
圖4從新生兒和地區(qū)維來分析的。在圖4中可以看到在所有條件下可以得到在這幾年內(nèi)在這間醫(yī)院出生的新生兒總數(shù)為27119人,其中1表示男孩的有15528人,表示女孩的有11591人.新生兒的出生在“醫(yī)院所在區(qū)縣”和“本省其他市”的總?cè)藬?shù)是相同的。但對(duì)于“醫(yī)院所在區(qū)縣”來說是新生兒男孩是5176人而女孩是3864人,男孩比女孩多1312人次;對(duì)于“本省其他市”來說男孩是4208人次,而女孩是4832人次,男孩比女孩少。從而可以知道醫(yī)院所在區(qū)縣的男女比例嚴(yán)重失衡,存在重男輕女的現(xiàn)象。從總的人數(shù)來說新生兒的出生情況在地區(qū)性上差異不大。如果想知道新生兒在那個(gè)時(shí)間段出生的多少可以加上一個(gè)時(shí)間維,選擇不同的時(shí)間段進(jìn)行細(xì)分下去。從這些時(shí)間段中可以觀察其出生率的走勢(shì)。那么醫(yī)院可以將數(shù)據(jù)報(bào)到政府機(jī)關(guān),由他們采取措施防止男女失衡,同時(shí)醫(yī)院也要有相應(yīng)的應(yīng)對(duì)方法不能隨便幫孕婦做人流手術(shù)等。在進(jìn)行宣傳教育時(shí)要針對(duì)醫(yī)院所在區(qū)縣的人們來進(jìn)行。
3.3 對(duì)決策的支持作用
就本實(shí)驗(yàn)的聯(lián)機(jī)分析,從地區(qū)維度來說可以得到是醫(yī)院所在區(qū)縣、本市其它地區(qū)、本省其它市、外省市、港澳臺(tái)地區(qū)、還是外國患某種?。ㄈ纾耗X出血)的人數(shù),再加上性別維,是男的占比例多還是女多,再加上年齡段維是40-59歲的多還是60歲以上的多等等維度來分析,可以作出一個(gè)好的解答,對(duì)于這種病的預(yù)防,在作宣傳教育時(shí)針對(duì)那個(gè)地區(qū)、那個(gè)年齡段、什么職業(yè)、男性還是女性來挑選對(duì)象作宣傳教育,從歷史數(shù)據(jù)中那個(gè)季度這種病的發(fā)病情況,就選擇在這個(gè)時(shí)間多作宣傳。
在醫(yī)院內(nèi)部管理方面,在那個(gè)月或者那個(gè)季度,外科、內(nèi)科、五官科、還是婦科整體對(duì)所遇疾病的治愈情況,鉆取下去到具體某位醫(yī)生的工作情況,在這方面的醫(yī)療技術(shù)如何,醫(yī)院管理者可以從中發(fā)現(xiàn),對(duì)醫(yī)生們提要求,為他們?cè)O(shè)置加強(qiáng)技能培訓(xùn)等。
從新生兒維度可以分析出在那個(gè)時(shí)間段,那個(gè)地區(qū)的新生兒出生率情況,男女比例如何,為了平衡男女比例對(duì)那個(gè)地區(qū)那些人群進(jìn)行教育,政府又應(yīng)該采取什么有效措施提供一個(gè)數(shù)據(jù)參考。
4 結(jié)束語
只要能充分利用聯(lián)機(jī)分析對(duì)病案資料的進(jìn)行整理、利用,就能對(duì)醫(yī)院病案信息進(jìn)行全方位、多層次的查詢和分析,為醫(yī)院各類人員提供信息查詢、數(shù)據(jù)分析和決策支持。病案信息利用越多其價(jià)值越高,改變以“重管輕用”和消極等待利用的思想,做到管理和利用相結(jié)合。
參考文獻(xiàn)
[1]Microsoft Corporation. Analysis Services[M].MIicrosoft Press ,2001.
[2]魏忠琴 .數(shù)據(jù)倉庫技術(shù)在醫(yī)院病案統(tǒng)計(jì)分析中的應(yīng)用研究[J]甘蕭科技,2006.
[3]劉翔. 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)[M].上海:上海交通大學(xué)出版,2005.
[4]陳華英. 醫(yī)療衛(wèi)生信息數(shù)據(jù)倉庫及聯(lián)機(jī)分[J].CNKI:CDMD,2001.
[5]https://www.evget.com/article/2015/10/23/22815.html
[6]孔琳.基于HIS的數(shù)據(jù)倉庫構(gòu)建及多維分析[J].醫(yī)學(xué)信息學(xué)雜志,2011,32(11):6-9.
作者單位
廣州市增城區(qū)新塘醫(yī)院 廣東省廣州市 511340