程華玲
[摘要] 該文探討和研究在醫(yī)院病案統(tǒng)計(jì)分析中采用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的應(yīng)用效果。通過(guò)對(duì)醫(yī)院信息系統(tǒng)數(shù)據(jù)的挖掘和分析發(fā)現(xiàn),數(shù)據(jù)挖掘技術(shù)和數(shù)據(jù)倉(cāng)庫(kù)目前處于初步階段,存在發(fā)展?jié)摿?。認(rèn)為應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)可使醫(yī)院信息系統(tǒng)更完善,能提高統(tǒng)計(jì)工作的效能,在醫(yī)院管理中提供比較重要的科學(xué)依據(jù)。
[關(guān)鍵詞] 數(shù)據(jù)倉(cāng)庫(kù)技術(shù);醫(yī)院病案統(tǒng)計(jì);應(yīng)用研究
[中圖分類號(hào)] R197.32 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1672-5654(2019)12(b)-0163-03
Application Research of Data Warehouse Technology in Statistical Analysis of Hospital Medical Records
CHENG Hua-ling
Department of Medical Records, Jurong People's Hospital, Jurong, Jiangsu Province, 212400 China
[Abstract] Discuss and study the application effect of data warehouse technology in the statistical analysis of hospital medical records. Through the mining and analysis of hospital information system data, it is found that data mining technology and data warehouse are currently in the preliminary stage and have potential for development. The application of data warehouse technology can make the hospital information system more perfect, improve the efficiency of statistical work, and provide more important scientific basis in hospital management.
[Key words] Data warehouse technology; Hospital case statistics; Applied research
病案統(tǒng)計(jì)是醫(yī)院管理工作中比較重要的部分,而且已經(jīng)成為醫(yī)學(xué)發(fā)展的學(xué)科,它將不斷促進(jìn)醫(yī)院管理體系的發(fā)展。病案統(tǒng)計(jì)信息是臨床工作中最為原始的記錄資料,同時(shí)也關(guān)系著患者在接受治療時(shí)和治愈后的工作總結(jié)。在這個(gè)過(guò)程中,其總結(jié)工作的好壞直接反映醫(yī)務(wù)人員日常工作的效果以及管理的水平。因此病案統(tǒng)計(jì)的原始資料及統(tǒng)計(jì)分析的再生數(shù)據(jù)資料,對(duì)醫(yī)院管理的決策發(fā)揮著重要的作用。隨著醫(yī)院信息系統(tǒng)工作的不斷運(yùn)用,病案統(tǒng)計(jì)的查詢工作逐漸復(fù)雜,而且統(tǒng)計(jì)的信息量也逐漸增多,病案分析工作速度大大降低了,無(wú)法滿足病案統(tǒng)計(jì)的工作需求,因此要尋求一種比較有效的方式促進(jìn)病案統(tǒng)計(jì)分析工作[1]。而數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的出現(xiàn),恰恰滿足了病案統(tǒng)計(jì)工作的需求。數(shù)據(jù)倉(cāng)庫(kù)技術(shù)是用科學(xué)的方式整理數(shù)據(jù),從不同角度對(duì)醫(yī)院病案統(tǒng)計(jì)進(jìn)行分析,可以精確分析和準(zhǔn)確判斷。該文通過(guò)以下幾個(gè)方面敘述數(shù)據(jù)倉(cāng)庫(kù)技術(shù)在醫(yī)院病案統(tǒng)計(jì)分析中的應(yīng)用效果,旨在宣傳當(dāng)今順息萬(wàn)變的大數(shù)據(jù)時(shí)代,應(yīng)用數(shù)據(jù)倉(cāng)技術(shù)勢(shì)在必行。
1 ?醫(yī)院病案統(tǒng)計(jì)分析中出現(xiàn)的問(wèn)題
1.1 ?在查詢過(guò)程中速度比較慢
隨著醫(yī)院信息量的增大,在信息管理系統(tǒng)的運(yùn)營(yíng)過(guò)程中,數(shù)據(jù)量逐漸增多,在查詢分析過(guò)程中具有一定的復(fù)雜性,最終導(dǎo)致統(tǒng)計(jì)查詢的速度降低,無(wú)法滿足工作的效率,同時(shí)歷史的數(shù)據(jù)也無(wú)法充分運(yùn)用。而且系統(tǒng)管理的技術(shù)是屬于傳統(tǒng)的數(shù)據(jù)庫(kù),因此在平時(shí)的工作中,無(wú)法滿足增多的信息量,使歷史的數(shù)據(jù)脫離系統(tǒng)管理。而且傳統(tǒng)數(shù)據(jù)庫(kù)的統(tǒng)計(jì)比較單一,難以符合決策性的需求[2]。
1.2 ?病案統(tǒng)計(jì)分析工作不健全
當(dāng)前醫(yī)院病案統(tǒng)計(jì)分析系統(tǒng)是十幾年前安裝使用的老程序,隨著醫(yī)療技術(shù)水平的提高和一些新病種的出現(xiàn),各種新的疾病治療方法、技術(shù)和新的手術(shù)項(xiàng)目應(yīng)運(yùn)而生,系統(tǒng)對(duì)這些新內(nèi)容無(wú)法識(shí)別和更新,或者系統(tǒng)儲(chǔ)存容量不夠,在檢索和分析病案數(shù)據(jù)資料時(shí),會(huì)丟失部分?jǐn)?shù)據(jù)或者根本查不到該有的信息(經(jīng)常有醫(yī)生來(lái)說(shuō)幫查一下收治的幾份重要和特殊病例但病案室查不到),有時(shí)信息還會(huì)互串和重疊。導(dǎo)致數(shù)據(jù)統(tǒng)計(jì)缺乏真實(shí)性,勢(shì)必影響整個(gè)醫(yī)院的發(fā)展[3]。
1.3 ?在病案統(tǒng)計(jì)分析工作中基礎(chǔ)建設(shè)比較薄弱
在經(jīng)濟(jì)不斷發(fā)展的今天,醫(yī)院信息統(tǒng)計(jì)方面的需求不斷增加,在病案統(tǒng)計(jì)分析工作中,信息統(tǒng)計(jì)不規(guī)范,其建立的信息數(shù)據(jù)不健全,確保不了質(zhì)量。部分人員對(duì)待工作責(zé)任心不強(qiáng),因此病案統(tǒng)計(jì)分析工作存在疏忽和漏洞[4]。
2 ?采用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的作用
對(duì)傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)而言,在進(jìn)行數(shù)據(jù)統(tǒng)計(jì)和分析時(shí)只能用于平時(shí)的數(shù)據(jù)統(tǒng)計(jì),而對(duì)于輔助決策的數(shù)據(jù)分析工作是無(wú)法完成的,而數(shù)據(jù)倉(cāng)庫(kù)技術(shù)在分析數(shù)據(jù)方面具有比較大的優(yōu)勢(shì)。傳統(tǒng)的數(shù)據(jù)分析滿足不了病案統(tǒng)計(jì)工作,直接影響病案統(tǒng)計(jì)分析工作的價(jià)值。而數(shù)據(jù)倉(cāng)庫(kù)技術(shù)可以在傳統(tǒng)數(shù)據(jù)技術(shù)的基礎(chǔ)上提升管理需求,在數(shù)據(jù)倉(cāng)庫(kù)技術(shù)開(kāi)展下,將病案中的各類數(shù)據(jù)、信息等相互結(jié)合起來(lái),重新建立新型的信息知識(shí)庫(kù)。分門(mén)別類的實(shí)現(xiàn)統(tǒng)計(jì)分析的目的,同時(shí)可以在醫(yī)療工作中實(shí)施非數(shù)字的信息安排,也能進(jìn)一步提高病案中數(shù)據(jù)統(tǒng)計(jì)的利用率。數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的實(shí)施,可以有效的識(shí)別出大量數(shù)據(jù)中最有用的數(shù)據(jù)并進(jìn)行分析。在病案系統(tǒng)管理應(yīng)用中,數(shù)據(jù)倉(cāng)庫(kù)技術(shù)對(duì)各類病案中的醫(yī)療過(guò)程產(chǎn)生的數(shù)據(jù)進(jìn)行集成、綜合、對(duì)比,其產(chǎn)生的數(shù)據(jù)是真實(shí)有效的,對(duì)比性與推理性都比較強(qiáng)[5]。
3 ?在病案統(tǒng)計(jì)分析中應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的特點(diǎn)
3.1 ?實(shí)施建立數(shù)據(jù)倉(cāng)庫(kù)
數(shù)據(jù)倉(cāng)庫(kù)是按照數(shù)據(jù)結(jié)構(gòu)來(lái)組織、存儲(chǔ)和管理數(shù)據(jù)并建立在計(jì)算機(jī)存儲(chǔ)設(shè)備上的倉(cāng)庫(kù)。可以長(zhǎng)期存儲(chǔ)在計(jì)算機(jī)內(nèi),是有組織可以共享的數(shù)據(jù)集合。建立數(shù)據(jù)倉(cāng)庫(kù)的第一個(gè)步驟是要通過(guò)與醫(yī)院業(yè)務(wù)部分的交流溝通,充分了解建立數(shù)據(jù)倉(cāng)庫(kù)所要解決的問(wèn)題和真正的含義,確定查詢分析的需求。第二是要選擇滿足數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)要求的軟件平臺(tái),其中包括數(shù)據(jù)庫(kù)、建模工具以及分析工具等。要考慮到系統(tǒng)對(duì)數(shù)據(jù)量、響應(yīng)時(shí)間、分析功能的要求等。第三要建立數(shù)據(jù)倉(cāng)庫(kù)的邏輯模型,確定建立數(shù)據(jù)倉(cāng)庫(kù)邏輯模型的基本方法,將主題中數(shù)據(jù)定義轉(zhuǎn)到邏輯數(shù)據(jù)模型中,進(jìn)行審核邏輯數(shù)據(jù)模型。
3.2 ?邏輯數(shù)據(jù)模型轉(zhuǎn)化數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型
在數(shù)據(jù)倉(cāng)庫(kù)模型中不需要包含非戰(zhàn)略性的數(shù)據(jù),因此在用操作處理的數(shù)據(jù)要進(jìn)行刪除。在數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)一定是時(shí)間的快照,在分析數(shù)據(jù)要提高使用性能。在病案統(tǒng)計(jì)工作中,要實(shí)施確定主題,首先對(duì)患者的疾病進(jìn)行分析其特點(diǎn),對(duì)該病的治療措施進(jìn)行制定,將所需花費(fèi)的費(fèi)用進(jìn)行統(tǒng)計(jì),以及對(duì)患者的住院時(shí)間進(jìn)行評(píng)估和對(duì)患者治療后的工作進(jìn)行總結(jié)。針對(duì)所要發(fā)生的情況,提供縮短治療的時(shí)間、減少患者所承擔(dān)的醫(yī)療費(fèi)用、對(duì)患者實(shí)施最佳的治療方案,同時(shí)也確保了醫(yī)院效益的情況進(jìn)行統(tǒng)計(jì)分析,制定相關(guān)的表格。在數(shù)據(jù)模型建立的過(guò)程中,將無(wú)關(guān)此次分析的數(shù)據(jù)進(jìn)行排除,將所發(fā)生的事實(shí)明確并仔細(xì)地記錄[6]。
3.3 ?建立數(shù)據(jù)模型后提取相關(guān)的數(shù)據(jù)
在將所需的數(shù)據(jù)模型建立以后,根據(jù)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的要求,對(duì)數(shù)據(jù)倉(cāng)庫(kù)中所需要的數(shù)據(jù)進(jìn)行提取,首先要對(duì)外界的數(shù)據(jù)資源進(jìn)行收集和提取。在提取數(shù)據(jù)的過(guò)程中,首先要將數(shù)據(jù)提取的目標(biāo)與數(shù)據(jù)進(jìn)行聯(lián)合建立,在統(tǒng)一的服務(wù)器中完成。如果數(shù)據(jù)結(jié)構(gòu)化,在數(shù)據(jù)提取的過(guò)程中要在源系統(tǒng)內(nèi)執(zhí)行。采用的是完全提取法,無(wú)需跟蹤更改,邏輯簡(jiǎn)單,但是系統(tǒng)負(fù)載較大。增量提取,將跟蹤源數(shù)據(jù)中的更改,可以創(chuàng)建更改表以跟蹤更改或檢查時(shí)間戳,數(shù)據(jù)倉(cāng)庫(kù)內(nèi)置變更數(shù)據(jù)捕獲功能,雖然邏輯比較復(fù)雜,但是系統(tǒng)負(fù)載卻大大減少了。
3.4 ?創(chuàng)建多維數(shù)據(jù)表進(jìn)行分析
在將外界數(shù)據(jù)源進(jìn)行收集和提取后,要建立多維數(shù)據(jù)庫(kù),將數(shù)據(jù)存放在一個(gè)n維數(shù)組中,而不是像關(guān)系數(shù)據(jù)庫(kù)那樣以記錄的形式存放。工作人員可以通過(guò)多維視圖來(lái)觀察數(shù)據(jù),多維數(shù)據(jù)庫(kù)增加了一個(gè)時(shí)間維,與關(guān)系數(shù)據(jù)庫(kù)相比,更加提高了數(shù)據(jù)處理的速度,加快了反應(yīng)的時(shí)間,提高查詢的效率。創(chuàng)建多維數(shù)據(jù)庫(kù)首先要選擇事實(shí)數(shù)據(jù)表,以及需要的雪花架構(gòu)和星型架構(gòu)維度,采集后存儲(chǔ)到多維數(shù)據(jù)庫(kù)內(nèi)。
4 ?數(shù)據(jù)挖掘
4.1 ?數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘是近年來(lái)伴隨數(shù)據(jù)庫(kù)系統(tǒng)的大量建立和萬(wàn)維網(wǎng)的廣泛應(yīng)用而發(fā)展起來(lái)的一門(mén)技術(shù)。數(shù)據(jù)挖掘是交叉性學(xué)科,是數(shù)據(jù)庫(kù)技術(shù)、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、人工智能、可視化分析等多門(mén)技術(shù)的融合。在大量的、不完全的以及有噪音或模糊的實(shí)際數(shù)據(jù)中,提取隱含的,有潛在價(jià)值的信息和知識(shí)的過(guò)程。數(shù)據(jù)的挖掘首先是搜集數(shù)據(jù)、數(shù)據(jù)越豐富越好,數(shù)據(jù)量越大越好,只有獲得足夠的高質(zhì)量的數(shù)據(jù),才可以獲得準(zhǔn)確的判斷,才可以產(chǎn)生認(rèn)知模型,是量變到質(zhì)變的過(guò)程。目前挖掘數(shù)據(jù)的方法分類有神經(jīng)網(wǎng)絡(luò)方法、遺傳算法、決策樹(shù)方法、統(tǒng)計(jì)分析方法、模糊集方法等,神經(jīng)網(wǎng)絡(luò)方法是由于本身良好的魯棒性、自組織自適應(yīng)性、并行處理以及分布存儲(chǔ)和高度容錯(cuò)的特性,比較適合解決數(shù)據(jù)挖掘的問(wèn)題。遺傳算法是一種基于生物自然選擇與遺傳機(jī)理的隨機(jī)搜索的算法,是一種仿生全局的優(yōu)化方法,具有隱含并行性,易于和其他的模型結(jié)合的性質(zhì),應(yīng)用比較廣泛。決策樹(shù)方法是一種常用于預(yù)測(cè)模型的算法,通過(guò)大量的數(shù)據(jù)有目的地分類,在這當(dāng)中找到有價(jià)值以及潛在的信息,優(yōu)點(diǎn)在于描述比較簡(jiǎn)單,分類速度較快,比較適合大規(guī)模的數(shù)據(jù)處理。統(tǒng)計(jì)分析方法是在數(shù)據(jù)庫(kù)字段項(xiàng)之間存在的兩種關(guān)系,函數(shù)關(guān)系和相關(guān)關(guān)系,對(duì)它們的分析主要采用統(tǒng)計(jì)學(xué)方法,利用統(tǒng)計(jì)學(xué)的原理對(duì)數(shù)據(jù)庫(kù)中的信息進(jìn)行分析,主要進(jìn)行回歸分析、相關(guān)分析以及差異分析和常用統(tǒng)計(jì)等。模糊集方法對(duì)實(shí)際問(wèn)題進(jìn)行模糊評(píng)判、模糊決策、模糊模式識(shí)別和模糊聚類分析,其系統(tǒng)的復(fù)雜性比較高、模糊性比較強(qiáng)[7]。
4.2 ?數(shù)據(jù)挖掘任務(wù)
數(shù)據(jù)挖掘任務(wù)包括關(guān)聯(lián)分析、聚類分析,關(guān)聯(lián)分析是指兩個(gè)或兩個(gè)以上變量的取值之間存在某種規(guī)律性為關(guān)聯(lián)。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)倉(cāng)庫(kù)中存在的比較重要和可被發(fā)現(xiàn)的知識(shí),分為簡(jiǎn)單和時(shí)序以及因果關(guān)聯(lián)。其目的是找出數(shù)據(jù)庫(kù)中隱藏的關(guān)聯(lián)網(wǎng),使數(shù)據(jù)挖掘的規(guī)則更加符合要求。聚類分析是數(shù)據(jù)按照相似性歸納為若干類別,同一類的數(shù)據(jù)彼此相似,不同類的數(shù)據(jù)相異,可以建立宏觀的概念,發(fā)現(xiàn)數(shù)據(jù)的分布模式。
4.3 ?數(shù)據(jù)挖掘的特點(diǎn)
數(shù)據(jù)挖掘是基于大量的數(shù)據(jù),并非說(shuō)小數(shù)據(jù)量上不可以進(jìn)行挖掘,在大多數(shù)據(jù)挖掘的算法是在小數(shù)據(jù)量上運(yùn)行而且得到的結(jié)果,小數(shù)據(jù)量無(wú)法反映出真實(shí)世界中的普遍特性。數(shù)據(jù)挖掘出來(lái)的知識(shí)是以前未知的,是一個(gè)全新的知識(shí),可以幫助醫(yī)院獲得進(jìn)一步的洞察力。數(shù)據(jù)挖掘具有一定的價(jià)值性,可以給醫(yī)院直接帶來(lái)效益,是提升醫(yī)院總體價(jià)值的利器[8]。
近年來(lái),醫(yī)院的整個(gè)信息系統(tǒng)當(dāng)中,數(shù)據(jù)倉(cāng)庫(kù)技術(shù)以及數(shù)據(jù)挖掘技術(shù)都處在一個(gè)比較初步的階段,有著廣闊的發(fā)展空間,醫(yī)院在整體的信息系統(tǒng)采用數(shù)據(jù)倉(cāng)庫(kù)技術(shù),學(xué)習(xí)和掌握數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的理論知識(shí)和操作應(yīng)用,改變自身的知識(shí)結(jié)構(gòu),既要有良好的統(tǒng)計(jì)思維,又要熟練掌握現(xiàn)代信息技術(shù),成為復(fù)合型的統(tǒng)計(jì)工作者。充分利用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的信息資源,為醫(yī)院領(lǐng)導(dǎo)決策提供依據(jù)。
[參考文獻(xiàn)]
[1] ?周清.如何利用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)開(kāi)展醫(yī)院病案統(tǒng)計(jì)分析[J].財(cái)經(jīng)界:學(xué)術(shù)版,2019(3):169.
[2] ?陳力.關(guān)于醫(yī)院信息化建設(shè)中數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的應(yīng)用研究[J].中國(guó)信息化,2019(1):64-65.
[3] ?余冬.醫(yī)院信息化建設(shè)中數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的應(yīng)用[J].信息與電腦:理論版,2018(22):160-161,164.
[4] ?陳翔,劉春,楊銳.數(shù)據(jù)倉(cāng)庫(kù)技術(shù)在糖尿病健康教育中的應(yīng)用研究[J].醫(yī)學(xué)信息,2018,31(20):1-2,5.
[5] ?李宏楨.基于數(shù)據(jù)倉(cāng)庫(kù)技術(shù)建立醫(yī)院管理信息數(shù)據(jù)平臺(tái)的實(shí)踐[J].數(shù)字技術(shù)與應(yīng)用,2017(9):90-91.
[6] ?彭欣元.解析數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘在醫(yī)院管理中的應(yīng)用[J].中國(guó)新通信,2017,19(4):118.
[7] ?李韜,馮佳莉,張屹,等.數(shù)據(jù)倉(cāng)庫(kù)技術(shù)在醫(yī)院信息化建設(shè)方案實(shí)現(xiàn)中的應(yīng)用價(jià)值[J].中國(guó)醫(yī)藥導(dǎo)報(bào),2016,13(4):160-163.
[8] ?唐瑞璠,劉虹群,何擁群,等.基于病案信息數(shù)據(jù)倉(cāng)庫(kù)及數(shù)據(jù)挖掘技術(shù)構(gòu)建醫(yī)院管理決策平臺(tái)[J].現(xiàn)代醫(yī)院,2016,16(1):132-134.
(收稿日期:2019-09-19)