王螢,徐琛
(1.首都醫(yī)科大學附屬北京朝陽醫(yī)院財務科,北京 100043;2.首都醫(yī)科大學附屬北京朝陽醫(yī)院病案統(tǒng)計科,北京 100043)
基于OLAP+DM技術的醫(yī)院財務分析系統(tǒng)的設計與實現(xiàn)
王螢1,徐琛2
(1.首都醫(yī)科大學附屬北京朝陽醫(yī)院財務科,北京100043;2.首都醫(yī)科大學附屬北京朝陽醫(yī)院病案統(tǒng)計科,北京100043)
文中成功將醫(yī)院的數(shù)據(jù)信息庫與下屬醫(yī)院的信息庫有效相結(jié)合,建立了龐大的整合數(shù)據(jù)資源池,并經(jīng)過一系列的數(shù)據(jù)抽取、轉(zhuǎn)換和加載為資源的整合做出了有效的準備工作,且最終建立了一個有效的財務分析數(shù)據(jù)倉庫,解決了始終困擾行業(yè)的數(shù)據(jù)孤島問題。在此基礎上,還經(jīng)過一些列的分析和推導,利用OLAP和DM技術,對財務報表進行了全方位多維度的分析,同時對于數(shù)據(jù)的可靠性和價值性進行一定程度上的數(shù)據(jù)挖掘,將對數(shù)據(jù)分析的結(jié)果提供給醫(yī)院的管理層和決策層。對系統(tǒng)地測試表明,該系統(tǒng)在數(shù)據(jù)分析和處理整合上均具有可靠性和權(quán)威性。
醫(yī)院財務系統(tǒng);數(shù)據(jù)庫;數(shù)據(jù)整合;技術分析
進入21世紀以后,計算機信息技術發(fā)展突飛猛進,我們的生產(chǎn)生活方式已經(jīng)發(fā)生了巨大的改變,已經(jīng)避免不了要和大量的數(shù)據(jù)信息進行交流溝通,對于醫(yī)院來說,更是如此,作為社會上的職能機構(gòu)每天要處理很多龐大數(shù)據(jù)信息,作為醫(yī)院的管理層和決策層,如何在大量的數(shù)據(jù)流量信息中捕捉到有價值的信息,從而進行有針對性的正確決策是一個考驗著IT工作者們的難題,而這也決定著一個醫(yī)院的成敗興衰和工作效率。正是為了解決這種實際問題,文將本來用于數(shù)據(jù)倉庫管理的OLAP技術和用于數(shù)據(jù)挖掘的DM技術移植到數(shù)據(jù)處理中來[1],為財務分析工作進行輔助,在對這兩種技術進行深入的與原理剖析后,結(jié)合醫(yī)院目前的運行現(xiàn)狀,對系統(tǒng)的功能和設計進行綜合考量,最終確定了一套行之有效的設計原則和標準,使用該系統(tǒng)后可以改變醫(yī)院以前的每月月報的傳統(tǒng)財務分析行為,可以在系統(tǒng)中直接進行綜合整理和上報,這有效的提高了醫(yī)院的運行效率,除此之外,系統(tǒng)還能只能分析財務報表,將隱含的突出信息上報給決策層。
1.1體系結(jié)構(gòu)的設計研究
文中設計的這款系統(tǒng)的體系結(jié)構(gòu)可分成4個層次,如圖1所示,位于體系最底層的是數(shù)據(jù)獲取層,數(shù)據(jù)源主要是醫(yī)院的日常財務報表,這里面包括各類憑證數(shù)據(jù),要保證數(shù)據(jù)的統(tǒng)一性和一致性必須對數(shù)據(jù)進行必要的抽取,清理和轉(zhuǎn)換,而后在將統(tǒng)一后的數(shù)據(jù)類型進化型存入操作,目標地址是數(shù)據(jù)倉庫。這里面采用的是SAP BW數(shù)據(jù)抽取機制[2],通過一定得技術手段將數(shù)據(jù)先加載至PSA再通過與信息源的對照等更新規(guī)則的清洗加載到ODS中,最終進入目標地址信息立方體。
數(shù)據(jù)存儲層的主要功能是用來處理講過加工后的數(shù)據(jù),來源主要是醫(yī)院日常的財務系統(tǒng)地數(shù)據(jù)流,按照某種需求進行重新的組織和處理,這個層面的主要功能是為醫(yī)院的決策層提供大量的規(guī)范化的數(shù)據(jù)以便于進行分析從而做出正確的判斷。
數(shù)據(jù)處理層是體系結(jié)構(gòu)中很重要的一個環(huán)節(jié),主要工作原理是利用OLAP技術和數(shù)據(jù)挖掘技術對醫(yī)院的信息數(shù)據(jù)流進行立方式的設計和處理,從而刪除不必要的信息,有價值的信息進行保留上傳至下一環(huán)節(jié)。
圖1 醫(yī)院財務分析系統(tǒng)的體系結(jié)構(gòu)設計Fig.1 Architecture design Hospital Financial Analysis System
1.2數(shù)據(jù)準備模塊相關設計研究
設計這個模塊的主要作用是將醫(yī)院的各個部門之間不同的數(shù)據(jù)類型新型轉(zhuǎn)換清洗和加載[3],由此可使得數(shù)據(jù)具有統(tǒng)一性。要達到這個目的,首先應對數(shù)據(jù)源和數(shù)據(jù)倉庫進行數(shù)據(jù)化建模。
在進行數(shù)據(jù)處理時,要考慮數(shù)據(jù)源結(jié)構(gòu)等相關問題,即數(shù)據(jù)源結(jié)構(gòu)是什么樣的,在抽取結(jié)果中EPR是包含著那些有價值的數(shù)據(jù),諸如此類問題必須在EPR系統(tǒng)中提前定義好,這個過程通常稱之為數(shù)據(jù)源建模,我們設計的這款財務分析系統(tǒng)使用的就是EPR系統(tǒng)中的財務模塊數(shù)據(jù)[4]。設計的系統(tǒng)中將存在兩種數(shù)據(jù)類型庫,分別如圖表1和表2所示,表1表示的是資產(chǎn)負債表的數(shù)據(jù)源建模相關參照標準,表2是利潤表的數(shù)據(jù)源建模系統(tǒng)相關參照標準。
表1 資產(chǎn)負債表相關數(shù)據(jù)源建模Tab.1 Balance sheet data source modeling
表2 利潤表相關數(shù)據(jù)建模Tab.2 Income statement data modeling
根據(jù)系統(tǒng)實際需求,這個數(shù)據(jù)倉庫會按照多維分析和指標分析等將邏輯模型設計為兩個可擴展的星型模型。
Ⅰ在系統(tǒng)中多維分析模塊是由兩個部分組成,即一個事實表和六維表組成。其中的每一個維表包含的SID表均由三部分組成,即屬性表,文本表和層次表[5]。
Ⅱ指標的分析模塊的邏輯模型是由兩部分組成個,即一個事實表和4個維表,這些屬性會在財務分析系統(tǒng)中起到至關重要的提示作用,為系統(tǒng)的操作帶來了方便,分別是時間維表,單位名稱維表。
1.3多維分析模塊的設計研究
在系統(tǒng)設計中,這個模塊的主要功能是將各選定的科目以一種多維的方式顯示出來,使用者可通過OLAP技術對這些數(shù)據(jù)進行比較分析,即使用OLAP的在維度方面的變化功能對一個單位不同年份進行縱向比較和分析,或者對同一個時間節(jié)點的不同單位進行橫向比較。
這個模塊的優(yōu)勢或者說是特色功能是可以利用數(shù)據(jù)挖掘技術中的OLAP技術進行數(shù)據(jù)的維度操作[6],這運行在財務分析系統(tǒng)上是一個技術創(chuàng)新,這在實際使用中具有很有價值的意義,例如若要比較某一個單位在不同年份上的同一個時期或者季度的營業(yè)情況或者比較同一年份的不同單位的效益情況都需要一種維度的比較?;诖?,本系統(tǒng)采用了分組序號聚焦算法,這能提高查詢效率,顯著提高了排序的速度。
該算法步驟中主要有兩大部分組成,即排序和分組聚集兩個部分,在排序中,首先是要將查詢分解為單維表,其次將各維表按照查詢的關鍵字進行分組編號,再次將事實表中的每個需要記錄的字段進行對應維表的替換工作,新的關鍵字就在系統(tǒng)中連接起來了。排好序后,將按照關鍵字進行分組的聚集求和,這個過程與剛才的排序過程相反,它是將記錄的關鍵字從后向前依次分解出各維表的分組序號,相同的分組序號顯然可以納入一組,最后再系統(tǒng)中對其求和操作。這個算法的流程圖可用如圖2所示的框圖表達出來。
1.4報表輸出模塊的研究設計
在上文提到的多維度分析模塊中有兩種報表,分別是運營收入狀況分析和費用情況分析的報表。其中在“運營收入狀況分析”中,其收入主要來源于門診和醫(yī)藥費等環(huán)節(jié),使用者通過這個財務分析系統(tǒng)中不僅可查詢到醫(yī)院各年度的銷售收入狀況,還可進行下鉆操作,而這依賴于OLAP技術的運用[7],這樣可以獲得本年度醫(yī)院各項銷售和運行狀況財務分析情況。
在“費用支出情況分析中”,費用情況被系統(tǒng)自動分為了醫(yī)院門診費用,管理維護費用和財務費用等3大類,這每一大類都有不同的費用科目進行選擇,其結(jié)構(gòu)設計情況大同小異,分4個維度進行表征,主要為單位,利潤,費用科目情況和時間節(jié)點4個維度。使用者在系統(tǒng)中可通過OLAP技術添加利潤版塊額度,這便于決策者對不同的模塊進行統(tǒng)計分析。表3給出了醫(yī)院財務分析系統(tǒng)的指標分析情況和具體科目表。
圖2 分組序號的聚集算法流程框圖Fig.2 Packet sequence number of aggregation algorithm flow diagram
表3 財務分析系統(tǒng)中的指標分析模塊樣本Tab.3 Financial analysis system index analysis module sample
2.1數(shù)據(jù)倉庫的建模實現(xiàn)
數(shù)據(jù)倉庫概念是在關系型的數(shù)據(jù)庫模型的基礎上發(fā)展而來的,其所表征的數(shù)據(jù)類型應該具有以下幾個基本特點和特點,即非冗余性、穩(wěn)定性、一致性和最終數(shù)據(jù)使用的靈活性等特點。這個程序是系統(tǒng)中必要的準備,為以后數(shù)據(jù)庫的大量數(shù)據(jù)提取和存儲提供了技術支持。
這個程序主要的功能即是從zbalance表和 faglflext表中獲得數(shù)據(jù)[8],而后將數(shù)據(jù)按照月份想加的方式從而得到醫(yī)院的各項財務部門的期末余額,這些數(shù)據(jù)都將保存在資產(chǎn)的負債表中,最后經(jīng)過數(shù)據(jù)分析和提煉上報決策層做出最正確的選擇。
zbalancep.”從資產(chǎn)負債表對應科目中讀出所有記錄,存放在 zbalancep表中
2.2多維分析模塊的報表開發(fā)與相應實現(xiàn)
在設計的這款醫(yī)院財務分析系統(tǒng)中為了加快計算及相應的速度和利用好存儲效率,里面運用了OLAP聚焦查詢的算法,這即是對CUBE事實表進行預計算,具體實現(xiàn)方式是對要查詢的維度進行聚焦運算,將結(jié)果保存在實施表中。
系統(tǒng)中采用分組序號聚焦算法明顯提高了查詢效率,當事實表記錄數(shù)越多,這種算法提高效率的效果更加理想。舉個例子,在實驗中記錄的數(shù)據(jù)為100 000時,利用分組聚焦算法的計算機查詢速度是3 s,當采用傳統(tǒng)的聚焦算法時,查詢速度為99 s,結(jié)果如下表4所示。
2.3指標分析模塊的報表相關開發(fā)與實現(xiàn)方式
在這個模塊中使用的是模糊識別的算法,這實現(xiàn)了對輸入測試的樣本集的4項重要指標分析,這能根據(jù)指標數(shù)據(jù)的不同對數(shù)據(jù)進行只能預警分析,這也就引起了醫(yī)院決策層的注意。
查詢效率高是這個模塊應該具備的基本特征,數(shù)據(jù)存儲在數(shù)據(jù)倉庫中,進行預計算和聚焦運算,當決策層要查詢相關數(shù)據(jù)時,就可以隨時進行訪問,這極大地提高了數(shù)據(jù)分析的效率。維護性好和維護量小也是系統(tǒng)的一個特色功能,醫(yī)院的財務分析系統(tǒng)在建立的時候就已經(jīng)設定好取數(shù)邏輯和查詢邏輯。這無需專門人員進行操作和處理,只要對模型進行稍加修正即可。圖3是指標分析模塊的切片設計分析圖。
表4 分組聚焦算法與傳統(tǒng)聚焦算法相關運算效率的比較結(jié)果Tab.4 Comparison of the results of the focus groups related to the algorithm algorithm with the traditional focus of the operation efficiency
圖3 指標分析模塊的切片設計圖Fig.3 Slice design index analysis module
OLAP技術和DM技術經(jīng)過多年的發(fā)展已日趨成熟,并在眾多行業(yè)得到了廣泛的應用,而將這兩種技術結(jié)合起來為醫(yī)院的財務方面決策層提供服務卻是近些年才興起來的。本文成功將這兩種技術應用于醫(yī)院的財務分析系統(tǒng)中,經(jīng)過一系列的數(shù)據(jù)抽取和轉(zhuǎn)換等操作,建立了一個適用于醫(yī)院財務部門的信息數(shù)據(jù)系統(tǒng),解決了一直存在的數(shù)據(jù)孤島問題,在建立的這個數(shù)據(jù)倉庫中利用OLAP技術和DM技術進行數(shù)據(jù)挖掘,對醫(yī)院財務狀況進行深入分析研究,且對數(shù)據(jù)進行了價值判斷,這些結(jié)果將直達決策層,為醫(yī)院管理者的分析和決策提供了重要的技術支持。
[1]Efrem G.Mallach.Decision Support and Data Warehouse Systems[M].李昭智,李昭勇,譯.北京:電子工業(yè)出版社,2001.
[2]Paul Gray Hugh J.Watson.Decision Support In The Data Warehouse[M].北京:北京理工大學出版社,2001.
[3]Daubechies I.Ten lectures on wavelets[C].Philadelphia,Pennsylvania,SIAM Mathematieal Analysis,1992.
[4]British Standard Institution.BS EN 50160:2007 Voltage characteristics of electricity supplied by public distribution system[S].2007.
[5]IEEE Standards Coordinating Committee 22 on Power Quality,IEEE Std 1159-1995.IEEE Recommended Practice for Monitoring Electric Power Quality,ISBN-1-55937-549-3,1995.
[6]何玉潔,張俊超.數(shù)據(jù)倉庫與 OLAP實踐教程[M].北京:清華大學出版社,2008.
[7]徐潔磐.數(shù)據(jù)倉庫與決策支持系統(tǒng)[J].北京:科學出版社,2005.
[8]遲忠先,李艷紅,張春濤.OLAP核心技術—數(shù)據(jù)立方體的研究現(xiàn)狀與展望[J].計算機工程,2002,28(10):1-2.
Design and implementation of financial analysis system with hospital based on techniques of OLAP+DM
WANG Ying1,XU Chen2
(1.Financial Affairs Office,Beijing Chaoyang Hospital affiliated to Capital Medical University,Beijing 100043,China;2. Statistical room of Medical Records,Beijing Chaoyang Hospital affiliated to Capital Medical University,Beijing100043,China)
In this paper,the success of the hospital′s data bank and affiliated hospitals effectively combine information base,establishment of a large integrated data resource pool,and after a series of data extraction,transformation and loading for the integration of resources to make effective preparations,and the eventual establishment of an effective financial analysis of the data warehouse,to solve the industry has been plagued by the problem of data islands.On this basis,but also through analysis and derive some out using OLAP and DM technology,the financial statements of a full range of multi-dimensional analysis,and for the reliability and value of data mining to some extent,will the results of the data analysis provided to the hospital′s management and decision-making.To systematically test shows that the system is reliable and authoritative in the data analysis and processing integration.
hospital financial system;database;data integration;technical analysis
TM933.4
A
1674-6236(2016)05-0051-04
2015-04-17稿件編號:201504177
王 螢(1982—),女,北京人。研究方向:數(shù)據(jù)庫、醫(yī)院財務分析。