梁源
隨著醫(yī)院信息化系統(tǒng)的運行,其積累了海量的病歷數據,這些病歷數據散亂的、簡單的保存于數據庫中,為了提高醫(yī)院科研、診療、救治水平,可以利用數據挖掘技術將病歷進行整合、分類,從中發(fā)現(xiàn)潛在的、有價值的信息,為醫(yī)院管理、診斷和治療提供決策指導。論文詳細地分析了數據挖掘在醫(yī)院信息化中的應用現(xiàn)狀,設計了一個基于數據挖掘技術的病歷自動化分析系統(tǒng),詳細地描述了系統(tǒng)的業(yè)務處理流程,為系統(tǒng)實現(xiàn)提供參考。
【關鍵詞】數據挖掘 病歷信息 業(yè)務理解 數據準備
1 引言
隨著光纖網絡、移動計算、多媒體通信、智能存儲等技術快速發(fā)展,促進了云計算、數據挖掘、數據倉庫等技術在各個領域得到廣泛普及和應用,比如在教育、財務會計、在線學習、智能醫(yī)療和在線旅游等領域。隨著智能醫(yī)療系統(tǒng)的使用,其已經積累了海量的病歷資源,醫(yī)護人員使用病歷資源時采用人工查詢、審閱的方法,無法快速、精準定位自己期望的信息。數據挖掘可以使用支持向量機、K均值、貝葉斯理論、BP神經網絡等算法自動化的對病歷數據進行分類,分類主題可以由用戶進行設置,比如按照疾病治療成功率、疾病錯誤診斷原因等,將數據挖掘技術引入到醫(yī)院信息化系統(tǒng)中,可充分的利用先進的數據挖掘技術,深層次挖掘病歷信息模式,尋找潛藏的、有價值的病歷信息和決策知識,指導醫(yī)院開展管理、醫(yī)療診治工作。
2 數據挖掘技術在醫(yī)院信息化中的應用
近年來,數據挖掘技術在醫(yī)院信息化中也得到了廣泛的應用,提高了醫(yī)院信息資源的利用率。為了發(fā)揮醫(yī)院大數據資源的效用,醫(yī)院信息化系統(tǒng)中引入了多種數據挖掘技術,這些數據挖掘技術可以從海量的、帶有噪聲數據的、不完全的數據記錄中發(fā)現(xiàn)隱含的模式,以便能夠為醫(yī)院提供客觀的、有價值的決策知識,提高數據的利用率,將靜態(tài)的、抽象的數據資源與應用背景有效整合,轉化為有價值的、有利的信息和知識資源。經過多年的應用,數據挖掘在醫(yī)院信息系統(tǒng)中的應用主要包括以下幾個方面。
2.1 數據挖掘在合理用藥方面的分析
目前,醫(yī)院藥品管理系統(tǒng)中引入的藥品種類多大上萬種,每一種藥品的價格、用量都不同,數據量非常大。藥品種類的增多大幅度提升用藥的復雜度和困難度,需要嚴格遵循合理用藥原則,控制藥物使用量。數據挖掘算法可以從藥品管理系統(tǒng)中提取海量藥品使用數據,精確挖掘和分析用藥數量、患者用藥成本、藥品產生的不良反應等情況,確保醫(yī)院藥品使用合理。
2.2 患者疾病種類分析與預測
隨著人們的生活質量提高,易感染的疾病種類也越來越多。數據挖掘算法可以從患者病歷資料系統(tǒng)中提取患者診斷、治療數據,分析患者疾病種類、發(fā)病時間、病程、治愈情況等,以便能夠預測疾病易感染或發(fā)作時間段,挖掘有效的診斷和治療方法,提高患者醫(yī)治的成功率。
2.3 構建專家治療庫,便于用戶診斷推薦
隨著互聯(lián)網技術的快速發(fā)展,許多醫(yī)院設計了門戶網,可以集成共享醫(yī)療衛(wèi)生資源,實現(xiàn)網上預約會診等功能。由于許多患者或家屬對疾病知識不甚了解,無法獲取準確的治療專家信息,因此醫(yī)院可以使用數據挖掘技術,選取和分析診斷治療較好的專家,構建專家?guī)?,患者輸入相關的疾病之后,系統(tǒng)可以采用關聯(lián)規(guī)則自動匹配疾病專家,以便得到有效的會診和治療。
3 基于數據挖掘技術的病例自動化分析系統(tǒng)設計
基于數據挖掘的病歷自動化分析系統(tǒng)主要功能流程包括業(yè)務理解、數據理解、數據準備、建立模型及評估、算法部署運行等階段。
3.1 業(yè)務理解階段
業(yè)務理解可以確定病歷分析的挖掘背景、挖掘目標、可行性分析和挖掘計劃。數據挖掘的背景是針對病歷進行主題化分析,確定知識挖掘的成功標準和詳細的挖掘計劃,并且查看挖掘需要的資源是否滿足執(zhí)行條件,驗證病歷自動化分析的可行性。
3.2 數據理解階段
數據理解可以采集患者的原始病歷檔案信息,由于數據在算法運行過程中,數據是抽象的,使用人員通常無法獲取背景信息,不利于算法執(zhí)行。數據理解可以描述數據記錄、屬性等內容,形成一個病歷檔案數據摘要報告。
3.3 數據準備階段
原始的病歷檔案信息會存在許多的錯誤、缺省值等問題,因此數據準備階段需要完成的工作包括數據選擇、數據清潔、數據創(chuàng)建、數據合并、數據格式化等。該階段可以根據數據挖掘的目標和質量選擇一個合適的數據,選擇合適的表、記錄和屬性,同時可以去除噪聲和缺省值的記錄,提高病歷檔案數據的質量,創(chuàng)建一個新的病歷數據子集,并且可以將多個數據集形成一個完整的表,轉換成算法運行期望的格式。
3.4 建立模型及評估階段
病歷自動分析系統(tǒng)中,建立模型是非常關鍵的一個內容,其工作包括選擇數據挖掘算法、模型訓練、模型測試及評估等操作。選擇建模技術可以根據病歷分析的應用需求確定適合的數據挖掘算法,設置算法模型的運行參數和評估方案,評估模型的質量和有效性,并且使用模型在病歷數據集上運行,進一步可以優(yōu)化模型。
3.5 算法部署運行階段
算法部署運行階段的主要工作是將數據挖掘算法嵌入到系統(tǒng)中,按照不同的應用需求主題挖掘病歷知識,同時監(jiān)控挖掘獲取的知識在實際業(yè)務中應用效果。
4 結束語
醫(yī)院信息系統(tǒng)的運行積累了海量的病歷資源,這些資源蘊含無限的、有價值的知識內容,利用數據挖掘技術可以構建一個完善的病歷自動化分析系統(tǒng),挖掘病歷中的潛在模式,指導醫(yī)院開展各類工作。
參考文獻
[1]史淳樵,侯佳音.數據挖掘技術在醫(yī)院信息管理系統(tǒng)當中的應用[J].電子設計工程,2015,32(21):21-23.
[2]鄒芳,田曄,吳衛(wèi)國,等.基于非結構化電子病歷的腦卒中數據挖掘管理系統(tǒng)設計和實現(xiàn)[J].中國數字醫(yī)學,2015,44(3):41-44.
[3]王慧.數據倉庫和數據挖掘在醫(yī)院信息系統(tǒng)中的應用[J].電腦開發(fā)與應用,2014,34(1):76-78.
[4]陳曉琛.醫(yī)院病案信息系統(tǒng)的數據挖掘在醫(yī)院中的重要意義[J].當代醫(yī)學,2014,35(25):8-9.
作者單位
1.承德醫(yī)學院附屬醫(yī)院網絡中心 河北省承德市 067000
2.承德醫(yī)學院附屬醫(yī)院結算中心 河北省承德市 067000