• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    關聯規(guī)則挖掘在電子病歷分析中的應用研究

    2014-04-29 00:00:00伍鼎韡等
    計算機光盤軟件與應用 2014年3期

    摘 要:目前,醫(yī)院對電子病歷中信息的利用率還很低,缺乏對數據的挖掘和知識發(fā)現。關聯規(guī)則挖掘能夠發(fā)現病歷數據各屬性間的關聯關系,對疾病的診斷、治療和醫(yī)學研究有著重要的意義。

    關鍵詞:關聯規(guī)則;電子病歷;糖尿病

    中圖分類號:TP311.13

    電子病歷中記錄著重要的醫(yī)學信息,這些信息對于醫(yī)學研究、疾病的診斷和治療有著非常重要的價值。數據挖掘技術通過分析不同病人的病因、治療方法和疾病的發(fā)展趨勢,為醫(yī)生的治療方案提供決策支持。

    1 關聯規(guī)則挖掘技術

    1.1 關聯規(guī)則的概念

    關聯規(guī)則就是反映大量數據集中的各種數據項之間的聯系和關聯程度,是數據挖掘技術中的一個重要的研究方向。關聯規(guī)則主要通過支持度和置信度兩個指標進行衡量。置信度表示規(guī)則的強度,是對關聯規(guī)則準確度的衡量;支持度是對關聯規(guī)則重要性的描述,反映規(guī)則的頻度。通常規(guī)則的支持度越高,說明關聯規(guī)則越重要;關聯規(guī)則的置信度越高,說明關聯規(guī)則的可靠性越高。根據分類的標準不同,關聯規(guī)則可以分為三類:

    (1)根據數據變量的類型分類

    關聯規(guī)則處理的變量包括數值型和布爾型。數值型變量是連續(xù)型變量,關聯規(guī)則對數值型字段進行處理時將其進行動態(tài)的分割,或者直接對原始的數據進行處理,可以和多維關聯或多層關聯規(guī)則結合起來分析。布爾型變量是離散型的,因此布爾型關聯規(guī)則處理的值都是種類化的、離散的,顯示了這些變量之間的關系。

    (2)根據數據的抽象層次分類

    關聯規(guī)則的內容在同一個層次上,則此規(guī)則為單層關聯規(guī)則,若涉及到多個不同的抽象層次,則為多層關聯規(guī)則。

    (3)根據數據維數分類

    如果規(guī)則中只涉及數據的一個維度,它就是一個單維關聯規(guī)則,單維關聯規(guī)則只處理數據的單個屬性中的一些關系;多維關聯規(guī)則從數據的多個維度進行處理和分析,涉及到各個屬性之間的某些關系。

    1.2 關聯規(guī)則算法

    關聯規(guī)則算法在很多種,其中以FP- growth算法和Apriori算法最為出名。

    Apriori算法是基于布爾關聯規(guī)則挖掘算法,其基本原理是將逐層迭代探索,找出最優(yōu)解,即通過K項集來探索(k+1)項數據集,從而獲得所在的頻繁數據項集合。Apriori算法實現過程簡單,但是算法的效率非常低。

    FP-growth算法是對Apriori算法的改進,它提出分而治之的策略,不產生候選挖掘頻繁項集,從而來提高算法的效率。FP-growth算法在首次掃描完成后,把數據庫中的頻集壓縮進一棵頻繁模式樹,用樹中的各節(jié)點的關系表示其關聯信息,然后再把這棵頻繁模式樹分解成一些條件庫,對這些條件庫分別進行挖掘。

    2 關聯規(guī)則在電子病歷中的應用

    2.1 電子病歷數據的特點

    電子病歷是醫(yī)生在治療過程中記錄病人的病情、治療過程和病情發(fā)展趨勢等資料的一種總和,這些信息可以是文字、影像、切片、圖表和符號等形式。電子病歷是醫(yī)生分析病情的主要依據,也是制定治療方案的重要參考資料,它為醫(yī)生提高了準確、及時、完善的病歷信息,在病人的診斷和治療過程起著重要的作用。

    2.2 病歷數據的關聯規(guī)則挖掘

    本文對糖尿病及并發(fā)癥的電子病歷進行關聯規(guī)則挖掘,數據來源于??卺t(yī)學院附屬醫(yī)院的糖尿病及并發(fā)癥人的電子病歷,共收集病人的診斷、治療記錄總數共13541條。對電子病歷中的數據進行初步的整理和統(tǒng)計,得出糖尿病可能引發(fā)的并發(fā)癥的信息如下:糖尿病:7021;高血壓4380;眼病2140;糖尿病并發(fā)眼病2034;糖尿病并發(fā)高血壓1934;高血壓并發(fā)眼病540。為了便于規(guī)則發(fā)現,將病癥進行符號化處理:記高血壓病為G,眼病為E,糖尿病為T。

    運用FP-growth算法進行數據挖掘,設置關聯規(guī)則的最小支持度為0.25,最小置信度為0.55,挖掘出以下關聯規(guī)則,如表1所示。

    對得到的關聯規(guī)則進行醫(yī)學解釋,得出以下結論:

    (1)糖尿病與高血壓、眼病之間有一定的關聯關系。

    (2)在統(tǒng)計的病歷中,有8%的病人同時患有糖尿病和高血壓,患有高血壓的病人有42.12%的可能并發(fā)糖尿?。换加刑悄虿〉牟∪擞?0.78%的可能會有高血壓。

    (3)在統(tǒng)計的病歷中,有4%的病人同時患有糖尿病和眼病,患有高血壓的病人有20.13%的可能并發(fā)眼?。换加醒鄄∮?5.4%的可能會有糖尿病。

    (4)有1.2%的病人同時患有糖尿病、高血壓和眼病,患有高血壓和眼病的病人有67%的可能會患有糖尿??;患有糖尿病的病人有8.02%的可能會并發(fā)患有高血壓和眼病。

    3 結束語

    文中利用FP-growth算法對糖尿病人的電子病歷進行關聯規(guī)則分析,挖掘出糖尿病可能引發(fā)的并發(fā)癥,以及并發(fā)病發(fā)生的概率,為醫(yī)生進行病情診斷提供決策信息,具有一定的實用價值。

    參考文獻:

    [1]劉秀娜.關聯規(guī)則挖掘在電子病歷分析中的應用研究[J].內蒙古科技大學學報,2010,12:23-25.

    [2]丁衛(wèi)平,祁恒.基于關聯規(guī)則的電子病歷挖掘算法研究與應用[J].微電子學與計算機,2007,03:69-76.

    作者簡介:伍鼎韡,男,海南??谌?,本科在讀生,研究方向:數據挖掘及金屬材料機械性能;通訊作者:伍強(1969.04-),男,海南??谌?,碩士,副教授,高級工程師,研究方向:數據挖掘、口腔設備學教學與研究。

    作者單位:華中科技大學機械學院11級機械2班,武漢 430074;海南醫(yī)學院附屬醫(yī)院設備科,???570102;海南科技職業(yè)學院,???570216;海南醫(yī)學院,???571199

    基金項目:海南省自然科學基金資助項目(NO:310154)。

    子长县| 镇安县| 和平区| 通山县| 自治县| 方城县| 台北市| 平邑县| 紫金县| 鄱阳县| 洱源县| 弥渡县| 迭部县| 阳春市| 葵青区| 自贡市| 闵行区| 舞阳县| 鲁甸县| 宜宾市| 黔西县| 崇阳县| 昌吉市| 彭山县| 白沙| 武定县| 屯留县| 九寨沟县| 沂源县| 鸡泽县| 洞口县| 偏关县| 丽江市| 宁蒗| 白朗县| 琼中| 宜黄县| 武威市| 绥芬河市| 灵川县| 南丹县|