• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    數(shù)據(jù)挖掘技術(shù)在建立肺結(jié)核病單病種費(fèi)用模型中的研究

    2014-04-18 06:18:36管麗華
    中國(guó)醫(yī)院 2014年4期
    關(guān)鍵詞:肺結(jié)核病決策樹(shù)天數(shù)

    ■王 俊 馬 麗 趙 敘 管麗華 陳 可 李 硯

    數(shù)據(jù)挖掘技術(shù)在建立肺結(jié)核病單病種費(fèi)用模型中的研究

    ■王 ?、亳R 麗①趙 敘①管麗華①陳 可①李 硯①

    肺結(jié)核病 數(shù)據(jù)挖掘技術(shù) 單病種 費(fèi)用模型 信息管理系統(tǒng)

    肺結(jié)核病具有發(fā)病率高、危害嚴(yán)重、消耗醫(yī)療資源大的特點(diǎn)。因病情程度和并發(fā)癥等差異,其住院費(fèi)用的差別也較大。本文利用數(shù)據(jù)挖掘技術(shù),針對(duì)南京市胸科醫(yī)院信息系統(tǒng)中所積累的醫(yī)療病歷數(shù)據(jù)及病人醫(yī)療費(fèi)用數(shù)據(jù),構(gòu)建了相應(yīng)的病人醫(yī)療費(fèi)用數(shù)據(jù)庫(kù)。采用決策樹(shù)、神經(jīng)網(wǎng)絡(luò)等數(shù)據(jù)挖掘方法,對(duì)肺結(jié)核單病種醫(yī)療費(fèi)用數(shù)據(jù)進(jìn)行分析、處理,建立了用3層10分類的決策樹(shù)表示的費(fèi)用模型,比較客觀地反映了歷史數(shù)據(jù)中所蘊(yùn)涵的相關(guān)知識(shí)或規(guī)律。

    Author’s address:Department of Information, NanJing Chest Hospital, No.215, Guangzhou Road, Nanjing, 210029, Jiangsu Province, PRC

    1 研究的意義和目的

    肺結(jié)核(pulmonary tuberculosis,PTB)是我國(guó)發(fā)病率最高、嚴(yán)重危害人民群眾健康的呼吸道傳染性疾病。全國(guó)第5次結(jié)核病流行病學(xué)調(diào)查結(jié)果顯示,全國(guó)大約有5.5億人感染結(jié)核菌,每年有130萬(wàn)人發(fā)病,占全球發(fā)病的14.3%,位居全球第2,其中傳染性肺結(jié)核患者約為65萬(wàn)例,每年有13萬(wàn)人死亡。我國(guó)每年新發(fā)耐多藥結(jié)核病患者人數(shù)約為12萬(wàn),耐多藥結(jié)核病患者人數(shù)位居世界第2;耐多藥結(jié)核患者的傳染性更強(qiáng),治療費(fèi)用大幅增加。近年來(lái),結(jié)核病與肝炎病毒、艾滋病病毒等雙重感染的病例逐漸增多,肺結(jié)核病每年消耗的醫(yī)療資源巨大。

    本文借鑒國(guó)外推行DRGs預(yù)付費(fèi)模式的實(shí)踐經(jīng)驗(yàn),結(jié)合南京胸科醫(yī)院的??铺厣?,旨在按照國(guó)內(nèi)外肺結(jié)核病標(biāo)準(zhǔn)化治療流程和我國(guó)該病種臨床路徑的管理要求進(jìn)行規(guī)范化治療的條件下,依靠醫(yī)院完整的計(jì)算機(jī)信息系統(tǒng),運(yùn)用適合醫(yī)療數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù),通過(guò)對(duì)大量病例的分析,建立單病種醫(yī)療費(fèi)用模型,得出單病種醫(yī)療費(fèi)用控制標(biāo)準(zhǔn)參考值,分析影響住院費(fèi)用的各種因素及其影響程度。以往的研究,多關(guān)注住院日期的長(zhǎng)短、入院病情的輕重、是否手術(shù),很少關(guān)注并發(fā)癥和伴發(fā)癥對(duì)費(fèi)用的影響。本研究的貢獻(xiàn)在于建立了單病種醫(yī)療費(fèi)用模型,得出各類別所占費(fèi)用比例和中位數(shù)費(fèi)用標(biāo)準(zhǔn),為肺結(jié)核住院病人的費(fèi)用支付提供參考標(biāo)準(zhǔn),對(duì)降低病人的醫(yī)療費(fèi)用、降低醫(yī)院的運(yùn)營(yíng)成本起到良好的推動(dòng)作用。

    2 數(shù)據(jù)預(yù)處理

    由于我們從系統(tǒng)中收集到的原始數(shù)據(jù)存在數(shù)據(jù)缺失、記錄不一致等現(xiàn)象,對(duì)數(shù)據(jù)挖掘的信息規(guī)則提取產(chǎn)生干擾。為了提高數(shù)據(jù)的質(zhì)量,便于得到更好的、更有效的數(shù)據(jù)挖掘結(jié)果,有必要對(duì)其進(jìn)行預(yù)處理。

    2.1 原始數(shù)據(jù)的概況及特點(diǎn)

    本文采樣抽取南京市胸科醫(yī)院2011年—2012年間結(jié)核病區(qū)出院病人共9920例,其中結(jié)核9610例。詳細(xì)數(shù)據(jù)如表1所示。剔除住院天數(shù)超過(guò)200天的46例,住院天數(shù)低于1天的216例,剩余樣本為9348例。入院途徑全為門診。有效樣本中原發(fā)型肺結(jié)核(I型)364例,占總病例數(shù)的3.9%;血行播散型肺結(jié)核(Ⅱ型)1818例,占總病例數(shù)的19.4%;繼發(fā)型肺結(jié)核(Ⅲ型)4856例,占總病例數(shù)的51.9%;結(jié)核性胸膜炎(Ⅳ型)2083例,占總病例數(shù)的22.3%;其他肺外結(jié)核(Ⅴ型)227例,占總病例數(shù)的2.4%。有效樣本中耐多藥結(jié)核853例,占總病例數(shù)的9.1%。

    樣本患者都是按照世界衛(wèi)生組織(WHO)結(jié)核治療指南和衛(wèi)生部關(guān)于肺結(jié)核病的臨床路徑相關(guān)要求以及我院的??铺厣?,進(jìn)行規(guī)范化的診療。減少了不必要的檢查和用藥,一定程度上降低了病人的醫(yī)療費(fèi)用。

    通過(guò)分析,選取30項(xiàng)指標(biāo),根據(jù)首頁(yè)序號(hào)將數(shù)據(jù)對(duì)應(yīng)、整合,形成臨時(shí)表。表中以定性數(shù)據(jù)為主,數(shù)據(jù)分布多樣化,費(fèi)用等指標(biāo)絕大部分不服從正態(tài)分布。根據(jù)肺結(jié)核病病例的特點(diǎn),最終本文選取肺結(jié)核病患者的住院醫(yī)療費(fèi)用做目標(biāo)變量,另有14項(xiàng)分類費(fèi)用指標(biāo),15項(xiàng)基本指標(biāo)。二分類變量6個(gè),多分類變量4個(gè),數(shù)值型變量5個(gè)。以性別、年齡、入院病情、第一診斷、并發(fā)癥、治療結(jié)果、住院天數(shù)、確診天數(shù)、護(hù)理等級(jí)、一級(jí)護(hù)理天數(shù)、有無(wú)手術(shù)、是否搶救、是否耐多藥結(jié)核為分類節(jié)點(diǎn)(預(yù)測(cè)變量)。

    2.2 本文涉及的數(shù)據(jù)預(yù)處理

    2.2.1 缺失數(shù)據(jù)的處理。在處理缺失數(shù)據(jù)時(shí),需要根據(jù)變量類型采取不同的填充方法,否則會(huì)對(duì)數(shù)據(jù)挖掘產(chǎn)生影響。例如,區(qū)間型變量應(yīng)以其均數(shù)作為填充值,如使用回歸、貝葉斯形式化方法或判定樹(shù)歸納確定最有可能的值,使用該值填充缺失值,可能導(dǎo)致數(shù)據(jù)發(fā)生偏離,從而引出錯(cuò)誤的結(jié)論。重要的數(shù)據(jù)缺失且無(wú)法補(bǔ)齊的,直接刪除該存在遺漏信息屬性值的元組。

    2.2.2 異常值的檢出與處理。對(duì)原始數(shù)據(jù)進(jìn)行分析和處理,檢校不反映變量變化規(guī)律的異常值和缺失值。通過(guò)對(duì)計(jì)量資料編制頻數(shù)表可以發(fā)現(xiàn)某些特大或特小的異常值,異常值的存在會(huì)影響所建立模型的穩(wěn)定性,因此需要進(jìn)一步檢查和核對(duì)。根據(jù)肺結(jié)核病的特性,剔除那些醫(yī)療質(zhì)量、技術(shù)項(xiàng)目及費(fèi)用明顯不合理的病例,如住院天數(shù)少于2天、高于100天的病例和住院費(fèi)用低于2000元、高于10萬(wàn)元的病例。

    2.2.3 對(duì)偏態(tài)變量進(jìn)行正態(tài)轉(zhuǎn)換。住院天數(shù)和住院總費(fèi)用分布偏態(tài)(Sig.=0),需用正態(tài)性轉(zhuǎn)換方法來(lái)糾正??梢允褂肂ox-Cox、平方根變換(SQRT)、指數(shù)變換(E X P)等變量轉(zhuǎn)換方法將原來(lái)分布偏態(tài)的資料變換成正態(tài)或近似正態(tài)分布的資料,改進(jìn)模型的擬合效果。對(duì)住院天數(shù)和住院總費(fèi)用進(jìn)行對(duì)數(shù)轉(zhuǎn)換處理,其轉(zhuǎn)換后數(shù)據(jù)服從正態(tài)分布。數(shù)據(jù)分析表明,出院患者住院醫(yī)療費(fèi)用的平均值為14585.66元,住院天數(shù)平均值為17.7天;對(duì)應(yīng)中位數(shù)分別是12877.42元、15天,表明有50%的患者住院醫(yī)療費(fèi)用小于12877.42元,住院天數(shù)小于15天。

    2.2.4 特征值離散化。將連續(xù)型特征的值離散化,使之成為少量的區(qū)間,每個(gè)區(qū)間映射到一個(gè)離散符號(hào)。特征離散化后簡(jiǎn)化了數(shù)據(jù)描述,并易于理解數(shù)據(jù)和最終數(shù)據(jù)挖掘的結(jié)果。多數(shù)情況下,可以采用平均分配的原則,將原特征值映射到指定的等區(qū)間段內(nèi)。但是,具體的分割點(diǎn)需根據(jù)實(shí)際情況而定。

    表1 2011年-2012年南京市胸科醫(yī)院結(jié)核病出院病例情況

    3 單病種醫(yī)療費(fèi)用模型的建立

    經(jīng)過(guò)篩選,選出是否耐多藥結(jié)核(G_X 10)、并發(fā)癥(G_X 12)、第一診斷(G_X 11 )、入院情況(G_ X6)、住院天數(shù)(G_X1)、護(hù)理等級(jí)(G_X3)、治療結(jié)果(G_X7)、確診天數(shù)(G_X5)、是否搶救(G_X8)、有無(wú)手術(shù)(G_X 9)、一級(jí)護(hù)理天數(shù)(G_X4)、住院次數(shù)(G_X2)等12個(gè)重要影響因素作為建模變量。

    3.1 肺結(jié)核住院病例的建模分析

    3.1.1 變量篩選結(jié)果??偟腞值為0.58左右,前8位的影響因素依次是是否耐多藥結(jié)核、并發(fā)癥、第一診斷、入院情況、住院天數(shù)、護(hù)理等級(jí)、治療結(jié)果、確診天數(shù)。

    3.1.2 聚類產(chǎn)生新變量。例如,確診天數(shù)(G_X5)為新分類變量,取值1代表易確診、取值2代表不易確診。從中位數(shù)費(fèi)用分析可看出費(fèi)用差別比較顯著,新變量將入選為決策樹(shù)建模的關(guān)鍵變量。

    3.1.3 新的住院天數(shù)有序分類變量。對(duì)原住院天數(shù)變量進(jìn)行了聚類,按0~10天,11~21天,22~28天,29~35天,36~42天,43~56天,56天以上,重新得到新的有序分類變量G_ X1。

    3.1.4 建立決策樹(shù)模型。按訓(xùn)練樣本70%,檢驗(yàn)樣本30%,建立決策樹(shù)模型。利用決策樹(shù)技術(shù)對(duì)整個(gè)樣本空間進(jìn)行分層,得到訓(xùn)練樣本決策樹(shù)和檢驗(yàn)樣本決策樹(shù)。

    3.2 神經(jīng)網(wǎng)絡(luò)技術(shù)建立預(yù)測(cè)模型

    利用決策樹(shù)技術(shù)分類建模結(jié)果比較直觀,但預(yù)測(cè)建模效果與神經(jīng)網(wǎng)絡(luò)技術(shù)相比較顯得比較粗略。研究結(jié)果表明,神經(jīng)網(wǎng)絡(luò)技術(shù)預(yù)測(cè)建模方法優(yōu)于傳統(tǒng)的多元線性回歸技術(shù)和Logistic回歸技術(shù),所建立的模型性能要比采用決策樹(shù)技術(shù)所建立的模型更加好,但該技術(shù)的預(yù)測(cè)模型描述比較復(fù)雜,不便于實(shí)施。為了對(duì)比分析,可使用多層感知器神經(jīng)網(wǎng)絡(luò)建模做初步探討。

    4 結(jié)果分析

    本文利用數(shù)據(jù)挖掘技術(shù)分析和處理南京市胸科醫(yī)院近2年來(lái)收治的9千多名肺結(jié)核病例住院費(fèi)用數(shù)據(jù),建立該病種住院費(fèi)用的決策樹(shù)分類模型,得出各類別所占費(fèi)用比例和中位數(shù)費(fèi)用標(biāo)準(zhǔn)。該模型充分考慮了肺結(jié)核病住院患者中并發(fā)癥、伴發(fā)癥病例出現(xiàn)較多以及耐藥性肺結(jié)核增多的情況,因此所得出的費(fèi)用數(shù)據(jù)有科學(xué)性和合理性。費(fèi)用中位數(shù),可以作為肺結(jié)核住院病人的費(fèi)用支付參考標(biāo)準(zhǔn),其75%分位數(shù)和25%分位數(shù)可以作為不同情況下費(fèi)用控制的上限與下限。

    [1] 北京協(xié)合醫(yī)院世界衛(wèi)生組織疾病合作中心.疾病和有關(guān)健康問(wèn)題的國(guó)際統(tǒng)計(jì)分類[M].北京:人民衛(wèi)生出版社,1996:89-98.

    [2] 安淑芝.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘[M].北京:清華大學(xué)出版社,2005.

    [3] Mehmed Kantardzic.數(shù)據(jù)挖掘:概念、模型、方法和算法[M].北京:清華大學(xué)出版社,2003.

    [4] Wei-Chang Yeh.Novel swarm optimization for mining classification rules on thyroid gland data[J]. Information Sciences,197(12):65-76.

    [5] A'lvaro Rebuge ,DiogoR Ferreira.Business process analysis in healthcare environments: A methodology based on process mining[J]. Information Systems,37(2):99-116.

    [6] V ivian F Ló pez,Ramiro Aguilar,Luis Alonso,et al.Data mining for grammatical inference with bioinformatics criteria[J]. Expert Systems with Applications,39(3):2330-2334.

    Research on data mining technology in establishing pulmonary tuberculosis single disease cost model

    WANG Jun, MA Li, ZHAO Xu, GUAN Lihua, CHEN Ke, LI Yan// Chinese Hospitals. -2014,18(4):33-34

    pulmonary tuberculosis,data mining technology,single disease, cost model, information management system

    Pulmonary tuberculosis has features of high incidence, serious harm, consumption of medical resources. Due to the differences in severity and complications, the difference of its cost of hospitalization is also large. In this paper, using the data mining technology, the medical record data and patient medical expense data accumulated in the information system construction of NanJing Chest Hospital, the patient medical expenses to the corresponding data warehouse were established. Using decision tree, neural network, data mining methods, analysis, treatment for PTB medical expense of single disease data were analyzed and cost model represented by decision tree classification of 3 layers 10 was established. The related knowledge or rules contained in historical data were objectively reflected.

    2013-12-12](責(zé)任編輯 鮑文琦)

    ①南京市胸科醫(yī)院信息科,210029 江蘇省南京市廣州路215號(hào)

    王 ?。耗暇┦行乜漆t(yī)院信息科工程師

    E-mail:wangjun_000001@sina.com

    猜你喜歡
    肺結(jié)核病決策樹(shù)天數(shù)
    本周連漲天數(shù)居前個(gè)股
    本周連跌天數(shù)居前個(gè)股
    健康教育對(duì)于肺結(jié)核病防控管理的效果研究
    一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
    決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
    電子制作(2018年16期)2018-09-26 03:27:06
    生日謎題
    基于決策樹(shù)的出租車乘客出行目的識(shí)別
    莫西沙星和左氧氟沙星在耐多藥肺結(jié)核病治療方案中的效果比較
    110例耐藥肺結(jié)核病臨床特征分析
    基于肺癌CT的決策樹(shù)模型在肺癌診斷中的應(yīng)用
    乌鲁木齐县| 阿克陶县| 习水县| 双江| 麻栗坡县| 赣州市| 诸暨市| 福州市| 莱州市| 普格县| 盘山县| 沂源县| 勐海县| 合肥市| 古浪县| 临夏市| 永寿县| 霸州市| 宝山区| 泰和县| 达州市| 奎屯市| 梁平县| 巧家县| 镇巴县| 乌恰县| 涪陵区| 龙山县| 高台县| 平邑县| 招远市| 赤水市| 灵武市| 景德镇市| 鲜城| 阳山县| 五原县| 武强县| 杂多县| 丽水市| 井陉县|