王曉輝,潘雁,朱珺
(上海交通大學(xué)附屬胸科醫(yī)院藥劑科,上海 200030)
應(yīng)用人工神經(jīng)網(wǎng)絡(luò)建立老年肺癌患者化療期間發(fā)生感染的預(yù)測(cè)模型
王曉輝,潘雁,朱珺
(上海交通大學(xué)附屬胸科醫(yī)院藥劑科,上海 200030)
目的建立老年(>65歲)肺癌患者住院化療期間發(fā)生感染的預(yù)測(cè)模型,評(píng)價(jià)模型的預(yù)測(cè)性能,探討個(gè)體發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)的方法。方法收集本院收治的老年肺癌化療患者327例,按4∶1分為訓(xùn)練組(n=260)與檢驗(yàn)組(n=67),分別用于篩選變量、建立預(yù)測(cè)模型及對(duì)模型的檢測(cè)和評(píng)價(jià)。應(yīng)用logistic回歸Logistic Regression(LR)模型對(duì)資料進(jìn)行多因素篩選,將篩選出有統(tǒng)計(jì)學(xué)意義的指標(biāo)建立LR模型和人工智能神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)模型,利用受試者工作特征曲線(receiver operator characteristic,ROC)評(píng)價(jià)模型的預(yù)測(cè)性能。結(jié)果醫(yī)院感染的發(fā)生率為21.10%(69/327),進(jìn)一步分析發(fā)現(xiàn)骨髓抑制(≥Ⅱ度,P=0.001)、長時(shí)間住院(≥14 d,P=0.001)、糖尿病(P=0.005)、聯(lián)合化療(含順鉑,P=0.009),肺癌手術(shù)史(P=0.033)以及應(yīng)用激素(P=0.025)是老年肺癌患者化療期間發(fā)生感染的危險(xiǎn)因素。利用兩種模型對(duì)67名檢驗(yàn)集預(yù)測(cè),預(yù)測(cè)正確率分別為87.15%和79.81%;通過ROC曲線下面積比較模型的預(yù)測(cè)能力:LR模型曲線下面積(0.757±0.036)小于ANN模型(0.905±0.017)。結(jié)論在老年肺癌患者住院化療期間發(fā)生感染的預(yù)測(cè)方面ANN模型預(yù)測(cè)性能優(yōu)于LR模型。
人工智能神經(jīng)網(wǎng)絡(luò);感染;老年患者;肺癌化療
目前,在全球惡性腫瘤引起的死亡原因排序中,肺癌仍位列首位[1-2]。在對(duì)癌癥患者進(jìn)行的并發(fā)癥以及死亡原因的研究中顯示,與感染有關(guān)的致死病因高達(dá)76%[3-5]。老年肺癌患者住院化療期間發(fā)生感染病因復(fù)雜,影響患病的危險(xiǎn)因素是多方面的,一些危險(xiǎn)因素之間可能存在交互作用、多重共線性,嚴(yán)重干擾了感染的預(yù)測(cè)。本研究對(duì)327例住院化療的老年肺癌患者進(jìn)行分析,利用影響化療期間感染發(fā)生的危險(xiǎn)因素建立特定的預(yù)測(cè)模型,對(duì)肺癌患者可能發(fā)生的感染作出評(píng)估和預(yù)測(cè),從而提示個(gè)體狀況及是否采取預(yù)防干預(yù)措施,以期提高患者的化療療效和生活質(zhì)量。
采用分層抽樣的方法隨機(jī)抽上海市胸科醫(yī)院2014年6月至2016年6月因組織和細(xì)胞學(xué)診斷為肺癌的住院化療患者病歷資料,要求有統(tǒng)一詳盡的住院病史資料,收集信息包括:年齡、性別、吸煙指數(shù)(吸煙指數(shù)=每天吸煙支數(shù)×吸煙年數(shù))、TNM分期、病理分型、基礎(chǔ)疾病、化療周期、化療方案、侵入性操作、肺癌手術(shù)史、放療史、白細(xì)胞及白蛋白、化療后不良反應(yīng)、應(yīng)用激素,應(yīng)用抗生素及住院時(shí)間等內(nèi)容。
表1 327例老年肺癌患者的人口學(xué)特征分析
根據(jù)衛(wèi)生部 2001年頒布的《醫(yī)院感染診斷標(biāo)準(zhǔn)(試行)》,所有患者均經(jīng)病原學(xué)診斷下列情況記為醫(yī)院感染[6]。本組數(shù)據(jù)醫(yī)院感染的發(fā)生率為21.10%(69/327),送檢記錄標(biāo)本情況:痰(73.54%),其次是血液(12.93%)、尿(6.00%)和胸腔積液(3.72%),其他(3.81%)。
本研究考慮到神經(jīng)元個(gè)數(shù)過多對(duì)樣本量要求較高,故以肺癌化療期間是否出現(xiàn)感染作為應(yīng)變量,進(jìn)行單因素和多因素Logistic Regression(LR)分析,將篩選出的對(duì)構(gòu)建模型具有統(tǒng)計(jì)學(xué)意義的自變量,建立預(yù)測(cè)模型。將納入327例樣本按4∶1的比例隨機(jī)分為訓(xùn)練集(260例)和測(cè)試集(67例)。分別建立LR和Back Propagation(BP)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型。Z檢驗(yàn)比較 ROC 曲線下面積與0.5的差異,檢驗(yàn)?zāi)P褪欠裼蓄A(yù)測(cè)價(jià)值;應(yīng)用相關(guān)樣本Z檢驗(yàn)比較模型的 ROC 曲線下面積,評(píng)價(jià)模型的預(yù)測(cè)效果。LR模型的構(gòu)建及 ROC 曲線的繪制均用 SPSS 16.0 軟件完成;應(yīng)用Matlab 7.12軟件構(gòu)建ANN模型及進(jìn)行測(cè)試樣本的仿真和驗(yàn)證。
對(duì)調(diào)查的17項(xiàng)指標(biāo)應(yīng)用單因素和多因素條件LR回歸分析,最終得出住院時(shí)間、肺癌手術(shù)史、聯(lián)合化療、骨髓抑制、糖尿病及應(yīng)用激素這6項(xiàng)指標(biāo)有統(tǒng)計(jì)學(xué)意義,并建立LR模型。分析結(jié)果見表1。
表2 老年肺癌患者化療期間感染危險(xiǎn)因素多因素分析
多因素分析時(shí),設(shè)定進(jìn)入方程的標(biāo)準(zhǔn)為得分統(tǒng)計(jì)量的概率P<0.05,剔除標(biāo)準(zhǔn)為P>0.10,分類割點(diǎn)值為0.5,最大迭代次數(shù)為20,回歸系數(shù)β的指數(shù)的可信區(qū)間為95%。采用偏最大似然的前進(jìn)法篩選變量,建立LR模型,其表達(dá)式為:Logit(P)=-0.470+0.185(肺癌手術(shù)史)+0.582(聯(lián)合化療)+0.668(糖尿病)+0.273 (應(yīng)用激素)+1.321(住院時(shí)間/天)-1.478 (骨髓抑制)。
根據(jù)輸入影響因素對(duì)網(wǎng)絡(luò)的影響程度,做如下順位圖,見圖1。影響程度由高到低依次為:骨髓抑制、住院時(shí)間、糖尿病、聯(lián)合化療、肺癌手術(shù)史、應(yīng)用激素。
將以上LR回歸分析篩選出的6個(gè)自變量作為輸入元,是否發(fā)生感染作為輸出元,直接構(gòu)建3層前饋BP神經(jīng)網(wǎng)絡(luò),稱為Artificial Neural Network(ANN)模型。輸入層6個(gè)神經(jīng)節(jié)點(diǎn)包括:住院時(shí)間、肺癌手術(shù)史、聯(lián)合化療、骨髓抑制、糖尿病及應(yīng)用激素;隱含層神經(jīng)節(jié)點(diǎn)6個(gè)(可更改),采用雙曲正切傳遞函數(shù)。輸出變量:化療期間是否發(fā)生感染為二分類變量,采用Softmax傳遞函數(shù)。隱含層傳輸函數(shù)為Tansig,輸出層傳輸函數(shù)為Purelin,目標(biāo)誤差取0.01,學(xué)習(xí)速率0.1,網(wǎng)絡(luò)訓(xùn)練采用LM優(yōu)化算法。
ANN與LR回歸模型相比,其ROC曲線下面積為(0.905±0.017),大于后者得出的結(jié)果(0.757±0.036),提示ANN的預(yù)測(cè)判別能力高于傳統(tǒng)的LR模型,見圖2。
用67例測(cè)試樣本檢測(cè)以上建立的LR模型和ANN模型,結(jié)果顯示ANN模型的準(zhǔn)確率、靈敏度及約登指數(shù)均高于LR模型,但ANN模型特異度低于LR模型。見表2。
表3 ANN模型和logistic模型兩種方法預(yù)測(cè)結(jié)果評(píng)價(jià)指標(biāo)(%)
老年肺癌患者住院化療期間發(fā)生感染病因復(fù)雜,影響患病的危險(xiǎn)因素也是多方面的。醫(yī)院感染不僅影響治療和康復(fù)治療,延長住院時(shí)間,增加醫(yī)療費(fèi)用,而且明顯影響預(yù)后,甚至危及生命。老年患者由于年齡導(dǎo)致的器官生理機(jī)能減退,自身免疫力低下,同患多病的發(fā)生率高,易并發(fā)各類醫(yī)院感染。本組資料中,醫(yī)院感染的發(fā)生率為21.10%(69/327),與國內(nèi)文獻(xiàn)報(bào)道相似[7]。進(jìn)一步分析發(fā)現(xiàn)骨髓抑制(≥Ⅱ度,P=0.000)、住院時(shí)間(≥14 d,P=0.000)、糖尿病(P=0.005)、聯(lián)合化療(含順鉑,P=0.009),肺癌手術(shù)史(P=0.033)以及應(yīng)用激素(P=0.025)是老年肺癌患者化療期間發(fā)生感染的獨(dú)立危險(xiǎn)因素。
本研究試圖利用影響化療期間感染發(fā)生的危險(xiǎn)因素建立特定的數(shù)學(xué)模型,對(duì)老年肺癌患者可能發(fā)生的感染作出評(píng)估和預(yù)測(cè),評(píng)價(jià)并探討預(yù)測(cè)個(gè)體患病的新方法。LR簡單易用,對(duì)具有明確分類的疾病狀態(tài)進(jìn)行預(yù)測(cè)的最常用方法,但要求資料滿足一定的條件,如因變量為分類變量,自變量之間相互獨(dú)立,不存在明顯的共線性和交互作用等,難以實(shí)現(xiàn)對(duì)個(gè)體患者發(fā)生感染的有效預(yù)測(cè)。ANN對(duì)變量的分布、類型沒有任何要求,善于處理非線性的、模糊的、含有噪聲的數(shù)據(jù)情況,為解決復(fù)雜的醫(yī)學(xué)問題提供了新的途徑,在疾病預(yù)測(cè)方面越來越受到廣大醫(yī)學(xué)工作者的重視。相關(guān)研究認(rèn)為BP人工神經(jīng)網(wǎng)絡(luò)對(duì)于數(shù)據(jù)的擬合情況要遠(yuǎn)遠(yuǎn)優(yōu)于傳統(tǒng)的COX回歸和LR模型[8-9]。
研究中利用條件LR回歸分析篩選出的危險(xiǎn)因素建立LR和ANN預(yù)測(cè)模型,并用測(cè)試集樣本進(jìn)行檢測(cè)。研究結(jié)果顯示:ANN模型的準(zhǔn)確性、敏感性及約登指數(shù)均優(yōu)于LR模型。本研究借助于ROC曲線評(píng)價(jià)3種模型的預(yù)測(cè)效果,ROC曲線可以直觀的觀察敏感性和特異性之間的關(guān)系,曲線下面積越大其診斷試驗(yàn)的準(zhǔn)確度越大。本研究結(jié)果LR預(yù)測(cè)模型ROC曲線下面積為(0.757±0.036),BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果ROC曲線下面積為(0.905±0.017),提示ANN預(yù)測(cè)模型較LR預(yù)測(cè)模型有更好的預(yù)測(cè)判別效能,ANN對(duì)于數(shù)據(jù)的擬合情況藥優(yōu)于傳統(tǒng)的LR。
由于本研究是回顧性研究,對(duì)患者感染的界定主要依靠查醫(yī)生診斷、病程記錄、影像學(xué)檢查以及查閱病例中有送檢標(biāo)本記錄的化驗(yàn)單來完成,包括有痰、血液、尿標(biāo)本和胸腔積液等。
但仍存在部分病例應(yīng)用抗生素因無明確診斷并且沒有相關(guān)的實(shí)驗(yàn)室及影像學(xué)檢查證據(jù),故無法判斷該患者應(yīng)用抗生素屬于預(yù)防性還是治療性使用。這可能會(huì)造成信息的局限和偏倚,致所建立的預(yù)測(cè)模型存在一定的缺陷。
[1] 吳菲,林國楨,張晉昕.我國惡性腫瘤發(fā)病現(xiàn)狀及趨勢(shì)[J].中國腫瘤,2012,21(2):81-85.
[2] Henley SJ,Richards TB,Underwood JM,etal.Lung cancer incidence trends among men and women-united states,2005-2009[J].MMWR Morb Mortal Wkly Rep,2014,63(1):1-5.
[3] Limacher JM,Spring-Giusti C,Bellon N,etal.Therapeutic cancer vaccines in the treatment of non-small-cell lung cancer[J].Expert Rev Vaccines,2013,12(3):263-70.
[4] 葉正寶,陸義駿,金杏泉.癌癥病人的感染和治療[J].腫瘤,2000,20(4):307.
[5] Lanoix JP,Pluquet E,Lescure FX,etal.Bacterial infection profiles in lung cancer patients with febrile neutropenia[J].BMC Infect Dis,2011,11(1):1-7.
[6] 衛(wèi)醫(yī)發(fā)[2001] 2號(hào).衛(wèi)生部關(guān)于印發(fā)醫(yī)院感染診斷標(biāo)準(zhǔn)(試行)的通知[EB/OL].(2001-11-07).
[7] 鄭珊紅.老年肺癌患者醫(yī)院感染及其危險(xiǎn)因素分析[J].中國感染控制雜志,2012,11(5):355-356,359.
[8] Ayer T,Alagoz O,Chhatwal J,etal.Breast cancer risk estimation with artificial neural networks revisited:discrimination and calibration[J].Cancer,2010,116(14):3310-3321.
[9] Thakur A,Mishra V,Jain SK.Feed forward artificial neural network: tool for early detection of ovarian cancer[J].Sci Pharm,2011,79(3):493-505.
Applicationofartificialneuralnetworkinestablishingpredictivemodelswithinfectionduringchemotherapyforhospitalizedelderlypatientswithlungcancer
WANG Xiao-hui,PAN Yan,ZHU Jun
(DepartmentofPharmacy,ShanghaiChestHospital,ShanghaiJiaotongUniversity,Shanghai200030,China)
Objective:To establish predictive models with infection during chemotherapy for hospitalized elderly patients (>65 years old) with lung cancer and then evaluate the predictive capacity of the models,so as to explore methods to predicate the disease onset risks in individuals.MethodsA total of 327 elderly patients with lung cancer admitted in our hospital for chemotherapy were collected retrospectively,and divided into training group (n=260) and detection group (n=67) by ratio of 4∶1 to screen variables,establish predictive models,and detect and evaluate those models.Logistic Regression (LR) models were used to conduct multivariate screening to the data,and screened indexes with statistical significance were used to establish LR models and Artificial Neural Network (ANN) models.Receiver Operator Characteristic CUI-Ve (ROC) was used to evaluate the prediction performance of these models.ResultsThe occurrence rate of nosocomial infection was 21.10% (69/327),and further analysis indicated that myelosuppression (≥degree Ⅱ,P=0.001),long length of hospital stay (≥14 days,P=0.001),diabetes (P=0.005),combination with chemotherapy (containing cisplatin,P=0.009), history of surgery for lung cancer (P=0.033) and application of hormones (P=0.025) were risk factors for the occurrence of infection during chemotherapy for elderly patients with lung cancer.The two models were used to predict the 67 validation sets, with rates of accurate prediction being 87.15% and 79.81%,respectively.ROC area under the curve (AUC) was used to compare the prediction capacity of the models,and the results showed that the AUC of LR models was (0.757±0.036),smaller than the (0.905±0.017) of ANN models.ConclusionANN models have better prediction performance than LR models in predicting the occurrence of infection during chemotherapy for elderly patients with lung cancer.
Artificial Neural Network;Infection;Elderly patients;Chemotherapy for lung cancer
10.3969/j.issn.1005-3697.2017.06.018
上海市胸科醫(yī)院科技發(fā)展基金(YZ14-24)(JDYX2016QN013);上海交通大學(xué)醫(yī)學(xué)院醫(yī)院藥學(xué)科研基金
2017-07-12
王曉輝,女(1980-),碩士,主管藥師。E-mail:xhzd666@163.com
朱珺,E-mail:jone_zhu@163.com
時(shí)間: 2017-12-27 16∶44網(wǎng)絡(luò)出版地址http://kns.cnki.net/kcms/detail/51.1254.R.20171227.1643.036.html
1005-3697(2017)06-0871-03
R734.2
A
(學(xué)術(shù)編輯:付茂勇)
川北醫(yī)學(xué)院學(xué)報(bào)2017年6期