于長春,曾昭成,金鑫玲,宋明媚,孫志偉,卜翠萍,王 靜,姜舒亞,施 科
巨細胞病毒(CMV)感染是人類常見的病毒感染,且多在嬰幼兒時期發(fā)病,引起多系統(tǒng)播散性疾病或單一器官損害,其中肺是最易受到感染的器官之一[1-3]。但由于嬰幼兒CMV性肺炎表現(xiàn)與其他病原體導致的喘息性支氣管(肺)炎相比無特異性,加之醫(yī)務人員對其認識不足或重視程度不夠,往往被誤診為普通的喘息性支氣管(肺)炎,誤診率較高[4],從而導致抗生素和激素的濫用,對患兒的身體健康造成危害??焖?、準確地將巨細胞病毒性肺炎疑似患者從眾多的就診患者中篩查出來對該病的治療轉(zhuǎn)歸具有極其重要的意義。本研究運用Logistic回歸與ROC曲線對所收集的病例數(shù)據(jù)進行分析,建立診斷預測模型,為醫(yī)務人員有針對性的診斷CMV性肺炎提供有力的篩查手段。
1.1 一般資料 2011年9月—2012年4月某三級醫(yī)院兒科收治確診為CMV性肺炎和普通喘息性支氣管炎患兒共111例。其中CMV性肺炎(CMV性肺炎組)65例,男44例,女21例;年齡(0.76±0.41)歲;診斷標準依據(jù)中華醫(yī)學會兒科學分會感染學組最新公布的《兒童巨細胞病毒性疾病診斷和防治的建議》[5]。普通喘息性支氣管炎(普通喘息性支氣管炎組)46例,男 31例,女 15例;年齡(1.46±0.86)歲。
1.2 檢測方法 人CMV(HCMV)-IgG、HCMV-IgM測定采用膠體金標免疫層析試驗,使用中山大學達安基因股份有限公司TORCH-IgG、TORCH-IgM試劑盒,操作過程嚴格按照試劑盒說明書進行。
1.3 統(tǒng)計學方法 應用SPSS 13.0軟件進行統(tǒng)計學處理。對定量指標(年齡、HCMV-IgG、HCMVIgM)采用成組t檢驗進行比較,對定性指標(性別、血常規(guī))采用卡方(χ2)檢驗進行比較。將差異有統(tǒng)計學意義的指標運用多因素Logistic回歸分析,以找出巨細胞病毒性肺炎的危險因素與保護因素,利用ROC曲線對定量指標的診斷價值進行分析,確定截斷值,對樣本進行預測,并與實際診斷結(jié)果進行對比,以評估預測的準確度。兩曲線下面積的比較采用Z檢驗[6]。α=0.05為檢驗水準。
2.1 兩組一般資料、HCMV-IgG、HCMV-IgM、血常規(guī)比較 兩組年齡、HCMV-IgG、HCMV-IgM、血紅蛋白、白細胞計數(shù)、淋巴細胞計數(shù)、血小板計數(shù)差異有統(tǒng)計學意義(P<0.01),見表1。
表1 兩組一般資料、HCMV-IgG、HCMV-IgM、血常規(guī)比較結(jié)果
2.2 危險因素分析 經(jīng)多因素Logistic回歸分析,共有3個定量指標進入最終的模型,具體結(jié)果見表2。
2.3 ROC曲線分析 以普通喘息性支氣管炎組作為對照,對血紅蛋白、淋巴細胞計數(shù)、血小板計數(shù)3個指標繪制ROC曲線并確定截斷值,見表3、表4和圖1。
表2 兒童巨細胞病毒性肺炎臨床篩查多元Logistic回歸分析結(jié)果
表3 3個檢測指標的曲線下面積比較
表4 3個檢測指標的靈敏度、特異度和診斷符合率比較(%)
圖1 血紅蛋白、淋巴細胞計數(shù)、血小板計數(shù)的ROC曲線
對3個指標曲線下的面積采用Z檢驗進行兩兩比較,結(jié)果顯示差異均無統(tǒng)計學意義(P>0.05),利用3個指標組成的Logistic回歸模型P=1/[1+e-(7.031-0.103血紅蛋白 +0.298 淋巴細胞計數(shù)+0.011血小板計數(shù))]對樣本進行回代,若P≥0.5則判斷為CMV性肺炎,若P<0.5則判斷為普通喘息性支氣管炎,得到的綜合預測模型的靈敏度為83.08%,特異度為 76.09%,診斷符合率為80.18%。
HCMV感染呈世界性分布,在人群中廣為傳播,是引起先天性及圍生期病毒感染最常見的病原之一。HCMV的細胞和組織嗜性非常廣泛,任何器官都有可能受到HCMV感染,可累及多臟器、多系統(tǒng),且患者年齡越小,發(fā)病率越高,臨床后果越嚴重。在嬰幼兒中CMV感染以肺炎較為常見,但由于患病嬰幼兒的臨床表現(xiàn)不具特異性,往往被誤診為普通的喘息性支氣管炎、支原體肺炎、軍團菌肺炎、肺結(jié)核[7]等。將HCMV肺炎疑似患者從眾多的就診患者中篩查出來,再進行CMV特異性指標檢測加以確診,這樣不僅可以降低醫(yī)務人員的工作負荷,而且可以有效降低就診人群中CMV性肺炎的漏診和誤診率。機器學習是近年來逐漸興起的重要的數(shù)據(jù)挖掘工具,通過對大量數(shù)據(jù)的分析尋找出有價值的信息,為實踐活動提供決策支持,在眾多領(lǐng)域得到了廣泛應用。在醫(yī)學領(lǐng)域,利用收集的患者資料建立診斷預測系統(tǒng)是近年來興起的一種嶄新的研究手段,目前正得到越來越多的應用,如圖像識別、疾病輔助診斷、疾病風險預測、生存期預測等[8-13],收到了較好的效果。通過中國知網(wǎng)期刊數(shù)據(jù)庫檢索1994—2012年發(fā)表的中文文獻,未見有將機器學習用于兒童巨細胞病毒性肺炎篩查的相關(guān)報道,在PubMed上利用“機器學習(machine learnin)”、“巨細胞病毒(cytomegalovirus)”和“肺炎(pneumonia)”進行檢索,結(jié)果顯示有將機器學習用于分子生物學研究、肺結(jié)核的輔助診斷、指導老年人下呼吸道感染的抗生素治療、預測肺炎患者經(jīng)過治療后的狀態(tài)、預測患者腎移植術(shù)后發(fā)生CMV性疾病的風險等報道[14-20],但未見將機器學習用于CMV性肺炎篩查的有關(guān)研究。探討機器學習用于CMV性肺炎的篩查和輔助診斷,對于提高醫(yī)務人員的診斷水平、減少CMV性肺炎的漏診和誤診具有十分積極的實際意義。
本研究采用多元Logistic回歸進行因素篩選,得到血紅蛋白、淋巴細胞計數(shù)、血小板計數(shù)3個對巨細胞病毒性肺炎發(fā)生影響有統(tǒng)計學意義的指標。三者的曲線下面積均在0.75以上,說明用于篩查CMV性肺炎的診斷準確性較高,從繪制出的ROC曲線可以看出,代表淋巴細胞計數(shù)和血小板計數(shù)的兩條曲線位于對角線上方,而代表血紅蛋白的曲線位于對角線下方,說明前兩項指標和后一項指標對CMV性肺炎影響的作用方向是相反的,這與所建立的Logistic回歸模型中變量系數(shù)的正負號相一致,臨床觀察到CMV性肺炎患兒血紅蛋白降低、淋巴細胞計數(shù)和血小板計數(shù)升高的現(xiàn)象也印證了這一結(jié)果。從OR值的大小可以看出,淋巴細胞計數(shù)和血小板計數(shù)的OR值均>1,說明二者是CMV性肺炎的危險因素,血紅蛋白的OR值<1,提示該指標是CMV性肺炎的保護因素。通過ROC曲線確定了各指標的截斷值,分別為血紅蛋白118.5 g/L、淋巴細胞計數(shù)4.61×109/L、血小板計數(shù)257×109/L,根據(jù)這3 個檢測指標的數(shù)值大小可以獨立對患者發(fā)生CMV性肺炎的風險進行評估,但診斷性能分析結(jié)果顯示獨立指標預測均存在特異度偏低即誤診率偏高的問題,三者組成的Logistic回歸綜合預測模型則較好地克服了這一問題,預測結(jié)果較為理想。對預測患病風險高的人群再通過CMV特異性指標檢測進一步確診,這樣不僅降低了醫(yī)務人員的工作量,同時縮小了需要確診檢測的人群比例,在不增加患者經(jīng)濟負擔的情況下,提高了CMV性肺炎的人群檢出率。
利用統(tǒng)計學方法建立的預測模型是根據(jù)患者相關(guān)指標大小對診斷結(jié)果進行概率推斷,是近年來興起的一種重要的輔助診斷工具,減少了主觀經(jīng)驗判斷的偏差,符合現(xiàn)代循證醫(yī)學理念,且臨床操作簡便,有利于大規(guī)模推廣。其計算原理是建立在概率論的基礎(chǔ)上,因此其結(jié)論是概率性的,只能作為診斷疾病的佐證,并不能代替必要的確診性檢查,但是隨著臨床研究的不斷深入,病例數(shù)量的逐漸增加,所建立的預測模型不斷完善,預測結(jié)果的準確性將越來越高,對臨床工作的指導意義將更大。
[1]劉麗,魯繼榮.嬰幼兒巨細胞病毒性肺炎49例臨床分析[J].臨床兒科雜志,2007,25(7):544-546.
[2]Iizuka T,Sakai F,Suzuki N,et al.Neuronal hyperexcitability in stroke-like episodes of MELAS syndrome[J].Neurology,2002,59(6):816-824.
[3]de Lonlay Debeney P,von Kleist Retzow J C,Hertz-Pannier L,et al.Cerebral white matter disease in children may be caused by mitochondrial respiratory chain deficiency[J].J Pediatr,2000,136(2):209-214.
[4]嚴清華,藺增榕,林世江.嬰幼兒巨細胞病毒感染31例臨床分析[J].中華全科醫(yī)學,2008,6(12):1235-1236.
[5]中華醫(yī)學會兒科學分會感染學組,全國兒科臨床病毒感染協(xié)作組,《中華兒科雜志》編輯委員會.兒童巨細胞病毒性疾病診斷和治療的建議[J].中華兒科雜志,2012,50(4):290-292.
[6]Hanley J A,McNeil B J.A method of comparing the areas under receiver operating characteristic curves derived from the same cases[J].Radiology,1983,148(3):839-843.
[7]高韋娟,陳雅蘭,胡艷艷,等.嬰幼兒巨細胞病毒肺炎臨床分析[J].疑難病雜志,2009,8(9):561-562.
[8]謝華,夏順仁,張贊超.醫(yī)學圖像識別中多分類器融合方法的研究進展[J].國際生物醫(yī)學工程雜志,2006,29(3):152-157.
[9]Di Luca M,Grossi E,Borroni B,et al.Artificial neural networks allow the use of simultaneous measurements of Alzheimer Disease markers for early detection of the disease[J].J Transl Med,2005,3(30):1479-5876.
[10]Srinivasan V,Eswaran C,Sriraam N.Artificial neural network based epileptic detection using time-domain and frequency domain feature[J].J Med Syst,2005,29(6):647-660.
[11]徐繼承,李磊,劉桂紅,等.人工神經(jīng)網(wǎng)絡建立食管癌發(fā)病預測模型的比較研究[J].現(xiàn)代預防醫(yī)學,2011,38(17):3408-3410.
[12]Acir N,Oztura I,Kuntalp M,et al.Automatic detection of epileptiform events in EEG by a three-stage procedure based on artificial neural networks[J].IEEE Trans Biomed Eng,2005,52(1):30-40.
[13]劉剛,柳紅,劉藝萍,等.人工神經(jīng)網(wǎng)絡在大腸癌患者術(shù)后5年生存期預測中的應用[J].中國衛(wèi)生統(tǒng)計,2010,27(3):240-242.
[14]Huang J C,Jojic N.Modeling major histocompatibility complex binding by nonparametric averaging of multiple predictors and sequence encodings[J].J Immunol Methods,2011,374(1-2):35-42.
[15]Ladanyi A,Sher A C,Herlitz A,et al.Automatic detection of immunofluorescently labeled cytomegalovirus-infected cells in isolated peripheral blood leukocytes using decision tree analysis[J].Cytometry A,2004,58(2):147-156.
[16]Er O,Temurtas F,Tanrikulu A C.Tuberculosis Disease Diagnosis Using Artificial Neural Networks[J].J Med Syst,2010,34(3):299-302.
[17]Gueli N,Martinez A,Verrusio W,et al.Empirical antibiotic therapy(ABT)of lower respiratory tract infections(LRTI)in the elderly:application of artificial neural network(ANN).Preliminary results[J].Archives of Gerontology and Geriatrics,2012,55(2):499-503.
[18]Papageorgiou E I,F(xiàn)roelich W.Application of evolutionary fuzzy cognitive maps for prediction of pulmonary infections[J].IEEE Trans Inf Technol Biomed,2012,16(1):143-149.
[19]Sheppard D,McPhee D,Darke C,et al.Predicting cytomegalovirus disease after renal transplantation:an artificial neural network approach[J].Int J Med Inform,1999,54(1):55-76.
[20]曾文彤,葉青,羅光華,等.動態(tài)檢測血漿CMV DNA載量在預測腎移植術(shù)后并發(fā)巨細胞病毒肺炎中的意義[J].中華泌尿外科雜志,2005,26(8):525-528.