尹 柯,巴文娟,湯 敏,劉金沙,汪 瓊,孫婷婷,謝 梅,沈 晶,林 琳,伍建林
(大連大學(xué)附屬中山醫(yī)院放射科,遼寧 大連 116000)
2011年,國際肺癌研究協(xié)會(huì)(International Association for the Study of Lung Cancer, IASLC)、美國胸科學(xué)會(huì)(American Thoracic Society, ATS)和歐洲呼吸學(xué)會(huì)(European Respiratory Society, ERS)將肺腺癌分為不典型腺瘤樣增生(atypical adenomatous hyperplasia, AAH)、原位腺癌(adenocarcinoma in situ, AIS)、微浸潤性腺癌(minimally invasive adenocarcinoma, MIA)和浸潤性腺癌(invasive adenocarcinoma, IA)[1],其中AIS、MIA和以貼壁生長為主的IA胸部CT多表現(xiàn)為純磨玻璃結(jié)節(jié)(pure ground glass nodule, pGGN)[2]。既往研究[3-7]表明,AIS、MIA與IA患者預(yù)后存在差異[8-12],因此,準(zhǔn)確評(píng)估pGGN肺腺癌病理亞型對(duì)臨床早期正確干預(yù)十分重要。人工神經(jīng)網(wǎng)絡(luò)起源于對(duì)人類大腦思維模式的研究,屬于數(shù)據(jù)建模工具[13-14],其中的多層感知器(multilayer perceptron, MLP)可對(duì)輸入數(shù)據(jù)進(jìn)行非線性分類。本研究利用MLP對(duì)pGGN分類,探討MLP預(yù)測pGGN肺腺癌浸潤程度的價(jià)值。
1.1 一般資料 收集2015年1月―2018年10月于大連大學(xué)附屬中山醫(yī)院、大連醫(yī)科大學(xué)附屬第二醫(yī)院和大連市中心醫(yī)院經(jīng)手術(shù)病理證實(shí)為肺腺癌的393例pGGN患者作為訓(xùn)練集,男121例,女272例,年齡24~78歲,平均(55.8±11.1)歲;共442枚pGGN,根據(jù)病理學(xué)診斷分為浸潤前病變(pre-invasive lesions, PIL)組(共254枚pGGN,其中AAH 31枚,AIS 62枚,MIA 161枚)和IA組(188枚pGGN)。以2019年6月—8月于大連大學(xué)附屬中山醫(yī)院及大連醫(yī)科大學(xué)附屬第二醫(yī)院經(jīng)手術(shù)病理證實(shí)為肺腺癌的89例pGGN患者為測試集,男27例,女62例,年齡18~77歲,平均(54.8±11.9)歲;共100枚pGGN,其中PIL組59枚, 包括AAH 10枚、AIS 18枚、MIA 31枚,IA組41枚。納入標(biāo)準(zhǔn):pGGN患者,術(shù)前1個(gè)月內(nèi)接受胸部CT檢查,圖像層厚1 mm,pGGN最大徑≤30 mm。排除標(biāo)準(zhǔn):①術(shù)前接受化學(xué)治療或放射治療;②圖像存在嚴(yán)重偽影。
1.2 儀器與方法 采用Siemens SOMATOM Definition雙源CT及SOMATOM Definition AS 64層CT掃描儀,于吸氣末行胸部掃描,掃描范圍自胸廓入口至肺底。掃描參數(shù):管電壓100~140 kV,管電流200~280 mAs,層厚和層間距均為5 mm,肺窗窗寬1 200 HU,窗位-600 HU;縱隔窗窗寬350 HU,窗位-50 HU,以高分辨骨算法進(jìn)行后處理,重建層厚為1 mm。
1.3 評(píng)估圖像 由2名分別具有6年及8年工作經(jīng)驗(yàn)的醫(yī)師采用圖像存儲(chǔ)與傳輸系統(tǒng)(picture archiving and communications system, PACS)系統(tǒng)評(píng)估pGGN的CT征象,意見分歧時(shí)由1名具有30年胸部影像學(xué)診斷經(jīng)驗(yàn)的主任醫(yī)師評(píng)判。評(píng)估項(xiàng)目包括pGGN形狀(圓形、類圓形或非圓形、非類圓形),邊緣(是否清晰)以及是否存在胸膜凹陷征、空泡征、空氣支氣管征及主要血管穿行,后者定義為肺門發(fā)出供應(yīng)各肺段血管至其直達(dá)胸膜下區(qū)分叉前或各肺段血管分支在其二級(jí)分叉之前進(jìn)入病灶[15],以多平面重建及最大強(qiáng)度投影圖像對(duì)其進(jìn)行分析。測量CT定量參數(shù),包括病灶最大徑及平均CT值。
1.4 統(tǒng)計(jì)學(xué)分析 采用SPSS 20.0統(tǒng)計(jì)分析軟件。連續(xù)變量用±s表示。以獨(dú)立樣本t檢驗(yàn)比較組間pGGN直徑與CT值。以受試者工作特征(receiver operating characteristic, ROC)曲線評(píng)價(jià)pGGN直徑和CT值鑒別診斷pGGN的效能,并獲得最佳截?cái)嘀?。采用?檢驗(yàn)比較組間分類變量,以差異存在統(tǒng)計(jì)學(xué)意義的指標(biāo)分別建立二元Logistic回歸模型及MLP模型。通過測試集以曲線下面積(area under the curve, AUC)、準(zhǔn)確率、敏感度及特異度評(píng)估模型的預(yù)測效能。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 CT征象 訓(xùn)練集IA組pGGN直徑(15.34±5.69)mm,CT值(-577.10±98.8)HU,均高于PIL組[(8.76±3.02)mm,(-607.00±112.40)HU,P均<0.05]。以直徑10 mm、CT值-675 HU為最佳截?cái)嘀?,pGGN直徑>10 mm(χ2=127.296)及CT值>-675 HU(χ2=12.408)的pGGN多為IA(P均<0.001)。PIL組與IA組pGGN形狀、邊緣、胸膜凹陷征、空泡征、主要血管穿行及空氣支氣管征差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。見表1。
表1 訓(xùn)練集PIL組及IA組CT征象(枚)
2.2 建立模型及評(píng)估預(yù)測效能 回歸分析顯示pGGN直徑、CT值、主要血管穿行、胸膜凹陷征及空氣支氣管征是IA的獨(dú)立危險(xiǎn)因素(表2);以之構(gòu)建的二元Logistic回歸模型在驗(yàn)證集的AUC(圖1)、預(yù)測準(zhǔn)確率、敏感度、特異度分別為0.799、0.820、0.683和0.915。
表2 訓(xùn)練集pGGN二元Logistic回歸變量分析結(jié)果
圖1 MLP模型與二元Logistic回歸模型檢出驗(yàn)證集IA的ROC曲線 AUC分別為0.869和0.799
2.3 建立MLP模型并評(píng)估預(yù)測效能 以單變量分析顯示差異具有統(tǒng)計(jì)學(xué)意義者作為因子建立的MLP模型見圖2。以AUC(0.869)、預(yù)測準(zhǔn)確率(0.880)、敏感度(0.805)及特異度(0.932)評(píng)估MLP模型對(duì)于驗(yàn)證集的預(yù)測效能,其絕對(duì)凈重新分類改善指數(shù)(net reclassification improvement, NRI)為6%,與二元Logistic回歸模型差異具有統(tǒng)計(jì)學(xué)意義(Z=3.473、P=0.001),見表3;模型驗(yàn)證案例見圖3、4。
圖2 MLP模型示意圖 模型包括1個(gè)輸入層、1個(gè)隱藏層和1個(gè)輸出層,輸入層神經(jīng)元數(shù)16個(gè),隱藏層6個(gè),輸出層2個(gè)
圖3 患者女,42歲,右肺上葉pGGN,術(shù)后病理證實(shí)為MIA CT見右肺上葉直徑10.3 mm類圓形pGGN,CT值-694 HU,邊緣清晰,未見胸膜凹陷征、主要血管穿行及空氣支氣管征,MLP模型及二元Logistic回歸模型均判斷為PIL 圖4 患者女,26歲,右肺上葉pGGN,術(shù)后病理證實(shí)為IA CT見右肺上葉直徑9.6 mm類圓形pGGN,CT值-587 HU,邊緣清晰,未見胸膜凹陷征及主要血管穿行,可見空氣支氣管征, 二元Logistic回歸模型判斷為PIL,MLP模型判斷為IA
表3 MLP模型與二元Logistic回歸模型預(yù)測驗(yàn)證集的效能比較
隨著人工智能輔助CT篩查肺癌在全球范圍內(nèi)逐漸展開,大量pGGN被檢出。既往研究[16-17]證實(shí),根據(jù)pGGN直徑及CT特征如胸膜凹陷征和空氣支氣管征等,可分析和鑒別其惡性浸潤程度。本研究發(fā)現(xiàn),通過評(píng)估pGGN的CT特征并建立MLP模型可預(yù)測PIL和IAC,并具有較高的AUC、預(yù)測準(zhǔn)確率、敏感度和特異度。MLP模型具有輸入層、輸出層以及輸入和輸出之間的“隱藏”層;一個(gè)或多個(gè)隱藏層構(gòu)成神經(jīng)元,神經(jīng)元之間的連接賦予相關(guān)權(quán)重,在迭代過程中不斷調(diào)整權(quán)重以訓(xùn)練學(xué)習(xí)算法,使得預(yù)測誤差最小化。
本研究將AAH、AIS和MIA歸入PIL組[18-20],此類患者亞肺葉切除術(shù)后5年生存率接近100%;對(duì)IA而言,肺葉切除術(shù)與淋巴結(jié)清掃術(shù)或采樣是標(biāo)準(zhǔn)外科手術(shù)方式,術(shù)后患者5年生存率60%~88%[8-12],但術(shù)中冰凍切片往往難以準(zhǔn)確反映腺癌的侵襲性。術(shù)前預(yù)測pGGN的浸潤性有助于制定手術(shù)規(guī)劃方式。為此有必要建立無創(chuàng)性術(shù)前預(yù)測模型,輔助放射科醫(yī)師及胸外科醫(yī)師更好地區(qū)分PIL及IA。
既往研究[16]表明,利用二元Logistic回歸分析建立診斷模型對(duì)于鑒別良惡性磨玻璃結(jié)節(jié)[(ground glass nodule, GGN),包括pGGN和混合磨玻璃結(jié)節(jié)(mix ground glass nodule, mGGN)]具有較高診斷價(jià)值,但其前期研究模型建立組數(shù)據(jù)較少,為單中心樣本,且未涉及GGN浸潤程度及由此帶來的手術(shù)方式及預(yù)后差異。本研究采用多中心較大樣本量建立二元Logistic回歸預(yù)測模型,同時(shí)以同一數(shù)據(jù)樣本建立MLP模型,后者只需輸入pGGN的放射學(xué)特征(是否具有某種CT征象)即可自動(dòng)預(yù)測其分類,較前者具有更高的AUC、敏感度、特異度和預(yù)測準(zhǔn)確率,與二元Logistic回歸模型相比NRI為6%。有學(xué)者[18]嘗試?yán)秒S機(jī)森林統(tǒng)計(jì)工具預(yù)測GGN中的PIL及IA,本研究所獲AUC與之近似,但本研究對(duì)象是性質(zhì)更難以判斷的pGGN,而mGGN往往多提示為病理學(xué)上的IA[21]。
本研究的不足是使用放射學(xué)特征,而非直接從CT圖像中提取信息,未來將直接以成像數(shù)據(jù)集來開發(fā)用于相同目的的深度學(xué)習(xí)算法;另外,本研究未納入患者臨床信息資料,可能導(dǎo)致?lián)p失部分診斷效能。
總之,本研究發(fā)現(xiàn)MLP模型較二元Logistic回歸模型預(yù)測pGGN為PIL或IA的效能更佳,有望作為一種無創(chuàng)性預(yù)測工具,替代或部分替代活檢,亦可在pGGN病變早期和隨訪期間輔助臨床進(jìn)行有效管理,并有助于胸外科醫(yī)師術(shù)前制定合理手術(shù)方案,具有較好的臨床應(yīng)用前景。
中國醫(yī)學(xué)影像技術(shù)2020年11期