1.中國醫(yī)科大學 生物醫(yī)學工程系,遼寧 沈陽 110122;2.遼寧省腫瘤醫(yī)院(中國醫(yī)科大學腫瘤醫(yī)院) 醫(yī)學影像科,遼寧 沈陽 110042;3.濟寧醫(yī)學院 基礎醫(yī)學院 分子醫(yī)學與化學實驗室,山東 濟寧 272067
肺癌具有極高發(fā)病率和轉移率[1-2],全球每年肺癌新發(fā)病例數約173萬[3],其致死人數占全球癌癥死亡人數的19%[4]。淋巴結轉移是影響肺癌患者生存預后的一個重要因素[5],發(fā)生淋巴結轉移的患者中,僅有26%~53%的患者生存期能超過五年[6-7]。臨床上診斷肺癌淋巴結轉移的金標準是病理活檢,如胸腔鏡手術和支氣管超聲等侵入性方法,但可能引起嚴重的并發(fā)癥[8]。目前缺乏一種通過術前影像對肺癌淋巴結轉移進行預測的技術方法。
計算機斷層掃描因其具有較高的空間分辨率而在肺癌的常規(guī)診斷、分析、療效評估中發(fā)揮著重要的作用[9-10]。CT圖像中蘊含的結節(jié)的形狀、大小、方位等臨床信息對疾病的診斷預測具有重要意義[11]。
近年來,影像組學技術發(fā)展迅速,通過高通量提取醫(yī)學圖像中隱藏的深層次特征信息[12-13],能夠準確反應腫瘤的生物學特性,可實現無創(chuàng)地對患者腫瘤進行分型及鑒別[14]。諾莫圖模型通過結合患者的影像組學特征和臨床指標,可充分揭示特征與疾病病理之間潛在的聯系[15],具有良好的臨床適用性。本研究利用肺癌患者CT影像與患者的臨床指標建立諾莫圖模型分析其對淋巴結轉移進行預測的效果,以期為臨床決策提供參考。
回顧性分析2014—2017年于中國醫(yī)科大學附屬遼寧省腫瘤醫(yī)院確診的肺癌患者,共納入211例肺癌患者(男性120例,女性91例;患者年齡在29~80歲之間,平均年齡59.1歲);有72人已發(fā)生淋巴結轉移,139人未發(fā)生淋巴結轉移。入組標準:① 術前進行CT掃描;② 有病理結果并作為金標準;③ 年齡在18歲以上。排除標準:① 同時患有其它腫瘤疾??;② 進行過化療或放療;③ CT數據不完整或病灶小于三層(掃描層厚5 mm,螺距1.0)。
掃描設備選用64排螺旋CT機(SOMATOM De finition單源CT機,德國西門子公司)。掃描參數:電壓120 kV,電流200~350 mAs,掃描層厚5 mm,矩陣512×512。掃描范圍:肺尖至肋膈角。
患者的CT掃描圖像保存為DICOM格式文件,并儲存在醫(yī)院PACS系統(tǒng)中。為了獲取每位患者的病灶區(qū)域(Region of Interest,ROI),由兩位10年以上工作經驗的影像科醫(yī)生通過ITK-SNAP(3.6.0版本)軟件進行手動勾畫并保存為NII格式文件。
通過Python 3.6編程從CT圖像中提取影像組學特征,包括圖像的一階統(tǒng)計、形狀、灰度共生矩陣(Gray-Level Co-occurrence Matrix,GLCM)、灰度區(qū)域大小矩陣(Gray-Level Size Zone Matrix,GLSZM)和灰度行程紋理矩陣(Gray-Level Run Length Matrix,GLRLM)[16-17]。利用LASSO算法對提取的影像組學特征進行篩選。
根據患者性別、家族史、吸煙史、癌胚抗原(Carcinoembryonic Antigen,CEA)、神經元特異性烯醇化酶(Neuron Specific Enolase,NSE)和細胞角蛋白(Cytokeratin,CYFRA)臨床指標,采用χ2檢驗、K-S檢驗及U檢驗,評價特征與治療反應的相關性。P<0.05表明具有統(tǒng)計學意義。統(tǒng)計分析使用SPSS軟件(24.0版本)。
使用 LASSO(Least Absolute Shrinkage and Selection Operator)算法[18]構造影像組學標簽,結合臨床指標(年齡、性別、吸煙史、CEA、NSE、CYFRA),用R語言的rms軟件包(v.3.5.1)建立諾莫圖模型。決策曲線(Decision Curve,DCA)通過計算不同閾值概率下的凈效益來評估諾莫圖的臨床應用價值。
以受試者工作特征(Receiver Operating Characteristic,ROC)曲線下面積(Area Under Curve,AUC)、準確度、特異度和靈敏度作為比較指標,計算公式:① 準確度=(真陽性患者人數+真陰性患者人數)/(真陰性人數+假陰性人數+真陽性人數+假陽性人數);② 靈敏度=真陽性人數/(真陽性人數+假陰性人數);③ 特異度=真陰性人數/(真陰性人數+假陽性人數)。本研究全部算法運行的硬件平臺為3.7GHz Intel i7-8700K CPU和64GB 3000 MHz DDR4 RAM。
本研究中患者的臨床指標結果如表1所示。將所有患者以7:3的比例劃分為訓練集和測試集,年齡的測試集采用U檢驗,訓練集采用t檢驗,其余臨床指標訓練集和測試集均采用χ2檢驗。訓練組和測試組患者的性別、年齡、吸煙史、家族史、NSE和CYFRA均無統(tǒng)計學意義;訓練組中患者的CEA具有顯著統(tǒng)計學意義,P<0.001。
表1 測試集和訓練集中患者的臨床指標概況
從患者的CT圖像中共提取855個影像組學特征,利用LASSO回歸模型進行特征降維獲得9個相關性較高的特征并構建了影像組學標簽,即Ct score。
Ct score=(-5.50212843e01)×original_glcm_Imc2+(1.27936076e01)×original_glcm_InverseVariance+(-1.52741916e-01)×original_glcm_SumAverage+(3.21012323e-03)×original_glszm_LargeAreaLowGrayLevelEmphasis+(1.5 2245783e-05)×wavelet-HHH_ngtdm_Busyness+(1.52885379 e+00)×wavelet-HHL_glcm_Idn+(-8.46251468e-01)×wavelet-HLH_glcm_ClusterTendency+(-5.27286929e-03)×wavelet-HLH_glrlm_RunEntropy+(3.00252669e-01)×wavelet-HLH_glrlm_RunLengthNonUniformityNormalized
多因素邏輯回歸構建的包含臨床指標CEA和影像組學標簽的諾莫圖模型如圖1所示,影像組學標簽和CEA得分求和得出總分數(范圍:0~100),將總分數定位在總分數軸上,自上而下畫一條垂線與最底部的量表的交點即為惡性肺結節(jié)的淋巴結轉移風險(范圍:0.1~0.9)。
圖1 多因素邏輯回歸結合CEA和影像組學標簽構建的諾莫圖模型
經諾莫圖模型繪制出ROC曲線,見圖2。模型訓練集的AUC為0.859(靈感度為0.810,特異度為0.773),測試集AUC為0.864(靈感度為0.820,特異度為0.753),結果表明諾莫圖模型在預測肺癌淋巴結轉移方面展現出了良好的預測性能。圖3所示為諾莫圖模型的決策曲線,分析曲線可知當患者發(fā)生淋巴結轉移的閾概率大于0.06%時,使用諾莫圖模型對患者進行淋巴結轉移的預測相較另外兩種治療方案(假設所有患者均發(fā)生淋巴結轉移和假設所有患者均未發(fā)生淋巴結轉移)而言,能得到更大的凈獲益。這一結論凸顯了諾莫圖模型在淋巴結轉移預測方面的臨床應用價值。
圖2 諾莫圖模型訓練集和測試集的ROC曲線
圖3 諾莫圖模型中的決策曲線
肺癌的淋巴結轉移狀態(tài)是患者的外科手術治療的選擇以及是否使用如淋巴結清掃術等輔助治療的關鍵因素,術前無創(chuàng)預測淋巴結轉移具有重要的臨床意義。
本文通過ROC曲線來直觀展示諾莫圖模型的預測性能。ROC曲線下面積即AUC值作為模型準確評估患者患病的概率,可用于評價模型預測性能的優(yōu)劣;特異性、敏感性用于輔助評價模型的性能。ROC曲線是一種判斷模型優(yōu)劣的最直觀、最常用的方法。本研究諾莫圖模型測試集AUC 為0.864,特異度為0.753,靈敏度為0.820,具有優(yōu)秀的預測淋巴結轉移能力。
諾莫圖模型常用于影像組學的研究,能通過患者的個體特征評估臨床事件發(fā)生的概率,是一種很好的預測分類模型[19-21]。相比于其他預測性統(tǒng)計學模型,其可視化的圖標式結果,能更直觀的反映患者的患病概率,并提供個體化的預后風險評估。CEA是一種血清腫瘤標志物,常被用于早期肺癌的檢測。本研究對與肺癌相關的臨床指標進行統(tǒng)計學分析,結果顯示CEA與惡性肺結節(jié)的淋巴結轉移相關性較高(P<0.001),是作為構建預測肺癌患者淋巴結轉移的諾莫圖模型的獨立預后因子(表1),與既往研究一致[22-23]。本研究將臨床指標CEA和通過LASSO算法構建的影像組學標簽(LASSO算法對處理的數據要求低,是一種應用廣泛的數據篩選方法)一同作為預測因子參與構建諾莫圖。由模型繪制出的ROC曲線測試集AUC為0.864,靈敏度為0.820,特異度為0.753;Yang等[20]人通過肺癌LNM分級和影像組學特征標簽建立諾莫圖預測肺癌的淋巴結轉移,測試集AUC為0.856、特異度為0.821、靈敏度為0.917,表明經CEA和肺癌組學特征建立的諾莫圖模型具有優(yōu)秀的預測淋巴結轉移能力。DCA是一種評估模型在支持臨床決策方面是否具有效用的統(tǒng)計學方法[24]。相較于ROC從準確性方面評價模型的優(yōu)劣,DCA更偏向于從臨床效益方面評價模型,即在假陽性和假陰性均無法避免的情況下,尋求一種使患者凈受益最大的辦法。本研究繪制了諾莫圖決策曲線,圖形表明當患者發(fā)生淋巴結轉移的閾概率大于0.06%時,由諾莫圖模型對患者淋巴結轉移進行預測比“不治療”或“全部治療”策略更有效,顯示出良好的臨床應用潛能。
本研究有幾個局限性。首先,所有的數據都來自同一家醫(yī)院,不具有普遍性,在今后的研究中會引入多中心數據。其次,肺癌的淋巴結轉移還與基因、蛋白質表達有關[25-26],而本研究并未納入該類因素;最后,本研究中的影像組學特征依賴于醫(yī)生手工勾畫ROI,兩位醫(yī)生對肺結節(jié)病灶區(qū)域勾畫的相關系數值為0.954,具有很高的一致性,但較為耗時。在未來的研究中,擴大樣本容量、納入不同地域的患者、融合更多的臨床信息,采用更高效、更準確的病灶分割算法將更有可能改善模型的性能和普適性。
綜上所述,本研究利用CT圖像建立了包含臨床指標CEA和影像組學標簽的諾莫圖模型。ROC和DCA結果析顯示:諾莫圖模型在預測肺癌淋巴結轉移方面展現出了良好的預測效果和臨床應用價值。