陳小琪, 徐華霞, 王小玥, 李銳進, 邱明鏈, 邱模良, 吳凱明, 胡志堅
我國是食管癌(esophageal carcinoma, EC)的高發(fā)地區(qū),發(fā)病率為11.130/100 000,居我國腫瘤發(fā)病率第六位;其死亡率為8.280/100 000,居我國腫瘤死亡率第五位[1]。EC的病理類型包括鱗狀細胞癌和腺癌,我國約90% EC為食管鱗癌(esophageal squamous cell carcinoma, ESCC)[2]。淋巴結(jié)轉(zhuǎn)移(lymph node metastasis, LNM)是ESCC的主要轉(zhuǎn)移方式,是TNM分期中重要的病理特征之一,也是影響ESCC患者總生存期的關(guān)鍵性預(yù)后指標(biāo)[3]。由于獨特的淋巴引流方式,EC極易在食管黏膜及黏膜下層豐富的淋巴管網(wǎng)內(nèi)發(fā)生廣泛或跳躍性轉(zhuǎn)移[4],具有較高的LNM發(fā)生率[5],導(dǎo)致患者預(yù)后不佳。因此,識別ESCC患者是否發(fā)生LNM并評估患者預(yù)后顯得尤為重要。
影像組學(xué)作為一種非侵入性方法,能夠從醫(yī)學(xué)影像中挖掘出定量特征,并結(jié)合統(tǒng)計學(xué)方法篩選出最有價值的影像特征,用于疾病的診斷、療效評估及預(yù)后預(yù)測,包括乳腺癌、肺腺癌、結(jié)直腸癌等惡性腫瘤的診斷及預(yù)后評估[5-6],特別是用于識別原發(fā)性腫瘤是否伴有LNM[7]。已有研究[8-9]證實,影像組學(xué)在預(yù)測ESCC LNM和預(yù)后方面的潛在價值。然而,這些研究僅僅關(guān)注原發(fā)性腫瘤的影像特征,未探討淋巴結(jié)影像特征與LNM的關(guān)聯(lián)。同時,這些研究大多使用人工手動法對影像特征進行分割與提取[10-12]。人工手動分割不僅耗時,且受經(jīng)驗與主觀因素影響比較大,難以適用于大規(guī)模的病例研究[12]。與人工手動分割相比,用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)獲取到的特征可以讓復(fù)雜的內(nèi)部信息得到更好的描述,能夠發(fā)現(xiàn)更深層次的特征[13],適用于大數(shù)據(jù)研究。本研究基于CNN分割提取到的淋巴結(jié)影像組學(xué)特征,探討LNM相關(guān)的影像組學(xué)特征與ESCC LNM及預(yù)后的關(guān)聯(lián),為ESCC淋巴結(jié)的識別及預(yù)后判斷提供理論依據(jù)。
1.1 對象 收集2014年6月—2021年9月福建醫(yī)科大學(xué)附屬第一醫(yī)院308例新發(fā)ESCC患者,其中淋巴結(jié)未轉(zhuǎn)移者154例,LNM者154例。將研究對象按照2∶1隨機分為訓(xùn)練集(n=206)和驗證集(n=102)。納入標(biāo)準:(1)經(jīng)手術(shù)病理組織學(xué)確診的原發(fā)性ESCC;(2)術(shù)前未接受放、化療;(3)在福建省居住10 a以上。排除標(biāo)準:(1)經(jīng)病理診斷確診為非原發(fā)性ESCC、復(fù)發(fā)性ESCC患者;(2)伴有肝腎功能不全或急慢性感染;(3)病情危重不能清晰回答問題者。本研究通過福建醫(yī)科大學(xué)倫理委員會批準(審批號:201495),患者及家屬均知情同意。
1.2 影像資料收集 影像資料來源于福建醫(yī)科大學(xué)附屬第一醫(yī)院胸外科。采用Toshiba Aquilion One 320排CT機,從胸廓入口到肺底,進行胸部螺旋掃描。掃描參數(shù):根據(jù)醫(yī)院統(tǒng)一標(biāo)準執(zhí)行。所有患者數(shù)據(jù)格式均保持一致,采用digital imaging and communications in medicine (DICOM)格式。
1.3 影像組學(xué)特征提取與篩選
1.3.1 影像資料標(biāo)記 根據(jù)影像指南統(tǒng)一標(biāo)記標(biāo)準,由2位具有5 a以上工作經(jīng)驗的影像科醫(yī)生使用MRIcroGL軟件標(biāo)記ESCC患者CT影像資料中的淋巴結(jié)。
1.3.2 圖像分割 為確保分割的準確性及節(jié)省人力物力,本研究使用CNN對標(biāo)記的淋巴結(jié)區(qū)域進行自動分割,進而提取ESCC淋巴結(jié)的影像組學(xué)特征。
1.3.3 影像資料提取 為減少各種CT掃描儀的影響,統(tǒng)一將DICOM圖像轉(zhuǎn)換為灰度值圖像,并對每個患者自動提取感興趣區(qū)(region of interest, ROI)的影像特征進行進一步分析,使用CNN自動提取ESCC的CT淋巴結(jié)特征,共提取到999個影像組學(xué)特征值用于后續(xù)研究。
1.4 統(tǒng)計學(xué)處理 采用SPSS 24.0軟件及R(4.10)軟件進行統(tǒng)計分析。使用χ2檢驗比較2組患者臨床特征的分布情況。本研究使用CNN對標(biāo)記的淋巴結(jié)區(qū)域進行自動分割,并自動提取ESCC淋巴結(jié)的影像組學(xué)特征;進而分別使用LASSO回歸和隨機森林篩選影像組學(xué)特征構(gòu)建ESCC LNM的預(yù)測模型。根據(jù)最佳λ納入LASSO回歸篩選的影像組學(xué)特征;根據(jù)十折交叉驗證擬合的模型誤差及increase in mean squared error(%IncMSE)納入隨機森林篩選的影像組學(xué)特征。以曲線下面積(area under the curve, AUC)作為判斷模型的效能;并使用Delong法比較,選擇最佳模型進行后續(xù)研究;根據(jù)Cox回歸(向后法)算法所得回歸系數(shù)構(gòu)建與篩選出ESCC預(yù)后相關(guān)的影像組學(xué)標(biāo)簽(radiomics signature),并使用Cox回歸探討影像組學(xué)標(biāo)簽與ESCC預(yù)后的關(guān)聯(lián);以C指數(shù)評價由多因素Cox回歸分析變量所建列線圖的預(yù)測能力。
2.1 臨床特征比較 訓(xùn)練集和驗證集在性別、年齡、腫瘤部位、腫瘤直徑、分化程度和T分期分布均衡可比(P>0.05,表1)。
表1 訓(xùn)練集和驗證集患者的臨床特征比較
2.2 篩選與ESCC LNM相關(guān)影像組學(xué)特征構(gòu)建ESCC LNM的預(yù)測模型
2.2.1 使用LASSO回歸篩選影像組學(xué)特征構(gòu)建ESCC LNM的預(yù)測模型 使用LASSO回歸篩選影像特征,最佳λ為0.024(圖1)。使用LASSO回歸,共篩選出19個影像特征,分別為:173、417、457、473、504、521、546、583、585、611、678、695、761、812、884、905、932、974和987。
CNN:卷積神經(jīng)網(wǎng)絡(luò)。
使用上述19個影像特征構(gòu)建預(yù)測模型,在全模型、訓(xùn)練集和驗證集中,其AUC (95% CI)分別為:0.747(0.694,0.801)、0.751(0.686,0.817)和 0.766(0.672,0.860)(圖2)。
ESCC:食管鱗癌;LNM:淋巴結(jié)轉(zhuǎn)移;AUC:曲線下面積。A:全模型;B:訓(xùn)練集;C:驗證集。
2.2.2 使用隨機森林篩選影像組學(xué)特征構(gòu)建 ESCC LNM的預(yù)測模型 根據(jù)隨機森林計算結(jié)果(圖3)。以十折交叉驗證曲線中模型誤差的穩(wěn)定性及%IncMSE作為篩選影像特征的依據(jù),選擇排序為前9位的影像特征用于構(gòu)建ESCC LNM預(yù)測模型,9個影像特征分別為987、306、505、438、111、546、799、566和850。
%IncMSE:增長的錯誤率平方均值;CNN:卷積神經(jīng)網(wǎng)絡(luò)。
使用上述9個影像特征構(gòu)建預(yù)測模型,在全模型、訓(xùn)練集和驗證集中,其AUC (95% CI)分別為:0.692(0.633,0.751)、0.683(0.610,0.755)和 0.723(0.624,0.822)(圖4)。
ESCC:食管鱗癌;LNM:淋巴結(jié)轉(zhuǎn)移。AUC:曲線下面積。A:全模型;B:訓(xùn)練集;C:驗證集。
2.2.3 篩選最佳預(yù)測模型 使用Delong法比較LASSO回歸與隨機森林篩選的影像組學(xué)特征構(gòu)建的ESCC LNM預(yù)測模型。分析發(fā)現(xiàn),使用LASSO回歸所構(gòu)建模型的AUC優(yōu)于使用隨機森林所構(gòu)建的模型(Z=-3.955,P<0.001)。因此,本研究選擇使用LASSO回歸篩選的變量進行后續(xù)的分析。
2.3 使用ESCC LNM相關(guān)的影像組學(xué)特征構(gòu)建ESCC預(yù)后相關(guān)的影像組學(xué)標(biāo)簽 通過Cox回歸(向后法)算法進一步篩選出與ESCC預(yù)后相關(guān)的影像組學(xué)特征,根據(jù)回歸系數(shù)構(gòu)建影像組學(xué)標(biāo)簽,具體計算方式如下:
影像組學(xué)標(biāo)簽=β1X1+β2X2+β3X3+…+βnXn
(1)
式中Xn表示影像組學(xué)特征變量,βn表示所對應(yīng)的回歸系數(shù)[14]。
2.4 影像組學(xué)標(biāo)簽與ESCC預(yù)后的關(guān)聯(lián)分析 本研究對象的生存時間中位數(shù)為 17.430 個月,1、3及5 a生存率分別為77%(95% CI:0.720, 0.830)、52%(95% CI:0.450, 0.590)和42%(95% CI:0.310, 0.520)。根據(jù)影像組學(xué)標(biāo)簽的中位數(shù),將其分為低風(fēng)險影像組學(xué)標(biāo)簽組和高風(fēng)險影像組學(xué)標(biāo)簽組。
調(diào)整性別、年齡、腫瘤直徑、分化程度、T分期、術(shù)后放化療和影像組學(xué)標(biāo)簽,多因素Cox回歸分析發(fā)現(xiàn),高風(fēng)險的影像組學(xué)標(biāo)簽與ESCC不良的預(yù)后相關(guān)(P<0.05,表2)。
表2 多因素LASSO Cox回歸分析
2.5 列線圖 使用多因素Cox回歸分析的變量構(gòu)建列線圖(圖5,圖6),影像組學(xué)標(biāo)簽?zāi)芎芎玫仡A(yù)測食管癌的預(yù)后,總生存率(overall survival, OS)C指數(shù)(95% CI)在全模型、訓(xùn)練集和驗證集中分別為0.710(0.670,0.749)、0.765(0.742,0.788)和0.652(0.568,0.736),無病進展生存率(disease free survival,DFS)C指數(shù)(95% CI)在全模型、訓(xùn)練集和驗證集中分別為0.775(0.746,0.804)、0.754(0.726,0.781)和0.774(0.760,0.789)。
A:全模型;B:訓(xùn)練集;C:驗證集。OS:總生存率。
A:全模型;B:訓(xùn)練集;C:驗證集。DFS:無病進展生存率。
影像組學(xué)在醫(yī)療領(lǐng)域應(yīng)用越來越廣泛,其在疾病的輔助診斷、療效評估和預(yù)后預(yù)測方面已有初步效果[8-9]。本研究通過CNN提取影像組學(xué)特征,并使用LASSO回歸篩選與ESCC LNM相關(guān)的影像組學(xué)特征,構(gòu)建ESCC LNM的預(yù)測模型,發(fā)現(xiàn)該模型識別LNM的效果較好(AUC=0.750, 95% CI:0.690,0.800)。同時,多因素Cox回歸分析發(fā)現(xiàn),高風(fēng)險影像組學(xué)標(biāo)簽與ESCC不良預(yù)后有關(guān)。此外,列線圖結(jié)果顯示,影像組學(xué)標(biāo)簽在預(yù)測ESCC預(yù)后方面有較高的價值。
近年來,多項研究[5,15-17]證實影像組學(xué)在LNM的預(yù)測價值。如ZHAO等[18]基于ESCC患者臨床特征及計算機斷層掃描提取到的影像組學(xué)特征,構(gòu)建LNM預(yù)測模型,訓(xùn)練集和驗證集的AUC分別為0.870和0.840。趙博[19]的研究發(fā)現(xiàn),基于CT影像組學(xué)可以較好地預(yù)測ESCC LNM,且對“隱匿”LNM的預(yù)測也有一定的潛力,訓(xùn)練組和驗證組的AUC分別為0.870和0.840。然而,上述研究大多采用手動分割對CT影像資料進行圖像分割和特征提取,耗時又耗力,且手動分割存在分割不準確、對邊界判斷具有主觀性等問題[10-12]。本研究通過CNN來分割并提取ESCC LNM的影像組學(xué)特征,其分割精準,且能節(jié)省時間,并擇優(yōu)選擇LASSO回歸對提取到的999個特征值進行篩選,共篩選出19個影像特征并構(gòu)建預(yù)測LNM的預(yù)測模型,其AUC (95% CI)在全模型、訓(xùn)練集和驗證集中分別為0.747(0.694,0.801)、0.751(0.686,0.817)和0.766(0.672,0.860)。
使用Cox回歸篩選與預(yù)后相關(guān)的影像組學(xué)特征,并根據(jù)回歸系數(shù)構(gòu)建影像組學(xué)標(biāo)簽,根據(jù)中位數(shù)將其分為低風(fēng)險和高風(fēng)險影像組學(xué)標(biāo)簽,結(jié)果顯示,與低風(fēng)險影像組學(xué)標(biāo)簽比較,高風(fēng)險影像組學(xué)標(biāo)簽與不良預(yù)后相關(guān),說明影像組學(xué)標(biāo)簽與ESCC預(yù)后存在關(guān)聯(lián),可用于ESCC預(yù)后的預(yù)測,與文獻 [8-9] 結(jié)論一致。此外,基于影像組學(xué)標(biāo)簽,構(gòu)建ESCC預(yù)后預(yù)測的列線圖,分析發(fā)現(xiàn)總OS C指數(shù)(95% CI)在全模型、訓(xùn)練集和驗證集中分別為0.710(0.670,0.749)、0.765(0.742,0788)和0.652(0.568,0.736),DFS C指數(shù)(95% CI)分別為0.775(0.746,0.804)、0.754(0.726,0.781)和0.774(0.760,0.789),說明影像組學(xué)標(biāo)簽?zāi)茌^好地預(yù)測ESCC的預(yù)后。但本研究為小樣本、單中心研究,模型的外推使用及穩(wěn)定性有待進一步進行多中心、大樣本的驗證。