劉明璐, 沈浮, 陸建平
直腸癌(rectal cancer,RC)是世界范圍內(nèi)最常見的消化道惡性腫瘤之一,得益于早期篩查和對確診患者的規(guī)范性治療,全球范圍內(nèi)直腸癌的發(fā)病率、死亡率近20年來有不斷下降的趨勢,但在我國卻呈升高趨勢,多數(shù)患者發(fā)現(xiàn)時已經(jīng)為局部進(jìn)展期直腸癌(locally advanced rectal cancer,LARC)[1-2]。新輔助放化療(neoadjuvant chemoradiotherapy,nCRT)后手術(shù)治療可以降低LARC術(shù)后局部復(fù)發(fā)率,并提高長期生存率及保肛率,是目前的主流治療方式。病理的腫瘤退縮分級(tumor regression grade,TRG)通過對腫瘤組織中纖維化及殘存腫瘤比例的評判,對新輔助治療療效進(jìn)行術(shù)后評估。目前傳統(tǒng)影像學(xué)主要依靠高分辨T2WI序列對新輔助治療的療效進(jìn)行術(shù)前mrTRG分級,僅在形態(tài)學(xué)上評估療效,與病理TRG缺乏對應(yīng),無法滿足精準(zhǔn)醫(yī)學(xué)的要求[3]。影像組學(xué)(radiomics)是將影像數(shù)據(jù)定量分析并與機(jī)器學(xué)習(xí)(machine learning,ML)方法相結(jié)合,篩選出具有診斷價值的影像組學(xué)特征,建立診斷模型,為影像診斷及治療決策提供更精準(zhǔn)的信息。
本研究采用影像組學(xué)的方法,在磁共振高分辨T2WI圖像上分別提取治療前基線檢查的組學(xué)特征及治療前和治療后改變的組學(xué)特征,探討基于這兩種特征提取方法的影像組學(xué)模型對LARC新輔助治療的療效評估價值。
1.患者資料
回顧性分析2018年1月-2018年12月在本院經(jīng)手術(shù)病理證實,行新輔助放化療的80例LARC患者(cT3/T4N0M0或cTxN+M0),男60例,女20例,年齡28~74歲,平均56.2±9.9歲。納入標(biāo)準(zhǔn):①術(shù)后病理類型為直腸腺癌;②直腸單發(fā)病灶;③基線檢查及nCRT后術(shù)前評估均行直腸高分辨T2WI序列掃描;④術(shù)前檢查后行根治性手術(shù)治療,有TRG分級的詳細(xì)病理報告結(jié)果。排除標(biāo)準(zhǔn):①圖像質(zhì)量欠佳,如明顯偽影導(dǎo)致無法對圖像進(jìn)行分割及提取影像組學(xué)特征;②術(shù)前MRI檢查距手術(shù)間隔時間超過12周[4-5];③病程中另外接受其他局部治療、靶向治療或免疫治療。
2.MR檢查方法
采用Siemens 3.0T Skyra MR成像系統(tǒng),腹部相控陣線圈。所有患者檢查前禁食4 h。檢查前使用一支開塞露(20 mL甘油)清潔患者腸道。直腸MR掃描主要序列包括:脂肪抑制T2WI(矢狀面),T1WI(橫軸面)、高分辨T2WI(斜橫軸面)、DWI及增強(qiáng)掃描。高分辨T2WI平面垂直于病灶處腸管的長軸。掃描參數(shù):TR 4000 ms,TE 108 ms,F(xiàn)OV 180 mm,矩陣320×320,層厚3 mm,無層間距,層數(shù)28,翻轉(zhuǎn)角150°,帶寬108 Hz/像素,無脂肪抑制技術(shù),GRAPPA并行采集模式,加速因子為3,采集時間為4 min 10 s。
3.治療方案及病理標(biāo)準(zhǔn)
所有患者術(shù)前均行長程適形調(diào)強(qiáng)盆腔放療,處方劑量為45~50 Gy,共25~28次,5周到5周半完成?;熡诘谝淮闻枨环暖熼_展時口服卡培他濱或靜滴5-氟尿嘧啶(5-fluorouracil,5-FU)[4-5]。新輔助放化療結(jié)束后間隔5~12周行直腸癌根治性切除術(shù)[6]。術(shù)后病理判斷腫瘤退縮分級(tumor regression grade,TRG),根據(jù)美國癌癥聯(lián)合委員會(American Joint Committee on Cancer,AJCC)第八版的分類標(biāo)準(zhǔn)[7]分為0~3級共4類。TRG 0級(完全消退):鏡下無腫瘤細(xì)胞殘留;TRG 1級(中等退縮):鏡下僅見單個或小灶性腫瘤細(xì)胞殘留;TRG 2級(輕微退縮):可見腫瘤細(xì)胞殘留但少于纖維化間質(zhì);TRG 3級(無退縮):無或僅少量腫瘤細(xì)胞壞死,可見廣泛的腫瘤細(xì)胞殘留。據(jù)此將TRG 0和TRG 1級歸類為療效良好組,將TRG 2和TRG 3級歸類為療效不良組。
4.圖像VOI選取和特征提取
分別將nCRT前、后采集到的DICOM圖像導(dǎo)入后處理平臺(大數(shù)據(jù)智能分析云平臺,慧影醫(yī)療科技有限公司,北京),由兩名具有5年以上經(jīng)驗的放射科醫(yī)師采用手動方式在T2WI圖像上分別沿病變邊緣逐層勾畫興趣區(qū)(region of interest,ROI),自動生成病灶的三維容積興趣區(qū)(volume of interest,VOI),見圖1。分為兩種模型提取特征,Model 1:僅提取基線影像組學(xué)特征;Model 2:提取治療前基線和治療后改變的影像組學(xué)特征,代表nCRT后的組學(xué)變化。分為以下兩類特征:①基于特征類:一階統(tǒng)計量特征(first order statistic),形狀特征(shape-based),紋理特征(texture),包括:灰度級共生矩陣(gray level co-occurrence matrix,GLCM)、灰度級長度矩陣(gray level run length matrix,GLRLM)、灰度級形狀矩陣(gray level size zone matrix,GLSZM)和領(lǐng)域灰度差分矩陣(neighborhood gray-tone difference matrix,NGTDM);②基于過濾器類:小波分析(wavelets)、拉普拉斯轉(zhuǎn)換(laplacian transforms)、對數(shù)特征(logarithm)、指數(shù)特征(exponential)、明可夫斯基函數(shù)(minkowski functionals)、分形維數(shù)(fractal dimensions)等方式處理后再提取的高階特征,共1409組,Model 1:1409個特征,Model 2:2818個特征。
圖1 直腸癌病灶分割示意圖。a)基線高分辨T2WI,逐層勾畫ROI;b)治療前病灶重建VOI;c)治療后復(fù)查高分辨T2WI,逐層勾畫ROI;d)治療后病灶重建VOI。
5.模型構(gòu)建及統(tǒng)計學(xué)分析
首先將上述獲取到的兩種方法的所有特征分別進(jìn)行組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficient,ICC)分析,選擇ICC>0.8的特征,最后采用最小絕對收縮算子算法(least absolute shrinkage and selection operator,LASSO)進(jìn)行降維,分別選擇對TRG分級最有價值的特征。隨機(jī)選取70%的病例作為訓(xùn)練集構(gòu)建隨機(jī)森林(random forests,RF)模型,剩余30%的病例作為測試集,兩種方法分別進(jìn)行驗證。兩種模型分別繪制受試者操作特征(receiver operating characteristic,ROC)曲線,計算曲線下面積(area under curve,AUC)、敏感度、特異度、95%置信區(qū)間(95% CI)、符合率、陽性似然比、陰性似然比、陽性預(yù)測值、陰性預(yù)測值。采用Delong檢驗比較組間差異。采用決策曲線分析(decision curve analysis,DCA)評估不同風(fēng)險閾值下的臨床獲益。
1.病理結(jié)果
最終共納入80例LARC直腸癌患者(臨床分期T3-4,N0,M0或任何T,N1-2,M0),nCRT后臨床評估49例患者降期(61.25%)。根據(jù)術(shù)后病理報告:TRG 0級15例(圖2),TRG 1級14例,TRG 2級32例(圖3),TRG 3級19例。療效良好組29例(36.25%),療效不良組51例(63.75%)。療效良好組男、女性別比為21:8,平均年齡55.6±9.3歲;療效不良組男、女性別比為39:12,平均年齡56.8±10.1歲,兩組間性別及年齡差異無統(tǒng)計學(xué)意義(χ2=0.162,P=0.790;t=0.525,P=0.601)。
2.影像組學(xué)特征
Model 1初始1409個組學(xué)特征,其中121個特征ICC<0.8;Model 2初始2818個特征,272個特征ICC<0.8,兩種方法差異無統(tǒng)計學(xué)意義(χ2=1.262,P=0.286)。去除ICC<0.8的特征后Model 1降維得到28個相關(guān)特征;Model 2降維得到3個相關(guān)特征(圖4)。
3.隨機(jī)森林分類器模型的建立及診斷效能評價
降維后的兩組影像組學(xué)特征與TRG分級建立隨機(jī)森林(RF)分類器模型。Model 1和Model 2的訓(xùn)練集AUC分別為0.698、0.708,Model 1和Model 2的測試集AUC分別為0.943、0.950,組間比較Delong檢驗P值為0.848(表1,圖5)。決策曲線顯示總體上兩種預(yù)測模型均有臨床獲益(圖6)。
1.傳統(tǒng)影像學(xué)對直腸癌nCRT療效評估的局限性
TRG作為新輔助治療后的一個預(yù)后獨立因子,廣泛應(yīng)用于評估直腸癌新輔助治療的療效[6]。但是,TRG作為金標(biāo)準(zhǔn)依靠術(shù)后病理進(jìn)行分級,因此如何應(yīng)用影像學(xué)方法來術(shù)前準(zhǔn)確評估直腸癌新輔助治療的療效便成了一個非常迫切的問題。目前利用MR腫瘤消退分級(MR imaging tumor regression grade,mrTRG)進(jìn)行術(shù)前療效評估受到廣泛關(guān)注,但是mrTRG分級系統(tǒng)基于高分辨T2WI,對腫瘤大小及信號變化進(jìn)行評價,根據(jù)主觀判斷分為五個等級(mrTRG1-5),而病理TRG分為0~3共4個等級(NCCN指南推薦根據(jù)Ryan R等的分級系統(tǒng))[3],兩種分級系統(tǒng)無法對應(yīng)。因此本研究希望引入影像組學(xué)的方法來分析組學(xué)特征與病理TRG的關(guān)系。
表1 兩種模型測試集ROC曲線分析
圖2 男,64歲,大便帶血1年余。a)基線高分辨T2WI示直腸前壁不均勻增厚占管腔3/4圈(箭);b)nCRT后復(fù)查高分辨T2WI示直腸前壁見低信號疤痕殘留,提示病灶明顯退縮(箭);c)病理示(直腸)新輔助治療后,未見癌組織,符合直腸癌新輔助放化療后腫瘤完全退縮,TRG 0級(HE,×1)。 圖3 男,38歲,無明顯原因大便次數(shù)增多6個月余。a)基線高分辨T2WI示腸壁增厚占管腔1/4圈(箭);b)nCRT后復(fù)查高分辨T2WI示病灶體積較前縮小(箭);c)病理示(直腸)中分化腺癌,新輔助治療后輕微退縮,TRG 2級(HE,×20)。
影像組學(xué)是應(yīng)用高通量運算提取并整合醫(yī)學(xué)影像中海量的肉眼無法識別的數(shù)字化信息,規(guī)避了觀察者本身對于影像特征解讀的主觀偏向,從而擁有了能夠量化分析腫瘤異質(zhì)性的能力[8],輔助醫(yī)師做出治療決策[9-11],有望成為精準(zhǔn)影像醫(yī)學(xué)的重要基石[12]。目前,一些國內(nèi)外學(xué)者已開始進(jìn)行影像組學(xué)對結(jié)直腸腫瘤nCRT后療效評價的相關(guān)研究[13-17]。本研究采用RF分類器,屬于監(jiān)督式學(xué)習(xí),是一種包含多棵決策樹的集成學(xué)習(xí)方法,每棵分類樹通過Boot strapping算法(自助法)訓(xùn)練子分類器,通過組合子分類器的投票結(jié)果獲得最終分類結(jié)果[18],能夠減少問題的復(fù)雜性和節(jié)省訓(xùn)練時間,增強(qiáng)了分類模型的泛化能力,不容易過擬合,且具有較強(qiáng)的抗噪能力。
2.影像組學(xué)模型對直腸癌nCRT療效評估的效能
本研究對接受新輔助治療的LARC患者分別提取治療前基線檢查的影像組學(xué)特征以及治療前后的組學(xué)特征,建立這兩種不同維度的模型。Model 1的特征提取方法僅納入腫瘤本身的基線組學(xué)特征,更直接反應(yīng)腫瘤負(fù)荷[13],傾向于體現(xiàn)模型對療效的預(yù)測能力,而Model 2聯(lián)合了治療前后的組學(xué)特征,特征的改變更接近于術(shù)后病理特征,建立的模型側(cè)重于治療后的再評價能力[15-16]。
圖4 TRG相關(guān)影像組學(xué)特征。a)Model 1,28個特征;b)Model 2,3個特征。
圖5 兩種模型測試集ROC曲線。 圖6 決策曲線評估臨床獲益。Y軸是凈收益,通過獲得真陽性然后減去假陽性來計算的;X軸表示風(fēng)險因素的概率閾值。當(dāng)概率閾值為10%~80%時,采用影像組學(xué)方法預(yù)測TRG分級優(yōu)于將所有患者都看作療效良好,也優(yōu)于將所有患者看作療效不良。兩種預(yù)測模型的曲線于約55%的風(fēng)險閾值處相交,此時兩種模型的臨床獲益相仿,在此之前Model 2的臨床獲益略高。
兩個模型ROC曲線分析均有較好的診斷效能,且差異無統(tǒng)計學(xué)意義(Model 1的AUC為0.943,Model 2的AUC為0.950,P>0.05)。其中Model 1(98.0%)的特異度高于Model 2(90.2%),且陽性似然比較高(>10),提示該模型能夠較準(zhǔn)確地識別真正的對新輔助治療敏感的患者(模型預(yù)測療效好時真陽性的概率大)。而Model 2(85.7%)的敏感度高于Model1(96.4%),陰性似然比也較低(<0.1),表明該模型發(fā)現(xiàn)新輔助治療效果不佳的患者的可能性增加(模型評估療效不良時真陰性的可能性大)。同時兩種模型的陽性預(yù)測值和陰性預(yù)測值都較高,不會導(dǎo)致過度治療或治療延誤。
DCA結(jié)果顯示,當(dāng)概率閾值為10%~80%時,兩種模型均有較大的臨床獲益。兩曲線于約55%的風(fēng)險閾值處相交,此時兩種模型的凈收益相仿,在此之前Model 2優(yōu)于Model 1。本組研究療效良好組占36.25%,此時Model 2的曲線位于Model 1之上,凈獲益更好。
3.局限性
本次研究仍存在以下局限性:第一,單中心回顧性的研究納入的樣本量相對較小,需設(shè)計前瞻性多中心研究,擴(kuò)大樣本量以減少數(shù)據(jù)量對模型的影響;第二,由于直腸癌病灶形態(tài)欠規(guī)則,本研究采用的傳統(tǒng)手動勾畫興趣區(qū)的方法分割耗時久,工作量大,不適用于大規(guī)模的數(shù)據(jù)處理,且可重復(fù)性及穩(wěn)定性差,這可能會影響紋理特征的準(zhǔn)確性,基于深度學(xué)習(xí)的興趣區(qū)半自動/自動分割方法將是未來的一個重要研究內(nèi)容;第三,本研究分析影像組學(xué)特征沒有結(jié)合相關(guān)臨床風(fēng)險因素,有待下一步驗證研究。
綜上所述,采用MRI基線檢查的影像組學(xué)模型與治療前后改變的影像組學(xué)模型均可以判斷直腸癌新輔助治療后的腫瘤退縮程度。因此,應(yīng)用影像組學(xué)模型可以對直腸癌新輔助治療的療效進(jìn)行有效評估,從而實現(xiàn)個體化精準(zhǔn)醫(yī)療。