鄭宇,郭子義
(錦州醫(yī)科大學附屬第一醫(yī)院,遼寧 錦州 121000)
肝癌包括原發(fā)肝癌和肝轉(zhuǎn)移癌是癌癥患者的主要死亡原因之一[1]。以腫瘤射頻消融或微波消融為代表的局部毀損性治療(local ablative treatment,LAT)已經(jīng)得到腫瘤治療指南推薦[2]。然而,腫瘤消融術后局部復發(fā)是影響患者長期生存的關鍵問題之一[3-4]。CT紋理分析(CT texture analysis,CTTA)是一種利用像素屬性表征特定感興趣區(qū)域(region of interesting,ROI)內(nèi)病變的異質(zhì)性進而獲得定量紋理參數(shù)的方法。已有研究表明CTTA能夠預測腫瘤患者預后,總體生存率及評估腫瘤治療反應[5]。
本研究擬通過對肝癌患者隨訪中,以機器學習(ML)分類模型方法為基礎,分析肝癌門靜脈期增強CT的CTTA所獲得參數(shù)特征來預測肝癌消融術后復發(fā)與否。
本研究中的所有臨床數(shù)據(jù)和影像學數(shù)據(jù)均來自錦州醫(yī)科大學附屬第一醫(yī)院,CT圖像以DICOM格式保存。所有實驗方案均已獲得錦州醫(yī)科大學機構審查委員會的批準。
回顧性的收集2016—2021年肝腫瘤微波消融術治療病例,共146例,3~6個月后隨訪發(fā)現(xiàn)局部復發(fā)者45例。本研究中僅包括那些在肝腫瘤消融術后3個月以上,且行對比增強CT(contrast enhancement CT,CECT)檢查并且保存有原始DICOM圖像數(shù)據(jù)的患者。所有這些圖像為最大管電壓為120 kV的腹部增強CT,切片厚度5 mm,僅收集門靜脈期增強CT圖像。
CECT圖像質(zhì)量差的患者,如明顯的圖像噪聲、偽影或圖像存在其他質(zhì)量問題被排除在研究之外。
每位患者3~5個連續(xù)層面的樣本,將數(shù)據(jù)擴充到總共528個標記樣本(225個無局部復發(fā)的樣本和303個局部復發(fā)樣本)。圖像選在感興趣病灶的最大直徑中心切片位置和上、下1~2層,因此在3~5個不同且連續(xù)的切片中進行采樣。
在代表腫瘤最大橫截面積的軸向圖像切片上,使用3D Slicer軟件(版本4.8.1)手動進行腫瘤分割[6],然后在相鄰的連續(xù)上層和下層切片上執(zhí)行其他分割。每個病灶最多可獲取5次分割(連續(xù)5層),且距病變輪廓約2 mm的邊緣縮進。全部針對DICOM圖像格式進行提取數(shù)據(jù),并進行歸一化和標準化處理。
使用開源軟件包提取紋理特征(Pyradiomics,版本2.2.0)[7],提取過程按軟件說明書進行。所提取的紋理特征包括一階特征,灰度相關矩陣,灰度共現(xiàn)矩陣,灰度游程矩陣,灰度大小帶矩陣,相鄰灰度差矩陣和基于小波分析的紋理特征。每個病變提取的特征總數(shù)為828。這些特征的詳細描述和數(shù)學公式已在其他文獻進行了描述[8]。
使用統(tǒng)計軟件SPSS 18.0中運行內(nèi)相關系數(shù)(internal correlation coefficient,ICC)為每個紋理特征計算類內(nèi)相關系數(shù)值[9]。在特征選擇步驟中,僅包含類ICC > 0.9的特征(表明具有高度可重復性)。
基于ML的分類模型的統(tǒng)計使用Pycaret軟件(2.1.2版)[10]。使用10倍交叉驗證,共制作了18個分類模型。主要根據(jù)AUC值對分類模型的性能進行了評估和比較。主要使用AUC值測算不同分類模型的性能,顯著性檢查水平P<0.05。
本研究所納入病例的一般特征:平均年齡(59.74 ± 27.5)歲;男性101例,女性45例;原發(fā)肝癌48例,肝轉(zhuǎn)移癌98例;出現(xiàn)微波消融術后復發(fā)者原發(fā)肝癌10例,肝轉(zhuǎn)移癌35例。在門靜脈增強CT增強圖像上的測定病變最大直徑如下:(1)伴有局部復發(fā)腫瘤直徑為直徑:(2.95±1.38) cm;中位數(shù):3.57 cm;IQR:2.88~4.40 cm;(2)無局部復發(fā)的肝腫瘤為(2.02±1.45) cm;中位數(shù):2.95 cm;IQR:2.06~3.36 cm。每個含有腫瘤的ROI中的體素數(shù)量如下:(1)伴有局部復發(fā)腫瘤者4893± 4698;中位數(shù):5875;IQR:2860~5578;(2)無局部復發(fā)腫瘤者3574 ± 5658;中位數(shù):4984;IQR:1761~4430。肝腫瘤微波消融術后局部復發(fā)在門靜脈期增強CT影像表現(xiàn),見圖1。
目標變量是消融術后局部復發(fā)狀態(tài)(是=1,否=0)。在828個紋理特征中,759個具有高度可重復性(ICC ≥ 0.9),因此以下分析中總共包括759特征和528個樣本。訓練集∶測試集∶驗證集的樣本比例為70∶20∶10。使用交叉驗證對總共18個模型進行了訓練和評估。
在訓練集上對所有18個分類模型進行了訓練,并使用分層交叉驗證對它們進行了評分,分別用AUC、準確率、精確率、Kappa值表示分類模型的優(yōu)劣。最終將得分最高的3種分類模型Extra Trees、cat Boost和Gradient Boosting用作判定局部復發(fā)與否,3種分類模型在腫瘤局部復發(fā)與否預測的準確率、精確率、Kappa值和AUC值之間的比較,見表1。
星號所示A:最大徑約為1.8 cm;B:行CT引導下微波消融術后3個月時復查CT提示可疑結節(jié),未行進一步治療;C:微波消融術后6個月復查增強提示病灶局部復發(fā)
表1 不同分類模型對有/無局部復發(fā)分類
在測試集上Extra Trees、cat Boost和Gradient Boosting這3種分類模型的預測準確率均超過80%,精確率超過80%,Kappa值約60%,特別是AUC值均超過85%(P<0.05),提示所選擇的3種分類模型在預測效能和穩(wěn)定性上具有顯著優(yōu)勢。為了驗證數(shù)據(jù)的預測模型功能,在從原始數(shù)據(jù)集中保留了53個樣本記錄(占10%),用于最終驗證所用分類模型的AUC的性能,見圖2。
在測試樣本(test data為20%,105個樣本)上判定經(jīng)過訓練集獲得的3種模型的分類結果。圖2顯示了來自Extra trees分類模型,Cat Boost分類模型和Gradient Boosting模型的ROC曲線圖,3種分類模型的分類準確性均超過85%。進一步對預測的精確率進行判定,見圖3。Extra Trees、CatBoost、Gradient Boosting這3種分類模型方法,從肝癌的門靜脈期增強CT的CTTA獲得的所選10個特征預測AUC值分別為:0.85、0.88、0.89(P<0.05);預測精確度分別為90%、91%和92%(P<0.05)。
A:使用Extra Trees分類模型獲得的AUC為0.85;B:使用Cat Boost分類模型獲得的AUC值為0.88;C:使用Gradient Boosting分類模型獲得的AUC分別為0.89。顯著性檢驗水平設定為P<0.05
為了預測驗證集并查看評估指標,最終模型功能將模型擬合到完整的數(shù)據(jù)集驗證集樣本(validation data 為10%,53個樣本)。在測試集和驗證集上,3種性能良好的模型分別是Extra Trees、Cat Boost和Gradient Boosting,模型之間預測準確性結果的比較如下,如圖3所示:(1)測試樣本(105個樣本)上Extra Trees分類模型的準確性為0.85,驗證集數(shù)據(jù)(53個樣本)進行預測的準確性為0.9;(2)Cat Boost在測試集(105個樣本)上的準確度為0.88,驗證集數(shù)據(jù)(53個樣本)的預測準確度為0.9;(3)Gradient Boosting在測試集(105個樣本)上的準確度為0.86,驗證集數(shù)據(jù)(53個樣本)的預測準確度為0.9。
A:使用Extra Trees分類模型有效區(qū)分有/無局部復發(fā)分類的精確度為0.90;B:使用Cat Boost分類模型有效區(qū)分有/無局部復發(fā)分類的精確度為0.91;C:使用Gradient Boosting分類模型有效區(qū)分有/無局部復發(fā)分類的精確度為0.92。 3種分類模型(Extra Trees,Cat Boost和Gradient Boosting)判定復發(fā)與否的精確度均超過90%,顯著性檢驗水平設定為P<0.05
本文使用ML分類模型對肝腫瘤消融治療后CTTA所獲特征數(shù)據(jù)進行分析,來預測腫瘤消融局部復發(fā)與否。本研究結果表明,使用3種不同ML分類模型(如 Extra Trees、Cat Boost和Gradient Boosting分類模型)對CTTA分析均可能對預測肝腫瘤局部復發(fā)有用,預測的準確率可以達到90%以上。本研究結果與其他通過使用CTTA的作為腫瘤復發(fā)的生物標志物研究結論一致,判斷正確率約88%~93%[11]。
本研究中僅通過分析肝癌門靜脈期增強CT進行CTTA研究,而且使用120 kV的管電壓完成肝增強CT檢查,使得應用于本研究所需的CT檢查放射劑量低于常規(guī)多期肝增強CT(平掃-動脈期-門靜脈期-延遲期),有效的降低了CT放射劑量。特別是對于肝癌患者而言,需要反復多次進行CT為代表的放射線檢查,能夠行之有效地降低醫(yī)療相關輻射劑量。
基于CTTA的ML分類模型已用于預測轉(zhuǎn)移性結直腸癌患者的生存[12],CTTA還成功用于預測單個HER2擴增的結直腸癌肝轉(zhuǎn)移的化療后反應[13]。從CTTA得出的特征參數(shù)可能會提供潛在的預后標記來預測腫瘤治療后局部復發(fā),我們可以預計通過進一步研究可能會開發(fā)出新的基于影像數(shù)據(jù)的預后標記物和模型,其中可能涉及更大的數(shù)據(jù)集和不同的特征選擇算法以及支持ML分類模型。由于CTTA可以揭示成像特征與腫瘤治療預后之間的關系,我們目前的研究可能具有重要的臨床意義。
該研究尚存在一些局限有待解決:(1)作為一項回顧性研究設計,該研究提供了一些較低水平的證據(jù);(2)基于ML的分類模型可能會因患者人數(shù)少且失衡而導致過擬合的風險,我們努力通過應用數(shù)據(jù)增強技術來增加標記樣本的數(shù)量,以減少這種預期過擬合的問題,這是一種有效的方法,可以克服基于ML的分類模型中的過擬合;(3)盡管3D分割可以更有效地表示放射線影像學信息,但是我們僅將最大的2D切片及其相鄰的連續(xù)上下切片用于CTTA,因為多數(shù)既往對肝癌的臨床研究都是基于單個層面的分割或少數(shù)幾個分割層面[14];(4)本文未分析非對比增強CT或動脈期增強CT的CTTA,因為非對比增強CT在診斷肝腫瘤復發(fā)缺乏組織對比度,因難于早期發(fā)現(xiàn),易出現(xiàn)漏診;肝動脈期增強CT可因腫瘤消融術后所致肝實質(zhì)“異常灌注”,可能造成誤診,故本文僅選擇門靜脈期CT圖像進行CTTA分析;(5)本文僅評估了腫瘤局部復發(fā)與否,對復發(fā)程度和范圍未進行劃分。
綜上所述,基于ML分類模型的CTTA被證明是預測肝癌患者腫瘤消融治療后復發(fā)與否的可行且可能成功的方法。由于本研究僅使用門靜脈期增強CT即可實現(xiàn)對腫瘤消融術后復發(fā)的有效預測,并能夠行之有效的降低CT檢查放射劑量,而且可以將該方法用作大型和前瞻性臨床試驗中的臨床決策支持工具之一。