謝小雪, 金和坤, 肖翔, 金一, 師穎瑞, 婁繁, 張榮, 楊锫
不同于傳統(tǒng)的醫(yī)學(xué)影像學(xué)概念,通過分析海量且量化的圖像數(shù)據(jù)以指導(dǎo)臨床醫(yī)療決策,是近十年來影像研究的核心?!坝跋窠M學(xué)”通常是指通過機(jī)器學(xué)習(xí)處理從多模態(tài)醫(yī)學(xué)圖像(如:CT、PET、MRI 或超聲波等)中提取的大量量化的圖像特征,單獨(dú)或與其他“組學(xué)參數(shù)”(例如臨床特征、代謝組學(xué)、基因組或蛋白質(zhì)組學(xué)數(shù)據(jù))共同建立預(yù)測(cè)或預(yù)后模型[1-2]。通過影像組學(xué)分析,可對(duì)腫瘤組織內(nèi)部不同空間位點(diǎn)的組織特征進(jìn)行比較,從而能幫助臨床醫(yī)師簡(jiǎn)單快速地了解腫瘤組織內(nèi)部異質(zhì)性,這是影像組學(xué)成為腫瘤學(xué)領(lǐng)域研究熱點(diǎn)的主要原因之一。
計(jì)算機(jī)領(lǐng)域的人工智能等技術(shù)的進(jìn)步,使隱藏在圖像中的海量數(shù)據(jù)被有效利用成為可能,由影像組學(xué)引導(dǎo)的精確個(gè)性化醫(yī)療大門已經(jīng)打開,期待在不久的將來,影像組學(xué)即可用于臨床實(shí)踐以提高患者的診斷、預(yù)后和治療效果[3-4]。影像組學(xué)在提高魯棒性和可重復(fù)性后,將影響腫瘤放療每一個(gè)步驟。目前大量工作都致力于建立一個(gè)可全球通用的標(biāo)準(zhǔn)化工作流程以及可分享的數(shù)學(xué)模型庫,并可在全球范圍達(dá)到幫助腫瘤放療科醫(yī)師進(jìn)行放療及綜合治療決策的制定。本篇綜述將重點(diǎn)闡述影像組學(xué)的主要分析方法,及其在腫瘤放療學(xué)領(lǐng)域中應(yīng)用的研究進(jìn)展。
1.1 基于特征的影像組學(xué) 目前已有部分文獻(xiàn)對(duì)影像組學(xué)特征的提取及建立預(yù)測(cè)模型的常用方法進(jìn)行了綜述[1-2,4-5]。圖像特征主要來自以下幾個(gè)方面:①感興趣區(qū)域(volume of interest,VOI)內(nèi)灰度級(jí)的平均值,方差或者更復(fù)雜的方法,如共生矩陣等;②與 VOI 的幾何(如形狀)相關(guān)的特征包括體積、表面積、球形和致密性等,這部分特征通常與VOI的分割密切相關(guān);③VOI內(nèi)的衍生體積參數(shù),如PET圖像的平均標(biāo)準(zhǔn)攝取值(mean standard uptake value,SUVmean)[6-7]。
最簡(jiǎn)單的定量分析使用描述性統(tǒng)計(jì)方法,例如從某個(gè)VOI內(nèi)灰度分布得出最大值、最小值、均值和方差,日常工作中使用這些特征來分別表征CT或PET圖像內(nèi)的Hounsfiel 單位(HU)或SUV。從直方圖中可進(jìn)行更高級(jí)的統(tǒng)計(jì)分析來表征灰度分布的不對(duì)稱性(偏度)、平坦度(峰度)、無序性(熵)或均勻性(能量)[4]。這些通常被稱為一階圖像特征或直方圖特征。
紋理特征通常涉及二階或高階統(tǒng)計(jì)描述符,能夠識(shí)別 VOI 內(nèi)相同大小體素之間的空間關(guān)系。主要使用灰度共現(xiàn)矩陣(gray level co-occurrence matrix,GLCM)、具有相同灰度幅度的連續(xù)體素(稱為運(yùn)行)矩陣(gray-level run-length matrix,GLRLM)和灰度色調(diào)差矩陣(gray-level tone difference matrix,GTDM)[3]。由此可推導(dǎo)出幾個(gè)特征,例如二階熵或能量,短期強(qiáng)調(diào)或長(zhǎng)期強(qiáng)調(diào)[3]。也可以使用更高級(jí)的過濾器來捕捉重復(fù)模式是否存在。這些過濾器,如高斯拉普拉斯算子、Gabor、小波和勞斯掩碼變換,傾向于跟蹤圖像不同尺度的結(jié)構(gòu)邊緣或邊界[3-4,8-9]。另一種有趣的方法是估計(jì) VOI 內(nèi)的分形維度(fractal dimension),它描述了某一結(jié)構(gòu)在多尺度水平上的自相似性,最常用的算法是二進(jìn)制卷的盒計(jì)數(shù),或灰度卷的差分盒計(jì)數(shù)(box-counting)[10]。
識(shí)別和選擇合適的影像組學(xué)特征并建立精準(zhǔn)預(yù)測(cè)建模的最終目的是指導(dǎo)臨床決策[7-8]。為此,需要通過各種機(jī)器學(xué)習(xí)算法找出可能得出最佳結(jié)果預(yù)測(cè)模型的影像組學(xué)特征[2],接著將總樣本分為訓(xùn)練集和驗(yàn)證集,從而實(shí)現(xiàn)模型的建立和性能評(píng)估。理想情況下,模型的驗(yàn)證應(yīng)該使用獨(dú)立的測(cè)試數(shù)據(jù)集來執(zhí)行,以確保模型能夠適用于不同中心來源的數(shù)據(jù)。由于影像組學(xué)預(yù)測(cè)模型與患者預(yù)后緊密相關(guān),此類研究應(yīng)該遵循TRIPOD[11]等指南并接受嚴(yán)格的評(píng)估。
目前影像組學(xué)研究只有少數(shù)臨床軟件可用(如Dosisoft、Onco Radiomics、TexRad)。但其他免費(fèi)研究工具(IBEX、CGITA、CERR、QMaZda、LifeX、Pyradiomics、RaCaT)使影像組學(xué)在醫(yī)學(xué)界的交流和傳播更為容易。影像組學(xué)軟件的使用缺乏統(tǒng)一標(biāo)準(zhǔn),直接影響了其預(yù)測(cè)模型的可重復(fù)性和穩(wěn)定性[12-13]。已有一項(xiàng)國(guó)際合作開始致力于建立影像組學(xué)中提取圖像生物標(biāo)志物的統(tǒng)一標(biāo)準(zhǔn),作者定期報(bào)告描述獲取和重建醫(yī)學(xué)成像的過程,規(guī)定了圖像特征和基準(zhǔn)數(shù)據(jù)集的命名等[14]。
1.2 基于深度學(xué)習(xí)的影像組學(xué) 深度學(xué)習(xí)是指應(yīng)用神經(jīng)網(wǎng)絡(luò)架構(gòu)原理來解決具體問題的過程,這是一種特定類型的機(jī)器學(xué)習(xí)算法。受人類視覺系統(tǒng)工作原理的啟發(fā),從醫(yī)學(xué)圖像中自動(dòng)識(shí)別和提取高維特征,從而建立對(duì)模式識(shí)別或高維非線性數(shù)據(jù)的分類預(yù)測(cè)模型[15]。利用深度學(xué)習(xí)方法建立預(yù)測(cè)模型指導(dǎo)腦轉(zhuǎn)移瘤和神經(jīng)膠質(zhì)瘤的放療計(jì)劃設(shè)計(jì),其有效性已在多項(xiàng)研究中得到證實(shí)[16-20]。
與基于特征的影像組學(xué)的工作流程不同,基于深度學(xué)習(xí)的影像組學(xué)不是使用數(shù)學(xué)上預(yù)定義的特征,而是使用不同的神經(jīng)網(wǎng)絡(luò)架構(gòu),如卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)或自動(dòng)編碼器,從輸入數(shù)據(jù)中生成和識(shí)別最重要的特征。自動(dòng)編碼器網(wǎng)絡(luò)是CNN的一種特殊、無監(jiān)督變體,旨在壓縮圖像內(nèi)容并映射為相對(duì)較短但具有代表性的特征向量[21]。一般來說,基于深度學(xué)習(xí)的影像組學(xué)使用單層神經(jīng)網(wǎng)絡(luò)的級(jí)聯(lián)系統(tǒng),這些神經(jīng)網(wǎng)絡(luò)經(jīng)過訓(xùn)練可以從圖像數(shù)據(jù)中學(xué)習(xí)和識(shí)別與分類問題相關(guān)的結(jié)構(gòu)信息[22],然后進(jìn)一步組合提取特征向量以生成更高階的抽象特征。而最后建模步驟,既可以將所識(shí)別的特征通過神經(jīng)網(wǎng)絡(luò)本身用于分類,也可以離開神經(jīng)網(wǎng)絡(luò)而通過傳統(tǒng)機(jī)器學(xué)習(xí)法進(jìn)行分類,例如決策樹、回歸模型或支持向量機(jī)等。值得注意的是,基于特征的影像組學(xué)需要分割圖像(即獲取ROI)來進(jìn)行特征提取,而基于深度學(xué)習(xí)的影像組學(xué)(尤其是 CNN)可不基于分割圖像。
基于深度學(xué)習(xí)的影像組學(xué)特征是直接從基礎(chǔ)數(shù)據(jù)中生成和提取的,并且會(huì)自動(dòng)提取性能最佳的特征子集,因此很少執(zhí)行特征選擇,所以特征和輸入數(shù)據(jù)之間可能存在高度的相關(guān)性(即過度擬合),為了降低過度擬合的風(fēng)險(xiǎn),因此需要比基于特征的影像組學(xué)更大型的數(shù)據(jù)集來識(shí)別相關(guān)且穩(wěn)健的特征子集。使用稱為遷移學(xué)習(xí)的機(jī)器學(xué)習(xí)技術(shù),可以克服部分限制。在遷移學(xué)習(xí)中,使用已經(jīng)針對(duì)不同但密切相關(guān)的任務(wù)進(jìn)行預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò),例如,用于腦腫瘤分割的神經(jīng)網(wǎng)絡(luò)模型最初是根據(jù)腦轉(zhuǎn)移患者的圖像數(shù)據(jù)進(jìn)行測(cè)試的,但該模型也適用于膠質(zhì)瘤圖像。遷移學(xué)習(xí)的方法,可減少與識(shí)別相關(guān)特征子集所需的數(shù)據(jù)量和計(jì)算量。
2.1 用于指導(dǎo)設(shè)定放療計(jì)劃 放療危及器官(organ at risk, OAR)的勾畫是放療過程中一個(gè)精細(xì)而關(guān)鍵的步驟。由于解剖結(jié)構(gòu)的復(fù)雜性及不同放療醫(yī)師對(duì)高危亞臨床病灶看法的不同,導(dǎo)致不同中心及不同醫(yī)師之間靶區(qū)勾畫的差異。從多模態(tài)成像中提取有用信息可以提高勾畫的質(zhì)量。除此以外,通過影像組學(xué)過程自動(dòng)提取成像特征有助于減少這種可變性,同時(shí)提高輪廓的準(zhǔn)確性。
在腫瘤治療過程中,尤其對(duì)頭頸部腫瘤而言,預(yù)判和識(shí)別淋巴結(jié)轉(zhuǎn)移和淋巴結(jié)外擴(kuò)散風(fēng)險(xiǎn),是指導(dǎo)治療決策和方案的關(guān)鍵因素。影像組學(xué)有助于預(yù)測(cè)淋巴結(jié)轉(zhuǎn)移的風(fēng)險(xiǎn)。Kann等[23]測(cè)試了一組神經(jīng)網(wǎng)絡(luò),通過術(shù)前CT圖像特征建立淋巴結(jié)轉(zhuǎn)移的預(yù)測(cè)模型,顯示 AUC 約為 0.60,在獨(dú)立隊(duì)列的測(cè)試階段,該模型預(yù)測(cè)淋巴結(jié)轉(zhuǎn)移和淋巴結(jié)外擴(kuò)散的 AUC 均為 0.91,陰性預(yù)測(cè)值分別為 0.82 和 0.95,該計(jì)算模型的性能優(yōu)于臨床風(fēng)險(xiǎn)因素回歸模型和基于放射學(xué)標(biāo)準(zhǔn)的歷史評(píng)估。
影像組學(xué)分析還可用于識(shí)別腫瘤內(nèi)部的組織異質(zhì)性。例如,Shiradkar等[24]使用來自11例前列腺癌患者的多參數(shù) MRI 來確立影像組學(xué)特征分類(預(yù)測(cè)模型),將其用于檢測(cè)來自另一機(jī)構(gòu)的12例患者的腫瘤區(qū)域,其預(yù)測(cè)結(jié)果與放射腫瘤科醫(yī)生確定的癌癥描述的組織學(xué)結(jié)果一致。然后生成近距離放療或外照射放療的治療計(jì)劃,并通過基于影像組學(xué)的腫瘤空間分布概率進(jìn)行細(xì)化,與常規(guī)治療相比,這種以影像組學(xué)為指導(dǎo)的治療計(jì)劃導(dǎo)致對(duì)周圍組織的劑量略有增加。
使用腫瘤劑量繪制(dose painting,DP)[25]的放療是一個(gè)極佳的治療選擇,影像組學(xué)可以為其做出重大貢獻(xiàn)。DP 程序不是開出標(biāo)準(zhǔn)劑量,而是根據(jù)假定的空間放射敏感度,根據(jù)目標(biāo)體積調(diào)整開出的劑量??梢酝ㄟ^將 CT、MRI 或 PET 等圖像與特定的放射標(biāo)記相結(jié)合來確定生物目標(biāo)體積所對(duì)應(yīng)的劑量[26-27]。大多數(shù) DP 臨床試驗(yàn)已使用基于 SUV 閾值或手動(dòng)描繪的PET 功能成像來描繪生物靶區(qū)[28-31]。盡管納入的患者數(shù)量仍然有限,基于 PET 的劑量繪制的臨床益處仍有待確認(rèn),但基于影像組學(xué)的方法應(yīng)成為未來 DP 試驗(yàn)的一部分。
2.2 用于控制輸出劑量 精確放療技術(shù)(如IMRT 和 SBRT)是目前非常有效的治療方法,予以腫瘤及高危亞臨床病灶高劑量輻射,且通過劑量迅速下降以保護(hù)鄰近重要器官,與傳統(tǒng)放療相比,對(duì)體位重復(fù)性及劑量輸送的精準(zhǔn)性要求更高,所以劑量輸送的控制質(zhì)量(control quality,CQ)至關(guān)重要。因此,在開始放療之前,必須進(jìn)行患者特異性對(duì)照測(cè)試[32]。與基于閾值的傳統(tǒng)方法相比,影像組學(xué)將成為精確放療時(shí)代更穩(wěn)健和可靠的CQ程序[33-34]。通過影像組學(xué)方法建立模型后獲得了更高的分類精度,尤其是通過卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)法后。
2.3 用于預(yù)測(cè)放療效果 放療作為綜合治療手段之一,臨床醫(yī)師需要通過及時(shí)甚至提前了解腫瘤組織對(duì)放射線的反應(yīng),從而指導(dǎo)臨床醫(yī)師制定個(gè)體化放療計(jì)劃及聯(lián)合治療方案的決策。在放療過程中,為減少因體重下降或腫瘤體積退縮導(dǎo)致的劑量和擺位誤差,需要對(duì)這部分患者在放療過程中進(jìn)行多次定位及計(jì)劃設(shè)計(jì),即自適應(yīng)放療[35]。但因?yàn)榉派涿舾行缘膫€(gè)體差異,腫瘤消退速度在個(gè)體之間存在差異,如能提前預(yù)測(cè)患者是否需要進(jìn)行自適應(yīng)放療,可更好地節(jié)約臨床資源。Yu等[36]基于放療前所采集磁共振的T1序列圖像特征、T2序列圖像特征,以及二者聯(lián)合的特征分別建立了3個(gè)模型,均可用于預(yù)測(cè)鼻咽癌患者是否需要接受自適應(yīng)放療(AUC分別為0.852,0.750和0.930),實(shí)現(xiàn)了鼻咽癌患者的個(gè)體化放療并減少了傳統(tǒng)放療流程中存在的劑量誤差或不必要的臨床資源浪費(fèi)。由于人工智能及醫(yī)學(xué)影像技術(shù)的同時(shí)發(fā)展及交叉引用,通過影像組學(xué)建立放療過程中腫瘤消退情況的預(yù)測(cè)模型,醫(yī)師為每一位患者制定個(gè)體化復(fù)查頻率及自適應(yīng)放療計(jì)劃,有望在不久的將來應(yīng)用于臨床。
現(xiàn)代放療離不開先進(jìn)的圖像引導(dǎo)技術(shù),其中錐形束CT(come beam CT,CBCT)和4D-CT的廣泛應(yīng)用是現(xiàn)代放療的重要體現(xiàn)[37]。通過每周CBCT圖像驗(yàn)證以保障放療的精確及準(zhǔn)確,而每周放療驗(yàn)證過程中所獲得的CBCT圖像,恰好可用于建立“劑量—療效”預(yù)測(cè)模型,即可通過實(shí)時(shí)動(dòng)態(tài)獲得的CBCT圖像可更好地研究腫瘤反應(yīng)與放療總劑量、分次劑量、分割方式等變量之間的關(guān)系。需要考慮的是CBCT圖像質(zhì)量及其特征的穩(wěn)定性。已有相關(guān)研究表明,從CBCT圖像中可提取高重復(fù)性的圖像特征[38],且用這些特征建立的生存預(yù)測(cè)模型不亞于普通CT診斷[39]。4D-CT定位系統(tǒng)是肺癌放療過程中必不可少的設(shè)備,研究表明,從4D-CT中可以獲得更豐富且更穩(wěn)定的圖像特征,用于建立生存預(yù)測(cè)模型[40]。
2.4 用于預(yù)測(cè)放療毒性反應(yīng) 從個(gè)體化醫(yī)療的角度來看,預(yù)測(cè)治療毒性也至關(guān)重要,特別是隨著立體定向放療(stereotactic body radiotherapy,SBRT)和再程放療相關(guān)技術(shù)的發(fā)展?;谀[瘤靶標(biāo)周圍 OAR 的正常組織的劑量限制已被證明是成功的[41]:例如,調(diào)強(qiáng)放療技術(shù)(intensity-modulated radiation therapy,IMRT)的應(yīng)用,通過對(duì)腮腺的保護(hù),降低了頭頸部腫瘤放療中輻射引起的口干癥的發(fā)生率[41-43]。然而這些限制并不能防止所有輻射誘發(fā)的事件,因?yàn)閷?duì)于每一位特定患者,需要考慮許多個(gè)體因素(如年齡、體質(zhì)指數(shù)、化療藥物等)[44]。解剖學(xué)因素也可能會(huì)影響很大[45]。
使用影像組學(xué)來識(shí)別健康組織中的特定圖像特征以及與輻射引起的毒性的相關(guān)性,是一個(gè)有前途的新興研究領(lǐng)域,主要研究口干癥或放射性肺炎的風(fēng)險(xiǎn),同時(shí)也集中在對(duì)腮腺和肺的研究分析[46]。Scalco 等[47]研究顯示口腔癌患者的腮腺在放療前后顯著的紋理變化,這些變化提示輻射誘導(dǎo)的腺體組織的結(jié)構(gòu)轉(zhuǎn)變。此外,通過將紋理變化與初始體積變化相結(jié)合,改進(jìn)了放療后腮腺收縮的預(yù)測(cè)模型。
同樣對(duì)于肺組織,Anthony等[48]研究表明,胸部 IMRT 前后體素與體素密度之間的相關(guān)性隨劑量增加而增加。其他放療不良反應(yīng)的預(yù)測(cè)也可見報(bào)道,如基于CT影像組學(xué)分析預(yù)測(cè)加速部分乳房照射對(duì)正常乳腺組織的影響[49],以及基于MRI對(duì)頭頸部腫瘤放化療相關(guān)的神經(jīng)性聽力損失、張口受限等[49-50]。
2.5 用于區(qū)分輻射損傷和腫瘤復(fù)發(fā) 標(biāo)準(zhǔn)的放療損傷評(píng)價(jià)標(biāo)準(zhǔn)(如 RECIST 標(biāo)準(zhǔn))對(duì)于區(qū)分良性損傷和腫瘤復(fù)發(fā)非常困難。而影像組學(xué)分析已在該領(lǐng)域顯示出非常有希望的研究結(jié)果,尤其是在肺癌和腦腫瘤等方面[51-52]。
通過CT 影像組學(xué)分析,建立對(duì)非小細(xì)胞肺癌接受SBRT治療后復(fù)發(fā)及放射損傷的預(yù)測(cè)模型。同時(shí)對(duì)醫(yī)生與影像組學(xué)的預(yù)測(cè)能力進(jìn)行對(duì)比,由醫(yī)生評(píng)估復(fù)發(fā)的中位敏感性和特異性較高(分別為83%和75%),但是首次檢測(cè)局部復(fù)發(fā)需要較長(zhǎng)時(shí)間(約15.5個(gè)月),并且由不同醫(yī)生觀察得出的結(jié)果存在較大差異[53]。
影像組學(xué)對(duì)膠質(zhì)母細(xì)胞瘤的MRI 圖像中提取的特征在區(qū)分其假性進(jìn)展和真性進(jìn)展方面敏感性和特異性分別為90%和88%。將之用于對(duì)放療后患者的隨訪,有深遠(yuǎn)的臨床應(yīng)用前景[54]。
從腫瘤放療的靶區(qū)勾畫、處方劑量指導(dǎo)、輸出劑量質(zhì)控、預(yù)測(cè)放療毒不良反應(yīng)到區(qū)分放療不良反應(yīng)和腫瘤復(fù)發(fā),影像組學(xué)可應(yīng)用于放療的各個(gè)階段,影像組學(xué)可能對(duì)臨床腫瘤放療學(xué)工作者的日常實(shí)踐產(chǎn)生巨大影響。目前影像組學(xué)方法還未用于臨床放療,我們還需明確如何同質(zhì)化建模,以及明確基于圖像的特征與生物學(xué)之間的關(guān)系。努力方向如下:①使用標(biāo)準(zhǔn)化成像程序以實(shí)現(xiàn)可重復(fù)的建模方式;②研究中心之間數(shù)據(jù)共享,以形成大隊(duì)列研究;③科研工作者與臨床醫(yī)生之間數(shù)據(jù)共享以測(cè)試和驗(yàn)證基于假設(shè)的影像組學(xué)預(yù)測(cè)模型效能。目前臨床醫(yī)生使用影像組學(xué)的主要困難可能是未能掌握對(duì)機(jī)器的深度學(xué)習(xí),猶如打不開“黑匣子”一般。計(jì)算機(jī)和醫(yī)學(xué)專業(yè)的深度合作將有助于臨床醫(yī)生更好地接受該技術(shù)。最重要的是不應(yīng)將基于機(jī)器學(xué)習(xí)的通用算法認(rèn)為可替代臨床醫(yī)生,而應(yīng)將其作為臨床醫(yī)生執(zhí)行個(gè)性化醫(yī)療措施“觸手可及”的有效工具。