盧明君,屈耀銘,馬安東,朱建彬,鄒 霞,林耕耘,李榆欣,劉昕孜,溫志波
南方醫(yī)科大學(xué)珠江醫(yī)院影像診斷科,廣東 廣州 510282
膠質(zhì)瘤是中樞神經(jīng)系統(tǒng)最常見的惡性腫瘤,是原發(fā)性腦腫瘤患者死亡的主要原因。彌漫性較低級別膠質(zhì)瘤(Ⅱ/Ⅲ級)占所有膠質(zhì)瘤的43.2%[1]。一部分彌漫性較低級別膠質(zhì)瘤可在幾月內(nèi)發(fā)展為多形性膠質(zhì)母細胞瘤[2]。早期檢測膠質(zhì)瘤1p/19q共缺失狀態(tài)與預(yù)后水平有關(guān),對化療敏感,并且可以識別少突膠質(zhì)細胞瘤[3]。通常,使用熒光原位雜交(FISH)可以識別1p/19q的狀態(tài),包括測量1p36/1q21和19q13/19p13的含量。但是,由于部分患者年齡較大、神經(jīng)系統(tǒng)狀況差和腫瘤的位置等原因,并不適合手術(shù)或活檢,因此需要一種非侵入性的方法來預(yù)測膠質(zhì)瘤1p/19q的狀態(tài)。
1p/19q共缺失與少突膠質(zhì)細胞瘤高度相關(guān)。一些常規(guī)的CT或MRI影像學(xué)特征可用于診斷及區(qū)分少突膠質(zhì)細胞瘤與星形細胞瘤。其中,T2-FLAIR錯配征是IDH突變型星形細胞瘤的一個重要的影像學(xué)特征,具有高特異性和低敏感性[4,5]。少突膠質(zhì)細胞瘤的鈣化發(fā)生率達到43%~80%[6]。然而,當膠質(zhì)瘤無鈣化或T2-FLAIR錯配征時,傳統(tǒng)的放射學(xué)鑒別少突膠質(zhì)膠質(zhì)瘤和星形細胞瘤的效果有限。
影像組學(xué)作為一種高通量方法,可以預(yù)測腫瘤表型、基因組學(xué)和生存水平。已有研究使用影像組學(xué)模型預(yù)測1p/19q狀態(tài)[7-11],但是采用單一序列或者缺少功能序列,組學(xué)信息較少,而且構(gòu)建機器學(xué)習(xí)模型類型單一,尚未進行不同機器學(xué)習(xí)模型診斷效能的比較。本研究主要目的是構(gòu)建基于多模態(tài)MRI的影像組學(xué)模型來預(yù)測1p/19q共缺失狀態(tài),并且建立多個組學(xué)模型進行比較,同時與影像醫(yī)師診斷效能作比較。
本研究通過南方醫(yī)科大學(xué)珠江醫(yī)院倫理委員會批準(批件號:2020-KY-058-01)。收集從2015年10月~2022年9月本院292例接受手術(shù)并且病理證實為彌漫性較低級別膠質(zhì)瘤患者的資料,包括患者年齡、性別、腫瘤位置、MRI圖像以及病理資料。納入標準:患者年齡≥18 歲;病理證實為Ⅱ或Ⅲ級膠質(zhì)瘤;均經(jīng)過FISH檢測1p/19q狀態(tài);MR檢查前未接受過放療和化療;排除標準:T1WI、T2WI、FLAIR、對比增強T1WI(CET1WI)、DWI序列不完整或缺失;圖像質(zhì)量較差;曾經(jīng)接受過放化療和復(fù)發(fā)的膠質(zhì)瘤患者。最終本研究共納入已知1p/19q狀態(tài)的彌漫性較低級別膠質(zhì)瘤104例患者,其中Ⅱ級膠質(zhì)瘤70例,Ⅲ級膠質(zhì)瘤34例,年齡為42.7±12.5歲(18~75歲),男性60例。
在3.0T Philip MR掃描儀上進行顱腦MRI掃描,包括Achieva、Ingenia和Ingenia Eltion X(Philips Medical System,Best,The Netherlands)。本研究流程圖見圖1。
圖1 本研究的影像組學(xué)流程圖Fig.1 Radiomics workflow of the study.
使用SPM 12 軟件將T1WI、FLAIR、CE-T1WI 和DWI 序列配準到T2WI 序列中(https://www.fil.ion.ucl.ac.uk/spm/software/spm12/)。一位影像醫(yī)師(具有3年神經(jīng)腫瘤影像學(xué)診斷經(jīng)驗)使用ITK-SNAP軟件(www.ITK-SNAP.org)手動描繪了三維感興趣體積(VOI)。主要根據(jù)FLAIR 序列描繪腫瘤邊緣,然后使用T2WI 和CE-T1WI序列交叉檢查腫瘤邊緣的精細程度,并去除了腫瘤內(nèi)壞死、囊變和出血部分,另一位影像醫(yī)師(具有8年神經(jīng)腫瘤影像學(xué)診斷經(jīng)驗)隨機選擇了30例患者的MR數(shù)據(jù),并對腫瘤區(qū)域進行了勾畫,對ROI勾畫不一致的進行討論,最終意見達成一致。兩位影像醫(yī)師對患者的臨床特征和腫瘤分子狀態(tài)并不知情。
使用FAE軟件(0.5.3 version)從MRI圖像的VOI中提取影像組學(xué)特征[12]。對所有體素進行重新采樣后,提取特征,包括:(1)70個基于形狀的特征;(2)90個一階統(tǒng)計量;(3)120個灰度共生矩陣(GLCM);(4)80個灰度大小區(qū)域(GLSZM);(5)80 個灰級游程長度矩陣(GLRLM);(6)25個相鄰灰度差矩陣(NGTDM);(7)70個灰度相關(guān)性矩陣(GLDM),從多參數(shù)MRI 中提取535個特征,包括T2WI、T1WI、FLAIR、CE-T1WI和DWI序列。
在FAE軟件中刪除無效的特征和病例。104例患者根據(jù)其臨床特征(年齡和性別)按照7:3的比例分成訓(xùn)練集和驗證集。
為了消除不相關(guān)和冗余的特征并且避免數(shù)據(jù)的過度擬合,挖掘特征是一個必要的過程。在特征選擇之前,使用上采樣來消除訓(xùn)練集和驗證集的不平衡。我們在特征矩陣上應(yīng)用了Z分數(shù)和均值歸一化。由于特征空間的維數(shù)很高,我們比較了每個特征對的相似度。如果特征對的PCC值大于0.990,刪除其中一個特征。遞歸特征消除(RFE)、方差分析(ANOVA)、KW和Relief用于特征選擇,特征選擇數(shù)量范圍為0~21。使用邏輯回歸(LR)、支持向量機(SVM)、基于邏輯回歸的最小絕對收縮和選擇算子(LRlasso)和線性判別分析(LDA)作為分類器來構(gòu)建模型。最后,為了確定模型的超參數(shù)(例如特征數(shù)量),對訓(xùn)練集進行10折交叉驗證。
一名住院醫(yī)師(在神經(jīng)腫瘤影像學(xué)方面具有3年診斷經(jīng)驗)和一名主治醫(yī)師(在神經(jīng)腫瘤影像學(xué)方面具有7年診斷經(jīng)驗)根據(jù)T2WI、T1WI、FLAIR、CE-T1WI和DWI圖像來對彌漫性較低級別膠質(zhì)瘤患者1p/19q共缺失狀態(tài)進行預(yù)測,主要觀察腫瘤是否出現(xiàn)鈣化、位置深淺和T2-FLAIR錯配征。影像組學(xué)模型和影像醫(yī)師獲得圖像信息是相同的,對患者的臨床特征和分子狀態(tài)都不知情。影像醫(yī)師使用5分法來預(yù)測1p/19q共缺失狀態(tài)。1分(可信度:0%~20%),2分(可信度:20%~40%),3分(可信度:40%~60%),4分(可信度:60%~80%:,5分(可信度:80%~100%)。
本研究使用SPSS 27.0 和MedCalc 20.1.4軟件進行統(tǒng)計分析,所有連續(xù)變量表示為均數(shù)±標準差,分類變量表示為計數(shù)(百分比)。采用Shapiro-Wilk檢驗對連續(xù)變量進行正態(tài)檢驗,符合正態(tài)分布的連續(xù)變量采用兩獨立樣本t檢驗,否則采用Mann-Whitney檢驗。分類變量采用卡方檢驗。使用受試者工作特性曲線下面積(AUC)來評估影像組學(xué)模型和影像醫(yī)師的預(yù)測效能。不同影像組學(xué)模型和醫(yī)生的AUC值對比采用DeLong檢驗。P<0.05(雙側(cè))為差異具有統(tǒng)計學(xué)意義。
訓(xùn)練集包括73例患者,驗證集包括31例患者。訓(xùn)練集和驗證集在年齡、性別、組織學(xué)分型和WHO分級方面的分布差異無統(tǒng)計學(xué)意義(P>0.05,表1)。
表1 訓(xùn)練集和驗證集描述Tab.1 Description of the training and validation datasets
從T2WI、T1WI、FLAIR、CE-T1WI和DWI圖像中共提取535個特征。應(yīng)用10折交叉驗證,選擇8個特征構(gòu)建最優(yōu)的4個模型(表2),LR模型訓(xùn)練集和驗證集的AUC為0.923和0.833,LRlasso模型訓(xùn)練集和驗證集的AUC 為0.915 和0.819,SVM 模型訓(xùn)練集和驗證集的AUC達到0.920和0.824,LDA模型訓(xùn)練集和驗證集的AUC達到0.912和0.819。這4組模型的驗證集AUC值比較接近(P>0.1,表3、4)。
表2 8個特征構(gòu)建LR、LRlasso、SVM、LDA影像組學(xué)模型Tab.2 Eight features for constructing the LR,LRlasso,SVM,and LDAmodels
表3 4組影像組學(xué)模型在訓(xùn)練集的分類性能Tab.3 Classification performance of the 4 radiomics models on the training dataset
表4 4組影像組學(xué)模型在驗證集的分類性能Tab.4 Classification performance of the 4 radiomics models on the validation dataset
影像科住院醫(yī)師的AUC=0.645(95%CI: 0.441~0.849)低于4 組影像組學(xué)模型(AUC=0.833、0.819、0.824、0.819;P=0.011,0.022,0.016,0.030),但是影像科主治醫(yī)師的AUC=0.838(95%CI:0.692-0.985)稍高于4組影像組學(xué)模型(P>0.05,圖2)。
圖2 LR、LRlasso、SVM和LDA模型以及影像醫(yī)師的ROC曲線分析Fig.2 ROC curve analysis of the prediction results by LR,LRlasso,SVM,and LDA models and by the neuroradiologists.
本研究從T2WI、T1WI、FLAIR、CE-T1WI和DWI圖像中提取影像組學(xué)特征,并且構(gòu)建了LR、LRlasso、SVM、LDA 4個影像組學(xué)模型用于預(yù)測較低級別膠質(zhì)瘤1p/19q的共缺失狀態(tài)。研究結(jié)果顯示LR、LRlasso、SVM和LDA模型的AUC分別為0.833、0.819、0.824和0.819,但這4組模型之間的診斷效能差異無統(tǒng)計學(xué)意義(P均>0.1)。4組影像組學(xué)模型的AUC均高于住院醫(yī)師,但和主治醫(yī)師診斷效能相仿。本研究證明多模態(tài)MRI影像組學(xué)模型可以非侵入性地預(yù)測彌漫性較低級別膠質(zhì)瘤1p/19q共缺失狀態(tài)。
本研究構(gòu)建4組不同的組學(xué)模型,其中篩選特征都相同,可能說明這些特征比較穩(wěn)定。篩選的特征包括從CE-T1WI提取的original_firstorder_Skewness特征,偏度表示腫瘤內(nèi)部體素信號不一致,有研究顯示1p/19q共缺失膠質(zhì)瘤更容易發(fā)生囊變、水腫和鈣化等[13,14],所以腫瘤內(nèi)部信號差異較大,即偏度相對越大。從T1WI序列中提取original_ngtdm_Busyness 特征,Busyness 稱為繁忙度,是像素到相鄰區(qū)域變化的度量,與腫瘤內(nèi)部信號不均勻有關(guān)。
1p/19q是膠質(zhì)瘤最重要的分子之一,1p/19q共缺失不僅可以識別少突膠質(zhì)細胞瘤,而且對化療敏感。除了對輔助治療敏感外,1p/19q也是指導(dǎo)手術(shù)切除的重要分子。有研究發(fā)現(xiàn),星形細胞瘤的全部切除有利于患者的預(yù)后,但是對少突膠質(zhì)細胞瘤的患者沒有受益[15]。據(jù)報道,全切和非全切對IDH突變和1p/19q共缺失型WHOⅢ級膠質(zhì)瘤患者的預(yù)后無差異,但是對IDH突變和1p/19q非共缺失膠質(zhì)瘤患者有顯著影響[16]。因此,識別1p/19q狀態(tài)對于外科醫(yī)師選擇手術(shù)方式非常重要。目前在臨床中,主要通過手術(shù)或者穿刺這種侵入性方式來識別1p/19q共缺失狀態(tài),非侵入性地預(yù)測1p/19q共缺失狀態(tài)仍然是一項挑戰(zhàn)。
有研究發(fā)現(xiàn)當T2-FLAIR錯配比例大于50%時可以非常準確地預(yù)測1p/19q非共缺失(特異度為100%),而腫瘤內(nèi)部出現(xiàn)鈣化可以高度預(yù)測1p/19q共缺失(特異度為97%)[17]。在臨床中有些患者缺少CT資料,所以腫瘤內(nèi)部的鈣化有時并不容易判斷,同時T2-FLAIR錯配癥和鈣化的敏感度較低(敏感度分別為37%和29%),且這項研究樣本量較小,所以我們并不能完全依賴這些特征來預(yù)測1p/19q的狀態(tài)。Yang等[18]發(fā)現(xiàn)使用常規(guī)序列和先進的功能序列(DWI、SWI、DSC-PWI)可以預(yù)測膠質(zhì)瘤1p/19q共缺失狀態(tài),當把所有常規(guī)序列和功能序列結(jié)合預(yù)測1p/19q共缺失狀態(tài)時,其敏感度、特異度和AUC分別為80.36%、78.57%、0.88。有研究顯示使用功能序列DWI、PWI和MRS雖然可以預(yù)測腫瘤的分級[19],但是無法區(qū)分1p/19q的狀態(tài)。
影像組學(xué)由于其無創(chuàng)性和重復(fù)性強等特點,被用來預(yù)測腫瘤分級、分子分型以及預(yù)后。影像組學(xué)可以識別我們?nèi)庋蹮o法識別的特征,而這些特征與腫瘤異質(zhì)性有一定的相關(guān)性。較多學(xué)者使用常規(guī)MRI序列的影像組學(xué)模型來預(yù)測1p/19q共缺失狀態(tài),但是使用較先進功能序列的影像組學(xué)模型來預(yù)測1p/19q共缺失的研究相對較少[20-23]。有研究發(fā)現(xiàn)DWI可以非侵入性地反映腫瘤細胞和細胞外空間[24],且有研究認為1p/19q共缺失膠質(zhì)瘤比1p/19q非共缺失膠質(zhì)瘤強化比例更高[25,26],因此,我們最終選擇將CE-T1WI、DWI與其他常規(guī)序列結(jié)合來預(yù)測較低級別膠質(zhì)瘤1p/19q共缺失狀態(tài),并和影像醫(yī)師的診斷效能做比較。
有研究使用基于T2WI序列的影像組學(xué)模型預(yù)測1p/19q 共缺失,顯示AUC 為0.760(0.663~0.857)[8]。Sun等[7]使用1.5T和3T磁共振獲取常規(guī)MRI和DWI圖像,提取MRI影像組學(xué)特征后,構(gòu)建隨機森林(RF)模型來預(yù)測1p/19q共缺失狀態(tài),AUC值為0.7579。相比之下,本研究構(gòu)建的4 組影像組學(xué)模型(AUC=0.833、0.819、0.824、0.819)診斷效能更優(yōu),可能原因是:(1)使用多模態(tài)磁共振圖像;(2)勾畫三維ROI;(3)RF不是最優(yōu)模型;(4)MRI磁場強度不一致。有研究提取T2WI和CE-T1WI 圖像中特征,在構(gòu)建的7 組影像組學(xué)模型(Adaptive boosting、k-nearest neighbours、stochastic gradient descent、RF、SVM、Naive Bayes、Neural network),AUC范圍為0.7179~0.869[23]。本研究4個組學(xué)模型的AUC 比Adaptive boosting,k-nearest neighbours、stochastic gradient descent 模型較高,與RF、SVM、Naive Bayes和Neural network模型相仿,可能原因是:(1)我們使用了多模態(tài)的MRI序列;(2)可能Adaptive boosting、k-nearest neighbours 和stochastic gradient descent并不是最優(yōu)模型。此外,我們將影像醫(yī)師的預(yù)測性能和影像組學(xué)模型進行了比較,發(fā)現(xiàn)4個影像組學(xué)模型預(yù)測1p/19q共缺失的診斷效能高于住院醫(yī)師,而且達到了主治醫(yī)師的診斷級別。
本研究仍有一定的局限性:首先,樣本量較少,未來將收集更多樣本并使用深度學(xué)習(xí)方法來預(yù)測膠質(zhì)瘤的分子狀態(tài)。其次,這是一項單中心研究,沒有使用外部數(shù)據(jù)來驗證模型有效性和重復(fù)性,未來需與其他中心合作。第三,本研究使用常規(guī)序列和DWI序列來預(yù)測1p/19q共缺失,計劃應(yīng)用一些其他的功能MRI序列,比如灌注加權(quán)成像、磁共振波譜、酰胺質(zhì)子轉(zhuǎn)移加權(quán)、擴散張量成像等,這些序列其與腫瘤的微觀結(jié)構(gòu)相關(guān)。第四,1p/19q非共缺失和共缺失的彌漫性較低級別膠質(zhì)瘤患者比例不均衡。
綜上所述,基于多模態(tài)MRI(T2WI、T1WI、FLAIR、CE-T1WI、DWI)的影像組學(xué)模型可以在術(shù)前無創(chuàng)性地預(yù)測彌漫性較低級別膠質(zhì)瘤1p/19q共缺失狀態(tài),對患者進行個性化治療提供可靠依據(jù)。本研究4個影像組學(xué)模型的診斷效能高于住院醫(yī)師,并且達到了主治醫(yī)師的診斷級別,將有助于臨床醫(yī)生提高診斷及預(yù)測效能,輔助臨床決策。