翟天童,尹平,孫超,洪楠
北京大學(xué)人民醫(yī)院放射科,北京 100044;*通信作者 洪楠 hongnan@pkuph.edu.cn
骨巨細(xì)胞瘤約占原發(fā)骨腫瘤的15%[1],可發(fā)生惡變。2020年世界衛(wèi)生組織骨與軟組織腫瘤分類中,將骨巨細(xì)胞瘤歸類為交界性腫瘤[2]。骨巨細(xì)胞瘤的治療方式以手術(shù)為主,包括病灶內(nèi)刮除、廣泛切除以及聯(lián)合放療等。術(shù)前預(yù)測骨巨細(xì)胞瘤的復(fù)發(fā)幾率有助于對不同復(fù)發(fā)風(fēng)險(xiǎn)患者給出更合理的治療建議[3]。
影像組學(xué)是將保存有腫瘤病理生理及基因表達(dá)信息的數(shù)字醫(yī)學(xué)圖像轉(zhuǎn)換為高維數(shù)據(jù),從醫(yī)學(xué)圖像中提取和篩選大量的定量數(shù)據(jù),用以構(gòu)建預(yù)測性模型,協(xié)助診斷、療效評估,腫瘤分級、預(yù)后、預(yù)測治療反應(yīng)及術(shù)后復(fù)發(fā)等[4]。本研究擬建立一個(gè)基于術(shù)前CT圖像影像特征的組學(xué)模型,預(yù)測骨巨細(xì)胞瘤3年內(nèi)的復(fù)發(fā)風(fēng)險(xiǎn)。
1.1 研究對象 回顧性收集2007年2月—2018年5月北京大學(xué)人民醫(yī)院經(jīng)病理證實(shí)的95例骨巨細(xì)胞瘤患者,通過查詢患者就診記錄及電話隨訪獲取非本地復(fù)查患者的影像學(xué)檢查結(jié)果,證實(shí)患者自發(fā)病以來3年有/無復(fù)發(fā)。按3∶1將患者隨機(jī)分為訓(xùn)練組71例和測試組24例。納入標(biāo)準(zhǔn):①采集樣本均為我院手術(shù)病理證實(shí)的骨巨細(xì)胞瘤患者;②每例患者術(shù)前在我院行CT檢查,并選用最初的CT圖像序列進(jìn)行圖像分割及數(shù)據(jù)分析;③隨訪3年及以上。排除標(biāo)準(zhǔn):①患者3年內(nèi)因其他原因死亡或失訪;②術(shù)前CT檢查存在手術(shù)治療、聯(lián)合治療后(如地諾單抗)等干擾因素。本研究經(jīng)本院醫(yī)學(xué)科學(xué)研究倫理委員會(huì)批準(zhǔn)(審批號:2020PHB293-01),豁免患者知情同意。
1.2 儀器與方法 所有患者術(shù)前均行CT檢查,使用儀器:Philips Brilliance iCT 256層螺旋CT,管電壓100/120 kVp,有效管電流由程序設(shè)置根據(jù)患者體型自動(dòng)選擇,范圍約100~500 mA,層厚1 mm;GE Lightspeed VCT 64層螺旋CT,管電壓100/120 kVp,有效管電流由程序設(shè)置根據(jù)患者體型自動(dòng)選擇,范圍約100~500 mA,層厚1 mm;均采用骨及軟組織算法重建。
1.3 感興趣區(qū)(ROI)分割 本研究納入樣本采用2種不同的CT設(shè)備,首先對圖像進(jìn)行重新采樣及灰度標(biāo)準(zhǔn)化的預(yù)處理工作,然后由2名具有10年閱片經(jīng)驗(yàn)的醫(yī)師使用ITK-snap 3.8(www.itksnap.org)進(jìn)行逐層手動(dòng)分割。首先隨機(jī)抽取20例患者,分別由2名醫(yī)師同時(shí)進(jìn)行ROI分割,根據(jù)這20例CT提取的特征計(jì)算觀察者組內(nèi)相關(guān)系數(shù)(ICC),ICC>0.8為一致性良好。通過一致性檢驗(yàn)后,由醫(yī)師1對剩余75例CT進(jìn)行勾畫。以上圖像分割過程均由1名具有20年以上診斷經(jīng)驗(yàn)的放射科醫(yī)師指導(dǎo)進(jìn)行。
1.4 影像組學(xué)特征提取、篩選與影像組學(xué)模型建立及評估 設(shè)備1采集圖像39例,設(shè)備2采集圖像56例。劉濤等[5]研究表明體素大小對CT影像組學(xué)特征有很大影響,因此圖像預(yù)處理工作是保證特征穩(wěn)定性的良好方法。采用MITKwokbench平臺(GE)進(jìn)行圖像預(yù)處理工作并提取影像組學(xué)特征。使用Launch IPMs軟件(GE)對全部提取的組學(xué)特征進(jìn)行篩選及模型建立。為避免影像組學(xué)標(biāo)簽過擬合,采用下列算法進(jìn)行特征降維:首先篩選出ICC>0.8的可復(fù)性高的組學(xué)特征,納入Spearman相關(guān)分析算法進(jìn)行初次降維;其次選擇最小絕對收縮與選擇算子(least absolute shrinkage and selection operator,LASSO)方法及梯度提升迭代決策樹(gradient boosting decision tree,GBDT)進(jìn)行再次降維。將最終篩選出的影像組學(xué)特征,計(jì)算影像組學(xué)特征系數(shù)。使用邏輯回歸(logistic regression,LR)及隨機(jī)森林(random forests,RF)建立預(yù)測模型,得出受試者工作特征(ROC)曲線下面積(AUC)和準(zhǔn)確度評價(jià)模型的效能;運(yùn)用測試組患者的數(shù)據(jù)對預(yù)測模型進(jìn)行驗(yàn)證。
1.5 統(tǒng)計(jì)學(xué)方法 采用SPSS 17.0軟件,正態(tài)分布的計(jì)量資料以±s表示,組間比較采用獨(dú)立樣本t檢驗(yàn);非正態(tài)分布的計(jì)量資料用M(Q1,Q3)表示。計(jì)數(shù)資料以例(%)表示,采用χ2檢驗(yàn)。用Spearman相關(guān)分析計(jì)算特征與特征之間的相關(guān)系數(shù)。采用ICC評價(jià)2位醫(yī)師手動(dòng)勾畫ROI的一致性;繪制ROC曲線對模型的效能進(jìn)行評估,并計(jì)算AUC、準(zhǔn)確度、敏感度和特異度。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 患者病例資料 95例骨巨細(xì)胞瘤患者中,男46例,女49例;年齡15~75歲,中位年齡32(25,42)歲。發(fā)病部位:脊柱7例,骨盆含骶骨36例,四肢長骨48例,肋骨1例,鼻竇1例,距骨1例,骰骨1例。復(fù)發(fā)27例,無復(fù)發(fā)68例。95例中,采取病變刮除11例,廣泛/根治切除84例。復(fù)發(fā)與無復(fù)發(fā)患者性別、發(fā)病部位差異有統(tǒng)計(jì)學(xué)意義(χ2=3.931、10.780,P<0.05)。
2.2 影像組學(xué)特征提取及篩選 2位醫(yī)師手動(dòng)勾畫的ROI的ICC為0.8~0.9,使用醫(yī)學(xué)影像交互包,導(dǎo)入95例CT的原始圖像及對應(yīng)的ROI文件進(jìn)行特征提取,共提取出1 316個(gè)影像組學(xué)特征。首先用Spearman相關(guān)性分析方法計(jì)算特征與特征之間的相關(guān)系數(shù),篩選條件為0.7,經(jīng)第1次篩選得到160個(gè)影像組學(xué)特征。采用LASSO算法進(jìn)行2次篩選,保留34個(gè)重要特征;最終通過GBDT算法對所獲特征進(jìn)行最終篩選,共獲得12個(gè)影像組學(xué)特征,包括2大類,3個(gè)一階特征,9個(gè)灰度相關(guān)特征(表1、圖1)。
圖1 影像組學(xué)特征篩選流程。訓(xùn)練組(A)及測試組(B)通過相關(guān)性分析算法進(jìn)行特征降維的熱圖,圖中顯示所篩特征的相關(guān)性強(qiáng)弱;經(jīng)LASSO模型算法進(jìn)行再次降維的路徑圖(C)與均方誤差(D),在最佳a(bǔ)lpha值0.031時(shí)篩取34個(gè)特征;訓(xùn)練組(E)及測試組(F)經(jīng)GBDT算法進(jìn)行特征降維的熱圖
表1 篩選后用于建模的組學(xué)特征
2.3 模型結(jié)果對比 本研究結(jié)果顯示,訓(xùn)練組中,LR的AUC為0.962,準(zhǔn)確度為0.892;測試組中,LR的AUC為0.924,準(zhǔn)確度為0.824,見表2。
表2 影像組學(xué)模型結(jié)果
在傳統(tǒng)影像學(xué)與影像組學(xué)研究中,骨巨細(xì)胞瘤的診斷和鑒別診斷已有成熟的體系,但關(guān)于預(yù)測術(shù)后復(fù)發(fā)的研究較少。本研究基于CT影像學(xué)標(biāo)簽建立了獨(dú)立的預(yù)測模型,如果可以預(yù)測腫瘤的復(fù)發(fā)概率,將有助于選擇最優(yōu)治療及隨訪方案。
3.1 影像組學(xué)概述 影像組學(xué)可以通過不同信號強(qiáng)度的成像體素的空間排列評估腫瘤的異質(zhì)性,從而產(chǎn)生定量信息,用于協(xié)助腫瘤的診斷和治療[6]。近年對影像組學(xué)在臨床中應(yīng)用的研究非常廣泛。夏婷等[7]通過提取術(shù)前動(dòng)態(tài)增強(qiáng)CT圖像的影像組學(xué)特征并構(gòu)建了關(guān)于腫瘤病理分級的預(yù)測模型,效能良好。梁翠珊等[8]構(gòu)建術(shù)前影像組學(xué)模型預(yù)測結(jié)直腸癌的淋巴血管侵犯具有較好的效能,并且結(jié)合臨床因子后使得組學(xué)模型的效能進(jìn)一步提升。上述研究表明通過影像組學(xué)構(gòu)建模型無論是獨(dú)立應(yīng)用或與臨床結(jié)合,均有深遠(yuǎn)的探索意義。但通過影像組學(xué)預(yù)測骨巨細(xì)胞瘤復(fù)發(fā)的研究鮮有報(bào)道。由此可見通過影像組學(xué)預(yù)測骨巨細(xì)胞瘤的復(fù)發(fā)具有一定的臨床需求,且具有可行性。盡管各地區(qū)的CT設(shè)備及掃描技術(shù)很難完全一致,導(dǎo)致各地區(qū)掃描圖像中存在技術(shù)相關(guān)的異質(zhì)性(噪聲和偽影)[9],但部分研究發(fā)現(xiàn)在CT紋理特征具有較高異質(zhì)性的前提下,基于CT的放射組學(xué)分析的差異性不大[10-12]。Yin等[13]對骨盆軟骨肉瘤進(jìn)行影像組學(xué)回顧性研究,結(jié)果證實(shí)基于mpMRI影像組學(xué)特征在預(yù)測骨盆軟骨肉瘤早期復(fù)發(fā)方面具有良好的表現(xiàn);Wang等[3]的研究顯示基于CT影像組學(xué)特征預(yù)測脊柱骨巨細(xì)胞瘤的早期復(fù)發(fā)具有良好的表現(xiàn)。
3.2 影像組學(xué)特征分析 從篩選的幾個(gè)特征中,一階直方圖特征包含均值和偏度,反映了圖像的異質(zhì)性。而紋理特征則包含了灰度尺寸區(qū)域矩陣(GLSZM)、灰度共生矩陣(GLCM)、灰度級運(yùn)行長度矩陣(GLRLM)、灰度依賴性矩陣(GLDM)。從定義來看,GLDM量化了圖像中的灰度依賴性,它定義為依賴于中心體素的特定距離內(nèi)連接體素的數(shù)量。GLSZM量化了圖像中的灰度區(qū)域,定義為具有相同灰度強(qiáng)度的連接體素的數(shù)量。GLCM是高級紋理特征,是建立在預(yù)估圖像的二階組合條件概率密度基礎(chǔ)上的方法。GLRLM是基于GLCM某一像素值沿某一方向游行的長度所組成的矩陣[14]。上述紋理分析的一個(gè)缺點(diǎn)是特征的提取僅能依賴計(jì)算機(jī)算法。盡管如此,腫瘤的紋理可以顯示腫瘤的異質(zhì)性,這與腫瘤潛在的生物學(xué)行為相關(guān),而影像組學(xué)分析則或許可以提供這一相關(guān)性的線索。
3.3 影像組學(xué)模型效能 本研究采用LR及RF模型。影像組學(xué)在腫瘤復(fù)發(fā)和預(yù)測研究中已經(jīng)有很多研究,并通過不同的模型分別驗(yàn)證了影像組學(xué)特征的效能。既往研究顯示LR和RF模型對于小樣本數(shù)據(jù)有很好的穩(wěn)定性和準(zhǔn)確性,并且得到廣泛應(yīng)用[15-16]。但RF存在一定的過擬合問題。Yin等[15]通過術(shù)前影像組學(xué)特征、預(yù)測骨盆腫瘤的良惡性研究中,對比了多種模型的效能,結(jié)果顯示LR的結(jié)果更優(yōu)于RF。目前使用影像組學(xué)預(yù)測腫瘤復(fù)發(fā)的研究較為廣泛,但針對骨巨細(xì)胞瘤的研究較少[3]。盡管Wang等[3]的研究顯示影像組學(xué)預(yù)測脊柱骨巨細(xì)胞瘤的早期復(fù)發(fā)具有良好的表現(xiàn),但樣本量較小,僅62例,并且僅使用支持向量機(jī)模型預(yù)測研究結(jié)果。既往基于CT影像組學(xué)的研究在肺癌與甲狀腺癌的鑒別中構(gòu)建了RF、LR和支持向量機(jī)3種模型,結(jié)果顯示支持向量機(jī)的模型效能較其他兩者稍差,而RF的模型效能最優(yōu)[17-18]。本研究使用并對比了LR和RF模型,均具有很好的結(jié)果,進(jìn)一步驗(yàn)證了影像組學(xué)評估預(yù)測骨巨細(xì)胞瘤具有很好的效能,有望為臨床盡早制訂個(gè)體化治療方案提供幫助。
3.4 本研究的局限性 首先,本研究納入樣本量較小。其次,該隊(duì)列患者中,由于發(fā)病部位不同,導(dǎo)致治療方法與手術(shù)選擇不同。本研究95例患者中,11例行病灶刮除,84例行根治性切除術(shù),術(shù)式不同和術(shù)者的不同可能是一個(gè)比較重要的干擾因素。盡管有研究顯示基于Ki-67[19]、RANK/RANKL/OPG[20]、IMP3/IGF2[21]、P53[22]等分子生物學(xué)標(biāo)志物檢查,有助于預(yù)測骨巨細(xì)胞瘤的復(fù)發(fā)風(fēng)險(xiǎn),并表示骨巨細(xì)胞瘤術(shù)后復(fù)發(fā)并不能完全歸因于手術(shù)過程的不完整切除,后續(xù)研究將擴(kuò)大樣本量并按照發(fā)病部位、術(shù)式進(jìn)行分類研究。第三,本研究僅分析了術(shù)前CT平掃圖像,并未采集CT增強(qiáng)及MR的圖像。一方面,胡奎等[23]研究認(rèn)為碘對比劑強(qiáng)化程度在一定范圍內(nèi),對CT組學(xué)的影像特征穩(wěn)定性產(chǎn)生影響。本研究為避免更多的干擾因素,選擇CT平掃圖像進(jìn)行數(shù)據(jù)提取。另一方面,樣本中并非每一例患者均有增強(qiáng)CT圖像資料。為保證樣本量的完整性,選擇了基數(shù)更大的CT平掃圖像。Yin等[16]的研究中描述了基于MR T1WI、T2WI及表觀擴(kuò)散系數(shù)3個(gè)序列建立預(yù)測骨盆軟骨肉瘤早期復(fù)發(fā)模型具有很好的表現(xiàn),在結(jié)合臨床特征后該模型的效能明顯提升;也闡明了應(yīng)用影像組學(xué)特征鑒別骶骨脊索瘤和骨巨細(xì)胞瘤具有良好的表現(xiàn),結(jié)合臨床特征后該模型效能亦得到很高的提升[24]。與前者研究相比,本研究樣本量較小,且添加的臨床標(biāo)簽不夠充分(僅包括年齡、性別、發(fā)病部位),很多已經(jīng)得到證實(shí)的臨床特征因素在組學(xué)特征降維過程中被篩除,最終保留的穩(wěn)定特征僅包含影像組學(xué)特征,導(dǎo)致結(jié)果并未提示臨床標(biāo)簽對組學(xué)模型有優(yōu)化作用。
總之,本研究對影像組學(xué)特征進(jìn)行定量分析,探討基于術(shù)前CT影像組學(xué)模型預(yù)測骨巨細(xì)胞瘤術(shù)后復(fù)發(fā)的可行性。研究結(jié)果表明基于術(shù)前CT圖像提取的影像組學(xué)特征預(yù)測骨巨細(xì)胞瘤復(fù)發(fā)具有良好的效能。這將有助于制訂個(gè)性化的診療策略與隨訪方案,給予臨床更合理的治療建議。