王浩入,陳 欣,劉 歡,余春霖,何 玲
1重慶醫(yī)科大學(xué)附屬兒童醫(yī)院放射科,國(guó)家兒童健康與疾病臨床醫(yī)學(xué)研究中心,兒童發(fā)育疾病研究教育部重點(diǎn)實(shí)驗(yàn)室,兒科學(xué)重慶市重點(diǎn)實(shí)驗(yàn)室,重慶 400014;2通用電氣藥業(yè)有限公司,精準(zhǔn)醫(yī)學(xué)研究院,上海201203
外周神經(jīng)母細(xì)胞性腫瘤是兒童最常見的顱外實(shí)體性腫瘤,通常包括神經(jīng)母細(xì)胞瘤(NB)、節(jié)細(xì)胞神經(jīng)母細(xì)胞瘤(GNB)和節(jié)細(xì)胞神經(jīng)瘤(GN),好發(fā)于腹膜后[1-2]。NB和GNB具有相似的年齡分布、臨床表現(xiàn)和生化指標(biāo),但惡性程度不同,GNB預(yù)后相對(duì)較好,臨床上較難區(qū)分兩者[3]。CT是評(píng)價(jià)兒童腹膜后外周神經(jīng)母細(xì)胞性腫瘤的重要檢查手段[4],但基于病灶形態(tài)、跨越中線、鈣化和強(qiáng)化情況等常規(guī)影像學(xué)表現(xiàn)對(duì)鑒別腹膜后NB和GNB的價(jià)值有限[5-7]。近年來(lái),基于腫瘤病灶感興趣區(qū)的影像組學(xué)分析通過提取影像學(xué)圖像中肉眼無(wú)法捕捉的潛在異質(zhì)性信息,計(jì)算一階、二階以及經(jīng)濾波器轉(zhuǎn)換后的高階特征,進(jìn)而對(duì)腫瘤像素分布情況進(jìn)行挖掘和分析,有助于定量、準(zhǔn)確和客觀的用于腫瘤診斷和分級(jí)等[8-9]。CT影像組學(xué)廣泛應(yīng)用于成人腫瘤,在兒童腫瘤中的報(bào)道較少[10]。研究曾利用CT影像組學(xué)鑒別兒童盆腔橫紋肌肉瘤和卵黃囊瘤[11]。但目前尚未見到CT影像組學(xué)用于鑒別兒童腹膜后NB和GNB的報(bào)道。本研究通過分析兒童腹膜后NB和GNB的平掃和增強(qiáng)CT的影像組學(xué)特征,研究基于平掃和增強(qiáng)CT的影像組學(xué)分析在兒童腹膜后NB和GNB鑒別診斷中的價(jià)值。
回顧性收集2012年5月~2020年8月于我院行CT檢查且經(jīng)穿刺或手術(shù)病理證實(shí)的220例腹膜后NB和GNB患兒的臨床和影像資料。納入標(biāo)準(zhǔn):(1)初診患兒,未接受放化療或手術(shù)治療;(2)經(jīng)病理證實(shí)為腹膜后NB或GNB;(3)CT影像資料完整且圖像清晰,包含平掃期(NP)、動(dòng)脈期(AP)和靜脈期(VP)。排除標(biāo)準(zhǔn):(1)就診前已接受放化療或手術(shù)治療;(2)經(jīng)病理診斷證實(shí)為其他病理類型腫瘤;(3)圖像質(zhì)量不佳影響進(jìn)一步分析者。220例患兒中,NB患兒172例,GNB患兒48例。NB患兒中,男98例,女74例,年齡1月~13歲,平均2.6歲;GNB患兒中,男20例,女28例,年齡6月~10歲(3.8)歲。研究隊(duì)列按7∶3分層隨機(jī)抽樣分為訓(xùn)練集(n=153)和測(cè)試集(n=67)。訓(xùn)練集中NB和GNB分別為120例和33例,測(cè)試集中NB和GNB分別為52例和15例。
患兒于安靜狀態(tài)下檢查,對(duì)不能配合的患兒給予口服10%水合氯醛(0.5 mL/kg)或肌肉注射苯巴比妥鈉針(5 mg/kg)鎮(zhèn)靜。使用GE LightSpeed VCT 64排螺旋CT機(jī)或Philips Brilliance iCT 256排螺旋CT機(jī)掃描。掃描參數(shù):管電壓90~120 kV,管電流自動(dòng)調(diào)節(jié),層厚5.0 mm,部分重建為1.25 mm,螺距0.984∶1。增強(qiáng)掃描經(jīng)前臂靜脈團(tuán)注含碘對(duì)比劑(2 mL/kg體質(zhì)量,2 mL/s),分別在給藥后15~30 s和50~60 s行2期增強(qiáng)掃描。
1.3.1 圖像預(yù)處理和感興趣區(qū)勾畫 從PACS系統(tǒng)中以DICOM格式導(dǎo)出所有患兒的CT平掃期、動(dòng)脈期和靜脈期圖像。在勾畫腫瘤病灶感興趣區(qū)之前,為了減少不同掃描儀及掃描層厚帶來(lái)的差異,使用1 mm×1 mm×1 mm體素重采樣對(duì)圖像進(jìn)行預(yù)處理。本研究使用ITKSNAP(ver.3.4.0)軟件,由兩名放射科醫(yī)師分別在三期軸位圖像上逐層手動(dòng)勾畫腫瘤病灶邊緣(低年資醫(yī)師A勾畫2次,時(shí)間間隔2周;高年資醫(yī)師B勾畫1次),自動(dòng)合成三維感興趣區(qū)。感興趣區(qū)的勾畫包含腫瘤鈣化和壞死區(qū)域,避開重要大血管。
1.3.2 特征提取、篩選及模型建立 將所有圖像和相應(yīng)的感興趣區(qū)導(dǎo)入Artificial Intelligence Kit(A.K)軟件(Version V3.3.0.R,GE Healthcare),分別從平掃期、動(dòng)脈期和靜脈期圖像中自動(dòng)提取影像組學(xué)特征,每期1218個(gè)特征。影像組學(xué)特征包括一階特征、形狀特征及紋理特征。濾波器包括高斯轉(zhuǎn)換(LoG)和小波變換(Wavelet)。首先,為了提高特征的重復(fù)性及魯棒性,對(duì)組內(nèi)及組間勾畫感興趣區(qū)的特征進(jìn)行一致性分析,保留相關(guān)系數(shù)≥0.8的特征。在特征篩選前,對(duì)提取的影像組學(xué)特征進(jìn)行標(biāo)準(zhǔn)化處理,使用中位數(shù)替代異常值或缺失值。采用Mann WhitneyU檢驗(yàn)篩選具有顯著性的特征,采用Spearman相關(guān)分析,舍去Spearman相關(guān)系數(shù)>0.9的特征,降低特征的冗余性。接著,使用梯度增強(qiáng)決策樹(GBDT)進(jìn)一步篩選出最具有預(yù)測(cè)價(jià)值的特征子集。最后,采用多變量邏輯回歸模型,并進(jìn)行5折交叉驗(yàn)證構(gòu)建各期以及三期復(fù)合的影像組學(xué)模型。
本研究采用R 軟件(ver.3.6.1,http://www.rproject.org)進(jìn)行統(tǒng)計(jì)學(xué)分析。在訓(xùn)練集和驗(yàn)證集中均使用受試者工作特征曲線(ROC)評(píng)估模型效能,獲得ROC曲線下面積(AUC)、準(zhǔn)確度、靈敏度及特異性等評(píng)價(jià)指標(biāo)。采用Delong檢驗(yàn)比較訓(xùn)練集中不同模型的效能。P<0.05表示差異具有統(tǒng)計(jì)學(xué)意義。
從平掃期、動(dòng)脈期和靜脈期CT圖像中分別提取了每期1218個(gè)影像組學(xué)特征,經(jīng)過組內(nèi)及組間一致性分析,保留一致性相關(guān)系數(shù)≥0.8的特征后得到每期734個(gè)特征,然后經(jīng)Mann WhitneyU檢驗(yàn)、Spearman相關(guān)分析、GBDT及多變量邏輯回歸,最終篩選出NP模型4個(gè)特征、AP模型3個(gè)特征、VP模型2個(gè)特征以及三期復(fù)合模型5個(gè)特征。經(jīng)多變量邏輯回歸篩選后用于構(gòu)建影像組學(xué)模型的特征見表1?;诟髌贑T圖像建立影像組學(xué)模型的特征在訓(xùn)練集和測(cè)試集中的影像組學(xué)評(píng)分(Rad-score)(圖1)。
圖1 基于各期CT圖像建立影像組學(xué)模型的特征在訓(xùn)練集和測(cè)試集中的影像組學(xué)評(píng)分Fig.1 Rad-score of radiomics models in the training and testing samples based on CT images obtained in each phase.A,C,E,G:Rad-score of training samples in NP,AP,VP and combined models,respectively;B,D,F,H:Rad-score of testing samples in NP,AP,VP and combined models,respectively.The red and blue bars refer to NB and GNB,respectively.
表1 經(jīng)多變量邏輯回歸篩選后用于構(gòu)建影像組學(xué)模型的特征Tab.1 Radiomics features used to construct the radiomics models through multivariate logistic regression model
各期影像組學(xué)模型ROC曲線(圖2)顯示,平掃期模型在訓(xùn)練集中的AUC為0.840[95%CI:0.778~0.902],測(cè)試集中AUC為0.804(95%CI:0.699~0.899)。訓(xùn)練集和測(cè)試集的準(zhǔn)確度、靈敏度及特異性分別為80.4%、69.7%、83.3%和76.1%、46.7%、84.6%。動(dòng)脈期模型在訓(xùn)練集中的AUC為0.819(95%CI:0.759~0.877),測(cè)試集中AUC為0.815(95%CI:0.697~0.915)。訓(xùn)練集和測(cè)試集的準(zhǔn)確度、靈敏度及特異性分別為79.1%、66.7%、82.5%和82.1%、80.0%、82.7%。靜脈期模型在訓(xùn)練集中的AUC 為0.730(95%CI:0.649~0.803),測(cè)試集中AUC為0.751(95%CI:0.619~0.869)。訓(xùn)練集和測(cè)試集的準(zhǔn)確度、靈敏度及特異性分別為58.2%、84.8%、50.8%和32.4%、80.0%、51.9%。三期復(fù)合模型在訓(xùn)練集中的AUC為0.861(95%CI:0.809~0.910),測(cè)試集中AUC為0.827(95%CI:0.726~0.915)。訓(xùn)練集和驗(yàn)證集的準(zhǔn)確度、靈敏度及特異性分別為73.0%、90.9%、69.2%和70.1%、80.0%、67.3%(表2)。Delong檢驗(yàn)顯示單一時(shí)期模型間的效能差異無(wú)統(tǒng)計(jì)學(xué)意義,平掃期、動(dòng)脈期與復(fù)合模型間的效能差異無(wú)統(tǒng)計(jì)學(xué)意義,靜脈期與復(fù)合模型間效能的差異具有統(tǒng)計(jì)學(xué)意義(表3)。
表2 訓(xùn)練集和測(cè)試集中平掃期、動(dòng)脈期、靜脈期以及三期復(fù)合模型的評(píng)價(jià)指標(biāo)Tab.2 Evaluation indexes of NP,AP,VP and Combined models in the training and testing sets
表3 訓(xùn)練集中不同模型效能比較的Delong檢驗(yàn)Tab.3 Delong test among NP,AP,VP and Combined models in the training set
圖2 各期影像組學(xué)模型ROC曲線Fig.2 ROC curves of the radiomics models.A,C,E,G:Training samples;B,D,F,H:Testing samples.
NB和GNB的生物學(xué)行為和臨床特征較復(fù)雜,準(zhǔn)確鑒別兩者有助于指導(dǎo)臨床治療決策[12]。近年來(lái),影像組學(xué)作為一個(gè)新興的研究領(lǐng)域,通過定量分析從標(biāo)準(zhǔn)醫(yī)學(xué)影像學(xué)圖像中高通量提取的高維特征數(shù)據(jù),以獲取其中反映病灶病理生理學(xué)基礎(chǔ)的潛在異質(zhì)性信息,有助于全面、客觀和定量的評(píng)價(jià)病灶的空間和時(shí)間異質(zhì)性[13-14]。影像組學(xué)在兒童中的研究主要集中于后顱窩腫瘤的MRI影像組學(xué)[15-16]。有研究顯示CT影像組學(xué)模型能有效預(yù)測(cè)NB和GNB的MYCN擴(kuò)增狀態(tài)[17]。目前尚未見到CT影像組學(xué)用于鑒別兒童腹膜后NB和GNB的報(bào)道。本研究研究基于平掃和增強(qiáng)CT的影像組學(xué)分析在兒童腹膜后NB和GNB鑒別診斷中的價(jià)值。
在本研究中,病灶感興趣區(qū)的勾畫均為人工手動(dòng)勾畫,為了提高影像組學(xué)特征的可靠性和可重復(fù)性,對(duì)組內(nèi)及組間勾畫感興趣區(qū)的特征進(jìn)行一致性分析,保留了一致性相關(guān)系數(shù)≥0.8的特征。同時(shí),本研究采用了GBDT算法進(jìn)行特征篩選。在以往的影像組學(xué)研究中[11,15,18],影像組學(xué)特征的篩選多采用套索算法、相關(guān)性分析或邏輯回歸等統(tǒng)計(jì)學(xué)方法。GBDT是近年來(lái)發(fā)展起來(lái)的一種廣受贊譽(yù)的算法,是傳統(tǒng)機(jī)器學(xué)習(xí)算法里對(duì)真實(shí)分布擬合最好的算法之一,泛化能力較強(qiáng)[19]。GBDT 的基本原理是在迭代過程中利用一系列的弱預(yù)測(cè)模型不斷減小預(yù)測(cè)值與真實(shí)值之間的誤差,進(jìn)而達(dá)到最終的目標(biāo)任務(wù)[20]。
盡管GBDT算法用于目標(biāo)分類的效果較好,但較少用于影像組學(xué)特征的篩選和降維[21]。在一項(xiàng)旨在評(píng)估18F-脫氧葡萄糖正電子發(fā)射斷層掃描(PET)和CT影像組學(xué)特征結(jié)合機(jī)器學(xué)習(xí)方法來(lái)鑒別原發(fā)性和轉(zhuǎn)移性肺腫瘤病變及組織學(xué)類型的研究中,利用5種特征篩選方法和9種分類器建立了45種影像組學(xué)模型,發(fā)現(xiàn)基于GBDT篩選和建模的影像組學(xué)模型具有最佳的鑒別效能,在PET數(shù)據(jù)集中的AUC為0.98[22]。這表明GBDT算法在該研究中是最佳的特征篩選方法。在其他研究早期肺腺癌和小乳腺癌的影像組學(xué)研究中[23-24],基于
GBDT降維和建模的影像組學(xué)模型也表現(xiàn)出較好的診斷效能。因此,本研究在Mann Whitney U單因素檢驗(yàn)和Spearman相關(guān)分析的基礎(chǔ)上,使用GBDT算法進(jìn)一步篩選出對(duì)鑒別腹膜后NB和GNB最具價(jià)值的特征子集。
在分別從各期CT圖像中提取并篩選的最佳特征子集中,紋理特征明顯優(yōu)于一階特征。一階特征通過直方圖分析,量化單個(gè)體素在感興趣區(qū)內(nèi)的強(qiáng)度分布,如平均值、中位數(shù)、百分位數(shù)、偏度和熵等,然而這些特征無(wú)法體現(xiàn)體素間相對(duì)位置關(guān)系[8]。本研究中的相關(guān)特征包括中位數(shù)和第90百分位數(shù),可能是由于感興趣區(qū)的勾畫包含了腫瘤鈣化和壞死區(qū)域,而其中包含著鑒別NB與GNB的潛在異質(zhì)性信息。紋理特征通過計(jì)算體素間的相對(duì)位置關(guān)系得出,可用于分析二維或三維圖像的結(jié)構(gòu)紋理[8]。研究表明,紋理特征能更好的反映瘤內(nèi)組織解剖的結(jié)構(gòu)紋理差異,在評(píng)價(jià)腫瘤異質(zhì)性、鑒別腫瘤不同病理類型等方面具有較大價(jià)值[11,15,17]。本研究中,每一時(shí)期模型的紋理特征都包含GLDM特征。GLDM記錄了圖像中依賴于中心體素的距離δ內(nèi)的連接體素的數(shù)量。當(dāng)|i?j|≤α?xí)r,認(rèn)為灰度級(jí)別為j的相鄰體素依賴于灰度級(jí)別為i的中心體素[25]。GLDM在表征組織結(jié)構(gòu)一致性等方面具有重要價(jià)值,表明NB和GNB在組織結(jié)構(gòu)均勻性方面存在差異。
在運(yùn)用CT影像組學(xué)鑒別兒童盆腔橫紋肌肉瘤和卵黃囊瘤的研究中[11],平掃期、動(dòng)脈期和靜脈期模型均包含GLSZM紋理特征。GLSZM也稱灰度區(qū)域大小矩陣,記錄了二維圖像區(qū)域中j元素和i元素相鄰的次數(shù),是對(duì)腫瘤區(qū)域灰度不均勻程度的衡量[26],在兒童盆腔橫紋肌肉瘤和卵黃瘤的鑒別診斷中發(fā)揮著重要作用[11],而本研究中GLDM紋理特征有助于鑒別兒童腹膜后NB和GNB,這說明不同類型腫瘤的紋理特征存在差異。同時(shí),本研究中有價(jià)值的絕大部分特征由小波變換和LoG轉(zhuǎn)換而來(lái)。小波變換和LoG都是對(duì)圖像進(jìn)行濾波網(wǎng)格處理的高階統(tǒng)計(jì)方法,前者是在圖像上放置一個(gè)線性或徑向波矩陣,而后者主要用于提取紋理圖案中較粗糙區(qū)域的特征,兩者均有助于揭示病灶中更多肉眼不可見的有價(jià)值的信息[27]。
有研究發(fā)現(xiàn)紋理參數(shù)在縱隔NB和GNB的鑒別診斷中具有較重要的意義[28]。與之不同的是,本研究構(gòu)建了基于平掃期、動(dòng)脈期和靜脈期CT圖像的影像組學(xué)模型,這些模型均有助于鑒別腹膜后NB和GNB。平掃期和動(dòng)脈期模型表現(xiàn)相對(duì)較好,AUC 及準(zhǔn)確度均大于0.7;靜脈期模型相對(duì)較差,其AUC雖然大于0.7,但準(zhǔn)確度僅0.324。動(dòng)脈期模型表現(xiàn)出最佳的效能,在測(cè)試集中,鑒別NB和GNB的AUC(0.815)、準(zhǔn)確度(82.1%)、靈敏度(80.0%)及特異性(82.7%)均較高,可能是由于NB惡性程度較高,其內(nèi)有較多的血竇和血管[5],從動(dòng)脈期圖像中提取的影像組學(xué)特征能更好的反映NB的病理基礎(chǔ),因而有助于鑒別腹膜后NB 和GNB。但Delong檢驗(yàn)顯示,單一時(shí)期模型的鑒別效能無(wú)統(tǒng)計(jì)學(xué)差異,表明基于各時(shí)期圖像的影像組學(xué)模型均能較好的鑒別NB和GNB。有研究利用CT影像組學(xué)鑒別兒童盆腔橫紋肌肉瘤和卵黃囊瘤[11],構(gòu)建的動(dòng)脈期模型較平掃期和靜脈期模型表現(xiàn)好,動(dòng)脈期模型在訓(xùn)練集和測(cè)試集中的AUC 分別為0.973(95%CI:0.913,0.996)和0.800(95%CI:0.422,0.979),其病理基礎(chǔ)可能與瘤內(nèi)新生血管和細(xì)胞浸潤(rùn)有關(guān)。在本研究中,綜合了三期所有特征的復(fù)合模型相較于單一時(shí)期的模型表現(xiàn)出相對(duì)較好的診斷效能,在訓(xùn)練集和測(cè)試集中的AUC分別為0.861(95%CI:0.809~0.910)和0.827(95%CI:0.726~0.915),但復(fù)合模型與平掃期、動(dòng)脈期模型差異無(wú)統(tǒng)計(jì)學(xué)意義,復(fù)合模型的效能優(yōu)于靜脈期模型。在其他運(yùn)用CT影像組學(xué)鑒別腫瘤病理類型的研究中[18,29-30],綜合了不同時(shí)期影像組學(xué)特征的復(fù)合模型表現(xiàn)出較好的診斷效能。有研究使用CT影像組學(xué)預(yù)測(cè)胰腺神經(jīng)內(nèi)分泌腫瘤分級(jí),動(dòng)脈期和門靜脈期模型的效能相似[29],但合并了動(dòng)脈期和門靜脈期特征的復(fù)合模型能顯著提高預(yù)測(cè)胰腺神經(jīng)內(nèi)分泌腫瘤分級(jí)的能力。應(yīng)用CT影像組學(xué)鑒別甲狀腺結(jié)節(jié)的良惡性,其構(gòu)建的模型鑒別甲狀腺良惡性結(jié)節(jié)的AUC、準(zhǔn)確度、靈敏度和特異性分別為0.90、88.2%、88.5%和84.6%[18],展現(xiàn)出較高的預(yù)測(cè)能力。
盡管本研究展現(xiàn)出CT影像組學(xué)在鑒別兒童腹膜后NB和GNB中具有一定價(jià)值,但仍有一定的局限性。首先,本研究為單中心研究,樣本量偏小,腹膜后GNB的病例相對(duì)較少,今后需擴(kuò)大樣本量和進(jìn)行多中心研究以驗(yàn)證模型的有效性和可重復(fù)性。同時(shí),本研究的目的是驗(yàn)證CT影像組學(xué)特征鑒別兒童腹膜后NB和GNB的有效性,因而僅采用了多變量邏輯回歸建立分類模型,其他機(jī)器學(xué)習(xí)分類方法用于建立模型的效能仍需要進(jìn)一步探索和比較。其次,本研究納入病例的CT檢查由兩臺(tái)不同廠商的掃描儀完成,這可能會(huì)對(duì)影像組學(xué)特征的可重復(fù)性造成一定程度的影響。同時(shí),本研究病例的部分CT圖像為5 mm層厚,雖然我們?cè)谔崛D像特征前對(duì)圖像進(jìn)行了預(yù)處理,但也有可能影響模型的效能。
綜上所述,基于平掃和增強(qiáng)CT的影像組學(xué)特征有助于鑒別兒童腹膜后NB和GNB,紋理特征相較于一階直方圖特征能更好的反映兩者的病灶差異,GLDM紋理特征在兩者的鑒別診斷中發(fā)揮著重要作用。平掃期、動(dòng)脈期和靜脈期影像組學(xué)模型均可較好鑒別兒童腹膜后NB和GNB。三期復(fù)合模型與平掃期、動(dòng)脈期模型效能相似,但優(yōu)于靜脈期模型。
南方醫(yī)科大學(xué)學(xué)報(bào)2021年10期