王 博,譚紅娜,周 燕,孫慧芳,耿亞媛,高劍波*
(1.鄭州大學(xué)第一附屬醫(yī)院放射科,河南 鄭州 450052;2.河南省人民醫(yī)院醫(yī)學(xué)影像科,河南 鄭州 450003;3.北京慧影醫(yī)療科技公司,北京 100080)
三陰性乳腺癌(triple negative breast cancer, TNBC)指雌激素受體(estrogen receptor, ER)、孕激素受體(progesterone receptor, PR)及人表皮生長因子受體2(human epidermal growth factor receptor 2, HER-2)表達(dá)均呈陰性的乳腺癌,具有明顯腫瘤異質(zhì)性,是惡性程度最高、侵襲性最強(qiáng)、預(yù)后最差的乳腺癌分子亞型[1-2]。乳腺X線攝影可用于篩查和診斷乳腺癌,但其鑒別TNBC的價(jià)值有限[3-4],目前常通過對手術(shù)切除標(biāo)本行免疫組織化學(xué)檢查以評估ER、PR及HER-2來診斷TNBC。影像組學(xué)是采用自動化、高通量特征提取方法將影像轉(zhuǎn)化為可挖掘的特征數(shù)據(jù),從而全面、定量評估腫瘤異質(zhì)性的無創(chuàng)方法[5]。本研究評估乳腺X線攝影影像組學(xué)特征預(yù)測TNBC的價(jià)值。
1.1 一般資料 回顧性分析2017年1月—2019年6月177例乳腺癌患者(177個(gè)病灶),均為女性,年齡26~84歲,中位年齡為49歲,其中77例TNBC和100例非TNBC。納入標(biāo)準(zhǔn):①首次經(jīng)手術(shù)病理證實(shí)組織細(xì)胞分型為非特殊類型的浸潤性乳腺癌,免疫組織化學(xué)檢查ER、PR、HER2及Ki-67表達(dá)結(jié)果完整,并根據(jù)結(jié)果分為TNBC和非TNBC[6];②術(shù)前接受乳腺X線攝影。排除標(biāo)準(zhǔn):檢查前接受組織穿刺活檢或新輔助化學(xué)治療。按照7∶3比例將患者隨機(jī)分為訓(xùn)練集(n=123)和驗(yàn)證集(n=54)。訓(xùn)練集含54例TNBC和69例非TNBC,驗(yàn)證集含23例TNBC和31例非TNBC。
1.2 儀器與方法 采用Hologic Selenia數(shù)字乳腺機(jī)行乳腺X線攝影,選擇自動濾過曝光模式,采集雙側(cè)乳腺內(nèi)外側(cè)斜位(mediolateral oblique, MLO)和頭足位(cranial caudal, CC)片。
1.3 影像組學(xué)特征提取、篩選及分析 由2名具有5年以上乳腺X線診斷經(jīng)驗(yàn)的主治醫(yī)師在放射組學(xué)云平臺(V3.1)[慧影醫(yī)療科技有限公司(北京)]上于CC位和MLO位圖像上分別手動勾畫腫瘤感興趣區(qū)(region of interest, ROI)(圖1),平臺自動計(jì)算并輸出其影像組學(xué)特征參數(shù)。
圖1 于乳腺CC位和MLO位圖像上分別手動勾畫腫瘤ROI(紅色區(qū)域)示意圖 A.CC位; B.MLO位
為降低特征冗余度,采用Select-K-Best、最小絕對值收斂和選擇算子(least absolute shrinkage and selection operator, Lasso)方法篩選與TNBC相關(guān)性最強(qiáng)的影像組學(xué)特征,以Select-K-Best方法計(jì)算影像組學(xué)特征與最終組學(xué)標(biāo)簽間的相關(guān)性,保留最佳影像組學(xué)特征,有效降低Lasso的代價(jià)函數(shù),Lasso函數(shù)中所用代價(jià)函數(shù)為:
其中,X表示影像組學(xué)特征矩陣,y代表樣本標(biāo)簽列,n代表樣本量,w是回歸模型的系數(shù)矩陣,α‖w‖1表示Lasso懲罰,α是常數(shù)因子,‖w‖1是系數(shù)矩陣的1范式。對數(shù)據(jù)行標(biāo)準(zhǔn)化處理,并采用5折交叉驗(yàn)證,經(jīng)2 000次迭代后,根據(jù)最小均方誤差得到最優(yōu)α值,依據(jù)最優(yōu)α值篩選與TNBC相關(guān)性最強(qiáng)的影像組學(xué)特征集,分別計(jì)算其Lasso系數(shù)。
針對獲得的影像組學(xué)特征集,以支持向量機(jī)(support vector machine, SVM)建立預(yù)測TNBC模型。
1.4 統(tǒng)計(jì)學(xué)分析 采用SPSS 22.0統(tǒng)計(jì)分析軟件。計(jì)量資料符合正態(tài)分布時(shí)以±s表示,否則以中位數(shù)(上下四分位數(shù))表示。采用獨(dú)立樣本t檢驗(yàn)或Mann-WhitneyU檢驗(yàn)比較訓(xùn)練集與驗(yàn)證集患者年齡、病灶最大徑及Ki-67增殖指數(shù)的差異;以χ2檢驗(yàn)比較訓(xùn)練集與驗(yàn)證集病灶病理學(xué)分級、ER、PR及HER-2表達(dá)的差異。以受試者工作特征(receiver operating characteristic, ROC)曲線分析影像組學(xué)特征及預(yù)測模型預(yù)測TNBC的效能。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 臨床病理特征 訓(xùn)練集和驗(yàn)證集患者年齡、病灶最大徑、病理學(xué)scarff-bloom-richardson(SBR)分級、ER表達(dá)、PR表達(dá)、HER-2表達(dá)、Ki-67增殖指數(shù)及腋窩淋巴結(jié)轉(zhuǎn)移差異均無統(tǒng)計(jì)學(xué)意義(P均>0.05),見表1。
表1 訓(xùn)練集與驗(yàn)證集臨床病理特征比較
2.2 影像組學(xué)特征 自CC位和MLO位圖像各獲得1 033個(gè)2D高維影像組學(xué)特征,包括18個(gè)一階統(tǒng)計(jì)量特征、10個(gè)形狀特征、75個(gè)紋理特征(24個(gè)灰度級共生矩陣特征,16個(gè)灰度區(qū)域矩陣特征,16個(gè)灰度游程矩陣特征,5個(gè)領(lǐng)域灰度差異矩陣特征,14個(gè)灰度級依賴矩陣特征)及濾波變換生成的930個(gè)影像組學(xué)參數(shù)特征。訓(xùn)練集中,經(jīng)Select-K-Best方法和Lasso回歸分析,分別于CC位圖像(圖2)、MLO位圖像和CC+MLO位圖像中各篩選出7個(gè)與TNBC相關(guān)性最強(qiáng)的影像組學(xué)特征,并分別建立預(yù)測模型。
圖2 采用Lasso算法篩選影像組學(xué)特征 A.Lasso path圖示最佳α值為0.039,-log(α)=1.41; B.采用5折交叉驗(yàn)證獲得均方誤差; C.根據(jù)最優(yōu)α值獲得CC位圖像中與TNBC相關(guān)性最強(qiáng)的影像組學(xué)特征及其Lasso系數(shù)
2.3 乳腺X線影像組學(xué)特征及預(yù)測模型預(yù)測TNBC的效能 ROC曲線顯示,在訓(xùn)練集和驗(yàn)證集中,CC位預(yù)測模型預(yù)測TNBC的準(zhǔn)確率高于MLO位及CC+MLO位預(yù)測模型,見表2及圖3。基于CC位圖像篩選的7個(gè)與TNBC分類預(yù)測相關(guān)性最強(qiáng)的影像組學(xué)特征中,灰度級依賴矩陣中的Maximum Probability、經(jīng)過濾波變換的Gray Level NonUniformity及Large Dependence Low Gray Level Emphasis預(yù)測TNBC的AUC為0.587、0.599及0.615(P均<0.05),見表3。
圖3 訓(xùn)練集(A)和驗(yàn)證集(B)中CC位、MLO位和CC+MLO位預(yù)測模型預(yù)測TNBC的ROC曲線
表2 各預(yù)測模型預(yù)測TNBC的ROC曲線結(jié)果
表3 CC位圖像影像組學(xué)特征預(yù)測TNBC的效能
乳腺癌是女性最常見的惡性腫瘤之一,且發(fā)病率逐年增加[7]。不同分子亞型乳腺癌呈現(xiàn)不同的生物學(xué)行為,預(yù)后差異較大。2013年St.Gallen國際乳腺癌會議發(fā)布了參照乳腺癌生物學(xué)標(biāo)記物及基因表達(dá)譜定義的乳腺癌分子分型標(biāo)準(zhǔn)[6],包括Luminal A型、Luminal B型、HER-2陽性型和TNBC,現(xiàn)已廣泛用于臨床指導(dǎo)選擇治療方案及評估療效。其中TNBC惡性程度最高、預(yù)后最差[1-2],且缺乏靶向治療藥物,使得早期診斷成為改善患者預(yù)后的重要手段。
目前需要通過手術(shù)或活檢獲取組織學(xué)標(biāo)本,經(jīng)免疫組織化學(xué)檢查診斷TNBC,具有創(chuàng)傷性。影像學(xué)檢查常用于術(shù)前評價(jià)腫瘤異質(zhì)性,但相關(guān)乳腺癌分子分型研究[4,8-10]僅根據(jù)X線攝影、MRI等影像學(xué)征象預(yù)測TNBC,在一定程度上評估腫瘤表型的異質(zhì)性,無法進(jìn)行定量分析,且均為單中心回顧性研究,樣本量相對較小。影像組學(xué)可全面、定量、無創(chuàng)評估腫瘤異質(zhì)性,可為臨床制定治療決策提供幫助[11]。乳腺X線攝影對于乳腺疾病的診斷、臨床分期及預(yù)后評估等具有高度實(shí)用價(jià)值,其中TNBC多表現(xiàn)為不伴鈣化的腫塊或結(jié)構(gòu)扭曲[4,10],難以與其他亞型乳腺癌相鑒別。本研究提取乳腺癌X線攝影影像組學(xué)特征,評估其用于預(yù)測TNBC與非TNBC的價(jià)值。
既往研究[12-13]結(jié)果顯示,基于乳腺X線攝影影像組學(xué)特征預(yù)測TNBC的效能不高。馬文娟等[12]報(bào)道, CC+MLO雙視角圖像影像組學(xué)模型的預(yù)測價(jià)值高于單獨(dú)CC及MLO位圖像影像組學(xué)模型;其所篩選的影像組學(xué)特征均為紋理特征,未經(jīng)驗(yàn)證集驗(yàn)證,且其中TNBC(n=34)與非TNBC樣本量(n=102)相差較大。本研究于乳腺CC位、MLO位和CC+MLO位圖像各篩選出7個(gè)與TNBC關(guān)系最密切的影像組學(xué)特征,構(gòu)建預(yù)測TNBC模型,發(fā)現(xiàn)CC位預(yù)測模型在驗(yàn)證集中的AUC值、準(zhǔn)確率最高,分別為0.82、81.48%,且其在訓(xùn)練集及驗(yàn)證集中的AUC值及準(zhǔn)確率基本一致,表明該模型相對穩(wěn)定。本研究進(jìn)一步分析基于CC位圖像選出的7個(gè)與TNBC分類預(yù)測相關(guān)性最強(qiáng)的影像組學(xué)特征,其中灰度級依賴矩陣中的Maximum Probability及濾波變換的Gray Level NonUniformity和Large Dependence Low Gray Level Emphasis分類預(yù)測TNBC的AUC為0.587、0.599及0.615,有助于鑒別診斷TNBC與非TNBC。本組CC位模型預(yù)測TNBC的AUC稍高于ZHANG等[13]的結(jié)果,但仍不甚理想,可能與選擇的預(yù)測模型較單一以及數(shù)據(jù)處理過程中過擬合有關(guān),有待加大樣本量開展多中心研究加以驗(yàn)證。
本研究的局限性:①手動勾畫病灶ROI,難以避免閱片者主觀因素的影響;②TNBC發(fā)生率較低,本研究隨機(jī)選取100例非TNBC與77例TNBC匹配,并以7∶3比例隨機(jī)分為訓(xùn)練集和驗(yàn)證集,配比效果是否最佳有待證實(shí);③納入病例均為非特殊類型浸潤性乳腺癌,病種相對單一。
總之,乳腺X線影像、尤其乳腺CC位圖像影像組學(xué)特征對術(shù)前預(yù)測TNBC有一定臨床應(yīng)用價(jià)值。