何 雄,陳艷麗,帕哈提·吐遜江,夏雨薇,劉文亞,郭 輝
1新疆醫(yī)科大學(xué)第一附屬醫(yī)院影像中心,新疆 烏魯木齊 830054;2新疆醫(yī)科大學(xué)第四臨床醫(yī)學(xué)院,新疆 烏魯木齊 830054;3慧影醫(yī)療科技(北京)有限公司,北京100089
結(jié)核性脊柱炎(TS)與布魯菌性脊柱炎(BS)是兩種 不同細(xì)菌侵襲感染脊柱而引起的感染性脊柱炎,在骨關(guān)節(jié)感染中以脊柱最為常見(jiàn)[1-3]。TS的影像學(xué)表現(xiàn)與BS較為相似,易發(fā)生誤診、誤治,不利于患者治療,導(dǎo)致患者病情加重,致患者癱瘓甚至死亡。目前,國(guó)內(nèi)外主要通過(guò)臨床表現(xiàn)、實(shí)驗(yàn)室檢查及影像學(xué)表現(xiàn)對(duì)TS與BS進(jìn)行鑒別診斷,必要時(shí)行穿刺活檢術(shù)或開(kāi)放手術(shù)病理檢查。但臨床表現(xiàn)和實(shí)驗(yàn)室檢查對(duì)于脊柱結(jié)核和化膿性脊柱炎鑒別診斷的特異性不高,往往依靠醫(yī)生的臨床經(jīng)驗(yàn),誤診率高[4]。尋找TS與BS的早期診斷和鑒別診斷方法十分重要。隨著醫(yī)學(xué)影像人工智能技術(shù)的迅速發(fā)展及大數(shù)據(jù)的日積月累,傳統(tǒng)醫(yī)療模式向精準(zhǔn)醫(yī)學(xué)模式的過(guò)渡,影像組學(xué)逐漸成為量化影像圖像中各類(lèi)數(shù)據(jù)及輔助診療疾病的新手段。影像組學(xué)是近年來(lái)應(yīng)用于研究疾病早期診斷、鑒別診斷、醫(yī)學(xué)模型建立等方面的熱點(diǎn),這種新的技術(shù)方法應(yīng)用于MRI分析中,可以獲取一些肉眼觀察不到的信息,它是從醫(yī)學(xué)影像圖像中獲取豐富的特征指標(biāo),通過(guò)一系列的處理獲取有用的特征信息,最后建立機(jī)器學(xué)習(xí)模型[5-6],從而獲取有價(jià)值的診斷結(jié)論。迄今為止,影像組學(xué)已廣泛應(yīng)用于肺癌、乳腺癌、直腸癌、膠質(zhì)瘤的研究中,而在脊柱感染性病變方面缺乏系統(tǒng)研究,有較少研究局限在解剖結(jié)構(gòu)識(shí)別、常規(guī)診斷方面[7],本研究旨在探討MR T1WI影像組學(xué)的機(jī)器學(xué)習(xí)在鑒別診斷TS與BS中的效能,以此來(lái)提高這兩種疾病的診斷準(zhǔn)確性和檢出率,為精準(zhǔn)醫(yī)療提供更為豐富的依據(jù)。
回顧性收集2019年3月~2021年12月在我院經(jīng)臨床和實(shí)驗(yàn)室確診的TS與BS患者病例。納入標(biāo)準(zhǔn):臨床和實(shí)驗(yàn)室確診證實(shí)為T(mén)S或BS;接受脊柱MRI檢查;確診前有完整的T1WI且資料完整、影像清晰。排除標(biāo)準(zhǔn):患者同時(shí)患有TS或BS以外的其他脊柱感染性病變;影像資料不全、偽影較多;圖像質(zhì)量不能滿足對(duì)感興趣區(qū)域(ROI)的勾畫(huà);在MRI檢查前接受了治療。本研究最終共納入111例患者,其中男性85例,女性26例,年齡24~73歲,包括77例TS與34例BS。以0.8:0.2的比例將全部患者隨機(jī)分組到訓(xùn)練集(n=88)與驗(yàn)證集(n=23),訓(xùn)練集側(cè)重于對(duì)診斷模型的建立,驗(yàn)證集則側(cè)重于對(duì)模型鑒別診斷TS與BS的作用大小。訓(xùn)練集包括61例TS和27例BS,驗(yàn)證集包括16例TS和7例BS。訓(xùn)練集和驗(yàn)證集患者的性別、年齡差異均無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05,表1)。本研究經(jīng)我院倫理委員會(huì)審核,獲得所有患者知情同意,并簽署臨床研究協(xié)議書(shū)。
表1 訓(xùn)練集與驗(yàn)證集患者性別、年齡比較Tab.1 Comparison of gender and age of patients in training set and verification set
采用1.5T MR掃描儀(西門(mén)子)進(jìn)行掃描,采用體線圈接收信號(hào),予以T1WI序列掃描,具體數(shù)據(jù)如下:TR 400~700 ms,TE 11~15 ms,層厚3.0 mm,層距0.5 mm。
將顯示TS或BS所有層面的MR T1WI序列圖像上傳至放射組學(xué)云平臺(tái),由2名從事感染性脊柱疾病診斷經(jīng)驗(yàn)為5年與10年的影像醫(yī)生各自對(duì)影像圖片進(jìn)行篩選,優(yōu)先選取矢狀位圖像,沿病灶邊緣逐層手動(dòng)勾畫(huà)病灶ROI(圖1),提取整個(gè)病灶的圖像信息。將分割的病灶ROI在放射組學(xué)云平臺(tái)上進(jìn)行特征信息的提取,然后對(duì)得到的結(jié)果進(jìn)行組內(nèi)相關(guān)系數(shù)分析,組內(nèi)相關(guān)系數(shù)>0.75表明一致性良好,最終獲得觀察者間一致性。首先采用方差選擇法對(duì)提取的組學(xué)特征進(jìn)行初步降維,然后采用單變量特征選擇法對(duì)組學(xué)特征再次降維,最后通過(guò)最小絕對(duì)收縮與選擇算子算法(LASSO)對(duì)組學(xué)特征信息進(jìn)行選擇和降維處理(圖2),選擇出最優(yōu)特征信息(8個(gè))并構(gòu)建模型(圖3)。所應(yīng)用的機(jī)器學(xué)習(xí)算法模型方法包括極限梯度增強(qiáng)法(XGBoost)、Logistic 回歸法(LR)、支持向量機(jī)法(SVM)、K鄰近法(KNN)。
圖1 MR T1WI上手動(dòng)勾畫(huà)感興趣區(qū)前后對(duì)比Fig.1 Comparison before and after manual delineation of ROI on MR T1WI.A: Before the outline;B: After the outline.
圖2 在特征選擇上的套索算法Fig.2 LASSO algorithm on feature selection.
圖3 LASSO降維后通過(guò)模型選擇篩選出的特征及其權(quán)重Fig.3 Features and their weights filtered through model selection after LASSO dimensionality reduction.
采用SPSS22.0軟件對(duì)數(shù)據(jù)進(jìn)行處理。計(jì)量資料以均數(shù)±標(biāo)準(zhǔn)差表示;計(jì)數(shù)資料的組間比較行卡方檢驗(yàn)或Fisher確切概率法。使用準(zhǔn)確度、ROC曲線及其95%CI評(píng)估各訓(xùn)練模型和驗(yàn)證模型對(duì)TS與BS的診斷效能。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
4種機(jī)器學(xué)習(xí)算法預(yù)測(cè)模型的AUC由大到小的順序?yàn)椋篨GBoost>SVM>KNN>LR;準(zhǔn)確度由大到小的順序?yàn)椋篨GBoost>SVM=LR>KNN(表2)。所構(gòu)建的4種機(jī)器學(xué)習(xí)算法預(yù)測(cè)模型在訓(xùn)練集中的ROC曲線(圖4)。
圖4 4種機(jī)器學(xué)習(xí)算法預(yù)測(cè)模型在訓(xùn)練集中的ROC曲線Fig.4 ROC curve of four machine learning algorithm prediction models in training set.A: LR;B: SVM;C:KNN;D:XGBoost.
表2 4種T1WI機(jī)器學(xué)習(xí)算法預(yù)測(cè)模型在訓(xùn)練集中的診斷效能Tab.2 Diagnostic effectiveness of four T1WI machine learning algorithm prediction models in training set
4種機(jī)器學(xué)習(xí)算法預(yù)測(cè)模型的AUC由大到小順序?yàn)椋篖R>SVM>XGBoost>KNN;準(zhǔn)確度由大到小順序?yàn)椋篕NN=XGBoost>SVM=LR(表3)。所構(gòu)建的4種機(jī)器學(xué)習(xí)算法預(yù)測(cè)模型在驗(yàn)證集中的ROC曲線(圖5)。
圖5 4種機(jī)器學(xué)習(xí)算法預(yù)測(cè)模型在驗(yàn)證集中的ROC曲線Fig.5 ROC curve of four machine learning algorithm prediction models in validation set.A:LR;B:SVM;C:KNN;D:XGBoost.
表3 4種T1WI機(jī)器學(xué)習(xí)算法預(yù)測(cè)模型在驗(yàn)證集中的診斷效能Tab.3 Diagnostic effectiveness of four T1WI machine learning algorithm prediction models in validation set
TS與BS癥狀非常相似,特別是在脊柱受累及方面[8-9],選擇一種方法對(duì)兩者進(jìn)行鑒別診斷尤為重要。影像組學(xué)實(shí)現(xiàn)了將醫(yī)學(xué)圖像信息轉(zhuǎn)化為豐富的數(shù)據(jù)信息,通過(guò)病灶分割、特征提取與模型建立,對(duì)病灶進(jìn)行精準(zhǔn)、客觀、定量評(píng)估[10],間接幫助醫(yī)生提高診斷準(zhǔn)確率[11-12]。影像組學(xué)的機(jī)器學(xué)習(xí)算法有很多種,但它們有共同的工作流程[13-14]。本研究采用的是影像組學(xué)分析中較為常用的建模方法,建立的XGBoost、LR、SVM和KNN影像組學(xué)預(yù)測(cè)模型在TS與BS鑒別上均表現(xiàn)出較好的預(yù)測(cè)性能,訓(xùn)練集中準(zhǔn)確度分別為0.97、0.83、0.83、0.78,測(cè)試集中準(zhǔn)確度分別為0.83、0.78、0.78、0.83,這表明本研究所建立的影像組學(xué)預(yù)測(cè)模型對(duì)TS與BS病變具有較高的預(yù)測(cè)價(jià)值,可作為治療病變TS與BS病變前的臨床輔助工具。
有研究對(duì)50 例脊柱多發(fā)性骨髓瘤患者T1WI、T2WI和FS-T2WI圖像提取分析了248個(gè)病灶(111個(gè)高危細(xì)胞遺傳學(xué)異常和137個(gè)非高危細(xì)胞遺傳學(xué)異常)的放射組學(xué)特征,并使用LR機(jī)器學(xué)習(xí),預(yù)測(cè)了多發(fā)性骨髓瘤患者高危細(xì)胞遺傳異常的可行性[15-16]。在驗(yàn)證隊(duì)列中觀察到放射組學(xué)模型和組合模型之間的AUC值,分別為0.863和0.870。放射組學(xué)模型的AUC為0.863,敏感度為0.789,特異性為0.787,陽(yáng)性預(yù)測(cè)值為0.753,陰性預(yù)測(cè)值為0.824,準(zhǔn)確度為0.788,與訓(xùn)練隊(duì)列中的表現(xiàn)相當(dāng),表明常規(guī)脊柱MRI的放射組學(xué)特征反映了多發(fā)性骨髓瘤患者高危細(xì)胞遺傳學(xué)異常和非高危細(xì)胞遺傳學(xué)異常之間的差異。本研究中,LR模型在穩(wěn)定性、準(zhǔn)確度及AUC方面均表現(xiàn)最佳,明顯優(yōu)于其他3種模型,從側(cè)面驗(yàn)證了LR機(jī)器學(xué)習(xí)算法所構(gòu)建的模型具有良好的穩(wěn)定性。既往文獻(xiàn)中也可以看到類(lèi)似的結(jié)果,構(gòu)建預(yù)測(cè)模型的機(jī)器學(xué)習(xí)算法可以用于不同的部位,LR機(jī)器學(xué)習(xí)算法可能對(duì)骶骨腫瘤、四肢和骨盆軟組織腫塊、肺實(shí)性結(jié)節(jié)和乳腺癌有較高的診斷效能[17]。在本研究中,LR機(jī)器學(xué)習(xí)算法在鑒別TS與BS病變方面也表現(xiàn)出了較好的診斷效能。
本研究通過(guò)應(yīng)用MR T1WI的影像組學(xué)來(lái)鑒別診斷TS與BS,聯(lián)合人工智能機(jī)器學(xué)習(xí)的4種方法,構(gòu)建了TS與BS的鑒別診斷模型,來(lái)提高對(duì)TS與BS鑒別診斷,為患者治療提供更加可靠的診斷結(jié)果。通過(guò)研究結(jié)果表明,構(gòu)建的TS與BS影像組學(xué)鑒別診斷模型有一定的價(jià)值(AUC均>0.75),特別是機(jī)器學(xué)習(xí)算法LR在鑒別TS與BS的驗(yàn)證集中診斷效能明顯優(yōu)于機(jī)器學(xué)習(xí)其他4種算法,同時(shí)LR檢測(cè)準(zhǔn)確度超過(guò)75%,展現(xiàn)出了非常優(yōu)異的診斷效能??傮w來(lái)看,本研究機(jī)器學(xué)習(xí)的4種算法比較結(jié)果為:LR>SVM>XGBoost>KNN,提示在本研究機(jī)器學(xué)習(xí)的4種算法中,機(jī)器學(xué)習(xí)LR算法不僅具有較好的診斷效能,還在穩(wěn)定性、操控性、應(yīng)用潛力方面具有更大的優(yōu)勢(shì)。
本研究的局限性:共搜集到77例TS與34例BS,樣本量較少;樣本未進(jìn)行嚴(yán)格的圖像標(biāo)準(zhǔn)化處理,對(duì)病灶感興趣區(qū)的勾畫(huà),仍采用人眼識(shí)別、手工勾畫(huà)的方式進(jìn)行,可能存在一定的人為因素影響;本研究只選用了我院病例進(jìn)行研究分析,會(huì)存在選擇性偏倚的可能。目前影像組學(xué)雖處于初步應(yīng)用階段,但是隨著研究的不斷深入,在未來(lái)會(huì)有更多新的成果被發(fā)掘出來(lái),將會(huì)為患者的精準(zhǔn)醫(yī)療、個(gè)體化治療提供強(qiáng)有力的幫助。影像組學(xué)的進(jìn)步,不但推動(dòng)著醫(yī)學(xué)影像專(zhuān)業(yè)發(fā)展,而且對(duì)整個(gè)醫(yī)學(xué)事業(yè)的發(fā)展具有重要促進(jìn)意義。
綜上所述,基于MR T1WI影像組學(xué)的機(jī)器學(xué)習(xí)在鑒別診斷TS與BS的應(yīng)用方面有較高的應(yīng)用優(yōu)勢(shì),特別是LR構(gòu)建的機(jī)器學(xué)習(xí)算法,可為診斷TS與BS的預(yù)測(cè)及預(yù)后評(píng)估提供一種較為可靠的診斷依據(jù),具有較好的應(yīng)用前景。