張弛,張政,張蕾,朱磊,汪豐
1. 東南大學(xué) 生物科學(xué)與醫(yī)學(xué)工程學(xué)院,江蘇 南京 210096;2. 上海市第一人民醫(yī)院 放射科,上海 201620
隨著生活水平的提高,人們的飲食習(xí)慣逐漸發(fā)生改變,長(zhǎng)期攝入高糖高脂食物,導(dǎo)致人體內(nèi)脂質(zhì)物質(zhì)積累過(guò)多,脂肪沉積在某些特定的器官、組織內(nèi)部,造成異位脂肪沉積及脂肪變性[1]。而肝部不同程度脂肪變性會(huì)導(dǎo)致脂肪肝、肝纖維化、肝硬化甚至肝癌等[2]。脂肪變性導(dǎo)致疾病的發(fā)生為不可逆過(guò)程,因此對(duì)于輕中度脂肪變性的研究具有較大臨床意義。
組織學(xué)檢查是診斷肝臟脂肪變性程度的金標(biāo)準(zhǔn)[3],但由于穿刺組織活檢為有創(chuàng)操作,且存在取樣、判讀誤差和可重復(fù)性差等缺點(diǎn)[4],目前臨床上主要采用超聲影像進(jìn)行檢查,但超聲影像分析在脂肪含量低于20%的時(shí)候,敏感度最高55%;CT檢查在診斷輕度肝脂肪變性時(shí)準(zhǔn)確性較差,MRI可利用脂肪與水分子中氫質(zhì)子在不同磁場(chǎng)強(qiáng)度下進(jìn)動(dòng)頻率的差異,對(duì)包括輕度肝臟脂肪變性在內(nèi)的病變也能得出更加可靠的影像學(xué)診斷結(jié)果[5-7]。
根據(jù)全國(guó)調(diào)查結(jié)果顯示,中國(guó)成人血脂異常總體患病率高達(dá)40.40%,較2002年呈大幅度上升[8]。代謝疾病愈加威脅人類的身體健康。這些疾病會(huì)導(dǎo)致血管、眼、神經(jīng)系統(tǒng)的慢性損害和功能障礙,給患者帶來(lái)極大的痛苦,而肝臟脂肪變性程度與代謝異常疾病具有高相關(guān)性,研究肝臟脂肪變性程度對(duì)于代謝相關(guān)疾病的診斷具有臨床意義[9-10]。
近幾十年隨著影像領(lǐng)域新的硬件、標(biāo)準(zhǔn)化協(xié)議的不斷出現(xiàn)和發(fā)展及與醫(yī)療大數(shù)據(jù)的結(jié)合,影像組學(xué)開(kāi)始興起并快速發(fā)展,通過(guò)從影像圖像中高通量提取大量特征,給出更完善的分析結(jié)果[11-12]。
本研究擬使用影像組學(xué)方法,獲取患者腹部MRI影像中肝臟的感興趣區(qū)域,提取影像組學(xué)特征,包括強(qiáng)度特征、紋理特征等等,并對(duì)特征進(jìn)行篩選,再利用多種機(jī)器學(xué)習(xí)方法進(jìn)行建模并進(jìn)行模型評(píng)估,最終對(duì)肝臟脂肪變性輕中度進(jìn)行分類研究。
回顧性分析2018年6月至8月于上海市第一人民醫(yī)院進(jìn)行MR上腹部mDixon成像序列掃描的成人患者。排除標(biāo)準(zhǔn):具有肝臟其他疾病以及因惡性腫瘤正在接受化學(xué)、放射治療的患者。本次研究共入組50位患者,其中38位輕度肝部脂肪變性患者,12位中度肝部脂肪變性患者。患者肝部脂肪變性等級(jí)均由專業(yè)醫(yī)師依據(jù)患者的超聲影像與MR影像資料聯(lián)合判斷所給出的等級(jí)評(píng)判結(jié)果。
使 用 3.0T MR機(jī)(Ingenia,Philips) 進(jìn)行上腹部MR影像采集,序列采集參數(shù)如下:回波數(shù)為6;TE=n×1.15 ms,n=1,…,6; 翻轉(zhuǎn)角 5°;TR=10.3 ms;FOV=400×350×210 mm3,矩陣 320×256×70,掃描時(shí)間為16 s,屏氣掃描,接收線圈為腹部32通道表面線圈。
本研究采用影像組學(xué)與集成學(xué)習(xí)方式,流程主要包括:① 患者影像數(shù)據(jù)預(yù)處理;② 提取影像組學(xué)特征;③ 特征處理;④ 集成學(xué)習(xí)建模分類。流程圖如圖1所示。
圖1 本文影像組學(xué)與集成學(xué)習(xí)流程圖
數(shù)據(jù)預(yù)處理主要包括肝部影像數(shù)據(jù)提取和數(shù)據(jù)擴(kuò)增。
(1)肝部影像數(shù)據(jù)提取。對(duì)患者的影像數(shù)據(jù)使用3D slicer軟件勾畫(huà)感興趣區(qū)(Region of Interest,ROI)。ROI選取患者mDixon序列中肝部實(shí)質(zhì)區(qū)域,避開(kāi)大血管、局灶性病變和顯著的偽影。每位患者共選取肝部區(qū)域的6個(gè)ROI,其中4個(gè)位于右葉實(shí)質(zhì)(肝Ⅴ,Ⅵ,Ⅶ,Ⅷ段),2個(gè)位于左葉實(shí)質(zhì)(肝Ⅱ,Ⅲ段)。每個(gè)ROI的大小均為16×16像素。
老人們常常擔(dān)心自己部族的文化會(huì)消亡。年輕人的生活方式通常更現(xiàn)代,但這也付出了代價(jià),少數(shù)民族的文明全球化了。
(2)數(shù)據(jù)擴(kuò)增。由于患者數(shù)目較少,因此通過(guò)數(shù)據(jù)擴(kuò)增的方式增加樣本數(shù)量。具體的方法包括在提取ROI的上下兩層數(shù)據(jù)中分別再次進(jìn)行勾畫(huà),將數(shù)據(jù)進(jìn)行擴(kuò)增;添加隨機(jī)高斯噪聲等。擴(kuò)增后的數(shù)據(jù)量為初始數(shù)據(jù)量的4倍。
利用Python編碼并進(jìn)行特征提取,對(duì)每位患者的6個(gè)ROI分別提取影像組學(xué)特征,包括強(qiáng)度特征及紋理特征。強(qiáng)度特征主要描述ROI區(qū)域內(nèi)體素強(qiáng)度的一階統(tǒng)計(jì)特征值,包括平均值、最大值和最小值等。紋理特征包括灰度共生矩陣、灰度游程矩陣、灰度區(qū)域大小矩陣、領(lǐng)域灰度差矩陣、灰度相關(guān)矩陣。使用Python共提取出126項(xiàng)特征,其中強(qiáng)度特征18項(xiàng),紋理特征共108項(xiàng)。
由于提取出的特征在維度和取值范圍上具有較為明顯的差異,為了使機(jī)器學(xué)習(xí)分類模型達(dá)到更好的分類結(jié)果,需要提前對(duì)所有特征進(jìn)行處理,主要包括特征篩選[13]和歸一化處理。
特征篩選的目的為通過(guò)對(duì)過(guò)于冗余的特征進(jìn)行剔除,減少模型建立過(guò)程中無(wú)用的計(jì)算量。特征篩選不存在對(duì)特征值的修改,而更加側(cè)重于尋找那些對(duì)模型的性能提升較大的少量特征。由于本研究中研究的是二維圖像數(shù)據(jù),因此影像組學(xué)特征中一些描述三維的特征向量可以進(jìn)行剔除,如平坦度等。經(jīng)過(guò)特征篩選,剔除27項(xiàng)特征,剩余93項(xiàng)特征。
歸一化處理主要針對(duì)不同特征最大值和最小值范圍差距過(guò)大進(jìn)行處理,如果兩種特征取值范圍差距過(guò)大,會(huì)導(dǎo)致分類模型的訓(xùn)練過(guò)程中產(chǎn)生不必要的針對(duì)特征量綱的計(jì)算,一定程度上影響分類結(jié)果。將特征處完成后整理為數(shù)據(jù)集,以供機(jī)器學(xué)習(xí)分類模型進(jìn)行訓(xùn)練和測(cè)試。
特征處理完畢后,需要建立機(jī)器學(xué)習(xí)模型對(duì)特征進(jìn)行分類。本研究采用集成學(xué)習(xí)方法進(jìn)行機(jī)器學(xué)習(xí)分類。相較于傳統(tǒng)機(jī)器學(xué)習(xí)分類方法,集成學(xué)習(xí)通過(guò)特定的規(guī)則生成多個(gè)學(xué)習(xí)器,再利用一定的組合策略將這些學(xué)習(xí)器進(jìn)行組合從而獲取最終的結(jié)果。集成學(xué)習(xí)中的多個(gè)學(xué)習(xí)器一般為同質(zhì)的“弱學(xué)習(xí)器”?;谠撊鯇W(xué)習(xí)器,通過(guò)樣本集擾動(dòng)、輸入特征擾動(dòng)、輸出表示擾動(dòng)、算法參數(shù)擾動(dòng)等方式生成多個(gè)學(xué)習(xí)器,進(jìn)行集成后獲得一個(gè)精度較好的“強(qiáng)學(xué)習(xí)器”,即最終集成學(xué)習(xí)模型。
本研究所采用的集成學(xué)習(xí)方法包括三種:自適應(yīng)提升法(Adaptive Boosting,AdaBoost)[14]、梯度提升決策樹(shù)(Gradient Boosting Decision Tree,GBDT)[15]、極端梯度提升法(Extreme Gradient Boosting,XGBoost)[16],這三種方法都是基于Boosting(提升方法)的集成學(xué)習(xí)方法,訓(xùn)練多輪弱分類器,每一輪根據(jù)上一輪的分類結(jié)果動(dòng)態(tài)調(diào)整每個(gè)樣本在分類器中的權(quán)重,從而得到K個(gè)弱分類器,這些弱分類器都有各自的權(quán)重,通過(guò)加權(quán)組合的方式得到最終的分類結(jié)果(綜合所有的基模型預(yù)測(cè)結(jié)果)。AdaBoost通過(guò)每次迭代訓(xùn)練中改變數(shù)據(jù)分布,根據(jù)判斷每次訓(xùn)練集中的每個(gè)樣本的正確性以及上次的總體分類的準(zhǔn)確率來(lái)確定每個(gè)樣本的權(quán)值,再將修改權(quán)值的新數(shù)據(jù)送給下層分類器進(jìn)行訓(xùn)練,然后將每次訓(xùn)練得到的分類器線性組合起來(lái)作為最終的決策分類器。GBDT算法的核心則是在迭代過(guò)程中利用下一個(gè)弱分類器去擬合誤差函數(shù)對(duì)預(yù)測(cè)值的殘差(這個(gè)殘差就是預(yù)測(cè)值與真實(shí)值之間的誤差),通過(guò)不斷減小殘差來(lái)達(dá)到最終的分類。XGBoost與GBDT核心思想類似,區(qū)別在于XGBoost在代價(jià)函數(shù)中加入了正則項(xiàng),可以控制模型的復(fù)雜度,且在每次迭代之后,XGBoost為葉子結(jié)點(diǎn)分配學(xué)習(xí)速率,降低每棵分類決策樹(shù)的權(quán)重,為之后的訓(xùn)練提供更好的空間,而從權(quán)衡方差偏差來(lái)看,XGBoost降低了模型的方差,使訓(xùn)練模型更加精簡(jiǎn),并能夠有效防止過(guò)擬合,泛化性能優(yōu)于GBDT。
本研究采用3項(xiàng)指標(biāo)對(duì)三種集成學(xué)習(xí)分類算法的性能進(jìn)行評(píng)估,包括準(zhǔn)確率(Accuracy,ACC),精確率(Precision),召回率(Recall),F(xiàn)1 score。各項(xiàng)指標(biāo)值定義如公式(1)~(4):
其中,TP(True Positive)表示被模型預(yù)測(cè)為正的正樣本數(shù),F(xiàn)P(False Positive)表示被模型預(yù)測(cè)為正的負(fù)樣本數(shù),F(xiàn)N(False Negative)表示被模型預(yù)測(cè)為負(fù)的正樣本數(shù),TN(True Negative)表示被模型預(yù)測(cè)為負(fù)的負(fù)樣本數(shù)。
本研究利用AdaBoost、GBDT與XGBoost三種集成學(xué)習(xí)算法分別將處理過(guò)后的患者肝部MRI影像組學(xué)特征進(jìn)行分類,獲得分類結(jié)果。訓(xùn)練過(guò)程中訓(xùn)練集與測(cè)試集劃分比例為4:1。訓(xùn)練集數(shù)據(jù)進(jìn)行交叉驗(yàn)證得到穩(wěn)定的模型,并利用測(cè)試集評(píng)估三種分類模型的效果(表1)。XGBoost算法性能最佳,分類準(zhǔn)確率達(dá)到81.9%。
表1 三種算法分類性能表(%)
通過(guò)模型效果對(duì)比,XGBoost算法在肝臟脂肪變性輕中度分類效果最佳,因此將XGBoost模型中影像組學(xué)特征的重要性進(jìn)行排序,排序結(jié)果如圖2所示。特征的重要性代表了該項(xiàng)特征在總體模型中權(quán)重的大小,重要性越高則表明該項(xiàng)特征對(duì)肝臟脂肪變性程度輕中度分類發(fā)揮更大的作用。其中重要性最高的五項(xiàng)分別為強(qiáng)度特征中的90Percentile(用于描述ROI區(qū)域內(nèi)總體的體素的強(qiáng)度分布)、灰度區(qū)域大小矩陣中的Small Area High Gray Level Emphasis(用于衡量ROI中具有較高灰度值的較小尺寸區(qū)域的聯(lián)合分布比例)、灰度游程矩陣中的Run Percentage(用于衡量ROI區(qū)域紋理的粗糙度)、強(qiáng)度特征中的Energy(用于衡量ROI區(qū)域平均體素強(qiáng)度)、灰度共生矩陣中的Cluster Tendency(衡量ROI區(qū)域內(nèi)具有相似灰度值的聚類趨勢(shì))。這五項(xiàng)特征重要性之和大于19%,即在總體肝臟脂肪變形程度輕中度分類模型之中所占權(quán)重接近1/5。
圖2 特征重要性由高至低排序結(jié)果
三種不同的集成學(xué)習(xí)方法中最高分類準(zhǔn)確率為XGBoost方法,準(zhǔn)確率達(dá)到81.9%。XGBoost相較于AdaBoost與GBDT加入了二階導(dǎo)數(shù),對(duì)于影像組學(xué)特征的分類起到了更好的效果。影像組學(xué)與集成學(xué)習(xí)相結(jié)合的方法對(duì)于肝部脂肪變性輕中度分類起到了較好的結(jié)果。
通過(guò)對(duì)這三種模型性能指標(biāo)的對(duì)比,選出更適合本研究患者數(shù)據(jù)的算法,并對(duì)XGBoost分類模型中影像組學(xué)特征重要性進(jìn)行排序,篩選出了權(quán)重更大的一些影像組學(xué)特征。根據(jù)特征重要性排序,在重要性最高的五項(xiàng)特征中,90Percentile與Energy這兩項(xiàng)特征均為描述總體的體素分布情況或平均強(qiáng)度的特征,而除此之外的三項(xiàng)特征分別衡量高灰度值的較小尺寸區(qū)域的分布、紋理粗糙度及相似灰度值的聚類趨勢(shì),這說(shuō)明僅僅依靠體素的強(qiáng)度大小對(duì)肝臟脂肪變性進(jìn)行研究具有一定的局限性,而MRI數(shù)據(jù)中還有著更多的有效特征可以進(jìn)行提取并用來(lái)對(duì)脂肪變性進(jìn)行更準(zhǔn)確的分析研究。除此之外,包括灰度共生矩陣、灰度游程矩陣及灰度區(qū)域大小矩陣包含的特征也占據(jù)不小的比重。與此同時(shí),這也表明肝臟脂肪變性的影像學(xué)表現(xiàn)還有著許多值得進(jìn)一步研究的信息,例如紋理粗糙度和相似灰度值聚類趨勢(shì)等特征,這些深層特征在分類模型的特征重要性分?jǐn)?shù)中排名靠前,對(duì)于肝臟脂肪變性輕中度分類占據(jù)較高重要性,一定程度上也可能表征出肝組織的結(jié)構(gòu)的變化,或是脂肪等物質(zhì)在肝部的堆積情況等等,包括其他影像組學(xué)特征也可能為肝臟脂肪變性及相關(guān)疾病的診斷提供有效建議。
目前對(duì)于肝部脂肪變性研究的影像學(xué)手段一般多為超聲檢查及CT檢查,但超聲影像與CT對(duì)于輕中度脂肪變性的敏感度較低,而本研究中通過(guò)基于MRI的影像組學(xué)方法對(duì)于輕中度脂肪變性的分類準(zhǔn)確率最高達(dá)到81.9%,可以有效解決這一問(wèn)題。相較于傳統(tǒng)依靠醫(yī)學(xué)影像中體素值強(qiáng)度的分析,影像組學(xué)更深入挖掘了影像中的一些深層次特征[17-18],通過(guò)分析這些特征所代表的影像學(xué)意義,有助于更全面的針對(duì)肝部脂肪變性的影像學(xué)研究。
肝臟脂肪變性程度輕中度分類對(duì)于患者是否發(fā)生代謝異常的早期篩查具有一定的意義,而影像組學(xué)能有效提取患者的影像數(shù)據(jù)中的多維度特征[19-20],從而更好地進(jìn)行影像分析,借助集成學(xué)習(xí)的高效分類更能進(jìn)一步提取到有價(jià)值的信息,對(duì)輕中度脂肪變性的患者提供一些飲食習(xí)慣的建議或其他臨床干預(yù)手段,減少患者由輕中度脂肪變性發(fā)展為更嚴(yán)重的肝纖維化、肝硬化甚至肝癌等的概率。
目前研究結(jié)果還存在一些不足之處,由于研究前期入組的患者數(shù)量較少,無(wú)法完全發(fā)揮集成學(xué)習(xí)的優(yōu)勢(shì),后續(xù)研究將會(huì)繼續(xù)收集不同程度肝臟脂肪變性患者的腹部MRI數(shù)據(jù),增加樣本數(shù)量,進(jìn)一步提高分類精度,并深入分析影像組學(xué)特征的意義,挖掘肝臟脂肪變性影像資料中更多可靠、有效的信息,為影像學(xué)檢查提供參考。
本文通過(guò)結(jié)合影像組學(xué)與集成學(xué)習(xí)的方法對(duì)肝臟脂肪輕中度變性的患者進(jìn)行分類,并對(duì)模型中重要性較高的影像組學(xué)特征進(jìn)行分析。影像組學(xué)與集成學(xué)習(xí)方法為脂肪變性分級(jí)提供了一種較為可靠的輔助診斷手段,隨著后續(xù)研究入組患者數(shù)量增多,集成學(xué)習(xí)方法將會(huì)發(fā)揮更大的優(yōu)勢(shì),使分類結(jié)果更加準(zhǔn)確可靠。通過(guò)挖掘患者影像數(shù)據(jù)中更多深層次信息,也為臨床診斷提供更多有效幫助,除此之外,對(duì)輕中度脂肪變性的研究也能夠?yàn)榛颊咧|(zhì)代謝相關(guān)疾病的臨床干預(yù)或治療時(shí)機(jī)提供指導(dǎo)。