王聰,袁榕澳,李川
(四川大學(xué)計算機學(xué)院,成都610065)
阿爾茨海默?。ˋD)是一種起病隱匿的進行性發(fā)展的神經(jīng)系統(tǒng)退行性疾病,主要病理體現(xiàn)為進行性腦細胞死亡和腦體積縮小[1],目前尚無有效的治療方法。一旦患病,無法逆轉(zhuǎn)。輕度認知功能障礙(MCI)是介于正常對照組(CN)和AD 之間的一種中間狀態(tài),患者存在輕度認知功能減退,但日常能力沒有受到明顯影響。常常有大量的患者在這個階段接受一定的干預(yù)措施,避免發(fā)展成為不可逆的老年癡呆(AD)。因此對于AD 和MCI 的及時準確的診斷具有重要的意義。
目前大量阿爾茨海默病的診斷依賴醫(yī)師的主觀診斷,醫(yī)師通過與患者的交談觀察等填寫一些評估量表,這個過程耗費大量的精力與時間,而且與醫(yī)師的狀態(tài)和專業(yè)能力具有較大關(guān)聯(lián)程度。神經(jīng)影像學(xué)技術(shù)目前已廣泛用于AD 和MCI 的生物標志物的尋找,如磁共振成像(MRI)可以掃描人腦圖像[2],以便跟蹤大腦結(jié)構(gòu)的變化以及AD 病理學(xué)中神經(jīng)變性方面不可避免的萎縮[3]。因此有大量的研究基于患者的MRI 圖像,使用機器學(xué)習(xí)等算法對患者腦圖像進行診斷識別,然而傳統(tǒng)機器學(xué)習(xí)的輸入數(shù)據(jù)常常是需要人為地提取MRI 圖像特征,以此減小特征的維度來適應(yīng)機器學(xué)習(xí)算法的訓(xùn)練擬合。而目前深度學(xué)習(xí)在圖像識別領(lǐng)域上的成功,給AD 圖像等診斷帶來有前景的希望。
本文采用患者的全腦MRI 圖像,進行一定的預(yù)處理后,設(shè)計一個3D 卷積神經(jīng)網(wǎng)絡(luò)[4]架構(gòu)來對患者進行診斷。在兩個分類實驗AD vs.CN 和AD vs.MCI 上獲得了較高的識別準確率。有望成為AD 與MCI 自動診斷的有力輔助工具。
本文中使用的數(shù)據(jù)全部來自阿爾茨海默氏癥神經(jīng)影像計劃(ADNI)數(shù)據(jù)庫(adni.loni.usc.edu)。ADNI 研究人員收集、驗證和利用數(shù)據(jù),包括MRI 和正電子發(fā)射型計算機斷層顯像(PET)圖像、遺傳學(xué)、認知測試、腦脊液和血液生物標記物作為疾病的預(yù)測因子。在這里,我們傾向于使用非侵入性和廣泛可用的數(shù)據(jù)來作為我們預(yù)測模型的輸入,因此選擇了ADNI 參與者的T1 加權(quán)MRI 圖像。圖像采集系統(tǒng)為GE-Medical Systems,掃描儀的磁場強度為3T??紤]到被試者的縱向檢查數(shù)據(jù)同樣具有AD 和MCI 患者的有效和有用的信息。因此,對46 例AD 患者、121 例MRI 患者和58 例正常人(CN)進行縱向時間點采集,分別獲得148 例、500例、233 例MRI 圖像樣本。
由于原始三維圖像的高維性和相對稀疏的醫(yī)學(xué)數(shù)據(jù),使得深度學(xué)習(xí)算法難以訓(xùn)練和收斂。因此需要對所有的圖像進行預(yù)處理,以便將樣本的所有腦圖像統(tǒng)一到一個坐標空間中,篩除掉多余的部分,如頭骨、眼球、小腦等。在這里,我們設(shè)計了一個嚴格的圖像數(shù)據(jù)預(yù)處理流水線,如圖1 所示。
MRI 預(yù)處理:
(1)使用MRIcron 軟件將數(shù)字成像和醫(yī)學(xué)通信(DICOM)格式的數(shù)據(jù)轉(zhuǎn)換為神經(jīng)成像信息技術(shù)倡議(NIfTI)格式,從而生成重定向的圖像。
(2)使用大腦提取算法(BET)進行大腦提取。
(3)將大腦圖像配準到標準蒙特利爾神經(jīng)研究所(MNI)大腦模板MNI152_T1_1mm_brain。
(4)去除小腦部位體素。
(5)去除多余黑色體素塊,進一步減少維度。
經(jīng)過以上預(yù)處理后,所有MRI 圖像具有相同的140×180×150 體素分辨率。以上所有步驟通過使用MRIcron 與FSL 軟件庫完成的[5]。
圖1 MRI數(shù)據(jù)預(yù)處理步驟
傳統(tǒng)手工設(shè)計的圖像特征往往會損失大量可用的信息,例如較多的研究僅僅基于大腦圖像中某些感興趣區(qū)域,如海馬體、顳葉、扣帶回等區(qū)域,拋棄了大量其他腦部信息。因此診斷結(jié)果的好壞往往取決于手工選擇特征的優(yōu)劣。而目前深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)在圖像領(lǐng)域上的應(yīng)用使得識別等結(jié)果大大提升,優(yōu)點在于無需人為地去提取特征,建立多層卷積模型,直接輸入原始圖像像素,由網(wǎng)絡(luò)逐層自動學(xué)習(xí)最優(yōu)特征。
目前大多數(shù)卷積神經(jīng)網(wǎng)絡(luò)都是二維卷積結(jié)構(gòu),僅僅用于提取圖像的二維平面特征,在大多數(shù)的圖像任務(wù)中已經(jīng)完全足夠了,但MRI 腦圖像為三維圖像,若采用二維卷積,則只能針對某個切片來進行識別。因此基于以上特點,為了保留三維空間的特征,我們設(shè)計了適合三維圖像的三維卷積結(jié)構(gòu),不僅提取圖像的平面特征,還提取三維空間的立體特征。
3D 卷積神經(jīng)網(wǎng)絡(luò)同2D 卷積類似,都是逐層提取圖像特征,每層減小特征圖的尺寸的同時,增加特征圖的個數(shù),以此避免信息的損失,而特征也從像素特征轉(zhuǎn)化為語義特征,像素特征往往人眼還能分辨,但語義特征就相對更加地抽象。將低層像素特征轉(zhuǎn)化到高層語義特征的過程極大減少了特征的維度,然后使用分類器對其語義特征分類。因此卷積層的結(jié)構(gòu)極大影響了特征提取的好壞,我們設(shè)計針對三維圖像的特征提取卷積塊作為單元,如圖2。它由三個操作組成:3D 卷積、批量正則化、ReLU 激活函數(shù)
圖2 3D卷積塊,K表示該層的卷積核個數(shù)
我們的CNN 網(wǎng)絡(luò)架構(gòu)如圖3 所示。MRI 的輸入大小均為140×180×150,然后通過3D 卷積塊組成的網(wǎng)絡(luò)架構(gòu)實現(xiàn)特征提取。特征提取網(wǎng)絡(luò)由三個卷積塊串聯(lián)而成,最終輸出高層特征圖。將MRI 特征圖展平后作為全連接層的輸入,全連接神經(jīng)網(wǎng)絡(luò)有一個隱藏層,結(jié)點數(shù)為100,最后用sigmoid 函數(shù)作為輸出層分類。
圖3 基于3D卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
在我們的實現(xiàn)中,所有卷積核的大小為3×3×3,步長為2×2×2,padding 為SAME,三個卷積層的卷積核數(shù)分別設(shè)置為16、32、64。所有池層的大小設(shè)置為3×3×3,步長大小為2×2×2。全連接層節(jié)點數(shù)分別為100、2。所有層均采用ReLu 函數(shù)作為非線性激活函數(shù)。
在深度學(xué)習(xí)算法的參數(shù)學(xué)習(xí)中,通常使用反向傳播(BP)算法,這是一種適合于多層神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法,建立在梯度下降法的基礎(chǔ)上。BP 算法的學(xué)習(xí)過程由正向傳播過程和反向傳播過程組成。在正向傳播過程中,輸入信息通過輸入層經(jīng)中間卷積層,逐層計算并傳向輸出層。如果在輸出層得不到期望的輸出值,則計算輸出與標簽的某種誤差作為目標函數(shù),在分類問題中,常常使用交叉熵損失函數(shù)作為目標函數(shù),在反向傳播時,需要逐層求出目標函數(shù)對鄰近層的梯度,計算出每層的誤差,最后更新權(quán)重。
由于數(shù)據(jù)量相對較少,為了避免隨機因素對預(yù)測結(jié)果的影響,訓(xùn)練和測試過程采用5 倍交叉驗證。并且為了保證每份數(shù)據(jù)集中的各類別的樣本數(shù)量具有相同的分布比例,我們采用分層抽樣。所提出的算法是用Google 的開源TensorFlow 框架實現(xiàn)的,TensorFlow框架也是世界上使用最廣泛的用于深度學(xué)習(xí)的開源框架。所有的計算都是在一臺裝有GPU NVIDIA GTX1080 的服務(wù)器上進行的。三維卷積核和全連接權(quán)值參數(shù)用截斷正態(tài)分布隨機數(shù)初始化,標準偏差為0.1。Adam 優(yōu)化算法[6]用于最小化交叉熵損失。學(xué)習(xí)率為0.001,batchsize 大小為16,迭代次數(shù)為300。
為了比較和評估分類器的性能,每次計算出測試集樣本的混淆矩陣,如圖4,混淆矩陣表示了樣本的分類結(jié)果和實際測得值之間的誤差。通過混淆矩陣可以計算各種評估指標,如醫(yī)學(xué)領(lǐng)域由于正負樣本數(shù)量分布不均而常用的準確率(ACC)、靈敏度(SEN)、特異性(SPE)等指標。靈敏度即實際正類而被預(yù)測為正類的概率,特異度即實際負類而被預(yù)測為負類的概率。所以靈敏度高可認為漏診率低,特異性高可認為誤診率低,理想情況是希望兩者都很高。
圖4
我們一共進行了兩個分類實驗,分別為AD vs.CN和AD vs.MCI,結(jié)果匯總?cè)绫?。AD 與CN 的分類平均準確率達到95%,標準差也在3%以內(nèi),說明我們構(gòu)建的模型有效的分類。而AD 與MCI 的平均準確率為85%,這個任務(wù)稍低的原因在于,MCI 作為CN 與AD的過渡狀態(tài),在大腦組織變化上已經(jīng)有了很大的區(qū)分,因此相對來說更難將其分開。
表1 提出的CNN 模型對AD vs.CN 和AD vs.MCI 分類的預(yù)測結(jié)果
通過繪制模型五倍交叉驗證的ROC 曲線,顯示于圖5,計算得到AUC 分別達到0.983 和0.966,ROC 曲線有一個巨大的優(yōu)勢就是,當正負樣本的分布發(fā)生變化時,其形狀能夠基本保持不變,而P-R 曲線的形狀一般會發(fā)生劇烈的變化,因此該評估指標能降低不同測試集帶來的干擾,更加客觀地衡量模型本身的性能。
圖5
通過構(gòu)建適合三維腦圖像數(shù)據(jù)的3D 卷積神經(jīng)網(wǎng)絡(luò)模型,對AD 與CN,AD 與MCI 兩個分類任務(wù)均有不錯的診斷性能,經(jīng)過五倍交叉驗證,AD vs CN 模型的平均準確率達到96.8%,模型AUC 值達到0.983。對于AD vs MCI 這個相對較難的分類,使用同樣的網(wǎng)絡(luò)架構(gòu)仍然有較高的準確率94.7%,AUC 值為0.966。說明該3D 卷積結(jié)構(gòu)具有較好的特征提取能力,有望成為AD、MCI 的自動診斷工具。