楊夢(mèng)雅 侯 雯 楊 鵬 鄒文斌 汪天富 雷柏英*
1(深圳大學(xué)醫(yī)學(xué)部生物醫(yī)學(xué)工程學(xué)院,廣東省生物醫(yī)學(xué)信息檢測(cè)和超聲成像重點(diǎn)實(shí)驗(yàn)室,廣東 深圳 518060)2(深圳大學(xué)信息工程學(xué)院,廣東 深圳 518060)
阿爾茨海默病(Alzheimer′s disease, AD)是導(dǎo)致癡呆癥的主要原因,60%~80%的老年癡呆癥都因此引起。AD主要損害患者的腦部認(rèn)知、記憶和情緒等功能,導(dǎo)致其不能獨(dú)立正常生活和社交,是一種不可逆的神經(jīng)退行性疾病。目前,輕度認(rèn)知障礙(mild cognitive impairment, MCI)已經(jīng)被廣泛認(rèn)為是正常老化向AD及其他老年癡呆癥轉(zhuǎn)變的前驅(qū)階段[1],一旦患者由輕度認(rèn)知障礙發(fā)展成AD,則無(wú)有效的治愈方法。AD臨床上的主要癥狀為:記憶力障礙、失語(yǔ)、執(zhí)行功能障礙,更有甚者發(fā)生人格和行為改變等[2]。隨著社會(huì)發(fā)展,老齡化速度加快,AD的發(fā)病率逐年升高。AD主要發(fā)生在65歲以上的高齡者,而且每增加5歲,患者人數(shù)增加一倍[3]。85歲以上患AD的人可高達(dá)23~33%[4]。據(jù)“世界阿爾茨海默病2016年報(bào)告”統(tǒng)計(jì),全球AD患者約為4 700萬(wàn)人,遠(yuǎn)超于西班牙的總?cè)丝?,隨著人口的老齡化加劇,預(yù)計(jì)到2050年AD患者將達(dá)到1億3 100萬(wàn)。AD對(duì)經(jīng)濟(jì)也產(chǎn)生了巨大的影響,全球總花費(fèi)大約在8 180億美元,預(yù)計(jì)在2018年將增加至1萬(wàn)億[5],給家庭和社會(huì)都帶來(lái)了巨大影響。在AD的治療過(guò)程中,醫(yī)生需要密切監(jiān)測(cè)患者的病情,并根據(jù)病情及時(shí)調(diào)整治療計(jì)劃。在臨床上,神經(jīng)科醫(yī)師常常根據(jù)癡呆量表的評(píng)分初步判斷腦疾病類(lèi)型和嚴(yán)重程度,常用的量表有簡(jiǎn)易精神狀態(tài)檢查量表(mini-mental state examination, MMSE)、臨床癡呆量表-GLOB (the clinical dementia rating-global, CDR-GLOB)、臨床癡呆量表-SOB (the clinical dementia rating scale sum of boxes,CDR-SOB)、阿爾茨海默病癥評(píng)估認(rèn)知分量表(Alzheimer′s disease assessment scale-cognitive subscale,ADAS-cog)。目前,學(xué)者們通常采用神經(jīng)影像如結(jié)構(gòu)磁共振成像(magnetic resonance imaging, MRI)[6]及正電子發(fā)射斷層掃描(positron emission tomography, PET)數(shù)據(jù)進(jìn)行臨床評(píng)分預(yù)測(cè)。
當(dāng)前,評(píng)分預(yù)測(cè)所面臨的一個(gè)問(wèn)題是神經(jīng)影像數(shù)據(jù)的特征維數(shù)比較高,選擇效果差。針對(duì)這個(gè)問(wèn)題,一般有兩種解決方案,一種是特征選擇,另一種是子空間學(xué)習(xí)[7]。特征選擇常用的方法有t檢驗(yàn)、卡方檢驗(yàn)、稀疏模型等[8],均有利于發(fā)現(xiàn)與疾病相關(guān)的生物標(biāo)記物。子空間學(xué)習(xí)是將高維數(shù)據(jù)投影到低維空間后進(jìn)行分析,可以有效地揭示患者的病情[9]。將特征選擇與子空間結(jié)合,可更加精準(zhǔn)地預(yù)測(cè)患者的臨床評(píng)分[10]。
傳統(tǒng)的臨床評(píng)分預(yù)測(cè)主要是利用單一時(shí)間點(diǎn)數(shù)據(jù)進(jìn)行評(píng)分預(yù)測(cè),缺乏多時(shí)間點(diǎn)數(shù)據(jù)的使用,有一定的局限性,而縱向研究的方法[11]可以充分地探索AD的發(fā)展進(jìn)程?;诖?,本研究擬設(shè)計(jì)一個(gè)包含兩種情形的縱向研究框架。在情形1中,訓(xùn)練基線數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)時(shí)間點(diǎn)的臨床評(píng)分。在情形2中,訓(xùn)練被測(cè)時(shí)間點(diǎn)之前的所有數(shù)據(jù)來(lái)預(yù)測(cè)該時(shí)間點(diǎn)的臨床評(píng)分。此外,情形2還解決了多個(gè)時(shí)間點(diǎn)評(píng)分預(yù)測(cè)中經(jīng)常出現(xiàn)的數(shù)據(jù)不完整問(wèn)題。針對(duì)數(shù)據(jù)不完整問(wèn)題,常用的處理方法是將那些缺失數(shù)據(jù)的受試者從提取的數(shù)據(jù)中移除,但這種方法會(huì)導(dǎo)致可用的受試者數(shù)量減少。另一種處理方法是使用插值法來(lái)填補(bǔ)缺失評(píng)分,這種方法比較依賴于時(shí)間的平滑性,一旦受試者的情況突然惡化,預(yù)測(cè)結(jié)果可能會(huì)產(chǎn)生偏差??紤]到以上不足,本研究提出結(jié)合被測(cè)時(shí)間點(diǎn)之前所有可用的數(shù)據(jù)來(lái)研究MRI數(shù)據(jù)與臨床評(píng)分的關(guān)系,然后根據(jù)相應(yīng)的MRI數(shù)據(jù)估計(jì)缺失評(píng)分。
具體的回歸方法由3個(gè)過(guò)程組成,首先是基于相關(guān)熵與時(shí)間約束聯(lián)合(correntropy and temporal constraints,CT)的特征選擇;其次是基于深度多項(xiàng)式網(wǎng)絡(luò)(deep polynomial network,DPN)的集成特征編碼(ensemble feature encoding,DE);最后是支持向量回歸(support vector regression,SVR),整個(gè)過(guò)程簡(jiǎn)稱為CTDE。對(duì)于特征選擇,通過(guò)時(shí)間約束組LASSO模型[12]找出不同時(shí)間點(diǎn)中最相關(guān)的特征,并利用相關(guān)熵[13]消除離群值。對(duì)于特征編碼,采用DPN[14-17]算法處理,該算法是一種特殊類(lèi)型的深度學(xué)習(xí)[18]系統(tǒng)。
圖1 相關(guān)熵正則化深度聯(lián)合回歸流程Fig.1 Flowchart of the correntropy regularized deep joint regression
本研究從阿爾茨海默病神經(jīng)影像學(xué)ADNI數(shù)據(jù)庫(kù)(Alzheimer′s Disease Neuroimaging Initiative,http://adni.loni.ucla.edu/)獲得共805名受試者的基線數(shù)據(jù),分別在兩種情形下進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)表明,所提出的CTDE整體模型對(duì)評(píng)分的預(yù)測(cè)效果要優(yōu)于僅具有特征選擇或僅具有特征編碼的部分模型。通過(guò)實(shí)驗(yàn)與現(xiàn)有方法[19-21]相比的結(jié)果,CTDE模型可以得到相似甚至更好的結(jié)果,證明了所提出的方法的有效性。
所采用方法的具體流程如圖1所示,整體流程大致分為:獲取多時(shí)間點(diǎn)(基線、第6個(gè)月,…,第36個(gè)月)MRI影像數(shù)據(jù),提取感興趣區(qū)域向量作為特征輸入,基于相關(guān)熵與時(shí)間約束聯(lián)合(correntropy and temporal constraints,CT)方法進(jìn)行特征選擇,根據(jù)學(xué)習(xí)得到的權(quán)重參數(shù)選取權(quán)重較大的特征,獲得區(qū)分力較大的特征以減少噪聲特征的干擾;其次是基于深度多項(xiàng)式網(wǎng)絡(luò)DPN的集成特征編碼,最后利用支持向量回歸進(jìn)行回歸預(yù)測(cè)。
實(shí)驗(yàn)中提出在兩種情形下實(shí)現(xiàn)疾病的預(yù)測(cè)回歸。在情形1中,通過(guò)訓(xùn)練基線數(shù)據(jù)預(yù)測(cè)未來(lái)時(shí)間點(diǎn)的臨床評(píng)分;在情形2中,訓(xùn)練被測(cè)時(shí)間點(diǎn)之前所有可用的數(shù)據(jù)來(lái)預(yù)測(cè)該時(shí)間點(diǎn)的臨床評(píng)分,從而有效地提高評(píng)分預(yù)測(cè)的精度。具體的流程如圖2所示。
圖2 評(píng)分預(yù)測(cè)流程。(a)情形1;(b)情形2Fig.2 Two scenarios for score prediction. (a) Scenario 1;(b) Scenario 2
從公共數(shù)據(jù)庫(kù)ADNI數(shù)據(jù)庫(kù)上獲得共805位受試者基線狀態(tài)數(shù)據(jù),包含人口統(tǒng)計(jì)信息、醫(yī)學(xué)影像數(shù)據(jù)、臨床評(píng)分。分別采集受試者的第6個(gè)月、 第12個(gè)月、第18個(gè)月、第24四個(gè)月、第36個(gè)月數(shù)據(jù)信息,但由于很多受試者由于各種原因而在中途退出,所以后面時(shí)間點(diǎn)的受試者數(shù)量逐漸減少。后面時(shí)間點(diǎn)獲取到的受試者情況如下表1所示, 其中A表示具有MRI數(shù)據(jù)的受試者,B表示既具有MRI又具有量表評(píng)分的受試者。
表1 MRI數(shù)據(jù)和評(píng)分
選擇T1-加權(quán)MRI影像數(shù)據(jù)、MMSE、CDR-SOB、CDR-GLOB、ADAS-cog等4種臨床評(píng)分,作為研究對(duì)象。
原始圖像需要經(jīng)過(guò)預(yù)處理以剔除明顯的結(jié)構(gòu)損傷和掃描偽影等噪聲信息,預(yù)處理部分包括:頭骨分離,ACPC矯正,分割得到灰質(zhì)(grey matter)、白質(zhì)(white matter)和腦脊液(cerebrospinal fluid),使用模板對(duì)大腦進(jìn)行匹配并生成93個(gè)相應(yīng)的感興趣區(qū)域(region of interest,ROI),提取這些區(qū)域的灰質(zhì)體積量作為輸入特征變量。
假設(shè)實(shí)驗(yàn)共計(jì)有N個(gè)受試者,第i個(gè)受試者在T個(gè)不同時(shí)間點(diǎn)上獲得的神經(jīng)影像數(shù)據(jù)表示為xi1,…,xit,…,xiT,其中,xit∈R1×D是一個(gè)D維行向量。Xt=x1 t,…,x2 t,…,xNt∈RN×D表示輸入訓(xùn)練數(shù)據(jù)矩陣,yt∈RN×1表示t時(shí)間點(diǎn)對(duì)應(yīng)的臨床預(yù)測(cè)評(píng)分。通過(guò)經(jīng)典的組LASSO回歸模型進(jìn)行特征選擇,表示為
(1)
(2)
同時(shí)也引入了相關(guān)熵消除訓(xùn)練數(shù)據(jù)中的潛在離群值、非高斯噪聲、脈沖噪聲。相關(guān)熵計(jì)算式如下:
(3)
式中,ρ1、ρ2都是參數(shù),在不同的規(guī)則和約束下會(huì)選擇魯棒性好并且信息豐富的特征。
采用加速梯度法(accelerated gradient methods, AGM)[24]來(lái)求解式(3)。傳統(tǒng)的梯度法每次迭代中只使用最近的點(diǎn)作為當(dāng)前的搜索點(diǎn),而AGM使用前兩個(gè)點(diǎn)的線性組作為新的搜索點(diǎn),收斂速度更快。算法1描述了優(yōu)化算法的整體過(guò)程,其中,k是迭代索引,K是最大迭代次數(shù),L是正則化參數(shù)。首先將式(3)中的目標(biāo)函數(shù)f(W)分為平滑部分fs(W)和非平滑部分fns(W),計(jì)算式如下:
(4)
(5)
在Wk處對(duì)其泰勒一階展開(kāi),構(gòu)造f(W)的逼近函數(shù)
(6)
Uk=Wk+βkWk-Wk-1
(7)
式中,βk是參數(shù)。
因此,W在不斷更新,有
式中,V=Wk-1/Lkf′s(Wk),wj和vj分別代表W和V的第j行。
通過(guò)遵循Aremijo-Goldstein準(zhǔn)則,使用線搜索的方法得到Lk,直接將問(wèn)題轉(zhuǎn)換為D個(gè)獨(dú)立的子問(wèn)題,采用以下公式來(lái)計(jì)算Wk+1,有
(8)
算法1:基于組學(xué)習(xí)的熵優(yōu)化算法 輸入: ρ0>0,ρ1>0,L0>0,W0,K 輸出:WK+1 1: 初始化W1=W0,α-1=0, α0=1, and L=L0 2: for k=1 to K do 3: βk=αk-2-1αk-1,Uk=Wk+βkWk-Wk-1() 4: 更新等式(8)中的Wk+1 5: 在 {Lk-1 2Lk-1…}找到最小值L 使得f(Wk+1)≤gLk,UkWk+1(): 6: 更新Lk=L 7: αk=1+1+4α2k2 8: 結(jié)束
DPN是一種新興的有監(jiān)督的深度學(xué)習(xí)算法,具有扎實(shí)的理論基礎(chǔ)。因?yàn)樗且粋€(gè)逐層學(xué)習(xí)的算法,每個(gè)節(jié)點(diǎn)的輸出結(jié)果是輸入空間的一個(gè)線性函數(shù)或者二次函數(shù),所以學(xué)習(xí)預(yù)測(cè)因子就變?yōu)檩斎肟臻g上的多項(xiàng)式函數(shù)。DPN的一大優(yōu)勢(shì)是可以基于自身網(wǎng)絡(luò)結(jié)構(gòu),在有限樣本數(shù)據(jù)集上可以表示任意函數(shù)。其網(wǎng)絡(luò)深度就是層級(jí)數(shù),寬度是任意單一層中最大的節(jié)點(diǎn)數(shù)。
經(jīng)過(guò)本文第1.2節(jié)的特征選擇后,假設(shè)每位受試者的數(shù)據(jù)具有M維特征,且M x1,y1,x2,y2,…,xN,yN (9) 式中,xi∈R1×M,yi是相應(yīng)的標(biāo)簽值。 因?yàn)橛?xùn)練數(shù)據(jù)按照時(shí)間順序依次進(jìn)入DPN,所以這里省略了時(shí)間下標(biāo)。訓(xùn)練數(shù)據(jù)通過(guò)一級(jí)多項(xiàng)式函數(shù)得到一組相應(yīng)的值,可表示為 (10) (11) 式中,F(xiàn)1表示矩陣F1的列數(shù),F(xiàn)i表示矩陣F的第i個(gè)列向量,°表示Hadamard乘積運(yùn)算。 (12) 也就是特征編碼矩陣。 經(jīng)過(guò)選擇和編碼后的特征被送到SVR進(jìn)行評(píng)分預(yù)測(cè)。與支持向量機(jī)(support vector machine, SVM)[25]相似的是,SVR旨在對(duì)最大邊緣超平面進(jìn)行處理,輸入的訓(xùn)練樣本經(jīng)過(guò)核函數(shù)處理,會(huì)將其映射到一個(gè)分類(lèi)間隔盡可能寬的高維度空間。然后,將測(cè)試樣本映射到同一空間,這樣就可以識(shí)別出測(cè)試樣本所對(duì)應(yīng)的類(lèi)別。 (13) 假設(shè)訓(xùn)練樣本包含N個(gè)受試者,R是N×P維度空間,G是P層預(yù)測(cè)結(jié)果的權(quán)重向量。在P×1維度空間中,Gi是權(quán)重向量G的第i個(gè)元素,而Y是實(shí)際評(píng)分向量。先求解式(13)的線性約束最小二乘問(wèn)題,然后,將通過(guò)不同層級(jí)特征獲得的臨床預(yù)測(cè)評(píng)分進(jìn)行集成,最終獲得最優(yōu)權(quán)重。 從公共數(shù)據(jù)庫(kù)ADNI上獲得共805位受試者的基線數(shù)據(jù),在5個(gè)不同時(shí)間點(diǎn)對(duì)受試者進(jìn)行回訪。因?yàn)樵诤罄m(xù)的時(shí)間里,受試者會(huì)由于各種原因而退出,所以最后得到的縱向數(shù)據(jù)并不是完整的。下面是具體的實(shí)驗(yàn)過(guò)程:以基線數(shù)據(jù)為基礎(chǔ),在后面5個(gè)時(shí)間點(diǎn)進(jìn)行隨訪,分別得到725、675、282、479、50例受試者的MRI數(shù)據(jù),但分別只得到705、637、247、430、50人相應(yīng)的臨床得分。計(jì)算得到預(yù)測(cè)評(píng)分與實(shí)際評(píng)分計(jì)算平均絕對(duì)誤差(mean absolute error,MAE)和皮爾森相關(guān)系數(shù)R(Pearson correlation coefficient),根據(jù)MAE值和R值評(píng)估預(yù)測(cè)的性能,相關(guān)的定義如下: (14) (15) 在情形1中,因?yàn)槊看沃粚?duì)未來(lái)的某一時(shí)間點(diǎn)進(jìn)行預(yù)測(cè)評(píng)分,所以相關(guān)熵時(shí)間約束聯(lián)合學(xué)習(xí)就降級(jí)為相關(guān)熵正則化LASSO模型,也就是由CTDE模型變?yōu)镃DE模型。因?yàn)镃DE模型是一個(gè)復(fù)合模型,所以將其與局部模型、SVR、相關(guān)熵學(xué)習(xí)(CL)、DPN、DPN集成編碼輸出(DE)分別進(jìn)行比較,來(lái)驗(yàn)證每個(gè)局部模型的作用,同時(shí)驗(yàn)證復(fù)合模型CDE的整體性能,比較結(jié)果在表2、3中列出。 表2 CDE模型和局部模型平均絕對(duì)誤差(MAE)的比較 表3 CDE模型和局部模型皮爾森相關(guān)系數(shù)(R)的比較 從表2和表3中可以看出,通過(guò)CDE模型獲得的預(yù)測(cè)評(píng)分比相關(guān)熵學(xué)習(xí)(CL)、DPN集成編碼輸出(DE)更精準(zhǔn),不但R值變大,而且MAE值也有所減小。此外,CDE模型獲得了最小的MAE值和最大的R值。 在情形2中,當(dāng)對(duì)某一時(shí)間點(diǎn)進(jìn)行預(yù)測(cè)時(shí),需要結(jié)合該時(shí)間點(diǎn)之前的所有數(shù)據(jù)來(lái)進(jìn)行臨床評(píng)分預(yù)測(cè)。但是由于部分受試者只有MRI數(shù)據(jù),缺少了臨床評(píng)分?jǐn)?shù)據(jù),所以采用CTDE模型填充這些受試者的臨床評(píng)分?jǐn)?shù)據(jù),與之前不完整的數(shù)據(jù)結(jié)合,形成完整數(shù)據(jù),用于未來(lái)時(shí)間點(diǎn)的評(píng)分預(yù)測(cè)。如果沒(méi)有填充缺失評(píng)分這個(gè)過(guò)程,該模型就會(huì)被視為不完整的CTDE模型。圖3是CDE模型、不完整的CTDE模型和CTDE模型這3種模型下的MAE折線圖。從圖中可以看出,CTDE模型獲得的MAE值最小,預(yù)測(cè)精度明顯提高,主要原因是訓(xùn)練樣本的數(shù)量大幅度增加,從而有了更大范圍的臨床評(píng)分。如若調(diào)整數(shù)據(jù)填充方法,MAE的值會(huì)進(jìn)一步減少。 為了進(jìn)一步分析CTDE模型的性能,通過(guò)CTDE模型獲得的縱向時(shí)間點(diǎn)的實(shí)際評(píng)分作為x軸數(shù)據(jù),預(yù)測(cè)評(píng)分作為y軸數(shù)據(jù),繪制散點(diǎn)圖,如圖4所示,在每個(gè)散點(diǎn)圖中有兩條線,虛線是參考線,用來(lái)判斷預(yù)測(cè)評(píng)分與實(shí)際評(píng)分的接近程度;實(shí)線是回歸線,通過(guò)最小二乘回歸方法得到。其中,參考線和回歸線越靠近,預(yù)測(cè)效果就越好。從圖4中可以看出,臨床預(yù)測(cè)評(píng)分和實(shí)際臨床評(píng)分在一定的范圍內(nèi)具有很高的相關(guān)性,預(yù)測(cè)評(píng)分越接近實(shí)際評(píng)分,CTDE模型預(yù)測(cè)的越精準(zhǔn)。 將所提出方法與目前最先進(jìn)的技術(shù)方法[19-21]進(jìn)行比較,得到4個(gè)不同時(shí)間點(diǎn)的MAE值和R值,如圖5所示。從實(shí)驗(yàn)結(jié)果可以看出,所提出的CTDE模型獲得了最低的MAE值和最高的R值,預(yù)測(cè)效果最好。 在AD早期,雖然內(nèi)側(cè)顳葉皮層的萎縮速率最為明顯,最能預(yù)測(cè)AD的進(jìn)展[26],但是到晚期,前額葉、頂葉、顳葉后部扣帶回的萎縮速率明顯增加。情節(jié)記憶,特別是言語(yǔ)性情節(jié)記憶受損的嚴(yán)重程度是判斷MCI是否進(jìn)展為AD的重要指標(biāo);海馬萎縮是預(yù)測(cè)MCI是否轉(zhuǎn)化為AD的有效指標(biāo)??偟膩?lái)說(shuō),AD患者神經(jīng)元的退行性使大腦重量減輕和體積縮小、額葉、頂葉和顳葉皮質(zhì)萎縮,杏仁核、海馬和海馬回受累可能會(huì)更加明顯,白質(zhì)和深部灰質(zhì)的體積縮小。 在式(3)的特征選擇模型中,系統(tǒng)得到與MMSE、CDR-SOB、CDR-GLOB、ADAS-cog等4種量表評(píng)分最相關(guān)的ROIs,分別有67個(gè)、43個(gè)、67個(gè)、74個(gè),如圖6所示。為了展示與疾病相關(guān)的ROIs,筆者通過(guò)使用mricron軟件從大腦從上至下切割,選取9個(gè)有代表性的切片。其中,不同顏色代表著不同的感興趣區(qū)域,權(quán)重越大的感興趣區(qū)域則顏色越深(如紅色)。我們的模型得到與疾病相關(guān)的區(qū)域如海馬區(qū)、杏仁核、顳下回等,并且這些區(qū)域在文獻(xiàn)[27]中被發(fā)現(xiàn)可以作為AD生物標(biāo)志物。 本研究提出了一種新穎有效的方法,實(shí)現(xiàn)阿爾茨海默病的臨床評(píng)分預(yù)測(cè),輔助醫(yī)生對(duì)患者進(jìn)行早期診斷和治療,并通過(guò)廣泛的實(shí)驗(yàn)來(lái)研究其有效性。Lasso 是一個(gè)在回歸和分類(lèi)領(lǐng)域應(yīng)用廣泛的特征選擇方法,能夠用模型系數(shù)的絕對(duì)值函數(shù)作為懲罰來(lái)壓縮模型系數(shù),使得絕對(duì)值較小的系數(shù)變?yōu)?,同時(shí)實(shí)現(xiàn)顯著性變量和對(duì)應(yīng)參數(shù)的估計(jì)。而在本研究的實(shí)際問(wèn)題中,腦區(qū)特征是組結(jié)構(gòu),因此提出基于組Lasso方法建立相關(guān)熵與時(shí)間約束聯(lián)合的特征選擇模型,再通過(guò)DPN網(wǎng)絡(luò)進(jìn)行特征編碼,最后應(yīng)用于SVR回歸模型,實(shí)現(xiàn)疾病的自動(dòng)診斷和預(yù)測(cè)。 在情形1中,加入了組Lasso和深度多項(xiàng)式網(wǎng)絡(luò)DPN的CDE模型,與單獨(dú)的Lasso、DPN方法實(shí)驗(yàn)結(jié)果相比,精確度上獲得了最佳,主要是因?yàn)橥ㄟ^(guò)組Lasso[28]特征選擇方法,舍去權(quán)重為0 的特征,篩選出權(quán)重較大的特征。此外,加入相關(guān)熵以減少噪聲特征的干擾,也能降低數(shù)據(jù)維度,加快模型訓(xùn)練速度。而DPN的使用進(jìn)一步提高了模型的預(yù)測(cè)精度,其主要原因是DPN在數(shù)據(jù)集數(shù)量少的情況下,可以通過(guò)多層網(wǎng)絡(luò)挖掘出數(shù)據(jù)中更深層的特征表示[18],從而提升相關(guān)腦區(qū)特征的表達(dá)能力。最后將DPN每一層的結(jié)果進(jìn)行集成處理,主要是因?yàn)镈PN每一層的輸出結(jié)果分別送入SVR,得到預(yù)測(cè)結(jié)果,根據(jù)式(14)進(jìn)行計(jì)算,如圖7所示??梢园l(fā)現(xiàn),DPN的每一層特征都攜帶有一定的信息,而第一層特征比其他層攜有更多的可識(shí)別性信息,相應(yīng)的預(yù)測(cè)評(píng)分也要比其他層更精準(zhǔn)。因此集成所有級(jí)聯(lián)層的結(jié)果作為輸出,而不是只選擇某一層的輸出結(jié)果作為最終結(jié)果,以此來(lái)避免模型性能的不穩(wěn)定性。 圖3 CDE模型(情形1)、不完整的CTDE模型(無(wú)數(shù)據(jù)填充的情形2)和CTDE模型的實(shí)驗(yàn)結(jié)果比較。(a)MMSE;(b)CDR-SOB;(c)CDR-GLOB;(d)ADAS-cogFig.3 MAE comparisons between CDE (scenario 1), CTDE incomplete (scenario 2 without data filling), and CTDE. (a)MMSE;(b)CDR-SOB;(c)CDR-GLOB;(d)ADAS-cog. 圖4 通過(guò)CTDE模型獲得的預(yù)測(cè)評(píng)分與實(shí)際評(píng)分的散點(diǎn)圖(實(shí)線是回歸線,虛線是參考線。當(dāng)兩線越靠近時(shí),回歸精度越高)。(a)MMSE;(b)CDR-SOB;(c)CDR-GLOB;(d)ADAS-cogFig.4 Scatter plots of ground truth versus predicted scores predicted by CTDE method(The dotted line represents reference line and the solid line represents regression line). Regression accuracy is higher when two lines are closer. (a)MMSE;(b)CDR-SOB;(c)CDR-GLOB;(d)ADAS-cog. 圖5 CTDE模型與最先進(jìn)方法的實(shí)驗(yàn)結(jié)果比較(oRF-L1-soft-long: 基于L1范數(shù)隨機(jī)森林軟分離的縱向回歸預(yù)測(cè); DBN: 深度信念網(wǎng)絡(luò); R2DLSR: 基于多重關(guān)系的判別式最小二乘回歸預(yù)測(cè))。(a)MAE;(b)RFig.5 Result comparisons between the proposed model and state-of-the-art methods (oRF-L1-soft-long, oblique RF with L1 and soft split and longitudinal prediction; DBN: deep belief network; R2DLSR, relational-regularized discriminative least squares regression). (a)MAE; (b)R 在情形2中,其臨床評(píng)分的預(yù)測(cè)結(jié)果要優(yōu)于情形1,但CDR-GLOB與ADAS-cog評(píng)分的結(jié)果并不是很理想,原因主要除醫(yī)生在對(duì)患者進(jìn)行量表評(píng)分時(shí)具有一定的主觀性之外,還可能與患者當(dāng)時(shí)的心情、身體狀態(tài)有關(guān)。從4種量表實(shí)驗(yàn)結(jié)果來(lái)看,通過(guò)使用所有可用的數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)時(shí)間的受試者臨床評(píng)分,可以考慮到同一受試者在同一時(shí)間點(diǎn)腦區(qū)之間的關(guān)系,也可以考慮到不同時(shí)間點(diǎn)同一被試者的MRI數(shù)據(jù)、臨床評(píng)分之間的關(guān)聯(lián)性。同時(shí)通過(guò)受試者的MRI數(shù)據(jù)去預(yù)測(cè)其缺失的評(píng)分,并進(jìn)行評(píng)分補(bǔ)全,這意味著訓(xùn)練模型的數(shù)據(jù)大幅度增加,從而在一定程度上提升整體模型的預(yù)測(cè)精度。 本研究依然存在一些不足,首先通過(guò)MRI影像數(shù)據(jù)和臨床評(píng)分來(lái)進(jìn)行實(shí)驗(yàn),并沒(méi)有考慮AD的生理病理因素、心理社會(huì)性因素等,這將在今后的工作中逐步探索。另外,未就預(yù)測(cè)評(píng)分和實(shí)際評(píng)分的差異進(jìn)行顯著性檢驗(yàn)。最后是實(shí)驗(yàn)樣本數(shù)量有限,雖然在一定程度上能夠體現(xiàn)方法的評(píng)價(jià)性能,但是更多的數(shù)據(jù)會(huì)更具說(shuō)服力。因此,在未來(lái)的工作中,將采集更多的MRI、PET等多模態(tài)數(shù)據(jù)進(jìn)行實(shí)驗(yàn),并嘗試采集本地醫(yī)院的AD數(shù)據(jù)進(jìn)行模型測(cè)試,提高模型的穩(wěn)定性,提高計(jì)算機(jī)輔助診斷的性能。 為了研究AD的縱向評(píng)分預(yù)測(cè),本研究將兩種情形回歸框架進(jìn)行分組,得到一個(gè)有效的回歸模型。實(shí)驗(yàn)結(jié)果證明,所提出的回歸框架可以獲得預(yù)測(cè)精度較高的臨床評(píng)分,并且在ROI的選擇一致性方面表現(xiàn)出良好的性能。1.4 加權(quán)集成評(píng)分預(yù)測(cè)
1.5 實(shí)驗(yàn)設(shè)置
2 結(jié)果
2.1 情形1:基線數(shù)據(jù)預(yù)測(cè)
2.2 情形2:縱向數(shù)據(jù)預(yù)測(cè)
2.3 最具識(shí)別力的大腦區(qū)域
3 討論
4 結(jié)論