陳靖,靳晨,滕升華
(山東科技大學電子通信與物理學院,青島 266590)
阿爾茨海默病(alzheimer's disease,AD )是一種以腦功能衰退為特征的神經(jīng)退行性疾病,是老年癡呆最常見的形式[1-2]。2015年根據(jù)國際相關(guān)組織報告,隨著人口老齡化,AD發(fā)病率呈明顯上升趨勢,預計在現(xiàn)有AD患者的基礎(chǔ)上,每20年增加1倍,估算到2050年將達到1億人以上[3]。研究表明,及時診斷、發(fā)現(xiàn)AD前期階段—輕度認知障礙(mild cognitive impairment,MCI)并進行相關(guān)治療,可延緩甚至避免MCI發(fā)展惡化為AD,是防治AD的有效手段之一[4-5]。
到目前為止,已有多種生物標志物顯示出對AD診斷的敏感性,從而眾多分類方法被開發(fā)并應用于識別AD、MCI和健康對照組(healthy control,HC),其中支持向量機(support vector machine,SVM)對小樣本學習操作簡單且識別率高而被廣泛應用,但處理高維腦影像數(shù)據(jù)其準確率并不能令人滿意[4-9]。
高斯過程分類(gaussian process classification,GPC)是一種基于概率判別和核函數(shù)的貝葉斯機器學習方法,其分類思想是假設(shè)映射函數(shù)服從均值為協(xié)方差矩陣(即核函數(shù))為K的高斯分布先驗,然后通過貝葉斯推理獲得合適的,使之能夠?qū)y試樣本類別進行概率預測[10-11]。GPC在識別分類研究中展現(xiàn)出良好的性能,Bazi把GPC應用到遙感圖像的分類上,比較了在不同的核函數(shù)和近似方法下的分類結(jié)果,同時在與SVM的精度比較上取得了更好的結(jié)果[12];Chen將GPC和深度信念網(wǎng)絡(luò)結(jié)合,應用于音樂情感檢測系統(tǒng),結(jié)果顯示性能良好[13];黃維在人臉識別分類中使用GPC,并成功解決了多分類問題[14];耿雪青將GPC應用于運動想象腦電信號分類,并與SVM分類進行比較,證明了該方法的有效性[15]。
對AD分類的研究,可供使用的有標記腦影像數(shù)據(jù)仍然相對較少。利用GPC解決有監(jiān)督分類問題,訓練樣本數(shù)量是影響識別率的一個重要因素,若樣本數(shù)量不足可能會造成類內(nèi)協(xié)方差矩陣奇異或者協(xié)方差矩陣的逆陣不穩(wěn)定,使得映射函數(shù)的后驗概率參數(shù)無法進行估計,除此之外,小樣本問題還會使結(jié)果產(chǎn)生較大的偶然性。為了緩解訓練樣本數(shù)量少的問題,可以采用無標記樣本參與訓練。一種做法是半監(jiān)督分類[16],即用部分未標記數(shù)據(jù)和標記數(shù)據(jù)聯(lián)合進行模式分析,但算法通常較為復雜。本研究設(shè)計一種分步的分類模式:先進行一次高斯過程分類,把分類結(jié)果確定性強的測試樣本作為補充參與訓練,以此增加訓練樣本數(shù)量;再對后驗概率差異較小、容易造成錯分的樣本進行二次分類。利用更多的訓練樣本能更準確地在特征空間表征對應的分類模式,進而提升分類性能。最后,通過實驗驗證了該方法對AD輔助診斷的有效性。
GPC相對于神經(jīng)網(wǎng)絡(luò)和SVM等分類方法的優(yōu)勢首先體現(xiàn)在采用概率模型,模型輸出值為測試樣本屬于每一類的概率數(shù)據(jù)而不是預測的標簽,這一點在臨床診斷中更有意義。其次GPC不需要手動設(shè)置模型參數(shù),這些參數(shù)都是在應用高斯函數(shù)求解后驗概率時自動獲取的。此外,參數(shù)相對較少,優(yōu)化參數(shù)和進行收斂則更簡單。
GPC包含3個模塊:定義映射函數(shù)(隱變量函數(shù))、定義似然函數(shù)、計算映射函數(shù)的后驗概率。
在分類問題中似然函數(shù)通常定義為一個S形函數(shù),不能直接得到映射函數(shù)的后驗概率,通常利用高斯函數(shù)來逼近后驗概率,主要包括Kullback-Leibler散度最小化、期望傳播(Expectation Propagation)、Laplace逼近、Markov Chain Monte Carlo方法等[10]。
(1)
假設(shè)映射函數(shù)服從均值為零、協(xié)方差矩陣為平方指數(shù)協(xié)方差核函數(shù)(RBF)的多維高斯過程分布,則先驗概率p(f/x)表示為:
p(f/x)=N(0,K)
(2)
式中,K為協(xié)方差矩陣,由貝葉斯定理可得映射函數(shù)的后驗概率為:
(3)
(4)
(5)
則對于測試樣本x*輸出為正樣本的概率為:
(6)
對于AD診斷常用高維腦影像數(shù)據(jù),訓練樣本數(shù)量相對較少,直接利用GPC的準確率較低。觀察樣本從屬于正樣本的概率,有些數(shù)值非常高甚至接近于1、或者非常低而近似于0,對這些樣本進行類別判定通常不會產(chǎn)生錯誤。更進一步,把這些易分樣本篩選出來與原有訓練數(shù)據(jù)合并作為新的訓練樣本,可看作增加了訓練樣本的數(shù)量,從而有可能改善分類性能。這就是高斯過程分步分類(gaussian process stepwise classification, GPSC)的基本思想,處理流程見圖1。具體地,先將測試樣本進行一次高斯過程分類,得到測試樣本對應于每一類的預測概率。當類別之間的預測概率相差不大時,說明該樣本的特征不明顯,容易造成錯分,如兩類問題、預測概率近似為0.5。確定模糊概率范圍,把預測概率位于此范圍內(nèi)的樣本定為易錯樣本,其他樣本為易識別樣本。在第二步分類中,將易識別樣本作為補充參與訓練,對易錯樣本重新進行分類,從而得到這部分樣本最終的判定結(jié)果。
圖1 高斯過程分步分類流程圖
實驗數(shù)據(jù)采用(alzheimer’s disease neuroimaging initiative,ADNI) 數(shù)據(jù)庫的磁共振影像(magnetic resonance imaging, MRI)。所用MRI均采用1.5T掃描,對MR圖像進行灰度校正和配準,并把大腦分成93個感興趣區(qū)域[18],將每個區(qū)域的灰質(zhì)體積作為樣本特征。
實驗中共使用807個樣本:AD樣本為186個,HC樣本為226個,MCI樣本395個,包括167個進展型MCI樣本(progressive MCI, pMCI)和228個穩(wěn)定型MCI樣本(stable MCI, sMCI)。為了驗證GPSC算法的有效性,實驗將GPSC算法與SVM、GPC兩種分類方法進行比較。
GPC的輸出結(jié)果為測試樣本屬于每一類的概率值,通過設(shè)定閾值判定類別歸屬;閾值不同,分類靈敏度和特異度也會發(fā)生相應的變化,可根據(jù)實際需要對靈敏度和特異度進行調(diào)節(jié),這也是高斯過程分類方法一個優(yōu)良特性。為公平比較GPC和GPSC的分類性能,實驗中閾值均取0.5,并通過十折交叉驗證計算分類指標,具體包括準確率、靈敏度、特異度和ROC曲線下面積(area under curve, AUC)。
實驗數(shù)據(jù)是186個AD樣本和226個HC樣本。SVM、GPC和GPSC等三種分類方法的識別結(jié)果見表1,ROC曲線見圖2。
表1三種方法對ADvs.HC的分類結(jié)果
Table 1 Classification results of three methods for AD vs. HC
圖2 三種方法對AD vs. HC分類的ROC曲線
可以看出,與SVM和GPC相比,GPSC能顯著提升分類的準確率、靈敏度、特異度以及AUC值。與此對應,圖2所示ROC曲線同樣表明GPSC綜合性能最優(yōu)。
本次實驗數(shù)據(jù)為395個MCI樣本,其中包括167個pMCI樣本和228個sMCI樣本,以及226個HC樣本。GPSC和SVM、GPC三種分類方法的識別結(jié)果見表2,ROC曲線見圖3。
表2三種方法對MCIvs.HC的分類結(jié)果
Table 2 Classification results of three methods for MCI vs. HC
圖3 三種方法對MCI vs. HC分類的ROC曲線
從表2可以看出,實驗結(jié)果和AD vs. HC分類結(jié)果一致,GPSC分類性能相對于其他兩種分類方法都是最好的。結(jié)合圖3的ROC曲線,再次證明GPSC分類性能最優(yōu)。
為充分驗證GPSC算法的有效性以及對MCI病情轉(zhuǎn)化預測的準確性,本次實驗數(shù)據(jù)采用167個pMCI樣本和228個sMCI樣本,兩類樣本的區(qū)別為是否在18個月內(nèi)轉(zhuǎn)為AD患者,若轉(zhuǎn)為AD患者,則為進展型MCI即pMCI,反之為sMCI。GPSC和SVM、GPC三種分類方法的識別結(jié)果見表3,圖4是相應的ROC曲線。
表3三種方法對pMCIvs.sMCI的分類結(jié)果
Table 3 Classification results of three methods for pMCI vs. sMCI
圖4三種方法對pMCIvs.sMCI分類的ROC曲線
Fig4ROCcurvesoffourmethodsfor
pMCIvs.sMCIclassification
從表3可以看出,GPSC對于病變特征相似且不符合老年癡呆診斷標準的pMCI和sMCI樣本依然具有分類能力,準確率、靈敏度、特異度以及AUC值同樣高于其他兩種分類方法,圖4的ROC曲線也證明了GPSC算法的有效性。
受限于數(shù)據(jù)的高維度和有限的訓練樣本數(shù)量,常規(guī)高斯過程分類和SVM在對結(jié)構(gòu)性腦影像數(shù)據(jù)進行分類時的準確率不是非常理想。本研究提出基于分步分類模式的高斯過程分步分類方法:先對測試樣本進行一次高斯過程分類,根據(jù)預測概率是否在模糊范圍內(nèi),將測試樣本分為易錯樣本和易識別樣本;在第二次分類中,將易識別樣本作為補充參與訓練,以此增加訓練樣本數(shù)量,并對易錯樣本進行第二次分類。
將高斯過程分步分類應用于AD診斷,通過對AD vs. HC、MCI vs. HC、pMCI vs. sMCI分類的結(jié)果表明,高斯過程分步分類的分類性能要優(yōu)于常規(guī)高斯過程分類和SVM分類。
為驗證高斯過程分步分類方法對AD診斷的有效性,本研究僅利用了結(jié)構(gòu)性磁共振腦影像數(shù)據(jù);后續(xù)工作將加入FDG-PET等其他模態(tài)數(shù)據(jù),以進一步提高對阿爾茨海默病計算機輔助診斷的性能。