楊澤坤 葛曼玲 付曉璇 陳盛華? 張夫一 郭志彤 張志強
1(河北工業(yè)大學(xué)省部共建電工裝備可靠性與智能化國家重點實驗室,天津 300130)
2(河北工業(yè)大學(xué)河北省電磁場與電器可靠性重點實驗室,天津 300130)
3(南京大學(xué)醫(yī)學(xué)院附屬金陵醫(yī)院/東部戰(zhàn)區(qū)總醫(yī)院醫(yī)學(xué)影像科,南京 210002)
癲癇是一種腦內(nèi)自發(fā)神經(jīng)電活動異常的疾病,是先天(遺傳性或發(fā)育障礙)或獲得性(腫瘤、外傷、炎癥等)因素導(dǎo)致的神經(jīng)元細胞膜電位高興奮性所致的突然、反復(fù)和短暫的中樞神經(jīng)系統(tǒng)功能失調(diào)的慢性病[1],僅我國就有900 萬例以上,是病例最多的國家。顳葉癲癇(temporal lobe epilepsy,TLE)是典型的部分癲癇,也是一種常見的藥物難治性癲癇[2-3],手術(shù)切除致癇灶(也叫癲癇源灶或放電起始區(qū))是最佳的治療方案,因而,致癇灶定位是術(shù)前必需的工作[4],其中定側(cè)是首要的。
當(dāng)前,在癲癇活動的臨床定位診斷中,以fMRI(functional magnetic resonance imaging)為代表的多模態(tài)無創(chuàng)影像學(xué)快速發(fā)展,并發(fā)揮著越來越重要的作用,國際抗癲癇聯(lián)盟(International League Against Epilepsy,ILAE)已把MRI 檢查作為重要的診斷檢查項目[5]。常規(guī)結(jié)構(gòu)MRI 可以發(fā)現(xiàn)與顳葉癲癇活動產(chǎn)生相關(guān)的病理灶(如海馬硬化,即海馬在結(jié)構(gòu)MRI 上顯示陽性,因而成為發(fā)作側(cè)的結(jié)構(gòu)像標記)。但是,20%~30%的患者表現(xiàn)為常規(guī)結(jié)構(gòu)影像陰性,功能成像彌補了對其定位診斷的不足,已成為當(dāng)前癲癇影像研究的主要方向。尤其是靜息態(tài)fMRI 技術(shù)(resting-state fMRI,rfMRI),具有無損、快捷和很強的患者適應(yīng)性(嬰兒、殘疾和昏迷患者亦可),且不需專門設(shè)備,不受發(fā)作間期癇性發(fā)放條件的影響,不受血流動力學(xué)相應(yīng)函數(shù)選擇的限制,也可實現(xiàn)癲癇活動的檢出,具有很高的敏感性和特異性,因此被看作是最有發(fā)展前景的癲癇活動定位技術(shù);Pearson 相關(guān)性(Pearson correlation)的功能連接算法應(yīng)用最廣泛,是傳統(tǒng)的成像算法[6-7]。
機器學(xué)習(xí)是功能影像學(xué)人工智能的核心,旨在將影像學(xué)數(shù)據(jù)與神經(jīng)網(wǎng)絡(luò)的機器學(xué)習(xí)模型相結(jié)合,發(fā)現(xiàn)功能影像學(xué)標記,輔助醫(yī)學(xué)診斷;其在癲癇患者rfMRI 研究中,主要應(yīng)用于患者腦功能評估和諸如語言功能偏側(cè)定位,也應(yīng)用于發(fā)作側(cè)定位[8-16]。盡管目前傳統(tǒng)的功能連接算法在機器學(xué)習(xí)定位發(fā)作側(cè)上具有良好表現(xiàn),分類精度可達80%以上[16],甚至100%[17],但無論是大樣本還是小樣本,傳統(tǒng)的功能連接模型的分類精度穩(wěn)定度尚無報道。而且,已有研究表明,傳統(tǒng)功能連接在描述癲癇功能網(wǎng)絡(luò)上存在一定的局限性,遜于互信息算法,互信息所定義的功能相關(guān)比Pearson 相關(guān)更好地捕捉大腦網(wǎng)絡(luò)的生理特征[18]。
值得一提的是多重共線性的發(fā)現(xiàn):在多元線性回歸模型中,多重共線性會使回歸系數(shù)估計的方差很大,造成估計結(jié)果的高度不穩(wěn)定,還可能產(chǎn)生參數(shù)估計精度降低、置信區(qū)間長度增大、假設(shè)檢驗結(jié)果不準確等影響[19-20]。這些影響或在癲癇的功能影像機器學(xué)習(xí)中存在,對分類性能產(chǎn)生負面影響,卻至今少有報道,因而成為筆者嘗試的研究目標。
為此,根據(jù)癲癇有別于健康人腦功能的特點,本研究以健康人群為參照,提出為單個癲癇患者的單個腦區(qū)打分的功能連接指數(shù)模型,并將該模型與Pearson 相關(guān)性的傳統(tǒng)功能連接模型用于相同的機器學(xué)習(xí)方法,比較兩者的分類性能及其穩(wěn)定性,試圖對比功能連接模型在機器學(xué)習(xí)分類中的表現(xiàn),并為功能連接模型應(yīng)用于機器學(xué)習(xí)提供指導(dǎo)。
由于患者數(shù)量屬于小樣本,機器學(xué)習(xí)采用了在小樣本分類和預(yù)測上具有優(yōu)勢的概率神經(jīng)網(wǎng)絡(luò)(probabilistic neural network,PNN)和支持向量機(support vector machine,SVM),旨在檢驗兩種功能連接模型在不同機器學(xué)習(xí)算法分類中是否具有相同表現(xiàn)。考慮指數(shù)模型以健康人作為參照,即特異于健康人群,需采用較大樣本量以保證特異性研究的基礎(chǔ),在此選取了與患者處于相同年齡段的影像組學(xué)數(shù)據(jù)——西南大學(xué)成人壽命數(shù)據(jù)集(SALT)中的健康人,符合者達142 人。最后,由于PNN 和SVM 皆為有監(jiān)督學(xué)習(xí)模型,需要在提前標記發(fā)作側(cè)的樣本上運行,采用結(jié)構(gòu)像提示的發(fā)作側(cè)信息(海馬硬化)進行功能像的有監(jiān)督學(xué)習(xí)。
1.1.1 健康人組
選取了142 名年齡在19~37 歲之間的健康人。數(shù)據(jù)來自西南大學(xué)成人壽命數(shù)據(jù)集(https:/ /www.nature.com/articles/sdata2018134)[21],符合下述5個質(zhì)量控制標準:一是符合MRI 相關(guān)排除標準,包括幽閉恐怖、金屬植入物、梅尼埃氏綜合征、近6 個月內(nèi)有暈倒史;二是目前無精神疾病或神經(jīng)系統(tǒng)疾?。蝗窃趻呙枨? 個月內(nèi)沒有使用精神類藥物;四是沒有懷孕;五是沒有頭部外傷史。此外,要求參與者在掃描前一天和掃描當(dāng)天不要飲酒。數(shù)據(jù)集的收集獲得了每位參與者知情書面同意。
1.1.2 癲癇患者組
癲癇患者組實驗對象為來自南京軍區(qū)南京總醫(yī)院的20 名單側(cè)發(fā)作顳葉癲癇患者(9 名男性,11名女性),左側(cè)發(fā)作和右側(cè)發(fā)作各10 名,年齡在19~33 歲之間,平均每月發(fā)作7.4 次。所有實驗對象均為結(jié)構(gòu)MRI 檢出海馬陽性,在術(shù)前接受常規(guī)的術(shù)前檢查,以定位癲癇放電區(qū)域。采用Siemens 3.0 T 高場強超導(dǎo)MRI 掃描儀,經(jīng)單次激發(fā)GE-EPI 序列采集BOLD-fMRI 數(shù)據(jù),TR=2 000 ms,TE=30 ms,翻轉(zhuǎn)角度為90°,矩陣64×64,掃描視野240 mm×240 mm,層厚4.00 mm,層間距0.40 mm。本研究獲得南京軍區(qū)總醫(yī)院醫(yī)學(xué)倫理委員會批準,患者知情并且簽署知情同意書[22]。
1.2.1 rfMRI 數(shù)據(jù)預(yù)處理
rfMRI 數(shù)據(jù)預(yù)處理是使用FMRIB 軟件庫中的工具進行的[23-24],處理流程、專利算法和質(zhì)量檢測在美國哈佛醫(yī)學(xué)院Martinos 醫(yī)學(xué)影像中心完成[25-26]。處理平臺CPU 為Intel Xeon Sliver 4112×16,64 核,操作系統(tǒng)Centos7.6,每位實驗對象的數(shù)據(jù)預(yù)處理時間約為15 h。
預(yù)處理步驟如下:
1)將每位實驗對象采集的前4 個時間點數(shù)據(jù)移除,使信號更加穩(wěn)定;
2)使用SPM2 校正切片采集的每個腦體積時間偏移;
3)利用FSL 軟件(http:/ /fsl.fmrib.ox.ac.uk/fsl),對頭部運動進行剛體平移和旋轉(zhuǎn)[27];
4)全腦平均信號歸一化,將信號配準到MNI(Montreal Neurological Institute)標準空間,重采樣到2 mm 各向同性體素大小;
5)帶通時間濾波(0.01~0.08 Hz)。
預(yù)處理完成之后,使用DPABI_V4.3[28]將數(shù)據(jù)投射到解剖自動標記圖譜(AAL,第1 版)[29]模版上,在AAL 模板共116 個腦區(qū)域評估BOLD 時間序列,每個腦區(qū)的時間長度為246,并通過在屬于每個腦區(qū)域的所有體素上的平均BOLD 信號用于分析。所使用的實驗設(shè)備CPU 為Inter Core i9-9 900 K,獨立顯卡NVIDIA RTX 2060,操作系統(tǒng)Windows10,每名患者數(shù)據(jù)的處理時間為23 min。
1.2.2 Pearson 相關(guān)的傳統(tǒng)功能連接模型
Pearson 相關(guān)系數(shù),又稱Pearson 積矩相關(guān)系數(shù),用于表示兩個變量間的線性相關(guān)性[30],通過強度來反映腦功能狀態(tài)和活動,是腦功能連接的傳統(tǒng)計算模型,其取值范圍為[-1,1]。當(dāng)取值大于0 時,代表兩個腦區(qū)的活動強度共同增長或減低;當(dāng)取值小于0 時,則代表兩個腦區(qū)的活動強度此消彼長。以Pearson 系數(shù)的絕對值表達相關(guān)的強度,絕對值越大則表示相關(guān)度越強,反之越弱。當(dāng)相關(guān)系數(shù)等于0時,兩個變量間完全不相關(guān);當(dāng)相關(guān)系數(shù)絕對值在區(qū)間(0,0.3)上時,為弱相關(guān);當(dāng)絕對值在(0.3,0.5)上時,為實相關(guān);當(dāng)絕對值在(0.5,0.8)上時,為顯著相關(guān);當(dāng)絕對值在(0.8,1)上時,為高度相關(guān);當(dāng)相關(guān)系數(shù)等于1 時,為完全相關(guān)。
將20 名單側(cè)發(fā)作患者的BOLD 信號在時間序列上取平均,進行全腦Pearson 功能相關(guān)計算。首先,得到116×116 的全腦功能連接矩陣,按行求平均值,得到116×1 的傳統(tǒng)功能連接(記做FC)矩陣;20 位患者將獲得20×116 的FC 矩陣。最后,通過DPABI_V4.3 投射到大腦上,觀察不同發(fā)作側(cè)患者功能像的差異。
1.2.3 功能連接特異性指數(shù)模型
基于傳統(tǒng)功能連接,提出以健康人連接組學(xué)為參照的個體患者rfMRI 功能連接特異性指數(shù)模型,為每位患者每個腦區(qū)的功能連接打分,以評估個體患者每個腦區(qū)功能連接的大小,試圖改進傳統(tǒng)功能連接模型。
功能連接差異指標(connectome distinctiveness index,CDI)表示為
式中,fs,i是患者第s個腦區(qū)與第i個腦區(qū)之間功能連接向量,fp,i是健康人第p個腦區(qū)與第i個腦區(qū)之間功能連接向量,N是健康人的數(shù)量,CDIs,i為患者第s個與第i個腦區(qū)之間的功能連接特異性指數(shù)。
計算每位患者相對于健康人群組的CDI,得到20×116 矩陣。為了比較癲癇患者與健康人的CDI差異,又計算了142 個健康人群組之間CDI,得到了142×116 矩陣。
CDI 在健康人中的分布表示為
式中,mean_CDIi表示N個健康壯年人在第i個腦區(qū)的CDI 平均值,std_CDIi表示N個健康人在第i個腦區(qū)的CDI 標準差,N=142。
計算142 個健康人群組CDI 分布,將上述計算得到的142×116 矩陣對人數(shù)取平均,得到一個1×116 矩陣,記為mean_CDI_nc。它是描述CDI 集中位置的一個統(tǒng)計量,既可以用來反映群組CDI 平均水平,也可以用其進行不同組數(shù)據(jù)比較,得出組間差別的統(tǒng)計顯著性。再求CDI 標準差,記為std_CDI_nc,它是1×116 矩陣,反映組內(nèi)個體間CDI 離散程度,其值越大,代表大部分CDI 數(shù)值和其平均值之間差異越大,反之亦然。
通過比較每位患者CDI 與健康人群組CDI 的分布,即可得到該患者s在腦區(qū)i處CDI 的功能連接特異性指數(shù)FCSIs,i,有
該指數(shù)可客觀評價個體患者在大腦任意腦區(qū)處功能連接偏離健康人群的程度,評分越高表明偏離健康人群的程度越大,說明功能連接越有可能異常,反之亦然。對每位患者每個腦區(qū)評分,獲得全腦評分陣列,則20 位患者將獲得20×116 評分矩陣。
1.2.4 ROC 曲線分析定義功能像對側(cè)敏感腦區(qū)
計算得到功能連接系數(shù)矩陣,利用SPSS 對20名患者所計算的兩種功能連接模型數(shù)據(jù),進行組間ROC(receiver operating characteristic)曲線分析,也就是分類敏感性分析和曲線下面積(area under curve,AUC)。其中,AUC 的值越大,表示兩組不同的數(shù)據(jù)對所分析的變量敏感性越高。將10 名左發(fā)作患者標記為1,將10 名右發(fā)作患者標記為2,選擇狀態(tài)變量值為2,計算后各得到116 個腦區(qū)的ROC曲線以及AUC;對AUC 進行降序排列,分別取兩種功能連接模型中的前8 個敏感腦區(qū)作為功能影像標志性腦區(qū)(functional bio-marker areas),通過BrainNet Viewer 將所得到的標志性腦區(qū)可視化[31]。
1.2.5 概率神經(jīng)網(wǎng)絡(luò)
概率神經(jīng)網(wǎng)絡(luò)(PNN)是在徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上發(fā)展而來的一種新型人工神經(jīng)網(wǎng)絡(luò),是基于貝葉斯決策和Parzen 窗概率密度函數(shù)構(gòu)建的前饋網(wǎng)絡(luò)模型,是一種有監(jiān)督學(xué)習(xí)算法[32]。PNN 可以將非線性問題轉(zhuǎn)換為線性問題求解,事實上它曾被認為是徑向基神經(jīng)網(wǎng)絡(luò)的一種變體,但所不同的是其權(quán)值可全部調(diào)為一致,這也是它適用于訓(xùn)練樣本數(shù)量較小問題的一個原因。本研究在Matlab 中以徑向基函數(shù)為核函數(shù)構(gòu)建概率神經(jīng)網(wǎng)絡(luò)[33],平滑因子的值設(shè)為1.5。
1.2.6 支持向量機
SVM 是一種基于統(tǒng)計學(xué)理論的機器學(xué)習(xí)分類方法[34-35],其基本原理是將低維空間中的線性不可分點映射到高維空間中,使它們成為線性可分,再利用線性可分時構(gòu)造最優(yōu)超平面方法,通過核函數(shù)用高維空間超平面來完成分類。
1.2.7 分類與隨機交叉驗證
PNN 和SVM 是兩種有效適用于小樣本分類的有監(jiān)督機器學(xué)習(xí)方法。每位患者特征向量均為9 維行向量,其中包括8 個功能影像標志性腦區(qū)特征值(即Pearson 相關(guān)性模型特征值為FC,功能連接特異性指數(shù)模型特征值為FCSI)和1 個標記值,左發(fā)作患者標記為1,右發(fā)作患者標記為2。訓(xùn)練集與測試集的比例為6∶4。本研究采用相同的特征向量和不同的機器學(xué)習(xí)算法,共進行10 次隨機交叉驗證實驗,獲得10 次實驗的分類準確率。
為了避免訓(xùn)練集和測試集患者分組對機器學(xué)習(xí)造成偶然性影響,機器學(xué)習(xí)分類實驗中采取多次隨機交叉驗證實驗。每次分類實驗前將所有患者特征向量隨機排序并分組,用于機器學(xué)習(xí)分類實驗。
1.2.8 特征向量相關(guān)性分析
在回歸模型中,自變量之間存在的線性相關(guān)會對回歸結(jié)果產(chǎn)生負面影響。在機器學(xué)習(xí)中,特征向量之間存在的線性相關(guān)或依存關(guān)系將影響分類效果,造成準確率較差或不穩(wěn)定。
利用線性相關(guān)(即Pearson 相關(guān))分別對2 種功能連接模型提取的特征向量進行橫向和縱向分析,試圖全面揭示向量間存在的依存關(guān)系。所謂橫向相關(guān)性分析(患者間相關(guān)性分析),是以每位患者的8 個特征腦區(qū)模型數(shù)據(jù)重構(gòu)分析向量,計算分析向量之間相關(guān)性,即10 位同發(fā)作側(cè)(本研究選取10 名左發(fā)作側(cè))患者的特征向量之間兩兩計算線性相關(guān),獲得相關(guān)系數(shù)絕對值用于分析;而所謂縱向相關(guān)性分析(特征向量間相關(guān)性分析),是以每個特征腦區(qū)的20 名患者功能連接模型數(shù)據(jù)構(gòu)建分析向量,計算分析向量間的相關(guān)性,即8 個特征腦區(qū)之間兩兩計算線性相關(guān)性,獲得相關(guān)系數(shù)絕對值用于分析。
2.1.1 傳統(tǒng)功能影像標示的發(fā)作側(cè)
圖1顯示了一例左側(cè)海馬結(jié)構(gòu)MRI 陽性患者Pearson 相關(guān)性算法成像的功能像??梢钥闯?,傳統(tǒng)功能連接算法可成像左側(cè)顳葉有集中高亮區(qū)域,說明傳統(tǒng)功能連接模型能夠粗略標示發(fā)作側(cè)。
圖1 Pearson 功能連接表達的發(fā)作側(cè)。(a) 冠狀面;(b) 矢狀面;(c)軸狀面Fig.1 Paroxysmal side displayed by Pearson correlation.(a) Coronal plane;(b) Sagittal plane;(c) Axial plane
2.1.2 傳統(tǒng)功能連接模型定義的標志性腦區(qū)
圖2給出了由Pearson 相關(guān)系數(shù)確定的8 個組間差異顯著腦區(qū)的ROC 曲線??梢钥闯觯瑢Πl(fā)作側(cè)敏感的功能影像標志性腦區(qū)為海馬旁回、楔葉、枕中回、楔前葉、楔前葉、顳中回及小腦。
圖2 Pearson 相關(guān)模型確定的8 個功能影像標志性腦區(qū)。(a)ROC 曲線;(b)標志性腦區(qū)位置:左右兩列上方和中間為兩個腦半球的矢狀面,下方為冠狀面,中間一列為軸狀面Fig.2 A total of 8 functional bio-marker areas estimated by Pearson correlation model.(a) ROC curves;(b)Schematic diagram of locations of bio-markers.In the left and right columns,upper and middle parts are on the sagittal planes,lower part is on the coronal plane,and middle column is on the axial plane
圖3給出了功能連接特異性指數(shù)確定的8 個組間差異顯著腦區(qū)的ROC 曲線。可以看出,對發(fā)作側(cè)敏感的功能影像標志腦區(qū)為眶部額上回、眶部額中回、島蓋部額下回、三角部額下回、杏仁核、舌回、梭狀回。
圖3 功能連接特異性指數(shù)模型確定的8 個功能影像標志性腦區(qū)。(a)ROC 曲線;(b)標志性腦區(qū)位置:左右兩列上方和中間為兩個腦半球的矢狀面,下方為冠狀面,中間一列為軸狀面Fig.2 A total of 8 functional bio-marker areas estimated by FC-based specificity model.(a) ROC curves;(b)Schematic diagram of locations of bio-markers.In the left and right columns,upper and middle parts are on the sagittal planes,lower part is on the coronal plane,and middle column is on the axial plane
2.3.1 Pearson 相關(guān)性模型
Pearson 相關(guān)性模型的機器學(xué)習(xí)定側(cè)的隨機交叉驗證結(jié)果如表1所示。可以看出,PNN 分類準確率在25.0%~100%之間,SVM 則在50.0%~87.5%之間。從平均分類準確率來看,PNN 為51.25%,而SVM 則為68.75%,說明SVM 分類準確率要好于PNN 分類準確率。從分類穩(wěn)定性來看,Pearson 相關(guān)性模型的分類準確率方差分別25.99%為和13.5%。PNN 分類準確率方差(25.99%)占其平均值(51.25%)一半以上,穩(wěn)定性極差;SVM 較PNN下降了1 倍多(13.5%),其平均值也有所提高(68.75%),其穩(wěn)定性要好于PNN 的穩(wěn)定性,但其平均值僅稍高于50%,而且方差占平均值接近20%,說明其穩(wěn)定性仍然較差。
總之,傳統(tǒng)功能連接模型在PNN 和SVM 的機器學(xué)習(xí)分類中,SVM 的平均分類準確率和穩(wěn)定性好于PNN,但兩者的分類性能都較差。
2.3.2 功能連接特異性指數(shù)模型
功能連接特異性模型的機器學(xué)習(xí)定側(cè)的隨機交叉驗證結(jié)果如表2所示??梢钥闯?,PNN 和SVM的分類準確率皆在75%~100%之間,但PNN 平均準確率為88.75%,而SVM 平均準確率為86.25%,PNN 略好于SVM。從分類穩(wěn)定性來看,PNN 方差(7.10%)低于SVM 方差(10.94%),再次說明PNN好于SVM。總之,功能連接特異性指數(shù)模型在PNN和SVM 的機器學(xué)習(xí)分類中,PNN 平均分類精度和穩(wěn)定性好于SVM 的相應(yīng)情況;但兩者的分類性能都較好,具有較強的魯棒性,都遠強于傳統(tǒng)功能連接模型的魯棒性。
最后,表1和表2皆表明:PNN 和SVM 的機器學(xué)習(xí)算法對分類準確度和穩(wěn)定性影響較小。
表1 Pearson 相關(guān)性模型的機器學(xué)習(xí)分類準確率Tab.1 Classification accuracy in machine learning when imaging by Pearson correlation model
表2 功能連接特異性指數(shù)模型的機器學(xué)習(xí)分類準確率Tab.2 Classification accuracy in machine learning when imaging by FC-based specificity index model
2.4.1 患者間線性相關(guān)性
表3給出組間所有患者由功能影像標志性腦區(qū)的傳統(tǒng)功能連接構(gòu)成特征向量之間相關(guān)系數(shù)絕對值,而表4則為功能連接特異性指數(shù)構(gòu)成特征向量之間相關(guān)系數(shù)絕對值。由于相關(guān)系數(shù)矩陣的對稱性,這里只顯示上三角相關(guān)系數(shù)絕對值。
比較表3和表4可見,功能連接特異性指數(shù)構(gòu)成的特征向量之間相關(guān)系數(shù),除了4 個高于0.5,其余皆遠低于0.5,呈弱相關(guān);而傳統(tǒng)功能連接構(gòu)成的特征向量之間相關(guān)系數(shù),除了3 個低于0.5,其余皆大于0.5,呈顯著相關(guān)甚至高度相關(guān)。這說明,傳統(tǒng)功能連接模型在機器學(xué)習(xí)中易形成樣本間相關(guān)性較大的特征向量,也就是功能影像標記不獨立,向量間存在多重共線性,可能造成表格1 隨機交叉驗證實驗發(fā)現(xiàn)的定側(cè)平均準確率和穩(wěn)定性皆較差。而功能連接特異性指數(shù)模型則在機器學(xué)習(xí)分類中則表現(xiàn)出較強魯棒性,患者在所構(gòu)成的特征向量之間相關(guān)性很弱,也就是所確定的功能影像標記較為獨立,改善了傳統(tǒng)功能連接存在的多重共線性,因此,在表格2 觀察到定側(cè)準確率有較高水準并具較高穩(wěn)定性。
表3 FCs 的特征向量在患者間的相關(guān)系數(shù)Tab.3 FCs of features vectors between groups
表4 功能連接特異性指數(shù)的特征向量在患者間的相關(guān)系數(shù)Tab.4 FC-based specificity indexes of features vectors between groups
2.4.2 功能影像標志性腦區(qū)間線性相關(guān)性
由8 個功能影像標志性腦區(qū)組間患者的傳統(tǒng)功能連接構(gòu)成分析向量,做分析向量之間線性相關(guān)性系數(shù),如表5所示。由8 個功能影像標志性腦區(qū)組間患者的功能連接特異性指數(shù)構(gòu)成分析向量,做分析向量之間線性相關(guān)性系數(shù),如表6所示??梢钥闯觯颊哂蓛煞N功能連接模型所確定的功能影像標志性腦區(qū)間皆線性無關(guān),所以可以推測對發(fā)作側(cè)敏感的功能影像標志性腦區(qū)與機器學(xué)習(xí)的分類穩(wěn)定性無關(guān)。
表5 傳統(tǒng)功能連接在功能影像標志性腦區(qū)中的組間相關(guān)系數(shù)Tab.5 Inter-group correlation of FCs in functional imaging bio-marker areas
表6 功能連接特異性指數(shù)模型在功能影像標志性腦區(qū)中的組間相關(guān)系數(shù)Tab.6 Inter-group correlation of FC-based indexes in functional imaging bio-marker areas
Pearson 相關(guān)系數(shù)作為傳統(tǒng)的、典型的腦功能表征模型,一直以來被廣泛地用于腦功能和腦疾病的研究中,但在機器學(xué)習(xí)中表現(xiàn)出一定的局限性,并在一些不同的應(yīng)用情景下被其他的模型所取代。在本研究中,基于連接組學(xué)的FCSI 模型在機器學(xué)習(xí)中的平均準確率比Pearson 相關(guān)系數(shù)在相同實驗下高27.5%,平均方差低9.02%,表現(xiàn)出更高的分類水平和更好的穩(wěn)定性。在特征向量分析和標志性腦區(qū)的確定中,以FC 為特征向量的AUC 為0.76,而FCSI 的特征向量AUC 為0.84,F(xiàn)CSI 模型表現(xiàn)出更好的敏感性。在以往的實驗?zāi)P椭?,用于分類的特征向量往往是來自健康人與患者,或是不同發(fā)作側(cè)的患者;FCSI 模型以健康人連接組學(xué)作為參照,以為患者單個腦區(qū)的功能異常程度打分的方式,這是該模型優(yōu)于Pearson 模型的主要優(yōu)勢。另外,在多重共線性分析中,基于FCSI 的特征向量相比基于Pearson 相關(guān)系數(shù)的特征向量,呈現(xiàn)較弱的線性相關(guān)性,這一特點或是兩種模型在機器學(xué)習(xí)分類實驗中不同表現(xiàn)的內(nèi)在因素。
PNN 和SVM 是兩種適用于小樣本分類的機器學(xué)習(xí)方法,具有較強的泛化能力。在相同的實驗設(shè)計下,相比Pearson 相關(guān)系數(shù),基于FCSI 的機器學(xué)習(xí)分類實驗,PNN 準確率高37.5%、方差低18.89%,SVM 準確率高17.5%、方差低2.56%,F(xiàn)CSI 模型表現(xiàn)出了明顯的優(yōu)勢。在隨機交叉驗證實驗中,功能連接特異性指數(shù)模型的平均分類準確率高于Pearson 模型的,且分類準確率方差遠小于Pearson模型的,可能的原因是功能連接特異性指數(shù)模型引入了來自連接組學(xué)的較大樣本健康人數(shù)據(jù),得到CDI在健康人中的分布;將其統(tǒng)計特性作為比對基礎(chǔ),引入到癲癇患者功能連接評估,以打分的方式評價患者單個腦區(qū)功能狀態(tài)與健康人差異的程度,更突出了患者異常功能連接特性,降低了同種癲癇定側(cè)時在傳統(tǒng)功能連接模型直接做線性相關(guān)時所造成的相似性,因而患者間功能連接特異性指數(shù)的相關(guān)性降低,如表4所示。因此,功能連接特異性指數(shù)模型在機器學(xué)習(xí)定側(cè)中具有較強魯?shù)陌粜浴?/p>
盡管由功能連接模型的敏感性分析曲線確定的功能影像標志性腦區(qū)會依賴所選用的連接模型(見圖2、3),但在兩種功能連接模型所確定的對發(fā)作側(cè)敏感腦區(qū),諸如海馬旁回、枕中回、顳中回、眶部額上回、眶部額中回、杏仁核等,已被多次證實為有效的顳葉癲癇診斷生物標記物[17,36]。
值得一提的是,海馬作為臨床中利用結(jié)構(gòu)磁共振成像診斷顳葉癲癇的生物標記物,常以海馬硬化的結(jié)構(gòu)MRI 作為診斷依據(jù),現(xiàn)在已經(jīng)成功地應(yīng)用于陰性癲癇的機器學(xué)習(xí)分類研究中,取得很好的分類效果[37],但在利用fMRI 診斷顳葉癲癇中卻很少被提及。在ROC 曲線分析中,海馬的AUC 較低,并不適用于作為分類的特征。近年來,海馬亞區(qū)的研究逐步深入,對海馬的進一步分割或許會在未來更進一步地揭示癲癇發(fā)作與海馬硬化的因果關(guān)系和海馬的功能變化。
多重共線性可反映線性回歸模型中自變量之間由于存在高度相關(guān)關(guān)系而使模型的權(quán)重參數(shù)估計失真或難以估計準確的一種特性,它在機器學(xué)習(xí)中表現(xiàn)為樣本間或特征向量間的依存關(guān)系,將影響分類準確率的水平和穩(wěn)定性。
本研究在兩種功能連接模型下,分別進行了功能影像標志性腦區(qū)間相關(guān)關(guān)系和患者間相關(guān)關(guān)系的分析,試圖找出造成兩種功能連接模型在機器學(xué)習(xí)中分類性能差異的內(nèi)在原因。根據(jù)計算發(fā)現(xiàn),在各標志性腦區(qū)間相關(guān)關(guān)系的結(jié)果中(見表5、6),兩種模型的差異并不大,說明本研究發(fā)現(xiàn)的傳統(tǒng)功能連接模型所表現(xiàn)的分類精度不穩(wěn)定,與標志性腦區(qū)選擇無關(guān)。在患者間依存關(guān)系分析中,Pearson 相關(guān)系數(shù)的數(shù)據(jù)在患者之間表現(xiàn)出較強的相關(guān)性(見圖3),平均相關(guān)系數(shù)為0.67;而功能連接特異性數(shù)據(jù)的樣本間相關(guān)性則相對較小(見表4),平均相關(guān)系數(shù)僅為0.28。這說明,患者間特征向量存在的多重共線性或是影響機器學(xué)習(xí)分類性能的內(nèi)在原因。
在本研究中,用于機器學(xué)習(xí)分類的樣本容量較小,這是根據(jù)機器學(xué)習(xí)在醫(yī)學(xué)領(lǐng)域應(yīng)用時臨床數(shù)據(jù)不足所做出的小樣本分類嘗試,雖然取得的準確率較為理想,但仍面臨泛化能力不足的困難。在通常情況下,增加訓(xùn)練集樣本容量是提高機器學(xué)習(xí)分類效果的一個有效方法。目前不能肯定更多樣本能否使本研究構(gòu)建的功能連接特異性指數(shù)模型取得更好的分類效果,一切有待于進一步實驗驗證。
在用Pearson 相關(guān)的傳統(tǒng)功能連接模型對腦功能進行分析的過程中,在將全腦功能連接系數(shù)投射到大腦上之后,可以粗略地從投射后的功能影像觀察出患者發(fā)作側(cè)與非發(fā)作側(cè)的差異。但根據(jù)其標志性腦區(qū)提取特征向量并應(yīng)用于機器學(xué)習(xí)分類時,分類準確率及穩(wěn)定性并不理想。造成這一結(jié)果可能是由于患者的傳統(tǒng)功能連接特征向量具有相似性,即存在多重共線性,這已在本研究的小樣本實驗中得以證實,有待在大樣本的患者數(shù)據(jù)或多中心連接組學(xué)的健康人數(shù)據(jù)上進一步試驗。
在病歷證實的內(nèi)側(cè)顳葉癲癇的患者中,有13%的患者為結(jié)構(gòu)陰性患者[38]。因此,結(jié)構(gòu)陰性顳葉癲癇的定側(cè)以及病灶定位目前仍是一個重要的研究領(lǐng)域,尚未取得可觀成果,有待于筆者所建立的功能連接特異性指數(shù)模型推廣至該領(lǐng)域研究之中。
筆者以健康人連接組學(xué)為參照,提出了單個顳葉癲癇患者rfMRI 功能連接特異性指數(shù)模型,用于表征癲癇患者個體與健康人群組的腦功能連接差異,以突出表現(xiàn)癲癇患者大腦功能連接異常,并將其應(yīng)用到對患者發(fā)作側(cè)的定位中。通過與Pearson相關(guān)的傳統(tǒng)功能連接模型進行比較,研究了功能連接模型在機器學(xué)習(xí)中的分類準確度和穩(wěn)定性?;谶B接組學(xué)的靜息態(tài)功能磁共振功能連接特異性指數(shù)模型,在癲癇定側(cè)的機器學(xué)習(xí)上表現(xiàn)出較強的魯棒性,遠優(yōu)于Pearson 相關(guān)性的傳統(tǒng)功能連接模型,特征向量之間具有較大的相關(guān)性可能是影響其穩(wěn)定性的主要原因。本研究為顳葉癲癇患者靜息態(tài)腦功能異常表征提供了一種新方法,并對機器學(xué)習(xí)在神經(jīng)系統(tǒng)疾病診斷中應(yīng)用提供了新思路。