趙文碩,姚旭峰
(1.上海理工大學(xué)健康科學(xué)與工程學(xué)院,上海 200093;2.上海健康醫(yī)學(xué)院醫(yī)學(xué)影像學(xué)院,上海 201318)
目前,我國(guó)60 周歲以上的人口比例已超過國(guó)際老齡化基數(shù),據(jù)國(guó)家統(tǒng)計(jì)局?jǐn)?shù)據(jù)顯示,預(yù)計(jì)2030 年我國(guó)將成為全球老齡化程度較高的國(guó)家[1]。在腦老化過程中,腦的形態(tài)結(jié)構(gòu)會(huì)發(fā)生改變,認(rèn)知功能也會(huì)隨之衰退[2],研究證明正常腦老化與神經(jīng)退變性疾病間存在相似病理特征[3]。因此,研究腦結(jié)構(gòu)的變化規(guī)律,有助于更好地認(rèn)知神經(jīng)系統(tǒng)疾病的發(fā)病機(jī)制,并探索相應(yīng)的預(yù)防和治療措施。
醫(yī)學(xué)影像技術(shù)及腦科學(xué)領(lǐng)域的快速發(fā)展,推動(dòng)了腦結(jié)構(gòu)成像技術(shù)及功能成像技術(shù)的進(jìn)步。繼計(jì)算機(jī)斷層掃描成像(Computerized Tomography,CT)技術(shù)之后,核磁共振成像技術(shù)(Magnetic Resonance Imaging,MRI)、正電子發(fā)射攝影術(shù)(Positron Emission Tomography,PET)等多種技術(shù)興起,并廣泛應(yīng)用于腦認(rèn)知科學(xué)研究領(lǐng)域[4]。
現(xiàn)階段,結(jié)構(gòu)磁共振成像技術(shù)(Structural Magnetic Resonance Imaging,sMRI)作為一種無(wú)創(chuàng)的醫(yī)學(xué)影像技術(shù),因其良好的組織與空間分辨率,能夠準(zhǔn)確發(fā)現(xiàn)腦結(jié)構(gòu)形態(tài)發(fā)生的微觀變化,顯示不同腦區(qū)的功能差別與代謝差異。具體的,結(jié)構(gòu)磁共振成像主要包含以下3 種:①T1 加權(quán)像;②T2 加權(quán)像;③彌散張量成像(Diffusion Tensor Imaging,DTI)。
隨著計(jì)算機(jī)技術(shù)與人工智能的蓬勃發(fā)展,圖像處理方法逐步運(yùn)用到機(jī)器學(xué)習(xí)領(lǐng)域,借助計(jì)算機(jī)輔助技術(shù)對(duì)于醫(yī)學(xué)圖像數(shù)據(jù)進(jìn)行分析,能夠有效挖掘信息輔助疾病診斷或進(jìn)行基礎(chǔ)性研究。在基于腦影像特征的基礎(chǔ)性研究與疾病診斷識(shí)別中,由于不同疾病間的腦影像特征無(wú)法得到精確識(shí)別、分類,單一病例的診斷也存在較大的主觀性。因此,借助計(jì)算機(jī)輔助技術(shù)進(jìn)行腦影像特征提取,挖掘多序列腦影像數(shù)據(jù)信息,構(gòu)建基于腦影像特征的分類識(shí)別模型已發(fā)展為腦科學(xué)領(lǐng)域的新趨勢(shì)[5-8]。
迄今為止,腦部神經(jīng)性疾病的大部分MRI 研究集中在灰質(zhì)結(jié)構(gòu)的神經(jīng)變性,已有大量研究證明了疾病及正常老化會(huì)造成灰質(zhì)結(jié)構(gòu)變性[9],但白質(zhì)在正常老化中也會(huì)受到影響[10]。因此,探究青、老年白質(zhì)纖維束特征的變化為人們研究腦部神經(jīng)性疾病的發(fā)病機(jī)制提供了方向。研究表明,正常成年人大腦約有1011個(gè)神經(jīng)元細(xì)胞,而神經(jīng)元細(xì)胞間又通過約1015個(gè)神經(jīng)突觸相連,從而形成了高度復(fù)雜且具有高效傳輸能力的腦網(wǎng)絡(luò)。對(duì)于腦科學(xué)研究,在于用少量的神經(jīng)生物學(xué)意義和易于計(jì)算的方法來(lái)描述人腦網(wǎng)絡(luò)屬性。
T1 結(jié)構(gòu)磁共振作為臨床中應(yīng)用最早、最廣泛的診斷模式,提供了豐富的大腦結(jié)構(gòu)形態(tài)學(xué)特征,并具備成像時(shí)間短、圖像質(zhì)量高、腦白質(zhì)與灰質(zhì)對(duì)比度高等優(yōu)勢(shì),適用于結(jié)構(gòu)提取及基于皮層特征的腦結(jié)構(gòu)分析。腦皮層的萎縮可以視為正常的大腦在老化上的宏觀表現(xiàn),且不同腦區(qū)在腦老化過程中因所受因素影響不同,萎縮速度并不相同[11]。為此,本文提出一種基于表面的形態(tài)測(cè)量學(xué)方法(Surfacebased morphometry,SBM),研究腦皮層特征在正常老化中的變化規(guī)律。
隨著神經(jīng)影像學(xué)及計(jì)算機(jī)視覺技術(shù)的發(fā)展,基于人工智能的腦部神經(jīng)性疾病診斷方法越來(lái)越多。Meier 等[12]基于功能性磁共振成像(Functional Magnetic Resonance Imag?ing,fMRI)數(shù)據(jù),利用支持向量機(jī)(Support Vector Machine,SVM)對(duì)青、老年組進(jìn)行分類,準(zhǔn)確度達(dá)到了84%。Robin?son 等[13]利用sMRI 數(shù)據(jù),基于腦網(wǎng)絡(luò)特征使用線性判別分析(Linear Discriminant Analysis,LDA)對(duì)青、老年組別進(jìn)行分類,最高得到了87.46%的準(zhǔn)確率。Lancaster 等[14]基于T1 加權(quán)的MRI 數(shù)據(jù)對(duì)青、老年組別進(jìn)行分類,并在SVM 上最高得到88.1%的準(zhǔn)確率。相較于現(xiàn)有研究,本文提出的方法利用多序列特征融合技術(shù),構(gòu)建大腦形態(tài)學(xué)與網(wǎng)絡(luò)聯(lián)合特征集,利用機(jī)器學(xué)習(xí)算法驗(yàn)證數(shù)據(jù)集性能,最高達(dá)到90%的準(zhǔn)確度,證實(shí)了所構(gòu)建的聯(lián)合特征集對(duì)腦老化表征具有更獨(dú)特的敏感特異性。
數(shù)據(jù)均采集于復(fù)旦大學(xué)華山醫(yī)院附屬上海伽瑪醫(yī)院放射科2016 年9 月至2018 年1 月招募的96 例健康志愿者。根據(jù)世界衛(wèi)生組織的標(biāo)準(zhǔn)(44 歲以下為青年人;45-59歲為中年人;60-74 歲為年輕老年人)將志愿者分為青年組48 例(21-30 歲)及老年組48 例(60-72 歲),具體數(shù)據(jù)如表1所示。
Table 1 Clinical data of subjects in each group表1 各組受試者臨床資料
采用美國(guó)GE 公司生產(chǎn)的1.5T 超導(dǎo)磁共振掃描儀,選擇標(biāo)準(zhǔn)8 通道頭部相控陣線圈作為掃描設(shè)備,所有檢查者均利用T1WI、T2WI 和DTI 方式進(jìn)行掃描,采集的影像均以前后聯(lián)合的連線為基線。其中,T1加權(quán)像掃描參數(shù)基于自旋回波(SE)序列,TR=880ms、TE=7.864ms、層厚為3mm、層間距為3mm、翻轉(zhuǎn)角度為90°、矩陣大小為224×224、FOV=240mm×240mm;DTI 掃描參數(shù)采用單次激發(fā)自旋回波平面成像(EPI)序列,15 個(gè)方向的擴(kuò)散編碼,彌散敏感系數(shù)b=1 000s/mm2、TR=10 000ms、TE=116.9ms、層厚為3mm,翻轉(zhuǎn)角 度為90°、層間距 為3mm、矩陣大小128×128、FOV=240mm×240mm。
在描述大腦網(wǎng)絡(luò)結(jié)構(gòu)時(shí),通常使用網(wǎng)絡(luò)特征屬性對(duì)其進(jìn)行分析。本文基于MATLAB 的GRETNA(https://www.ni?trc.org/ projects/gretna)腦網(wǎng)絡(luò)特征分析工具,計(jì)算每一例被測(cè)者的白質(zhì)網(wǎng)絡(luò)全腦及局部腦區(qū)的結(jié)構(gòu)網(wǎng)絡(luò)特征參數(shù)。其中,腦網(wǎng)絡(luò)特性的全局參數(shù)主要包括網(wǎng)絡(luò)平均聚類系數(shù)Cp、平均最短路徑長(zhǎng)度Lp、全局效率Eg、網(wǎng)絡(luò)局部效率El、平均節(jié)點(diǎn)度Kp、小世界屬性σ等;腦網(wǎng)絡(luò)特性的局部參數(shù)主要包括節(jié)點(diǎn)度Ki、節(jié)點(diǎn)的聚類系數(shù)Ci、節(jié)點(diǎn)的最短路徑長(zhǎng)度Li、節(jié)點(diǎn)局部效率Eilocal及節(jié)點(diǎn)效率Englobal。
基于表面形態(tài)學(xué)(Surface-Based Morphometry,SBM)操作檢測(cè)組間更深層次的差異,能了解大腦皮層的表面模式,從而準(zhǔn)確地察覺早期皮層發(fā)生的變化,以評(píng)估腦功能的退化程度。對(duì)于原始皮層特征數(shù)據(jù),采用Freesurfer 軟件測(cè)量青年組和老年組大腦的體積、厚度、表面積和平均曲率。具體操作如下:首先對(duì)預(yù)處理后的特征集進(jìn)行歸一化、降維處理;然后采用單因素方差優(yōu)化數(shù)據(jù)。
2.2.1 數(shù)據(jù)歸一化處理與降維
為解決不同結(jié)構(gòu)特征統(tǒng)計(jì)的數(shù)據(jù)差別較大問題,先對(duì)特征數(shù)據(jù)進(jìn)行歸一化處理,將不同特征的數(shù)據(jù)縮放至同一數(shù)量級(jí)。由于歸一化處理并不會(huì)影響原始數(shù)據(jù)的分布情況,并保持了各特征維度對(duì)于目標(biāo)函數(shù)的影響權(quán)重。因此,能夠有效減少探究不同特征與類別相關(guān)性間的數(shù)據(jù)處理時(shí)耗。
由于特征數(shù)量過高會(huì)影響后續(xù)特征選擇及模型建立,因此在數(shù)據(jù)歸一化后,對(duì)數(shù)據(jù)進(jìn)行降維處理。具體的,主成分分析(Principal Component Analysis,PCA)可將具有相關(guān)性的高維特征映射成低維特征,使處理后的低維數(shù)據(jù)與每個(gè)特征均保持線性無(wú)關(guān)。
2.2.2 特征選擇
由于提取的大量特征存在數(shù)據(jù)冗余,會(huì)導(dǎo)致模型的訓(xùn)練結(jié)果不理想。因此,通過單因素方差對(duì)多個(gè)特征進(jìn)行統(tǒng)計(jì)、分析,計(jì)算單一特征對(duì)類別的權(quán)重并進(jìn)行排序,在不改變?cè)卣髦档那疤嵯?,篩選與樣本類別相關(guān)性較高的特征變量。實(shí)驗(yàn)采用單因素方差分析,驗(yàn)證了各參數(shù)的正態(tài)分布和方差齊性。大量研究表明,統(tǒng)計(jì)學(xué)意義標(biāo)準(zhǔn)P<0.05時(shí),篩選區(qū)分類別特征的相關(guān)性較高。
2.3.1 腦網(wǎng)絡(luò)特征
表2 為對(duì)腦網(wǎng)絡(luò)全局特征參數(shù)進(jìn)行年齡差異分析的結(jié)果,可見青年組與老年組之間的平均聚類系數(shù)(Cp)存在顯著的差異(P<0.05),且青年組的節(jié)點(diǎn)度(Kp)、局部效率(El)和全局效率(Eg)高于老年組,平均最短路徑長(zhǎng)度(Lp)值低于老年組。圖1 為了青年組和老年組全腦的核心節(jié)點(diǎn),具體數(shù)據(jù)見表3。
Table 2 Difference analysis of global characteristic parameters of brain network(*P<0.05)表2 腦網(wǎng)絡(luò)全局特征參數(shù)差異性分析(*P<0.05)
Fig.1 Whole brain core area(young group and old group)圖1 全腦核心腦區(qū)(青年組和老年組)
由表3 可見,青年組和老年組共有9 個(gè)核心節(jié)點(diǎn),分別為左側(cè)前扣帶和旁扣帶腦回(ACG.L)、兩側(cè)內(nèi)側(cè)和旁扣帶腦回(DCG.L、DCG.R)、兩側(cè)距狀裂周圍皮層(CAL.L、CAL.R)、右側(cè)舌回(LING.R)、兩側(cè)楔前葉(PCUN.L、PCUN.R)及左側(cè)顳中回(MTG.L)。
Table 3 Whole brain core node of young and elderly group表3 青年組和老年組全腦核心節(jié)點(diǎn)
圖2、圖3 分別為青年組和老年組核心節(jié)點(diǎn)的節(jié)點(diǎn)度和最短路徑長(zhǎng)度差異分析。由此可見,青年組與老年組在左側(cè)前扣帶和旁扣帶腦回(ACG.L)、兩側(cè)內(nèi)側(cè)和旁扣帶腦回(DCG.L、DCG.R)、兩側(cè)楔前葉(PCUN.L、PCUN.R)、左側(cè)顳中回(MTG.L)存在顯著性差異(P<0.05),且差異區(qū)域老年組的節(jié)點(diǎn)度明顯低于青年組。
圖4 為青年組和老年組核心節(jié)點(diǎn)的聚類系數(shù)差異。由此可見,右側(cè)距狀裂周圍皮層(CAL.R)、右側(cè)舌回(LING.R)均存在顯著差異,并且隨著聚類系數(shù)增大,表示與該節(jié)點(diǎn)相連節(jié)點(diǎn)組成的子網(wǎng)絡(luò)緊湊程度越高。
Fig.2 Analysis of node degree Ki difference between youth group and elderly group(*P<0.05,**P<0.01)圖2 青、老年組核心節(jié)點(diǎn)的節(jié)點(diǎn)度Ki差異分析(*P<0.05,**P<0.01)
Fig.3 Analysis of the difference of the shortest path length Li be?tween youth group and elderly group(*P<0.05,**P<0.01)圖3 青、老年組核心節(jié)點(diǎn)的最短路徑長(zhǎng)度Li差異分析(*P<0.05,**P<0.01)
由圖5 青年組和老年組核心節(jié)點(diǎn)的節(jié)點(diǎn)效率差異分析可見,除左側(cè)距狀裂周圍皮層(CAL.L)、右側(cè)舌回(LING.R)不存在差異外,其它核心腦區(qū)均存在差異(P<0.05)。
青年組與老年組核心節(jié)點(diǎn)的局部效率差異如圖6 所示。由此可見,在雙側(cè)內(nèi)側(cè)和旁扣帶腦回(DCG.L、DCG.R)、左側(cè)距狀裂周圍皮層(CAL.L)等腦區(qū)的局部效率均存在顯著差異(P<0.01)。
Fig.4 Analysis results of Ci difference of clustering coefficient of core nodes between young group and elderly group(*P<0.05)圖4 青、老年組核心節(jié)點(diǎn)的聚類系數(shù)Ci差異分析結(jié)果(*P<0.05)
Fig.5 Englobal difference analysis of node efficiency of core nodes be?tween young group and elderly group(*P<0.05,**P<0.01)圖5 青、老年組核心節(jié)點(diǎn)的節(jié)點(diǎn)效率Englobal差異分析(*P<0.05,**P<0.01)
Fig.6 Eilocal difference analysis of node local efficiency of core nodes between young group and elderly group(**P<0.01)圖6 青、老年組核心節(jié)點(diǎn)的節(jié)點(diǎn)局部效率Eilocal差異分析(**P<0.01)
2.3.2 腦皮層形態(tài)特征參數(shù)年齡的差異性分析
通過對(duì)皮層特征進(jìn)行單因素方差分析,提取得到5 個(gè)腦區(qū)的皮層表面積參數(shù)、7 個(gè)腦區(qū)的皮層厚度參數(shù)、11 個(gè)腦區(qū)的皮層平均曲率參數(shù)及5 個(gè)腦區(qū)的體積參數(shù)(見圖7-圖10)。實(shí)驗(yàn)結(jié)果表明,這些參數(shù)隨著年齡層次不同均存在顯著差異(P<0.05)。
Fig.7 Brain regions with statistically different gray matter volume between young group and elderly group(*P<0.05,**P<0.01)圖7 青、老年組皮層體積具有統(tǒng)計(jì)學(xué)差異的腦區(qū)(*P<0.05,**P<0.01)
Fig.8 Brain areas with statistically different cortical surface area be?tween young group and elderly group(*P<0.05,**P<0.01)圖8 青、老年組皮層表面積具有統(tǒng)計(jì)學(xué)差異的腦區(qū)(*P<0.05,**P<0.01)
Fig.9 Brain areas with statistically different cortical thickness be?tween the young group and the elderly group(*P<0.05,**P<0.01)圖9 青、老年組皮層厚度具有統(tǒng)計(jì)學(xué)差異的腦區(qū)(*P<0.05,**P<0.01)
Fig.10 Brain regions with statistically different mean curvature of cortex between young group and elderly group(*P<0.05,**P<0.01)圖10 青、老年組皮層平均曲率具有統(tǒng)計(jì)學(xué)差異的腦區(qū)(*P<0.05,**P<0.01)
支持向量機(jī)(Support Vector Machine,SVM)是一種多元、受監(jiān)督的數(shù)據(jù)分類方法,其思想是建立一個(gè)最優(yōu)決策超平面對(duì)樣本進(jìn)行分割。對(duì)于一個(gè)多維樣本集,系統(tǒng)隨機(jī)產(chǎn)生一個(gè)不斷移動(dòng)的超平面對(duì)樣本進(jìn)行分類,直到訓(xùn)練樣本中屬于不同類別的樣本點(diǎn)正好位于超平面的兩側(cè),從而實(shí)現(xiàn)對(duì)線性可分樣本的全局最優(yōu)分類[21-22]。
隨機(jī)森林(Random forest,RF)是一種利用多個(gè)決策樹對(duì)樣本進(jìn)行訓(xùn)練、分類和預(yù)測(cè)的算法,主要用于解決回歸和分類問題,通常采用隨機(jī)、有放回地選擇訓(xùn)練數(shù)據(jù)構(gòu)造分類器與學(xué)習(xí)到的模型進(jìn)行組合,以提升模型預(yù)測(cè)精度[23]。
自編碼器(Auto-Encoder,AE)是一種利用反向傳播算法使輸出值等于輸入值的神經(jīng)網(wǎng)絡(luò),先將輸入壓縮成潛在空間表征,然后通過表征重構(gòu)輸出。
實(shí)驗(yàn)利用SVM、RF 及AE 分類器,依據(jù)優(yōu)化后的皮層特征數(shù)據(jù)集對(duì)青、老年受試者進(jìn)行類別分類。為了提高分類器性能,將原始數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集,通過5 倍交叉驗(yàn)證重復(fù)迭代訓(xùn)練,并采用受試者工作特征曲線(Re?ceiver Operating Characteristic,ROC)、曲線下面積(Area Under the Curve,AUC)、分類準(zhǔn)確率(Accuracy,ACC),及特異性值(Specificity,SPE)對(duì)分類效果進(jìn)行評(píng)價(jià)。
實(shí)驗(yàn)基于由華東師范大學(xué)上海市磁共振重點(diǎn)實(shí)驗(yàn)室和上??ɡ辗悄茚t(yī)療科技有限公司聯(lián)合開發(fā)的FeAture Explorer(FAE)平臺(tái)。
表4 為網(wǎng)絡(luò)特征集的青年組與老年組分類結(jié)果,可見SVM、RF 及AE 分類器分別達(dá)到70%、40%及70%的準(zhǔn)確率,AE 分類器的AUC 最高值為0.71。
Table 4 Classification results of network feature sets表4 網(wǎng)絡(luò)特征集分類結(jié)果
表5 為形態(tài)特征集的青年組與老年組分類結(jié)果,可見SVM、RF 及AE 分類器分別達(dá)到70%、74.4%及69.05%的準(zhǔn)確率,AE 分類器的AUC 最高值為0.75。
Table 5 Classification results of morphological feature sets表5 形態(tài)特征集分類結(jié)果
表6 為聯(lián)合特征集的青年組與老年組分類結(jié)果,可見SVM、RF 及AE 分類器分別達(dá)到90%、85%及80%的準(zhǔn)確率,SVM 分類器的AUC 最高值為0.89。相較于單一特征集,聯(lián)合特征集的最佳分類準(zhǔn)確率、SPE 及AUC 值均有顯著提高,證實(shí)了聯(lián)合特征集能夠提高模型性能。
Table 6 Classification results of joint feature sets表6 聯(lián)合特征集分類結(jié)果
本文利用單因素方差方法分析特征,分別提取大腦結(jié)構(gòu)形態(tài)特征及腦結(jié)構(gòu)網(wǎng)絡(luò)特征,得到優(yōu)化特征子集,并基于機(jī)器學(xué)習(xí)方法依據(jù)優(yōu)化后的皮層特征數(shù)據(jù)集對(duì)青、老年受試者進(jìn)行類別分類,驗(yàn)證構(gòu)建特征集對(duì)于腦老化的特異性,挖掘?qū)Υ竽X老化靈敏特異性更高的特征參數(shù)。
研究結(jié)果表明,構(gòu)建的多序列聯(lián)合特征集對(duì)腦老化程度的敏感特異性較強(qiáng),為后續(xù)大腦年齡及腦疾病預(yù)測(cè)研究提供了方向,同時(shí)對(duì)基于多序列腦影像數(shù)據(jù)融合方向的腦科學(xué)研究具有一定的指導(dǎo)意義。后續(xù)將添加更多正常受試者樣本及退行性疾病患者的狀態(tài)數(shù)據(jù),對(duì)于正常老化及疾病引起的腦影像特征變化進(jìn)行比較。