蔣嘉蕊,牛振東
北京理工大學(xué)計(jì)算機(jī)學(xué)院,北京市100081
人口老齡化已成為世界性的普遍現(xiàn)象。預(yù)測到2030年,世界65歲以上老年人將從2000年的4.2億增加到近10 億[1]。阿爾茨海默病(Alzheimer's disease,AD)是一種神經(jīng)退行性疾病[2],在65 歲及以上老年人中越來越普遍,其特征是神經(jīng)元及其連接進(jìn)行性不可逆損傷,導(dǎo)致認(rèn)知功能下降和喪失。根據(jù)認(rèn)知障礙程度,AD分為癥狀前、輕度認(rèn)知障礙和癡呆階段[3]。
目前,AD尚無法治愈[4],早期診斷和預(yù)防尤為重要。過去AD 的確診多取決于患者死亡腦組織檢查[5]。隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,計(jì)算機(jī)輔助AD 早期診斷逐漸流行,研究方法主要包括機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。機(jī)器學(xué)習(xí)已被廣泛應(yīng)用[6]。深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的一個(gè)分支,近年來取得很大發(fā)展[7]。深度學(xué)習(xí)采用端到端的學(xué)習(xí)方式,省略圖像分割、特征提取和特征選擇的過程[8],分類效果優(yōu)于機(jī)器學(xué)習(xí),日益受到重視。
本文對近5 年深度學(xué)習(xí)在AD 診斷中應(yīng)用研究的熱點(diǎn)和趨勢進(jìn)行可視化分析。
檢索Web of Science(WoS)核心數(shù)據(jù)庫。時(shí)間范圍為2017 年1 月1 日至2021 年12 月31 日。檢索式為deep learning AND Alzheimer disease AND disease diag‐nosis。剔除資訊、會(huì)議類論文,采用軟件自帶的去重功能和人工去重,刪除與本主題無關(guān)、字段值缺失等文獻(xiàn)。共檢索出文獻(xiàn)306篇。
采用CiteSpace 6.1.R3 軟件[9-11],分別從年發(fā)文量、國家、機(jī)構(gòu)、作者、關(guān)鍵詞、共被引文獻(xiàn)等方面進(jìn)行可視化分析。其中,時(shí)間分段選擇“2017-2021”,時(shí)間分區(qū)選擇“1”;閾值選擇“TOP N”,N=50;網(wǎng)絡(luò)剪裁在“Pathfinder”“Pruning the merged network”和“Pruning the sliced networks”三種算法中選擇。
近5 年來,深度學(xué)習(xí)在AD 診斷相關(guān)領(lǐng)域研究熱度逐年遞增,發(fā)文量呈上升趨勢,見圖1。
圖1 相關(guān)文獻(xiàn)年發(fā)文量趨勢圖
節(jié)點(diǎn)設(shè)定為Country,得到55 個(gè)節(jié)點(diǎn),105 條線(圖2)。發(fā)文量最多的國家為中國102 篇,其次是美國76 篇,韓國42 篇,英國31 篇,印度28 篇。中心性最高的國家是美國0.56,其次為西班牙0.25,英國0.21,德國0.20,韓國0.19。美國、韓國、英國在發(fā)文量和中心性方面均處于領(lǐng)先,在該領(lǐng)域具有重大影響力。我國發(fā)文量雖排名第1,中心性只有0.05。
圖2 國家/地區(qū)合作網(wǎng)絡(luò)
節(jié)點(diǎn)設(shè)定為Institution,得到662 個(gè)節(jié)點(diǎn),1 738條線(圖3)。發(fā)文量最多的機(jī)構(gòu)為中國科學(xué)院10 篇,其次為高麗大學(xué)9 篇,深圳大學(xué)8 篇,北卡羅來納大學(xué)8 篇,上海交通大學(xué)8 篇。中心性最高的是中國科學(xué)院0.17 和中國科學(xué)院大學(xué)0.13,其次為南京航空航天大學(xué)0.13、高麗大學(xué)0.11、北卡羅來納大學(xué)0.11。
圖3 研究機(jī)構(gòu)合作網(wǎng)絡(luò)
節(jié)點(diǎn)設(shè)定為Author,得到876 個(gè)節(jié)點(diǎn),2 760 條連線。發(fā)文量最高的作者是Liu M (11 篇),他提出一種基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)的多模型深度學(xué)習(xí)框架,用于結(jié)構(gòu)MRI數(shù)據(jù)進(jìn)行海馬自動(dòng)分割和AD 分類[12-13]。發(fā)文量排名前5 的還有Zhang Y[14-15](10 篇)、Wang Y[16](9 篇)、Liu Y[17](8 篇)、Kim J S[18](7篇)。
2.5.1 突顯分析
節(jié)點(diǎn)設(shè)定為Keyword 進(jìn)行突顯分析,出現(xiàn)5 個(gè)突顯關(guān)鍵詞(圖4),分別為AD 疾病診斷、魯棒性、網(wǎng)絡(luò)、連接性、人工神經(jīng)網(wǎng)絡(luò)。越來越多的模型關(guān)注魯棒性,有研究提出一種通用算法來訓(xùn)練數(shù)據(jù)不完整的LSTM網(wǎng)絡(luò),提高模型的魯棒性[19]。
圖4 關(guān)鍵詞突顯分析
2.5.2 共現(xiàn)分析
節(jié)點(diǎn)設(shè)定為Keyword,得到259個(gè)節(jié)點(diǎn),959條線(圖5)。除檢索詞外,頻次排名前5的關(guān)鍵詞依次是輕度認(rèn)知功能障礙、分類、磁共振成像、CNN 和癡呆。中心性排名前5 的關(guān)鍵詞依次是選擇、靜息態(tài)磁共振成像、遷移學(xué)習(xí)、特征排序和結(jié)構(gòu)磁共振成像(struc‐tural MRI,sMRI)。見表1。
圖5 關(guān)鍵詞共現(xiàn)圖
表1 高頻及高中心性關(guān)鍵詞
2.5.3 聚類分析
節(jié)點(diǎn)設(shè)定為Keyword,通過LLR 進(jìn)行聚類,Mo‐dality Q=0.67,Mean Sihouette=0.86,聚類結(jié)構(gòu)顯著,且聚類效果良好[20]。見圖6和表2。
圖6 關(guān)鍵詞聚類
表2 主要聚類及其包含關(guān)鍵詞
應(yīng)用的醫(yī)學(xué)影像技術(shù)主要有sMRI、正電子發(fā)射斷層掃描(positron emission computed tomography,PET)、功能磁共振成像、腦電圖。sMRI 可以無創(chuàng)地捕捉AD 患者腦萎縮的演變[21]。正電子發(fā)射斷層掃描可通過注入放射性示蹤劑捕捉AD 典型的淀粉樣沉積[22]。功能磁共振成像是分析大腦網(wǎng)絡(luò)功能連接的主要神經(jīng)影像模式[23]。腦電圖是一種低成本、無創(chuàng)的測量網(wǎng)絡(luò),可以記錄大腦的電活動(dòng),腦電圖的異常,如節(jié)律減慢、復(fù)雜性喪失和通道之間的同步改變,可能提示腦退化[24]。
常用數(shù)據(jù)集有阿爾茨海默病神經(jīng)影像學(xué)倡議(Al‐zheimer's Disease Neuroimaging Initiative,ADNI)、開放獲取系列成像研究數(shù)據(jù)集(Open Access Same Time Information System,OASIS)。ADNI 的主要目標(biāo)是測試MRI、PET 和其他生物標(biāo)志物,以及臨床和神經(jīng)心理評估是否可以結(jié)合起來測量輕度認(rèn)知障礙和早期AD 的進(jìn)展[25-26]。OASIS 由橫斷面和縱向面數(shù)據(jù)集組成,是僅次于ADNI 的核心數(shù)據(jù)資源[27]。針對AD 檢測的心理測試主要包括簡易精神狀態(tài)檢查[28]。AD 早期診斷問題主要可以分為三類:二元分類[29-30]、多元分類[31]和預(yù)測[32]。采用的深度學(xué)習(xí)結(jié)構(gòu)主要有CNN 和深度生成模型(deep generative model,DGM)。CNN 包括2D-CNN[33]和3D-CNN[34-35]兩種。DGM 包括自編碼器[36-37]、深度信念網(wǎng)絡(luò)、受限玻爾茲曼機(jī)[38-39]。
2.6.1 共被引分析
節(jié)點(diǎn)設(shè)定為Reference,被引頻次排名前5 的文獻(xiàn)見表3。其中Liu 等[40]Multimodal neuroimaging feature learning for multiclass diagnosis of Alzheimer's disease被引頻次最高,該研究設(shè)計(jì)一種基于多層神經(jīng)網(wǎng)絡(luò)的新型診斷框架,融合多模式神經(jīng)成像特征以幫助診斷AD,在AD 二元分類和多元分類中都實(shí)現(xiàn)了性能提升。Basaia 等[41]Automated classification of Alzheimer'sdisease and mild cognitive impairment using a single MRI and deep neural networks通過比較來自不同中心、神經(jīng)成像協(xié)議和掃描儀的數(shù)據(jù),克服數(shù)據(jù)來源單一的限制,達(dá)到結(jié)果的可靠性和可重復(fù)性。
表3 高頻次被引文獻(xiàn)
2.6.2 突顯分析
節(jié)點(diǎn)設(shè)定為Reference 進(jìn)行突顯分析(圖7)。Suk等[42]Hierarchical feature representation and multimodal fusion with deep learning for AD/MCI diagnosis突顯時(shí)間最早,研究使用堆疊自編碼器學(xué)習(xí)用于AD 分類的MRI和PET腦圖像的多層次和多模態(tài)特征。
圖7 參考文獻(xiàn)突顯分析
本研究采用CiteSpace 對近5 年深度學(xué)習(xí)在AD 診斷中的應(yīng)用的相關(guān)文獻(xiàn)進(jìn)行可視化分析,結(jié)果顯示,發(fā)文量逐年增加,說明深度學(xué)習(xí)在AD 診斷領(lǐng)域的可行性。美國、韓國、英國在發(fā)文量和中心性方面均領(lǐng)先。我國發(fā)文量雖排名第1,但中心性只有0.05,未來應(yīng)注意增加與其他國家的合作,提高國際影響力。
AD 診斷越來越依賴于腦影像技術(shù)。通過對關(guān)鍵詞和參考文獻(xiàn)的分析發(fā)現(xiàn),該領(lǐng)域使用的醫(yī)學(xué)影像技術(shù)主要有MRI、PET、腦電圖等。早期研究多采用單一腦影像技術(shù)即單模態(tài)神經(jīng)成像方法進(jìn)行輔助診斷,近年來傾向采用多種醫(yī)學(xué)影像技術(shù)整合,即多模態(tài)成像方法進(jìn)行輔助診斷。多模態(tài)成像方法的時(shí)間和空間分辨率更好,具有生物信息功能互補(bǔ)等特性,在分類上也更具優(yōu)勢[43]。由上述技術(shù)采集的數(shù)據(jù)形成數(shù)據(jù)集,常用有ADNI 和OASIS。進(jìn)一步研究應(yīng)將上述數(shù)據(jù)與臨床和神經(jīng)心理評估數(shù)據(jù)及其他生物標(biāo)志物相結(jié)合,以提高分類和預(yù)測的準(zhǔn)確性。
AD 早期診斷問題主要分為3 類:二元分類[28-29]、多元分類[30]和預(yù)測[31]。目前的研究多集中在對AD 早期診斷的二元、多元分類,對于MCI 到AD 轉(zhuǎn)換預(yù)測的研究較少。
CNN 是最多研究者選擇的深度學(xué)習(xí)模型[44]。深度學(xué)習(xí)能進(jìn)行數(shù)據(jù)驅(qū)動(dòng)的自動(dòng)特征學(xué)習(xí),消除了選擇相關(guān)特征的主觀性。通過應(yīng)用非線性的層次結(jié)構(gòu),深度學(xué)習(xí)能夠?qū)Ψ浅?fù)雜的數(shù)據(jù)模式建模。采用深度學(xué)習(xí)方法進(jìn)行AD診斷的準(zhǔn)確率不斷提高。
采用深度學(xué)習(xí)進(jìn)行AD 診斷也存在一些問題。標(biāo)記AD 診斷醫(yī)學(xué)圖像是一項(xiàng)耗時(shí)且昂貴的任務(wù)[45];當(dāng)前數(shù)據(jù)樣本量尚不充分,而依靠數(shù)據(jù)增強(qiáng)和遷移學(xué)習(xí)緩解數(shù)據(jù)量不足問題的技術(shù)仍有局限[46]。進(jìn)一步研究要不斷降低數(shù)據(jù)采集成本、并盡可能采集互補(bǔ)性更強(qiáng)的多模態(tài)數(shù)據(jù),不斷豐富研究數(shù)據(jù);應(yīng)優(yōu)化基準(zhǔn)測試平臺,探索不同數(shù)據(jù)模式之間的關(guān)聯(lián),克服因數(shù)據(jù)集、分類模式和受試者數(shù)量差異造成的研究間無法比較的局限,提高模型預(yù)測精度。
本研究選用單一數(shù)據(jù)庫進(jìn)行分析,對年份、語種、文獻(xiàn)類型進(jìn)行了限制,導(dǎo)致許多研究未納入統(tǒng)計(jì),有待進(jìn)一步完善。
利益沖突聲明:所有作者聲明不存在利益沖突。