王卓雅, 王燕琳, 楊志華, 孫慧芳, 張 奇, 楊 靖, 許予明
阿爾茨海默病(Alzheimer’s disease,AD)是一種年齡相關(guān)的神經(jīng)退行性疾病,也是認(rèn)知功能下降最常見(jiàn)的病因。目前,全球有4000多萬(wàn)人患有AD,預(yù)計(jì)到2050年,這一數(shù)字將超過(guò)1億[1]。影像學(xué)的應(yīng)用在AD診斷方面有極大影響,研究表明AD腦萎縮的模式不是隨機(jī)的,通常是緩慢有序發(fā)展的,首先涉及海馬體,然后擴(kuò)散到內(nèi)側(cè)頂葉、外側(cè)顳葉和額葉區(qū)域,最終影響皮質(zhì)的所有區(qū)域,因此,海馬體的是區(qū)分AD的最佳區(qū)域[2]。關(guān)于AD的發(fā)病機(jī)制存在很多種假說(shuō),包括淀粉樣蛋白級(jí)聯(lián)反應(yīng),tau過(guò)度磷酸化,神經(jīng)遞質(zhì)和氧化應(yīng)激等[3],但具體的發(fā)病機(jī)制和最佳的治療方案仍未明確。目前,有幾種針對(duì)Aβ和tau的藥物可以改善癥狀,但這些藥物不能延緩疾病的進(jìn)展。在我們此次的研究中,利用GEO數(shù)據(jù)庫(kù)結(jié)合GO富集分析、KEGG通路分析、PPI網(wǎng)絡(luò)分析、基因共表達(dá)網(wǎng)絡(luò)分析等生物信息學(xué)方法,識(shí)別可能參與AD發(fā)生發(fā)展的關(guān)鍵基因。因此,探討AD發(fā)病的分子機(jī)制,進(jìn)一步為AD的精準(zhǔn)治療提供依據(jù)。
1.1 資料來(lái)源 GEO(Gene Expression Omnibus database)數(shù)據(jù)庫(kù)(https://www. ncbi. nlm. nih. gov/geo/)系美國(guó)國(guó)立生物技術(shù)信息中心(NCBI)創(chuàng)建并維護(hù)的基因表達(dá)數(shù)據(jù)庫(kù),是目前最全面的公共基因表達(dá)數(shù)據(jù)庫(kù)[4]。從GEO數(shù)據(jù)庫(kù)中搜索獲取基因芯片GSE5281,該芯片包含161個(gè)人大腦組織,芯片數(shù)據(jù)是通過(guò)Affymetrix U133 Plus 2.0 array獲取的表達(dá)譜,其中包括6個(gè)腦區(qū)樣本,分別是內(nèi)嗅皮質(zhì)(AD患者10例,正常對(duì)照13例)、海馬(AD患者10例,正常對(duì)照13例)、內(nèi)側(cè)顳葉(AD患者16例,正常對(duì)照12例)、后扣帶回(AD患者9例,正常對(duì)照13例)、額上回(AD患者23例,正常對(duì)照11例)和初級(jí)視覺(jué)皮質(zhì)(AD患者19例,正常對(duì)照12例)。本研究選取海馬區(qū)AD患者10例,正常對(duì)照13例作為樣本,并比較兩者之間的差異。
1.2 差異表達(dá)基因的篩選 使用R程序?qū)蜻M(jìn)行t檢驗(yàn),通過(guò)統(tǒng)計(jì)學(xué)方法差異基因,通過(guò)采用調(diào)整P值<0.05,|logFC|>1.5 作為入選標(biāo)準(zhǔn),其中l(wèi)ogFC>1.5 作為上調(diào)差異表達(dá)基因,logFC<-1.5作為下調(diào)差異表達(dá)基因。
1.3 基因本體(GO)及京都基因與基因組百科全書(shū)(KEGG)通路富集分析 GO富集分析從生物過(guò)程、細(xì)胞組成和分子功能三方面對(duì)基因產(chǎn)物進(jìn)行標(biāo)準(zhǔn)化描述,能夠有效地鑒定獲取數(shù)據(jù)的相應(yīng)生物學(xué)屬性。KEGG通路富集分析DEGs所參與的代謝途徑以及各途徑之間的關(guān)系,從而可以表示參與其中的基因列表以及信號(hào)通路。使用DAVID數(shù)據(jù)庫(kù)(https://david. ncifcrf. gov)對(duì)篩選得到的DEGs進(jìn)行在線GO富集分析,使用R程序clusterProfiler包對(duì)DEGs進(jìn)行KEGG通路富集分析,獲取P值,P<0.05并且基因數(shù)≥5有統(tǒng)計(jì)學(xué)意義。
1.4 蛋白質(zhì)-蛋白質(zhì)相互作用(Protein-Protein interaction,PPI) 網(wǎng)絡(luò)分析 采用STRING數(shù)據(jù)庫(kù)(https://string-db. org)進(jìn)行DEGs的PPI網(wǎng)絡(luò)構(gòu)建,STRING是目前覆蓋蛋白質(zhì)相互作用信息最全面的數(shù)據(jù)庫(kù),使用STRING分析得到的PPI網(wǎng)絡(luò)結(jié)合Cytoscape軟件進(jìn)行可視化分析。
1.5 藥物-基因的相互作用 利用開(kāi)源的藥物基因相互作用數(shù)據(jù)庫(kù)(https:/ /www. Dgidb. org)來(lái)分析基因與藥物之間的相互作用,以關(guān)鍵基因?yàn)闈撛诘臉?biāo)靶在數(shù)據(jù)庫(kù)中搜素現(xiàn)有的藥物,以探索新的藥物在疾病中的潛在應(yīng)用。
1.6 統(tǒng)計(jì)學(xué)分析 DEGs分析采用t檢驗(yàn)的P值和差異倍數(shù)進(jìn)行篩選和鑒定,篩選的標(biāo)準(zhǔn)為調(diào)整P值<0.05且差異倍數(shù)>1.5有統(tǒng)計(jì)學(xué)意義,對(duì)DEGs進(jìn)行GO及 KEGG富集分析,P<0.05有統(tǒng)計(jì)學(xué)意義。所有統(tǒng)計(jì)分析均在R 4.0.3中完成。
2.1 差異表達(dá)基因 通過(guò)GSE5281中海馬組進(jìn)行差異基因篩選出863個(gè)DEGs(差異倍數(shù)>1.5,且調(diào)整P<0.05),分別包括246個(gè)上調(diào)基因和617個(gè)下調(diào)基因(前10位上調(diào)和下調(diào)DEGs見(jiàn)表1)。通過(guò)差異表達(dá)基因繪制火山圖(圖1A)和聚類圖(見(jiàn)圖1B)。紅色代表上調(diào)基因,藍(lán)色代表下調(diào)基因,從圖中可以說(shuō)明下調(diào)基因比例較高。
表1 前10位上調(diào)及下調(diào)差異表達(dá)基因
2.2 差異表達(dá)基因的功能分析
2.2.1 GO富集分析 GO分析可由生物過(guò)程、分子功能和細(xì)胞組成3個(gè)部分結(jié)果構(gòu)成。上調(diào)的DEGs在分子功能包括ATP結(jié)合以及POLY(A) RNA結(jié)合,細(xì)胞組成包括細(xì)胞外泌體,線粒體,線粒體內(nèi)膜,細(xì)胞膜等,生物過(guò)程中主要包括蛋白折疊和內(nèi)質(zhì)網(wǎng)(ER)相關(guān)泛素依賴蛋白分解過(guò)程,下調(diào)的DFGs在分子功能包括RNA聚合酶Ⅱ核心啟動(dòng)子的結(jié)合及特異性DNA結(jié)合以及轉(zhuǎn)錄調(diào)控區(qū)域的特異性結(jié)合,細(xì)胞組成包括核質(zhì)和細(xì)胞核內(nèi),生物過(guò)程中主要包括RNA聚合酶Ⅱ啟動(dòng)子的轉(zhuǎn)錄的調(diào)控以及轉(zhuǎn)化生長(zhǎng)因子受體信號(hào)通路的負(fù)調(diào)控等(見(jiàn)圖2)。
2.2.2 KEGG通路分析 KEGG分析結(jié)果顯示,上調(diào)DEGs主要涉及帕金森病、朊蛋白病、亨廷頓病、阿爾茲海默病等多種神經(jīng)退行性疾病,以及蛋白酶體、氧化磷酸化和生熱作用,下調(diào)DEGs主要包括長(zhǎng)時(shí)程增強(qiáng)作用、軸突導(dǎo)向、嗅覺(jué)傳導(dǎo)以及MAPK、Rap1、雌激素鈣離子、Ras信號(hào)通路等(見(jiàn)圖3)。
圖3 差異表達(dá)基因的KEGG富集分析(紅色代表上調(diào)基因,藍(lán)色代表下調(diào)基因)
2.3 差異表達(dá)基因的PPI結(jié)果
2.3.1 PPI網(wǎng)絡(luò)的構(gòu)建以及核心基因的篩選 為了鑒定潛在調(diào)控基因,構(gòu)建 PPI 網(wǎng)絡(luò),基于STRING數(shù)據(jù)庫(kù)結(jié)合Cytoscape插件篩選出5個(gè)基因PSMA7、PSMA3、PSMB7、PSMC5和PSMC3,將這5個(gè)基因命名為核心基因(見(jiàn)圖4A)。
2.3.2 功能模塊分析 使用 Cytoscape 中的 MCODE 插件,其根據(jù)拓?fù)潢P(guān)系對(duì)給定網(wǎng)絡(luò)進(jìn)行聚類,篩選出31個(gè)關(guān)鍵基因,其中包括23個(gè)上調(diào)基因和8個(gè)下調(diào)基因(圖4B),紅色代表上調(diào)基因,藍(lán)色代表下調(diào)基因。31個(gè)關(guān)鍵基因?yàn)镻SMC5、PSMA7、PSMC3、PSMB3、TNPO1、UBE2W、FBXO32、CCT4、MYLIP、PSMB7、RPL3、RNF25、FBXW12、CCT2、PSMA3、CUL3、PFDN5、CCT5、SMURF2、UBE2M、COPS5、EIF3G、ASB16、UBC、PPP2R1A、HSP90AB1、PSMD8、CCT7、CUL1、NACA、NHP2L1,其中TNPO1、NHP2L1、ASB16、FBXW12、SMURF2、FBXO32、UBE2W、MYLIP為下調(diào)基因,余23個(gè)均為上調(diào)基因。通過(guò)KEGG分析得這些關(guān)鍵基因與蛋白酶體及泛素介導(dǎo)的蛋白水解關(guān)系密切。
2.4 藥物基因相互作用 以5個(gè)核心基因?yàn)榘悬c(diǎn)篩選出8種現(xiàn)有藥物,分別為CARFILZOMIB、BORTEZOMIB、IXAZOMIB CITRATE、OPROZOMIB、PHENETHYLISOTHIOCYANATEIXAZOMI、CHEMBL304784、MARIZOMIB(見(jiàn)表2)。
表2 藥物與核心基因相互作用
2.5 多組基因芯片分析 由于所檢索的基因表達(dá)譜芯片(ID:GSE5281)樣本量較少,為了使數(shù)據(jù)更加具有說(shuō)服力,進(jìn)一步擴(kuò)大樣本量進(jìn)行分析,以用于尋找到共同的差異表達(dá)基因,從GEO數(shù)據(jù)庫(kù)中進(jìn)一步篩選出兩組基因芯片GSE1297和GSE48350,GSE1297芯片來(lái)源于海馬部分的基因表達(dá)分析,其包含9個(gè)正常對(duì)照和31個(gè)AD患者的海馬區(qū)腦組織,根據(jù)MMSE和NFT評(píng)分將患者劃分為輕、中、重度,我們選取其中9個(gè)正常對(duì)照和7個(gè)分型為重度的患者進(jìn)行分析。GSE48350芯片包括253例腦組織樣本的基因表達(dá)譜數(shù)據(jù)集,我們選取其中對(duì)本研究有意義的62例樣本,包括19例AD患者海馬區(qū)腦組織樣本和43例正常對(duì)照海馬區(qū)腦組織樣本進(jìn)行分析(P值<0.05,|logFC|>1.5 作為入選標(biāo)準(zhǔn))。GEO數(shù)據(jù)庫(kù)中僅GSE5281,GSE1297和GSE48350這3組基因芯片為AD患者海馬區(qū)腦組織表達(dá)譜芯片,這三組基因芯片兩兩比較結(jié)果見(jiàn)表3。
表3 3組基因芯片分析結(jié)果兩兩比較
阿爾茨海默病(AD)是1907年由Alois Alzheimer首次提出并以其名字命名此種疾病[5]。AD是癡呆最常見(jiàn)的原因,約占70%[6]。臨床表現(xiàn)起病隱匿,包括記憶力減退、認(rèn)知功能下降,行為功能障礙,日常生活活動(dòng)不能維持[7]。患者從正常認(rèn)知障礙進(jìn)展到輕度認(rèn)知障礙(MCI),隨后癡呆程度逐漸加重從輕度進(jìn)展為中度進(jìn)而變?yōu)橹囟取?5歲患者確診后的平均存活時(shí)間為8 y[8]。AD的神經(jīng)病理學(xué)在宏觀上表現(xiàn)為腦萎縮,皮質(zhì)變薄、萎縮,主要顯微特征包括神經(jīng)炎性淀粉樣斑塊和神經(jīng)原纖維纏結(jié)(NFTs)形成。目前多數(shù)研究認(rèn)為Aβ和tau寡聚物沉積是AD重要的發(fā)病機(jī)制[9]。但具體的機(jī)制仍不清晰,并且治療方式單一,效果甚微,給患者及家庭造成了極大的精神和經(jīng)濟(jì)負(fù)擔(dān),因此加快對(duì)AD的發(fā)病機(jī)制的研究進(jìn)而促進(jìn)治療的需求十分迫切。
本研究通過(guò)使用t檢驗(yàn)對(duì)GSE5281基因芯片進(jìn)行分析,獲得AD患者海馬體部分腦組織與正常對(duì)照相比差異表達(dá)863個(gè)基因,包括 246個(gè)上調(diào)基因和617個(gè)下調(diào)基因,通過(guò)PPI分析得到31個(gè)關(guān)鍵基因:PSMC5、PSMA7、PSMC3、PSMB3、TNPO1、UBE2W、FBXO32、CCT4、MYLIP、PSMB7、RPL3、RNF25、FBXW12、CCT2、PSMA3、CUL3、PFDN5、CCT5、SMURF2、UBE2M、COPS5、EIF3G、ASB16、UBC、PPP2R1A、HSP90AB1、PSMD8、CCT7、CUL1、NACA、NHP2L1,其中TNPO1、NHP2L1、ASB16、FBXW12、SMURF2、FBXO32、UBE2W、MYLIP為下調(diào)基因,余23個(gè)差異表達(dá)基因在AD患者海馬體部分為上調(diào)基因。
通過(guò)生物信息學(xué)的方法,我們分析得到AD患者海馬體部分與正常對(duì)照相比有31個(gè)關(guān)鍵的DEGs,其中COPS5、PSDN5和TNPO1在AD中的作用已有研究,而有些基因在AD中的作用仍需進(jìn)一步研究。有研究表明在細(xì)胞系和小鼠腦中COPS5 (Constitutive Photomorphogenesis 9 Signalosome Subunit 5)與LRP、BACE1、APP和RanBP9結(jié)合從而導(dǎo)致Aβ的分泌增加[10],此外,COPS5過(guò)表達(dá)減少腦內(nèi)樹(shù)突棘標(biāo)志物的表達(dá)并且小鼠的學(xué)習(xí)和記憶能力均有下降[11],因此說(shuō)明COPS5是RanBP9復(fù)合物的一部分,并且在Aβ的產(chǎn)生和體內(nèi)突觸蛋白水平變化中占據(jù)重要作用。PFDN(Prefoldin)是一種廣泛表達(dá)的異六聚體輔伴侶蛋白,由2個(gè)α亞基(PFDN3、5)和4個(gè)β亞基(PFDN1,2,4,和6)組成[12],其生物功能主要為協(xié)助新合成大小的蛋白質(zhì)折疊,防止已存在的蛋白質(zhì)聚集和錯(cuò)誤折疊[13],其中PFDN5在神經(jīng)系統(tǒng)中研究最為充分,PFDN5功能異常導(dǎo)致致病性淀粉樣β蛋白聚集,隨后神經(jīng)元死亡[14],此外,在小鼠體內(nèi)PFDN5基因破壞可導(dǎo)致小腦神經(jīng)元細(xì)胞變性[15],因此PFDN5功能障礙是導(dǎo)致AD的病因之一。有研究指出TNPO1(Transportin-1)在早期AD中發(fā)揮了重要作用,在AD小鼠海馬區(qū)發(fā)現(xiàn)TNPO1水平上調(diào),這與我們此次的研究相符,這可能說(shuō)明了TNOP1表達(dá)水平的上調(diào)可能是腦內(nèi)Aβ增加的調(diào)節(jié)機(jī)制,因此TNOP1可能在早期AD中Aβ代謝中占據(jù)了重要作用[16]。
GO富集分析得到DEGs主要集中在線粒體電子傳遞、ATP結(jié)合以及定位于線粒體內(nèi)等生物過(guò)程。線粒體功能障礙與AD之間的關(guān)系十分密切,線粒體主要產(chǎn)生ATP用于為細(xì)胞生命活動(dòng)提供能量,許多線粒體功能障礙已經(jīng)在AD中有研究,在Aβ和tau蛋白開(kāi)始形成之前線粒體中葡萄糖的代謝受損、線粒體酶功能下降以及ROS的產(chǎn)生增加[17],此外,在早期AD線粒體動(dòng)力學(xué)方面也出現(xiàn)功能障礙,包括線粒體融合和裂變之間的平衡破壞、線粒體軸突運(yùn)輸減少、細(xì)胞內(nèi)線粒體比例降低、大小發(fā)生改變,線粒體在AD中維持為更短、更寬的形狀[18]。因此,線粒體功能缺陷可能是AD進(jìn)展的核心。KEGG富集分析結(jié)果示上調(diào)DEGs主要跟AD、帕金森病及亨廷頓病等神經(jīng)退行性疾病有關(guān),下調(diào)DEGs主要跟長(zhǎng)時(shí)程增強(qiáng)有關(guān),長(zhǎng)時(shí)程增強(qiáng)(LTP)是1973年首次在哺乳動(dòng)物大腦中的穿通神經(jīng)纖維與顆粒細(xì)胞之間的突觸連接中發(fā)現(xiàn),海馬內(nèi)單突觸興奮同類的短暫高頻刺激尋獵導(dǎo)致突觸傳遞效率的突然和持續(xù)增加,LTP構(gòu)成海馬體的所有興奮通路及大腦其他幾個(gè)區(qū)域[19],因此可以說(shuō)明其構(gòu)成了記憶形式的基礎(chǔ),我們此次研究說(shuō)明AD患者海馬體與正常對(duì)照相比下調(diào)DEGs的KEGG富集通路主要集中于長(zhǎng)時(shí)程增強(qiáng),構(gòu)成AD的發(fā)病機(jī)制。然而,我們此次研究中GO富集分析中發(fā)現(xiàn)DEGs與RNA聚合酶Ⅱ啟動(dòng)子的結(jié)合劑轉(zhuǎn)錄調(diào)控關(guān)系密切,然而這部分研究相對(duì)較少,可能為以后研究AD發(fā)病機(jī)制提供新方向。
通過(guò)基因與藥物相互關(guān)系研究,我們通過(guò)PPI篩選出5個(gè)核心基因(PSMA7、PSMA3、PSMB7、PSMC5和PSMC3),并以此為靶點(diǎn)篩選出8種藥物,分別為CARFILZOMIB、BORTEZOMIB、IXAZOMIB CITRATE、OPROZOMIB、PHENETHYLISOTHIOCYANATE、IXAZOMI、CHEMBL304784、MARIZOMIB,這8種藥物均為相應(yīng)基因位點(diǎn)的抑制劑。其中,CARFILZOMIB用于治療難治性和復(fù)發(fā)性多發(fā)性骨髓瘤的蛋白酶體抑制劑,美國(guó)食品和藥物管理局(FDA)批準(zhǔn)該藥物可以與地塞米松或來(lái)那度胺聯(lián)合使用來(lái)做進(jìn)一步治療[20],有案例曾報(bào)道一位使用CARFILZOMIB治療的多發(fā)性骨髓瘤患者出現(xiàn)了癲癇持續(xù)狀態(tài),停藥3 d后這些癥狀消失[21],目前針對(duì)CARFILZOMIB與癲癇的關(guān)系并沒(méi)有機(jī)制說(shuō)明,我們猜測(cè)可能通過(guò)降低血管內(nèi)皮生長(zhǎng)因子的轉(zhuǎn)錄導(dǎo)致內(nèi)皮功能障礙從而導(dǎo)致腦內(nèi)神經(jīng)元的興奮性增強(qiáng)出現(xiàn)癲癇等癥狀,而AD是一種退行性疾病,由此我們推測(cè)CARFILZOMIB可能提高神經(jīng)系統(tǒng)的興奮性。然而這些藥物均未在AD模型進(jìn)行研究,我們此次的研究為探討AD的發(fā)病機(jī)制及治療方式提供了新的思路,但仍需要進(jìn)行分子實(shí)驗(yàn)進(jìn)行驗(yàn)證。
我們通過(guò)一系列生物信息信息學(xué)方法對(duì)基因表達(dá)譜進(jìn)行分析,篩選出多個(gè)AD患者海馬體部分與正常人相比的差異表達(dá)基因,以及現(xiàn)有的靶向藥物,這將為我們了解AD發(fā)病機(jī)制和探討新的治療方案提供依據(jù)。