張雪,宋銀,孫嘉偉,汪海燕,王宿潔,黃瑾,楊磊,*
(1 石河子大學醫(yī)學院,新疆 石河子 832000;2 杭州師范大學醫(yī)學部,浙江 杭州 310036)
隨著中國老齡化社會的來臨,各種老年性疾病的發(fā)生也逐步增高,尤其是耳聾。據(jù)世界衛(wèi)生組織報道,在65歲及以上人群,約有三分之一的人患有聽力障礙[1]。在我國,老年人中聽力障礙者約占80%左右[2]。老年性耳聾也稱年齡相關性聽力損失(ARHL),指隨年齡增長而出現(xiàn)的雙耳對稱、緩慢、進行性的感音神經(jīng)性聽力減退,具有隱匿性及漸進性發(fā)展的特點,對患者造成嚴重的身體和心理危害,降低老年人的生活質(zhì)量,加重社會的經(jīng)濟負擔。
由于ARHL發(fā)病機制非常復雜,ARHL的早期診斷極其困難。為了探索其分子機制,一些學者利用基因芯片技術,用于指示其發(fā)生發(fā)展規(guī)律,研究小鼠模型ARHL發(fā)生過程中的基因表達變化[3-4]。然而,由于樣本數(shù)量限制,單個微陣列測序往往表現(xiàn)出對高豐度分子鑒定的局限性,結(jié)果往往存在偏差[5]。利用生物信息學手段可以整合多個微陣列數(shù)據(jù)集,減少這種偏差,從而使結(jié)果更具有客觀性。
本研究中,我們通過挖掘3個與ARHL有關的GEO數(shù)據(jù)集,獲得了異常表達的基因,綜合分析,獲得與ARHL高度相關的核心基因,并通過預測其下游的信號通路及可能調(diào)控這些核心基因的miRNA,進一步明確核心基因與ARHL的相關性。
使用GEO(http://www.ncbi.nlm.nih.gov/geo/)數(shù)據(jù)庫以hearing loss and aging為關鍵詞搜索基因芯片,按以下標準納入結(jié)果:(1)研究與年齡相關性聽力損失有關。(2)小鼠模型為會發(fā)生年齡相關性聽力損失的模型。(3)芯片檢測內(nèi)容為差異基因。
對于從GEO篩選到的數(shù)據(jù)集,使用R語言RMA包[6]對數(shù)據(jù)進行標準化,隨后使用R語言的limma包[7]分析差異表達基因,篩選標準為P<0.05和| logFC |>0.5。
將差異基因上傳至STRING(用于搜索相互作用基因的搜索工具;https://string-db.org/)數(shù)據(jù)庫分析基因相互作用并下載蛋白互作網(wǎng)絡,然后將蛋白互作網(wǎng)絡導入Cytoscap[8]軟件,利用CytohHubba[9]插件富集出連接數(shù)位于前10的核心基因。
將篩選的10個核心基因,使用R語言的clusterProfiler包括KEGG(Kyoto Encyclopedia of Genes and Genomes)富集分析,得到可能發(fā)揮作用的通路(P<0.05)。
使用miRDB數(shù)據(jù)庫 (http://mirtarbase.mbc.nctu.edu.tw/php/search.php)預測靶向10個核心基因的miRNA,然后使用 Cytoscap構(gòu)建它們的調(diào)控網(wǎng)絡關系圖,利用CytohHubba[9]插件篩選出節(jié)點數(shù)靠前的miRNA。
我們在GEO數(shù)據(jù)庫中,篩選出了3個與ARHL有關的mRNA芯片,分別為GSE6045,GSE62173和GSE35234。GSE6045使用了DBA/2 J(DBA)小鼠作為ARHL的模型動物,檢測了7周齡和36周齡小鼠耳蝸的基因表達。GSE62173同樣使用了DBA/2 J(DBA)小鼠,檢測了4周齡和12周齡小鼠耳蝸的基因表達。GSE35234使用了C57/BL6j小鼠作為ARHL的模型動物,檢測了4周齡、15周齡和45周齡小鼠耳蝸的基因表達。我們使用主成分分析(PCA)評估芯片每組樣本的獨立性(圖1)。結(jié)果顯示數(shù)據(jù)集GSE6045,GSE62173和GSE35234中的對照組和實驗組樣本之間分離程度很好。
A—基因芯片GSE45026的主成分分析圖 B—基因芯片GSE62173的主成分分析圖 C—GSE35234基因芯片的主成分分析圖PC1,PC2代表芯片的兩種主要組分,紅點代表老年組,藍點代表年輕組。圖1 ARHL基因芯片的主成分分析圖
我們分析基因芯片的差異基因后使用火山圖對其進行可視化,火山圖(圖2A,C,E)顯示了3個數(shù)據(jù)集中差異基因的分布。我們在GSE6045中共篩選到1 871個差異基因,包括740個上調(diào)基因和1 131個下調(diào)基因,在GSE62173 中篩選到313個差異基因,包括153個上調(diào)基因和160個下調(diào)基因,在GSE35234中篩選到958個差異基因,包括498個上調(diào)基因和460個下調(diào)基因。將3個芯片的上調(diào)基因和下調(diào)基因分別取交集,結(jié)果顯示3個基因芯片中有105個共同上調(diào)基因(圖2G)和121個共同下調(diào)基因(圖2H)。
圖2 ARHL差異基因的篩選
對于篩選到的105個共上調(diào)基因和121個共下調(diào)基因,我們利用STRING數(shù)據(jù)庫,分析出基因間的相互作用關系(圖3A,C)。根據(jù)基因的相互作用關系,我們從105個共上調(diào)基因中富集出10個上調(diào)的核心基因即MPo,Hp,Cd52,Elane,II1b,H2-K1,Tyrobp,Cd74,Lcp1和Ptprc(圖3B);我們從121個共下調(diào)基因中富集處10個下調(diào)核心基因即MPo,Hp,Cd52,Elane,II1b,H2-K1,Tyrobp,Cd74,Lcp1和Ptprc(圖3D)。
圖3 ARHL基因芯片的核心基因篩選
A:10個下調(diào)核心基因的KEGG富集分析結(jié)果圖4 ARHL下調(diào)的10個核心基因的KEGG富集分析
年齡相關性聽力損失是一種與年齡相關的退行性疾病,對于退行性疾病我們一般關注下調(diào)基因。對于富集到的10個下調(diào)核心基因,KEGG富集分析結(jié)果顯示:Col3a1,Col1a2,Col4a2,Col2a1和Col5a2主要富集在Protein digestion and absorption,ECM-receptor interactions,AGE-RAGE signaling pathway in diabetic complications,Amoebiasis,Relaxin signaling pathway,F(xiàn)ocal adhesion等信號通路(圖4A)。
我們使用生物信息學網(wǎng)站miRDB預測了調(diào)控10個下調(diào)核心基因的miRNA,發(fā)現(xiàn)其中有8個核心基因(Col3a1,Col1a2,Sparc,Col4a2,Col2a1,Lox,Col5a2,Postn)可以被miRNA靶向調(diào)控(圖5A)。miRNA與基因存在著多對多的調(diào)控關系,我們使用Cytoscap軟件對預測到的miRNA進行了篩選,從中篩選到了連接數(shù)最多的2個miRNA即 miR-29c-3p,miR-29a-3p(圖5B)。miR-29c-3p和miR-29a-3p與6個核心基因(Col3a1,Col4a2,Col2a1,Lox,Sparc,Col5a2)均存在著調(diào)控關系,可以認為其為老年性聽力損失中的重要miRNA。
A:調(diào)控8個下調(diào)基因的miRNA預測結(jié)果;B:調(diào)控8個下調(diào)基因的miRNA中重要miRNA的篩選結(jié)果。圖5 靶向下調(diào)ARHL核心基因的miRNA預測及核心miRNA的篩選
ARHL造成了約30%的老年人生活質(zhì)量下降,在全球范圍內(nèi)正在成為一個日益嚴重的公共衛(wèi)生問題,但目前對其早期診斷非常困難?;蛐酒夹g可以檢測人類中數(shù)以千萬個基因的表達水平,已被廣泛用于研究各種疾病的分子變化、預測潛在的治療靶標以及尋找早期診斷生物標志物。本研究從3個與ARHL有關的基因芯片,篩選了10個與其有關的核心基因,為ARHL的早期診斷提供可能的分子靶標。
ARHL是一種退行性疾病,各種重要基因隨年齡變化開始表達下調(diào)。小鼠是研究哺乳動物聽覺功能和衰老的主要生物模型動物[10]。據(jù)報道某些品系小鼠隨年齡增長其聽力變化不大(例如CAST,CBA/CaJ,CBA/J,C3H/HeH),而某些品系表現(xiàn)出隨年齡變化聽覺功能逐漸下降的特點(例如BALB,C57BL/6,DBA/2 J)。本研究應用生物信息學分析了C57BL/6、DBA/2 J小鼠中多個數(shù)據(jù)集的mRNA表達譜,通過集成多個數(shù)據(jù)集來提高檢測結(jié)果的準確度[11]。GSE6045、GSE35234和GSE62173中使用的C57BL/6,DBA/2 J小鼠都具有隨年齡增長而發(fā)生聽力損失的特性。使用R語言分析后,我們在三個芯片中篩選到了226個共表達基因,其中包括105個上調(diào)基因和121個下調(diào)基因(|log2FC|>0.5,P<0.05)。
為了篩選ARHL中的核心基因,我們將獲得的下調(diào)基因映射到STRING數(shù)據(jù)庫并獲得蛋白互作網(wǎng)絡。眾所周知,蛋白互作網(wǎng)絡中節(jié)點度較高的基因通常起重要作用。我們在下調(diào)基因中選擇了節(jié)點排名前10的基因確定為核心基因,分別是:Col3a1,Col5a2,Sparc,Col4a2,Col2a1,Col1a1,Lox,Ctgf,Postn和Acan。其中Col家族是一類與膠原蛋白形成有關的基因,我們預測發(fā)現(xiàn)在ARHL動物模型中Col家族基因表達下調(diào)。膠原蛋白是內(nèi)耳細胞外基質(zhì)的主要成分,其中,II型膠原蛋白在整個耳蝸和螺旋韌帶中含量最高[12],對于螺旋狀韌帶中離子傳輸系統(tǒng)的完整性至關重要。在F344大鼠中,II型膠原蛋白在螺旋韌帶和血管紋連接區(qū)域的明顯減少造成了老年F344大鼠的聽力損失[13]。此外,內(nèi)耳的蓋膜也主要是膠原蛋白組成[14-15]。以上研究表明在ARHL中,膠原蛋白隨年齡減少,與耳聾的發(fā)生有關,這與我們的分析不謀而合。我們還發(fā)現(xiàn),Sparc基因在ARHL中表達下調(diào),Sparc是一種能夠編碼多功能細胞外基質(zhì)(ECM)糖蛋白的基因,當耳蝸功能成熟并需要鈣水平快速變化時,SPARC可能在直流的鈣調(diào)節(jié)中發(fā)揮作用[16],可能與聽力損失有關,與我們的預測結(jié)果不謀而同。Ctgf基因在ARHL也表達下調(diào),有文獻發(fā)現(xiàn),斑馬魚在嚴重的脊髓損傷后,CTGF重組蛋白能有效地再生功能神經(jīng)系統(tǒng)組織[17]。提示Ctgf基因在神經(jīng)系統(tǒng)的損傷恢復中可能發(fā)揮重要作用,而耳聾也屬于神經(jīng)系統(tǒng)疾病。
為了驗證核心基因與ARHL發(fā)生發(fā)展的相關性,我們分析了其下游的信號通路。在本研究中,Col家族在ECM-receptor interactions,PI3K-Akt signaling pathway,F(xiàn)ocal adhesion信號通路中顯著富集。有文獻報道,F(xiàn)ocal adhesion參與了血管生成期間調(diào)節(jié)細胞的遷移和增殖,PI3K/Akt信號在血管發(fā)生,調(diào)節(jié)血管內(nèi)皮細胞延長和內(nèi)皮毛細管穩(wěn)定性方面起重要作用[18]。也有研究[19]發(fā)現(xiàn)miR-29通過PI3K/Akt信號傳導途徑介導人Tenon成纖維細胞中I型膠原的表達。因此,Col家族基因下調(diào)可能通過ECM-receptor interactions,PI3K-Akt signaling pathway,F(xiàn)ocal adhesion信號通路介導耳蝸血管內(nèi)皮細胞的退化,從而抑制耳蝸的血管生成,造成血管紋的異常,最終影響聽功能。但是,目前的研究結(jié)果需要更深入地實驗研究來證實。
miRNA是一類短的非編碼RNA,其大小約20~25個核苷酸,可調(diào)節(jié)靶基因的表達,是細胞衰老的重要調(diào)節(jié)劑,在神經(jīng)退行性疾病中會表達失調(diào)[20]。在本研究中,我們對核心基因的上游miRNA進行了預測,通過miRDB網(wǎng)站預測了3000個可能調(diào)控核心基因的miRNA,發(fā)現(xiàn)多個miRNA和多個基因存在著調(diào)節(jié)作用,通過cytoscap軟件篩選得到了2個重要的miRNA即miR-29a-3p,miR-29c-3p。已有文獻表明miR-29在多種病理生理過程中發(fā)揮重要作用,如心血管[21]、視網(wǎng)膜功能[21]、以及阿爾茨海默病[22]。有研究發(fā)現(xiàn),在ARHL模型中,miR-29家族和miR-34家族的表達上調(diào)[23],眾所周知,它們是促凋亡途徑的調(diào)節(jié)劑。越來越多研究表明,miR-29通過負向調(diào)控編碼細胞外基質(zhì)蛋白的mRNA,在基質(zhì)沉積,上皮-間質(zhì)轉(zhuǎn)化和纖維化進程中起著重要作用。細胞外基質(zhì)是調(diào)節(jié)血管生成的關鍵成分[24],主要參與血管內(nèi)皮細胞的生長,分化和遷移。綜上所述,miR-29家族的變化與ARHL的相關性非常密切。
總而言之,我們的研究分析了GEO數(shù)據(jù)庫中與ARHL有關的3個mRNA基因芯片,發(fā)現(xiàn)了與ARHL相關的的核心基因,并通過分析核心基因作用的信號通路和調(diào)控核心基因的miRNA進行了驗證,進一步說明了核心基因與ARHL的相關性,這些基因可能作為ARHL的診斷性生物標志物,應引起更多的關注?;谏镄畔W分析的結(jié)果,尚需要進行進一步的實驗驗證,后續(xù)的研究需要利用細胞實驗和動物實驗進行深入的驗證,進而為尋找靶向ARHL新的診斷標志物提供重要的科學依據(jù)。