鄭嫻嫻,葛魏巍
克羅恩病病(Crohn′s disease,CD)病因未明,可能與環(huán)境因素亦或腸道菌群參與下的免疫紊亂等因素有關(guān)[1]。病情反復(fù),可累及整個(gè)消化道,其中30%患者病變僅局限于小腸稱為小腸克羅恩病病(small bowel Crohn′s disease,SBCD)[2],目前尚無(wú)根治的方法。近年來(lái),由于多種檢查方法的應(yīng)用[3-6],小腸克羅恩病的早期診斷率有所提升,然而對(duì)于非穿孔或非狹窄的小腸克羅恩病早期發(fā)現(xiàn)率仍較低[7]。因此,如果能從分子水平揭示疾病發(fā)生的機(jī)制,尋找分子治療靶點(diǎn),并為疾病的診斷提供分子標(biāo)志物,將會(huì)大大提高患者生活質(zhì)量[8]。本研究挖掘GEO數(shù)據(jù)庫(kù)中有關(guān)小腸克羅恩病的相關(guān)數(shù)據(jù),利用生物信息學(xué)方法構(gòu)建miRNA-mRNA調(diào)控,并篩選關(guān)鍵致病基因,從分子水平上探尋小腸克羅恩病的發(fā)病機(jī)制并為分子治療提供理論依據(jù)。
GEO數(shù)據(jù)庫(kù)(https://www.ncb i.nlm.nih.gov/geo/)收錄了世界各國(guó)研究機(jī)構(gòu)提交的高通量基因表達(dá)數(shù)據(jù)。本研究從GEO數(shù)據(jù)庫(kù)中檢索克羅恩病的表達(dá)譜芯片,選取小腸黏膜及正常小腸黏膜的表達(dá)數(shù)據(jù),最終選定GSE102127用于差異表達(dá)miRNA(DEMs)的篩選、GSE20881、GSE75214、GSE102133經(jīng)數(shù)據(jù)融合及批次校正后用于篩選差異表達(dá)基因(DEGs)及診斷效能分析,數(shù)據(jù)集對(duì)應(yīng)的檢測(cè)平臺(tái)及樣本數(shù)見(jiàn)表1。GEO數(shù)據(jù)完全公開(kāi),因此本研究無(wú)需倫理委員會(huì)審查。
表1 GEO數(shù)據(jù)庫(kù)樣本
1.3.1 轉(zhuǎn)錄組數(shù)據(jù)差異分析及可視化 GSE102127數(shù)據(jù)集利用GEO數(shù)據(jù)庫(kù)的在線分析軟件,設(shè)定過(guò)濾條件adj.P.Val<0.05且|logFC|>1,篩選DEMs。GSE20881、GSE75214、GSE102133三個(gè)數(shù)據(jù)集首先進(jìn)行融合,經(jīng)批次校正后利用perl軟件(https://www.perl.org/)將探針I(yè)D轉(zhuǎn)換為對(duì)應(yīng)的基因名稱;采用R語(yǔ)言(https://www.r-project.org/)的“l(fā)imma”包進(jìn)行DEGs的篩選,設(shè)定過(guò)濾條件為adj.P.Val<0.05且|logFC|>2,并后續(xù)進(jìn)行GO (Gene Ontology) 富集和 KEGG (Kyoto Encyclopedia of Genes and Genomes,京都基因與基因組百科全書(shū)) 富集分析。
圖1 研究路線圖
1.3.2 miRNA-mRNA調(diào)控網(wǎng)絡(luò)構(gòu)建 利用FunRich(version 3.1.3 http://www.funrich.org/)軟件對(duì)差異表達(dá)的miRNA進(jìn)行靶基因預(yù)測(cè),篩選出符合以下條件的miRNA及mRNA進(jìn)行調(diào)控網(wǎng)絡(luò)的構(gòu)建:①miRNA及mRNA在各自數(shù)據(jù)集中均差異表達(dá);②miRNA及mRNA呈負(fù)相關(guān)。調(diào)控網(wǎng)絡(luò)利用Cytoscape(https://cytoscape.org/)軟件進(jìn)行可視化。
1.3.3 功能注釋及可視化 融合后的數(shù)據(jù)集中DEGs利用R語(yǔ)言進(jìn)行GO富集和 KEGG通路功能注釋。GO 富集分為分子生物學(xué)功能(molecular function, MF)、生物學(xué)過(guò)程(biological process, BP)和細(xì)胞學(xué)組分(cellular components, CC)三大類。KEGG 是一個(gè)整合了基因組、化學(xué)和系統(tǒng)功能信息的綜合數(shù)據(jù)庫(kù),被廣泛用于基因通路的富集注釋。設(shè)置篩選參數(shù)為Pvalue cutoff =0.05且q value cutoff = 0.05為具有統(tǒng)計(jì)學(xué)意義。
1.3.4 關(guān)鍵基因篩選及診斷效能分析 將融合后的數(shù)據(jù)集中DEGs通過(guò)String(https://string-db.org/)數(shù)據(jù)庫(kù)進(jìn)行分子蛋白互作網(wǎng)絡(luò)分析,并將網(wǎng)絡(luò)結(jié)果導(dǎo)入Cytoscape軟件(版本號(hào)3.9.0),基于“cytohubba”模塊中“Degree”、“MCC”、“Betweenness”算法篩選排名前10的關(guān)鍵基因,取交集后得到關(guān)鍵基因,并通過(guò)ROC曲線分析關(guān)鍵基因的診斷效能。
利用受試者工作特征曲線評(píng)價(jià)關(guān)鍵基因?qū)π∧c克羅恩病的診斷效能,P<0.05有統(tǒng)計(jì)學(xué)意義。
GSE3102127數(shù)據(jù)集經(jīng)在線分析后得到DEMs15個(gè),9個(gè)表達(dá)上調(diào),6個(gè)表達(dá)下調(diào)。經(jīng)FunRich軟件預(yù)測(cè)后得到2699個(gè)可能調(diào)控的靶基因。GSE20881、GSE75214、GSE10213三個(gè)數(shù)據(jù)集經(jīng)融合及批次校正后,利用R語(yǔ)言“l(fā)imma”包篩選出DEGs 273個(gè),其中上調(diào)基因66個(gè),下調(diào)基因207個(gè),具體見(jiàn)圖2。
基于miRNA-mRNA 負(fù)向調(diào)控原理,結(jié)合FunRich軟件預(yù)測(cè)結(jié)果,本研究共篩選出38個(gè)調(diào)控軸用于調(diào)控網(wǎng)絡(luò)構(gòu)建,其中miRNA 11個(gè),mRNA34 個(gè),調(diào)控網(wǎng)絡(luò)構(gòu)建結(jié)果見(jiàn)圖3。
將273個(gè)DGEs進(jìn)行功能注釋分析,GO富集在白細(xì)胞遷移、中性粒細(xì)胞遷移等生物過(guò)程;KEGG富集注釋表明差異基因主要參與IL-17、腫瘤壞死因子等信號(hào)通路,見(jiàn)圖4,圖5。
圖2 差異表達(dá)mRNA火山圖,紅色表示上調(diào),綠色表示下調(diào)
圖3 miRNA-mRNA 調(diào)控網(wǎng)絡(luò),三角代表miRNA,圓形代表mRNA,紅色表示上調(diào),黃色表示下調(diào)
圖4 GO富集結(jié)果
將273個(gè)差異表達(dá)的mRNA 導(dǎo)入String網(wǎng)站,進(jìn)行蛋白互作網(wǎng)絡(luò)分析,最低互動(dòng)分?jǐn)?shù)>0.700時(shí)共得到157個(gè)節(jié)點(diǎn),538條邊,具體見(jiàn)圖6。將String網(wǎng)站數(shù)據(jù)導(dǎo)入Cytoscape軟件,cytoHubba模塊下基于“Degree”、“MCC”、“Betweenness”算法篩選排名前10的關(guān)鍵基因,取交集后得到4個(gè)關(guān)鍵基因(圖7),分別為IL6、IL1B、MMP9 及ICAM1。受試者工作特征曲線分析以上4個(gè)關(guān)鍵基因中僅MMP9可用于診斷小腸克羅恩病,其P值為0.025,AUC為0.361,敏感性100%,特異性31%,具體見(jiàn)圖8。
圖5 KEGG富集結(jié)果
圖6 DEGs蛋白互作網(wǎng)絡(luò)圖
圖7 關(guān)鍵基因篩選結(jié)果
SBCD缺乏特異性臨床表現(xiàn),同時(shí)小腸鏡檢查普及程度不一,因此患者從癥狀出現(xiàn)到發(fā)現(xiàn)病灶歷時(shí)較長(zhǎng),診斷較為困難[9-10]。目前,有關(guān)SBCD的發(fā)病機(jī)制尚不明確,可能與免疫功能紊亂、遺傳、環(huán)境等因素等有關(guān),治療上仍缺乏有效藥物[11]。因此,從分子水平探究小腸克羅恩病的發(fā)病機(jī)制及尋找治療靶點(diǎn)是目前研究的一個(gè)方向[12-14]。本研究借助生物信息學(xué)技術(shù),分析了GEO數(shù)據(jù)庫(kù)中有關(guān)CD小腸黏膜轉(zhuǎn)錄組表達(dá)數(shù)據(jù)。研究結(jié)果表明miRNA及mRNA在正常小腸黏膜及病變黏膜組織中均差異表達(dá)。為增加致病基因篩選的可信性,我們將3個(gè)mRNA數(shù)據(jù)集進(jìn)行融合,擴(kuò)大樣本量,經(jīng)R語(yǔ)言處理后篩選出DEGs 273個(gè),其中上調(diào)基因66個(gè),下調(diào)基因207個(gè),聯(lián)合miRNA篩選結(jié)果我們成功構(gòu)建出38個(gè)調(diào)控軸,為SBCD的分子調(diào)控研究提供了理論依據(jù)。
圖8 IL6、IL1B、MMP9 、ICAM1診斷小腸克羅恩病ROC曲線
針對(duì)273個(gè)DEGs,我們進(jìn)行了GO富集分析,注釋結(jié)果表明DEGs參與了白細(xì)胞遷移、中性粒細(xì)胞遷移、細(xì)胞趨化性等生物過(guò)程。白細(xì)胞遷移是啟動(dòng)炎癥免疫反應(yīng)的重要的步驟之一,過(guò)程相當(dāng)復(fù)雜。在體內(nèi),通過(guò)抑制白細(xì)胞遷移有望治療炎癥性腸病/克羅恩病、多發(fā)性硬化癥和類風(fēng)濕性關(guān)節(jié)炎等疾病。既往研究同樣表明克羅恩病患者中性粒細(xì)胞遷移受損與趨化因子的產(chǎn)生減少有關(guān),通過(guò)粒細(xì)胞集落刺激因子治療后病情有所緩解[15]。而KEGG注釋則表明DEGs參與IL-17、腫瘤壞死因子(TNF)、類風(fēng)濕性關(guān)節(jié)炎等信號(hào)通路。IL17細(xì)胞因子家族由6個(gè)配體組成,IL17A到IL17F,是Th17細(xì)胞產(chǎn)生的關(guān)鍵細(xì)胞因子。IL17信號(hào)通路能夠誘導(dǎo)TNF、IL22、IL1β和脂多糖等促炎分子的產(chǎn)生,從而導(dǎo)致黏膜免疫系統(tǒng)的過(guò)度激活和異常的細(xì)胞因子反應(yīng)[16]。TNF是由157個(gè)氨基酸亞基組成的同源三聚體,主要由活化的巨噬細(xì)胞以可溶性或跨膜形式產(chǎn)生,通過(guò)與兩個(gè)膜受體TNFR1和TNFR2的相互激發(fā)來(lái)發(fā)揮作用。在炎癥過(guò)程中,TNF是炎癥級(jí)聯(lián)反應(yīng)后期的關(guān)鍵介質(zhì)。除了促炎功能,TNF在維持腸道菌群與黏膜免疫系統(tǒng)之間的穩(wěn)態(tài)平衡中同樣發(fā)揮作用,積極參與腸道屏障功能[17]。在炎癥過(guò)程的早期階段,TNF對(duì)腸道黏膜有保護(hù)作用,而在疾病的晚期階段,TNF則發(fā)揮促炎作用[18-19]。以上情況表明DEGs在腸道菌群平衡、腸黏膜屏障功能及腸道免疫等方面參與了小腸克羅恩病的發(fā)生發(fā)展過(guò)程。
我們通過(guò)String網(wǎng)站對(duì)差異表達(dá)的mRNA 進(jìn)行蛋白互作網(wǎng)絡(luò)分析,最低互動(dòng)分?jǐn)?shù)>0.700時(shí)共得到157個(gè)節(jié)點(diǎn),538條邊,經(jīng)Cytoscape軟件,篩選出IL6、IL1B、MMP9 及ICAM1為關(guān)鍵基因。IL6、IL1B作為炎性細(xì)胞因子和炎性反應(yīng)介質(zhì),可破壞腸黏膜屏障,導(dǎo)致腸黏膜腸黏膜滲出、增生,組織損傷[20-21]。在動(dòng)物模型中,抗 IL-6R 單克隆抗體通過(guò)抑制血管內(nèi)皮粘附分子表達(dá)而用于治療腸道炎癥性疾病[22]?;|(zhì)金屬蛋白酶9(matrix metalloproteinase-9,MMP 9)是一種依賴金屬鋅離子的金屬酶,主要來(lái)源于單核細(xì)胞、淋巴細(xì)胞、巨噬細(xì)胞和成纖維細(xì)胞,具有降解細(xì)胞外基質(zhì)和觸發(fā)炎癥等作用。既往多項(xiàng)研究發(fā)現(xiàn)MMP9水平升高與CD患者的疾病活動(dòng)密切相關(guān),可用于評(píng)估疾病活動(dòng)程度[23-24]。細(xì)胞間黏附分子-1(intercellular cell adhesion molecule-1,ICAM-1),屬于黏附分子中免疫球蛋白超家族中的一員,是介導(dǎo)黏附反應(yīng)的一個(gè)重要黏附分子,在促進(jìn)炎癥部位黏連、調(diào)節(jié)機(jī)體免疫反應(yīng)中起重要作用。通過(guò)與其受體的特異性結(jié)合,增強(qiáng)炎癥細(xì)胞與內(nèi)皮細(xì)胞間的黏附作用,促使炎性細(xì)胞向炎癥部位遷移,參與CD的腸道炎癥過(guò)程。國(guó)內(nèi)學(xué)者研究發(fā)現(xiàn)CD 患者血漿中ICAM-1水平與疾病嚴(yán)重程度密切相關(guān),與年齡、病變部位等臨床特征無(wú)明顯關(guān)聯(lián)[25]。
本研究篩選的4個(gè)關(guān)鍵基因均參與了SBCD的發(fā)生、發(fā)展的過(guò)程,證實(shí)了利用生物信息學(xué)技術(shù)尋找疾病相關(guān)致病基因的可行性。由于SBCD早期診斷相對(duì)困難,為進(jìn)一步探討關(guān)鍵基因能否早期診斷SBCD,我們利用ROC曲線分析其診斷效能,ROC結(jié)果顯示4個(gè)關(guān)鍵基因中僅MMP9可用于SBCD的診斷,其P值為0.025。然而MMP9的診斷效能偏低,其AUC為0.361,且特異性欠佳,僅為31%。從ROC分析結(jié)果可以看出目前SBCD的診斷很大程度上仍取決于臨床醫(yī)師的經(jīng)驗(yàn)及膠囊內(nèi)鏡、氣囊輔助小腸鏡等輔助檢查,從分子水平上尋找SBCD早期診斷生物標(biāo)志物仍是未來(lái)我們研究的方向。
綜上所述,我們利用多芯片聯(lián)合分析的方法篩選了SBCD患者DEGs,這些差異基因在腸道菌群失衡、腸黏膜屏障功能、炎性細(xì)胞遷移及腸道免疫等方面參與了小腸克羅恩病病的發(fā)生發(fā)展過(guò)程。雖然目前差異基因尚無(wú)法作為SBCD診斷的分子標(biāo)志物,然而我們構(gòu)建的miRNA-mRNA調(diào)控網(wǎng)絡(luò)為SBCD的分子治療提供了理論依據(jù)及未來(lái)可能的分子靶點(diǎn),以期從分子水平上達(dá)到治愈SBCD的目的。