洪 佳,李 汛
(武漢大學(xué)人民醫(yī)院:1.婦產(chǎn)科;2.感染科,湖北武漢 430060)
結(jié)核病是由結(jié)核分枝桿菌復(fù)合群(MTBC)感染所導(dǎo)致的一種嚴(yán)重危害人類(lèi)健康的疾病。據(jù)世界衛(wèi)生組織報(bào)道,2017年全球新發(fā)結(jié)核病患者約1 000萬(wàn),結(jié)核病死亡人數(shù)約為157萬(wàn)[1]。結(jié)核分枝桿菌幾乎可以引起身體任何部位的感染,而且,結(jié)核分枝桿菌感染后臨床疾病譜表現(xiàn)多樣,可從無(wú)癥狀發(fā)展至危及生命的急性傳染病[2-3]。根據(jù)臨床表現(xiàn)的不同,結(jié)核感染可分為潛伏結(jié)核感染(LTBI)和活動(dòng)性結(jié)核,前者沒(méi)有任何癥狀,也沒(méi)有傳染性;而后者可有典型的結(jié)核癥狀,包括發(fā)熱、乏力、納差及體質(zhì)量減輕等[4]。盡管已有許多技術(shù)應(yīng)用于診斷結(jié)核病,包括T細(xì)胞斑點(diǎn)檢測(cè)(T-SPOT.TB)、結(jié)核分枝桿菌及利福平耐藥快速檢測(cè)技術(shù)(Xpert?MTB/RIF)等。但是,目前對(duì)于一些肺外結(jié)核的診斷仍十分困難,尤其是在無(wú)明確感染病灶的情況下。因此,尋找新的生物標(biāo)志物來(lái)輔助診斷活動(dòng)性結(jié)核,特別是肺外結(jié)核顯得尤為重要?;蛐酒夹g(shù)能夠快速地檢測(cè)上萬(wàn)個(gè)基因表達(dá)水平,已廣泛應(yīng)用于各類(lèi)疾病基因組水平差異表達(dá)的篩選[5]。GEO數(shù)據(jù)庫(kù)是一個(gè)公共功能基因組數(shù)據(jù)存儲(chǔ)庫(kù),接受世界各國(guó)研究機(jī)構(gòu)提交的基于數(shù)組和序列的高通量基因表達(dá)數(shù)據(jù)[6-7]。本研究通過(guò)分析GEO數(shù)據(jù)庫(kù)中結(jié)核分枝桿菌感染患者血液基因芯片表達(dá)譜數(shù)據(jù),旨在尋找新的生物標(biāo)志物來(lái)提高對(duì)活動(dòng)性結(jié)核的診斷效率,以期為臨床診斷活動(dòng)性結(jié)核提供新的指標(biāo)。
1.1數(shù)據(jù)集獲取 登陸美國(guó)國(guó)立生物技術(shù)信息中心(NCBI)GEO數(shù)據(jù)庫(kù)下載基因表達(dá)芯片GSE19491、GSE25534和GSE31348。GSE19491芯片中含有498份人類(lèi)血液標(biāo)本,本研究選取其中健康人群(n=36)、LTBI患者(n=69)及活動(dòng)性結(jié)核患者(n=54)全血基因芯片數(shù)據(jù)為研究對(duì)象。GSE25534芯片中含有51份人類(lèi)血液標(biāo)本,本研究選取其中健康人群(n=6)、LTBI患者(n=22)及活動(dòng)性結(jié)核患者(n=23)全血基因芯片數(shù)據(jù)為研究對(duì)象。GSE31348芯片中含有135份人類(lèi)血液標(biāo)本,來(lái)自27例肺結(jié)核患者,包括采取2HRZE/4HR方案抗結(jié)核治療前,以及治療后1、2、4、26周5個(gè)時(shí)間點(diǎn)的全血基因芯片數(shù)據(jù)。
1.2分析方法 采用GEO數(shù)據(jù)庫(kù)在線數(shù)據(jù)分析工具GEO2R[8]對(duì)GSE19491和GSE25534兩組芯片數(shù)據(jù)進(jìn)行分析,獲取差異表達(dá)基因(DEGs),并應(yīng)用FunRich3.0軟件(http://www.FunRich.org/)獲取目的基因及核心基因。差異基因的篩選條件為差異倍數(shù)log fold change>1.5,Padjust<0.05。分別對(duì)兩組芯片中健康人群與活動(dòng)性結(jié)核患者、健康人群與LTBI患者、LTBI患者與活動(dòng)性結(jié)核患者這3組進(jìn)行單獨(dú)分析,獲取3組DEGs,包括DEGs NOR與ACTB、DEGs NOR與LTBI、DEGs LTBI與ACTB。對(duì)比DEGs NOR與ACTB、DEGs LTBI與ACTB,提取兩者中的共表達(dá)基因,將提取的基因和DEGs NOR與LTBI進(jìn)行對(duì)比,剔除其中的重合表達(dá)基因,獲得目的基因。兩組芯片的目的基因中交集的部分基因?yàn)楸狙芯康暮诵幕?。利用在線基因注釋工具M(jìn)etascape (http://www.metascape.org)對(duì)核心基因進(jìn)行GO富集分析和京都基因與基因組百科全書(shū)(KEGG)信號(hào)通路富集分析,并運(yùn)用在線分析工具STRING 11.0 (https://string-db.org)構(gòu)建核心基因編碼蛋白的相互作用網(wǎng)絡(luò)。提取GSE31348芯片中核心基因表達(dá)的數(shù)據(jù),觀察核心基因表達(dá)水平在抗結(jié)核治療前后的變化。
2.1核心基因的篩選 對(duì)GSE19491基因芯片進(jìn)行分析發(fā)現(xiàn),DEGs NOR與ACTB中共有差異基因129個(gè),DEGs NOR與LTBI中共有差異基因219個(gè),DEGs LTBI與ACTB中共有差異基因274個(gè),其中在DEGs NOR與ACTB、DEGs LTBI與ACTB中重合表達(dá)的差異基因有32個(gè),剔除在DEGs NOR與LTBI中重合表達(dá)的1個(gè)基因,剩余31個(gè)目的基因,見(jiàn)圖1A。對(duì)GSE25534基因芯片進(jìn)行分析發(fā)現(xiàn),DEGs NOR與ACTB中共有差異基因73個(gè),DEGs NOR與LTBI中共有差異基因43個(gè),DEGs LTBI與ACTB中共有差異基因97個(gè),其中在DEGs NOR與ACTB和DEGs LTBI與ACTB中重合表達(dá)的差異基因有37個(gè),剔除在DEGs NOR與LTBI中重合表達(dá)的1個(gè)基因,剩余36個(gè)目的基因,見(jiàn)圖1B。取兩組目的基因交集,獲得核心基因13個(gè),分別為AIM2、ANKRD22、BATF2、C1QB、CARD17、CD274、EPSTI1、ETV7、FCGR1B、GBP1、GBP5、P2RY14和RSAD2,見(jiàn)圖1C。
注:A為GSE19491基因芯片集中目的基因的篩選;B為GSE25534基因芯片集中目的基因的篩選;C為核心基因的篩選;NOR與ACTB為健康人群與活動(dòng)性結(jié)核DEGs;LTBI與ACTB為L(zhǎng)TBI與活動(dòng)性結(jié)核DEGs;NOR與LTBI為健康人群與LTBI DEGs。
2.2GO及KEGG富集分析 運(yùn)用在線分析工具M(jìn)etascape對(duì)核心基因進(jìn)行GO及KEGG富集分析,結(jié)果發(fā)現(xiàn)核心基因的主要功能主要集中在GO:0050663 cytokine secretion、0071346 cellular response to interferon gamma、0098542 defense response to other organism、0002250 adaptive immune response及0009617 response to bacterium。KEGG信號(hào)通路分析的唯一結(jié)果為hsa04621 NOD樣受體相關(guān)信號(hào)通路。見(jiàn)圖2。
圖2 核心基因GO及KEGG富集分析
2.3核心基因編碼蛋白的相互作用網(wǎng)絡(luò)分析 運(yùn)用在線分析工具STRING 11.0 (https://string-db.org)構(gòu)建核心基因編碼蛋白相互作用網(wǎng)絡(luò)。從蛋白相互作用網(wǎng)絡(luò)可發(fā)現(xiàn),10種基因的編碼蛋白能夠相互作用,其中GBP5是基因連接度最高的hub基因,其次為GBP1和RSAD2,見(jiàn)圖3。
2.4核心基因在GSE31348基因芯片中的表達(dá) 為了驗(yàn)證篩選出的核心基因是否在活動(dòng)性結(jié)核中差異表達(dá),本研究進(jìn)一步提取了活動(dòng)性肺結(jié)核患者的基因表達(dá)芯片GSE31348中核心基因表達(dá)的數(shù)據(jù),除基因CARD17數(shù)據(jù)缺失外,其余核心基因表達(dá)數(shù)據(jù)均能成功獲取。通過(guò)對(duì)上述基因的表達(dá)情況進(jìn)行分析,結(jié)果發(fā)現(xiàn)與治療前(0周)相比,所有核心基因表達(dá)水平在患者接受抗結(jié)核分枝桿菌治療后均有不同程度的下降,尤其是在第26周,下降幅度最明顯(P<0.05),見(jiàn)圖4。
圖3 核心基因編碼蛋白相互作用網(wǎng)絡(luò)
注:所有數(shù)據(jù)經(jīng)過(guò)log2處理,與抗結(jié)核治療前(0周)相比,*P<0.05。
結(jié)核病是一種古老的疾病,雖然在全球范圍內(nèi)結(jié)核病患者數(shù)不斷下降,但是其整體負(fù)擔(dān)仍較重。得益于新的診斷技術(shù)的應(yīng)用,絕大多數(shù)結(jié)核病都能夠被及時(shí)準(zhǔn)確地診斷。T-SPOT.TB是一種以T細(xì)胞為基礎(chǔ)的γ-干擾素釋放試驗(yàn)(IGRA),其原理是通過(guò)檢測(cè)被結(jié)核分枝桿菌特異性早期分泌靶抗原6和培養(yǎng)濾液蛋白10分別刺激后釋放γ-干擾素的效應(yīng)T細(xì)胞,以輔助診斷結(jié)核分枝桿菌感染[9]。IGRA是基于結(jié)核特異性抗原誘導(dǎo)的細(xì)胞免疫反應(yīng),在感染結(jié)核分枝桿菌后均可能獲得陽(yáng)性結(jié)果,包括活動(dòng)性結(jié)核、LTBI和既往結(jié)核病史患者[10]。因此,IGRA陽(yáng)性結(jié)果反映體內(nèi)曾發(fā)生過(guò)結(jié)核分枝桿菌感染的意義更大,而不能有效區(qū)分活動(dòng)性結(jié)核、LTBI或既往結(jié)核分枝桿菌感染。Xpert?MTB/RIF是一種用于檢測(cè)結(jié)核分枝桿菌復(fù)合物的自動(dòng)化診斷測(cè)試,這是一種基于DNA的檢測(cè)結(jié)核分枝桿菌rpoB基因的方法,還能檢測(cè)rpoB中可能導(dǎo)致利福平耐藥的突變[11]。Xpert?MTB/RIF是世界衛(wèi)生組織推薦的用于結(jié)核病“快速”診斷的方法,它比涂片鏡檢的靈敏度、特異度更高,但是需要特定的組織或體液標(biāo)本。對(duì)于肺外結(jié)核,尤其是不能明確感染部位者,由于難以獲得病變部位的組織或體液標(biāo)本得到細(xì)菌學(xué)證據(jù),因此,診斷仍十分困難[12]。
為了提高活動(dòng)性結(jié)核,尤其是肺外活動(dòng)性結(jié)核的診斷效率,本研究以生物信息學(xué)方法,分析了健康人群、LTBI和活動(dòng)性結(jié)核患者的基因表達(dá)情況,篩選活動(dòng)性結(jié)核患者特異表達(dá)的差異基因。本研究首先將健康人群與活動(dòng)性結(jié)核患者進(jìn)行對(duì)比,提取了二者之間的差異基因。為了區(qū)別LTBI與活動(dòng)性結(jié)核,本研究進(jìn)一步提取了LTBI和活動(dòng)性結(jié)核患者之間的差異基因。將兩組差異基因?qū)Ρ?,并且取其中的交集部分,使獲得的目的基因能同時(shí)將活動(dòng)性結(jié)核與LTBI和健康人群加以區(qū)分。為了使目的基因能夠特異性反映活動(dòng)性結(jié)核,避免LTBI患者的干擾,本研究分析了健康人群與LTBI患者的基因表達(dá)情況,獲取了二者之間的差異基因,并將后者與目的基因進(jìn)行交集,刪除目的基因中重合表達(dá)的部分。為了進(jìn)一步提高目的基因的特異性,本研究分別提取了GSE19491和GSE25534的目的基因,并將兩個(gè)目的基因集進(jìn)行交集,最終獲得核心基因13個(gè)。
將13個(gè)核心基因進(jìn)行功能富集,結(jié)果發(fā)現(xiàn)這些核心基因的功能主要與細(xì)胞因子的分泌、細(xì)胞對(duì)γ-干擾素的反應(yīng)、適應(yīng)性免疫和細(xì)菌感染反應(yīng)等相關(guān),而信號(hào)通路為固有免疫中的NOD樣受體相關(guān)信號(hào)通路。從以上結(jié)果可以發(fā)現(xiàn),機(jī)體對(duì)抗結(jié)核分枝桿菌感染時(shí)以NOD樣受體相關(guān)信號(hào)通路為主,涉及機(jī)體固有免疫、適應(yīng)性免疫、細(xì)胞γ-干擾素的反應(yīng)、細(xì)胞因子的分泌等。
對(duì)以上核心基因編碼的蛋白構(gòu)建相互作用網(wǎng)絡(luò),結(jié)果發(fā)現(xiàn)其中的10種基因的編碼蛋白能夠相互作用,其中GBP5、GBP1和RSAD2是基因連接度較高的幾個(gè)hub基因,由此可推測(cè)GBP5、GBP1和RSAD2可能在機(jī)體對(duì)抗結(jié)核分枝桿菌過(guò)程中發(fā)揮核心作用。
為了進(jìn)一步觀察本研究所篩選出的核心基因在活動(dòng)性結(jié)核患者體內(nèi)的表達(dá)情況,進(jìn)一步提取了以上核心基因在GSE31348芯片中的表達(dá)數(shù)據(jù),結(jié)果顯示,隨著抗結(jié)核藥物治療時(shí)間的延長(zhǎng),核心基因的表達(dá)均呈現(xiàn)下降趨勢(shì),在治療結(jié)束時(shí)的第26周下降幅度最為明顯。該結(jié)果表明,以上核心基因能夠反映活動(dòng)性結(jié)核的病情變化情況,能夠作為指示活動(dòng)性結(jié)核的指標(biāo)。
鳥(niǎo)苷酸結(jié)合蛋白 (GBPs)是一類(lèi)干擾素誘導(dǎo)的GTP酶,可促進(jìn)細(xì)胞內(nèi)脂多糖(LPS)與caspase-11相互作用,激活非典型炎性小體[13]。KIM等[14]證實(shí),鼠類(lèi)GBPs是控制單核增生李斯特菌和牛分枝桿菌感染的關(guān)鍵,mGBP1和mGBP7可通過(guò)募集NADPH氧化酶進(jìn)入吞噬體,促進(jìn)活性氧的形成,并通過(guò)與p62/SQSTM1和Atg4b的相互作用誘導(dǎo)自噬。有研究表明,GBP5及BATF2聯(lián)合另一指標(biāo)SCARF可作為短期內(nèi)發(fā)生活動(dòng)性結(jié)核的預(yù)測(cè)指標(biāo)[15]。這也證實(shí)本研究所篩選出的核心基因能夠反映活動(dòng)性結(jié)核。曲婧格等[16]證實(shí),系統(tǒng)性紅斑狼瘡患者RSAD2 mRNA的表達(dá)水平明顯升高,并與疾病程度及免疫功能密切相關(guān)。機(jī)體對(duì)抗結(jié)核分枝桿菌感染也是一個(gè)免疫過(guò)程,從本研究所挖掘的信息來(lái)看,RSAD2的水平應(yīng)該與結(jié)核分枝桿菌的活動(dòng)程度相關(guān)。
本研究基于生物信息學(xué),從篩選出的核心基因在活動(dòng)性肺結(jié)核患者血液中的表達(dá)水平來(lái)看,確實(shí)能夠作為反映結(jié)核分枝桿菌活動(dòng)的指標(biāo),將這些標(biāo)志物結(jié)合臨床有望提高活動(dòng)性結(jié)核的診斷效率。但是,由于機(jī)體對(duì)抗病原微生物時(shí),都有著類(lèi)似的免疫過(guò)程,以上核心基因能否作為區(qū)別結(jié)核分枝桿菌感染與其他細(xì)菌感染的指標(biāo),尚待進(jìn)一步驗(yàn)證。