馬江磊,陳華秋,王光明,2*
(1.大理大學(xué)臨床醫(yī)學(xué)院,云南 大理 671000;2.大理大學(xué)第一附屬醫(yī)院基因檢測(cè)中心,云南 大理 671000)
系統(tǒng)性紅斑狼瘡(systemic lupus erythematosus,SLE)是一種以免疫調(diào)節(jié)異常、自身免疫復(fù)合物沉積為特征的慢性自身免疫性疾病,常累及多臟器損害,甚至危及患者的生命。女性患病率高于男性,比例約為10∶1〔1〕。在過(guò)去的半個(gè)多世紀(jì),隨著人們對(duì)SLE認(rèn)識(shí)逐漸增多,SLE患者的生存率和治療效果有所提高〔2〕,但SLE臨床癥狀表現(xiàn)多樣,仍有部分患者因診斷延誤或誤診,未得到及時(shí)治療,從而產(chǎn)生嚴(yán)重后果。因此,建立準(zhǔn)確、科學(xué)的分類和有針對(duì)性的治療,對(duì)改善SLE患者的治療效果有十分重要的意義。
SLE發(fā)病機(jī)制復(fù)雜,目前已知除了與紫外線照射、氣候和地理分布等外界因素有關(guān)外,還發(fā)現(xiàn)多種與SLE有關(guān)的易感基因〔3〕。Wang等〔4〕通過(guò)對(duì)17 389名SLE患者和29 273名健康人群數(shù)據(jù)進(jìn)行薈萃分析后發(fā)現(xiàn),在歐洲及亞洲的總體人群中,信號(hào)轉(zhuǎn)導(dǎo)和轉(zhuǎn)錄激活因子(signal transducer and activator of transcription,STAT)4基因rs7574865、rs10168266多態(tài)性與SLE發(fā)病風(fēng)險(xiǎn)密切相關(guān)。Sandling等〔5〕采用以信號(hào)通路為中心的方法,對(duì)瑞典958名SLE患者和1 026名健康個(gè)體的1 832個(gè)候選基因進(jìn)行了免疫通路基因測(cè)序,確定了T淋巴細(xì)胞分化和先天免疫2個(gè)涉及SLE易感性的主要獨(dú)立途徑,通路風(fēng)險(xiǎn)評(píng)分有可能將SLE患者臨床表現(xiàn)以外的分子進(jìn)行分類,有助于臨床隨訪和治療的選擇。
目前,針對(duì)SLE的基因治療還不完善,為促進(jìn)SLE治療新策略的開(kāi)發(fā),本研究對(duì)1 254例SLE患者的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行匯總分析,建立共識(shí)聚類表達(dá)分析,分成相應(yīng)的亞群,并比較各亞群之間在臨床特點(diǎn)、分子構(gòu)成及細(xì)胞學(xué)功能方面的差異,為SLE的基因分型提供相關(guān)依據(jù)。
1.1 數(shù)據(jù)集的富集分析和主成分分析(principal componentanalysis,PCA)在NCBI的GeneExpression Omnibus(GEO)數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo/)中搜索“systemic lupus erythematosus”,下載GSE121239、GSE65391和GSE154851的微陣列數(shù)據(jù)集,各芯片數(shù)據(jù)集中只包含SLE患者及健康對(duì)照者的組織。GSE121239由GPL13158平臺(tái)文件提供,GSE65391和GSE154851分別來(lái)自GPL10558、GPL16699平臺(tái)文件。使用R 4.1.3軟件中的“l(fā)imma”和“sva”數(shù)據(jù)包消除批次效應(yīng),進(jìn)行歸一化〔6-7〕。將數(shù)據(jù)合并后得到1 254例SLE患者(以下稱“轉(zhuǎn)錄組”)和124例健康對(duì)照者(以下稱“對(duì)照組”)的基因表達(dá)數(shù)據(jù)集。其中臨床數(shù)據(jù)包括年齡、性別、SLE活動(dòng)指數(shù)(systemic lupus erythematosus disease activity index,SLEDAI)等。
1.2 亞群的構(gòu)建和亞群間臨床特點(diǎn)的比較1 254例SLE患者的基因表達(dá)矩陣?yán)肦軟件中的“ggplot2”“rstatix”“reshape2”和“Consensus Cluster Plus”等數(shù)據(jù)包對(duì)矯正后的樣本數(shù)據(jù)集進(jìn)行分析,得到具有相似差異表達(dá)基因(differentially expressed genes,DEGs)的SLE患者分型。每個(gè)亞群的聚類得分越高,說(shuō)明各亞群基因在基因表達(dá)上的相似性越高,然后把每個(gè)亞群視為一個(gè)聚類進(jìn)行分析。
使用R軟件中“ggplot2”和“ggpurb”數(shù)據(jù)包對(duì)各亞群的臨床特點(diǎn)進(jìn)行分析。以患者性別作為離散變量,分析男性和女性在各亞群中所占的比例;以年齡和SLEDAI作為連續(xù)變量,進(jìn)行差異富集分析得到相關(guān)箱式圖。
1.3 篩選亞群特異性基因及構(gòu)建蛋白質(zhì)相互作用(protein-protein interaction,PPI)網(wǎng)絡(luò)將各亞群與對(duì)照組以及各亞群之間進(jìn)行比較后,從中篩選出均值差異>0.2、調(diào)整后P<0.05的基因,得到各亞群對(duì)應(yīng)的DEGs,將所得到的DEGs取交集,進(jìn)一步篩選出只在某個(gè)亞群中表達(dá)上調(diào)的基因,即亞群的特異性基因。取各群前100個(gè)特異性基因上傳到STRING(https://stringdb.org/)網(wǎng)站,設(shè)置置信系數(shù)為0.4,生成特異性基因表達(dá)蛋白的PPI網(wǎng)絡(luò)圖,再將PPI網(wǎng)絡(luò)圖傳輸?shù)紺ytoscape軟件中,以Degree算法計(jì)算得到節(jié)點(diǎn)數(shù)最多的前10個(gè)蛋白并對(duì)其進(jìn)行分析。
1.4 各亞群基因集的富集分析對(duì)基因集富集分析(gene set enrichment analysis,GSEA)。GSEA前對(duì)基因列表文件和基因集文件進(jìn)行對(duì)應(yīng)轉(zhuǎn)換,將每個(gè)組得到的列表和數(shù)據(jù)集文件傳輸?shù)紾SEA軟件(version 4.1.0)中,設(shè)置最大運(yùn)行值為5 000,得到各亞群中特異性基因在對(duì)照組中的表達(dá)分析結(jié)果。
1.5 GO功能富集分析和KEGG信號(hào)通路分析選擇矯正后的基因數(shù)據(jù)集、各亞群中特異性上調(diào)基因文件以及含有連續(xù)變量的臨床特征文件,使用R軟件的“WGCNA”數(shù)據(jù)包進(jìn)行分析。對(duì)樣本臨床特征與DEGs和模塊之間的相關(guān)性分析后通過(guò)動(dòng)態(tài)樹(shù)切割法〔8〕,將基因數(shù)據(jù)集分成顏色不同的基因模塊。應(yīng)用R軟件對(duì)分成的基因顏色模塊進(jìn)行GO功能富集分析和KEGG信號(hào)通路分析。GO功能富集分析主要對(duì)生物學(xué)過(guò)程、細(xì)胞成分和分子功能進(jìn)行富集分析。KEGG信號(hào)通路分析主要對(duì)分子生物學(xué)途徑進(jìn)行分析。對(duì)KEGG信號(hào)通路分析的結(jié)果,篩選出每個(gè)模塊中差異最顯著的信號(hào)通路,分析各亞群與生物學(xué)信息之間更密切的聯(lián)系。
1.6 統(tǒng)計(jì)分析用SPSS 26.0軟件進(jìn)行數(shù)據(jù)分析,數(shù)據(jù)以(±s)表示。組間比較采用單因素方差分析,不同組間的比較使用獨(dú)立樣本t檢驗(yàn),P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 轉(zhuǎn)錄組數(shù)據(jù)的預(yù)處理及分組對(duì)“GSE121239”“GSE65391”和“GSE154851”3個(gè)數(shù)據(jù)集進(jìn)行預(yù)處理及批次矯正后,得到總數(shù)據(jù)集的PCA圖。3個(gè)數(shù)據(jù)集在批處理前,各組間無(wú)明顯相關(guān)性。見(jiàn)圖1A。消除批次效應(yīng)后,總體基因分布均勻集中。見(jiàn)圖1B。根據(jù)每個(gè)樣本中的基因與SLE相關(guān)情況進(jìn)行聚類分析,設(shè)置2~10個(gè)聚類,根據(jù)一致性評(píng)分結(jié)果,可將樣本分為3個(gè)亞群,分別為亞群Ⅰ、亞群Ⅱ及亞群Ⅲ。表達(dá)差異富集模式圖的分析結(jié)果也表明分為3個(gè)亞群時(shí),組間表達(dá)模式顯著不同。見(jiàn)圖2。
2.2 亞群間臨床特點(diǎn)的比較結(jié)果本研究納入“GSE65391”和“GSE154851”數(shù)據(jù)集中(“GSE121239”數(shù)據(jù)集中未標(biāo)注性別信息)患者1 066例,男124例,女942例,男女性別比為1.00∶7.60。把性別作為每個(gè)亞群的離散變量進(jìn)行亞群間分析比較后發(fā)現(xiàn),性別在各亞群間無(wú)顯著差異,說(shuō)明性別不是區(qū)分各亞群的要素。在3個(gè)亞群中,亞群Ⅰ的平均年齡為(15.24±5.10)歲,亞群Ⅱ的平均年齡為(16.09±5.76)歲,亞群Ⅲ的平均年齡為(15.09±6.00)歲,富集比較結(jié)果顯示,亞群Ⅰ和亞群Ⅱ、亞群Ⅱ和亞群Ⅲ之間年齡差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。在3個(gè)亞群中,亞群Ⅰ的SLEDAI為(4.03±3.11),亞群Ⅱ的SLEDAI為(1.88±2.80),亞群Ⅲ的SLEDAI為(2.68±3.22)。SLEDAI在各亞群中差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。見(jiàn)圖3。
2.3 各亞群特異性基因與PPI網(wǎng)絡(luò)圖分析3個(gè)亞群的特異性上調(diào)基因數(shù)量分別為:亞群Ⅰ(2 134個(gè))、亞群Ⅱ(105個(gè))、亞群Ⅲ(2 289個(gè)),進(jìn)一步篩選出各亞群中前10個(gè)表達(dá)差異最顯著的DEGs。見(jiàn)表1。選擇各亞群中上調(diào)前100個(gè)的特異性基因,對(duì)其表達(dá)的蛋白質(zhì)進(jìn)行PPI網(wǎng)絡(luò)分析,使用Degree算法得到節(jié)點(diǎn)>10的蛋白樞紐圖,其中,排名前10的蛋 白 分 別 是STAT3、TLR4、BRIX1、TLR2、PTEN、HSPA8、NHP2、NOP58、CAT、DDX18。見(jiàn)圖4。
表1 各亞群中前10個(gè)上調(diào)的差異表達(dá)基因
2.4 各亞群的GSEA結(jié)果通過(guò)對(duì)每個(gè)亞群中的DEGs與對(duì)照組進(jìn)行比較分析,發(fā)現(xiàn)各組中黑色線及灰色線均靠左聚集,GSEA結(jié)果顯示各亞群的P值和FDR值均小于0.01,說(shuō)明各亞群中的特異差異基因在對(duì)照組也存在明顯的表達(dá)差異。見(jiàn)圖5。
2.5 GO功能富集和KEGG信號(hào)通路分析結(jié)果在測(cè)試1~20閾值功率的結(jié)果中得到最佳功率值為9,在功率值為9的情況之下,基因之間的連通性符合無(wú)標(biāo)度網(wǎng)絡(luò)分布,可分為8個(gè)顏色模塊。各基因顏色模塊的分析結(jié)果見(jiàn)表2~5。
表2 生物學(xué)過(guò)程富集分析結(jié)果
GO功能富集分析結(jié)果顯示,在生物學(xué)過(guò)程中,粉紅色模塊中的基因與血液凝固、止血途徑以及血小板聚集等聯(lián)系密切。在細(xì)胞成分中,黏著斑、細(xì)胞-基質(zhì)連接以及血小板α顆粒等與粉紅色模塊密切相關(guān)。分子功能結(jié)果顯示,粉紅色模塊主要與結(jié)合肌動(dòng)蛋白、結(jié)合整合素、結(jié)合膠原等有關(guān)。從KEGG信號(hào)通路富集結(jié)果中,篩選出每個(gè)顏色模塊中表達(dá)差異最顯著的信號(hào)通路,分別為:自然殺傷細(xì)胞介導(dǎo)的細(xì)胞毒作用、核糖體、線粒體自噬、細(xì)胞凋亡、血小板活化、造血細(xì)胞譜系、破骨細(xì)胞分化、甲型流感,以進(jìn)一步分析與亞群之間的關(guān)系。
將上述信號(hào)通路與對(duì)照組及3個(gè)亞群中的富集表達(dá)情況進(jìn)行分析,結(jié)果顯示,自然殺傷細(xì)胞介導(dǎo)的細(xì)胞毒作用、核糖體和造血細(xì)胞譜系在亞群Ⅲ中高表達(dá),而在亞群Ⅰ中低表達(dá);亞群Ⅱ在各信號(hào)路徑中表達(dá)無(wú)明顯差別,說(shuō)明從生物學(xué)功能層面可以區(qū)別不同的亞群。
表3 細(xì)胞成分富集分析結(jié)果
表4 分子功能富集分析結(jié)果
續(xù)表4
表5 KEGG信號(hào)通路富集分析結(jié)果
本研究通過(guò)對(duì)SLE患者的轉(zhuǎn)錄組基因進(jìn)行分析,根據(jù)共識(shí)聚類表達(dá),將所有基因分為3個(gè)亞群,對(duì)各亞群的臨床特點(diǎn)進(jìn)行對(duì)比分析,探討了年齡、性別以及SLEDAI與各亞群間的聯(lián)系。利用GO功能和KEGG信號(hào)通路富集,對(duì)各亞群的生物學(xué)過(guò)程、細(xì)胞成分、分子功能和相關(guān)信號(hào)通路的關(guān)聯(lián)情況進(jìn)行了分析,為SLE基因亞型的認(rèn)識(shí)提供相應(yīng)的依據(jù)。在所納入的1 254例SLE患者中,性別在各亞群中差異無(wú)統(tǒng)計(jì)學(xué)意義,而年齡和SLEDAI在各亞群中差異有統(tǒng)計(jì)學(xué)意義,說(shuō)明年齡和SLEDAI在SLE的病理生理過(guò)程及預(yù)后中起到重要作用。有研究〔9〕發(fā)現(xiàn),年齡越小,其臨床表現(xiàn)越嚴(yán)重,且發(fā)生治療副作用的風(fēng)險(xiǎn)更高,病死率也會(huì)增加。SLEDAI是評(píng)估SLE臨床狀態(tài)和治療效果的關(guān)鍵指標(biāo),多年來(lái),在臨床工作中被廣泛應(yīng)用〔10〕。SLEDAI-2K是對(duì)SLEDAI的修改,當(dāng)SLEDAI-2K>4時(shí),提示存在狼瘡疾病活動(dòng)〔11〕。
利用STRING網(wǎng)站分析,得到了網(wǎng)絡(luò)節(jié)點(diǎn)最多的蛋白,通過(guò)表達(dá)蛋白研究其對(duì)應(yīng)的基因可以看出,排名靠前的分別是STAT3、TLR4、BRIX1、TLR2。其中,STAT3是節(jié)點(diǎn)最多的基因,但它并不在每個(gè)亞群的前10個(gè)特異性上調(diào)基因中。STAT3是轉(zhuǎn)錄信號(hào)傳導(dǎo)子與激活子通路的重要成員,在調(diào)節(jié)炎癥和免疫應(yīng)答反應(yīng)中起到關(guān)鍵作用〔12〕。當(dāng)T細(xì)胞功能缺陷時(shí),導(dǎo)致STAT3信號(hào)通路中白細(xì)胞介素(interleukin,IL)-17和IL-21的異常表達(dá),IL-17細(xì)胞因子可以介導(dǎo)中性粒細(xì)胞和其他促炎細(xì)胞因子的釋放,從而引起炎癥反應(yīng)的發(fā)生〔13-14〕。Chen等〔15〕發(fā)現(xiàn)在SLE患者中,IL-17表達(dá)上調(diào)且與STAT3強(qiáng)度呈正相關(guān),說(shuō)明STAT3和SLE的發(fā)生有著密切聯(lián)系,這與樞紐圖分析的結(jié)果相同。
先天免疫系統(tǒng)是宿主抵御病原體侵襲的第一道防線,Toll樣受體(Toll-like receptor,TLR)是固有免疫受體的重要組成部分,其在B細(xì)胞參與自身免疫性疾病的機(jī)制中起到產(chǎn)生抗體、T細(xì)胞的抗原呈遞和促進(jìn)細(xì)胞因子生成等重要作用〔16-17〕。目前已知存在于人類的TLR有11種(TLR1~11),TLR4是一種跨膜受體,屬于富含亮氨酸重復(fù)序列的超家族蛋白,在哺乳動(dòng)物中是第一個(gè)被定義的TLR成員,它既能在質(zhì)膜上發(fā)揮作用,也能在核內(nèi)體上發(fā)揮作用〔18-19〕。TLR2是另一種TLR受體,當(dāng)TLR2被識(shí)別并與配體結(jié)合后,會(huì)激活細(xì)胞內(nèi)信號(hào)轉(zhuǎn)導(dǎo)通路,引起免疫應(yīng)答,可介導(dǎo)多種生物學(xué)過(guò)程,包括多發(fā)性硬化癥、天皰瘡、特發(fā)性皮炎、白癜風(fēng)和1型糖尿病等〔16,20〕。Ma等〔21〕發(fā)現(xiàn)TLR4在狼瘡腎炎的發(fā)生發(fā)展過(guò)程中具有重要的致病作用,可能為狼瘡的治療提供新的治療策略。然而,也有研究發(fā)現(xiàn),TLR7和TLR9是SLE患者中B細(xì)胞的效應(yīng)功能的主要作用因子,而并不是TLR4和TLR2〔16-17,22〕。綜上所述,對(duì)于TLR4和TLR2在SLE的發(fā)病發(fā)展中的作用還需要進(jìn)一步的證實(shí)。
在過(guò)去的十幾年中,隨著精準(zhǔn)醫(yī)療的迅速發(fā)展,越來(lái)越多治療手段被應(yīng)用到疑難疾病的診療當(dāng)中,特別是與基因相關(guān)的研究中〔23〕。2021年,我國(guó)科研工作者對(duì)SLE患者的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析,建立了一個(gè)關(guān)于SLE患者動(dòng)脈粥樣硬化風(fēng)險(xiǎn)預(yù)測(cè)模型〔24〕。在本研究中,通過(guò)利用SLE患者在轉(zhuǎn)錄組數(shù)據(jù)聚集高表達(dá)分析得到的3個(gè)基因亞群,并對(duì)各亞群及對(duì)照組進(jìn)行差異基因表達(dá)、信號(hào)通路以及臨床特點(diǎn)等分析比較,闡述了SLE可能的亞型,為SLE的精準(zhǔn)治療提供依據(jù)。當(dāng)然,本研究仍存在幾點(diǎn)不足之處,從GEO數(shù)據(jù)庫(kù)中獲取的數(shù)據(jù)集樣本缺乏更加詳細(xì)的臨床信息;研究中的樣本年齡偏小,還需要結(jié)合更多數(shù)量的成年SLE樣本一起分析;基因的亞型是多方面的,需要更多的樣本量以及其他組學(xué)的相互結(jié)合分析作為依據(jù)。