薛 娜 肖 瑩 董 晶 孫 偉 (吉林省白城醫(yī)學(xué)高等??茖W(xué)校,白城137000)
干燥綜合征(Sj?gren's syndrome,SS)是一種全身性自身免疫病,主要病理生理學(xué)改變是外泌腺淋巴細(xì)胞浸潤(rùn)引起的與SS 相關(guān)的眼睛和口腔干燥。SS 是第二常見(jiàn)的慢性自身免疫性疾病,其發(fā)病具有性別傾向,主要集中于50歲左右的女性患者[1-2]。SS分為原發(fā)性和繼發(fā)性兩種類型,目前尚無(wú)單一的實(shí)驗(yàn)室檢驗(yàn)或檢查可確診此疾?。?]。2016年ACR/EU?LAR 指南主要通過(guò)結(jié)合唾液腺活檢的抗Ro/SSA 陽(yáng)性及眼部和口腔干燥癥狀分類[4]。此外SS 還會(huì)導(dǎo)致患者出現(xiàn)腺外表現(xiàn),影響多種器官,包括肺、皮膚、關(guān)節(jié)、神經(jīng)系統(tǒng)和腎臟,進(jìn)而加重患者的生活負(fù)擔(dān)和病死率[5]。目前SS 病因不明,因此無(wú)特效治療藥物,臨床治療主要以緩解癥狀、延緩病情發(fā)展為主要目的。因此本研究從基因水平探究SS 的發(fā)病機(jī)制,應(yīng)用多重生物信息分析方法試圖尋找到與SS發(fā)病過(guò)程最相關(guān)的核心基因及關(guān)鍵通路,為SS的快速診斷和治療提供理論依據(jù)。
1.1 基因數(shù)據(jù)來(lái)源 選取GEO數(shù)據(jù)庫(kù)中SS相關(guān)基因原始數(shù)據(jù)GSE97614,共包含9 例SS 患者及3 例體檢者的基因檢測(cè)結(jié)果,從GPL6244 平臺(tái)下載入組患者的基本狀況及微矩陣原始數(shù)據(jù)[6]。全部基因應(yīng)用GraphPad Prism 7.0繪制火山圖進(jìn)行可視化處理,應(yīng)用基因熱圖在TBtools軟件上進(jìn)行聚類分析。
1.2 數(shù)據(jù)校準(zhǔn)及篩選 應(yīng)用R 語(yǔ)言limma 數(shù)據(jù)包對(duì)基因微陣列原始數(shù)據(jù)進(jìn)行均一化處理,篩除表達(dá)量過(guò)高或過(guò)低的原始數(shù)據(jù)。應(yīng)用GEO2R 算法對(duì)全部基因進(jìn)行處理,并依照P<0.05和差異表達(dá)倍數(shù)>2的標(biāo)準(zhǔn)進(jìn)行篩選,從而獲得差異上調(diào)表達(dá)和差異下調(diào)表達(dá)的基因。
1.3 DAVID 數(shù)據(jù)富集分析 應(yīng)用DAVID 在線分析軟件分別對(duì)差異上調(diào)和差異下調(diào)及全部差異表達(dá)基因(differentially expressed genes,DEGs)進(jìn)行基因本體(GO)分析及KEGG 信號(hào)通路分析。其中GO 分析包括細(xì)胞組分、分子功能及生物過(guò)程。全部富集分析篩選標(biāo)準(zhǔn)為基因數(shù)≥2個(gè)及P<0.05。對(duì)DEGs富集結(jié)果進(jìn)行R語(yǔ)言數(shù)據(jù)處理及氣泡圖可視化呈現(xiàn)。
1.4 蛋白互作(PPI)網(wǎng)絡(luò)分析 應(yīng)用STRING 在線分析軟件進(jìn)行PPI 網(wǎng)絡(luò)制作,全部DEGs輸入“Multi?ple proteins”對(duì)話框,物種選擇為“homo sapiens”,同時(shí)獲得可視化處理后的PPI網(wǎng)絡(luò)圖及基因間的具體聯(lián)系。
1.5 核心基因預(yù)測(cè) 將PPI 網(wǎng)絡(luò)圖提供的數(shù)據(jù)信息輸入Cytoscape 軟件進(jìn)行可視化處理。通過(guò)Cyto?scape 內(nèi)置插件cytohubba 對(duì)全部基因聯(lián)系進(jìn)行分析和計(jì)算,選擇“Degree”評(píng)分準(zhǔn)則對(duì)全部DEGs按照分?jǐn)?shù)依次降序排列,最終篩選出與SS發(fā)病最為相關(guān)的核心基因。
1.6 統(tǒng)計(jì)學(xué)方法 所有原始數(shù)據(jù)采用R 語(yǔ)言軟件進(jìn)行分析。DEGs 篩選標(biāo)準(zhǔn)為差異倍數(shù)≥2 及P<0.05。KEGG 信號(hào)通路富集基因最少為2 且P<0.05。PPI篩選標(biāo)準(zhǔn)為基因間聯(lián)系>0.4。
2.1 原始數(shù)據(jù)處理 GSE97614 共包含12 例患者樣本,全部患者均為女性,依照ACR/EULAR 指南診斷為原發(fā)性SS。其中9 例SS 患者平均年齡為58 歲(24~75 歲),對(duì)照組3 例患者平均年齡為52 歲(20~70 歲)。SS 患者具體服藥情況不詳。GSE97614 共包含49 395 個(gè)編碼基因的檢測(cè)結(jié)果,數(shù)據(jù)樣本的均值-方差趨勢(shì)(圖1A)、UMAP 圖(圖1B)、表達(dá)密度(圖1C)、矯正P值(圖1D)、t值(圖1E)顯示基因檢測(cè)結(jié)果具有可分析性。
圖1 GSE97614原始數(shù)據(jù)一般概況Fig.1 General overview of GSE97614
2.2 差異基因矯正 檢測(cè)12例樣本中每例樣本的49 395 個(gè)編碼基因數(shù)據(jù),結(jié)果顯示原始數(shù)據(jù)結(jié)果均一性較差(圖2A);應(yīng)用R 語(yǔ)言limma 包進(jìn)行數(shù)據(jù)均一化處理,篩除離散度較大的數(shù)據(jù)(表達(dá)過(guò)高或表達(dá)過(guò)低),校準(zhǔn)后的數(shù)據(jù)均一性較好(圖2B)。
圖2 差異基因矯正Fig.2 DEGs correction
2.3 差異基因篩選及可視化處理 共篩選出96個(gè)差異上調(diào)表達(dá)和65 個(gè)下調(diào)表達(dá)的基因。對(duì)全部DEGs 進(jìn)行火山圖可視化處理結(jié)果見(jiàn)圖3A。對(duì)全部DEGs 進(jìn)行聚類分析,應(yīng)用基因熱圖進(jìn)行可視化處理,結(jié)果顯示全部DEGs具有可聚類性(圖3B)。
圖3 差異基因可視化處理Fig.3 Visualization of DEGs
2.4 差異基因的GO 分析 對(duì)差異上調(diào)表達(dá)基因進(jìn)行GO 分析顯示差異基因在細(xì)胞組成主要富集于細(xì)胞外間隙,生物過(guò)程主要富集于細(xì)胞外基質(zhì),分子功能主要富集于細(xì)胞因子活性。差異下調(diào)表達(dá)基因在細(xì)胞組成主要富集于質(zhì)膜的組成成分,生物過(guò)程主要富集于細(xì)胞對(duì)激素刺激的反應(yīng),分子功能主要富集于整合素結(jié)合。全部DEGs 在細(xì)胞組成主要富集于細(xì)胞外間隙,生物過(guò)程主要富集于細(xì)胞外基質(zhì),分子功能主要富集于細(xì)胞因子活性,和差異上調(diào)表達(dá)基因的GO分析一致,說(shuō)明差異上調(diào)表達(dá)基因可能在SS的發(fā)病過(guò)程中發(fā)揮更重要的作用(圖4)。
圖4 差異基因的GO分析Fig.4 GO analysis of DEGs
2.5 差異基因的KEGG 分析 對(duì)差異上調(diào)表達(dá)基因進(jìn)行KEGG分析顯示差異基因主要富集于補(bǔ)體和凝血級(jí)聯(lián)通路、細(xì)胞外基質(zhì)通路及黏著斑通路。對(duì)差異下調(diào)表達(dá)基因進(jìn)行KEGG分析顯示差異基因主要富集于干細(xì)胞多能性信號(hào)通路、雌激素信號(hào)通路及MAPK信號(hào)通路(圖5)。
圖5 差異基因的KEGG分析Fig.5 KEGG analysis of DEGs
2.6 PPI網(wǎng)絡(luò) STRING在線分析軟件對(duì)全部161個(gè)DEGs 進(jìn)行PPI 網(wǎng)絡(luò)分析,結(jié)果顯示共有141 個(gè)基因之間存在相關(guān)性聯(lián)系,聯(lián)系線路為224條,每個(gè)基因間的連接程度評(píng)分為3.18,平均局部聚類系數(shù)為0.401,PPI富集P值<1.0e-16(圖6)。
圖6 差異基因PPI網(wǎng)絡(luò)Fig.6 PPI network of DEGs
2.7 SS發(fā)病核心基因預(yù)測(cè) 應(yīng)用Cytoscape對(duì)蛋白網(wǎng)絡(luò)連接數(shù)據(jù)進(jìn)行可視化處理,cytohubba 內(nèi)置應(yīng)用程序計(jì)算出FN1(32分)、IL1B(20分)、TIMP1(20分)、THBS1(16分)、PLAU(16分)、SERPINE1(16分)、FOS(14 分)、ITGB3(13 分)、VCAN(10 分)、ADAMTS1(10 分)為前10 位發(fā)病核心基因。對(duì)10 個(gè)核心基因進(jìn)行聚類分析顯示基因間具有可聚類性(圖7)。
圖7 核心基因預(yù)測(cè)Fig.7 Prediction of hub genes
SS 是一種慢性自身免疫病,其典型的病理學(xué)改變是淚腺和唾液腺受累,導(dǎo)致眼睛和口干燥。SS 可累積到全身多個(gè)器官,包括肺、腎和中樞神經(jīng)系統(tǒng),加重患者的生活負(fù)擔(dān)及病死率[7]。目前針對(duì)SS 的具體發(fā)病機(jī)制尚不明確,因此無(wú)特效治療藥物。西醫(yī)以激素及免疫抑制劑為主,并針對(duì)癥狀選擇人工淚液、人工唾液進(jìn)行對(duì)癥支持治療。中醫(yī)多采用以補(bǔ)益脾胃、益氣養(yǎng)陰為主的辨證治療[8]。目前針對(duì)SS的診斷也是臨床的難點(diǎn),由于SS患者早期缺乏特異性臨床表現(xiàn),臨床也缺乏特異性和敏感性高的血清診療標(biāo)志物,常導(dǎo)致SS治療時(shí)機(jī)延誤。因此新的快速的血清學(xué)生物診療標(biāo)志物可提供SS 的早期診斷,更有可能成為治療SS的生物靶點(diǎn)。本研究主要對(duì)既往SS疾病基因測(cè)序結(jié)果進(jìn)行深入分析,試圖找到SS快速診療的標(biāo)志物及潛在治療靶點(diǎn)。
纖維連接蛋白(fibronectin,F(xiàn)N)是脊椎動(dòng)物的一種470~500 kD 的糖蛋白,對(duì)動(dòng)物的發(fā)育、器官生長(zhǎng)、細(xì)胞黏附、細(xì)胞遷移及止血等正常過(guò)程發(fā)揮重要作用[9]。FN分為3種亞型,包括FN1、FN2和FN3。FN 一般有兩種來(lái)源:血漿FN 由肝細(xì)胞合成并分泌到血液中;細(xì)胞FN 由細(xì)胞局部分泌。FN 需要被組裝成細(xì)胞外基質(zhì)的原纖維發(fā)揮作用。目前關(guān)于FN的組裝機(jī)制主要在細(xì)胞層面進(jìn)行研究,涉及FN 與細(xì)胞表面分子結(jié)合,招募額外的FN 分子形成不溶性原纖維。組裝開(kāi)始于細(xì)胞黏附部位,生長(zhǎng)的原纖維可向內(nèi)部轉(zhuǎn)移[10]。FN1分子廣泛分布于健康的細(xì)胞膜、固有層、血管結(jié)構(gòu)、神經(jīng)和平滑肌細(xì)胞層[11]。其是細(xì)胞遷移和轉(zhuǎn)移的重要調(diào)節(jié)因子,據(jù)報(bào)道,F(xiàn)N1參與人類皮膚鱗狀細(xì)胞癌的發(fā)生[12]。FN1在甲狀腺癌中表達(dá)上調(diào),下調(diào)其表達(dá)可抑制甲狀腺癌細(xì)胞的增殖、侵襲和遷移,提示FN1 可能參與甲狀腺癌的發(fā)生[13]。FN1 通過(guò)激活PI3K 促進(jìn)細(xì)胞增殖,抑制細(xì)胞凋亡[14]。在肝細(xì)胞癌中發(fā)現(xiàn)FN 蛋白呈過(guò)表達(dá)趨勢(shì)[15]。胃腸道和頭頸部癌癥患者血漿FN1 水平明顯升高[16]。在非惡性疾病中,特別是在血栓形成、止血過(guò)程、血管疾病和血小板功能方面,F(xiàn)N 的確切作用仍不明確。
目前針對(duì)FN1 在SS 發(fā)病機(jī)制中的作用尚未得到廣泛關(guān)注,國(guó)內(nèi)外僅有2 篇報(bào)道。JIANG 等[17]在2021 年的研究發(fā)現(xiàn)沙參麥冬湯可能對(duì)SS 的治療發(fā)揮積極作用,其通過(guò)生物信息學(xué)分析發(fā)現(xiàn),沙參麥冬湯可能通過(guò)靶向結(jié)合FN1 治療SS。其具體機(jī)制可能與沙參麥冬湯改善FN1 和MMP-9 對(duì)唾液腺泡和基底膜結(jié)構(gòu)的破壞、降低FN1在SS中的促炎癥反應(yīng)有關(guān)。MONA 等[18]2020 年的體內(nèi)實(shí)驗(yàn)發(fā)現(xiàn),具有潛在免疫調(diào)節(jié)及治療作用的骨髓間充質(zhì)干細(xì)胞在與唾液腺細(xì)胞進(jìn)行共培養(yǎng)時(shí),可分化為唾液祖細(xì)胞,取代病變的唾液腺細(xì)胞從而起到治療SS 的作用。
本文通過(guò)生物信息分析方法,首先對(duì)GSE97614基因檢測(cè)結(jié)果進(jìn)行了均一化處理,使得后續(xù)生物信息分析結(jié)果更加準(zhǔn)確。然后利用GO分析、KEGG 信號(hào)通路分析,PPI 網(wǎng)絡(luò)分析及cytoHubba 核心發(fā)病基因計(jì)算最終發(fā)現(xiàn)FN1 是SS 發(fā)病的關(guān)鍵基因。本文并不是第一篇針對(duì)SS 發(fā)病核心基因預(yù)測(cè)的文章。目前有4 篇針對(duì)SS 發(fā)病基因的生物信息分析文獻(xiàn)。郭俊愷等[19]分析GSE23117 和GSE127952 的基因表達(dá)譜發(fā)現(xiàn)CXCL9 可能與SS 發(fā)病相關(guān)。蔡鑫等[20]分析GSE127952 的基因表達(dá)譜發(fā)現(xiàn)STAT1 可能與SS發(fā)病相關(guān)。徐華等[21]分析GSE7451、GSE127952 和GSE40611的基因表達(dá)譜發(fā)現(xiàn)STAT1可能與SS發(fā)病相關(guān)。梁江等[22]分析GSE23117、GSE07451、GSE40611、GSE84844 的基因表達(dá)譜發(fā)現(xiàn)BAFF 可能與SS 發(fā)病相關(guān)。目前尚無(wú)研究分析GSE97614 數(shù)據(jù),而本文的分析結(jié)果也與既往研究發(fā)現(xiàn)的核心發(fā)病基因不完全相同,提示SS發(fā)病機(jī)制的復(fù)雜性及多樣性。
FN1 是上皮細(xì)胞-間質(zhì)細(xì)胞轉(zhuǎn)化相關(guān)基因,在腫瘤相關(guān)研究中被關(guān)注較多。近年來(lái),越來(lái)越多的研究表明FN1 也是參與免疫浸潤(rùn)的免疫相關(guān)基因。FN1編碼FN并儲(chǔ)存于血漿和細(xì)胞外基質(zhì),在炎癥組織募集巨噬細(xì)胞過(guò)程中,F(xiàn)N1 呈現(xiàn)高度上調(diào)趨勢(shì)。與此同時(shí),F(xiàn)N1在體外也可作為白細(xì)胞遷移的基質(zhì),促進(jìn)組織中的T 細(xì)胞聚集,增強(qiáng)局部對(duì)感染或癌癥的免疫力[23]。免疫浸潤(rùn)分析研究顯示免疫浸潤(rùn)水平與FN1表達(dá)水平相關(guān)。FN1參與調(diào)控NKp46受體介導(dǎo)的天然殺傷細(xì)胞產(chǎn)生IFN-γ,進(jìn)而影響細(xì)胞內(nèi)免疫。FN1 參與許多與免疫相關(guān)的信號(hào)通路,如趨化因子信號(hào)通路、細(xì)胞因子受體相互作用、自然殺傷細(xì)胞介導(dǎo)的細(xì)胞毒性和T 細(xì)胞受體信號(hào)通路。FN1 表達(dá)水平的增加與M2 巨噬細(xì)胞和靜息CD4+T細(xì)胞的比例呈正相關(guān),但與濾泡輔助性T 細(xì)胞和CD8+T細(xì)胞比例呈負(fù)相關(guān)[24]。SS是一種自身免疫性疾病,隨著FN1 參與體內(nèi)免疫應(yīng)答過(guò)程的深入研究,其在SS發(fā)病機(jī)制中的作用亦會(huì)被逐漸挖掘。
綜上,本研究通過(guò)對(duì)SS基因數(shù)據(jù)進(jìn)行生物信息學(xué)分析發(fā)現(xiàn)免疫相關(guān)基因FN1 可能通過(guò)改善免疫調(diào)節(jié)誘發(fā)SS。FN1 可能作為SS 快速診斷的血清標(biāo)志物及潛在的藥物干預(yù)靶點(diǎn)。未來(lái)有關(guān)FN1 介導(dǎo)免疫浸潤(rùn)、免疫細(xì)胞的募集及其在SS發(fā)病機(jī)制中的作用可能成為重點(diǎn)研究方向。