薛 菁,馬 銀,韓玉梅,池淑紅
間質(zhì)性肺病(ILD) 是類風濕性關節(jié)炎(RA) 患者比較常見的一種關節(jié)外病變[1]。目前,類風濕性關節(jié)炎相關間質(zhì)性肺病(RA-ILD)臨床診療管理報道較多,而對于其發(fā)病機制的研究卻相對匱乏[2]。早期的芯片技術到現(xiàn)在的高通量測序技術,都是以挖掘研究疾病相關靶標分子及通路為核心,其應用較為廣泛[3]。本研究利用NCBI GEO(GEO) 數(shù)據(jù)庫的RA-成纖維樣滑膜細胞(FLS)及ILD肺臟組織基因表達譜數(shù)據(jù)篩選共同表達的差異基因,并利用DAVID、KEGG以及STRING數(shù)據(jù)庫分析目的基因顯著富集的生物學過程,分子功能以及信號通路,為RA-ILD生物標記物的鑒定及分子機制的研究提供思路。
1.1 原始表達譜矩陣文件的下載與處理:數(shù)據(jù)集GSE47460及GSE128813均來源于NCBI-GEO DataSets,其中GSE47460數(shù)據(jù)集包括582例肺臟組織樣本,選取符合標準的194例ILD樣本以及91例正常肺臟組織對照樣本(297例COPD樣本除外),GSE128813數(shù)據(jù)集包括3例RA-FLS樣本以及3例正常FLS對照樣本。
1.2 差異表達基因(DEGs) 及目的基因的獲取:利用R3.6.1軟件的limma包分別篩選兩個數(shù)據(jù)集顯著DEGs,以P<0.05并且 |log2FC|>0.5作為篩選差異基因的閾值。分別利用R3.6.1軟件中ggplot2和pheatmap包繪制DEGs火山圖及熱圖,并利用Venn將兩個數(shù)據(jù)集篩選得到的DEGs取交集,從而獲取目的基因進行后續(xù)分析。
1.3 目的基因富集分析:利用富集分析工具DAVID分析目的基因參與的GO功能富集及KEGG通路富集。選取參與富集基因個數(shù)≥2,P<0.05作為富集顯著性的閾值。
1.4 TOP8核心(Hub)基因篩選:利用STRING(http:∥string-db.org/) 數(shù)據(jù)庫構建目的基因蛋白質(zhì)互作調(diào)控網(wǎng)絡圖(Protein-protein interaction,PPI),構建后的網(wǎng)絡圖利用Cytoscape3.6.0軟件及MCODE插件篩選TOP8 Hub基因。
1.5 目的基因蛋白質(zhì)與轉(zhuǎn)錄因子(TF) 網(wǎng)絡調(diào)控圖:利用DAVID軟件搜索與目的基因顯著相關的轉(zhuǎn)錄因子,聯(lián)合目的基因蛋白質(zhì)互作網(wǎng)路構建和TF相關的調(diào)控關系網(wǎng)絡圖。
2.1 DEGs篩選結果:數(shù)據(jù)集GSE47460 (間質(zhì)性肺病實驗組 vs.正常對照肺臟組織組)和數(shù)據(jù)集GSE128813 (類風濕性關節(jié)炎成纖維樣滑膜細胞與正常對照成纖維樣滑膜細胞)分別篩選出1 173個和1 154個滿足閾值的DEGs(圖1A、1B,封三),2組DEGs中包含43個重疊DEGs(圖2,目錄后),其中表達上調(diào)基因24個,表達下調(diào)基因19個,重疊DEGs分別在2組數(shù)據(jù)集中表達熱圖(圖3,封三),見表1。
表1 DEGs的24個高表達基因和19個低表達基因
2.2 目的基因功能及通路富集分析:分析目的基因的功能及通路富集情況。在生物學過程組中,主要富集于膠原蛋白分解代謝的過程、蛋白寡聚化正向調(diào)控、間充質(zhì)細胞增殖、催化活性負向調(diào)控、軟骨形態(tài)發(fā)生及上皮細胞向間充質(zhì)細胞轉(zhuǎn)化涉及心內(nèi)膜的形成。在細胞成分組中,主要富集于細胞外基質(zhì)、中間體及胞外區(qū)。在分子功能組中,主要富集于肽鏈內(nèi)切酶活性、肽鏈內(nèi)切酶金屬活性、肝素結合及生長因子(圖4,封三)。KEGG-通路分析發(fā)現(xiàn)顯著富集的通路包括類風濕性關節(jié)炎、癌癥通路、細胞骨架調(diào)控、Rap1信號通路、Ras信號通路、MAPK信號通路及戊糖和葡醛酸鹽的相互轉(zhuǎn)化(圖5,封三),見表2。
表2 DEGs三個功能組的顯著富集分析
2.3 利用PPI對DEGs進行關鍵候選基因的識別:運用STRING網(wǎng)站和Cyto-scape軟件,經(jīng)分析發(fā)現(xiàn)43個共同差異表達基因中有18個DEGs被過濾到PPI網(wǎng)絡中,其中包含18個節(jié)點和25個相互作用關系(圖6,封三)。18個節(jié)點中,利用Cytohuabba篩選了8個Hub-基因,分別為基質(zhì)金屬酶1(MMP1),基質(zhì)金屬酶3(MMP3),Discs大同源相關蛋白(DLGAP5),拓撲異構酶2A(TOP2A),著絲粒蛋白F(CENPF),驅(qū)動蛋白超家族4A(KIF4A),SHC的SH22結構域結合蛋白1(SHCBP1),去整合酶金屬蛋白酶3(ADAMTS3)(圖7,封三)。
2.4 目的基因與TF調(diào)控關系網(wǎng)絡圖:利用DAVID工具搜索共同差異表達基因顯著相關的轉(zhuǎn)錄因子,共篩選得到3個滿足閾值的TF,分別為SRY、STST5B、NKX3A。利用Cyto-scape軟件構建DEGs與TF調(diào)控網(wǎng)絡圖,其中包括43個節(jié)點和112個相互作用關系(圖8,封三)。
RA是以滑膜慢性炎癥及骨破壞為特征的一種系統(tǒng)性疾病[4]?;ひr里層的FLS的異常增殖、侵襲是RA發(fā)病的主要原因之一[5]。研究統(tǒng)計,RA患者一生發(fā)生ILD的風險約為60%,嚴重影響了患者的日常生活質(zhì)量,同時存在死亡風險[6-7]。研究表明,感染、吸煙、黏膜失調(diào)、宿主遺傳及過早衰老等都是RA患者肺部疾病發(fā)展的重要潛在因素[8]。RA-ILD(可先于關節(jié)發(fā)病) 可能起源于慢性氣道和肺泡上皮損傷,從而導致慢性炎癥以及氣道和肺實質(zhì)的纖維化改變[9]。然而,作為影響RA患者預后的ILD,一直以來研究方法、動物模型以及治療手段均較匱乏,比如是否采用抗纖維化治療/非抗纖維化治療的方法存在爭議[10]。所以說,進一步尋找RA-ILD潛在的診斷與治療靶基因和相關信號通路,對于臨床發(fā)掘有效的治療方法至關重要。本研究通過分別篩選RA-FLS及ILD肺臟組織芯片數(shù)據(jù)集的共同表達差異基因,同時根據(jù)目的基因的PPI網(wǎng)絡,共篩選出8個Hub基因,包括MMP-1、MMP-3、DLGAP5、TOP2A、SHCBP1、CENPF、KIF4A、ADAMTS3。Hub基因功能主要富集于膠原蛋白分解代謝、上皮細胞向間充質(zhì)細胞分化及間充質(zhì)細胞增殖過程。
關節(jié)軟骨的細胞外基質(zhì)(ECM)和基底膜降解是RA患者關節(jié)軟骨損害的病理基礎?;|(zhì)金屬蛋白酶(MMPs) 對降解ECM起著重要作用[11]。在MMPs家族中,MMP1和MMP3屬于膠原酶和間質(zhì)溶解素酶,對ECM的降解發(fā)揮著關鍵作用。研究表明,利用ELISA及qRT-PCR方法檢測RA患者關節(jié)滑膜組織原代成纖維樣滑膜細胞中MMP1和MMP3的表達,均高于阿巴西普細胞治療組,提示MMP1與MMP3的表達水平與RA疾病活動度呈現(xiàn)正相關[12]。在檢測端粒酶介導的人骨關節(jié)炎FLS(hTERT-OA 13A FLS)和端粒酶介導的人類風濕關節(jié)炎FLS(hTERT-RA 516 FLS)基因表達的差異時,發(fā)現(xiàn)MMP1、MMP3及ADAMTS3基因在端粒酶介導的人類風濕關節(jié)炎FLS中的表達是明顯上調(diào)的。而在博來霉素誘發(fā)的特發(fā)性肺纖維化小鼠模型中,MMP3具有促進上皮細胞向間質(zhì)轉(zhuǎn)化、異常遷移和其他異常修復過程的功能,而MMP1具有減緩肺臟纖維化的潛在功能,這一結論與本文結論不符,可能與實驗樣本量的大小以及物種的差異性有關。ADAMTS3是ADAMTS基因家族前膠原N-蛋白酶亞家族成員,其主要作用為合成骨和軟骨的組成成分II型膠原分子[13]。研究表明,在SiO2構建的大鼠肺纖維化模型中,miR-144可通過調(diào)控靶基因ADAMTS3參與肺纖維化的發(fā)生。以上結果提示MMP1、MMP3及ADAMTS3基因可能參與RA-ILD的發(fā)生。
TOP2A是一種廣泛存在于原核生物和真核生物中的酶蛋白,與細胞增殖、細胞凋亡、細胞有絲分裂等密切相關。其表達的異常與腫瘤的發(fā)生發(fā)展、治療及其預后等方面相關[14]。研究表明,青少年類風濕性關節(jié)炎患者血漿中TOP2A的水平與疾病的嚴重程度呈現(xiàn)正相關,并且系統(tǒng)性硬化(SSc) 患者血漿中抗TOP2A抗體陽性發(fā)生肺纖維化的概率明顯高于抗TOP2A抗體陰性患者,這一發(fā)現(xiàn)強調(diào)了TOP2A對于風濕免疫疾病誘發(fā)的肺部疾病的研究是一個有價值的重要工具[15-16]。
綜上所述,通過對RA-FLS及ILD肺臟組織芯片數(shù)據(jù)集的共同表達差異基因的篩選、搜尋GEO Profiles數(shù)據(jù)庫及查閱相關文獻,結果提示,MMP1、MMP3、ADAMTS3、TOP2A可能在RA-ILD中起一定作用。而DLGAP5、SHCBP1、CENPF、KIF4A,其主要富集功能與MMP1、MMP3、ADAMTS3、TOP2A類似,但相關文獻報道較少,尚需實驗室和臨床證實。這也是本文的不足之處,需要進一步開展的工作。