梁 爽,凡 奎,張 燕,謝楊眉
(四川省三臺縣人民醫(yī)院 腎內(nèi)科,四川 綿陽 621100)
IgA腎病(IgA Nephropathy,IgAN)是最常見的原發(fā)性腎小球腎炎,20%~40%的患者在20年內(nèi)進(jìn)展為終末期腎病[1]。膜性腎病(Membranous Nephropathy,MN)是腎病綜合征常見的病理類型之一。經(jīng)腎臟活檢可確切診斷和鑒別IgAN和MN,但腎穿為有創(chuàng)檢查,存在不易操作等因素。因此,了解 IgAN 和MN的疾病發(fā)生發(fā)展機(jī)制以及尋找特異性生物標(biāo)記物,能為診斷和鑒別提供簡便、可靠的依據(jù)補(bǔ)充。
運用傳統(tǒng)的研究方法和數(shù)據(jù)處理分析方式常遇見高維度、小樣本、變異大、線性等問題, 不易做到簡便的分類和有效的、系統(tǒng)的分析。生物信息學(xué)技術(shù)通過綜合利用生物學(xué)、計算機(jī)科學(xué)和信息技術(shù)等多學(xué)科技術(shù)、手段,能夠精確高效的運算大量、復(fù)雜的生物數(shù)據(jù)。通過下載IgAN和MN患者外周血單核細(xì)胞DNA高通量數(shù)據(jù)集,分析篩選關(guān)鍵基因和途徑,進(jìn)行基因本體(Gene Ontology,GO)功能、京都基因基因組百科全書(Kyoto Encyclopedia of Gene and Genome,KEGG)和顯著富集基因蛋白質(zhì)與蛋白質(zhì)相互作用(Protein-Protein Interaction,PPI)分析等進(jìn)一步了解差異表達(dá)基因(Differentially Expressed Genes,DEGs)。
進(jìn) 入NCBI Gene Expression Omnibus(https://www.ncbi.nlm.nih.gov/geo/),下載GSE73953數(shù)據(jù)集,該數(shù)據(jù)集包含 15個IgAN樣本和8個MN樣本。下載其矩陣文件 SOFT formatted family file(s).SOFT 以及原始數(shù)據(jù) GSE73953_RAW.tar。通過GEO數(shù)據(jù)庫評價數(shù)據(jù)原始值分布。
1.2.1 篩選差異表達(dá)基因(DEGs)
R是集統(tǒng)計分析與圖形顯示于一體的一種統(tǒng)計分析軟件。它擁有一套完整的數(shù)據(jù)處理、計算和制圖軟件系統(tǒng)。其主要功能包括:數(shù)據(jù)存儲、數(shù)組運算、統(tǒng)計分析、統(tǒng)計作圖和程序編寫等。
下載安裝R軟件。加載limma包[2],對原始數(shù)據(jù)進(jìn)行提取和處理,以及差異表達(dá)基因的分析(|LogFC|>2,P<0.05)。R軟件采用R/Bioconductor software version 3.5.1版本。
1.2.2 差異表達(dá)基因GO和KEGG分析
運用Cytoscape(https://cytoscape.org/),安裝bingo,將篩選出的前96個差異表達(dá)基因?qū)氤绦?,根?jù)GEO中數(shù)據(jù)研究對象,選擇Homo sapiens。
運用DAVID數(shù)據(jù)庫(Database for Annotation,Visualization and Integrated Discovery, https://david.ncifcrf.gov/)對差異表達(dá)基因進(jìn)行GO富集分析和KEGG通路分析。Corrected P-Value<0.05 記為有統(tǒng)計學(xué)意義。
1.2.3 顯著富集差異表達(dá)基因PPI分析
STRING(Search Tool for the Rtrieval of Interacting Genes,https://string-db.org/)是已知和預(yù)測蛋白質(zhì)-蛋白質(zhì)相互作用的數(shù)據(jù)庫。相互作用包括直接(物理)聯(lián)系和間接(功能)聯(lián)系。它們來源于計算預(yù)測、生物體之間的知識轉(zhuǎn)移以及來自其他(主要)數(shù)據(jù)庫的相互作用。
運用STRING在線數(shù)據(jù)庫,構(gòu)建蛋白質(zhì)互作網(wǎng)絡(luò),取combined score≥0.4,下載PPI網(wǎng)絡(luò)數(shù)據(jù)。通過Cytoscape軟件(version 3.6.1)將PPI網(wǎng)絡(luò)可視化,并通過MCODE插件聚類構(gòu)建共表達(dá)模塊。最后,通過R軟件計算PPI 網(wǎng)絡(luò)中各個節(jié)點的連接度。運行后得到蛋白質(zhì)相互作用關(guān)系圖。
數(shù)據(jù)來自GEO數(shù)據(jù)庫GSE73953數(shù)據(jù)集,下載得到15個IgA Nephropathy樣本和8個Membranous Nephropathy樣本。得到矩陣文件SOFT formatted family file(s).SOFT 以及原始數(shù)據(jù) GSE73953_RAW.tar。通過GEO數(shù)據(jù)庫GEO2R評價數(shù)據(jù)集原始值分布(見圖1),基本以中間值為中心表明數(shù)據(jù)具有可比較性。
該數(shù)據(jù)集包含15個IgA Nephropathy樣本和8個Membranous Nephropathy樣本。通過R軟件limma包[2],根據(jù)限定條件:|LogFC|>2,P<0.05,在IgAN患者和MN患者中得到顯著差異表達(dá)基因75個,其中73個上調(diào)表達(dá)基因和2個下調(diào)表達(dá)基因。由差異表達(dá)基因所得熱圖(見圖2a)和火山圖(見圖2b)。
為進(jìn)一步了解篩選得到IgAN、MN疾病相關(guān)的差異表達(dá)基因功能和通路,利用 Cytoscape和DAVID在線數(shù)據(jù)庫對分析得到的差異基因分別進(jìn)行GO富集分析與KEGG通路分析。
顯著富集差異表達(dá)基因GO富集分析的生物學(xué)過程(Biological process,BP)(見圖3a)主要包括蛋白質(zhì)轉(zhuǎn)運、內(nèi)溶酶體到溶酶體轉(zhuǎn)運、趨化因子介導(dǎo)的信號通路作用和鈣介導(dǎo)信號的調(diào)控等。細(xì)胞學(xué)組分(Cellular components,CC)(見圖3b)主要為COPⅡ囊泡、NMDA選擇性谷氨酸受體復(fù)合物和高爾基體等。分子生物學(xué)功能(Molecular function,MF)(見圖3c)主要有NMDA谷氨酸受體激活、信號傳感器激活和鈣粘蛋白結(jié)合參與細(xì)胞與細(xì)胞的黏附等。
顯著富集差異表達(dá)基因KEGG通路分析(見圖3d)顯示具有統(tǒng)計學(xué)差異(P<0.05)的上調(diào)及下調(diào)差異表達(dá)基因通路,包括Endocytosis和Hepatitis B的相關(guān)信號通路。
圖1 原始數(shù)據(jù)集值分布Fig.1 Values distribution of original data set
圖2 差異表達(dá)基因熱圖和火山圖Fig.2 Heatmap and volcano map of the DEGs
圖3 GO富集分析和KEGG通路分析Fig.3 GO enrichment analysis and KEGG pathway analysis
為進(jìn)一步篩選差異表達(dá)基因所編碼的蛋白質(zhì)之間的相互作用關(guān)系,采用STRING工具對差異表達(dá)基因蛋白相互作用關(guān)系進(jìn)行梳理,得到蛋白質(zhì)相互作用關(guān)系圖(見圖4)。按照節(jié)點數(shù)關(guān)系篩選得到前10個關(guān)鍵基因,包括:EPS15、STAT4、CCL2、SUN2、SEC24C、SEC31A、GOLGB1、F2R,RAB12和PTK2B。
圖4 顯著富集差異表達(dá)基因蛋白相互作用關(guān)系Fig.4 Protein interaction of significantly enriched DEGs
IgAN目前被認(rèn)為是世界上最常見的原發(fā)性腎小球腎炎之一[1]。MN是腎病綜合征常見的病理類型之一,大部分為特發(fā)性膜性腎病(Idiopathic membranous nephropathy,IMN)[3]。MN的主要病理機(jī)制為:循環(huán)的自體抗體與腎小球內(nèi)的內(nèi)源性抗原結(jié)合,并在腎小球毛細(xì)血管壁中形成免疫復(fù)合物的沉積,補(bǔ)體激活對腎小球足細(xì)胞(Podocytes)的影響和對細(xì)胞屏障的破壞,導(dǎo)致NS表現(xiàn)[4]。
探尋IgAN 和MN的疾病發(fā)生發(fā)展機(jī)制以及尋找特異性生物標(biāo)記物,以便診斷和鑒別甚至發(fā)現(xiàn)新的治療靶點。生物信息學(xué)相關(guān)技術(shù)通過利用生物學(xué)、計算機(jī)學(xué)和信息技術(shù)揭示生物數(shù)據(jù)所蘊含的奧秘[5]。為了尋找可能有助于更好地理解IgAN和MN分子基礎(chǔ)并有助于診斷的活性病變的新標(biāo)記物,使用外周血單核細(xì)胞(PBMCs)進(jìn)行DNA分析。通過下載IgAN和MN患者外周血單核細(xì)胞DNA高通量數(shù)據(jù)集,通過篩選差異表達(dá)基因、基因富集分析及蛋白質(zhì)相互作用關(guān)系分析。
分析發(fā)現(xiàn),在具有明顯表達(dá)差異的250個基因中,包括226個上調(diào)的差異表達(dá)基因和24個下調(diào)的差異表達(dá)基因。其中75個顯著DEGs,包括73個上調(diào)基因,2個下調(diào)基因。GO富集分析的生物學(xué)過程(BP)主要包括蛋白質(zhì)轉(zhuǎn)運、內(nèi)溶酶體到溶酶體轉(zhuǎn)運、趨化因子介導(dǎo)的信號通路作用等。細(xì)胞學(xué)組分(CC)主要為COPⅡ囊泡、NMDA選擇性谷氨酸受體復(fù)合物和高爾基體等。分子生物學(xué)功能(MF)主要有NMDA谷氨酸受體激活、信號傳感器激活和鈣粘蛋白結(jié)合參與細(xì)胞與細(xì)胞的黏附等。顯著富集差異表達(dá)基因KEGG通路分析包括Endocytosis和Hepatitis B的相關(guān)信號通路。PPI篩選出EPS15、STAT4、CCL2、SUN2、SEC24C、SEC31A、GOLGB1、F2R,RAB12和PTK2B等關(guān)鍵基因。
EPS15為表皮生長因子受體底物基因,參與細(xì)胞生長調(diào)節(jié)[6]??赡軈⑴c細(xì)胞增殖的控制,有絲分裂信號的調(diào)節(jié),特別是EGFR在網(wǎng)格蛋白涂層凹坑(CCPs)的組裝中發(fā)揮作用,可能參與IgA介導(dǎo)的免疫反應(yīng)[7]。STAT4是一種轉(zhuǎn)錄因子,它在T細(xì)胞和單核細(xì)胞中轉(zhuǎn)導(dǎo)IL-12和IL-23的生成,導(dǎo)致單核細(xì)胞激活[8],一些證據(jù)顯示,STAT4可能在多種自身免疫性疾病的進(jìn)展中發(fā)揮著關(guān)鍵的作用[9]。相關(guān)研究利用炎癥相mRNA表達(dá)譜顯示,IgAN患者體內(nèi)外體趨化因子(C-C motif)配體2 (CCL2)表達(dá)上調(diào)[10],表明CCL2可能參與IgA腎臟病的發(fā)病和進(jìn)展。細(xì)胞學(xué)組分(CC)分析發(fā)現(xiàn)主要存在COPⅡ囊泡和高爾基體的差異,研究顯示在prechylomicron運輸囊泡(PCTV)與高爾基體對接時,存在COPII蛋白,并且是需要SEC24C參與[11]。F2R基因存在功能多態(tài)性,研究顯示其啟動子多態(tài)性改變在結(jié)節(jié)病中的作用,主要導(dǎo)致炎癥的加重[12],IgAN和MN存在炎性改變,F(xiàn)2R對其是否存在具體影響,目前尚無確切研究證據(jù)。RAB12在人PMBCs磷酸化中起重要作用,在帕金森疾病表現(xiàn)顯著[13],而同SUN2、SEC31,GOLGB1和PTK2B在人IgAN和MN中的具體作用和機(jī)制有待進(jìn)一步研究。
篩選出核心差異表達(dá)基因,特別是EPS15、STAT4、CCL2,SEC24C和F2R,為IgAN和MN的診斷和鑒別提供簡便、可靠的依據(jù)補(bǔ)充,甚至提供治療的新靶點。研究和掌握IgAN和MN疾病特異性的發(fā)病機(jī)制和特異性標(biāo)記物,對現(xiàn)階段IgAN和MN的診斷和鑒別具有重要意義。探討基因表達(dá)及調(diào)控,挖掘特異性蛋白質(zhì)表達(dá)和PPI,有助于尋找新治療靶點。