郭海森,張煒岱,倪楚民,周琳潔,蔡志雄,朱稚丹
汕頭市中心醫(yī)院 中山大學(xué)附屬汕頭醫(yī)院 心血管內(nèi)科,廣東 汕頭 515031
特發(fā)性肺動脈高壓(IPAH)是由于不明原因引起肺小動脈收縮、增生和重塑導(dǎo)致肺血管阻力增加,平均肺動脈壓在靜息狀態(tài)下≥25mmHg,且排除其他病因所致的肺高壓[1]。目前IPAH的基因表達特點仍未研究透徹。此外,系統(tǒng)性硬化病所致肺動脈高壓(SSc-PAH)在臨床上較為常見,但由于病因不同,IPAH和SSc-PAH在治療和預(yù)后等方面存在明顯差異,探究兩者的基因表達差異,有助于鑒別診斷和個體化治療[2]。因此,本研究借助基因芯片數(shù)據(jù),分別探究IPAH與健康人群、系統(tǒng)性硬化病相關(guān)肺動脈高壓的基因表達差異,為進一步臨床研究提供方向和思路。
美國國立生物技術(shù)信息中心的GEO數(shù)據(jù)庫(www.ncbi.nlm.nih.gov/geo)收錄了大量基因芯片檢測信息。本研究基于該數(shù)據(jù)庫中收錄的GSE33463數(shù)據(jù)集進行分析,該數(shù)據(jù)集為病例對照研究設(shè)計,包含140例病例(其中特發(fā)性肺動脈高壓病例30例,系統(tǒng)性硬化病相關(guān)肺動脈高壓42例,系統(tǒng)性硬化病相關(guān)肺高壓伴間質(zhì)性肺病8例,系統(tǒng)性硬化病不伴有肺動脈高壓19例)和41例健康對照,病例基線信息詳見原始研究[3]。該數(shù)據(jù)集分析外周血標本,F(xiàn)icoll密度梯度法分離外周血單核細胞,提取和純化RNA,應(yīng)用Illumina HumanHT-12 V3.0 expression beadchip芯片平臺進行基因表達譜分析[3]。根據(jù)DNA轉(zhuǎn)錄為RNA過程中的轉(zhuǎn)錄水平高低,篩選轉(zhuǎn)錄水平上調(diào)基因和轉(zhuǎn)錄水平下調(diào)基因,以供進一步分析。
在原始研究的基礎(chǔ)上,本研究進一步將特發(fā)性肺動脈高壓(IPAH)組與系統(tǒng)性硬化病相關(guān)肺動脈高壓(SSc-PAH)組進行比較分析,探究其基因和信號通路的差異(原始研究和本研究的分組方式,見圖1 )。此外,本研究再次對IPAH組與對照組的差異基因進行分析(采用最新基因注釋信息、最新GO數(shù)據(jù)庫、最新KEGG數(shù)據(jù)庫和蛋白質(zhì)相互作用數(shù)據(jù)庫進行分析,以獲取比原始研究更全面的結(jié)果)。
特發(fā)性肺動脈高壓(IPAH,n=30)硬皮病伴肺動脈高壓(SSc-PAH,n=42)硬皮病伴肺動脈高壓伴間質(zhì)肺炎(SSc-PH-ILD,n=8)硬皮病不伴有肺動脈高壓(n=19)對照組(n=41)
本研究使用R軟件對基因數(shù)據(jù)進行標準化和去批次效應(yīng),應(yīng)用Limma程序包和GEO2R平臺對差異表達基因進行篩選。差異基因的判斷閾值根據(jù)兩組樣本差異情況而定。對于IPAH病例組與對照組的分析,差異基因篩選條件為校正后P值(Adjusted P)<0.05且差異倍數(shù)(FC) >2;對于IPAH組與SSc-PAH組的分析,差異基因篩選條件為P<0.05且差異倍數(shù)(FC) >1.5[4, 5]。
為了更好地評估目標基因的生物學(xué)效應(yīng),應(yīng)用DAVID平臺的GO基因本體和KEGG通路分析工具以及ClusterProfiler程序包對差異基因進行功能和信號通路分析[4, 5]。為篩選樞紐基因(Hub gene),使用STRING平臺和Cytoscape 3.7.0軟件進行蛋白質(zhì)相互作用分析,以篩選樞紐基因[6, 7]。
2.1.1IPAH與對照組的差異表達基因篩選及富集分析 特發(fā)性肺動脈高壓病例(IPAH組)與對照組相比,IPAH組共篩選出33個轉(zhuǎn)錄上調(diào)基因和51個轉(zhuǎn)錄下調(diào)基因(詳見表1,圖2)。上調(diào)基因的GO富集分析,在細胞組分方面,主要涉及血紅蛋白組成;在分子功能方面,主要涉及活性氧代謝過程、過氧化氫代謝過程、氧運輸、氣體轉(zhuǎn)運等功能;在生物過程方面,主要涉及氧運輸(圖3B),上調(diào)基因的KEGG分析未發(fā)現(xiàn)相關(guān)通路(FDR<0.05,即-log10(P)>1.3,詳見圖3A)。下調(diào)基因的GO富集分析,在細胞組分方面,主要涉及轉(zhuǎn)錄因子復(fù)合體;在分子功能方面,主要涉及DNA結(jié)合轉(zhuǎn)錄因子活性的調(diào)控、細胞因子產(chǎn)生的負調(diào)控等;在生物過程方面,主要涉及細胞對生物刺激的反應(yīng)、轉(zhuǎn)錄因子的調(diào)控等(圖3D);KEGG信號通路分析提示下調(diào)基因主要涉及IL-17信號通路、破骨細胞分化、NOD樣受體信號通路、Toll樣受體信號通路、TNF信號通路等(圖3C)。
表1 特發(fā)性肺動脈高壓病例(IPAH組)與對照組差異表達基因(前10個)
15105001-1Log2(foldchange)_Log10FDRDown-regulationNoneUp-regulation
CBAD
2.1.2IPAH組與對照組的差異表達基因的蛋白相互作用分析 將IPAH組轉(zhuǎn)錄上調(diào)的33個基因進行蛋白質(zhì)相互作用分析,發(fā)現(xiàn)HBD、NFE2、HBE1、HBG1、EPB42、SELENBP1、AHSP、SNCA、ALAS2、HBG2、HBQ1和HBM共12個基因所編碼的蛋白存在廣泛的相互作用,考慮為樞紐基因(圖4A),將樞紐基因進行富集分析,發(fā)現(xiàn)其主要參與血紅蛋白復(fù)合體組成、氧轉(zhuǎn)運蛋白活性調(diào)節(jié)、氧輸送、氧結(jié)合、鐵離子結(jié)合和凝血等生物學(xué)過程。將IPAH組轉(zhuǎn)錄下調(diào)的51個基因進行蛋白質(zhì)相互作用分析,發(fā)現(xiàn)JUNB、JUN、NFKBIA和FOSB為樞紐基因(圖4B),其主要參與轉(zhuǎn)錄因子結(jié)合、對激素刺激反應(yīng)、對cAMP反應(yīng)和對機械刺激反應(yīng)等生物學(xué)過程。
AB
特發(fā)性肺動脈高壓組(IPAH組)與系統(tǒng)性硬化病相關(guān)肺動脈高壓組(SSc-PAH組)相比,IPAH組共篩選出1個轉(zhuǎn)錄上調(diào)基因(RBPMS2)和18個轉(zhuǎn)錄下調(diào)基因。從下調(diào)基因中篩選樞紐基因并進行富集分析,結(jié)果發(fā)現(xiàn)OAS2、OAS3、IFI6和IFITM3共4個基因作為樞紐基因參與免疫反應(yīng)過程。
基因芯片可以高通量分析目標基因的表達情況,信息量巨大。因此,往往一項研究僅能利用其中的部分數(shù)據(jù),仍有大量數(shù)據(jù)尚未被充分挖掘使用。本論文所采用的數(shù)據(jù)集首次分析于2012年,現(xiàn)今相關(guān)數(shù)據(jù)分析手段已有明顯進步。生物信息學(xué)發(fā)展速度極快,隨著注釋文庫數(shù)據(jù)的完善,重注釋基因可以得到更多差異表達基因。此外,隨著基因相互作用機制的進一步研究,基因富集分析(如GO分析、KEGG分析和蛋白質(zhì)相互作用分析)數(shù)據(jù)庫也逐漸成熟和全面。因此,本研究使用最新的基因注釋信息庫、最新的富集分析數(shù)據(jù)庫和蛋白質(zhì)相關(guān)作用數(shù)據(jù),將已有研究的基因芯片進行二次分析,以得到更全面和可靠的研究結(jié)果[8]。同時,基于不同的研究目的,采用與原始研究不同的分組方式進行分析,可以得到全新臨床意義的研究結(jié)果,是當前基因研究的熱門手段。本研究通過GEO數(shù)據(jù)庫獲取特發(fā)性肺動脈高壓數(shù)據(jù)集(GSE33463),該數(shù)據(jù)集已于2012年進行初次分析,但隨著基因芯片注釋技術(shù)和生物信息學(xué)技術(shù)的發(fā)展,可用于該數(shù)據(jù)集的基因注釋信息和基因富集分析信息已進一步完善[3]。因此,本研究應(yīng)用最新的注釋信息和功能富集信息,分析IPAH組和對照組的差異表達基因并進行功能富集和蛋白質(zhì)相互作用分析。此外,本研究在原始研究的基礎(chǔ)上,增加新的比較組(IPAH 組vs. SSc-PAH組),以分析IPAH相較其他病因所致肺動脈高壓的基因表達差異,從而為IPAH的診療和研究提供更多的信息。
本研究利用當前最新的基因芯片注釋文庫進行分析,IPAH組與對照組相比,共篩選12個上調(diào)的樞紐基因和4個下調(diào)的樞紐基因。IPAH上調(diào)的樞紐基因,主要參與血紅蛋白復(fù)合體組成、氧轉(zhuǎn)運蛋白活性調(diào)節(jié)、氧氣輸送、氧結(jié)合、血紅素結(jié)合和凝血等生物學(xué)過程。其中HBD、HBE1、HBG1、HBG2、HBQ1、HBM 、NFE2基因的表達產(chǎn)物為胚胎、胎兒或成年的血紅蛋白或紅系組織的組成成分。HBE1為胚胎血紅蛋白的重要組成成分[9];HBG1和HBG2所編碼的γ珠蛋白通常在胎兒肝臟、脾臟和骨髓中表達[10];EPB42為紅細胞膜蛋白帶。此外,AHSP編碼α血紅蛋白穩(wěn)定蛋白,特異性結(jié)合游離的α-珠蛋白并參與血紅蛋白的組裝[11];ALAS2編碼的蛋白質(zhì)催化血紅素生物合成途徑的第一步,Chris等人的研究已證實,ALAS2與IPAH疾病嚴重程度正相關(guān),與肺動脈血氧飽和度和心臟指數(shù)呈負相關(guān)[3]。綜上,在IPAH患者的外周血單核細胞中,紅細胞系基因表達明顯上調(diào),尤其是不成熟的胚胎和胎兒期的紅系基因上調(diào),可能是由于低氧等原因誘發(fā)的表達上調(diào)。有研究表明,紅細胞系基因的表達水平與IPAH的血流動力學(xué)指標密切相關(guān),包括平均右心房壓、心臟指數(shù)、肺血管阻力指數(shù)和肺動脈血氧飽和度[3]。在未來研究中可進一步探究上述基因與IPAH的嚴重程度和預(yù)后的相關(guān)性,探究其作為生物標志物的價值[3, 12]。
在IPAH的低表達基因中,發(fā)現(xiàn)JUNB、JUN、FOSB、NFKBIA為樞紐基因,富集分析發(fā)現(xiàn)上述4個基因主要參與轉(zhuǎn)錄因子結(jié)合、對激素刺激反應(yīng)、對cAMP反應(yīng)、對鈣離子反應(yīng)和對機械刺激反應(yīng)等生物學(xué)過程。Diana等研究發(fā)現(xiàn)JUN參與肺動脈纖維化過程[13];Rothman等研究發(fā)現(xiàn)JUNB參與肺動脈平滑肌細胞的肥大和增生,但其具體機制仍未有研究[13-15]。JUNB、JUN和FOSB基因構(gòu)成AP-1轉(zhuǎn)錄因子的亞基[16]。AP-1轉(zhuǎn)錄復(fù)合體幾乎參與所有細胞的生理過程,并已發(fā)現(xiàn)在多種疾病中發(fā)揮重要的作用。Sanjiv 等研究發(fā)現(xiàn)JUNB、JUN和FOSB組成的AP-1轉(zhuǎn)錄因子可能是肺血管內(nèi)皮細胞一氧化氮合成酶的重要調(diào)節(jié)因子[17]。一氧化氮(NO)可促進環(huán)磷鳥苷酸(cGMP)擴張肺動脈,針對NO-cGMP途徑的藥物(如西地那非、他達拉非、利奧西瓜等)是目前治療IPAH的重要靶向藥物[1, 18]。在本研究中,IPAH患者JUNB、JUN和FOSB基因表達明顯降低,進一步提示IPAH患者的AP-1活性降低可能參與肺動脈高壓的病理過程。因此,研究JUNB、JUN和FOSB基因的表達和調(diào)控機制,其潛在價值包括鑒別診斷、靶向藥物開發(fā)和預(yù)后評估等。在未來的研究中,體外進一步驗證AP-1轉(zhuǎn)錄因子與一氧化氮合成酶、細胞一氧化氮水平的關(guān)系可能是重點研究方向。
在本數(shù)據(jù)集的原始研究中,僅橫向分析IPAH組、SSc-PAH組、SSc-PH-ILD組與對照組的差異表達基因。系統(tǒng)性硬化(SSc)是一種累及多系統(tǒng)的自身免疫性結(jié)締組織病,主要以皮膚硬化和內(nèi)臟器官纖維化為特征[19]。肺動脈高壓在系統(tǒng)性硬化病患者中的發(fā)生率可達5-12%,嚴重影響SSc患者的生活質(zhì)量及生存期限[19]。SSc-PAH的發(fā)病機制復(fù)雜,臨床治療無統(tǒng)一規(guī)范[19]。SSc-PAH治療需使用糖皮質(zhì)激素及免疫抑制劑,而針對肺動脈高壓的靶向治療的研究較少,尤其是在基因水平分析SSc-PAH與IPAH的不同靶向藥物選擇的研究極少。因此,本研究在原始研究的基礎(chǔ)上,進一步比較IPAH組與SSc-PAH組的差異表達基因,進一步探討IPAH與其他類型肺動脈高壓的基因表達差異,為不同病因肺動脈高壓的精準化治療提供基因水平的依據(jù)。
與SSc-PAH組相比,發(fā)現(xiàn)RBPMS2基因在IPAH組中表達上調(diào),RBPMS2是RNA結(jié)合蛋白,主要參與消化平滑肌細胞的發(fā)育和去分化,與肺動脈高壓和SSc的關(guān)系尚不明確,可作為候選基因進一步探索其在不同類型肺動脈高壓中的作用[20]。而在下調(diào)基因中OAS2、OAS3、IFI6和IFITM3共4個基因作為樞紐基因,主要參與免疫應(yīng)答,其中OAS2、OAS3和IFI6已被證實與SSc的發(fā)病和進展相關(guān)[21]。SSc作為一種自身免疫性疾病,免疫反應(yīng)和炎癥反應(yīng)在疾病的發(fā)生過程中扮演者更重要的角色。對于診斷困難的病例,OAS2、OAS3和IFI6可能有助于IPAH與SSc-PAH的鑒別診斷。與SSc-PAH-ILD組相比,下調(diào)基因中S100A12、CSF3R、FPR1、C5AR1和FPR2共5個基因為樞紐基因,主要參與炎癥反應(yīng)、細胞趨化等生物學(xué)過程,現(xiàn)有研究提示上述基因與SSc密切相關(guān)[22-23]。
本研究主要利用生物信息學(xué)手段,在轉(zhuǎn)錄組水平探討IPAH的基因表達情況,為鑒別診斷、靶向藥物篩選、預(yù)后評估等方便提供信息。通過分析差異表達基因輔助靶向藥物的篩選,目前已有成功的案例。例如,研究發(fā)現(xiàn)BMPR2基因和BMPR-II信號通路的異??蓪?dǎo)致BMP和TGF-β信號失衡,參與肺動脈高壓的進展。近期新英格蘭雜志發(fā)表的論文表明,Sotatercept作為TGF-β的選擇性配體陷阱,可重新平衡BMP信號通路而降低肺血管阻力[18]。Sotatercept的成功篩選,提示針對IPAH的差異表達基因的進行干預(yù)是可行的。因此,本論文中所篩選的基因亦可作為潛在的靶點,輔助篩選靶向藥物。然而,本研究不足在于僅依據(jù)基因芯片數(shù)據(jù)進行分析,缺乏進一步臨床樣本分析以驗證相關(guān)結(jié)論的可靠性,未來仍需進一步研究和探討。