李雪麗,曹彩霞,宋潔,馮文靜,鐘麗娜,楊學(xué)成
(青島大學(xué)附屬醫(yī)院,山東 青島 266003 1 內(nèi)分泌與代謝科; 2 老年醫(yī)學(xué)科; 3 泌尿外科)
作為繼發(fā)性高血壓常見原因之一的嗜鉻細(xì)胞瘤/副神經(jīng)節(jié)瘤(PCPG)是一種少見的神經(jīng)內(nèi)分泌腫瘤,國內(nèi)尚沒有確切的患病率統(tǒng)計[1]。臨床研究顯示,有15%~17%的PCPG可以發(fā)展為轉(zhuǎn)移性PCPG,而轉(zhuǎn)移性PCPG治療選擇有限,預(yù)后差,通常5年存活率不到50%[2];并且腫瘤轉(zhuǎn)移是導(dǎo)致病人死亡的主要原因[3]。世界衛(wèi)生組織已將PCPG歸類到有轉(zhuǎn)移可能的腫瘤類目中,而術(shù)前生化檢測和前期病理結(jié)果均難以判斷PCPG是否具有轉(zhuǎn)移性[4]。國內(nèi)外學(xué)者認(rèn)為,PCPG的發(fā)生發(fā)展在很大程度上是受基因組的改變驅(qū)動,如SDHx和VHL基因的改變導(dǎo)致三羧酸循環(huán)中斷,低氧相關(guān)因子表達增加[1,5];MAX、RET和TMEM127等抑癌基因激活促進腫瘤生長基因的蛋白翻譯[6-7]。PCPG具有較強的遺傳背景,目前已經(jīng)報道了20多個易感基因[8],約50%的病人存在胚系或體系基因突變[1]。目前常用腎上腺嗜鉻細(xì)胞瘤評分(PASS)和腎上腺嗜鉻細(xì)胞瘤及副神經(jīng)節(jié)瘤分級系統(tǒng)(GAPP)評估PCPG的惡性生物學(xué)特征[9]。但在個體病人中致病基因的改變差異較大,復(fù)發(fā)或轉(zhuǎn)移進展較慢,僅憑評分結(jié)果、總體生存期和無進展生存期,難以精準(zhǔn)地對病人的疾病進展進行評估。故迫切需要從宏觀角度捕捉可能與該病進展相關(guān)的基因變化,綜合相關(guān)基因的內(nèi)在機制判斷腫瘤的發(fā)生發(fā)展,為未來開展基因信息監(jiān)測、實現(xiàn)精準(zhǔn)干預(yù)提供研究基礎(chǔ)。
近年來,微陣列分析和測序技術(shù)已經(jīng)成為篩選致病基因,識別具有診斷、治療價值的生物標(biāo)志物的有效技術(shù),如LIN等[10]的研究通過微陣列芯片確定了KCNQ1和SCN2A是PCPG中的異常甲基化基因。生物信息學(xué)分析為高通量測序技術(shù)提供了快速有效的分析途徑,其與液相色譜-串聯(lián)質(zhì)譜結(jié)合分析發(fā)現(xiàn),COX4I2和PLAT蛋白與PCPG供血高度相關(guān)[11]。NCBI基因表達綜合數(shù)據(jù)庫(GEO)可以提供大量針對各種人類腫瘤的微陣列分析數(shù)據(jù)和下一代測序數(shù)據(jù),儲存了大量未被挖掘的差異表達基因(DEGs)。探究與PCPG相關(guān)的特異性DEGs及其可能參與的病理功能有助于更好地理解PCPG的進展。本研究基于GEO數(shù)據(jù)庫的微陣列芯片數(shù)據(jù),通過生物信息學(xué)分析篩選核心DEGs并探討其可能的分子機制,以期為PCPG的發(fā)生發(fā)展提供新的研究視角。
通過GEO數(shù)據(jù)庫獲取PCPG基因微陣列芯片(GSE60458)數(shù)據(jù),其中共包含62 976個探針的初始數(shù)據(jù),來自于12例PCPG組織樣本(PCPG組,良性9例,惡性3例)和3例正常腎上腺髓質(zhì)組織樣本(Normal組)。并且通過GPL13607平臺(Agilent-028004 SurePrint G3 Human GE 8x60K Microarray)識別探針信號對應(yīng)的基因名稱。
利用在線NetworkAnalyst 3.0系統(tǒng),對微陣列芯片初始數(shù)據(jù)進行標(biāo)準(zhǔn)化和背景校正處理。使用該系統(tǒng)的Limma包對PCPG組和Normal組做層次聚類分析,以log2|Fold Change|>2且P<0.05的標(biāo)準(zhǔn)篩選DEGs,以熱圖顯示DEGs表達譜,以火山圖展示所有DEGs的顯著性差異。并以DEGs為變量進行主成分分析(PCA),觀察PCPG組和Normal組樣本的差異。
為探究DEGs可能參與的通路,將全部DEGs輸入KOBAS v3.0(KEGG Orthology Based Annotation System v3.0)線上數(shù)據(jù)平臺,進行在線GO(Gene Ontology)、KEGG(Kyoto Encyclopedia of Gene and Genomes)通路富集分析,以P<0.05和錯誤發(fā)現(xiàn)率(FDR)<0.05為基因富集通路有統(tǒng)計學(xué)意義。
使用STRING v11.0工具將表達差異最大的40個DEGs進行蛋白質(zhì)相互作用(PPI)網(wǎng)絡(luò)分析,將連接于模塊中的基因作為核心DEGs,并將PPI網(wǎng)絡(luò)可視化。
為驗證GSE60458微陣列芯片結(jié)果的準(zhǔn)確性,在GEPIA2平臺上TCGA和GTEx數(shù)據(jù)庫中獲取182例PCPG標(biāo)本(Tumor組)和3例正常對照標(biāo)本(Normal組),分析兩組核心DEGs的表達情況。使用Origin 2016軟件構(gòu)建生物信息學(xué)分析結(jié)果圖,采用雙側(cè)t檢驗統(tǒng)計組間的差異,以P<0.05為差異具有統(tǒng)計學(xué)意義。
PCA顯示,DEGs將兩組樣本從兩個主成分維度(PC1、PC2)完全分離,說明DEGs表達模式具有特異性,可用于完全區(qū)分PCPG組織和正常腎上腺組織。同時觀察到PCPG組9例良性腫瘤樣本和3例惡性腫瘤樣本未能完全分離,說明良惡性腫瘤組織DEGs表達模式的特異性差。見圖1。
分析GSE60458芯片中的所有基因的表達結(jié)果,DEGs共有1 903個(圖2),其中表達上調(diào)基因864個,下調(diào)基因1 039個(圖3)。表達上調(diào)DEGs前10位依次為EGR、SCRT2、C1QL1、SOHLH1、CD163L、lincRNA:chr5:1731、CHRNA4、TLX3、NR4A1和ENST0000031680,表達下調(diào)DEGs前10位依次為HSD3B1、HSD3B2、MRAP、AADAC、CYP11B2、GSTA5、LOC391081、CYP11B1、MGST1和KCNK2(圖4)。
紅色代表PCPG組12例樣本,包括9例良性腫瘤樣本和3例惡性腫瘤樣本,藍色代表Normal組3例樣本。
藍色為表達下調(diào)DEGs,紅色為表達上調(diào)DEGs,顏色越深表示DEGs的表達量越高或越低。
藍色為顯著下調(diào)DEGs,紅色為顯著上調(diào)DEGs,黑色為表達差異無統(tǒng)計學(xué)意義的基因。
GO富集分析結(jié)果顯示,DEGs富集于1 593條通路,DEGs富集度最大的5條通路分別為蛋白結(jié)合(Protein binding)、細(xì)胞質(zhì)膜(Plasma membrane)、胞外區(qū)(Extracellular region)、細(xì)胞膜的有機構(gòu)成(Integral component of membrane)和細(xì)胞外間隙(Extracellular space)。見圖5。KEGG通路富集于145條通路,其中富集度最大的5條通路分別為代謝途徑(Metabolic pathways)、細(xì)胞因子-細(xì)胞因子受體相互作用(Cytokine-cytokine receptor interaction)、病毒蛋白與細(xì)胞因子及細(xì)胞因子受體的相互作用(Viral protein interaction with cytokine and cytokine receptor)、癌癥通路(Pathways in cancer)和藥物代謝-細(xì)胞色素P450(Drug metabolism-cytochrome P450)。見圖6。
藍色為表達下調(diào)DEGs,紅色為表達上調(diào)DEGs,顏色越深表示DEGs的表達量越高或越低。
氣泡大小表示富集的基因個數(shù)多少,顏色表示P值的大小。
本研究采用STRING v11.0工具軟件對表達差異最大的40個DEGs進行PPI網(wǎng)絡(luò)分析,并將PPI網(wǎng)絡(luò)可視化。PPI網(wǎng)絡(luò)分析結(jié)果顯示,CYP11A1、CYP11B1、CYP11B2、CYP17A1、HSD3B2、EGR4、STAR、SULT2A1、NR4A1和HSD3B1等10個基因位于緊密連接的模塊中,認(rèn)定為核心DEGs(圖7)。該模塊由10個節(jié)點和32條連接線組成,結(jié)合GO和KEGG富集分析結(jié)果,CYP11B1、CYP11B2、CYP11A1、CYP17A1、HSD3B1和HSD3B2基因參與甾類激素生物合成(Steroid hormone biosynthesis),CYP11B1、CYP11B2基因參與氧化還原過程(Oxidation-reduction process),CYP11B1、CYP11B2和HSD3B2基因共同參與鈣離子結(jié)合(Calcium ion binding),CYP11B1、HSD3B2基因以及HSD3B1基因參與代謝通路(Metabolic pathways),NR4A1基因參與MAPK信號通路(MAPK signaling pathway)。
利用TCGA和GTEx數(shù)據(jù)庫,對GSE60458芯片的分析結(jié)果進行驗證。與Normal組相比,Tumor組病人CYP11A1、CYP11B1、CYP11B2、CYP17A1、HSD3B2、STAR和SULT2A1等7個核心DEGs的表達水平顯著下調(diào)(P<0.05),與GSE60458數(shù)據(jù)集的結(jié)果相同;而HSD3B1、NR4A1和EGR4等3個核心DEGs表達水平無明顯變化,與GSE60458數(shù)據(jù)集的結(jié)果相似。見圖8。
氣泡大小表示富集的基因個數(shù)多少,顏色表示P值的大小。
節(jié)點代表DEGs的表達產(chǎn)物,連接線表示兩個節(jié)點參與同一個功能,連接線粗細(xì)表示置信度大小。
探究腫瘤組織和正常組織之間的差異是腫瘤研究的主要內(nèi)容。PCPG是少見的神經(jīng)內(nèi)分泌腫瘤,由于臨床數(shù)據(jù)及組織標(biāo)本難以大量獲得,這限制了科研人員對該病的探究。腫瘤基因微陣列芯片中包含了大量有潛在研究價值的信息,生物信息學(xué)的運用可以從宏觀角度對有潛在研究價值的基因進行篩選,進而加快研究進程。但隨著高通量技術(shù)的普及和大數(shù)據(jù)庫的發(fā)展,“數(shù)據(jù)泛濫”成為生物信息學(xué)分析的一個難點。而PCA可以將多維度數(shù)據(jù)有效地降維分析[12]。本研究對所有樣本進行了PCA,觀察到PCPG組和Normal組可以從兩個主成分維度完全分離,說明PCPG組織和正常腎上腺組織在基因表達模式上具有顯著的差異。而PCPG組9例良性腫瘤樣本和3例惡性腫瘤樣本則未能完全分離,提示PCPG良惡性組織基因表達模式差異較小。日本學(xué)者統(tǒng)計發(fā)現(xiàn),有60%的惡性PCPG最初被診斷為良性PCPG[4],本研究PCA結(jié)果也從側(cè)面驗證了這一事實。
本研究從GSE60458芯片數(shù)據(jù)集中共確定了1 903個DEGs,表明腫瘤的形成過程是一個涉及癌基因、抑癌基因和其他基因改變的復(fù)雜過程。DEGs通路富集分析進一步表明,DEGs主要參與了與腫瘤相關(guān)的生物學(xué)過程,如胞外外泌體、炎癥反應(yīng)、細(xì)胞因子-細(xì)胞因子受體相互作用、趨化因子信號、Ras信號通路以及MAPK信號通路等。有研究發(fā)現(xiàn),PCPG病人的循環(huán)外泌體中存在雙鏈DNA片段,且外泌體DNA片段與腫瘤細(xì)胞易感基因具有相同的突變[13];NRF2基因激活可以通過抑制氧化應(yīng)激和促進腫瘤炎癥來降低癌癥風(fēng)險[14];白細(xì)胞介素-33(IL-33)通過調(diào)節(jié)趨化因子,招募、激活固有免疫細(xì)胞,從而創(chuàng)造促腫瘤環(huán)境[15];在肺癌研究中,Treg細(xì)胞中IC(Immune checkpoint)分子表達水平升高,程序性死亡受體1(PD-1)表達增加,表現(xiàn)出強大的抑制活性[16]。近年來,PCPG病因相關(guān)基因的發(fā)現(xiàn)使轉(zhuǎn)移性PCPG的診斷和治療取得了重大進展,為了精準(zhǔn)地對疾病進展進行個體化基因信息監(jiān)測,還需要更為高效的分析技術(shù)。
由于篩選出的1 903個DEGs的信息眾多,為精確研究范圍,本研究通過STRING v11.0工具將表達差異最大的40個DEGs進行PPI網(wǎng)絡(luò)分析,結(jié)果顯示,10個核心DEGs存在著直接或間接地相互作用。表明核心基因表達水平的變化有可能干擾PCPG的發(fā)生和發(fā)展。通過TCGA和GTEx數(shù)據(jù)庫驗證10個核心基因表達水平,結(jié)果與GSE60458芯片結(jié)果一致。其中HSD3B1、NR4A1和EGR4基因的表達水平兩組間差異無統(tǒng)計學(xué)意義,可能是由于TCGA和GTEx數(shù)據(jù)庫中正常對照組納入的樣本數(shù)量有限,數(shù)據(jù)存在偏移,提示仍需收集腫瘤標(biāo)本和臨床數(shù)據(jù),進一步驗證分析結(jié)果的準(zhǔn)確性。
紅色為PCPG腫瘤組織(Tumor組,182例),灰色為正常腎上腺組織(Normal組,3例),*P<0.05。
本文富集分析結(jié)果顯示,CYP11B1、CYP11B2、CYP11A1、CYP17A1、HSD3B1、HSD3B2等基因共同參與甾類激素的生物合成。類固醇生成酶分為細(xì)胞色素P450和羥基類固醇脫氫酶/酮類固醇還原酶兩類,包括CYP11A1、CYP11B1、CYP11B2、HSD3B2、HSD11B1、HSD11B2等[17-18]。甾類激素生物合成是在多種酶和輔助因子的參與下,由膽固醇經(jīng)多步酶促反應(yīng)轉(zhuǎn)化為具有生物活性的甾類激素,涉及多種細(xì)胞的生理功能。膽固醇是免疫細(xì)胞膜的基本脂質(zhì)成分,可以通過T細(xì)胞獲得,并參與細(xì)胞激活、增殖、代謝等[19]。已有研究發(fā)現(xiàn),腫瘤膽固醇通過調(diào)節(jié)內(nèi)質(zhì)網(wǎng)應(yīng)激通路[20],或誘導(dǎo)CD8+T細(xì)胞功能衰竭[21],使抗腫瘤免疫失活;氧甾醇通過與核肝X受體(LXR)α和LXRβ相互作用,發(fā)揮內(nèi)源性脂質(zhì)代謝調(diào)節(jié)作用,招募促血管生成和免疫抑制的中性粒細(xì)胞[22],建立促腫瘤微環(huán)境;腺體外類固醇激素合成失調(diào)降低了免疫細(xì)胞自身的抗腫瘤能力[23]。腫瘤細(xì)胞可通過破壞免疫細(xì)胞功能,造成抗腫瘤免疫反應(yīng)鈍化,從而逃避免疫殺傷。此外,轉(zhuǎn)錄因子也可能參與抗腫瘤免疫。NR4A1基因位于12號染色體,有12個外顯子,編碼核轉(zhuǎn)錄因子。有文獻報道,NR4A1轉(zhuǎn)錄因子在耐受性T細(xì)胞中表達增加,缺失NR4A1則可降低T細(xì)胞的耐受性,增強對腫瘤的免疫力[24]。本研究芯片分析結(jié)果顯示,NR4A1表達上調(diào),通路富集顯示NR4A1參與MAPK信號通路,可能通過影響PCPG激酶信號通路[1],參與腫瘤的發(fā)生。
本研究分析報告了兩個在PCPG中鮮有研究的DEGs。SOHLH1基因位于9號染色體,其編碼蛋白具有轉(zhuǎn)錄因子的功能。LIU等[25]研究發(fā)現(xiàn),Sohlh1蛋白在膠質(zhì)母細(xì)胞瘤中表達下調(diào),且與膠質(zhì)母細(xì)胞瘤的惡性程度呈負(fù)相關(guān)。體外實驗進一步確定了Sohlh1通過抑制Wnt/β-catenin信號通路抑制膠質(zhì)母細(xì)胞瘤細(xì)胞的增殖、遷移和侵襲[25]。Wnt信號通路在PCPG中已有深入的研究,如CSDE1體細(xì)胞突變及MAML3的體細(xì)胞基因融合激活Wnt和Hedgehog信號通路[3],使PCPG表現(xiàn)為強侵襲性。SOHLH1基因表達上調(diào),可能參與PCPG的轉(zhuǎn)移,提示該基因可能成為腫瘤行為的預(yù)測因子。SCRT2基因編碼Scratch家族轉(zhuǎn)錄抑制因子2,位于20號染色體。研究發(fā)現(xiàn),Scratch1和Scratch2由黏附分子E-cadherin介導(dǎo),通過上皮-間充質(zhì)轉(zhuǎn)化機制,參與神經(jīng)上皮細(xì)胞向神經(jīng)元遷移或向中間神經(jīng)元祖細(xì)胞轉(zhuǎn)化[26]。但SCRT2在PCPG中的作用機制還有待進一步探究。
綜上所述,本研究篩選出的10個核心DEGs可能影響甾類激素的生物合成,參與調(diào)控PCPG的發(fā)生發(fā)展,這為預(yù)測PCPG的潛在生物標(biāo)志物提供了研究依據(jù)。