徐 珊,張海寶, 種 岳,田娟華,穆麗君,賀大林,杜岳峰
(1.西安交通大學第一附屬醫(yī)院泌尿外科,陜西西安 710061;2.西安交通大學環(huán)境和疾病相關基因教育部重點實驗室,陜西西安 710061)
腎細胞癌(renal cell carcinoma,RCC)是泌尿系常見腫瘤,占成人惡性腫瘤的3%,其中以透明細胞型RCC 為主,約占 85%~90%,發(fā)病率和死亡率逐年增加[1-3]。早期 RCC 的治療以外科手術切除為主,尤其是近年來以腹腔鏡為代表的微創(chuàng)手術在我國廣泛開展,為早期 RCC 患者帶來了希望。但遺憾的是,術后仍有30%患者很快出現腫瘤復發(fā)或遠處轉移,還有一部分患者在首次就診時腫瘤已發(fā)生遠處轉移[1-3]。目前,以酪氨酸激酶抑制劑(舒尼替尼、索拉非尼)和mTOR抑制劑(替西羅莫司、依維莫司)等為代表的小分子靶向藥物是轉移性腎癌(metastatic RCC,mRCC)的一線藥物,但是mRCC對臨床放、化療以及免疫治療高度耐受,臨床預后很差,約50%患者的生存期<1年,且5年生存率只有10%[4-5]。雖然大多數研究證明希佩爾-林道蛋白(von hippel-lindau,VHL)-低氧誘導因子(hypoxia-inducible factors,HIFs)信號通路激活是腎癌發(fā)生發(fā)展以致轉移的主要原因[6-8],但是YOUNG等[9]對比研究了177名腎癌患者,發(fā)現VHL突變以及缺失與患者預后并無關系,所以針對VHL-HIFs信號通路之外的機制研究,尋求腎癌治療的新靶點,開創(chuàng)腎癌治療的新策略,仍是必要闡明的機制研究。
傳統(tǒng)“一種疾病一個基因”的研究模式不能從多層次多基因協同模式下了解疾病的發(fā)生和發(fā)展,高通量測序和基因表達芯片技術相結合可獲得疾病基因組中所有基因的表達水平[10-11]。研究者利用高通量數據,采用基因功能富集分析,可全面而系統(tǒng)的闡明疾病發(fā)生或發(fā)展過程中起關鍵作用的信號通路,從而可揭示疾病的基本分子機制[11-12]。本研究從基因表達綜合數據庫(gene expression omnibus,GEO)下載mRCC基因表達譜(GSE47352),該研究共收集5名未轉移RCC患者和4名mRCC患者,提取患者腫瘤組織獲取基因表達譜,利用現代生物學信息分析工具,對未轉移RCC患者和mRCC患者進行差異表達基因富集分析,以期了解腎癌發(fā)生轉移的分子機制以及關鍵的生物學信號通路,為腎癌治療尋找新靶點。
1.1基因芯片數據腎癌轉移芯片數據GSE47352從GEO數據庫官方網站下載,基因芯片數據處理見文獻[13]。
1.2方法
1.2.1基因芯片數據提取 使用GEO數據庫官方網站GEO2R在線分析軟件,RCC患者分為兩組,非轉移組(5位)和轉移組(4位),提取非轉移組和轉移組顯著表達差異的前250位基因(Top250)信息,包括:基因符號基因名(Gene.symbol)、基因標題(Gene.title)、P值(P.Value)、調整后P值(adj.P.Val)和差異倍數(logFC)等,同時刪去不確定的基因檢測結果。
1.2.2基因功能富集分析 使用Omicsbean(http:∥www.omicsbean.com:88∥)數據分析系統(tǒng)對GSE47352 Top250基因進行基因本體(gene ontology,GO)富集(生物過程、細胞組成、分子功能),京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG)富集以及蛋白質-蛋白質互作用(protein-protein interaction,PPI)模型構建,該軟件由金弗康生物科技(上海)有限公司開發(fā)研制和維護。
1.2.3Venn分析腎癌轉移關鍵基因 結合作者信號傳遞網絡(signal-net)分析、差異基因P值、差異基因變化幅度以及介數中心性(betweenness centrality)篩選得出的腎癌轉移的6位關鍵基因,與Top250基因結合分析,篩選出腎癌轉移的核心基因。
2.1分子功能富集分析本研究應用GO分子功能富集分析對未轉移RCC患者和mRCC患者Top250基因進行分析。結果顯示,在納入富集分析的基因中,值得注意的是有36位基因產物參與核酸結合,其中有轉錄因子SOX21、內皮PAS1蛋白(endothelial PAS domain-containing protein 1,EPAS1)、人腫瘤蛋白63(tumor protein 63,TP63)、JUN以及TEAD2等重要腫瘤細胞增殖、耐藥以及血管生成等信號通路調控因子,35位基因產物與細胞內陽離子結合,調控細胞生理過程,有12位基因產物參與調控RNA聚合酶Ⅱ轉錄因子活性(圖1)。
圖1腎癌轉移Top250基因分子功能富集分析
2.2細胞組成富集分析本研究擬通過細胞組成成份的富集分析,進一步探知在腎癌發(fā)生轉移的病程進程中,細胞哪部分組成發(fā)生最顯著的變化,為藥物研究提供依據。Top250基因細胞組成富集分析發(fā)現,在腎癌轉移疾病進程中有86位基因產物,約占細胞器相關基因的60%,參與細胞內細胞器的功能調節(jié),如腫瘤壞死因子(tumor necrosis factor,TNF)、ADAM8和RAB25等;39位基因產物,參與細胞囊泡儲存以及運輸的生命活動;另外我們也發(fā)現,有9位基因產物是細胞外基質蛋白粘連蛋白α4鏈(laminin alpha4,LAMA4)、基質金屬蛋白酶28(matrix metallo peptidase,MMP28)、帶有血小板凝血酶敏感蛋白結構域的解聚素與金屬蛋白酶-3(a disintegrin-like and metalloprotease domain with thrombospondin type I motifs-Like 3,ADAMTSL3)、LAMA1等。
圖2腎癌轉移Top250基因集細胞組成富集分析
2.3生物學途徑富集分析本研究Top250基因生物學途徑富集分析結果發(fā)現,Top250基因中基因富集較多或者P值較小富集通路主要為細胞生長發(fā)育、信號轉導、細胞化學應激反應等,其中SOX21、TNF、白細胞介素-2(interleukin2,IL2)、EPAS1、TP63、JUN等參與多條信號通路調控(圖3)。直接與腎癌侵襲轉移相關的富集通路有血管形態(tài)、內皮細胞生長,細胞分化以及小管形成等信號通路。
圖3腎癌轉移Top250基因集生物學途徑富集分析
2.4KEGGpathway富集分析KEGG是一個整合了生物基因組以及生物系統(tǒng)的生物學信息數據庫,聯合基因芯片技術能夠找出疾病發(fā)生過程中起決定性的信號通路,為疾病研究方向提供指引。本研究通過分析轉移和未轉移腎癌患者的差異表達基因,利用KEGG從更高生物層次和更復雜的腫瘤細胞行為中得到腎癌轉移最為顯著區(qū)別的細胞生化過程。Top250基因進行Pathway通路富集分析發(fā)現,轉移組和未轉移患者Top250基因主要集中在人類疾病相關通路上(圖4),包括:腫瘤、腎癌、炎癥、肺癌、腫瘤微小RNA(MicroRNA)等;轉移患者和未轉移患者絲裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)以及兩面神激酶(janus kinase,JAK)信號轉導子和轉錄激活子(signal transducer and activator of transcription,STAT)信號通路變化顯著;Top250基因富集結果也顯示轉移患者和未轉移患者在細胞粘附生物學行為發(fā)生顯著變化。
圖4腎癌轉移Top250基因集KEGGpathway富集分析
2.5蛋白互作網絡構建對Top250基因產物蛋白質進行PPI網絡構建,分析網絡中的hub蛋白,尋找與腎癌轉移相關的關鍵基因。本研究PPI結果顯示與腎癌轉移主要相關通路是腎細胞癌通路,囊括了6種基因產物:非受體型蛋白酪氨酸磷酸酶11(protein-tyrosine phosphatase,nonreceptor-type 11,PTPN11)、內皮PAS1蛋白(endothelial PAS domain protein 1,EPAS1),又稱缺氧誘導因子-2(hypoxia induced factor-2,HIF-2)、 Ras/Rho 鳥苷酸交換因子(SOS Ras/Rho guanine nucleotide exchange factor 2,SOS2)、轉移生長因子β2 (transforming growth factor beta 2,TGFB2)、E26轉錄因子1(E26 transformation specific-1,ETSl)和JUN(圖5);同時結果還顯示轉錄因子EPAS1以及JUN在腎癌發(fā)生發(fā)展中起重要作用,JUN有可能在腎癌發(fā)展中具有至關重要的作用。
2.6腎癌轉移核心基因篩選為了進一步篩選腎癌轉移的關鍵基因,我們聯合Top250基因,signal-net分析結果,轉移和未轉移患者差異表達基因的P值,介數中心性betweenness centrality和差異基因變化幅度5個篩選條件得出LAMA4和JUN這兩個基因(圖6),推斷LAMA4和JUN可能是潛在的腎癌轉移的核心基因。
圖5腎癌轉移Top250基因集KEGG信號通路分析
圖6腎癌轉移關鍵基因Venn圖分析
腎癌轉移,與腎癌細胞本身惡性度有很大關系,目前關于腎癌細胞轉移分子機制研究還不明晰。本研究通過軟件分析,從基因叢的水平而非單基因水平探尋腎癌轉移的關鍵基因。Top250 GO分析、KEGG pathway富集以及PPI等分析方法得出轉移與未轉移腎癌細胞發(fā)生的顯著變化是基因表達調控、細胞生長、細胞應激、細胞粘附特性、血管生成以及細胞向外信息傳遞等生物學功能。
血管生成是腫瘤細胞自我生存以及轉移的重要條件[14],在我們的富集分析結果中大部分Top250基因參與腎癌血管生成,分泌促內皮細胞生長因子促進內皮細胞生長以及小管形成等細胞通路上,包括促進血管生成的重要轉錄因子Hif 2α[6-7],該結果也和目前腎癌靶向藥物設計靶點相符合。腫瘤細胞發(fā)生轉移需要改變細胞外基質粘附和降解,且研究證明腫瘤細胞發(fā)生轉移首先需要沖破基底膜,之后再轉移到別處組織,所以腫瘤細胞外基質改變是腫瘤細胞侵襲遷移的重要改變。在我們的富集分析結果中有9個基因產物是細胞外基質蛋白,其中有MMP家族MMP28,以及LAMA家族LAMA4和LAMA1,MMP和LAMA家族都是細胞外基質的重要組成部分,與腫瘤細胞轉移密切相關。近幾年研究發(fā)現,外泌體是腫瘤細胞靶向轉移的重要信號傳遞者,腫瘤細胞可通過釋放外泌體抑制機體免疫、促進腫瘤細胞生長、促進內皮細胞形成血管、同時攜帶特異性膜蛋白,到達特定器官,形成轉移轉“龕”,等待腫瘤細胞形成轉移灶[15-17]。在我們的研究結果中有39位基因都與細胞外囊泡以及囊泡運輸有關,其中RAB25和TNF等報道在肺癌、卵巢癌以及胃癌等多種腫瘤中具有促進腫瘤細胞增殖、侵襲以及轉移作用[18-20]。研究結果還揭示KEGG pathway富集分析和PPI結果顯示TNF、EPAS1、TP63、JUN等基因在腎癌轉移中可能具有至關重要的作用。
以上結果提示Top250中存在腎癌轉移的關鍵調控基因,為了進一步篩選出腎癌轉移的核心基因,本研究結合signal-net分析構建出的腎癌轉移關鍵基因,差異基因的改變倍數(大于2)、P值和betweenness centrality值綜合因素篩選出6個潛在的促進腎透明細胞癌轉移的基因產物:LAMA4、JUN、炭疽毒素受體(anthrax toxin receptor,ATR)、叉頭框蛋白O3a (forkhead box O3a,FOX03a)、 E26轉錄因子1(E26 transformation specific-1,ETSl)、山梨醇(Sorbin)和SH3結構域連接蛋白2 (sorbin and SH3 domain containing 2,SORBS2)[13],再與Top250結合分析,篩選得到兩個基因LAMA4和JUN,提示LAMA4和JUN極有可能是腎癌轉移的關鍵核心基因,該結果與PPI結果相互印證。
進一步,我們對LAMA4和JUN兩個基因產物在Pubmed數據庫上檢索相關信息及其生物學功能。LAMA4是層粘連蛋白8的功能亞基,而層粘連蛋白是重要的細胞外基質,在細胞支持、連接以及維持形態(tài)方面有重要作用,并且影響細胞粘附、生長、遷移以及信號傳遞等功能[21]。有研究者報道LAMA4可以調控MMPs家族,影響細胞基底膜,影響細胞侵襲遷移能力[22]。雖然目前關于LAMA4在腫瘤轉移中的作用研究較少,從整個基因組水平客觀分析結果提示我們LAMA4有可能在腎癌的轉移過程中發(fā)揮重要作用,后續(xù)我們會進一步驗證其在腎癌轉移中的生物學功能。JUN在基因名片網(Gene card)顯示又名c-Jun,是細胞內轉錄激活蛋白-1(activator protein-1,AP-1)二聚體的亞基[23]。AP-1是細胞應激應答(輻射、生長、壓力等)的一個重要因子,AP-1可調節(jié)基因的表達以應對細胞因子、生長因子、細菌和病毒感染以及壓力等,從而控制細胞的分化、增殖以及凋亡等,在多種腫瘤中均有報道,在腫瘤細胞轉移過程中發(fā)揮著重要作用[23-24],JUN有可能是腎癌轉移的重要轉錄因子。
本研究通過比對腎癌轉移患者和未轉移患者腫瘤組織Top250基因,運用多種生物信息學分析方法,結合篩查因素篩選得出JUN和LAMA4在腎癌轉移中具有重要的作用。在今后的研究中,筆者將在組織樣本中檢測LAMA4和JUN的表達,闡明和腎癌患者預后以及生存率的關系,以及在腎癌轉移中的生物學功能,為腎癌臨床治療提供依據。