張汝朋,呂雷鋒,張 晨,柏傳毅,王坤正,黨曉謙
(西安交通大學(xué)第二附屬醫(yī)院骨一科,西安 710004)
橫紋肌肉瘤(rhabdomyosarcoma,RMS)是兒童最常見的顱外實(shí)體瘤之一,也是兒童和青少年最常見的侵襲性軟組織肉瘤,其預(yù)后較差[1]。腺泡狀RMS(alveolar RMS,ARMS)是RMS的一種亞型,起源于間充質(zhì)細(xì)胞,其在形態(tài)學(xué)上與肺組織的腺泡相似,故稱為ARMS。 越來越多的證據(jù)表明,PAX3、FKHR、TAZ和PPP2R1A等基因的異常表達(dá)和突變參與了ARMS的發(fā)生和進(jìn)展,以及相關(guān)抑癌基因的功能缺失和突變[2-3]。然而,由于在疾病早期缺乏有效的診治方法,ARMS的病死率仍然很高。因此,了解ARMS發(fā)生、增殖和復(fù)發(fā)的確切分子機(jī)制,從而制訂有效的診斷和治療策略至關(guān)重要。在過去的幾十年里,芯片與測(cè)序技術(shù)和生物信息學(xué)分析被廣泛用于篩選基因組水平的基因改變,這有助于鑒定與ARMS的癌變和進(jìn)展有關(guān)的差異表達(dá)基因(differentially expressed genes,DEGs)。本研究從基因表達(dá)合集(gene expression omnibus,GEO)中下載并分析ARMS基因表達(dá)分析數(shù)據(jù)集,得到ARMS組織與正常組織之間的DEGs。隨后,本課題組進(jìn)行了基因本體論(gene ontology,GO)、京都(日本)基因與基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG)通路富集分析和蛋白-蛋白相互作用(protein-protein interaction network,PPI)網(wǎng)絡(luò)分析,以幫助了解致癌和促進(jìn)腫瘤發(fā)展相關(guān)基因的分子機(jī)制。
1.1材料 ARMS的基因芯片數(shù)據(jù)GSE2787從公共數(shù)據(jù)庫GEO查找并下載(https://www.ncbi.nlm.nih.gov/geo/)。以Alveolar Rhabdomyosarcoma為數(shù)據(jù)檢索關(guān)鍵詞,研究類型為Expression profiling by array,限制種屬為 Homo sapiens,是1組基于Human Array 2.0芯片平臺(tái)GPL2011的數(shù)據(jù)組。此芯片共包含有14組ARMS腫瘤與正常對(duì)照樣本。
1.2方法
1.2.1數(shù)據(jù)的提取、處理及差異表達(dá)基因分析 基因表達(dá)譜的原始數(shù)據(jù)集利用R語言的affy包進(jìn)行處理,rma包進(jìn)行標(biāo)準(zhǔn)化,limma包進(jìn)行DEGs分析,篩選出ARMS與人類胎兒骨骼肌對(duì)照組之間的DEGs。DEGs需同時(shí)滿足以下篩選條件:(1)采用t檢驗(yàn),定義P<0.01;(2) log2FC≤-1或log2FC≥1,F(xiàn)C表示DEGs差異倍數(shù)(fold change)。
1.2.2差異表達(dá)基因的GO功能富集分析 利用注釋、可視與集成探索的數(shù)據(jù)庫(Database for Annotation,Visualization and Integrated Discovery,DAVID 6.8)在線分析軟件對(duì)DEGs進(jìn)行GO分析,以P<0.01作為篩選條件。
1.2.3DEGs編碼蛋白相互作用網(wǎng)絡(luò)的構(gòu)建及模塊分析 采用STRING在線數(shù)據(jù)庫,將參與GO功能富集的DEGs所編碼的蛋白進(jìn)行PPI網(wǎng)絡(luò)分析。利用Cytoscape軟件的插件MCODE對(duì)PPI進(jìn)行模塊分析,以MCODE分?jǐn)?shù)大于5分作為顯著性模塊的篩選標(biāo)準(zhǔn),并且利用DAVID在線分析工具對(duì)篩選出模塊中的關(guān)鍵基因進(jìn)行功能和通路分析。
1.2.4主要觀察指標(biāo) 觀察經(jīng)Cytoscape篩選出PPI網(wǎng)絡(luò)中關(guān)鍵基因的功能與其所在信號(hào)通路。
2.1DEGs的篩選結(jié)果 利用R分析工具,以P<0.01,log2FC≤-1或log2FC≥1為篩選條件對(duì)DEGs進(jìn)行篩選。 GSE2787數(shù)據(jù)集共篩選出DEGs 867個(gè),其中表達(dá)上調(diào)基因737個(gè),表達(dá)下調(diào)基因130個(gè)。
2.2DEGs的GO分析結(jié)果 通過GO功能基因富集分析,有45個(gè)基因富集分析結(jié)果呈顯著性(P<0.01,F(xiàn)DR<0.01)。依P值列出最小3條,DEGs主要涉及肌原纖維、肌小節(jié)、收縮纖維、肌肉收縮、橫紋肌薄絲、肌肉系統(tǒng)進(jìn)程等功能類別,見表1。
2.3DEGs的PPI分析 為闡釋涉及ARMS的DEGs相關(guān)分子機(jī)制,使用STRING在線數(shù)據(jù)庫構(gòu)建了PPI,PPI可視化圖用Cytoscape軟件繪制。PPI網(wǎng)絡(luò)由752個(gè)節(jié)點(diǎn)和5 158個(gè)交互組成。PPI中交互最密集區(qū)域(圖1)中包含35個(gè)中心節(jié)點(diǎn)蛋白,依次為:CSTF3、CWC25、DDX5、DHX9、ELAVL1、HNRNPA2B1、HNRNPA3、HNRNPD、HNRNPK、LSM2、LSM3、LSM7、NAA38、NCBP1、NHP2L1、PABPN1、POLR2G、POLR2I、POLR2J、PRCC、PRPF19、PRPF3、RBM5、RBM8A、SF3A3、SNRPB、SNRPD2、SNRPE、SNRPG、SRRM1、SRSF11、SRSF3、SRSF5、SRSF9、TRA2B。
2.4關(guān)鍵DEGs的GO分析與KEGG信號(hào)通路分析結(jié)果 通過GO功能基因富集分析,35個(gè)DEGs有21個(gè)富集分析呈顯著性(P<0.01,F(xiàn)DR<0.01)和1條信號(hào)通路分析結(jié)果呈顯著性(P<0.01,F(xiàn)DR<0.01),分析結(jié)果見表2。DEGs主要涉及RNA拼接、RNA代謝過程、腺苷酯交換反應(yīng)RNA剪接等生物學(xué)過程,涉及核糖核蛋白復(fù)合體、剪接體、核內(nèi)腔等細(xì)胞組件,涉及RNA結(jié)合等分子功能及剪接體信號(hào)通路。
表1 DEGs的GO功能分析結(jié)果(依P值取最小3個(gè))
BP:生物學(xué)過程;CC:細(xì)胞組分;MF:分子功能
表2 關(guān)鍵DEGs的GO功能分析結(jié)果與KEGG信號(hào)通路分析結(jié)果(依P值取最小3個(gè))
BP:生物學(xué)過程;CC:細(xì)胞組分;MF:分子功能;PW:信號(hào)通路;hsa:人
圖1 關(guān)鍵差異基因構(gòu)建的蛋白互作網(wǎng)絡(luò)圖
1978年,林華安博士結(jié)合計(jì)算機(jī)科學(xué)與生物學(xué),開創(chuàng)了生物信息學(xué)的新交叉領(lǐng)域[4]。隨著測(cè)序技術(shù)的不斷發(fā)展,測(cè)序數(shù)據(jù)呈現(xiàn)爆發(fā)式增長(zhǎng),信息的管理和分析成為限制測(cè)序數(shù)據(jù)使用的關(guān)鍵問題,生物信息學(xué)技術(shù)應(yīng)運(yùn)而生且實(shí)現(xiàn)快速發(fā)展。
本研究從GEO數(shù)據(jù)庫下載ARMS的基因芯片數(shù)據(jù)GSE2787,其中包括14對(duì)ARMS腫瘤與正常對(duì)照樣本,經(jīng)數(shù)據(jù)整理、分析,按P<0.01,log2FC≤-1或log2FC≥1為篩選條件對(duì)DEGs進(jìn)行篩選,共篩選出867個(gè)DEGs,其中上調(diào)737個(gè),下調(diào)130個(gè)。構(gòu)建PPI闡釋涉及ARMS的DEGs分子機(jī)制,共得到CSTF3、CWC25、DDX5等35個(gè)中心節(jié)點(diǎn)蛋白,提示相應(yīng)基因可能是與ARMS發(fā)生、發(fā)展密切相關(guān)的關(guān)鍵基因。對(duì)關(guān)鍵DEGs進(jìn)行GO分析與KEGG信號(hào)通路分析,提示DEGs主要涉及RNA拼接、RNA代謝過程、腺苷酯交換反應(yīng)RNA剪接等生物學(xué)過程,涉及核糖核蛋白復(fù)合體、剪接體、核內(nèi)腔等細(xì)胞組件,涉及RNA結(jié)合等分子功能及剪接體信號(hào)通路。
與ARMS相關(guān)的功能基因研究已經(jīng)有較多且深入的文獻(xiàn)報(bào)道。有研究發(fā)現(xiàn)70%~80%的ARMS中存在特異性染色體易位t(2;13)(q35;q14)和t(1;13)(p36;q14),形成的融合基因PAX3/7-FKHR可以抵制腫瘤細(xì)胞凋亡,促使增殖,對(duì)于ARMS的發(fā)生機(jī)制研究、診斷、靶向治療、預(yù)后判斷等都具有重要意義[5-7]。有文獻(xiàn)報(bào)道PAX3/FOXO1融合負(fù)調(diào)控的PPP2R1A促進(jìn)PAX3/FOXO1陽性ARMS的侵襲行為[3]。染色質(zhì)域解旋酶DNA結(jié)合蛋白4(CHD4)結(jié)合到PAX3-FOXO1靶基因的調(diào)控區(qū)域,CHD4的缺失降低了融合陽性細(xì)胞的生存能力,但未降低融合陰性細(xì)胞的生存能力,導(dǎo)致了體內(nèi)融合陽性異種移植瘤的特異性回歸,是PAX3-FOXO1活性的關(guān)鍵核心調(diào)控因子[8]。卷曲相關(guān)蛋白SFRP3可抑制ARMS細(xì)胞的生長(zhǎng),減少其增殖,同時(shí)伴有G1阻滯和p21的誘導(dǎo),誘導(dǎo)細(xì)胞凋亡,抑制SFRP3除了增加肌源性分化和連環(huán)蛋白信號(hào)外,還將ARMS的生長(zhǎng)和質(zhì)量降低了3倍以上[9]。組蛋白乙酰轉(zhuǎn)移酶P/CAF(KAT2B)在ARMS患者的原發(fā)性腫瘤中過表達(dá),但是在融合陽性的ARMS細(xì)胞系中,P/CAF乙?;⒎€(wěn)定PAX3-FOXO1,沉默P/CAF,或?qū)ζ湟阴^D(zhuǎn)移酶活性的藥理學(xué)抑制,在移植瘤模型中下調(diào)PAX3-FOXO1水平,同時(shí)減少增殖和腫瘤負(fù)擔(dān)[10]。然而,Sphingosine在PAX3-FKHR陽性ARMS細(xì)胞中,通過MYCN下調(diào)獨(dú)立于TP53突變狀態(tài),發(fā)揮了抗增殖和促凋亡作用[11]。轉(zhuǎn)錄因子SNAIL表達(dá)在ARMS中升高,表現(xiàn)為肌原性分化程度低、侵襲性強(qiáng),SNAIL水平與MYF5表達(dá)呈負(fù)相關(guān),沉默SMAIL使MYF5重新表達(dá)和MYOD經(jīng)典結(jié)合,促進(jìn)ARMS細(xì)胞的肌原性分化,提示SNAIL是一種重要的肌源性分化調(diào)節(jié)劑[12]。TAZ抑制ARMS細(xì)胞增殖,誘導(dǎo)凋亡,支持肌原性分化,降低ARMS細(xì)胞活性,TAZ缺陷的ARMS細(xì)胞在細(xì)胞周期的G2-M期富集,提示TAZ是ARMS發(fā)生的致瘤因子[2]。GSK3β抑制或外源性表達(dá)的S160/164A突變肌原蛋白減少了RH30細(xì)胞在集落形成實(shí)驗(yàn)中的自主錨定生長(zhǎng),提示GSK3β抑制了肌源級(jí)聯(lián)的關(guān)鍵調(diào)控步驟,導(dǎo)致ARMS未分化、增殖表型[13]。目前ARMS相關(guān)功能基因研究多關(guān)注于融合基因及腫瘤的肌原分化,與本研究通過生物信息學(xué)分析預(yù)測(cè)所得關(guān)鍵DEGs的肌肉收縮、核糖核蛋白復(fù)雜裝配、大分子復(fù)雜亞基組織、單核苷酸突變、剪接體等功能類別相符。但是對(duì)本研究預(yù)測(cè)的功能相關(guān)可能性較高的RNA拼接、剪接、結(jié)合等功能類別研究較少,提示可以在將來研究中考慮RNA功能尤其是RNA拼接、剪接、結(jié)合等功能類別在ARMS發(fā)生、發(fā)展中的作用與相關(guān)機(jī)制。
與ARMS相關(guān)的信號(hào)通路研究報(bào)道卻較少。有研究表明肝細(xì)胞生長(zhǎng)因子(HGF)刺激不能促進(jìn)ARMS細(xì)胞系的增殖,HGF刺激細(xì)胞的活力不是被ERK1 siRNA抑制,而是被ERK2 siRNA抑制,提示HGF/MET信號(hào)主要通過ERK2信號(hào)促進(jìn)ARMS細(xì)胞的運(yùn)動(dòng)[14-15]。藥物對(duì)NF-κB活性的抑制導(dǎo)致許多ARMS腫瘤培養(yǎng)物的細(xì)胞增殖減少;然而,用ARMS腫瘤細(xì)胞進(jìn)行原位同種異體移植的小鼠在使用NF-κB抑制劑時(shí)腫瘤生長(zhǎng)與對(duì)照組相比沒有差異。當(dāng)與NF-κB抑制劑聯(lián)合使用時(shí),navitoclax在減少人類和IKKbeta野生型小鼠ARMS細(xì)胞的生長(zhǎng)方面具有協(xié)同作用,提示僅NF-κB的滅活可能不足以減少腫瘤的生長(zhǎng),但如果與另一種靶向治療結(jié)合使用,可能具有益處[16]。本研究所預(yù)測(cè)的信號(hào)通路剪接體(hsa03040:Spliceosome)信號(hào)通路目前尚未有在ARMS中的研究報(bào)道,提示在將來進(jìn)行ARMS發(fā)生與發(fā)展研究時(shí)可以考慮剪接體信號(hào)通路是否發(fā)揮作用及相關(guān)機(jī)制。
綜上所述,本研究旨在識(shí)別可能參與ARMS發(fā)生或進(jìn)展的DEGs。共鑒定867個(gè)DEGs和35個(gè)關(guān)鍵DEGs,可作為診斷ARMS的生物標(biāo)志物的參考范圍。然而,需要進(jìn)一步研究和闡明這些基因在ARMS中的生物學(xué)功能。