張永明,王一澎,馬飛
國家癌癥中心/中國醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)學(xué)院腫瘤醫(yī)院1教育處,2乳腺外科,3腫瘤內(nèi)科,北京100021
RNA剪接是指從DNA模版鏈轉(zhuǎn)錄出的初級(jí)轉(zhuǎn)錄本中去除內(nèi)含子,并將外顯子拼接在一起,產(chǎn)生成熟的信使RNA的過程。對(duì)于具有多個(gè)外顯子的基因而言,剪接過程產(chǎn)生了具有不同外顯子組成方式的信使RNA,并被翻譯成不同的蛋白產(chǎn)物,極大地豐富了基因組編碼蛋白的多樣性,對(duì)維持細(xì)胞的正常功能以及決定細(xì)胞和組織的特異性發(fā)揮著重要作用。RNA剪接過程調(diào)控紊亂與腫瘤及多種疾病有關(guān)。如在腫瘤的發(fā)生、發(fā)展過程中,腫瘤相關(guān)基因的調(diào)控序列在剪接位點(diǎn)常發(fā)生基因突變,從而影響基因的選擇性剪接過程。剪接復(fù)合體核心組分的蛋白表達(dá)異常影響了剪接體的正常功能,與腫瘤的進(jìn)展和轉(zhuǎn)移有關(guān)[1]。MYC癌蛋白是大多數(shù)人類腫瘤的主要驅(qū)動(dòng)因子,MYC可以結(jié)合到基因組中的活性調(diào)控元件上,廣泛擴(kuò)大基因表達(dá),導(dǎo)致細(xì)胞不受限制地生長(zhǎng)[2]。MYC開啟一組與剪接體組成元件相關(guān)的基因表達(dá),剪接相關(guān)基因?qū)YC驅(qū)動(dòng)腫瘤形成起到至關(guān)重要的作用[3-4]。本研究通過分析乳腺癌多組學(xué)數(shù)據(jù),鑒定MYC調(diào)控的剪接基因,并評(píng)價(jià)其潛在的預(yù)后價(jià)值,為深入研究MYC在乳腺癌中的作用機(jī)制,鑒定潛在的乳腺癌治療靶點(diǎn)提供理論依據(jù)。
利用癌癥和腫瘤基因圖譜(cancer genome atlas,TCGA)數(shù)據(jù)庫調(diào)取乳腺癌數(shù)據(jù)集BreastⅠnvasive Carcinoma(TCGA,Provisional)數(shù)據(jù),分析乳腺癌中與c-MYC共表達(dá)的基因;采用DAVⅠD(functional annotation bioinformatics microarray analysis)數(shù)據(jù)庫對(duì)c-MYC共表達(dá)的基因進(jìn)行功能富集分析;采用String蛋白數(shù)據(jù)庫分析剪接基因蛋白互作網(wǎng)絡(luò);利用TCGA數(shù)據(jù)庫調(diào)取BreastⅠnvasive Carcinoma(TCGA,Provisional)數(shù)據(jù),分析剪接基因在基因組水平上的突變、擴(kuò)增和缺失情況;Kaplan-Meier plotter數(shù)據(jù)庫分析乳腺癌中WDR77、GEMIN4、SNRPD1及其他剪接基因的表達(dá)與乳腺癌患者預(yù)后的關(guān)系。
采用Cluster 3.0和Java TreeView軟件繪制基因表達(dá)熱圖。
調(diào)取并分析TCGA數(shù)據(jù)庫中乳腺癌數(shù)據(jù)集Breast Ⅰnvasive Carcinoma(TCGA,Provisional)的1105例乳腺癌數(shù)據(jù),結(jié)果顯示:與c-MYC共表達(dá)相關(guān)的基因共有519個(gè)(Pearson相關(guān)系數(shù)≥0.3)。采用DAVⅠD數(shù)據(jù)庫對(duì)519個(gè)基因進(jìn)行功能聚類,結(jié)果顯示:與c-MYC共表達(dá)相關(guān)的基因顯著富集核糖體生物合成、細(xì)胞周期、染色體分離、RNA剪接、DNA結(jié)合調(diào)節(jié)等功能。(圖1)
圖1 c-MYC共表達(dá)基因的功能富集
功能富集結(jié)果顯示:與c-MYC共表達(dá)的基因中涉及RNA剪接的共有16個(gè),其中PPP2CA基因的表達(dá)與c-MYC的表達(dá)在乳腺癌中呈負(fù)相關(guān);其余15個(gè)基因的表達(dá)均與c-MYC的表達(dá)呈正相關(guān),即c-MYC表達(dá)的升高伴隨著15個(gè)剪接基因的表達(dá)升高的現(xiàn)象,提示在乳腺癌中c-MYC參與調(diào)節(jié)異常剪接基因的轉(zhuǎn)錄。(圖2)
圖2 c-MYC與共表達(dá)基因的相關(guān)性分析
應(yīng)用String蛋白數(shù)據(jù)庫分析c-MYC相關(guān)剪接基因互作網(wǎng)絡(luò),分析結(jié)果顯示:16個(gè)基因中有12個(gè)基因與RNA剪接具有密切聯(lián)系,主要是剪接體復(fù)合物、U12-型剪接體復(fù)合物和剪接體snSNP復(fù)合物,其中最主要的節(jié)點(diǎn)基因?yàn)镾NRPD1,其他基因的節(jié)點(diǎn)數(shù)目詳見圖3。
圖3 String蛋白數(shù)據(jù)庫分析可變剪接基因之間的聯(lián)系
在本研究分析的乳腺癌數(shù)據(jù)中,與c-MYC共表達(dá)的16個(gè)基因中有3個(gè)基因與已經(jīng)發(fā)表的淋巴瘤中的基因一致,分別為WDR77、GEMIN4和SNRPD1。WDR77、GEMIN4和SNRPD1基因與c-MYC基因在乳腺癌數(shù)據(jù)集中的Pearson相關(guān)系數(shù)分別為0.32、0.47和0.30。(圖4)
圖4 淋巴瘤和乳腺癌c-MYC調(diào)節(jié)剪接基因交集分析
調(diào)取TCGA數(shù)據(jù)庫中乳腺癌數(shù)據(jù)集BreastⅠnvasive Carcinoma(TCGA,Provisional),分析剪接基因在基因組水平上突變、擴(kuò)增和缺失的情況,結(jié)果顯示:16個(gè)剪接基因在乳腺癌中均有不同程度的擴(kuò)增,其中CPSF1、PUF60、TGS1和RBM17基因在乳腺癌中的擴(kuò)增比例較多,分別為16%、15%、9%和5%,詳見圖5。進(jìn)一步分析結(jié)果顯示:c-MYC調(diào)節(jié)的剪接基因在基因組水平的拷貝數(shù)改變與基因mRNA表達(dá)之間存在相關(guān)性,詳見圖6。
圖5 剪接基因的突變、擴(kuò)增和缺失比例分析
圖6 剪接基因拷貝數(shù)變異與基因表達(dá)的相關(guān)性分析
對(duì)WDR77、GEMIN4、SNRPD1基因及其他剪接基因的表達(dá)與乳腺癌患者預(yù)后的關(guān)系進(jìn)行分析,結(jié)果顯示:與WDR77低表達(dá)的乳腺癌患者相比,WDR77高表達(dá)的乳腺癌患者的總生存期較長(zhǎng),差異有統(tǒng)計(jì)學(xué)意義(log-rankP=0.046);WDR77高表達(dá)的乳腺癌患者的無復(fù)發(fā)生存期明顯長(zhǎng)于WDR77低表達(dá)的乳腺癌患者,差異有統(tǒng)計(jì)學(xué)意義(logrankP=1.1×10-11);GEMIN4高表達(dá)的乳腺癌患者的總生存期和無復(fù)發(fā)生存期均短于GEMIN4低表達(dá)的患者,差異均有統(tǒng)計(jì)學(xué)意義(log-rankP=0.031、4.2×10-6);SNRPD1高表達(dá)的乳腺癌患者的總生存期和無復(fù)發(fā)生存期均短于SNRPD1低表達(dá)的患者,差異均有統(tǒng)計(jì)學(xué)意義(log-rankP=0.036、5.9×10-12);另外,CPSF1、PPNA、SF1、LSM6、SRPK1、YBX1、RBM28和PUF60基因的表達(dá)也與乳腺癌患者的預(yù)后有關(guān)。(圖7)
圖7 WDR77、GEMIN 4和SNRPD 1基因高表達(dá)與低表達(dá)乳腺癌患者的生存曲線圖
可變剪接是生物多樣性的重要原因,屬于表觀遺傳學(xué)范疇,其通過不同的作用方式從同一條基因序列產(chǎn)生不同的mRNA序列從而合成功能不同的蛋白質(zhì),使基因編碼更有效率??勺兗艚釉诎l(fā)育、分化過程中發(fā)揮著重要作用。越來越多的證據(jù)表明:不同組織或細(xì)胞中往往存在異常的可變剪接事件與腫瘤的發(fā)生發(fā)展密切相關(guān)。剪接異構(gòu)體通過調(diào)控細(xì)胞運(yùn)動(dòng)、細(xì)胞增殖、激素應(yīng)答、細(xì)胞凋亡和化療反應(yīng)等過程中的基因參與腫瘤的發(fā)生發(fā)展。由于腫瘤中普遍存在選擇性剪接異常,可變剪接異常逐漸被認(rèn)為是腫瘤進(jìn)展和治療的重要標(biāo)志。然而,其介導(dǎo)腫瘤發(fā)生發(fā)展的具體機(jī)制尚不明確[5-6]。
有研究表明,多種腫瘤中常見MYC的表達(dá)上調(diào),并伴有腫瘤的惡性進(jìn)展和不良預(yù)后,說明MYC是腫瘤發(fā)生的重要驅(qū)動(dòng)基因[7-8]。雖然細(xì)胞通路基因的突變可為細(xì)胞的生長(zhǎng)和增殖提供最初的信號(hào),但轉(zhuǎn)錄的異常可以引起廣泛的細(xì)胞生理學(xué)變化,從而促進(jìn)細(xì)胞的生長(zhǎng)和增殖;同時(shí),基因表達(dá)程序組成部分的增加,使細(xì)胞能夠適應(yīng)多種突變,使腫瘤細(xì)胞變得活躍[9]。研究發(fā)現(xiàn),一些促進(jìn)細(xì)胞惡性轉(zhuǎn)化的剪接調(diào)節(jié)蛋白是MYC的直接轉(zhuǎn)錄靶點(diǎn),其中包括hnRNP A1和hnRNP A2,而MYC誘導(dǎo)上調(diào)的二者能調(diào)節(jié)丙酮酸激酶的選擇性剪切,進(jìn)而促進(jìn)與腫瘤相關(guān)的丙酮酸激酶M2的表達(dá)[10]。靶向剪接體通路,剪接復(fù)合體蛋白以及腫瘤相關(guān)基因的選擇性剪接過程的治療方法,可以為腫瘤靶向治療提供新的策略[1,11-12]。近些年,人們正嘗試通過可變剪接進(jìn)行腫瘤診斷和治療,剪接體是MYC驅(qū)動(dòng)的腫瘤中一個(gè)治療新靶點(diǎn),因?yàn)樵贛YC驅(qū)動(dòng)的腫瘤中,腫瘤的發(fā)生和進(jìn)展對(duì)剪接體蛋白表達(dá)的依賴性增強(qiáng),但是目前仍沒有阻斷該基因發(fā)揮作用的有效方法,通過抑制腫瘤細(xì)胞中剪接體的功能或許可以有效抑制腫瘤的進(jìn)展[1]。Hsu等[13]發(fā)現(xiàn)BUD31為乳腺上皮細(xì)胞中的MYC合成致死基因,并證明BUD31是核心剪接體組裝和催化活性所需的組分,敲降BUD31表達(dá)能干擾剪接體活動(dòng)并損害MYC依賴性乳腺腫瘤和轉(zhuǎn)移。在MYC驅(qū)動(dòng)的淋巴瘤中,使用相應(yīng)的反義寡核苷酸能使Eμmyc B細(xì)胞出現(xiàn)增殖減緩和誘導(dǎo)凋亡的特征[4]。因此,較深入地研究并揭示剪接體在腫瘤發(fā)病與進(jìn)展中的機(jī)制,同時(shí)針對(duì)不同剪接體設(shè)計(jì)靶向藥物對(duì)于腫瘤的診斷和治療具有重要意義。
Hsu等[13]在乳腺癌中直接對(duì)c-MYC調(diào)控的剪接因子進(jìn)行了實(shí)驗(yàn)性分析,但缺少多樣本剪接因子表達(dá)分析,為此本研究組進(jìn)行了多腫瘤樣本的c-MYC調(diào)控表達(dá)對(duì)剪接的影響。本研究分析發(fā)現(xiàn),在乳腺癌中與c-MYC共表達(dá)的基因有519個(gè),其中可變剪接基因有16個(gè)。剪接基因中有15個(gè)基因表達(dá)伴隨c-MYC表達(dá)升高而升高。Cheryl M.Koh團(tuán)隊(duì)[4]研究發(fā)現(xiàn),在淋巴瘤中c-MYC參與調(diào)控RNA剪接復(fù)合體核心組裝基因的轉(zhuǎn)錄,其中c-MYC直接調(diào)節(jié)的核心SNRP組裝基因中21個(gè)基因表達(dá)上調(diào),且本研究與Koh等在淋巴瘤中發(fā)現(xiàn)的剪接基因存在3個(gè)重疊基因,即WDR77、GEMIN4和SNRPD1,提示W(wǎng)DR77、GEMIN4和SNRPD1這些剪接基因在c-MYC驅(qū)動(dòng)乳腺癌的進(jìn)展中具有重要作用[4]。這16個(gè)剪接基因在基因組水平上有不同程度的缺失和擴(kuò)增;生存分析表明WDR77、GEMIN4和SNRPD1與患者的總生存期和無復(fù)發(fā)生存期顯著相關(guān),提示與c-MYC相關(guān)的剪接基因在乳腺癌的發(fā)生和進(jìn)展中具有重要作用。
綜上所述,c-MYC調(diào)節(jié)的剪接基因在乳腺癌的發(fā)生和發(fā)展中扮演重要角色,本研究為乳腺癌的治療和預(yù)后評(píng)估提供了重要參考價(jià)值,但關(guān)于c-MYC如何調(diào)節(jié)剪接基因的表達(dá)及剪接基因如何介導(dǎo)乳腺癌的發(fā)生發(fā)展還需進(jìn)一步研究,同時(shí)充分了解c-MYC影響剪接的具體機(jī)制可能對(duì)未來的靶向MYC依賴性的腫瘤治療提供重要理論依據(jù)。
[1]Dvinge H,Kim E,Abdel-Wahab O,et al.RNA splicing factors as oncoproteins and tumor suppressors[J].Nat Rev Cancer,2016,16(7):413-430.
[2]Walz S,Lorenzin F,Morton J,et al.Activation and repression by oncogenic MYC shape tumour-specific gene expression profiles[J].Nature,2014,511(7510):483-487.
[3]Sabò A,Kress TR,Pelizzola M,et al.Selective transcriptional regulation by Myc in cellular growth control and lymphomagenesis[J].Nature,2014,511(7510):488-492.
[4]Koh CM,Bezzi M,Low DH,et al.MYC regulates the core pre-mRNA splicing machinery as an essential step in lymphomagenesis[J].Nature,2015,523(7558):96-100.
[5]Singh B,Eyras E.The role of alternative splicing in cancer[J].Transcription,2017,8(2):91-98.
[6]Ghigna C,Riva S,Biamonti G.Alternative splicing of tumor suppressors and oncogenes[J].Cancer Treat Res,2013,158:95-117.
[7]Chen BJ,Wu YL,Tanaka Y,et al.Small molecules targeting c-Myc oncogene:promising anti-cancer therapeutics[J].Ⅰnt J Biol Sci,2014,10(10):1084-1096.
[8]Kuzyk A,Mai S.c-MYC-induced genomic instability.Cold Spring Harb Perspect Med[J],2014,4(4):a014373.
[9]Lin CY,Lovén J,Rahl PB,et al.Transcriptional amplification in tumor cells with elevated c-Myc[J].Cell,2012,151(1):56-67.
[10]David CJ,Chen M,Assanah M,et al.HnRNP proteins controlled by c-Myc deregulate pyruvate kinase mRNA splicing in cancer[J].Nature,2010,463(7279):364-368.
[11]Lee SC,Abdel-Wahab O.Therapeutic targeting of splicing in cancer[J].Nat Med,2016,22(9):976-986.
[12]Chen J,Weiss WA.Alternative splicing in cancer:implications for biology and therapy[J].Oncogene,2015,34(1):1-14.
[13]Hsu TY,Simon LM,Neill NJ,et al.The spliceosome is a therapeutic vulnerability in MYC-driven cancer[J].Nature,2015,525(7569):384-388.