王兆強,裴露萍,李 剛
(山東省濱州市博興縣人民醫(yī)院,山東博興縣 256500)
環(huán)狀RNA(circular RNAs,circRNA)是一類長的非編碼RNA分子,它們形成共價閉合的環(huán)狀結(jié)構(gòu),沒有5′-3′極性和polyA尾,不受RNA外切酶影響,表達穩(wěn)定[1]。近幾年研究表明,哺乳動物細胞中存在成千上萬種內(nèi)源性circRNA,它們通過充當miRNA海綿與microRNA(miRNA)相結(jié)合,阻斷miRNA對下游靶基因的降解作用,從而使靶基因表達水平升高,被稱為競爭性內(nèi)源RNA(competing endogenous RNAs,ceRNA) 機制[2,3]。越來越多的研究證實,體內(nèi)circRNA表達豐度的改變可以通過ceRNA機制影響下游靶基因的表達,從而導(dǎo)致細胞生理功能失調(diào),在腫瘤的發(fā)生、發(fā)展和轉(zhuǎn)移中發(fā)揮重要作用[2]。
骨肉瘤(osteosarcoma,OS)是最常見的原發(fā)性惡性骨腫瘤,多發(fā)于四肢,而很少見于脊柱,在青春期和60歲以上的人群中有2個發(fā)病高峰[4,5]。盡管多藥化療和手術(shù)切除原發(fā)性腫瘤等醫(yī)學(xué)技術(shù)已經(jīng)改善,但由于骨肉瘤早期轉(zhuǎn)移的特征,其生存率仍然很低[6]。因此,尋找有效的用于骨肉瘤早期診斷的分子標志物及優(yōu)化個體化治療是臨床亟待解決的問題。越來越多的研究表明,由非編碼RNA介導(dǎo)的關(guān)鍵信號通路的分子變化對骨肉瘤的發(fā)生發(fā)展機制(包括細胞生長、侵襲和轉(zhuǎn)移)至關(guān)重要[7]。因此,本實驗通過GEO數(shù)據(jù)庫篩選出骨肉瘤中差異表達的circRNAs,miRNAs和 mRNAs,再構(gòu)建 circRNA-miRNA-mRNA調(diào)控網(wǎng)絡(luò),對其進行功能和通路富集分析,最后篩選出與骨肉瘤患者預(yù)后相關(guān)的mRNAs。有望為骨肉瘤的早期診斷開發(fā)新的標志物以及為骨肉瘤的治療開發(fā)新的治療靶點。
通過GEO數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo/) 下載 GSE140256,GSE28425,GSE36001 和GSE28424數(shù)據(jù)集中基因表達譜數(shù)據(jù)。在GSE140256數(shù)據(jù)集中,對3例骨肉瘤組織和3例正常骨組織進行circRNA數(shù)據(jù)分析;在GSE28425數(shù)據(jù)集中,對19種骨肉瘤細胞系和4例正常骨組織進行miRNA數(shù)據(jù)分析;在GSE36001和GSE28424數(shù)據(jù)集中,對19種骨肉瘤細胞系和8例正常骨組織進行mRNA數(shù)據(jù)分析。
通過edgeR的R/Bioconductor包,設(shè)置|log2FC|的臨界值,進行差異表達分析,以篩選骨肉瘤和正常組織之間差異表達的circRNA,mRNA和miRNA。|log2FC|>1(foldchange,變化倍數(shù)),P<0.05為差異有統(tǒng)計學(xué)意義。
通過 StarBase數(shù)據(jù)庫(http://starbase.sysu.edu.cn/)預(yù)測circRNA-miRNA間結(jié)合情況。通過TargetScan(http://www.targetscan.org/)和StarBase(http://starbase.sysu.edu.cn/)數(shù)據(jù)庫預(yù)測miRNA的mRNA靶標。基于circRNA/miRNA和miRNA/mRNA的相互作用,利用Cy?toscape(3.5.1版)構(gòu)建circRNA-miRNA-mRNA網(wǎng)絡(luò)。
利用 Cytoscape(3.5.1版)中的 BiNGO和ClueGO插件進行功能和通路富集分析,GO(gene ontology) 和 KEGG (kyoto encyclopedia of genes and genomes)富集分析評估網(wǎng)絡(luò)中過表達mRNAs的潛在生物學(xué)功能和相關(guān)信號通路(P<0.05)。
下載GEO中GSE 39055數(shù)據(jù)集基因表達譜數(shù)據(jù)和37例骨肉瘤患者的生存時間及生存狀態(tài)。ROC(receiver operating characteristic)分析用于確定曲線下的面積。在每個mRNA表達譜的ROC曲線上都可以清楚地觀察到(0,1)點,該點可以同時最大化靈敏度和特異性。因此,作者將1 512.3、27 975.15、10 931.25、42.3、552.55表達量作為 NUDT11、FSCN1、MYO10、SDC4、UBE2V2生存分析的最佳截斷值。通過Kaplan-Meier生存分析評估這6種mRNAs與患者預(yù)后之間的關(guān)系。
使用SPSS統(tǒng)計學(xué)軟件進行數(shù)據(jù)統(tǒng)計分析,使用非配對T檢驗分析骨肉瘤組織(細胞)與正常骨組織之間circRNA的差異表達。使用SPSS軟件生存函數(shù)中的Cox回歸模型進行單因素分析。運用Kaplan-Meier方法進行生存分析,并使用log-rank檢驗分析mRNA表達與骨肉瘤患者預(yù)后之間的相關(guān)性。以P<0.05為差異有統(tǒng)計學(xué)意義。運用Graphpad Prism 7.0軟件作圖。
在GSE140256數(shù)據(jù)集中分析了骨肉瘤和正常骨組織之間circRNA的差異表達。定義變化倍數(shù)>2且P<0.05的circRNA為表達差異具有統(tǒng)計學(xué)意義,篩選出6個表達上調(diào)的circRNAs(hsa_circ_0000006、hsa_circ_0046264、 hsa_circ_0078767、 hsa_circ_0094088、hsa_circ_0096041和 hsa_circ_0049271)?;谏鲜鯿ircRNAs構(gòu)建表達熱圖(圖1a),circRNA差異表達見圖1b~g。
圖1 基于GEO數(shù)據(jù)集(GSE140256)的基因表達分析 1a:在3個OS組織中與3個正常骨組織相比,6個上調(diào)的cir?cRNAs的熱圖。每一列代表一個樣品,每一行代表一個circRNA。從藍色(低)到紅色(高)的色標指示歸一化表達的水平 1b~1g:基于GSE140256數(shù)據(jù)集的相應(yīng)circRNAs差異表達圖
在GSE28425、GSE36001和GSE28424數(shù)據(jù)集中分析了骨肉瘤和正常骨組織之間miRNA和mRNA的差異表達。定義變化倍數(shù)>2且P<0.05的miRNA和mRNA具有差異表達,篩選出124個表達下調(diào)的miRNA;GSE 36001和GSE 28424數(shù)據(jù)集分別篩選出604和687個表達上調(diào)的mRNA,做Venn圖篩選出504個共同表達上調(diào)的mRNAs(圖2a)。
圖2 circRNA-miRNA-mRNA網(wǎng)絡(luò)的富集分析 2a:基于2個GEO數(shù)據(jù)集(GSE36001,GSE28424),與正常骨組織相比,OS中上調(diào)的mRNAs的Venn分析 2b:OS中的circRNA-miRNA-mRNA調(diào)控網(wǎng)絡(luò)。節(jié)點顏色代表不同的RNA類型 2c:circRNA-miRNA-mRNA網(wǎng)絡(luò)中過表達mRNAs富集的前20 GO分析生物學(xué)過程。球的大小代表富集的基因個數(shù),顏色代表P值 2d:cir?cRNA-miRNA-mRNA網(wǎng)絡(luò)中過表達mRNAs富集的KEGG通路生物學(xué)過程。“*”代表P<0.05;“**”代表P<0.01
為了探索circRNA的功能,作者基于ceRNA預(yù)測了circRNA-miRNA-mRNA網(wǎng)絡(luò)內(nèi)的潛在相互作用。通過StarBase在線工具,預(yù)測出能夠與hsa_circ_0000006、 hsa_circ_0046264、 hsa_circ_0078 767結(jié)合的的下調(diào)miRNA分別有4、2、4個(表1)。通過TargetScan和StarBase在線工具,預(yù)測出52個能夠與上述10個miRNAs結(jié)合的上調(diào)mRNAs(表1)。根據(jù)circRNA,miRNA和mRNA之間的相互作用,使用Cytoscape軟件繪制包含3個circRNAs,10個miRNAs和52個mRNAs的ceRNA網(wǎng)絡(luò)圖(圖2b)。
表1 骨肉瘤circRNA相關(guān)ceRNA網(wǎng)絡(luò)中的circRNAs、miRNAs和mRNAs
功能分析表明,上述ceRNA網(wǎng)絡(luò)中52個上調(diào)的mRNAs富集20個GO生物學(xué)過程類別和8個KEGG類別(P<0.05)。與基因表達失調(diào)有關(guān)的GO生物學(xué)過程是正向調(diào)控細胞周期(GO:0048522),正向調(diào)控生物學(xué)過程(GO:0048518)和正向調(diào)控細胞增殖(GO:0008284)(圖2c)。根據(jù)KEGG分析,p53信號通路和病毒致癌通路與癌癥發(fā)生有關(guān)(圖2d)。
通過Kaplan-Meier生存分析評估了這52種mRNA與骨肉瘤患者預(yù)后之間的關(guān)系,結(jié)果表明,NUDT11、FSCN1、MYO10、SDC4、UBE2V2 過表達患者的總體生存時間顯著短于低表達患者(圖3)。基于Cox回歸模型的單因素分析,發(fā)現(xiàn)NUDT11、FSCN1、MYO10、SDC4、UBE2V2過表達均是預(yù)后不良的危險因素(表2)。
表2 骨肉瘤中mRNAs的單因素Cox分析
圖3 基于GEO數(shù)據(jù)集(GSE39055)分析circRNA-miRNA-mRNA網(wǎng)絡(luò)中mRNAs表達與OS患者預(yù)后之間的關(guān)系 3a~3e:FSCN1、MMYO10、NUDT11、SDC4、UBE2V2過表達患者的總生存時間均顯著短于低表達患者(P<0.01,P<0.05,P<0.01,P<0.05,P<0.01)
circRNA是一類新型的非編碼RNA,它們可能在基因表達和信號通路中起重要作用,并參與多種疾病的發(fā)展。目前研究表明OS中存在特定的circRNA表達失調(diào),其高表達或低表達是OS發(fā)生、發(fā)展和轉(zhuǎn)移過程中的重要分子事件,但這些circRNAs的作用機制尚不清楚。差異表達的circRNAs可能作為疾病早期診斷的標志物,也可作為新的潛在治療靶標。
在本研究中,基于GEO數(shù)據(jù)庫,與正常骨組織相比,OS中有 6個 circRNAs(hsa_circ_0000006,hsa_circ_0046264,hsa_circ_0078767,hsa_circ_0094 088,hsa_circ_0096041 和 hsa_circ_0049271)和 504個mRNAs表達上調(diào)。據(jù)報道,hsa_circ_0000006通過吸附miR-578上調(diào)VEGF表達促進骨肉瘤細胞增殖和遷移[8],與本篩選結(jié)果一致。有研究發(fā)現(xiàn)hsa_circ_0046264通過靶向hsa-miR-1245上調(diào)BRCA2的表達抑制肺癌發(fā)生發(fā)展[9],與本篩選結(jié)果不一致,可能與其所在腫瘤微環(huán)境有關(guān),有待后續(xù)試驗進一步驗證。其余4個circRNAs尚未有文獻報道。
circRNA被證實具有調(diào)節(jié)mRNA穩(wěn)定性和蛋白質(zhì)翻譯的能力[2]。作者推測OS中過表達的mRNAs可能受 circRNAs調(diào)控。 RPISeq(http://pridb.gdcb.ia?state.edu/RPISeq/)和LncTar(http://www.cuilab.cn/lnctar)預(yù)測發(fā)現(xiàn)沒有與6個circRNAs直接結(jié)合的mRNAs和蛋白。因此,作者認為circRNAs可能間接作用于靶基因。據(jù)報道,miRNA與其靶基因的3'UTR區(qū)結(jié)合,降低了mRNA的穩(wěn)定性或抑制蛋白質(zhì)翻譯[10]。ceRNA假說認為circRNA吸附miRNA,從而降低了其豐度并影響了下游靶基因的表達[2]。作者通過GEO數(shù)據(jù)庫篩選了在OS中下調(diào)的miRNAs,根據(jù)相互間的結(jié)合位點確定了潛在的circRNA-miR?NA-mRNA相互作用網(wǎng)絡(luò),構(gòu)建了一個完整的ceR?NA調(diào)控網(wǎng)絡(luò)。近幾年的研究表明,circRNA基于ceRNA機制可能在多種類型的癌癥中發(fā)揮作用[11~17]。在本研究中,hsa_circ_0000006、hsa_circ_0046264、hsa_circ_0078767結(jié)合OS中下調(diào)miRNAs分別有4、2、4個。有研究發(fā)現(xiàn),miR-665通過直接靶向HMGB1并激活Wnt/β-catenin途徑來抑制視網(wǎng)膜母細胞瘤的致癌性[18];miR-140-3p的高表達可抑制乳腺癌的增殖和遷移[19];miR-671-5p通過阻斷細胞周期來抑制骨肉瘤細胞增殖[20];hsa-miR-486-5p通過TGF-β/SMAD2信號通路抑制非小細胞肺癌的遷移和侵襲[21],與本篩選結(jié)果一致。作者預(yù)測發(fā)現(xiàn),能夠與10個miRNAs結(jié)合的mRNAs中,NUDT11、FSCN1、MYO10、SDC4、UBE2V2 過表達患者的總體生存時間明顯短于低表達患者。基于Cox回歸模型的單因素分析,發(fā)現(xiàn)NUDT11、FSCN1、MYO10、SDC4、UBE2V2過表達均是預(yù)后不良的危險因素。FSCN1促進骨肉瘤細胞的增殖和轉(zhuǎn)移,其高表達與患者預(yù)后不良有關(guān)[22];SDC4的高表達與遠處轉(zhuǎn)移的發(fā)生和腫瘤的大小有關(guān),其高表達患者的總體生存期明顯縮短[23],上述研究與本分析結(jié)果一致。此外,功能分析表明,這些上調(diào)的mRNAs可能與腫瘤的發(fā)生發(fā)展有關(guān),目前對包括OS在內(nèi)的多種腫瘤均有報道,證實SOX4、FSCN1、SKP2可促進OS 細胞的增殖[22、24、25]。
綜上所述,作者確定了3個circRNA-miRNA-mRNA信號軸,circRNA相關(guān)的ceRNA網(wǎng)絡(luò)可能為OS發(fā)生發(fā)展的分子機制提供有價值的數(shù)據(jù)支持。由于此分析僅基于生物信息學(xué)方法,因此還需要進一步的實驗研究,以驗證這3條信號軸在OS的發(fā)生發(fā)展中發(fā)揮重要的調(diào)控作用。