易鳳仙 曾淑華 周 容 楊 靜 王月君 唐 青 萬鳳知
(三峽大學(xué) 第一臨床醫(yī)學(xué)院[宜昌市中心人民醫(yī)院] 婦科, 湖北 宜昌 443003)
子宮內(nèi)膜癌(endometrial carcinoma,EC)可分為雌激素依賴型(I型)和非雌激素依賴型(Ⅱ型)。I型EC絕大部分為內(nèi)膜樣癌,少部分為黏液腺癌;Ⅱ型包括漿液性癌和透明細(xì)胞癌等[1]。EC是女性生殖系統(tǒng)三大惡性腫瘤之一,占女性生殖系統(tǒng)惡性腫瘤的20%~30%[2,3]。近年來,EC的發(fā)病率在全球范圍內(nèi)有所增加[4,5]。據(jù)統(tǒng)計(jì),全世界每年有287 000例新增EC病例和74 000例EC相關(guān)死亡病例[6]。EC不僅給患者帶來痛苦,而且增加了社會(huì)和家庭的經(jīng)濟(jì)負(fù)擔(dān)。因此,明確其發(fā)病機(jī)制,尋找有效的分子生物標(biāo)志物,對實(shí)現(xiàn)EC的早發(fā)現(xiàn)、早診斷、早治療具有重要意義。
近年來,全基因組測序和生物信息學(xué)技術(shù)的發(fā)展為癌癥研究提供了新方向,例如癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫、基因表達(dá)綜合譜(Gene Expression Omnibus,GEO)和基因組富集分析(Gene Set Enrichment Analysis,GSEA)。長鏈非編碼RNA(long non-coding RNA,LncRNA)是指長度>200個(gè)核苷酸的轉(zhuǎn)錄本,根據(jù)它們所處的基因組環(huán)境大致分為反義LncRNA(antisense LncRNA)、內(nèi)含子LncRNA(intronic LncRNA)和基因間LncRNA(intergenic LncRNA,LincRNA)等,其中LincRNA是最大的LncRNA分子[7]。LincRNA在腫瘤的發(fā)生發(fā)展中起重要調(diào)控作用。本研究使用生物信息學(xué)分析報(bào)告EC中的關(guān)鍵LincRNA,擬為EC的診斷和治療提供新的標(biāo)志物。
從TCGA(https://portal.gdc.cancer.gov/)下載RNA-Seq、拷貝數(shù)變化(copy number variation,CNV)和臨床數(shù)據(jù)。RNA-Seq數(shù)據(jù)顯示為FPKM(Fragments Per Kilobase of transcript per Million fragments mapped)?;贓nsembl數(shù)據(jù)集(http://asia.ensembl.org/index.html)對基因變異類型進(jìn)行分類。
使用基因富集分析軟件鑒定EC中差異性LincRNA的富集程度[8]。對于功能富集分析,根據(jù)目標(biāo)LincRNA的相關(guān)性,將mRNA排列,以Pearson相關(guān)系數(shù)R值表示相關(guān)水平。隨后,列出mRNA和相應(yīng)的R值,并通過clusterProfiler進(jìn)行GO、KEGG及GSEA富集分析[9,10]。
本研究選擇了總體生存(overall survival,OS)作為預(yù)后指標(biāo),OS定義為從診斷之日至因任何原因死亡之日的時(shí)間,研究時(shí)間為5年[11]。在TCGA數(shù)據(jù)集中的漿液性癌樣品上建立雙變量回歸和多元Cox模型,驗(yàn)證漿液性癌中特異性表達(dá)LincRNAs在漿液性癌中的預(yù)后預(yù)測價(jià)值。
多組間比較采用單因素方差分析,兩兩比較采用Bonferroni校正的t檢驗(yàn)以評估任意兩種類型的樣品之間表達(dá)水平的差異。交集分析通過在線工具venny 2.1進(jìn)行。在SPSS 25.0上執(zhí)行雙變量回歸和Cox模型。使用GraphPad Prism 8或Rv3.6.1進(jìn)行其他分析和繪圖。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
為了鑒定在EC中差異表達(dá)的LncRNA,在521個(gè)EC腫瘤樣品(包括407個(gè)內(nèi)膜樣癌組織和114個(gè)漿液性癌組織)和35個(gè)正常組織樣品中分析它們的表達(dá)。與正常組織相比,腫瘤組織中LincRNA表達(dá)更高(P<0.05);與內(nèi)膜樣癌組織相比,LincRNAs在漿液性癌組織中表達(dá)更高(P<0.05),見圖1A。與正常組織相比,腫瘤組織中反義LncRNA表達(dá)更低(P<0.05),漿液性癌組織與內(nèi)膜樣癌組織比較差異無統(tǒng)計(jì)學(xué)意義(P>0.05),見圖1B。與正常組織相比,其它類型LncRNA在內(nèi)膜樣癌組織中表達(dá)更高(P<0.05),見圖1C。篩選出只在漿液性癌中高表達(dá)的LincRNA共39個(gè)(C2orf48,LINC00839,LINC01993,AL391095.1,AL354707.1,AC109826.1,LINC00954,LINC01508,LINC01814,LINC00958,AC105219.3,MIR9-3HG,AC117498.2,LINC00239,AC012236.1,AL023284.4,LINC01572,AL512274.1,AC010422.2,AC004233.3,AL390719.2,U62317.1,AC099568.2,LINC02012,AL096828.3,AL121906.2,BLACAT1,UCA1,AL121899.1,AL391832.2,AC024230.1,AC016737.1,AL671710.1,LINC01127,AL080250.1,AC025165.4,AC010719.1,AP002360.3,AC253536.6)。未發(fā)現(xiàn)只在內(nèi)膜樣癌中高表達(dá)的LincRNA。
注:A:LincRNA在不同組織中的表達(dá); B:反義LncRNA在不同組織中的表達(dá); C:其它類型LncRNA在不同組織中的表達(dá);與正常組織相比,*P<0.05;與漿液性癌組織相比,#P<0.05圖1 LncRNA在不同組織中的表達(dá)
為了鑒定這39種LincRNA在EC中的富集程度,根據(jù)它們的表達(dá)進(jìn)行了GSEA分析。這39種LincRNA在EC中富集得分為0.65(P=0.006)(見圖2A),在漿液性癌中富集得分為0.66(P=0.010)(見圖2B),說明這39種LincRNA在EC和漿液性癌中顯著富集。
注:A:LincRNA在EC中的富集分析;B:LincRNA在漿液性癌中的富集分析圖2 LincRNA富集分析
密度圖顯示了每個(gè)漿液性癌特異性表達(dá)LincRNA的CNV擴(kuò)增和缺失分布(見圖3)。
圖3 LincRNA的CNV譜
這39個(gè)LincRNA的CNV擴(kuò)增密度峰值明顯大于缺失密度峰值,表明CNV擴(kuò)增介導(dǎo)了漿液性癌中特異性表達(dá)的LincRNA的過表達(dá)。在這39種LincRNA中,膀胱癌相關(guān)轉(zhuǎn)錄本1(bladder cancer-associated transcript 1,BLACAT1)(TCGA編號ENSG00000281406)的表達(dá)差異性最大。
通過雙變量回歸(見圖4A)和Cox(見圖4B)模型進(jìn)行ROC分析驗(yàn)證這些LincRNA對OS的預(yù)測價(jià)值。雙變量回歸模型(AUC=0.786,P<0.000 1)和多變量Cox模型(AUC=0.704,P=0.001)顯示,這些LincRNA均為漿液性癌的預(yù)測標(biāo)志物。
圖4 漿液性癌特異性表達(dá)LincRNAs預(yù)測分析
本研究通過生物信息學(xué)方法分析公共數(shù)據(jù)庫中的EC測序數(shù)據(jù),首先確定了不同類型的LncRNA在EC不同亞型中的表達(dá)水平,接下來鑒定了漿液性癌中特異性過表達(dá)的39種LincRNA。這39種LincRNA中,LincRNA BLACAT1的表達(dá)差異性最大,且這39種LincRNA可作為漿液性癌預(yù)后預(yù)測的生物標(biāo)記物。
LncRNA是指長度>200個(gè)核苷酸的轉(zhuǎn)錄本,不含蛋白質(zhì)編碼序列[12]。盡管有多項(xiàng)研究報(bào)告指出,LincRNA在EC中既有腫瘤抑制作用也有腫瘤促進(jìn)作用,但尚無研究報(bào)道LincRNA與漿液性癌之間的關(guān)系。據(jù)報(bào)道,某些LincRNA與腫瘤進(jìn)展有關(guān)。例如,LincRNA UCA1(ensembl編號ENSG00000214049)可促進(jìn)胃癌、膀胱癌和乳腺癌的發(fā)生[13,14]。本研究發(fā)現(xiàn),39種LincRNA的CNV擴(kuò)增密度峰值明顯大于缺失密度峰值,表明CNV擴(kuò)增介導(dǎo)了漿液性癌中特異性LincRNA的過表達(dá),可能是LincRNA過表達(dá)的重要機(jī)制,后續(xù)研究中應(yīng)進(jìn)一步實(shí)驗(yàn)驗(yàn)證。
本研究發(fā)現(xiàn),在這39種LincRNA中,LincRNA BLACAT1表達(dá)差異性最大,LincRNA BLACAT1可作為OS的預(yù)測指標(biāo)。據(jù)報(bào)道,LincRNA BLACAT1可促進(jìn)腫瘤發(fā)生,并與小細(xì)胞肺癌和大腸癌的不良預(yù)后有關(guān)[15,16]。具體機(jī)制可能與LincRNA BLACAT1調(diào)節(jié)Wnt信號通路,促進(jìn)腫瘤增殖、遷移和侵襲有關(guān)[17]。然而,本研究也存在一些不足。首先,本研究缺乏臨床標(biāo)本的收集和進(jìn)一步實(shí)驗(yàn)驗(yàn)證;其次,沒有預(yù)測和驗(yàn)證LincRNA BLACAT1的下游靶標(biāo),后續(xù)研究中將通過收集臨床標(biāo)本,結(jié)合體內(nèi)和體外實(shí)驗(yàn)進(jìn)行深入的機(jī)制探討。
綜上所述,在漿液性癌中差異表達(dá)的39種LincRNAs可作為漿液性癌的預(yù)后標(biāo)志物。這些LincRNA中,LincRNA BLACAT1表達(dá)差異最大,有望為EC提供新的預(yù)后標(biāo)志物和治療靶點(diǎn)。