劉峰 楊富 張鈴 孫樹(shù)漢
?綜 述?
長(zhǎng)鏈非編碼RNA與腫瘤診斷
劉峰 楊富 張鈴 孫樹(shù)漢★
非編碼RNA參與了多種疾病尤其是腫瘤發(fā)生發(fā)展的調(diào)控過(guò)程,是近期研究熱點(diǎn)之一。隨著高通量篩選方法的完善,越來(lái)越多的lncRNA分子被發(fā)現(xiàn),并有望成為新型腫瘤診斷標(biāo)志物和腫瘤治療的靶點(diǎn)。近期研究提示lncRNA在腫瘤診斷和治療方面具有良好的臨床應(yīng)用前景。本文介紹了lncRNA近期研究進(jìn)展,相關(guān)lncRNA數(shù)據(jù)庫(kù)的使用,并著重介紹了lncRNA與腫瘤診斷和預(yù)后關(guān)系研究情況。
長(zhǎng)鏈非編碼RNA;腫瘤標(biāo)志物;數(shù)據(jù)庫(kù)
真核生物體內(nèi)曾經(jīng)被視為基因組“噪音”不編碼蛋白質(zhì)的轉(zhuǎn)錄本,即非編碼RNA,一度被認(rèn)為不具有生物學(xué)功能,而近期報(bào)道發(fā)現(xiàn)它們亦在生命活動(dòng)發(fā)揮重要作用,并迅速成為研究熱點(diǎn)之一。非編碼RNA是指不具有編碼蛋白質(zhì)功能的RNA分子,對(duì)于生命活動(dòng)發(fā)揮著極廣泛的調(diào)控作用,具有重要意義。功能性非編碼RNA及蛋白的翻譯后修飾等表觀遺傳調(diào)控方式越來(lái)越受到研究者的重視。功能性非編碼RNA在基因表達(dá)中發(fā)揮重要的作用,按照它們的大小可分為長(zhǎng)鏈非編碼RNA(long non-coding RNA,lncRNA)和短鏈非編碼RNA,他們都是近年來(lái)研究的熱點(diǎn)。相對(duì)于編碼蛋白的RNA(mRNA)以及各種小分子RNA(siRNA,miRNA),長(zhǎng)鏈非編碼RNA的研究還僅僅處于起步階段。長(zhǎng)鏈非編碼RNA是指長(zhǎng)度超過(guò)200個(gè)核苷酸、具有調(diào)控基因表達(dá)作用的非編碼RNA。根據(jù)它們?cè)诨蚪M上相對(duì)于蛋白編碼基因的位置,可以將其分為(1)sense,(2)antisense,(3)bidirectional,(4)intronic, (5)intergenic這 5種類型。lncRNA參與了X染色體沉默、基因組印記以及染色質(zhì)修飾、轉(zhuǎn)錄激活、轉(zhuǎn)錄干擾、表觀遺傳學(xué)調(diào)控等多種重要的調(diào)控過(guò)程;在疾病的發(fā)生、發(fā)展過(guò)程中具有重要的生物學(xué)功能;另外, 它們還通過(guò)表觀遺傳調(diào)控等方式影響腫瘤細(xì)胞的生長(zhǎng)、凋亡、浸潤(rùn)與轉(zhuǎn)移。lncRNA有望成為新型腫瘤標(biāo)志物和腫瘤治療的靶點(diǎn), 在腫瘤診斷和治療方面具有良好的臨床應(yīng)用前景。因此,作者將lncRNA作為疾病標(biāo)志物的研究進(jìn)展作如下綜述。
lncRNA或在基因簇以至于整個(gè)染色體水平發(fā)揮順式調(diào)節(jié)作用,或改變直接相互作用蛋白質(zhì)的分子結(jié)構(gòu)而發(fā)揮作用,或影響相關(guān)編碼蛋白基因的剪切、翻譯等過(guò)程。許多這些lncRNA的高表達(dá),特別是進(jìn)化上保守的一些,具有其功能意義。lncRNA表達(dá)模式與許多實(shí)體腫瘤的診斷和預(yù)后相關(guān),因此可以作為新的腫瘤標(biāo)志物的來(lái)源。功能性lncRNA為腫瘤的發(fā)生發(fā)展機(jī)制提供新的視野。大量未知的不同非編碼RNA為許多疾病的診斷,預(yù)后和治療提供靶向。當(dāng)進(jìn)行l(wèi)ncRNA篩選和研究時(shí)如何能挑選得到具有價(jià)值的候選lncRNA,或者要了解驗(yàn)證得到的lncRNA是否具有功能意義,不可避免的需要查找lncRNA的信息,目前除了lncRNAdb是專門的lncRNA數(shù)據(jù)庫(kù)之外,還有其它的一些數(shù)據(jù)庫(kù)也含有l(wèi)ncRNA信息。這些數(shù)據(jù)庫(kù)的lncRNA來(lái)自GeneBank或者發(fā)布的文獻(xiàn)。有些ncRNA經(jīng)實(shí)驗(yàn)驗(yàn)證,有些則基于計(jì)算預(yù)測(cè)(比如基于RNA Z或Evofold)。下面介紹幾個(gè)最新的數(shù)據(jù)庫(kù)。
1.1 LncRNADisease:http://cmbi.bjmu.edu.cn/ lncrnadisease
lncRNA相關(guān)疾病數(shù)據(jù)庫(kù),可以公開(kāi)訪問(wèn)。近年來(lái),大量lncRNA已經(jīng)被鑒定,并且越來(lái)越多的證據(jù)顯示lncRNA在各種生物過(guò)程中起著關(guān)鍵的作用。因此,lncRNA的功能異常與一系列疾病相關(guān)。因此,理解lncRNA在疾病中的作用,并鑒定疾病診斷、治療和預(yù)后的候選lncRNA變得非常重要。為此,一個(gè)高質(zhì)量的lncRNA-疾病關(guān)聯(lián)數(shù)據(jù)庫(kù)將是非常有益的。它收集并精選了約480個(gè)實(shí)驗(yàn)支持的lncRNA-疾病關(guān)聯(lián)條目,包括166種疾病。LncRNADisease也在各種分子水平(包括蛋白質(zhì)、RNA、miRNA和DNA)精選了478個(gè)lncRNA相互作用的條目。此外,該數(shù)據(jù)庫(kù)用基因組信息、序列、參考文獻(xiàn)和物種注釋了lncRNA-疾病關(guān)聯(lián)。開(kāi)發(fā)了一種生物信息學(xué)方法來(lái)預(yù)測(cè)新的lncRNA-疾病關(guān)聯(lián),并將該方法和1 564個(gè)人類lncRNAs預(yù)測(cè)的關(guān)聯(lián)疾病整合到數(shù)據(jù)庫(kù)中[1]。
1.2 NONCODE:http://www.noncode.org/
NONCODE科學(xué)數(shù)據(jù)庫(kù)是中國(guó)科學(xué)院計(jì)算技術(shù)研究所生物信息學(xué)研究組和中國(guó)科學(xué)院生物物理研究所生物信息學(xué)實(shí)驗(yàn)室共同開(kāi)發(fā)和維護(hù)的一個(gè)提供給科學(xué)研究人員分析非編碼RNA基因的綜合數(shù)據(jù)平臺(tái),目前已更新至v3.0,其中收錄的非編碼RNA基因數(shù)目比v2.0增加一倍,達(dá)到40余萬(wàn)條目。NONCODE系統(tǒng)地編纂和整合已公布的lncRNA研究(例如表達(dá)譜,分子功能和生物學(xué)功能),v3.0還包括芯片研究重新注釋的功能性lncRNA數(shù)據(jù)。在NONCODE中的非編碼RNA基因數(shù)據(jù)分析平臺(tái)中,還為研究人員提供了BLAST序列比對(duì)服務(wù),非編碼RNA基因在基因組中定位以及它們的上下游相關(guān)注釋信息的瀏覽服務(wù)。為適應(yīng)lncRNA數(shù)據(jù)快速更新的需要,NONCODE提供了網(wǎng)上提交系統(tǒng),為有關(guān)最新文獻(xiàn)報(bào)道的非編碼RNA的整理提供了一個(gè)平臺(tái)。所有數(shù)據(jù)都向用戶開(kāi)放,并且可以通過(guò)網(wǎng)站下載[2]。
1.3 ChIPBase:http://deepbase.sysu.edu.cn/ chipbase/
染色質(zhì)免疫共沉淀結(jié)合二代測(cè)序技術(shù)(即:ChIPSeq)為轉(zhuǎn)錄因子和轉(zhuǎn)錄結(jié)合位點(diǎn)提供了高靈敏度的方法,該數(shù)據(jù)庫(kù)正是提供這一技術(shù)的相關(guān)數(shù)據(jù),對(duì)轉(zhuǎn)錄因子結(jié)合地圖以及l(fā)ncRNA和miRNA轉(zhuǎn)錄調(diào)控關(guān)系進(jìn)行全面的注釋和發(fā)現(xiàn)。ChIPBase現(xiàn)有數(shù)據(jù)包括六個(gè)物種不同的組織和細(xì)胞系運(yùn)用543高通量測(cè)序(ChIP-seq)實(shí)驗(yàn)所生成的數(shù)據(jù)。此數(shù)據(jù)庫(kù)尚包括通過(guò)分析數(shù)百萬(wàn)TFBSs而發(fā)現(xiàn)的數(shù)十萬(wàn)TF-lncRNA和TF-miRNA的調(diào)控關(guān)系。此外,ChIPBase開(kāi)發(fā)了兩個(gè)基因組瀏覽器,DeepView和GenomeView,為客戶提供綜合的多維數(shù)據(jù)[3]。
1.4 LNCipedia:http://www.lncipedia.org
隨著高通量方法的廣泛應(yīng)用,越來(lái)越多的新lncRNA分子被發(fā)現(xiàn),但其中僅有一些lncRNA已進(jìn)行了功能注釋。 LNCipedia數(shù)據(jù)庫(kù)注釋了21 488條不同組織來(lái)源的人lncRNA轉(zhuǎn)錄本。除了基本的轉(zhuǎn)錄信息和基因結(jié)構(gòu),該數(shù)據(jù)庫(kù)還提供如二級(jí)結(jié)構(gòu)信息、蛋白質(zhì)編碼潛能和miRNA結(jié)合位點(diǎn)等入口。LNCipedia向公眾開(kāi)放,允許用戶根據(jù)不同的搜索標(biāo)準(zhǔn)查詢和下載lncRNA序列和結(jié)構(gòu),并且還提供文獻(xiàn)報(bào)道的lncRNA的鏈接,用戶或作者可以通過(guò)Web界面提交文章。LNCipedia數(shù)據(jù)庫(kù)具有三大特征:lncRNA轉(zhuǎn)錄本的通用命名法,蛋白編碼潛能預(yù)測(cè)參考PRIDE數(shù)據(jù)庫(kù)以及l(fā)ncRNA所包含miRNA種子序列預(yù)測(cè)[4]。
1.5 DeepBase:http://deepbase.sysu.edu.cn/
整合了所有公開(kāi)的深度測(cè)序數(shù)據(jù),提供DeepView基因組瀏覽器在多層次比較分析這些數(shù)據(jù),提供了一個(gè)綜合性、互動(dòng)性、多功能的網(wǎng)絡(luò)圖形界面來(lái)評(píng)估m(xù)iRBase注釋的miRNA基因和其它已知的非編碼RNA,探討miRNA和其他非編碼RNA的表達(dá)模式,發(fā)現(xiàn)深度測(cè)序數(shù)據(jù)中新的miRNA和其他非編碼RNA[5]。
1.6 NRED:http://jsm-research.imb.uq.edu.au/NRED
非編碼RNA表達(dá)數(shù)據(jù)庫(kù),它提供了數(shù)以千計(jì)的在人類和小鼠表達(dá)的lncRNA信息。該數(shù)據(jù)庫(kù)包含了微陣列和原位雜交的數(shù)據(jù),其中大部分是第一次報(bào)道的。 NRED還提供了豐富多彩的功能性非編碼RNA的輔助信息,包括進(jìn)化保守性,二級(jí)結(jié)構(gòu)的證據(jù),基因組間的聯(lián)系和反義鏈之間的關(guān)系。該數(shù)據(jù)庫(kù)可進(jìn)行搜索并提供數(shù)據(jù)下載[6]。
1.7 Rfam數(shù)據(jù)庫(kù):http://rfam.sanger.ac.uk
數(shù)據(jù)庫(kù)以非編碼RNA家族的方式收集相關(guān)數(shù)據(jù),同一家族具有保守的 RNA二級(jí)結(jié)構(gòu)。每個(gè)RNA家族都有多序列比對(duì),二級(jí)結(jié)構(gòu)預(yù)測(cè)和協(xié)方差模型。在最新版本Rfam11.0中,還包括基于基因組比對(duì)引進(jìn)的超大RNA家族[7]。
1.8 lncRNAdb:http://www.lncrnadb.org/
包含已被證明在真核細(xì)胞有生物學(xué)功能的lncRNA以及具有調(diào)節(jié)功能的mRNA列表。每個(gè)條目包含的參考信息有序列、結(jié)構(gòu)信息、基因組信息、表達(dá)量、亞細(xì)胞定位、保守性、功能性的證據(jù)和其他相關(guān)信息。此外,lncRNAdb被鏈接到UCSC基因組瀏覽器和NRED數(shù)據(jù)庫(kù)[8]。
1.9 其他相關(guān)數(shù)據(jù)庫(kù)
如RNAdb http://research.imb.uq.edu.au/RNAdb[9],fRNAdb http://www.ncrna.org/[10],ncRNAimprint http:// rnaqueen.sysu.edu.cn/ncRNAimprint[11],在此不再一一贅述。
近年來(lái),人們一直熱衷于新診斷標(biāo)志物的尋找,lncRNA因其與腫瘤的相關(guān)性成為新腫瘤標(biāo)志物開(kāi)發(fā)的重要來(lái)源。
在肝癌組織中以及病人外周血中一些新診斷標(biāo)志物的提出,結(jié)合著傳統(tǒng)指標(biāo)可以一定程度上提高肝癌早期診斷的靈敏性和準(zhǔn)確性。我們的研究結(jié)果顯示在肝癌組織中上調(diào)表達(dá)的lncRNA-HEIH與肝癌復(fù)發(fā)概率密切相關(guān),該lncRNA在肝癌組織中的表達(dá)量與病人的術(shù)后生存時(shí)間顯著關(guān)聯(lián),肝癌組織中l(wèi)ncRNA-HEIH表達(dá)量越高則預(yù)示著病人的術(shù)后生存時(shí)間可能越短;同時(shí)我們的研究結(jié)果也表明在肝癌組織中特異性表達(dá)的lncRNA譜可以將癌組織和癌旁組織進(jìn)行準(zhǔn)確判別。因此,檢測(cè)肝癌組織中 lncRNAHEIH的表達(dá)量結(jié)合現(xiàn)有一些指標(biāo),或者是聯(lián)合檢測(cè)若干個(gè)lncRNA的表達(dá)情況,可作為手術(shù)病人預(yù)后判斷的參考指標(biāo),幫助臨床醫(yī)生進(jìn)行決策[12]。
lncRNA在其他腫瘤中同樣具有重要的預(yù)示功能。長(zhǎng)鏈非編碼RNA malat1,也被稱為malat-1或neat2,是一個(gè)高度保守的核的非編碼RNA,能夠成為預(yù)測(cè)肺癌發(fā)展和轉(zhuǎn)移標(biāo)志之一[13]。在基因水平上,Malat1促進(jìn)腫瘤生長(zhǎng),與腫瘤細(xì)胞的生長(zhǎng),運(yùn)動(dòng),增殖,信號(hào)傳導(dǎo),免疫調(diào)節(jié)有關(guān)的基因具有相關(guān)性并與病人的生存率相關(guān)[14]。lincRNA TUG1在膀胱尿路上皮癌上調(diào)表達(dá),高水平tug1表達(dá)與癌細(xì)胞惡性程度相關(guān)。TUG1是一種新興的表征膀胱尿路上皮癌的疾病狀態(tài)的分子,可能成為潛在的膀胱癌分子標(biāo)志物和/或治療靶點(diǎn)[15]。UCA1作為一種新型的膀胱癌生物標(biāo)志物,Northern blot分析檢測(cè)到有三種不同的轉(zhuǎn)錄本。在人膀胱癌的生長(zhǎng)和腫瘤的發(fā)生中扮演著重要的角色,他們共同的區(qū)域可能具有至關(guān)重要的生物活性,可以作為膀胱癌的一種新的治療靶標(biāo)[16]。Homo sapiens ZNFX1 antisense RNA 1(ZFAS1)在乳腺組織高表達(dá),但在乳腺腫瘤中下調(diào),推測(cè)其與肺泡發(fā)育和乳腺上皮細(xì)胞分化有關(guān),并且ZFAS1可作為一個(gè)抑癌基因調(diào)節(jié)乳腺癌的發(fā)生發(fā)展,是潛在的乳腺癌標(biāo)志物[17]。血細(xì)胞中KCNQ1OT基因印跡丟失和H19基因的高甲基化能判斷Beckwith-Wiedemann綜合征的診斷和預(yù)后并與胚胎性腫瘤的風(fēng)險(xiǎn)增加有關(guān)(常見(jiàn)Wilms瘤)[18]。
一些lncRNA分子在多種腫瘤中均發(fā)揮重要作用,可作為廣譜的腫瘤標(biāo)志分子,如HOTAIR分子。在63例肝切除的肝細(xì)胞癌(HCC)中檢測(cè)HOTAIR基因的表達(dá)量,顯示與鄰近的非腫瘤組織相比,HOTAIR在肝癌組織中過(guò)度表達(dá)。高HOTAIR基因表達(dá)與腫瘤患者肝切除術(shù)后復(fù)發(fā)的危險(xiǎn)性增加相關(guān)[19]。在肝癌組織中高表達(dá)水平的HOTAIR是一個(gè)獨(dú)立的預(yù)后因素,能夠預(yù)測(cè)已接受肝移植治療的肝癌患者的腫瘤復(fù)發(fā)(P= 0.001,危險(xiǎn)比為3.564)。此外,在超出米蘭標(biāo)準(zhǔn)的患者,高HOTAIR表達(dá)水平的患者無(wú)瘤生存期明顯較短,因此HOTAIR可能是肝癌候選標(biāo)志物,或潛在的治療靶點(diǎn)[20]。在大腸癌中,HOTAIR表達(dá)和PRC2復(fù)合體的成員(SUZ12,EZH2和H3K27me3)的表達(dá)具有明顯的相關(guān)性,高HOTAIR表達(dá)與結(jié)腸癌肝轉(zhuǎn)移的進(jìn)展存在緊密關(guān)聯(lián),并預(yù)示相對(duì)較差的預(yù)后[21]。HOTAIR也可通過(guò)上調(diào)miR-196a促進(jìn)胃腸道間質(zhì)瘤(GIST)的惡性轉(zhuǎn)化,與GIST標(biāo)本中高風(fēng)險(xiǎn)等級(jí)和轉(zhuǎn)移密切相關(guān),因此是惡性胃腸道間質(zhì)瘤潛在的生物標(biāo)志物和治療靶點(diǎn)[22]。
前列腺癌中,癌細(xì)胞特異性地表達(dá)lnc PCA3,正常細(xì)胞以及其他類型組織細(xì)胞均不表達(dá),因此PCA3已被開(kāi)發(fā)應(yīng)用為前列腺癌診斷的標(biāo)志物[23]。PCA3的優(yōu)勢(shì)在于可通過(guò)尿路系統(tǒng)進(jìn)入尿液而被檢測(cè)到,尿液檢測(cè)的無(wú)創(chuàng)性、取材方便使其具備成為篩查手段的可能性。在一項(xiàng)涉及108名參與者(前列腺活檢后24名確診腫瘤)的隊(duì)列研究中,Hessels等[24]發(fā)現(xiàn)基于RT-PCR的PCA3檢測(cè)具有67%的靈敏度和83%的特異性,而相對(duì)應(yīng)的血清PCA特異性只有22%。PCA3水平還可以作為預(yù)后指標(biāo),已證實(shí)與腫瘤大小、臨床分期和包膜外侵襲程度相關(guān)[25,26]。尿液中PCA3檢測(cè)的意義不僅在于對(duì)前列腺癌診斷的貢獻(xiàn),還為檢測(cè)體液中游離lncRNA作為腫瘤診斷標(biāo)志物的探索點(diǎn)亮了曙光。Panzitt等[27]在肝癌患者外周血中檢測(cè)到肝癌中特異性高表達(dá)的lncHULC,這一發(fā)現(xiàn)同PCA3一樣拓寬了lncRNA的應(yīng)用前景。
這些lncRNA腫瘤標(biāo)志分子參與的調(diào)控過(guò)程主要有:(1)維持細(xì)胞增殖;(2)逃避生長(zhǎng)抑制因子;(3)使復(fù)制持續(xù)進(jìn)行;(4)活化侵襲和轉(zhuǎn)移;(5)誘導(dǎo)血管生成;(6)抗細(xì)胞死亡。在過(guò)去的十年中,在癌癥研究領(lǐng)域取得的顯著進(jìn)展促使人們更好地理解這些標(biāo)志的功能,并最終擴(kuò)展最初的概念。
Tilling芯片和新一代的測(cè)序技術(shù)為整個(gè)人類基因組的轉(zhuǎn)錄本建立了豐富的檔案?;谶@些技術(shù)使得lncRNA的研究迅速發(fā)展。目前的各類生物芯片已經(jīng)覆蓋當(dāng)前各個(gè)lncRNA數(shù)據(jù)庫(kù),包括用于檢測(cè)已知lncRNA在不同樣本之間的表達(dá)差異,或檢測(cè)疾病樣本中表達(dá)異常的lncRNA的芯片;發(fā)現(xiàn)lncRNA上游調(diào)控功能的SNP、CNV和甲基化芯片;以及覆蓋面廣泛的Tiling芯片等都是lncRNA篩選的有效工具,芯片技術(shù)的規(guī)?;统墒旎呀?jīng)帶領(lǐng)研究者向系統(tǒng)生物學(xué)的領(lǐng)域拓展[28,29]。與此同時(shí),新一代測(cè)序技術(shù)更為一些新的轉(zhuǎn)錄本的發(fā)現(xiàn)提供方法并且彌補(bǔ)了芯片的不足[30]。
第二代測(cè)序技術(shù)(Next-generation Sequencing)的出現(xiàn)為DNA及RNA的測(cè)序提供了通量更高、更加敏感的方法,而且更加有利于新轉(zhuǎn)錄本尤其是ncRNA發(fā)現(xiàn)。第二代測(cè)序技術(shù)結(jié)合ChIP或RIP可以高通量的方法研究蛋白結(jié)合的DNA或RNA序列。
RIP-Seq/chip技術(shù)(RNA-Binding Protein Immunoprecipitation)用目標(biāo)RNA結(jié)合蛋白的抗體把相應(yīng)的RNA-蛋白質(zhì)復(fù)合物沉淀下來(lái),然后經(jīng)過(guò)分離純化就可以對(duì)于目標(biāo)蛋白結(jié)合的RNA進(jìn)行分析??蓮母咄繙y(cè)序技術(shù)和芯片技術(shù)獲得大量的結(jié)合RNA的信息,幫助我們更高通量地了解癌癥以及其它疾病整體水平的RNA變化。
CHIRP-Seq/chip(Chromatin Isolation by RNA Puri fi cation)是一種用高通量測(cè)序技術(shù)或者芯片手段檢測(cè)與RNA共同作用的RNA、DNA和蛋白的方法。首先需要設(shè)計(jì)生物素或鏈霉親和素探針(包括奇數(shù)組和偶數(shù)組),將目標(biāo)RNA拉下來(lái)以后,與其共同作用的RNA、DNA染色體片段就會(huì)一起附在鏈霉親和素磁珠上,經(jīng)過(guò)不同純化方法,最后把RNA或染色體片段做高通量測(cè)序,這樣會(huì)得到可能與目標(biāo)RNA直接結(jié)合的RNA,以及該RNA能夠結(jié)合到基因組的哪些區(qū)域;如果結(jié)合物是蛋白質(zhì),可以通過(guò)將蛋白質(zhì)打斷成短肽再通過(guò)質(zhì)譜進(jìn)行鑒定,或者將得到的蛋白質(zhì)進(jìn)行蛋白芯片雜交,獲取直接與RNA相互作用的蛋白質(zhì)信息。RNA Pull down技術(shù)也是類似的獲取RNA-蛋白復(fù)合物的方法。
遺傳因素以外發(fā)生的轉(zhuǎn)錄和功能性非蛋白質(zhì)編碼基因,特別是那些參與疾病的lncRNA的研究?jī)r(jià)值,仍然是一個(gè)有爭(zhēng)議的問(wèn)題。在這篇綜述中,我們集中于lncRNA研究中所涉及的癌癥。我們列出了一些腫瘤相關(guān)lncRNA,和已知的lncRNA定位和掃描基因組跨度的工具(例如,公共數(shù)據(jù)庫(kù)),并描述部分癌癥中的功能性lncRNA和可能的遺傳機(jī)制基礎(chǔ)如lncRNA的表達(dá)變化,以及現(xiàn)有的和未來(lái)可能在治療癌癥的研究中應(yīng)用的lncRNA。
近年來(lái),lncRNA成為解釋疾病尤其是癌癥的發(fā)生發(fā)展機(jī)制,作為診斷、病理分型、預(yù)后判斷和治療靶點(diǎn)的新的候選分子,并且展示了良好的應(yīng)用前景。然而,在我們可以利用lncRNA作為新的治療和診斷靶點(diǎn)的時(shí)候,我們有必要進(jìn)行更多的功能和結(jié)構(gòu)的研究。因?yàn)橐浞终J(rèn)識(shí)lncRNA的本質(zhì),尤其是每個(gè)生物個(gè)體的不同特征,我們的道路還是很長(zhǎng)的。目前,我們只踏入了第一步,我們了解了許多l(xiāng)ncRNA在癌癥中的作用,觀察到其與疾病的聯(lián)系。但是,我們向前邁進(jìn),我們會(huì)發(fā)現(xiàn)新的非編碼RNA,并找到它新的功能和意義,這將幫助我們能夠?qū)膊『湍[瘤有更早、更好的預(yù)測(cè)。由于越來(lái)越多新發(fā)現(xiàn)的非編碼RNA被人們所認(rèn)識(shí),我們可以預(yù)期生命科學(xué)領(lǐng)域?qū)?huì)有更加偉大的發(fā)現(xiàn),而這也為基礎(chǔ)科學(xué)和臨床研究的結(jié)合提供了廣闊的舞臺(tái),為轉(zhuǎn)化醫(yī)學(xué)提供了契機(jī)。
[1] Chen G, Wang Z, Wang D, et al. LncRNADisease: a database for long-non-coding RNA-associated diseases[J]. Nucleic Acids Res, 2013, 41(Database issue): D983- D986.
[2] Bu D, Yu K, Sun S, et al. NONCODE v3.0: integrative annotation of long noncoding RNAs[J]. Nucleic Acids Res, 2012, 40(Database issue): D210- D215.
[3] Yang J H, Li J H, Jiang S, et al. ChIPBase: a database for decoding the transcriptional regulation of long non-coding RNA and microRNA genes from ChIP-Seq data[J]. Nucleic Acids Res, 2013, 41(Database issue): D177- D187.
[4] Volders P J, Helsens K, Wang X, et al. LNCipedia: a database for annotated human lncRNA transcript sequences and structures[J]. Nucleic Acids Res, 2013, 41(Database issue): D246- D251.
[5] Yang J H, Qu L H. DeepBase: annotation and discovery of microRNAs and other noncoding RNAs from deepsequencing data[J]. Methods Mol Biol, 2012, 822: 233-248.
[6] Dinger M E, Pang K C, Mercer T R, et al. NRED: a database of long noncoding RNA expression[J]. Nucleic Acids Res, 2009, 37(Database issue): D122- D126.
[7] Burge S W, Daub J, Eberhardt R, et al. Rfam 11.0: 10 years of RNA families[J]. Nucleic Acids Res, 2013, 41(Database issue): D226-D232.
[8] Amaral P P, Clark M B, Gascoigne D K, et al. lncRNAdb: a reference database for long noncoding RNAs[J]. Nucleic Acids Res, 2011, 39(Database issue): D146-D151.
[9] Pang K C, Stephen S, Dinger M E, et al. RNAdb 2.0--an expanded database of mammalian non-coding RNAs[J]. Nucleic Acids Res, 2007, 35(Database issue): D178-D182.
[10] Kin T, Yamada K, Terai G, et al. fRNAdb: a platform for mining/annotating functional RNA candidates from noncoding RNA sequences[J]. Nucleic Acids Res, 2007, 35(Database issue): D145-D148.
[11] Zhang Y, Guan D G, Yang J H, et al. ncRNAimprint: a comprehensive database of mammalian imprinted noncoding RNAs[J]. RNA, 2010, 16(10): 1889-1901.
[12] Yang F, Zhang L, Huo X S, et al. Long noncoding RNA high expression in hepatocellular carcinoma facilitates tumor growth through enhancer of zeste homolog 2 in humans[J]. Hepatology, 2011, 54(5): 1679-1689.
[13] Gutschner T, H?mmerle M, Eissmann M, et al. The noncoding RNA MALAT1 is a critical regulator of the metastasis phenotype of lung cancer cells[J]. Cancer Res, 2013, 73(3): 1182-1189.
[14] Schmidt L H, Spieker T, Koschmieder S, et al. The long noncoding MALAT-1 RNA indicates a poor prognosis in non-small cell lung cancer and induces migration and tumor growth[J]. J Thorac Oncol, 2011, 6(12): 1984-1992.
[15] Han Y, Liu Y, Gui Y, et al. Long intergenic non-coding RNA TUG1 is overexpressed in urothelial carcinoma of the bladder[J]. J Surg Oncol, 2012, 107(5): 555-559.
[16] Wang Y, Chen W, Yang C, et al. Long non-coding RNA UCA1a(CUDR) promotes proliferation and tumorigenesis of bladder cancer[J]. Int J Oncol, 2012, 41(1): 276-284.
[17] Askarian-Amiri M E, Crawford J, French J D, et al. SNORD-host RNA Zfas1 is a regulator of mammary development and a potential marker for breast cancer[J]. RNA, 2011, 17(5): 878-891.
[18] Gaston V, Le Bouc Y, Soupre V, et al. Analysis of the methylation status of the KCNQ1OT and H19 genes in leukocyte DNA for the diagnosis and prognosis of Beckwith-Wiedemann syndrome[J]. Eur J Hum Genet, 2001, 9(6): 409-418.
[19] Geng Y J, Xie S L, Li Q, et al. Large intervening non-coding RNA HOTAIR is associated with hepatocellular carcinoma progression[J]. J Int Med Res, 2011, 39(6): 2119-2128.
[20] Yang Z, Zhou L, Wu L M, et al. Overexpression of long non-coding RNA HOTAIR predicts tumor recurrence in hepatocellular carcinoma patients following liver transplantation[J]. Ann Surg Oncol, 2011, 18(5): 1243-1250.
[21] Kogo R, Shimamura T, Mimori k, et al. Long noncodingRNA HOTAIR regulates polycomb-dependent chromatin modification and is associated with poor prognosis in colorectal cancers[J]. Cancer Res, 2011, 71(20): 6320-6326.
[22] Niinuma T, Suzuki H, Nojima M, et al. Upregulation of miR-196a and HOTAIR drive malignant character in gastrointestinal stromal tumors[J]. Cancer Res, 2012, 72(5): 1126-1136.
[23] Bussemakers M J, van Bokhoven A, Verhaegh G W, et al. DD3: a new prostate-speci fi c gene, highly overexpressed in prostate cancer[J]. Cancer Res, 1999, 59(23): 5975-5979.
[24] Hessels D, Klein Gunnewiek J M, van Oort I, et al. DD3(PCA3)-based molecular urine analysis for the diagnosis of prostate cancer[J]. Eur Urol, 2003, 44(1): 8-15.
[25] Nakanishi H, Groskopf J, Fritsche H A, et al. PCA3 molecular urine assay correlates with prostate cancer tumor volume: implication in selecting candidates for active surveillance[J]. J Urol, 2008, 179(5): 1804-1809.
[26] Whitman E J, Groskopf J, Ali A, et al. PCA3 score before radical prostatectomy predicts extracapsular extension and tumor volume[J]. J Urol, 2008, 180(5): 1975-1978.
[27] Panzitt K, Tschernatsch M M, Guelly C, et al. Characterization of HULC, a novel gene with striking up-regulation in hepatocellular carcinoma, as noncoding RNA[J]. Gastroenterology, 2007, 132(1): 330-342.
[28] Landt S G, Abeliuk E. A strategy for identifying noncoding RNAs using whole-genome tiling arrays[J]. Methods Mol Biol, 2012, 905: 29-39.
[29] Spizzo R, Almeida M I, Colombatti A, et al. Long noncoding RNAs and cancer: a new frontier of translational research[J]. Oncogene, 2012, 31(43): 4577-4587.
[30] Sasidharan R, Agarwal A, Rozowsky J, et al. An approach to comparing tiling array and high throughput sequencing technologies for genomic transcript mapping[J]. BMC Res Notes, 2009, 2: 150.
Long non-coding RNA in tumor diagnosis
LIU Feng, YANG Fu, ZHANG Ling, SUN Shuhan★
(Department of Medical Genetics, Second Military Medical University, Shanghai 200433, China)
Non-coding RNAs (ncRNAs) are involved in a variety of diseases, and especially in the regulation of the tumor occurrence and development. Nowadays, more reserchers focus on these functional RNAs instead of protein-coding genes. With the improvement of high-throughput screening method, more and more lncRNAs are found, and are expected to become new tumor diagnostic markers and targets of cancer therapy. Also, recent studies have indicated that the lncRNA is a good candidate for clinical application in tumor diagnosis and treatment. Now, the review describes recent research progress about lncRNAs, including the usage of lncRNA databases and the relationship between lncRNAs and tumor diagnosis and prognosis.
Long non-coding RNA; Tumor Marker; Database
第二軍醫(yī)大學(xué)醫(yī)學(xué)遺傳學(xué)教研室,上海 200433
★通訊作者:孫樹(shù)漢,E-mail:shsun@vip.sina.com