姜懷德,李桂林(南昌大學(xué)醫(yī)學(xué)院生理學(xué)教研室,江西南昌 330006)
?
長非編碼RNA的功能研究
姜懷德,李桂林
(南昌大學(xué)醫(yī)學(xué)院生理學(xué)教研室,江西南昌330006)
中國圖書分類號: R-05; R339.38; R342.2; R394; R741
摘要:長非編碼RNA(long noncoding RNAs,lncRNAs)是指長度大于200個核苷酸的RNA分子。近年來的研究表明,lncRNAs具有多種重要的生物學(xué)功能。隨著現(xiàn)代生物技術(shù)的發(fā)展,lncRNAs轉(zhuǎn)錄本的預(yù)測及發(fā)現(xiàn)已經(jīng)比較容易,然而不同于蛋白質(zhì)編碼基因序列所具有的指示功能,lncRNAs序列信息目前不提供功能信息的預(yù)測。因此,如何解碼lncRNAs的功能已逐漸成為基因組研究中的熱點問題。我們將對探測lncRNAs功能的研究方法進行綜述。
關(guān)鍵詞:長非編碼RNA;衰老;老化相關(guān)疾病;轉(zhuǎn)錄組分析;研究方法;生物信息學(xué)
網(wǎng)絡(luò)出版時間:2015-6-5 11:22網(wǎng)絡(luò)出版地址: http://www.cnki.net/kcms/detail/34.1086.R.20150605.1122.003.html
李桂林(1972-),女,博士,教授,碩士生導(dǎo)師,研究方向:神經(jīng)生理學(xué)和藥理學(xué),通迅作者,Tel: 0791-86360556,E-mail: li.guilin@163.com
人類全基因組測序結(jié)果顯示,具有編碼蛋白質(zhì)功能的基因不到全部基因組序列的2%,而在占據(jù)人類基因組98%以上的非蛋白編碼序列中,絕大多數(shù)被轉(zhuǎn)錄成長度大于200個堿基的長非編碼RNA(long noncoding RNAs,lncRNAs)。長非編碼RNA是指無蛋白質(zhì)編碼功能、但往往具有mRNA結(jié)構(gòu)特征(帽式結(jié)構(gòu)和poly A尾巴)的RNA[1],在對小鼠cDNA文庫的大規(guī)模測序研究中被首次發(fā)現(xiàn)[2]。近年來,隨著二代測序技術(shù)的廣泛應(yīng)用,長鏈非編碼RNA的神秘面紗才逐漸被揭開,長非編碼RNA是具有多種功能的轉(zhuǎn)錄本。lncRNA的表達不僅具有細胞或組織特異性,其中某些lncRNA還僅在真核生物發(fā)育過程的特定階段產(chǎn)生。越來越多針對長非編碼RNA的功能研究表明,lncRNA可以通過影響mRNA的轉(zhuǎn)錄、剪接、轉(zhuǎn)運、穩(wěn)定性和翻譯等過程,調(diào)節(jié)蛋白質(zhì)基因的表達。從而影響劑量補償、基因印跡、細胞周期、端粒生物學(xué)、亞細胞結(jié)構(gòu)組成、發(fā)育、配子形成及染色體結(jié)構(gòu)動態(tài)變化等生物學(xué)過程。有的lncRNA轉(zhuǎn)錄后很快被降解,但同樣具有重要的調(diào)節(jié)功能;有的lncRNA雖短暫表達,但可以產(chǎn)生長期的調(diào)控效應(yīng)。lncRNAs的異常表達與人類疾病相關(guān),如與老化相關(guān)的阿爾茨海默病(AD)和認知障礙、心血管疾病、糖尿病和癌癥等[3]。因此,更好地了解lncRNAs的功能會促進我們對細胞調(diào)節(jié)和疾病機制的理解。然而由于lncRNAs不具有蛋白質(zhì)編碼基因序列所具有的指示功能,所以直接對lncRNAs的功能進行研究具有一定的困難。目前對lncRNAs功能的研究主要有l(wèi)ncRNAs表達的高通量分析、高通量數(shù)據(jù)的驗證和lncRNA-蛋白質(zhì)相互作用的研究。此外,近年來生物信息技術(shù)的快速發(fā)展也為lncRNAs功能的研究提供了新的契機。我們將對lncRNA在衰老和老化相關(guān)疾病的研究進展及l(fā)ncRNAs功能的研究方法進行綜述。
1.1長非編碼RNA與衰老lncRNAs調(diào)節(jié)生物體生命周期、組織老化或細胞衰老的研究仍處于起步階段,但lncRNAs作為新興的重要ncRNAs,可能在衰老網(wǎng)絡(luò)和衰老相關(guān)疾病中發(fā)揮作用。lncRNAs參與軸突和樹突聯(lián)系的發(fā)育和與神經(jīng)網(wǎng)絡(luò)可塑性相關(guān)或與學(xué)習(xí)和記憶相關(guān)的長時程增強的突觸調(diào)制。在包括老化相關(guān)疾病的許多人類疾病中出現(xiàn)多種lncRNAs失調(diào)[4]。lncRNA可能作為一種新穎的基于衰老分子機制的代表。然而,關(guān)于lncRNAs參與調(diào)節(jié)細胞衰老復(fù)雜過程的信息仍然極少,但隨著轉(zhuǎn)錄組的持續(xù)發(fā)展,大量涉及腦老化動態(tài)變化的lncRNAs被發(fā)現(xiàn),這表明這些lncRNAs可能在大腦衰老過程中起著非常重要的作用。
在衰老過程中除了lncRNAs的表達模式發(fā)生改變,lncRNAs還可能通過直接參與老化網(wǎng)絡(luò)在組織老化或細胞衰老水平調(diào)節(jié)老化。lncRNA ANRIL參與原癌基因誘導(dǎo)衰老的關(guān)鍵效應(yīng)器并在老化期間誘導(dǎo)INK4a、ARF和/或INK4b的抑制。在首次系統(tǒng)研究老化相關(guān)的lncRNAs時,研究人員對增殖和衰老的成纖維細胞進行RNA深度測序時發(fā)現(xiàn),許多衰老相關(guān)lncRNAs(SAL-RNA)存在差異表達。在這些lncRNAs中,有些SAL-RNAs可調(diào)節(jié)衰老的發(fā)作并保護衰老細胞活力,這表明lncRNAs直接促成衰老表型的形成。此外,有報道稱lncRNA MALAT1在衰老成纖維細胞下調(diào),這與在成纖維細胞中降低MALAT1可啟動細胞衰老的結(jié)果相符。這種作用部分歸因于當(dāng)MALAT1水平較低時B-MYB前體mRNA剪接產(chǎn)生的致癌轉(zhuǎn)錄因子b-myb/myb12的下調(diào)。反過來,b-Myb的水平降低可縮短G2/M細胞周期進程,促進細胞衰老[5]。
lncRNAs可影響參與細胞衰老途徑的調(diào)節(jié),在細胞周期進程中起重要作用。細胞衰老的關(guān)鍵調(diào)節(jié)劑p53可以激活具有增殖抑制功能的許多l(xiāng)ncRNAs。反之,lncRNAs也可靶向作用于p53和p53途徑分子,從而影響p53的活性。lincRNA-p21作為p53基因的真正下游靶標(biāo),細胞凋亡中起作用,同時又反過來作為p53途徑中幾個重要促存活基因的關(guān)鍵抑制劑。沉默lincRNA-p21可阻斷程序性細胞死亡(即細胞凋亡),而不是細胞周期停滯[6]。哺乳動物雷帕霉素靶蛋白(mTOR)通路在從細胞周期停滯到衰老的轉(zhuǎn)化過程中起了至關(guān)重要的作用。mTOR具有上游調(diào)節(jié)信號和下游底物兩個不同細胞復(fù)合物(mTORC1和mTORC2)的催化亞基。雷帕霉素可阻斷mTORC1激酶,抑制或減速細胞轉(zhuǎn)化而使細胞保持靜止?fàn)顟B(tài)。抑制mTOR通路可延長包括小鼠在內(nèi)的模式生物的壽命。Uchl1AS lncRNA也參與mTOR信號通路。其功能是在應(yīng)激信號通路的控制下由雷帕霉素抑制mTORC1導(dǎo)致UCHL1蛋白增加而實現(xiàn)的。這種蛋白質(zhì)的突變與早發(fā)型家族性帕金森病有關(guān),并在特發(fā)性帕金森氏病和AD下調(diào)。從上述信息,可以容易地得出結(jié)論,lncRNAs在復(fù)雜的細胞衰老調(diào)控網(wǎng)絡(luò)起關(guān)鍵作用。
1.2 lncRNAs在老化相關(guān)疾病中的作用衰老是生活中不可避免的一部分,不幸的是衰老成了與老化相關(guān)的慢性疾病,如AD、認知障礙等疾病發(fā)作的最大危險因素[3](Tab 1)。
AD中BACE1(β位淀粉樣前體蛋白裂解酶1)反義轉(zhuǎn)錄物BACE1-AS是人神經(jīng)系統(tǒng)疾病研究最為透徹的調(diào)控關(guān)鍵基因的lncRNA。BACE1可使淀粉樣前體蛋白(APP)在腦內(nèi)異常代謝導(dǎo)致β淀粉樣蛋白(Aβ)在腦內(nèi)沉積。BACE1 在AD患者腦內(nèi)的表達高于正常人。BACE1-AS能夠在細胞各種外界壓力刺激條件下,與BACE1 mRNA形成RNA復(fù)合物來防止BACE1 mRNA受到核酸酶的降解,從而增加BACE1 mRNA的穩(wěn)定性,導(dǎo)致更多的Aβ累積,且促進更多BACE1-AS的表達,這個正反饋循環(huán)最終加速AD的發(fā)展。研究表明使用BACE1-AS siRNA降低BACE1-AS的表達水平后,BACE1 mRNA與Aβ的表達水平也同時下降,這就表明BACE1-AS是一個較理想的治療AD的藥物靶點[7]。
腦胞質(zhì)(BC)RNA是AD和腦老化的另一種lncRNA。小鼠BC1 RNA和人的BCYRN1/BC200 RNA是將核蛋白顆粒轉(zhuǎn)運到樹突的lncRNA轉(zhuǎn)錄本,可在翻譯水平調(diào)節(jié)基因表達。AD患者Brodmann 9區(qū)(受AD影響的主要腦區(qū))的BCYRN1/BC200水平較相同年齡的正常人持續(xù)升高,且該腦區(qū)的BCYRN1/BC200水平與AD嚴重程度呈正相關(guān)[8]。BCYRN1/BC200 RNA與一些涉及mRNA異常轉(zhuǎn)運的RNA結(jié)合蛋白相互作用,例如翻譯起始調(diào)節(jié)因子poly(A)結(jié)合蛋白(PABP1),與神經(jīng)元和少突膠質(zhì)細胞的mRNA轉(zhuǎn)運有關(guān)的hnRNPA2和突觸結(jié)合胞質(zhì)RNA相互作用蛋白(synaptotagmin-binding cytoplasmic RNA interacting protein,SYNCRIP),SYNCRIP是mRNA轉(zhuǎn)運顆粒的一部分,可能參與神經(jīng)元突觸后位點局部定位蛋白質(zhì)的合成。所有的這些似乎都證明了BCYRN1/BC200在樹突局部蛋白質(zhì)合成中具有調(diào)節(jié)作用,AD和腦老化時CYRN1/BC200的過表達可能引起突觸樹突退化。此外,位于突觸區(qū)域的BC1可能具有BCYRN1/BC200 lncRNA類似的功能,它與翻譯支架復(fù)合體中的關(guān)鍵蛋白相互作用并且通過調(diào)節(jié)決定突觸功能的突觸蛋白質(zhì)的合成維持長時程突觸可塑性。BC1 lncRNA通過抑制與多巴胺D2受體產(chǎn)生相互作用并下調(diào)D2受體的突觸蛋白負向調(diào)節(jié)紋狀體多巴胺D2受體介導(dǎo)的突觸傳遞。將BC1-/-小鼠關(guān)在籠子里飼養(yǎng)時不表現(xiàn)明顯的表型或者神經(jīng)異常,但是當(dāng)將其放養(yǎng)時,BC1-/-小鼠表現(xiàn)出異常認知和異常行為表型,更容易焦慮,成活率降低。
Tab 1 lncRNAs are implicated in Alzheimer’s and cognitive disorder
除了AD,lncRNAs還與認知和行為障礙有關(guān)。例如主要表達在新皮層發(fā)育期Cajal-Retzius細胞的高加速區(qū)1(HAR1)。HAR1控制徑向遷移和皮質(zhì)板錐體神經(jīng)元的層定位。HAR1與涉及正常認知功能和多種認知障礙(例如,神經(jīng)元遷移缺陷、自閉癥、精神分裂癥、雙相性精神障礙、癲癇癥、中風(fēng)和AD)的reelin共表達。亨廷頓病(HD)患者紋狀體中HAR1的表達降低。此外FMR1反義RNA1(FMR4/ASFMR1)與脆性X綜合征(FXS,自閉癥的常見原因)有關(guān)。
lncRNAs也與印跡疾病有關(guān),例如天使綜合征(angelman syndrome,AS)患者的泛素蛋白連接酶E3A(UBE3A)-ATS。天使綜合癥由母系單基因遺傳缺陷所致。UBE3A缺乏導(dǎo)致這種印跡相關(guān)的神經(jīng)發(fā)育障礙。UBE3A在大多數(shù)組織中呈雙等位基因表達,但只有母系等位基因UBE3A在大腦中表達。天使綜合征患者母系UBE3A基因缺失或失活,導(dǎo)致神經(jīng)細胞UBE3A功能性喪失,反義lncRNA轉(zhuǎn)錄物UBE3AATS可調(diào)節(jié)表觀遺傳沉默的父系等位基因,使體內(nèi)沉睡的父系UBE3A基因重新開始活躍,從而增加父系UBE3A在大腦的表達,讓它能夠指導(dǎo)合成大腦發(fā)育所需的正確蛋白質(zhì),而為天使綜合征提供新的治療方案[9]。
神經(jīng)內(nèi)分泌蛋白反義(NESPAS)lncRNA來源于基因座,調(diào)節(jié)在藍斑-去甲腎上腺素系統(tǒng)中明顯表達的神經(jīng)內(nèi)分泌蛋白55(NESP55)。藍斑-去甲腎上腺素系統(tǒng)是狀態(tài)依賴性神經(jīng)網(wǎng)絡(luò)活動的重要調(diào)質(zhì),并與神經(jīng)退行性疾病和神經(jīng)障礙相關(guān)。此外,腦老化及相關(guān)認知表型與lncRNA介導(dǎo)的突觸和神經(jīng)網(wǎng)絡(luò)連通性、可塑性和應(yīng)激反應(yīng)的改變有關(guān)。lncRNA HSR1,在促進細胞保護的熱休克反應(yīng)中起重要作用,并與神經(jīng)發(fā)育、腦老化和各種神經(jīng)退行性疾病的分子發(fā)病機制有關(guān)。
總之,中樞神經(jīng)系統(tǒng)中的轉(zhuǎn)錄境況特別復(fù)雜,因為mRNAs和lncRNAs都受神經(jīng)元活動調(diào)控,這種錯綜復(fù)雜的調(diào)控網(wǎng)絡(luò)的中斷可能會導(dǎo)致正常的大腦發(fā)育和功能的破壞。研究lncRNA的行為機制無疑將為神經(jīng)障礙的分子基礎(chǔ)提供有價值的見解,這可能會產(chǎn)生新的治療和診斷方法。
2.1芯片基因芯片的發(fā)展對于實現(xiàn)基因的大量分析而言是一種飛躍式的進步,它們對于全基因組基因表達分析的巨大容量使得其成為發(fā)現(xiàn)靶標(biāo)的理想工具,從而使我們能夠快速地評估不同組織或不同細胞類型中轉(zhuǎn)錄譜間的差異。隨著越來越多的lncRNA被發(fā)現(xiàn),專門針對lncRNA的芯片也被設(shè)計開發(fā)出來,如晶芯人類長非編碼RNA表達譜芯片和Arraystar lncRNA芯片等同時針對mRNA和lncRNA進行大規(guī)模檢測,發(fā)現(xiàn)差異表達的lncRNA和mRNA,并挖掘二者之間的關(guān)聯(lián)。Arraystar lncRNA芯片檢測支氣管上皮囊性纖維化患者和非囊性纖維化人群發(fā)現(xiàn)在30 586個lncRNA中有差異表達的有1 063個,在26 109個編碼蛋白的基因中720個有差異表達,經(jīng)GO生物信息學(xué)分析顯示囊性纖維化主要與炎癥相關(guān)。研究結(jié)果還提示lncRNA失調(diào)在囊性纖維化患者肺部慢性感染和炎癥中起著重要的作用[10]。
Φrom等用芯片對人成纖維細胞、角質(zhì)細胞和HeLa細胞進行l(wèi)ncRNAs轉(zhuǎn)錄譜分析時檢測到了一千多種lncRNAs。Dinger等采用了專門設(shè)計的芯片來檢查小鼠胚胎干細胞分化期間其胚胎干細胞的表達圖譜,確定在分化期間表達的lncRNAs有945個,其中174個差異性表達并與全能性或特定事件的分化相關(guān)聯(lián)。Pang等發(fā)現(xiàn)CD8+T細胞表達數(shù)百種lncRNAs,其中有許多是淋巴特異性的和/或隨淋巴細胞分化或活化動態(tài)地改變。Mercer等通過芯片平臺揭示了lncRNAs在神經(jīng)元和少突膠質(zhì)細胞譜系特異性、神經(jīng)元-膠質(zhì)細胞命運轉(zhuǎn)換,以及少突膠質(zhì)細胞包括髓鞘形成在內(nèi)的進展期的動態(tài)表達模式。
2.2轉(zhuǎn)錄組分析轉(zhuǎn)錄組(RNA-seq)是指細胞在特定發(fā)育階段或生理狀態(tài)下所有轉(zhuǎn)錄本的集合,包括mRNA、非編碼RNA和小分子RNA。與傳統(tǒng)的芯片雜交相比,RNA-Seq具有定量更準(zhǔn)確、可重復(fù)性更高、檢測范圍更廣、分析更可靠等特點,能夠?qū)θ魏挝锓N進行全基因組水平的基因表達差異研究,可以檢出低豐度轉(zhuǎn)錄本。除了分析基因表達水平,RNASeq還能發(fā)現(xiàn)新的轉(zhuǎn)錄本、SNP、剪接變體,并提供等位基因特異的基因表達。
Soreq等[11]利用RNA-seq技術(shù)和一種用于深度探索全基因組RNA-seq數(shù)據(jù)集的新穎計算流程檢測并分析了帕金森病患者治療前后白細胞的lncRNAs,他們新發(fā)現(xiàn)了7 000多個lncRNAs,大大豐富了目前可利用而又為數(shù)不多的人組織來源的lncRNAs數(shù)據(jù)庫。Pauli等按時間順序在斑馬魚早期發(fā)育的八個階段進行了轉(zhuǎn)錄組測序,確定了在胚胎發(fā)育過程中由多外顯子轉(zhuǎn)錄所產(chǎn)生的1 133個非編碼轉(zhuǎn)錄本。為識別轉(zhuǎn)移性黑色素瘤中差異性表達基因和單核苷酸變異,Liu等[12]使用RNA-seq技術(shù)對兩個正常樣本和兩個轉(zhuǎn)移性黑色素瘤樣本進行了轉(zhuǎn)錄組測序,他們確定了18個顯著的差異性表達基因和33 096個單核苷酸變異。Lin等對iPS細胞來源的人類神經(jīng)元進行轉(zhuǎn)錄組分析結(jié)果顯示lncRNAs參與了神經(jīng)的發(fā)生和神經(jīng)功能障礙。另外,在RNA-seq測序數(shù)據(jù)的幫助下,Rackham等發(fā)現(xiàn)線粒體基因組產(chǎn)生的lncRNAs受核基因編碼的蛋白質(zhì)的調(diào)控。
盡管芯片和RNA-seq是發(fā)現(xiàn)靶標(biāo)非常好的工具,然而待測靶標(biāo)的驗證還有賴于其它分子生物學(xué)方法的幫助。Northern blots、實時定量聚合酶鏈?zhǔn)椒磻?yīng)(Q-PCR)、熒光原位雜交(FISH)、RNA干擾(RNAi)是用來進行高通量數(shù)據(jù)驗證相對比較成熟的方法。
3.1 Northern blots和Q-PCR Northern blots可以直接檢測RNA轉(zhuǎn)錄本的存在和不同發(fā)育階段、不同環(huán)境和不同治療階段組織和細胞RNA的表達模式。實時定量聚合酶鏈?zhǔn)椒磻?yīng)(Q-PCR)是一種擴增并同時量化目標(biāo)分子的實驗室技術(shù),Q-PCR可以結(jié)合逆轉(zhuǎn)錄定量細胞或組織中的信使RNA和非編碼RNA。Furuno等運用Northern blots和Q-PCR證實了已知蛋白編碼基因以外的8個新lncRNAs的存在。Perez等應(yīng)用Northern blots證明了lncRNAs轉(zhuǎn)錄本的長度與癌癥發(fā)病有關(guān)。Q-PCR方法可精確定量不同人體組織及乳腺癌和卵巢癌中每個非編碼RNA的表達。
3.2熒光原位雜交(FISH)FISH是用來檢測和定位組織樣本中特定RNA轉(zhuǎn)錄物的一種細胞遺傳學(xué)技術(shù),它可以幫助定義細胞和組織中基因表達的時空模式。RNA熒光原位雜交(RNA-FISH)是研究lncRNAs的分布和功能的重要工具[13]。研究者們已經(jīng)運用該技術(shù)檢測并定位了許多l(xiāng)ncRNAs,例如Xist、MALAT1、MEN ε/β、Kcnq1ot1和HA117等。為了揭示在X染色體失活中的作用,Chureau等運用RNAFISH技術(shù)分析了FTX在雌性胚胎干細胞分化過程中的表達。Tripathi等運用RNA-FISH技術(shù)分析MALAT1的位置結(jié)果表明MALAT1富集在間期細胞核內(nèi)。Sasaki等通過RNAFISH揭示了MENε/β信號定位于離散斑點,表示核小體存在于所有細胞系中。此外,Redrup等應(yīng)用RNA-FISH技術(shù)于E12.5胎盤切片中檢測KCNQ1、Kcnq1ot1和Xist。進一步實驗結(jié)果表明,Kcnq1ot1形成了一個區(qū)域,若基因位于該區(qū)域內(nèi)部則有可能使表觀遺傳失活,而基因位于該區(qū)域外則沒有這種現(xiàn)象。Liu等[14]用FISH檢測先天性巨結(jié)腸癥患者結(jié)腸時發(fā)現(xiàn)長非編碼RNA HA117主要分布在狹窄段的腸粘膜和肌層。
3.3 RNA干擾(RNAi)自從AndrewFire等揭示了RNA具有干擾基因表達的機制自今,RNAi技術(shù)在生物學(xué)領(lǐng)域得到了長足的發(fā)展,尤其是在lncRNAs的研究領(lǐng)域方面。這與其自身的優(yōu)點是密切相關(guān)的,RNAi對基因表達的選擇性以及其dsRNA的穩(wěn)定性,使RNAi技術(shù)較反義RNA技術(shù)具有一定的優(yōu)勢。
研究發(fā)現(xiàn)采用RNAi技術(shù)降低非編碼RNA的表達可導(dǎo)致其鄰近的蛋白質(zhì)編碼基因表達下降,表明lncRNAs在人類細胞系中起增強子的作用。HOTAIR是一個模塊化的雙功能RNA,對復(fù)合物中核心蛋白復(fù)合體2(PRC2)和LSD1具有不同的結(jié)合結(jié)構(gòu)域。用小干擾RNA沉默HOTAIR可以解除PRC2和LSD1之間的相互作用,這表明HOTAIR可能在PRC2和LSD1之間充當(dāng)支架作用。用shRNA敲低gadd7可以明顯降低脂質(zhì)和非脂質(zhì)誘導(dǎo)的活性氧,還可以明顯地推遲和削弱活性氧引起的內(nèi)質(zhì)網(wǎng)應(yīng)激反應(yīng),這表明非編碼RNA gadd7可能是內(nèi)質(zhì)網(wǎng)應(yīng)激反應(yīng)的調(diào)節(jié)因子。此外,在白血病NB4細胞髓樣分化期間,敲低HOTAIRM1可降低RA誘導(dǎo)的HOXA1和HOXA4的表達,并選擇性地降低髓樣分化基因ITGAM和ITGB218的轉(zhuǎn)錄誘導(dǎo),說明HOTAIRM1通過調(diào)控基因表達在髓細胞生成過程中起著一定作用。
越來越多的研究表明,lncRNAs以RNA-蛋白質(zhì)復(fù)合物的形式起調(diào)控作用,例如染色質(zhì)修飾復(fù)合物、轉(zhuǎn)錄因子復(fù)合物、核糖核蛋白復(fù)合物等。因此,對lncRNAs和蛋白質(zhì)相互作用加以研究有助于揭開lncRNAs生物學(xué)過程的機制。
4.1 RNA免疫沉淀(RIP)在研究活細胞或組織中蛋白質(zhì)和RNA之間的相互作用時,RNA免疫沉積(RNA-immunoprecipatation,RIP)是一種非常有價值的實驗技術(shù)。該技術(shù)運用針對目標(biāo)蛋白的抗體把相應(yīng)的RNA-蛋白質(zhì)復(fù)合物沉淀下來,然后經(jīng)過分離純化就可以對結(jié)合在復(fù)合物上的RNA進行分析。Pandey等用RIP技術(shù)揭示Kcnq1ot1與H3K9甲基轉(zhuǎn)移酶和PRC2間的相互作用。Rinn等借助hnRNP-K的抗體,運用RIP技術(shù)證實了在MEF細胞核抽提物中,lincRNA-p21和hnRNP-K之間存在相互作用,lincRNA-p21通過hnRNP-K調(diào)節(jié)p53介導(dǎo)的細胞凋亡[6]。此外,Zhao等用RIP技術(shù)揭示了RepA、Xist和Tsix都是與PRC2存在相互作用的非編碼RNA。
4.2 RIP-Chip和RIP-Seq RIP-Chip和RIP-Seq是RIP分別與Chip和RNA-seq結(jié)合所形成的衍生技術(shù),目前這兩種技術(shù)都已被廣泛地應(yīng)用于尋找RNA和蛋白的相互作用中。Khalil等用RIP-Chip技術(shù)發(fā)現(xiàn)有大量的lncRNAs與染色質(zhì)修飾復(fù)合物有關(guān)聯(lián)并且影響基因的表達,其中PRC2在干細胞更新和人類疾病中發(fā)揮重要作用。在小鼠胚胎干細胞中,Mohamed等用RIP-Chip技術(shù)揭示了一些保守lncRNAs轉(zhuǎn)錄由POU5F1和NANOG調(diào)控,Nanog可能調(diào)節(jié)干細胞多能性。Zhao等使用RIP-Chip和RIP-Seq方法捕獲胚胎干細胞中PRC2的轉(zhuǎn)錄組,并確定了9000多個與PRC2相互作用的RNA轉(zhuǎn)錄本。
4.3 CLIP和c-KLAN交聯(lián)-免疫沉淀法(crosslinkingimmunopurification,CLIP)為活體實驗中探測RNA與蛋白間的相互作用提供了一種突破性的研究策略。該法的主要過程是用紫外線照射組織或細胞,當(dāng)細胞中RNA和RNA結(jié)合蛋白之間近距離接觸時便可形成共價鍵。紫外交聯(lián)后用免疫共沉淀的試驗方法對RNA及RNA結(jié)合蛋白(RBPs)進行分離純化,RNA隨即被轉(zhuǎn)換成cDNA文庫,并且使用Solexa技術(shù)進行深入測序,與lncRNA結(jié)合的蛋白可通過SDS-PAGE分離染色后進行質(zhì)譜鑒定或直接通過液質(zhì)聯(lián)用的方法進行蛋白質(zhì)鑒定。Ule等首次采用CLIP技術(shù)證實了NOVA依賴性的剪接調(diào)控功能。如今以CLIP技術(shù)為基礎(chǔ)已經(jīng)衍生出了高通量測序交聯(lián)-免疫沉淀技術(shù)(HITS-CLIP)、光活性增強的核糖核苷交聯(lián)和免疫共沉淀技術(shù)(PAR-CLIP)、單核苷酸分辨率交聯(lián)-免疫沉淀技術(shù)(iCLIP)。
非編碼RNA沉默與定位分析技術(shù)(combined knockdown and localization analysis of non-coding RNAs,c-KLAN)是一種近年來發(fā)現(xiàn)的研究lncRNAs功能及其細胞定位非常有價值的技術(shù),該技術(shù)針對目的lncRNA設(shè)計引物,將其逆轉(zhuǎn)錄成cDNA,PCR擴增cDNA。一方面對擴增產(chǎn)物進行體外轉(zhuǎn)錄生成dsRNA,用核糖核酸內(nèi)切酶Ⅲ酶切dsRNA來制備esiRNA(endoribonuclease-prepared siRNA),用于對lncRNA進行功能缺失研究;另一方面用熒光標(biāo)記的UTP對擴增產(chǎn)物進行體外轉(zhuǎn)錄,以制備lncRNAs正義或反義的FISH探針從而達到對特定組織或細胞中靶l(wèi)ncRNAs進行定位的目的。Chakraborty等運用c-KLAN技術(shù)確定了多能性相關(guān)非編碼轉(zhuǎn)錄物1(pluripotency-associated noncoding transcript 1,Panct1)主要位于胚胎干細胞的細胞核中,同時進一步研究發(fā)現(xiàn)Panct1在維持胚胎干細胞的多能性方面起著決定性作用。
4.4 ChIRP-seq ChIRP-seq是以RNA純化的染色質(zhì)分離(chromatin isolation by RNA purification,ChIRP)技術(shù)為基礎(chǔ),經(jīng)進一步改造而形成的,是一種檢測與RNA結(jié)合的DNA和蛋白質(zhì)的高通量測序方法。該法的基本原理是基于生物素和鏈霉親和素之間、寡核苷酸探針與lncRNAs之間的相互作用,生物素化的寡核苷酸探針與lncRNAs雜交后可以被結(jié)合有鏈霉親和素的磁珠拉下來,這樣與lncRNAs結(jié)合的染色質(zhì)復(fù)合體也被拉下來,最后把染色體片段做高通量測序,以確定該lncRNA能夠結(jié)合到基因組的哪些區(qū)域。Quinn等運用ChIRP-seq技術(shù)確定了3個lncRNAs(drosophila roX2、human TERC和HOTAIR)在基因組上的定位,這些lncRNAs的結(jié)合位點具有序列特異性或區(qū)域特異性。例如,roX2主要定位于X染色體上,并且趨向定位于每個基因的3'端; TERC主要富集于端粒DNA和Wnt受體信號通路基因上; HOTAIR lncRNA優(yōu)先定位于富含GA的DNA區(qū)域。
最近,Chang等對ChIRP進行了改造,發(fā)布了稱為dChIRP(domain-specific ChIRP)的新技術(shù)。該技術(shù)可以在天然環(huán)境下剖析lncRNAs不同結(jié)構(gòu)域的功能,這無疑將為研究lncRNAs功能提供了又一個實用的工具。他們首先設(shè)計了生物素化的反義寡核苷酸池來靶標(biāo)lncRNAs的特定結(jié)構(gòu)域。隨后通過交聯(lián)保護了細胞中的lncRNAs互作,并利用超聲處理使lncRNAs形成結(jié)構(gòu)域大小的片段。最后通過鏈霉親和素磁珠,將lncRNAs結(jié)構(gòu)域連同它的互作搭檔一起純化出來,并對這些純化產(chǎn)物進行分析(WB、逆轉(zhuǎn)錄定量PCR、定量PCR或者測序),從而鑒定了RNA-蛋白、RNA-RNA和RNA-染色質(zhì)間的互作。通過dChIRP技術(shù)他們對一種稱為roX1的雄性果蠅劑量補償效應(yīng)所需的lncRNAs進行研究,并揭示了roX1功能域的組成結(jié)構(gòu),向人們展示了由3個不同結(jié)構(gòu)域組成的3指手掌結(jié)構(gòu),其中的3個指狀結(jié)構(gòu)域負責(zé)與染色質(zhì)互作,是功能獨立的RNA亞單位[15]。
與耗時且昂貴的傳統(tǒng)實驗方法相比,用生物信息學(xué)技術(shù)對lncRNAs的功能進行計算預(yù)測正逐漸得到研究人員的青睞。例如,Tartaglia等開發(fā)的catRAPID在線算法,該算法可以通過對所要研究的蛋白和RNA的序列分析來預(yù)測它們之間可能存在的相互作用,其基本原理是基于RNA和蛋白質(zhì)的二級結(jié)構(gòu)、氫鍵和分子間作用力。據(jù)Tartaglia介紹,該算法可在10 min內(nèi)完成輸入序列與整個轉(zhuǎn)錄組(或蛋白質(zhì)組)的比對分析,這大大節(jié)約了實驗時間與實驗成本。其網(wǎng)址為http://service.tartaglialab.com/page/catrapid_group。Liao等已經(jīng)利用catRAPID算法預(yù)測了約340個lncRNAs的功能,主要涉及器官或組織的生成,細胞轉(zhuǎn)運或代謝過程等方面。
在lncRNAs的功能研究中,建立相關(guān)的lncRNAs數(shù)據(jù)庫并對lncRNAs進行功能注釋是非常有必要的,這使得研究人員知道要尋找什么,并讓他們知道如何對他們新發(fā)現(xiàn)的東西進行命名,從而方便其他研究人員對lncRNAs進行研究。為了便于研究和學(xué)術(shù)交流,相關(guān)研究人員已經(jīng)建立了多個在線1ncRNA數(shù)據(jù)庫(Tab 2)。這些數(shù)據(jù)庫所收錄的1ncRNA數(shù)據(jù)來自已發(fā)表的論文和GenBank。
Tab 2 Publicly available lncRNA online databases
近年來對lncRNAs的研究呈現(xiàn)出一種井噴模式,然而與已發(fā)現(xiàn)的lncRNAs的數(shù)量相比,目前對lncRNAs功能研究所取得的成果依舊很少,其主要原因如下:首先,lncRNAs物種之間保守性不高,這使得不同生物之間進行l(wèi)ncRNAs功能比對更加困難,同時也導(dǎo)致了一個給定的lncRNAs功能的不確定性。其次,lncRNAs數(shù)據(jù)庫還不充足,lncRNAs功能預(yù)測工具還很少,以及l(fā)ncRNAs功能研究的實驗技術(shù)還不完善等原因都對lncRNAs的功能研究有一定的限制。
但是我們必須認識到,lncRNAs的功能研究尚處于起步階段,就lncRNAs的研究正逐漸成為基因組研究的又一個熱點以及當(dāng)前生物信息技術(shù)的快速發(fā)展而言,我們相信更多的科研人員將投身于lncRNAs的功能研究中,更多更有效的研究工具將如雨后春筍般層出不窮,這必將有助于我們進一步解析lncRNAs的功能及其分子調(diào)控機制,最終揭開lncRNAs的神秘面紗。
參考文獻:
[1]Hung T,Chang H Y.Long noncoding RNA in genome regulation: prospects and mechanisms[J].RNA Biol,2010,7(5): 582-5.
[2]Okazaki Y,F(xiàn)uruno M,Kasukawa T,et al.Analysis of the mouse transcriptome based on functional annotation of 60,770 full-length cDNAs[J].Nature,2002,420(6915): 563-73.
[3]Li X,Wu Z,F(xiàn)u X,et al.lncRNAs: Insights into their function and mechanics in underlying disorders[J].Mutat Res Rev Mutat Res,2014,762: 1-21.
[4]Abdelmohsen K,Panda A,Kang M J,et al.Senescence-associated lncRNAs: senescence-associated long noncoding RNAs[J].Aging Cell,2013,12(5): 890-900.
[5]Tripathi V,Shen Z,Chakraborty A,et al.Long noncoding RNA MALAT1 controls cell cycle progression by regulating the expression of oncogenic transcription factor B-MYB[J].PLoS Genet,2013,9(3): e1003368.
[6]Wu G,Cai J,Han Y,et al.LincRNA-p21 regulates neointima formation,vascular smooth muscle cell proliferation,apoptosis,and atherosclerosis by enhancing p53 activity[J].Circulation,2014,130(17):1452-65.
[7]Evin G,Hince C.BACE1 as a therapeutic target in Alzheimer’s disease: rationale and current status[J].Drugs Aging,2013,30(10):755-64.
[8]徐宏,梁尚棟.長非編碼RNA與其他表觀遺傳學(xué)的相互調(diào)控與神經(jīng)系統(tǒng)疾?。跩].中國藥理學(xué)通報,2012,28(10): 1348 -51.
[8]Xu H,Liang S D.Epigenetic regulation mediated by long noncoding RNA in nervous system disease[J].Chin Pharmacol Bull,2012,28(10):1348-51.
[9]Martins-Taylor K,Hsiao J S,Chen P F,et al.Imprinted expression of UBE3A in non-neuronal cells from a Prader-Willi syndrome patient with an atypical deletion[J].Hum Mol Genet,2014,23(9):2364-73.
[10]McKiernan P J,Molloy K,Cryan S A,et al.Long noncoding RNA are aberrantly expressed in vivo in the cystic fibrosis bronchial epithelium[J].Int J Biochem Cell Biol,2014,52:184-91.
[11]Soreq L,Guffanti A,Salomonis N,et al.Long non-coding RNA and alternative splicing modulations in Parkinson's leukocytes identified by RNA sequencing.[J].PLoS Comput Biol,2014,10(3): e1003517.
[12]Liu D,Zhao Z G,Jiao Z L,et al.Identifying differential expression genes and single nucleotide variations using RNA-seq in metastatic melanoma[J].Genet Mol Res,2014,13(4): 8153-62.
[13]Tripathi V,F(xiàn)ei J,Ha T,et al.RNA fluorescence in situ hybridization in cultured Mammalian cells[J].Methods Mol Biol,2015,1206:123-36.
[14]Liu H,Luo Y,Li S,et al.Expression profiles of HA117 and its neighboring gene DPF3 in different colon segments of Hirschsprung’s disease[J].Int J Clin Exp Pathol,2014,7(7):3966-74.
[15]Quinn J J,Ilik I A,Qu K,et al.Revealing long noncoding RNA architecture and functions using domain-specific chromatin isolation by RNA purification[J].Nat Biotechnol,2014,32(9): 933-40.
[16]Erdmann V A,Szymanski M,Hochberg A,et al.Non-coding,mRNA-like RNAs database Y2K[J].Nucleic Acids Res,2000,28(1): 197-200.
[17]Mituyama T,Yamada K,Hattori E,et al.The Functional RNA Database 3.0: databases to support mining and annotation of functional RNAs[J].Nucleic Acids Res,2009,37: D89-92.
[18]Dinger M E,Pang K C,Mercer T R,et al.NRED: a database of long noncoding RNA expression[J].Nucleic Acids Res,2009,37: D122-6.
[19]Amaral P P,Clark M B,Gascoigne D K,et al.1ncRNAdb: a reference database for long noncoding RNAs[J].Nucleic Acids Res,2011,39: D146-51.
[20]Liao Q,Xiao H,Bu D C,et al.ncFANs: a web server for functional annotation of long non-coding RNAs[J].Nucleic Acids Res,2011,39(Web Server issue): W118-24.
[21]Xie C,Yuan J,Li H,et al.NONCODEv4: exploring the world of long non-coding RNA genes[J].Nucleic Acids Res,2014,42: D98-103.
[22]Volders P J,Helsens K,Wang X,et al.LNCipedia: A database for annotated human lncRNA transcript sequences and structures [J].Nucleic Acids Res,2013,41: D246-51.
[23]Pang K C,Stephen S,Dinger M E,et al.RNAdb 2.0—an expanded database of mammalian non-coding RNAs[J].Nucleic Acids Res,2007,35: D178-82.
[24]Erdmann V A,Szymanski M,Hochberg A,et al.Non-coding,mRNA-like RNAs database Y2K[J].Nucleic Acids Res,2000,28(1):197-200.
[25]Burge S W,Daub J,Eberhardt R,et al.Rfam 11.0: 10 years of RNA families[J].Nucleic Acids Res,2013,41: D226-32.
[26]Yang J H,Li J H,Jiang S,et al.ChiPBase: A database for decoding the transcriptional regulation of long non-coding RNA and microRNA genes from chip-seq data[J].Nucleic Acids Res,2013,41: D177-87.
[27]Chen G,Wang Z,Wang D,et al.lncRNAdisease: A database for long-non-coding RNA-associated diseases[J].Nucleic Acids Res,2013,41: D983-6.
On function of long noncoding RNA
JIANG Huai-de,LI Gui-lin
(Dept of Physiology,Basic Medical College of Nanchang University,Nanchang 330006,China)
Abstract:Long noncoding RNAs(lncRNAs)are transcribed RNA molecules greater than 200 nucleotides in length.In recent years,studies have shown that lncRNAs have many important biological functions.With the development of modern biological technology,lncRNAs transcripts can be easily detected and predicted.However,unlike protein-coding genes whose sequence motifs usually have indicative function,lncRNA sequence information is currently uninformative for function prediction.Thus,how to decode the function of lncRNAs has gradually become a hot issue in genome research.The paper summarizes the studies regarding the methods to probe the function of lncRNAs.
Key words:long noncoding RNA; aging; diseases related to aging; transcriptome analysis; the research methods; bioinformatics
作者簡介:姜懷德(1990-),男,碩士生,研究方向:神經(jīng)生理學(xué)和藥理學(xué),E-mail: jianghd1101@126.com;
基金項目:國家自然科學(xué)基金資助課題(No 81200853,81171184,31060139)
收稿日期:2015-03-25,修回日期:2015-04-23
文獻標(biāo)志碼:A
文章編號:1001-1978(2015)07-0900-06
doi:10.3969/j.issn.1001-1978.2015.07.003