荊曉燕,張彩霞,宋艷芳,劉東宇,劉 娣,楊秀芹*
(1. 東北農(nóng)業(yè)大學(xué)動(dòng)物科技學(xué)院,哈爾濱 150030; 2. 黑龍江省農(nóng)業(yè)科學(xué)院,哈爾濱 150086)
真核生物基因多數(shù)是斷裂的,由外顯子和內(nèi)含子組成,轉(zhuǎn)錄時(shí)首先形成初始轉(zhuǎn)錄本——pre-mRNA,再經(jīng)過剪接去掉內(nèi)含子并把外顯子按照5′→3′的順序連接起來,得到成熟mRNA。傳統(tǒng)剪接發(fā)生于同一個(gè)pre-mRNA內(nèi)部,成熟RNA的外顯子都來源于同一個(gè)初始轉(zhuǎn)錄本,稱為順式剪接(cis-splicing, CS)。反式剪接(trans-splicing, TS)則發(fā)生于不同的初始轉(zhuǎn)錄本之間,剪接產(chǎn)物是含有不同來源外顯子的嵌合RNAs。TS最早發(fā)現(xiàn)于低等真核生物,哺乳動(dòng)物的相關(guān)研究起步較晚,近年來,第二代高通量測(cè)序技術(shù)的發(fā)展為TS鑒定提供了有力工具,TS及其產(chǎn)物在生命活動(dòng)、疾病發(fā)生中的作用也逐漸得到重視。本文對(duì)TS概念、類型、產(chǎn)生機(jī)制及其在哺乳動(dòng)物中的作用進(jìn)行綜述。
TS可歸納為兩種類型:SL(spliced-leader)-型和非SL-型,非SL-型又包括基因內(nèi)TS和基因間TS。SL-型TS只存在于低等真核生物,在脊椎動(dòng)物中非SL-型取代了SL型,且發(fā)生的頻率顯著降低。SL-型TS與操縱子密切相關(guān),有研究認(rèn)為,隨著操縱子的丟失和基因組復(fù)雜性的增加,TS逐漸轉(zhuǎn)化為CS,說明剪接在生物進(jìn)化過程中具有重要意義[1]。
SL-型TS是指來源于一個(gè)非編碼RNA(SL RNA)5′末端的前導(dǎo)序列被剪接到pre-mRNA的5′端,在產(chǎn)生的成熟mRNA中前導(dǎo)序列不具有編碼作用,故SL-型TS不影響原有mRNA的翻譯結(jié)果,該過程類似于高等生物基因的5′加帽,能夠提高mRNA穩(wěn)定性,促進(jìn)翻譯。SL RNA的前導(dǎo)序列也被稱為外顯子(SLe),余下部分為內(nèi)含子(SLi)。SLe的長(zhǎng)度隨著物種的不同而改變,介于16~51 nt之間。同一個(gè)SLe可以與許多、甚至是物種內(nèi)全部pre-mRNA進(jìn)行TS,由此形成的成熟mRNA含有共同的5′末端。各物種SL RNA序列相似性不高,但都具有高甲基化的5′帽子結(jié)構(gòu)、較短的SLe序列和莖環(huán)二級(jí)結(jié)構(gòu),并且莖環(huán)結(jié)構(gòu)的一個(gè)配對(duì)區(qū)含有5′剪接位點(diǎn)(splice site, SS)和Sm蛋白結(jié)合位點(diǎn)[2]。
SL-型TS存在兩種類型:一種剪接發(fā)生于SLe和pre-mRNA的5′游離末端;此外,許多低等真核生物基因以操縱子形式存在,即多個(gè)基因共用一個(gè)啟動(dòng)子,所以也存在著SL RNA和操縱子內(nèi)部基因間的TS,剪接發(fā)生于SLe和pre-mRNA的5′非游離序列(圖1A)。有些生物(如錐體蟲)只有一種SL RNA參與所有的TS反應(yīng)[3];而在秀麗線蟲及其親緣種中,上述兩種TS反應(yīng)分別由不同的SL RNA(SL1和SL2)負(fù)責(zé),這可能是不同環(huán)境和發(fā)育階段下轉(zhuǎn)錄本差異表達(dá)的原因[4]。SL-型TS廣泛存在于低等真核生物中,錐體蟲每個(gè)蛋白編碼基因都會(huì)通過該方式形成SL帽狀RNA[3]。
a. 同一pre-mRNA的兩個(gè)拷貝或等位基因間的剪接;b. 同一基因座正反兩條鏈間的剪接。方框表示外顯子,不同顏色或背景的方框表示來自不同基因。tss. 反式剪接位點(diǎn)a. Trans-splicing between two copies of the same pre-mRNA or alleles; b. Trans-splicing between sense and antisense DNA at the same locus. Boxes indicate exon, those boxes with different colors or backgrounds indicate exons from different genes. Tss. Trans-splicing site圖1 反式剪接類型Fig.1 Types of trans-splicing
基因內(nèi)TS的初始轉(zhuǎn)錄本來源于同一個(gè)基因座,可發(fā)生于同一pre-mRNA的兩個(gè)拷貝、等位基因以及同一DNA分子兩條鏈的轉(zhuǎn)錄產(chǎn)物間(圖1B),往往造成外顯子重復(fù)和正義-反義鏈融合[4]。在果蠅[5]和家蠶[6]中研究得比較透徹的mod(mdg)基因座能形成一系列基因內(nèi)TS產(chǎn)物,這些成熟mRNAs的5′外顯子相同,均來自于同一個(gè)基因的5′端,家蠶是BGIBMGA006426基因的外顯子1~4;3′外顯子是可變的,分別來自于反向平行鏈的不同基因,家蠶中已鑒定了8個(gè)不同基因。家蠶的1個(gè)上游基因和8個(gè)下游基因產(chǎn)生了9種成熟mRNAs,其中兩個(gè)mRNAs的3′端來源于同一個(gè)基因,但外顯子組成不同(圖2),這說明TS也存在著可變剪接。目前可變反式剪接(alternativetrans-splicing, ATS)還沒有統(tǒng)一的定義,筆者認(rèn)為應(yīng)該為兩個(gè)或多個(gè)特定的pre-RNAs分子經(jīng)過TS形成多種嵌合RNAs的過程。mod(mdg)基因編碼產(chǎn)物在兩個(gè)物種間非常相似:5′外顯子編碼產(chǎn)生BTB(BR2C, ttk and bab)結(jié)構(gòu)域;3′外顯子盡管來源于不同的基因,但都編碼產(chǎn)生保守的FLYWCH基序。家蠶9個(gè)成熟mRNAs均編碼產(chǎn)生317 aa殘基的蛋白質(zhì)多肽鏈。大鼠COT(carnitine octanoyltransferase)基因cDNA的外顯子重復(fù)現(xiàn)象及產(chǎn)生機(jī)制分析,首次證明了哺乳動(dòng)物中存在著自發(fā)的TS反應(yīng)[7];對(duì)綿羊T細(xì)胞受體β鏈(T cell receptor β-chain, TRB)基因座轉(zhuǎn)錄產(chǎn)物的克隆分析表明,在該區(qū)域存在著較高頻率的基因內(nèi)TS事件,這也是其編碼蛋白功能復(fù)雜的原因之一[8]。
基因間TS是不同來源的初始轉(zhuǎn)錄本間發(fā)生剪接,在pre-mRNA之間以及pre-mRNA和非編碼RNA之間都能發(fā)生;進(jìn)行剪接的基因可位于同一條染色體上,也可位于不同染色體上(圖1C)。自二十世紀(jì)九十年代初期在胎鼠肝組織中發(fā)現(xiàn)基因間TS后[9],這方面的研究逐漸增多,人、小鼠和果蠅中都鑒定到該現(xiàn)象。雖然一度被認(rèn)為是轉(zhuǎn)錄組中的稀有事件,深度測(cè)序技術(shù)的普及應(yīng)用及高性能生物信息學(xué)軟件的開發(fā)、完善,為在全轉(zhuǎn)錄組水平上進(jìn)行TS的高通量鑒定提供了有效手段,大量基因間TS現(xiàn)象也隨之被鑒定,其在生命活動(dòng)中的重要性正逐漸被揭示[10-12]。
基因間TS也存在著復(fù)雜的可變剪接現(xiàn)象。嵌合子ZC3HAV1L-CHMP1A的兩個(gè)親本基因分別位于人7和16號(hào)染色體上,兩個(gè)親本通過TS產(chǎn)生的嵌合子有5種可變轉(zhuǎn)錄本(圖2),其中轉(zhuǎn)錄本a是主 要的ATS產(chǎn)物,廣泛表達(dá)于多種組織和細(xì)胞內(nèi),兩個(gè)親本基因?yàn)榭騼?nèi)融合,預(yù)期可編碼產(chǎn)生融合蛋白;轉(zhuǎn)錄本a~d使用經(jīng)典的SSs進(jìn)行TS;轉(zhuǎn)錄本e的嵌合點(diǎn)位于ZC3HAV1L外顯子4末端和CHMP1A外顯子6內(nèi)部,不符合GT-AG規(guī)則,在交界處存在著一個(gè)5 bp的正向重復(fù)序列,筆者認(rèn)為其可能是轉(zhuǎn)錄過程中模板轉(zhuǎn)換導(dǎo)致的(圖2)[13]。
方框表示外顯子,直線表示內(nèi)含子,不同顏色的方框分別表示部分外顯子和內(nèi)含子(用i表示)。a、b、c、d、e表示可變轉(zhuǎn)錄本Boxes indicate exon, lines indicate intron, those closed boxes with different colors indicate partial of an exon or retained intron (indicated with i). a,b,c,d,e indicate the alternative transcripts圖2 家蠶mod4(mdg4)和人ZC3HAV1L-CHMP1A基因的可變反式剪接[6, 13]Fig.2 Alternative trans-splicing of silk worm mod4(mdg4) and human ZC3HAV1L-CHMP1A genes[6, 13]
I型內(nèi)含子[14]、II型內(nèi)含子[15]和tRNA[16]都存在TS現(xiàn)象,但他們都是不依賴于剪接體的TS,本文只對(duì)剪接體介導(dǎo)的RNA反式剪接(spliceosome-mediated RNAtrans-splicing, SMaRT)產(chǎn)生機(jī)制進(jìn)行介紹。
一系列研究表明,SMaRT具有和CS相同的剪接機(jī)制。首先,具有相同的剪接信號(hào)。TS不存在特殊的反式剪接位點(diǎn)(trans-splice sites, TSSs)。綿羊TRB基因座含有3個(gè)D-J-C(多樣區(qū)-連接區(qū)-恒定區(qū))基因簇,該區(qū)域的TS都發(fā)生于D/J和J/C連接點(diǎn),沒有形成新的SSs[8];Ma等[17]通過高通量測(cè)序技術(shù)在豬上鑒定了251個(gè)嵌合RNAs,其中大多數(shù)分子的SSs符合GT-AG規(guī)則。
其次,具有相似的剪接體組分。U1、U2、U4/U6和U5等核內(nèi)小核糖核蛋白(small nuclear ribonucleoproteins, snRNP)共同組裝成順式剪接體。早期在秀麗線蟲和蛔蟲中的研究表明,U2、U4/U6、U5等snRNPs都是SL-型TS的基本因子[18],后來發(fā)現(xiàn),錐體蟲中U1 snRNP在CS和TS中發(fā)揮著雙重作用[19]。
另外,具有類似的剪接調(diào)控因子。SR蛋白、Sm蛋白、核內(nèi)不均一核糖核蛋白和多聚嘧啶序列結(jié)合蛋白等順式剪接調(diào)控因子均參與調(diào)控TS[20-23]。在目前鑒定的哺乳動(dòng)物TS反應(yīng)中,尚未發(fā)現(xiàn)特殊的剪接調(diào)控因子。
2.2.1 形成Y-結(jié)構(gòu) 不同于CS的套馬索結(jié)構(gòu),TS的中間產(chǎn)物是一個(gè)Y-結(jié)構(gòu)。Y-結(jié)構(gòu)最早是在研究錐體蟲SL-型TS中發(fā)現(xiàn)的[24],全轉(zhuǎn)錄組水平上的研究進(jìn)一步證明了Y-結(jié)構(gòu)存在的普遍性[25]。在進(jìn)行TS時(shí),被剪接掉的區(qū)域不是一個(gè)連續(xù)的內(nèi)含子,而是來自于兩個(gè)不同的基因,剪接供體位點(diǎn)和分支點(diǎn)分別位于不同的基因上,當(dāng)分支點(diǎn)游離羥基與5′ SS通過2′-5′磷酸二酯鍵結(jié)合后,反式內(nèi)含子的上游和下游之間不能形成一個(gè)閉合的套馬索結(jié)構(gòu),而是開放的Y-結(jié)構(gòu)(圖3)。
圖3 反式剪接的Y結(jié)構(gòu)Fig.3 Y-structure in trans-splicing
2.2.2 含有互補(bǔ)配對(duì)序列 CS的外顯子都位于一個(gè)基因上,彼此具有較近的物理距離。TS的反式內(nèi)含子則含有互補(bǔ)配對(duì)序列,通過該序列形成二級(jí)結(jié)構(gòu),促進(jìn)兩個(gè)獨(dú)立pre-mRNA彼此靠近,為剪接反應(yīng)創(chuàng)造條件(圖4)。人和小鼠TS的上游內(nèi)含子含有嘧啶富集區(qū),下游內(nèi)含子具有嘌呤富集區(qū),二者幾乎能夠完全互補(bǔ)配對(duì)[26]。腸賈第蟲HSP90和OADβ基因都是TS產(chǎn)物,其中HSP90反式內(nèi)含子的上、下游區(qū)域含有26 bp互補(bǔ)配對(duì)區(qū),OADβ基因在配對(duì)的堿基數(shù)和序列組成上存在著一定的差別,但也能形成二級(jí)結(jié)構(gòu)[27]。秀麗線蟲位于eri-6和eri-7位點(diǎn)之間的正向重復(fù)序列介導(dǎo)了這兩個(gè)獨(dú)立基因間的TS,從而形成ERI-6/7蛋白的完整編碼序列[28]。
長(zhǎng)方形表示外顯子,直線表示內(nèi)含子或外含子Rectangles indicate exon, lines indicate intron or outron圖4 互補(bǔ)配對(duì)結(jié)構(gòu)及序列的反式剪接Fig.4 Complementary structure and its trans-splicing
低等真核生物的SL-型TS是在pre-mRNA的5′端加上一個(gè)帽狀結(jié)構(gòu),不改變其原有的編碼作用,因此不影響蛋白質(zhì)組的復(fù)雜性和多樣性,該種剪接主要對(duì)mRNA進(jìn)行表達(dá)調(diào)控[29],不涉及到編碼蛋白質(zhì)的功能性通路。本文主要對(duì)哺乳動(dòng)物TS及其嵌合體的功能進(jìn)行介紹。
TS把兩個(gè)或多個(gè)不同來源的pre-RNA分子剪接成一個(gè)嵌合分子,這種來源的嵌合RNA也稱為tsRNA(trans-splicing RNA),嵌合點(diǎn)的位置存在著以下幾種可能:(1)位于UTR區(qū),導(dǎo)致一個(gè)親本基因的5′或者3′ UTR發(fā)生改變;(2)位于編碼區(qū)內(nèi)部,但破壞了原有的讀碼框,導(dǎo)致移碼融合(frame-shift fusion)。大部分TS屬于該種形式[12],所產(chǎn)生的嵌合子可以作為長(zhǎng)鏈非編碼RNA發(fā)揮作用;也可能在嵌合點(diǎn)下游形成提前終止密碼子,從而被生物體內(nèi)的監(jiān)測(cè)系統(tǒng)——無義介導(dǎo)的mRNA降解機(jī)制——降解掉;(3)位于編碼區(qū)內(nèi)部,并且不破壞兩個(gè)基因的讀碼框,即發(fā)生了框內(nèi)融合,嵌合子編碼產(chǎn)生融合蛋白。因此,通過形成tsRNA,TS能夠影響親本基因表達(dá)、形成新蛋白質(zhì)或非編碼RNA,在細(xì)胞活力和生長(zhǎng)、基因表達(dá)調(diào)控、信號(hào)轉(zhuǎn)導(dǎo)等一系列生物過程中發(fā)揮著重要的調(diào)控作用。
人?;o酶A:膽固醇?;D(zhuǎn)移酶1(acyl-coenzyme A:cholesterol acyltransferase 1,ACAT1)基因通過TS形成的一種轉(zhuǎn)錄變異體(4.3-kb mRNA),幾乎存在于所有組織細(xì)胞內(nèi)[30]。通過起始密碼子的選擇性使用,4.3-kb mRNA翻譯產(chǎn)生正常的ACAT1酶(50 ku)和N-端含有額外序列的一種亞型(56 ku),該亞型的活性是正常酶(50 ku)的30%[31]。因此,ACAT1通過產(chǎn)生嵌合RNA來競(jìng)爭(zhēng)使用pre-mRNA,從而調(diào)控正常序列表達(dá)、影響酶活性。小鼠5號(hào)染色體上的非編碼RNA(Dmr)和19號(hào)染色體上的Dmrt1基因形成的嵌合子,編碼產(chǎn)生缺少C端的Dmrt1蛋白,Dmr主要充當(dāng)嵌合子的3′ UTR,促進(jìn)TS、下調(diào)正常Dmrt1蛋白表達(dá)量[32]。HongrES2是大鼠附睪組織中鑒定的嵌合、非編碼RNA,其下游基因?yàn)楦讲G特異表達(dá)的CES7,HongrES2具有5′ 帽子結(jié)構(gòu)和3′ poly(A)尾,類似于mRNA前體,加工成熟后的產(chǎn)物為microRNA樣小RNA(microRNA-like small RNA),能夠抑制CES7基因表達(dá)[33]。
Hirano和Noda[34]利用簡(jiǎn)并PCR在精子cDNA 文庫中分離得到了減數(shù)分裂同源重組基因Msh4的7條cDNA,其中3條(Msh4β、ε和δ)是基因間TS產(chǎn)物,主要表達(dá)于精子中,Msh4β和ε在腦、心、胸腺和卵巢等組織中也有少量表達(dá);進(jìn)一步研究發(fā)現(xiàn),Msh4δ能在精子發(fā)生過程中誘導(dǎo)細(xì)胞程序性死亡。嵌合分子CYCLIN D1-TROP2編碼產(chǎn)生截短的CYCLIN D1(細(xì)胞周期蛋白D1)和TROP2(滋養(yǎng)層細(xì)胞表面抗原-2),在原代培養(yǎng)的細(xì)胞中異源低表達(dá)CYCLIN D1-TROP2,促進(jìn)細(xì)胞增殖、延長(zhǎng)壽命,高表達(dá)則能導(dǎo)致細(xì)胞轉(zhuǎn)化[35]。CHD2和CHMP1A基因分別位于人15和16號(hào)染色體上,二者編碼的蛋白質(zhì)都調(diào)控染色質(zhì)/DNA結(jié)構(gòu),嵌合分子CHD2-CHMP1A在多種腫瘤組織和細(xì)胞系中表達(dá),通過RNAi技術(shù)敲低其在HBL-100細(xì)胞系中的表達(dá)后,細(xì)胞生長(zhǎng)受到明顯抑制[36]。在腎癌和結(jié)腸癌細(xì)胞中檢測(cè)到的tsADK-DHX8能夠調(diào)控細(xì)胞生長(zhǎng)[36]。
細(xì)胞過度生長(zhǎng)和細(xì)胞周期改變都是癌癥的標(biāo)志[37],tsRNA與癌癥發(fā)生、發(fā)展存在著密切關(guān)系,可以作為腫瘤診斷的生物標(biāo)記[38]。約90%的前列腺癌細(xì)胞都表達(dá)TMEM79-SMG5嵌合分子,在健康的對(duì)照組織中不表達(dá)[39]。嵌合分子MN1-FLI和NIPBL-HOXB9被注入到小鼠骨髓后,能夠誘發(fā)白血病[40]。CYCLIN D1-TROP2是一種強(qiáng)致癌因子,能促進(jìn)侵襲性腫瘤生長(zhǎng)[35]。Xie等[41]通過對(duì)多種組織和癌細(xì)胞檢測(cè)發(fā)現(xiàn),除了嵌合分子PAX3-FOXO1,還有些tsRNA在橫紋肌肉瘤細(xì)胞系和臨床樣本中特異表達(dá),并具有與PAX3-FOXO1相同的瞬時(shí)表達(dá)模式。此外,原發(fā)性大腸癌[42]、急性髓樣白血病[43]等疾病中都鑒定出了相關(guān)嵌合分子。
TS和染色體重排存在著一定的聯(lián)系。染色體易位[t(7;17)(p15q21)]形成的嵌合分子JAZF1-JJAZ1與子宮內(nèi)膜間質(zhì)腫瘤具有明顯相關(guān)[44],研究發(fā)現(xiàn),在染色體組成正常非腫瘤細(xì)胞內(nèi)也存在著tsJAZF1-JJAZ1[45]。tsJAZF1-JJAZ1在子宮內(nèi)膜基質(zhì)細(xì)胞發(fā)育中受到嚴(yán)格的表達(dá)調(diào)控,嵌合子的轉(zhuǎn)錄量明顯低于親本基因,翻譯產(chǎn)生的嵌合蛋白具有抗凋亡作用[45]。人、鼠上的熒光原位雜交分析發(fā)現(xiàn)[46],位于15號(hào)染色體上的原癌基因Myc和12號(hào)染色體上的免疫球蛋白重鏈基因Igh共同出現(xiàn)在同一個(gè)轉(zhuǎn)錄工廠(transcription factory)上,具備發(fā)生TS的條件。而在漿細(xì)胞瘤和伯基特淋巴瘤患者中,這兩個(gè)位點(diǎn)非常頻繁地發(fā)生易位。人2號(hào)和13號(hào)染色體易位形成的嵌合分子PAX3-FOXO1,是腺泡狀橫紋肌肉瘤(alveolar rhabdomyosarcoma, ARMS)的診斷標(biāo)志物和治療靶標(biāo)[47],其編碼的嵌合蛋白誘導(dǎo)肌肉生成、并抑制其分化產(chǎn)生成熟肌肉組織[48]。沒有發(fā)生易位的間充質(zhì)干細(xì)胞和胎兒肌肉組織均能形成tsPAX3-FOXO1[49]。在間充質(zhì)干細(xì)胞中,該嵌合分子在其他生肌因子轉(zhuǎn)錄之前瞬時(shí)表達(dá);在胎兒肌肉組織中,其相對(duì)表達(dá)量遠(yuǎn)低于橫紋肌肉瘤細(xì)胞系。過表達(dá)PAX3-FOXO1導(dǎo)致MyoD和Myogenin兩種肌肉標(biāo)記物持續(xù)表達(dá),并最終形成ARMS的肌肉發(fā)育和過表達(dá)癥狀。綜上,研究者認(rèn)為,tsRNA具有重要的生理功能,是機(jī)體正常生長(zhǎng)發(fā)育所必須的;同時(shí)可作為骨架促進(jìn)染色體間相互作用,是染色體發(fā)生重排的前提條件[50];而染色體重排造成的嵌合子表達(dá)失調(diào)是導(dǎo)致癌轉(zhuǎn)化的原因[45]。
Wu等[51]在生物信息學(xué)分析基礎(chǔ)上,通過兩種逆轉(zhuǎn)錄酶(MMLV和AMV)催化的RT-PCR反應(yīng)及RNase保護(hù)試驗(yàn),在人胚胎干細(xì)胞(human embryonic stem cell, hESC)中鑒定了4個(gè)tsRNA——tsCSNK1G3、tsARHGAP5、tsFAT1和tsRMST,他們均在hESC體外分化過程中差異表達(dá)。其中,tsRMST在hESC和多種體細(xì)胞(皮膚成纖維細(xì)胞、毛乳頭細(xì)胞和顆粒細(xì)胞)重編程形成的誘導(dǎo)性多能干細(xì)胞中高表達(dá),但在肌肉、肝、腎等10種分化的組織中不表達(dá)。利用小發(fā)卡RNA (small hairpin RNA, shRNA)敲低tsRMST表達(dá),hESC中多能性基因(NANOG、POU5F1、SOX2和TCF7L1)的表達(dá)受到顯著抑制,而種系特異的轉(zhuǎn)錄因子(GATA6和PAX6)表達(dá)量增加,進(jìn)一步分析證明了tsRMST通過招募NANOG和PRC2復(fù)合體抑制種系特異基因表達(dá),維持hESC多能性。
G蛋白信號(hào)調(diào)節(jié)因子(regulaotrs of G-protein signaling, RGS)是G蛋白信號(hào)轉(zhuǎn)導(dǎo)通路中的負(fù)性調(diào)節(jié)因子,能夠與一些受體、效應(yīng)分子相互作用,調(diào)節(jié)G蛋白信號(hào)通路。tsRGS12嵌合分子在組織中特異表達(dá),其編碼產(chǎn)物以細(xì)胞周期依賴的方式定位于核點(diǎn),與減數(shù)分裂中期的染色體形成有關(guān),過表達(dá)該嵌合分子導(dǎo)致細(xì)胞內(nèi)形成不規(guī)則核與多核。此外,TS改變了正常RGS12基因的表達(dá)量,形成了新蛋白質(zhì),必然會(huì)對(duì)G蛋白的信號(hào)轉(zhuǎn)導(dǎo)功能產(chǎn)生影響[52]。
對(duì)嵌合蛋白的結(jié)構(gòu)分析表明,嵌合子含有完整蛋白結(jié)構(gòu)域的幾率非常顯著地高于隨機(jī)序列,暗示著TS及其產(chǎn)物在生命活動(dòng)中具有一定作用[53]。有些嵌合分子的編碼蛋白與親本蛋白互相競(jìng)爭(zhēng),擾亂原有的蛋白互作網(wǎng)絡(luò)[53-54]。隨著TS產(chǎn)物作用的揭示,人們逐漸認(rèn)識(shí)到其在生理、病理活動(dòng)中的重要性,研究范疇也在逐漸擴(kuò)大,從最初的癌癥相關(guān)研究擴(kuò)展到生命活動(dòng)的多個(gè)領(lǐng)域,但Huang等[55]通過定量PCR分析發(fā)現(xiàn),嵌合RNAs和衰老之間不存在相關(guān)性,這可能和樣本數(shù)及檢測(cè)的嵌合RNAs數(shù)量較少有關(guān)。
基于SMaRT的產(chǎn)生機(jī)制,人們開發(fā)了基因靶向療法,基本原理是設(shè)計(jì)合成靶向內(nèi)源、缺陷mRNA前體的RNA分子——pre-mRNA反式剪接分子(pre-mRNA trans-splicing molecule, PTM),其上含有與靶內(nèi)含子互補(bǔ)的配對(duì)序列、催化剪接反應(yīng)的人工內(nèi)含子、以及替代缺陷序列的正確cDNA片段。PTM被注入到體內(nèi)(細(xì)胞)后,首先利用互補(bǔ)配對(duì)序列識(shí)別、結(jié)合內(nèi)源pre-mRNA,然后在剪接體介導(dǎo)下,內(nèi)源pre-mRNA與PTM進(jìn)行TS形成一個(gè)嵌合分子,在此過程中外源cDNA替代了內(nèi)源pre-mRNA的缺陷序列,從而達(dá)到修復(fù)缺陷RNA的目的[56]。
脊髓性肌萎縮(spinal muscular atrophy, SMA)是一種神經(jīng)退行性疾病,是導(dǎo)致嬰兒期死亡的主要遺傳因素,由運(yùn)動(dòng)神經(jīng)元存活基因1(survival motor neuron 1, SMN1)缺失導(dǎo)致[57-58]。人基因組中含有SMN1和SMN2兩個(gè)基因,二者具有完全相同的開放讀碼框,但SMN2的大部分轉(zhuǎn)錄本都是可變剪接產(chǎn)物,編碼產(chǎn)生的截短蛋白穩(wěn)定性差、沒有功能[59]。SMN2基因存在于所有的SMA患者中,校正SMN2基因的可變剪接位點(diǎn)、抑制其可變剪接,是SMA分子治療的可行思路[60]。Coady和Lorson[61]把人工合成的、靶向修復(fù)SMN2的PTM注射入SMA小鼠的側(cè)腦室,在體內(nèi)實(shí)現(xiàn)了SMN功能蛋白的挽救性表達(dá),減輕了小鼠SMA癥狀,延長(zhǎng)了生存期。
TS在遺傳性疾病治療方面的巨大潛力引起了人們的廣泛研究興趣,目前已經(jīng)利用PTM對(duì)亨廷頓疾病[62]、營養(yǎng)不良大皰性表皮松懈癥[63]、肥厚性心肌病[64]、鐮狀細(xì)胞貧血病[65]、B細(xì)胞急性淋巴細(xì)胞白血病[66]、直腸癌[67]、先天性肌肉營養(yǎng)不良癥[68]等多種疾病的遺傳因子修復(fù)方面進(jìn)行了試驗(yàn)研究,并得到了預(yù)期效果。在病毒性疾病的治療方面,TS也展現(xiàn)了良好的應(yīng)用前景。Ingemarsdotter等[69]構(gòu)建了靶向人類免疫缺陷病毒(human immunodeficiency virus, HIV)RNA SSs位點(diǎn)的TS載體,并成功地在攜帶HIV的細(xì)胞內(nèi)獲得了tsRNA,實(shí)現(xiàn)了選擇性殺死感染細(xì)胞。以期TS介導(dǎo)的基因靶向療法將會(huì)實(shí)現(xiàn)臨床上的應(yīng)用。
TS及其嵌合RNAs在一系列生理、病理活動(dòng)中發(fā)揮著重要作用,在正常細(xì)胞中的表達(dá)量較低且受到嚴(yán)格的時(shí)空調(diào)控,在特定條件下或癌細(xì)胞等細(xì)胞類型中的表達(dá)失調(diào),導(dǎo)致染色體易位和腫瘤發(fā)生。但當(dāng)前研究多集中在利用高通量測(cè)序結(jié)合生物信息學(xué)方法鑒定癌癥相關(guān)tsRNA和試驗(yàn)驗(yàn)證層面,缺乏研究深度。研究的對(duì)象主要是人和小鼠,TS在農(nóng)業(yè)動(dòng)物領(lǐng)域方面的作用及應(yīng)用前景有待揭示。進(jìn)一步闡明哺乳動(dòng)物TS在基本生命活動(dòng)中的作用及產(chǎn)生機(jī)制,有助于深入揭示其生理/病理學(xué)意義,更好地為畜禽遺傳改良和人類遺傳性疾病的靶向治療服務(wù)。
由于表達(dá)量較低,傳統(tǒng)的RNA酶保護(hù)試驗(yàn)、Northern blot、Western blot等可信度高的分析方法往往靈敏度不夠;而基于逆轉(zhuǎn)錄的檢測(cè)方法(如RT-PCR)又容易形成假陽性,在一定程度上阻礙了TS在非腫瘤細(xì)胞中的研究,需要對(duì)相關(guān)試驗(yàn)技術(shù)進(jìn)行改進(jìn)和完善。近年來發(fā)展起來的直接RNA測(cè)序方法、Hi-C三維基因組研究技術(shù)、蛋白質(zhì)數(shù)據(jù)分析方法為TS及其嵌合RNA研究提供了新的工具。鑒于其在生命活動(dòng)中的重要性以及相關(guān)試驗(yàn)方法的不斷改進(jìn)、完善,TS必將會(huì)成為遺傳學(xué)研究中的一個(gè)重要內(nèi)容。