侯德富 ,關勇軍 ,萬恂恂 ,譚宇婷 ,歐陽詠梅 ,余艷輝 ,陳主初 2,
(1.湖南師范大學醫(yī)學院,湖南 長沙410013;2.中南大學湘雅醫(yī)院衛(wèi)生部腫瘤蛋白質組學重點實驗室,湖南 長沙410008;3.中南大學腫瘤研究所3,湖南 長沙410008)
選擇性剪接在哺乳動物的基因表達中是一種廣泛存在的現(xiàn)象,最新研究報道有高達92%~94%的多外顯子基因通過選擇性剪接產(chǎn)生多個mRNA剪接變異體,并可能編碼多種蛋白異形體,為人類蛋白質組多樣化的重要機制[1]。NPCEDRG基因(GenBank No.AF538150)是由基因定位候選克隆策略獲得的一個在正常鼻咽和鼻咽癌組織表達差異具有顯著性的基因,定位于湖南家族性鼻咽癌的遺傳易感區(qū)3p21.31~21.2區(qū)域內(nèi)[2,3]。我們前期研究結果表明,NPCEDRG基因在正常人多種組織中表達,而在鼻咽癌組織、鼻咽癌細胞系及其他腫瘤細胞系中表達下調,功能研究提示NPCEDRG基因可能為一個鼻咽癌候選抑瘤基因[4-6]。我們最近的研究成功克隆并鑒定NPCEDRG基因啟動子區(qū),初步證實啟動子核心元件CCAAT/NFY可能參與該基因的轉錄調控[7,8]。本研究擬應用5'-RACE和3'-RACE等技術對NPCEDRG基因mRNA剪接變異體進行分析,并成功克隆得到一個新的NPCEDRG基因mRNA剪接變異體,為進一步闡述NPCEDRG基因在鼻咽癌發(fā)生發(fā)展中的可能作用提供線索。
1.1.1 細胞系及其培養(yǎng) 鼻咽癌細胞系CNE1由中南大學腫瘤研究所提供,于RPMI 1640+10%新生小牛血清 (newborn calf serum,NCS)的培養(yǎng)基中,37℃、5%CO2、飽和濕度條件下培養(yǎng)。
1.1.2 主要試劑/試劑盒 TRIzol試劑為Invitrogen公司產(chǎn)品,DNA-free?Kit為Ambion公司產(chǎn)品,RPMI 1640培養(yǎng)基為Gibco BRL公司,新生小牛血清為杭州四季青公司產(chǎn)品,5'-Full RACE kit、3'-Full RACE、Agarose Gel DNA Purification Kit、TaKaRa LA Taq 酶、DNA Marker DL2000、pMD20-T 載體為TAKARA公司產(chǎn)品,其他試劑為國產(chǎn)分析純試劑。1.1.3引物 依據(jù)mRNA序列比對分析結果,用primer 5.0在線程序設計引物,由大連寶生物公司合成,所用引物序列見表1。
表1 5'-RACE、3'-RACE引物
1.2.1 5'-RACE擴增NPCEDRG基因的5'-末端的全長序列
按TRIZOLTM試劑操作程序進行培養(yǎng)細胞總RNA的抽提,rDNase I消化 Total RNA中殘留gDNA,于1.0%瓊脂糖凝膠電泳確定RNA的質量和完整性,用紫外分光光度儀檢測RNA的濃度和純度。使用 5'-Full RACE Kit對 2μg CNE2細胞Total RNA進行CIAP、TAP處理,并與5'-RACE Adaptor連接后,反轉錄合成cDNA,同時設立MMLV(-)對照。10 L逆轉錄反應體系:Ligated RNA 6 l,Random 9 mers(50 M)0.5 L,dNTP Mixture(10 mM each)1 L,5×M-MLV Buffer 2 L,RNase Inhibitor (40 U/L)0.25 L,Reverse Transcriptase M-MLV (RNase H-)(200 U/L)0.25 uL,RNase Free dH2O 4.5 L;反應條件:30℃,10 min 42℃,60 min 70℃,15 min。 以5'-RACE Adaptor cDNA 第一鏈為模板,進行巢式PCR第一輪擴增。50 μL Outer PCR反應體系:5'-RACE Adaptor cDNA第一 鏈 2 μL、1×cDNA Dilution Buffer II 8 μL、5'-RACE Outer Primer(10 μM)2 μL、GSP-R1(10 μM)2 μL、2× GC Buffer I 25 μL、TaKaRa LA Taq?(5 U/μL)0.5 μL、dH2O 10.5 μL。 PCR 反應條件:94℃ 3 min;94℃ 30 s,55℃ 30 s,72℃ 2 min,30 Cycles;72℃ 10 min。取10 μL PCR擴增產(chǎn)物進行 2%瓊脂糖凝膠電泳檢測。將PCR擴增產(chǎn)物1:100稀釋后取2μL為模板進行第二輪擴增巢式PCR(方法同前),引物對5'-RACE Inner Primer和GSP-R2擴增NPCEDRG剪接變異體 5'末端序列。PCR產(chǎn)物進行瓊脂糖凝膠電泳檢測。
1.2.2 3'-RACE擴增NPCEDRG基因的3'-末端的全長序列
取3μg CNE2 Total RNA為模板,以3'-RACE Adaptor Primer作為逆轉錄引物,由Reverse Transcriptase M-MLV(RNase H-)將 Poly(A)+RNA逆轉錄成帶有3'-RACE Adaptor的cDNA第一鏈,然后再使用TaKaRa LA Taq,以帶有3'-RACE Adaptor的cDNA第一鏈為模板,進行巢式PCR第一輪和第二輪擴增,反應體系及反應條件同5'-RACE。
1.2.3 PCR產(chǎn)物回收及鑒定
上述PCR產(chǎn)物利用PCR產(chǎn)物純化試劑盒純化后,膠回收后連接入pMD20-T載體,轉化至大腸桿菌JM109感受態(tài)中,涂板、37℃培養(yǎng)過夜,挑取陽性菌落擴大培養(yǎng),直接送菌液至大連寶生物公司進行測序。
在GenBank數(shù)據(jù)庫中,NPCEDRG基因共有包括非冗余參考序列 (NCBI RefSeq)NM_032316.3在內(nèi)的9種mRNA剪接變異體,編碼3種不同蛋白質。通過與gDNA序列的比對分析,如圖1所示,9種mRNA剪接變異體分別包含6-7個不同的外顯子,各條mRNA的所有外顯子序列均有所不相同,說明NPCEDRG基因經(jīng)轉錄后要通過選擇性剪接機制進一步形成各種不同的成熟mRNA。各mRNA剪接變異體的5'-UTR和3'-UTR長度各不相同,表明NPCEDRG基因的轉錄起始位點和3'末端加工位點都具有不均一性。
依據(jù)各mRNA剪接變異體的比對分析結果,在共有序列(NM_032316的外顯子4處)設計外引物GSP-R1進行第一輪PCR,針對AF538150序列中特有序列(第4內(nèi)含子保留區(qū)域),設計內(nèi)巢引物GSP-R2(見圖 2A、表 1)進行內(nèi)巢 PCR。 以第一輪PCR產(chǎn)物為模板,5'-RACE Inner primer/GSP-R2為內(nèi)巢引物(見圖2A,表1),取10μL PCR產(chǎn)物進行2%瓊脂糖凝膠電泳(見圖2B),結果顯示擴增得到兩條長度不同的PCR產(chǎn)物,即剪接變異體1(Variant 1,V1)約 500 bp 和剪接變異體 2(Variant 2,V2)約為400 bp,分別切下進行膠回收、T/A克隆,隨機挑取V1和V2數(shù)個克隆進行測序,分別獲得2個V1 cDNA序列和2個V2 cDNA序列。應用DNASTar軟件包中MegAlign(ClustalW)程序進行比對分析,如圖2C所示,比對分析結果表明V1 cDNA序列的轉錄起始位點位于ATG上游25個核苷酸(-25nt)處,完全包含在AF538150序列中,結果表明V1 cDNA序列為AF538150的PCR產(chǎn)物,即AF538150的轉錄起始位點為-25 nt處。V2 cDNA序列與V1 cDNA比較,5'端有2 bp的缺失,且中間有139 bp核苷酸片段的缺失,因此推測V2 cDNA序列可能為NPCEDRG基因新的剪接變異體的部分mRNA序列,其轉錄起始位點可能位于ATG上游23個核苷酸(-23 nt)處。
A:NM_032316和AF538150 gDNA結構及引物設計示意圖;B:巢式PCR擴增產(chǎn)物2%瓊脂糖凝膠電泳結果;C:轉錄起始位點在gDNA序列上的定位示意圖。D:巢式PCR產(chǎn)物V1和V2經(jīng)T-A克隆并測序,陽性克隆測序序列比對分析結果。
應用ORF Finder(http://www.ncbi.nlm.nih.gov/gorf/gorf.html)在線預測剪接變異體V2片段,發(fā)現(xiàn)其編碼一種由98個氨基酸組成的蛋白質 (見圖3B),其分子量為10.4 kD,等電點為7.1。V2與AF538150比對結果顯示V2缺失AF538150 CDs區(qū)域的139 bp而致讀框移碼并導致其終止密碼子TGA提前出現(xiàn)(見圖3A、B),因此其編碼蛋白序列變短。
依據(jù)各mRNA剪接變異體的比對分析結果,在共有序列(NM_032316的外顯子2處)設計外引物GSP-F1進行第一輪PCR,針對AF538150序列中特有序列(第4內(nèi)含子保留區(qū)域),設計內(nèi)巢引物GSP-F2(見圖2A、表1)進行內(nèi)巢PCR。以第一輪PCR產(chǎn)物為模板,GSP-F2/3'-RACE Inner primer為內(nèi)巢引物(見圖2A,表1),PCR擴增AF538150及其相關的剪接變異體mRNA 3'端序列,取10 μL PCR產(chǎn)物進行2%瓊脂糖凝膠電泳,結果顯示PCR擴增得到2條特異性產(chǎn)物,分別命名為剪接變異體Va和Vb(見圖3A)。PCR產(chǎn)物經(jīng)膠回收、T-A克隆,隨機挑選各數(shù)個陽性克隆測序。如圖3B所示,其中剪接變異體Va經(jīng)測序證實獲得了3個長度不同的cDNA序列,分別為命名3Va-1(1706 bp)、3Va-3(1783 bp)、3Va-5(1730 bp)。 與 AF538150 比較 ,3Va-3保留了AF538150的第4內(nèi)含子及第5、6外顯子的截短;3Va-1和3Va-5均有第5、6外顯子的截短。剪接變異體Vb經(jīng)測序證實獲得一個長度為926 bp的cDNA序列,命名為3Vb-1,比對分析結果顯示3Vb-1為在第5外顯子處提前終止而形成一種新的NPCEDRG基因轉錄本的3'端序列(見圖3B),該序列可能為NPCEDRG基因新剪接變異體V2的3'末端序列。
選擇性剪接在哺乳動物的基因表達中是一種廣泛存在的現(xiàn)象,剪接的方式隨著發(fā)育階段,特定的組織部位以及疾病狀態(tài)的不同而發(fā)生變化。研究表明約有35~94%的基因在個體的發(fā)育過程中會發(fā)生選擇性剪接[1,9-11],這表明選擇性剪接是哺乳動物功能多樣性,甚至是基因組多樣性的重要因素。一般情況下,絕大多數(shù)的基因產(chǎn)生數(shù)量適中的剪接本,但有一些基因則象擁有一個選擇性外顯子庫,可以組合形成大量的剪接本[12]。選擇性剪接過程受到許多剪接相關蛋白和因子的調節(jié)[13,14]。剪接過程的缺損現(xiàn)象已經(jīng)越來越被認為是一些疾病產(chǎn)生的原因[15,16],并且這種疾病狀態(tài)具有非常復雜的遺傳方式。因此,對剪接情況的分析需要通過系統(tǒng)的收集選擇性剪接的外顯子數(shù)據(jù),內(nèi)含子數(shù)據(jù)以及剪接本的數(shù)據(jù)進行綜合分析。
我們通過生物信息學方法系統(tǒng)的分析了NPCEDRG基因的基因結構,其定位于湖南家族性鼻咽癌的遺傳易感區(qū) 3p21.31~21.2區(qū)域內(nèi)[2,3]。NPCEDRG基因有至少9中不同的mRNA剪接變異體,編碼至少3種不同的蛋白質。我們前期研究結果[7]表明NPCEDRG基因總mRNA表達在HK1和6-10B兩株鼻咽癌細胞中非常低,在其他鼻咽癌細胞和其他腫瘤細胞中表達相對較高;而AF538150在約75%(9/12)鼻咽癌細胞系中表達非常低,而在鼻咽癌細胞CNE1、CNE2和永生化鼻咽上皮細胞系NP69,以及其他腫瘤細胞中表達相對較高。因此,在本研究中選用CNE2等相對高表達的細胞作為mRNA剪接變異體分析的靶細胞。
近來一系列研究應用寡核苷酸帽法對人和小鼠等基因轉錄起始位點分析表明,多數(shù)真核生物基因并非某一固定的TSS開始轉錄,往往是在某一50~100 bp區(qū)域的不同位點上開始轉錄,也就是說其轉錄起始位點是分布在一定的區(qū)域內(nèi)[17-19]。我們應用5'-RACE技術在CNE2細胞中特異性針對AF538150進行的5'-RACE擴增得到2條不同的5'-末端序列 (V1和V2)。其中5'-末端序列V1與AF538150完全匹配,但其5'-末端序列短于AF538150,其TSS位于ATG上游25個核苷酸(-25nt)處,而AF538150是我們實驗室利用EST拼接而成,其5'端序列未經(jīng)實驗證實,比對分析發(fā)現(xiàn)其前6個核苷酸為污染序列,因此證實AF538150的轉錄起始位點為-25 nt處;V2與V1比較,5'端有2 bp的缺失,且中間有139 bp核苷酸片段的缺失,且該序列在GenBank中未見公布,進一步應用ORF Finder預測其編碼一種98個氨基酸組成的蛋白,因此,我們推斷該序列為NPCEDRG基因新的剪接變異體5'-末端序列。應用3'-RACE技術擴增得到4條不同的3'-末端序列(3Va-1、3Va-3、3Va-5和3Vb-1),但是我們無法界定該4條3'-末端序列是否為AF538150或新剪接變異體V2特有或共有。這些結果表明NPCEDRG基因轉錄后調控機制非常復雜,且其轉錄起始位點和3'末端加工位點都具有不均一性。
總之,本研究在鼻咽癌細胞系CNE2中成功克隆得到一種新的mRNA剪接變異體V2,預測其編碼一種98個氨基酸組成的蛋白;確定NPCEDRG基因存在不同的轉錄起始位點,其中AF538150的TSS位于ATG上游25個核苷酸(-25nt)處,而新的mRNA剪接變異體V2的TSS位于ATG上游23個核苷酸(-23nt)處。因此,這些結果為進一步闡述NPCEDRG基因表達調控機制、功能研究及其在鼻咽癌發(fā)生發(fā)展中的可能作用提供重要的理論基礎。
[1]Wang ET,Sandberg R,Luo S,et al.Alternative isoform regulation in human tissue transcriptomes [J].Nature,2008,456(7221):470-476.
[2]Xiong W,Zeng ZY,Xia JH,et al.A susceptibility locus at chromosome 3p21 linked to familial nasopharyngeal carcinoma[J].Cancer Res,2004,64(6):1972-1974.
[3]Zeng Z,Zhou Y,Zhang W,et al.Family-based association analysis validates chromosome 3p21 as a putative nasopharyngeal carcinoma susceptibility locus[J].Genet Med,2006,8(3):156-60.
[4]賀修勝,陳主初,田芳,等.鼻咽癌中染色體3p21區(qū)域一個表達下調的EST的鑒定[J].癌癥;22(1):1-5.
[5]關勇軍,賀修勝,侯德富,等.一個鼻咽癌相關EST的鑒定及其全長cDNA序列分析 [J].生命科學研究 2006,10(2):173-177.
[6]陽帥,胡華,鄧敏,等.鼻咽癌相關新基因NPCEDRG表達對CNE2細胞生長的影響 [J].生物化學與生物物理進展,2010;37(2):167-174.
[7]Hou D,Guan Y,Liu J,et al.Cloning and characterization of the NPCEDRG gene promoter[J].Mol Cell Biochem,2011,346(1-2):1-10.
[8]侯德富,關勇軍,關瑞,等.人NPCEDRG基因啟動子的克隆及CCAAT/NFY結合位點初步分析[J].生物化學與生物物理學進展,2011(http://www.pibb.ac.cn/cn/ch/common/create_pdf.aspx?file_no=20100673&flag=1).
[9]Modrek B,Lee C.A genomic view of alternative splicing[J].Nat Genet,2002,30(1):13-19.
[10]Johnson JM,Castle J,Garrett-Engele P,et al.Genomewide survey of human alternative pre-mRNA splicing with exon junction microarrays[J].Science,2003,302(5653):2141-2144.
[11]Kim N,Alekseyenko AV,Roy M,et al.The ASAP II database:analysis and comparative genomics of alternative splicing in 15 animal species[J].Nucleic Acids Res,2007,35(Database issue):D93-98.
[12]Schmucker D,Clemens JC,Shu H,et al.Drosophila Dscam is an axon guidance receptor exhibiting extraordinary molecular diversity[J].Cell,2000,101(6):671-684.
[13]Sperling J,Azubel M,Sperling R.Structure and function of the Pre-mRNA splicing machine[J].Structure,2008,16(11):1605-1615.
[14]Bessonov S,Anokhina M,Will CL,et al.Isolation of an active step I spliceosome and composition of its RNP core[J].Nature,2008,452(7189):846-850.
[15]Faustino NA,Cooper TA.Pre-mRNA splicing and human disease[J].Genes Dev 2003;17(4):419-437.
[16]Garcia-Blanco MA,Baraniak AP,Lasda EL.Alternative splicing in disease and therapy[J].Nat Biotechnol,2004,22(5):535-546.
[17]Carninci P,Sandelin A,Lenhard B,et al.Genome-wide analysis of mammalian promoter architecture and evolution[J].Nat Genet,2006,38(6):626-635.
[18]Engstr?m PG,Suzuki H,Ninomiya N,et al.Complex Loci in human and mouse genomes[J].PLoS Genet,2006,2(4):e47.
[19]Faulkner GJ,Forrest AR,Chalk AM,et al.A rescue strategy for multimapping short sequence tags refines surveys of transcriptional activity by CAGE[J].Genomics,2008,91(3):281-288.