齊 波, 丁 晶
(成都軍區(qū)昆明總院 全軍創(chuàng)傷骨科研究所,云南 昆明 650032)
在自然選擇的驅(qū)動(dòng)下,細(xì)菌對(duì)外源基因的入侵已進(jìn)化出多種防御機(jī)制,當(dāng)外源基因侵入細(xì)菌時(shí),一種成簇而規(guī)律間隔的短回文重復(fù)序列(clustered regularly interspaced short palindromic repeats,CRISPR)會(huì)將該基因片段整合保存,待相同基因片段再次入侵時(shí),CRISPR及其相關(guān)蛋白會(huì)將該外源基因剪切破壞,細(xì)菌這種免疫防御功能不禁讓人聯(lián)想到基因沉默技術(shù),能否利用CRISPR構(gòu)建出新的基因沉默新技術(shù)呢?當(dāng)Qi等[1]的研究給出肯定的答案時(shí)便開(kāi)啟了基因研究的新篇章。本文旨在介紹CRISPR干擾(CRISPR inference, CRISPRi)系統(tǒng)的基本結(jié)構(gòu)和功能。
1.1 CRISPR位點(diǎn) 1987年Ishino等[2]報(bào)道在大腸桿菌堿性磷酸酶的同工酶Ipa中有一段呈“重復(fù)-間隔-重復(fù)”規(guī)律排列的序列,爾后發(fā)現(xiàn)這種結(jié)構(gòu)在細(xì)菌和古細(xì)菌中普遍存在,并于2002年由Jansen等[3]統(tǒng)一命名為CRISPR。這些重復(fù)序列有較高保守性,一般由23 bp-50 bp組成,其間有5 bp-7 bp的回文序列,通常于此形成穩(wěn)定的莖-環(huán)結(jié)構(gòu);在同一個(gè)CRISPR位點(diǎn),重復(fù)序列基本相同,但不同微生物有不同CRISPR位點(diǎn),在同一微生物中可能有多個(gè)CRISPR位點(diǎn),不同CRISPR位點(diǎn)所含重復(fù)序列各不相同[4-5];許多重復(fù)序列還含有GAAA(C/G)3'-端保守基序,其可能是Cas蛋白的結(jié)合位點(diǎn)[5]。間隔序列長(zhǎng)為17 bp-84 bp,在同一個(gè)CRISPR位點(diǎn)該序列不同,研究表明它們可能來(lái)源于噬菌體、質(zhì)粒[6]。
1.2 Cas蛋白 2002年Jansen等[3]發(fā)現(xiàn)在CRISPR位點(diǎn)附近有一系列與之相關(guān)的基因(CRISPR-associated, Cas),與之相對(duì)應(yīng)的蛋白稱(chēng)為Cas蛋白,目前已從中鑒定出核酸內(nèi)切酶、核酸外切酶,解螺旋酶及RNA-和DNA-結(jié)合的結(jié)構(gòu)域,由此推斷Cas蛋白可能參與CRISPR的轉(zhuǎn)錄、加工等過(guò)程[7]。隨著人們對(duì)CRISPR系統(tǒng)的關(guān)注,目前已發(fā)現(xiàn)40余種Cas蛋白。在CRISPR位點(diǎn)上游存在一段(A+T)富集的前導(dǎo)序列(lead sequence),其在CRISPR轉(zhuǎn)錄過(guò)程中起啟動(dòng)子的作用[8]。一言蔽之,CRISPR-Cas系統(tǒng)包括:由重復(fù)序列及間隔序列規(guī)律排列的CRISPR簇、前導(dǎo)序列和Cas基因構(gòu)成(見(jiàn)圖1)。
注:A: 獲得間隔序列,Cas蛋白發(fā)揮核酸內(nèi)切酶活性剪切含有PAMs的外源基因,并將其整合到自身基因組中;B: crRNA的轉(zhuǎn)錄加工,整合后的CRISPR序列首先被轉(zhuǎn)錄為pre-crRNA,后者與tracrRNA形成復(fù)合體,隨后RNase將其切割為crRNA;C: crRNA與Cas蛋白構(gòu)成復(fù)合體,前者通過(guò)與靶基因互補(bǔ)配的方式保證特異性識(shí)別,Cas蛋白發(fā)揮核酸內(nèi)切酶活性切斷外源基因;D:若去除Cas蛋白核酸內(nèi)切酶活性,即dCas蛋白,則阻礙靶基因轉(zhuǎn)錄,實(shí)現(xiàn)基因沉默。圖1 CRISPRi系統(tǒng)的結(jié)構(gòu)及其作用機(jī)制
1.3 CRISPR系統(tǒng)的分類(lèi) 2005年Haft[5]等在分析了40種細(xì)菌和古細(xì)菌基因組后,依據(jù)Cas1系統(tǒng)發(fā)育樹(shù)的拓?fù)浣Y(jié)構(gòu)及相應(yīng)Cas蛋白組成和功能,將CRISPR-Cas系統(tǒng)分為:Ecoli、Ypest、Nmeni、Dvulg、Tneap、Hmari、Apern、Mtube共8個(gè)亞型。這種分類(lèi)盡管簡(jiǎn)單易行,但卻未考慮諸多Cas蛋白的遠(yuǎn)緣關(guān)系;其次,該方法也未考慮CRISPR-Cas系統(tǒng)在品類(lèi)繁盛的細(xì)菌和古細(xì)菌中進(jìn)化的復(fù)雜性;最終可能導(dǎo)致那些重組、雜交的CRISPR-Cas系統(tǒng)無(wú)法歸類(lèi)。鑒于此,Makarova等[9]提出將細(xì)菌整合間斷序列過(guò)程納入考慮,把CRISPR-Cas系統(tǒng)分為3類(lèi):Ⅰ型CRISPR-Cas系統(tǒng)特點(diǎn)是包含cas3的編碼基因,其翻譯的蛋白含有N-端HD磷酸水解酶和C-端解螺旋酶結(jié)構(gòu)域,它們亦可分別由cas''、cas'基因編碼,主要生物學(xué)功能是參與降解外源基因; Ⅱ型CRISPR-Cas系統(tǒng)的特征是含有cas9(或稱(chēng)csn1)基因,其編碼的蛋白包含RuvC樣核酸酶和HNH核酸酶結(jié)構(gòu)域,后者有豐富的限制性酶并具內(nèi)切酶活性,參與CRISPR RNA加工及剪切外源基因過(guò)程[10-11];Ⅲ型CRISPR-Cas系統(tǒng)主要包括DNA/RNA聚合酶和RAMP(Repeat-associated mysterious proteins)組件,主要功能是參與間隔-重復(fù)序列轉(zhuǎn)錄過(guò)程及降解靶基因,根據(jù)其作用對(duì)象不同還可將該系統(tǒng)進(jìn)一步分為Ⅲ-A和Ⅲ-B兩種亞型,前者主要以外源DNA為靶標(biāo)[12],而后者可破壞外源RNA[13]。
2.1 CRISPR系統(tǒng)對(duì)外源基因的整合 獲得外源基因是CRISPRi的首要步驟。當(dāng)外源基因侵入細(xì)菌后,宿主體內(nèi)的Cas蛋白會(huì)迅速與之結(jié)合,并發(fā)揮核酸內(nèi)切酶活性將外源基因剪切為小片段后再將其嵌入前導(dǎo)序列與第一個(gè)重復(fù)序列之間,隨后復(fù)制一段重復(fù)序列,保持“重復(fù)-間隔-重復(fù)-間隔”的序列結(jié)構(gòu)(見(jiàn)圖1A)。嵌入的前間隔序列(protospacer)長(zhǎng)度大約為30 bp,該序列的選擇并不是隨機(jī)的,而是取決于前間序列5'-端或3'-端的前間區(qū)序列鄰近基序( protospacer adjacent motifs,PAMs),如化膿性鏈球菌、無(wú)乳鏈球菌及單核細(xì)胞增生李斯特菌的NGG基序,但并不是所有生物的PAMs都相同,這些差異可能與生物多樣性有關(guān)[9, 14]。間隔序列既可來(lái)源于編碼鏈,也可來(lái)自非編碼鏈,無(wú)論是哪種來(lái)源都能使細(xì)菌獲得沉默目的基因的免疫功能[15-16]。
2.2 CRISPR序列的轉(zhuǎn)錄 整合后的CRISPR序列首先被轉(zhuǎn)錄為CRISPR前體RNA(CRISPR precursor RNA, pre-crRNA),后者再被進(jìn)一步加工形成CRISPR源性小RNA(short CRISPR-derived RNA, crRNA),其是實(shí)現(xiàn)CRISPRi的必要條件[15]。研究表明,前導(dǎo)序列可發(fā)揮“啟動(dòng)子”樣作用啟動(dòng)轉(zhuǎn)錄,并沿下游單向進(jìn)行,該過(guò)程依賴(lài)于cAMP信號(hào)傳導(dǎo)[8, 17]。在pre-crRNA剪切加工為crRNA的機(jī)制首先在大腸桿菌K12中得到闡釋?zhuān)芯堪l(fā)現(xiàn),CRISPR編碼的Cas5e及Cse1-Cse4 5種Cas蛋白形成復(fù)合體,稱(chēng)為CRISPR相關(guān)抗病毒復(fù)合體(CRISPR-associated complex for antiviral defence, Cascade),Cascade通過(guò)發(fā)揮核酸內(nèi)切酶活性即可將pre-crRNA剪切為成熟crRNA[15](見(jiàn)圖1B);但Cascade并不是實(shí)現(xiàn)CRISPRi的必須路徑,在化膿性鏈球菌中發(fā)現(xiàn)pre-crRNA有一段24 nt組成的tracrRNA(trans-encoded small RNA),其通過(guò)激活RNaseIII及Cas9(亦稱(chēng)Csn1)即可完成上述過(guò)程[11]。成熟crRNA可分為5'-手柄、3'-發(fā)卡結(jié)構(gòu)和間隔序,5'-手柄在具有保守性,3'-發(fā)卡是核酸內(nèi)切酶識(shí)別位點(diǎn)[18];5'-端重復(fù)序列均質(zhì)性較3'-端好,其與PAMs一起保護(hù)自身CRISPR序列不被誤切[19];crRNA末端還含有一段起”種子區(qū)”作用的序列,它決定著尋找靶基因的效率,該區(qū)域僅需1個(gè)位點(diǎn)發(fā)生突變即極可能無(wú)法正確識(shí)別靶基因,但在種子區(qū)外發(fā)生少量突變則不容易導(dǎo)致識(shí)別功能失效[20]。
2.3 CRISPR系統(tǒng)沉默目的基因 準(zhǔn)確找到目的基因是CRISPRi的關(guān)鍵步驟,crRNA與其相關(guān)Cas蛋白組裝為CRISPR相關(guān)核糖核蛋白復(fù)合體,通過(guò)crRNA間隔序列與靶基因互補(bǔ)配對(duì)即能特異性識(shí)別侵入的外源基因。這種以RNA為導(dǎo)向的DNA識(shí)別不僅得以證實(shí),且發(fā)現(xiàn)靶基因所在位點(diǎn)的雙鏈DNA都會(huì)被Cas蛋白中的核酸內(nèi)切酶剪切,即完成了RNA指導(dǎo)的DNA沉默(見(jiàn)圖1C)[7, 10]。需要指出的是并非所有CRISPRi系統(tǒng)都以DNA為靶標(biāo),在Pyrococcus furious的體外實(shí)驗(yàn)中就發(fā)現(xiàn)大量RNA被剪切,但這種情況尚認(rèn)為與入侵的基因類(lèi)型有關(guān),當(dāng)外源基因?yàn)镽NA時(shí),CRISPRi即以RNA為靶標(biāo)[13, 21]。crRNA與Cas蛋白的具體作用機(jī)制尚未完全闡明,但通過(guò)對(duì)比Cascade與靶基因結(jié)合前后的結(jié)構(gòu)變化發(fā)現(xiàn),Cas蛋白亞基沿著crRNA呈螺旋狀排列,防止crRNA被降解,crRNA的5'-端和3'-端則形成特殊結(jié)構(gòu)錨定在Cas蛋白上[22]。這種既緊密結(jié)合又能自身保護(hù)的結(jié)構(gòu),使CRISPR相關(guān)核糖核蛋白復(fù)合體在破壞一條外源基因后不會(huì)失效,還可繼續(xù)攻擊存在的其他外源基因。
3.1 CRISPRi技術(shù)聚焦于Cas9 化膿性鏈球菌的CRISPR系統(tǒng)最為簡(jiǎn)單,僅由1條編碼Cas9蛋白的基因、crRNA和tracrRNA構(gòu)成,三者即足以完成上述RNA指導(dǎo)的DNA沉默過(guò)程,其中Cas9-crRNA復(fù)合體的功能首先是作為向?qū)ふ野谢蚝秃怂醿?nèi)切酶作用位點(diǎn),然后Cas9發(fā)揮核酸內(nèi)切酶活性切除靶基因[23-24]。能否設(shè)計(jì)一條含靶基因的向?qū)NA(small guide RNA, sgRNA)模擬tracrRNA-crRNA復(fù)合體,讓其與Cas9共同構(gòu)成CRISPRi系統(tǒng)特異性沉默靶基因呢?新近研究表明,按上述方法構(gòu)建的CRISPRi系統(tǒng)將293T細(xì)胞、K562細(xì)胞及多能干細(xì)胞等多種人細(xì)胞中的基因靶向切除[25-26];且在同一系統(tǒng)中,僅需通過(guò)增加插入間隔序列的數(shù)量就能實(shí)現(xiàn)同時(shí)切除多個(gè)目的基因[27];而這種技術(shù)的基因修飾效率至少與ZFNs (zinc finger nucleases)技術(shù)或TALENs(transcription activator-like TAL effector nucleases)技術(shù)相當(dāng)[28]。
3.2 控制轉(zhuǎn)錄的CRISPRi系統(tǒng) 目前設(shè)計(jì)的CRISPRi系統(tǒng)直接將靶基因切斷,這種方法可能更適合修改突變基因或在特異位點(diǎn)刪除、插入基因片段,Qi等[1]設(shè)計(jì)的CRISPRi系統(tǒng)令Cas9蛋白核酸內(nèi)切酶活性失活,避免靶基因被剪切,同時(shí),由于CRISPRi系統(tǒng)與目的基因緊密結(jié)合而阻滯了轉(zhuǎn)錄過(guò)程,當(dāng)CRISPRi系統(tǒng)被移除后,細(xì)胞又能恢復(fù)正常(見(jiàn)圖1D)。CRISPRi與RNAi的主要區(qū)別在于前者在轉(zhuǎn)錄水平抑制RNA合成,而后者是通過(guò)Dicer介導(dǎo)mRNA降解。
CRISPR是細(xì)菌抵御外源基因入侵的天然免疫屏障,人們一直致力于認(rèn)識(shí)這種自然存在的基因沉默現(xiàn)象,但直至近年來(lái)才取得突破。尤其是Cas9的發(fā)現(xiàn),不僅簡(jiǎn)明扼要地向人們闡釋了CRISPR抗外源基因的基本機(jī)制,而且使這種生物現(xiàn)象得以在科學(xué)研究中運(yùn)用[25-31]。CRISPRi技術(shù)不僅是基因功能研究的利器,而且可用于基因編輯以改良農(nóng)作物,建立基因病動(dòng)物模型和進(jìn)行基因治療[29-31]。這項(xiàng)技術(shù)被Science評(píng)為2013年十大科學(xué)進(jìn)展之一,并將其功能總結(jié)為“Genetic Microsurgery for the Masses”。CRISPRi有以下突出優(yōu)點(diǎn):①這種干擾是直接阻滯DNA轉(zhuǎn)錄,而不像RNAi技術(shù)是破壞mRNA,阻滯級(jí)別更高、更準(zhǔn)確;②可對(duì)多個(gè)靶點(diǎn)同時(shí)編輯;③實(shí)現(xiàn)可逆性基因沉默;④沉默效率較高,載體構(gòu)建簡(jiǎn)單,只需設(shè)計(jì)目的基因的sgRNA。但建立在Ⅱ型CRISPR系統(tǒng)上的CRISPRi僅能編輯PAMs后的20 bp,Ⅲ型CRISPR系統(tǒng)實(shí)現(xiàn)的CRISPRi雖不收PAMs限制,但需多種Cas蛋白形成復(fù)合體發(fā)揮功能,這是進(jìn)一步研究需要解決的問(wèn)題。
[參考文獻(xiàn)]
[1] Qi L S, Larson M H,Gilbert L A, et al.Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression[J].Cell, 2013,152(5):1173-1183.
[2] Ishino Y, Shinagawa H, Makino K, et al.Nucleotide sequence of the iap gene, responsible for alkaline phosphatase isozyme conversion in Escherichia coli, and identification of the gene product[J].J Bacteriol, 1987, 169(12):5429-5433.
[3] Jansen R, Embden J D, Gaastra W, et al.Identification of genes that are associated with DNA repeats in prokaryotes[J].Mol Microbiol, 2002, 43(6):1565-1575.
[4] Kunin V, Sorek R, Hugenholtz P.Evolutionary conservation of sequence and secondary structures in CRISPR repeats[J].Genome Biol, 2007, 8(4):R61.
[5] Haft D H, Selengut J, Mongodin E F, et al.A guild of 45 CRISPR-associated (Cas) protein families and multiple CRISPR/Cas subtypes exist in prokaryotic genomes[J].PLoS Comput Biol, 2005, 2005(1):1:e60.
[6] Pourcel C, Salvignol G, Vergnaud G.CRISPR elements in Yersinia pestis acquire new repeats by preferential uptake of bacteriophage DNA, and provide additional tools for evolutionary studies[J].Microbiology, 2005, 151(Pt 3):653-663.
[7] Marraffini L A, Sontheimer E J.CRISPR interference:RNA-directed adaptive immunity in bacteria and archaea[J].Nature Reviews Genetics, 2010, 11(3):181-190.
[8] Pougach K, Semenova E, Bogdanova E, et al.Transcription, processing and function of CRISPR cassettes in Escherichia coli[J].Mol Microbiol, 2010, 77(6):1367-1379.
[9] Makarova K S, Haft D H, Barrangou R, et al.Evolution and classification of the CRISPR-Cas systems[J].Nat Rev Microbiol, 2011, 9(6):467-477.
[10] Garneau J E, Dupuis Mè, Villion M, et al.The CRISPR/Cas bacterial immune system cleaves bacteriophage and plasmid DNA[J].Nature, 2010, 468(7320):67-71.
[11] Deltcheva E, Chylinski K, Sharma C M, et al.CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III[J].Nature, 2011, 471(7340):602-607.
[12] Marraffini L A, Sontheimer E J.CRISPR interference limits horizontal gene transfer in staphylococci by targeting DNA[J].Science, 2008, 322(5909):1843-1845.
[13] Hale C R, Zhao P, Olson S, et al.RNA-guided RNA cleavage by a CRISPR RNA-Cas protein complex[J].cell, 2009, 139(5):945-956.
[14] Mojica F J, Díez-Villaseor C, García-Martínez J, et al.Short motif sequences determine the targets of the prokaryotic CRISPR defence system[J].Microbiology, 2009, 155(Pt3):733-740.
[15] Brouns S J, Jore M M, Lundgren M, et al.Small CRISPR RNAs guide antiviral defense in prokaryotes[J].Science, 2008, 321(5891):960-964.
[16] Gudbergsdottir S, Deng L, Chen Z, et al.Dynamic properties of the Sulfolobus CRISPR/Cas and CRISPR/Cmr systems when challenged with vector-borne viral and plasmid genes and protospacers[J].Mol Microbiol, 2011, 79(1):35-49.
[17] Agari Y, Sakamoto K, Tamakoshi M, et al.Transcription profile of Thermus thermophilus CRISPR systems after phage infection[J].J Mol Biol, 2010, 395(2):270-281.
[18] Wiedenheft B, Van Duijn E, Bultema J B, et al.RNA-guided complex from a bacterial immune system enhances target recognition through seed sequence interactions[J].Proc Natl Acad Sci USA,2011, 108(25):10092-10097.
[19] Marraffini L A, Sontheimer E J.Self versus non-self discrimination during CRISPR RNA-directed immunity[J].Nature, 2010, 463(7280):569-571.
[20] Semenova E, Jore M M, Datsenko K A, et al.Interference by clustered regularly interspaced short palindromic repeat (CRISPR) RNA is governed by a seed sequence[J].Proc Natl Acad Sci USA,2011, 108(25):10098-10103.
[21] Wiedenheft B, Sternberg S H, Doudna J A.RNA-guided genetic silencing systems in bacteria and archaea[J].Nature, 2012, 482(7385):331-338
[22] Wiedenheft B, Lander G C, Zhou K, et al.Structures of the RNA-guided surveillance complex from a bacterial immune system[J].Nature, 2011, 477(477(7365):486-489):486-489
[23] Gasiunas G, Barrangou R, Horvath P, et al.Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria[J].Proc Natl Acad Sci USA,2012, 109(39):e2579-2586.
[24] Jinek M, Chylinski K, Fonfara I, et al.A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity[J].Science, 2012, 337(6069):816-821.
[25] Jinek M, East A, Cheng A, et al.RNA-programmed genome editing in human cells[J].Elife, 2013, 2:e471.
[26] Mali P, Yang L, Esvelt K M, et al.RNA-guided human genome engineering via Cas9[J].Science, 2013, 339(6121):823-826.
[27] Cong L, Ran F A, Cox D, et al.Multiplex genome engineering using CRISPR/Cas systems[J].Science, 2013, 339(6121):819-823.
[28] Hwang W Y, Fu Y, Reyon D, et al.Efficient genome editing in zebrafish using a CRISPR-Cas system[J].Nat Biotechnol, 2013, 31(3):227-229.
[29] Niu Y,Shen B,Cui Y, et al.Generation of gene-modified cynomolgus monkey via Cas9/RNA-Mediated gene targeting in one-cell embryos[J].Cell, 2014, 156(4):836-843.
[30] Shan Q, Wang Y, Li J, et al.Targeted genome modification of crop plants using a CRISPR-Cas system[J].Nat Biotechnol, 2013, 31(8):686-688.
[31] Li W, Li X, Li T, et al.Genetic modification and screening in rat using haploid Embryonic Stem Cells[J].Cell Stem Cell, 2014,14(3):404-414.