肖雅麗,張建華,鐘耀廣*
1(上海海洋大學 食品學院,上海,201306)2(上海交通大學 農(nóng)業(yè)與生物學院,上海,200240)
CRISPR-Cas系統(tǒng),即規(guī)律成簇的間隔短回文重復序列(CRISPR基因座)及其相關蛋白(Cas基因簇),廣泛分布于約50%的細菌和約90%的古菌中,是菌體內(nèi)進化出的一種具有免疫記憶的獲得性免疫防御系統(tǒng),用于抵御外源遺傳元件的入侵[1]。JINEK等[2]最早證明,來自化膿鏈球菌的II型CRISPR-Cas系統(tǒng)在體外可特異性切割雙鏈DNA,將其用于基因組編輯,具有效率高、成本低、操作簡單等優(yōu)點。近年來,CRISPR技術的基本結構和作用機制逐漸被闡明,成為了繼鋅指核酸酶和類轉錄激活因子效應物核酸酶技術之后最新的基因組編輯技術,不僅可用于人類的基因治療,還可以用于植物和動物的精確育種以及微生物工程,具有廣闊的發(fā)展空間和應用前景。
如今,越來越多的CRISPR-Cas系統(tǒng)被發(fā)現(xiàn)和改造并用于細菌基因組編輯及基因表達調(diào)控,包括II型CRISPR-Cas9系統(tǒng)、V型CRISPR-Cpf1系統(tǒng)、內(nèi)源I-B型和I-E型CRISPR-Cas系統(tǒng)。所有這些系統(tǒng)都有自己的特征蛋白、特異性的原始間隔區(qū)相鄰基序(protospacer adjacent motif,PAM)等,可根據(jù)實驗需求綜合考慮,自由選擇[3]。本文主要從CRISPR-Cas系統(tǒng)的結構、分類、作用機理,及其在細菌基因組編輯和基因表達調(diào)控等方面的應用進行綜述,旨在為相關研究提供參考。
CRISPR基因座依次包括前導序列(Leader)、重復序列(Repeat)和間隔序列(Spacer)(圖1)。
圖1 CRISPR-Cas系統(tǒng)結構示意圖[9]Fig.1 CRISPR-Cas system structure[9]
長度可達550 bp的前導序列多位于CRISPR基因座的5′端,直接與第一個重復序列相鄰,富含A、T堿基。前導序列是添加新間隔序列的識別序列,相同的重復序列和特異的間隔序列交替排列于前導序列之后。同一個CRISPR基因座的重復序列高度保守,而不同CRISPR基因座的重復序列在序列和結構上均不相同[4]。入侵病毒或質(zhì)粒的一個小片段(即原型間隔序列)被整合到CRISPR基因座中即為間隔序列,用于儲存外來遺傳元件的核苷酸信息。CRISPR基因座的兩側是大量極其多樣化的cas基因,其編碼的某些Cas蛋白具有核酸內(nèi)切酶結構域、RNA和DNA結合域及參與轉錄調(diào)控的結構域,在CRISPR-Cas系統(tǒng)的適應性免疫中起著重要作用[5-7]。此外,Cas1和Cas2蛋白存在于大多數(shù)已知的CRISPR-Cas系統(tǒng)中,是將原型間隔序列插入CRISPR基因座所必需的[8]。
CRISPR-Cas系統(tǒng)的免疫應答過程如圖2所示,包括3個主要階段:適應(adaption)、表達(expression)和干擾(interference)[10]。從入侵的DNA/RNA中識別和提取原型間隔序列是CRISPR-Cas系統(tǒng)介導免疫的第一步,也稱為適應階段。首先,多功能Cas1-Cas2復合體識別入侵DNA上的PAM位點,并切割下入侵DNA的一部分(即原型間隔序列)。隨后,原型間隔序列被整合到CRISPR基因座的前導序列和重復序列之間,成為間隔序列。也有一些CRISPR-Cas系統(tǒng)采用另一種適應機制——利用在CRISPR基因座上編碼的逆轉錄酶進行逆轉錄,從而從入侵的RNA中獲取間隔序列[11-12]。
圖2 CRISPR-Cas系統(tǒng)免疫應答3階段[16]Fig.2 Immune process of CRISPR-Cas system[16]
在表達階段,CRISPR基因座中的間隔重復序列通常被轉錄為較長的CRISPR RNA前體(pre-crRNA)。在多亞基效應復合物中的核酸內(nèi)切酶或者核糖核酸酶Ⅲ(RNase Ⅲ)和反式激活CRISPR RNA(tracrRNA)的介導下,pre-crRNA被加工成短的成熟CRISPR RNA(crRNA),每個成熟crRNA分子都包含一段間隔序列和一部分重復序列。成熟的crRNA分子與效應蛋白或多亞基效應復合物結合,形成crRNA-效應復合物[13]。
最后,當宿主細胞受到相同的外來DNA/RNA入侵時,系統(tǒng)發(fā)生干擾,成熟crRNA引導Cas蛋白特異性識別PAM位點后,靶向切割入侵DNA或RNA[14-15]。
隨著對CRISPR-Cas系統(tǒng)研究的深入,各類不同的CRISPR-Cas系統(tǒng)逐漸被發(fā)現(xiàn),根據(jù)系統(tǒng)效應子的不同將其分為2大類:第1類CRISPR-Cas系統(tǒng)的效應子是由多個Cas蛋白組成的多亞基效應復合物;第2類系統(tǒng)的效應子為單一的多域Cas效應蛋白。MAKAROVA等[10]于2020年根據(jù)Cas效應蛋白的不同和多亞基效應復合物的差異將CRISPR-Cas系統(tǒng)進一步分為6種類型:第1類包括Ⅰ型、Ⅲ型和Ⅳ型;第2類包括Ⅱ型、Ⅴ型和Ⅵ型。
第1類系統(tǒng)中,Ⅰ型系統(tǒng)的多亞基效應復合物通常包含1個Cas6亞基、1個Cas5亞基、幾個Cas7亞基和特征蛋白。Ⅰ型系統(tǒng)還編碼解旋酶Cas3,它通常與HD(His-Asp)核酸酶結構域融合。Ⅲ型系統(tǒng)組成類似于Ⅰ型,不同的是,Ⅲ型系統(tǒng)的特征蛋白為Cas10,與HD(His-Asp)核酸酶融合的也是Cas10。與Ⅰ型和Ⅲ型系統(tǒng)差別較大的Ⅳ型CRISPR-Cas系統(tǒng)通常位于質(zhì)粒上,缺乏cas1、cas2基因以及目標DNA切割酶的編碼基因cas3或cas10,但擁有編碼Cas5 (Csf3)、Cas7 (Csf2)和特征蛋白(Csf1)的基因。根據(jù)特征蛋白的不同,Ⅰ型系統(tǒng)進一步細分為I-A到I-F和I-U 7個亞型。I-A到I-D型的特征蛋白分別為:Cas8a、Cas8b、Cas8c、Cas10 d;I-E型的特征蛋白為Cse1和Cse2;I-F型的特征蛋白為Csy1、Csy2、Csy3和Csy6;I-U型的特征蛋白未知[3,17]。
駱馬湖局開展采砂管理工作以來,河湖采砂從曾經(jīng)的混亂無序到如今的逐步規(guī)范有序,采砂管理從高壓嚴打到尋求源頭管理的標本兼治,從流域與區(qū)域當初的“一事一議”到建立長效的合作機制,這一切,都歸功于不斷推進的流域性河湖采砂聯(lián)合管理機制。但是,這種聯(lián)合管理機制目前還不是十分完善,仍然存在著以下幾個方面急需解決的問題。
在第2類系統(tǒng)中,Ⅱ型、Ⅴ型、Ⅵ型的根本區(qū)別在于其效應蛋白的結構不同。Ⅱ型系統(tǒng)的效應蛋白是Cas9,包含2個高度保守的核酸酶結構域:HNH(His-Asn-His)核酸酶結構域和RuvC核酸酶結構域[18]。Ⅴ型系統(tǒng)包括V-A到V-I和V-U 10種亞型,只有V-A型被用于細菌基因組編輯,效應蛋白是Cas12a(Cpf1),由1 200~1 300個氨基酸組成,僅包含一個RuvC核酸酶結構域[3,19]。VI型系統(tǒng)的效應蛋白為Cas13(也稱C2c2),包含2個高等真核生物和原核生物核苷酸結合結構域,與任何已知的DNA核酸酶結構域均不同源,靶向RNA[20]。
上述I-VI型的CRISPR-Cas系統(tǒng)中,IV型CRISPR-Cas系統(tǒng)通常位于質(zhì)粒上,缺乏從入侵DNA/RNA上提取原型間隔序列所需的Cas1和Cas2以及靶向切割入侵DNA/RNA所需的核酸內(nèi)切酶[17];Ⅵ型CRISPR-Cas系統(tǒng)只能靶向RNA[20]。下面重點介紹可以靶向切割DNA的Ⅱ型CRISPR-Cas9、Ⅴ型CRISPR-Cpf1和I型CRISPR-Cas系統(tǒng)的作用機制。
2.2.1 Ⅱ型CRISPR-Cas9系統(tǒng)的作用機制
Ⅱ型CRISPR-Cas9系統(tǒng)包含Cas9蛋白、crRNA和tracrRNA。tracrRNA是由重復序列轉錄而來,負責激活RNase Ⅲ以促進pre-crRNA的加工,生成成熟的crRNA。成熟的crRNA與tracrRNA和Cas9形成復合物,并引導Cas9識別目標DNA中的PAM位點(5′-NGG-3′)。隨后,HNH核酸酶結構域切割外源DNA中與間隔序列互補的單鏈,RuvC核酸酶結構域切割另一條單鏈,使DNA雙鏈斷裂(double stranded break,DSB),產(chǎn)生平末端。將crRNA與tracrRNA分子進行適當改造,整合為一條RNA鏈,即單鏈引導RNA(single guide RNA,sgRNA),可以同時發(fā)揮crRNA和tracrRNA的功能[9]。
Cas9核酸酶產(chǎn)生的DSB可以通過非同源末端連接途徑或同源定向修復系統(tǒng)進行修復。多數(shù)細菌缺少非同源末端連接途徑,需依賴DNA模板介導的同源定向修復途徑完成修復,否則DSB很容易引起細胞死亡[21]。YAO等[22]人為構建了一個CRISPR-Cas9系統(tǒng)(帶有sgRNA和目標基因的同源修復臂)并轉入宿主菌中,該系統(tǒng)識別宿主菌基因組上的目標基因并進行切割,最后通過同源修復臂與基因組上的目標位點發(fā)生同源重組而實現(xiàn)基因的缺失、突變或插入。
2.2.2 V型CRISPR-Cpf1系統(tǒng)的作用機制
Cpf1是繼Cas9之后的一種新型核酸酶,與Cas9只識別5′-NGG-3′這一PAM位點不同,它能識別富含T堿基的PAM位點(5′-YTN-3′和5′-TTTN-3′)[3],擴展了可靶向識別的基因組DNA范圍。此外,CRISPR-Cpf1是目前最簡單的CRISPR-Cas系統(tǒng),只包含crRNA和Cpf1蛋白。Cpf1不需要tracrRNA的參與就可以將pre-crRNA加工成成熟的crRNA,成熟的crRNA與Cpf1形成復合物并靶向識別目標DNA。然后,Cpf1蛋白依次切割非互補鏈和互補鏈以產(chǎn)生DSB。最后,通過同源定向修復或者非同源末端連接途徑修復DNA斷裂片段。因此,通過設計由間隔序列(23~25 nt)和同向重復序列(19 nt)組成的單鏈向導crRNA來引導Cpf1識別和切割目標DNA并提供同源修復臂修復DSB即可實現(xiàn)細菌的基因組編輯。而且,CRISPR-Cpf1產(chǎn)生黏性末端,與CRISPR-Cas9(產(chǎn)生平末端)相比具有更高的同源重組修復效率,可更簡單高效地編輯細菌基因組[23]。
2.2.3 I型CRISPR-Cas系統(tǒng)的作用機制
依賴于鋅指核酸酶和類轉錄激活因子效應物核酸酶的基因組編輯技術存在耗時且效率低、需要進行選擇性標記、難以插入大DNA片段以及大片段的刪除和插入會對下游基因造成影響等問題[25]。CRISPR-Cas基因組編輯技術具有快速精確、無標記、簡便高效等優(yōu)勢,因此被廣泛應用于微生物研究。目前,用于細菌基因組編輯的主要有II型CRISPR-Cas9系統(tǒng)、Ⅴ型CRISPR-Cpf1系統(tǒng)、內(nèi)源Ⅰ型CRISPR-Cas系統(tǒng)以及由CRISPR-Cas9衍變而來的CRISPR-Cas9n系統(tǒng)。
CRISPR-Cas9是最早被用于細菌基因組編輯的CRISPR-Cas系統(tǒng)。隨著CRISPR技術的發(fā)展,有學者[26-27]于2016年開發(fā)了一種基于CRISPR-Cas9系統(tǒng)的快速簡便的基因組編輯方法,只需要構建一個質(zhì)粒便可以在3 d內(nèi)實現(xiàn)大腸桿菌的基因組編輯,而用傳統(tǒng)的基因組編輯技術大約需要7 d。CRISPR-Cas9不僅縮短基因組編輯周期,還可提高編輯效率。RONDA等[28]利用CRISPR-Cas9系統(tǒng)和λ-Red重組酶在大腸桿菌中同時編輯3個基因,重組效率達到了96.5%~99.7%。相比之下,傳統(tǒng)重組系統(tǒng)的效率僅為0.68%~5.40%。
此外,CRISPR-Cas9系統(tǒng)還可編輯更大的DNA片段。SU等[29]將CRISPR-Cas9系統(tǒng)和λ-Red重組系統(tǒng)結合,成功地將12 kb的DNA片段整合到大腸桿菌W3110的染色體中,編輯效率可達100%。SYNEFIARIDOU等[30]在肺炎鏈球菌D39V中利用CRISPR-Cas9系統(tǒng)實現(xiàn)了長達24 kb的染色體大片段刪除。
Cas9蛋白造成的雙鏈斷裂有時會導致宿主細胞死亡。為解決這一問題,研究人員通過突變Cas9蛋白的HNH結構域(H840A)或RuvC結構域(D10A)得到了Cas9切口酶:Cas9n (Cas9 Nickase)。Cas9n只 能切割DNA的一條鏈,切口容易修復且脫靶率低。當修復系統(tǒng)無法修復由Cas9引入的DSB時,可嘗試用Cas9n代替Cas9[31]。例如,GOH等[32]使用CRISPR-Cas9n系統(tǒng)在嗜酸乳桿菌NCFM、加氏乳桿菌ATCC 33323和副干酪乳桿菌Lpc-37中進行基因組編輯,實現(xiàn)了300 bp~1.9 kb的染色體缺失,編輯效率為35%~100%。ZHOU等[33]開發(fā)了基于CRISPR/Cas9n的基因編輯工具,不僅在惡臭假單胞菌(Pseudomonasputida)中敲除了不同長度(98~4 643 bp)的DNA片段,而且敲入了長度從1.9 kb到15 kb不等的DNA片段。同樣,CRISPR-Cas9n介導的基因組編輯也可有效縮短操作周期。用同源重組雙交換法敲除干酪乳桿菌的單基因至少需要24 d。為了能快速、精確地編輯干酪乳桿菌基因組,SONG等[34]建立了CRISPR-Cas9n(D10A)系統(tǒng),將編輯時長縮短至9 d,單基因敲除效率最高可達65%。
繼CRISPR-Cas9之后,具有結構簡單、應用范圍廣、基因組編輯效率高等優(yōu)點的CRISPR-Cpf1系統(tǒng)被開發(fā)和應用。LI等[35]使用CRISPR-Cpf1和同源定向修復系統(tǒng)成功敲除了天藍色鏈霉菌的actI-orf1和redX基因,單基因編輯效率為90%~95%,證明了該系統(tǒng)的簡單高效,可用于多種基因組工程。ZHAO等[36]將CRISPR-Cpf1系統(tǒng)和核酸外切酶-重組酶(RecET)系統(tǒng)結合起來,實現(xiàn)了谷氨酸棒桿菌ATCC 14067基因組的大片段缺失。其中,1 kb和20 kb基因缺失的編輯效率分別為79.6%和36.4%。WU等[37]改造新弗朗西斯菌(Francisella)U112的CRISPR-Cpf1系統(tǒng)并將其用于枯草芽孢桿菌,以100%的效率實現(xiàn)了單基因插入、雙基因敲除和多點突變(最多6個)。同年,HAO等[38]借助CRISPR-Cpf1系統(tǒng)以高編輯效率精確地實現(xiàn)了枯草芽孢桿菌的基因敲除,其中包含一個38 kb的超大基因簇。
第2類CRISPR-Cas系統(tǒng)中的CRISPR-Cas9/Cpf1是強大的基因組編輯工具,然而Cas9或Cpf1作為一種異源蛋白很難被引入某些宿主菌中,從而難以進行基因組編輯。據(jù)報道,大多數(shù)的CRISPR-Cas系統(tǒng)屬于第一類,且Ⅰ型最為常見[5]。因此,可以借助宿主菌體內(nèi)的I型系統(tǒng)來實現(xiàn)基因組工程,即構建內(nèi)源I型CRISPR-Cas系統(tǒng),利用內(nèi)源的Cas蛋白靶向切割宿主菌基因組上的目標基因。
PYNE等[39]設計了內(nèi)源I-B型CRISPR-Cas系統(tǒng),成功刪除了巴氏梭菌中的cpaAIR基因,編輯效率高達100%。而相比之下,用Ⅱ型CRISPR-Cas9系統(tǒng)編輯該基因的效率僅為25%。ZHANG等[40]使用丁酸梭菌的內(nèi)源I-B型CRISPR-Cas系統(tǒng)成功地進行了pyrF和spo0A雙基因敲除,編輯效率為100%。ZHOU等[41]報道了在酪酸梭菌中利用內(nèi)源I-B型CRISPR-Cas系統(tǒng)進行基因組編輯,成功敲除了spo0A和aldh基因,效率高達100%。這些結果表明內(nèi)源CRISPR-Cas系統(tǒng)是細菌基因組編輯的有效工具,有巨大的發(fā)展?jié)摿Α?/p>
雖然已經(jīng)開發(fā)出了對宿主細胞低毒性的CRISPR-Cas9n系統(tǒng),但在一些DNA修復效率較低且外部修復機制無效的菌株中,Cas9n仍可能導致細胞死亡[42]。所以,科研人員制備了Cas9蛋白HNH核酸酶結構域(H840A)和RuvC核酸酶結構域(D10A)的雙突變體,即滅活核酸內(nèi)切酶:dCas9。CRISPR-dCas9系統(tǒng)不會引發(fā)DNA雙鏈或單鏈的斷裂,可在不引起DNA損傷的前提下識別目標DNA并干擾基因的轉錄[43]。dCas9蛋白既可以與轉錄激活因子融合以產(chǎn)生CRISPR激活(CRISPRa)系統(tǒng)[44],也可以與特定基因組位點結合從而抑制下游基因的轉錄,在sgRNA的引導下選擇性地調(diào)節(jié)目標基因的表達,稱為CRISPR抑制(CRISPRi)系統(tǒng)[45]。
傳統(tǒng)的RNA干擾技術可用于下調(diào)目標基因表達,但僅限于具有適當宿主機制的特定生物體,并表現(xiàn)出顯著的脫靶效應和細胞毒性[46]。在細菌中,CRISPRi是比RNA干擾更好的基因轉錄調(diào)控工具,能有效、可逆地抑制多種細菌中目標基因的表達,如谷氨酸棒桿菌中的pyc、gltA、idsA和glgC[47]、銅綠假單胞菌(Pseudomonasaeruginosa)的prtR[48]以及金黃色葡萄球菌的tarO、tarH和tarG[49]。將CRISPR-dCas9系統(tǒng)應用于工業(yè)微生物可有效地提高目標產(chǎn)物的產(chǎn)量,如琥珀酸[50]、乙醛酸[51]、白藜蘆醇[52]、1,4-丁二醇[53]等。相比之下,關于細菌CRISPRa的報道則較少。
由CRISPR-Cas9改造而來的CRISPR-dCas9系統(tǒng)雖然已廣泛應用于基因的轉錄調(diào)控,但對于多個靶點需要多個sgRNA的獨立表達。相比之下,采用CRISPR-Cpf1系統(tǒng)則只需設計由19 nt的同向重復序列和23~25 nt的間隔序列組成的crRNA即可實現(xiàn)單基因敲除。更重要的是,將多個crRNA直接串聯(lián),只需要一個啟動子驅動即可簡單高效地實現(xiàn)多基因敲除。而且,crRNA序列的長度比CRISPR-Cas9系統(tǒng)的sgRNA短約60 nt,大大降低了構建系統(tǒng)的難度和成本[3,35]。同時,Cpf1蛋白同時具有DNA內(nèi)切酶(DNase)和RNA內(nèi)切酶活性,且DNase失活并不影響RNA內(nèi)切酶的活性,系統(tǒng)依然能生成成熟的crRNA,靶向識別目標DNA[54]。于是,ZHANG等[55]將Cpf1中的第993位谷氨酸突變?yōu)楸彼?,獲得了DNase失活的DNase-dead Cpf1(ddCpf1),并將其成功用于大腸桿菌的多位點轉錄調(diào)控。LI等[35]開發(fā)了基于ddCpf1的CRISPRi系統(tǒng)用于多重基因抑制,在天藍色鏈霉菌中同時抑制了3種抗生素生物合成基因(cpkA、redX、orf1)的表達,效率約為70%。
通過敲除負責降解目標DNA的cas3,大腸桿菌中的內(nèi)源性I-E型CRISPR-Cas系統(tǒng)被用作可編程基因表達調(diào)節(jié)器[56]。CHANG等[57]在大腸桿菌中構建了內(nèi)源I-E型CRISPR-Cas系統(tǒng),將大腸桿菌中的靶基因表達量下調(diào)了82%。TARASAVA等[58]使用改良的內(nèi)源I-E型CRISPR-Cas系統(tǒng),可以同時靶向6個不同的基因,通過篩選增加丙二酰輔酶A通量的突變體,提高了大腸桿菌中3-羥基丙酸的產(chǎn)量。
自JINEK等[2]于2012年在體外證明了CRISPR-Cas9系統(tǒng)的DNA切割機制后,該系統(tǒng)憑借高效、經(jīng)濟、簡便等優(yōu)點逐漸代替了傳統(tǒng)的基因組編輯技術,被廣泛應用于細菌的基因組編輯。結構更簡單的CRISPR-Cpf1系統(tǒng)拓寬了CRISPR-Cas系統(tǒng)的應用范圍并且具有更高地基因組編輯效率。而針對無法引入Cas9和Cpf1的宿主菌,可利用細菌的內(nèi)源I型CRISPR-Cas系統(tǒng)進行基因組編輯和代謝調(diào)控。同時,由于Cas9造成的DSB容易引起細胞死亡,于是在其基礎上開發(fā)出了CRISPR-Cas9n系統(tǒng)。另外,對Cas9和Cpf1進行改造得到的dCas9和ddCpf1還可以用于調(diào)控基因的轉錄表達。
但CRISPR-Cas系統(tǒng)依然存在改進的空間。首先,CRISPR-Cas系統(tǒng)對PAM位點的特異性識別以及宿主菌對異源蛋白的排斥限制了該系統(tǒng)的應用范圍。因此,未來應努力改造Cas蛋白以擴大其識別范圍并繼續(xù)開發(fā)內(nèi)源CRISPR-Cas系統(tǒng)。其次,細菌基因組編輯效率因物種而異,表明宿主菌的生理活動會影響CRISPR-Cas系統(tǒng)。今后應開發(fā)更可靠、可誘導和廣泛適用的表達結構,使Cas效應子和gRNA在不同宿主菌中均能穩(wěn)定表達。最后,隨著CRISPR-Cas系統(tǒng)的大量應用,將生成包含數(shù)百萬甚至數(shù)十億變體的大型文庫[59],因此開發(fā)高通量技術很有必要,例如高效轉化方法、機器人平臺和微流體系統(tǒng)等。相信隨著科學技術的進步,CRISPR-Cas系統(tǒng)將來會擁有更優(yōu)異的性能。