李雪琪 張素杰 于曼 黃金光 周煥斌
(1.青島農(nóng)業(yè)大學(xué)植物醫(yī)學(xué)學(xué)院,青島 266109;2.中國農(nóng)業(yè)科學(xué)院植物保護研究所 植物病蟲害生物學(xué)國家重點實驗室,北京 100093;3.農(nóng)業(yè)農(nóng)村部桂林作物有害生物科學(xué)觀測實驗站,桂林 541399)
基因組編輯技術(shù)是在基因組水平上對DNA序列進行定點改造和修飾的一種新興的基因工程技術(shù),它在基因功能研究、植物遺傳改良和分子育種等方面發(fā)揮著重要的作用[1]。其中CRISPR/Cas介導(dǎo)的基因組編輯系統(tǒng)由于設(shè)計簡單、低成本和高精準(zhǔn)性等特點,被廣泛應(yīng)用于改良植物遺傳性狀,包括提高產(chǎn)量、提高植物病蟲害抗性以及提高抗逆性等[2-3]。
CRISPR/Cas系統(tǒng)是存在于原核生物中的一種天然免疫系統(tǒng),根據(jù)效應(yīng)復(fù)合物和Cas蛋白的不同,CRISPR/Cas系統(tǒng)分為兩大類、六種類型和若干亞型。其中Ⅱ型的Cas9蛋白和Ⅴ型的Cas12蛋白,是目前應(yīng)用最廣泛的CRISPR/Cas系統(tǒng)[4]。
CRISPR/SpCas9系統(tǒng)由兩部分組成:SpCas9核酸酶和single guide RNA(sgRNA),sgRNA是通過CRISPR RNA(crRNA)和反式激活CRISPR RNA(tracrRNA)的融合組成的[5],Cas9有兩個不同的核酸酶結(jié)構(gòu)域:HNH和RuvC-like,其中HNH切割靶標(biāo)DNA鏈,RuvC-like切割含PAM序列的非靶標(biāo)DNA鏈[6]。常用的SpCas9識別NGG PAM[7],這種特定的PAM要求限制了CRISPR系統(tǒng)可編輯的區(qū)域。為了拓展CRISPR/Cas系統(tǒng)對不同PAM序列的兼容性,需要挖掘出新的識別不同PAM的天然Cas9蛋白或人工改造的Cas9變體。例如,不同來源的SpCas9的天然同源物ScCas9、SaCas9以及St1Cas9等,并已被證明分別可以識別NNG、NNGRRT和NNAGAAW PAM序列[8-10]。SpCas9定向進化產(chǎn)生的突變體SpRY、xCas9和Cas9-NG能夠識別含G-PAM和A-PAM[11-13]。
Cas12核酸酶屬于V型CRISPR系統(tǒng),包含Cas12a-Cas12k幾種變體,是一種單一的RNA引導(dǎo)的內(nèi)切酶,不需要tracrRNA,只需要crRNA就能進行打靶。Cas12a(又稱Cpf1)是第一個廣泛用于基因組編輯的Cas12核酸酶,具有DNA和RNA內(nèi)切酶活性,與Cas9蛋白不同的是Cas12a僅需要一個切割結(jié)構(gòu)域即可在靶位點處產(chǎn)生DSBs[14]。另一方面,Cas12a可以靶向植物基因組中富含T的序列,彌補了Cas9只能識別富含G的序列的缺陷,進一步擴大了CRISPR/Cas系統(tǒng)的打靶范圍[15]。
Cas12e(又稱CasX)是通過對地下水中的細菌進行宏基因組分析而確定的,CasX具有兩個同源蛋白,來自Deltaproteobacteria的CasX(以下稱為DpbCasX)和來自Planctomycetes的CasX(以下稱為PlmCasX),它們具有68.5%的序列相似性。基于該蛋白建立的CRISPR/CasX系統(tǒng)可以通過提供一類更小的、可編程的核酸酶作為額外的治療選擇,擴展了CRISPR/Cas基因組編輯家族[16-18]。與Cas9(~1 300 aa)或Cas12a(~1 200 aa)相比,CasX(~980 aa)足夠小,可以通過單個AAV傳遞,并有額外的空間用于多重單向?qū)NA(gRNA)或蛋白質(zhì)域融合[19-21]。與SpCas9蛋白識別NGG PAM和Cas12a蛋白識別TTTV PAM位點不同的是,CasX蛋白能夠識別TTCN PAM序列位點。因此,本研究通過利用PlmCasX和DpbCasX蛋白,建立基于CRISPR/CasX介導(dǎo)的水稻基因編輯系統(tǒng),擴大基因編輯技術(shù)在水稻中的應(yīng)用范圍。
1.1.1 植物材料 均來自早熟水稻粳稻品種Kitaake,收獲的青種子主要用于水稻遺傳轉(zhuǎn)化,熟種子用于原生質(zhì)體制備。
1.1.2 菌株、質(zhì)粒及試劑 本研究所用的菌株和質(zhì)粒見表1。酵母粉、胰蛋白胨、細菌用瓊脂粉、植物組培用瓊脂粉、2,4-二氯苯氧乙酸、萘乙酸和6芐基腺嘌呤購自北京索萊寶公司。潮霉素、特美汀、乙酰丁香酮、氨芐青霉素、氨芐青霉素、硫酸卡那霉素和利福平購自上海翊圣生物科技公司。十六烷基三甲基溴化銨、溴化乙錠購自北京冰達生物科技公司。NaCl、三氯甲烷、異丙醇、乙醇、Tris、甘露醇、山梨醇和蔗糖等常用試劑購自國藥集團。質(zhì)粒提取試劑盒購自北京全式金生物技術(shù)公司、膠回收試劑盒購自南京諾唯贊生物科技股份有限公司。T4 DNA Ligase、ATP、T4 polynucleotide kinase等購自TaKaRa。Bsa I、Sap I購自NEB。PCR擴增用的高保真酶2× TransStart? FastPfu PCR SuperMix購自北京全式金生物技術(shù)公司,Gateway? LR ClonaseTM II Enzyme Mix購自Invitrogen。
表1 載體與菌株Table 1 Bacterial strains and plasmids
1.1.3 所用引物 實驗中用到的引物的合成及測序由生工生物工程(上海)股份有限公司完成(表2)。
表2 引物序列信息Table 2 Primer sequences
1.2.1 CasX表達載體的構(gòu)建 人工合成DpbCasX和PlmCasX兩個片段,通過BamH I/Spe I雙酶切將合成的基因片段克隆至瞬時表達載體pUC19中,由CaMV 35S啟動子驅(qū)動表達,同時克隆至雙元表達載體pUbi中,由玉米泛素蛋白啟動子(Ubi-p)驅(qū)動表達,分別構(gòu)建pUbi-DpbCasX、pUbi-PlmCasX和pUC19-DpbCasX、pUC19-PlmCasX四個載體(圖1-A-B)。
圖1 載體示意圖Fig.1 Schematics of vector
MIDAS(Improving Editing Activity by Synergistic Engineering)是一種蛋白質(zhì)工程化改造的新方法,能顯著增強PlmCasX在人類細胞中的基因組編輯活性[22],MIDAS(T26R/K610R/K808R)突變體的構(gòu)建方法:分別用引物對pUbi-PlmCasX-F1/R1、pU-bi-PlmCasX-F2/R2、pUbi-PlmCasX-F3/R3、pUbi-Plm-CasX-F4/R4(表2)以PlmCasX合成片段為模板進行PCR擴增,回收純化后進行infusion連接,命名為PlmCasX-V1。最后通過BamH I/Spe I雙酶切,分別連接到雙元載體和pUC19骨架上,構(gòu)建pUbi-PlmCasX-V1和pUC19-PlmCasX-V1兩個載體。
1.2.2 crRNA的設(shè)計及打靶載體的構(gòu)建 利用具有核酸酶活性的HDV核酶單元、tRNA、CRISPR/CasX系統(tǒng)的crRNA靶序列間隔DNA修復(fù)模板,使用CaMV 35S啟動子和Nos終止子,命名為CasX-crRNA交由生工合成(圖1-C),與用Bsa I酶切后的pENTR4-gRNA41載體連接,經(jīng)酶切驗證及測序,最終得到正確質(zhì)粒,命名為pHZ38。
gRNA的設(shè)計:根據(jù)水稻基因組數(shù)據(jù)中內(nèi)源基因序列,尋找PAM位點為TTCN(TTCA、TTCT、TTCC、TTCG)的合適靶點。使用Bsa I酶切位點時正向引物的黏性末端為aaag,反向引物為ggcc;使用Sap I酶切位點時的正向引物的黏性末端為aag,反向引物為gcc。
gRNAs的構(gòu)建方法參考文章[23]。
互補的引物對(表2)經(jīng)磷酸化處理后通過熱處理后自然冷卻結(jié)合成雙鏈,然后插入經(jīng)Bsa I或Sap I酶切后的pHZ38載體中。通過gateway的LR反應(yīng)將gRNA插入到雙元載體pUbi-DpbCasX、pUbi-PlmCasX和pUbi-PlmCasX-V1中,最終轉(zhuǎn)入農(nóng)桿菌EHA105中用于水稻遺傳轉(zhuǎn)化。
1.2.3 水稻原生質(zhì)體轉(zhuǎn)化 PEG介導(dǎo)的水稻原生質(zhì)體的轉(zhuǎn)化方法參考李超的文章[24]。將pUC19載體和gRNA載體通過PEG介導(dǎo)的水稻原生質(zhì)體轉(zhuǎn)化導(dǎo)入水稻細胞中進行共表達,轉(zhuǎn)染48 h后收集并提取原生質(zhì)體DNA,利用OsCPK16基因的特異引物(表2)進行PCR擴增和高通量測序,鑒定靶位點是否發(fā)生基因編輯。
1.2.4 農(nóng)桿菌轉(zhuǎn)化 本試驗中農(nóng)桿菌介導(dǎo)的水稻穩(wěn)定遺傳轉(zhuǎn)化方法參考Hiei等[25]和Nguyen等[26]的方法。雙元載體pUbi-DpbCasX、pUbi-PlmCasX及pUbi-PlmCasX-V1對含有不同TTCN(TTCA、TTCT、TTCC、TTCG)PAM序列的水稻內(nèi)源基因進行打靶后,轉(zhuǎn)入用未成熟的Kitaake種子誘導(dǎo)出的水稻愈傷中進行水稻遺傳轉(zhuǎn)化。
1.2.5 編輯效率檢測 采用十六烷基三甲基溴化銨(CTAB)方法提取水稻原生質(zhì)體基因組DNA,采用磁珠法提取水稻轉(zhuǎn)基因材料的基因組DNA,通過高通量測序的方法對編輯效率進行分析。
首先根據(jù)常規(guī)PCR引物設(shè)計原則進行引物設(shè)計(18-22 nt):檢測位點必需在正向或反向引物附近(10-60 bp范圍內(nèi)),擴增長度為150-200 bp;在正向引物前端加搭橋序列5′-ggagtgagtacggtgtgc-3′,反向引物前端加搭橋序列5′-gagttggatgctggatgg-3′。以提取的基因組DNA為模板,并用2× Rapid Taq Master酶進行第一輪擴增,PCR反應(yīng)結(jié)束后,用1%瓊脂糖凝膠電泳檢查DNA質(zhì)量,確認所有樣品條帶亮度一致且特異后,以第一輪擴增產(chǎn)物為模板,barcoded引物(合成12條barcoded正向引物,9條barcoded反向引物)進行第二輪擴增,將所有的PCR產(chǎn)物等量混合,直接純化回收構(gòu)建文庫,檢測文庫的DNA濃度,送給公司上機測序。最后對數(shù)據(jù)進行處理,根據(jù)不同的引物序列對每個樣品進行拆分,分析基因編輯的效率。
已有報道表明DpbCasX具有在大腸桿菌細胞中切割靶基因的能力,而其失活的對應(yīng)物能夠結(jié)合靶基因并降低基因表達。首先對DpbCasX基因按照水稻密碼子使用偏好性進行了密碼子優(yōu)化后進行人工合成,后克隆至瞬時表達載體pUC19中,用于水稻原生質(zhì)體瞬時表達檢測DpbCasX的編輯活性。以水稻內(nèi)源基因OsCPK16作為目的基因,設(shè)計以TTCT為PAM的gRNA插入pHZ38中,在水稻細胞中表達DpbCasX的gRNA。
將表達CasX蛋白的pUC19載體和攜帶靶位點gRNA的pHZ38載體通過PEG介導(dǎo)的方法共轉(zhuǎn)化水稻原生質(zhì)體,并對靶位點進行編輯活性檢測。通過高通量測序結(jié)果顯示(圖2),pUC19:DpbCasX與gRNA共轉(zhuǎn)化后,實現(xiàn)了對水稻內(nèi)源基因OsCPK16的有效編輯,且在DpbCasX蛋白處理下引起的靶位點的突變在-7 - -23 bp之間。上述結(jié)果證明以TTCT為PAM的CRISPR/DpbCasX系統(tǒng)在水稻中具有編輯活性。
圖2 CRISPR/DpbCasX系統(tǒng)打靶OsCPK16基因在水稻原生質(zhì)體中的編輯效率Fig.2 Editing efficiency of OsCPK16 gene targeted by CRISPR/DpbCasX system in rice protoplasts
接下來通過水稻穩(wěn)定遺傳轉(zhuǎn)化實驗進行進一步的驗證。本研究將DpbCasX合成片段通過BamH I和Spe I酶切克隆至雙元表達載體pUbi中,并選擇了水稻內(nèi)源基因OsCPK30和OsCPK4能夠識別TTCG PAM序列的靶位點、水稻內(nèi)源基因OsCPK21能夠識別TTCA PAM序列的靶位點、水稻內(nèi)源基因OsCPK23和OsCPK14能夠識別TTCC PAM序列的靶位點以及水稻內(nèi)源基因OsCPK11和OsCPK27能夠識別TTCT PAM序列的靶位點進行打靶實驗(表3),利用農(nóng)桿菌介導(dǎo)的水稻穩(wěn)定遺傳轉(zhuǎn)化檢測其編輯效率,通過PCR擴增和高通量測序?qū)Λ@得的獨立轉(zhuǎn)基因水稻品系進行基因型分析。結(jié)果顯示(圖3),DpbCasX蛋白只在打靶含TTCA PAM識別位點的水稻基因OsCPK21實驗中有編輯效率,得到的40株轉(zhuǎn)基因獨立株系中,檢測到7株發(fā)生了編輯,編輯效率為17.5%,發(fā)生編輯的突變材料中,有5株為單等位基因突變,2株為雙等位基因突變,且靶位點在DpbCasX蛋白處理下引起的突變在-7- -10 bp之間。
圖3 CRISPR/DpbCasX和CRISPR/PlmCasX系統(tǒng)打靶OsCPK4和OsCPK21基因高通量測序結(jié)果比較Fig.3 Comparison of high-throughput sequencing results of OsCPK4 and OsCPK21 genes targeted by CRISPR/DpbCasX and CRISPR/PlmCasX systems
表3 DpbCasX、PlmCasX編輯效率比較Table 3 Comparison of editing efficiency among DpbCasX and PlmCasX
為了進一步建立水稻CRISPR/CasX系統(tǒng),又對PlmCasX基因按照水稻密碼子使用偏好性進行了密碼子優(yōu)化后進行人工合成,克隆至瞬時表達載體pUC19中。以水稻內(nèi)源基因OsCPK16作為目的基因,將表達CasX蛋白的pUC19載體和攜帶靶位點gRNA的pHZ38載體通過水稻原生質(zhì)體瞬時表達檢測PlmCasX的編輯活性。通過高通量測序結(jié)果顯示(圖4),pUC19: PlmCasX與gRNA共轉(zhuǎn)化后,也能實現(xiàn)對水稻內(nèi)源基因OsCPK16的有效編輯,且在PlmCasX蛋白處理下引起的突變在-8- -23 bp之間。證明了以TTCT為PAM的CRISPR/PlmCasX系統(tǒng)在水稻中具有編輯活性。
圖4 CRISPR/PlmCasX系統(tǒng)打靶OsCPK16基因在水稻原生質(zhì)體中的編輯效率Fig.4 Editing efficiency of OsCPK16 gene targeted by CRISPR/PlmCasX system in rice protoplasts
之后我們又將PlmCasX合成片段通過BamH I和Spe I酶切克隆至雙元表達載體pUbi中,并選擇了水稻內(nèi)源基因OsCPK30和OsCPK4能夠識別TTCG PAM序列的靶位點、水稻內(nèi)源基因OsCPK21能夠識別TTCA PAM序列的靶位點、水稻內(nèi)源基因OsCPK23和OsCPK14能夠識別TTCC PAM序列的靶位點以及水稻內(nèi)源基因OsCPK11和OsCPK27能夠識別TTCT PAM序列的靶位點進行打靶實驗(表3),利用農(nóng)桿菌介導(dǎo)的水稻穩(wěn)定遺傳轉(zhuǎn)化檢測其編輯效率,通過PCR擴增和高通量測序?qū)Λ@得的獨立轉(zhuǎn)基因水稻品系進行基因型分析。結(jié)果顯示(圖3),PlmCasX蛋白在打靶含TTCA PAM識別位點的水稻基因OsCPK21實驗中有編輯效率,得到的56株轉(zhuǎn)基因獨立株系中,檢測到37株發(fā)生了編輯,編輯效率為66.07%,發(fā)生編輯的突變材料中,有22株為單等位基因突變,15株為雙等位基因突變,且靶位點在PlmCasX蛋白處理下引起的突變在-7- -13 bp之間。在打靶含TTCG PAM識別位點的水稻基因OsCPK4實驗中,得到的56株轉(zhuǎn)基因獨立株系中,檢測到13株發(fā)生了編輯,編輯效率為23.21%,也主要以單基因突變?yōu)橹鳎⑶掖蠖鄶?shù)突變株在靶位點處產(chǎn)生的基因突變基本都在-7- -16 bp之間的基因突變。
為了進一步提高PlmCasX系統(tǒng)的編輯效率,本研究試圖用MIDAS方法對PlmCasX蛋白進行了優(yōu)化,構(gòu)建了基于PlmCasX-V1(T26R/K610R/K808R)的新系統(tǒng),并對上述7個水稻內(nèi)源基因(OsCPK11、OsCPK21、OsCPK23、OsCPK30、OsCPK4、OsCPK14、OsCPK27)進行打靶實驗,這些基因的PAM序列包含所有的TTCN PAM(TTCA、TTCC、TTCT、TTCG),通過PCR擴增和高通量測序?qū)Λ@得的獨立愈傷進行基因型分析。結(jié)果發(fā)現(xiàn)PlmCasX-V1在這7個靶位點都不具有編輯活性。
將OsCPK4和OsCPK21靶位點的序列通過網(wǎng)站CRISPR-GE(http://skl.scau.edu.cn/)進行檢索,查找潛在的脫靶基因,發(fā)現(xiàn)OsCPK4基因不存在含有4個及4個以下錯配堿基的靶位點,而OsCPK21存在含有兩個錯配堿基和一處缺失的潛在脫靶位點,設(shè)計特異性引物PCR擴增后進行Sanger測序(圖5),結(jié)果顯示均未發(fā)現(xiàn)脫靶現(xiàn)象。
圖5 OsCPK21基因潛在脫靶情況Fig.5 Potential off-target situation of OsCPK21 gene
Cas9和Cas12系統(tǒng)通過PAMs區(qū)分自身和非自身DNA靶,并產(chǎn)生雙鏈斷裂。Cas9識別富含G的PAM并產(chǎn)生被RuvC和HNH結(jié)構(gòu)域切割的平末端,而Cas12識別富含T的PAM并產(chǎn)生僅被RuvC結(jié)構(gòu)域切割的黏性末端,CasX則是一種新鑒定的能識別TTCN PAM序列的具有雙RNA導(dǎo)向的DNA靶向核酸酶的DNA切割特性[21]?;贑RISPR/CasX系統(tǒng)的建立,突破了SpCas9蛋白識別NGG PAM位點和Cas12a蛋白識別TTTV PAM位點的限制,在動植物基因組編輯中具有極大的潛力。有研究表明,在哺乳動物中CasX與Cas9和Cas12a相比具有更低的錯配耐受性,這表明CasX具有高保真度和低脫靶編輯,并且在哺乳動物中PlmCasX的編輯效率要高于DpbCasX[27]。本研究通過水稻原生質(zhì)體轉(zhuǎn)化和水稻穩(wěn)定遺傳轉(zhuǎn)化檢測到PlmCasX和DpbCasX在水稻內(nèi)源基因中均有編輯活性,但原生質(zhì)體中使用含有TTCT PAM的靶位點能檢測到編輯活性,而在水稻穩(wěn)定遺傳轉(zhuǎn)化的時候含TTCT PAM的靶位點并未檢測到編輯活性,這可能是因為靶位點不同,可能存在編輯位點依賴性,同時TTCT PAM的編輯活性較低,無法在穩(wěn)定遺傳轉(zhuǎn)化中檢測到,需要進一步實驗驗證。
Cas12a的同源蛋白LbCas12a和AsCas12a已被證實可以在水稻中實現(xiàn)基因編輯,在crRNA為23 nt時,LbCas12a和AsCas12a處理的樣品都能檢測出編輯效率,且在靶位點引起的突變基本都在-6- -12 bp之間[28],而本研究證實了CRISPR/DpbCasX和CRISPR/PlmCasX系統(tǒng)能夠產(chǎn)生-7- -23 bp堿基的突變,為創(chuàng)造新的水稻突變體提供了條件。
有研究構(gòu)建了CasX衍生型的穩(wěn)定活性構(gòu)象狀態(tài)的工程變體,使其在體外將催化效率提高了10-20倍,在人體細胞中平均編輯效率提高了2-3倍[29]。而本研究通過MIDAS對PlmCasX蛋白進行優(yōu)化,構(gòu)建了PlmCasX-V1突變體,沒有檢測到該突變體在水稻中的編輯活性。據(jù)報道,在哺乳動物細胞中經(jīng)過MIDSA處理的PlmCasX蛋白比野生型的PlmCasX蛋白的編輯效率高52%,而本研究中的靶位點均沒有編輯活性,這可能是因為本實驗選取的靶位點與該報道中的位點有差異,其只在哺乳動物中有編輯活性,在植物中是否可行還需要我們進一步實驗驗證。
綜上所述,本研究建立的基于CRISPR/CasX的水稻基因編輯系統(tǒng),為將來開發(fā)基于CRISPR/CasX系統(tǒng)的堿基編輯工具和引導(dǎo)編輯工具,用于基因功能研究、遺傳性狀改良和分子作物育種提供了良好的技術(shù)支撐。
本研究通過比較CasX的兩個衍生型蛋白PlmCasX和DpbCasX對不同水稻內(nèi)源基因的編輯效率,建立了基于CRISPR/CasX介導(dǎo)的水稻基因編輯系統(tǒng),且其能識別TTCR PAM這一特性,擴大了基因編輯技術(shù)在水稻中的應(yīng)用范圍。