劉光宇,徐曉靜,夏科科,孫海汐,陶月如,崔 震,顧 穎
(深圳華大生命科學研究院,廣東 深圳 518083)
谷子(Setaria italica)作為1 年生的二倍體禾本科植物,主要在亞洲、非洲北部、南美洲和北美洲的干旱和半干旱地區(qū)種植,是優(yōu)質的糧飼兼用作物[1-2]。由于谷子基因組較小、生育期短、自花授粉、種質資源豐富、與其他主糧作物和生物質能源草本植物關系密切,有巨大的潛力成為模式作物以更好地了解C4 植物的光合作用[3-4]。雖然在過去的20 a谷子的遺傳轉化效率較低(5.5%~9.0%),但最近高效的谷子遺傳轉化方法已經被報道,轉化效率高達19.2%,這使得利用基因編輯工具進行谷子功能基因研究和遺傳改良成為可能[5-8]。
CRISPR/Cas9 (Clustered regularly interspaced short palindromic repeats/CRISPR-associated protein 9)系統(tǒng)是進行基因編輯的重要工具之一。該系統(tǒng)由gRNA(Guide RNA)引導Cas9 在靶位點通過識別前間隔序列鄰近基序(PAM)產生雙鏈DNA 斷裂,隨后通過非同源末端連接(NHEJ)或同源定向修復(HDR)機制引入基因突變[9]。NHEJ 主要通過產生短小的核苷酸插入或缺失造成基因突變,而HDR介導的基因組編輯可在目標DNA 序列中精確引入所需的基因片段[10]。
CRISPR/Cas9 系統(tǒng)已被廣泛有效地應用于包括植物在內的多種生物的靶向基因突變。將CRISPR/Cas9 系統(tǒng)應用于一個新的植物物種時,首先需要針對系統(tǒng)中的表達元件,如啟動子、Cas9和gRNA 等進行優(yōu)化。內源性的組成型啟動子和密碼子優(yōu)化可以提高Cas9 在宿主內的表達水平[11-16]。gRNA 表達元件呈現(xiàn)多元化,比如單一gRNA、雙gRNA 串聯(lián)和基于tRNA 的工具包等。增加gRNA 數(shù)量可以使gRNA表達元件釋放更多成熟的gRNA,增加Cas9的靶位點,進而提高基因編輯效率或進行多位點的同時編輯[17-20]。對Cas9 和gRNA 表達元件同時進行優(yōu)化組合可進一步提高基因編輯效率。這些高效的基因編輯工具被用于植物育種以提高新品種的培育效率[10,21]。
植物原生質體可用于快速評估基因編輯工具的效率,進而對基因編輯工具進行優(yōu)化[22-24]。植物原生質體易于獲得,并且基因編輯工具可通過聚乙二醇(PEG)快速導入原生質體中,試驗在7 d內可以完成。基因編輯工具通過植物組織培養(yǎng)的遺傳轉化周期至少在3個月以上,獲得再生植株后還需要進行大量的篩選工作。因此,基于原生質體的方法優(yōu)化CRIPSR/Cas9系統(tǒng)比基于組織培養(yǎng)的方法更高效。另外,核糖核蛋白(RNP)復合物也可以通過PEG 介導傳遞到植物原生質體中,在不引入外源DNA 的情況下誘導靶點突變[25-27]。這種突變區(qū)別于轉基因作物的突變機制,有助于提高公眾對基因編輯作物的接受度。
為了檢測轉化原生質體后CRISPR/Cas9系統(tǒng)誘導的突變頻率,需要提取原生質體DNA 并對靶向序列進行PCR 擴增,隨后可以用2 種簡單的方法來評估擴增產物:DNA 酶分析法和大規(guī)模平行測序法。DNA 酶分析法依賴酶消化產物的凝膠圖像密度來粗略估計誘變效率,包括限制性片段長度多態(tài)性(RFLP)、切割擴增多態(tài)性序列分析和T7 核酸內切酶Ⅰ(T7EⅠ)分析[28]。但由于限制性內切酶切割不完全或PCR 擴增錯誤等原因,很難在靶點檢測到低效率的突變,并且容易出現(xiàn)假陽性結果,而大規(guī)模平行測序法可以通過計算突變序列的百分比來避免這些問題[29-30]。
目前,在谷子中學者們對一些簡單的CRISPR/Cas9 系統(tǒng)已經進行了測試[22-23]。LIN 等[22]設計了一種單一RNA的基因編輯工具,將其轉入谷子原生質體中,通過DNA酶分析法測得其對八氫番茄紅素脫氫酶基因(PDS)靶點的編輯效率為10.2%。CHENG等[23]設計了雙gRNA 系統(tǒng),通過農桿菌介導法將其轉入谷子愈傷組織中,在65 個再生植株中檢測到26個編輯事件。但是,高效的基因組編輯工具仍需要開發(fā)和優(yōu)化。因此,針對谷子內源化Cas9表達元件,設計了多種gRNA 表達元件與其組合構建了多種CRISPR/Cas9 基因編輯系統(tǒng),將它們轉入谷子原生質體中,通過大規(guī)模平行測序技術分析SiPDS基因的突變頻率來評估這些基因編輯系統(tǒng)的編輯效率,從而快速篩選出基于tRNA 的高效基因編輯工具,并驗證RNP 復合物在谷子中進行基因編輯的有效性。這種基于原生質體的篩選系統(tǒng)可用于評估和優(yōu)化谷子基因組編輯工具,有助于加速谷子的基因功能研究和遺傳改良進程。
供試谷子品種為豫谷1 號,將其成熟種子置于30 ℃烘箱中48 h 打破休眠,隨后浸泡于5% H2O2溶液中16 h 以提高種子萌發(fā)率,然后用75%乙醇消毒1 min,2.5%次氯酸鈉表面消毒10 min。消毒完成后,挑選飽滿健康的種子平鋪于培養(yǎng)皿中的濾紙上,加入適量的蒸餾水,置于28 ℃培養(yǎng)箱中,光照條件下培養(yǎng)2 d,再轉入黑暗條件下培養(yǎng)5 d,隨后收獲黃化苗用于谷子原生質體的制備[31-32]。
從Phytozome 數(shù)據(jù)庫獲取谷子(Setaria italicv2.2)參考基因組序列,通過BLAST 獲得谷子PDS基因序列,并進一步通過Sanger 測序確認該基因在豫谷1號中的序列信息。利用CRISPR-GE(http://skl.scau.edu.cn/)設計6 個gRNA 用以靶向SiPDS基因保守結構域,序列和位置信息見圖1。根據(jù)谷子密碼子偏好優(yōu)化Cas9序列并在序列首尾加入2 個核定位信號(NLS)。所有核苷酸序列通過BGI-Write 平臺合成。
圖1 設計的gRNA序列和靶向SiPDS的位置Fig.1 Designed gRNAs sequences and targeting sites in SiPDS
首先,以pCAMBIA1300 載體為骨架整合Super啟動子(SP)或谷子內源的泛素啟動子(Ubi)驅動的綠色熒光蛋白基因(GFP),構建報告質粒SP-GFP和Ubi-GFP以指示原生質體瞬時轉化效率。然后,同樣以pCAMBIA1300 載體為骨架整合SP 或Ubi 啟動子驅動的Cas9 表達元件,構建中間載體SP-Cas9和Ubi-Cas9以進一步構建多種基因編輯系統(tǒng)。合成的單一gRNA、雙gRNA 和基于tRNA 結構并包含4個gRNA 的表達元件由水稻(Oryza sativa)U6 啟動子驅動,并通過多克隆位點區(qū)域的限制性內切酶BsaⅠ的2 個位點將其分別導入SP-Cas9或Ubi-Cas9中間載體,構建SP-gRNA1、Ubi-gRNA1、UbigRNA3、Ubi-dgRNAE1、Ubi-dgRNAE12、Ubi-tRNA質粒(圖2)。SP-gRNA1 和Ubi-gRNA1 用以篩選在谷子中更適合驅動Cas9的啟動子。Ubi-gRNA1、Ubi-gRNA3、Ubi-dgRNAE1、Ubi-dgRNAE12 和UbitRNA 用以優(yōu)化gRNA 表達元件,從而篩選高效的CRIPSR/Cas9基因編輯系統(tǒng)。
圖2 構建的CRISPR/Cas9基因編輯系統(tǒng)Fig.2 The constructed CRISPR/Cas9 gene editing systems
用MEGAshortscript?T7 轉錄試劑盒(Invitrogen,AM1354)進行gRNA 體外轉錄。參考LIANG 等[33]的方法在Cas9 反應緩沖液中將1 μg gRNA3、gRNA4和gRNA5 體外轉錄產物分別與1 μg Cas9(NEB,M0386S)混合并在室溫下靜置10 min 制備RNP 復合物。根據(jù)SiPDS基因靶位點附近的序列設計1 對引物,引物序列為5′-CCTGCAAGGTACCAACTTGA-3′和5′-GGTGCTTTTATGTGCAACCAGG-3′,通過PCR擴增獲得667 bp 的擴增產物。將此擴增產物純化后,添加制備好的RNP 復合物,37 ℃下共培養(yǎng)2 h。取20 μL反應液在1.5%的瓊脂糖凝膠中于120 V電壓下電泳20 min,然后通過觀察凝膠圖像檢測Cas9的切割活性,以篩選高效的RNP復合物。
原生質體分離和轉化采用PEG 介導的改良方法進行[32]。用刀片將黃化苗的幼莖切成0.5~1.0 mm 的小段,隨后放入裝有15 g/L 纖維素酶‘Onozuka’R-10(Yakult Pharmaceutical)、7.5 g/L 離析酶R-10(Yakult Pharmaceutical)、10 mmol/L 嗎啉乙磺酸(MES,pH 值5.7,Sigma,M3671)、10 mmol/L CaCl2(Sigma,C5670)、0.4 mol/L D-甘露醇(Sigma,M1902)和0.1% 牛血清白蛋白(BSA,Sigma,V900933)溶液的三角瓶中。三角瓶包裹錫紙后放入搖床中,60 r/min 培養(yǎng)約5 h 進行酶解反應。反應完成后組織懸浮液通過孔徑40 μm 的過濾器去除酶解溶液和組織碎片,用W5 緩沖液[154 mmol/L NaCl(Sigma,S5886)、5 mmol/L KCl(Sigma,P5405)、125 mmol/L CaCl2和2 mmol/L MES(pH 值5.7)]清洗2 次。將清洗后的混合溶液以100×g轉速緩慢離心5 min,收集原生質體,隨后用W5 緩沖液再洗滌原生質體2次,并在MMG 溶液(0.4 mmol/L D-甘露醇、15 mmol/L MgCl2和4.0 mmol/L MES,pH 值5.7)中重懸原生質體,顯微鏡下用血細胞儀計數(shù),然后將細胞濃度調整至2×106個/mL。
質粒(10 μg)和體外切割活性較高的RNP 復合物(20 μg Cas9 和20 μg gRNA)分別與細胞濃度為2×106個/mL 的原生質體在新鮮配制的400 g/L PEG溶液中暗置20 min。除去上清液后重懸于1 mL W5緩沖液中,室溫暗置培養(yǎng)48 h。
提取室溫暗置培養(yǎng)48 h 的原生質體DNA,并設計引物(表1)擴增含有SiPDS基因靶位點的DNA 序列。使用MGIEasy AmpSeq 建庫試劑盒構建測序文庫。用BGISEQ-500測序儀對文庫進行大規(guī)模平行測序。
表1 測序文庫構建所用引物信息Tab.1 Primers used for construction of sequencing library
測序read 中的突變有4 種類型,包括缺失、插入、替換和混合(替換加缺失、替換加插入等復雜類型)。每種類型的總突變效率通過突變的read 總數(shù)除以總read 數(shù)來估計。為了盡量減少擴增子測序錯誤引起的問題,測序數(shù)據(jù)中只發(fā)生一次的突變read 不計算在內[31]。每個CRISPR/Cas9 基因編輯系統(tǒng)的誘變效率由每個gRNA 序列區(qū)域內所有突變類型的總突變效率決定。
為了建立高效的谷子原生質體轉化系統(tǒng),利用PEG 介導法將SP-GFP和Ubi-GFP質粒轉入來源于7 d 黃化苗幼莖的原生質體中。質粒中的GFP基因表達的產物受到紫外或藍光激發(fā)時會發(fā)射綠色熒光(圖3a)。通過顯微觀察和統(tǒng)計發(fā)現(xiàn),SP-GFP和Ubi-GFP質粒的轉化效率為50.44%和57.36%(圖3b),這與之前報道的高效谷子原生質體轉化系統(tǒng)的轉化效率相近[22,34]。
圖3 SP和Ubi驅動GFP基因在谷子原生質體中的瞬時表達Fig.3 The transient expression of GFP driven by SP and Ubi promoters in S.italica protoplasts
為了篩選更適合驅動Cas9基因表達的啟動子,構建了SP-gRNA1 和Ubi-gRNA1 質粒并檢測它們在谷子原生質體中對SiPDS基因的編輯效率。結果表明,轉SP-gRNA1 質粒的谷子原生質體的基因突變頻率為0.5%,而轉Ubi-gRNA1 質粒的谷子原生質體的基因突變頻率為5.5%(圖4),說明在谷子原生質體中內源性Ubi 啟動子比SP 啟動子更適合驅動Cas9基因的表達。因此,在后續(xù)試驗中選擇Ubi啟動子來驅動Cas9基因的表達。
圖4 CRISPR/Cas9 基因編輯系統(tǒng)對SiPDS基因的突變頻率Fig.4 Mutation efficiency of SiPDS gene induced by CRISPR/Cas9 gene editing systems
為了研究多元化gRNA 表達元件對提高基因突變效率的作用,設計了雙gRNA系統(tǒng),并構建了UbidgRNAE1 和Ubi-dgRNAE12 質粒。與單一gRNA 系統(tǒng)Ubi-gRNA1 相比,Ubi-dgRNAE1 對SiPDS基因第一外顯子靶點的基因突變頻率增加了1.66 倍,為14.56%(圖4)。靶向SiPDS基因第12 外顯子的雙gRNA 系統(tǒng)Ubi-dgRNAE12 比單一gRNA 系統(tǒng)UbigRNA3 的基因突變頻率提高了1.11 倍,為15.71%(圖4)。這些結果表明,額外添加1 個gRNA 可以提高CRISPR/Cas9 基因編輯系統(tǒng)對SiPDS基因的突變效率。
為了進一步提高靶向基因的突變效率,利用tRNA 結構優(yōu)化gRNA 表達元件并構建了包含4 個gRNA 的Ubi-tRNA 質粒。結果顯示,轉Ubi-tRNA質粒的谷子原生質體的SiPDS基因突變頻率提升至51.24%,相較于轉Ubi-gRNA3 和Ubi-dgRNAE12 質粒的谷子原生質體分別增加了5.87 倍和2.26 倍(圖4)。綜上,利用tRNA 系統(tǒng)組裝多個gRNA 可以進一步提高CRISPR/Cas9 基因編輯系統(tǒng)對SiPDS基因的突變效率。
為了進一步調查多元化gRNA 基因編輯系統(tǒng)誘導SiPDS基因的多位點突變效率,本研究統(tǒng)計了Ubi-dgRNAE1、Ubi-dgRNAE12、Ubi-tRNA 系統(tǒng)在單一靶位點和多個靶位點同時發(fā)生編輯事件的頻率。結果(表2)表明,Ubi-dgRNAE1 在單一靶位點的突變頻率為14.42%,而同時編輯2 個靶位點的突變頻率僅為0.14%。在轉Ubi-dgRNAE12 谷子原生質體中,也發(fā)現(xiàn)同時編輯SiPDS基因2 個靶位點的突變頻率極低。上述結果表明,利用雙gRNA 系統(tǒng)同時編輯SiPDS基因2 個靶位點的效率極低。轉Ubi-tRNA 谷子原生質體中SiPDS基因單一靶位點的突變頻率為48.00%,同時編輯2、3 個靶位點的突變頻率分別為2.99%、0.24%,分別占總突變頻率的5.83%、0.47%。這些結果證實了tRNA 結構可以有效提高基因編輯系統(tǒng)同時靶向SiPDS基因多個位點的突變效率,而雙gRNA 串聯(lián)結構對提高多位點編輯效率的作用不明顯。
表2 谷子原生質體中CRISPR/Cas9基因編輯系統(tǒng)同時靶向SiPDS基因多個位點的突變頻率Tab.2 Mutation frequency of targeting multiple sites by CRISPR/Cas9 gene editing systems in S.italica protoplasts
為了篩選高效的RNP 復合物,選取gRNA3、gRNA4、gRNA5 進行體外轉錄,其產物分別與Cas9蛋白混合制備RNP 復合物。用RNP-gRNA3、RNPgRNA4 和RNP-gRNA5 復合物對SiPDS基因靶點擴增的DNA序列進行體外切割活性檢測,凝膠圖像顯示RNP-gRNA5 復合物體外切割活性高于RNPgRNA3和RNP-gRNA4復合物(圖5a)。根據(jù)此結果將RNP-gRNA5 復合物轉入谷子原生質體后進行大規(guī)模平行測序以評估其引起SiPDS基因突變的效率。結果表明,RNP-gRNA5復合物引起SiPDS基因的突變頻率為2.0%(圖5b)。
為了進一步研究RNP-gRNA5 復合物誘導的SiPDS基因靶點突變類型,對突變譜進行了分析,包括1、2、3 及以上堿基對(bp)缺失、插入和其他(替換、替換加缺失、替換加插入等)突變類型。統(tǒng)計結果(圖5c)顯示,缺失突變類型在總突變類型中的占比高達98.33%。其中,1、2、3 bp 缺失突變類型分別占35.41%、35.30%、24.76%,3 bp以上缺失突變類型占比下降至2.86%。插入和其他突變類型在總突變類型中的占比不超過2%。上述結果表明,RNPgRNA5 復合物誘導的SiPDS基因突變類型主要為小片段(1~3 bp)的缺失。
圖5 RNP復合物在谷子原生質體中編輯SiPDS基因的有效性分析Fig.5 Efficiency of RNP complexes editing SiPDS gene in S.italica protoplasts
谷子穩(wěn)定的遺傳轉化可以實現(xiàn)編輯位點在后代植株中的穩(wěn)定遺傳,但需要組織培養(yǎng)、載體傳遞和植株再生等較煩瑣的過程,對于基因編輯工具的篩選和優(yōu)化既費時又費力。相對而言,谷子原生質體更容易獲得,轉化容易,試驗周期較短,已用于突變檢測[22]、再生[35]和蛋白質互作[36]等研究中。與前人[22,34-36]研究結果相比,本研究采用生長7 d 的黃化苗制備谷子原生質體,從時間上更早,并且轉化效率可以達到同樣的高效水平。此外,大規(guī)模平行測序可以在短時間內以較低的人工成本實現(xiàn)高通量突變檢測和分析,并且可以提供比傳統(tǒng)DNA酶分析法更準確的統(tǒng)計數(shù)據(jù)。因此,基于谷子原生質體的大規(guī)模平行測序系統(tǒng)可以作為一種簡便有效的方法對基因編輯工具進行快速篩選和優(yōu)化,在穩(wěn)定遺傳轉化前即可篩選到高效的基因編輯工具。
CRISPR/Cas9 系統(tǒng)在谷子中的應用相對比較簡單,目前只有包含單一或2 個gRNA 的基因編輯工具被報道,并且其基因突變效率不高[22-23]。CRISPR/Cas9 系統(tǒng)中更多的組件需要測試和優(yōu)化以開發(fā)更高效的基因編輯工具。優(yōu)化Cas9基因的密碼子以適應寄主植物已成為共識。許多研究用內源性Cas9 啟動子提高CRISPR/Cas9 系統(tǒng)的基因突變效率[13-16]。本研究利用開發(fā)的原生質體系統(tǒng)證明谷子內源性Ubi 啟動子可以提高CRISPR/Cas9 基因編輯系統(tǒng)對SiPDS基因的突變效率,也可以進一步應用本研究開發(fā)的這套系統(tǒng)快速篩選更高效的啟動子及其他元件。
多元化的gRNA 表達元件可以釋放出更多成熟的gRNA,以靶向多個位點從而提高編輯效率。2個gRNA串聯(lián)的表達元件可以提高Cas9在胡蘿卜細胞中的靶向概率[18],相似的表達元件被用來靶向獼猴桃PDS基因的2 個不同外顯子以確?;蚯贸齕19]。本研究結果表明,與單一gRNA 導向的基因編輯系統(tǒng)相比,2 個gRNA 串聯(lián)的基因編輯系統(tǒng)UbidgRNAE1 和Ubi-dgRNAE12 的總突變頻率提高,但是同時編輯2 個靶位點的的突變頻率還是極低,說明在CRISPR/Cas9 系統(tǒng)中串聯(lián)2 個gRNA 的表達元件對同時編輯2 個靶位點效率的提升并不明顯,在最近報道的研究中也發(fā)現(xiàn)了類似的結果[23]。進一步利用tRNA 結構優(yōu)化CRISPR/Cas9 系統(tǒng),構建的Ubi-tRNA 質粒不僅具有較高的總誘變頻率,而且增強了多重基因組編輯能力。這些結果表明,基于tRNA 的CRISPR/Cas 基因編輯系統(tǒng)可以高效地引起目標基因突變,提高誘變效率。未來將其應用于谷子的穩(wěn)定遺傳轉化可能產生更多的突變植株,甚至可以進行多基因編輯以達到更高的育種目標。
通過RNP 復合物進行基因組編輯提供了一種在植物中無外源DNA 引入和低脫靶編輯的方法[10]。在作物中應用RNP 復合物引起的編輯效率并不高,介于2.4%~9.7%,但在萵苣中卻異常地高達46%[25-27]。本研究結果表明,RNP 復合物RNPgRNA5 在谷子原生質體中的誘變效率為2.0%。這種相對較低的誘變效率可能是由于RNP-gRNA5 的轉化效率較低或者是選取的gRNA 活性不高。不過這些問題可以通過使用本研究開發(fā)的原生質體系統(tǒng)進一步篩選優(yōu)化更多的RNP 復合物來解決。盡管RNP 復合物引起的基因突變效率不高,但由于該方法簡便、快速、可操作性強,對于大多數(shù)研究來說仍然是可以接受的[26]。此外,RNP 復合物可在不引入外源DNA 的情況下對目標基因進行編輯。RNP復合物有巨大的潛力成為重要的基因編輯工具。