徐鵬,郭琪,徐珍珍,孟珊,陳天子,沈新蓮
(江蘇省農(nóng)業(yè)科學院經(jīng)濟作物研究所/農(nóng)業(yè)部長江下游棉花與油菜重點實驗室,南京 210014)
目前,轉基因作物在許多國家和地區(qū)已經(jīng)被批準種植、加工和出口。 為了確保消費者健康和環(huán)境安全,在進入市場之前,必須強制性地對轉基因作物進行安全評估[1]。 轉基因作物的安全性評估從分子特征開始, 然后才是轉基因與非轉基因作物之間的表型和農(nóng)藝性狀的評估。 分子特征包括外源插入物的結構、表達、穩(wěn)定性遺傳信息以及插入位點的序列特征[2]。 因此在轉基因作物的風險評估中,分子特征識別是必不可少的。
近些年來,隨著更多的轉化體獲準商業(yè)化種植,轉基因作物的安全評價監(jiān)督管理及其知識產(chǎn)權的保護受到更廣泛的關注。 明確轉化體插入位點的分子特征是對轉基因作物知識產(chǎn)權保護和安全監(jiān)督管理的技術依據(jù)。 由于T-DNA 插入植物基因組中位置的不確定性, 不同轉化事件中T-DNA 插入位點的側翼序列也不同;因此,每一個轉化體都是唯一轉化事件,T-DNA 插入位點是每個轉化體的標簽。 鑒定出T-DNA 在植物基因組中的插入位點,根據(jù)插入位點處的側翼序列以及T-DNA 骨架序列建立轉化體特異性聚合酶鏈式反應(Polymerase chain reaction,PCR)檢測方法可以準確地識別不同轉化事件。 因此,明確新轉化體的側翼序列是建立PCR 檢測轉化體方法的基礎。目前,獲得T-DNA 插入位點側翼序列主要報道的方法有反向PCR 法[3]、 熱不對稱交錯PCR[4-5]、PCR 步移[6-7]和基因組重測序法[8-9]。 近些年來,陸地棉基因組序列的公布為準確而有效地鑒定外源轉基因在陸地棉中的插入位點奠定了基礎。
前期筆者團隊從鹽生植物海蓬子中獲得了高親和鉀離子轉運體SbHKT基因, 利用農(nóng)桿菌介導法將其轉入棉花,Southern 雜交結果顯示T0代轉基因陽性單株L-HKT-69 為單拷貝插入[10]。本研究對L-HKT-69 的T5代株系HKT-1 進行重測序, 獲得SbHKT基因在陸地棉基因組中的側翼序列, 分析外源T-DNA 在陸地棉基因組插入位點的序列特征, 從而構建SbHKT基因轉化事件的特異性檢測方法。
轉SbHKT基因抗逆棉花L-HKT-69 陽性單株是通過農(nóng)桿菌介導轉化陸地棉品系R15 子葉和下胚軸而獲得[10]。 HKT-1 為L-HKT-69 單株繁殖的T5代。 所用植物表達載體為pCAMBIA2301。
用CTAB 法[11]提取3 株HKT-1 陽性株系基因組DNA,然后等量混合。 利用Thermo Nanodrop 2000 超微量分光光度計檢測DNA 的純度,Qubit 2.0 熒光定量儀精確定量DNA 濃度。 檢測合格的DNA 樣品通過Covaris 破碎機隨機打斷成長度為350 bp 的片段, 采用TruSeq Library Construction Kit(Illumina 公司)進行建庫。文庫構建完成后,先使用Qubit 2.0 熒光定量儀進行初步定量, 稀釋文庫至1 mg·L-1, 隨后使用Agilent 2100 生物分析儀對文庫插入片段大小進行檢測,符合預期后, 使用實時定量聚合酶鏈式反應(Quantitative real time-PCR,qRT-PCR)方法對文庫的有效濃度進行準確定量(文庫有效濃度大于2 nmol·L-1),以保證文庫質量。 文庫檢測合格后通過Illumina HiSeq PE150 進行測序。 對下機得到的原始數(shù)據(jù)(Raw data)進行質量控制得到干凈數(shù)據(jù)(Clean data)。
以干凈數(shù)據(jù)作為檢索項, 含有SbHKT基因的pCAMBIA2301 載體(后文簡稱為:T-DNA 區(qū))骨架序列作為參考序列進行本地BlastN 比對(E值<1×10-10); 用CAP3 軟件進行聚類與拼接。剔除T-DNA 骨架序列后, 剩余部分序列為插入位點的側翼序列。
分別針對左邊界(Left border,LB)端側翼序列HKT1_LSEQ 和右邊界 (Right border,RB)端側翼序列HKT1_RSEQ 以及T-DNA 區(qū)段內(nèi)的骨架序列設計引物, 特異性擴增T-DNA 區(qū)骨架序列到其插入位點兩端側翼序列之間的片段。 同時以HKT1_LB_F 和HKT2_RB_R 為引物,特異性擴增HKT1_LSEQ 到HKT1_RSEQ 之間的序列(包含整個T-DNA 區(qū))。 引物由南京擎科生物科技有限公司合成, 序列如表1 所示, 位置如圖1所示。 PCR 產(chǎn)物經(jīng)瓊脂糖電泳分離后,將特異條帶回收純化,連接到pMD18-T 載體,轉化大腸桿菌,隨機挑選單克隆進行PCR 檢測,選擇PCR 檢測陽性的克隆測序驗證。
表1 本研究所用引物序列Table 1 Primer sequences in this study
利用Illumina 雙端對轉基因陽性株系HKT-1 進行了30×的重測序,對含有接頭的、低質量的原始數(shù)據(jù)過濾后得到約50 Gb(Gigabyte)的干凈數(shù)據(jù),以其為檢索序列,以含有SbHKT基因的T-DNA 區(qū)完整序列作為參考序列進行本地BlastN 比對, 獲得與T-DNA 區(qū)聯(lián)配的干凈數(shù)據(jù)共計1 887 條,其中38 條干凈數(shù)據(jù)僅有部分序列比對到T-DNA 骨架序列兩端 (表2)。 利用CAP3 對38 條干凈數(shù)據(jù)拼接,獲得了圖2 所示的2 條序列, 為SbHKT基因插入位點的側翼序列, 其中LB 端側翼序列HKT1_LSEQ 長度為107 bp,RB 端 側 翼 序 列HKT1_RSEQ 長 度 為122 bp。 因為在T-DNA 骨架序列兩側僅各自獲得1 條側翼序列, 暗示本研究中插入事件為單位點插入。
表2 部分干凈數(shù)據(jù)與T-DNA 區(qū)的比對結果Table 2 Alignment results of some clean reads with SbHKT vector
利用以上預測的側翼序列HKT1_LSEQ 和HKT1_RSEQ(圖2)作為檢索序列,比對陸地棉基因 組[12],HKT1_LSEQ 和HKT1_RSEQ 均 錨 定 到D08 染色體,兩者的物理距離約為2.5 Mb(表3),表明應該有2 個不同的插入事件, 與2.1 的結果矛盾。相關研究表明,由于T-DNA 的插入通常伴隨著插入位點序列的刪除、復制、染色體易位或倒位等現(xiàn)象[13]。 因此,推測本研究中T-DNA 的插入引起了陸地棉染色體的結構變異。 我們提取了HKT1_LSEQ 和HKT1_RSEQ 序列之間2.5 Mb 的參考基因組序列作為參考序列,以干凈數(shù)據(jù)作為檢索序列進行本地BlastN 比對, 其中編號為H5WHNDSXX:1:2454:27227:3646 的干凈數(shù)據(jù)前端58 bp 能夠比對到HKT1_RSEQ 附近, 而末端83 bp 能比對到HKT1_LSEQ 附近(表4),初步推測SbHKT基因的插入引發(fā)了陸地棉基因組較大的結構變異。
表3 側翼序列在陸地棉基因組中的定位Table 3 The position of the flanking sequence
表4 編號為H5WHNDSXX:1:2454:27227:3646 干凈數(shù)據(jù)的比對結果Table 4 Alignment results of clean reads numbered H5WHNDSXX:1:2454:27227:3646
為了驗證T-DNA 的插入位點, 分別針對HKT1_LSEQ 和HKT1_RSEQ 以 及T-DNA 骨 架序列設計特異引物(表1),特異性擴增T-DNA 骨架序列及其插入位點兩側的陸地棉基因組序列。2 對引物在轉SbHKT基因株系HKT-1 中均擴增出與預期大小一致的目的條帶,而轉化受體R15中均沒有擴增產(chǎn)物(圖3A)。 測序結果與參考序列完全一致, 顯示HKT1_LSEQ 和HKT1_RSEQ是SbHKT基因插入位點處的左右側翼序列。 為了進一步證明HKT1_LSEQ 和HKT1_RSEQ 為同一插入事件的側翼序列, 用引物HKT1_LB_F和HKT2_RB_R 對HKT-1 株系和對照R15 進行PCR 擴增, 在HKT-1 株系中擴增出7 000 bp 左右條帶,而R15 中并未擴增出任何產(chǎn)物(圖3B)。直接對7 000 bp 的PCR 產(chǎn)物測序發(fā)現(xiàn), 產(chǎn)物包含完整的T-DNA 骨架序列以及SbHKT基因序列,結果與參考序列一致,證實HKT1_LSEQ 和HKT1_RSEQ 為同一插入事件的2 個側翼序列。
SbHKT基因的插入造成了陸地棉R15 基因組發(fā)生了大片段的結構變異,利用CAP3 對結構變異處的干凈數(shù)據(jù)拼接后獲得序列Contig1,比對后發(fā)現(xiàn)D08 染色體65 715 837~65 716 919 bp片段倒置插入到63 234 670 bp 之前(圖4)。 根據(jù)Contig1 序列設計特異PCR 引物, 克隆并測序證實了HKT-1 株系中的結構變異。 然后,對HKT-1株系T-DNA 插入位點側翼序列(兩側各500 bp)的分析顯示,AT 含量分別為68.2%、66.8%。 說明T-DNA 偏好插入到AT 含量較高的區(qū)域,與前人研究結果[4-5]一致。
目前, 棉花中獲取T-DNA 側翼序列的主要手段是通過高效熱不對稱交錯PCR 和PCR 步移方法獲取T-DNA 側翼序列。 這些方法操作步驟復雜,特異性差,無法獲得很高的成功率。 前期的研究中, 我們通過高效熱不對稱交錯PCR 分離SbHKT基因插入陸地棉基因組的側翼序列,但是結果不太理想。 重測序技術是1 種簡單、可靠、高效的獲取外源T-DNA 插入位點的方法。 陸地棉基因組序列的公布為準確而有效地鑒定外源轉基因插入位點奠定了基礎。 本研究基于重測序技術獲得了轉SbHKT基因在陸地棉基因組中的側翼序列,證實通過重測序技術可以快速、準確且有效地鑒定外源轉基因插入位點。
基于以下4 點原因, 我們認為SbHKT基因的插入引發(fā)了陸地棉基因組較大的結構變異。(1)HKT1_LSEQ 和HKT1_RSEQ 的物理距離約為2.5 Mb。 我們分別從陸地棉基因組中調取HKT1_LSEQ 下游和HKT1_RSEQ 上游1 000 bp的序列作為其理論上存在的另一側側翼序列,設計特異引物對HKT-1 陽性株系以及對照R15 進
行PCR 擴增,均未能擴增出任何產(chǎn)物(結果未列出);(2)HKT1_LSEQ 和HKT1_RSEQ 錨定現(xiàn)有已公布的棉花基因組序列[12,14-17]均得到類似的結果,進一步排除了參考基因組的原因;(3)編號為H5WHNDSXX:1:2454:27227:3646 的干凈數(shù)據(jù)前端1~58 bp 序列定位到HKT1_RSEQ 附近,且末端68~150 bp 區(qū)間定位到HKT1_LSEQ 附近;(4)用特異引物HKT1_LB_F 和HKT2_RB_R 對HKT-1 株系和對照R15 進行PCR 擴增,在HKT-1 株系中擴增出7 000 bp 含有SbHKT基因的T-DNA 區(qū)完整序列, 而R15 中并未擴增出任何產(chǎn)物,證實HKT1_LSEQ 和HKT1_RSEQ 為同一插入事件的側翼序列。 因為測序深度有限,SbHKT基因插入后具體結構變異是如何發(fā)生的仍不清楚。目前,棉花中僅報道了T-DNA 插入引起序列刪除的研究,還未見引起染色體易位或倒位等現(xiàn)象的報道。 侯娜等[4]和陳天子等[5]均發(fā)現(xiàn)T-DNA 插入事件造成了棉花基因組序列缺失。擬南芥中有T-DNA 插入引起較大結構變異的報道。 Beying 等[18]利用金黃色葡萄球菌Cas9 核酸酶, 誘導擬南芥2 條異源染色體發(fā)生了0.5 Mb左右的相互易位,易位發(fā)生頻率為0.01%。本研究中,SbHKT基因的插入造成了陸地棉D08 染色體上的結構變異,但是具體是如何發(fā)生的仍有待進一步的分析和驗證。
基于重測序技術獲得了SbHKT基因在陸地棉基因組中的側翼序列, 分析了外源T-DNA 在陸地棉基因組插入位點的序列特征, 構建了SbHKT基因轉化事件的特異性檢測方法。