田陽(yáng)陽(yáng),軒貝貝,王正旭,劉 魁,郭建華,牟文君,戴華鑫,楊繼周,宋紀(jì)真,胡利偉*
(1.紅塔煙草(集團(tuán))有限責(zé)任公司,云南 玉溪 653100;2.中國(guó)煙草總公司 鄭州煙草研究院,河南 鄭州 450001)
我國(guó)煙草種質(zhì)資源豐富,至2018年,我國(guó)全國(guó)煙草品種審定委員會(huì)共審(認(rèn)、鑒)定了145個(gè)煙草新品種,其中審(認(rèn)、鑒)定的烤煙品種達(dá)82個(gè)[1]。 目前我國(guó)烤煙種植主要集中于西南、華南、華北、東北等地區(qū),主要植煙省份有云南、河南、貴州、山東等18個(gè)省(市、區(qū))[2-4]。經(jīng)過(guò)多年的發(fā)展,我國(guó)煙葉生產(chǎn)逐漸趨于穩(wěn)定,并形成了相對(duì)穩(wěn)定的煙葉產(chǎn)供格局。近3年,種植面積較大的烤煙品種主要有云煙87、K326、紅花大金元、云煙85、云煙97、中煙100等[5,6]。主栽烤煙品種的親本比較集中,親緣關(guān)系較近,如云煙87與云煙85為姊妹系,親本相同,均是以K326和云煙2號(hào)為親本雜交選育出來(lái)的;云煙97和云煙99的母本均為云煙85;云煙100的母本為云煙87,其形態(tài)學(xué)特征差異不明顯。多數(shù)研究表明我國(guó)烤煙遺傳背景狹窄,遺傳多樣性較低,利用傳統(tǒng)手段對(duì)烤后煙葉進(jìn)行品種鑒定存在一定的難度[7]。
SSR熒光標(biāo)記檢測(cè)技術(shù)是直接將熒光染料標(biāo)記到SSR引物的5’端或引物內(nèi)部的某個(gè)堿基上,然后進(jìn)行PCR擴(kuò)增,使每一個(gè)擴(kuò)增產(chǎn)物都帶有熒光染料,熒光標(biāo)記DNA片段在通過(guò)毛細(xì)管正極受到激光掃描時(shí)發(fā)射出特定波長(zhǎng)的熒光,掃描儀獲取熒光強(qiáng)度,同時(shí)記錄激發(fā)時(shí)間,通過(guò)出峰時(shí)間計(jì)算出DNA片段大小,根據(jù)峰值高度計(jì)算出PCR產(chǎn)物的量[8-10]。 該檢測(cè)體系可以一次檢測(cè)多個(gè)不同PCR擴(kuò)增產(chǎn)物,根據(jù)PCR產(chǎn)物攜帶的熒光顏色的不同分離出不同SSR位點(diǎn)的PCR產(chǎn)物[10,11]。擁有高通量、高準(zhǔn)確率的ABI3730XL自動(dòng)測(cè)序儀有96道毛細(xì)管,一次電泳能夠測(cè)定96個(gè)樣品,自動(dòng)化流程較高[9]。再利用計(jì)算機(jī)軟件進(jìn)行數(shù)據(jù)收集和分析,可以精確計(jì)算出各擴(kuò)增核酸片段的大小,其分辨率可以達(dá)到1 bp,為分析主栽烤煙品種間的遺傳差異提供了較為可靠的技術(shù)手段,目前已被廣泛應(yīng)用于基因型鑒定、遺傳多樣性分析、遺傳圖譜的構(gòu)建等方面[12]。Bindler等[13]于2011年開發(fā)并報(bào)道了1張煙草SSR標(biāo)記的高密度遺傳圖譜;國(guó)內(nèi)童志軍[11]、陳雅瓊[14]、尹國(guó)英[15]、陳杰[16]、王慧穎[17]等對(duì)煙草的SSR標(biāo)記進(jìn)行了進(jìn)一步開發(fā)和應(yīng)用,使得SSR標(biāo)記在烤煙上的應(yīng)用已日趨成熟。黃莉莎等[7]利用SSR標(biāo)記構(gòu)建了煙草主栽品種的遺傳圖譜,為烤煙的遺傳多樣性分析提供了有效的SSR引物。陳芳等[18]篩選出了8對(duì)重復(fù)性好、多態(tài)性高的SSR引物,可將32份煙草種質(zhì)資源分為4個(gè)大類。眾多的研究[19-21]充分表明了SSR標(biāo)記在煙草品種的遺傳多樣性分析中有著良好的應(yīng)用潛力。本研究在前期研究的基礎(chǔ)上篩選SSR引物,利用毛細(xì)管電泳檢測(cè)技術(shù)進(jìn)行SSR分型,對(duì)主栽烤煙品種進(jìn)行了遺傳多樣性分析,以期為烤煙主栽品種鑒定提供有效的方法和理論依據(jù)。
供試材料為紅花大金元、云煙87、中煙100、云煙97、翠碧1號(hào)、K326、KRK26和NC297等8個(gè)主栽烤煙品種的烤后煙葉DNA??竞鬅熑~樣品除NC297取自云南玉溪峨山產(chǎn)區(qū)外,其他品種樣品均取自玉溪世界煙草品種園。對(duì)烤后煙葉樣品進(jìn)行紫外線照射20 min,以去除葉面DNA污染,并用液氮研磨,置于-80 ℃冰箱保存?zhèn)溆谩?/p>
實(shí)驗(yàn)儀器有PCR儀(Applied Biosystems)、電泳儀及電泳槽(北京六一儀器廠)、凝膠成像系統(tǒng)(Bio-Rad公司)、PCR儀(Bio-Rad公司)、3730XL DNA序列分析儀(美國(guó)ABI公司)等。實(shí)驗(yàn)試劑有Taq PCR Mix預(yù)混液、λDNA/EcoRI+HindIII Marker、SSR引物。
通過(guò)查閱文獻(xiàn)以及前期實(shí)驗(yàn),委托上海生物工程有限公司進(jìn)行引物合成與熒光標(biāo)記,實(shí)驗(yàn)中用到的引物及標(biāo)記位點(diǎn)見(jiàn)表1。
表1 供試SSR引物對(duì)的序列信息
PCR反應(yīng)總體積為25 μL,含有模板DNA 1 μL、正反向引物各1 μL、Taq PCR Mix 12.5 μL、無(wú)菌水9.5 μL。擴(kuò)增程序?yàn)?94 ℃熱處理變性 5 min;接著進(jìn)行兩輪的Touchdown PCR;94 ℃ 30 s、60 ℃ 30 s、72 ℃ 30 s,設(shè)置循環(huán)10次;接著將退火溫度降低至55 ℃,94 ℃ 30 s、55 ℃ 30 s、72 ℃ 30 s,循環(huán)20次;72 ℃延伸10 min。在反應(yīng)結(jié)束后將PCR管置于-80 ℃冰箱保存。
吸取稀釋后的PCR產(chǎn)物作為樣品,將其加入到96孔板,做好標(biāo)記,將96孔板用封板膜密封,以5000 r/min短暫離心。將10 μL內(nèi)標(biāo)LIZ500 (35~500 bp)和990 μL HIDI溶液充分混勻后,接著分裝入96孔反應(yīng)板中,以5000 r/min離心數(shù)秒。將96孔板置于PCR儀上,變性程序設(shè)置為98 ℃變性5 min,完成后立即將96孔板置于冰上迅速冷卻,以10000 r/min 短暫離心。使用ABI 3730XL DNA序列分析儀進(jìn)行毛細(xì)管電泳,檢測(cè)目的產(chǎn)物的片段大小。
采用Genemapper 4.0軟件對(duì)毛細(xì)管電泳結(jié)束后DataCollection 軟件收集的原始數(shù)據(jù)進(jìn)行分析,比較目標(biāo)峰與分子內(nèi)標(biāo)Genescan500-LIZ 的位置,確定不同樣品SSR擴(kuò)增片段的精確長(zhǎng)度(計(jì)量單位為bp)。對(duì)每個(gè)樣品進(jìn)行獨(dú)立的3 次獨(dú)立重復(fù)實(shí)驗(yàn),取3 次重復(fù)的平均值,并四舍五入作為該樣品在該位點(diǎn)擴(kuò)增片段的大小。通過(guò)統(tǒng)計(jì)毛細(xì)管電泳的檢測(cè)結(jié)果,將得到的離散數(shù)據(jù)按照相同位置峰圖的有無(wú)以“0”、“1”進(jìn)行編碼,建立“0”與“1”二元數(shù)據(jù)矩陣。利用NTsys 2.10e軟件[22]對(duì)SSR的多樣性指標(biāo)進(jìn)行統(tǒng)計(jì);基于SHAN算法進(jìn)行UPGMA聚類分析[23];通過(guò)Tree plot模塊繪制遺傳聚類圖。
將SSR實(shí)驗(yàn)中已擴(kuò)增的PCR產(chǎn)物混合后進(jìn)行純化,采用3%瓊脂糖凝膠進(jìn)行電泳檢測(cè),檢測(cè)合格后對(duì)PCR產(chǎn)物進(jìn)行純化,接著使用文庫(kù)制備試劑盒(NEB公司,英國(guó))構(gòu)建文庫(kù),采用Qubit?2.0進(jìn)行文庫(kù)濃度測(cè)定。建庫(kù)流程如下:在每個(gè)樣品中加入末端連接酶、末端修復(fù)反應(yīng)緩沖液和DNA樣品,進(jìn)行末端補(bǔ)平和3’末端加PolyA尾巴。修復(fù)完成后保存于4 ℃。等上一步修復(fù)結(jié)束后,采用Agencourt AMPure XP磁珠純化試劑盒去除dNTP、引物、引物二聚體等其他雜質(zhì),于-20 ℃保存。對(duì)純化后的接頭連接產(chǎn)物進(jìn)行PCR富集擴(kuò)增,然后使用Agencourt AMPure XP磁珠純化試劑盒進(jìn)行純化,于-20 ℃保存。對(duì)PCR產(chǎn)物的檢測(cè)采用Illumina Miseq測(cè)序平臺(tái),讀長(zhǎng)為150 bp,進(jìn)行雙端測(cè)序。
采用Cutadapt軟件對(duì)正向測(cè)序的數(shù)據(jù)進(jìn)行切割,切除上下游固定引物序列,僅保留中間部分序列,數(shù)據(jù)格式為 fastq;采用 Prinseq-lite 軟件進(jìn)行質(zhì)量控制[24];根據(jù)高通量測(cè)序結(jié)果,對(duì)大量測(cè)序數(shù)據(jù)進(jìn)行排序分類,創(chuàng)建包含序列長(zhǎng)度和頻率的輸出文件,并以毛細(xì)管電泳檢測(cè)數(shù)據(jù)為期望值,以NGS測(cè)序數(shù)據(jù)為觀察值,利用簡(jiǎn)單重復(fù)序列識(shí)別工具SSRIT識(shí)別SSR基因座的結(jié)構(gòu)組成。
為了研究上樣量對(duì)檢測(cè)信號(hào)輸出的影響,本實(shí)驗(yàn)對(duì)不同濃度的PCR產(chǎn)物進(jìn)行毛細(xì)管電泳檢測(cè),將PT20213、PT20306、PT30028等引物對(duì)的PCR擴(kuò)增產(chǎn)物稀釋成25、50、100、200、300、600 ng/μL 6個(gè)濃度梯度,進(jìn)行毛細(xì)管電泳檢測(cè),確定合適的上樣濃度,結(jié)果如圖1所示。PT201213的PCR產(chǎn)物在25、50、100、200 ng/μL濃度下都有熒光信號(hào),在300、600 ng/μL濃度下則沒(méi)有熒光信號(hào);PT20306的PCR產(chǎn)物在25、50、100 ng/μL濃度下都有熒光信號(hào),而在200 ng/μL及以上濃度下則無(wú)信號(hào);PT30028的PCR產(chǎn)物在25 ng/μL濃度下沒(méi)有熒光信號(hào),在50~600 ng/μL范圍內(nèi)都有熒光信號(hào)。因此,在本實(shí)驗(yàn)中,當(dāng)PCR產(chǎn)物濃度為50~100 ng/μL時(shí),在絕大多數(shù)SSR位點(diǎn)的毛細(xì)管電泳能夠檢測(cè)到熒光信號(hào)。
圖1 不同PCR產(chǎn)物濃度對(duì)毛細(xì)管電泳檢測(cè)結(jié)果的影響
利用83對(duì)SSR引物對(duì)8個(gè)烤煙品種進(jìn)行PCR擴(kuò)增,根據(jù)3.0%瓊脂糖凝膠電泳檢測(cè)結(jié)果,對(duì)其中的33對(duì)SSR引物隨機(jī)進(jìn)行熒光標(biāo)記,并利用毛細(xì)管電泳檢測(cè)其擴(kuò)增片段長(zhǎng)度,確定NTGS66288、PT30250、PT30213、PT52573、PT30170等5對(duì)SSR引物為本研究的核心引物,這5對(duì)引物在8個(gè)烤煙品種中的毛細(xì)管電泳檢測(cè)結(jié)果如圖3所示,NTGS66288、PT30250、PT30170的PCR產(chǎn)物帶型單一,滑移峰較少,而PT30213、PT52573的PCR產(chǎn)物具有較多的滑移峰,但是主峰依然明顯,可以用于進(jìn)一步分析。從毛細(xì)管電泳檢測(cè)的圖譜中可以看出,在5對(duì)SSR引物中,多數(shù)SSR引物對(duì)8個(gè)烤煙品種的擴(kuò)增結(jié)果為單條帶,如引物NTGS66288;少部分的擴(kuò)增結(jié)果為雙條帶,如引物PT52573。
圖2 熒光SSR引物擴(kuò)增產(chǎn)物的毛細(xì)管電泳檢測(cè)結(jié)果
對(duì)帶型清晰、差異明顯的5對(duì)SSR進(jìn)行多態(tài)性分析,5對(duì)SSR引物在8個(gè)烤煙品種材料中共擴(kuò)增出13個(gè)條帶,都為多態(tài)性條帶,其片段大小處于104~203 bp,其在8個(gè)烤煙品種中PCR產(chǎn)物的片段長(zhǎng)度差異在6~14 bp,平均每個(gè)SSR引物的多態(tài)性條帶數(shù)為2.6個(gè),詳見(jiàn)表2。這5對(duì)引物的多態(tài)性良好,8個(gè)烤煙品種的0、1編碼矩陣如表3,能夠有效地將8個(gè)烤煙品種進(jìn)行區(qū)分。
表2 SSR引物在8個(gè)烤煙品種的擴(kuò)增產(chǎn)物及其片段長(zhǎng)度 bp
表3 基于5對(duì)引物擴(kuò)增的8個(gè)烤煙品種的0、1編碼矩陣
通過(guò)對(duì)8個(gè)烤煙品種的SSR標(biāo)記數(shù)據(jù)進(jìn)行統(tǒng)計(jì),采用UPGMA算法計(jì)算8個(gè)烤煙品種間的遺傳相似系數(shù)并繪制遺傳聚類圖(圖3)。8個(gè)烤煙品種間遺傳相似系數(shù)分布在0.30~0.86,平均值為0.52(表4)。由8個(gè)烤煙品種遺傳相似系數(shù)獲得的聚類圖表明,當(dāng)遺傳相似系數(shù)為0.761時(shí),可將8個(gè)烤煙品種分為4個(gè)類群。云煙87與NC297首先聚在一起,說(shuō)明兩者遺傳背景較近,遺傳相似系數(shù)為0.86;遺傳相似系數(shù)最小為0.24,出現(xiàn)在翠碧1號(hào)和中煙100這兩個(gè)品種間;中煙100、云煙97、NC297和云煙87聚為一類;K326、KRK26聚為另外一類;紅花大金元、翠碧1號(hào)與這兩個(gè)類群之間的遺傳距離相對(duì)較遠(yuǎn)。
圖3 8個(gè)烤煙品種的SSR標(biāo)記聚類圖
表4 8個(gè)烤煙品種間的遺傳相似系數(shù)
通過(guò)分析PCR產(chǎn)物的測(cè)序結(jié)果,利用簡(jiǎn)單重復(fù)序列識(shí)別工具SSRIT識(shí)別SSR基因座的結(jié)構(gòu)組成,NTGS66288、PT30250、PT30213、PT52573、PT30170等5個(gè)SSR位點(diǎn)的序列信息如表5所示。檢測(cè)結(jié)果顯示NTGS66288、PT30250、PT30213、PT52573、PT30170等5個(gè)SSR位點(diǎn)基因座的核心重復(fù)單元多為簡(jiǎn)單二堿基重復(fù)和三堿基重復(fù),其中二堿基重復(fù)以(AT)n和(TA)n為主,三堿基重復(fù)以(ATA)n、(TCT)n和(TAG)n為主。其基序重復(fù)次數(shù)在3~28次,基序長(zhǎng)度介于9~84 bp。
表5 SSR位點(diǎn)的結(jié)構(gòu)組成分析結(jié)果
對(duì)8個(gè)烤煙品種NTGS66288、PT30250、PT30213、PT52573、PT30170等5個(gè)SSR位點(diǎn)序列進(jìn)行序列比對(duì)和分析,結(jié)果表明,在這5個(gè)SSR位點(diǎn)上,8個(gè)品種之間的差異僅為核心重復(fù)單元數(shù)量不同,其他區(qū)域序列完全一致,不存在SNP或者插入、顛換等差異,具體序列比對(duì)結(jié)果見(jiàn)圖4。
圖4 8個(gè)烤煙品種在5個(gè)SSR位點(diǎn)的序列信息
基于SSR標(biāo)記在烤后煙葉中較高的重復(fù)性、可靠性以及特異性,SSR標(biāo)記可以作為主栽烤煙品種遺傳多樣性分析的首選,篩選重復(fù)性好、穩(wěn)定性高和多態(tài)性豐富的優(yōu)質(zhì)SSR標(biāo)記是提高品種鑒定效率的關(guān)鍵。本研究從83對(duì)引物中篩選出5對(duì)SSR引物,結(jié)合毛細(xì)管電泳檢測(cè)技術(shù)對(duì)8個(gè)主栽烤煙品種進(jìn)行遺傳多樣性分析,發(fā)現(xiàn):5對(duì)SSR引物在8個(gè)烤煙品種中共獲得13個(gè)條帶,都為多態(tài)性條帶,其片段大小處于104~203 bp;烤煙品種間遺傳基礎(chǔ)相對(duì)狹窄,8個(gè)品種間的遺傳相似系數(shù)在0.30~0.86。因此,8個(gè)烤煙品種間遺傳相似性較高,遺傳背景接近,這與薛懷裕[25]、劉林等[26]的研究結(jié)果類似。
由于能分辨親緣關(guān)系極近的品種,SSR得到了越來(lái)越多的應(yīng)用,但是其也存在著“復(fù)制滑移”現(xiàn)象,這種“復(fù)制滑移”現(xiàn)象可能與引物序列重復(fù)單元的構(gòu)成有一定關(guān)系。在本實(shí)驗(yàn)中,NTGS66288、PT30250、PT30170等引物對(duì)的PCR產(chǎn)物帶型單一,滑移峰較少,而PT30213、PT52573的PCR產(chǎn)物具有較多的滑移峰,但是主峰依然明顯,可以用于進(jìn)一步分析。SSR位點(diǎn)復(fù)制滑移的發(fā)生頻率受很多因素的影響,變異很大,但有一個(gè)共同的特征,即發(fā)生概率較小,如果不加以控制,足以在群體中產(chǎn)生差異。本研究使用的部分SSR引物在經(jīng)過(guò)PCR優(yōu)化之后,依然會(huì)存在較多的滑移峰,如SSR引物PT30213和PT52573。因此,在遇到此類引物時(shí),需要引起重視,首先應(yīng)該進(jìn)行重復(fù)實(shí)驗(yàn),多次優(yōu)化PCR條件,或者采用其他擴(kuò)增體系進(jìn)行重復(fù)驗(yàn)證,檢查內(nèi)標(biāo)或Ladder分型是否正確。
基于高通量測(cè)序技術(shù)的基因分型給物種分類及品種鑒定提供了更高的分辨率,但后期測(cè)序數(shù)據(jù)拼接繁瑣,對(duì)具有重復(fù)序列的SSR等位基因難以進(jìn)行準(zhǔn)確的測(cè)序分析,主要是因?yàn)樵谌蚪M測(cè)序過(guò)程中,SSR的核心重復(fù)序列因基序的多次重復(fù)會(huì)導(dǎo)致測(cè)序出現(xiàn)大量堿基空缺[27,28]。因此,通過(guò)全基因組測(cè)序獲得完整的SSR位點(diǎn)的序列信息存在困難,而通過(guò)單管PCR擴(kuò)增,并對(duì)PCR擴(kuò)增產(chǎn)物進(jìn)行高通量測(cè)序,對(duì)于獲得SSR位點(diǎn)的序列信息變得相對(duì)容易。本研究基于Hiseq測(cè)序平臺(tái),對(duì)8個(gè)烤煙品種的SSR位點(diǎn)進(jìn)行測(cè)序,探索了不同SSR位點(diǎn)的結(jié)構(gòu)與序列差異,期望將長(zhǎng)度序列多態(tài)性進(jìn)階為DNA序列多態(tài)性。測(cè)序結(jié)果表明SSR位點(diǎn)的深度測(cè)序確實(shí)可以提供更詳細(xì)的烤煙遺傳多樣性信息,獲得更多的等位基因,提高遺傳標(biāo)記的應(yīng)用潛力。但是由于本實(shí)驗(yàn)的測(cè)序位點(diǎn)較少,而且大部分SSR基因座間的序列信息差異屬于常規(guī)的簡(jiǎn)單重復(fù)次數(shù)的差異,因此若要獲得更多堿基水平的SSR序列多態(tài)性則需要更多的SSR引物和大量的群體。此外在利用深度測(cè)序檢測(cè)SSR基因座的低頻突變中,測(cè)序提供了足夠的覆蓋率,但由于建庫(kù)過(guò)程不同,SSR引物存在模板偏好性,因此測(cè)序結(jié)果依然存在突變與測(cè)序錯(cuò)誤的不可區(qū)分性。今后可以從SSR位點(diǎn)的序列差異入手,利用SSR標(biāo)記的穩(wěn)定性和下一代測(cè)序技術(shù)的高通量以及高分辨率,擴(kuò)大特異引物的測(cè)序規(guī)模,尋找更多可穩(wěn)定遺傳的序列突變,明確每一個(gè)品種的特征序列,為烤后煙葉品種的批量、快速鑒定奠定基礎(chǔ)。
本實(shí)驗(yàn)確定的5對(duì)SSR引物(NTGS66288、PT30250、PT30213、PT52573、PT30170)可有效區(qū)分云煙87、云煙97、翠碧1號(hào)、紅花大金元、中煙100、K326、KRK26、NC297等8個(gè)烤煙品種,且8個(gè)品種之間的差異僅為簡(jiǎn)單二堿基和三堿基核心重復(fù)單元數(shù)量不同,其中二堿基重復(fù)以(AT)n和(TA)n為主,三堿基重復(fù)以(ATA)n、(TCT)n和(TAG)n為主。