王萌 趙虎 徐曉美 潘堯鏵 趙曾菁 吳星 王日升
關(guān)鍵詞:辣椒;全基因組重測(cè)序;胞質(zhì)雄性不育;恢復(fù)基因;分子標(biāo)記
辣椒(Capsicumspp.)是世界最大的調(diào)味料作物和世界第三大蔬菜作物,也是我國(guó)種植面積最大、加工方式最多、消費(fèi)功能最多的蔬菜和最大的調(diào)味品[1]。目前辣椒雜交制種生產(chǎn)仍較多采用人工去雄,種子生產(chǎn)成本高,與國(guó)外品種相比缺乏市場(chǎng)競(jìng)爭(zhēng)力[2]。利用辣椒胞質(zhì)雄性不育(CMS)進(jìn)行三系雜交制種不僅可以確保雜交種子純度,更有利于保護(hù)品種的知識(shí)產(chǎn)權(quán),是辣椒育種發(fā)展的主要趨勢(shì)[3]。開(kāi)發(fā)與辣椒CMS恢復(fù)基因緊密連鎖的分子標(biāo)記,大規(guī)模對(duì)自交系及中間材料進(jìn)行恢復(fù)基因篩選,可大大提高三系育種效率。
辣椒CMS育性恢復(fù)的遺傳控制多樣且復(fù)雜,多數(shù)研究者認(rèn)為辣椒Rf基因由1個(gè)顯性基因控制的[4-5],WEI等[6]認(rèn)為辣椒CMS恢復(fù)基因(Rf)是受2個(gè)主加性-顯性上位基因和1個(gè)加性-顯性多基因控制,也有認(rèn)為辣椒CMS育性恢復(fù)與1個(gè)主QTL和4個(gè)小QTL有關(guān)[7]。針對(duì)辣椒Rf基因,前人已經(jīng)開(kāi)發(fā)了多種類(lèi)型的分子標(biāo)記用于輔助育種,這些標(biāo)記包括隨機(jī)擴(kuò)增多態(tài)性(RAPD)標(biāo)記[8]、簡(jiǎn)單重復(fù)序列(SSR)標(biāo)記[9]、插入/缺失(InDel)標(biāo)記[10]、切割擴(kuò)增多態(tài)性序列(CAPS)標(biāo)記[11]、序列特征擴(kuò)增區(qū)(SCAR)標(biāo)記[12]和競(jìng)爭(zhēng)性等位基因特異性PCR(KASP)標(biāo)記[6,13]等。其中應(yīng)用最廣泛的標(biāo)記CRF-SCAR[12,14]在不同自然群體中對(duì)育性恢復(fù)性狀的準(zhǔn)確率最高,同一標(biāo)記在不同群體間準(zhǔn)確率差異較大,準(zhǔn)確率較高的報(bào)道有89.1%[4]、79.2%[15]和100%[16]。這些結(jié)果進(jìn)一步說(shuō)明,辣椒基因組包含多個(gè)候選Rf基因,不同恢復(fù)系可能具有基因型特異性的Rf基因[11,15,17-18],目前尚無(wú)通用標(biāo)記,特異的恢復(fù)基因需要開(kāi)發(fā)相應(yīng)的標(biāo)記才更有效。
目前,最廣泛使用的CRF-SCAR標(biāo)記[15,17]不能區(qū)分本單位的不育系014A和恢復(fù)系014C,說(shuō)明恢復(fù)系014C可能具有不同Rf基因,需要開(kāi)發(fā)相應(yīng)的連鎖標(biāo)記。深度測(cè)序結(jié)合BSA法,在不構(gòu)建遺傳圖譜的情況下,可快速定位正向遺傳學(xué)的性狀位點(diǎn)[19],快速篩選目標(biāo)基因以獲得緊密連鎖分子標(biāo)記[20],目前已用于多種作物質(zhì)量性狀或主效基因的定位,如尹明智等[21]利用該方法定位了油菜野芥胞質(zhì)雄性不育恢復(fù)基因;LI等[22]利用BSA法結(jié)合基因組測(cè)序和轉(zhuǎn)錄組測(cè)序,聯(lián)合分析獲得了大白菜中與葉狀頭形成相關(guān)的共同候選基因。本研究以不育系014A和恢復(fù)系014C構(gòu)建了F2分離群體,利用BSA法結(jié)合全基因組重測(cè)序,獲得辣椒CMS恢復(fù)基因相關(guān)定位區(qū)間,根據(jù)區(qū)間內(nèi)的差異SNP/InDel設(shè)計(jì)引物,篩選恢復(fù)基因連鎖分子標(biāo)記,為加速選育辣椒CMS恢復(fù)系奠定基礎(chǔ)。
1材料與方法
1.1材料
以不育系014A×恢復(fù)系014C構(gòu)建F2分離群體,正常田間管理,于花期調(diào)查育性,構(gòu)建測(cè)序所需基因可育混池和不育混池,可育混池單株分別隔離,單株留種,每個(gè)單株種植30個(gè)子代,調(diào)查育性分離情況,判斷可育混池內(nèi)單株基因型為RfRf或Rfrf。試驗(yàn)材料種植于廣西農(nóng)業(yè)科學(xué)院基地。
1.2方法
1.2.1育性調(diào)查2020年對(duì)F2群體1008個(gè)單株進(jìn)行插牌編號(hào),田間正常管理,于辣椒開(kāi)花期開(kāi)展3次以上育性調(diào)查并記錄,參考花粉指數(shù)(PI)法:根據(jù)肉眼觀察花粉數(shù)量分為1~4級(jí),每株調(diào)查10朵花,在開(kāi)花當(dāng)天進(jìn)行觀察。1級(jí):花藥上布滿(mǎn)花粉,同可育親本無(wú)明顯差異;2級(jí):有花粉,但不及可育親本的一半,花粉量明顯減少;3級(jí):有很少量的花粉;4級(jí):花藥干癟皺縮,無(wú)可見(jiàn)的花粉。對(duì)于不易判定等級(jí)的調(diào)查的單株,采用多次調(diào)查的方法,同時(shí)調(diào)查自然坐果率和果內(nèi)種子數(shù)量進(jìn)行輔助判斷并記錄。
1.2.2建池、測(cè)序與數(shù)據(jù)處理在F2群體采集單株葉片提取DNA,同時(shí)分別選擇1級(jí)和4級(jí)各30個(gè)單株,分別取幼嫩葉片0.1g用于DNA的提取,DNA分別等量混合構(gòu)建不育基因池和可育基因池。2個(gè)混池連同親本建庫(kù)后使用HiseqX10PE150上機(jī)測(cè)序,測(cè)序深度為30×。樣本由廣州基迪奧生物科技有限公司完成建庫(kù)和測(cè)序。測(cè)序得到的原始數(shù)據(jù)先進(jìn)行過(guò)濾,獲得cleanreads,再利用Burrows-WheelerAligner(BWA,v0.7.16a-r1181)將過(guò)濾后的reads與辣椒參考基因組Ensembl_release47(http://plants.ensembl.org/Capsicum_annuum/Info/Index)進(jìn)行比對(duì)。比對(duì)結(jié)果使用GATK(v3.5)VariantFiltration模塊對(duì)SNP和InDel進(jìn)行變異檢測(cè)。
1.2.3基于SNP-index的BSA分析與Fisher精確檢驗(yàn)對(duì)辣椒育性連鎖定位區(qū)間進(jìn)行篩選時(shí),首先過(guò)濾不育和可育混池中SNP-index均小于0.3或大于0.7的位點(diǎn),計(jì)算各混池的SNP-index和混池間的Δ(SNP-index),然后以滑動(dòng)窗口法對(duì)Δ(SNP-index)在各個(gè)染色體上的分布制圖。置信區(qū)間設(shè)置為95%和99%,取正向置信水平99%以上窗口作為候選區(qū)間[23]。
采用Fisher精確檢驗(yàn)法(SPSS21.0)對(duì)2個(gè)混池中的等位基因深度比例進(jìn)行檢驗(yàn),顯著性使用P值表示,再次按照滑窗的方法對(duì)計(jì)算獲得的P值結(jié)果進(jìn)行擬合,取P值的-log10后繪制曼哈頓圖。原始的P值進(jìn)行FDR校正后獲得q值,篩選q值小于閾值(0.05)的位點(diǎn)作為顯著位點(diǎn),連續(xù)的顯著位點(diǎn)合并成一個(gè)區(qū)間,獲得顯著區(qū)間。
1.2.4DNA提取與引物篩選采用改良的CTAB法提取親本及F2群體所有單株DNA,檢測(cè)合格后將濃度統(tǒng)一調(diào)整至50ng/μL用于后續(xù)試驗(yàn)。根據(jù)定位區(qū)間獲得的基因、InDel/SNPs信息,結(jié)合前人報(bào)道恢復(fù)基因類(lèi)型信息,每個(gè)基因至少設(shè)計(jì)1對(duì)以上的引物,優(yōu)先選擇位于外顯子區(qū)域的SNP和多態(tài)性差異5bp以上的InDel作為第一輪SSR/InDel分子標(biāo)記,篩選在親本間呈現(xiàn)多態(tài)性的引物。在第一輪多態(tài)性引物附近,第二輪根據(jù)基因信息和InDel/SNPs設(shè)計(jì)更多的標(biāo)記,再次利用雙親進(jìn)行標(biāo)記篩選,然后結(jié)合F2、F3育性田間調(diào)查結(jié)果,利用確定了基因型的30個(gè)可育混池單株(基因型為RfRf或Rfrf)、30個(gè)不育混池單株(基因型為rfrf)進(jìn)行篩選,獲得準(zhǔn)確率最高的分子標(biāo)記,最后使用F2群體進(jìn)行準(zhǔn)確率驗(yàn)證。
提取目標(biāo)位點(diǎn)兩翼各150bp的堿基序列,使用Oligo6軟件進(jìn)行引物設(shè)計(jì)。引物序列均由生工生物工程(上海)股份有限公司合成。PCR反應(yīng)總體系均為10μL,其中50ng/μL模版DNA1μL,TaqDNA聚合酶5μL,上下游引物(10μmol/L)各0.5μL,ddH2O3μL。PCR擴(kuò)增程序參照王日勇等[24]的方法。擴(kuò)增產(chǎn)物用8%變性聚丙烯酰胺凝膠110V電泳分離95min,用銀染法進(jìn)行顯影;根據(jù)標(biāo)記特征,分離群體內(nèi)驗(yàn)證也可使用2%瓊脂糖,電壓120V,電泳35min;觀察結(jié)果并拍照保存。
2結(jié)果與分析
2.1F2代分離群體育性調(diào)查
通過(guò)不育系014A和恢復(fù)系014C雜交構(gòu)建的F2代分離群體1008個(gè)單株育性調(diào)查結(jié)果表明,花粉正??捎龁沃隇?85株,不育的單株為223株,可育、不育分離比例均接近3∶1,按1對(duì)基因的控制模式分別進(jìn)行χ2測(cè)驗(yàn),χ2值為1.341,P值為0.247,P>0.05,符合理論預(yù)測(cè),即可育和不育分離比符合3∶1的分離規(guī)律(表1),表明辣椒CMS育性恢復(fù)性狀受1對(duì)顯性基因控制。30個(gè)測(cè)序用的極端可育單株通過(guò)種植調(diào)查F3群體分離情況,育性不發(fā)生分離則親本為純合可育(RfRf),育性發(fā)生分離則親本為雜合可育(Rfrf),連同30個(gè)純合不育單株(rfrf)用于后續(xù)分子標(biāo)記篩選與驗(yàn)證。
2.2重測(cè)序混池?cái)?shù)據(jù)質(zhì)量評(píng)估
根據(jù)親本和混池重測(cè)序的相關(guān)數(shù)據(jù)結(jié)果顯示(表2),此次測(cè)序共得到450.60Gb原始數(shù)據(jù),經(jīng)數(shù)據(jù)質(zhì)控過(guò)濾后獲得448.27Gb高質(zhì)量有效數(shù)據(jù)。樣品的GC堿基含量為36.08%~36.84%,測(cè)序質(zhì)量控制標(biāo)準(zhǔn)Q30>93.75%。不育、可育測(cè)試樣品與參考基因組的比對(duì)率分別為97.84%、97.67%。基因組覆蓋度20×比例約為80%以上。全基因組范圍內(nèi)分別檢測(cè)到950253個(gè)InDel和15142397個(gè)SNP。由此可知,本研究樣本數(shù)據(jù)量足夠,GC分布正常,測(cè)序質(zhì)量合格,測(cè)序數(shù)據(jù)與參考基因組比對(duì)結(jié)果正常,覆蓋度飽和,可用于后續(xù)的變異分析及目標(biāo)性狀的基因定位。
2.3與辣椒CMS育性關(guān)聯(lián)的連鎖區(qū)間定位
基于SNP-index的BSA分析結(jié)果顯示,正向置信水平99%以上窗口有12個(gè)區(qū)間分別位于6號(hào)、8號(hào)、11號(hào)染色體上(表3,圖1)。由圖1可知,6號(hào)染色體定位區(qū)間峰值高、峰形寬大,8號(hào)染色體存在多個(gè)小峰,11號(hào)染色體也存在一個(gè)峰值高的狹窄峰。由表3可知,6號(hào)染色體的第一個(gè)定位區(qū)間最大,長(zhǎng)度為26.72Mb,約占總區(qū)間長(zhǎng)度32%,其中包含540個(gè)基因,約占基因總數(shù)的64%,基因分布相對(duì)集中。
為進(jìn)一步縮小定位區(qū)間,采用Fisher精確檢驗(yàn)法對(duì)2個(gè)混池中的等位基因深度比例進(jìn)行檢驗(yàn),得到基于-log10(p)值的全基因組分布曼哈頓圖(圖2),獲得的定位區(qū)間為6號(hào)染色體1.44~8.28Mb,該區(qū)間內(nèi)包含4441個(gè)SNP、266個(gè)Indel和227個(gè)基因。
2.4分子標(biāo)記開(kāi)發(fā)
根據(jù)6號(hào)染色體1.44~8.28Mb候選區(qū)間內(nèi)227個(gè)基因及SNP/InDel位點(diǎn),共設(shè)計(jì)了316對(duì)引物,擴(kuò)增親本,篩選出27對(duì)在親本間差異顯著的標(biāo)記。根據(jù)基因注釋獲得的3個(gè)恢復(fù)基因候選基因,然后重點(diǎn)在這3個(gè)基因附近設(shè)計(jì)引物并篩選,最終獲得了能穩(wěn)定擴(kuò)增出特異條帶的標(biāo)記OP59和PP5。OP59引物序列為F:5-TGGAACAGAGTCATATTTTTCTTTCAT-3、R:5-CCAATTCCGATAAAGGGTTTT-3。PP5引物序列為F:5-TCATTCTTTAGGGGAAGCTTAGG-3、R:5-CGGTGTGGACAGACATTTCA-3。根據(jù)SNP位點(diǎn)設(shè)計(jì)的標(biāo)記OP59,在純合可育材料可擴(kuò)增出282bp條帶,不育材料可擴(kuò)增出278bp條帶,雜合單株能擴(kuò)增出2條帶(圖3)。根據(jù)InDel位點(diǎn)設(shè)計(jì)的標(biāo)記PP5,在不育親本、F2雜合可育單株、不育單株中均可擴(kuò)增出約300bp的條帶,而純合可育親本和F2純合可育單株中無(wú)擴(kuò)增條帶,該標(biāo)記可使用瓊脂糖電泳更方便快速(圖4)。2個(gè)標(biāo)記在極端群體驗(yàn)證中準(zhǔn)確率均達(dá)到100%。
將這2個(gè)標(biāo)記在F2代分離群體隨機(jī)挑選的456個(gè)單株進(jìn)行驗(yàn)證,結(jié)果表明,2個(gè)標(biāo)記在重測(cè)序的極端群體中準(zhǔn)確率均達(dá)到100%。共顯性標(biāo)記OP59在不育的群體中準(zhǔn)確率為100%,在可育單株中準(zhǔn)確率為97.21%。標(biāo)記PP5在不育單株和純合可育單株中準(zhǔn)確率均為100%。根據(jù)與參考基因組比對(duì)結(jié)果,標(biāo)記OP59根據(jù)位于6號(hào)染色體3877192bp處SNP位點(diǎn)設(shè)計(jì),參考?jí)A基為A,突變堿基為G,該位點(diǎn)位于恢復(fù)基因候選PPR基因T459-15819基因間區(qū),距離為17232bp;標(biāo)記PP5根據(jù)位于6號(hào)染色體3897138bp處InDel位點(diǎn)設(shè)計(jì),參考?jí)A基為G,突變堿基為GT,該位點(diǎn)位于該基因下游318bp。
3討論
本研究表明,辣椒CMS核內(nèi)恢復(fù)基因經(jīng)BSA結(jié)合法結(jié)合全基因組重測(cè)序,比對(duì)參考基因組Ensembl_release47,經(jīng)Fisher精確檢驗(yàn),定位在6號(hào)染色體頂端1.44~8.28Mb區(qū)間,區(qū)間長(zhǎng)度6.84Mb。WEI等[6]通過(guò)基于轉(zhuǎn)錄組測(cè)序的BSR-seq方法,通過(guò)與參考基因組Zunla-1比對(duì),將恢復(fù)基因定位在6號(hào)染色體末端16.8Mb的區(qū)間,其使用的試驗(yàn)材料包含的恢復(fù)基因被認(rèn)為是受2個(gè)主加性-顯性上位基因和一個(gè)加性-顯性多基因控制。ZHANG等[25]也是使用BSA結(jié)合基因組重測(cè)序的方法在6號(hào)染色體的兩端分別獲得了一個(gè)恢復(fù)基因,該材料中辣椒CMS育性恢復(fù)同時(shí)受2對(duì)基因控制。本研究所使用的試驗(yàn)材料F2群體中可育∶不育符合3∶1,因此育性恢復(fù)受1對(duì)基因控制,這與WEI等[6]、ZHANG等[25]的試驗(yàn)材料不同,推測(cè)確實(shí)含有不同的恢復(fù)基因。
在許多農(nóng)作物中多個(gè)雄性不育恢復(fù)基因(Rf)已經(jīng)被鑒定,大多數(shù)恢復(fù)基因?qū)儆赑PR基因(編碼蛋白含有五肽重復(fù)序列),如水稻[26]、油菜[27]、棉花[28]等。在辣椒作物上,前人報(bào)道的恢復(fù)基因有PPR6[11]、PPR46[11]、NEDD8[18]、長(zhǎng)鏈非編碼RNA[29]等。尹明智等[21]通過(guò)對(duì)基因定位的候選區(qū)域進(jìn)行序列分析和基因注釋?zhuān)l(fā)現(xiàn)其中的PPR基因,再進(jìn)行基因克隆及功能驗(yàn)證,這將是分析恢復(fù)基因的一種有效手段。本研究初步獲得的候選基因T459-15819也是屬于PPR基因,該基因是否為調(diào)控辣椒育性恢復(fù)的關(guān)鍵基因,以及如何影響育性的恢復(fù)還需進(jìn)一步分析驗(yàn)證。
本研究獲得的標(biāo)記OP59屬于共顯性標(biāo)記,不僅能夠區(qū)分基因純合可育(RfRf)植株和不育(rfrf)植株,還能鑒定出雜合可育(Rfrf)的植株,且準(zhǔn)確率高,聚丙烯酰胺凝膠電泳即可分辨,在實(shí)際應(yīng)用中非常簡(jiǎn)便有效。標(biāo)記PP5瓊脂糖凝膠電泳檢測(cè)即可,實(shí)際應(yīng)用中可先用PP5檢出純合可育株,然后再用OP59檢出其他類(lèi)型。
本研究構(gòu)建的F2群體中,根據(jù)花粉指數(shù)法將單株劃分為不同的等級(jí),花粉量減少的2、3、4等級(jí)全部歸為不育,經(jīng)χ2測(cè)驗(yàn),可育和不育分離比符合3∶1,推測(cè)辣椒CMS育性恢復(fù)性狀受1對(duì)顯性基因控制,這與多數(shù)研究結(jié)果一致[4-5,9,14]。從本研究不育群體實(shí)際調(diào)查數(shù)據(jù)來(lái)看,單株間花粉量存在一定的差異,因此,本研究使用的恢復(fù)基因除受1對(duì)顯性基因控制外,在6號(hào)、8號(hào)、11號(hào)染色體上也可能存在育性修飾的微效基因,或基因表達(dá)受到環(huán)境影響,仍需進(jìn)一步研究。