王騰輝 葛雯冬 羅雅方 范震宇 王玉書,2
(1.齊齊哈爾大學生命科學與農林學院,齊齊哈爾 161006;2.黑龍江省抗性基因工程與寒地生物多樣性保護重點實驗室,齊齊哈爾 161006)
羽衣甘藍(Brassica oleracea L.var.acephala DC)為十字花科蕓薹屬甘藍種的變種,外葉綠色為主要功能葉,心葉有紫紅、紅色、粉色和乳白色等多種顏色,為主要觀賞葉,因其較高的營養(yǎng)價值和獨特的觀賞性成為賞食兼用的作物。大部分十字花科植物葉色性狀屬于質量性狀遺傳。研究葉色的遺傳模式和葉色形成的關鍵基因,對羽衣甘藍新品種的選育具有重要的理論意義。
孫日飛等[1]研究發(fā)現(xiàn)大白菜紫葉性狀是由一對顯性基因控制。甘藍型油菜紫葉性狀則由不完全顯性核基因控制[2]。但紫菜薹紫色葉色卻是數(shù)量性狀,主效QTL區(qū)間內編碼bHLH轉錄因子的2個基因BrEGL3.1和BrEGL3.2被鑒定為控制葉色的關鍵基因[3]。Zhu等[4]通過側翼標記對羽衣甘藍粉葉基因進行錨定,同時,利用甘藍基因組信息,將Pi定位在C03染色體的頂端。白菜A07染色體上的R2R3-MYB調控基因BrMYB2,其缺失較多的短內含子促進一些結構基因的高轉錄是導致出現(xiàn)紫色表型的原因[5]。葉綠素的缺少是導致葉片白化的主要原因[6]。植物白色葉片形成往往受環(huán)境因素影響,如在自然光照下,白茶突變體‘Huangjinju’葉片出現(xiàn)白化現(xiàn)象,當處于低強度光照條件,葉片又會返綠[7];大麥白化突變體‘SLTW’在低溫誘導后,于5葉期葉片開始出現(xiàn)白化現(xiàn)象,當溫度升高,白化葉片開始轉綠,直至恢復正常葉色[8]。而羽衣甘藍白色系品種外葉表現(xiàn)為綠色,僅心葉表現(xiàn)為白色,近年來,基因組測序技術的進步和成本的降低,加快了一些非模式生物的參考基因組組裝?;谌蚪M重測序的BSA方法,在無須構建遺傳圖譜的情況下,可以高效挖掘目標基因,BSA-Seq技術也從模式物種拓展到了非模式物種,在許多作物中得到了廣泛的應用。
目前,利用BSA-Seq方法已成功定位出黃瓜早花[9]、番茄果重[10]、甘藍型油菜有限花序[11]、茄子萼下果色[12]、豌豆花色[13]等基因。但在羽衣甘藍中的應用報道較少。
本研究利用白色心葉DH系‘WB’和紅葉DH系‘WR’雜交構建F2代分離群體,通過對親本和2個子代混合池進行BSA-Seq全基因組重測序,定位與白葉性狀顯著關聯(lián)的區(qū)域,并通過分子生物信息學方法篩選候選基因,旨在篩選羽衣甘藍葉色形成相關的基因與位點,為羽衣甘藍新品種選育及分子標記輔助育種奠定基礎。
羽衣甘藍親本白色心葉DH系‘WB’和紅葉DH系‘WR’為小孢子培養(yǎng)獲得的DH純系。以‘WR’為母本、‘WB’為父本雜交獲得F1,F(xiàn)1自交獲得F2代種子,秋季在溫室種植F2代,于觀賞期觀察記錄每個F2單株的心葉顏色。利用卡方檢驗對羽衣甘藍心葉顏色性狀的遺傳分析進行檢驗。
1.2.1 基因組DNA的提取及混池的構建 從F2群體中挑選20個紅葉F2單株和20個白葉F2單株,構建成2個混合池,命名為R和B,取幼嫩植株葉片,利用QIAGEN植物DNA提取試劑盒提取DNA,等量混合構成2個親本混池和2個子代混池,委托上海伯豪生物科技有限公司完成測序分析。利用DNA超聲波粉碎成插入長度為350 bp的片段,雙端處理文庫質檢合格后,用Illunima HiSeq進行測序,2個親本和2個混合池的測序深度分別為20×和50×。
1.2.2 測序數(shù)據(jù)處理 利用Trimmomatic軟件[14]將原始測序序列Raw Reads中的接頭和低質量序列去除,再運用BWA軟件[15]比對甘藍參考基因組(https://brassicadb.org/brad/datasets/pub/Genomes/Brassica_oleracea/V1.1/)。采用GATKv3.6.0[16]軟件進行SNP和InDel標記的檢測。使用VariantFiltration進行過濾,并利用ANNOVAR[17]軟件對變異位點在基因組上的位置區(qū)域進行注釋。
1.2.3 SNP-index計算 基于基因分型的結果,篩選親本間純合差異的多態(tài)性位點。以親本互為參照,計算2個子代混合池在每個多態(tài)性位點上的SNP頻率(SNP-index)[18]。為減少測序錯誤和比對錯誤造成的影響,將計算出2個子代中SNP-index都小于0.3且SNP深度都小于7的位點及1個子代SNP-index缺失的位點過濾掉。同時,計算2個子代池中SNP-index的差值,作ΔSNP-index。
1.2.4 目的基因的篩選與功能注釋 選擇2 Mb為滑窗、50 kb為步長,對△SNP-index在各染色體上的分布進行作圖,選取99%置信水平作為篩選的閾值,超出置信水平的窗口作為候選區(qū)間,把候選區(qū)間的SNP位點所在的基因篩選出來進行注釋。利用Blast軟件對候選區(qū)間鑒定的基因進行GO(gene ontology)數(shù)據(jù)庫注釋,從而對候選基因進行篩選和功能預測。
羽衣甘藍心葉顏色各世代分離鑒定統(tǒng)計如表1所示,以WR為母本,WB為父本的F1代均表現(xiàn)心葉紅色,F(xiàn)2分離群體中紅色心葉和白色心葉分離比例經卡方測驗符合3∶1的孟德爾分離比例(χ2=0.20<χ20.05=3.84)。遺傳規(guī)律分析表明,羽衣甘藍白色心葉相對于紅色為隱性性狀。
表1 ‘WR’和‘WB’雜交組合后代分離比例Table 1 Segregation of the crosses between ‘WR’ and ‘WB’ in progeny populations
對20株白葉F2單株和20株紅葉F2單株構建的混合池,以及兩親本開展全基因組重測序(表2),共獲得150.00 G的原始數(shù)據(jù),過濾后,4個樣本的Clean Data在18 125.99-54 943.91 M,總數(shù)據(jù)量為144.24 G。平均每個樣品覆蓋深度在55.16×,基因組平均覆蓋度為89.65%,測序數(shù)據(jù)有95.09%-95.90%以上的序列可以成功比對參考基因組,測序數(shù)據(jù)質量較高(Q20≥97.81%),說明所有樣本測序質量合格,數(shù)據(jù)比對率高,有利于后續(xù)的變異檢測及性狀的基因定位。
表2 不同樣品測序比對結果Table 2 Sequencing comparison results of different samples
根據(jù)測序結果進行SNP位點分析(表3),4個樣本中,紅葉親本‘WR’中最少,為964 912個,白葉混合池中數(shù)量最多,為1 021 699個。4個樣本之間,同一類型的SNP數(shù)量和比例大致相當。所有SNP變異的位置信息包括7種類型,其中,以位于基因區(qū)間的SNP位點最多,其次是非同義突變、同義突變、終止子獲得、終止密碼子丟失,剩余的起始密碼子丟失、5′非翻譯區(qū)類型的SNP較少。
表3 變異位點注釋統(tǒng)計表Table 3 Annotation of variation sites
統(tǒng)計2個極端子代混池SNP-index在染色體上的分布情況,計算2個子代混池的△SNP-index,當置信度為99%時,分布于羽衣甘藍3條染色體的8個區(qū)域出現(xiàn)了超過臨界值水平的極顯著峰(圖1)。顯著關聯(lián)區(qū)間分布在羽衣甘藍Chr.2:35.10-37.05 Mb、Chr.3:51.60-52.80 Mb、Chr.9:5.85-7.85 Mb、Chr.9:9.15-10.60 Mb、Chr.9:11.90-21.65 Mb、Chr.9:22.00-24.25 Mb、Chr.9:28.10-33.05 Mb和Chr.9:33.25-35.35 Mb。這些顯著關聯(lián)區(qū)間覆蓋的染色體長度為1.2-9.75 Mb,8個關聯(lián)區(qū)間內共包含510個基因(表4)。其中,第9染色體上SNP的富集程度顯著高于其他染色體,且Chr.9:11.90-21.65 Mb和Chr.9:22.00-24.25 Mb兩個關聯(lián)區(qū)間頂點峰值最高,暗示這兩個區(qū)間內可能具有調控羽衣甘藍心葉顏色的關鍵基因。
圖1 所有染色體的△SNP-index圖Fig.1 △SNP-index map of all chromosomes
表4 SNP位點關聯(lián)分析獲得的關聯(lián)區(qū)域Table 4 Correlation regions obtained by SNP correlation analysis methods
結合BRAD數(shù)據(jù)庫中注釋信息,2個候選區(qū)段內預測到172個有注釋的基因,其中94個基因注釋到GO數(shù)據(jù)庫的21個功能組中(圖2),包括8個生物學進程、7個細胞組分和6個分子功能,在生物學進程中,這些基因主要參與代謝過程、細胞過程、單一有機體、定位等生物學過程;在細胞成分中,這些基因主要集中在膜、細胞、細胞組分、細胞器等成分;在分子功能中,這些基因主要參與結合、催化活性、轉運活性等功能。
圖2 候選基因GO富集分析Fig.2 GO enrichment of the candidate genes
根據(jù)數(shù)據(jù)庫中詳細注釋信息進一步篩選與目標性狀相關的基因,共得到8個與羽衣甘藍白葉形成有關的基因(表5)。Bol005195編碼的葉綠體ATP合酶δ亞基為光合作用必須蛋白。Bol030253為五肽重復序列超家族蛋白(pentatricopeptide repeat(PPR)superfamily protein),通過基因注釋及同源性比較,發(fā)現(xiàn)該基因可能編碼葉綠體蛋白。Bol030286編碼葉綠體膜整合金屬蛋白酶FtsH11。以上3個基因編碼的葉綠體蛋白穩(wěn)態(tài)對葉綠體維持正常功能十分重要。Bol030235為β-類胡蘿卜素羥化酶2(BETA CAROTENOID HYDROXYLASE 2, CYH, BCH2)基因,通過隱黃質將β-胡蘿卜素轉化為玉米黃質。Bol012077、Bol1012077、Bol029431和Bol030318為跨膜蛋白(transmembrane protein)基因,具有跨膜轉運作用,推測這4個基因在葉綠素的跨膜轉運中發(fā)揮作用。
表5 候選基因功能注釋Table 5 Functional annotation of candidate genes
自然界中,大多數(shù)植物葉子都是綠色的,葉綠素可以吸收藍紫色和紅橙光并將光能轉化為化學能。一些植物會長出白色葉子,研究證明白色的葉子或苞片可以用來吸引傳粉者,白葉的特殊功能可能增強植物的生殖適合性[19-20]。羽衣甘藍白色葉的形成機制很少被研究。本研究以2個不同葉色材料為親本構建了BSA-Seq群體,利用測序獲得的SNP進行關聯(lián)分析,獲得候選區(qū)段,對控制羽衣甘藍白色心葉的基因進行分析。2個候選區(qū)域內,共有172個具有注釋信息的基因,根據(jù)注釋及同源性比對信息共篩選出8個候選基因。
光合色素合成的場所為葉綠體,因此葉綠體的結構和發(fā)育情況直接影響光合色素的合成,進而影響葉色。Bol005195(AtpD)編碼葉綠體atp酶δ亞基,進而影響葉綠體合成酶的豐度和活性,Maiwald等[21]發(fā)現(xiàn)擬南芥AtpD-1突變體溫室生長表現(xiàn)為色素缺乏,通過回補試驗,恢復了野生型葉片顏色,表明AtpD-1的表型是由于缺乏AtpD功能所致,AtpD的產物對葉綠素合成十分必要。Bol030253編碼的五肽重復序列蛋白是一種退化的35個氨基酸重復基序,葉綠體中的PPR蛋白通過影響葉綠體的發(fā)育調控植物的葉色變化[22]。Liu等[23]研究發(fā)現(xiàn)玉米PPR26突變體出現(xiàn)葉綠素缺乏、淡綠甚至白化致死。劉勝坤等[24]證明玉米突變體74101的黃葉表型由定位于細胞核中的ZmNPPR5控制。Bol030286編碼膜結合蛋白酶FtsH11,擬南芥中同源的FtsH11亞細胞定位在葉綠體包膜內,被認為是線粒體和葉綠體的雙重靶標,F(xiàn)tsH11在長光周期生長期間對葉綠體的結構和功能至關重要,F(xiàn)tsH11突變體在長日或連續(xù)光照下生長中出現(xiàn)到褪綠變白的表型[25]。Bol030235為β-類胡蘿卜素羥化酶2基因,β-胡蘿卜素羥基化是類胡蘿卜素生成的關鍵調節(jié)步驟。AcBCH1沉默表達的獼猴桃中,玉米黃質、葉黃素和β-隱黃質含量降低,β-胡蘿卜素含量增加,而轉基因獼猴桃幼苗中,β-胡蘿卜素含量降低[26]。CHY沉默的馬鈴薯塊莖中,β-胡蘿卜素增加了38倍,總類胡蘿卜素增加了4.5倍,而β-胡蘿卜素羥基化的直接產物玉米黃質隨之減少[27]。以上4個基因與葉綠體結構和光合色素的形成有關,因此,推測參與白色葉形成??缒さ鞍卓梢詥为毣蛘吲c其他蛋白組成跨膜蛋白復合體一起執(zhí)行轉運功能,一些跨膜蛋白參與了脂肪、碳、維生素及一些色素的代謝過程[28]。本研究中共鑒定出4個跨膜蛋白基因Bol012077、Bol007709、Bol029431和Bol030318,可能對葉綠素分子的轉運產生影響,從而影響葉色。
白色葉片的形成和發(fā)育是一個復雜的生理過程,目前尚缺乏系統(tǒng)全面的研究,本研究通過基于全基因組重測序的BSA分析尋找到了一些與白葉形成相關的基因,對于這些基因是否是白色葉片形成的關鍵基因,以及如何調控葉色的形成將在后續(xù)工作中通過轉基因等技術進行功能驗證。
羽衣甘藍白色心葉相對于紅色為隱性性狀。所有SNP變異的位置信息包括7種類型,其中,以位于基因區(qū)間的SNP位點最多。Chr.9:11.90-21.65 Mb和Chr.9:22.00-24.25 Mb區(qū)間內可能具有調控羽衣甘藍心葉顏色的關鍵基因。進一步篩選獲得8個與羽衣甘藍白葉形成有關的基因,分別為Bol030253、Bol029431、Bol012077、Bol007709、Bol030318、Bol030235、Bol030286和Bol005195。