丁延慶 徐建霞 汪 燦 周棱波 張國兵 趙 強 邵明波 張立異
(貴州省農(nóng)業(yè)科學(xué)院旱糧研究所,貴州貴陽 550006)
高粱(Sorghum bicolorL.Moench)是世界第五大糧食作物,在食品、飼料、纖維、釀造和生物能源原料等方面被廣泛應(yīng)用。在我國,高粱主要種植在西南、華北和東北地區(qū),每年有超過80%的高粱籽粒作為白酒釀造原料[1-3]。高粱籽粒釀造性狀包括總淀粉含量、支鏈淀粉含量、單寧含量、硬度和顏色等。淀粉是產(chǎn)生酒精的主要物質(zhì),籽??偟矸酆颗c出酒率成正比,而支/直鏈淀粉含量與糊化率相關(guān),影響釀造工藝。籽粒硬度由角質(zhì)(玻璃質(zhì))率決定,而角質(zhì)率與蛋白質(zhì)含量呈正比,對白酒品質(zhì)有較大影響。單寧又稱原花青素,在白酒釀造過程中不僅具有抑制有害微生物作用,而且能產(chǎn)生丁香酸、丁香醛、香草醛、阿魏酸等化合物,從而賦予白酒獨特的香味[4]。此外,籽粒顏色受單寧含量影響,也是酒用高粱育種的一個重要指標[5]。
高粱籽粒釀造性狀是受多基因控制的數(shù)量性狀。結(jié)合限制性片段長度多態(tài)性(restriction fragment length polymorphism,RFLP)、擴增片段長度多態(tài)性(amplified fragment length polymorphism,AFLP)和簡單重復(fù)序列(simple sequence repeat,SSR)等分子標記,利用遺傳群體開展高粱數(shù)量性狀位點(quantitative trait locus,QTL)定位是研究數(shù)量性狀的重要方法[6]。目前,位于10號染色體上編碼顆粒結(jié)合淀粉合成酶的Wax基因已被克?。?]。Murray等[8]利用85個AFLP和68個SSR標記對176個家系的重組自交系(recombinant inbred lines,RIL)群體(BTx623×Rio)開展基因分型,在1、3和4號染色體上確定了4個與籽粒總淀粉含量有關(guān)的QTL。基于115個RFLP和85個AFLP標記的基因分型,前人構(gòu)建了包含125個家系的F5群體(RTx430×Sureno)和379個家系(IS2807×249)的RIL的遺傳圖譜,并在2、3和7號染色體上定位了4個影響籽粒硬度的QTL[9-10]。在籽粒顏色和單寧含量方面,目前科研人員已經(jīng)克隆了位于1號染色體上影響籽粒顏色的Y基因[11],以及分別位于4號和2號染色體上控制籽粒單寧含量的Tan1和Tan2基因[12-13]。利用118個SSR和8個Indel標記,白春明等[14]構(gòu)建了包含325個家系RIL群體(BTx623×Rio)的遺傳圖譜,在1號、2號、4號和6號染色體上檢測到3個與單寧含量和6個與籽粒顏色相關(guān)的QTL位點。
隨著高粱基因組測序的完成,基于高通量測序的簡化基因組測序技術(shù)(genotyping by sequencing,GBS)越來越多地應(yīng)用于高粱QTL定位。GBS是在二代測序的基礎(chǔ)上發(fā)展起來的一種基于酶切試驗對特定區(qū)域進行測序從而降低基因組復(fù)雜度的方法,具有快速、簡便、低成本發(fā)現(xiàn)單核苷酸多態(tài)性標記(single nucleotide polymorphism,SNP)標記的優(yōu)點[15]。通過GBS技術(shù),Habyarimana等[16]利 用S.bicolor×S.halepense構(gòu) 建 的RIL,準確定位了控制高粱籽粒中多酚、單寧和類黃酮含量的QTL。Sukumaran等[17]對包含248個家系的RIL群體(Tx436×MN7645),使用GBS進行基因分型獲得了7 144個多態(tài)性SNP位點,準確定位了與高粱產(chǎn)量、開花時間和持綠性狀相關(guān)的QTL。同樣利用該技術(shù),Kong等[18]對來源于BTx623×IS3620C的399個RILs構(gòu)建了包含616個Bin標記的高粱遺傳圖譜,檢測到36個調(diào)控株型和開花性狀的QTL[18]。Super-GBS是基于GBS進一步發(fā)展的簡化基因組測序技術(shù),在SNP標記的重現(xiàn)性、穩(wěn)定性、分型準確性等特點上優(yōu)于GBS,已應(yīng)用于遺傳圖譜構(gòu)建、QTL定位以及全基因組關(guān)聯(lián)分析等研究[19-21]。但目前利用Super-GBS技術(shù)在高粱中開展遺傳圖譜構(gòu)建和QTL定位的研究仍鮮見報道。
鑒于此,本研究通過美國品種BTx623與貴州茅臺酒專用品種紅纓子雜交構(gòu)建包含205個家系的RIL群體,利用Supper-GBS技術(shù)開展全基因組基因分型,以期確定影響籽粒總淀粉含量、支鏈淀粉含量、單寧含量、硬度和顏色的QTL,并對重要遺傳區(qū)段內(nèi)的基因進行注釋,確定影響重要QTL的候選基因,旨在為關(guān)鍵基因的進一步克隆和酒用高粱遺傳改良提供理論依據(jù)。
本研究利用貴州省旱糧研究所收集的美國高粱籽粒品種BTx623為母本,貴州酒用高粱品種紅纓子為父本配置雜交組合,得到F1植株后,采用單粒傳法在貴州貴陽和海南三亞兩地進行輪流加代,構(gòu)建了包含205個家系的RIL群體。BTx623是非糯高粱,總淀粉含量較高,籽粒較硬,顏色為白色,不含單寧;紅纓子是糯高粱,籽粒較軟,顏色為紅色,單寧含量較高。
2020—2021年連續(xù)兩年分別在貴州貴陽、貴州安順和海南三亞進行RIL群體及雙親材料種植。小區(qū)長2 m,行距60 cm,株距20 cm,人工點播,適時進行常規(guī)大田管理工作。在抽穗期,每個株系中選擇5個高粱穗用硫酸鈉紙袋套袋自交,在整穗完成授粉時,將紙袋換成網(wǎng)袋,直至種子成熟。收獲后進行曬干脫粒,選擇飽滿無損傷的籽粒200 g,利用XDS谷物品質(zhì)分析儀(美國福斯公司)進行籽??偟矸酆浚╰otal starch content,TSC)、支鏈淀粉含量(amylopectin content,AC)和單寧含量(tannin content,TC)的測定:(1)采用改進最小二乘法(modified PLS)回歸技術(shù),通過不同散射處理和導(dǎo)數(shù)處理建立預(yù)測模型;(2)將100份不同類型高粱資源的化學(xué)測定值作為驗證集,對預(yù)測模型進行交叉驗證和非參數(shù)檢驗,從而獲得最優(yōu)預(yù)測模型;(3)測定時將樣品放入分析盤的樣品杯中,在波長400~2 489 nm范圍內(nèi)進行3次光譜掃描,每個性狀以3株的平均值為最終的表型值。使用GWJ-2谷物硬度計(杭州金科利達公司)測定高粱籽粒硬度(grain hardness,GH),每個株系隨機選取30粒種子進行測量,重復(fù)3次,取平均值作為表型數(shù)據(jù)。籽粒顏色(grain color,GC)參照《高粱種質(zhì)資源描述規(guī)范和數(shù)據(jù)標準》[22]進行分級賦值,1~5級依次對應(yīng)白色、灰色、黃色、黃褐色和紅褐色。
在2020年貴州貴陽環(huán)境,采集四葉期RIL家系的新鮮嫩葉,采用十六烷基三甲基溴化銨(cetyltrimethylammonium bromide,CTAB)方法提取DNA,將質(zhì)檢合格的DNA樣品送至上海歐易生物醫(yī)學(xué)科技有限公司進行Super-GBS文庫的構(gòu)建,并通過Illumina Nova PE150平臺測序。以高粱品種BTx623的基因組序列作為參考(https://phytozome-next.jgi.doe.gov/info/Sbicolor_v3_1_1),使 用bwa和GATK軟 件進 行SNP篩 選,利用vcftools軟件對獲得的SNP分型結(jié)果進行過濾,過濾條件為:缺失率小于20%,次等位基因頻率大于5%的二等位位點。利用親本的基因型數(shù)據(jù)進行多態(tài)性標記開發(fā),其中BTx623基因組為參考基因組,紅纓子已完成基于深度重測序的全基因組測序[23]。完成親本間標記開發(fā)后,對RIL群體的基因型數(shù)據(jù)進行標記位點篩選,只保留親本基因型為純合且有差異的標記,共獲得16 474個多態(tài)性標記。
使用JoinMap 5.0軟件對RIL群體的基因型數(shù)據(jù)進行標記過濾和遺傳圖譜構(gòu)建,過濾條件為:(1)刪除卡方檢驗顯著性P<0.05的位點;(2)刪除RIL群體中基因型缺失值>5%的個體;(3)相似度等于1的位點只保留1個。采用Kosambi函數(shù)構(gòu)建遺傳圖譜,根據(jù)5個籽粒性狀的表型數(shù)據(jù),使用QTL IciMapping 4.2軟件的完備區(qū)間作圖法(inclusive composite interval mapping,ICIM)進行QTL鑒定,染色體步移長度設(shè)定為0.1 cM,逐步回歸概率為P<0.001,篩選似然率(likelihood of odds,LOD)大于2.5的QTL位點,最后計算每個QTL的貢獻率和加性效應(yīng),QTL參照蘇代群等[24]的方法進行命名。
利用SPSS 21.0軟件對各個環(huán)境的表型數(shù)據(jù)進行平均值、標準差、頻率分布等描述性統(tǒng)計分析和相關(guān)性分析。在Sorghum QTL(http://aussorgm.org.au/sorghumqtl-atlas/)網(wǎng)站查找已被報道的QTL信息,從Phytozome(https://phytozome-next.jgi.doe.gov/)網(wǎng)站上獲得高粱品種BTx623的參考基因組信息。
在貴州貴陽(2020—2021年)、貴州安順(2021年)和海南三亞(2020年)的4個環(huán)境下開展親本和RIL群體的表型數(shù)據(jù)調(diào)查。結(jié)果表明,除籽粒顏色外,RIL群體的總淀粉含量、支鏈淀粉含量、單寧含量和籽粒硬度均表現(xiàn)為連續(xù)變異,表型平均值在2個親本表型值范圍內(nèi),變異系數(shù)為1.72%~64.97%。RIL群體各性狀的偏度和峰度絕對值均小于1,說明各性狀指標均呈正態(tài)分布(表1),是受多基因控制且易受環(huán)境影響的數(shù)量性狀,適合進行QTL定位。為了解不同環(huán)境下各性狀之間的關(guān)系,進行了Pearson相關(guān)性分析,結(jié)果如表2所示。籽粒顏色與單寧含量在4個環(huán)境下均呈極顯著正相關(guān)(P<0.01),R值平均為0.55,變異范圍為0.53~0.56;支鏈淀粉含量與總淀粉含量在所有環(huán)境下均呈極顯著正相關(guān)(P<0.01),R值平均為0.28,變異范圍為0.23~0.33。
表1 4個環(huán)境下親本及RIL群體籽粒釀造相關(guān)性狀的表型統(tǒng)計Table 1 Phenotypic statistics of grain brewing related traits in parents and RIL population in four environments
表2 高粱籽粒釀造相關(guān)性狀的相關(guān)性分析Table 2 Correlation analysis of grain brewing related traits in sorghum
利用Super-GBS技術(shù)對205個家系的RIL群體進行全基因組基因分型,共獲得16 474個多態(tài)性SNP標記。采用Kosambi函數(shù)構(gòu)建了覆蓋了高粱10條染色體的遺傳連鎖圖譜。除去冗余SNP后,最終圖譜的標記數(shù)為1 910個,圖譜長度為905.10 cM,標記間平均距離為0.47 cM(表3)。不同染色體的圖譜距離和標記密度變化范圍較大,其中遺傳圖距最長和標記密度最高的是2號染色體,其遺傳長度和標記間平均距離分別為128.45和0.38 cM;圖距最短的是5號染色體(61.48 cM)和10號染色體(61.94 cM);密度最低的是7號染色體,其標記間平均距離為0.72 cM。
表3 RIL群體中10條染色體遺傳圖距長度及SNP標記密度Table 3 Genetics distance length and SNP marker density of 10 chromosomes in the RIL population
利用ICIM方法,在4個環(huán)境下共定位到35個QTL與籽粒的5個釀造性狀相關(guān),分別位于1~9號染色體上(表4、圖1)。與總淀粉含量、支鏈淀粉含量、單寧含量、籽粒硬度和籽粒顏色相關(guān)的QTL分別有9、7、11、5和3個,一共涉及到28個染色體區(qū)段。
表4 4個環(huán)境下高粱籽粒釀造相關(guān)性狀的QTL定位Table 4 QTL mapping of sorghum grain brewing related traits in in four environments
影響總淀粉含量的9個QTL分別位于1號(2個)、3號(1個)、4號(1個)、5號(2個)、6號(1個)和9號(2個)染色體上。在3個環(huán)境下均能檢測到位于4號染色體的qTSC4.1,其最大LOD值和表型貢獻率分別為9.93和20.33%。在2020年貴陽環(huán)境下檢測到2個QTL(qTSC1.1和qTSC9.2),LOD值變化范圍為3.12~3.23,可解釋的表型變異率為6.39%~6.45%。除qTSC1.1、qTSC1.2、qTSC3.1和qTSC4.1外,其他5個QTL的增效等位基因均來源于親本BTx623。
影響支鏈淀粉含量的7個QTL分別位于3(2個)、4(3個)、7(1個)和9(1個)號染色體上。在2個環(huán)境下都定位到1個位于4號染色體上的重要QTL(qAC4.1),其最大LOD值和表型貢獻率分別為4.45和9.22%。5個QTL(qAC3.1、qAC3.2、qAC4.1、qAC4.2、qAC4.3)的增效等位基因來源于親本紅纓子,其他2個QTL(qAC7.1和qAC9.1)的增效等位基因來源于親本BTx623。
與單寧含量相關(guān)的11個QTL分別位于1號(1個)、2號(3個)、3號(2個)、4號(2個)、6號(1個)和9號(2個)染色體上。2個重要的QTL在4個環(huán)境中均能夠被檢測到,位于4號的qTC4.1的平均LOD值為27.57,變化范圍為23.34~32.13,可解釋平均表型貢獻率為36.51%,變化范圍為33.11%~40.53%。位于6號染色體的qTC6.1的平均LOD值為13.62,變化范圍為10.61~18.85,可解釋平均表型貢獻率為14.49%,變化范圍為11.67%~18.51%。在3個環(huán)境下檢測到2個QTL(qTC1.1和qTC4.2),最大LOD值分別為4.36和6.46,表型貢獻率分別為4.19%和6.77%。除qTC9.1和TC9.2以外,其他9個QTL增效的等位基因均來源于親本紅纓子。
影響籽粒硬度的5個QTL分別位于3號(2個)、7號(1個)、8號(1個)和9號(1個)染色體上。其中,位于3號和9號染色體上的2個重要QTL(qGH3.2和qGH9.1)能夠在2個環(huán)境下被檢測到,最大的LOD值分別為6.00和4.21,表型貢獻率分別為12.53%和8.22%。在5個QTL中,除了qGH9.1以外,其他4個QTL的增效等位基因均來源于親本BTx623。
與籽粒顏色相關(guān)的3個QTL分別定位于1號(1個)、4號(1個)和6號(1個)染色體上。在4個環(huán)境下均檢測到的2個重要QTL(qGC1.1和qGC4.1)定位于1號和4號染色體上,LOD值分別為8.82~15.59和19.74~31.25,表型貢獻率范圍為9.85%~17.07%和28.40%~44.96%。在3個環(huán)境下檢測到的qTC6.1位于6號染色體,其LOD值和表型貢獻率分別為2.53~4.67和2.73%~5.52%。上述3個QTL的增效等位基因均來源于親本紅纓子。
綜合比較,與5個性狀相關(guān)的QTL涉及到28個遺傳區(qū)段,其中3個重要區(qū)段在多個性狀中被同時定位(圖1)。與總淀粉含量、單寧含量和籽粒顏色相關(guān)的QTL在1號染色體的66.30~71.55 Mb區(qū)段上重疊,與總淀粉含量、支鏈淀粉含量、單寧含量和籽粒顏色相關(guān)的QTL在4號染色體的54.00~62.3 Mb區(qū)段上重疊,與單寧含量和籽粒顏色相關(guān)的QTL在6號染色體的54.59~57.57 Mb區(qū)段上重疊。
圖1 高粱籽粒釀造相關(guān)性狀QTL在遺傳圖譜上的分布Fig.1 Distribution of QTLs for sorghum grain brewing related traits on genetic map
根據(jù)上述QTL定位結(jié)果,對1號染色體(66.30~71.55 Mb)、4號染色體(54.00~62.3 Mb)以及6號染色體(54.59~57.57Mb)的三個重要區(qū)段進行了候選基因分析,利用植物基因組數(shù)據(jù)庫Phytozome(https://phytozome-next.jgi.doe.gov/),識別QTL區(qū)間內(nèi)高粱相關(guān)基因ID、蛋白質(zhì)注釋信息及相應(yīng)的其他物種(水稻和擬南芥)的同源基因,結(jié)合前人研究文獻[11,13,26,34-35],確定了8個候選基因(表5)。除已經(jīng)被克隆的Y基因和Tan1基因以外,本研究還注釋到了6個新的候選基因,包括與類黃酮合成途徑相關(guān)的bHLH轉(zhuǎn)錄因子Sobic.006G175700以及編碼黃烷酮3-羥化酶的基因Sobic.006G253900。其他4個基因則與植物淀粉和蔗糖代謝途徑相關(guān),包括編碼β-淀粉酶的基因Sobic.001G372100,是催化植物淀粉轉(zhuǎn)化為麥芽糖的重要基因,以及編碼淀粉合酶Ⅱ的Sobic.004G238600基因,是淀粉合成途徑的4種關(guān)鍵基因之一。
表5 QTL區(qū)間候選基因功能注釋Table 5 Functional annotation of candidate genes in QTL mapping
自元朝(公元前749-652年)以來,我國高粱一直就是釀造著名白酒的重要原料[25],如貴州茅臺、瀘州老窖、五糧液、汾酒等都是利用高粱作為主要的釀酒原料。因此,開展釀造相關(guān)性狀的遺傳學(xué)研究,發(fā)展緊密連鎖的分子標記,利用標記輔助育種技術(shù)加快酒用高粱新品種選育具有重要意義。
籽粒顏色是選育高粱單寧含量的指標,即隨著籽粒顏色的加深,單寧含量增加[14]。但是本研究的相關(guān)性分析結(jié)果顯示,單寧含量和籽粒顏色之間呈正相關(guān)關(guān)系,Pearson系數(shù)約等于0.5。這說明籽粒顏色并不是高粱單寧含量的可靠指標,在酒用高粱新品種選育中,僅根據(jù)籽粒顏色的深淺來判斷單寧含量的可能會導(dǎo)致較大的偏差。
目前,在水稻和玉米中涉及淀粉合成途徑的相關(guān)基因研究較為透徹[26],而在高粱中,雖然對籽??偟矸酆?、直(支)鏈淀粉含量以及胚乳蠟質(zhì)/角質(zhì)性狀進行了一些QTL定位[6],但是目前僅有Wax基因被克?。?]。本研究中,影響支鏈淀粉含量的2個QTL(qAC3.2和qAC9.1)與前人的研究結(jié)果接近[27],而總淀粉含量的4個QTL(qTSC1.2、qTSC3.1、qTSC4.1和qTSC9.1)則與已報道的QTL區(qū)間重疊[28]。通過同源基因比對,在qTSC1.2和qTSC4.1的區(qū)間上發(fā)現(xiàn)了4個候選基因,與其他作物中已報道的淀粉和蔗糖代謝相關(guān)基因同源[26],推測是參與高粱籽粒淀粉合成的候選基因。然而,由于本試驗所構(gòu)建的遺傳圖譜在10號染色體頂端存在一個缺口(Gap),導(dǎo)致Wax基因所在染色體區(qū)域缺少SNP標記,因此,在本研究中Wax基因未能被檢測到。
在糧食作物籽粒硬度的遺傳基礎(chǔ)研究方面,控制小麥籽粒硬度的基因Pina和Pinb已經(jīng)被克?。?9]。但關(guān)于高粱籽粒硬度的QTL定位報道仍較少[9-10,30],目前已定位的8個QTL位于2號、3號、4號、7號和10號染色體上,其中位于3號和7號染色體的QTL與本研究發(fā)現(xiàn)的qGH3.2和qGH7.1定位區(qū)間一致。推測本研究中發(fā)現(xiàn)的其他3個遺傳位點可能是新的QTL,但尚未找到與小麥等其他作物籽粒硬度相關(guān)的同源基因,需要進一步驗證。
單寧和花青素由類黃酮途徑的一個特定分支產(chǎn)生,涉及數(shù)十個結(jié)構(gòu)基因和多個調(diào)控基因,這些基因已在水稻[31]和玉米[32]和擬南芥[33]中得到較為全面的研究。迄今為止,在高粱中只克隆了2個調(diào)控單寧合成的基因,分別是編碼WD40蛋白的Tan1(Sobic.004G280800)基因[13]和編碼bHLH結(jié)構(gòu)域蛋白的Tan2(Sobic.002G0 76600)基因[12]。在本研究中,位于4號染色體的qTC4.1和qGC4.1與Tan1基因位點重疊。而位于2號染色體的Tan2基因則沒有被檢測到,其原因是2個親本BTx623和紅纓子在這個基因上沒有多態(tài)性,而基因測序結(jié)果也證實這兩個親本的Tan2基因序列完全相同(結(jié)果未報道)。而與單寧含量相關(guān)的另外3個QTL(qTC1.1、qTC3.2和qTC9.1)也與前人定位結(jié)果重疊[25]。本研究確定的控制籽粒顏色的qGC1.1位于1號染色體66.30~71.55 Mb區(qū)間,與控制高粱籽粒顏色的Y1基因位點一致[11]。同時,在4個環(huán)境中還檢測發(fā)現(xiàn),與單寧含量和籽粒顏色相關(guān)的8個QTL均位于6號染色體上的同一區(qū)段(54.59~57.26 Mb),目前在高粱研究中還未見報道。通過同源基因比對,在其附近確定了2個重要的候選基因:一個候選基因為Sobic.006G175700,與水稻Kala4基因同源,屬于bHLH轉(zhuǎn)錄因子,通過激活類黃酮合成相關(guān)基因產(chǎn)生特異色素,導(dǎo)致水稻籽粒變黑[34];另一個候選基因為Sobic.006G253900,是擬南芥中黃烷酮3-羥化酶(F3H)同源物[35],屬于類黃酮合成途徑中的關(guān)鍵酶,轉(zhuǎn)基因試驗也證實了高粱品種Tx430中轉(zhuǎn)入F3H基因后植株中類黃酮化合物含量較野生型顯著上升[36]。
此外,本研究還確定了幾個潛在的控制高粱單寧和淀粉生物合成的候選基因。為了進一步精確鑒定等位變異位點,后續(xù)將利用基于轉(zhuǎn)錄組測序的集群分離法(bulked segregation analysis,BSA),加密作圖群體的目標區(qū)段;隨后,將對候選基因進行序列分析和表達分析,以確定基因多態(tài)性,為單寧和淀粉遺傳變異在作物改良中的應(yīng)用奠定基礎(chǔ)。
本研究利用Super-GBS技術(shù),構(gòu)建了包含205個RILs(Bx623×紅纓子)的SNP高密度遺傳連鎖圖譜。在四個環(huán)境下共定位到9個總淀粉含量、7個支鏈淀粉含量、11個單寧含量、5個籽粒硬度和3個籽粒顏色相關(guān)的QTLs。在多個環(huán)境和性狀中確定了3個重要遺傳區(qū)段,分別位于1號、4號和6號染色體,包含了已經(jīng)克隆的Y1和Tan1基因位點,同時篩選出6個與籽粒淀粉含量、支鏈淀粉含量、單寧含量以及顏色相關(guān)的候選基因。