孫正文, 谷淇深, 張艷, 王省芬, 馬峙英
(河北農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,華北作物改良與調(diào)控國(guó)家重點(diǎn)實(shí)驗(yàn)室,河北 保定 071001)
棉花是我國(guó)重要經(jīng)濟(jì)作物和紡織工業(yè)原料,棉花全產(chǎn)業(yè)鏈涉及數(shù)千萬(wàn)產(chǎn)業(yè)工人、棉農(nóng)等從業(yè)人員。棉花產(chǎn)業(yè)發(fā)展事關(guān)國(guó)計(jì)民生,提升棉花生產(chǎn)水平對(duì)促進(jìn)農(nóng)民增收、農(nóng)業(yè)增效和鄉(xiāng)村振興具有重要意義。優(yōu)良品種是作物生產(chǎn)的第一要素,針對(duì)棉花生產(chǎn)自然資源限制和不利生產(chǎn)條件等問(wèn)題,開(kāi)展種源“卡脖子”技術(shù)攻關(guān),創(chuàng)制多抗、高產(chǎn)、優(yōu)質(zhì)、早熟的突破性棉花重大新品種是推進(jìn)棉花產(chǎn)業(yè)提質(zhì)增效和區(qū)域經(jīng)濟(jì)持續(xù)發(fā)展的重大需求。
種質(zhì)資源和育種技術(shù)創(chuàng)新是培育突破性新品種的首要關(guān)口。目前,我國(guó)在棉花突破性種質(zhì)資源重要經(jīng)濟(jì)性狀精準(zhǔn)鑒定和創(chuàng)新方面還有較大提升空間,育種上采用的大多還是2.0時(shí)代的雜交育種,3.0時(shí)代的分子育種在部分單位進(jìn)行了研究和應(yīng)用,亟需加快進(jìn)入4.0時(shí)代的生物技術(shù)育種。本團(tuán)隊(duì)近年來(lái)在種質(zhì)鑒定和基因發(fā)掘等方面取得了一系列研究進(jìn)展,本文重點(diǎn)對(duì)其進(jìn)行梳理總結(jié),以期為棉花生物技術(shù)育種提供參考。
種質(zhì)資源是農(nóng)業(yè)科技創(chuàng)新與現(xiàn)代種業(yè)發(fā)展的重要物質(zhì)支撐,為豐富棉花育種的遺傳基礎(chǔ),提高育成品種的產(chǎn)量、品質(zhì)及抗性水平,有待對(duì)大量陸地棉種質(zhì)資源農(nóng)藝性狀和纖維品質(zhì)性狀等進(jìn)行多環(huán)境鑒定,并結(jié)合SNP(single nucleotide polymorphisms,單核苷酸多態(tài)性位點(diǎn))芯片、重測(cè)序等多種分子技術(shù)手段,綜合評(píng)選優(yōu)異種質(zhì)資源。
Sun等[1]利用棉花SNP芯片對(duì)719份陸地棉種質(zhì)進(jìn)行了分子鑒定,獲得10 511個(gè)高質(zhì)量SNPs并進(jìn)行遺傳變異分析。這些SNPs 標(biāo)記在整個(gè)基因組中分布不均勻,其中染色體Dt08 的SNP 最多(844),At04 的SNP 最少(97)。通過(guò)群體結(jié)構(gòu)分析將這些種質(zhì)資源分為2個(gè)亞群G1和G2,其中在G2 中有 360個(gè)獨(dú)特的 SNPs,在 G1 中只有 68個(gè)獨(dú)特的SNPs。這些結(jié)果表明,2個(gè)亞群體在分子水平上出現(xiàn)了遺傳分化。Ma 等[2]利用代表7 362個(gè)陸地棉種質(zhì)的419份(5.7%)核心種質(zhì)進(jìn)行基因組重測(cè)序,鑒定到3 665 030個(gè)SNPs,其中224 201個(gè)位于17 446個(gè)蛋白質(zhì)編碼基因內(nèi),70 959個(gè)位于上游或下游區(qū)域,其余3 369 870個(gè)位于基因間區(qū)域。這些SNPs位點(diǎn)為棉花重要性狀的分子改良提供了豐富的遺傳信息。群體結(jié)構(gòu)分析表明,419份棉花分為 3個(gè)亞群,亞群之間 θπ 值為(3.13~3.72)×10-4,均高于已報(bào)道的地方品種(2.59×10-4)和改良品種(1.79×10-4),但低于水稻秈稻(1.6×10-3)、粳稻(0.6×10-3)和改良大豆(1.05×10-3),表明陸地棉種質(zhì)總體上遺傳多樣性較低,這些種質(zhì)資源為棉花育種提供了較為廣泛的遺傳基礎(chǔ)。在優(yōu)異種質(zhì)資源篩選上,Sun等[3]基于719份陸地棉多年多點(diǎn)表型數(shù)據(jù)的綜合評(píng)價(jià),篩選出纖維長(zhǎng)度(fiber length,F(xiàn)L)大于30.00 mm、纖維強(qiáng)度(fiber strength,F(xiàn)S)大于30.00 cn·tex-1的優(yōu)異種質(zhì)31 份,這些材料在至少6個(gè)環(huán)境中的品質(zhì)達(dá)到了“雙30”,馬克隆值(fiber micronaire,F(xiàn)M)在3.5~4.9之間,其中W82-1的FL和FS在8種環(huán)境中均大于30.00。MSCO-12的FL平均值最高(33.74 mm);J02-508 的FS 平均值最高(33.94 cn·tex-1)。另外,Ma等[4]又通過(guò)對(duì)1 081份陸地棉種質(zhì)進(jìn)行重測(cè)序獲得了2 970 970個(gè)高質(zhì)量SNPs,對(duì)該群體進(jìn)行遺傳親緣關(guān)系分析發(fā)現(xiàn)可分為3個(gè)亞群,這些種質(zhì)資源為棉花改良提供了分子基礎(chǔ),也為優(yōu)異親本組配提供重要理論參考。
協(xié)同提高陸地棉品種的產(chǎn)量、品質(zhì)和抗逆性是生物技術(shù)育種的重大目標(biāo),而棉花現(xiàn)代栽培品種參考基因組的缺乏以及潛在的農(nóng)藝性狀的基因組結(jié)構(gòu)變異的遺傳效應(yīng)有待探明。因此,我國(guó)自育陸地棉現(xiàn)代品種農(nóng)大棉8 號(hào)(Nongdamian 8,NDM8)和海島棉Pima 90 的組裝以及品種間結(jié)構(gòu)變異的鑒定[4]為棉花重要性狀改良提供了新的理論依據(jù)和資源。
基于單分子實(shí)時(shí)(single molecule real-time,SMRT)測(cè)序(覆蓋深度為180.38 倍)和Illumina 雙端數(shù)據(jù)校正(總覆蓋率為233.75倍),10×Genomics(基因組)鏈接數(shù)據(jù)(覆蓋深度232.90倍)以及Hi-C雙端數(shù)據(jù)(覆蓋深度125 倍)構(gòu)建的基因組大小分別為2.29和2.21Gb,重疊群(contig)N50為13.15和9.24 Mb,染色體掛載率為99.57%和99.75%,編碼基因80 124和79 613個(gè),其中1 499和1 267個(gè)為預(yù)測(cè)的新基因,比較發(fā)現(xiàn)在棉種進(jìn)化中,Copia和Gypsy轉(zhuǎn)座子對(duì)農(nóng)藝性狀的分化起著重要作用。將海陸基因組比對(duì),檢測(cè)到31 296個(gè)變異/基因?qū)υ诤u棉組織中顯著特異表達(dá),5 815個(gè)插入缺失位于5 256個(gè)基因的外顯子區(qū),其中蔗糖合酶基因GbM_D13G2394存在2 bp 的缺失,在海島棉品種Hai7124和3-79以及漸滲系NDM373-9和魯原343中得以驗(yàn)證。發(fā)現(xiàn)NDM373-9 獲得了來(lái)自海島棉的171個(gè)外顯子區(qū)結(jié)構(gòu)變異,其中分別有34 和12個(gè)基因與已報(bào)道的抗病性和纖維發(fā)育有關(guān),證明了海島棉對(duì)改良陸地棉的育種價(jià)值。與已測(cè)序基因組TM-1進(jìn)行比較,發(fā)現(xiàn)NDM8存在876 568個(gè)結(jié)構(gòu)變異,其中28 626個(gè)變異能夠在10~1 081個(gè)重測(cè)序種質(zhì)中檢測(cè)到。研究還發(fā)現(xiàn),現(xiàn)代品種較早期品種獲得了1 128個(gè)NDM8型結(jié)構(gòu)變異,表明現(xiàn)代育種改良發(fā)揮了重要作用[4]。
提升棉花產(chǎn)量一直是育種的重要目標(biāo),但是棉花產(chǎn)量以及纖維品質(zhì)性狀均為數(shù)量性狀,且易受環(huán)境影響,同步改良這些性狀比較困難。利用分子標(biāo)記結(jié)合關(guān)聯(lián)分析對(duì)產(chǎn)量性狀進(jìn)行解析,可鑒定到大量相關(guān)的標(biāo)記位點(diǎn)。
Sun 等[5]通過(guò)全基因組關(guān)聯(lián)分析(genome-wide association studies,GWAS)鑒定了不同環(huán)境下陸地棉產(chǎn)量相關(guān)性狀的SNP標(biāo)記及候選基因。共鑒定出62個(gè)顯著相關(guān)的SNPs,其中8個(gè)與鈴重(boll weight,BW)關(guān)聯(lián)的SNPs,6個(gè)與衣分(lint percentage,LP)關(guān)聯(lián),21個(gè) SNPs 位點(diǎn)與籽指(seed index,SI),5個(gè)位點(diǎn)與衣指(lint index,LI)關(guān)聯(lián),7個(gè)位點(diǎn)與結(jié)鈴數(shù)(boll number,BN)關(guān)聯(lián),進(jìn)一步確定了27個(gè)候選基因,且每個(gè)基因至少包含1個(gè)SNP。Ma等[?]鑒定到與BW、LP、SI、LI 和單鈴纖維重(fiber weight per boll,F(xiàn)WPB)5個(gè)產(chǎn)量相關(guān)性狀顯著關(guān)聯(lián)的1 816個(gè)SNPs 位點(diǎn),在 842個(gè)與 LP 相關(guān)的基因和 743個(gè)與LI相關(guān)的基因中,分別有16和9個(gè)基因包含非同義SNPs。其中在Dt02染色體上的峰值區(qū)域包含5個(gè)與LP相關(guān)的非同義SNP,3個(gè)位于編碼四肽重復(fù)類超家族蛋白基因Gh_D02G0025內(nèi),富含TPR 結(jié)構(gòu)域的蛋白在植物激素信號(hào)通路中發(fā)揮重要作用;轉(zhuǎn)錄組分析表明,Gh_D02G0025在 0 和 5 DPA(days post anthesis)纖維中具有較高的表達(dá)量,這些結(jié)果表明Gh_D02G0025可能會(huì)通過(guò)不同的激素信號(hào)通路參與纖維起始和快速伸長(zhǎng),并決定皮棉產(chǎn)量。Ma 等[4]通過(guò)重測(cè)序1 081 份陸地棉獲得了304 630個(gè)結(jié)構(gòu)變異(structure variation,SV),包括141 145個(gè) 插 入 、156 234個(gè) 缺 失 、39個(gè) 倒 位 、6 384個(gè)易位和828個(gè)重復(fù)。而棉花重要農(nóng)藝性狀結(jié)構(gòu)變異的遺傳效應(yīng)尚不清楚。因此,利用SV數(shù)據(jù)對(duì)產(chǎn)量性狀進(jìn)行了GWAS 分析,共鑒定出97個(gè)與產(chǎn)量相關(guān)。產(chǎn)量性狀(BW、LP、SI)的結(jié)構(gòu)變異主要位于At染色體(22個(gè))。其中對(duì)于重要的皮棉產(chǎn)量性狀LP,Dt03的2個(gè)結(jié)構(gòu)變異可顯著提高LP,分別由37.49%提高到39.69%,37.47%提高到40.00%。
棉花的長(zhǎng)度、強(qiáng)度、馬克隆值等是評(píng)價(jià)棉花纖維品質(zhì)的重要指標(biāo)。利用大量的SNPs 標(biāo)記對(duì)纖維品質(zhì)性狀進(jìn)行了連鎖分析及關(guān)聯(lián)分析,檢測(cè)到多個(gè)與棉花纖維品質(zhì)性狀相關(guān)的分子標(biāo)記位點(diǎn)。
Sun等[1]利用基因芯片對(duì)719份陸地棉材料在8個(gè)環(huán)境鑒定的纖維品質(zhì)性狀進(jìn)行關(guān)聯(lián)分析,檢測(cè)到20個(gè)與纖維長(zhǎng)度相關(guān)的標(biāo)記位點(diǎn),其中染色體Dt11的i60962Gt位點(diǎn)可在6個(gè)環(huán)境下穩(wěn)定檢測(cè)到;與纖維強(qiáng)度顯著相關(guān)SNPs標(biāo)記18個(gè),其中4個(gè)可在多環(huán)境下穩(wěn)定檢測(cè)到;另外鑒定到4、4、11個(gè)SNPs位點(diǎn)分別與馬克隆值、整齊度和伸長(zhǎng)率相關(guān)。在這些SNPs位點(diǎn)中,8個(gè)位點(diǎn)與纖維長(zhǎng)度、強(qiáng)度同時(shí)關(guān)聯(lián),3個(gè)位點(diǎn)同時(shí)與纖維長(zhǎng)度和纖維伸長(zhǎng)率關(guān)聯(lián)。Ma 等[2]利用重測(cè)序技術(shù)挖掘到366 萬(wàn)個(gè)高質(zhì)量SNPs位點(diǎn),并對(duì)419份陸地棉核心種質(zhì)在12個(gè)環(huán)境下的纖維品質(zhì)性狀進(jìn)行關(guān)聯(lián)分析,共檢測(cè)到3 136個(gè)與纖維長(zhǎng)度、纖維強(qiáng)度、馬克隆值、整齊度和伸長(zhǎng)率相關(guān)的標(biāo)記,其中有778個(gè)SNPs 標(biāo)記可在至少2個(gè)性狀上檢測(cè)到。染色體Dt11上23.93~24.10 Mb 區(qū)域的30個(gè)SNPs 位點(diǎn)與多個(gè)性狀同時(shí)關(guān)聯(lián),說(shuō)明該區(qū)域存在協(xié)同調(diào)控棉花纖維品質(zhì)性狀的遺傳位點(diǎn),可用于分子標(biāo)記輔助選擇改良纖維品質(zhì)。Gu等[6]以自育品種農(nóng)大棉13號(hào)和農(nóng)大601為親本,構(gòu)建了1套含有588個(gè)株系的重組自交系群體,基于重測(cè)序數(shù)據(jù)對(duì)該群體在8個(gè)環(huán)境的5個(gè)纖維品質(zhì)性狀進(jìn)行QTL(quantitative trait locus)定位分析,共檢測(cè)到66個(gè)優(yōu)異位點(diǎn),16個(gè)QTLs 可在多環(huán)境下穩(wěn)定檢測(cè)到,bin4537等13個(gè)標(biāo)記與此16個(gè)位點(diǎn)緊密連鎖(表1)。
表1 與穩(wěn)定QTL緊密連鎖的標(biāo)記信息[6]Table 1 Marker information closely linked to stable QTL[6]
另外,通過(guò)重測(cè)序1 081份陸地棉材料獲得的304 630個(gè)結(jié)構(gòu)變異對(duì)主要的纖維品質(zhì)性狀進(jìn)行了GWAS 分析[4],鑒定出160個(gè)與纖維品質(zhì)性狀(FL、FS、M)關(guān)聯(lián),其中139個(gè)位于Dt染色體,21個(gè)位于At 染色體。對(duì)于能夠顯著提高紗線經(jīng)濟(jì)價(jià)值的FL 性狀,在Dt11 中檢測(cè)到最高的關(guān)聯(lián)峰,其中370 kb 區(qū)域(24.55~24.93 Mb)包含125個(gè)結(jié)構(gòu)變異。在這些位點(diǎn)中,69個(gè)和56個(gè)分別使FL 顯著增加0.71~0.99 和1.00~1.19 mm,使纖維從27或28 mm級(jí)增加到29 mm級(jí)。
目前已克隆很多纖維發(fā)育的基因(表2),如轉(zhuǎn)錄因子[7-8]、激素[9-10]、骨架蛋白[11-13]、脂肪代謝[9,14]、細(xì)胞壁成分[11,15]等相關(guān)基因。本團(tuán)隊(duì)利用連鎖分析和關(guān)聯(lián)分析也檢測(cè)到與纖維發(fā)育相關(guān)的基因,如糖代謝相關(guān)基因Gh_D07G1799[1],與細(xì)胞代謝相關(guān)的伴侶基因Gh_D13G1792[1],與細(xì)胞骨架蛋白相關(guān)的gyp1p 家族蛋白基因Gh_A10G1256[2]和Ghir_D02G-002580[6],與 擬 南芥細(xì)胞伸長(zhǎng)相關(guān)的KRP 家族蛋白基因Gh_D11G1929[2],與植物激素信號(hào)途徑相關(guān)基因Gh_D02G0025[2]、Ghir_A03G020290[6];與 脂 質(zhì)信號(hào)轉(zhuǎn)導(dǎo)相關(guān),編碼棉花種子脂肪酸的基因Ghir_D02G010340[6],與細(xì)胞壁成分相關(guān)的基因Ghir_D02G011110[6]。
表2 纖維發(fā)育相關(guān)候選基因鑒定Table 2 Identification of candidate genes related to fiber development
黃萎病(Verticilliumwilt)是棉花生產(chǎn)上最重要的病害之一,嚴(yán)重影響著品質(zhì)和產(chǎn)量。挖掘棉花抗病相關(guān)的分子標(biāo)記和基因?qū)γ藁裹S萎病遺傳改良具有重要意義。目前,已發(fā)表多篇與棉花抗黃萎病相關(guān)的研究結(jié)果[16-17]。本團(tuán)隊(duì)以300多萬(wàn)個(gè)SNPs位點(diǎn)對(duì)401 份陸地棉核心種質(zhì)黃萎病抗性進(jìn)行關(guān)聯(lián)分析[18],共檢測(cè)到352個(gè)與黃萎病抗性相關(guān)的標(biāo)記位點(diǎn),其中在染色體Dt11上發(fā)現(xiàn)13個(gè)穩(wěn)定存在的核心SNP標(biāo)記位點(diǎn),可用于分子輔助選擇育種。
在棉花抗病相關(guān)基因報(bào)道中,內(nèi)源激素介導(dǎo)的信號(hào)轉(zhuǎn)導(dǎo)[19-20]、R基因[17,21-22]、次級(jí)代謝產(chǎn)物[23]等在抗病反應(yīng)中發(fā)揮著至關(guān)重要的作用。本團(tuán)隊(duì)利用多組學(xué)、關(guān)聯(lián)分析等方法,鑒定到多個(gè)與黃萎病抗性相關(guān)的基因(表3),如涉及抗病信號(hào)傳導(dǎo)的脂肪酶基因GbEDS1[24-25]、蛋白激酶基因GbSTK[26]、親環(huán)素基因GhCYP-3[27]、編碼雜合的富含脯氨酸的細(xì)胞壁蛋白的GbHyPRP1[28]、G蛋白基因GhGPA[29]、編碼植物L(fēng) 型凝集素類受體激酶的GhLecRKs-V.9[18];R基因GbVe[30]、GbRVd[31];參與木質(zhì)素單體的聚合編碼漆酶的基因GhLAC15[32];影響苯丙烷途徑中木質(zhì)素和類黃酮代謝流的基因GhnsLTPs[33];與活性氧相關(guān)的基因GhPAO[34];硬脂酰-ACP-去飽和酶家族成員GhSSI2[35],谷胱甘肽硫轉(zhuǎn)移酶簇GhGST[36],病程相關(guān)基因GhNCS[4]等。
表3 棉花抗黃萎病相關(guān)基因鑒定Table 3 Identification of cotton Verticillium Wilt resistance related genes
傳統(tǒng)育種方法改良作物性狀已獲得了巨大的成就,然而由于受到育種材料遺傳背景狹窄、選擇效率低等多因素約束,近年來(lái)我國(guó)重要作物品種選育工作已進(jìn)入了平緩發(fā)展階段。因此,加快育種技術(shù)創(chuàng)新勢(shì)在必行。分子生物學(xué)催生的生物育種技術(shù)突破了傳統(tǒng)育種的局限,使農(nóng)作物育種更精確、更高效?,F(xiàn)代生物技術(shù)在育種中的應(yīng)用,必將加快育種速度,縮短育種年限,提高育種水平,同時(shí)也為棉花品種改良開(kāi)辟新的道路。但由于我國(guó)的生物技術(shù)研究水平與發(fā)達(dá)國(guó)家相比還有差距,所以,急需加強(qiáng)我國(guó)棉花生物育種的源頭創(chuàng)新,不斷促進(jìn)我國(guó)棉花產(chǎn)業(yè)的發(fā)展和進(jìn)步。