凌宏清
(中國(guó)科學(xué)院遺傳與發(fā)育生物學(xué)研究所植物細(xì)胞與染色體工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100101)
?
小麥及其近緣種基因組測(cè)序研究進(jìn)展與發(fā)展趨勢(shì)
凌宏清
(中國(guó)科學(xué)院遺傳與發(fā)育生物學(xué)研究所植物細(xì)胞與染色體工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100101)
摘要:近年來(lái),隨著測(cè)序和基因組序列組裝技術(shù)的深入發(fā)展,小麥基因組測(cè)序研究不斷取得了新的進(jìn)展和突破,為小麥育種研究帶來(lái)了新的發(fā)展機(jī)遇。本文簡(jiǎn)要介紹了小麥基因組測(cè)序的背景及其重要性,概要綜述了小麥基因組測(cè)序研究的最新進(jìn)展,展望了小麥基因組測(cè)序研究的發(fā)展動(dòng)態(tài)和趨勢(shì),并討論了基因組學(xué)發(fā)展對(duì)未來(lái)小麥育種的影響。
關(guān)鍵詞:小麥;基因組測(cè)序;進(jìn)展;趨勢(shì)
小麥?zhǔn)鞘澜缟献钪匾募Z食作物之一,年產(chǎn)量超過(guò)6.2億t,提供了全球20%的卡路里消耗,是世界上35%以上人口的口糧[1]。小麥還是世界上栽培范圍最廣的作物,從北緯76度的斯堪的納維亞半島到南緯45度的阿根廷均有分布[2]。我國(guó)是世界上小麥種植面積最大和總產(chǎn)最高的國(guó)家,也是全球最大的小麥消費(fèi)國(guó),常年小麥種植面積在2 400萬(wàn)hm2左右,年產(chǎn)量超過(guò)1億t[3-4]。因此,小麥的持續(xù)增產(chǎn)和穩(wěn)產(chǎn)對(duì)我國(guó)乃至全世界的糧食安全都具有舉足輕重的影響。近十年來(lái)我國(guó)與其他主要小麥生產(chǎn)國(guó)都出現(xiàn)了小麥單產(chǎn)增長(zhǎng)變緩的情況,加之全球氣候變化,小麥生產(chǎn)面臨著嚴(yán)重挑戰(zhàn),迫切要求小麥品種改良與育種工作取得重大突破,以滿足實(shí)際生產(chǎn)的需要。
世界三大糧食作物中,水稻(2002)和玉米(2009)基因組計(jì)劃已相繼完成,并極大地推動(dòng)了這兩大作物的基礎(chǔ)研究和分子育種的深入發(fā)展。由于小麥基因組的特殊性及復(fù)雜性,其基因組測(cè)序研究一直進(jìn)展緩慢,嚴(yán)重制約了小麥功能基因組學(xué)與品種改良研究工作的深入。近年來(lái),隨著高通量測(cè)序技術(shù)以及生物信息學(xué)分析技術(shù)的不斷發(fā)展,小麥基因組測(cè)序研究取得了許多重大突破。本文就小麥基因組測(cè)序背景、最新進(jìn)展及其發(fā)展動(dòng)態(tài)和趨勢(shì)進(jìn)行簡(jiǎn)要綜述。
1普通小麥基因組的特點(diǎn)及測(cè)序的難度
普通小麥?zhǔn)怯扇齻€(gè)相似而又不同的亞基因組(A、B和D)整合在一起形成的一個(gè)擁有42條染色體的異源六倍體物種,其基因組非常龐大,1C值為17.33 ng,約17 Gb,大小為人類(lèi)基因組的5倍,為水稻基因組的40倍[5-7];另外,小麥基因組的結(jié)構(gòu)也異常復(fù)雜,含有大量的重復(fù)序列,約占全基因組序列的85%~90%[8-9]。大量的研究表明[10-12],普通小麥的起源是由三個(gè)二倍體祖先種經(jīng)過(guò)兩次天然異交并自然加倍而形成。首先,大約在50萬(wàn)~300萬(wàn)年前,A基因組供體烏拉爾圖小麥(Triticumurartu, AA,2n=2x=14)與B基因組供體擬斯卑爾脫山羊草 (未完全確定)(Aegilopsspeltoides,SS,2n=2x=14)天然雜交形成了異源四倍體小麥(T.turgidumL, AABB,2n=4x=28) ,然后在大約9000年前,四倍體小麥進(jìn)一步與粗山羊草(A.tauschiiCoss,DD,2n=2x=14)通過(guò)天然雜交,生成了六倍體小麥(T.aestivumL., AABBDD, 2n=6x=42)。因此,小麥具有二倍體(一粒小麥)、四倍體(二粒小麥)、六倍體(普通小麥)等不同類(lèi)型,它們?cè)诨蚪M間既有高度的相似性,同時(shí)又存在一定的區(qū)別。普通小麥多倍體的特性,為染色體工程及非整倍體研究提供了很好的材料。在細(xì)胞遺傳學(xué)時(shí)代,小麥一直是植物細(xì)胞遺傳學(xué)研究的模式材料,并具有一套完整的缺體、缺四體、單體、端體、染色體片段缺失系等非整倍體材料。同時(shí),小麥的起源發(fā)生相對(duì)較近,這也為染色體互作及多倍體起源研究提供了理想的研究系統(tǒng)[13]。但小麥基因組龐大、多倍化及高重復(fù)的特點(diǎn)對(duì)基因組測(cè)序和組裝帶來(lái)了極大的挑戰(zhàn),使得在全基因組水平上完成其基因組的測(cè)序,幾乎是一個(gè)不可完成的任務(wù)[14]。
2小麥基因組測(cè)序的進(jìn)展
鑒于小麥的重要性及其代表性,全世界大量科研工作者對(duì)小麥基因組測(cè)序進(jìn)行了堅(jiān)持不懈的努力,開(kāi)展了大量的研究工作。2005年,美、法等國(guó)科學(xué)家發(fā)起并成立了國(guó)際小麥基因組測(cè)序聯(lián)盟(International Wheat Genome Sequencing Consortium, IWGSC),協(xié)調(diào)、組織全世界20多個(gè)小麥主要生產(chǎn)國(guó)的科學(xué)家協(xié)作開(kāi)展小麥基因組測(cè)序工作。為了克服小麥基因組龐大、多倍化及重復(fù)序列含量高的難題,國(guó)際小麥基因組測(cè)序聯(lián)盟采用了“化整為零”的研究策略,即將整個(gè)小麥基因組分解成單條染色體或染色體臂,分別構(gòu)建每條染色體(臂)的BAC文庫(kù)和物理圖譜,最后用BAC BY BAC測(cè)序策略,解析小麥全基因組序列。各個(gè)染色體(臂)DNA的分離、富集及BAC文庫(kù)構(gòu)建,統(tǒng)一由捷克實(shí)驗(yàn)植物研究所的Jaroslav Dolezel教授實(shí)驗(yàn)室完成,然后將各個(gè)染色體(臂)的BAC文庫(kù)分配給不同的實(shí)驗(yàn)室,進(jìn)行物理圖譜的構(gòu)建和BAC測(cè)序,力爭(zhēng)完成小麥全基因組的測(cè)序(IWGSC, http://www.wheatgenome.org/)。隨著高通量測(cè)序技術(shù)的出現(xiàn)和推廣,在很大程度上加快了小麥基因組測(cè)序的步伐。英國(guó)利物浦大學(xué)聯(lián)合其他幾家單位的科學(xué)家,利用454測(cè)序技術(shù)對(duì)“中國(guó)春”基因組進(jìn)行5倍覆蓋率的全基因組鳥(niǎo)槍法測(cè)序,獲得了小麥的基因組序列信息,開(kāi)創(chuàng)了小麥基因組測(cè)序的新局面[15]。但是,通過(guò)這種方法獲得的序列很短,尤其是對(duì)龐大且復(fù)雜的小麥基因組,利用這種方法將序列拼接成功能單元或完整染色體難度很大[16]。同時(shí),國(guó)內(nèi)外眾多科學(xué)家圍繞小麥起源相關(guān)的供體祖先種也開(kāi)展了大量的基因組測(cè)序研究,并取得眾多富有成效的結(jié)果,大大地促進(jìn)了小麥基因組測(cè)序研究的發(fā)展和深入。現(xiàn)就小麥基因組測(cè)序研究取得的最新進(jìn)展進(jìn)行簡(jiǎn)要概述。
2.1二倍體小麥的基因組測(cè)序
小麥的二倍體祖先種是小麥形成的基礎(chǔ),在小麥多倍化進(jìn)化過(guò)程中起著核心作用。二倍體祖先種基因組的解析,不但為普通小麥基因組分析提供了重要的參考,簡(jiǎn)化了小麥基因組測(cè)序的難度,而且為小麥進(jìn)化與馴化研究提供重要的信息,為未來(lái)更加全面地解析和改良六倍體小麥奠定基礎(chǔ)。目前,在小麥A、D基因組的二倍體供體物種基因組測(cè)序方面取得了很多重要進(jìn)展,完成了小麥A、D基因組的草圖繪制。鑒于小麥A基因組是小麥進(jìn)化過(guò)程中最基本的基因組,Ling等[17]利用全基因組shotgun測(cè)序法,以小麥A基因組祖先種烏拉爾圖小麥G1812系為材料,構(gòu)建了57個(gè)含有8種不同插入片段大小(200~20 000 bp)的測(cè)序文庫(kù),用Hiseq2000測(cè)序平臺(tái)進(jìn)行測(cè)序,總共獲得了450 Gb的有效序列,通過(guò)生物信息學(xué)分析和組裝,獲得了總長(zhǎng)為4.66 Gb的基因組序列草圖,不含N的完整序列為3.92 Gb,其中重復(fù)序列含量為66.88%,拼接的congtig N50長(zhǎng)度達(dá)3.42 kb(其中含基因contig的平均長(zhǎng)度為9.91 kb),Scaffold N50長(zhǎng)度為63.6 kb。預(yù)測(cè)出了34 879個(gè)蛋白編碼基因,其中3 425個(gè)基因?yàn)锳基因組特異基因,還鑒定出了23個(gè)新的miRNA。通過(guò)同源性比對(duì)鑒定出了一批控制小麥籽粒長(zhǎng)度、千粒重、株高、落粒性等重要農(nóng)藝性狀基因,并通過(guò)關(guān)聯(lián)分析證明烏拉爾圖小麥的 TuGASR7基因和普通小麥 TaGASR7基因參與控制小麥粒長(zhǎng)和千粒重。與二穗短柄草的共線性分析顯示,大約21%的小麥基因在基因密度上與對(duì)應(yīng)的短柄草共線性區(qū)段的基因密度相似,但79%的小麥基因在進(jìn)化過(guò)程中被大量插入的反轉(zhuǎn)座子(如Gypsy、Copia)隔開(kāi),使其基因間的平均距離與短柄草基因組相比增加了近20倍,這從分子水平上解釋了小麥基因組龐大的原因。與此同時(shí),Jia等[18]以小麥D基因組供體種粗山羊草AL8/79系為材料,構(gòu)建了不同大小插入片段的測(cè)序文庫(kù),也利用Illumina高通量測(cè)序技術(shù)對(duì)粗山羊草進(jìn)行了全基因組shotgun測(cè)序。通過(guò)序列拼接組裝,獲得了全基因組序列草圖,拼接的congtig N50長(zhǎng)度為4 512 bp,Scafflod N50長(zhǎng)度達(dá)到57.6 kb,總共覆蓋了83.4%基因組區(qū)域,其中65.9%是轉(zhuǎn)座子重復(fù)元件;進(jìn)一步利用490個(gè)F2個(gè)體的基因組簡(jiǎn)化測(cè)序,構(gòu)建了粗山羊草高密度的SNP遺傳圖譜,包含有151 083個(gè)SNP標(biāo)記組成的7個(gè)同源群,圖譜總長(zhǎng)為1 059.8 cM,并將30 303個(gè)Scaffolds錨定到遺傳圖上;通過(guò)預(yù)測(cè)結(jié)合轉(zhuǎn)錄組測(cè)序,鑒定出了43 150 個(gè)功能基因,其中30 697 (71.1%) 個(gè)基因定位到了遺傳圖譜上;研究還發(fā)現(xiàn),粗山羊草的抗病相關(guān)基因(如NBS-LRR基因等)、抗非生物應(yīng)激反應(yīng)的基因數(shù)量都發(fā)生顯著擴(kuò)張,因而大大增強(qiáng)了抗病性、抗逆性與適應(yīng)性。同時(shí)在D基因組中有小麥特有的品質(zhì)相關(guān)基因,而且其中許多基因也發(fā)生了顯著擴(kuò)增,從而使小麥的品質(zhì)性狀大大得到改良。烏拉爾圖小麥和粗山羊草基因組序列草圖的完成,標(biāo)志著我國(guó)小麥基因組測(cè)序研究跨入了世界先進(jìn)行列。另外,美國(guó)加州大學(xué)戴維斯分校的Mingcheng Luo博士和Jan Dvorak教授帶領(lǐng)的團(tuán)隊(duì)[19]采用了另外一種策略開(kāi)展了粗山羊草基因組的測(cè)序研究,以期獲得能夠?qū)嶋H應(yīng)用的基因組精細(xì)圖。他們首先構(gòu)建了多個(gè)粗山羊草的基因組BAC文庫(kù),然后利用SNaPshot方法對(duì)461 706 BAC克隆進(jìn)行了指紋印記分析,將其組裝成BAC重疊群,然后開(kāi)發(fā)了粗山羊草9K Infinium SNP芯片,構(gòu)建了包含7 185個(gè)標(biāo)記的遺傳圖譜,將大約4.03 Gb的BAC重疊群錨定到了D基因組的遺傳圖譜上,最終構(gòu)建完成了粗山羊草基因組的物理圖譜。在此基礎(chǔ)上,開(kāi)展了BAC BY BAC全基因組序列測(cè)定,目前已完成了大部分的工作,相關(guān)成果可能會(huì)在2016年度發(fā)布出來(lái)。
2.2四倍體小麥的基因組測(cè)序
四倍體小麥,又稱二粒小麥,包括野生二粒小麥、硬粒小麥、圓錐小麥等多種類(lèi)型,它們是小麥起源的重要祖先種,也是現(xiàn)代栽培小麥形成的本源,同時(shí)還是重要的農(nóng)業(yè)生產(chǎn)資料和重要的小麥遺傳改良種質(zhì)。其中,硬粒小麥?zhǔn)鞘澜绲诙篼滎?lèi)作物[20]。因此,開(kāi)展二粒小麥的全基因組測(cè)序是十分必要的。但二粒小麥也是多倍體,其基因組超過(guò)10 Gb,測(cè)序難度也很大。2015年,以色列特拉維夫大學(xué)聯(lián)合美國(guó)、加拿大和土耳其等國(guó)的科學(xué)家成立了野生二粒小麥測(cè)序聯(lián)盟(Wild Emmer Wheat sequencing consortium,WEWseq consortium),共同開(kāi)展野生二粒小麥的全基因組測(cè)序工作,他們以野生二粒小麥系Zavitan為材料,采用鳥(niǎo)槍法的策略,利用二代測(cè)序技術(shù)分別進(jìn)行了100×pair-end和80×mate-pair測(cè)序,然后利用NRgene公司開(kāi)發(fā)的新的組裝軟件DeNovoMAGICTM 2.0進(jìn)行從頭拼裝,最后獲得總長(zhǎng)為10.8 Gb的序列草圖,Scaffold的N50達(dá)6.8 Mb,N90達(dá)1 Mb。然后,用140 個(gè)RIL系,利用小麥90K SNP芯片及POPSEQ的策略構(gòu)建了野生二粒小麥超高密度的SNP遺傳圖譜,該圖譜包含14 088 個(gè)基因相關(guān)的SNP標(biāo)記和939 536 個(gè)GBS 標(biāo)記,并且通過(guò)遺傳圖譜將10.3 Gb的序列進(jìn)行定位和排序,同時(shí)還預(yù)測(cè)出了71 000多個(gè)基因[21]。目前,該聯(lián)盟正在進(jìn)行最后的序列優(yōu)化與整合工作,最終的基因組序列將在近期正式發(fā)布。野生二粒小麥基因組測(cè)序工作的完成,將是首次從整體層面完成了小麥屬多倍體物種的全基因組測(cè)序,同時(shí)是完全采用二代測(cè)序技術(shù)進(jìn)行shotgun測(cè)序,通過(guò)新拼裝算法的開(kāi)發(fā)與運(yùn)用,在極短的時(shí)間及有限的經(jīng)費(fèi)投入下,將多倍體復(fù)雜且龐大的基因組組裝到Mb水平,開(kāi)創(chuàng)了復(fù)雜基因組測(cè)序研究的先河,在小麥基因組學(xué)研究領(lǐng)域具有里程碑式的意義。同時(shí),硬粒小麥的全基因組測(cè)序也開(kāi)展了一些工作,英國(guó)生物技術(shù)和生物科學(xué)研究理事會(huì)(Biotechnology and Biological Sciences Research Council)資助下的基因組分析中心(TGAC, The Genome Analysis Centre)對(duì)兩個(gè)硬粒小麥品種Cappelli和Strongfield進(jìn)行了全基因組shotgun測(cè)序,分別組裝獲得了超過(guò)500萬(wàn)條contigs,總大小為3.95 Gb,并公布在了URGI數(shù)據(jù)庫(kù)(https://urgi.versailles.inra.fr/download/iwgsc/TGAC_WGS_assemblies_of_other_wheat_species/),供全球科研人員免費(fèi)下載。
2.3六倍體小麥的基因組測(cè)序
目前,六倍體小麥的基因組測(cè)序也取得了一些重要進(jìn)展。Brenchley等[22]采用全基因組鳥(niǎo)槍法策略,利用454測(cè)序技術(shù),以“中國(guó)春”為材料,進(jìn)行了全基因組shotgun測(cè)序,共獲得了85 Gb的數(shù)據(jù)(220 million reads),覆蓋小麥基因組大約5倍,并對(duì)小麥的3A、3B和3D三個(gè)染色體以及中國(guó)春CS42系的cDNA進(jìn)行了454深度測(cè)序,以及利用SOLiD平臺(tái)對(duì)CS42和小麥的其他三個(gè)祖先種進(jìn)行了重測(cè)序,最終獲得的測(cè)序數(shù)據(jù)達(dá)到210 Gb,拼接獲得的序列總長(zhǎng)為3.1 Gb,N50為884 bp,預(yù)測(cè)出了94 000 ~96 000個(gè)基因,并將大約2/3的基因分配到A、B、D三個(gè)亞基因組上;開(kāi)發(fā)了超過(guò)132 000個(gè)SNP位點(diǎn)。利用這些數(shù)據(jù),研究了小麥在多倍化與進(jìn)化過(guò)程中基因數(shù)量與功能的變化,以及分析了小麥與已測(cè)序物種水稻、玉米、高粱、二穗短柄草等的共線性關(guān)系。雖然該組裝序列較短,沒(méi)有達(dá)到基因組草圖的標(biāo)準(zhǔn),但這些數(shù)據(jù)對(duì)促進(jìn)小麥基因組的深入研究具有重要意義。
同時(shí),在國(guó)際小麥基因組測(cè)序聯(lián)盟的大力推動(dòng)下,小麥單條染色體物理圖譜構(gòu)建及測(cè)序工作進(jìn)展很快。首先,Paux等[23]率先完成了普通小麥基因組中最大染色體3B的物理圖譜,通過(guò)構(gòu)建3B染色體特異的BAC文庫(kù),然后進(jìn)行指紋分析,搭建了1 991個(gè)BAC重疊群(Contigs), 平均長(zhǎng)度為482 kb,最大的3 852 kb,其總長(zhǎng)約為960 Mb。利用新開(kāi)發(fā)的ISBP及SSR標(biāo)記構(gòu)建了3B的高密度遺傳圖。對(duì)物理圖和遺傳圖進(jìn)行了整合,利用1 443個(gè)分子標(biāo)記將1036個(gè)BAC重疊群(約為3B染色體DNA總長(zhǎng)的82%)錨定到了染色體相應(yīng)位置,為小麥3B染色體的測(cè)序及基因克隆提供了重要的基礎(chǔ)。采用3B類(lèi)似方法,先后有1AS、1AL、1BL、4D、7B、6B、5DS和7DS等染色體的物理圖譜被繪制完成[24-31]。在此基礎(chǔ)上,Choulet等[32]利用3B物理圖譜,采用BAC BY BAC的測(cè)序策略,對(duì)8 452個(gè)最短路徑BAC克隆進(jìn)行了測(cè)序,組裝繪制出了3B染色體的DNA序列框架圖。該框架圖包含2 808個(gè)Scaffolds,序列總長(zhǎng)為833 Mb,N50達(dá)到892 kb。通過(guò)與遺傳圖的整合,將其中的1 358個(gè)scaffolds排列成了一個(gè)總長(zhǎng)為774.4 Mb的假染色體核酸鏈分子(Pseudo molecule),約占3B染色體DNA總長(zhǎng)的93%,其中640 Mb (85%)為轉(zhuǎn)座子重復(fù)元件,基因預(yù)測(cè)共鑒定到了5 326個(gè)編碼基因以及1 938個(gè)假基因。這是第一條報(bào)道的真正意義上的小麥3B染色體的DNA參考序列,為小麥其余染色體的DNA測(cè)序提供了概念驗(yàn)證與模板。其次,國(guó)際小麥基因組測(cè)序聯(lián)盟聯(lián)合完成了基于染色體的小麥全基因組序列草圖,通過(guò)對(duì)“中國(guó)春”每個(gè)染色體臂的分離、測(cè)序及組裝,獲得了小麥所有21條染色體的DNA序列信息,初步明確了小麥各個(gè)染色體的基因含量、遺傳組成及結(jié)構(gòu)特征,共預(yù)測(cè)出了133 090個(gè)基因位點(diǎn),其中124 201(93.3%)個(gè)基因可以被精確定位到染色體臂上,編碼蛋白質(zhì)的功能基因?yàn)?06 000個(gè)。同時(shí)還發(fā)現(xiàn)各個(gè)染色體上基因分布差異較大,6B染色體上只有2 125個(gè)基因,是基因數(shù)量最少的染色體,而2D上有4 404個(gè),是基因數(shù)量最多的染色體,而且小麥基因組中的基因復(fù)制現(xiàn)象十分普遍,平均有23.6%的基因發(fā)生了復(fù)制,表明小麥基因組復(fù)雜的起源及進(jìn)化關(guān)系[33]。普通小麥基因組序列草圖的獲得為小麥基因組精細(xì)圖的繪制奠定了堅(jiān)實(shí)的基礎(chǔ),同時(shí)也為小麥基因組學(xué)研究提供了不可或缺的資源。最后,Chapman等[34]利用上述發(fā)布的小麥基因組序列草圖,采用POPSEQ策略,以IMTI遺傳作圖群體Opata×W7984為材料,對(duì)其兩個(gè)親本及90個(gè) DH個(gè)體進(jìn)行短reads的高通量測(cè)序,總共獲得了3 Tb的數(shù)據(jù),分析獲得了1 900萬(wàn)個(gè)可用于遺傳圖譜構(gòu)建的SNP位點(diǎn),并構(gòu)建了該群體超高密度的SNP遺傳圖譜,利用W7984測(cè)序數(shù)據(jù)進(jìn)行de novo拼接,并將組裝后的contigs與遺傳圖進(jìn)行整合,從而錨定了部分contigs在染色體上的順序,最終獲得了W7984的序列草圖,序列總長(zhǎng)達(dá)到了9.1 Gb,其中7.1 Gb可以定位到染色體上,表明利用POPSEQ策略開(kāi)展小麥基因組測(cè)序研究是可行的,并為復(fù)雜基因組的測(cè)序提供了新的借鑒。
3小麥近緣種的基因組測(cè)序
小麥的近緣植物泛指小麥族中除小麥屬以外的其他屬種,包括大麥、黑麥以及二穗短柄草等[35]。國(guó)內(nèi)外研究者圍繞小麥近緣種的基因組測(cè)序也開(kāi)展了大量的工作。二穗短柄草是短柄草屬的一種雜草,由于其基因組小、結(jié)構(gòu)簡(jiǎn)單、生長(zhǎng)周期短、較易遺傳轉(zhuǎn)化,一直被作為小麥、大麥等麥類(lèi)作物的模式材料[36-37]。二穗短柄草二倍體系BD21的全基因組測(cè)序已經(jīng)完成,拼接獲得了包含5條染色體的總長(zhǎng)為272 Mb序列框架圖,含25 532個(gè)編碼基因,基因分析發(fā)現(xiàn)短柄草屬與水稻、小麥等擁有共同的祖先,二穂短柄草與小麥的親緣關(guān)系很近,兩者基因組相似度很高[38]。大麥?zhǔn)鞘澜绲谒拇蠹Z食作物,同時(shí)與小麥的親緣關(guān)系也很近。近年來(lái)大麥基因組測(cè)序也取得了重大進(jìn)展。國(guó)際大麥基因組測(cè)序聯(lián)盟(International Barley Genome Sequencing Consortium)以大麥品種Morex為材料,構(gòu)建了6個(gè)基因組的BAC文庫(kù),共含571 000個(gè)BAC克隆,對(duì)這些BAC克隆進(jìn)行了指紋印記分析,組裝成了9 264個(gè)BAC重疊群,其N(xiāo)50達(dá)到904 kb,覆蓋了4.98 Gb的序列總長(zhǎng),占大麥基因組總長(zhǎng)的95%;用最短路徑法從中挑選出了67 000個(gè)BAC克隆,對(duì)5 341個(gè)包含基因的BAC克隆和937個(gè)隨機(jī)挑選的BAC克隆進(jìn)行shotgun測(cè)序;同時(shí),還測(cè)定了304 523個(gè)BAC克隆的末端序列,并對(duì)Morex進(jìn)行了覆蓋度為50×的全基因組shotgun測(cè)序,整合所有數(shù)據(jù),并結(jié)合遺傳圖譜將3.9 Gb的序列錨定到了相應(yīng)的染色體上。通過(guò)基因預(yù)測(cè),鑒定出了26 159個(gè)高可信度的基因,初步獲得了大麥基因組的序列草圖[39]。另外,我國(guó)西藏農(nóng)牧學(xué)院聯(lián)合華大基因等單位,采用全基因組shotgun測(cè)序策略,對(duì)我國(guó)西藏特有大麥類(lèi)型青稞進(jìn)行基因組測(cè)序,拼接得到了3.89 Gb的序列總長(zhǎng),約占青稞基因組的87%,并預(yù)測(cè)到了39 197個(gè)蛋白編碼基因,將青稞基因組和其他的禾本科作物基因組進(jìn)行了比對(duì),發(fā)現(xiàn)調(diào)節(jié)轉(zhuǎn)錄的基因家族、激活轉(zhuǎn)錄因子的基因家族及防御反應(yīng)相關(guān)基因家族在青稞基因組中發(fā)生了顯著的擴(kuò)張,為揭示青稞高原適應(yīng)性和壓力調(diào)節(jié)機(jī)制提供了重要的信息[40]。
4小麥基因組測(cè)序的未來(lái)發(fā)展趨勢(shì)
4.1全基因組精細(xì)圖的繪制
當(dāng)前,雖然小麥及其近緣種基因組測(cè)序研究取得了很多重要的突破,但是主要進(jìn)展都集中于基因組序列草圖的繪制,除了小麥3B染色體和二穗短柄草獲得了精細(xì)圖外,其他目前測(cè)序的小麥及其近緣種基因組序列都是拼裝錨定后的Scaffolds,存在不少的缺口(Gaps),并缺乏在染色體上的精確位置及上下游關(guān)系,部分序列可能還存在一些組裝錯(cuò)誤,在實(shí)際的基因定位、圖位克隆等應(yīng)用中還存在一些問(wèn)題。因此,未來(lái)幾年,繪制能夠直接應(yīng)用于基因克隆等研究的小麥及其近緣種全基因組精細(xì)圖譜是小麥基因組學(xué)研究的重中之重。目前,國(guó)際小麥測(cè)序聯(lián)盟正在攻關(guān)普通小麥的其余20條染色體DNA參考序列的構(gòu)建,并已開(kāi)始著手小麥全基因組學(xué)精細(xì)圖的繪制;中國(guó)科學(xué)院遺傳與發(fā)育生物學(xué)研究所正在構(gòu)建烏拉爾圖小麥基因組的精細(xì)圖;美國(guó)加州大學(xué)戴維斯分校正在進(jìn)行粗山羊草基因組精細(xì)圖的構(gòu)建;隨著野生二粒小麥基因組草圖的完成,硬粒小麥的基因組精細(xì)圖有待完成;最后,國(guó)際大麥基因組測(cè)序聯(lián)盟也正在協(xié)作完成大麥全基因組精細(xì)圖。
4.2小麥功能基因組研究的深入發(fā)展
小麥基因組測(cè)序的完成,尤其是精細(xì)圖的獲得,將為小麥功能基因組學(xué)研究提供重要的平臺(tái)和有力的工具[41]。有了基因組序列,可直接定位并拿到候選基因而不用借鑒其他模式植物的序列;利用序列可以開(kāi)發(fā)大量的分子標(biāo)記,建立飽和遺傳圖譜。這些將有助于重要農(nóng)藝性狀的遺傳精細(xì)定位和分子標(biāo)記輔助選擇。在序列的指導(dǎo)下也可以系統(tǒng)高效地分離、克隆相關(guān)基因,研究其生物學(xué)功能。隨著小麥基因組序列的不斷完善,小麥基因組學(xué)研究將從目前的結(jié)構(gòu)基因組學(xué)進(jìn)入到功能基因組學(xué)的研究階段,基因克隆、基因功能發(fā)現(xiàn)、表達(dá)分析及代謝調(diào)控途徑解析等方面的研究將會(huì)取得長(zhǎng)足進(jìn)展。
4.3其他小麥近緣種基因組測(cè)序的興起
小麥近緣種是小麥遺傳改良的重要種質(zhì)資源,對(duì)擴(kuò)大小麥的遺傳基礎(chǔ),克服基因資源同質(zhì)化具有重要價(jià)值。隨著烏拉爾圖小麥、粗山羊草、大麥等小麥親緣和近緣種全基因組測(cè)序的完成,其他小麥近緣種基因組的測(cè)序也將逐漸興起,尤其是具有優(yōu)質(zhì)、抗病、耐逆、高光效等特殊優(yōu)良性狀的物種,如偃麥草、華山新麥草等,將是重要的目標(biāo)。小麥近緣種的基因組測(cè)序,不但為小麥遺傳改良提供重要的基因資源,同時(shí)也將為揭示小麥族復(fù)雜的起源和進(jìn)化歷史提供重要的信息。
4.4新測(cè)序技術(shù)的不斷涌現(xiàn)及廣泛應(yīng)用
測(cè)序技術(shù)是基因組學(xué)研究的前提。近年來(lái),小麥基因組測(cè)序所取得的突破主要就是高通量測(cè)序技術(shù)的應(yīng)用,大大地提高了測(cè)序通量,降低了測(cè)序成本。當(dāng)前,新測(cè)序技術(shù)不斷涌現(xiàn)并逐漸應(yīng)用到了小麥基因組學(xué)研究,包括PacBio的單分子測(cè)序技術(shù)(第三代測(cè)序技術(shù))[42]、BioNano光學(xué)圖譜技術(shù)[31]等。未來(lái)幾年,新測(cè)序技術(shù)的不斷涌現(xiàn),將會(huì)大大促進(jìn)小麥基因組學(xué)研究的不斷深入。
4.5生物信息學(xué)的突破
基因組測(cè)序會(huì)帶來(lái)海量的數(shù)據(jù),加之小麥基因組的龐大及復(fù)雜性,測(cè)序數(shù)據(jù)的分析、存儲(chǔ)、傳遞與使用對(duì)計(jì)算資源要求特別高。數(shù)據(jù)分析與挖掘方法的突破,開(kāi)發(fā)能夠處理像小麥這樣復(fù)雜基因組信息分析的新分析工具及算法將是生物信息學(xué)的挑戰(zhàn),該方面突破將成為小麥基因組學(xué)研究的巨大推動(dòng)力,比如以色列NRgene公司開(kāi)發(fā)的DeNovoMAGICTM 2.0的應(yīng)用,大大加快了野生二粒小麥基因組測(cè)序的進(jìn)度。
5基因組測(cè)序?qū)π←溣N的影響
作為世界最重要的糧食作物之一,小麥的基因組學(xué)和測(cè)序研究具有重要的理論價(jià)值和現(xiàn)實(shí)意義,它為促進(jìn)小麥的持續(xù)穩(wěn)產(chǎn)和增產(chǎn),為進(jìn)一步解決世界糧食問(wèn)題提供了新的突破口和契機(jī)。小麥基因組測(cè)序的完成,就標(biāo)志著小麥基因組學(xué)研究由結(jié)構(gòu)基因組學(xué)進(jìn)入到功能基因組學(xué)時(shí)代,利用基因組的參考序列,可以開(kāi)發(fā)大量分子標(biāo)記,構(gòu)建高密度的飽和遺傳圖譜,將加速重要農(nóng)藝性狀基因的遺傳定位和高效系統(tǒng)地克隆小麥的重要功能基因,解析小麥高產(chǎn)、抗逆、優(yōu)質(zhì)等重要性狀的分子機(jī)制。基因組測(cè)序、重測(cè)序與高密度遺傳圖譜也可以揭示小麥種質(zhì)資源的全基因組重組狀況,為親本選配與群體設(shè)計(jì)奠定了理論基礎(chǔ);功能性分子標(biāo)記的鑒定與開(kāi)發(fā),可直接用分子標(biāo)記,進(jìn)行基因型選擇,提高選擇的準(zhǔn)確性和效率。根據(jù)育種的需要, 有目的的對(duì)親本進(jìn)行選擇, 對(duì)目標(biāo)優(yōu)良基因進(jìn)行聚合;同時(shí),小麥及其近緣種基因組測(cè)序的完成還將促進(jìn)種質(zhì)資源的發(fā)掘與利用,豐富遺傳基礎(chǔ)和變異??傊←溁蚪M測(cè)序不僅將為全球從事小麥和其他麥類(lèi)植物研究的科學(xué)家提供急需的序列數(shù)據(jù),也為功能基因組學(xué)和蛋白質(zhì)組學(xué)的研究奠定堅(jiān)實(shí)基礎(chǔ),而且能全面闡明小麥的生長(zhǎng)、發(fā)育、抗病、抗逆和高產(chǎn)的分子機(jī)制及相關(guān)規(guī)律,將極大地推動(dòng)小麥遺傳育種研究,在小麥分子設(shè)計(jì)和聚合育種方面產(chǎn)生重大影響,將會(huì)帶來(lái)小麥育種的新變革。
致謝:感謝西北農(nóng)林科技大學(xué)農(nóng)學(xué)院聶小軍先生在資料收集和整理方面所做的工作!
參考文獻(xiàn):
[1]世界糧農(nóng)組織.世界糧農(nóng)組織2015年統(tǒng)計(jì)年報(bào) [R/OL].(2014-10-23)[2016-02-15].http://www.fao.org/documents/card/en/c/383d384a-28e6-47b3-a1a2-2496a9e017b2/.
Food and Agriculture Organization of the United Nations.FAO statistical pocketbook in 2015[R/OL].(2014-10-23 )[ 2016-02-15].http://www.fao.org/documents/card/en/c/383d384a-28e6-47b3-a1a2-2496a9e017b2/.
[2]Feldman M.Origin of cultivated wheat.In:Bonjean A P,Angus W J,eds.The world wheat book:a history of wheat breeding [M].Paris,France:Lavoisier Publishing,2001:3-56.
[3]中國(guó)小麥網(wǎng).2014年中國(guó)小麥?zhǔn)袌?chǎng)分析 [R/OL].(2015-02-26)[2015-02-28].http://www.xiaomai.cn/html/news/20150226/363917.html.
http://www.xiaomai.cn.Analysis of the China's wheat market in 2014 [R/OL].(2015-02-26)[2015-02-28].http://www.xiaomai.cn/html/news/20150226/363917.html.
[4]谷秀娟,王彥行.中國(guó)小麥產(chǎn)業(yè)國(guó)際競(jìng)爭(zhēng)力分析 [J].產(chǎn)業(yè)與科技論壇,2015,14(23):11-12.
Gu X J,Wang Y X.International competitiveness analysis of wheat industry in China[J].Industrial&ScienceTribune,2015,14(23):11-12.
[5]Fossati D,Ingold M.Mountain wheat pool.In:Bonjean A P,Angus W J,eds.The world wheat book:a history of wheat breeding [M].Paris,France:Lavoisier Publishing,2001:311-332.
[6]Bennett M D,Smith J B.Nuclear DNA amounts in angiosperms [J].PhilosophicalTransactionsoftheRoyalSocietyofLondonSeriesB-BiologicalSciences,1976,274:227-274.
[7]張正斌,徐 萍.小麥基因組研究進(jìn)展 [J].遺傳,2002,24(3):389-394.
Zhang Z B,Xu P.Reviewed on wheat genome [J].Hereditas,2002,24(3):389-394.
[8]于海霞,田紀(jì)春.普通小麥 B 基因組的研究進(jìn)展 [J].分子植物育種,2008,6(4):724-732.
Yu H X,Tian J C.Review of genome B inT.aestivumL.[J].MolecularPlantBreeding,2008,6(4):724-732.
[9]Lu Y Z,Wang L,Yue H,etal.Comparative analysis of Stowaway-like miniature inverted repeat transposable elements in wheat group 7 chromosomes:abundance,composition,and evolution [J].JournalofSystematicsandEvolution,2014,52(6):743-749.
[10]Feldman M,Levy A A.Allopolyploidy:A shaping force in the evolution of wheat genomes [J].CytogeneticandGenomeResearch,2005,109:250-258.
[11]Shewry P R.Wheat [J].JournalofExperimentalBotany,2009,60(6):1537-1553.
[12]Marcussen T,Sandve S R,Heier L,etal.Ancient hybridizations among the ancestral genomes of bread wheat [J].Science,2014,345:6194.
[13]Li A,Liu D,Wu J,etal.mRNA and small RNA transcriptomes reveal insights into dynamic homoeolog regulation of allopolyploid heterosis in nascent hexaploid wheat [J].PlantCell,2014,26(5):1878-1900.
[14]Gill B S,Appels R,Botha-Oberholster A M,etal.A workshop report on wheat genome sequencing:International Genome Research on Wheat Consortium[J].Genetics,2004,168(2):1087-1096.
[15]Brenchley R,Spannagl M,Pfeifer M,etal.Analysis of the bread wheat genome using whole-genome shotgun sequencing [J].Nature,2012,491(7426):705-710.
[16]Langridge P.Genomics:Decoding our daily bread[J].Nature,2014,491:678-680.
[17]Ling H Q,Zhao S,Liu D,etal.Draft genome of the wheat A-genome progenitorTriticumurartu[J].Nature,2013,496(7443):87-90.
[18]Jia J,Zhao S,Kong X,etal.Aegilopstauschiidraft genome sequence reveals a gene repertoire for wheat adaptation [J].Nature,2013,496(7443):91-95.
[19]Luo M C,Gu Y Q,You F M,etal.A 4-gigabase physical map unlocks the structure and evolution of the complex genome ofAegilopstauschii,the wheat D-genome progenitor[J].ProceedingsoftheNationalAcademyofSciences,2013,110(19):7940-7945.
[20]Canè M A,Maccaferri M,Nazemi G,etal.Association mapping for root architectural traits in durum wheat seedlings as related to agronomic performance [J].MolecularBreeding,2014,34:1629-1645.
[21]Twardziok S O,Spannagl M,Ronen G,etal.Annotation of theTriticumdicoccoidesgenome provides insights into genome organization and cereal evolution [C].SanDiego,USA:PlantandAnimalGenomicsConferenceⅩⅩⅣ,2016:0880.
[22]Brenchley R,Spannagl M,Pfeifer M,etal.Analysis of the bread wheat genome using whole-genome shotgun sequencing [J].Nature,2012,491(7426):705-710.
[23]Paux E,Sourdille P,Salse J,etal.A physical map of the 1-gigabase bread wheat chromosome 3B [J].Science,2008,322:101-104.
[24]Breen J,Wicker T,Shatalina M,etal.A physical map of the short arm of wheat chromosome 1A [J].PLoSOne,2013,8(11):e80272.
[25]Lucas S J,Akpnar B A,Kantar M,etal.Physical mapping integrated with syntenic analysis to characterize the gene space of the long arm of wheat chromosome 1A [J].PLoSOne,2013,8(4):e59542.
[26]Philippe R,Paux E,Bertin I,etal.A high density physical map of chromosome 1BL supports evolutionary studies,map-based cloning and sequencing in wheat [J].GenomeBiology,2013,14(6):R64.
[27]Belova T,Gronvold L,Kumar A,etal.Utilization of deletion bins to anchor and order sequences along the wheat 7B chromosome [J].TheoreticalandAppliedGenetics,2014,127(9):2029-2040.
[28]Helguera M,Rivarola M,Clavijo B,etal.New insights into the wheat chromosome 4D structure and virtual gene order,revealed by survey pyrosequencing [J].PlantScience,2015,233:200-212.
[29]Kobayashi F,Wu J,Kanamori H,etal.A high-resolution physical map integrating an anchored chromosome with the BAC physical maps of wheat chromosome 6B [J].BMCGenomics,2015,16:595.
[30]Akpinar B A,Magni F,Yuce M,etal.The physical map of wheat chromosome 5DS revealed gene duplications and small rearrangements [J].BMCGenomics,2015,16:453.
[31]Staňková H,Hastie A R,Chan S,etal.BioNano genome mapping of individual chromosomes supports physical mapping and sequence assembly in complex plant genomes [J].PlantBiotechnologyJournal,2016.doi:10.1111/pbi.12513.
[32]Choulet F,Alberti A,Theil S,etal.Structural and functional partitioning of bread wheat chromosome 3B[J].Science,2014,345(6194):1249721.
[33]International Wheat Genome Sequencing Consortium (IWGSC).A chromosome-based draft sequence of the hexaploid bread wheat (Triticumaestivum) genome [J].Science,2014,345(6194):1251788.
[34]Chapman J,Mascher M,Bulu A,etal.A whole-genome shotgun approach for assembling and anchoring the hexaploid bread wheat genome [J].GenomeBiology,2015,16:26.
[35]劉玉萍,蘇 旭,陳克龍,等.小麥族植物的分類(lèi)現(xiàn)狀及主要存在的問(wèn)題 [J].生物學(xué)雜志,2013,30(2):77-83.
Liu Y P,Su X,Chen K L,etal.Current taxonomic status and major existing problems in Triticeae (Poaceae) [J].JournalofBiology,2013,30(2):77-83.
[36]Draper J,Mur L A,Jenkins G,etal.A new model system for functional genomics in grasses [J].PlantPhysiology,2001,127:1539-1555.
[37]陳軍營(yíng),李香妞,趙一丹,等.新型禾本科模式植物-二穗短柄草 [J].植物生理學(xué)通訊,2008,44(4):781-784.
Chen J Y,Li X N,Zhao Y D,etal.A new model plant in Gramineae-BrachypodiumdistachyonL.[J].PlantPhysiologyJournal,2008,44(4):781-784.
[38]Vogel J P,Garvin D F,Mockler T C,etal.Genome sequencing and analysis of the model grassBrachypodiumdistachyon[J].Nature,2010,463:763-768.
[39]Mayer K F,Waugh R,Brown J W,etal.A physical,genetic and functional sequence assembly of the barley genome [J].Nature,2012,491(7426):711-716.
[40]Zeng X,Long H,Wang Z,etal.The draft genome of Tibetan hulless barley reveals adaptive patterns to the high stressful Tibetan Plateau [J].ProceedingsoftheNationalAcademyScience,2015,112(4):1095-100.
[41]Eversole K,Feuillet C,Mayer K,etal.Slicing the wheat genome [J].Science,2014,345(6):285-287.
[42]Dong L,Liu H,Zhang J,etal.Single-molecule real-time transcript sequencing facilitates common wheat genome annotation and grain transcriptome research [J].BMCGenomics,2015,16:1039.
Progress and Perspectives of the Genome Sequencing in Wheat and Its Relatives
LING Hongqing
(State Key Laboratory of Plant Cell and Chromosome Engineering, Institute of Genetics and Developmental Biology,Chinese Academy of Science,Beijing 100101,China)
Abstract:During last several years, a big progress and breakthrough have been made in the genome sequencing of wheat and its relatives along with the development of genome sequencing and assembling technologies. It will give rise to a new developmental opportunity for the research in wheat breeding. In this paper, we give a brief introduction about the background and importance of wheat genome sequencing, and review the progress obtained recently in the genome sequencing of wheat and its relatives. Finally, we prospect its future development and discuss the possible effects of the genome sequencing on wheat breeding.
Key words:Wheat; Genome sequencing; Progress; Perspectives
中圖分類(lèi)號(hào):S512.1;S330
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-1041(2016)04-0397-07
基金項(xiàng)目:植物細(xì)胞與染色體工程國(guó)家重點(diǎn)實(shí)驗(yàn)室自主課題
收稿日期:2016-03-05修回日期:2016-03-15
網(wǎng)絡(luò)出版時(shí)間:2016-04-01
網(wǎng)絡(luò)出版地址:http://www.cnki.net/kcms/detail/61.1359.S.20160401.1529.002.html
第一作者E-mail:hqling@genetics.ac.cn