郭紹貴,許 勇(編譯)
(北京市農(nóng)林科學(xué)院蔬菜研究中心 北京 100097)
目的與意義:西瓜是一種重要的葫蘆科作物,占全世界蔬菜生產(chǎn)面積的7%。經(jīng)過長期人工選育,西瓜遺傳多樣性變的十分狹窄,已成為西瓜品種改良的瓶頸。本研究以東亞類型高品質(zhì)西瓜品種‘97103為材料進(jìn)行西瓜全基因組序列分析,并開展20份代表性西瓜資源的基因組重測序分析,以明確西瓜基因組結(jié)構(gòu)和進(jìn)化歷程,闡明果實(shí)品質(zhì)和維管束信號傳導(dǎo)等重要生物學(xué)過程的分子機(jī)制。
材料與方法:利用Illumina GAII測序平臺進(jìn)行‘97103基因組高通量測序?;凇?7103×PI296341-FR F8重組自交系群體構(gòu)建高密度遺傳圖譜進(jìn)行scaffold錨定。利用PILER、RepeatScout、LTR_FINDER、RepeatProteinMask和RepeatMasker進(jìn)行基因組重復(fù)序列注釋。利用Augustus、GlimmerHMM、BLAT、TBLASTN和GLEAN進(jìn)行基因預(yù)測整合?;赟wissProt、TrEMBL、Pfam、PRINTS、PROSITE、ProDom和SMART數(shù)據(jù)庫進(jìn)行基因功能注釋。利用OrthoMCL進(jìn)行基因家族分析,MRBAYES構(gòu)建系統(tǒng)進(jìn)化樹。通過Pfam和SMART數(shù)據(jù)庫比對鑒定基因組抗病基因。利用454測序平臺進(jìn)行果實(shí)發(fā)育轉(zhuǎn)錄組分析。
結(jié)果與分析:(1)‘97103測序組裝獲得了353.5 Mb基因組序列,覆蓋了西瓜全基因組大小的83.2%,共包含1 793個(gè)scaffolds (≥500 bp),scaffold和contig的N50長度分別為2.38 Mb和26.38 kb。共有234個(gè)scaffold錨定到西瓜11條染色體,覆蓋了西瓜基因組大小330 Mb,占基因組組裝序列的93.5%。西瓜基因組共預(yù)測出23 440個(gè)蛋白編碼基因,其中約85%的基因被功能注釋。(2)利用熒光原位雜交技術(shù)分析發(fā)現(xiàn),10份現(xiàn)代栽培西瓜(C. lanatus subsp. vulgaris)和6份半野生西瓜(C. lanatus subsp. mucosospermus)的5S和45S分布與97103基因組上的rDNA分布一致,而野生西瓜(C. lanatus subsp. lanatus)基因組含有1個(gè)45S和2個(gè)5S rDNA簇,其中一個(gè)5S rDNA簇位于染色體11短臂,表明在西瓜進(jìn)化過程中染色體可能發(fā)生了融合、斷裂和倒位事件。這一發(fā)現(xiàn)進(jìn)一步證實(shí)了三個(gè)西瓜亞種的系統(tǒng)進(jìn)化關(guān)系。根據(jù)雙子葉植物古六倍體化事件,我們提出了從7條祖先染色體到現(xiàn)代西瓜11條染色體的進(jìn)化模型。(3)本研究對20份代表性西瓜資源進(jìn)行了基因組重測序分析,共鑒定出678萬個(gè)SNP和96萬個(gè)Indel。遺傳多樣性分析表明,野生西瓜具有更高的遺傳多樣性,說明利用野生西瓜進(jìn)行種質(zhì)改良有很大的潛力。進(jìn)一步通過鄰接樹法和主成分分析方法研究了西瓜種質(zhì)資源的群體結(jié)構(gòu)關(guān)系,結(jié)果顯示,栽培西瓜C. lanatus subsp. vulgaris和半野生西瓜C. lanatus subsp. mucosospermus的關(guān)系更近。(4)群體進(jìn)化分析共鑒定出108個(gè)選擇性清除區(qū)域,覆蓋基因組7.78 Mb,包含741個(gè)基因。我們發(fā)現(xiàn)與西瓜重要性狀生物學(xué)過程有關(guān)的候選基因受到進(jìn)化選擇,如碳水化合物利用調(diào)節(jié)、糖介導(dǎo)的信號傳導(dǎo)、碳水化合物代謝、蔗糖刺激響應(yīng)、氮素代謝調(diào)節(jié)、低氮脅迫細(xì)胞響應(yīng)和生長等。3號染色體3.4~5.6 Mb區(qū)域鑒定出一個(gè)包含12個(gè)S-locus蛋白激酶串聯(lián)排列的基因簇。同時(shí),植物抗逆相關(guān)基因與品質(zhì)性狀相關(guān)基因(如碳水化合物代謝、果實(shí)風(fēng)味和種子含油量等)也富集在該區(qū)域。(5)抗病性改良一直是西瓜育種的主要目標(biāo)。西瓜基因組共鑒定出44個(gè)NBS-LRR基因。分析發(fā)現(xiàn),NBS-LRR基因?yàn)楠?dú)立進(jìn)化,而LOX基因家族經(jīng)歷了一個(gè)快速擴(kuò)張過程。我們進(jìn)一步鑒定了197個(gè)receptor-like基因,具有染色體成簇分布的顯著特征,表明串聯(lián)復(fù)制可以是這些抗病基因的進(jìn)化基礎(chǔ)。(6)我們分別從西瓜和黃瓜維管束鑒定出13 775和14 242個(gè)mRNA,從西瓜和黃瓜韌皮部汁液中分別獲得了1 519和1 012個(gè)轉(zhuǎn)錄本。分析發(fā)現(xiàn)西瓜和黃瓜維管束中獲得的基因基本一致,而韌皮部汁液中的轉(zhuǎn)錄本僅50%~60%為兩者共有。GO term富集分析顯示,這些共有韌皮部轉(zhuǎn)錄本主要參與脅迫或刺激響應(yīng)。(7)西瓜果實(shí)發(fā)育是一個(gè)復(fù)雜的過程。在果實(shí)發(fā)育過程中,3 046和558個(gè)基因分別在果肉和果皮中差異表達(dá)。GO term富集分析顯示,果實(shí)發(fā)育過程中果皮和果肉的多個(gè)生物學(xué)過程相關(guān)功能均發(fā)生了顯著變化,如細(xì)胞壁形成、類黃酮代謝和防衛(wèi)反應(yīng)等。而類胡蘿卜素、已糖和單糖代謝過程僅在果肉發(fā)育過程中發(fā)生顯著變化,在基因表達(dá)水平上反映了西瓜果肉和果皮之間的主要成熟特性差異。193個(gè)轉(zhuǎn)錄因子在果實(shí)發(fā)育過程中顯著差異
表達(dá)。其中bZIP基因Cla014572含有SC-uORF結(jié)構(gòu)域,隨著果實(shí)發(fā)育而下調(diào)表達(dá)。MADS-box轉(zhuǎn)錄因子是果實(shí)膨大和成熟過程的重要調(diào)控基因。基于系統(tǒng)進(jìn)化分析我們在RIN和AGL1分支中分別發(fā)現(xiàn)2個(gè)西瓜MADS-box轉(zhuǎn)錄因子在西瓜果實(shí)發(fā)育過程中差異表達(dá)。其中Cla009725和Cla019630的表達(dá)模式與番茄TAGL1類似,推測它們在西瓜果實(shí)發(fā)育過程中具有類似的生物學(xué)調(diào)控功能。(8)西瓜瓜氨酸代謝途徑分析發(fā)現(xiàn),精氨琥珀酸裂解酶和精氨琥珀酸合成酶家族發(fā)生了基因擴(kuò)張。其中1個(gè)精氨酸琥珀酸裂解酶和2個(gè)精氨琥珀酸合成酶基因隨著西瓜果實(shí)發(fā)育顯著下調(diào)表達(dá),表明成熟果實(shí)中的瓜氨酸積累可能是由于瓜氨酸降解活性的下降而引起。
結(jié)? ? 論:本研究完成的西瓜基因組框架圖譜是分子生物學(xué)研究和遺傳改良的關(guān)鍵數(shù)據(jù)資源。我們發(fā)現(xiàn)從半野生西瓜到現(xiàn)代栽培西瓜的馴化過程中,多個(gè)基因組區(qū)域受到強(qiáng)烈選擇,進(jìn)而形成了現(xiàn)代栽培西瓜含糖量高、早熟等生物學(xué)特征,而大量抗病基因在從野生西瓜到現(xiàn)代栽培西瓜的進(jìn)化和人工馴化過程中丟失。結(jié)合維管束與果實(shí)發(fā)育轉(zhuǎn)錄組測序,明確了瓜類植株信號傳導(dǎo)和調(diào)控、果實(shí)成熟糖代謝與調(diào)控以及瓜氨酸代謝的基因網(wǎng)絡(luò),為最終闡明葫蘆科作物基因組進(jìn)化與重要性狀形成的分子機(jī)制等理論研究奠定了重要基礎(chǔ)。