侯曉婉 胡偉 徐碧玉 金志強 張魯斌 鹿志偉
摘 要 香蕉作為熱帶和亞熱帶發(fā)展中國家最重要的糧食和經(jīng)濟作物,其產(chǎn)量和質(zhì)量受到低溫、干旱、高鹽等非生物逆境脅迫的嚴重影響?;谙憬禔基因組測序數(shù)據(jù),利用生物信息學技術和方法,對巴西蕉中調(diào)控植物非生物逆境脅迫應答方面發(fā)揮重要作用的AP2/ERF超家族基因全基因組進行系統(tǒng)分析。結(jié)果表明:共獲得119個巴西蕉AP2/ERF超家族基因,并將其劃分成ERF(100)、RAV(15)和soloist(4)家族,其中ERF家族又被劃分為10個亞家族,每個亞家族基因具有相似的保守motif和基因結(jié)構。此研究結(jié)果不僅為巴西蕉應答非生物逆境脅迫下AP2/ERF超家族基因功能和響應機制的研究、香蕉品種抗逆改良奠定理論基礎,而且也為不同物種的AP2/ERF超家族基因的系統(tǒng)發(fā)育和進化研究提供方法和理論依據(jù)。
關鍵詞 香蕉;AP2/ERF;全基因組分析
中圖分類號 S668.1 文獻標識碼 A
Abstract Banana(Musaceae, Musa)is one of the most important foods and commercial crops in tropical and subtropical developing countries. The abiotic stresses, such as freezing, drought and salt, influence heavily the yield and quality of banana. A genome-wide analysis and expression profiles analysis on AP2/ERF super gene family of banana, which play an important role in responding to abiotic stresses, were conducted based on banana A genome sequencing. The main results showed that 119 AP2/ERF genes from banana A genome were divided into three families of ERF(100), RAV(15)and soloist(4). ERF family were classified again into ten subfamilies which were named fromⅠto Ⅹ. The same subfamily had same intro-exon structure and conserved motif domain. Taken together, the methods and theories in this paper could be used to study the development and evolution of gene coming AP2/ERF super family in other species. This study could identify some abiotic stress-responsive candidate MaERF genes, which would lay a solid foundation for genetic improvement of banana cultivars in the future.
Key words banana(Musaceae, Musa); AP2/ERF; genome-wide analysis
doi 10.3969/j.issn.1000-2561.2017.02.019
1961年Simmonds等[1]將含尖葉蕉性狀的基因稱為A基因,將含有長梗蕉性狀的基因稱為B基因,按其基因型,并參照染色體數(shù)將由原始的野生尖葉蕉(Musa acuminate Colla)和長梗蕉(Musa balibisiana)種內(nèi)或者種間雜交之后逐漸進化而成的香蕉品種分為AA、AAA、AAAA、AAB、AAAB、AABB、AB、ABBBB、BBB等組,而主要香蕉栽培品種巴西蕉、大蕉和粉蕉均為三倍體,其基因型分別為AAA、ABB和AAB[1-3],特別是巴西蕉,因其具有較高的商業(yè)價值,很受收購商和蕉農(nóng)的歡迎,普遍被大面積種植。然而香蕉是多年生常綠大型草本單子葉植物,對低溫、干旱、高鹽等非生物逆境脅迫異常敏感,非生物逆境脅迫的發(fā)生嚴重影響其產(chǎn)量和質(zhì)量。
AP2/ERF(APETELLA2/Ethylene Responsive Element Binding Factor)超家族是植物最大的轉(zhuǎn)錄因子之一,其至少包含1個AP2/ERF結(jié)構域?;贏P2/ERF結(jié)構域的數(shù)目和是否出現(xiàn)其他DNA結(jié)合區(qū)域,將其劃分為AP2、ERF、RAV和soloist家族。其中AP2家族基因包含2個重復的AP2/ERF結(jié)構域;ERF家族基因僅包含1個AP2/ERF結(jié)構域;RAV家族基因包含1個AP2/ERF結(jié)構域和1個B3 DNA結(jié)合區(qū)域[4-5]。AP2/ERF超家族在植株花器官的發(fā)育、細胞增生、次生代謝、激素信號響應及生物和非生物脅迫應答中發(fā)揮重要的作用。Wan等[6]研究報導花生AhERF019在轉(zhuǎn)基因擬南芥中過表達的增強了植株對干旱、高溫和高鹽的耐受性。荷花LcERF054和麻瘋樹JcERF1的表達被高鹽誘導,增強了轉(zhuǎn)基因植株對高鹽的耐受性[7-8]。芝麻的AP2si16和水稻的OsERF71改善了芝麻和水稻對干旱的耐受性[9-10]。ERF家族基因在植株響應外界生物和非生物脅迫方面分別發(fā)揮著不同的功能。前人對擬南芥中ERF各家族基因的功能進行研究,結(jié)果發(fā)現(xiàn)ERF家族的GroupIII亞家族基因在植株響應低溫、高鹽和干旱脅迫方面發(fā)揮重要作用;GroupVII和GroupIX亞家族基因在植株對病害的耐受性方面發(fā)揮重要作用[4,11]。
對植物基因家族的全基因組進行分析,識別出的分類組和假定功能motif將對研究每個家族內(nèi)基因的生物功能有很大作用。自2006~2014年,已先后對擬南芥(Arabidopsis thaliana)、水稻(Oryza sativa L.)、大豆(Giycinemax L.)、玉米(Zea mays L.)、楊樹(Populus trichocarpa)、 高粱(Sorghum bicolor L.)、葡萄(Vitis vinifera L.)、蘋果(Malus domestica)、中國大白菜(Brassica rapa ssp. pekinensis)、荷花(Lotus corniculatus)、黃瓜(Cucumbers)、馬鈴薯(Potato)、苜蓿(Medicago truncatula)等許多物種的AP2/ERF超家族進行了全基因組分析[4-5,7,12-15]。近年來,香蕉基因組的研究也越來越深入,2012年就完成了A基因組的測序工作[16],2016年Lakhwani等[17]從香蕉A基因組數(shù)據(jù)庫中篩選了小果野芭蕉(M. acuminata)和野蕉(M. balbisiana)的AP2/ERF超家族基因,從基因進化角度對其進行了整體分析,但是基因型為AAA的巴西蕉AP2/ERF超家族基因的家族分類和結(jié)構分析還未見報道。
本研究根據(jù)香蕉A基因組數(shù)據(jù)庫中,基因型為AAA巴西蕉完整、非冗余的AP2/ERF超家族基因全基因組數(shù)據(jù),對其進行了系統(tǒng)的分析,將為巴西蕉應答非生物逆境脅迫下AP2/ERF超家族功能基因的挖掘和鑒定,及后期巴西蕉脅迫響應機制和抗逆品種改良的研究奠定理論基礎,也將為不同物種AP2/ERF超家族基因的系統(tǒng)發(fā)育和進化研究提供方法和理論依據(jù)。
1 材料與方法
1.1 巴西蕉AP2/ERF超家族基因的識別和系統(tǒng)發(fā)育樹的構建
從香蕉A基因組數(shù)據(jù)庫(http://banana-genome.cirad.fr/)中篩選基因型為AAA的巴西蕉AP2/ERF超家族DNA和蛋白序列[16]。另外,以已知的AP2/ERF超家族基因結(jié)構特征為基礎,運用CDD和PFAM數(shù)據(jù)庫[18-19],通過保守結(jié)構域的識別進一步對AP2/ERF超家族基因進行家族劃分,將包含2個重復AP2/ERF結(jié)構域的基因劃分為AP2家族,將僅包含1個AP2/ERF結(jié)構域的基因劃分為ERF家族,而將包含1個AP2/ERF結(jié)構域和1個B3 DNA結(jié)合區(qū)域的基因劃分為RAV家族。此外,AP2/ERF結(jié)構域發(fā)生高度分化但與其他物種中ERF基因有較高相似性的基因被歸為soloist家族[4-5,15,17]。從Rice Genome Annotation Project[20]中獲得水稻ERF家族氨基酸序列。用BLAST分析所有水稻的ERF蛋白,深入識別香蕉數(shù)據(jù)庫中的ERF家族蛋白?;诎臀鹘逗退局凶R別的ERF進行多序列比對,運用Clustal X 2.0和MEGA 5.0構建系統(tǒng)發(fā)育樹。
1.2 巴西蕉AP2/ERF超家族基因結(jié)構和motif分析
在香蕉A基因組數(shù)據(jù)庫中下載基因型為AAA的巴西蕉AP2/ERF超家族基因的全基因組和CDS序列。用GSDS2.0軟件對香蕉AP2/ERF超家族全部基因結(jié)構進行分析[21];用MEME軟件對香蕉AP2/ERF超家族全部基因的氨基酸motif組件進行分析[22],并基于InterProScan數(shù)據(jù)對識別的motif做進一步的詮釋[23]。
2 結(jié)果與分析
2.1 巴西蕉ERF家族基因的識別和進化分析
從香蕉A基因組數(shù)據(jù)庫中共篩選出基因型為AAA巴西蕉的非冗余、完整的AP2/ERF基因119個,依據(jù)擬南芥中MYB、WRKY、bZIP和bHLH轉(zhuǎn)錄因子的命名方法[24-26],從MaERF1~MaERF119對其命名。ExPASY分析結(jié)果表明,119個假定的AP2/ERF超家族基因編碼的蛋白全長為127~1 029 aa,相關分子量為13.837 3~114.825 9 ku,等電點從4.66到11.19(表1)。
對119個基因進行保守區(qū)域檢測和多重序列分析,結(jié)合AP2/ERF超家族分類標準,分別將100個基因歸為ERF家族,15個基因歸類為RAV家族;4個AP2/ERF結(jié)構域發(fā)生高度分化,但與其他物種中ERF基因有較高相似性的基因歸為soloist家族;因沒有包含2個重復AP2/ERF結(jié)構域的基因,所以AAA基因型巴西蕉中未劃分出AP2家族。
用香蕉和水稻ERF家族基因編碼的AP2/ERF結(jié)構域的氨基酸序列進行了多序列比對,并構建無根系統(tǒng)發(fā)育樹(圖1)。結(jié)果表明,基于序列比對的相似性,香蕉100個ERF家族基因又被劃分成10亞組,即GroupⅠ~GroupⅩ。GroupⅠ亞家族包含MaERF50,-51,-52;GroupⅡ包含MaERF1,-7~-17,-22;GroupⅢ包含MaERF18~-21,-23~-27,-32~-39;Group Ⅳ包含MaERF40,-41,-42;Group Ⅴ包含7個基因,分別為MaERF2~-6,-28,-29;MaERF53~-59,-99,-112,-118和-119屬于GroupⅥ;GroupⅦ亞家族中有MaERF60和MaERF63~-73;GroupⅧ包含MaERF基因-30,-31,
43~-49,-74~-82;MaERF84,-85和MaERF87~-97屬于亞家族GroupⅨ;GroupⅩ亞家族有3個基因-MaERF103、MaERF104和MaERF105。根據(jù)水稻GroupⅤ和GroupⅩ的劃分,又將香蕉GroupⅤ中的MaERF4-6劃分為Ⅴb,剩余的GroupⅤ亞家族基因劃分為Ⅴa;香蕉GroupⅩ中的MaERF105被劃分為Ⅹa,而Ⅹb有基因MaERF103和MaERF104。
2.2 巴西蕉AP2/ERF家族基因結(jié)構分析
基于巴西蕉119個AP2/ERF超家族基因AP2/ERF保守結(jié)構域氨基酸序列同源比對,依據(jù)其相似性建立了一個無根的系統(tǒng)進化樹,然后對基因內(nèi)含子和外顯子結(jié)構進行比較分析(圖2)。結(jié)果顯示,所有的巴西蕉AP2/ERF超家族基因也被劃分為3個大的家族:ERF、RAV和Soloist,其中ERF家族又被劃分成10個亞組,分別命名為Ⅰ~Ⅹ,并且每個亞家族中各基因具有相似的內(nèi)含子-外顯子結(jié)構,如GroupⅠ、GroupⅡ、GroupⅣ和GroupⅨ均只包含1個外顯子;RAV和Soloist家族中的基因大多含有2個外顯子。每個亞組中相似的外顯子數(shù)目說明了他們之間較近的進化關系和相似的功能。這一結(jié)果和圖1的進化結(jié)果一致,進一步證實了AP2/ERF超家族分類的準確性。系統(tǒng)發(fā)育樹和基因結(jié)構分析說明它們之間有較近的進化關系,清晰的展示了巴西蕉ERF家族基因每個分支早期的進化關系。
2.3 巴西蕉AP2/ERF家族基因保守motif分析
通過MEME軟件分析,從119個香蕉AP2/ERF超家族基因中搜索出15個保守motif,并運用InterPro 資料對其進一步詮釋(圖3,表2)。15個motif中含有2個功能區(qū)域,分別為AP2/ERF 結(jié)構域和DNA-binding結(jié)構域,其中AP2/ERF 結(jié)構域在motif 1和motif 2中,而DNA-binding結(jié)構域在motif 1、4、5和6中。含有AP2/ERF結(jié)構域的motif 1和motif 2除了在Soloist家族的MaERF106、MaERF107、MaERF108和MaERF109基因中未被詮釋外,剩余的所有AP2/ERF超家族基因中均詮釋有AP2/ERF結(jié)構域;在RAV家族基因中還詮釋出了DNA-binding結(jié)構域。
另外,每個ERF亞組中基本含有相同的保守motif組件。如GroupⅠ均含有motif 1、2和10;GroupⅣ中基因均含有motif 1、2、3、10和14。保守Motif的分析更進一步的證明了香蕉ERF家族進化和分類關系的準確性,并且每個亞組含有相同motif預示著同一亞組基因有著相似的功能。
3 討論
近年來,擬南芥、水稻、大豆、葡萄等物種AP2/ERF家族基因的全基因組分析已被完成,并且該領域的研究也越來越被重視,僅2014年就報導了玉米、馬鈴薯和黃瓜3種植物AP2/ERF的全基因組分析的結(jié)果,2016年又對小果野芭蕉(M. acuminata)、長梗蕉(M. balbisiana)和苜蓿的AP2/ERF超家族基因全基因組分析進行了報導[7,12,15,17]。本研究對基因型為AAA的巴西蕉AP2/ERF超基因家族進行了分析,共識別出巴西蕉119個全長、非冗余的AP2/ERF超家族基因,又將其劃分成3個家族,分別為ERF(100個)、RAV(15個)和soloist(4個)家族。這一分類結(jié)果與大白菜、水稻、黃瓜、玉米、荷花等植株AP2/ERF超家族基因劃分結(jié)果不同,以上植株均是將AP2/ERF超家族基因劃分為AP2、ERF、RAV和soloist 4個家族。此外,這一分類結(jié)果也與同一物種的小果野芭蕉和長梗蕉的不同,2016年Lakhwani等[17]將小果野芭蕉和長梗蕉的AP2/ERF超家族基因劃分為AP2、ERF、RAV和soloist共4個家族,其中AP2家族有2個重復的AP2/ERF結(jié)構域,ERF家族僅含有1個AP2/ERF結(jié)構域。巴西蕉是野生尖葉蕉和長梗蕉種內(nèi)或者種間雜交之后逐漸進化而來的3倍體新品種,其不存在包含2個AP2/ERF結(jié)構域的AP2家族基因,可能是在進化過程中1個AP2/ERF結(jié)構域消失的原因。因此,根據(jù)AP2/ERF結(jié)構域的數(shù)目和是否出現(xiàn)其他DNA結(jié)構域特征,將本研究識別出的119個AAA基因型巴西蕉AP2/ERF超家族基因劃分為ERF、RAV和soloist是正確的,這一結(jié)果對于后續(xù)AAA基因型巴西蕉AP2/ERF超家族基因的篩選和功能研究具有一定的指導意義。
一般而言,轉(zhuǎn)錄因子DNA結(jié)合域外的區(qū)域包含重要的功能區(qū)域,參與轉(zhuǎn)錄啟動、蛋白之間互作和核定位。因此,植物轉(zhuǎn)錄因子大家族的一個亞組內(nèi)成員的功能區(qū)域,即氨基酸序列motif通常是保守的,如MYB、WRKY、NAC、Dof、GATA和GRAS[24,27-29]。一個亞組中蛋白的motif可能有相似的功能,有些可能在轉(zhuǎn)錄調(diào)控中發(fā)揮重要作用[4]。本研究依據(jù)水稻ERF家族和巴西蕉100個ERF家族基因編碼的AP2/ERF保守結(jié)構域氨基酸序列的比對結(jié)果,又將ERF家族劃分為10個亞組,即GroupⅠ~GroupⅩ。對于AP2/ERF超家族中ERF家族的劃分,近幾年不同物種中的報導均一致,都被劃分為10個亞組,也與香蕉進化的原始種小果野芭蕉和長梗蕉的劃分結(jié)果一致[17]。對巴西蕉ERF家族基因結(jié)構和保守功能motif分析發(fā)現(xiàn),聚類到同一亞組中的ERF基因具有相似的基因結(jié)構和相似的motif組件。這一結(jié)果也符合前人對其他植物ERF家族全基因組分析后得出的結(jié)論[4-5,7,15]。因此,劃分到同一亞組的ERF基因具有較近的進化關系,并且可能在巴西蕉響應外界生物和非生物脅迫方面具有相似的功能。
綜上所述,本研究對基因型為AAA的栽培種巴西蕉的AP2/ERF超家族進行了系統(tǒng)的分析,將獲得的119個巴西蕉AP2/ERF超家族基因劃分成ERF、RAV和soloist共3個家族,其中ERF家族又被劃分為10個亞家族,每個亞家族基因具有相似的保守motif和基因結(jié)構。對巴西蕉AP2/ERF超家族基因的研究為不同物種基因家族的系統(tǒng)發(fā)育和進化研究提供了方法和理論依據(jù),更有助于巴西蕉響應非生物逆境脅迫下AP2/ERF超家族功能基因的挖掘和鑒定,對于后期非生物逆境脅迫響應機制的研究、香蕉品種抗逆改良奠定了基礎。
參考文獻
[1] Simmonds N W. Megasporogenesis and female fertility in 3 edible triploid bananas[J]. Journal of Genetics, 1961, 57(2-3): 269.
[2] 吳坤林. 香蕉的生物學特性及其組織培養(yǎng)技術[J]. 生物學通報, 2006, 41(10): 5-8.
[3] 程曉培. 香蕉MADS-box轉(zhuǎn)錄因子在脅迫條件下的表達分析[D]. ??冢?海南大學, 2013.
[4] Nakano T, Suzuki K, Fujimura T, et al. Genome-wide analysis of the ERF gene family in Arabidopsis and rice[J]. Plant Physiology, 2006, 140(2): 411-432.
[5] Song X M, Li Y, Hou X L. Genome-wide analysis of the AP2/ERF transcription factor superfamily in Chinese cabbage(Brassica rapa ssp. pekinensis)[J]. BMC Genomics, 2013, 14(1): 1-15.
[6] Wan L Y, Wu Y S, Huang J Q, et al. Identif ication of ERF genes in peanuts and functional analysis bof AhERF008 and AhERF019 in abiotic stress response[J]. Funct Integr Genomics, 2014, 14(3): 467-477.
[7] Sun Z M, Zhou M L, Xiao X G, et al. Genome-wide analysis of AP2/ERF family genes from Lotus corniculatus shows LcERF054 enhances salt tolerance[J]. Functional & Integrative Genomics, 2014, 14(3): 453-466.
[8] Yang H, Yu C, Yan J, et al. Overexpression of the Jatropha curcas JcERF1 gene coding an AP2/ERF-Type transcription factor increases tolerance to salt in transgenic tobacco[J]. Biochemistry(Moscow), 2014, 79(11): 1 226-1 236.
[9] Dossa K, Wei X, Li D H, et al. Insight into the AP2/ERF transcription factor superfamily in sesame and expression profiling of DREB subfamily under drought stress[J]. BMC Plant Biology, 2016, 16(1): 171-186.
[10] Lee D K, Jung H, Jang G, et al. Overexpression of the OsERF71 transcription factor alters rice root structure and drought resistance[J]. Plant Physiology Preview, 2016, 172(1): 379.
[11] Magome H, Yamaguchi S, Hanada A, et al. dwarf and delayed-flowering, a novel Arabidopsis mutant deficient in gibberellin biosynthesis because of overexpression of a putative AP2 transcription factor[J]. Plant J, 2014, 37(4): 720-729
[12] Du H W, Huang M, Zhang Z X, et al. Genome-wide analysis of the AP2/ERF gene family in maize waterlogging stress response[J]. Euphytica, 2014, 198(1): 115-126.
[13] Zhuang J, Cai B, Peng R H, et al. Genome-wide analysis of the AP2/ERF gene family in Populus trichocarpa[J]. Biochem Biophys Res Commun, 2008, 371(3): 468-474.
[14] Zhuang J, Peng R H, Cheng Z M, et al. Genome-wide analysis of the putative AP2/ERF family genes in Vitis vinifera[J]. Scientia Horticulturae, 2009, 123(1): 73-81.
[15] Hu L F, Liu S Q. Genome-wide identification and phylogenetic analysis of the ERF gene family in cucumbers[J]. Genetics and Molecular Biology, 2011, 34(4): 624-633.
[16] D'Hont A, Denoeud F, Aury J M, et al. The banana(Musa acuminata)genome and the evolution of monocotyledonous plants[J]. Nature, 2012, 488(1): 213-217.
[17] Lakhwani D, Pandey A, Dhar Y V, et al. Genome-wide analysis of the AP2/ERF family in Musa species reveals divergence and neofunctionalisation during evolution[J]. Scientific Report, 2016, 6: 18 878.
[18] Marchler-Bauer A, Derbyshire M K, Gonzales N R, et al. CDD: NCBI's conserved domain database[J]. Nucleic Acids Res, 2015, 43(1): D222-D226.
[19] Finn R D, Bateman A, Clements J, et al. The Pfam protein families database[J]. Nucleic Acids Res, 2014, 42(1): D222-D230.
[20] Kawahara Y, de la Bastide M, Hamilton J P, et al. Improvement of the Oryza sativa Nipponbare reference genome using next generation sequence and optical map data[J]. Rice, 2013, 6(1): 1-10.
[21] Hu B, Jin J, Guo A Y, et al. GSDS 2.0: An upgraded gene feature visualization server[J]. Bioinformatics, 2015, 31(7): 1 296-1 297.
[22] Brown P, Baxter L, Hickman R, et al. MEME-LaB: Motif analysis in clusters[J]. Bioinformatics, 2013, 29(9): 1 696-1 697.
[23] Mulder N, Apweiler R. InterPro and InterProScan: Tools for protein sequence classification and comparison[J]. Methods Mol Biol, 2007, 396(1): 59-70.
[24] Eulgem T, Rushton P J, Robatzek S, et al. The WRKY superfamily of plant transcription factors[J]. Trends Plant Science, 2000, 5(5): 199-206.
[25] Jakoby M, Weisshaar B, Droge-Laser W, et al. bZIP transcription factors in Arabidopsis[J]. Trends in Plant Science, 2002, 7(3): 106-111.
[26] Heim M A, Jakoby M, Werber M, et al. The basic helix-loop-helix transcription factor family in plants: a genome-wide study of protein structure and functional diversity[J]. Molecular Biology and Evolution, 2003, 20(5): 735-747.
[27] Ooka H, Satoh K, Doi K, et al. Comprehensive analysis of NAC family genes in Oryza sativa and Arabidopsis thaliana[J]. DNA Res, 2003, 10(2): 239-247.
[28] Tian C, Wan P, Sun S, et al. Genome-wide analysis of the GRAS gene family in rice and Arabidopsis[J]. Plant Molecular Biology, 2004, 54(3): 519-532.
[29] Gupta S, Malviya N, Kushwaha H, et al. Insights into structural and functional diversity of Dof(DNA binding with one finger)transcription factor[J]. Planta, 2015, 1(7): 549-562.