江騰,林勇祥,劉雪,江海洋,朱蘇文
(安徽農(nóng)業(yè)大學(xué)生命科學(xué)學(xué)院 安徽省作物生物學(xué)重點(diǎn)實(shí)驗(yàn)室,安徽 合肥230036)
轉(zhuǎn)錄因子在高等植物的生長(zhǎng)發(fā)育及其對(duì)外界環(huán)境的反應(yīng)中起著重要的調(diào)控作用,典型的高等植物轉(zhuǎn)錄因子含有DNA結(jié)合域、轉(zhuǎn)錄調(diào)控域、寡聚化位點(diǎn)和核定位信號(hào),轉(zhuǎn)錄因子通過這些結(jié)構(gòu)域與順式元件相互作用調(diào)控基因的表達(dá)。轉(zhuǎn)錄因子也稱反式作用因子,其主要功能是激活或抑制基因的轉(zhuǎn)錄效應(yīng)[1,2]。WRKY蛋白是植物所特有的轉(zhuǎn)錄因子家族。因WRKY結(jié)構(gòu)域是一個(gè)60個(gè)氨基酸左右的保守結(jié)構(gòu),所有結(jié)構(gòu)域均含有高度保守的WRJKYGQK氨基酸序列而得名[3,4]。WRKY基因是首先從植物中分離得到的一類調(diào)節(jié)蛋白質(zhì)。至今已從多種植物中分離,如甜土豆(Ipomoea batatas)、野燕麥(Avena sativa)、皺葉歐芹(Petroselinum crispum)、擬南芥(Arabidopsisthaliana)、煙草(Nicotiana tabacum)、水稻(Oryza sativa)等[5-9]。WRKY 基因家族的名字來源于這類蛋白質(zhì)的一個(gè)主要特征即含有WRKY結(jié)構(gòu)域。
在擬南芥、煙草和水稻中,已有大量的文獻(xiàn)報(bào)道WRKY轉(zhuǎn)錄因子參與了水楊酸和茉莉酸信號(hào)傳導(dǎo)相關(guān)基因的調(diào)控和抗病性[10-12]。水稻的一個(gè)WRKY45基因被證實(shí)與稻瘟病的抗性相關(guān),過量表達(dá)WRKY45基因?qū)е滤镜目沟疚敛∧芰υ鰪?qiáng)[13]。擬南芥中的WRKY18,WRKY40和WRKY60基因與灰霉菌(Streptomyces griseus)和假單孢菌(Pseudomonasaeruginosa)的抗性密切相關(guān)[14]。近年來,隨著多種植物全基因組數(shù)據(jù)的公布,利用全基因組數(shù)據(jù)分析某一基因家族基因的特征越來越多,最早是擬南芥中抗病基因的全基因組分析,利用生物信息學(xué)方法從擬南芥中共發(fā)現(xiàn)149個(gè)NBS(nucleotide binding site)基因,并對(duì)該基因家族進(jìn)行染色體定位,分類,保守的基序(motif)分析[15],該研究對(duì)近幾年擬南芥NBS抗病基因的克隆和功能驗(yàn)證起著重要的作用。隨后利用生物信息學(xué)方法對(duì)其他基因家族的全基因分析的報(bào)道也日益增多,而WRKY基因作為一類較為重要的基因家族,一直是分子生物學(xué)中研究的重點(diǎn),在擬南芥全基因組中有72個(gè)WRKY基因,共含有85個(gè)WRKY結(jié)構(gòu)域,其中有13個(gè)WRKY蛋白包含著2個(gè)WRKY結(jié)構(gòu)域,對(duì)水稻全基因組WRKY基因研究表明,水稻中共有102個(gè)WRKY轉(zhuǎn)錄因子基因[16],對(duì)擬南芥和水稻W(wǎng)RKY基因的研究大大加速了對(duì)這類基因的了解。
蒺藜苜蓿(Medicago truncatula),豆科蝶形花亞科苜蓿屬一年生黃花苜蓿,耐旱,已經(jīng)成為研究豆科植物的模式植物[17,18],基因組小(全基因組470 Mb),因其轉(zhuǎn)化和培養(yǎng)較為容易,目前,在豆科植物功能基因的研究中應(yīng)用較多[19-21]。苜蓿全基因組的精細(xì)序列(Mt2.0)已經(jīng)公布,目前,利用生物信息學(xué)方法分析基因家族的特征、進(jìn)化關(guān)系成為熱點(diǎn)[22,23]。本研究利用生物信息學(xué)方法分析了苜蓿全基因組WRKY基因的種類、數(shù)目和進(jìn)化特點(diǎn),對(duì)促進(jìn)苜蓿WRKY基因家族功能基因組學(xué)的進(jìn)一步研究具有重要意義。
本研究以苜蓿最新的全基因組數(shù)據(jù)庫(Mt2.0)為對(duì)象,苜蓿全基因組數(shù)據(jù)和蛋白質(zhì)數(shù)據(jù)下載于苜?;蚪M測(cè)序網(wǎng)站(http://www.medicago.org)。
1.2.1 WRKY基因的確定 因?yàn)檐俎;蚪M的注釋并不完全,因此利用蛋白家族數(shù)據(jù)庫(Pfam)中選取的WRKY蛋白家族序列(PF03106),利用序列的同源性搜索工具(Blastp)篩選苜蓿全部基因,P值設(shè)為10-3[24],把候選WRKY基因進(jìn)行Pfam分析,以證實(shí)其蛋白含有保守的WRKY結(jié)構(gòu)域。而水稻的WRKY基因已經(jīng)在基因組中有較好的注釋,直接從水稻基因組網(wǎng)站中下載全基因序列,獲取水稻的102條WRKY基因序列。
1.2.2 WRKY類型基因分類 對(duì)基因家族進(jìn)行分組是功能分析的一項(xiàng)重要內(nèi)容,轉(zhuǎn)錄因子基因家族常含有高度保守的功能域或有DNA結(jié)合功能的保守域。根據(jù)預(yù)測(cè)得到的WRKY域的氨基酸序列對(duì)苜蓿WRKY基因進(jìn)行分組。參照Eulgem和Somssich[3]的分組原則及結(jié)合系統(tǒng)發(fā)育分析的結(jié)果進(jìn)一步分組,含有2個(gè)WRKY保守結(jié)構(gòu)域的定義為Ⅰ類,含有1個(gè)WRKY保守結(jié)構(gòu)域且含有C2H2保守鋅指基序(motif)的定義為Ⅱ類,含有1個(gè)WRKY保守結(jié)構(gòu)域且含有C2HC保守的鋅指motif的定義為Ⅲ類。這樣WRKY域可以分為3個(gè)大組(Ⅰ、Ⅱ、Ⅲ)。
1.2.3 WRKY類型基因的染色體定位 WRKY類型基因通過苜?;蚪M數(shù)據(jù)庫(http://www.medicago.org/genome/)提供的染色體BLAST工具進(jìn)行苜蓿染色體物理定位,首先將每個(gè)WRKY基因與苜蓿全基因組進(jìn)行BLAST搜索,尋找最匹配的染色體位置,從而確定每個(gè)WRKY類型基因在染色體上的具體位置。
1.2.4 WRKY類型基因系統(tǒng)發(fā)生學(xué)分析 選取苜蓿中所有的WRKY類型基因與水稻102個(gè)已鑒定的WRKY基因利用CLUSTALW軟件進(jìn)行序列比對(duì)[25],然后利用MEGA 4.0軟件進(jìn)行系統(tǒng)進(jìn)化樹的構(gòu)建,分析苜蓿與水稻W(wǎng)RKY基因間的進(jìn)化關(guān)系[26]。此外,對(duì)所有WRKY基因中的所有WRKY結(jié)構(gòu)域進(jìn)行序列比對(duì),然后根據(jù)結(jié)構(gòu)域的比對(duì)結(jié)果繪制WRKY結(jié)構(gòu)域的系統(tǒng)進(jìn)化樹。
1.2.5 WRKY結(jié)構(gòu)域(domain)的motif分析 苜蓿WRKY類型基因的預(yù)測(cè)motif分析通過MEME(multiple expectation maximization for motif elicitation)在線分析[27],MEME是美國圣地亞哥超級(jí)計(jì)算機(jī)中心(SDSC)開發(fā)的一套用來尋找一組相關(guān)的DNA序列或者蛋白質(zhì)序列基序的程序。利用此軟件來預(yù)測(cè)苜蓿WRKY基因中的保守motif以及WRKY結(jié)構(gòu)域上的保守motif。
利用Pfam數(shù)據(jù)庫的WRKY結(jié)構(gòu)域的標(biāo)準(zhǔn)序列,在苜蓿全基因組中進(jìn)行BLAST搜索,P值設(shè)為10-3,然后把候選序列進(jìn)行序列比對(duì)。通過這種方法,從苜?;蚪M中共找到28個(gè)WRKY候選基因,分別命名為Mt-WRKY1-MtWRKY 28(表1)。水稻已經(jīng)報(bào)道共有102個(gè)WRKY基因,即使是同為雙子葉植物的擬南芥中也發(fā)現(xiàn)了72個(gè)WRKY基因,苜蓿的基因組大小與水稻相當(dāng),這說明了WRKY基因家族并不與基因組大小有直接的對(duì)應(yīng)關(guān)系,擬南芥的基因組是苜蓿的1/4左右,但是其WRKY基因總數(shù)是苜蓿的3倍左右。進(jìn)一步把28個(gè)苜蓿的WRKY進(jìn)行染色體定位,發(fā)現(xiàn)WRKY基因并沒有均勻的分布在染色體上,其中,5號(hào)染色體分布最多,共含有8個(gè)WRKY基因,1號(hào)染色體有4個(gè)基因,3和4號(hào)染色體都有3個(gè)基因,7號(hào)染色體有2個(gè)基因,8號(hào)染色體有6個(gè)基因,而2和6號(hào)染色體上不含有WRKY基因,水稻、擬南芥等植物的WRKY基因分布也有此特點(diǎn)。此外,26個(gè)WRKY基因都已經(jīng)精確定位到染色體上,而MtWRKY14和MtWRKY15兩個(gè)基因并沒有定位在任何染色體上,主要是因?yàn)槠渌诘腂AC(細(xì)菌人工染色體,bacterial artificial chromosome)克隆目前沒有被定位,導(dǎo)致基因不能夠與拼接的染色體序列匹配。
擬南芥和水稻W(wǎng)RKY基因的研究已經(jīng)對(duì)這個(gè)基因家族有了一些理解,一般而言該基因可以分為3個(gè)大類和若干小類,采用了文獻(xiàn)的方法將苜蓿的28個(gè)WRKY基因進(jìn)行了分類,也可以分為3類,其中MtWRKY1-MtWRKY 5因?yàn)槠浜?個(gè)保守的WRKY結(jié)構(gòu)域而劃分為Ⅰ類。MtWRKY27與Mt-WRKY28因?yàn)槠涑撕?個(gè)WRKY結(jié)構(gòu)域外,還含有C2HC的保守motif,而劃分為Ⅲ類,其他的WRKY基因含有1個(gè)WRKY結(jié)構(gòu)域且在C端包含C2H2的保守motif而劃分為Ⅱ類。此外,把所有基因的WRKY保守結(jié)構(gòu)域的氨基酸序列進(jìn)行比對(duì)分析,其中含有2個(gè)WRKY結(jié)構(gòu)域的Ⅱ類基因,把N端的結(jié)構(gòu)域命名為NW,發(fā)現(xiàn)WRKY結(jié)構(gòu)域長(zhǎng)度為51~63個(gè)氨基酸(圖1),相對(duì)于 C端的WRKY結(jié)構(gòu)域,其N端WRKY結(jié)構(gòu)域之間具有相似的序列構(gòu)成。對(duì)WRKY結(jié)構(gòu)域進(jìn)行系統(tǒng)發(fā)生學(xué)分析,可以明顯的分為3個(gè)分枝(圖2),且所有基因的NW結(jié)構(gòu)域基本上在同一進(jìn)化分枝上,說明它們與C端的WRKY結(jié)構(gòu)域并不是簡(jiǎn)單的復(fù)制現(xiàn)象造成,有其單獨(dú)的起源和進(jìn)化關(guān)系。此外,WRKYGQK 7個(gè)氨基酸被視為WRKY基因最保守的結(jié)構(gòu),從結(jié)構(gòu)域的序列比較可以發(fā)現(xiàn),第1組和第3組基本上比較保守,WRKYGQK基本上沒有變異,而第2組中WRKYGQK中的Q殘基變異較大,說明了不同類型的WRKY基因的選擇壓力和進(jìn)化模式是不同的。
利用苜蓿的28個(gè)WRKY基因氨基酸序列與水稻102個(gè)WRKY基因氨基酸序列進(jìn)行序列比對(duì),然后進(jìn)行系統(tǒng)進(jìn)化樹繪制(圖3)。可以明顯的看出苜蓿的WRKY基因集中分布在幾個(gè)分枝上,共有17個(gè)基因是單獨(dú)位于分枝上,說明了苜蓿與水稻W(wǎng)RKY基因的起源和進(jìn)化關(guān)系不同。如MtWRKY8-11單獨(dú)在一分枝上,與水稻W(wǎng)RKY具有較遠(yuǎn)的進(jìn)化距離。此外,可以明顯的看出水稻的WRKY基因分布在外圍分枝的基因較多,而且一些基因與苜蓿的WRKY基因差異較多,證實(shí)水稻的WRKY基因變異較多,苜蓿的WRKY基因更加保守。
表1 苜蓿WRKY基因的分類和定位信息Table 1 Classification and location of WRKY genes in M.truncatula
對(duì)28個(gè)WRKY基因的氨基酸進(jìn)行MEME軟件在線分析,結(jié)果顯示,在苜蓿WRKY基因中共找到46個(gè)預(yù)測(cè)的motif,可以看出不同類型的WRKY基因含有的motif數(shù)目和種類有所差異,如Ⅰ組WRKY基本上都含有2個(gè)motif 1,這是WRKY結(jié)構(gòu)域的特征,motif的多樣化也說明了WRKY基因廣泛參與細(xì)胞內(nèi)的多樣代謝途徑和反應(yīng)。此外選取28個(gè)基因的33個(gè)WRKY結(jié)構(gòu)域序列進(jìn)行motif分析,結(jié)果共發(fā)現(xiàn)5個(gè)motif(表2),其中最長(zhǎng)的motif長(zhǎng)度為26個(gè)氨基酸,最短的為10個(gè)氨基酸,其中motif 1最為保守,是WRKY基因最保守的motif(圖4)。
圖1 苜蓿WRKY結(jié)構(gòu)域的氨基酸比對(duì)Fig.1 Amino acid alignment of M.truncatula WRKY domain
圖2 苜蓿WRKY結(jié)構(gòu)域的系統(tǒng)發(fā)生樹Fig.2 Phylogenetic tree of M.truncatula WRKY domain
圖3 苜蓿和水稻W(wǎng)RKY基因的的系統(tǒng)發(fā)生樹Fig.3 Phylogenetic tree of rice and M.truncatula WRKY genes
圖4 苜蓿WRKY蛋白推測(cè)的保守motifFig.4 Forty six putative motifs identified in the WRKY family
WRKY基因家族是植物特有的一類重要的轉(zhuǎn)錄因子基因,已經(jīng)克隆的基因表明該基因廣泛參與植物的抗病、抗旱等逆境的調(diào)控,在細(xì)胞代謝和防衛(wèi)反應(yīng)中具有重要的作用。但是目前對(duì)WRKY基因的研究還處在一個(gè)初步認(rèn)識(shí)的階段,大大地限制了人們對(duì)該類基因家族完全功能的認(rèn)識(shí)和了解[28]。隨著眾多模式植物全基因組測(cè)序的完成,利用全基因組數(shù)據(jù)分析基因家族成為可能。本研究利用苜蓿最新的基因組數(shù)據(jù)(Mt2.0)進(jìn)行WRKY基因家族的分析,詳細(xì)研究了該基因家族的特點(diǎn)和進(jìn)化關(guān)系,并發(fā)現(xiàn)其與水稻、擬南芥WRKY基因具有一定的差異。
表2 苜蓿推測(cè)的WRKY結(jié)構(gòu)域的motifTable 2 M.truncatula putative WRKY domain motif
在苜蓿全基因組中共有28個(gè)WRKY基因被確認(rèn),占整個(gè)基因總數(shù)的0.072%,而在擬南芥中這一比例為0.199%,水稻中這一比例為0.407%,無論是基因的總數(shù)還是所占比例,苜蓿都遠(yuǎn)遠(yuǎn)少于模式植物擬南芥和水稻。已經(jīng)有研究表明,水稻和擬南芥WRKY基因家族存在較明顯的基因復(fù)制現(xiàn)象,而苜蓿中這一現(xiàn)象并不是很明顯,此外,苜蓿28個(gè)基因在7條染色體都有分布,相對(duì)于擬南芥和水稻而言分布不集中,說明了苜?;蚪M中WRKY基因復(fù)制事件較少,這可能是苜蓿WRKY基因較少的原因之一[29]。此外,苜蓿WRKY基因的同源性較高,在進(jìn)化樹上分布相對(duì)集中,而水稻W(wǎng)RKY基因差異較大,不少基因分布在進(jìn)化樹外圍,苜蓿相對(duì)水稻而言,WRKY基因較為保守。
對(duì)苜蓿和水稻W(wǎng)RKY基因的系統(tǒng)發(fā)生學(xué)分析證實(shí)了水稻和苜蓿的大部分WRKY基因并不在同一分枝上,說明了水稻和苜蓿的WRKY基因在進(jìn)化上具有較大差異,進(jìn)一步證實(shí)了這些差異可能早在單子葉與雙子葉植物分化前就已經(jīng)產(chǎn)生,這也進(jìn)一步說明了苜蓿的WRKY基因在進(jìn)化上比較保守,而水稻的WRKY在進(jìn)化上發(fā)生了更多的基因復(fù)制,導(dǎo)致WRKY基因的快速擴(kuò)張。對(duì)苜蓿WRKY結(jié)構(gòu)域的系統(tǒng)進(jìn)化樹分析證實(shí)了位于N端的WRKY結(jié)構(gòu)域與C端具有較大的差異,并不是結(jié)構(gòu)域的簡(jiǎn)單復(fù)制而來,可能起源于不同的結(jié)構(gòu)域,特別是第1組5個(gè)基因的N端WRKY在一個(gè)分枝上,C端WRKY也在同一分枝上,說明了N端與C端WRKY結(jié)構(gòu)域的起源不同。
[1]Arce A L,Cabello J V,Chan R L.Patents on plant transcription factors[J].Recent Patents on Biotechnology,2008,2(3):209-217.
[2]Jain M,Tyagi A K,Khurana J P.Genome-wide identification,classification,evolutionary expansion and expression analyses of homeobox genes in rice[J].Febs Journal,2008,275(11):2845-2861.
[3]Eulgem T,Somssich I E.Networks of WRKY transcription factors in defense signaling[J].Current Opinion in Plant Biology,2007,10:366-371.
[4]張秋平,楊宇紅,謝丙炎,等.植物轉(zhuǎn)錄因子的超表達(dá)及其在分子育種中的應(yīng)用[J].分子植物育種,2005,3(3):401-408.
[5]Chujo T,Takai R,Akimoto-Tomiyama C,et al.Involvement of the elicitor-induced gene OsWRKY53 in the expression of defense-related genes in rice[J].Biochemica et Biophysica Acta,2007,1769:497-505.
[6]Li J,Brader G,Palva E T.The WRKY70 transcription factor:A node of convergence for jasmonate-mediated and salicylatemediated signals in plant defense[J].Plant Cell,2004,16:319-331.
[7]Liu X,Bai X,Wang X,et al.OsWRKY71,a rice transcription factor,is involved in rice defense response[J].Journal of Plant Physiology,2007,164:969-979.
[8]Peng Y,Laura E B,Chen X W,et al.OsWRKY62 is a negative regulator of basal and Xa21-mediated defense against Xanthomonas oryzae pv.oryzae in rice[J].Molecular Plant,2009,1:446-458.
[9]Qiu D,Xiao J,Ding X H,et al.OsWRKY13 mediates rice disease resistance by regulating defense-related genes in salicylateand jasmonate-dependent signaling[J].Molecular Plant-microbe Interactions,2007,20:492-499.
[10]Eulgem T,Rushton P J,Robatzek S,et al.The WRKY superfamily of plant transcription factors[J].T rends in Plant Science,2000,5:199-206.
[11]田云,盧向陽,彭麗莎,等.植物WRKY轉(zhuǎn)錄因子結(jié)構(gòu)特點(diǎn)及其生物學(xué)功能[J].遺傳,2006,28(12):1607-1612.
[12]Shimono M,Sugano S,Nakayama A,et al.Rice WRKY45 plays a crucial role in benzothiadiazole-inducible blast resistance[J].Plant Cell,2007,19:2064-2076.
[13]Xu X,Chen C,Fan B,et al.Physical and functional interactions between pathogen-induced arabidopsis WRKY18,WRKY40,and WRKY60 transcription factors[J].Plant Cell,2006,18:1310-1326.
[14]Hara K,Yagi M,Kusano T,et al.Rapid systemic accumulation of transcripts encoding a tobacco WRKY transcription factor upon wounding[J].Molecular and General Genetics,2000,263:30-37.
[15]M eyersa B,Kozika A,Griego A,et al.Genome-wide analysis of NBS-LRR-encoding genes in arabidopsis[J].Plant Cell,2003,15:809-834.
[16]Wu K L,Guo Z J,Wang H H,et al.The WRKY Family of transcription factors in rice and arabidopsis and their origins[J].DNA Research,2005,12:9-26.
[17]張改娜,賈敬芬.豌豆清蛋白1(PA1)基因的克隆及對(duì)苜蓿的轉(zhuǎn)化[J].草業(yè)學(xué)報(bào),2009,18(3):117-125.
[18]劉圈煒,王成章,嚴(yán)學(xué)兵,等.苜蓿青飼對(duì)波爾山羊屠宰性狀及肉品質(zhì)的影響[J].草業(yè)學(xué)報(bào),2010,19(1):158-165.
[19]何樹斌,劉國利,楊惠敏.不同水分處理下紫花苜蓿刈割后殘茬的光合變化及其機(jī)制[J].草業(yè)學(xué)報(bào),2010,18(6):192-197.
[20]燕麗萍,夏陽,梁慧敏,等.轉(zhuǎn)BADH基因苜蓿T1代遺傳穩(wěn)定性和抗鹽性研究[J].草業(yè)學(xué)報(bào),2010,18(6):65-71.
[21]馮毓琴,曹致中.天藍(lán)苜蓿野生種質(zhì)的品質(zhì)分析研究[J].草業(yè)科學(xué),2009,26(10):80-84.
[22]Boutrot F,Chantret N,Gautier M F.Genome-wide analysis of the rice and arabidopsis non-specific lipid transfer protein(nsLtp)gene families and identification of wheat nsLtp genes by EST data mining[J].BioMed Central Genomics,2008,9:86.
[23]Wang D,Guo Y,Wu C,et al.Genome-wide analysis of CCCH zinc finger family in arabidopsis and rice[J].BioMed Central Genomics,2008,9:44.
[24]Zhou T,Wang Y,Chen J Q.Genome-wide identification of NBS genes in japonica rice reveals significant expansion of divergent non-TIR NBS-LRR genes[J].Molecular Genetics and Genomics,2004,271(4):402-415.
[25]Higgins D G,Thompson J D,Gibson T J.CLUSTAL W:Improving the sensitivity of progressive multiple sequence alignment through sequence weighting,position-specific gap penalties and weight matrix choice[J].Nucleic Acids Research,1994,22:4673-4680.
[26]Tamura K,Dudley J,Nei M,et al.MEGA4:molecular evolutionary genetics analysis(M EGA)software version 4.0[J].M olecular Biology and Evolution,2007,24:1596-1599.
[27]Bailey T L,Elkan C.The value of prior knowledge in discovering motifs with MEME[J].Proceedings International Conference on Intelligent Systems for Molecular Biology,1995,3:21-29.
[28]Pandey S P,Somssich I E.The role of WRKY transcription factors in plant immunity[J].Plant Physiology,2009,150(4):1648-1655.
[29]Lai Z,Vinod K,Zheng Z.Roles of arabidopsis WRKY3 and WRKY4 transcription factors in plant responses to pathogens[J].BioMed Central Plant Biology,2008,8:68.