任永康,牛瑜琦,逯成芳,唐朝暉
(山西農(nóng)業(yè)大學(xué) 農(nóng)學(xué)院,山西 太原 030031)
Dof(DNA binding with one finger)轉(zhuǎn)錄因子是植物中特有的轉(zhuǎn)錄因子,其N端有一個(gè)保守的Dof結(jié)構(gòu)域,該結(jié)構(gòu)域由50~52個(gè)氨基酸殘基(C-X2-C-X21-C-X2-C)組成,其中的4個(gè)Cys殘基與Zn2+共價(jià)結(jié)合形成C2-C2型單鋅指結(jié)構(gòu)[1];該結(jié)構(gòu)域能夠特異識(shí)別靶基因啟動(dòng)子中的AAAG/CTTT順式作用元件[1]。Dof結(jié)構(gòu)域作為一個(gè)雙功能結(jié)構(gòu)域,能夠介導(dǎo)DNA與蛋白質(zhì)結(jié)合或者蛋白質(zhì)與蛋白質(zhì)相互作用[2]。與其他單鋅指類轉(zhuǎn)錄因子不同的是,Dof轉(zhuǎn)錄因子C端的轉(zhuǎn)錄調(diào)控結(jié)構(gòu)域氨基酸數(shù)量和種類變化較大[1]。
研究發(fā)現(xiàn),Dof轉(zhuǎn)錄因子可以調(diào)控植物的生長(zhǎng)發(fā)育,例如植株表型的變化[3]、開(kāi)花時(shí)間的變化[3]、葉片的衰老[4]、種皮形成[5]、胚乳發(fā)育[6-7]等。過(guò)表達(dá)水稻OsDof12基因可使轉(zhuǎn)基因水稻植株變矮,葉片短小直立,在長(zhǎng)日照條件下提前開(kāi)花[3];水稻OsDof24基因參與茉莉酸介導(dǎo)的延緩葉片衰老[4];擬南芥AtDOF4.2基因調(diào)控種皮形成[5];水稻Dof基因OsPBF(Prolamin-box binding factor)是水稻種子存儲(chǔ)蛋白基因的激活劑,參與胚乳特異性基因表達(dá)的調(diào)控[6];玉米ZmDof3基因能夠調(diào)節(jié)玉米胚乳中的淀粉積累[7]。此外,Dof轉(zhuǎn)錄因子在抵抗生物和非生物脅迫方面同樣發(fā)揮重要作用[8-13]。毛竹Dof基因廣泛參與冷、鹽、干旱脅迫響應(yīng)[8];楊樹(shù)Dof基因參與ABA響應(yīng)[9];過(guò)表達(dá)番茄Dof基因SlCDF1(Cycling dof factors 1)能提高植物抗旱、耐鹽能力[10];過(guò)表達(dá)水稻OsDof15基因能夠降低轉(zhuǎn)基因水稻植株根對(duì)鹽脅迫的敏感性[11];過(guò)表達(dá)番茄Dof基因TDDF1(Tomato dof daily fluctuations 1)能夠提高轉(zhuǎn)基因番茄植株的抗旱和耐鹽能力[12];超表達(dá)3個(gè)煙草Dof基因BBF1(RolB domain B Factor 1)、BBF2和BBF3能夠提高病毒抗性基因和多個(gè)防御相關(guān)基因的表達(dá)水平[13]。上述表明Dof基因在植物生長(zhǎng)發(fā)育、生物和非生物脅迫響應(yīng)方面發(fā)揮了重要作用。
自從第一個(gè)Dof轉(zhuǎn)錄因子在玉米中被分離出來(lái)之后[14],研究人員陸續(xù)從其他物種中分離出植物Dof基因,如水稻、擬南芥等[1]。截至目前,在水稻基因組中共鑒定了30個(gè)Dof基因[1],擬南芥中36個(gè)[1-2],二穗短柄草中27個(gè)[15],谷子中35個(gè)[16],胡蘿卜中46個(gè)[17]。小麥?zhǔn)侵匾募Z食作物,其重要性不言而喻。小麥基因組測(cè)序已完成,但在全基因組水平上鑒定小麥Dof轉(zhuǎn)錄因子家族的研究尚未見(jiàn)報(bào)道,這極大地限制了小麥Dof轉(zhuǎn)錄因子的生物學(xué)功能研究。為此,利用最新的小麥基因組信息,通過(guò)生物信息學(xué)方法對(duì)小麥Dof轉(zhuǎn)錄因子家族成員在全基因組水平上進(jìn)行鑒定,并進(jìn)一步對(duì)其理化性質(zhì)、保守結(jié)構(gòu)域、染色體分布、共線性、表達(dá)模式進(jìn)行系統(tǒng)分析,旨在為小麥Dof轉(zhuǎn)錄因子的功能研究奠定基礎(chǔ)。
小麥、擬南芥、水稻全基因組數(shù)據(jù)和蛋白質(zhì)數(shù)據(jù)從Ensembl Plant(http://plants.ensembl.org/index.html)中下載。為了獲得小麥Dof基因,利用前人的方法略做了改進(jìn)[18-19]。首先利用HMMER 3.0的HMMbuild程序?qū)λ械臄M南芥和水稻Dof基因構(gòu)建HMM模型,并利用該模型在小麥蛋白質(zhì)數(shù)據(jù)庫(kù)中進(jìn)行BLASTP比對(duì),獲得假定的小麥Dof基因。然后,從Pfam數(shù)據(jù)庫(kù)(http://pfam.xfam.org/)中獲得Dof基因特有的保守結(jié)構(gòu)域模型PF02701,利用HMMsearch程序在小麥蛋白質(zhì)數(shù)據(jù)庫(kù)中進(jìn)行BLASTP比對(duì),獲得假定的小麥Dof基因。對(duì)于兩次獲得的假定Dof基因,去除重復(fù)基因和可變剪接基因之后,即為小麥Dof基因。最后,利用NCBI CDD和SMART對(duì)得到的Dof基因進(jìn)行結(jié)構(gòu)域確定,去除沒(méi)有Dof結(jié)構(gòu)域的基因,最終得到小麥Dof基因。
利用ExPASy(https://www.expasy.org/)對(duì)小麥Dof蛋白進(jìn)行理化性質(zhì)預(yù)測(cè),包括氨基酸數(shù)目、理論等電點(diǎn)、分子質(zhì)量、總平均疏水指數(shù)等;同時(shí)利用CELLO 2.5 (http://cello.life.nctu.edu.tw/)進(jìn)行亞細(xì)胞定位預(yù)測(cè)。
利用Bioedit軟件中的ClustalX程序?qū)π←?、水稻、擬南芥Dof轉(zhuǎn)錄因子進(jìn)行多序列比對(duì)和結(jié)果的可視化。利用MEGA 7的鄰接法(Neighbor-joining)進(jìn)行系統(tǒng)進(jìn)化樹(shù)構(gòu)建,bootstrap值設(shè)置為1 000,其他參數(shù)默認(rèn)。
根據(jù)小麥基因組注釋信息(http://plants.ensembl.org/index.html)及BLASTN比對(duì)結(jié)果,獲得小麥Dof基因的染色體定位信息。采用MCScanX軟件進(jìn)行小麥Dof基因序列的比對(duì)、同源基因獲取、共線性整合,參數(shù)設(shè)置為默認(rèn)。利用Circos 0.67軟件展示Dof基因在染色體上的物理分布和共線性結(jié)果。
在EMBL-EBI(http://www.ebi.ac.uk/)數(shù)據(jù)庫(kù)中下載小麥15個(gè)組織(15個(gè)不同時(shí)期的根、莖、葉、花、果實(shí))編號(hào)為E-MTAB-4484的高通量數(shù)據(jù);從NCBI SRA數(shù)據(jù)庫(kù)中下載編號(hào)為SRP045409的轉(zhuǎn)錄組數(shù)據(jù),進(jìn)行高溫、干旱、旱熱共脅迫后的表達(dá)分析,下載編號(hào)為SRP068156的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行禾谷鐮刀菌侵染后的表達(dá)分析。利用Tophat和Cufflinks軟件進(jìn)行轉(zhuǎn)錄組數(shù)據(jù)reads的全基因組映射,計(jì)算各個(gè)Dof基因的FPKM值,利用HemI 1.0進(jìn)行表達(dá)譜熱圖的繪制。
在小麥基因組水平上共鑒定到86個(gè)Dof基因,根據(jù)其在染色體上的位置分布(表1),將它們命名為TaDof1A—TaDof28D。小麥Dof基因編碼氨基酸數(shù)目介于152(TaDof14D)~539(TaDof17A和TaDof17B)個(gè),分子質(zhì)量為15.77(TaDof14D)~58.13 ku(TaDof17B),理論等電點(diǎn)為4.66(TaDof18B)~10.46(TaDof14A/B/D),所有的小麥Dof轉(zhuǎn)錄因子的總平均疏水指數(shù)均小于1,說(shuō)明它們都是親水性蛋白。亞細(xì)胞定位預(yù)測(cè)發(fā)現(xiàn),所有的Dof轉(zhuǎn)錄因子均定位在細(xì)胞核中。
表1 小麥Dof轉(zhuǎn)錄因子家族的全基因組鑒定及理化性質(zhì)Tab.1 Genome-wide identification and physicochemical properties of Dof transcription factors in wheat
續(xù)表1 小麥Dof轉(zhuǎn)錄因子家族的全基因組鑒定及理化性質(zhì)Tab.1(Continued) Genome-wide identification and physicochemical properties of Dof transcription factors in wheat
由圖1可知,所有小麥Dof轉(zhuǎn)錄因子結(jié)構(gòu)域均含有C-X2-C-X21-CX2-C保守基序,其構(gòu)成一個(gè)C2-C2型的單鋅指結(jié)構(gòu),這與在水稻和擬南芥中的研究結(jié)果一致[1],進(jìn)一步證明所鑒定的蛋白質(zhì)為Dof家族成員。
圖1 小麥Dof轉(zhuǎn)錄因子保守結(jié)構(gòu)域多序列比對(duì)Fig.1 Multiple sequences alignment of conserved domain in wheat Dof transcription factors
將前人研究得到的水稻、擬南芥Dof轉(zhuǎn)錄因子及本研究的86個(gè)小麥Dof轉(zhuǎn)錄因子進(jìn)行進(jìn)化分析(圖2),發(fā)現(xiàn)Dof轉(zhuǎn)錄因子可分為A、B、C1、C2、C3、D1、D2共7個(gè)亞組。其中,D1是最大的亞組,包含29個(gè)小麥Dof轉(zhuǎn)錄因子;C3是最小的亞組,包含3個(gè)小麥Dof轉(zhuǎn)錄因子。Dof基因廣泛參與植物的生長(zhǎng)發(fā)育。例如,在A亞組基因中,過(guò)表達(dá)擬南芥AtDOF4.7(At4g38000.1)會(huì)使花器官脫落[20];SCAP1(Stomatal carpenter 1)(At5g65590.1)調(diào)控?cái)M南芥氣孔發(fā)育[21];而小麥TaDof1(TaDof27A)在小麥葉片和葉鞘中具有較高的表達(dá)量,暗示它在小麥葉片發(fā)育過(guò)程中發(fā)揮重要作用[22]。C1亞組基因中,擬南芥DOF6(At3g45610.1)基因負(fù)向調(diào)控種子的萌發(fā)[21]。C3亞組中,水稻RPBF(Rice prolamin-box binding factor)(LOC_Os02g15350.1)基因通過(guò)激活種子貯藏蛋白基因的表達(dá)來(lái)促進(jìn)種子發(fā)育[23]。而D1亞組中,過(guò)表達(dá)擬南芥CDF3(Cycling Dof factor 3)(At3g47500.1)基因促使植物開(kāi)花延遲,并提高植物對(duì)干旱、低溫的抗性[24];擬南芥CDF2(At5g39660.1)基因可抑制CO(CONSTANS)的表達(dá),使擬南芥開(kāi)花延遲[25];過(guò)表達(dá)水稻OsDof4(LOC_Os01g17000.1)能夠促使植物提前開(kāi)花[26];過(guò)表達(dá)水稻OsDof12(LOC_Os03g07360.1)基因會(huì)導(dǎo)致水稻植株變矮、葉片直立和葉片縮短[3];而OsDOF24(LOC_Os08g38220.1)基因通過(guò)調(diào)控茉莉酸途徑中基因的表達(dá)量來(lái)延遲葉片衰老[4]。由上可知,A和D1亞組基因調(diào)控植物開(kāi)花和葉片發(fā)育,而C1和C3亞組基因主要調(diào)控種子的發(fā)育。目前,對(duì)小麥Dof基因的研究很少,這些結(jié)果暗示小麥A和D1亞組Dof基因可能調(diào)控植物開(kāi)花和葉片發(fā)育,同時(shí)C亞組基因在種子發(fā)育方面發(fā)揮重要作用。盡管B亞組基因尚未有研究報(bào)道,但該亞組和其他亞組同源關(guān)系較近,暗示B亞組在植物生長(zhǎng)發(fā)育中也可能發(fā)揮重要作用。
由圖3可知,所有的小麥Dof基因不均等分布在不同染色體上。在小麥的A、B、D染色體組中,分別包含有30、29、27個(gè)Dof轉(zhuǎn)錄因子,暗示小麥Dof轉(zhuǎn)錄因子的數(shù)量在A、B、D染色體組中發(fā)生了變化,在小麥兩次進(jìn)化加倍過(guò)程中,同源基因的保留和丟失同時(shí)發(fā)生。
由圖3可知,23個(gè)小麥Dof基因組成了29對(duì)共線性基因?qū)?。一些基因至少與3個(gè)同源基因組成不同的共線性基因?qū)?,?A染色體上的TaDof18A基因與TaDof3A、TaDof3B、TaDof3D分別組成3對(duì)共線性基因?qū)Γ?D染色體上的TaDof15D基因與TaDof4A、TaDof4B、TaDof4D分別組成3對(duì)共線性基因?qū)Α_@些結(jié)果表明,小麥Dof基因在進(jìn)化過(guò)程中發(fā)生了復(fù)制,且發(fā)生在不同染色體上,這可能是小麥Dof基因數(shù)目多于其他物種的原因。
圖2 小麥Dof轉(zhuǎn)錄因子與水稻、擬南芥Dof轉(zhuǎn)錄因子的進(jìn)化分析
圖3 小麥Dof基因的染色體定位和共線性分析
為探究小麥Dof基因在小麥生長(zhǎng)發(fā)育中的生物學(xué)功能,利用RNA-seq數(shù)據(jù)對(duì)小麥Dof基因在15個(gè)不同組織(多個(gè)不同時(shí)期的根、莖、葉、花、籽粒)中的表達(dá)情況進(jìn)行分析發(fā)現(xiàn)(圖4),小麥Dof基因在不同組織中的表達(dá)模式有明顯差異,大部分基因在這15個(gè)組織中表達(dá)量都較低。相同基因在同一組織的不同時(shí)期表達(dá)模式有較大差異,例如TaDof1基因的A、B、D 3個(gè)拷貝在拔節(jié)期的花中均有較高表達(dá)量,而在抽穗期和揚(yáng)花期的花中表達(dá)量均較低。說(shuō)明小麥Dof基因廣泛參與各個(gè)時(shí)期的植物生長(zhǎng)發(fā)育,在植物生長(zhǎng)發(fā)育過(guò)程中具有重要作用。
本研究進(jìn)一步利用轉(zhuǎn)錄組數(shù)據(jù)分析了小麥Dof基因在高溫、干旱、旱熱共脅迫以及禾谷鐮刀菌侵染條件下噴施ABA(脫落酸)和GA(赤霉素)的表達(dá)模式。結(jié)果發(fā)現(xiàn)(圖5A),大部分小麥Dof基因在受到高溫和干旱脅迫后表達(dá)模式發(fā)生較明顯變化,且相同處理不同時(shí)間點(diǎn)的表達(dá)模式也存在明顯差異。例如,TaDof3的A、B、D 3個(gè)拷貝,在遭受干旱脅迫6 h后(DS6h)表達(dá)量明顯上調(diào),相同處理1 h(DS1h)條件下相對(duì)于對(duì)照而言未發(fā)生明顯變化。由此說(shuō)明小麥Dof基因在響應(yīng)非生物逆境過(guò)程中可能發(fā)揮重要作用。圖5B顯示,所有的Dof基因在禾谷鐮刀菌侵染條件下噴施ABA后表達(dá)量相對(duì)于只受到禾谷鐮刀菌侵染處理發(fā)生了較明顯的相反趨勢(shì)變化;而大部分Dof基因表達(dá)量在噴施GA后也發(fā)生了明顯變化。說(shuō)明Dof基因廣泛參與植物的生物和非生物脅迫響應(yīng)。
a:子葉出現(xiàn)期的根;b:三葉期的根;c:成熟期的根;d:三葉期的莖;e:拔節(jié)期的莖;f:抽穗期的莖;g:三葉期的葉;h:分蘗期的葉;i:灌漿期的葉;j:拔節(jié)期的花;k:抽穗期的花;l:揚(yáng)花期的花;m:籽粒形成期的籽粒;n:灌漿期的籽粒;o:蠟熟期的籽粒
A:CK、HS1h、HS6h、DS1h、DS6h、HD1h、HD6h分別代表對(duì)照,高溫處理1、6 h,干旱處理1、6 h,旱熱共脅迫1、6 h。B:fhb、ABA、GA分別代表禾谷鐮刀菌侵染后、侵染后ABA處理、侵染后GA處理
Dof轉(zhuǎn)錄因子是植物中特有的一類轉(zhuǎn)錄因子,其在植物生長(zhǎng)發(fā)育過(guò)程中具有重要作用。本研究在小麥基因組中共鑒定到86個(gè)Dof轉(zhuǎn)錄因子,其在數(shù)量上遠(yuǎn)多于水稻(30)[1]、擬南芥(36)[1-2]、二穗短柄草(27)[15]、谷子(35)[16]和粗山羊草(10)[27],可能是因?yàn)樾←溤谶M(jìn)化過(guò)程中經(jīng)歷了自然加倍,使得基因組得到擴(kuò)張,從而造成Dof基因數(shù)量加倍。多序列比對(duì)結(jié)果發(fā)現(xiàn),一共有24個(gè)氨基酸殘基存在于Dof結(jié)構(gòu)域中,占Dof結(jié)構(gòu)域氨基酸數(shù)量的1/2以上,它們共同組成了一個(gè)保守的C-X2-C-X21-CX2-C基序,構(gòu)成一個(gè)C2-C2型的單鋅指結(jié)構(gòu)。
系統(tǒng)進(jìn)化分析將86個(gè)小麥Dof轉(zhuǎn)錄因子分成了7個(gè)不同的亞組,每個(gè)亞組含有不同數(shù)量的Dof轉(zhuǎn)錄因子。其中,亞組D1是最大的一個(gè)亞組,包含29個(gè)Dof轉(zhuǎn)錄因子,約占所鑒定Dof轉(zhuǎn)錄因子總數(shù)的1/3。此外,小麥21條染色體分布著數(shù)量不等的Dof轉(zhuǎn)錄因子,他們?cè)贏、B、D 3個(gè)不同染色體組中數(shù)量同樣不均等,說(shuō)明小麥Dof同源基因的保留和丟失在染色體組中同時(shí)發(fā)生。共線性結(jié)果證明了小麥Dof基因在進(jìn)化過(guò)程中發(fā)生了基因復(fù)制事件,且發(fā)生在不同染色體上。這些結(jié)果均進(jìn)一步說(shuō)明了小麥Dof基因數(shù)量多于其他物種的原因。
有研究發(fā)現(xiàn),小麥TaZNF(Zinc finger protein,即TaDof6D)基因能夠顯著提高轉(zhuǎn)基因擬南芥的耐鹽性[28];TaDof1(即TaDof27A)基因在小麥葉片和葉鞘中具有較高的表達(dá)量,而在根中表達(dá)量較低[22]。本研究發(fā)現(xiàn),大部分小麥Dof基因在不同組織中均有表達(dá),相同基因在同一組織的不同發(fā)育時(shí)期表達(dá)模式也存在較大差異。此外,不同脅迫條件下的表達(dá)模式分析發(fā)現(xiàn),小麥Dof基因廣泛參與非生物和生物脅迫,在高溫、干旱、旱熱共脅迫條件下以及禾谷鐮刀菌侵染條件下均會(huì)不同程度地被誘導(dǎo)表達(dá)。說(shuō)明Dof基因廣泛參與小麥生長(zhǎng)發(fā)育,且在響應(yīng)生物和非生物脅迫中可能發(fā)揮重要作用。