鞏永永,端木慧子
(1黑龍江大學農(nóng)業(yè)微生物技術(shù)教育部工程研究中心,哈爾濱 150500;2黑龍江大學生命科學學院黑龍江省寒地生態(tài)修復與資源利用重點實驗室,哈爾濱 150080;3黑龍江大學生命科學學院黑龍江省普通高校分子生物學重點實驗室,哈爾濱 150080)
TIFY蛋白是一類植物所特有的轉(zhuǎn)錄因子,以高度保守的TIFY結(jié)構(gòu)域為特征,在植物生長發(fā)育和逆境脅迫耐受中有重要的調(diào)控作用[1]。
TIFY結(jié)構(gòu)域由28個氨基酸和TIF[F/Y]XG核心區(qū)組成,最早在擬南芥中被注釋為ZIM(花序分生組織中表達的鋅指蛋白)結(jié)構(gòu)域,與TIFY家族蛋白的功能表達密切相關(guān)[2]。自Nishii等[3]首次對擬南芥(Arabidopsis thaliana)TIFY基因進行鑒定后,水稻(Oryza sativa)[4]、葡 萄 (Vitis vinifera)[5]、大 豆 (Glycine max)[6]、小麥(Triticum aestivum)[7]等物種的TIFY基因家族鑒定也相繼完成,眾多研究表明TIFY家族蛋白可劃分為TIFY、JAZ、PPD和ZML四個亞家族[8]。其中,TIFY亞家族只含有TIFY結(jié)構(gòu)域,在擬南芥中可與其他調(diào)節(jié)因子相互作用來調(diào)控根的生長發(fā)育[9];JAZ亞家族由TIFY結(jié)構(gòu)域和Jas結(jié)構(gòu)域組成,后者具有高度保守的SLX2FX2KRX2RX5PY序列結(jié)構(gòu)[10],核定位信號為PY-NLS[11],可與MYC2轉(zhuǎn)錄因子相互作用來調(diào)節(jié)植物的茉莉酸信號通路[12];PPD亞家族由PPD結(jié)構(gòu)域、TIFY結(jié)構(gòu)域和羧基端不完整的Jas結(jié)構(gòu)域組成,前者為序列氨基端高度保守的55個氨基酸結(jié)構(gòu),后者在Pfam數(shù)據(jù)庫中被注釋為CCT結(jié)構(gòu)域,與JAZ亞家族中的Jas結(jié)構(gòu)域相比缺少重要的PY-NLS序列結(jié)構(gòu),研究表明擬南芥中的PPD1能夠調(diào)節(jié)葉片生長發(fā)育與形態(tài)構(gòu)成[13-14];ZML亞家族由TIFY結(jié)構(gòu)域、CCT結(jié)構(gòu)域與GATA結(jié)構(gòu)域組成,該類蛋白主要參與植物光周期信號轉(zhuǎn)導途徑與蛋白互作[15]。
由于測序技術(shù)的不斷完善,基因組數(shù)據(jù)測定已在大量物種中得以開展,這也為TIFY基因家族在全基因組水平的系統(tǒng)研究提供了便利。近年來,TIFY基因家族的鑒定分析在一些常見作物中陸續(xù)完成,揭示了TIFY家族的生物學功能,但許多重要經(jīng)濟作物的相關(guān)研究還依然存在不足。甜菜是中國重要糖料作物之一[16],其耐寒性好且塊根蔗糖含量高,而且其制糖副產(chǎn)物糖蜜可產(chǎn)生甜菜堿、甲醇、乙醇、甘油、丙酮等化學物質(zhì)[17],糖渣濾泥可充當肥料,并具有中和土壤游離酸的作用[18]。除制糖之外,部分甜菜品種可供食用及飼用,具有廣闊的應(yīng)用前景,因此闡明TIFY基因家族對甜菜生長發(fā)育的調(diào)控作用具有重要意義。目前,研究甜菜TIFY基因的文獻較少,本研究采用生物信息學手段對BvTIFY基因進行全基因組鑒定,同時分析其基因結(jié)構(gòu)、序列特征、染色體定位、啟動子功能元件、進化關(guān)系及鹽脅迫應(yīng)答模式,為進一步剖析BvTIFY基因的生物學功能提供一定理論參考。
從NCBI數(shù)據(jù)庫(https://ncbi.nlm.nih.gov/)和Pfam數(shù)據(jù)庫(http://pfam.xfam.org/)中下載甜菜蛋白組數(shù)據(jù)和TIFY結(jié)構(gòu)域(PF06200)隱馬爾科夫文件,利用HMMER軟件篩選甜菜基因組中可能的TIFY蛋白,并提交Pfam、SMART(https://smart.embl.de/)等在線程序驗證保守結(jié)構(gòu)域組成,進一步確定篩選結(jié)果,在NCBI數(shù)據(jù)庫中獲取已鑒定完成的BvTIFY蛋白所對應(yīng)的CDS序列與基因組序列。
1.2.1 基因結(jié)構(gòu)分析 將甜菜TIFY基因家族的CDS序列與基因組序列提交至GSDS(http://gsds.gao-lab.org/)在線程序,來進行TIFY基因內(nèi)含子-外顯子結(jié)構(gòu)的可視化。
1.2.2 序列特征分析 使用ClustalX軟件對甜菜和擬南芥的TIFY蛋白序列進行多序列比對,根據(jù)保守結(jié)構(gòu)域序列特征來劃分甜菜TIFY蛋白的亞家族類型,并上傳至SMART在線數(shù)據(jù)庫來獲取不同結(jié)構(gòu)域的起止位點。
1.2.3 系統(tǒng)進化分析 使用MEGA5軟件對擬南芥AtTIFY、水稻OsTIFY及鑒定得到的甜菜BvTIFY蛋白序列進行多序列比對,以對比結(jié)果構(gòu)建基于最大簡約法(Maximum-parsimony)的系統(tǒng)進化樹,Bootstrap數(shù)值設(shè)為1000,將構(gòu)建結(jié)果提交至Itol(https://itol.embl.de/)在線程序進一步完善。
1.2.4 染色體定位及共線性分析 從NCBI、TAIR(https://www.arabidopsis.org/)、RAP-DB(https://rapdb.d-na.affrc.go.jp/)數(shù)據(jù)庫分別獲取甜菜、擬南芥、水稻的基因組序列和GFF文件。從GFF文件中提取對應(yīng)物種的染色體長度和基因組中TIFY基因的位置信息,利用MCScanX分析法對基因組序列與GFF文件進行比對,以篩選同一或不同物種基因組間的共線性信息,從而預測TIFY基因家族在物種間的復制關(guān)系。所有數(shù)據(jù)通過TBtools[19]軟件進行可視化。
1.2.5 啟動子分析 對甜菜TIFY基因CDS上游2000 bp的片段進行提取,上傳至PlantCARE數(shù)據(jù)庫(http://bioinformatics.psb.ugent.be/webtools/plantcare/h-tml/),來獲取啟動子上的功能元件的類型和數(shù)量信息。
1.2.6 鹽脅迫應(yīng)答分析 實驗室前期測定了甜菜M14品系在對照以及中鹽、高鹽脅迫下的基因表達量數(shù)據(jù),以此為基礎(chǔ)可分析甜菜TIFY基因在鹽脅迫下差異表達水平,使用TBtools軟件制作基因差異表達圖譜。
1.2.7 蛋白互作網(wǎng)絡(luò)預測 將鑒定所得的BvTIFY蛋白序列上傳至STRING數(shù)據(jù)庫(https://string-db.org/cgi-/input?sessionId=balp0yQK5OTf&input_page_active_fo rm=multiple_sequences),來預測BvTIFY蛋白之間潛在的互作關(guān)系以及生物學功能。
通過比對篩選,共從甜菜基因組中鑒定出21個TIFY基因,以BvTIFY來命名,按照不同基因在基因組上的位置進行排序,并提交Expasy(https://web.expasy.org/compute_pi/)計算BvTIFY蛋白的理論分子量和等電點(表1)。其中BvTIFY1、BvTIFY2,BvTIFY3、BvTIFY4,BvTIFY5、BvTIFY6,BvTIFY8、BvTIFY9、BvTIFY10、BvTIFY11、BvTIFY12,BvTIFY16、BvTIFY17分別屬于同一基因的不同轉(zhuǎn)錄本,在基因組上的位置相同,而BvTIFY21在已公布的甜菜參考基因組中尚無準確定位。
表1 BvTIFY基因家族基本信息
BvTIFY基因的內(nèi)含子-外顯子結(jié)構(gòu)可視化結(jié)果如圖1所示。結(jié)合BvTIFY蛋白的進化關(guān)系來看,除同一基因的轉(zhuǎn)錄本具有高度相似的基因結(jié)構(gòu)外,進化距離較近的基因也擁有著較為一致的外顯子構(gòu)成,如BvTIFY15與BvTIFY18。進化距離相對較遠的基因其序列長度和結(jié)構(gòu)都有著明顯差異,表明不同的BvTIFY基因之間有著較高的序列差異。
圖1 BvTIFY基因家族的結(jié)構(gòu)特征
使用SMART數(shù)據(jù)庫鑒定BvTIFY蛋白的保守結(jié)構(gòu)域類型及位點,并結(jié)合Pfam數(shù)據(jù)庫對各保守結(jié)構(gòu)域的注釋信息來區(qū)分BvTIFY蛋白所屬的亞家族。對于PPD亞家族而言,Pfam數(shù)據(jù)庫并無PPD結(jié)構(gòu)域注冊信息,因此將擬南芥PPD亞家族成員AtTIFY4a、AtTIFY4b與甜菜BvTIFY蛋白序列進行比對,以確定甜菜TIFY蛋白中的PPD亞家族成員。經(jīng)過氨基酸序列特征對比,各亞家族成員及其結(jié)構(gòu)域特征如圖2所示。分析發(fā)現(xiàn),BvTIFY1、BvTIFY2、BvTIFY13、BvTIFY15、 BvTIFY16、 BvTIFY17、 BvTIFY18、BvTIFY21屬于JAZ亞家族,具有典型的TIFY結(jié)構(gòu)域和Jas結(jié)構(gòu)域;BvTIFY8、BvTIFY9、BvTIFY10、BvTIFY11、BvTIFY12屬于PPD亞家族,序列特征為氨基端高度保守的PPD結(jié)構(gòu)域;BvTIFY3、BvTIFY4、BvTIFY5、BvTIFY6、BvTIFY14、BvTIFY20屬于ZML亞家族,除TIFY結(jié)構(gòu)域和CCT結(jié)構(gòu)域外,其羧基端具有保守的GATA結(jié)構(gòu)域。此外,BvTIFY7與BvTIFY19屬于TIFY亞家族,因其結(jié)構(gòu)域與其他亞家族TIFY結(jié)構(gòu)域相類似,故未作單獨比對。
圖2 BvTIFY蛋白亞家族成員及結(jié)構(gòu)域特征
以甜菜BvTIFY序列、水稻OsTIFY序列、擬南芥AtTIFY序列構(gòu)建系統(tǒng)發(fā)育樹,如圖3所示。根據(jù)來自不同物種的TIFY蛋白結(jié)構(gòu)域類型可將其分為Ⅰ-Ⅴ組,其中Ⅰ、Ⅲ組對應(yīng)JAZ亞家族,Ⅱ組對應(yīng)PPD亞家族,Ⅳ組對應(yīng)TIFY亞家族,Ⅴ組對應(yīng)ZML亞家族,該分類結(jié)果與進化樹拓撲結(jié)構(gòu)較為一致。
圖3 TIFY家族的系統(tǒng)發(fā)育分析
在篩除同一基因不同轉(zhuǎn)錄本與尚未確認定位信息的BvTIFY21后,對剩余12條甜菜TIFY基因和20條水稻、18條擬南芥的TIFY基因進行染色體定位分析,同時利用MCScanX對擬南芥、水稻和甜菜的基因組做共線性分析,以探究其TIFY基因之間的復制關(guān)系,結(jié)果見圖4。分析發(fā)現(xiàn)除了4號、5號染色體外,其他7條甜菜染色體上均有BvTIFY基因分布,其中1號染色體含有3條BvTIFY基因,2號、3號、6號染色體上各含有1條BvTIFY基因,7號、8號、9號染色體各有2條BvTIFY基因。就物種自身的TIFY基因家族共線性關(guān)系而言,BvTIFY基因間只有一對基因存在復制事件,為BvTIFY15與BvTIFY18,而水稻和擬南芥分別為3對和5對,與二者相比BvTIFY基因間的復制事件較少;對比3個物種的TIFY基因共線性可發(fā)現(xiàn),甜菜與另兩個物種間TIFY基因的共線性要明顯高于自身TIFY基因的共線性,但擬南芥與水稻之間只有兩對TIFY基因存在共線性。
圖4 BvTIFY基因染色體定位及共線性分析
順式作用元件在決定各種壓力下的調(diào)節(jié)作用方面發(fā)揮著重要作用[20]。提取甜菜TIFY基因CDS上游2000 bp片段至PlantCARE進行啟動子上的功能元件分析,結(jié)果見圖5。在甜菜TIFY基因中共鑒定出8類作用元件,分別為茉莉酸甲酯(MeJA)、厭氧誘導(ARE)、干旱(MBS)、光(LRE)、脫落酸(ABRE)、水楊酸(SA)、低溫(LTR)及防御脅迫(TC-rich)響應(yīng)元件。除BvTIFY19外,其他基因都含有4類以上的功能元件。所有甜菜TIFY家族成員都含有光響應(yīng)元件,絕大多數(shù)含有厭氧誘導和脫落酸響應(yīng)元件,大部分成員含有干旱、低溫、水楊酸和茉莉酸甲酯響應(yīng)元件,還有少部分成員擁有防御脅迫元件,說明BvTIFY基因可能參與甜菜非生物脅迫應(yīng)答。
圖5 BvTIFY基因啟動子功能元件分析
利用實驗室前期中鹽(200 mmol/L)及高鹽(400 mmol/L)脅迫下甜菜根、葉的轉(zhuǎn)錄組測序數(shù)據(jù),分析BvTIFY是否參與甜菜中鹽脅迫應(yīng)答。在轉(zhuǎn)錄組測序數(shù)據(jù)中共篩選得到20個甜菜TIFY基因在鹽脅迫下的表達豐度。對200 mmol/L/0 mmol/L、400 mmol/L/0 mmol/L表達量比值做Log2處理來生成表達模式圖,當Log2變化倍數(shù)大于1或小于-1時表明基因差異表達,結(jié)果見圖6。在甜菜葉片中,僅高鹽脅迫下BvTIFY13存在差異表達,其他成員表達水平變化皆不明顯;在根中,BvTIFY13和BvTIFY15在中鹽高鹽脅迫下均顯著上調(diào)表達,可能為甜菜耐鹽關(guān)鍵基因,BvTIFY5、BvTIFY6、BvTIFY20與BvTIFY7在中鹽及高鹽脅迫下也明顯存在表達水平變化,而BvTIFY1、BvTIFY2在高鹽脅迫下顯著下調(diào)表達。此外,根中BvTIFY19在中鹽和高鹽脅迫下分別上調(diào)和下調(diào)表達,反映出其對高鹽環(huán)境的不耐受,只能響應(yīng)中鹽脅迫。
圖6 BvTIFY基因鹽脅迫應(yīng)答分析
使用STRING數(shù)據(jù)庫對21個BvTIFY蛋白的互作網(wǎng)絡(luò)進行預測,結(jié)果如圖7所示。網(wǎng)絡(luò)中的BvTIFY蛋白除BvTIFY6以外都屬于JAZ亞家族;與其互作的蛋白中,XP_010690074.1為COI1蛋白,XP_010696336.1為bHLH13,屬于llld亞組bHLH轉(zhuǎn)錄因子,XP_010677236.1為MYC2轉(zhuǎn)錄因子,XP_010694121.1屬于細胞色素P450家族蛋白,XP_010688282.1屬于Ninja家族蛋白。根據(jù)以上結(jié)果可推測,BvTIFY2、BvTIFY18等JAZ亞家族蛋白通過彼此互作形成復合物來行使功能。
圖7 BvTIFY蛋白互作網(wǎng)絡(luò)
本研究通過生物信息學研究方法,共鑒定出21個BvTIFY蛋白,包括2個TIFY亞家族蛋白、8個JAZ蛋白、6個ZML蛋白、5個PPD蛋白,對各亞家族成員進行多序列比對和保守結(jié)構(gòu)域分析,結(jié)果與前人研究相一致[9-14]。基因復制事件在植物功能多樣性和進化機制中起著重要作用[21],因此可通過分析不同基因組中基因排列順序的一致性(即共線性分析)來體現(xiàn)基因組中的復制事件[22]。對擬南芥、水稻、甜菜基因組的共線性分析發(fā)現(xiàn),大多數(shù)TIFY基因并非來源于基因復制,這表明在進化上,TIFY基因的產(chǎn)生比擬南芥、水稻、甜菜的物種形成更為古老[23]。系統(tǒng)進化分析發(fā)現(xiàn),不同物種同一亞家族的TIFY蛋白的親緣關(guān)系較近,而同一物種不同亞家族的TIFY蛋白親緣性較差,這也表明TIFY蛋白的分化早于擬南芥、水稻、甜菜的進化,在這些物種分化之前就已呈現(xiàn)出一定的多樣性。此外,水稻TIFY蛋白不含有PPD亞家族成員,鑒于水稻屬單子葉植物,可推測PPD亞家族成員是在單子葉植物向雙子葉植物進化的過程中出現(xiàn)的[24]。
通過BvTIFY基因的鹽脅迫應(yīng)答分析可發(fā)現(xiàn),BvTIFY15與BvTIFY18這對存在復制關(guān)系的基因其表達模式明顯不同,其原因可能為同源基因形成后表達特性發(fā)生了變化。同源基因分化后的功能分化是植物適應(yīng)外界環(huán)境的一種進化機制[25],這種基因表達多樣性規(guī)律有助于減少同源基因間的功能冗余。對其他非復制基因進行比較發(fā)現(xiàn),它們具有類似的表達模式,說明這些基因的表達模式發(fā)生了趨同現(xiàn)象[26]。
BvTIFY蛋白互作網(wǎng)絡(luò)預測結(jié)果表明,BvTIFY的JAZ亞家族成員與COI1蛋白、MYC2轉(zhuǎn)錄因子、Ninja蛋白、細胞色素P450蛋白和bHLH13蛋白構(gòu)成了一個調(diào)控植物體JA水平的復雜網(wǎng)絡(luò)。前人研究發(fā)現(xiàn),植物JA信號通路的核心組件為COI1-JAZ-MYC2復合體[27],正常情況下不執(zhí)行功能,其中的COI1-JAZ可作為共受體形式感知JA信號,并形成COI1-JAZ受體復合物來降解JAZ蛋白,從而釋放被禁錮的MYC2轉(zhuǎn)錄因子,調(diào)控植物體JA水平[28]。JAZ蛋白對MYC2轉(zhuǎn)錄因子活性的抑制是通過與Ninja阻遏蛋白的相互作用來實現(xiàn)的[29],而bHLH13作為llld亞組bHLH轉(zhuǎn)錄因子,單獨存在時也能抑制JA信號[30]。此外,細胞色素P450家族蛋白能夠催化植物體多種物質(zhì)的代謝,對JA信號調(diào)節(jié)有著一定催化作用[31]。
本研究通過生物信息學技術(shù)對BvTIFY基因進行全基因組鑒定,并對其基因結(jié)構(gòu)、序列特征、染色體定位、啟動子順式作用元件、系統(tǒng)進化、鹽脅迫應(yīng)答模式和蛋白互作網(wǎng)絡(luò)進行分析。研究表明BvTIFY基因間存在較高的特異性,能夠在多種非生物脅迫和激素應(yīng)答中發(fā)揮生物學功能,其中BvTIFY13、BvTIFY15在甜菜鹽脅迫耐受中起到重要作用;此外,BvTIFY蛋白也具有與典型TIFY相似的結(jié)構(gòu)域特征,其JAZ亞家族成員能夠與互作蛋白相作用來調(diào)控植物體JA信號水平。以上結(jié)果可對后續(xù)BvTIFY基因在非生物脅迫下的功能驗證提供理論基礎(chǔ)。