田驕陽,王秋霞,鄭淑文,劉文獻
(蘭州大學草地農(nóng)業(yè)生態(tài)系統(tǒng)國家重點實驗室,蘭州大學農(nóng)業(yè)農(nóng)村部草牧業(yè)創(chuàng)新重點實驗室,蘭州大學草地農(nóng)業(yè)教育部工程研究中心,蘭州大學草地農(nóng)業(yè)科技學院,甘肅 蘭州 730020)
轉(zhuǎn)錄因子(transcription factors)是一類能夠與DNA 特異序列結(jié)合并調(diào)節(jié)翻譯過程的蛋白質(zhì),由轉(zhuǎn)錄調(diào)控區(qū)、核定位信號區(qū)、寡聚位點和DNA 結(jié)合區(qū)組成,通過4 個區(qū)域相互協(xié)同,激活或抑制下游基因轉(zhuǎn)錄[1]。轉(zhuǎn)錄因子能夠參與環(huán)境脅迫響應、代謝調(diào)節(jié)、物質(zhì)生成等生命過程[2],在動植物生長發(fā)育及應激反應中具有重要作用,是深入解析生命活動分子調(diào)控機制的關(guān)鍵環(huán)節(jié)。CPP(cysteine-rich polycomb-like protein)基因家族是一類小轉(zhuǎn)錄因子,廣泛存在于除酵母與原核生物外的各種生物中[3]。CPP 轉(zhuǎn)錄因子中包含一個或兩個富含半胱氨酸的CXC 功能域(PF03638),保守序列的結(jié)構(gòu)為CXCX4CX3YCXCX6CX3CXCX2C,并被一個含有短的保守序列RNPXAFXPK 的基序分隔[3]。CXC 結(jié)構(gòu)域可以通過結(jié)合DNA 對靶基因起調(diào)控作用[4]。突變的CXC 保守結(jié)構(gòu)域失去與DNA 結(jié)合活性,抑制細胞周期進程,導致細胞核形態(tài)異常[5]。CXC 結(jié)構(gòu)域在不同植物中高度保守,可通過DNA 結(jié)合來誘導基因的抑制或表達[6]。隨著植物基因組測序的相繼完成,在全基因組水平對CPP基因家族的鑒定和分析成為可能。截至目前,已在擬南芥(Arabidopsis thaliana)[7]、水稻(Oryza sativa)[7]、大豆(Glycine max)[8]、玉米(Zea mays)[9]、黃瓜(Cucumis sativus)[10]、茶樹(Camellia sinensis)[11]等物種中分別鑒定到8、11、20、13、5、11 個CPP基因,從而為深入解析該基因家族的生物學功能奠定了基礎(chǔ)。
前人研究發(fā)現(xiàn),CPP基因家族在植物生長發(fā)育及響應脅迫過程中具有重要作用。例如,TSO1是在擬南芥中發(fā)現(xiàn)的第一個CPP 轉(zhuǎn)錄因子,在調(diào)節(jié)細胞分裂以及開花中起到重要作用[12-13]。AtTSO1編碼一個花特異性的細胞分裂成分,該基因突變會導致花分生組織細胞分裂過程受到影響,表現(xiàn)為細胞壁形成受阻以及DNA 倍性增加,導致突變體花的細胞核大小和形狀不規(guī)則[12]。另外,TSO1 和MYB3R1 形成一個調(diào)節(jié)模塊,協(xié)調(diào)芽和根組織細胞增殖與分化,造成莖和根分生組織收縮,從而導致地上部分和根部發(fā)育嚴重異常[11]。大豆中的GmCPP1能夠與血紅蛋白基因Gmlbc3的啟動子相互作用,參與共生根瘤中大豆血紅蛋白基因的調(diào)控[14]。GhCPP基因在陸地棉(Gossypium hirsutum)的雌蕊中高度表達,可能參與了花器官和雌蕊發(fā)育的調(diào)控過程。此外,CPP基因家族也在響應多種應激脅迫過程中發(fā)揮功能。通過qRT-PCR 對13 個ZmCPP基因的表達分析表明,大多數(shù)ZmCPP基因的表達在熱應激24 h 和冷應激12 h 后達到峰值[9]。大豆中GmCPP 轉(zhuǎn)錄因子除GmCPP03和GmCPP07外,其余18 個基因均在調(diào)節(jié)熱應激反應中起重要作用[8]。另外,黃瓜CsCPP基因能夠以依賴脫落酸的方式提高植物對逆境的耐性[10]。
蒺藜苜蓿(Medicago truncatula)是一種豆科模式植物,具有基因組?。?70 Mb)、自花授粉、植株再生時間短以及突變體多樣的特點[15]。另外,蒺藜苜蓿與大多數(shù)豆科植物有著較高的遺傳相似性,通過研究蒺藜苜??梢詾槠渌箍浦参铮貏e是紫花苜蓿(Medicago sativa)提供理論依據(jù)[16]。隨著蒺藜苜蓿基因組測序的完成,多種蒺藜苜蓿基因家族,例如LBD 家族[17]、AQPs 家族[18]、FAD 家族[19]被鑒定和系統(tǒng)研究,從而為深入解析蒺藜苜蓿生長發(fā)育調(diào)控及逆境脅迫響應過程提供了重要基因資源。截至目前,蒺藜苜蓿CPP基因家族的相關(guān)研究尚未見報道。本研究以蒺藜苜?;蚪M數(shù)據(jù)為基礎(chǔ),利用生物信息學方法對全基因組水平的蒺藜苜蓿CPP基因家族進行鑒定,進而對不同家族成員的理化性質(zhì)、結(jié)構(gòu)特征、順式作用元件、進化關(guān)系及壓力、染色體位置等進行系統(tǒng)分析。此外,對CPP基因家族在蒺藜苜蓿不同組織及非生物脅迫下的表達模式進行研究,以期為后期深入研究蒺藜苜蓿CPP基因家族功能以及通過基因工程技術(shù)創(chuàng)制高抗逆苜蓿新種質(zhì)提供理論依據(jù)。
本試驗于2020 年7 月-2021 年3 月進行。根據(jù)Pfam(http://pfam. sanger. ac. uk/search)[20]數(shù)據(jù)庫獲得的CPP 的保守結(jié)構(gòu)域(PF03638),從Phytozome 網(wǎng)站(https://phytozome.jgi.doe.gov/pz/portal.html)下載蒺藜苜蓿CPP基因家族的蛋白質(zhì)編碼區(qū)(coding sequence, CDS)和蛋白序列。通過HMMER(http://www.ebi.ac.uk/)[21]驗 證 保 守 結(jié) 構(gòu) 域。在ExPASy 網(wǎng) 站(http://www. expasy. org/)分 析 等 電 點(isoelectric point),分 子 量(molecular weight)和親水指數(shù)(grand average of hydropathicity)等參數(shù)[22]。通過WoLF-PSORT(https://www.genscript.com/wolf-psort.html)網(wǎng)站對MtCPP 蛋白亞細胞定位進行預測分析[23]。
擬南芥、水稻及大豆的CPP 蛋白序列分別從http://www. arabidopsis. org/,http://rice. plantbiology. msu.edu/,http://phyozome. jgi. doe. gov/soybean 下載。利用MEGA 7.0 軟件(http://www. megasoftware. net/)及Bioedit 軟件構(gòu)建系統(tǒng)發(fā)育樹,方法為最大似然法(maximum likelihood estimate),設(shè)置最大循環(huán)數(shù)為1000[24]。利用MCScanX 和TBTools 軟件進行基因區(qū)塊識別并計算同義替換率(the ratio of the number of synonymous substitutions per synonymous site,Ks)、非同義替換率(the ratio of the number of nonsynonymous substitutions per nonsynonymous site,Ka)[25-26]。
利用Mapchart 軟件對MtCPP基因染色體定位進行作圖。通過GSDS 2.0 網(wǎng)站(http://gsds.cbi.pku.edu.cn)分析蒺藜苜蓿的外顯子-內(nèi)含子結(jié)構(gòu)。MtCPP基因的啟動子區(qū)(翻譯起始密碼子上游2000 bp)從蒺藜苜?;蚪M數(shù)據(jù)中獲得,利用PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)對啟動子順式作用元件進行分析。利用MEME(http://meme.nbcr.net/meme/cgibin/meme.cgi)分析蒺藜苜蓿保守結(jié)構(gòu)域,采用TBtools 工具進行作圖[27]。
為分析MtCPP基因在不同器官及非生物脅迫下的表達模式,從Noble 網(wǎng)站(https://mtgea. noble.org/v3/blastt_search_form.php)中獲取不同MtCPP基因探針,并獲得了對應探針在葉、葉柄、葉芽、幼苗、莖、花、莢果、種衣、種子、根等組織中以及干旱脅迫和鹽脅迫下的表達量。干旱處理是對幼苗和根組織干旱脅迫2、3、4、7、10、14 d 以及解除脅迫后1、2、4 d。鹽處理是利用200 mmol·L-1NaCl 對根 組織處理1、2、5、10 和24 h。最后使用TBtools 軟件構(gòu)建表達熱圖。
通過Pfam 結(jié)構(gòu)域搜索最終在蒺藜苜?;蚪M共鑒定出9 個CPP基因家族成員,分別重新命名為MtCPP1~MtCPP9。利用在線網(wǎng)站對MtCPP基因編碼蛋白的長度、分子量、理論等電點、親水性和亞細胞定位進行分析。MtCPP基因的編碼序列長度介于924(MtCPP5)~2604 bp(MtCPP1),蛋白質(zhì)由307(MtCPP5)~867 AA(MtCPP1)個 氨基酸 組 成,分 子 量 為34610.89~93893.24 Da,等 電 點介于4.60~8.93,其 中MtCPP1 和MtCPP3 等電點小于6.5,為酸性氨基酸;MtCPP5、MtCPP6 和MtCPP9 等電點大于8,為堿性氨基酸。此外,MtCPP家族的蛋白質(zhì)親水性范圍為-0.802(MtCPP4)~-0.169(MtCPP5),9 個蛋白質(zhì)均為親水性蛋白質(zhì)。根據(jù)WoLF PSORT 預測,除MtCPP5為葉綠體基因外,其他8 個基因都為核基因(表1)。
表1 MtCPP 家族基本信息Table 1 The basic information of MtCPP gene family in M.truncatula
為了研究MtCPP基因家族成員的系統(tǒng)進化特征,利用MEGA 7.0 軟件構(gòu)建了蒺藜苜蓿與擬南芥、水稻和大豆CPP 家族之間的系統(tǒng)發(fā)育樹(圖1)?;谙到y(tǒng)發(fā)育樹,可將CPP 蛋白分為A、B、C 三組。A 組中包含7 個GmCPP 蛋白、3 個MtCPP 蛋白及1 個OsCPP 蛋白。在A 組中,除了OsCPP4 來源于單子葉植物外,其余蛋白都來源于雙 子葉植物。B 組包含3 個MtCPP 蛋 白、6 個GmCPP 蛋 白、5 個OsCPP 蛋白及4 個AtCPP 蛋白。C 組含有3 個MtCPP 蛋白、7 個GmCPP 蛋白、5 個OsCPP 蛋白及4 個AtCPP 蛋白。由以上 結(jié)果發(fā)現(xiàn),MtCPP基因均勻地分布于3 組中;3 組中均含有單子葉與雙子葉基因,表明CPP基因是在單子葉和雙子葉分化前形成的[7]。在B和C 組中,蒺藜苜蓿的CPP 基因與大豆的遺傳距離較近,如B 組中MtCPP6 與GmCPP5、GmCPP7,C 組中MtCPP1 與GmCPP16、GmCPP17、GmCPP18,表明雙子葉和單子葉植物在分化后沿著不同方向進化[7]。研究表明,A 組中的GmCPP1 可以調(diào)節(jié)豆血紅蛋白的合成[14],因此,同組的蒺藜苜蓿MtCPP基因可能具有類似的功能。C 組中的AtCPP4 和AtCPP5 分別對應SOL1、TSO1基因的蛋白序列,在花器官中表達,并調(diào)控花的發(fā)育[3],因此C 組中的MtCPP基因功能可能與花的發(fā)育有關(guān)。
圖1 MtCPP 基因家族進化分析Fig. 1 The phylogenetic analysis of MtCPP gene family
為了探究MtCPPs 的進化模式、選擇壓力,對MCScanX 篩選出的兩對MtCPP同源基因(MtCPP6和MtCPP9、MtCPP8和MtCPP9)計算非同義/同義替換比(Ka/Ks),結(jié)果如表2 所示,兩對MtCPP基因的Ka都明顯小于Ks,Ka/Ks都小于1,表明在MtCPP基因進化過程中,主要是凈化選擇發(fā)揮作用[28]。
表2 MtCPP 基因進化壓力分析Table 2 Evolutionary stress analysis of MtCPP genes
根據(jù)蛋白序列分析發(fā)現(xiàn)(圖2),大部分MtCPP 中有兩個CXC 保守結(jié)構(gòu)域以及在兩個保守結(jié)構(gòu)域之間的R 基序;兩個CXC 結(jié)構(gòu)域中都富含9 個保守的半胱氨酸(cysteine,Cys),在R 基序中含有相對保守的RNPXAFXPK 序列。有研究表明CXC 結(jié)構(gòu)域可以結(jié)合特定DNA 序列[13]。另外,并不是所有MtCPP 都具有兩個CXC 保守結(jié)構(gòu)域,其中MtCPP2 缺少CXC1 結(jié)構(gòu)域,并且在CXC1 區(qū)域具有較多的冗余氨基酸序列,這與前人研究結(jié)果相同[7]。MtCPP5 缺少CXC2 部分序列;MtCPP3 的CXC2 保守結(jié)構(gòu)域較短,其原因為N 端丟失了含有3 個保守半胱氨酸的11 個氨基酸序列;缺失和缺少CXC 結(jié)構(gòu)域可能會影響基因功能的發(fā)揮。蒺藜苜蓿MtCPP 家族的CXC1 結(jié)構(gòu)域保守性高于CXC2 結(jié)構(gòu)域,這一結(jié)果與水稻[29]、擬南芥[29]、茶樹[11]等的研究結(jié)果一致。
圖2 MtCPP 氨基酸序列比對Fig. 2 Multiple alignments of the amino acid sequences of MtCPPs
為了進一步驗證CPP 轉(zhuǎn)錄因子在蒺藜苜蓿中的保守結(jié)構(gòu)域,使用MEME 軟件對蒺藜苜蓿的7 個結(jié)構(gòu)域進行分析(圖3)。結(jié)果表明,9 個MtCPP 蛋白的結(jié)構(gòu)域長度介于11~49 AA,分別含有2~7 個保守結(jié)構(gòu)域。除MtCPP2 以外,其他家族成員均含有保守結(jié)構(gòu)域1(位于CXC1 的N 端);除MtCPP5 以外,其他家族成員均含有保守結(jié)構(gòu)域5(位于CXC1 的C 端)。保守結(jié)構(gòu)域2 和7 在多個MtCPP 蛋白中存在。雖然MtCPP基因家族在進化過程中發(fā)生分化,但一些基序在特定的亞家族中具有保守性,例如,MtCPP6、MtCPP8、MtCPP9 三個成員之間以及MtCPP1、MtCPP4、MtCPP7 三個成員之間均具有相同的保守結(jié)構(gòu)域。
圖3 基于綜合系統(tǒng)發(fā)育樹的MtCPPs 特征分析Fig. 3 Characteristic features of the MtCPPs based on the comprehensive phylogenetic tree
為進一步了解MtCPP基因的結(jié)構(gòu)差異,進一步比較了MtCPP的全長基因序列及結(jié)構(gòu)差異(圖4)。結(jié)果表明,MtCPP基因家族片段長度差異較大,MtCPP5的片段長度最短,MtCPP2的片段長度最長。MtCPP基因內(nèi)含子數(shù)目在6~16 個之間,外顯子數(shù)目在7~17 個之間。同一亞組的內(nèi)含子數(shù)目相近,如MtCPP6與MtCPP9都具有6 個內(nèi)含子;MtCPP1和MtCPP7基因結(jié)構(gòu)特征類似,但MtCPP7較MtCPP1缺少1 個內(nèi)含子。
圖4 MtCPP 系統(tǒng)發(fā)育關(guān)系及基因結(jié)構(gòu)分析Fig. 4 Phylogenetic relationships and gene structure of MtCPP genes
轉(zhuǎn)錄因子通過與啟動子特定序列結(jié)合對基因轉(zhuǎn)錄的起始與表達進行調(diào)控,進而在調(diào)控植物生長發(fā)育及響應逆境脅迫過程中發(fā)揮重要作用。為了預測MtCPP基因家族成員在響應逆境脅迫方面的潛在功能,通過PlantCare 網(wǎng)站(http://www.bioinformatics.psb.ugent.be/webtools/plantcare/html/)分析了不同MtCPP家族成員2000 bp 長度啟動子中的順式作用元件[30]。結(jié)果如圖5 所示,以激素調(diào)節(jié)和逆境脅迫為篩選條件,共在9 個基因啟動子中篩選了15 種順式作用元件,分別為無氧誘導(ARE、GC-motif)、水楊酸反應(TCA-element)、防御和壓力反應(TC-rich repeats)、茉莉酸甲酯反應(CGTCA-motif、TGACG-motif)、干旱誘導(MBS)、類黃酮生物合成基因調(diào)控(MBSI)、脫落酸反應(ABRE)、赤霉素反應(GARE-motif、P-box、TATC-box)、創(chuàng)傷反應(WUN-motif)以及生長素反應(AuxRR-core、TGA-element)。結(jié)果表明,平均每個基因中含有7 個順式作用元件。其中,MtCPP5和MtCPP6含有最多與激素調(diào)節(jié)和逆境脅迫相關(guān)的順式作用元件(13 個),MtCPP3中順式作用元件最少(2 個);MtCPP1、MtCPP2、MtCPP5、MtCPP6中有較多的無氧誘導元件,MtCPP5和MtCPP7中有較多的創(chuàng)傷誘導元件。控制類黃酮生物合成基因啟動子調(diào)控元件僅在MtCPP3中存在。具有干旱誘導元件的基因有MtCPP2、MtCPP5、MtCPP6、MtCPP7;MtCPP4、MtCPP5、MtCPP9具有脫落酸誘導元件,而MtCPP7和MtCPP8啟動子中具有生長素誘導元件。
圖5 MtCPP 基因啟動子順式作用元件分析Fig. 5 The analysis of cis-elements in the promoters of MtCPP genes
通過分析蒺藜苜蓿GFF3 文件獲取9 個MtCPP基因的染色位置進行染色體定位。結(jié)果如圖6 所示,9 個MtCPP定位在6 條染色體上。其中,4 個基因(MtCPP1、MtCPP2、MtCPP3、MtCPP4)定位在1 號染色體上;2、3、5、6、8 號染色體上都包含一個基因。相較于其他染色體,染色體1 上存在密度較大的基因簇,其中,MtCPP3與MtCPP4為串聯(lián)重復。基于基因重復分析,在MtCPP6與MtCPP9、MtCPP8和MtCPP9之間發(fā)生了兩個片段重復事件,預測這些基因在進化過程中可能來源于片段重復與串聯(lián)重復。
圖6 MtCPP 基因家族共線性分析Fig. 6 The collinearity analysis of MtCPP gene family
為了進一步解析MtCPP基因的表達模式,基于蒺藜苜蓿探針提取了9 個MtCPP基因不同組織、相同組織不同時期以及逆境脅迫下的56 個表達芯片數(shù)據(jù)[31]并進行熱圖制作,基因表達強度用紅-黃-藍聚類圖指示。從紅色到黃色最后到藍色,基因的表達量逐漸降低,結(jié)果如圖7 所示。在營養(yǎng)器官及發(fā)育時期特異性方面,根據(jù)聚類分析可將9 個基因劃分為兩類(圖7A),MtCPP1~MtCPP4為Ⅰ類,MtCPP5~MtCPP9為Ⅱ類。Ⅰ類基因在根中相對表達量較高,表明Ⅰ類基因主要為根表達基因。Ⅰ類中只有MtCPP1基因在種衣中表達量較高,Ⅱ類中除MtCPP5基因外,其余4 個基因在種衣中表達量均較高。在莢果中,Ⅰ類基因表達量較高,Ⅱ類基因中除了MtCPP5,其余基因表達量均較低。MtCPP1、MtCPP2、MtCPP5和MtCPP8基因在種子授粉后表達量在種子中下降,MtCPP2在種子授粉后20 d,達到最低值;MtCPP1、MtCPP5和MtCPP8在種子授粉后36 d 達到最低值,表明這4 個基因可能主要在植物的營養(yǎng)生長過程中發(fā)揮作用。MtCPP3表達量在授粉后上升,可能在植物的生殖生長中發(fā)揮作用。MtCPP5基因主要在葉芽和種子中表達;MtCPP8基因隨著莖的發(fā)育表達量增加;MtCPP9基因在花、葉以及莢果中表達量較高。
圖7 MtCPP 基因不同組織及響應脅迫表達模式分析Fig. 7 Analysis of MtCPP gene expression profiles in different tissues and stress
水分脅迫處理基因表達數(shù)據(jù)分析結(jié)果顯示(圖7B),對幼苗和根脅迫處理后,MtCPP6和MtCPP7基因被誘導表達,并在解除脅迫后表達量降低,表明MtCPP6和MtCPP7基因在響應干旱脅迫方面可能發(fā)揮著重要作用。對根進行干旱脅迫后,MtCPP2和MtCPP5基因表達量升高,可能為根特異性干旱脅迫響應基因。MtCPP4、MtCPP5、MtCPP8、MtCPP9基因在受脅迫后表達量降低,解除脅迫后表達量升高,根中MtCPP1基因受干旱脅迫影響,表明這些基因受干旱脅迫的影響。MtCPP1和MtCPP2基因在幼苗中對干旱脅迫不敏感,MtCPP8基因?qū)Ω母珊得{迫不敏感,表明MtCPP基因在響應干旱過程中具有組織特異性。MtCPP2、MtCPP8在鹽脅迫誘導的條件下表達量升高,表明MtCPP2、MtCPP8是植物響應鹽脅迫的重要基因。MtCPP1、MtCPP5、MtCPP6、MtCPP7基因在鹽脅迫條件下表達量降低,表明鹽脅迫影響著這4 個基因的表達(圖7C)。
CPP基因普遍存在于植物和動物基因組中,截至目前,CPP基因家族的一些成員已經(jīng)在模式植物中進行了廣泛的研究,例如大豆和擬南芥[12,14]。并且發(fā)現(xiàn)CPP家族的基因在調(diào)控生長發(fā)育及響應逆境脅迫過程中具有重要的生物學功能[11]。然而,蒺藜苜蓿MtCPP基因家族尚未進行鑒定,其生物學功能仍不清晰。本研究利用生物信息學方法,在蒺藜苜蓿中共鑒定出9 個CPP家族基因,不均勻分布在蒺藜苜蓿6 條染色體上。其中MtCPP3與MtCPP4為串聯(lián)重復,MtCPP6與MtCPP9、MtCPP8與MtCPP9為片段重復。因此,蒺藜苜蓿CPP基因家族進化過程中,串聯(lián)重復以及片段重復可能起到了重要的促進作用。
CPP基因家族廣泛存在著兩個CXC 保守結(jié)構(gòu)域及保守結(jié)構(gòu)域之間的保守R 基序[4]。其中,CXC 保守結(jié)構(gòu)域廣泛存在于動物和植物中,但動物中的CPP同源基因缺失兩個CXC 保守基序之間的保守R 基序[3]。在兩個CXC結(jié)構(gòu)域中具有9 個保守的半胱氨酸,C1 結(jié)構(gòu)域的保守性大于C2 結(jié)構(gòu)域,該特征廣泛存在于蒺藜苜蓿、水稻[7]、擬南芥[7]、黃瓜[10]等CPP基因家族中。多重序列比對結(jié)果顯示,并非所有的CPP 家族蛋白都有3 個完整的跨膜結(jié)構(gòu)域。蒺 藜 苜 蓿MtCPP5 只 含 有C1 保 守 結(jié) 構(gòu) 域,與 水 稻OsCPP4 相 同[10];MtCPP7 只 含 有C2 結(jié) 構(gòu) 域,與 小 麥(Triticum aestivum)中TaCPP3 和TaCPP4[32]相同;其余7 個MtCPP 均含有C1 和C2 結(jié)構(gòu)域。較多的冗余氨基酸出現(xiàn)在MtCPP2 兩種蛋白C1 結(jié)構(gòu)域的第3 和4 個半胱氨酸殘基之間,而MtCPP3 在C1 的N 端則缺失16 個氨基酸,包括3 個半胱氨酸殘基,與AtCPP6 研究結(jié)果類似[7]。目前,已有研究表明兩個CXC 結(jié)構(gòu)域和兩個結(jié)構(gòu)域之間的保守結(jié)構(gòu)域間存在著高度相關(guān),并共同進化,兩個結(jié)構(gòu)域相互協(xié)同發(fā)揮特定功能,一個結(jié)構(gòu)域中氨基酸序列的變化將導致另一個結(jié)構(gòu)域中的反選擇或補償變化[33],缺失某部分CXC 可能會導致兩個CXC 結(jié)構(gòu)域之間的相互作用及其功能喪失。本研究中MtCPP6 和MtCPP9 來自片段重復,有著相同的保守結(jié)構(gòu)域,并且它們的基因結(jié)構(gòu)也非常相似,推測它們可能具有相同的功能。
為了進一步探究蒺藜苜蓿的進化關(guān)系,本研究通過與其他3 個已鑒定物種的CPP 蛋白的系統(tǒng)進化進行了分析,進而可將MtCPP分為A、B、C 三個類群。在A 組中,除1 個水稻基因外,其他都為大豆和蒺藜苜蓿CPP基因,表明同為豆科植物的CPP家族之間的親緣關(guān)系更為相近。其他兩組中均含有4 個物種基因,以上結(jié)果說明單子葉植物與雙子葉植物擁有共同的進化起源以及不同方向的進化選擇[7]。這種進化關(guān)系在水稻的SAUR基因家族[34]、擬南芥和水稻的Dof基因家族[29]等中都有類似報道。另外,進化關(guān)系相近的蛋白之間表現(xiàn)出更為相近的生物學功能。本研究中,A 組中的大豆CPP1 蛋白具有調(diào)節(jié)豆血紅蛋白合成的功能[14],C 組中擬南芥的SOL1及TSO1在調(diào)節(jié)花器官的發(fā)育方面具有重要功能[12-13],從而為與這些功能已知CPP基因進化關(guān)系更近的蒺藜苜蓿CPP基因的進一步生物學功能解析提供了參考和指導。
赤霉素在響應干旱、水淹、鹽脅迫方面發(fā)揮著重要作用[35]。MtCPP5、MtCPP6和MtCPP7中含有多種與激素相關(guān)的順式作用元件,表明這3 個基因可能受多種激素調(diào)控響應逆境脅迫。CPP基因家族參與植物對多種非生物脅迫的反應。在本研究中,9 個MtCPP基因在干旱和鹽脅迫處理的不同時間點表現(xiàn)出不同的表達模式。在干旱脅迫下,MtCPP2、MtCPP5、MtCPP6和MtCPP7被誘導表達,其中MtCPP2和MtCPP5僅在根中誘導表達。前人研究中,干旱脅迫導致玉米中ZmCPP1.1、ZmCPP7.1、ZmCPP9、ZmCPP12在處理12 h 后上調(diào)表達[9];大豆[8]、黃瓜[10]、茶樹[11]等研究中也表明CPP家族一些基因具有抗旱作用。啟動子是調(diào)控基因表達及響應逆境脅迫的重要順式調(diào)控元件。植物激素在響應脅迫方面發(fā)揮重要作用。干旱條件下,脫落酸調(diào)節(jié)植物氣孔的開閉并參與抗逆基因的表達調(diào)控。MtCPP5基因中含有脫落酸和干旱誘導順式作用元件,可能通過依賴脫落酸的方式發(fā)揮抗旱作用。對茶樹的CsCPP基因進行qRT-PCR 分析,6 個基因在干旱和脫落酸處理后上調(diào)表達,并且啟動子區(qū)分布有抗旱及脫落酸相關(guān)的順式作用元件[11]。黃瓜CsCPP基因的抗逆性依賴于脫落酸調(diào)節(jié)作用[10]。在外源脫落酸的作用下,橡膠樹(Hevea brasiliensis)葉片HbCPP1表達量升高[36]。這些結(jié)論表明,CPP基因家族中的部分基因可能通過脫落酸的調(diào)節(jié)誘導植物發(fā)揮抗旱功能。
CPP基因家族的一些基因與生殖相關(guān)。例如,擬南芥的TSO1影響著胚珠、花粉的生長;SOL1主要在花粉中表達[3];黃瓜CsCPP4參與黃瓜的子房發(fā)育[10];巴西橡膠樹HbCPP1基因隨著花器官的生長表達量增加[36]。本研究發(fā)現(xiàn),MtCPP9在花器官及莢果中大量表達,并隨著生殖階段的變化而在不同生殖器官差異表達,MtCPP9可能參與蒺藜苜?;ㄆ鞴俚陌l(fā)育以及生殖調(diào)控過程。B 類基因除MtCPP5以外,其他基因均可能參與種皮的形成,可能在生殖生長的后期發(fā)揮重要作用。另外,CPP基因在植物的營養(yǎng)生長方面也起到重要作用,例如,TSO1與MYB3R1結(jié)合共同調(diào)節(jié)擬南芥根和芽的分化[14];北美鵝掌楸(Liriodendron tulipifera)中LtTCX2基因在葉中大量表達;大豆中GmCPP16在幼嫩葉片和根瘤中特異表達[8]。本研究發(fā)現(xiàn)MtCPP3、MtCPP8、MtCPP9分別在根、莖、葉中大量表達,暗示這些MtCPP基因可能對營養(yǎng)生長發(fā)育過程具有重要調(diào)控作用。
本研究在全基因組水平首次鑒定分析了蒺藜苜蓿的9 個CPP基因,發(fā)現(xiàn)MtCPP基因中存在著CXC 保守結(jié)構(gòu)域,可能為MtCPP基因發(fā)揮功能的關(guān)鍵因素。系統(tǒng)發(fā)育分析表明MtCPP基因與大豆CPP基因親緣關(guān)系較近。此外,9 個MtCPP基因表達模式具有一定的時空特異性,并具有響應干旱和鹽脅迫的特性。本研究結(jié)果可為進一步研究MtCPP在植物逆境響應中的調(diào)控機制和功能提供基礎(chǔ),也可為在其他豆科植物,特別是在紫花苜蓿中鑒定和分析CPP家族基因功能提供一定參考。