葉方婷,潘鑫峰,毛志君,李兆偉,范凱
睡蓮轉(zhuǎn)錄因子bZIP家族的分子進(jìn)化以及功能分析
葉方婷,潘鑫峰,毛志君,李兆偉,范凱
福建農(nóng)林大學(xué)農(nóng)學(xué)院/作物遺傳育種與綜合利用教育部重點(diǎn)實(shí)驗(yàn)室,福州 350002
【】基于睡蓮基因組鑒定睡蓮bZIP(basic leucine zipper)家族成員,并對其進(jìn)行分析,以揭示睡蓮bZIP家族的分子進(jìn)化和功能。從Waterlily Pond數(shù)據(jù)庫獲取睡蓮基因組序列,利用HMMER3.0程序識別睡蓮的bZIP家族成員,并使用CDD程序進(jìn)一步確認(rèn)其含有的保守bZIP結(jié)構(gòu)域,使用IQ-tree軟件構(gòu)建系統(tǒng)進(jìn)化樹。利用ExPASy和SOPMA在線網(wǎng)站進(jìn)行蛋白質(zhì)結(jié)構(gòu)分析,通過MEME程序進(jìn)行保守基序分析,使用MCScan和Circos軟件對基因復(fù)制事件進(jìn)行分析以及可視化展示。從NCBI下載睡蓮轉(zhuǎn)錄組數(shù)據(jù)(SRA Study:SRP222853),用R軟件對睡蓮bZIP家族成員表達(dá)數(shù)據(jù)的Pearson相關(guān)系數(shù)(PCC)進(jìn)行計(jì)算和可視化分析,使用Cytoscape軟件對NcbZIP成員之間的表達(dá)數(shù)據(jù)關(guān)系進(jìn)行分析。從睡蓮基因組中共鑒定出46個(gè)bZIP家族成員,按成員在染色體上的分布命名為—。根據(jù)系統(tǒng)進(jìn)化分析可以將睡蓮bZIP家族成員分為A、B、C、D、E、G、H、I、J和S共10個(gè)亞家族,其中A亞家族所含成員最多(11個(gè)),相同亞家族成員具有相似的保守結(jié)構(gòu)域和基因結(jié)構(gòu)。理化性質(zhì)分析表明,睡蓮bZIP家族成員蛋白質(zhì)長度介于101—1 898 aa,分子量大小介于12.04—214.64 kD。染色體定位分析發(fā)現(xiàn),睡蓮共有14條染色體,46個(gè)bZIP家族成員不均勻地分布在其中的10條染色體上,其中1號染色體上分布最多。睡蓮bZIP基因家族發(fā)生10個(gè)復(fù)制事件,其中9個(gè)片段復(fù)制事件,1個(gè)串聯(lián)復(fù)制事件,A亞家族所含基因復(fù)制事件最多(3次)。對成員在不同組織下的表達(dá)進(jìn)行分析,根據(jù)表達(dá)情況分為Ⅰ、Ⅱ和Ⅲ組,Ⅰ組成員在所有組織中均高度表達(dá),Ⅱ組成員幾乎在所有組織中均不表達(dá),Ⅲ組成員在不同組織中表達(dá)水平各不相同,其中C、D和G亞家族的大部分成員集中在Ⅲ組。通過睡蓮成員表達(dá)量的Pearson相關(guān)系數(shù)分析,發(fā)現(xiàn)與所有成員之間的相關(guān)性最高。在睡蓮基因組中鑒定出46個(gè)bZIP成員,分為10個(gè)亞家族,不均勻地分布在14條染色體上,結(jié)構(gòu)進(jìn)化保守,組織表達(dá)模式多樣。
睡蓮;bZIP家族;分子進(jìn)化;表達(dá)譜;功能分析
【研究意義】睡蓮是基部被子植物,對植物進(jìn)化的研究具有重要意義。睡蓮基因組的破譯,揭示了睡蓮科植物與十字花科植物之間的分化時(shí)間大約為147—185百萬年前,基因組共線性分析為睡蓮發(fā)生全基因組復(fù)制事件提供了證據(jù)[1],這有助于解析睡蓮中基因家族的分子進(jìn)化研究?!厩叭搜芯窟M(jìn)展】在植物界中,轉(zhuǎn)錄因子bZIP(basic leucine zipper)是一類包含眾多成員的家族[2-3]。bZIP家族包含兩個(gè)保守的功能結(jié)構(gòu)域,一個(gè)是由16個(gè)氨基酸殘基組成的基本堿性區(qū)域,另一個(gè)是由1個(gè)七肽重復(fù)的亮氨酸或其他質(zhì)量較大的疏水氨基酸組成的亮氨酸拉鏈二聚體基序區(qū)域[4-5],bZIP家族在植物脅迫應(yīng)答、生物合成等方面發(fā)揮重要作用[6-8]。轉(zhuǎn)錄因子bZIP家族與植物生長發(fā)育有密切關(guān)系。在橄欖(L)中,在果實(shí)快速積油期高度表達(dá),通過比較油分積累的動(dòng)態(tài)變化,發(fā)現(xiàn)4個(gè)與橄欖果實(shí)發(fā)育和油脂合成密切相關(guān)的基因,說明橄欖bZIP成員可能參與果實(shí)的發(fā)育和脂質(zhì)的合成[9]。轉(zhuǎn)錄因子bZIP家族在物質(zhì)積累和脅迫應(yīng)答過程中也發(fā)揮著重要作用。在花生中,發(fā)現(xiàn)bZIP家族中G亞家族成員和可能具有抗鹽脅迫的能力[10]。對菠蘿轉(zhuǎn)錄因子bZIP家族的全基因組分析鑒定以及表達(dá)譜分析,發(fā)現(xiàn)在所有組織中均表達(dá)上調(diào);對菠蘿的根和地上部進(jìn)行抗鹽、干旱、冷和熱脅迫處理后發(fā)現(xiàn),部分bZIP轉(zhuǎn)錄因子在植物遭受脅迫一段時(shí)間后也出現(xiàn)上調(diào)表達(dá)[11]。此外,bZIP成員可能參與許多生物代謝過程。通過對亞洲棉和雷蒙德士棉bZIP蛋白的功能進(jìn)行GO分析預(yù)測,發(fā)現(xiàn)bZIP成員可能參與有機(jī)物代謝過程、初級代謝過程、細(xì)胞代謝過程的調(diào)節(jié)和氮化合物代謝過程等[12]。另外,在柳枝菊中也進(jìn)行了全基因組分析,并對bZIP可能參與的表達(dá)和功能進(jìn)行了預(yù)測[13]。【本研究切入點(diǎn)】目前未見對睡蓮bZIP家族的研究,本研究利用全基因組分析的方法對睡蓮bZIP家族分子進(jìn)化及功能進(jìn)行探索?!緮M解決的關(guān)鍵問題】本研究通過構(gòu)建系統(tǒng)發(fā)育樹對睡蓮與擬南芥bZIP家族同源關(guān)系進(jìn)行比較基因組學(xué)研究,進(jìn)而對睡蓮bZIP成員基因結(jié)構(gòu)、保守基序和基因復(fù)制事件進(jìn)行分析,揭示bZIP成員的分子進(jìn)化歷程,同時(shí)通過分析睡蓮中bZIP成員表達(dá)量、啟動(dòng)子元件等,為闡明睡蓮轉(zhuǎn)錄因子bZIP家族的功能奠定一定的基礎(chǔ)。
試驗(yàn)于2020—2021年在福建農(nóng)林大學(xué)農(nóng)學(xué)院作物遺傳育種與綜合利用教育部重點(diǎn)實(shí)驗(yàn)室進(jìn)行。
從Waterlily Pond數(shù)據(jù)庫(http://waterlily.eplant.org)獲取睡蓮基因組序列,隨后使用HMMER3.0程序進(jìn)行HMM搜索,從Pfam數(shù)據(jù)庫(https://pfam.xfam.org/)中獲得bZIP結(jié)構(gòu)域的HMM模型(PF00170),用以識別睡蓮的bZIP成員。擬南芥的bZIP成員主要從TAIR數(shù)據(jù)庫中下載獲得(https://www.arabidopsis.org/)。所有的bZIP成員均使用CDD(https://www.ncbi.nlm. nih.gov/cdd)程序,進(jìn)一步確保每一個(gè)候選基因均含有保守的bZIP結(jié)構(gòu)域。
采用MAFFT v7.453對所有bZIP序列進(jìn)行氨基酸序列比對分析,然后使用IQ-tree v2.0.7軟件構(gòu)建系統(tǒng)發(fā)育樹,應(yīng)用ModelFinder程序選擇最佳模型,bootstrap值設(shè)置為1 000。使用MEGA v10.1.8軟件對系統(tǒng)發(fā)育樹進(jìn)行可視化分析,并使用在線工具ExPASy網(wǎng)站(http://web.expasy.org/protparam/)和SOPMA網(wǎng)站(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)對睡蓮bZIP成員的一級結(jié)構(gòu)和二級結(jié)構(gòu)進(jìn)行分析。
擬南芥和睡蓮bZIP成員的保守基序通過在線工具M(jìn)EME(http://meme-suite.org/tools/meme)進(jìn)行鑒定,設(shè)置參數(shù)與前人研究類似[14]。從Waterlily Pond數(shù)據(jù)(http://waterlily.eplant.org)中下載睡蓮bZIP成員的注釋文件,從中提取基因結(jié)構(gòu)和染色體位置信息,并通過使用TBtools v1.068軟件對保守基序、基因結(jié)構(gòu)和染色體定位信息進(jìn)行可視化展示。
本研究從睡蓮基因組數(shù)據(jù)庫中提取NcbZIP成員上游的2 000 bp序列,用PlantCARE數(shù)據(jù)庫(http:// bioinformatics.psb.ugent.be/webtools/plantcare/html/)確定NcbZIP成員啟動(dòng)子中順式調(diào)控元件,最后使用TBtools v1.068軟件進(jìn)行可視化分析。
使用MCScan(https://github.com/tanghaibao/jcvi/ wiki/MCscan-Python version)軟件對NcbZIP成員的基因復(fù)制事件進(jìn)行分析,基因復(fù)制關(guān)系使用Circos v0.67軟件進(jìn)行可視化展示。利用TBTools v1.068軟件估計(jì)非同義替換率(Ka)、同義替換率(Ks)及其比值(Ka/Ks)。
本研究從NCBI數(shù)據(jù)庫(https://www.ncbi.nlm.nih. gov/)下載了睡蓮不同組織(成熟葉、幼葉、成熟莖、幼莖、花、萼片和心皮)的RNA-seq轉(zhuǎn)錄組數(shù)據(jù)(SRA Study:SRP222853),下載的RNA-Seq數(shù)據(jù)主要通過之前的轉(zhuǎn)錄組數(shù)據(jù)處理方法進(jìn)行數(shù)據(jù)分析[15]。睡蓮中bZIP成員的表達(dá)水平通過FPKM值進(jìn)行l(wèi)og2(FPKM+1)轉(zhuǎn)換獲得。在RStudio中使用ComplexHeatmap v2.4.2軟件包對NcbZIP成員的表達(dá)水平進(jìn)行聚類分析,同時(shí)使用ggcorrplo v0.1.3軟件包對NcbZIP成員之間表達(dá)數(shù)據(jù)的Pearson相關(guān)系數(shù)(PCC)進(jìn)行計(jì)算和可視化分析,并利用Cytoscape v3.7.2軟件對NcbZIP成員之間的表達(dá)數(shù)據(jù)網(wǎng)絡(luò)圖進(jìn)行分析。
在睡蓮中共鑒定出46個(gè)bZIP成員,根據(jù)其在染色體上的位置,將其命名為-。根據(jù)前人對擬南芥的研究結(jié)果進(jìn)行分類[13],可以將睡蓮的46個(gè)bZIP成員共分為10個(gè)亞家族,并命名為A、B、C、D、E、G、H、I、J和S(圖1)。在睡蓮bZIP家族中,A亞家族和D亞家族的bZIP成員數(shù)量最多,分別有11個(gè)成員和7個(gè)成員;在I亞家族中有6個(gè)成員,S亞家族和G亞家族有相同的成員數(shù)量(5個(gè));C、E、H、B和J五個(gè)亞家族分別只有4、3、2、2和1個(gè)bZIP成員,而在F亞家族中沒有發(fā)現(xiàn)睡蓮bZIP成員。
睡蓮bZIP成員的蛋白質(zhì)長度介于101 aa(NcbZIP43)—1 898 aa(NcbZIP13);分子量大小12.04 kD(NcbZIP43)—214.64 kD(NcbZIP13);其中,B亞家族成員的平均蛋白質(zhì)長度(774 aa)和分子量(84.17 kD)最大,H亞家族成員的平均蛋白質(zhì)長度(167 aa)和分子量(18.57 kD)最小。在睡蓮bZIP家族成員中,有一半的pI小于7.0,最低達(dá)4.79;另一半pI值大于7.0,最高可達(dá)9.92(表1)。
本研究在睡蓮bZIP成員中共鑒定到20個(gè)保守基序,大部分睡蓮bZIP成員都含有Motif 1和Motif 7(圖2)。對各組所含基序進(jìn)行統(tǒng)計(jì)分析,發(fā)現(xiàn)D亞家族和I亞家族所含保守基序的種類最多,有7種保守基序;H亞家族和J亞家族的保守基序種類最少,均只有2種。此外,本研究還發(fā)現(xiàn)一些亞家族所特有的基序,如Motif 4、Motif 5、Motif 18和Motif 20為D亞家族所特有,Motif 11、Motif 15和Motif 17只在B亞家族中發(fā)現(xiàn),Motif 16和Motif 19為E亞家族和I亞家族所共有。
圖1 擬南芥和睡蓮bZIP家族的系統(tǒng)發(fā)育分析
表1 本研究中NcbZIP成員的鑒定及結(jié)構(gòu)分析
圖2 睡蓮中bZIP家族保守基序(左)與基因結(jié)構(gòu)(右)的鑒定
最復(fù)雜的基因結(jié)構(gòu)出現(xiàn)在成員(含有16個(gè)外顯子和15個(gè)內(nèi)含子),最簡單的基因結(jié)構(gòu)出現(xiàn)在成員(僅含有1個(gè)外顯子,沒有內(nèi)含子)。D亞家族的基因結(jié)構(gòu)最為復(fù)雜,平均每個(gè)基因含有10個(gè)外顯子;其次是G亞家族,每個(gè)基因平均有7個(gè)外顯子;最簡單的基因結(jié)構(gòu)出現(xiàn)在S亞家族,除了外,大部分成員僅含有1個(gè)外顯子。
睡蓮共有14條染色體,而46個(gè)成員分布在睡蓮10條染色體上,4、7、12和14號染色體上沒有發(fā)現(xiàn)任何睡蓮成員(圖3)。在睡蓮中,不同染色體含有不同數(shù)目的成員。睡蓮1號和10號染色體上分布較多的成員,分別有11個(gè)和8個(gè)成員;在2號和13號染色體上分布較少的成員,均只有1個(gè)成員。在1號染色體的上端和下端均發(fā)現(xiàn)成員的聚集現(xiàn)象,在8號染色體的下端、10號染色體的下端和11號染色體的上端也發(fā)現(xiàn)成員的聚集現(xiàn)象。
在睡蓮bZIP家族中共鑒定出10個(gè)基因復(fù)制事件,其中有9個(gè)片段復(fù)制事件(////////和/)和1個(gè)串聯(lián)復(fù)制事件(/)(圖4-A)。不同亞家族含有不同數(shù)目的基因復(fù)制事件,在A亞家族中有3個(gè)復(fù)制基因事件,在I亞家族中有2個(gè)復(fù)制基因事件,而在C、D、E、G和S亞家族中均只有1個(gè)復(fù)制基因事件(圖4-B)。隨后對這些復(fù)制基因事件的Ka和Ks進(jìn)行分析,通過計(jì)算復(fù)制基因?qū)Φ耐x替換率分布,發(fā)現(xiàn)其約在1.108處Ks達(dá)到峰值(圖4-C)。所有復(fù)制基因?qū)Φ腒a/Ks比值均小于1(表2),因此,以上所有復(fù)制基因?qū)Χ冀?jīng)過純化選擇作用。此外,在睡蓮的bZIP家族中,發(fā)生串聯(lián)復(fù)制事件基因?qū)Φ腒s值基本小于發(fā)生片段復(fù)制事件的基因?qū)Α?/p>
圖3 睡蓮bZIP成員的染色體定位
表2 睡蓮復(fù)制的NcbZIP成員的Ka和Ks分析
A:睡蓮bZIP復(fù)制基因的共線性分析;B:睡蓮bZIP復(fù)制基因的亞家族分布;C:睡蓮bZIP復(fù)制基因的Ks分布,箭頭指向Ks峰值
順式調(diào)控元件中的光反應(yīng)、植物激素和高溫/低溫脅迫等調(diào)控元件在植物脅迫應(yīng)答方面起著重要作用[16]。本研究通過PlantCARE數(shù)據(jù)庫分析獲得的睡蓮成員的順式調(diào)控元件,其中包括生長素響應(yīng)元件、水楊酸響應(yīng)元件、赤霉素響應(yīng)元件、茉莉酸甲酯響應(yīng)元件、低溫響應(yīng)元件、ABA響應(yīng)元件、防御和應(yīng)激響應(yīng)元件以及MYB結(jié)合位點(diǎn)(圖5)。其中,茉莉酸甲酯響應(yīng)元件數(shù)量最多,存在于每個(gè)成員中;ABA響應(yīng)元件和茉莉酸甲酯響應(yīng)元件幾乎占所發(fā)現(xiàn)順式調(diào)控元件的一半以上,其中幾乎有一半分布在A、D和G亞家族中;防御和應(yīng)激響應(yīng)元件相對較少,在46個(gè)睡蓮bZIP成員中只發(fā)現(xiàn)14個(gè)防御和應(yīng)激響應(yīng)元件。在B亞家族中生長素響應(yīng)元件最多,E亞家族含有最多的順式調(diào)控元件是ABA響應(yīng)元件。
對睡蓮成員在成熟葉、幼葉、成熟莖、幼莖、花、雄蕊、萼片和心皮中表達(dá)情況進(jìn)行分析,通過基因表達(dá)聚類分析可以將睡蓮成員大致分為3個(gè)組(Ⅰ、Ⅱ和Ⅲ)(圖6)。在Ⅰ組中,14個(gè)成員幾乎在所有組織中均高度表達(dá)。在Ⅱ組中,13個(gè)成員幾乎在所有組織中均不表達(dá);在Ⅲ組中,19個(gè)成員在不同組織中表達(dá)水平各不相同,具有一定的組織特異性,例如,在成熟葉和成熟莖的表達(dá)量最高,僅在花中高表達(dá),而在雄蕊中具有明顯的高表達(dá)。此外,大部分的D亞家族成員集中分布在Ⅲ組,該亞家族在花中均有較高的表達(dá),C亞家族和G亞家族的大部分成員也集中分布在Ⅲ組。
本研究根據(jù)表達(dá)量計(jì)算出睡蓮成員之間的Pearson相關(guān)系數(shù)(PCC)(圖7),發(fā)現(xiàn)在10個(gè)發(fā)生基因復(fù)制事件的基因?qū)χ?,?對基因?qū)Τ收嚓P(guān)關(guān)系,1對基因?qū)Γê停┏守?fù)相關(guān)關(guān)系。隨后對不同亞家族成員的相關(guān)性進(jìn)行分析,發(fā)現(xiàn)E亞家族3個(gè)成員(和)之間的相關(guān)系數(shù)高達(dá)0.707,其次是D亞家族成員的相關(guān)系數(shù)較高(0.444)。此外,本研究對成員之間的相關(guān)性進(jìn)行了研究,發(fā)現(xiàn)與所有成員間的相關(guān)性最高,其次為。對PCC大于0.5的44對成員進(jìn)行分析,發(fā)現(xiàn)與其中21個(gè)成員均有較高的相關(guān)性(圖8)。
圖5 NcbZIP啟動(dòng)子區(qū)域的脅迫響應(yīng)調(diào)節(jié)元件分析
bZIP家族在植物生長發(fā)育、干旱脅迫、鹽脅迫、高溫脅迫等生物學(xué)過程中發(fā)揮著重要的作用[17-21]。本研究在睡蓮中共鑒定了46個(gè)轉(zhuǎn)錄因子bZIP成員,而在水稻中鑒定出89個(gè)bZIP成員[22-23],在大豆中鑒定出160個(gè)bZIP家族成員[24],其中,睡蓮的基因組大小為409 Mb[1],水稻基因組大小是466 Mb[25],大豆的基因組大小為1 100 Mb[26]。睡蓮是古老且保守的植物,所含的bZIP成員數(shù)量相對較少,可能與其基因組大小有關(guān)。此外,在bZIP家族系統(tǒng)發(fā)育分析中,睡蓮bZIP家族的A亞家族和D亞家族所含成員數(shù)最多,其次為I亞家族,而在J亞家族中成員數(shù)量最少,在擬南芥、水稻、棉花中也有類似的分布[27],這表明植物中bZIP家族的亞家族分布具有一定的保守性。睡蓮bZIP家族中共發(fā)現(xiàn)10個(gè)基因復(fù)制事件,不同亞家族發(fā)生基因復(fù)制事件數(shù)不同,因此,基因復(fù)制事件在不同亞家族中發(fā)生的頻率不同可能是導(dǎo)致各亞家族之間成員數(shù)量產(chǎn)生差異的原因之一,相似的結(jié)果也出現(xiàn)在蕎麥bZIP轉(zhuǎn)錄因子家族[28]。另外,在睡蓮bZIP家族中,相同bZIP亞家族具有相似的保守基序分布和基因結(jié)構(gòu)分布,這與bZIP家族成員的系統(tǒng)發(fā)育分析結(jié)果類似。
圖6 睡蓮bZIP成員在不同組織中的表達(dá)模式
通過MCScan軟件分析bZIP成員的基因復(fù)制事件,發(fā)現(xiàn)A亞家族的基因復(fù)制事件發(fā)生的最多,這可能是導(dǎo)致其亞家族成員數(shù)量較多的原因之一,相似的研究結(jié)果也出現(xiàn)在番茄、土豆等植物的bZIP家族[29-30]。對基因復(fù)制事件的Ks值進(jìn)行計(jì)算,發(fā)現(xiàn)大部分基因復(fù)制事件的Ks值集中在1.108附近,由此推測成員的基因復(fù)制事件發(fā)生在睡蓮全基因組復(fù)制事件中。此外,在睡蓮bZIP家族中,串聯(lián)復(fù)制事件的Ks值幾乎比所有片段復(fù)制事件的Ks值小,說明串聯(lián)復(fù)制事件發(fā)生的時(shí)間是在片段復(fù)制事件后,這表明在睡蓮中大規(guī)模發(fā)生的片段復(fù)制事件可能早于小規(guī)模發(fā)生的串聯(lián)復(fù)制事件。與此同時(shí),在睡蓮bZIP家族中,有9個(gè)片段復(fù)制事件和1個(gè)串聯(lián)復(fù)制事件,說明在睡蓮bZIP家族的擴(kuò)增中,片段復(fù)制事件是bZIP成員擴(kuò)增的主要原因。此外,所有基因復(fù)制事件的Ka/Ks值均小于1,說明所有基因復(fù)制事件都經(jīng)歷純化選擇作用,且大部分復(fù)制基因?qū)Φ腜CC值都大于0,即呈正相關(guān)性,類似的現(xiàn)象也出現(xiàn)在大豆PP2C(蛋白磷酸酶2C)家族[31]、玉米NAC家族[14]、棉花KUP家族[32]等作物。
圖7 睡蓮bZIP家族表達(dá)譜的PCC熱圖
本研究對睡蓮bZIP成員啟動(dòng)子的順式調(diào)控元件進(jìn)行分析,發(fā)現(xiàn)成員的啟動(dòng)子區(qū)域中含有最多的響應(yīng)元件為茉莉酸甲酯響應(yīng)元件,其次是ABA響應(yīng)元件,表明成員可能受到茉莉酸甲酯和ABA的調(diào)控。在前人的研究中發(fā)現(xiàn),棉花bZIP家族的A亞家族成員通過ABA介導(dǎo)可提高植株的抗旱性和耐鹽性[33];在擬南芥A亞家族中,植株受脫落酸和非生物脅迫時(shí),可通過ABA響應(yīng)元件來誘導(dǎo)的表達(dá)[4];脫落酸和茉莉酸甲酯是影響植物生長發(fā)育和逆境響應(yīng)的主要信號分子,可以參與植物多種生理過程[34-39]。在甘蔗中,曾發(fā)現(xiàn)ABA和茉莉酸甲酯調(diào)控了8個(gè)甘蔗bZIP成員的表達(dá)[40]。由此推測,睡蓮的A亞家族成員在ABA或應(yīng)激信號傳導(dǎo)中可能具有重要作用。對轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)睡蓮bZIP成員在成熟葉、幼葉、成熟莖、幼莖、花、雄蕊、萼片和心皮的表達(dá)可大致分為Ⅰ、Ⅱ、Ⅲ組。其中,A亞家族一半的成員和E亞家族的3個(gè)成員集中出現(xiàn)在Ⅱ組中,它們在所有組織中均不表達(dá);在甘薯轉(zhuǎn)錄因子bZIP家族的鑒定分析中,E亞家族的大部分成員在花中也不表達(dá)[41]。來自于D亞家族的在花和雄蕊中有較高的表達(dá),與其相同亞家族的擬南芥bZIP成員AT1G08320和AT5G06839參與花藥的發(fā)育[42];此外在S亞家族中,除外,其余成員均在雄蕊和心皮中有較高的表達(dá),表明D和S亞家族的成員可能與花器官的發(fā)育有關(guān)。在對NcbZIP成員表達(dá)量的PCC分析發(fā)現(xiàn),與其他NcbZIP成員的表達(dá)譜之間具有高度的正相關(guān)性,其在擬南芥的同源基因(AT1G43700)可以通過ABA調(diào)控植株的耐旱性[43],其在水稻中的同源基因LOC_Os11g06170可以調(diào)控茉莉酸代謝和信號傳導(dǎo)通路的相關(guān)基因[44],而的啟動(dòng)子元件中含有茉莉酸甲酯響應(yīng)元件最多,其次是ABA響應(yīng)元件,表明可能具有通過ABA和茉莉酸甲酯介導(dǎo)調(diào)控睡蓮非生物脅迫響應(yīng)的功能。
圖8 睡蓮bZIP家族成員網(wǎng)絡(luò)關(guān)系圖
本研究在睡蓮中共獲得46個(gè)NcbZIP成員,可以將46個(gè)NcbZIP成員進(jìn)一步分為10個(gè)亞家族,相同亞家族成員具有保守的基因結(jié)構(gòu)和保守的基序分布;在睡蓮中,4號、7號、12號和14號染色體上沒有任何睡蓮bZIP成員的存在,NcbZIP成員在其他10條染色體上存在不均勻分布;片段復(fù)制事件對睡蓮bZIP家族的擴(kuò)增起主要作用;睡蓮bZIP成員啟動(dòng)子區(qū)中含有最多的茉莉酸甲酯和ABA響應(yīng)元件;組織特異性表達(dá)分析發(fā)現(xiàn)各個(gè)成員在不同的組織中表達(dá)不同,可以作為睡蓮育種中一個(gè)具有潛在應(yīng)用價(jià)值的重要候選基因。
[1] ZHANG L S, CHEN F, ZHANG X T, LI Z, ZHAO Y Y, LOHAUS R, CHANG X J, DONG W, HO S Y W, LIU X, SONG A X, CHEN J H, GUO W L, WANG Z J, ZHUANG Y Y, WANG H F, CHEN X Q, HU J A, LIU Y H, QIN Y. The water lily genome and the early evolution of flowering plants. Nature, 2020, 577(7788): 79-84.
[2] DR?GE-LASER W, SNOEK B L, SNEL B, WEISTE C. ThebZIP transcription factor family-an update. Current Opinion in Plant Biology, 2018, 45(Pt A): 36-49.
[3] 劉慧潔, 徐恒, 邱文怡, 李曉芳, 張華, 朱英, 李春壽, 王良超. bZIP轉(zhuǎn)錄因子在植物生長發(fā)育及非生物逆境響應(yīng)的作用. 浙江農(nóng)業(yè)學(xué)報(bào), 2019, 31(7): 1205-1214.
LIU H J, XU H, QIU W Y, LI X F, ZHANG H, ZHU Y, LI C S, WANG L C. Roles of bZIP transcription factors in plant growth and development and abiotic stress response. Acta Agriculturae Zhejiangensis, 2019, 31(7): 1205-1214. (in Chinese)
[4] JAKOBY M, WEISSHAAR B, DR?GE-LASER W, VICENTE- CARBAJOSA J, TIEDEMANN J, KROJ T, PARCY F. bZIP transcription factors in. Trends in Plant Science, 2002, 7(3): 106-111.
[5] 王金英, 丁峰, 潘介春, 張樹偉, 楊亞涵, 黃幸, 范志毅, 李琳, 王穎. 植物bZIP轉(zhuǎn)錄因子家族的研究進(jìn)展. 熱帶農(nóng)業(yè)科學(xué), 2019, 39(6): 39-45.
WANG J Y, DING F, PAN J C, ZHANG S W, YANG Y H, HUANG X, FAN Z Y, LI L, WANG Y. Research progress of bZIP lineage transcription factors in plant. Chinese Journal of Tropical Agriculture, 2019, 39(6): 39-45. (in Chinese)
[6] SORNARAJ P, LUANG S, LOPATO S, HRMOVA M. Basic leucine zipper (bZIP) transcription factors involved in abiotic stresses: A molecular model of a wheat bZIP factor and implications of its structure in function. Biochimica et Biophysica Acta, 2016, 1860(1 Pt A): 46-56.
[7] 崔榮秀, 張議文, 陳曉倩, 谷彩紅, 張荃. 植物bZIP參與脅迫應(yīng)答調(diào)控的最新研究進(jìn)展. 生物技術(shù)通報(bào), 201, 35(2): 143-155.
CUI R X, ZHANG Y W, CHEN X Q, GU C H, ZHANG Q. The Latest Research Progress on the Stress Responses of bZIP Involved in Plants. Biotechnology Bulletin, 2019, 35(2): 143-155. (in Chinese)
[8] DAS P, LAKRA N, NUTAN K K, SINGLA-PAREEK S L, PAREEK A. A unique bZIP transcription factor imparting multiple stress tolerance in Rice. Rice (New York, NY), 2019, 12(1): 58.
[9] RONG S Y, WU Z Y, CHENG Z Z, ZHANG S, LIU H, HUANG Q M. Genome-wide identification, evolutionary patterns, and expression analysis of bZIP gene family in olive (L). Genes (Basel), 2020, 11(5): 510.
[10] WANG Z H, YAN L Y, WAN L Y, HUAI D X, KANG Y P, SHI L, JIANG H F, LEI Y, LIAO B S. Genome-wide systematic characterization of bZIP transcription factors and their expression profiles during seed development and in response to salt stress in peanut. BMC Genomics, 2019, 20(1): 51.
[11] LIU Y H, CHAI M N, ZHANG M, HE Q, SU Z X, PRIYADARSHANI S V G N, LIU L P, DONG G X, QIN Y A. Genome-wide analysis, characterization, and expression profile of the basic leucine zipper transcription factor family in pineapple. International Journal of Genomics, 2020, 2020: 3165958.
[12] AZEEM F, TAHIR H, IJAZ U, SHAHEEN T. A genome-wide comparative analysis of bZIP transcription factors inand(Diploid ancestors of present-day cotton). Physiology and Molecular Biology of Plants, 2020, 26(3): 433-444.
[13] WANG W W, WANG Y F, ZHANG S M, XIE K L, ZHANG C, XI Y J, SUN F L. Genome-wide analysis of the abiotic stress-related bZIP family in switchgrass. Molecular Biology Reports, 2020, 47(6): 4439-4454.
[14] FAN K, WANG M, MIAO Y, NI M, BIBI N, YUAN S N, LI F, WANG X D. Molecular evolution and expansion analysis of the NAC transcription factor in. PLoS One, 2014, 9(11): e111837.
[15] PERTEA M, KIM D, PERTEA G M, LEEK J T, SALZBERG S L. Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown. Nature Protocols, 2016, 11(9): 1650-1667.
[16] CHAI W B, SI W N, JI W, QIN Q Q, ZHAO M L, JIANG H Y. Genome-wide investigation and expression profiling of HD-zip transcription factors in foxtail millet (L.). BioMed Research International, 2018, 2018: 8457614.
[17] YANG Y, YU T F, MA J, CHEN J, ZHOU Y B, CHEN M, MA Y Z, WEI W L, XU Z S. The soybean bZIP transcription factor gene GmbZIP2 confers drought and salt resistances in transgenic plants. International Journal of Molecular Sciences, 2020, 21(2): 670.
[18] 朱蕓曄, 薛冰, 王安全, 王文杰, 周昂, 黃勝雄, 劉永勝. 番茄bZIP轉(zhuǎn)錄因子家族的生物信息學(xué)分析. 應(yīng)用與環(huán)境生物學(xué)報(bào), 2014, 20(5): 767-774.
ZHU Y Y, XUE B, WANG A Q, WANG W J, ZHOU A, HUANG S X, LIU Y S. Comprehensive bioinformatic analysis of bZIP transcription factors in. Chinese Journal of Applied & Environmental Biology, 2014, 20(5): 767-774. (in Chinese)
[19] 王升級, 孫赫, 黨慧. 鹽脅迫條件下楊樹bZIP轉(zhuǎn)錄因子全基因組分析. 山西農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版), 2018, 38(8): 1-7, 14.
WANG S J, SUN H, DANG H. Genome-wide analysis of the bZIP transcription factors inin response to salt stress. Journal of Shanxi Agricultural University (Natural Science Edition), 2018, 38(8): 1-7, 14. (in Chinese)
[20] 高斌, 陳娟娟, 崔順立, 侯名語, 穆國俊, 陳煥英, 楊鑫雷, 劉立峰. 花生bZIP基因家族全基因組鑒定及抗旱表達(dá)分析. 植物遺傳資源學(xué)報(bào), 2020, 21(1): 174-191.
GAO B, CHEN J J, CUI S L, HOU M Y, MU G J, CHEN H Y, YANG X L, LIU L F. Genome-wide identification and expression analysis of bZIP gene family under drought stress in peanut. Journal of Plant Genetic Resources, 2020, 21(1): 174-191. (in Chinese)
[21] BAILLO E H, KIMOTHO R N, ZHANG Z B, XU P. Transcription factors associated with abiotic and biotic stress tolerance and their potential for crops improvement. Genes (Basel), 2019, 10: 771.
[22] E Z G, ZHANG Y P, ZHOU J H, WANG L. Mini review roles of the bZIP gene family in rice. Genetics and Molecular Research, 2014, 13(2): 3025-3036.
[23] PAN F, WU M, HU W F, LIU R, YAN H W, XIANG Y. Genome-Wide Identification and Expression Analyses of the bZIP Transcription Factor Genes in moso bamboo). International Journal of Molecular Sciences, 2019, 20(9): 2203.
[24] ZHANG M, LIU Y H, SHI H, GUO M L, CHAI M N, HE Q, YAN M K, CAO D, ZHAO L H, CAI H Y, QIN Y A. Evolutionary and expression analyses of soybean basic Leucine zipper transcription factor family. BMC Genomics, 2018, 19(1): 159.
[25] YU J, HU S N, WANG J, KA-SHU G, LI S G, LIU B, DENG Y J, DAI L, ZHOU Y, ZHANG X Q, CAO M L, LIU J, SUN J D, TANG J B, CHEN Y J, HUANG X B, LIN W, YE C, TONG W, CONG L J,. A Draft Sequence of the Rice Genome (L. ssp.). Science, 2002, 296(5565): 79-92.
[26] SCHMUTZ J, CANNON S B, SCHLUETER J, MA J X, MITROS T, NELSON W, HYTEN D L, SONG Q J, THELEN J J, CHENG J L, XU D, HELLSTEN U, MAY G D, YU Y, SAKURAI T, UMEZAWA T, BHATTACHARYYA M K, SANDHU D, VALLIYODAN B, LINDQUIST E,. Genome sequence of the palaeopolyploid soybean. Nature, 2010, 463(7278): 178-183.
[27] WEI K F, CHEN J, WANG Y M, CHEN Y H, CHEN S X, LIN Y N, PAN S, ZHONG X J, XIE D X. Genome-wide analysis of bZIP-encoding genes in maize. DNA Research, 2012, 19(6): 463-476.
[28] LIU M Y, WEN Y D, SUN W J, MA Z T, HUANG L, WU Q, TANG Z Z, BU T L, LI C L, CHEN H. Genome-wide identification, phylogeny, evolutionary expansion and expression analyses of bZIP transcription factor family in tartaty buckwheat. BMC Genomics, 2019, 20(1): 483.
[29] LI D Y, FU F Y, ZHANG H J, SONG F M. Genome-wide systematic characterization of the bZIP transcriptional factor family in tomato (L.). BMC Genomics, 2015, 16: 771.
[30] ZHAO P, YE M H, WANG R Q, WANG D D, CHEN Q. Systematic identification and functional analysis of potato (L) bZIP transcription factors and overexpression of potato bZIP transcription factor StbZIP-65 enhances salt tolerance. International Journal of Biological Macromolecules, 2020, 161: 155-167.
[31] FAN K, CHEN Y R, MAO Z J, FANG Y, LI Z W, LIN W W, ZHANG Y Q, LIU J P, HUANG J W, LIN W X. Pervasive duplication, biased molecular evolution and comprehensive functional analysis of the PP2C family in. BMC Genomics, 2020, 21(1): 465.
[32] FAN K, MAO Z J, ZHENG J X, CHEN Y R, LI Z W, LIN W W, ZHANG Y Q, HUANG J W, LIN W X. Molecular evolution and expansion of the KUP family in the allopolyploid cotton speciesand. Frontiers in Plant Science, 2020, 11: 545042.
[33] LIANG C Z, MENG Z H, MENG Z G, MALIK W, YAN R, LWIN K M, LIN F Z, WANG Y A, SUN G Q, ZHOU T, ZHU T, LI J Y, JIN S X, GUO S D, ZHANG R. GhABF2, a bZIP transcription factor, confers drought and salinity tolerance in cotton (L.). Scientific Reports, 2016, 6: 35040.
[34] LIM C W, BAEK W, JUNG J, KIM J H, LEE S C. Function of ABA in stomatal defense against biotic and drought stresses. International Journal of Molecular Sciences, 2015, 16(7): 15251-15270.
[35] NAKASHIMA K, YAMAGUCHI-SHINOZAKI K. ABA signaling in stress-response and seed development. Plant Cell Reports, 2013, 32(7): 959-970.
[36] 郭貴華, 劉海艷, 李剛?cè)A, 劉明, 李巖, 王紹華, 劉正輝, 唐設(shè), 丁艷鋒. ABA緩解水稻孕穗期干旱脅迫生理特性的分析. 中國農(nóng)業(yè)科學(xué), 2014, 47(22): 4380-4391.
GUO G H, LIU H Y, LI G H, LIU M, LI Y, WANG S H, LIU Z H, TANG S, DING Y F. Analysis of physiological characteristics about ABA alleviating rice booting stage drought stress. Scientia Agricultura Sinica, 2014, 47(22): 4380-4391. (in Chinese)
[37] 山雨思, 代歡歡, 何瀟, 辛正琦, 吳能表. 外源茉莉酸甲酯和水楊酸對鹽脅迫下顛茄生理特性和次生代謝的影響. 植物生理學(xué)報(bào), 2019, 55(9): 1335-1346.
SHAN Y S, DAI H H, HE X, XIN Z Q, WU N B. Effects of exogenous methyl jasmonate and salicylic acid on physiological characteristics and secondary metabolism ofunder NaCl stress. Plant Physiology Communications, 2019, 55(9): 1335-1346. (in Chinese)
[38] YU X X, ZHANG W J, ZHANG Y, ZHANG X J, LANG D Y, ZHANG X H. The roles of methyl jasmonate to stress in plants. Functional Plant Biology, 2019, 46(3): 197-212.
[39] HO T T, MURTHY H N, PARK S Y. Methyl jasmonate induced oxidative stress and accumulation of secondary metabolites in plant cell and organ cultures. International Journal of Molecular Sciences, 2020, 21(3): 716.
[40] SCHL?GL P S, NOGUEIRA F T S, DRUMMOND R, FELIX J M, DE ROSA V E, VICENTINI R, LEITE A, ULIAN E C, MENOSSI M. Identification of new ABA- and MEJA-activated sugarcane bZIP genes by data mining in the SUCEST database. Plant Cell Reports, 2008, 27(2): 335-345.
[41] YANG Z M, SUN J, CHEN Y, ZHU P P, ZHANG L, WU S Y, MA D F, CAO Q H, LI Z Y, XU T. Genome-wide identification, structural and gene expression analysis of the bZIP transcription factor family in sweet potato wild relative. BMC Genetics, 2019, 20(1): 41.
[42] MURMU J, BUSH M J, DELONG C, LI S T, XU M L, KHAN M, MALCOLMSON C, FOBERT P R, ZACHGO S, HEPWORTH S R.basic leucine-zipper transcription factors TGA9 and TGA10 interact with floral glutaredoxins ROXY1 and ROXY2 and are redundantly required for anther development. Plant Physiology, 2010, 154(3): 1492-1504.
[43] XU D B, CHEN M, MA Y N, XU Z S, LI L C, CHEN Y F, MA Y Z. A G-protein β subunit, AGB1, negatively regulates the ABA response and drought tolerance by down-regulating AtMPK6-related pathway in. PLoS One, 2015, 10(1): e0116385.
[44] LIU D F, SHI S P, HAO Z J, XIONG W T, LUO M Z. A homologue ofVIP1, may positively regulate JA levels by directly targetting the genes in JA signaling and metabolism pathway in rice. International Journal of Molecular Sciences, 2019, 20(9): 2360.
Molecular Evolution and Function Analysis of bZIP Family in
YE FangTing, PAN XinFeng, MAO ZhiJun, LI ZhaoWei, FAN Kai
College of Agriculture, FuJian Agriculture and Forestry University/Key Laboratory of Ministry of Education for Genetics, Breeding and Multiple Utilization of Crops, Fuzhou 350002
【】The genome-wide analysis of the bZIP family inwas used to identify the bZIP (basic leucine zipper) family members in waterlily, and then which were further analyzed. This study revealed molecular evolution and function of the bZIP family in waterlily.【】The genome sequence ofwas downloaded from Waterlily Pond database. The bZIP members in waterlily were identified by using HMMER 3.0 program, and the conserved bZIP domain was verified by using CDD program. The phylogenetic tree was constructed by the IQ-tree software. The ExPASy and SOPMA online website were performed to analyze protein structure characters. The conserved motifs were identified by using MEME program. The gene duplication events were found and visualized by the MCScan and Circos software. Transcriptome data of NcbZIP members were obtained from the NCBI website (SRA Study: SRP222853). The Pearson Correlation Coefficient (PCC) about the expression levels of the NcbZIP family members was calculated by using R software, and the network of the expression levels in the NcbZIP family was analyzed by using Cytoscape software.】46 bZIP members were identified in. colorata, and were named fromtoaccording to their chromosome distributions. The A subfamily contained the most NcbZIP members (11 NcbZIPs). There were 10 subfamilies (A, B, C, D, E, G, H, I, J and S) according to the phylogenetic analysis. The protein length in the NcbZIP family was from 101 aa to 1 898 aa, and the molecular weight ranged from 12.04 kD to 214.64 kD. The NcbZIP members from same subfamily had the similar distributions of the conserved motifs and gene structures. Waterlily had 14 chromosomes, and 46 NcbZIP members were unevenly distributed across 10 chromosomes. Chromosome 1 had the highest number of NcbZIP members. There were 10 gene duplication events in the NcbZIP family, including nine segmental duplication events and one tandem duplication event. The A subfamily had the most number of the gene duplication events (three). Based on the expression patterns in different tissues, the NcbZIP family could be divided into three groups (I, II and III). Themembers in Group I were highly expressed in all tissues, while themembers in group II were not expressed in almost all tissues. Themembers in group III had tissue-specific expression profiles, and most of NcbZIP members in C, D and E subfamilies belonged to group III. The PPC analysis about the expression levels ofmembers indicatedhad the highest connection with other members.【】46 NcbZIP members were identified in, and were unevenly distributed in 14 chromosomes. The NcbZIP family could be divided into 10 subfamilies with conserved motifs distributions and diverse expression levels. The current study could lay the foundation on the functional analysis of the bZIP family in.
; bZIP family; molecular evolution; expression profile; function analysis
10.3864/j.issn.0578-1752.2021.21.018
2021-01-18;
2021-06-28
國家自然科學(xué)基金(31701470)、中國博士后基金(2017M610388,2018T110637)、福建農(nóng)林大學(xué)杰出青年科研人才計(jì)劃(xjq201917)、福建農(nóng)林大學(xué)科技創(chuàng)新專項(xiàng)基金(CXZX2020007A)、福建省自然科學(xué)基金(2021J01073)
葉方婷,E-mail:fangtingye@163.com。通信作者范凱,E-mail:fankai@fafu.edu.cn
(責(zé)任編輯 趙伶俐)