陳國戶,龐小可,李廣,王浩,3,吳思文,溫宏偉,尹倩,袁凌云,侯金鋒,唐小燕,汪承剛*
(1.安徽農(nóng)業(yè)大學(xué)園藝學(xué)院/安徽省園藝作物育種工程實驗室,安徽 合肥 230036;2.安徽省皖江蔬菜產(chǎn)業(yè)技術(shù)研究院,安徽 馬鞍山 238200;3.山東省濟(jì)寧市魚臺縣農(nóng)業(yè)技術(shù)推廣中心,山東 濟(jì)寧 272300)
轉(zhuǎn)錄因子(transcription factor)是一類特異性蛋白質(zhì)分子,可以與順式作用元件(cis-element)發(fā)生特異性結(jié)合,或與其他蛋白相互作用調(diào)控目的基因的表達(dá)強(qiáng)度,在生命活動中起著重要的作用[1]。轉(zhuǎn)錄因子根據(jù)不同DNA結(jié)合域,可以將其分為NAC(NAM-ATAF1/2-CUC2)、AP2/EREBP(APETALA2/ethylene-responsive element binding proteins)、HB(heparin-binding)、MYB(v-myb avian myeloblastosis viral)、MADS(MCML,AGAMOUS,DEFICIENS,SRF)和SBP(squamosa promoter binding protein)等多個家族[2]。其中,NAC基因家族廣泛存在于各植物中,是植物中最大、最重要的轉(zhuǎn)錄因子之一,參與各種生物過程的調(diào)控[3]。自矮牽牛屬中發(fā)現(xiàn)第1個NAC轉(zhuǎn)錄因子編碼基因NAM后,NAC基因家族已在多種植物中被全基因組鑒定,例如擬南芥有117成員[4],煙草有152個[5],水稻有151個[6],棉花有145個[7],玉米有87個[8]。
NAC基因家族名稱由NAM(矮牽牛無頂端分生組織)、ATAF1/2(擬南芥轉(zhuǎn)錄激活因子1/2)和CUC2(擬南芥杯狀子葉)首字母組合而成[9]。NAC轉(zhuǎn)錄因子蛋白N端有1個保守結(jié)構(gòu)域,該結(jié)構(gòu)域由5個基序(A、B、C、D和E)組成,長度約160個氨基酸,側(cè)翼含有α-螺旋和β-折疊結(jié)構(gòu);其中A、C和D基序高度保守,A可能與NAC蛋白形成二聚體有關(guān),C和D基序存在核定位信號并參與DNA的結(jié)合;B與E亞結(jié)構(gòu)變異較大,可能與NAC基因的功能多樣性密切相關(guān)[10]。NAC轉(zhuǎn)錄因子蛋白C端結(jié)構(gòu)域差異很大,具有轉(zhuǎn)錄激活或抑制活性,參與多種網(wǎng)絡(luò)的調(diào)控[11]。
NAC轉(zhuǎn)錄因子是一種多功能蛋白質(zhì),在調(diào)節(jié)植物生長發(fā)育、次生代謝及脅迫反應(yīng)中具有重要的生物學(xué)功能,如莖尖分生組織、側(cè)根、胚胎、種子發(fā)育[12-14],葉片衰老[15],細(xì)胞周期調(diào)控[16],以及各種應(yīng)激反應(yīng)中激素信號途徑[14]等。NAC轉(zhuǎn)錄因子還在調(diào)控花器官發(fā)育方面發(fā)揮作用。例如,擬南芥AIF(antherindehiscencefactor)在花期發(fā)育過程中異位表達(dá),導(dǎo)致花藥不裂,出現(xiàn)不育表型[17];NST1(NACsecondarywallthickeningpromotingfactor1)和NST2也調(diào)控花藥開裂[18];棉花NAC轉(zhuǎn)錄因子GhFSN5在擬南芥中異源表達(dá),導(dǎo)致擬南芥轉(zhuǎn)基因植株產(chǎn)生較小的莢果以及嚴(yán)重的不育性[19];甘蔗ScNAC23基因在擬南芥中異位表達(dá)加速了轉(zhuǎn)基因植株抽薹、開花和葉片衰老[20];麻黃CcNAC1基因的過表達(dá)加速了植物的生長,促進(jìn)了早期開花,提高了植物的耐旱性[21]。
白菜(Brassicarapa)是十字花科蕓薹屬中最重要的蔬菜之一,在全球范圍內(nèi)廣泛種植和消費[22]。近年來,研究人員對白菜轉(zhuǎn)錄因子家族進(jìn)行了大量的研究[23-25],其中對白菜NAC基因家族在不同發(fā)育階段、環(huán)境脅迫和激素處理下的表達(dá)也進(jìn)行了研究[26]。但NAC轉(zhuǎn)錄因子在應(yīng)答春化反應(yīng)中的表達(dá)分析尚未有報道。本研究通過生物信息學(xué)分析方法對白菜NAC轉(zhuǎn)錄因子進(jìn)行全基因組鑒定,并對其理化性質(zhì)、染色體分布、順式作用元件、系統(tǒng)進(jìn)化樹及共線性等進(jìn)行分析,同時基于轉(zhuǎn)錄組數(shù)據(jù)及RT-qPCR分析其在白菜不同組織及應(yīng)答春化反應(yīng)的表達(dá)模式,旨在為深入探索NAC基因應(yīng)答春化反應(yīng)的分子機(jī)制奠定基礎(chǔ)。
擬南芥基因組數(shù)據(jù)(TAIR10)來源于TAIR數(shù)據(jù)庫;白菜基因組數(shù)據(jù)(V1.5)來源于BRAD數(shù)據(jù)庫;NAC結(jié)構(gòu)域序列文件(PF02365)從Pfam網(wǎng)站下載。白菜不同組織(根、莖、葉、花、莢等)[27]及春化反應(yīng)(JWW春化0、25、30、35、45、50 d;XBJ春化0、10、15、25、40、50 d;4004春化0、35 d)[28-29]RNA-Seq原始數(shù)據(jù)從NCBI GEO與SRA數(shù)據(jù)庫下載。RNA-Seq原始數(shù)據(jù)經(jīng)過Trimmomatics及FastQC質(zhì)控后,利用Hisat2比對至白菜基因組(V1.5)序列,再利用Feature Counts進(jìn)行有參照轉(zhuǎn)錄組定量;基因表達(dá)水平采用FPKM值進(jìn)行計算,差異表達(dá)基因采用DESeq2軟件包進(jìn)行計算[25,30]。
利用HMMER 3.0軟件,以PF02365為模型,對白菜基因組(V1.5)進(jìn)行全基因組搜索;同時利用擬南芥NAC基因家族蛋白序列[4],采用BLASTp技術(shù)對白菜基因組進(jìn)行全基因組同源搜索(top≤5,E<1e-5)。將共同獲得的白菜NAC候選序列,在InterProScan(https://www.ebi.ac.uk/interpro/about/interproscan/)、Pfam(http://pfam.xfam.org/)、SMART(http://smart.embl-heidelberg.de/)、SwissProt(https://www.expasy.org/resources/uniprotkb-swiss-prot)以及NR(https://www.ncbi.nlm.nih.gov/)等數(shù)據(jù)庫中逐一鑒定;鑒定后的NAC基因家族再與白菜BRAD數(shù)據(jù)庫中NAC基因家族成員進(jìn)行比較,對有疑問的基因采用ClustalW及MEGA 7.0軟件構(gòu)建系統(tǒng)發(fā)育樹進(jìn)行鑒定,最終確定白菜NAC基因家族成員。
利用TBtools軟件[31]提取白菜NAC基因家族各基因、蛋白序列以及注釋等信息,并繪制染色體定位圖譜。使用EXPASY在線工具(https://web.expasy.org/compute_pi/),對NAC家族蛋白的相對分子質(zhì)量與等電點等信息進(jìn)行分析。
通過MEME在線工具(http://meme-suite.org/tools/meme),對白菜NAC轉(zhuǎn)錄因子蛋白序列的保守基序進(jìn)行分析,再利用TBtools軟件對白菜NAC轉(zhuǎn)錄因子基因結(jié)構(gòu)及結(jié)構(gòu)域進(jìn)行可視化分析。參考宋蒙飛等[32]的方法,使用ClustalW工具將擬南芥與白菜NAC蛋白序列進(jìn)行比對,并利用MEGA 7.0軟件,采用鄰接法以及泊松校正與成對刪除法(Bootstrap=1 000)構(gòu)建系統(tǒng)進(jìn)化樹。
利用TBtools軟件對白菜及擬南芥NAC基因家族的蛋白序列進(jìn)行all-BLASTp-all分析(top≤5,E<1e-5),采用TBtools軟件中MCScanX工具提取共線性基因?qū)?再利用Circos工具進(jìn)行可視化。
利用白菜不同組織轉(zhuǎn)錄組數(shù)據(jù)[27],分析白菜NAC基因家族的組織表達(dá)特征;利用白菜春化反應(yīng)材料轉(zhuǎn)錄組數(shù)據(jù)[28-29],分析白菜NAC基因家族應(yīng)答春化反應(yīng)關(guān)鍵基因。對NAC基因家族春化反應(yīng)關(guān)鍵基因,利用熒光定量PCR技術(shù)分析其在JWW和XBJ不同春化時間(JWW春化0、25、30、35、45、50 d;XBJ春化0、10、15、25、40、50 d)的相對表達(dá)量[28]。
通過HMMER與BLASTp搜索,對白菜NAC基因家族進(jìn)行全基因組鑒定,經(jīng)過嚴(yán)格篩選,共獲得188個NAC基因家族成員,對其序列進(jìn)行了理化性質(zhì)分析。白菜NAC基因家族堿基與氨基酸長度、相對分子質(zhì)量與等電點等變異較大,NAC基因開放閱讀框(ORF)長度最長為3 522 bp(Bra012470),最短為375 bp(Bra010895),氨基酸長度為124~1 173,相對分子質(zhì)量為(14.43~128.20)×103,等電點(pI)為4.43~9.88(圖1),表明它們可能在不同的微細(xì)胞環(huán)境中發(fā)揮著不同的作用。對其等電點與相對分子質(zhì)量之間關(guān)系進(jìn)行分析,發(fā)現(xiàn)白菜NAC基因家族蛋白相對分子質(zhì)量主要集中在(20~60)×103,且酸性蛋白數(shù)量遠(yuǎn)大于堿性蛋白數(shù)量(圖1)。
圖1 白菜NAC基因家族蛋白等電點與相對分子質(zhì)量分析Fig.1 Putative isoelectric points(pI)and relative molecular weights of NAC gene family proteins in Brassica rapa
如圖2所示:白菜NAC基因家族188個成員不均等分布在10條染色體上。其中,A04號染色體上分布的NAC基因數(shù)量最少,只有5個成員(2.66%);A03號染色體上分布的NAC基因數(shù)量最多,有29個成員(15.4%),說明各染色體上的NAC基因數(shù)量與染色體大小無關(guān)。此外,白菜NAC基因家族中未發(fā)現(xiàn)基因串聯(lián)重復(fù)現(xiàn)象。
圖2 白菜NAC基因家族的染色體定位Fig.2 Chromosomal mapping of NAC family genes in B.rapa
基于白菜NAC基因家族的系統(tǒng)發(fā)育關(guān)系,對白菜NAC基因家族成員的內(nèi)含子/外顯子分布及保守基序進(jìn)行分析,發(fā)現(xiàn)白菜NAC基因家族成員的基因結(jié)構(gòu)及保守基序差異較小,并且基因結(jié)構(gòu)和保守基序決定了其親緣關(guān)系的遠(yuǎn)近(圖3)?;蚪Y(jié)構(gòu)分析表明,白菜NAC基因家族成員含有0~16個數(shù)量不等的內(nèi)含子;其中,4個成員(Bra004575、Bra004579、Bra033405、Bra036034)不含內(nèi)含子,1個成員(Bra012470)含有16個內(nèi)含子,其余大部分成員僅含有2~6個內(nèi)含子,并且聚集在一起的NAC基因具有相似的結(jié)構(gòu)。保守基序分析表明,白菜NAC基因家族成員基序結(jié)構(gòu)與分布高度相似,N端結(jié)構(gòu)域非常保守,絕大部分成員N端均含有motif 2、motif 3、motif 4、motif 5(NAC基因家族的基本特征),說明這些基序是NAC蛋白功能所必需的。
圖3 白菜NAC基因家族保守基序及基因結(jié)構(gòu)分析Fig.3 Conserved motif and gene structure analysis of NAC gene family in B.rapa
對白菜和擬南芥NAC家族成員蛋白的氨基酸序列進(jìn)行系統(tǒng)進(jìn)化樹分析,結(jié)果(圖4)表明,188個BrNAC與AtNAC成員共分成7個亞簇,其中A亞簇成員數(shù)量最多,含有66個BrNAC與35個AtNAC成員;B亞簇含有41個BrNAC與18個AtNAC成員;C亞簇含有7個BrNAC與8個AtNAC成員;D亞簇含有 47個BrNAC與20個AtNAC成員;E亞簇含有20個BrNAC與8個AtNAC成員;F亞簇含有5個BrNAC與3個AtNAC成員;G亞簇成員數(shù)量最少,僅含有2個BrNAC與2個AtNAC成員。各簇中BrNAC與AtNAC成員數(shù)量比值為1∶1~2.5∶1,表明白菜和擬南芥具有較近的親緣關(guān)系,且兩者之間存在著一些關(guān)系密切的同源NAC基因。
圖4 白菜與擬南芥NAC基因家族系統(tǒng)進(jìn)化樹分析Fig.4 Phylogenetic tree of NAC gene family from B.rapa and Arabidopsis thaliana
由圖5可見:白菜NAC基因家族188個成員中,共有155對旁系同源基因?qū)?其中89對存在著單個基因?qū)?yīng)多個基因的情況(1∶1~1∶4),表明白菜NAC家族在發(fā)育進(jìn)化過程中發(fā)生了大量的基因復(fù)制現(xiàn)象。白菜與擬南芥NAC基因家族之間,同樣存在著大量的直系同源基因?qū)?160個BrNAC基因與88個AtNAC基因組成228個共線性基因?qū)?圖6),表明這些基因?qū)赡軄碜酝蛔嫦取?/p>
如圖7所示:白菜NAC基因家族188個成員中,大部分成員在白菜不同組織中有轉(zhuǎn)錄表達(dá)(圖7-A);對各組織FPKM>10的BrNAC基因進(jìn)行分析,發(fā)現(xiàn)僅有13個BrNAC成員在各組織中有較高的表達(dá)豐度(圖7-B),表明這些基因可能在白菜整個生長發(fā)育階段發(fā)揮著重要的作用。此外,在高轉(zhuǎn)錄豐度成員中,有21個成員在花與莢中特異表達(dá),有6個成員在根中特異表達(dá),表明這些特異表達(dá)BrNAC基因具有較強(qiáng)的組織表達(dá)特異性,可能對促進(jìn)特定組織的發(fā)育起著重要的作用。
圖5 白菜NAC基因?qū)?fù)制事件分析Fig.5 Analysis of duplicated NAC gene pairs in B.rapa
圖6 擬南芥(Chr1—Chr5)與白菜(A01—A10)NAC基因家族的共線性分析Fig.6 Synteny analysis of NAC gene family between A.thaliana(Chr1-Chr5)and B.rapa(A01-A10)
圖7 白菜NAC家族基因的組織表達(dá)模式分析[log2(FPKM)](A)及各組織中 高表達(dá)基因(FPKM>10)韋恩圖分析(B)Fig.7 Expression analysis of NAC genes in different tissues based on RNA-Seq[log2(FPKM)](A) and Venn analysis of high-expression genes(FPKM>10)in different tissues(B)
利用白菜春化反應(yīng)轉(zhuǎn)錄組數(shù)據(jù)分析BrNAC差異表達(dá)基因,結(jié)果(圖8)表明,在白菜JWW、XBJ與4004材料春化轉(zhuǎn)錄組數(shù)據(jù)中,差異表達(dá)BrNAC基因共有64個,其中共有28個基因至少在2個材料中差異表達(dá),說明這些BrNAC基因可能與春化反應(yīng)相關(guān)。在28個應(yīng)答春化反應(yīng)差異表達(dá)基因中,6個BrNAC基因下調(diào)表達(dá),22個BrNAC基因上調(diào)表達(dá)。
圖8 白菜NAC基因家族應(yīng)答春化反應(yīng)分析Fig.8 Analysis of NAC gene family responsed to vernalization in B.rapa A. 白菜NAC基因應(yīng)答春化反應(yīng)DEG表達(dá)分析;B. 白菜材料 JWW、XBJ和4004中NAC基因應(yīng)答春化反應(yīng)DEG韋恩圖分析。A. Expression analysis of BrNAC genes responsed to vernalization;B. Venn analysis of BrNAC genes responsed to vernalization among Chinese cabbage materials JWW,XBJ and 4004.
對JWW與XBJ材料中差異表達(dá)基因,分別進(jìn)行表達(dá)趨勢分析,結(jié)果如圖9所示。JWW與XBJ這2個材料有相同的顯著富集的趨勢(P<0.05)。白菜NAC基因家族成員表達(dá)豐度,隨春化時間的延長,2個材料共有16個基因逐漸上調(diào)表達(dá)(趨勢7),分別有14個基因在春化25 d(JWW)及22個基因在春化10 d(XBJ)時豐度達(dá)到最大(趨勢6)。此外,在顯著富集趨勢中,JWW與XBJ兩個材料共同有BrNAC基因 12個,其中5個BrNAC基因與春化密切相關(guān),表明這些基因為白菜NAC家族應(yīng)答春化關(guān)鍵基因。
圖9 白菜JWW和XBJ NAC基因應(yīng)答春化反應(yīng)DEG表達(dá)趨勢(A、B)及韋恩圖(C)分析Fig.9 DEG expression profiles(A,B)and Venn analysis(C)in Chinese cabbage JWW and XBJ
利用熒光定量PCR技術(shù),進(jìn)一步分析白菜NAC基因家族應(yīng)答春化反應(yīng)關(guān)鍵基因及春化途徑基因BrFLC1的表達(dá)水平,結(jié)果如圖10所示。Bra004385、Bra004736、Bra031950、Bra033296、Bra036327基因經(jīng)過低溫春化后,其在JWW和XBJ中的相對表達(dá)量均顯著上升,其中4個BrNAC基因(Bra004385、Bra004736、Bra031950、Bra036327)的表達(dá)量在春化過程中維持較高水平;而Bra033296的表達(dá)量,JWW在春化30 d時達(dá)到最高,隨后逐漸降低,但仍高于春化初始時期的表達(dá)量,XBJ在春化10 d時達(dá)到最高,隨后隨著春化時間表達(dá)量先降低后升高,再降低,最后再升高;而春化途徑BrFLC1基因隨春化時間延遲,其表達(dá)水平急劇下降后,緩慢上升然后再下降。
圖10 白菜NAC基因應(yīng)答春化反應(yīng)關(guān)鍵基因及FLC基因的表達(dá)分析Fig.10 Expression analysis of the key NAC and FLC genes related to vernalization in B.rapa
植物特異性NAC轉(zhuǎn)錄因子(TF)是植物中最大的轉(zhuǎn)錄調(diào)節(jié)因子家族之一,在植物的生長發(fā)育調(diào)控和逆境反應(yīng)中發(fā)揮著重要作用[3]。目前,多個物種的NAC基因家族已被鑒定出來[4-8],但對白菜NAC基因家族應(yīng)答春化反應(yīng)知之甚少。本研究中,利用同源比對及HMMER搜索,結(jié)合多重數(shù)據(jù)庫嚴(yán)格篩選,共鑒定出188個BrNAC轉(zhuǎn)錄因子成員,是擬南芥NAC基因家族數(shù)量的1.5倍,但顯著少于Liu等[26]的報道,其最主要原因為他們對白菜全基因組進(jìn)行HMMER篩選時采用了較低的篩選參數(shù)(E<1e-3),并且未進(jìn)行多個數(shù)據(jù)庫的篩選鑒定。
在多基因家族進(jìn)化過程中,基因結(jié)構(gòu)普遍存在多樣性,有利于基因進(jìn)化選擇新功能,以適應(yīng)環(huán)境變化[33]。本研究對白菜NAC基因家族成員基本特征進(jìn)行分析,其家族全部成員蛋白序列N端均含有NAM結(jié)構(gòu)域、基因結(jié)構(gòu)多樣,但同一聚類亞組中的NAC成員具有相似的功能基序、外顯子/內(nèi)含子結(jié)構(gòu)和位置,表明這些成員關(guān)系密切,可能具有相似的功能,這與Liu等[26]的研究一致。此外,同一亞組中的成員之間也存在序列大小、外顯子的相對位置和數(shù)量等差異,這可能是白菜NAC基因家族在進(jìn)化過程中發(fā)生了基因片段的剪接和插入所致,從而獲得了新的基因功能[34]。
白菜在進(jìn)化過程中經(jīng)歷過2次全基因組復(fù)制及1次全基因組三倍化事件[35]。本研究對白菜與擬南芥NAC成員進(jìn)行系統(tǒng)進(jìn)化樹分析,7個亞簇中BrNAC與AtNAC成員數(shù)量比值為1∶1~2.5∶1,表明白菜與擬南芥之間在進(jìn)化中存在著密切相關(guān)的同源NAC基因。白菜與擬南芥NAC基因家族成員之間存在大量的直系同源基因?qū)?表明白菜NAC基因家族大部分成員與擬南芥NAC基因成員可能來自同一祖先,且白菜NAC基因家族的擴(kuò)張主要來源于基因復(fù)制事件[33]。
大部分BrNAC基因具有組織表達(dá)特異性,僅少數(shù)BrNAC轉(zhuǎn)錄因子在白菜各組織中有較高的表達(dá)豐度,表明它們可能在白菜的生長發(fā)育中起重要作用。本研究中進(jìn)一步利用春化轉(zhuǎn)錄組數(shù)據(jù)[28-29]分析白菜NAC基因家族應(yīng)答春化反應(yīng)關(guān)鍵基因,結(jié)果共有6個BrNAC成員在JWW、XBJ及4004材料春化前、后均顯著差異表達(dá),表明這些基因與春化反應(yīng)密切相關(guān)。對JWW與XBJ材料中差異顯著的BrNAC基因進(jìn)行表達(dá)趨勢分析,顯示顯著表達(dá)趨勢中共有40個BrNAC基因;其中5個BrNAC成員為上述顯著差異表達(dá)基因一致,進(jìn)一步表明這些BrNAC成員與春化反應(yīng)密切相關(guān)。對這5個BrNAC成員在不同春化時期的表達(dá)水平進(jìn)行分析,顯示其相對表達(dá)量均顯著上升,并且在春化50 d時仍維持著較高的表達(dá)量;此外,上述 5個白菜NAC基因的表達(dá)趨勢與春化關(guān)鍵基因FLC的表達(dá)趨勢相反,特別是與Bra036327基因完全相反,表明該NAC基因為白菜春化應(yīng)答基因,在白菜春化過程中可能具有重要的作用。