方鑫,楊崢,王晨旭,孫雨欣,張斌,麻鵬達
(西北農林科技大學生命科學學院/創(chuàng)新實驗學院,陜西 咸陽 712100)
丹參(Salviamiltiorrhiza)是一種常見中藥材,其有效成分分為2類:一是脂溶性萜類,如丹參酮、隱丹參酮等;二是水溶性酚酸類,如丹酚酸、丹參素等。作為一種藥用植物,丹參具有抗炎、解熱鎮(zhèn)痛、抗腫瘤等功能,又因其具有活血化瘀等特性而在心血管疾病的治療中有廣泛應用[1]。丹參生命周期短,基因組規(guī)模小,因此成為研究各種環(huán)境脅迫與表型響應的模型植物[2]。一些研究表明,丹參生長狀態(tài)以及活性成分的含量與環(huán)境條件有關,不同的氣候條件對丹參生長有較大影響,惡劣氣候已成為影響丹參生長的主要非生物脅迫因素[3]。因此,研究丹參對高溫等逆境的響應機制具有重要意義。
熱休克蛋白(HSP)是機體響應逆境脅迫后產生的一種特殊蛋白質,其結構保守,主要作為分子伴侶行使生物學功能[4]。根據相對分子質量大小,熱休克蛋白被分為小分子熱休克蛋白(sHSP)和HSP70等多個類別,而DnaJ蛋白則歸類于小分子熱休克蛋白(HSP40)。DnaJ蛋白在進化過程中一直保留著分子伴侶功能,逆境脅迫時其作為分子伴侶參與維持蛋白質復合體的穩(wěn)定[5]。植物DnaJ蛋白含有4種經典結構域,包括高度保守的N端結構域(J-domain)、鋅指結構域(zinc-finger domain)、富含甘氨酸的結構域(G-domain)和保守的C端結構域(C-terminal)[6]。
丹參的主要藥用成分是通過次生代謝合成途徑進行生物學合成的[7]。在對擬南芥等多種植物研究中發(fā)現,DnaJ蛋白在植物抗逆和次生代謝途徑調控過程中起著重要的作用[8]。有研究者通過酵母雙雜交系統(tǒng)篩選到部分的丹參DnaJ蛋白,但未進行類似的功能研究[9]。為了探討丹參DnaJ蛋白對各種環(huán)境脅迫的響應作用,我們通過與擬南芥DnaJ進行比較,鑒定丹參DnaJ基因,揭示丹參DnaJ的功能和進化關系,為深入研究丹參中逆境響應和次生代謝途徑的調控提供參考。
基于已有報道的擬南芥DnaJ的研究結果,采用隱馬爾可夫模型篩選丹參基因數據庫(http://www.ndctcm.org/shujukujieshao/2015-04-23/27.html),得到丹參DnaJ基因序列信息[10-11]。利用BLAST 2.7.1建立本地BLAST數據庫,采用tBLASTn算法對丹參全基因組進行查詢,搜索DnaJ家族同源基因[12]。通過在線工具ScanProsite(http://prosite.expasy.org/)對預測的SmDnaJ蛋白序列進行J結構域的分析鑒定,利用DNAMAN軟件的多序列比對工具分析J結構域和HPD基序的序列特征,利用ExPASy在線軟件(http://web.expasy.org/compute_pi/)的PI/MW工具計算DnaJ蛋白的相對分子質量和理論等電點(pI)。
獲取丹參和擬南芥的DnaJ蛋白序列,利用ClustalW 2.1軟件進行多重序列比對(缺口開啟罰分設為15.00,缺口延伸罰分設為6.66),然后用Neighbor-joining法生成進化樹,P-distance、Bootstrap等參數設置為默認值,抽樣次數為1 000次。通過Evolview在線工具(https://www.evolgenius.info/)對系統(tǒng)發(fā)育樹進行美化。
SmDnaJ的外顯子-內含子結構通過在線軟件Gene Structure Display Server 2.0(http://gsds.cbi.pku.edu.cn/)進行分析,利用NCBI數據庫中的CD-Search工具分析SmDnaJ蛋白序列的保守結構域,通過Evolview在線工具將系統(tǒng)發(fā)育樹和保守結構域結合分析。利用TBtools軟件和PlantCare在線軟件等分析SmDnaJ基因上游1 500 bp的啟動子序列,重點分析逆境脅迫及激素響應的順式作用元件,如干旱、光、低溫、水楊酸(SA)、生長素(IAA)、茉莉酸甲酯(MeJA)和脫落酸(ABA)等。
通過Illumina HiSeq2000、Illumina HiSeq2500和Illumina Genome Analyzer對3個處理(SA、MeJA、酵母提取物)和3個器官(根、葉、花)的樣品進行轉錄組測序,這些數據儲存在NCBI的Sequence Read Archive(SRA)數據庫(登錄號:SRX2992229、SRX2992230、SRX2992231、SRX2992232、SRX2992233、SRR1043998、SRR1045051、SRR1020591和SRX1423774)。原始數據通過Visual Bioinformatics工具進行處理,使用BMKCloud在線工具(www.biocloud.net)計算RPKM(reads per kilobase of exon model per million mapped reads)值,然后通過SPSS 18.0軟件的二元相關分析功能和RPKM值計算每個轉錄本的Pairwise Pearson相關系數。如果P值大于0.5且具有顯著相關性,則認為確實相關。最后用軟件Multi Experiment Viewer(MEV4.9.0)繪制熱圖[13]。
在丹參基因組中共鑒定出71個序列,經過初步分析,刪除其中4條不能編碼完整J結構域的序列,其余67條序列能夠編碼至少1個J結構域,因此被確定為丹參DnaJ基因,依次命名為SmDnaJ1—SmDnaJ67。同擬南芥DnaJ基因數量相比較,可以發(fā)現丹參中DnaJ基因的數量與之相近,表明DnaJ基因的數量與基因組大小沒有直接關系,DnaJ基因的數量是相對保守的。表1列出了67個丹參DnaJ基因的詳細信息,SmDnaJ預測的相對分子質量為13.7×103(SmDnaJ28)至146.0×103(SmDnaJ53),預測的蛋白長度為115個氨基酸(SmDnaJ57)至1 322個氨基酸(SmDnaJ53),等電點為4.25(SmDnaJ12)至10.15(SmDnaJ28)。
表1 丹參DnaJ基因的詳細信息Table 1 The list of DnaJ sequences identified in Salvia miltiorrhiza
匯總72條AtDnaJ基因和67條SmDnaJ基因序列,通過MEGAX軟件構建進化樹,分析它們之間的親緣關系。由于SmDnaJ幾乎都只有1個J結構域,因此不采用基于基因結構分類的計算方法。DnaJ的系統(tǒng)發(fā)育樹(無根樹)顯示了丹參DnaJ基因與擬南芥的進化關系(圖1),根據進化樹的分支聚類情況將SmDnaJ和AtDnaJ分成10組,記為A— J,這些組中依次有3、7、10、2、3、11、3、7、10和11個丹參DnaJ基因。
圖1 丹參和擬南芥DnaJ基因的系統(tǒng)發(fā)育樹及其分類Fig.1 Phylogenetic tree and classification of DnaJ in Salvia miltiorrhiza and Arabidopsis thalianaA—J:基因分組Gene groups.
SmDnaJ蛋白由J結構域、鋅指結構域、G結構域和CTD結構域在內的4種結構域組成,而定義DnaJ蛋白的關鍵在于4種結構域中最保守的結構域(J結構域),它能夠調控HSP70(相對分子質量為70×103的熱休克蛋白)的活性[14]?;谶@些保守結構域,可以將J蛋白家族分為3種類型:第Ⅰ型亞組涵蓋具有完整4種結構域的蛋白質;第Ⅱ型亞組包含具有J結構域、CTD結構域和富含甘氨酸(不含鋅指結構域)的蛋白質;第Ⅲ型亞組由僅具有J結構域的蛋白質組成[15]。從圖2-A可知,67個SmDnaJ都具有1個J結構域,且大多數蛋白僅有1個J結構域,應將其分類為J蛋白家族的Ⅲ型亞組。劃分進H亞組的部分SmDnaJ具有多個保守結構域:SmDnaJ55和SmDnaJ20包含J結構域、CTD結構域和CRR結構域(具有4個C-X-X-C-X-G-X-G重復模塊的鋅指結構域);SmDnaJ58和SmDnaJ59包含J結構域和CTD結構域。外顯子-內含子結構可以反映同源基因的進化關系,外顯子-內含子結構與SmDnaJ基因分組之間具有一定的規(guī)律性:A組和J組等含有多個內含子,而C組絕大多數成員沒有內含子(圖2-B)。
圖2 丹參DnaJ蛋白的保守結構域(A)及其基因結構(B)Fig.2 The conserved domain(A)and gene structures(B)of the DnaJ in S.miltiorrhiza
從丹參基因組中摘錄67個SmDnaJ基因上游1 500 bp的啟動子序列,其中包含的順式作用元件通過PlantCARE等軟件進行預測。如圖3所示,除SmDnaJ25外,在所有SmDnaJ基因上游1 500 bp長度的啟動子區(qū)域內至少含有1個應激相關的順式調控元件,主要與水楊酸(SA)、茉莉酸甲酯(MeJA)和脫落酸(ABA)等激素響應以及光、溫度和干旱等環(huán)境響應有關。其中SmDnaJ17含有多達21個順式作用元件,分別為5個光響應元件、1個低溫響應元件、1個水楊酸響應相關元件、10個茉莉酸響應相關元件和4個脫落酸響應相關元件。
圖3 丹參SmDnaJ基因的順式作用元件Fig.3 cis-elements analysis of SmDnaJ genes in S.miltiorrhiza 柱狀圖顏色對應順式作用元件類型,柱狀圖長度對應順式作用元件數量。按照系統(tǒng)發(fā)育樹分組的Group A —Group J進行排序。The color of the bar chart corresponds to the type of cis-acting elements and the length of the bar chart corresponds to the number of cis-acting elements. The sequence was sorted according to Group A-Group J of phylogenetic tree grouping.
為了分析預測到的DnaJ蛋白在丹參酚酸和丹參酮代謝合成途徑的功能和表達情況,建立了相關基因的表達圖譜。丹參酚酸、酪氨酸和苯丙氨酸代謝途徑有許多關鍵酶基因(SmC4H1、SmCYP98A14、SmPAL1、SmRAS1、SmTAT1、SmHPPR1)和相關轉錄因子(SmMYC2a、SmbHLH51、SmbHLH37、SmERF111、SmMYC2b、SmTTG1、SmAREB1、SmbHLH148、SmMYB36、SmMYB39、SmMYB111、SmPAP1、SmERF115)?;诘⑥D錄組數據,對DnaJ蛋白與以上關鍵酶基因和調控關鍵酶基因表達的轉錄因子進行共表達分析。共表達分析結果(圖4)顯示,在丹參酚酸途徑中主要分為4個簇:第1個簇包含轉錄因子SmMYC2a和SmbHLH51,關鍵酶基因SmC4H1、SmCYP98A14和SmPAL1,DnaJ基因(SmDnaJ14、52、29、18、33、32、19、13、51、58);第2個簇包含轉錄因子SmMYC2b、DnaJ基因(SmDnaJ34、17、4、27、58、7、6、15、20、46、57、35、48、49、64);第3個簇包含轉錄因子SmTTG1和SmAREB1、DnaJ基因(SmDnaJ43、9、3、11、12、23、24、10、1、37、65);第4個簇包含轉錄因子SmbHLH148、SmMYB36、SmMYB39、SmMYB111和SmPAP1,關鍵酶基因SmRAS1、SmTAT1和SmHPPR1,DnaJ基因(SmDnaJ60、41、42、21、26、54、16、40、45、31、59、61、38、55、22、63、36、2、53、47、50、44、56、62、66、67)。其中10個DnaJ基因(SmDnaJ34、35、48、49、64、43、38、2、66、67)在檢測組織(根、葉、花)中幾乎沒有表達,4個基因(SmDnaJ19、13、30、58)在檢測組織中均表達,其他丹參DnaJ基因存在組織特異性表達的情況,如葉片中特異性表達的SmDnaJ5,花和葉片中特異性表達的SmDnaJ15和SmDnaJ7(圖4-A)。SmDnaJ19和SmDnaJ13的基因表達水平則在茉莉酸甲酯處理后明顯上調。
丹參酮等萜類化合物是通過胞體甲羥戊酸(MVA)途徑和質體2-C-甲基-D-赤蘚糖醇-4-磷酸(MEP)途徑生物合成的[16-17],涉及關鍵酶基因SmGGPPS1、SmCPS1、SmKSL1、SmDXR、SmCYP76AK1、SmCYP76AH1、SmCYP76AH3、SmIPI1、SmHMGR2、SmCPS2、SmHMGR1和相關轉錄因子SmMYB9b、SmERF115、SmbHLH148、SmMYB36、SmMYC2b、SmERF6、SmWRKY1、SmAREB1、SmbHLH10、SmMYC2a。對丹參DnaJ基因與上述丹參酮生物合成關鍵酶基因和相關轉錄因子進行共表達分析。從圖4-B可知,在丹參酮代謝途徑中主要分為3個簇:第1個簇包括DnaJ基因(SmDnaJ36、2、53、44、56、47、50、62、60、41、42、21、32、39、26、54、16、40、45、31、59、61、38、55、22、68、35、48、49、64),關鍵酶基因SmGGPPS1、SmCPS1、SmKSL1、SmDXR、SmCYP76AK1、SmCYP76AH1、SmCYP76AH3、SmIPI1、SmHMGR2和SmCPS2,轉錄因子SmMYB9b、SmbHLH148、SmMYB36和SmMYC2b;第2個簇包括DnaJ基因(SmDnaJ14、52、19、30、13、51、58、43、9、3、11、12、23、24、10、1、37、25、68、65),轉錄因子SmERF6、SmWRKY1和SmAREB1;第3個簇包含DnaJ基因(SmDnaJ17、4、27、5、8、6、15、20、46、7、57、29、18、33、34、66、67),轉錄因子SmERF6、SmWRKY1、SmAREB1、SmbHLH10和SmMYC2a,關鍵酶基因SmHMGR1。其中有9個DnaJ基因(SmDnaJ2、35、48、49、64、43、34、66、67)在檢測組織中幾乎沒有表達,其他58個DnaJ基因可以在至少1個組織中表達,包括16個在所有檢測組織中均有表達的DnaJ基因(SmDnaJ41、26、16、14、52、19、30、13、58、9、37、4、20、29、18、33)和其他特異性表達的基因。SmDnaJ30和SmDnaJ58基因有相對較高的表達水平。采用茉莉酸甲酯以及酵母提取物處理后,分別有SmDnaJ19、30、58、9、1、37、29和SmDnaJ14、19、30、13、58、9、3、10、1、37、4基因高表達。
圖4 不同組織中與不同因素誘導下SmDnaJ基因共表達熱圖Fig.4 Heat map of the expression profiles of SmDnaJ genes in different tissues and in response to various treatments A. SmDnaJ基因與酚酸、酪氨酸和苯丙氨酸代謝途徑相關基因的共表達熱圖;B. SmDnaJ基因與萜類代謝途徑相關基因的共表達熱圖。A. The co-expression heat map of SmDnaJ gene and genes related to phenolic acid,tyrosine and phenylalanine metabolic pathway;B. The co-expression heat map of SmDnaJ gene and genes related to terpene metabolic pathway.MeJA:茉莉酸甲酯Methyl jasmonate;YE:酵母提取物Yeast extract;SA:水楊酸Salicylic acid.
HSP70、DnaJ蛋白家族的成員在緩解生物或非生物脅迫中均起重要作用,相關研究中發(fā)現擬南芥具有 89個 DnaJ蛋白家族的成員[8]。在本研究中,我們對丹參DnaJ基因家族進行系統(tǒng)進化樹構建、外顯子-內含子結構分析、保守結構域鑒定、啟動子順式元件識別和基因共表達分析等工作,對丹參DnaJ基因有了進一步了解。
J蛋白家族通常分為3種類型,只有1個J結構域的DnaJ屬于Ⅲ型,而丹參中的DnaJ具有相似的結構,大部分只包含1個J結構域。在本研究中,DnaJ蛋白基于進化關系而進一步被細分成不同的亞組,將SmDnaJ和AtDnaJ共分為10組(A、B、C、D、E、F、G、H、I和J)。其中C組內含子的數量最保守,也是最少的1個亞組。從外顯子-內含子結構和保守結構域分布的情況可以看出,其規(guī)律性可以很好地與先前分類的亞組相匹配。已有研究證明,DnaJ基因能夠通過某些順式調控元件響應多種生物和非生物脅迫,從而在植物信號通路中起著重要作用。擬南芥花中表達的J3蛋白介導開花信號的整合識別[18];擬南芥葉片中表達的DnaJ蛋白起著調控葉片生長的重要作用[19];DnaJ/Hsp40家族蛋白BIL2通過油菜素甾體信號途徑來促進植物生長和提高逆境抵抗力[20]。
啟動子序列中的順式調控元件可以調節(jié)基因的轉錄水平,如GEAT、LTR、SARE、GARE、AuxRE、CGTCA基序和ABRE等調控元件,能夠響應光、低溫、SA、IAA、GA、MeJA和ABA等生物或非生物因素的誘導[21-28]。用PlantCARE分析了SmDnaJ啟動子序列中的順式作用元件,能夠更好地理解SmDnaJ基因在環(huán)境脅迫下如何行使生物學功能[29]。植物激素是某種次生代謝產物,在化學信號傳遞和響應生物或非生物脅迫的過程中起著重要作用[30]。不同植物在施加茉莉酸甲酯后,都能誘導大量防御相關基因的表達[31];植物不同的器官合成脫落酸來啟動防御機制,導致大量防御相關基因表達,從而幫助植物抵御逆境脅迫,度過不利于生長的時期[32]。大多數SmDnaJ基因都有1個以上響應MeJA和ABA的順式作用元件,這表明SmDnaJ可能是與次生代謝相關的重要基因之一,在響應多種逆境脅迫時有重要作用。為了深入分析SmDnaJ的功能,我們還研究了SmDnaJ基因在不同組織中的表達情況。少數SmDnaJ基因在根、葉、花中幾乎沒有表達,而大多數SmDnaJ基因在1個或多個組織中均有表達,其中部分SmDnaJ基因在特定組織中特異性表達,這意味著DnaJ蛋白可能參與生長發(fā)育過程,同時也表明SmDnaJ基因可能與植物激素信號通路密切相關,如茉莉酸甲酯和水楊酸途徑。
預測含有SA響應元件的DnaJ基因共有21個,分布在所有亞組,其中SmDnaJ6、15、17、18、32表達下調,SmDnaJ10、28、50、65表達上調,只有少數成員如SmDnaJ52、60變化差異較小;不含SA元件的DnaJ基因中只有少部分出現表達變化,大多數基因的表達水平相較于對照組沒有變化,可能是由其他基因表達變化間接導致的。預測不含有MeJA響應元件的DnaJ基因共有17個,其中僅有幾個基因表達有明顯差異;其余50個含有MeJA響應元件的DnaJ基因,如SmDnaJ3、24、37、44、53表達上調,SmDnaJ5、6、7、31、56表達下調,而SmDnaJ2、9、38表達變化不明顯。大多數SmDnaJ基因在激素誘導下的表達水平與啟動子順式作用元件的預測結果相符合,表明SmDnaJ基因在激素誘導的次生代謝途徑中可能發(fā)揮作用,而具有激素響應元件而表達水平不受相應激素誘導的DnaJ基因具有何種作用,與關鍵酶基因之間有何關系需要進一步探究。
闡明SmDnaJ蛋白的進化關系,分析SmDnaJ成員的功能差異,將有助于進一步闡明SmDnaJ蛋白結構與功能之間的關系。DnaJ蛋白的序列特征和功能同時存在保守性和多樣性,這些結果有助于進一步驗證SmDnaJ蛋白對逆境響應和代謝調控的具體機制。