江 舟,張愛麗,楊耀文,李國棟,錢子剛*
(1.云南中醫(yī)藥大學基礎醫(yī)學院,云南 昆明 650500;2.云南中醫(yī)藥大學中藥學院,云南 昆明 650500)
轉錄因子是一類DNA 結合蛋白,能特異性結合基因啟動子順式作用元件,激活或抑制轉錄,通過靶基因來調控相關基因的表達[1]。WRKY 是一類植物所特有的轉錄因子[2],因N 端具有高度保守性的WRKYGQK 區(qū)域,C 端具有鋅指C2H2或C2HC 結構而命名[3],能調控植物次生代謝產物合成、生長發(fā)育、抗病反應、抗脅迫能力[4-6]。
萜類作為天然次生代謝產物,廣泛存在于植物中,尤其三萜類是中草藥重要有效成分,具有較高的藥用價值[7]。研究表明,許多植物萜類代謝途徑的關鍵酶的表達可能受同一個轉錄因子的調控,故萜類代謝途徑中有轉錄因子的存在[8]。目前,轉錄因子調控藥用植物次生代謝產物的研究僅在紅豆杉、黃花蒿、長春花、人參、西洋參[9-13]等少數幾個植物中報道過。
金鐵鎖Psammosilene tunicoides W.C.Wu et C.Y.Wu為石竹科金鐵鎖屬多年生植物[14],以根入藥[15],是我國西南區(qū)域特有的傳統(tǒng)藥用植物,具有消炎、止痛、散瘀、祛風濕功效,是云南白藥主要組成藥材之一,前期大量研究表明其主要有效成分是齊墩果烷型五環(huán)三萜皂苷[16-20]。由于該藥材顯著的藥理活性及藥用價值,相關資源已開始匱乏,故揭示相關轉錄因子在其所含三萜皂苷合成途徑中的調控機制,定向增加該成分積累顯得尤為重要,但相關轉錄因子家族信息及關鍵酶基因表達、調控作用機理仍是未知領域。因此,本實驗利用課題組前期已獲得的金鐵鎖轉錄組數據,得到10 條含全長開放閱讀框 (ORF) 的WRKY 家族成員相關信息,通過生物信息學方法分析其基因結構及蛋白序列特征和功能特性,為進一步研究該藥材WRKY 轉錄調控機制及三萜皂苷合成機理提供分子依據。
1.1 金鐵鎖WRKY 基因結構分析 金鐵鎖WRKY 轉錄因子(PtWRKY) 序列來自課題組測序得到的轉錄組數據庫,使用以2 年生根和葉為材料通過Illumina Hiseq 2500 平臺測序,ABYSS 軟件拼接獲得。以人參、西洋參WRKY CDS 為查詢序列,通過BLASTn 進行同源搜索,ORF Finder (http://www.ncbi.nlm.nih.gov/ gorf/orFig.cgi) 在線篩選具有完整開放閱讀框(ORF) 的WRKY 序列,SMART (http://smart.embl.de/) 和 Pfam (http://pfam.sanger.ac.uk) 確定選出的序列具有WRKY 保守結構域和DNA 結合結構域,Gene Structure Display Server (http://gsds.cbi.pku.edu.cn/) 對金鐵鎖WRKY 基因結構進行分析。
1.2 金鐵鎖WRKY 蛋白序列理化特征分析 金鐵鎖WRKY 蛋白理化性質的基本參數通過http://expasy.org/protparam/在線分析獲得。
1.3 金鐵鎖WRKY 蛋白基序分析和預測 通過MEME(http://meme-suite.org/) 在線預測金鐵鎖WRKY 轉錄因子基序(motif),參數設定motif 最大值為3,寬度為3~100,并聯(lián)合Clustal Omega (http:/ www.ebi./ ac.uk/Tools/) 對WRKY 轉錄因子保守結構域進行綜合比對(參數OUTPUT FORMAT,ClustalW with character counts)。
1.4 金鐵鎖WRKY 轉錄因子聚類分析及進化樹構建 從NCBI 數據庫中下載人參、西洋參WRKY 氨基酸序列用于同源性分析,通過MEGA6.0 的Neighbor-Joining (參數Bootstrap method,Replications1000) 進行進化樹構建。
1.5 金鐵鎖WRKY 轉錄因子結合位點預測及分析 通過JASPAR (http://jaspar.genereg.net/) 在線預測分析金鐵鎖WRKY 轉錄因子的轉錄結合位點(TFBS) 信息。
1.6 金鐵鎖WRKY 表達分析 根據轉錄組測序所得數據分析金鐵鎖WRKY 基因的組織表達模式,其豐度以PRKM為計量單位(Reads per kilobase per million mapped reads)。
2.1 WRKY 基因結構分析 通過同源比對及開放閱讀框(ORF) 預測,從PtWRKY 轉錄組數據庫273 條序列中得到10 條具有完整ORF 的PtWRKY 序列,開放閱讀框612 bp(DN23488_ c0g1)~1 116 bp (DN23438_ c0g4)。通過基因結構分析(圖1) 發(fā)現(xiàn),DN21294_ c0g3、DN23488_c0g1、DN23488_ c0i2、DN23488_ c0i6 均含有1 個內含子,10 條基因序列均含有非編碼區(qū),5′ UTR 0 bp (DN21294_c0g3,DN23488_ c0i6)~685 bp (DN19980_ c0g2),3′UTR 176 bp (DN24254_ c0g3)~1 030 bp (DN23488_c0i6)。
圖1 金鐵鎖WRKY 基因結構分析
2.2 WRKY 蛋白序列理化特征分析 10 條開放閱讀框包括612~1 116 bp 的PtWRKY 序列,編碼蛋白203~371 aa,分析該序列理化特征,結果見表1。由此可知,蛋白相子量最小為23.0 kD,最大為43.1 kD,理論pI 平均值為7.68,其中有5 條蛋白的小于7,表明鑒定出的PtWRKY 蛋白偏酸性;所有PtWRKY 蛋白的親水系數均為負數,表明該基因家族編碼蛋白均親水,穩(wěn)定性較差。
2.3 WRKY 轉錄因子蛋白基序分析和預測 Eulgem 等[3]將WRKY 蛋白分為3 類:第Ⅰ類含有2 個WRKY 結構域,鋅指結構為C2H2型;第Ⅱ類含有1 個WRKY 結構域,鋅指結構也為C2H2型,第Ⅲ類有1 個WRKY 結構域,鋅指結構為C2HC 型;Zhang 等[21]又進一步將第Ⅱ類WRKY 蛋白分為5 個亞型,分別為Ⅱa、Ⅱb、Ⅱc、Ⅱd、Ⅱe。本實驗采用MEME 對金鐵鎖WRKY 的基序(motif) 進行在線預測分析,發(fā)現(xiàn)有3 個motif (圖2A);Clustal Omega 對10 個PtWRKY 進行綜合比對,分析motif 結構(圖2B),發(fā)現(xiàn)除了DN21294_ c0g2 和DN23488_ c0i6 缺失鋅指結構以外,DN13381 _ c0g1、DN19980 _ c0g2、DN24254 _ c0g3、DN21294 _ c0g3、DN23488 _ c0g1、DN23488 _ c0i2、DN87410_ c0g1、DN23438_ c0g4 都具有WRKY 保守結構域WRKYGQK、C2H2鋅指結構,屬于第Ⅱ類WRKY 蛋白。進一步分析該類蛋白的結構域特征,發(fā)現(xiàn)DN13381_ c0g1 屬于Ⅱa 亞型,DN21294_ c0g3、DN23488_ c0g1、DN23488_c0i2 屬 于Ⅱc 亞 型,DN23438_ c0g4、DN87410_ c0g1、DN24254_ c0g3 屬于Ⅱd 亞型,DN19980_ c0g2 屬于Ⅱe 亞型,無Ⅱb 亞型。另外,Ⅱa、Ⅱd、Ⅱe 亞型的鋅指序列為C-X5-C-X23-H-X1-H,而IIc 亞型的鋅指序列為C-X4-CX23-H-X1-H。
表1 金鐵鎖WRKY 蛋白理化特征
圖2 金鐵鎖WRKY 蛋白基序分析
2.4 WRKY 轉錄因子聚類分析及進化樹構建 通過MEGA6.0,以 10 個 PtWRKY、9 個人參 WRKY(PgWRKY)、3 個西洋參WRKY (PqWRKY) 轉錄因子序列構建系統(tǒng)進化樹,通過已知的人參、西洋參WRKY 功能鑒定同源金鐵鎖WRKY,從而預測了解后者功能,結果見圖3。由此可知,12 個WRKY 轉錄因子分為4 個大類Class1~Class4,金鐵鎖、人參WRKY 轉錄因子優(yōu)先聚在一起,DN19980_ c0g2、PgWRKY9,以 及DN13381_ c0g1、PgWRKY28 被聚為一類,表明這2 種植物WRKY 轉錄因子有較高的親緣關系和同源性,有著類似的功能。
圖3 金鐵鎖、人參、西洋參WRKY 蛋白的系統(tǒng)進化樹
2.5 WRKY 轉錄因子結合位點預測及分析 轉錄因子蛋白調控特定基因的表達是通過與目的基因5′端上游部分的轉錄因子結合位點TFBS (transcription factor binding site) 特異性結合來實現(xiàn)的[22],研究表明TFBS 具有保守性,有相同或相似的該序列就可結合相同的轉錄因子[23]。將PtWRKY 轉錄因子蛋白序列輸入JASPAR,篩選序列版本信息 和 e-value 值 后 (序列版 本 MA1093.1、MA1094.1、MA1087.1,e-value 值1.67014e-14、1.5632e-31、1.46487 e-31),預測得到3 個均屬于WRKY 家族的TFBS 序列信息,分別為DN21294_ c0g2、DN21294_ c0g2、DN23488_c0i2 所有,相關報道見于擬南芥WRKY8,WRKY 75、WRKY 45[24],PFM Matrix (堿基頻數分布矩陣) 見圖4A1、4B1、4C1。通過TFFM (雙核苷酸關聯(lián)序列) 分析 (圖4A2、4B2、4C2) 發(fā)現(xiàn),前2 個TFBS 序列在3~7 位有相同的保守堿基(圖4A1~4B2);后1 個在3~8 位均有保守堿基,在第8 位有差異,分別為C 和T。再分析motif 富集峰型圖,發(fā)現(xiàn)在峰的相對位置0 處均出現(xiàn)了1 個尖銳峰(圖4D1~4D3),表明該峰是轉錄因子motif 與TFBS 的結合位置。
2.6 WRKY 基因表達分析 對金鐵鎖10 個WRKY 基因在不同組織中的表達模式進行分析,發(fā)現(xiàn)PtWRKY 基因在根和葉中均有表達(PRKM>0) (圖5),大多數在根中表達較高,只有Ⅱa 亞型DN13381_ c0g1、Ⅱe 亞型DN19980_c0g2 在葉中的表達量更高;Ⅱc 亞型DN23488_ c0g1、DN23488_ c0i2,Ⅱd 亞 型DN23438_ c0g4、DN24254_c0g3 在根中的表達量均大于20,其中DN23488_ c0i2 高達69.24,同時Ⅱc 亞型DN21294_ c0g3,Ⅱd 亞型DN87410_ c0g1、鋅指結構缺失的DN23488_ c0i6 和DN21294_ c0g2表達量也均大于7,表明金鐵鎖根中高表達PtWRKY 基因主要屬于Ⅱc、Ⅱd 亞型。
圖4 金鐵鎖WRKY 轉錄因子結合位點的分析
金鐵鎖有效成分齊墩果烷型五環(huán)三萜皂苷結構復雜,在抗菌、消炎、止痛等方面的藥理作用明確,是多種中成藥的重要組成部分。長期以來,獲取該藥材方式幾乎都靠野生采挖,但由于其分布狹窄,種群稀少,自然生長緩慢,導致自然資源面臨枯竭。鑒于此,本實驗開展金鐵鎖Pt-WRKY 轉錄因子家族的研究,以期獲得可能參與其所含三萜皂苷合成轉錄的PtWRKY 基因,探索該成分合成調控規(guī)律,為實現(xiàn)其定向積累奠定基礎,也為其獲得提供新途徑,從而實現(xiàn)該類瀕危珍稀藥材的可持續(xù)利用。
本實驗分析了10 個金鐵鎖PtWRKY 基因,發(fā)現(xiàn)其中8個只具有1 個能與靶DNA 序列W-box 結合的保守結構域WRKYGQK,鋅指結構為C2H2,歸為Ⅱ類WRKY 蛋白,而其余2 個缺失了鋅指結構。植物WRKY 轉錄因子家族存在鋅指結構缺失或不完整的情況,如水稻第Ⅳ類WRKY 蛋白的鋅指結構就出現(xiàn)缺失或不完整[25],而小豆WRKY 也存在N 端鋅指結構整體缺失的情況[26]。
圖5 金鐵鎖WRKY 基因在葉、根中的表達
聚類分析表明,DN19980_ c0g2、PgWRKY9 被聚為一類,說明這2 個WRKY 轉錄因子具有較近的親緣關系及相似的功能。Xiu 等[27]從NGS 轉錄組中克隆了8 個WRKY 基因,命名為PgWRKY2-9,其中通過激素和NaCl 處理發(fā)現(xiàn)PgWRKY9 均有應答,表明它是脅迫應答轉錄因子,也提示DN19980_ c0g2 轉錄因子可能與金鐵鎖的抗逆性有關。PqWRKY1 (JF508376.1) 是從西洋參中克隆和鑒定得到的一個西洋參脅迫應答轉錄因子,參與其所含三萜皂苷合成的調控[28];PgWRKY1 (KU836935) 是人參的脅迫應答轉錄因子,通過調節(jié)相關酶基因的表達,調控其所含三萜皂苷的合成[13]。聚類分析顯示,金鐵鎖DN23438_ c0g4 轉錄因子與PgWRKY1 轉錄因子、PqWRKY1 歸為一類,表明它可能參與了其所含三萜皂苷的轉錄合成。
通過預測與分析轉錄因子結合位點,本實驗尋找到3個報道于擬南芥的潛在TFBS 序列特征信息,motif 富集峰型圖顯示,MA 1093.1、MA1094.1、MA1087.1 的TFFM 峰型圖都只存在1 個尖銳鋒,只具有1 個motif 的結合位置,是否還有其他潛在的TFBS 序列和motif 結合位置尚不明確,需完成后續(xù)金鐵鎖全基因組測序后,調取相關金鐵鎖三萜皂苷合成途徑關鍵酶基因的啟動子來進行綜合分析。表達模式分析發(fā)現(xiàn),IIc、IId 亞型在金鐵鎖的根中有著較高的表達量,提示這兩個亞型相似的表達模式可能與該藥材生長發(fā)育及五環(huán)三萜皂苷在其根內的合成有關。