王 淋,烏云塔娜,葉生晶
(1.中南林業(yè)科技大學(xué) a.經(jīng)濟(jì)林育種與栽培國(guó)家林業(yè)局重點(diǎn)實(shí)驗(yàn)室;b.林學(xué)院,湖南 長(zhǎng)沙 410004;2.中國(guó)林業(yè)科學(xué)研究院 經(jīng)濟(jì)林研究開發(fā)中心,河南 鄭州 450003;3.國(guó)家林業(yè)局杜仲工程技術(shù)研究中心,河南 鄭州450003;4.國(guó)家林業(yè)局中南林業(yè)調(diào)查規(guī)劃設(shè)計(jì)院,湖南 長(zhǎng)沙 410014)
我國(guó)是世界上最大的橡膠消費(fèi)國(guó),橡膠被廣泛應(yīng)用于工業(yè)、航空及軍事等高科技領(lǐng)域[1]。我國(guó)對(duì)國(guó)外橡膠的需求量較大,而我國(guó)特有的經(jīng)濟(jì)物種杜仲是名貴的藥材,已被收錄于2010 版中國(guó)藥典[2]。不僅如此,杜仲果實(shí)、葉片、樹皮、根部均含優(yōu)質(zhì)天然橡膠——杜仲膠[3],其中杜仲葉含膠量為1%~3%,果實(shí)含膠量為10%~12%,是世界上極具發(fā)展?jié)摿Φ膬?yōu)質(zhì)天然膠資源[4]。杜仲果實(shí)的含膠量較高,利用杜仲果皮提取杜仲膠,可以降低杜仲膠提取的生產(chǎn)成本,促進(jìn)杜仲膠產(chǎn)業(yè)的發(fā)展[5]。杜仲膠作為多萜類化合物,其結(jié)構(gòu)與三葉橡膠順式異戊二烯不同,杜仲膠為反式異戊二烯,這就決定了杜仲膠具有獨(dú)特的橡塑二重性,被譽(yù)為高分子合金[6-7]。
萜類物質(zhì)合成主要通過(guò)以下2條途徑:一是Michel Rohmer和Duilio Arigoni等[8-9]提出位于質(zhì)體的2-甲基-D-赤蘚醇-4-磷酸途徑(MEP),二是Lynen等[10-11]提出位于細(xì)胞質(zhì)的甲羥戊酸途徑(MVA),其中3-羥基-3-甲基戊二酰輔酶A合成酶(3-Hydroxy-3-methylglutaryl-coenzyme A synthase,HMGS)是位于MVA 途徑中的一個(gè)重要的代謝酶,乙酰乙酰CoA(acetoacetyl-CoA)經(jīng)羥甲基戊二酰CoA合酶(HMGS)的催化形成3-羥基-3-甲基戊二酰CoA(HMG-CoA),隨后在HMGCoA還原酶(3-Hydroxy-3-methylglutaryl-coenzyme A reductase,HMGR)的作用下生成甲羥戊酸(MVA),甲羥戊酸經(jīng)焦磷酸化和脫羧作用形成異戊烯焦磷酸IPP,從而為杜仲膠的生物合成提供通用前體[12-13]。
目前,已經(jīng)從動(dòng)物和植物的MVA途徑中系統(tǒng)分離出來(lái)HMGS基因進(jìn)行了研究[14],而本文中利用生物信息學(xué)技術(shù),對(duì)杜仲膠生物合成的重要靶點(diǎn)之一的HMGS基因進(jìn)行相關(guān)的預(yù)測(cè)及分析,旨在為利用基因工程技術(shù)代謝調(diào)控杜仲膠生物合成提供理論依據(jù)。
玉米Zea mays、擬南芥Arabidopsis thaliana、葡萄Viteus vitifoliae、小立碗蘚Physcomitrella patens基因組以及編碼區(qū)序列來(lái)源于phytozome(http://www.phytozome.net/search.php)數(shù)據(jù)庫(kù),杜仲Eucommia ulmoidesOliv.數(shù)據(jù)來(lái)源于杜仲全基因組測(cè)序以及轉(zhuǎn)錄組數(shù)據(jù)[15-16]。
利用生物信息學(xué)軟件ExPASyProtParam、TMHMM對(duì)EuHMGS基因氨基酸殘基數(shù)、氨基酸組成、蛋白質(zhì)相對(duì)分子質(zhì)量、理論等電點(diǎn)、蛋白質(zhì)的親疏水性等性質(zhì)以及蛋白的結(jié)果保守域進(jìn)行了預(yù)測(cè)與分析;利用PSIPRED、Swiss model預(yù)測(cè)蛋白質(zhì)的二級(jí)、三級(jí)結(jié)構(gòu);利用軟件GSDS對(duì)EuHMGS基因組結(jié)構(gòu)進(jìn)行預(yù)測(cè);利用PLANT CARE在線軟件預(yù)測(cè)EuHMGS基因啟動(dòng)子序列中可能存在的順式元件進(jìn)行分析。
杜仲EuHMGS基因氨基酸序列與擬南芥Arabidopsis thaliana、葡萄Viteus vitifoliaeHMGS基因家族的基因序列相比較,存在多個(gè)保守區(qū),序列相似性達(dá)到80 %以上(見圖1),因此命名為EuHMGS,記為EuHMGS4[17]。
圖1 全長(zhǎng)HMGS蛋白多序列對(duì)比Fig.1 Multiple sequence alignment of the full length HMGS proteins
利用MEGA5.1軟件對(duì)單子葉植物玉米Zea mays、雙子葉植物擬南芥Arabidopsis thaliana、葡萄Viteus vitifoliae、苔蘚類小立碗蘚Physcomitrella patens的HMGS基因家族進(jìn)行進(jìn)化分析,構(gòu)建了杜仲HMGS的系統(tǒng)進(jìn)化樹(見圖2)。從系統(tǒng)進(jìn)化樹圖中可知,單子葉植物玉米,雙子葉植物杜仲、擬南芥、葡萄,苔蘚類小立碗蘚共分為3個(gè)主要的大分支,符合傳統(tǒng)的進(jìn)化分類結(jié)果。其中EuHMGS位于雙子葉植物的1個(gè)大分支,且與VvHMGS2的遺傳距離相對(duì)較近,說(shuō)明EuHMGS4與VvHMGS2的同源關(guān)系較近。
圖2 HMGRS蛋白的聚類分析Fig.2 Cluster analysis of HMGRS proteins
對(duì)各個(gè)植物HMGRS基因家族的蛋白質(zhì)理化性質(zhì)進(jìn)行了預(yù)測(cè),結(jié)果如表1所示。HMGRS基因編碼氨基酸為450~470 aa;相對(duì)分子質(zhì)量為50~52kD;理論等電點(diǎn)為5~6,不同植物的HMGS基因編碼氨基酸數(shù)、相對(duì)分子質(zhì)量以及理論等電點(diǎn)均較為一致。EuHMGS4、VvHMGS1為不穩(wěn)定的疏水蛋白;ZmHMGS3為不穩(wěn)定的親水蛋白;AtHMGS為穩(wěn)定的疏水蛋白;VvHMGS2、PpHMGS1、PpHMGS2、ZmHMGS1、ZmHMGS2為穩(wěn)定的親水蛋白。
表1 HMGS編碼蛋白質(zhì)的基本理化參數(shù)Table 1 Physical and chemical parmeters of HMGS
HMGS蛋白質(zhì)的氨基酸組成如表2所示。由表2可見,HMGS基因所編碼蛋白質(zhì)的氨基酸組成大致相同,其中EuHMGS4中性疏水性氨基酸 為 Asn(N)3.3%、Ala(A)8.2%、Ile(I)4.6%、Leu(L)7.7%、Met(M)3.5%、Phe(F)4.9%、Val(V)6.0%、Trp(W)0.4%、Tyr(Y)5.3%,共43.8%;中性親水性氨基酸為Asn(N)3.3%、Cys(C)2.2%、Gln(Q)3.5%、Gly(G)6.4%、Ser(S)9.7%、Thr(T)6.2%,共31.3%;堿性氨基酸為Arg(R)3.3%、His(H)2.0%、Lys(K)7.1%,共10.4%;酸性氨基酸為Asp(D)5.3%、Glu(E)6.2%,共11.5%。
表2 HMGS蛋白質(zhì)的氨基酸組成Table 2 Amino acid composition of HMGS %
利用MEME在線工具分析HMGRS氨基酸序列的功能結(jié)構(gòu)域(見圖3),無(wú)論是單子葉植物、雙子葉植物還是苔蘚類植物,HMGRS蛋白的結(jié)構(gòu)保守域均為3個(gè),且3個(gè)保守區(qū)均靠近蛋白的N端,其中Motif1起始位點(diǎn)為9 aa,保守序列為 ILAMEI YFPPTCVQQEAMETHDGVSKGKYTIGLGQDCM AFCTEVEDVISM;Motif2起始位點(diǎn)為72 aa,保守序列為IDPTQIGRMEVGSETVIDKSKSIKTFLMQI FEECGNTDIEGVDSTNACYG;Motif3起始位點(diǎn)為128 aa,保守序列為NCTNWVESSSWDGRYGLVV CTDSAVYAEGPARPTGGAAAIAMLIGPDAPI。
圖3 HMGS基因的保守結(jié)構(gòu)域Fig.3 The conserved domains in HMGS gene
利用在線工具TMHMM2.0對(duì)EuHMGS4氨基酸序列的跨膜結(jié)構(gòu)域進(jìn)行預(yù)測(cè)(見圖4)。EuHMGS4蛋白無(wú)明顯跨膜區(qū),蛋白全部位于膜外。
根據(jù)EuHMGS4氨基酸序列,預(yù)測(cè)其蛋白的二級(jí)結(jié)構(gòu)(見圖5)。結(jié)果表明,EuHMGS4蛋白二級(jí)結(jié)構(gòu)中α-螺旋占38.05 %,β-折疊占12.17 %,螺環(huán)結(jié)構(gòu)占49.78 %,屬于混合型結(jié)構(gòu)的蛋白質(zhì)。
圖4 EuHMGS4蛋白的跨膜區(qū)預(yù)測(cè)Fig.4 Predicted transmembrane region of the deduced protein of EuHMGS4 protein
圖5 EuHMGS4蛋白二級(jí)結(jié)構(gòu)預(yù)測(cè)Fig.5 Predicted secondary structure of the deduced EuHMGS4 protein
采用Auto mode建模方式對(duì)EuHMGS4蛋白進(jìn)行同源建模,得到了EuHMGS4蛋白的三維空間模型,如圖6所示。ExPAsy structure assessment程序評(píng)測(cè)推導(dǎo)的EuHMGS4蛋白模型QMEAN 6 得分為0.7。
將杜仲HMGS基因組序列及其對(duì)應(yīng)的完整編碼序列(coding sequence CDS)提交到GSDS在線網(wǎng)站預(yù)測(cè)基因組序列特征,結(jié)果如圖7和表3所示。EuHMGS基因家族不同的基因具有不同的外顯子和內(nèi)含子數(shù)量,其中EuHMGS4有11個(gè)外顯子,10個(gè)內(nèi)含子,其中位于0相位的內(nèi)含子6個(gè),1相位的內(nèi)含子1個(gè),2相位的內(nèi)含子3個(gè)。
圖6 EuHMGS4蛋白三級(jí)結(jié)構(gòu)預(yù)測(cè)Fig.6 Predicted tertiary structure of the deduced EuHMGS4 protein
圖7 EuHMGS基因內(nèi)含子和外顯子預(yù)測(cè)Fig.7 Prediction on the intron and exon in EuHMGS
表3 EuHMGS4外顯子和內(nèi)含子分布序列Table 3 Distribution sequence on the intron and exon in EuHMGS4 bp
利用PLACE 和plantCARE 在線數(shù)據(jù)庫(kù),預(yù)測(cè)EuHMGS基因啟動(dòng)子(5’UTR 2 000bp)的主要順式元件潛在的分布以及功能(見表4)。結(jié)果發(fā)現(xiàn),EuHMGS基因啟動(dòng)子含有大量基本順式作用元件TATAbox、CAATbox,除此之外,EuHMGS4啟動(dòng)子部分還還有熱脅迫(HSE)、脫落酸(ABRE)、水楊酸(TCA-element)、乙烯(ERE)等相關(guān)調(diào)控元件,這些順式作用元件均可能參與杜仲M(fèi)K基因功能以及萜類物質(zhì)代謝調(diào)控的過(guò)程。
表4 EuHMGS4基因啟動(dòng)子區(qū)順式元件作用預(yù)測(cè)Table 4 Function prediction on the cis-elements of promoter in EuHMGS4
續(xù)表1Table 1 Continuation
杜仲羥甲基戊二酰輔酶A 合酶基因(EuHMGS)是甲羥戊酸途徑(MVA)中的第1個(gè)催化酶,催化乙酰乙酰CoA 生成羥甲基戊二酰CoA,對(duì)于杜仲膠-多萜類的生物合成起著十分重要的作用[18]。序列上高度保守且功能相似的基因被稱為是同一個(gè)基因家族,生理功能的實(shí)現(xiàn)一般是通過(guò)一個(gè)家族的功能來(lái)實(shí)現(xiàn),而不是單獨(dú)的1個(gè)基因,利用基因組數(shù)據(jù),從基因家族的角度分析代謝途徑以及基因的功能具有重要的意義[19],根據(jù)杜仲HMGS的完整編碼框(CDS),在杜仲基因組數(shù)據(jù)中找到唯一1個(gè)HMGS基因,目前認(rèn)為杜仲HMGS家族就只包含1個(gè)基因,而巴西橡膠樹(Hevea brasiliensis)HMGS也是一個(gè)小的基因家族,包括HMGS1和HMGS2[17]。對(duì)EuHMGS基因進(jìn)行生物信息學(xué)分析結(jié)果表明,含有HMGS蛋白的典型保守序列GNTDIEGVDSTNACYGGTA;聚類分析顯示EuHMGS與雙子葉植物遺傳距離較近,符合遺傳進(jìn)化規(guī)律。EuHMGS基因啟動(dòng)子中含有大量的脫落酸、水楊酸、茉莉酸響應(yīng)調(diào)控元件。用甲基茉莉酸和水楊酸誘導(dǎo)CaHMGS 喜樹子葉和胚軸中的表達(dá),結(jié)果發(fā)現(xiàn)在不同的組織中具有不同的表達(dá)調(diào)控模式[20],因此,推測(cè)EuHMGS基因也可能具有組織特異性表達(dá)基因,而且在巴西橡膠樹中HMGS基因的mRNA和酶的活性在白天顯著高于夜間,推測(cè)HMGS可能因含有大量的光調(diào)控順式作用元件,導(dǎo)致HMGS基因的表達(dá)受到光變化的調(diào)控[21]。
[1] 杜紅巖.我國(guó)的杜仲膠資源及其開發(fā)潛力與產(chǎn)業(yè)發(fā)展思路[J].經(jīng)濟(jì)林研究,2010,28(3):1-6.
[2] 杜紅巖,劉昌勇,李 欽,等.杜仲葉中3 種主要活性成分含量的季節(jié)變化[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2011,31(8): 6-9.
[3] 杜紅巖,劉攀峰,孫志強(qiáng).我國(guó)杜仲產(chǎn)業(yè)發(fā)展布局探討[J].經(jīng)濟(jì)林研究,2012,30(3):130-144.
[4] 李芳東,杜紅巖.杜仲[M].北京:中國(guó)中醫(yī)藥出版社,2001:232-256.
[5] 杜蘭英,劉攀峰,朱景樂,等.環(huán)剝與環(huán)割強(qiáng)度對(duì)果園化栽培條件下杜仲生長(zhǎng)和結(jié)果的影響[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2013,33(8):14-18.
[6] 紀(jì)奎江.我國(guó)橡膠資源與廢橡膠循環(huán)利用[J].技術(shù)交流,2010,(4):21-24.
[7] 杜紅巖,胡文臻,俞 銳.杜仲產(chǎn)業(yè)綠皮書:中國(guó)杜仲橡膠資源與產(chǎn)業(yè)發(fā)展報(bào)告[M].北京:社會(huì)科學(xué)文獻(xiàn)出版社,2013:1-2.
[8] Duilio A,Silvia S,Christoph,et al.Terpenoid Biosynthesis from 1-Deoxy-D-xylulose in Higher Plantd by Intramolecular Skeletal Rearrangement[J] Proc Natl Acad Sci USA,1997,94:10600-10605.
[9] Hartmut K L,Michel R,J?rg S.Two Independent Biochemical Pathways for Isopentenyl Diphosphate and Isoprenoid Biosynthesis in Higher Plants[J].Physiol Plant,1997,101:643-652.
[10] Lynen F,Efferer H,Henning U,et al.Farnesylpyrophosphatund 3-Methyl-Δ3-butenyl-1-pyrophosphat,diebiologischen Vorstufendes Squalens Zur Biosyntheseder Terpene,III [J].Angewandte Chemie,1958,70(24):738-742.
[11] Chaykin S,Law J,Phillips A H,et al.Phosphorylated Intermediates in the Synthesis of Squalene[J].Proc N A S,1958,44 (10):998-1004 .
[12] 韓軍麗,李振秋,劉本葉.植物萜類代謝工程[J].生物工程學(xué)報(bào),2007,23(4):561-569.
[13] Mann V,Harker M,Pecker I,et al.Metabolic engineering of astaxanthin production in tobaccof lowers [J].Nat Biotechnol,2000,18: 888-892.
[14] 葉生晶,烏云塔娜,田大倫,等.杜仲M(fèi)VA途徑相關(guān)基因的鑒定及熒光定量PCR引物篩選[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2013,33(8)51-56.
[15] 李鐵柱,杜紅巖,劉慧敏,等.杜仲果實(shí)和葉片轉(zhuǎn)錄組數(shù)據(jù)組裝及基因功能注釋[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2012,32(11):122-130.
[16] 李鐵柱,杜紅巖,劉慧敏,等.杜仲幼果和成熟果實(shí)轉(zhuǎn)錄組數(shù)據(jù)組裝及基因功能注釋[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2012,32(10):9-17.
[17] 葉生晶.杜仲M(fèi)VA途徑相關(guān)基因表達(dá)差異及全長(zhǎng)cDNA序列特征[D].長(zhǎng)沙:中南林業(yè)科技大學(xué),2012.
[18] T Dairi.Biosynthetic Genes and Enzymes of Isoprenoids Produced by Actinomycetes[C]//Isoprenoid Synthesis in Plants and Microorganisms.New York: Springer-Verlag,2013: 29-49.
[19] 王鳳華,劉文鋒.擬南芥HMGS家族成員全基因組分析[J].安徽農(nóng)業(yè)科學(xué),2012,40(36):17478-17481.
[20] Pluang S,Nualpun S,Wallie S.Regulation of 3-Hydroxy-3-Methylglutaryl-CoA Synthase and 3-Hydroxy-3-Methylglutaryl-CoA Reductase and Rubber Biosynthesis ofHevea brasiliensis(BHK)Mull Arg[C]//Isoprenoid Synthesis in Plants and Microorganisms.New York: Springer-Verlag,2013: 315-327.
[21] 王 偉.喜樹毛狀根培養(yǎng)體系的建立及喜歡HMGS基因的克隆分析[D].上海:上海師范大學(xué),2009.