王琴波,王雨晴,楊 謹,陳觀水
福建農(nóng)林大學生命科學學院,福建 福州 350002
三萜類化合物是一類具有抗腫瘤、抗病毒、降血糖、調(diào)血脂等多種生物活性的植物次生代謝產(chǎn)物,在太子參、人參、甘草等中藥基原植物中廣泛存在[1-3]。三萜類化合物的結(jié)構(gòu)與生物合成過程比較復雜,關(guān)于合成途徑中的關(guān)鍵酶的研究是熱點之一[4]。研究表明,三萜類化合物主要有兩條合成途徑生成,即甲羥戊酸(mevalonate pathway,MVA)和甲基-赤蘚醇-4-磷酸途徑(2-methyl-D-erythritol-4-phosphate,MEP)途徑,其中MVA 途徑是植物三萜類化合物合成的主要途徑[5-8]。在MVA 途徑中,鯊烯合酶(squalene synthase,SQS)位于三萜合成通路的分支點上,決定著法尼基焦磷酸的流向,是三萜類化合物生物合成途徑中一個關(guān)鍵酶,其含量及活性決定了植物該物質(zhì)的產(chǎn)量,也是三萜皂苷合成代謝中的一個重要的限速酶[9-14]。目前,已從各種各樣的生物,如動物[15]、人類[16]、真菌[17]、植物[9]中成功分離了鯊烯合酶編碼基因序列近1000 條。通過對SQS 的結(jié)構(gòu)及理化特性分析表明,不同來源的SQS 在功能位點、結(jié)構(gòu)特征存在一定的差異。因此,鯊烯合酶作為三萜類化合物代謝途徑中關(guān)鍵調(diào)控酶備受關(guān)注,具有重要的研究意義。
本研究運用生物信息學相關(guān)軟件及其分析方法,對太子參等《中國藥典》2015年版[18]收錄的20 種中藥基原植物中SQS 蛋白氨基酸序列的理化特性、跨膜結(jié)構(gòu)域、亞細胞定位、親水性進行比較與分析,并構(gòu)建SQS 蛋白家族的系統(tǒng)發(fā)育樹。為進一步研究植物SQS 的功能與結(jié)構(gòu)特征和調(diào)控植物三萜類化合物的生物合成提供依據(jù)。
設(shè)定SQS 為關(guān)鍵詞進行搜索,從美國國立生物技術(shù)信息中心(National Center of Biotechnology Information,NCBI)下載并篩選出了太子參Pseudostellaria he terophylla(Miq.) Pax ex Pax et Hoffm(登錄號AQV11962.1)、人參Panax ginsengC.A.Meyer(登錄號 ACV88718.1)、三七Panax notoginseng(Burkill) F.H.Chen ex C.H.(登錄號AIK21786.1)、西洋參Panax quinquefoliumL.(登錄號(AED99863.1)、竹節(jié)參Panax japonicas(T.Nees)C.A.Mey.(登錄號 ALB38664.1)、刺五加Acanthopanax senticosus(Rupr.Maxim.) Harms(登錄號AER23670.1)、柴胡Bupleurum chinenseD.C.(登錄號(ACX42425.1)、甘草Glycyrrhiza uralensisFisch.(登錄號ACS66749.1)、膜莢黃芪Astragalus membranaceus(Fisch.) Bunge(登錄號(ALA23415.1)、千金子Euphorbia lathyris(L.) Nees(登錄號(AFZ93644.1)、梔子Gardenia jasminoidesEllis.(登錄號AYC62335.1)、瓜蔞Trichosanthes kirilowiiMaxim.(登錄號(ARE29883.1)、金鐵鎖Psammosilene tunicoidesW.C.Wu & C.Y.Wu(登錄號(ABQ96265.1)、遠志Polygala t enuifoliaWilld.(登錄號ABG66304.1)、羅漢果Siraitia gr osvenorii(Swingle) C.Jeffery(登錄號(ANM71227.1)、丹參Salvia m iltiorrhizaBunge(登錄號ACR57219.1)、黃花蒿Artemisia annuaL.(登錄號AAR20329.1)、京大戟Euphorbia pe kinensisRupr.(ER)(登錄號AFT92039.1)、光果甘草Glycyrrhiza glabraL.(登錄號(AMR98504.1)、積雪草Centella asiatica(L.)Urb.(登錄號AAV58897.1)20 種《中國藥典》2015年版中收錄的中藥基原植物完整的SQS 氨基酸序列。
SQS 氨基酸序列利用NCBI 網(wǎng)站進行在線分析;氨基酸序列的組成、相對分子質(zhì)量、等電點、不穩(wěn)定系數(shù)等理化性質(zhì)利用Protparam(http: //web.expasy.org/protparam/)在線進行分析;跨膜結(jié)構(gòu)域用 TMHMM Serverv.2.0 ( http://www.cbs.dtu.dk/services/TMHMM-2.0/)進行預測;亞細胞定位利用 PSORTPrediction ( https: //wolfpsort.hgc.jp/)進行分析;信號肽利用SignalP軟件5.0 版(http://www.cbs.dtu.dk/services/ SignalP/)進行預測;采用 SOPMA ( https: //npsaprabi.ibcp.fr/cgi-bin/npsa_automat.pl/page=npsa_so pma.html)進行蛋白二結(jié)結(jié)構(gòu)的預測分析;采CDD在線工具分析(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)進行功能域預測;蛋白質(zhì)磷酸化位點利用 NetPhos3.1 Server ( http://www.cbs.dtu.dk/services/NetPhos/)進行預測;利用DNAMAN 9.0 進行SQS 蛋白氨基酸序列的多重比對分析;采用MEGA 10.0 軟件構(gòu)建SQS 蛋白的系統(tǒng)進化樹;利用 MEME 在線分析工具(http://meme-suite.org/tools/meme)進行SQS 蛋白的保守基序進行分析。
使用在線軟件Protparam 對20 條SQS 的氨基酸序列進行理化性質(zhì)預測分析(表1)。預測析分表明,20 條氨基酸序列的等電點在6.19~8.53,呈現(xiàn)弱酸性或弱堿性,正負電荷比例約為1∶1;同時對氨基酸序列的組成成分也進行了分析,發(fā)現(xiàn)所有SQS 蛋白中亮氨酸(L)含量最高,最高可達 11.8%。相對分子質(zhì)量之間差別不大,在46 960~47 890;總平均親水系數(shù)均為負值,親水性較好,表明SQS 均屬于親水性蛋白;預測的蛋白的不穩(wěn)定指數(shù)在35.77~44.38,表明20 種蛋白中既有穩(wěn)定性蛋白也有不穩(wěn)定性蛋白。
表1 20 種中藥基原植物SQS 蛋白理化性質(zhì)的預測分析Table 1 Prediction and analysis of physical and chemical properties of SQS protein in 20 Chinese herbal plants
利用在線軟件TMHMM 對太子參等20 個SQS 蛋白進行跨膜預測(表2),顯示除來源于桅子和丹參的SQS 蛋白只有1 個跨膜,其余SQS蛋白均含有2 個跨膜結(jié)構(gòu)。亞細胞定位預測表明(表2),20 個SQS 蛋白均具有多個亞細胞定位,其主要分布于細胞質(zhì)和質(zhì)膜中,并在細胞核、線粒體、高爾基體、內(nèi)質(zhì)網(wǎng)、液泡中也有少量分布,說明這些蛋白質(zhì)主要在細胞質(zhì)和質(zhì)膜中行使其功能。利用在線工具Signal P 對20 個SQS 蛋白進行信號肽預測(表2),結(jié)果顯示,所有的SQS 蛋白均不存在信號肽。
利用SOPMA 對20 種中藥SQS 蛋白的二級結(jié)構(gòu)進行預測(表3)。結(jié)果表明,所有SQS 蛋白均由α-螺旋、延伸連和無規(guī)則卷曲3 種構(gòu)件組成,其中以α-螺旋和無規(guī)則卷曲為主。以太子參SQS 為例,其α-螺旋、延伸連和無規(guī)則卷曲3 種構(gòu)件的比例分別為38.65%、22.22%和39.13%。因此推測,α-螺旋和無規(guī)則卷曲是植物SQS 蛋白中主要存在的結(jié)構(gòu)元件,并且分散在整個多肽鏈中。
表2 不同中藥基原植物SQS 蛋白跨膜、亞細胞定位及信號肽預測分析Table 2 SQS protein sequences prediction analysis of transmembrane,subcellular localization and signal peptide from different Chinese herbal plants
表3 不同中藥基原植物SQS 蛋白二級結(jié)構(gòu)元件比例Table 3 Secondary structure element ratio of SQS in different Chinese herbal plants
利用CDD 在線工具分析太了參等20 種SQS 氨基酸序列的功能結(jié)構(gòu)域。結(jié)果表明,20 種SQS 氨基酸的保守結(jié)構(gòu)域中均含有底物結(jié)合區(qū)、底物-鎂離子結(jié)合位點、活性位點蓋殘基、催化殘基和2 個天冬氨酸富集區(qū),具有典型的多聚異戊二烯基合成酶活性結(jié)構(gòu)域和鯊烯/八氫番茄紅素合成酶活性結(jié)構(gòu)域,屬于Isoprenoid-Biosyn-C1 超家族,為類異戊二烯生物合成酶。太子參SQS 的保守結(jié)構(gòu)域見圖1。
圖1 太子參SQS 的保守結(jié)構(gòu)域分析Fig.1 Conserved domain analysis of PhSQS
利用NetPhos 3.1 Server 對20 種中藥基原植物SQS 蛋白磷酸化位點進行預測,位點數(shù)在29~38個,其中絲氨酸磷酸化位點數(shù)在12~20 個,蘇氨酸位點有5~15 個,酪氨酸磷酸化位點有5~8 個。以太子參SQS 為例,共有32 個磷酸化位點,其中絲氨酸位點有13 個,蘇氨酸位點有11 個,酪氨酸磷酸化位點有8 個,其他中草藥植物的SQS 蛋白的氨基酸磷酸化位點差別。見表4。
20 種中藥基原植物的SQS 氨基酸序列的多重比分析表明(圖2),所有20 種SQS 均含有4 個高保守(I~Ⅳ)且典型的17~23 個氨基酸長度的結(jié)構(gòu)域和1個高度差異且?guī)缀跻允杷被釟埢鶠橹鞯母叨仁杷畢^(qū)結(jié)構(gòu)域(V)。研究表明,這些結(jié)構(gòu)域與SQS 的結(jié)合、調(diào)節(jié)及催化活性功能密切相關(guān)。用MEGA 10.0軟件對包括太子參在內(nèi)的20 種有代表性的SQS 蛋白構(gòu)建系統(tǒng)進化樹(圖3)。
表4 20 種中藥基原植物SQS 蛋白磷酸化作用位點預測結(jié)果Table 4 Prediction of phosphorylation sites of SQS protein from 20 Chinese herbal plants
圖2 20種中藥基原植物的SQS氨基酸序列比對分析Fig.2 Amino acid sequence alignment of SQS protein from 20 Chinese herbal plants
分析結(jié)果顯示,在進化遺傳學上親緣越近的物種,在SQS的分子系統(tǒng)進化樹上基本上距離越近?;诎被嵝蛄兄亟ǖ南到y(tǒng)進化樹,其結(jié)果對判斷不同植物之間的親緣關(guān)系具有一定的借鑒意義和可行性參考。
通過MEME軟件的搜索,在20個SQS蛋白氨基酸序列中發(fā)現(xiàn)了15個保守基序(motif)結(jié)構(gòu)(圖3),長度在6~50個氨基酸,所有SQS蛋白含有的基序除在碳端有稍有差別外,其他大體一致,且存在有位于SQS保守結(jié)構(gòu)域內(nèi)的保守基序。同時還發(fā)現(xiàn),在系統(tǒng)發(fā)育樹的每個分支上的成員具有相同或類似的基序類型和排列順序,顯示SQS蛋白之間在這20種中藥基原植物中的相對保守性。
圖3 20 種中藥基原植物SQS 蛋白系統(tǒng)發(fā)育樹及保守基序Fig.3 Phylogenetic tree and conserved motif of SQS proteins from 20 Chinese herbal plants
三萜及其苷類廣泛存在于自然界,在菌類、蕨類、單子葉、雙子葉植物、動物及海洋生物中均有分布,尤以雙子葉植物中分布最多[3]。三萜類化合物是人參、甘草、柴胡等中草藥植物中主要活性物質(zhì),常具有抗腫瘤、溶血、抗菌、增加機體免疫力的作用[1-3]。通過對三萜類化合物生物合成的研究表明,三萜類化合物是由鯊烯經(jīng)過不同的途徑環(huán)合而成,而鯊烯是三萜類化合物合成途徑中關(guān)鍵前體物質(zhì),它由法尼基焦磷酸(farnesyl diphosphate,F(xiàn)PP)經(jīng)過鯊烯合酶作用下兩分子鯊烯通過尾-尾縮合生成[5-11]。眾多研究表明,鯊烯合酶是三萜類化合物的底物合成起始點的催化合成酶,是三萜類化合物合成途徑中一個關(guān)鍵限速酶,對三萜類化合物合成途徑的下游物質(zhì)合成和積累具有重要決定性意義[9-10]。
利用生物信息學分析工具對源自《中國藥典》2015年版且三萜類化合物為其主要活性物質(zhì)的中藥基原植物的20 條SQS 蛋白氨基酸序列進行分析。SQS 蛋白質(zhì)一級結(jié)構(gòu)分析,表明這20 種中藥基原植物的SQS 蛋白呈現(xiàn)弱酸性或弱堿性,部分不穩(wěn)定,部分穩(wěn)定,均屬于親水性蛋白,不具有信號肽,可推測SQS 不是分泌蛋白,這與其屬于細胞質(zhì)中的MVA 途徑相一致;均存在1~2 個跨膜結(jié)構(gòu)域;亞細胞定位預測分析表明其最大可能定位在質(zhì)膜或細胞質(zhì)上,這與前人研究報道鯊烯合酶屬于膜結(jié)合蛋白相一致[12]。二級結(jié)構(gòu)預測結(jié)果表明,所有的SQS均以α-螺旋和任意卷曲為主要成份。多序列比對顯示這20 種中藥基原植物的SQS 氨基酸序列彼此間存在較高的相似性,含有4 個高保守且典型的17~23 個氨基酸長度的結(jié)構(gòu)域(I~Ⅳ)包括底物結(jié)合區(qū)、底物-鎂離子結(jié)合位點、活性位點蓋殘基、催化殘基和2 個天冬氨酸富集區(qū),研究表明,這些高保守區(qū)域?qū)τ赟QS 發(fā)揮催化作用具有關(guān)鍵作用[14,19]。另外,這20 條序列中均在氨基酸序列的C 端序列差異性極大且屬于幾乎都是疏水氨基酸殘基,研究表明,這些殘基有助于鯊烯合酶錨定于細胞器膜上[20]。系統(tǒng)發(fā)育樹的結(jié)果顯示,20 種中藥基原植物的SQS 蛋白氨基酸序列的聚類結(jié)果基本與植物系統(tǒng)分類學結(jié)果相一致。所有的信息表明,這20 種中藥基原植物的SQS 蛋白結(jié)構(gòu)和序列上的高度保守也許揭示它們在功能上的相似性。本研究通過對SQS 的序列結(jié)構(gòu)的預測和分析為深入研究鯊烯合酶結(jié)構(gòu)與功能的關(guān)系、作用機制和代謝過程提供了參考,同時也有助于其他生物的SQS 基因的克隆。