雷躍 楊仕梅 張?zhí)炀?趙德剛 宋莉
摘要:鯊烯合酶(SQS)是催化植物細胞合成甾醇和三萜類化合物的一種關(guān)鍵酶。為探明杜仲SQS基因家族成員的存在及其特性,本文通過生物信息學(xué)分析方法,對杜仲SQS基因(EuSQS)進行發(fā)掘,并對其進化關(guān)系、基因結(jié)構(gòu)、保守基序、染色體定位、蛋白理化性質(zhì)、空間結(jié)構(gòu)、調(diào)控元件等進行分析。從杜仲基因組數(shù)據(jù)中獲得3條EuSQS基因,它們分布于不同的scaffold上,有5 ~6個外顯子;EuSQS蛋白含396~ 440 aa,相對分子質(zhì)量為4573 ~ 4906 kDa,均屬于不穩(wěn)定蛋白,主要由α-螺旋和無規(guī)則卷曲構(gòu)成;EuSQS1和EuSQS3在結(jié)構(gòu)上較為接近,二者與EuSQS2差異較大;除含有基本元件外,EuSQSs的順式作用元件還包括光照和激素響應(yīng)、分生組織表達、逆境脅迫及類黃酮生物合成等六類;在進化關(guān)系上,杜仲EuSQSs與產(chǎn)膠植物橡膠草及橡膠樹的親緣關(guān)系較近。分析結(jié)果為進一步對EuSQS基因的功能鑒定和利用提供了依據(jù)。
關(guān)鍵詞:杜仲鯊烯合酶基因;萜類化合物;生物信息學(xué);基因結(jié)構(gòu);功能預(yù)測
中圖分類號:Q8114
文獻標(biāo)識碼:A
文章編號:1008-0457(2019)06-0001-07國際DOI編碼:10.15958/j.cnki.sdnyswxb.2019.06.001
Characteristic Information Analysis of Eucommia ulmoides SQS Gene
LEI Yue1,YANG Shi-mei1,ZHANG Tian-yuan1,ZHAO De-gang1,2,SONG Li1*
(1. Institute of College of Life Sciences and Agro-Bioengineering,Guizhou University/The Key Laboratory of Plant Resources Conservation and Germplasm Innovation in Mountainous Region (Ministry of Education)/ Guizhou Key Lab of Agro-Bioengineering,Guiyang,Guizhou 550025,China; 2. Guizhou Academy of Agricultural Sciences,Guiyang,Guizhou 550006,China)
Abstract:Squalene synthase (SQS )is a key enzyme catalyzing the formation of sterols and triterpenes in plant cellsIn order to explore the? existence and characteristics of the? SQS gene family members of? Eucommia ulmoidesthe Eucommia ulmoides SQS genes (EuSQSs )were screened and further analyzed for a better cognition by bioinformatic analysis including phylogenetic evolution,gene structure,conserved motif,chromosome positioning,the physicochemical properties,spatial structure and regulatory elements etcThe results showed that three EuSQS genes scattering different scaffold were obtained from the genome data,which have 5-6 of exonsEuSQS proteins were composed of 396-440 aa with a relative molecular weight of 4573 ~ 4906 kDaThe main structure of α- helix and random coil were found in these unstable proteinsEuSQS1 and EuSQS3 are similar in structure,but they are quite different comparing with EuSQS26 types of cis-acting elements related to gene regulation including basic elements,photoresponse,hormone response,meristem expression,stress tolerance and flavonoid biosynthesis also were found in the EuSQS genesIn terms of evolutionary relationship,Eucommia ulmoides EuSQS is closely related to the Taraxacum kok-saghyz and Hevea brasiliensis based on the phylogenetic analysisThis study preliminarily revealed the EuSQS molecular characteristics,which laid a good foundation for further study on the function of EuSQS genes.
Key words:EuSQS genes; terpenoids; bioinformatics; gene structure; function prediction
杜仲(Eucommia ulmoedes oliver)又名思仲、木棉、絲棉樹及玉絲皮等,是我國特有的名貴藥用樹種,也是世界上分布于亞熱帶和溫帶的極少數(shù)優(yōu)質(zhì)天然橡膠木本植物之一。杜仲的皮、葉、果及雄花均可入藥,具有消炎、抑菌、抗疲勞、抗氧化、降血脂、降血糖、增強免疫功能等多重功效[1-4],這些生物學(xué)活性是由杜仲含有的甾醇類、三萜類、環(huán)烯醚萜類、苯丙素類、黃酮類等多種次生代謝產(chǎn)物決定的。其中,杜仲甾醇類和三萜類具有降膽固醇、降血糖、調(diào)節(jié)機體免疫力、抗癌等活性[5,6]。甾醇類和三萜類的生物合成首先是通過甲羥戊酸途徑(mevalonic acid pathway,MVA)生成法尼基焦磷酸(farnesyl diphosphate,F(xiàn)PP),F(xiàn)PP在鯊烯合酶(Squalene Synthase,SQS,EC25121)的進一步催化下合成鯊烯(Squalene,SQ),鯊烯作為甾醇、三萜等物質(zhì)的共同前體[7],再經(jīng)過多步代謝反應(yīng)即可合成甾體類和三萜類物質(zhì)[8,9]??梢?,鯊烯合酶SQS作為催化甾醇和三萜類生物合成途徑中的重要調(diào)節(jié)點[10],是一種調(diào)控杜仲藥用活性成分的關(guān)鍵酶。盡管對橡膠樹等植物的鯊烯合酶的研究較多[11],但仍缺乏對杜仲鯊烯合酶及其編碼基因特性的了解,限制了對杜仲甾醇、三萜等活性成分合成調(diào)控的分子機制解析及利用。
本文通過生物信息學(xué)分析方法,對杜仲SQS基因進行發(fā)掘,并對其進化關(guān)系、基因結(jié)構(gòu)、染色體定位、理化性質(zhì)、三維結(jié)構(gòu)及順式作用元件組成等基本特征進行分析研究,為今后研究杜仲SQS基因功能和揭示甾體類和三萜類等杜仲化合物的合成調(diào)控提供依據(jù)。
1材料與方法
11材料來源
杜仲基因組數(shù)據(jù)庫來源于http://bigdbigaccn/gwh/Assembly/13/show。
12分析方法
根據(jù)Pfam數(shù)據(jù)庫中SQS基因的SQS_PSY(PF00494)功能域特征,構(gòu)建隱馬爾可夫模型,設(shè)置e-value值為1e-20,從杜仲基因組數(shù)據(jù)庫中鑒定SQS基因成員(EuSQSs)。參考相關(guān)文獻方法[12],利用在線工具GSDS(http://gsdscbipkueducn/)對EuSQS成員進行CDS結(jié)構(gòu)分析,根據(jù)文獻報道方法[13],通過在線工具MEME對杜仲SQS蛋白的motif進行預(yù)測分析;從基因組數(shù)據(jù)庫中心(http://bigdbigaccn/)獲得杜仲基因組注釋文件,根據(jù)SQS基因所在Scaffold的位置信息繪制其位置信息圖,并用在線工具MG2C(http://mg2ciaskin/mg2c_v20/)制作染色體定位圖;利用 ExPASy中的ProtParam (http://webexpasyorg/protparam/)軟件對EuSQS蛋白的基本特性進行分析;利用在線軟件SOPMA((https://npsa-prabiibcpfr/cgi-bin/npsa_automatpl? page=npsa_sopmahtml))對SQS蛋白的二級結(jié)構(gòu)進行分析,通過在線軟件SWISS-MODEL(https://swissmodelexpasyorg/interactive)分析其三維結(jié)構(gòu)[14];參考文獻方法[15],利用bedtools工具獲得SQS基因上游2000 bp序列,利用在線軟件PlantCARE對獲得的序列進行結(jié)構(gòu)分析[16],探討EuSQSs基因的主要順式作用元件;基于多序列比對的鄰接法(Neighbor-Joining),利用軟件 MEGA7,構(gòu)建EuSQSs基因的進化樹。執(zhí)行參數(shù)為bootstrap 1000次重復(fù),其他參數(shù)為系統(tǒng)默認(rèn)值。
2結(jié)果與分析
21杜仲SQS基因家族成員組成
基于構(gòu)建的隱馬爾可夫模型,從杜仲基因組中篩選到5條EuSQS基因,根據(jù)SQS基因特有SQS_PSY功能域,去掉不含SQS_PSY功能域的2條假陽性基因,最終從杜仲基因組中鑒定獲得3條EuSQS基因,其序列ID分別為GWHPAAAL000046、GWHPAAAL013859、GWHPAAAL007514,根據(jù)其在Scafflold上的位置分別命名為EuSQS1、EuSQS2、EuSQS3。
22杜仲SQS基因的結(jié)構(gòu)特征
利用在線網(wǎng)站工具GSDS對EuSQS基因內(nèi)含子和外顯子進行分析發(fā)現(xiàn),杜仲三條EuSQSs成員的基因結(jié)構(gòu)中均含有內(nèi)含子和外顯子(圖2),其中,EuSQS1和EuSQS3內(nèi)含子數(shù)量和外顯子數(shù)量一致,分別為5和6;而EuSQS2的內(nèi)含子數(shù)量和外顯子數(shù)量較少,分別為6和5。
利用 MEME軟件對3條杜仲SQS蛋白序列進行結(jié)構(gòu)分析,結(jié)果表明(圖3),EuSQS1和EuSQS3兩條蛋白均含8個基序,其中,6個基序相同,僅2個基序存在差異,推測二者在空間結(jié)構(gòu)和功能上接近;EuSQS2所含基序最少,僅有4個,表明EuSQS2與EuSQS1、EuSQS3在結(jié)構(gòu)上差異較大,功能上也可能存在差異。
23杜仲SQS基因在染色體上的位置
對SQS基因進行染色體定位分析顯示(圖4),EuSQS1、EuSQS2、EuSQS3三條基因分別位于Super-Scaffold_1、Super-Scaffold_91、Super-Scaffold_309三條Scaffold上,且杜仲三條SQS基因之間關(guān)聯(lián)度較差,不存在串聯(lián)重復(fù)。
24杜仲SQS蛋白的理化特性
理化性質(zhì)分析表明(表1),EuSQS1、EuSQS2、EuSQS3蛋白長度分別為434aa、440aa、396aa ,相對分子質(zhì)量大小分別為4874 kDa、4906 kDa、4573 kDa,理論等電點分別為909、920、844,編碼氨基酸序列最長的是EuSQS2,其相對分子質(zhì)量最大為4906 kDa;EuSQS3相對分子質(zhì)量最小,為4573 kDa。不穩(wěn)定指數(shù)分析表明,SQS蛋白不穩(wěn)定系數(shù)均大于40,為不穩(wěn)定蛋白,其中EuSQS2的不穩(wěn)定系數(shù)最小,為5232。三條蛋白的脂溶指數(shù)分別7959、8766、7588,均小于100,總平均親水性分別為-0384、-0263、-0484,均小于0,說明 SQS蛋白為親水性蛋白。
25SQS蛋白的二級結(jié)構(gòu)和三維結(jié)構(gòu)特征
對3條杜仲SQS蛋白的二級結(jié)構(gòu)分析表明,SQS蛋白由α-螺旋、延伸鏈、無規(guī)則卷曲、β-轉(zhuǎn)角四種結(jié)構(gòu)單元組成。其中,以α-螺旋比例最高,三條蛋白分別為5415%、5636%、5530%,占一半以上;其次是無規(guī)則卷曲,所占比例分別為3387%、3023%、3308%(表2)。
通過SWISS-MODEL對三維結(jié)構(gòu)進行的分析表明,SQS蛋白的三維結(jié)構(gòu)均由多個螺旋、延伸鏈和轉(zhuǎn)角組成,其中,EuSQS1和EuSQS3的三維結(jié)構(gòu)高度相似(圖5),這與motif分析推論出的二者空間結(jié)構(gòu)相似是一致的,可能二者屬于同一類型。
26杜仲SQS基因的順式作用元件組成
參照相關(guān)文獻報道方法[17],對EuSQS基因上游2000 bp序列進行分析發(fā)現(xiàn),SQS基因所含順式作用元件除CAAT-box和TATA-box基本元件外,還包括五類調(diào)節(jié)元件(圖6),第一類參與光響應(yīng),包括G-box、G-Box、Box-4、Sp-1、MRE等;第二類是激素響應(yīng)調(diào)節(jié)元件,有脫落酸反應(yīng)相關(guān)的ABRE,參與茉莉酸甲酯反應(yīng)的CGTCA-motif,水楊酸反應(yīng)所需的TCA-element以及赤霉素響應(yīng)元件GARE-motif等;第三類是與分生組織表達相關(guān)的順式作用調(diào)節(jié)元件CAT-box;第四類屬于逆境脅迫相關(guān)的順式作用元件,有參與防御、脅迫和應(yīng)激反應(yīng)的TC-rich-repeats,以及低溫響應(yīng)元件LTR;第五類參與類黃酮生物合成基因調(diào)控的MYB結(jié)合位點作用元件MBSI,該元件僅在EuSQS3中發(fā)現(xiàn),EuSQS1和EuSQS2中沒有。因此,EuSQSs基因在杜仲中具有廣泛的生物學(xué)活性,在光照、溫度及激素等信號分子的介導(dǎo)下,可能參與細胞光合過程、信號轉(zhuǎn)導(dǎo)、生長發(fā)育、逆境脅迫耐受和次生代謝活動等生物學(xué)過程的調(diào)控。
27杜仲SQS基因的進化特性
利用MEGA70軟件對3條杜仲SQS基因和模式植物擬南芥(10條)以及產(chǎn)膠植物橡膠草(6條)和橡膠樹(11條)的SQS基因構(gòu)建進系統(tǒng)化樹,并進行親緣性分析。結(jié)果顯示(圖7),3條杜仲SQS基因與模式植物擬南芥在進化上均較遠,而EuSQS1和EuSQS3與橡膠草的SQS基因、EuSQS2同橡膠樹的SQS基因在進化關(guān)系上接近,這從分子層面上為杜仲既是一種藥食兼用植物,也是一種產(chǎn)膠植物提供了依據(jù)。
3結(jié)論與討論
鯊烯合酶(SQS)是結(jié)合在內(nèi)質(zhì)網(wǎng)上的合成植物甾醇和三萜類化合物的關(guān)鍵酶[18],在細胞內(nèi),其含量和活性直接影響鯊烯的合成,進而影響到以其作為前體的次生代謝物質(zhì)合成[19]。近年來對植物SQS基因的調(diào)控研究倍受重視,盡管已對葡萄[20]、人參[21]、雷公藤[22]、甘草[19]和靈芝[23]等植物中的SQS基因進行了克隆分析,但其在杜仲中的研究還較為有限。
本研究對杜仲SQS基因家族成員進行發(fā)掘和基本特征的信息學(xué)預(yù)測分析,發(fā)現(xiàn)杜仲SQS蛋白長度范圍在396~440aa之間,相對分子質(zhì)量大小范圍為4573 ~ 4906 kDa,這與目前已知的植物鯊烯合酶的氨基酸殘基為410 ~ 461個,分子量介于469 ~525 kDa是接近的[24]?;蚣易宄蓡T之間既有功能相互一致或促進的,也有因分工不同而存在差異的。杜仲EuSQS1和EuSQS3的保守基序和空間結(jié)構(gòu)相似,且均與EuSQS2差異較大,可能與EuSQS1和EuSQS3的生物學(xué)功能相似而與EuSQS2不同有關(guān)??梢?,杜仲SQS基因家族成員在細胞中的功能較為豐富。杜仲既是一種藥用植物,也是一種產(chǎn)膠植物[25]。對杜仲與擬南芥、橡膠草、橡膠樹SQS基因間的進化關(guān)系分析表明,杜仲與產(chǎn)膠植物橡膠草和橡膠樹的同源性較高親緣關(guān)系較近,這可能和杜仲與同是橡膠植物的橡膠草、橡膠樹在生物學(xué)功能、生長調(diào)控機制上存在相似性有關(guān),這也暗示SQS基因可能在橡膠合成代謝中重要作用[11]。
植物激素作為細胞次生代謝的重要信號分子[26],促進SQS基因表達,從而調(diào)控三萜等的合成[27-29]。植物細胞中,水楊酸和茉莉酸甲酯是參與次生代謝過程的重要信號分子[26],水楊酸可通過提高靈芝SQS基因的表達促進靈芝三萜的高效合成[26],茉莉酸甲酯則可以增強靈芝甲羥戊酸途徑(MVA)中SQS、FPS、 HMGS、HMGR、MVD等關(guān)鍵酶基因的表達[25],而茯苓中MeJA可以顯著上調(diào)SQS基因表達而實現(xiàn)對三萜類的生物合成[29]??梢钥闯?,藥用植物中有效成分相關(guān)的次生代謝產(chǎn)物合成過程需要激素分子的參與啟動。本研究分析表明,杜仲SQS基因均含有水楊酸及茉莉酸甲酯反應(yīng)的順式作用調(diào)節(jié)元件TCA-element和CGTCA-motif,這為杜仲三萜類藥用成分的合成調(diào)控需要激素參與從分子層面上提供了依據(jù)。值得關(guān)注的是,EuSQS3基因中含有參與類黃酮生物合成調(diào)控的MYB轉(zhuǎn)錄因子結(jié)合位點作用元件,表明杜仲降糖降脂藥用活性成分——類黃酮的合成通過MYB調(diào)控途徑實現(xiàn),與其它植物一致[30]。本研究對發(fā)掘的3條杜仲SQS基因進行了系統(tǒng)的特征信息分析,研究結(jié)果將有助于對EuSQSs基因克隆、功能分析及利用等的進一步研究。
參考文獻:
[1]Kobayashi Y,Hiroi T,Araki M,et alFacilitative effects of Eucommia ulmoides on fatty acid oxidation in hypertriglyceridaemic rats[J]. Journal of the Science of Food and Agriculture,2012,92(2):358-365.
[2]馮晗,周宏灝,歐陽冬生杜仲的化學(xué)成分及藥理作用研究進展[J].中國臨床藥理學(xué)與治療學(xué),2015,20(6):713-720.
[3]項麗玲,溫亞娟,苗明三杜仲葉的化學(xué)、藥理及臨床應(yīng)用分析[J].中醫(yī)學(xué)報,2017,32(1):99-102.
[4]董旋,丁延慶,冉昕,等.杜仲EuCHIT1基因表達載體構(gòu)建及在大腸桿菌中的表達[J].山地農(nóng)業(yè)生物學(xué)報,2016,35(05):9-12.
[5]Seppo L,Jauhiainen T,Nevala R,et alPlant stanol esters in low-fat milk products lower serum total and LDL cholesterol[J]. European Journal of Nutrition,2007,46(2):111-117.
[6]丁艷霞,王騰宇,張耀文,等.杜仲雄花中三萜類化學(xué)成分研究[J].中國中藥雜志,2014,39(21):4225-4229.
[7]朱振洪,沈靜炎,周利萍,等.浙貝母鯊烯合酶核心功能區(qū)基因克隆與序列分析[J].生物技術(shù),2014,24(3):1-5.
[8]Pirronen V,Lindsay D G,Miettinen T A,et alPlant sterols:biosynthesis,biological function and their importance to human nutrition[J]. Journal of the Science of Food and Agriculturc,2000:939-966.
[9]謝琴鼎,陳瑤,唐亞琴,等.植物三萜代謝途徑中角鯊烯合成酶研究進展[J].分子植物育種,2018,16(9):2997-3005.
[10]KVishwakarma R,Patel K,Sonawane P,et alSqualene Synthase Gene from Medicinal HerbBacopa monniera:Molecular Characterization,Differential Expression,Comparative Modeling,and Docking Studies[J]. Plant Molecular Biology Reporter,2015,33(6):1675-1685.
[11]張志平,仇鍵,楊文鳳,等.巴西橡膠樹鯊烯合酶基因的克隆與序列分析[J].廣西植物,2014,34(2):235-241.
[12]Hu B,Jin J,Guo A Y,et alGSDS 20:An upgraded gene feature visualization server[J]. Bioinformatics,2014,31(8):1296.
[13]Bailey T L,Boden M,Buske F A,et alMEME SUITE:tools for motif discovery and searching[J]. Nucleic Acids Research,2009,37(2):W202-W208.
[14]呂晶晶,張?zhí)炀墸瑮钍嗣?,?大腸桿菌茶氨酸合成酶基因γ-GGT的生物信息學(xué)分析[J].山地農(nóng)業(yè)生物學(xué)報,2019,38(01):74-78.
[15]Quinlan A RBEDTools:The Swiss-Army tool for genome feature analysis[J]. Current Protocols in Bioinformatics,2014,47(111211):11121.
[16]Quinlan A R,Hall IM. BEDTools:a flexible suite of Utilities for comparing genornic features[J].Bioinform atics,2010,26(6):841-842.
[17]陳虹君,高臻毅,郭小勤毛竹IDD基因家族啟動子分析[J].福建農(nóng)林大學(xué)學(xué)報(自然科學(xué)版),2016,45(4):427-433.
[18]Filiz E,Ozyigit I I,Vatansever RComparative analyses of squalene synthase (SQS)proteins in poplar and pine by using bioinformatics tools[J]. Tree Genetics & Genomes,2016,12(2):32.
[19]榮齊仙,劉春生,黃璐琦,等.甘草鯊烯合酶基因及cDNA的克隆與序列分析[J].中國中藥雜志,2011,36(11):1416-1420.
[20]鄭祥正葡萄鯊烯合成酶基因的克隆與序列分析[J].江西農(nóng)業(yè)學(xué)報,2012,24(11):8-10,13
[21]張明哲,王真慧,張美萍,等.人參SQS和SE酶基因的克隆及其表達載體的構(gòu)建[J].現(xiàn)代農(nóng)業(yè)科技,2010,(4):20-22.
[22]Zhang B,Liu Y,Chen M,et alCloning,Expression Analysis and Functional Characterization of Squalene Synthase (SQS)from Tripterygium wilfordii[J]. Molecules,2018,23(2):269.
[23]Zhao M W,Liang W Q,Zhang D B,et alCloning and Characterization of Squalene Synthase (SQS)Gene from Ganoderma lucidum[J]. Journal of Microbiology & Biotechnology,2007,17(7):1106-1112.
[24]侯嶸,龔諾希,劉法濤,等.麻瘋樹鯊烯合酶基因SQS的克隆及生物信息學(xué)分析[J].熱帶亞熱帶植物學(xué)報,2011,19(5):391-399.
[25]Wang L,Wuyun T N,Du H Y,et alComplete chloroplast genome sequences of Eucommia ulmoides:genome structure and evolution[J]. Tree Genetics & Genomes,2016,12(1):12.
[26]鄒琳,周潔,王曉,等.藥用植物次生代謝信號轉(zhuǎn)導(dǎo)研究進展[J].中國現(xiàn)代中藥,2015,17(7):747-752.
[27]Ren A,Qin L,Shi L,et alMethyl jasmonate induces ganoderic acid biosynthesis in the basidiomycetous fungus,Ganoderma lucidum[J]. Bioresource Technology,2010,101(17):6785-6790.
[28]葉麗云,林強,劉梅,等.鈣離子和水楊酸誘導(dǎo)靈芝多糖和三萜的合成[J].菌物學(xué)報,2017(02):220-228
[29]陳林,崔培梧,魯耀邦,等.茉莉酸甲酯對茯苓三萜生物合成的調(diào)控研究[J].湖南中醫(yī)藥大學(xué)學(xué)報,2017(6):606-610.
[30]Ravaglia D,Espley R V,Henry-Kirk R A,et alTranscriptional regulation of flavonoid biosynthesis in nectarine (Prunus persica)by a set of R2R3 MYB transcription factors[J]. BMC Plant Biology,2013,13(1):68.