景炳年 魏磊 謝曉陽 劉雨晴 周雍 王偉
摘要 [目的]分析比較10種富含精油植物mono-TPS核苷酸和氨基酸序列。[方法]通過生物信息學相關軟件和網(wǎng)站比對和分析10種mono-TPS基因及蛋白序列,對其結(jié)構(gòu)、理化性質(zhì)、磷酸化位點、親/疏水性、跨膜結(jié)構(gòu)域、亞細胞定位、二級結(jié)構(gòu)、功能域、三級結(jié)構(gòu)及進化關系進行預測和分析。[結(jié)果]10種精油植物mono-TPS氨基酸序列結(jié)構(gòu)與理化性質(zhì)基本一致,具有親水性,多不穩(wěn)定,不含跨膜結(jié)構(gòu)域;可能定位在質(zhì)膜、線粒體內(nèi)膜、細胞核或線粒體基質(zhì)中;二級結(jié)構(gòu)以α螺旋和無規(guī)則卷曲為主要構(gòu)件,序列中包括底物結(jié)合區(qū)、鎂離子結(jié)合位點和天冬氨酸富集區(qū),具有典型的植物萜類環(huán)化酶活性結(jié)構(gòu)域,是Isoprenoid-Biosyn-C1超級家族成員之一,是一種類異戊二烯生物合成酶。通過進化樹分析單萜合成酶,艾草與玉米進化程度相似。[結(jié)論]該研究結(jié)果可為精油植物單萜化合物的研究提供理論基礎。
關鍵詞 精油植物;單萜合成酶;生物信息學分析
中圖分類號 Q 946文獻標識碼 A文章編號 0517-6611(2023)15-0088-05
doi:10.3969/j.issn.0517-6611.2023.15.021
Bioinformatics Analysis of Monoterpene Synthase in Ten Essential Oil Plants Including Artemisia argyi
JING Bing-nian,WEI Lei,XIE Xiao-yang et al
(Henan Plant Natural Products Development Engineering Technology Center,Henan Academy of Sciences,Zhengzhou,Henan 450002)
Abstract [Objective]To compare and analyze the nucleotide and amino acid sequences of mono-TPSs from ten essential oil rich plants.[Method]The nucleotide and amino acid sequences of ten mono-TPS genes were analyzed using bioinformatic softwares and websites,and the physical and chemical properties,secondary/tertiary structures and functional domains were predicted.[Result]Results showed that the structure and chemical properties of mono-TPSs from the ten essential oil plants were basically consistent,which were hydrophilic,unstable and did not contain transmembrane domains.The ten mono-TPSs might be located in plasma membrane,mitochondrial inner membrane,nucleus or mitochondrial matrix.The α-helix and random coil were found the main component of all the mono-TPS secondary structure.The sequence included substrate binding region,magnesium ion binding site and aspartic acid enrichment region,and had a typical plant terpene cyclase activity domain,belonging to the isoprenoid-biosyn-c1 superfamily.The phylogenetic anylysis showed Artemisia argyi was similar with Zea mays in degree of evolution.[Conclusion]These analysis results can provide a theoretical basis for the study of monoterpenes in essential oil plants.
Key words Essential oil plants;Monoterpene synthase;Bioinformatics analysis
單萜類化合物在植物中廣泛存在,種類繁多,賦予植物特殊的香氣和生物活性,是植物精油主要的組成成分,廣泛應用于食品、化妝品和醫(yī)藥行業(yè)[1]。如艾草精油,以桉油精、龍腦、馬鞭草烯醇、α-蒎烯、莰烯、β-蒎烯、4-蒈烯、桉葉油醇、γ-松油烯、樟腦、甲酸異莰酯、4-萜烯醇(4.66%)等單萜類化合物最為豐富[2],既是重要的香味物質(zhì),又具有良好的抗菌抗病毒效果?;ト~白千層精油,主要成分為蒎烯、檸檬烯、1,8-桉葉素等單萜類化合物[3],廣泛應用于化妝品和食品保鮮劑。傣藥紫色姜精油,包含α-側(cè)柏烯、β -側(cè)柏烯、α-異松油烯、檜烯、γ-松油烯等單萜類物質(zhì)[4],在治療多種真菌皮膚疾病及其皮膚保健護理方面頗具獨特療效。
單萜類化合物在植物體內(nèi)的生物合成途徑較為復雜,由多種酶進行表達、催化及合成調(diào)控。其中,單萜合成酶(monoterpene synthase,mono-TPS)是重要的關鍵限速酶之一,調(diào)控2-C-甲基-D-赤藻糖醇-4-磷酸途徑下游,將共同前體香葉基焦磷酸進行環(huán)化和異構(gòu)化,生成多個立體化學構(gòu)象不同的單萜類化合物[5-7]。生物信息學是一門結(jié)合現(xiàn)代生命與信息科學、數(shù)學、計算機科學等重要學科而形成的新興的交叉學科,它以計算機為工具對蛋白質(zhì)及核酸序列等生物信息進行儲存、檢索和比對分析,從而預測其分子的結(jié)構(gòu)與功能及兩者之間的相互作用關系[8]。生物信息學快速發(fā)展對生命科學影響深遠,并極大促進其他相關發(fā)展領域的進步。
筆者利用生物信息學方法對艾草、紫色姜等10種富含精油的藥用或食用植物的mono-TPS基因及編碼的氨基酸序列的一級結(jié)構(gòu)(包括組成、理化性質(zhì)、親-疏水性和亞細胞定位)、二級結(jié)構(gòu)、功能結(jié)構(gòu)域、三級結(jié)構(gòu)和親緣進化關系等進行分析預測,以期為今后開展mono-TPS的表達、轉(zhuǎn)化及功能鑒定等深層次研究提供理論基礎。
1 材料與方法
1.1 材料
艾草(Artemisia argyi)mono-TPS mRNA序列來自參考文獻[9],紫色姜(Zingiber montanum)、互葉白千層(Melaleuca alternifolia)、檀香(Santalum album)、鐵觀音茶(Camellia sinensis)、合歡(Albizia julibrissin)、蓖麻(Ricinus communis)、小果咖啡(Coffea arabica)、中華獼猴桃(Actinidia chinensis)和玉米(Zea mays)mono-TPS mRNA序列來自National Center of Biotechnology Information (NCBI)基因序列數(shù)據(jù)庫,登錄號和cDNA長度見表1。
1.2 方法
10種精油植物核苷酸和氨基酸序列通過NCBI網(wǎng)站在線分析;相對分子質(zhì)量、等電點、不穩(wěn)定系數(shù)等理化性質(zhì)通過Protparam進行在線分析;蛋白質(zhì)磷酸化位點通過NetPhos 3.1 Server進行預測;跨膜結(jié)構(gòu)域通過TMHMM Server v.2.0進行預測;親/疏水性通過ProtScale進行預測;亞細胞定位通過PSORT Prediction進行分析。二級結(jié)構(gòu)通過SOPMA進行分析,功能域通過Conserved domains軟件進行預測;通過SWISS-MODEL完成mono-TPS蛋白高級結(jié)構(gòu)同源建模;通過MEGA7.0.26軟件構(gòu)建mono-TPS系統(tǒng)進化樹。具體網(wǎng)址見表2。
2 結(jié)果與分析
2.1 核苷酸及其氨基酸序列的結(jié)構(gòu)和理化性質(zhì)
10種精油植物mono-TPS序列的理化性質(zhì)通過ProtParam在線網(wǎng)站進行分析預測(表3)??芍猰ono-TPS核苷酸序列起始密碼子都是ATG,終止密碼子是TAG、TGA或TAA;編碼氨基酸數(shù)在527~621,平均為584.7個;各蛋白相對分子質(zhì)量在61 162.97~70 468.28 kD,平均為67 442.74 kD;理論等電點在5.42~6.01,平均為5.68,表明mono-TPS為酸性蛋白。從氨基酸組成上可知,酸性氨基酸殘基比例較堿性氨基酸殘基比例高,表明mono-TPS蛋白為酸性;10種植物mono-TPS蛋白中,亮氨酸(Leu)、天冬氨酸(Asp)、丙氨酸(Ala)、谷氨酸(Glu)、絲氨酸(Ser)和異亮氨酸(Ile)為含量最多的氨基酸殘基??傇訑?shù)范圍在8 549~9 838,平均為9 437,消光系數(shù)為1.298~1.741,平均為1.507。檀香和蓖麻的不穩(wěn)定系數(shù)小于40,屬穩(wěn)定蛋白,其余均不穩(wěn)定。
2.2 磷酸化位點
磷酸化在蛋白質(zhì)翻譯后修飾中最為普遍,通過對底物蛋白的蘇氨酸、絲氨酸和酪氨酸進行磷酸基團轉(zhuǎn)移而調(diào)節(jié)蛋白質(zhì)活性和功能,從而調(diào)控各種細胞活動,因而磷酸化位點的確定非常關鍵,是認識蛋白質(zhì)作用分子機理的基礎[10]。該研究中10種精油植物mono-TPS蛋白磷酸化位點通過NetPhos 3.1 Server進行分析預測,個數(shù)最小的是艾草(41個),最多的是玉米(63個)。以艾草為例,共有41個磷酸化位點(圖1),其中19個絲氨酸磷酸化位點,分別是S35、S39、S54、S78、S146、S163、S184、S189、S195、S224、S234、S268、S270、S336、S387、S435、S460、S490、S515;12個蘇氨酸磷酸化位點,分別是T19、T82、T95、T193、T196、T209、T210、T313、T405、T409、T450、T475;10個酪氨酸磷酸化位點,分別是Y84、Y97、Y190、Y340、Y343、Y380、Y414、Y448、Y452、Y522。
2.3 親-疏水性、跨膜結(jié)構(gòu)域和亞細胞定位特征
2.3.1 蛋白親-疏水性的分析預測。
蛋白質(zhì)親-疏水作用是其折疊的主要驅(qū)動力,對親-疏水性的分析和驗證對蛋白質(zhì)的穩(wěn)定性、構(gòu)象和功能具有重要意義[11]。筆者采用 Protscale進行預測分析,以艾草為例,多肽鏈第47位氨基酸親水性分值最低(-2.644),第396位氨基酸疏水性分值最高(2.800),親水性和疏水性氨基酸占比分別為65.8%和34.2%,推測為親水性蛋白。其余9種mono-TPS肽鏈親水性氨基酸占比在鐵觀音茶的62.8%到紫色姜的71.5%,推測均為親水性蛋白。
2.3.2 跨膜結(jié)構(gòu)域特征。
跨膜結(jié)構(gòu)是蛋白質(zhì)與膜內(nèi)在蛋白的靜電相互作用和氫鍵鍵合相互作用與膜結(jié)合的一段氨基酸片段,一般由20個左右的疏水性氨基酸殘基組成,主要形成α螺旋,常由跨膜蛋白的效應區(qū)域所展現(xiàn)[12]。該研究中10種精油植物mono-TPS蛋白跨膜結(jié)構(gòu)通過TMHMM Server v.2.0進行分析預測,結(jié)果表明(以艾草為例),10個mono-TPS蛋白均沒有跨膜結(jié)構(gòu)域,說明mono-TPS蛋白不是膜蛋白(圖2)。
2.3.3 亞細胞定位特征。
大多數(shù)在細胞質(zhì)中合成的蛋白質(zhì)會被轉(zhuǎn)運到特定的亞細胞位置中發(fā)揮生物學功能,且只有位置正確時才能正確行使功能,因此對蛋白質(zhì)亞細胞定位的分析預測能極大加速對其結(jié)構(gòu)和功能的研究[13]。該研究中10種精油植物mono-TPS蛋白亞細胞定位通過PSORT Prediction進行分析預測。結(jié)果表明(表4),10種精油植物的亞細胞定位各不相同,其中艾草mono-TPS最有可能定位在質(zhì)膜上,其肯定度為0.700;蓖麻mono-TPS最有可能定位在線粒體內(nèi)膜上,其肯定度為0.570;合歡和小果咖啡最有可能定位在細胞核上,分別為0.760、0.674;互葉白千層則在線粒體基質(zhì)中,為0.653。
2.4 10種精油植物mono-TPS蛋白二級結(jié)構(gòu)預測
在生物信息學領域,很難從蛋白質(zhì)一級結(jié)構(gòu)預測其高級結(jié)構(gòu),因而蛋白質(zhì)二級結(jié)構(gòu)預測受到很多人重視。二級結(jié)構(gòu)是多肽鏈局部空間結(jié)構(gòu),是構(gòu)成蛋白質(zhì)高級空間立體結(jié)構(gòu)的基本要素,二級結(jié)構(gòu)的預測分析對研究蛋白質(zhì)的結(jié)構(gòu)和功能有著極其深遠的意義[14]。通過SOPMA分析預測10種精油植物mono-TPS蛋白二級結(jié)構(gòu),可知10種精油植物mono-TPS中均有4種二級結(jié)構(gòu)元件,包括α螺旋(所占比例最高)、無規(guī)則卷曲、β折疊和延伸鏈。以艾草mono-TPS為例,α螺旋占比72.30%、無規(guī)卷曲占比20.87%、β折疊占比3.80%和延伸鏈占比3.04%。其余9種mono-TPS蛋白4種結(jié)構(gòu)元件組成與艾草mono-TPS相似(表5)。由于α螺旋占比大于45%,而且β折疊占比小于5%,因此10種精油植物mono-TPS蛋白均屬于全α型蛋白。
2.5 蛋白質(zhì)功能結(jié)構(gòu)域的分析預測
功能結(jié)構(gòu)域通常是由50~400個氨基酸殘基構(gòu)成的球狀實體,它在蛋白質(zhì)中可以獨立穩(wěn)定存在,并且與完成蛋白質(zhì)功能有著密切的關系[15]。該研究以艾草mono-TPS為例,其保守區(qū)和功能域通過Conserved domains進行分析預測,結(jié)果如圖3所示。艾草mono-TPS蛋白保守區(qū)域為底物結(jié)合口袋、鎂離子結(jié)合位點和2個天冬氨酸富集區(qū),具有典型的植物萜類環(huán)化酶活性結(jié)構(gòu)域,能將無環(huán)的異戊二烯二磷酸進行環(huán)化,是Isoprenoid-Biosyn-C1超級家族成員之一。其余9種植物mono-TPS與艾草相似,均屬類異戊二烯生物合成酶。
2.6 10種精油植物mono-TPS蛋白三級結(jié)構(gòu)的預測分析 蛋白質(zhì)的三級結(jié)構(gòu)是蛋白質(zhì)分子處于天然折疊狀態(tài)的三維構(gòu)象,是在二級結(jié)構(gòu)的基礎上進一步盤繞、折疊形成的[16],因此預測分析蛋白質(zhì)三級結(jié)構(gòu)對于認識其功能具有重要意義。筆者以艾草mono-TPS為例,其三級結(jié)構(gòu)通過SWISS-MODEL進行分析預測,同源建模匹配到的模板蛋白為來自楊柳科楊屬植物銀灰楊(Populus canescens)的異戊二烯合成酶(ACCESSION:3n0f.1.A)。2個mono-TPS蛋白序列一致性為31.73%,GMQE值為0.75,因此分析預測結(jié)果較理想。艾草mono-TPS蛋白3D結(jié)構(gòu)通過Swiss Pdb-Viewer工具進行顯示(圖4),表明其為單體蛋白結(jié)構(gòu)。
2.7 10種精油植物mono-TPS蛋白的系統(tǒng)進化樹
進化樹是描述生物體形成或進化順序的拓撲樹結(jié)構(gòu),通常是二叉樹的形狀,一般由一系列節(jié)點分支組成,節(jié)點代表某個具體序列,節(jié)點之間的連線代表物種之間的親緣關系。進化樹可以分析不同物種之間的親緣關系遠近,有助于判斷生物體在進化過程中的地位及在遺傳本質(zhì)上探究生物體多樣性的產(chǎn)生機制[17]。用MEGA 7.0.26軟件對10種精油植物mono-TPS蛋白構(gòu)建系統(tǒng)進化樹。結(jié)果顯示,10個植物物種之間呈現(xiàn)明顯的親緣關系,其中紫色姜與合歡、互葉白千層與小果咖啡、艾草與玉米、檀香與中華獼猴桃這4組兩兩物種之間親緣關系最近,進化程度距離也最近(圖5)。
3 討論與結(jié)論
不同精油植物中單萜類化合物種類多、香氣特征明顯,其基本碳架由2個異戊二烯單位構(gòu)成,結(jié)構(gòu)最為簡單,其中具有花香和果香的精油或單萜化合物已經(jīng)在食品、空氣清新劑和化妝品等行業(yè)得到廣泛應用,具有生物活性的精油或單萜類化合物也在醫(yī)藥產(chǎn)品和健康產(chǎn)品領域得到廣泛應用。植物中萜類化合物的多樣性主要由于萜類合成酶種類多樣造成的,在一種植物中可能存在多種萜類合成酶[18],單萜合成酶是單萜生物合成的關鍵酶,決定了單萜結(jié)構(gòu)的多樣性[19]。
單萜合成酶為親水性蛋白,多數(shù)不穩(wěn)定,不存在跨膜結(jié)構(gòu)域;亞細胞定位預測可能定位在質(zhì)膜線粒體內(nèi)膜、細胞核或線粒體基質(zhì)中。10種精油植物的單萜合成酶的二級結(jié)構(gòu)以α螺旋和無規(guī)則卷曲為主,均包括底物結(jié)合區(qū)、鎂離子結(jié)合位點和天冬氨酸富集區(qū),具有典型的植物萜類環(huán)化酶活性結(jié)構(gòu)域,是Isoprenoid-Biosyn-C1超級家族成員之一,是一種類異戊二烯生物合成酶。三級結(jié)構(gòu)預測分析顯示,單萜合成酶為單體結(jié)構(gòu)蛋白。通過系統(tǒng)進化樹分析單萜合成酶,結(jié)果表明,艾草和玉米進化程度相似,與中華獼猴桃、檀香、鐵觀音茶進化相距較遠。
參考文獻
[1] 王印國.常見單萜類化合物及其在植物中的分布[J].現(xiàn)代農(nóng)業(yè)科技,2012(16):185-186.
[2] 冷佳政,仇越鵬,韓改英,等.邯鄲鮮艾與陳艾草精油化學成分的GC-MS分析[J].魅力中國,2021(4):442-443.
[3] 劉義軍,袁源,劉洋洋,等.不同因素對互葉白千層精油化學組分的影響[J].食品工業(yè)科技,2019,40(1):1-5.
[4] 潘美貞,童漢青,黃敏.超臨界CO2萃取傣藥紫色姜精油的GC-MS分析[J].廣州化工,2009,37(7):119-120.
[5]? LICHTENTHALER H K.The 1-deoxy-D-xylulose-5-phosphate pathway of isoprenoid biosynthesis in plants[J].Annual review of plant physiology and plant molecular biology,1999,50:47-65.
[6]? HUNTER W N,BOND C S,GABRIELSEN M,et al.Structure and reactivity in the non-mevalonate pathway of isoprenoid biosynthesis[J].Biochemical society transactions,2003,31(3):537-542.
[7]? DEGENHARDT J,KLLNER T G,GERSHENZON J.Monoterpene and sesquiterpene synthases and the origin of terpene skeletal diversity in plants[J].Phytochemistry,2009,70(15/16):1621-1637.
[8]? 秦琴.基于降噪的譜聚類分析蛋白質(zhì)算法及系統(tǒng)的研究與實現(xiàn)[D].濟南:山東大學,2015.
[9]? 劉雷,羅英,陶紅,等.艾草(Artemisia argyi)單萜合成酶基因的克隆及序列分析[J].熱帶作物學報,2016,37(7):1349-1356.
[10] 余中洲,高強,陰玉涵,等.細胞核蛋白質(zhì)磷酸化位點的預測方法研究[J].金陵科技學院學報,2020,36(2):47-51.
[11] 周斯涵,劉月蘭.基于數(shù)據(jù)挖掘與機器學習的蛋白質(zhì)疏水性分析的研究[J].哈爾濱師范大學自然科學學報,2017,33(3):34-38.
[12] 付海輝,辛培堯,許玉蘭,等.幾種經(jīng)濟植物UFGT基因的生物信息學分析[J].基因組學與應用生物學,2011,30(1):92-102.
[13] 余靜,張靖.基于多標記學習的蛋白質(zhì)亞細胞定位預測研究綜述[J].信息技術與信息化,2021(3):112-114.
[14] 趙亞武,劉毅慧.基于優(yōu)化的卷積神經(jīng)網(wǎng)絡的蛋白質(zhì)二級結(jié)構(gòu)預測[J].計算機應用與軟件,2021,38(7):147-152,166.
[15] 王文娟,李鳳敏.核定位蛋白的結(jié)構(gòu)域特征分析[J].內(nèi)蒙古大學學報(自然科學版),2018,49(1):70-76.
[16] 丁靜,錢俊青.蛋白質(zhì)二級與三級結(jié)構(gòu)的表征方法[J].浙江化工,2020,51(11):49-54.
[17] 遲文靜,劉宜昕,王粟,等.進化樹在細菌親緣關系分析中的應用研究[J].檢驗醫(yī)學,2020,35(12):1310-1314.
[18] 李天嬌,冷平生,楊凱,等.百合單萜合成酶基因的克隆與序列分析[J].北京農(nóng)學院學報,2014,29(3):6-10.
[19] 徐應文,呂季娟,吳衛(wèi),等.植物單萜合酶研究進展[J].生態(tài)學報,2009,29(6):3188-3197.
基金項目 河南省科技攻關項目(222102110219);河南省科學院重大科研項目聚焦專項(210113003)。
作者簡介 景炳年(1980—),男,甘肅蘭州人,助理研究員,博士,從事植物保護研究。*通信作者,副研究員,博士,從事植物化學及分子生物學研究。
收稿日期 2022-08-29;修回日期 2022-09-21