李 蒙,鮑 鋒
(西安文理學院 生物與環(huán)境工程學院,陜西 西安 710065)
不同植物無色花青素還原酶及其基因的生物信息學分析
李 蒙,鮑 鋒
(西安文理學院 生物與環(huán)境工程學院,陜西 西安 710065)
對9種不同植物的無色花青素還原酶及其基因進行生物信息學分析,探索該蛋白的結構并預測LAR的功能。通過生物信息學軟件對GenBank中已經(jīng)登錄的不同植物LAR基因和氨基酸序列進行分析,對其組成成分、理化性質、翻譯后修飾位點、功能域、二級結構、亞細胞定位、分子進化等進行預測和推斷。結果表明,9種植物無色花青素還原酶基因全長在1.0~1.2 kb,編碼342~391個氨基酸,不具有信號肽;9種植物LAR都具有蛋白激酶C磷酸化位點、酪蛋白激酶Ⅱ磷酸化位點和N-端肉豆蔻酰化位點,個別植物LAR具有N-端糖基化位點、酪氨酸激酶磷酸化位點和cAMP和cGMP依賴蛋白激酶磷酸化位點;二級結構以α螺旋和無規(guī)則卷曲為主;進化分析表明禾本科的玉米與其他科植物親緣關系較遠。
無色花青素還原酶;生物信息學;結構預測;功能分析
無色花青素還原酶(Leucoanthocyanidin reductase, LAR, EC 1.17.1.3)是植物黃酮類化合物合成路徑中一個關鍵酶,在苯丙氨酸代謝通路中,其催化無色花青素轉化為兒茶素[1],而兒茶素是具有重要生理活性的次生代謝產(chǎn)物,具有如免疫調節(jié)、抗氧化、抗癌活性等多種功效[2-4]。
在多種植物中研究發(fā)現(xiàn)兒茶素的積累與LAR基因的表達相關[5-7]。目前在GenBank數(shù)據(jù)庫中登陸的植物LAR的基因序列有1000多條,已從葡萄[6]、蘋果[8]、豆類[9]、苜蓿[10]等植物中分離出不同拷貝數(shù)的LAR基因,而LAR的活性也已經(jīng)在大麥[11]、豆類[12]、茶樹[13]等植物中得到鑒定。LAR在兒茶素合成途徑中尤為重要[14],有研究發(fā)現(xiàn)植物兒茶素的積累與LAR的轉錄因子調控相關[5],并且受種內(nèi)和種間差異的明顯影響[15]。因此,探討LAR基因的表達調控及酶的功能特性具有重要的科學意義。
隨著大多數(shù)兒茶素合成路徑中相關酶的基因得到分離與克隆[16],在后續(xù)基因的表達調控的研究中,將有利于進一步了解植物生長發(fā)育過程中黃酮類物質的積累過程。本文通過生物信息學方法,對不同植物LAR基因及其氨基酸序列的結構特點與特征進行了預測與分析,以期為研究LAR家族蛋白的生化特性和調控機理提供理論依據(jù)。
1.1 材料
在NCBI中查詢9種不同植物的無色花青素還原酶的核酸序列及其對應的氨基酸序列:玉米(NM-001155409)、苦蕎(KC404849)、蘋果(DQ139837)、葡萄(NM-001281160)、茶樹(EF205148)、西洋梨(DQ251190)、草莓(JX134096)、大豆(JF433916)、玫瑰(KP768080)作為研究對象。
1.2 方法
(1)不同植物LAR核苷酸與氨基酸序列分析與比對采用DNAStar、ClustalX2和genedoc軟件;(2)蛋白分子量、等電點、半衰期和穩(wěn)定性等重要理化性質分析采用ProtParam;(3)蛋白質亞細胞定位、分泌信號肽等采用TargetP 和SignalP 4.0,二級結構預測采用SOPMA;(4)蛋白質糖基化采用NetNGlyc在線分析,脂?;?、磷酸化、cAMP和cGMP依賴蛋白激酶磷酸化位點采用Motif Scan;(5)多重序列比對和構建系統(tǒng)發(fā)育樹采用ClustalX 2.0和TreeView。
2.1LAR基因與氨基酸序列理化性質分析
利用DNAStar和ProtParam在線分析,結果如表1所示,9種植物LAR基因的ORF全長在1029~1176 bp之間,GC含量適中(除玉米外),其氨基酸數(shù)目在342~391,分子量36.92~43.30 kD,pI值在5.16~6.38,說明LAR呈酸性,與酸堿氨基酸比例結果一致。經(jīng)ProParam分析氨基酸組成,發(fā)現(xiàn)氨基酸Val在所有植物LAR中含量較高,比例在7.1%~9.9%;氨基酸Ile、Ala在大多數(shù)植物LAR中含量較高;氨基酸Trp和Gln在所有植物LAR中含量較低。所有植物LAR蛋白質中負電荷氨基酸殘基比例高于正電荷氨基酸殘基比例,疏水氨基酸比例高于酸性、堿性和極性氨基酸比例,LAR在溶液中的不穩(wěn)定指數(shù)為28.86~49.28,除苦蕎外均低于閥值(<40為穩(wěn)定蛋白),推測LAR為穩(wěn)定蛋白。脂肪系數(shù)為89.23~96.88,親水性平均系數(shù)為-0.258~0.036,說明LAR蛋白質總體親水性較低。
表1 9種植物中LAR核苷酸及氨基酸序列組成和理化性質
2.2 LAR氨基酸序列比對分析
不同植物的LAR氨基酸序列經(jīng)ClustalX 2.0比對后,除了玉米,其他植物的LAR氨基酸序列同源性較高,都存在RFLP、ICCN和THD結構域(圖1),推斷不同植物中LAR的活性差異可能與保守結構域中個別氨基酸的替換相關。
2.3 LAR翻譯后修飾與功能位點分析
植物蛋白質序列分析對其生物學功能的確定具有重要意義。9種植物蛋白質翻譯后修飾位點表明(表2),通過NetNGlyc在線N-糖基化位點分析,玉米、葡萄、茶樹和玫瑰4種植物的LAR蛋白含有不同的糖基化位點(玉米270NNTV、葡萄227NKSL、茶樹50NKTL和212NKSV、玫瑰229NLSD),說明這些蛋白質只能在真核生物中翻譯才具有生物學功能。通過Motif Scan預測cAMP和cGMP依賴蛋白激酶、脂酰化等,所有植物LAR蛋白都具有蛋白激酶C磷酸化位點、酪蛋白激酶Ⅱ磷酸化位點和N端肉豆蔻?;稽c,而酪氨酸激酶磷酸化位點的修飾唯有玉米LAR蛋白含有,cAMP和cGMP依賴蛋白激酶磷酸化唯有苦蕎蛋白序列(343KKQS和361KKRS)和大豆蛋白序列(355KKCS)位點修飾。
2.4 蛋白的亞細胞定位和二級結構預測與分析
TargetP在線分析表明(表3),信號肽預測分值為0.012~0.618,cutoff值為0.430,說明9種植物LAR蛋白不存在信號肽,其結果與Signal P 4.0預測的結果相符;亞細胞定位分析表明,線粒體定位預測值為0.071~0.652,定位于其他位置的預測值為0.058~0.548;經(jīng)SOPMA對LAR進行二級結構預測,預測結果表明(表3),不同植物LAR二級結構α螺旋所占比例為30.39%~43.73%,β折疊所占比例為8.16%~11.11%,無規(guī)則卷曲所占比例為29.26%~38.00%,延伸鏈所占比例為16.91%~24.85%,說明LAR蛋白的二級結構以α螺旋和無規(guī)則卷曲為主。
黑色和灰色分別表示氨基酸的相似性;方框標明保守結構域。物種名分別為GmLAR:大豆(Glycinemax);CsLAR:茶樹(Camelliasinensis);PcLAR:西洋梨(Pyruscommunis);MdLAR:蘋果(MalusXdomestica);FaLAR:草莓(Fragariaxananassa);RrLAR:玫瑰(Rosarugosa);FtLAR:苦蕎(Fagopyrumtataricum);VvLAR:葡萄(Vitisvinifera);ZeLAR:玉米(Zea)。
圖1 多重氨基酸序列比對結果
2.5 進化分析
利用ClustalX 2.0和TreeView對不同植物的LAR進行氨基酸的進化分析,結果表明(圖2),不同植物LAR在進化過程中,禾本科的玉米LAR與其他科植物LAR距離較遠,親緣性較遠;薔薇科的西洋梨、蘋果、草莓和玫瑰LAR相聚為一個分支,說明親緣性較近;而蓼科的苦蕎、豆科的大豆、葡萄科的葡萄和山茶科的茶樹LAR具有親緣性。進化分析與LAR氨基酸序列比對結果相符。
圖2 不同植物LAR的系統(tǒng)進化樹
植物兒茶素代謝路徑中LAR屬于短鏈脫氫酶/還原酶家族和PIP家族[17],在植物中普遍存在并參與多種生長發(fā)育調控。隨著不同植物轉錄組測序的開展,生物信息學的發(fā)展為功能基因組學的研究開辟了更加便利的手段,通過對克隆的基因進行功能預測,有助于揭示物種基因的進化,發(fā)掘蛋白質功能,為遺傳育種篩選經(jīng)濟性狀和抗性候選基因提供一定的理論依據(jù)。
本文通過一系列生物信息學方法對9種植物兒茶素類化合物合成關鍵酶LAR的核酸和蛋白質序列進行分析,發(fā)現(xiàn)9種植物LAR核酸組成中G+C的含量正常(除玉米偏高外)?;蛐蛄蠫+C含量直接影響mRNA二級結構及其熱力學穩(wěn)定性,最終會影響植物組織中LAR的轉錄和翻譯,比如外源基因G+C含量(40%~50%)要與畢赤酵母表達手冊要求相一致,才能確保成功表達[18]。蛋白質的理化性質影響蛋白質的結構和生理功能;而蛋白質的糖基化修飾能夠調控其在組織和細胞中的定位、活性與功能,是參與蛋白質功能的主要修飾手段,其位點的變異與疾病的發(fā)生可能有關[19];同樣蛋白質磷酸化修飾能夠調節(jié)蛋白質在細胞信號傳導過程中離子通道和改變激酶的活性,改變基因的表達,在一定程度上影響細胞的再生和分化[20];蛋白質的二級或空間結構與蛋白質行使其功能密切相關;進化關系分析可以為植物的繁殖與育種提供理論依據(jù)。
植物黃酮類物質的生物活性功能不斷被發(fā)掘,以及在未來醫(yī)藥領域開闊的市場前景[21],其黃酮類物質代謝相關酶的基因得到克隆,后續(xù)可能利用基因工程手段改良植物品種,篩選代謝產(chǎn)物累積相關基因,研究其表達調控模式具有重要的意義。
表2 翻譯后修飾和結構特征性序列分析結果
注:“N-端糖基化位點”和“蛋白激酶C磷酸化位點”的閥值均為0.5。
表3 亞細胞定位及二級結構預測與分析結果
[1] Devic M, Guilleminot J, Debeaujon I, et al. TheBANYULSgene encodes a DFR-like protein and is a marker of early seed coat development[J]. The Plant Journal, 1999, 19(4): 387-398.
[2] Lin Y L, Juan I M, Chen Y L, et al. Composition of polyphenols in fresh tea leaves and associations of their oxygen-radicalabsorbing capacitiy with antiproliferative actions in fibroblast cells[J]. Journal of Agricultural and Food Chemistry, 1996, 44: 1387-1394.
[3] Rao L J M, Yada H, Ono H, et al. Occurrence of antioxidant and radical scavenging proanthocyanidins from the Indian minor spice nagkesar(Mammealongifoliaplanch and triana syn) [J]. Bioorg Med Chem, 2004, 12: 31-36.
[4] Sano T, Oda E, Yamashita T, et al. Anti-thrombotic effect of proanthocyanidin, a purified ingredient of grape seed[J]. Thromb Res, 2005, 115(1/2): 115-121.
[5] Paolocci F, Robbins M P, Madeo L, et al. Ectopic expression of a basic helix-loop-helix gene transactivates parallel pathways of proanthocyanidin biosynthesis: structure, expression analysis and genetic control of leucoanthocyanidin 4-reductase and anthocyanidin reductase genes inLotuscorniculatus[J]. Plant Physiology, 2007, 143(1): 504-516.
[6] Bogs J, Downey M O, Harvey J S, et al. Proanthocyanidin synthesis and expression of genes encoding leucoanthocyanidin reductase and anthocyanidin reductase in developing grape berries and grapevine leaves[J]. Plant Physiology, 2005, 139(2): 652-663.
[7] Wang Y P,Yang Z M,Zhang B. Identification of protein related to biosynthesis of condensed tannin inOnobrychistanaiticaSpreng[J]. Acta Agrestia Sinica, 2000, 88(2): 126-131.
[8] Takos A M, Ubi B E, Robinson S P, et al. Condensed tannin biosynthesis genes are regulated separately from other flavonoid biosynthesis genes in apple fruit skin[J]. Plant Science, 2006, 170(3): 487-499.
[9] Tanner G J, Francki K T, Abrahams S, et al. Proanthocyanidin biosynthesis in plants. Purification of legume leucoanthocyanidin reductase and molecular cloning of its cDNA[J]. Journal of Biological Chemistry, 2003, 278(34): 31647-31656.
[10] Pang Y, Peel G J, Wright E, et al. Early steps in proanthocyanidin biosynthesis in the model legumeMedicagotruncatula[J]. Plant Physiology, 2007, 145(3): 601-615.
[11] Kristiansen K N. Conversion of (+)-dihydroquercetin to (+)-2,3-trans-3,4-cis-leucocy anidin and (+)-catechin with an enzyme extract from maturing grains of barley[J]. Carisberg Research Communications, 1986(51): 51-60.
[12] Joseph R, Tanner G, Larkin P. Proanthocyanidin synthesis in the forage legumeOnobrychisviciifolia. A study of chalcone synthase, dihydroflavonol 4-reductase and leucoanthocyanidin 4-reductase in developing leaves[J]. Australian Journal of Plant Physiology, 1998, 25(3): 271-278.
[13] 高可君,夏濤,高麗萍,等.茶葉二氫黃酮醇還原酶/無色花青素還原酶反應產(chǎn)物的快速檢測方法研究[J].園藝園林科學,2008,6(24):287-290.
[14] Yuan L, Wang L, Han Z, et al. Molecular cloning and characterization of PtrLAR3,a gene encoding leucoanthocyanidin reductase fromPopulustrichocarpa, and its constitutive expression enhances fungal resistance in transgenic plants[J]. Journal of Experiment Botany, 2012, 63(7): 2513-2524.
[15] Pang Y, Wenger J P, Saathoff K, et al. A WD40 repeat protein fromMedicagotruncatulais necessary for tissue-specific anthocyanin and proanthocyanidin biosynthesis but not for trichome development[J]. Plant Physiology, 2009, 151(3):1114-1129.
[16] 夏濤,高麗萍.類黃酮及茶兒素生物合成途徑及其調控研究進展[J].中國農(nóng)業(yè)科學,2009,42(8):2899-2908.
[17] Maugé C, Granier T, D′Estaintot B L, et al. Crystal structure and catalytic mechanism of leucoanthocyanidin reductase fromVitisvinifera[J]. Journal of Molecular Biology, 2010, 397(4): 1079-1091.
[18] 張云博,白仁惠,王春迪,等.嗜熱棉毛菌木糖苷酶Xy143基因優(yōu)化及其在畢赤酵母中高效表達[J].微生物學通報,2017,44(1):9-19.
[19] Defaus S, Gupta P, Andreu D, et al. Mammalian protein glycosylation-structure versus function[J]. Analyst, 2014, 139(12): 2944-2967.
[20] Beenstock J, Mooshayef N, Engelberg D. How do protein kinases take a selfie(Autophosphorylate) [J]. Trends in Biochemical Sciences, 2016, 41(11): 938-953.
[21] Choi S U, Ryu S Y, Yoon S K, et al. Effects of flavonoids on the growth and cell cycle of cancer cells[J]. Anticancer Research, 1999, 19(6B): 5229-5233.
(責任編輯:許晶晶)
Bioinformatics Analysis of Leucoanthocyanidin Reductase and Gene in Different Plants
LI Meng, BAO Feng
(College of Biological and Environmental Engineering, Xi’an University of Arts and Sciences, Xi’an 710065, China)
The leucoanthocyanidin reductase (LAR) and its gene in nine kinds of plants were analyzed by using bioinformatic method. The nucleic acid sequences and amino acid sequences of LARs registered in GenBank were analyzed by using bioinformatic software, and their compositions, physical and chemical properties, post-translational modification sits, functional domains, secondary structure, subcellular location and molecular phylogenetic evolution were predicted and inferred. The results demonstrated that the LAR genes in nine kinds of plants was 1.0~1.2 kb in overall length, and they coded 342~391 amino acids, but had no signal peptide. All LARs had protein kinase C phosphorylation sites, casein kinase Ⅱ phosphorylation sites and N-myristoylation sites, and the LAR in several plants also had N-glycosylation sites, tyrosine kinase phosphorylation sites, and cAMP-dependent and cGMP-dependent protein kinase phosphorylation sites. The secondary structure mainly was of alpha helix and random coil. The evolutionary tree showed that the gramineous maize and the plants in other families had a distant genetic relationship.
Leucoanthocyanidin reductase; Bioinformatics; Structural prediction; Functional analysis
2017-05-14
李蒙(1988─),男,助理實驗師,碩士,研究方向為生物化學與分子生物學。
Q811.4
A
1001-8581(2017)09-0005-05