摘要:對(duì)棉鈴蟲(Helicoverpa armigera L.)腸道內(nèi)7種類胰蛋白酶的氨基酸序列進(jìn)行了生物信息學(xué)分析。結(jié)果表明,棉鈴蟲7種類胰蛋白酶理化性質(zhì)相近,含有豐富的Ala、Cys、Gly與Thr,均為可溶性蛋白酶,不穩(wěn)定性較高。類胰蛋白酶分子中不存在跨膜結(jié)構(gòu)域,含有特定的磷酸化位點(diǎn),主要分布在細(xì)胞外基質(zhì)與內(nèi)質(zhì)網(wǎng)中。棉鈴蟲類胰蛋白酶屬于胰蛋白酶超家族成員,具有較高的氨基酸序列同源性,分子中含有保守的必需氨基酸殘基,參與維持蛋白酶的空間結(jié)構(gòu)及行使催化功能。分子進(jìn)化研究表明類胰蛋白酶Ⅲ與類胰蛋白酶Ⅵ進(jìn)化關(guān)系較近,而類胰蛋白酶Ⅰ和類胰蛋白酶Ⅱ在進(jìn)化關(guān)系上更為接近。無規(guī)卷曲結(jié)構(gòu)是類胰蛋白酶二級(jí)結(jié)構(gòu)中的主要結(jié)構(gòu)元件。
關(guān)鍵詞:棉鈴蟲(Helicoverpa armigera L.);類胰蛋白酶;生物信息學(xué);分析
中圖分類號(hào):S433.4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2013)20-5047-04
Bioinformatics Analysis of Putative Trypsins of Helicoverpa armigera
LONG Ting,LEI Jie-ping,SONG Tao,HE Li-ran,ZHOU Jia-yu,LIAO Hai
(College of Life Science and Engineering,Southwest Jiaotong University,Chengdu 611756,China)
Abstract: Bioinformatic methods were used to analyze the amino acid sequences of 7 putative trypsins in the midgut of Helicoverpa armigera. The results showed that physical and chemical characteristics of these trypsins were very similar. Ala,Cys,Gly and Thr were abundant in these trypsins. These trypsins were soluble and relatively instable. They had no transmembrane structure and each trypsin had specific phosphorylation sites. They were mainly located in the extracellular and endoplasmic reticulum. These trypsins were belonged to the trypsin super family with highly homologous amino acid sequences. These trypsins consisted conservative residues participated in maintaining tertiary structure and catalytic process. Phylogenetic tree analysis showed that trypsin Ⅲ was similar to trypsin Ⅵ,and trypsin Ⅰ was more close to trypsin Ⅱ. Random coils were the major element in the whole secondary structure of these trypsins.
Key words: Helicoverpa armigera L.; putative trypsin; bioinformation; analysis
棉鈴蟲(Helicoverpa armigera L.)屬鱗翅目夜蛾科,是世界性重大致災(zāi)害蟲之一。棉鈴蟲為多食性害蟲,寄主植物有20多科200余種,可危害棉花、煙草、小麥、玉米、高粱、番茄、豆類、瓜類等多種農(nóng)作物,給農(nóng)業(yè)生產(chǎn)帶來嚴(yán)重威脅[1]。類胰蛋白酶是棉鈴蟲幼蟲中腸內(nèi)最主要的消化酶,其主要功能是參與棉鈴蟲中腸內(nèi)不同類型消化酶的激活及對(duì)食物蛋白質(zhì)的消化,使棉鈴蟲能夠獲取生長(zhǎng)發(fā)育所需的必需氨基酸[2,3]。類胰蛋白酶還能夠參與棉鈴蟲對(duì)外界環(huán)境的免疫應(yīng)答[4]。由于類胰蛋白酶在棉鈴蟲營(yíng)養(yǎng)消化及免疫防御方面的重要地位,以類胰蛋白酶為作用靶點(diǎn)篩選抗蟲基因或蛋白質(zhì)成為生物學(xué)研究的一大熱點(diǎn),如植物胰蛋白酶抑制劑能夠抑制棉鈴蟲中腸類胰蛋白酶的活力,是具有較好抗棉鈴蟲應(yīng)用潛力的候選抗蟲因子。通過轉(zhuǎn)基因技術(shù)將胰蛋白酶抑制劑基因轉(zhuǎn)入到異源植物中,培育抗棉鈴蟲植物新品種也取得了良好的進(jìn)展[5-8]。
然而,棉鈴蟲中腸內(nèi)至少存在7種類胰蛋白酶,它們?cè)诿掴徬x不同發(fā)育時(shí)期的作用、表達(dá)模式及對(duì)胰蛋白酶抑制劑的敏感度不盡相同。這種差異主要來源于類胰蛋白酶結(jié)構(gòu)上的不同[4,6,9,10]。本研究利用生物信息學(xué)方法分析棉鈴蟲7種類胰蛋白酶的理化性質(zhì);進(jìn)行序列比對(duì),分析其一級(jí)結(jié)構(gòu)中的關(guān)鍵氨基酸;依據(jù)氨基酸水平上的異同分析,研究類胰蛋白酶的起源進(jìn)化和結(jié)構(gòu)、功能的演變,進(jìn)而尋找其間的親緣關(guān)系;研究其跨膜結(jié)構(gòu)域,預(yù)測(cè)其可能作用位點(diǎn);進(jìn)行功能結(jié)構(gòu)域分析,篩選關(guān)鍵的功能區(qū)域,為系統(tǒng)認(rèn)識(shí)類胰蛋白酶的結(jié)構(gòu)與酶促機(jī)制,并為篩選以類胰蛋白酶為作用靶點(diǎn)的有效抗蟲功能蛋白質(zhì)或基因的篩選提供理論參考。
1 材料與方法
1.1 材料
試驗(yàn)數(shù)據(jù)來源于GenBank數(shù)據(jù)庫和NCBI蛋白質(zhì)數(shù)據(jù)庫中已登錄的棉鈴蟲類胰蛋白酶的氨基酸序列,包括類胰蛋白酶Ⅰ(HaTS7,CAA72950.1)、類胰蛋白酶Ⅱ(HaTC11, CAA72948.1)、類胰蛋白酶Ⅲ(SR36,CAA72956.1)、類胰蛋白酶Ⅳ(SR28,CAA72955.1)、類胰蛋白酶Ⅴ(HaTC16,CAA72949.1)、類胰蛋白酶Ⅵ(SR24,SR40,CAA72954.1)、類胰蛋白酶Ⅶ(SR66,CAA72962.1)。
1.2 方法
試驗(yàn)主要采用各種生物在線工具及軟件來處理相關(guān)氨基酸序列,進(jìn)行整理、比較、預(yù)測(cè)。運(yùn)用NCBI數(shù)據(jù)庫中BLAST在線工具進(jìn)行棉鈴蟲類胰蛋白酶序列篩選;運(yùn)用ProtParam在線軟件(Physico-chemical parameters of a protein sequence;http://expasy.org/tools/protparam.html)分析棉鈴蟲類胰蛋白酶氨基酸序列的理化性質(zhì);運(yùn)用DNAMAN軟件比對(duì)分析氨基酸序列同源性;運(yùn)用MEGA 5.0中的Fhylogenetic Tree方法構(gòu)建分子系統(tǒng)發(fā)育樹;運(yùn)用在線工具ProtScale (http://www.expasy.ch/tools/protscale.html)進(jìn)行親、疏水性的分析;運(yùn)用Psort在線工具(http://psort.nibb.ac.jp)進(jìn)行轉(zhuǎn)運(yùn)肽(transit peptide)分析;運(yùn)用NetPhosK 2.0 Server在線工具(http://www.cbs.dtu.dk/services/NetPhos/)進(jìn)行氨基酸翻譯后修飾分析預(yù)測(cè);運(yùn)用在線工具TMHMM 2.0 Server (http://www.cbs.dtu.dk/services/TMHMM/)進(jìn)行跨膜結(jié)構(gòu)域的分析;運(yùn)用NPSA_server (http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl? page=npsa_sopm.html)進(jìn)行蛋白質(zhì)二級(jí)結(jié)構(gòu)的分析預(yù)測(cè);運(yùn)用NCBI數(shù)據(jù)庫中CDD在線工具(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)進(jìn)行功能結(jié)構(gòu)域的分析。
2 結(jié)果與分析
2.1 棉鈴蟲類胰蛋白酶氨基酸序列理化性質(zhì)分析
運(yùn)用ProtParam在線軟件分析棉鈴蟲7種類胰蛋白酶氨基酸序列理化性質(zhì),結(jié)果見表1。由表1可知,棉鈴蟲7種類胰蛋白酶在理論等電點(diǎn)、脂溶指數(shù)以及氨基酸組成等方面均表現(xiàn)出相似性。其相對(duì)分子質(zhì)量約為70 000,等電點(diǎn)約為5.00,氨基酸數(shù)目為253~256,Ala、Cys、Gly和Thr殘基含量較高。7種類胰蛋白酶的不穩(wěn)定系數(shù)均較高,其中類胰蛋白酶Ⅲ的不穩(wěn)定指數(shù)最低,為52.08,表明類胰蛋白酶在棉鈴蟲細(xì)胞內(nèi)的穩(wěn)定性較差,推測(cè)類胰蛋白酶代謝較為活躍,代謝周轉(zhuǎn)的速度較快。棉鈴蟲7種類胰蛋白酶的脂溶指數(shù)均較低,屬于親水性蛋白質(zhì)。
2.2 棉鈴蟲類胰蛋白酶氨基酸序列磷酸化位點(diǎn)預(yù)測(cè)分析
使用NetPhosk 2.0 Server在線工具對(duì)棉鈴蟲7種類胰蛋白酶的氨基酸序列分別進(jìn)行預(yù)測(cè)Ser、Thr與Tyr位點(diǎn)處發(fā)生磷酸化的概率結(jié)果見表2。從表2可見,在氨基酸磷酸化位點(diǎn)中Ser的預(yù)測(cè)分值最高,表明Ser發(fā)生磷酸化的概率最高,并且發(fā)現(xiàn)類胰蛋白酶Ⅲ中不具有Thr磷酸化位點(diǎn);只有類胰蛋白酶Ⅴ具有Tyr磷酸化位點(diǎn)。以類胰蛋白酶Ⅲ為例進(jìn)行說明:其氨基酸序列在第83位、243位、246位、247位這4個(gè)Ser位點(diǎn)處都有可能發(fā)生磷酸化,但第247位Ser發(fā)生磷酸化的概率最大,為M3=0.973。
2.3 棉鈴蟲類胰蛋白酶氨基酸序列分子進(jìn)化樹分析
使用MEGA 5.0中的Fhylogenetic Tree方法構(gòu)建分子系統(tǒng)發(fā)育樹結(jié)果見圖1。由圖1可知,7種類胰蛋白酶分為兩個(gè)分支,類胰蛋白酶Ⅰ、Ⅱ、Ⅶ與Ⅴ處于一個(gè)分支,類胰蛋白酶Ⅳ、Ⅲ與Ⅵ處于另一個(gè)分支。其中,類胰蛋白酶Ⅰ和類胰蛋白酶Ⅱ進(jìn)化關(guān)系較近,類胰蛋白酶Ⅲ與類胰蛋白酶Ⅵ進(jìn)化關(guān)系較近。
2.4 棉鈴蟲類胰蛋白酶的氨基酸序列分析
1)使用TMHMM 2.0在線工具對(duì)7種類胰蛋白酶的氨基酸序列跨膜結(jié)構(gòu)進(jìn)行預(yù)測(cè)分析,均不存在跨膜結(jié)構(gòu)域。
2)使用ProtScale工具對(duì)7種蛋白酶的親、疏水性進(jìn)行分析。7種類胰蛋白酶的總平均親水性為0.860~0.960,均表現(xiàn)為親水性。其中,多肽鏈靠近N末端區(qū)域親水性最強(qiáng),最低分值為-0.500到-0.600,而C末端區(qū)域疏水性最強(qiáng),最高分值為2.100到2.300。
3)用DNAMAN軟件比對(duì)分析7種類胰蛋白酶的氨基酸序列同源性(圖2)。在這7種蛋白酶氨基酸序列中,有較多保守的區(qū)域(如圖2中深顏色區(qū)域所示)。經(jīng)過分析發(fā)現(xiàn),7種類胰蛋白酶氨基酸序列結(jié)構(gòu)相似,同源性最高為85.71%。7種類胰蛋白酶中均含有高度保守的必需氨基酸殘基,參與維持蛋白酶的空間結(jié)構(gòu)及行使催化功能。比如第10、54、70、179、196、207與231位的Cys殘基,它們之間能夠形成二硫鍵以穩(wěn)定蛋白酶的空間結(jié)構(gòu)。第205位的Asp殘基與228、238位的Gly殘基能夠與底物形成離子鍵、氫鍵,參與類胰蛋白酶對(duì)底物的識(shí)別與結(jié)合。第69位的His殘基、114位的Asp殘基與211位的Ser殘基組成了類胰蛋白酶的催化基團(tuán),通過電子的傳遞,與底物分子中的Arg和(或)Lys殘基羧基端肽鍵發(fā)生親核反應(yīng),實(shí)現(xiàn)催化功能(氨基酸殘基位置以類胰蛋白酶Ⅲ為準(zhǔn))。
2.5 棉鈴蟲類胰蛋白酶的功能結(jié)構(gòu)域分析
使用NCBI數(shù)據(jù)庫中CDD在線工具對(duì)類胰蛋白酶Ⅲ進(jìn)行功能結(jié)構(gòu)域分析(圖3)。結(jié)果表明,類胰蛋白酶Ⅲ屬于胰蛋白酶超家族,具有該家族特有的功能區(qū)域。類胰蛋白酶Ⅲ的16位(Ala)與17位(Arg)氨基酸殘基之間含有一個(gè)自剪切位點(diǎn)(Cleavage site),該位點(diǎn)與酶翻譯后的活化及轉(zhuǎn)運(yùn)有關(guān);69(His)位、114(Asp)位、211(Ser)位氨基酸殘基構(gòu)成酶的催化位點(diǎn)(Active site);205(Asp)位、228(Gly)位、238(Gly)位氨基酸殘基形成3個(gè)底物結(jié)合位點(diǎn)(Substrate binding sites),參與酶對(duì)底物的識(shí)別與結(jié)合,其他類胰蛋白酶的分析也得到相似的結(jié)果。
2.6 棉鈴蟲類胰蛋白酶的亞細(xì)胞定位分析
亞細(xì)胞定位預(yù)測(cè)結(jié)果見表3。由表3可以看出,類胰蛋白酶Ⅰ、Ⅱ主要位于內(nèi)質(zhì)網(wǎng)中,類胰蛋白酶Ⅲ主要位于內(nèi)質(zhì)網(wǎng)、液泡及細(xì)胞外基質(zhì)中,而類胰白酶Ⅳ、Ⅴ、Ⅵ與Ⅶ主要位于細(xì)胞外基質(zhì)中。亞細(xì)胞定位的多樣性體現(xiàn)了類胰蛋白酶在棉鈴蟲生命活動(dòng)過程中具有多樣性的生物學(xué)功能,其中類胰白酶Ⅲ、Ⅳ、Ⅴ、Ⅵ與Ⅶ主要發(fā)揮消化作用,因?yàn)槊掴徬x對(duì)食物的消化場(chǎng)所主要位于中腸(細(xì)胞外)。而類胰蛋白酶Ⅰ、Ⅱ與Ⅲ可能主要行使免疫保護(hù)作用,參與棉鈴蟲對(duì)外界環(huán)境的免疫應(yīng)答。
2.7 棉鈴蟲類胰蛋白酶的二級(jí)結(jié)構(gòu)分析預(yù)測(cè)
利用NPSA在線工具預(yù)測(cè)類胰蛋白酶的二級(jí)結(jié)構(gòu)(表4)。由表4可知,無規(guī)卷曲是該類胰蛋白酶整體結(jié)構(gòu)中的主要組成結(jié)構(gòu)元件,β轉(zhuǎn)角出現(xiàn)概率相對(duì)較小。α螺旋主要分布于氨基酸序列兩側(cè),而無規(guī)卷曲、延伸鏈則主要分布在多肽鏈中間區(qū)段。
3 小結(jié)與討論
本研究以棉鈴蟲腸道內(nèi)7種類胰蛋白酶為研究對(duì)象,運(yùn)用在線工具對(duì)其進(jìn)行生物信息學(xué)分析。結(jié)果表明,7種類胰蛋白酶理化性質(zhì)較為相似,為親水性蛋白酶。Ser是類胰蛋白酶序列中磷酸化概率最大的氨基酸殘基。分子系統(tǒng)發(fā)育樹結(jié)果顯示類胰蛋白酶Ⅲ與類胰蛋白酶Ⅵ進(jìn)化關(guān)系較近,而類胰蛋白酶I和類胰蛋白酶Ⅱ在進(jìn)化關(guān)系上更為接近。類胰蛋白酶不存在跨膜結(jié)構(gòu)域,屬于基質(zhì)類蛋白,這與其親水性的特點(diǎn)吻合。功能結(jié)構(gòu)域分析發(fā)現(xiàn)類胰蛋白酶屬于胰蛋白酶超家族,其氨基酸序列中含有自切割位點(diǎn)、若干催化殘基與結(jié)合殘基。類胰蛋白酶的亞細(xì)胞定位具有多樣性,主要分布在細(xì)胞外與內(nèi)質(zhì)網(wǎng)中,這體現(xiàn)了類胰蛋白酶在棉鈴蟲生命活動(dòng)過程中具有多樣性的生物學(xué)功能。二級(jí)結(jié)構(gòu)分析預(yù)測(cè)表明無規(guī)卷曲在該類胰蛋白酶整體結(jié)構(gòu)中所占比例最大,是其主要的結(jié)構(gòu)元件。氨基酸序列同源性分析,7種類胰蛋白酶氨基酸序列的同源性較高,達(dá)到了85.71%,并且含有高度保守的必需殘基,參與維持蛋白酶的空間結(jié)構(gòu)及行使催化功能,包括維持高級(jí)結(jié)構(gòu)的Cys殘基,形成底物結(jié)合口袋的結(jié)合殘基及參與催化作用的催化殘基。依據(jù)此研究結(jié)果,能夠設(shè)計(jì)出與類胰蛋白酶活性中心特異性結(jié)合的抑制劑,抑制其活性,從而擾亂棉鈴蟲的正常消化,實(shí)現(xiàn)抗蟲目的。
參考文獻(xiàn):
[1] 常團(tuán)結(jié),陳 蕾,路子顯,等. 棉鈴蟲幼蟲中腸類胰蛋白酶基因的克隆及在大腸桿菌中的表達(dá)[J]. 動(dòng)物學(xué)報(bào),2002,48(6):790-796.
[2] 任曉霞,韓召軍,王蔭長(zhǎng). 棉鈴蟲乙酰膽堿酯酶cDNA片段的克隆和序列分析[J]. 動(dòng)物學(xué)報(bào),2002,48(1):121-124.
[3] 郭線茹,蔣金煒,羅梅浩,等. 轉(zhuǎn)基因抗蟲煙草研究進(jìn)展[J]. 昆蟲知識(shí),2005,42(4):358-363.
[4] CHOUGULE N P, GIRI A P,SAINANI M N, et al. Gene expression patterns of Helicoverpa armigera gut proteases[J]. Insect Biochemistry and Molecular Biology,2005,35(4):355-367.
[5] KANG Z, JIANG J H, WANG D, et al. Kunitz-type trypsin inhibitor with high stability from Spinacia oleracea L. seeds[J]. Biochemistry (Moscow),2009,74(1):102-109.
[6] TELANG M A, GIRI A P, SAINANI M N, et al. Characterization of two midgut proteinases of Helicoverpa armigera and their interaction with proteinase inhibitors[J]. Journal of Insect Physiology,2005,51(5):513-522.
[7] TAMHANE V A, CHOUGULE N P, GIRI A P, et al. In vivo and in vitro effect of Capsicum annum proteinase inhibitors on Helicoverpa armigera gut proteinases[J]. Biochim Biophys Acta,2005,1772(2):156-167.
[8] BOWN D P, GATEHOUSE J A. Characterization of a digestive carboxypeptidase from the insect pest corn earworm (Helicoverpa armigera) with novel specificity towards C-terminal glutamate residues[J]. European Journal of Biochemistry,2004, 271(10):2000-2011.
[9] VOLPICELLA M, CECI L R, CORDEWENER J, et al. Properties of purified gut trypsin from Helicoverpa zea adapted to proteinase inhibitors[J]. Eur J Biochem,2003,270(1):10-19.
[10] LOPEZ A R, JULIANO M A, JULIANO L, et al. Coevolution of insect trypsins and inhibitors[J]. Arch Insect Biochem Physiol,2004,55(3):140-152.