林世鋒,王仁剛,任學(xué)良,王東茂,張 拓,黃亞娟
(1.貴州省煙草科學(xué)研究所,貴陽 550081;2.北京蛋白質(zhì)組研究中心/蛋白質(zhì)組學(xué)國家重點(diǎn)實驗室,北京 102206)
低溫、干旱和高鹽等非生物脅迫嚴(yán)重影響植物的生長發(fā)育和產(chǎn)量。煙草作為一種特殊的葉用經(jīng)濟(jì)作物,不僅注重?zé)熑~的產(chǎn)量,更注重?zé)熑~的品質(zhì)和可用性。煙草和其他作物一樣易受低溫、干旱和高鹽等非生物脅迫的危害,不僅影響其生長發(fā)育,更嚴(yán)重的是影響其質(zhì)量。
植物在受到低溫、干旱和高鹽等脅迫時,可以在體內(nèi)積累一些可溶性小分子,如脯氨酸、甘露醇、寡糖等,以增加植物細(xì)胞滲透壓,提高植物組織抵抗脅迫的能力[1-2]。棉子糖家族寡糖(Raffinose family oligosaccharides,RFOs,主要為棉子糖和水蘇糖)是上述可溶性小分子中的一類。研究表明,一些體內(nèi)不含RFOs或含量極低的植物,受到低溫、干旱和高鹽等逆境脅迫后RFOs迅速積累,植株抗逆性也隨之增強(qiáng)。肌醇半乳糖苷合成酶(Galactinol synthase,GolS)是植物體內(nèi)合成RFOs的關(guān)鍵酶。目前有一些關(guān)于該酶受逆境脅迫表達(dá)上升的報道,如低溫處理后辣椒葉片中GolS的mRNA表達(dá)量持續(xù)增加[3];小果咖啡經(jīng)干旱和高鹽脅迫后體內(nèi)會積累大量GolS[4];對甘藍(lán)型油菜種子進(jìn)行脫水處理,可造成該酶mRNA的積累[5];在小鹽芥[6]、日本黃連[7]和旋蒴苣苔[8]等植物中也存在類似的生理現(xiàn)象。本研究以煙草與辣椒同屬茄科植物,物種間同源基因序列相對保守為切入點(diǎn),以辣椒GolS基因cDNA序列為探針,通過電子克隆法獲得1個新的煙草GolS基因,并進(jìn)行生物信息學(xué)分析,以期為煙草抗逆相關(guān)研究提供基礎(chǔ)材料。
以辣椒肌醇半乳糖苷合成酶CaGolS基因的全長cDNA序列(GenBank登陸號:EF566470)[2]為信息探針,對GenBank中EST_others數(shù)據(jù)庫指定物種煙草(Nicotiana tabacum)進(jìn)行BLAST檢索,將檢索到來自于煙草栽培品種K326的全部EST序列利用DNAMAN 6.0軟件進(jìn)行拼接,形成重疊群(Contig)。然后用此重疊群再次進(jìn)行同源檢索、拼接,重復(fù)以上過程直至沒有更多煙草栽培品種K326的重疊EST檢出,最終獲得煙草栽培品種K326肌醇半乳糖苷合成酶cDNA序列片段。再以此片段在GenBank中進(jìn)行Blastx同源搜索,與其他物種肌醇半乳糖苷合成酶同源蛋白進(jìn)行序列比較,進(jìn)而判斷拼接得到的煙草肌醇半乳糖苷合成酶基因cDNA的正確性及其ORF序列的完整性。
利用NCBI網(wǎng)站(http://www.ncbi.nlm.nih.gov/)提供的ORF finder軟件對開放閱讀框進(jìn)行分析并翻譯成蛋白質(zhì),通過BlastP程序進(jìn)行序列相似性分析和氨基酸保守性預(yù)測;運(yùn)用DNAMAN 6.0軟件進(jìn)行氨基酸序列多重比對;利用瑞士生物信息研究所網(wǎng)站(http://www.expasy.org/tools/)提供的ProtParam軟件、SignalP軟件、NetNGlyc軟件和NetPhos軟件進(jìn)行蛋白基本特性、信號肽、糖基化和磷酸化位點(diǎn)分析,通過SOPMA軟件[9]和WISS-MODEL軟件[10-11]對蛋白質(zhì)二級和三級結(jié)構(gòu)進(jìn)行預(yù)測。
利用已知的辣椒肌醇半乳糖苷合成酶基因的核苷酸序列對GenBank中煙草EST數(shù)據(jù)庫進(jìn)行BLAST檢索分析,發(fā)現(xiàn)5條相似性高的EST序列來自煙草品種K326,通過DNAMAN 6.0軟件將它們進(jìn)行重疊群的裝配后,獲得contig成分及各個序列的拼接位置,如圖1所示。在組成的contig中,各條EST序列的拼接順序為:EB448354,EB430670,EB432401,EB431033,EB430244。通過拼接獲得一條長為1423 bp的一致性序列。ORF finder和Blastx分析結(jié)果表明,獲得一個煙草GolS基因,命名為NtGolS1。NtGolS1的cDNA全長1423 bp,包含一個完整的開放閱讀框架,起始密碼子位子在102位,終止密碼子位子在1133位,共編碼343個氨基酸(見圖2)。
圖1 煙草GolS1基因cDNA序列的拼接Fig.1 Joint map of Nicotiana tabacum GolS1 cDNA sequence
圖2 煙草GolS1的cDNA序列及推導(dǎo)的氨基酸序列Fig.2 Nucleotide acid sequence and deduced amino acid sequence of Nicotiana tabacum GolS1
利用ProtParam軟件對NtGolS1氨基酸序列進(jìn)行基本特性分析,結(jié)果顯示NtGolS1蛋白的分子式為C1803H2756N448O505S15,分子質(zhì)量為39.2693 ku,理論等電點(diǎn)pI 5.78。該蛋白含Val(V)最多,占9.6%;其次為Ala(A),占8.7%??偟膸д姎埢ˋrg+Lys)為37,負(fù)電殘基(Asp+Glu)為42??偟挠H水性平均系數(shù)(Grand average of hydropathicity,GRAVY)為-0.191,預(yù)測該蛋白屬于親水性蛋白。該蛋白預(yù)測不穩(wěn)定指數(shù)是35.47,屬于穩(wěn)定蛋白。NCBI保守結(jié)構(gòu)域搜索表明,NtGolS1屬于一個糖基轉(zhuǎn)移酶家族,該家族與脂多糖合成和糖原的合成相關(guān),包含脂多糖糖基轉(zhuǎn)移酶、半乳糖糖基轉(zhuǎn)移酶等。
采用NetNGlyc 1.0預(yù)測NtGolS1蛋白有2個潛在N-糖基化位點(diǎn),但糖基化一般發(fā)生在信號受體蛋白分子上,而SignalP 4.0預(yù)測NtGolS1蛋白無信號肽,說明在體內(nèi)這些預(yù)測的潛在N-糖基化位點(diǎn)可能不能真正被糖基化。NetPhos2.0預(yù)測NtGolS1蛋白存在16個磷酸化位點(diǎn),其潛在Ser、Thr和Tyr活性位點(diǎn)數(shù)分別為2、3和11個,NtGolS1蛋白存在豐富的磷酸化位點(diǎn),說明磷酸化位點(diǎn)修飾對GolS蛋白的功能可能非常重要,也可能是這些磷酸化參與GolS蛋白活性的調(diào)控。
運(yùn)用SOPMA軟件分析NtGolS1的二級結(jié)構(gòu),結(jié)果如圖3所示,α螺旋約占45%,延伸直鏈約占12%,β轉(zhuǎn)角約占4%,無規(guī)則卷曲約占39%,其中α螺旋為主要結(jié)構(gòu)。以兔肌肉糖原蛋白晶體結(jié)構(gòu)作為NtGolS1結(jié)構(gòu)建模的參考蛋白,用同源建模服務(wù)器SWISS-MODEL進(jìn)行蛋白三維結(jié)構(gòu)預(yù)測。結(jié)果如圖4所示,說明NtGolS1三維空間結(jié)構(gòu)主要由6個α螺旋和9個延伸直鏈圍繞形成1個球狀結(jié)構(gòu)。
圖3 NtGolS1的二級結(jié)構(gòu)預(yù)測結(jié)果Fig.3 Secondary structure prediction of NtGolS1
圖4 NtGolS1的三級結(jié)構(gòu)預(yù)測結(jié)果Fig.4 Tertiary structure prediction of NtGolS1
通過NCBI網(wǎng)站BLAST結(jié)果發(fā)現(xiàn)該基因的氨基酸序列與肌醇半乳糖苷合成酶基因有非常高的相似度。其中與甘藍(lán)型油菜中的GolS基因(Brassicanapus;ACJ15472、HM003640)[4]具有最高相似度,一致性達(dá)80%,相似性為88%。其次與維柯薩中的GolS基因(Xerophyta viscosa;ABK27907)[12]在蛋白質(zhì)水平上一致性和相似性分別為76%和83%,與辣椒中的GolS基因(Capsicum annuum;ABQ44212)[2]在蛋白質(zhì)水平上一致性和相似性分別為75%和84%(見圖5)。
圖5 不同植物GolS基因氨基酸序列同源性比較Fig.5 Alignment of deduced amino acid sequences of GolS genes of different plants
用Mega 3.1軟件將推導(dǎo)的氨基酸序列與GenBank中其他植物的26個GolS基因的氨基酸序列進(jìn)行聚類分析。結(jié)果表明,GolS基因在小果咖啡[4]、蕎麥[13]、甘藍(lán)型油菜[5]、紫毛蕊花[14]等植物中均以多種形式存在,其中小果咖啡和蕎麥中不同形式的GolS序列差異較大,被歸入不同的聚類組。
本文克隆的基因首先與維柯薩GolS聚在一起,再與甘藍(lán)型油菜等植物GolS聚在一起,而與同科的辣椒GolS親緣關(guān)系較遠(yuǎn)(見圖6)。
圖6 煙草GolS基因氨基酸序列與其他植物氨基酸序列聚類分析Fig.6 Phylogenetic analysis of amino acid sequences of tobacco GolS gene with other reported genes
電子克隆(In silico cloning)是近年來伴隨基因組計劃和EST計劃發(fā)展起來的基因克隆新方法[15-16],它依賴于各種生物信息數(shù)據(jù)庫,利用生物軟件拼接延伸EST序列,獲得目的基因的部分乃至全長的cDNA序列。本研究以煙草與辣椒同屬茄科植物,物種間同源基因序列相對保守為切入點(diǎn),以辣椒GS基因cDNA序列作為探針,對煙草EST數(shù)據(jù)庫進(jìn)行檢索拼接,成功克隆到1個新的煙草GS基因。在電子克隆檢索過程中,目標(biāo)物種鎖定煙草(Nicotiana tabacum),全部EST序列來源于同一品種K326,避免品種間基因多態(tài)性造成序列拼接工作的復(fù)雜性,進(jìn)而增加電子克隆的準(zhǔn)確性。同時,K326是我國主栽煙草品種之一,對其抗逆相關(guān)基因的研究,勢必具有重要的理論及應(yīng)用價值。
GolS基因在植物體內(nèi)常以多種形式存在,如在小果咖啡基因組中就發(fā)現(xiàn)有3種形式的GolS基因(見圖5)。dos Santos等研究表明,小果咖啡GolS1在正常生長和各種脅迫條件下持續(xù)表達(dá),GolS2受嚴(yán)重干旱和鹽脅迫誘導(dǎo)表達(dá),而GolS3被中度和嚴(yán)重干旱誘導(dǎo),但對鹽脅迫無反應(yīng)[4]。聚類圖中與本文克隆的基因聚在一起的維柯薩GolS基因受干旱脅迫后表達(dá)[12],同時與煙草GolS氨基酸序列最相似的甘藍(lán)型油菜GolS基因也受干旱脅迫誘導(dǎo)表達(dá)[5],上述這些基因在其他脅迫下是否表達(dá)并不清楚。繆珉等發(fā)現(xiàn)辣椒葉片在低溫脅迫后GolS表達(dá)上升[3],辣椒和煙草同屬茄科植物,但考慮到辣椒GolS基因序列與本文獲得的煙草GolS基因相似度不是最高,在聚類圖中也比較分散,可以推測這兩個基因不屬于同一類GolS基因。植物體內(nèi)的各種GolS基因?qū)Ω鞣N逆境脅迫的反應(yīng)相當(dāng)復(fù)雜,同一類GolS基因可以對不同的逆境脅迫作出反應(yīng),而不同的GolS基因也可以受同一種脅迫誘導(dǎo)表達(dá)。本文所獲得的基因會被何種逆境脅迫誘導(dǎo)表達(dá),值得進(jìn)一步研究。
本研究首次通過電子克隆法從煙草栽培品種K326中克隆到1個煙草GolS基因。通過生物信息學(xué)技術(shù)對其編碼蛋白的理化性質(zhì)、二級結(jié)構(gòu)以及高級結(jié)構(gòu)進(jìn)行生物信息學(xué)分析,并探究與其他物種的生物進(jìn)化關(guān)系。為進(jìn)一步研究該類蛋白的性質(zhì)和功能及植物抗逆基因工程研究奠定理論基礎(chǔ)。
[1] Taji T,Ohsumi C,Iuchi S,et al.Important roles of drought-and cold-inducible genes for galactinol synthase in stress tolerance in Arabidopsis thaliana[J].The Plant Journal,2002,29(4):417-426.
[2] 朱文哲,李景富,王傲雪.低溫脅迫對多毛番茄幼苗生理生化特性的影響[J].東北農(nóng)業(yè)大學(xué)學(xué)報,2011,42(4):57-62.
[3] 繆珉,李娜,任旭琴,等.一個辣椒肌醇半乳糖苷合成酶同源基因全長cDNA的克隆與低溫表達(dá)分析[J].園藝學(xué)報,2008,35(11):1671-1675.
[4] dos Santos T B,Budzinski I G,Marur C J,et al.Expression of three galactinol synthase isoforms in Coffea arabica L.and accumulation of raffinose and stachyose in response to abiotic stresses[J].Plant Physiology and Biochemistry,2011,49(4):441-448.
[5] Li X,Zhuo J,Jing Y,et al.Expression of a GALACTINOL SYNTHASE gene is positively associated with desiccation tolerance of Brassica napus seeds during development[J].Journal of Plant Physiology,2011,168(15):1761-1770.
[6] Wang Z I,Li P H,Fredricksen M,et al.Expressed sequence tags from Thellungiella halophila,a new model to study plant salttolerance[J].Plant Science,2004,166(3):609-616.
[7] Takanashi K,Shitan N,Sugiyama A,et al.Galactinol synthase gene of Coptis japonica is involved in berberine tolerance[J].Bioscience,Biotechnology,and Biochemistry,2008,72(2):398-405.
[8] Wang Z,Zhu Y,Wang L,et al.A WRKY transcription factor participates in dehydration tolerance in Boea hygrometrica by binding to the W-box elements of the galactinol synthase(BhGolS1)promoter[J].Planta,2009,230(6):1155-1166.
[9] Combet C,Blanchet C,Geourjon C,et al.NPS@:Network protein sequence analysis[J].Trends in Biochemical Sciences,2000,25(3):147-150.
[10] Arnold K,Bordoli L,Kopp J,et al.The SWISS-MODEL Workspace:A web-based environment for protein structure homology modelling[J].Bioinformatics,2006,22(2):195-201.
[11] Schwede T,Kopp J,Guex N,et al.SWISS-MODEL:An automated protein homology-modeling server[J].Nucleic Acids Research,2003,31(13):3381-3385.
[12] Peters S,Mundree S G,Thomson J A,et al.Protection mechanisms in the resurrection plant Xerophyta viscosa(Baker):Both sucrose and raffinose family oligosaccharides(RFOs)accumulate in leaves in response to water deficit[J].Journal of Experimental Botany,2007,58(8):1947-1956.
[13] Ueda T,Coseo M P,Harrel T J,et al.A multifunctional galactinol synthase catalyzes the synthesis of fagopyritol A1 and fagopyritol B1 in buckwheat seed[J].Plant Science,2005,168(3):681-690.
[14] McCaskill A,Turgeon R.Phloem loading in Verbascum phoeniceum L.depends on the synthesis of raffinose-family oligosaccharides[J].Proceedings of the National Academy of Sciences of the United States of America,2007,104(49):19619-19624.
[15] 俄廣鑫,劉娣,謝雨彤,等.豬SRPK1基因的電子克隆[J].東北農(nóng)業(yè)大學(xué)學(xué)報,2010,41(3):101-104.
[16] Gill R W,Sanseau P.Rapid in silico cloning of genes using expressed sequence tags(ESTs)[J].Biotechnology Annual Review,2000(5):25-44.