朱曉慶,李寧寧,王瑋,張少英
(內(nèi)蒙古農(nóng)業(yè)大學(xué)甜菜生理研究所,呼和浩特 010018)
植物持續(xù)光形態(tài)建成與矮化基因(Constitutive photomorphogenesis and dwarf,CPD)編碼細(xì)胞色素P450類固醇側(cè)鏈羥化酶(CYP90),在植物激素油菜素甾醇(Brassinosteroids,BRs)的生物合成中起重要作用[1-2]。已有研究表明,CPD 基因在植物生長發(fā)育過程中通過促進(jìn)BRs 的合成,調(diào)控植物的株高、產(chǎn)量、粒型、育性、纖維等多種農(nóng)藝性狀[3-5],參與細(xì)胞的伸長與分裂、維管束分化、光形態(tài)建成、葉和根的發(fā)育、衰老、育性以及對逆境脅迫的響應(yīng)等多個(gè)生物學(xué)過程,對植物生長發(fā)育起著至關(guān)重要的作用[6-8]。在BR 合成過程中參與催化反應(yīng)的酶主要有6 種,其中有5 種為細(xì)胞色素P450 單加氧化酶(Cytochrome P450s,CYPs)。到目前為止,與擬南芥CPD 同源的基因已經(jīng)在豌豆、番茄、水稻、大豆、馬鈴薯、胡楊、棉花、玉米、楊樹等[9-16]植物中被鑒定和研究,但在甜菜上未見報(bào)道。本研究以P450保守結(jié)構(gòu)域序列,為檢索序列通過HMM 和BLAST 在甜菜基因組數(shù)據(jù)中進(jìn)行同源性搜索,對BvCPD 家族成員進(jìn)行分析。利用ExPASy、MEGA 7.0、MapInspect、MEME等生物信息學(xué)分析工具對BvCPD 家族成員進(jìn)行理化性質(zhì)、系統(tǒng)進(jìn)化關(guān)系、基因染色體定位及模體分析。同時(shí),根據(jù)本課題組在甜菜塊根不同發(fā)育時(shí)期的轉(zhuǎn)錄組數(shù)據(jù)分析已得出的BvCPD 家族成員Bv2_qyup 與甜菜塊根膨大有關(guān)的結(jié)果[17],進(jìn)一步對Bv2_qyup 蛋白的理化性質(zhì)、蛋白質(zhì)結(jié)構(gòu)、蛋白信號肽和跨膜預(yù)測、亞細(xì)胞定位、蛋白保守結(jié)構(gòu)域以及蛋白磷酸化位點(diǎn)進(jìn)行生物信息學(xué)分析,以期闡明BvCPD 的基本理化特性,并為Bv2_qyup的克隆及功能鑒定提供理論依據(jù)。
以擬南芥CPD 氨基酸序列(ACCESSION:At5g05690,來自擬南芥數(shù)據(jù)庫及蛋白序列數(shù)據(jù)庫)作為探針序列,基于“隱馬爾可夫模型”(HMM)下載自Pfam 蛋白家族數(shù)據(jù)庫(http://pfam.xfam.org/)的保守性P450 結(jié)構(gòu)域序列在甜菜基因數(shù)據(jù)庫RefBeet-1.1和RefBeet-1.2中進(jìn)行BLASTP搜索,把編碼完整的任何P450結(jié)構(gòu)域均視為BvCPD家族基因,并確保其非冗余(E值≤10-15)。將SMART分析作為二次檢驗(yàn)的標(biāo)準(zhǔn),確保每一條蛋白質(zhì)序列都包含保守性P450結(jié)構(gòu)域。
利用軟件ExPASy 中的Prot-Param 工具對BvCPD 蛋白的氨基酸組分和理化性質(zhì)進(jìn)行分析;利用ClusterW(在默認(rèn)設(shè)置下)軟件對來自甜菜和擬南芥的CPD 蛋白氨基酸序列進(jìn)行多序列比對;利用MEGA7.0 軟件分析與構(gòu)建無根系統(tǒng)進(jìn)化樹;統(tǒng)計(jì)方法為鄰接(Neighbor joining)法。同時(shí)利用Maximum Likelihood 和Minimum Evolution法分別構(gòu)建的系統(tǒng)進(jìn)化樹對所得系統(tǒng)進(jìn)化樹進(jìn)行驗(yàn)證。
根據(jù)上面分析,再通過對甜菜基因組數(shù)據(jù)集RefBeet-1.1(http://bvseq.molgen.mpg.de/Genome/Download/index.shtml)的搜索確定BvCPD 家族基因所在的位置,利用Mapin-spect 軟件繪制BvCPD 家族基因的染色體定位圖譜。
進(jìn)一步,使用在線工具M(jìn)EME(http://meme-suite.org/tools/meme)統(tǒng)計(jì)分析BvCPD 家族蛋白序列中的保守性模體,模體數(shù)量上限設(shè)為10,其他值均設(shè)為默認(rèn)值。
利用ExPASy-Protparam 和Protscale在線軟件預(yù)測分析蛋白的理化性質(zhì)和親水性;利用NCBI CD search及NPSA-PRABI、Swiss-Model 軟件分別預(yù)測蛋白的保守結(jié)構(gòu)域及二、三級結(jié)構(gòu);并在線網(wǎng)站Psort 進(jìn)行亞細(xì)胞定位預(yù)測。根據(jù)SignalP4.1、TMHMM Server v.2.0 和NetPhos 3.1 Server軟件預(yù)測分析蛋白信號肽、蛋白跨膜及磷酸化位點(diǎn)[18-21]。
以P450保守結(jié)構(gòu)域序列為檢索序列通過HMM和BLAST在甜菜基因組數(shù)據(jù)中進(jìn)行同源性搜索,共獲得76個(gè)BvCPD家族成員,其mRNA 長度范圍在786~4 132 bp,外顯子數(shù)為1~16個(gè);編碼蛋白質(zhì)的氨基酸數(shù)量為235(Bv6_pfpc)~767(Bv7u_xmah)個(gè),分子質(zhì)量為26.40(Bv1_iokn)~87.49(Bv7u_xmah)kDa,等電點(diǎn)變化范圍為5.59(Bv2_dnyj)~9.45(Bv0_xcyt),親水性指數(shù)為-0.369~0.077(表1)。
表1 部分BvCPD 家族成員信息Table 1 Part of the BvCPD family genes information
將76 個(gè)BvCPD 的氨基酸序列與52 個(gè)AtCPD 的氨基酸序列用NJ 法構(gòu)建系統(tǒng)進(jìn)化樹,并根據(jù)BvCPD 家族成員與AtCPD 家族成員的進(jìn)化關(guān)系將BvCPD 家族成員分成10 個(gè)亞組(圖1),1~10 個(gè)亞組中的BvCPD數(shù)量分別是3、16、13、3、11、9、7、7、2和5個(gè),其中Bv2_qyup和AtCYP90A1同源性最高,共同位于亞組Ⅹ中。
圖1 CPD基因家族系統(tǒng)進(jìn)化樹分析Fig.1 Phylogenetic tree analysis of CPD gene family
對BvCPD蛋白序列進(jìn)行保守性模體預(yù)測,經(jīng)分析共得到10個(gè)保守性模體,所有BvCPD家族成員均含有4~10 個(gè)模體,且均含有模體2 和模體7,除Bv_hhum 外均含有模體1,除Bv_sqfu 外均含有模體4 和模體5(圖2)。結(jié)合系統(tǒng)進(jìn)化樹的分組,每個(gè)亞組中模體數(shù)量和種類相近。
通過Mapin-spect 軟件分析發(fā)現(xiàn),有66 個(gè)BvCPD 家族成員分布在甜菜的9 條染色體上,其中第7 條染色體上分布最多,分布有13 個(gè)基因;其次為第5 條和第1 條,分別分布有11 個(gè)和9 個(gè)基因;在第3 條染色體上分布的基因最少,只有3 個(gè)基因(圖3)。除此之外,還有10 個(gè)基因尚未明確定位。Bv2_qyup被定位于第2 條染色體上。
圖2 CPD家族蛋白保守性模體分布Fig.2 Conservative pattern distribution of CPD family protein
圖3 BvCPD家族成員的染色體分布Fig.3 Chromosome distribution of BvCPD family genes
為進(jìn)一步調(diào)查BvCPD 的功能,結(jié)合本課題組對甜菜塊根發(fā)育的轉(zhuǎn)錄組數(shù)據(jù)分析所發(fā)現(xiàn)的BvCPD 基因家族中Bv2_024470_qyup.t1與甜菜塊根膨大呈正相關(guān)的結(jié)果,我們進(jìn)一步對Bv2_qyup 及其編碼蛋白進(jìn)行生物信息學(xué)分析,以期為研究該基因在甜菜塊根發(fā)育中的功能奠定基礎(chǔ)。
2.5.1Bv2_qyup的序列分析
利用NCBI 數(shù)據(jù)庫中ORF finder 軟件預(yù)測Bv2_qyup 的開放閱讀框(ORF),結(jié)果顯示Bv2_qyup 的cDNA序列包含有1 422 bp 的ORF,編碼473 個(gè)氨基酸(圖4)。其中亮氨酸(Leu)、蘇氨酸(Thr)所占比例較高,分別為12.1%、7.8%,半胱氨酸(Cys)的占比最低,為1.1%;含堿性氨基酸精氨酸(Arg)和賴氨酸(Lys)共58 個(gè);含酸性氨基酸天冬氨酸(Asp)和谷氨酸(Glu)共52個(gè)。
圖4 Bv2_qyup的核苷酸序列及推測的氨基酸序列Fig.4 Nucleotide and deduced amino acid sequences of Bv2_qyup
圖5 Bv2_qyup的理化性質(zhì)及結(jié)構(gòu)分析Fig.5 Physical and chemical properties and structure of Bv2_qyup
2.5.2Bv2_qyup的理化性質(zhì)及結(jié)構(gòu)
通過ExPASy-Protparam 在線工具對Bv2_qyup 的理化性質(zhì)進(jìn)行分析。得出該蛋白的相對分子量為54.11 kD,等電點(diǎn)為8.85;蛋白質(zhì)不穩(wěn)定指數(shù)為37.49,說明該蛋白是穩(wěn)定蛋白(不穩(wěn)定系數(shù)<40)[22];總平均親水指數(shù)(GRAVY)為-0.107,再根據(jù)ProtScale 軟件檢測其親水性和疏水性。Bv2_qyup 最大的親水性和疏水性值分別為-4.033和2.833。從圖5a可以看出Bv2_qyup親水性和疏水性氨基酸分別為157個(gè)和135個(gè),說明Bv2_qyup屬于親水蛋白。
通過在線網(wǎng)站NPSA-PRABI預(yù)測Bv2_qyup的二級結(jié)構(gòu),如圖5b 所示:Bv2_qyup由α-螺旋、延伸鏈和無規(guī)卷曲組合的超二級結(jié)構(gòu),其中α-螺旋區(qū)域有230 個(gè)氨基酸,占48.63%;參與形成無規(guī)則卷曲的氨基酸有187個(gè),占39.53%;參與形成延伸鏈的氨基酸有56個(gè),占11.84%。
通過Swiss-Model 數(shù)據(jù)庫運(yùn)用同源建模的方法預(yù)測Bv2_qyup 的三級結(jié)構(gòu),預(yù)測的結(jié)果如圖5c 所示,Bv2_qyup 的主要空間結(jié)構(gòu)由α-螺旋和無規(guī)則卷曲構(gòu)成,與其二級結(jié)構(gòu)預(yù)測分析一致,經(jīng)折疊、彎曲等一系列復(fù)雜的過程形成了一個(gè)穩(wěn)定的三級結(jié)構(gòu)。
利用軟件NCBI CD search 預(yù)測Bv2_qyup 蛋白序列保守結(jié)構(gòu)域(圖5d)。預(yù)測結(jié)果表明Bv2_qyup 具有細(xì)胞色素p450超家族結(jié)構(gòu)。
2.5.3Bv2_qyup的亞細(xì)胞定位、磷酸化位點(diǎn)、跨膜區(qū)域及信號肽預(yù)測
通過Psort分析表明,Bv2_qyup定位于細(xì)胞質(zhì)中可能性占比最高(表2)。
表2 Bv2_qyup 的亞細(xì)胞定位分析Table 2 Analysis of subcellular localization of Bv2_qyup
通過軟件TMHMM Server v.2.0 分析Bv2_qyup 的跨膜結(jié)構(gòu),其N 末端位于膜內(nèi)側(cè)的概率為0.4541(圖6a),預(yù)測該蛋白在第4~23 個(gè)氨基酸存在跨膜結(jié)構(gòu)域,說明Bv2_qyup是一種膜蛋白。根據(jù)對目的肽鏈氨基酸間潛在酶切位點(diǎn)的預(yù)測來判斷是否存在信號肽[23]。預(yù)測分析表明:Bv2_qyup在第28~29個(gè)氨基酸位置存在信號肽(圖6b)。
圖6 Bv2_qyup的跨膜區(qū)域、信號肽及磷酸化位點(diǎn)預(yù)測Fig.6 Prediction of transmembrane region,signal peptide and phosphorylation site of Bv2_qyup
蛋白修飾在翻譯后細(xì)胞的調(diào)控機(jī)制中起極其重要的作用,磷酸化修飾是蛋白修飾的主要方式。對Bv2_qyup 編碼蛋白磷酸化位點(diǎn)進(jìn)行分析預(yù)測,當(dāng)潛在磷酸化位點(diǎn)的閾值為0.5 時(shí),Bv2_qyup 潛在的磷酸化位點(diǎn)有44 個(gè),其中22 個(gè)絲氨酸(Ser)位點(diǎn)、19 個(gè)蘇氨酸(Thr)位點(diǎn)、3 個(gè)酪氨酸(Tyr)位點(diǎn)(圖6c),推測Bv2_qyup被這3種氨基酸的磷酸激酶磷酸化并激活。
2.5.4Bv2_qyup蛋白序列的同源性分析
利用ClustalW 軟件進(jìn)行同源多重比對,結(jié)果如圖7 所示,Bv2_qyup 與藜麥CqCPD、菠菜SoCPD、毛果楊PtCPD、黃瓜CsCPD 和擬南芥AtCPD的同源性較高,分別為91%、89%、75%、75%和75%。
圖7 Bv2_qyup與不同植物的CPDs氨基酸序列比對Fig.7 Sequence alignment of CPDs amino acids between Bv2_qyup and different plants
通過生物信息學(xué)分析可以了解基因的結(jié)構(gòu)、染色體定位、保守結(jié)構(gòu)域、編碼蛋白序列及結(jié)構(gòu)、信號肽、跨膜結(jié)構(gòu)和磷酸化位點(diǎn)等信息。本研究對甜菜CPD 基因家族進(jìn)行了生物信息學(xué)分析,研究結(jié)果表明,甜菜CPD 基因共有76 個(gè)家族成員,分為10 個(gè)亞組,66 個(gè)BvCPD 家族基因分布在甜菜9條染色體上,有10個(gè)基因尚未明確定位;編碼蛋白含10 個(gè)保守性模體,系統(tǒng)進(jìn)化樹分組中每個(gè)亞組的模體數(shù)量和種類相近。進(jìn)一步對Bv2_qyup 基因及其編碼的蛋白質(zhì)分析表明,Bv2_qyup 由473 個(gè)氨基酸組成,是一種含信號肽的親水跨膜蛋白,二級結(jié)構(gòu)以α-螺旋和無規(guī)則卷曲為主要組成部分,與藜麥、菠菜、毛果楊、黃瓜和擬南芥CPD的同源性較高。細(xì)胞定位預(yù)測表明該蛋白在細(xì)胞質(zhì)中存在的可能性最大,與中國櫻桃Unigene5028(CPD)定位于葉綠體中不同[24],表明甜菜CPD 家族成員在細(xì)胞中的定位不同,Bv2_qyup 存在44 個(gè)磷酸化位點(diǎn),可被絲氨酸、蘇氨酸、酪氨酸磷酸激酶磷酸化并激活。根據(jù)以上研究結(jié)果,我們將對Bv2_qyup克隆,并對其在甜菜塊根發(fā)育中的功能進(jìn)行深入研究。