喻紅稠,韓長志,2*
(1.西南林業(yè)大學生物多樣性保護學院,昆明 650224;2.云南省森林災害預警與控制重點實驗室,昆明 650224)
禾谷炭疽菌Colletotrichumgraminicola(Cesati)Wilson作為一種半活體營養(yǎng)型真菌[1-3],該生活方式為其侵染玉米、小麥、高粱等諸多禾本科作物提供了重要的基礎[4-5],由該菌引起的炭疽病,在中國、美國等國家發(fā)生非常普遍,嚴重制約著農(nóng)林業(yè)經(jīng)濟的發(fā)展,給農(nóng)林業(yè)生產(chǎn)造成巨大的損失[6]。據(jù)估計,該菌每年導致玉米產(chǎn)量降低高達40%,相當于美國一年損失10億美元[2]。隨著基因組學和分子生物學的快速發(fā)展[7],該菌全基因組序列的公布,極大地促進了中外對禾谷炭疽菌的研究,前人研究主要集中在其侵染過程、細胞信號轉導、致病基因、生物學特性分析等方面[6,8]。
G蛋白偶聯(lián)受體(G protein-coupled receptors,GPCR)是數(shù)量最多的一大類具有典型的七跨膜結構域蛋白受體[9],具有7個顯著的疏水性跨膜結構[10],存在于大多數(shù)真核生物中[11],對細胞的信號轉導途徑具有重要作用,即主要將胞外跨膜信號傳遞到胞內(nèi)區(qū)域[11-13],調(diào)節(jié)細胞的一系列生理生化活動。目前,學術界關于禾谷炭疽菌中GPCR的研究較少,本研究小組已報道了關于該菌的4個GPCR[5]、14-3-3蛋白[14]、分泌蛋白[15]、磷酸二酯酶[8]、G蛋白信號途徑相關蛋白[16]等,其他研究者也報道了禾谷炭疽菌的CgRab5A的亞細胞定位[2]、Rab蛋白家族[17]、氨基酸通透酶GAP3基因的功能[18]等研究。另外,對釀酒酵母、構巢曲霉[19]、稻瘟菌[20]、大豆疫霉等GPCR也有研究,如大豆疫霉GPCR候選編碼基因的生物信息學預測與轉錄分析,在大豆疫霉、橡樹疫霉和致病疫霉中分別已挖掘出大量的GPCR候選編碼基因[21],為明確GPCR在一些生理生化過程中的功能解析奠定基礎。然而,關于禾谷炭疽菌候選GPCR的生物信息分析尚未見報道,嚴重制約植物病原絲狀真菌中GPCR相關蛋白的功能研究。前期,基于GPCR所具有的典型七跨膜結構域特性,通過TMHMM、Philius和TOPCONS三種常用軟件對禾谷炭疽菌中全基因組蛋白序列進行在線分析,明確該菌中具有七跨膜結構域特征的蛋白數(shù)量有243個,進一步結合保守結構域、預測功能分析等,最終明確該菌中含有220個候選GPCR蛋白。
基于前期所獲得的禾谷炭疽菌中220個候選GPCR蛋白序列,現(xiàn)利用SignalP、ProtParam、ProtScale以及MEGA等程序?qū)ζ湫盘栯?、理化性質(zhì)、疏水性以及遺傳關系等進行分析,以期為后期分析候選GPCR蛋白在該菌中的功能研究提供重要的理論指導。
禾谷炭疽菌中220個候選GPCR蛋白序列。
1.2.3 候選GPCR蛋白生物信息學分析
(1)信號肽預測。利用SignalP 5.1(http://www.cbs.dtu.dk/services/SignalP/)[22]在線進行信號肽的分析。
(2)理化性質(zhì)分析。利用ProtParam (https://web.expasy.org/protpara m/)程序在線進行理化性質(zhì)分析,包括理論等電點、不穩(wěn)定系數(shù)和總平均親水性等[23]。
(3)疏水性分析。利用ProtScale(https://web.expasy.org/protscale/)程序在線分析蛋白質(zhì)的疏水性[23]。
(4)遺傳關系分析。利用MEGA_X_10.1.8軟件進行多重比對分析和構建系統(tǒng)進化樹[5,17]。
(5)相互作用關系分析。利用STRING v.11在線數(shù)據(jù)庫開展相互作用預測,尋找蛋白-蛋白相互作用關系[24]。
通過對禾谷炭疽菌中220個候選GPCR蛋白(涉及含有7個跨膜結構域但不含有信號肽序列或者含有信號肽序列的具有8個跨膜結構域的蛋白)中信號肽進行預測,結果表明,僅有7個候選GPCR蛋白含有信號肽,ID號分別為XP_008088898.1、XP_008091374.1、XP_008095233.1、XP_008095290.1、XP_008097275.1、XP_008098329.1、XP_008099709.1,所占比例為3.18%。其中,ID號為XP_008088898.1具有七跨膜結構蛋白(TOPCONS和Philius分析),XP_008091374.1、XP_008095233.1、XP_008099709.1等蛋白具有八跨膜結構蛋白(TOPCONS分析),XP_008095290.1、XP_008097275.1、XP_008098329.1是具有八跨膜結構蛋白(TMHMM分析)。進一步對7個候選GPCR信號肽長度進行分析,明確信號肽長度集中在19~22個氨基酸,其中信號肽長度最多的為19個氨基酸,蛋白數(shù)量為3個,所占比例為42.86%;其次是長度為22個氨基酸,蛋白數(shù)量為2個,所占比例為28.57%;長度為23個氨基酸、28個氨基酸,蛋白數(shù)量均為1個,所占比例均為14.29%。
對候選GPCR蛋白的理論等電點進行分析,結果表明,XP_008092362.1具有最高理論等電點,為10.28;XP_008099443.1具有最低理論等電點,為4.97,進一步以理論等電點1.00為1個間隔單位,對全部候選GPCR蛋白進行分類匯總,結果表明,上述候選GPCR蛋白質(zhì)理論等電點主要集中于9.01~10.00,其數(shù)量為78個,所占比例為35.45%;其次集中在8.01~9.00的候選GPCR蛋白有67個,所占比例為30.45%。理論等電點為4.01~5.00、5.01~6.00、6.01~7.00、7.01~8.00、10.01~11.00,候選GPCR蛋白數(shù)量分別為2、20、30、18、5個,所占比例分別為0.91%、9.09%、13.64%、8.18%、2.27%(圖1)。同時,對屬于酸性蛋白質(zhì)(理論等電點小于6.01)的候選蛋白質(zhì)進行分析,其數(shù)量為22個,所占比例為10.00%;對屬于中性蛋白(理論等電點位于6.01~8.00)的分泌蛋白進行分析,其數(shù)量為48個,所占比例為21.82%;對屬于堿性蛋白質(zhì)(理論等電點大于8.00)的候選蛋白質(zhì)進行分析,其數(shù)量為150個,所占比例為68.18%。上述結果表明,候選蛋白質(zhì)中酸性蛋白質(zhì)、中性蛋白質(zhì)、堿性蛋白質(zhì)數(shù)量分布不均勻。對含有信號肽的7個候選GPCR理論等電點進行分析,得出理論等電點<6.01蛋白數(shù)量為1個(屬酸性蛋白),理論等電點在6.01~8.00蛋白數(shù)量為3個(屬中性蛋白),理論等電點>8.00蛋白數(shù)量為3個,7個候選GPCR多屬于中性或堿性蛋白。
圖1 禾谷炭疽菌中候選GPCR蛋白理論等電點的分布情況Fig.1 Distribution of theoretical isoelectric point of candidate GPCR protein in C.graminicola
通過對禾谷炭疽菌中候選GPCR蛋白中的不穩(wěn)定性系數(shù)分析,結果表明,XP_008097524.1的不穩(wěn)定系數(shù)值最大,其不穩(wěn)定性系數(shù)為62.26;XP_008098852.1的不穩(wěn)定系數(shù)值最小,其不穩(wěn)定性系數(shù)為21.11。不穩(wěn)定性系數(shù)主要集中在40.01~50.00,其蛋白質(zhì)有97個,所占比例為44.09%。次要集中在30.01~40.00,蛋白數(shù)量為84個,所占比例為38.18%。其余不穩(wěn)定系數(shù)在<30.00、50.01~60.00、>60.00的蛋白數(shù)量分別為12、26、1個,所占比例分別為5.45%、11.82%、0.45%(圖2)。同時,不穩(wěn)定性系數(shù)小于40.01(穩(wěn)定蛋白質(zhì))的GPCR有96個,所占比例為43.64%;不穩(wěn)定性系數(shù)大于或等于40.00(不穩(wěn)定蛋白質(zhì))的GPCR有124個,所占比例為56.36%。上述結果表明,候選GPCR蛋白在穩(wěn)定性和不穩(wěn)定性方面所占比例相當,推測其具有不同的功能特征。
圖2 禾谷炭疽菌中候選GPCR蛋白不穩(wěn)定性分布情況Fig.2 Distribution of candidate GPCR protein instability in C.graminicola
對上述220個候選GPCR進行疏水性分析,結果表明,親水性蛋白質(zhì)(親水性值小于0),蛋白數(shù)量為45個,所占比例為20.91%;疏水性蛋白(親水性值大于0),蛋白數(shù)量為174個,所占比例為79.09%。進一步對上述蛋白親水性最強氨基酸殘基、疏水性最強氨基酸殘基種類進行統(tǒng)計分析,明確親水性最強的有18種氨基酸殘基,存在較多的是R(精氨酸)、E(谷氨酸)、K(賴氨酸)3種氨基酸殘基,蛋白數(shù)量分別為50、38、32個,所占比例分別為20.66%、15.70%、13.22%(圖3);疏水性最強的有13種氨基酸殘基,存在較多的是L(亮氨酸)、V(纈氨酸)、I(異亮氨酸)、A(丙氨酸)4種氨基酸殘基,蛋白數(shù)量分別為52、50、37、32個,所占比例分別為22.32%、21.46%、15.88%、13.73%(圖4)。
圖3 禾谷炭疽菌中候選GPCR蛋白親水性和疏水性氨基酸殘基分布情況Fig.3 Distribution of hydrophilic and hydrophobic amino acid residues of candidate GPCR proteins in C.graminicola
對具有信號肽的7個候選GPCR進行親水性分析,均屬于疏水性蛋白,親水性最強氨基酸為S(絲氨酸)、T(蘇氨酸)、P(脯氨酸)、Y(酪氨酸)、K、E、R共7種氨基酸,存在較多的是S,疏水性最強氨基酸C(半胱氨酸)、F(苯丙氨酸)、V、T、G(甘氨酸)、I、S共7種氨基酸,其數(shù)量均衡。
對220個候選GPCR蛋白質(zhì)序列進行同源序列分析并進行遺傳關系解析,結果表明,禾谷炭疽菌中候選GPCR明顯分為三大類(圖4中的A、B、C,ID號為紅色的蛋白是7個具有信號肽的候選GPCR),其中最多的是假定蛋白(hypothetical protein)。為了進一步明確上述蛋白中的保守結構域與遺傳關系之間的關系,從上述三大類候選GPCR蛋白中各選擇5個蛋白進行保守結構域分析,結果顯示,均無明顯的保守結構域,僅含有數(shù)量不等的跨膜結構域(圖5)。
圖4 禾谷炭疽菌中候選GPCR蛋白的遺傳關系Fig.4 Genetic relationship of candidate GPCR proteins in C.graminicola
圖5 禾谷炭疽菌中部分候選GPCR蛋白的保守結構域情況Fig.5 Conserved domains of candidate GPCR proteins in C.graminicolas
前人研究發(fā)展,蛋白質(zhì)主要通過自身或是與其他蛋白質(zhì)等形成復合體來執(zhí)行生物學功能。通過STRING在線分析蛋白——蛋白互作關系,明確不同蛋白之間存在著較為緊密的關系(圖6),進一步選擇具有核心相互作用關系的GLRG_05787、GLRG_04512、GLRG_04171、GLRG_10567、GLRG_02030、GLRG_00022、GLRG_07391、GLRG_05683、GLRG_18008、GLRG_18009、GLRG_03657、GLRG_05394、GLRG_05322、GLRG_01849、GLRG_03748、GLRG_00376、GLRG_08672、GLRG_02620、GLRG_05948、GLRG_08500、GLRG_04939、GLRG_09992、GLRG_03678、GLRG_06302、GLRG_04841、GLRG_11173、GLRG_03011、GLRG_02235、GLRG_04562以及GLRG_05637、GLRG_06940等蛋白進行分析,結果顯示,上述蛋白存在著較為緊密的相互作用關系(圖7),該研究結果為進一步解析禾谷炭疽菌中候選GPCR蛋白的互作用關系提供重要的理論參考。
圖6 候選GPCR蛋白互作關系Fig.6 Candidate GPCR protein interaction
圖7 禾谷炭疽菌中候選GPCR蛋白互作關系分析Fig.7 Analysis of interaction between candidate GPCR proteins in C.graminicola
GPCR作為僅具有七跨膜螺旋結構域的蛋白,對細胞信號轉導具有重要作用,其會影響著真菌一系列的生理生化作用。前人對于GPCR蛋白的預測分析,僅能依靠跨膜結構域、同源比對等開展相關工作,同時,對于蛋白理化性質(zhì)、信號肽等研究也開展了諸多生物信息學分析軟件的開發(fā)利用等。本研究基于前期所獲得禾谷炭疽菌中候選GPCR蛋白序列,利用較為成熟的生物信息學分析軟件開展了上述蛋白的信號肽、理化性質(zhì)、疏水性以及保守結構域等方面的研究工作,有效地實現(xiàn)了該菌中候選GPCR蛋白性質(zhì)明確,為進一步開展該菌中GPCR蛋白找尋及功能分析提供了重要的理論支撐。
與前期所開展的蛋白生物信息學分析相比,研究較好地實現(xiàn)了GPCR蛋白的信號肽、理化性質(zhì)、疏水性和遺傳關系等特性分析,與前期利用釀酒酵母中GPCR蛋白序列為基礎根據(jù)同源序列比對情況所獲得候選GPCR相比,以及對其特性研究相比,研究較好地實現(xiàn)了全部候選GPCR蛋白的諸多特性研究,有效地解決了禾谷炭疽菌中候選GPCR蛋白的性質(zhì)不明等問題,為深入開展其他植物病原真菌中候選GPCR蛋白特性解析提供了重要的理論指導。同時,近期研究發(fā)現(xiàn)秀麗線蟲中有部分GPCR蛋白可以通過控制UPR和p38MAPK信號通路來控制免疫穩(wěn)態(tài)[25],而研究中所發(fā)現(xiàn)的候選GPCR蛋白并未與上述蛋白信號通路發(fā)生明顯關系,有待于進一步開展互作蛋白找尋及功能分析提供重要的理論支撐。在酵母中有3個GPCR蛋白,其中2個可作為激酶,1個可作為感應器[26],而對于禾谷炭疽菌中候選GPCR蛋白功能的解析,特別是蛋白互作通路方面的解析將是未來研究的重點。前人明確禾谷鐮刀菌中85個候選GPCR蛋白與其生長及產(chǎn)孢等生物過程調(diào)控密切相關,推測不同蛋白具有功能的冗余性[9],而本研究中禾谷炭疽菌中220個候選GPCR蛋白在理化性質(zhì)方面存在著諸多相似性特征,推測其也具有功能冗余性。
基于前期所獲得的220個候選GPCR蛋白,對其進行生物信息分析,明確7個具有七跨膜結構域含有信號肽的候選GPCR蛋白,多屬于中性或堿性蛋白,不穩(wěn)定性分布相對均勻且全是疏水性蛋白,同時,明確了上述候選GPCR蛋白之間存在著較為相近的親緣關系。為進一步實現(xiàn)禾谷炭疽菌中候選GPCR蛋白的功能研究提供重要的理論依據(jù),也為實現(xiàn)同屬于炭疽菌屬中核桃炭疽病菌中GPCR蛋白功能解析提供重要的理論指導。