喻紅稠,韓長志,2*
(1.西南林業(yè)大學(xué)生物多樣性保護(hù)學(xué)院,昆明 650224;2.云南省森林災(zāi)害預(yù)警與控制重點實驗室,昆明 650224)
G蛋白偶聯(lián)受體(G protein-coupled receptors,GPCR)典型的結(jié)構(gòu)特征為具有7個疏水性跨膜[1-4],該跨膜結(jié)構(gòu)域一般由7個相對保守的α跨膜螺旋和差異性較大的親水環(huán)所組成[2]。該蛋白廣泛存在于大多數(shù)真核生物中,參與多種不同的信號轉(zhuǎn)導(dǎo)途徑[5],主要負(fù)責(zé)跨細(xì)胞膜將胞外信號傳遞到胞內(nèi)區(qū)域[6-7]。同時,GPCR作為真菌中G蛋白信號途徑傳遞過程中的重要受體蛋白,參與接收外界信號,進(jìn)行內(nèi)部信號傳導(dǎo),從而實現(xiàn)真菌生長、發(fā)育、細(xì)胞增殖和凋亡過程等多種生理生化以及病理反應(yīng)[8]。
禾谷炭疽菌Colletotrichumgraminicola(Cesati)Wilson[9]作為植物病原絲狀真菌中引起許多植物炭疽病的重要病原真菌[10],可侵染玉米、小麥、高粱等禾本科植物,給世界農(nóng)業(yè)生產(chǎn)造成了巨大損失[11-14]。20世紀(jì)70年代至今,玉米炭疽病在美國、印度等國家大流行、大爆發(fā),嚴(yán)重制約著玉米產(chǎn)業(yè)的健康發(fā)展,引起了學(xué)術(shù)界普遍關(guān)注?;诖?,前人對該菌開展了全基因組測序工作[12-13],并對其碳水化合物活性酶及分泌蛋白[15]、細(xì)胞凋亡[16]、遺傳轉(zhuǎn)化[17-18]、基因敲除技術(shù)[19]、基因功能[20]、小RNA[21]、啟動子[22]等方面展開了深入研究工作。韓長志等[12-13]前期對該菌中G蛋白信號通路相關(guān)蛋白、分泌蛋白以及14-3-3蛋白和RGS蛋白等開展了諸多報道。目前,學(xué)術(shù)界對于真菌中候選GPCR的找尋,多基于模式生物釀酒酵母中GPCR蛋白同源比對及關(guān)鍵詞搜索方法,也出現(xiàn)了構(gòu)巢曲霉[23]、大豆疫霉[24]等GCPR一系列研究,為明確GPCR參與一些生理生化過程中的功能解析埋下伏筆。而關(guān)于禾谷炭疽菌的GPCR,前期明確了其僅有4個GPCR蛋白[12],顯然與該菌實現(xiàn)其半活體營養(yǎng)等過程中諸多功能存在一定的差異,也與其他真菌已報道GPCR蛋白數(shù)量存在著差異。與此同時,制約了植物病原絲狀真菌中GPCR相關(guān)蛋白的功能研究。
因此,現(xiàn)利用前人已經(jīng)報道的蛋白跨膜數(shù)量預(yù)測軟件TMHMM、Philius、TOPCONS對禾谷炭疽菌中全部蛋白中的跨膜數(shù)量進(jìn)行預(yù)測分析,并結(jié)合SMART保守結(jié)構(gòu)域分析,以期獲得該菌中候選GPCR蛋白數(shù)量,同時,對該菌中的蛋白預(yù)測功能、跨膜結(jié)構(gòu)域數(shù)量、氨基酸序列長度與蛋白數(shù)量之間的關(guān)系進(jìn)行分析,以期為今后禾谷炭疽菌候選GPCR的理化性質(zhì)分析和功能研究提供理論參考,也為后期其他炭疽菌屬真菌中GPCR蛋白的找尋研究提供方法借鑒。
禾谷炭疽菌M1.001全基因組數(shù)據(jù)來源于NCBI數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/genome/?term=Colletotrichum+graminicola+M1.001)。
1.2.1 蛋白數(shù)量與功能
通過Microsoft Excel 2010軟件對整理分析禾谷炭疽菌中的蛋白功能及氨基酸序列長度情況,并對蛋白質(zhì)功能、氨基酸序列長度與蛋白數(shù)量之間的關(guān)系進(jìn)行分析,并采用Origin 2018軟件作圖。
1.2.2 候選GPCR蛋白找尋方法
基于前期對于蛋白跨膜結(jié)構(gòu)域的預(yù)測軟件的對比分析(韓長志,未發(fā)表數(shù)據(jù)),利用TOPCONS(http://topcons.cbr.su.se/pred/)[25]、TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)[26]及Philius(http://www.yeastrc.org/philius/pages/philius/runPhilius.jsp)[27]等軟件對禾谷炭疽菌中跨膜結(jié)構(gòu)數(shù)量進(jìn)行預(yù)測,篩選出具有7個跨膜結(jié)構(gòu)域的蛋白(涉及含有7個跨膜結(jié)構(gòu)域但不含有信號肽序列或者含有信號肽序列的具有8個跨膜結(jié)構(gòu)域的蛋白)。同時,利用SMART保守結(jié)構(gòu)域預(yù)測程序(http://smart.embl.de/smart/set_mode.cgi?NORMAL=1)對上述蛋白進(jìn)行結(jié)構(gòu)分析,最終獲得禾谷炭疽菌中候選GPCR蛋白(圖1)。
圖1 技術(shù)路線Fig.1 Technical route
1.2.3 韋恩圖繪制
通過在線工具(https://bioinfogp.cnb.csic.es/tools/venny/index.html)[28]繪制韋恩圖。
2.1.1 預(yù)測功能主要為假定蛋白
通過對禾谷炭疽菌中12 020個蛋白開展功能歸類分析,結(jié)果表明,主要功能為主要促進(jìn)超家族轉(zhuǎn)運(yùn)體(major facilitator superfamily transporter)、糖基水解酶(glycosyl hydrolase)、細(xì)胞色素(cytochrome)、核糖體(ribosomal)、短鏈脫氫酶(short chain dehydrogenase)、FAD、RNA、WD結(jié)構(gòu)域蛋白(WD domain-containing protein)、ATP、甲基轉(zhuǎn)移酶(methyltransferase)、ABC、泛素(ubiquitin)、肽酶(peptidase)、假定蛋白(hypothetical protein)等類別,上述功能蛋白具有6 997個,居前三位的蛋白數(shù)量分別為5 484、251、173個,所占比例分別為45.62%、2.09%、1.44%(圖2)。同時,發(fā)現(xiàn)具有其他種類功能的蛋白數(shù)量相對較少、種類較多,有1 525種功能,總蛋白數(shù)量為5 023個,所占比例為41.79%(圖2)。上述結(jié)果表明,通過全基因組測序可以較好地實現(xiàn)蛋白功能的預(yù)測,而大多數(shù)蛋白的功能尚未得到明確,有待于進(jìn)一步通過生物學(xué)試驗進(jìn)行驗證。
圖2 禾谷炭疽菌中全部蛋白預(yù)測功能的分布情況Fig.2 Distribution of all protein prediction functions in C. graminicola
2.1.2 氨基酸長度主要集中在1 000 AA以下
禾谷炭疽菌中的蛋白氨基酸序列長度范圍為31~8 935 AA(AA代表氨基酸),首先以500 AA為區(qū)間進(jìn)行分析,結(jié)果表明,長度主要集中在1 000 AA以下,數(shù)量為11 231個,所占比例高達(dá)93.44%,而基酸長度大于1 000 AA的蛋白數(shù)量為789個,所占比例為6.56%。進(jìn)一步以100 AA為區(qū)間進(jìn)行分析,結(jié)果表明,該菌中的蛋白序列長度中主要集中在301~400 AA,數(shù)量為1 971個,所占比例為16.40%,其次為101~200、201~300、401~500、501~600 AA,數(shù)量分別為1 733、1 838、1 641、1 402個,所占比例分別為14.42%、15.29%、13.65%、11.66%(圖3)。
圖3 禾谷炭疽菌中全部蛋白氨基酸長度的分布情況Fig.3 Distribution of lengths in all proteins of C. graminicola
2.2.1 跨膜蛋白數(shù)量分析
通過TMHMM軟件分析,發(fā)現(xiàn)禾谷炭疽菌中不具有跨膜結(jié)構(gòu)域的蛋白數(shù)量較多,為9 545個,所占比例為79.41%,其次為具有1個跨膜結(jié)構(gòu)域的蛋白,數(shù)量為863個,所占比例為7.18%;同時,利用Philius軟件分析,得出該菌中不具有跨膜結(jié)構(gòu)域的蛋白數(shù)量為9 432個,所占比例為78.47%,而具有1個跨膜結(jié)構(gòu)域的蛋白數(shù)量為810個,所占比例為6.74%;此外,通過TOPCONS軟件分析,得出該菌中不具有跨膜結(jié)構(gòu)域的蛋白數(shù)量為9 191個,所占比例為76.46%,而具有1個跨膜結(jié)構(gòu)域的蛋白數(shù)量為889個,所占比例為7.40%(圖4)。通過上述三種跨膜結(jié)構(gòu)數(shù)量預(yù)測軟件分析,明確不同預(yù)測軟件所獲得的不同跨膜結(jié)構(gòu)域的蛋白數(shù)量大致相同(圖4)。
圖4 三種預(yù)測軟件預(yù)測跨膜數(shù)量情況對比分析Fig.4 Comparison of the number of transmembrane based on three kinds of prediction software
2.2.2 具有七跨膜結(jié)構(gòu)蛋白數(shù)量分析
通過三種分析軟件預(yù)測,明確禾谷炭疽菌中含有七跨膜結(jié)構(gòu)域的蛋白數(shù)量為243個,其中,通過TMHMM分析,具有七跨膜結(jié)構(gòu)不含信號肽蛋白數(shù)量為143個,具有八跨膜結(jié)構(gòu)含信號肽蛋白數(shù)量為6個,共計149個;通過Philius分析,具有七跨膜結(jié)構(gòu)不含信號肽蛋白數(shù)量為145個,具有八跨膜結(jié)構(gòu)含信號肽蛋白數(shù)量為3個,共計148個;通過TOPCONS分析,具有七跨膜不含信號肽蛋白數(shù)量為169個,具有八跨膜結(jié)構(gòu)含信號肽蛋白數(shù)量為4個,共計173個(表1)。
表1 含有七跨膜結(jié)構(gòu)蛋白的數(shù)量分布情況Table 1 The number distribution of proteins containing seven transmembrane structures
進(jìn)一步對上述三種軟件所獲得的跨膜蛋白進(jìn)行分析,結(jié)果表明:共同具有的蛋白數(shù)量為82個,僅由TMHMM和Philius分析,共同得出89個蛋白;僅由TMHMM和TOPCONS分析,共同得出92個蛋白;僅由Philius和TOPCONS分析,共同得出128個蛋白。同時,50個蛋白僅由TMHMM軟件預(yù)測得到,13個蛋白僅由Philius軟件預(yù)測得到,35個蛋白僅由TOPCONS軟件預(yù)測得到(圖5)。
圖5 三種跨膜結(jié)構(gòu)分析軟件預(yù)測跨膜蛋白數(shù)量分布情況Fig.5 The distribution of the number of transmembrane proteins based on three kinds of transmembrane structure analysis software
2.2.3 保守結(jié)構(gòu)域分析
進(jìn)一步利用SMART保守結(jié)構(gòu)域在線分析,結(jié)果表明,在243個候選GPCR中,不具有明顯保守結(jié)構(gòu)域的蛋白數(shù)量為220個,具有明顯保守結(jié)構(gòu)域的蛋白數(shù)量為23個,可以分為10類,所涉及的保守結(jié)構(gòu)域為CTNS、TLC、RING、WD40、TRP_N、Cation ATPaes_N、Solute_trans_a、acidPPc、Bac_rhodopsin和PSN(圖6),最終明確禾谷炭疽菌中具有的候選GPCR蛋白數(shù)量為220個,其蛋白ID為XP_008088898.1、XP_008088940.1、XP_008088990.1、XP_008089108.1、XP_008089111.1、XP_008089154.1、XP_008089168.1、XP_008089252.1、XP_008089256.1、XP_008089263.1、XP_008089306.1、XP_008089347.1。
圖6 保守結(jié)構(gòu)域情況Fig.6 Conserved domains
進(jìn)一步對上述所篩選出的220個候選GPCR蛋白的預(yù)測功能進(jìn)行分析,發(fā)現(xiàn)上述蛋白多集中在假定蛋白,數(shù)量為97個,所占比例為44.09%,其次為整合膜蛋白、鐵還原酶類跨膜組分,數(shù)量分別為28、10個,所占比例為12.73%、4.55%(圖7)。還有RTA1類蛋白、幾丁質(zhì)合成酶、ZIP鋅轉(zhuǎn)運(yùn)體、含CFEM結(jié)構(gòu)域蛋白、主要促進(jìn)超家族轉(zhuǎn)運(yùn)體的蛋白等,其數(shù)量分別為7、6、6、5、5個,所占比例分別為3.18%、2.73%、2.73%、2.27%、2.27%(圖7)。
圖7 候選GPCR蛋白預(yù)測功能與數(shù)量的分布情況Fig.7 The distribution of predictive function and number of candidate GPCR proteins
GPCR作為重要的聯(lián)系生物內(nèi)外信號的蛋白,其典型特征是具有七跨膜結(jié)構(gòu)域,在真菌生長發(fā)育、信息傳遞以及侵染等過程中發(fā)揮著重要作用。鑒于GPCR人工結(jié)晶存在諸多困難以及結(jié)構(gòu)解析存在費(fèi)用較大等問題,學(xué)術(shù)界開發(fā)了諸多用于GPCR膜蛋白預(yù)測及分析的數(shù)據(jù)庫和軟件,為高效實現(xiàn)生物中GPCR的找尋及結(jié)構(gòu)分析提供了重要的工具支撐。然而,就真菌中GPCR預(yù)測而言,由于缺少明確的保守結(jié)構(gòu)域,前人對其預(yù)測多采用模式生物釀酒酵母同源比對及關(guān)鍵詞搜索等方法[12],嚴(yán)重影響著對其功能的深入解析。對于真菌中GPCR蛋白的預(yù)測分析,按照一種預(yù)測分析軟件開展,影響到候選GPCR蛋白的找尋數(shù)量準(zhǔn)確性。因此,無論是利用模式真菌中GPCR開展同源比對及關(guān)鍵詞搜索,還是采用某一種跨膜結(jié)構(gòu)域預(yù)測分析,都容易產(chǎn)生假陽性問題和真正GPCR蛋白遺漏等問題。
近期研究指出,GPCR蛋白含有一段信號肽序列,可以引導(dǎo)真核生物和原核生物中幾乎所有蛋白質(zhì)的分泌[29]。這為進(jìn)一步解析GPCR蛋白功能以及找尋候選GPCR蛋白提供了特征依據(jù)。結(jié)合了GPCR所具有的典型七跨膜蛋白數(shù)量特征以及信號肽序列特征,按照具有七跨膜結(jié)構(gòu)特征而不含有信號肽序列以及具有八跨膜結(jié)構(gòu)域且含有信號肽序列進(jìn)行篩選。同時,隨著人們不斷地對真菌或卵菌中GPCR研究的不斷深入,發(fā)現(xiàn)了一些新型GPCR,在跨膜結(jié)構(gòu)數(shù)量方面含有5~9個跨膜結(jié)構(gòu)域[24],在保守結(jié)構(gòu)域方面含有CFEM等[30]。這為未來進(jìn)一步開展GPCR蛋白找尋提供了重要的特征依據(jù)。
根據(jù)經(jīng)典GPCR中含有七跨膜結(jié)構(gòu)域特征,通過TOPCONS、TMHMM和Philius三種跨膜結(jié)構(gòu)域分析軟件,對禾谷炭疽菌中具有七跨膜結(jié)構(gòu)域的蛋白進(jìn)行篩選,再通過SMART保守結(jié)構(gòu)域分析,最終明確禾谷炭疽菌中具有243個蛋白含有七跨膜結(jié)構(gòu)域,其中23個蛋白具有明顯的保守結(jié)構(gòu)域,220個蛋白為候選GPCR,其功能主要集中在假定蛋白,氨基酸序列長度主要集中在301~400 AA。隨著人們對于真菌中GPCR蛋白跨膜結(jié)構(gòu)數(shù)量預(yù)測準(zhǔn)確性的不斷提高,特別是采用生物學(xué)試驗驗證方法,可以較為準(zhǔn)確地知曉禾谷炭疽菌中GPCR的數(shù)量及功能。研究為進(jìn)一步開展禾谷炭疽菌中候選GPCR蛋白的理化性質(zhì)分析和功能提供重要的理論依據(jù),也對進(jìn)一步開展其他炭疽菌等植物絲狀病原真菌中候選GPCR蛋白找尋研究具有重要的借鑒意義。