韓長志
(西南林業(yè)大學(xué) a.林學(xué)院;b.云南省森林災(zāi)害預(yù)警與控制重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650224)
禾谷炭疽菌(Colletotrichumgraminicola(Cesati) Wilson)可以侵染玉米、小麥、高粱、燕麥等禾本科植物引起炭疽病,給農(nóng)業(yè)生產(chǎn)造成巨大的經(jīng)濟(jì)損失[1-2].該病菌屬于半活體營養(yǎng)型[3],具有諸如銹菌、白粉病菌等活體營養(yǎng)型病菌和如灰霉菌、油菜菌核病菌等死體營養(yǎng)型病菌的特征.活體營養(yǎng)型病菌可以通過形成的吸器分泌效應(yīng)分子(effector),從而抑制植物防衛(wèi)反應(yīng),來獲得寄主植物活體營養(yǎng)階段[4].效應(yīng)分子是指病原菌中那些由無毒基因所編碼的蛋白,這是鑒于人們對病原菌無毒基因研究的不斷深入,發(fā)現(xiàn)由無毒基因編碼的蛋白或者被攜帶相應(yīng)抗病基因的植物識別而表現(xiàn)無毒功能,或者不被未攜帶相應(yīng)抗病基因的植物識別而表現(xiàn)毒性功能,故稱之為效應(yīng)分子[5-6].
眾多病原菌全基因組測序的完成[7],為深入開展生物信息學(xué)分析以及研究相關(guān)致病基因提供了重要的數(shù)據(jù)基礎(chǔ).通過對一些病原卵菌、真菌的生物信息學(xué)分析,已經(jīng)明確其存在著大量效應(yīng)分子.卵菌中的大豆疫霉(PhytophthorasojaeKaufmann & Gerdemann)和橡樹疫霉(PhytophthoraramorumWerres, De Cock & Man in’t Veld)均存在著含有350個(gè)左右的保守RXLR-dEER(R,精氨酸;X,任何氨基酸;L,亮氨酸;d,天冬氨酸;E,谷氨酸)基序(motif)的超級家族[8].真菌中的稻瘟菌(MagnaportheoryzaeB. Couch sp. nov.)中也存在162個(gè)含有LXAR(L,亮氨酸;X,任何氨基酸;A,丙氨酸;R,精氨酸)基序的效應(yīng)分子[9-10],禾谷鐮刀菌(FusariumgraminearumSchw.)中存在157個(gè)含有RXLR基序的效應(yīng)分子[11],楊生褐盤二孢菌(Marssoninabrunneaf.sp. multigermtubi)含有106個(gè)效應(yīng)分子[12].研究發(fā)現(xiàn),效應(yīng)分子屬于分泌蛋白,RXLR基序作為寄主定位信號在P.sojae外泌蛋白進(jìn)入寄主細(xì)胞的過程中起著關(guān)鍵作用[13],另外,明確P.sojae、P.ramorum以及寄生霜霉(Hyaloperonosporaparasitica(Pers.)Constant)所含有的效應(yīng)分子處于正向選擇壓力條件下,其C端區(qū)域用于操縱植物的防衛(wèi)反應(yīng),而N端保守區(qū)域則具有分泌和定位于寄主體內(nèi)等功能[14].就效應(yīng)分子所具有的功能而言,其在病菌侵染過程中發(fā)揮著重要的作用[15],已經(jīng)明確植物病原卵菌RxLR效應(yīng)分子功能還具有多樣性、冗余性等特點(diǎn),即具有抑制Bax誘導(dǎo)的細(xì)胞死亡(Bax Trigged Progress Cell Death, BT-PCD)功能、抑制病原菌相關(guān)分子模式引發(fā)的免疫反應(yīng)(PAMP Trigged Immunity, PTI)、效應(yīng)分子引發(fā)的免疫反應(yīng)(Effector Trigged Immunity, ETI)功能、誘導(dǎo)細(xì)胞死亡等功能[16].此外,已經(jīng)明確P.sojae利用眾多RXLR效應(yīng)分子的程式化轉(zhuǎn)錄和功能互補(bǔ),通過協(xié)同作用來協(xié)同操縱植物防衛(wèi)反應(yīng)的PTI和ETI兩個(gè)層面[17-18],因此,這些植物病原卵菌存在的眾多效應(yīng)分子處于快速“誕生和死亡”的變化中[19],從而更好地操控對寄主植物的侵染,以利于其完成侵染、定殖和擴(kuò)展等過程.與植物病原卵菌RXLR效應(yīng)分子相似,植物病原真菌LXAR效應(yīng)分子也具有抑制Bax誘導(dǎo)的細(xì)胞死亡和誘導(dǎo)細(xì)胞死亡等功能[10].盡管在植物病原卵菌、真菌中存在的效應(yīng)分子數(shù)量、motif等不盡相同,但是已證明存在于P.sojae、瘧原蟲以及亞麻銹菌中的效應(yīng)分子均可以通過與磷脂酰肌醇結(jié)合而介導(dǎo)病原菌進(jìn)入寄主細(xì)胞[20],從而發(fā)揮操控寄主植物防衛(wèi)反應(yīng)的作用.
隨著禾谷炭疽菌全基因組序列的釋放,對其進(jìn)行基因組及轉(zhuǎn)錄組的分析,基于所預(yù)測的胞外蛋白與炭疽菌屬其他任何蛋白沒有同源性而推測出其含有177個(gè)候選效應(yīng)分子(Candidate effector, CE),其中85個(gè)為該菌所特有,其他則為炭疽菌屬特有[21].目前,對于這些CE的準(zhǔn)確性尚不清楚,本研究以禾谷炭疽菌中所含的177個(gè)CE氨基酸序列為基礎(chǔ)數(shù)據(jù),結(jié)合其他病原菌中已報(bào)道效應(yīng)分子所具有的特征(①氨基酸序列長度為50~300 aa;②含有信號肽;③不含跨膜區(qū)域;④富含半胱氨酸;⑤具有高度序列特異性.)[12,14],對上述CE進(jìn)行評測,并通過生物信息學(xué)軟件及在線分析網(wǎng)站對其保守結(jié)構(gòu)域進(jìn)行分析.
利用炭疽菌屬蛋白質(zhì)數(shù)據(jù)庫(http://www.broadinstitute.org/annotation/genome/colletotrichum_group/Multi Home.html)數(shù)據(jù)獲取禾谷炭疽菌的全蛋白質(zhì)數(shù)據(jù).
選擇前期已報(bào)道的177個(gè)CE的氨基酸序列作為后續(xù)研究的基礎(chǔ)數(shù)據(jù),其ID為,GLRG_00026、00039、00085、00249、00416、00784、00841、00850、00965、01009、01031、01037、01041、01042、01190、01602、01698、01722、01735、01793、01794、01852、01863、02113、02456、02464、02892、03021、03429、03437、03571、03573、03575、03626、03688、03869、04013、04558、04707、04750、04830、04877、04945、05522、05597、05701、05703、06052、06086、06187、06222、06509、06513、06527、06559、06726、06820、06861、06871、07140、07158、07239、07504、07580、07719、07736、07776、08117、08189、08235、08359、08553、08566、08592、08861、09086、09111、09313、09337、09545、09609、09801、09902、09910、10010、10126、10232、10269、10505、10719、10742、10803、10917、10977、11015、11092、11207、11223、11273、11645、11659、11781、11848、11923、11926、11948、11964、11965、11979、11993、00783、00911、01043、01189、01867、02539、02641、02757、04505、04799、05598、05950、06311、07383、08163、08177、08374、08901、08991、09582、09685、09780、09822、10738、11446、11682、00111、00192、01617、01684、01848、01884、02111、02282、02390、03416、03457、04199、04442、04552、04705、04995、05085、05496、05525、05951、06081、06996、07105、07347、07523、07720、08273、08507、09500、09534、09576、09740、10474、11219、11227、11228、11231、11234、11257、11671、11743.
1.2.1 基本特征
根據(jù)前期已經(jīng)報(bào)道的效應(yīng)分子所具有的特征①④情況,首先,對禾谷炭疽菌中177個(gè)CE所含氨基酸的數(shù)量情況進(jìn)行分類,同時(shí),獲得不同CE所具有的半胱氨酸(Cystine, cys)的含量情況,篩選用于后續(xù)研究的效應(yīng)分子.
1.2.2 信號肽預(yù)測分析
根據(jù)效應(yīng)分子所具有的特征②情況,對禾谷炭疽菌中177個(gè)CE進(jìn)行信號肽(signal peptide)預(yù)測,即利用SignalP 3.0 Server[27]在線分析實(shí)現(xiàn)(http://www.cbs.dtu.dk/services/SignalP-3.0/),以期對CE的準(zhǔn)確性進(jìn)行評價(jià).在線預(yù)測信號肽使用神經(jīng)網(wǎng)絡(luò)方法(Neural Networks, NN)和隱馬可夫模型(Hidden Markov Models, HMM)進(jìn)行操作,而兩種算法所得結(jié)果有所差別.
1.2.3 跨膜區(qū)結(jié)構(gòu)預(yù)測分析
根據(jù)效應(yīng)分子所具有的特征③情況,對禾谷炭疽菌中177個(gè)CE進(jìn)行跨膜區(qū)結(jié)構(gòu)預(yù)測,利用TMHMM Server v. 2.0實(shí)現(xiàn)(http://www.cbs.dtu.dk/services/TMHMM-2.0/)[27].
1.2.4 效應(yīng)分子保守結(jié)構(gòu)域分析
利用SMART website (http://smart.embl-heidelberg.de/)在線對禾谷炭疽菌中效應(yīng)分子進(jìn)行結(jié)構(gòu)預(yù)測.
禾谷炭疽菌中177個(gè)CE所含有的氨基酸數(shù)量不盡相同,范圍在51~1 135之間,按照50個(gè)氨基酸作為分類單元進(jìn)行分類,結(jié)果顯示,大部分CE所含氨基酸數(shù)量在51~200之間,所占比例為67.80%,其中以含有51~100氨基酸的CE居多,所占比例為24.86%,其次為含有101~150氨基酸的CE,所占比例為23.73%,見圖1.氨基酸數(shù)量在201~300之間的CE,所占比例為18.64%,上述含有從51到300氨基酸數(shù)量的CE為153個(gè),所占比例為86.44%.
圖1 禾谷炭疽菌CE所含氨基酸數(shù)量分布情況Fig.1 The distribution of CE in C. graminicola based on the number of amino acids
對177個(gè)CE進(jìn)行Cys殘基含量情況進(jìn)行統(tǒng)計(jì),結(jié)果顯示,30個(gè)CE不含有Cys,所占比例為16.95%,所含Cys殘基含量從1個(gè)到23個(gè)不等,但以含有2、4、6個(gè)CE數(shù)量居多,所占比例分別為14.69%、12.99%、12.99%,見圖2.
圖2 禾谷炭疽菌CE所含Cys殘基數(shù)量分布情況Fig.2 The distribution of Cys residues contained in CE in C. graminicola
通過SignalP 3.0在線分析,結(jié)果表明,在177個(gè)CE中,有136個(gè)含有信號肽,所占比例為76.84%,對其進(jìn)一步分析發(fā)現(xiàn),NN和HMM所預(yù)測結(jié)果并不完全相同,主要表現(xiàn)在所預(yù)測信號肽的切割位置方面,其中,有110個(gè)CE經(jīng)NN和HMM所預(yù)測的信號肽位置相同,占比例為62.15%,還有26個(gè)CE由NN和HMM所預(yù)測的信號肽的切割位置不相同,占比例為14.69%,見圖3.上述結(jié)果說明,前期報(bào)道的177個(gè)CE中僅有136個(gè)具有明顯的信號肽序列,其余41個(gè)不具有信號肽序列,這些不具有信號肽序列的CE與效應(yīng)分子所具有的特征②明顯相反,因此,后續(xù)選擇136個(gè)CE進(jìn)行深入分析,以期為更好地解析效應(yīng)分子的motif以及功能研究打下堅(jiān)實(shí)的理論基礎(chǔ).
圖3 禾谷炭疽菌CE所含信號肽預(yù)測情況Fig.3 The prediction of signal peptide contained in CE in C. graminicola
通過TMHMM Server v. 2.0在線分析,結(jié)果表明,在177個(gè)CE中,41個(gè)含有跨膜區(qū)結(jié)構(gòu),所占比例為23.16%,其中含有跨膜區(qū)數(shù)量最多的為6個(gè),其ID為GLRG_07158;含有跨膜區(qū)數(shù)量為2個(gè)的CE有7個(gè),含有跨膜區(qū)數(shù)量為1個(gè)的33個(gè),所占比例分別為3.95%、18.64%,見圖4.根據(jù)效應(yīng)分子所具有的特征③情況,選擇136個(gè)不含跨膜區(qū)結(jié)構(gòu)的CE進(jìn)行分析,以期明確禾谷炭疽菌中含有的效應(yīng)分子.
圖4 禾谷炭疽菌CE所含跨膜區(qū)結(jié)構(gòu)預(yù)測情況Fig.4 The prediction of transmembrane regions contained in CE in C. graminicola
結(jié)合病原菌效應(yīng)分子所具有的典型特征①②③④,通過上述分析,從177個(gè)CE中進(jìn)行篩選,首先依據(jù)特征②,對不含有信號肽的CE進(jìn)行剔除;其次,依據(jù)特征③,對含有跨膜區(qū)結(jié)構(gòu)的CE進(jìn)行剔除;再次,根據(jù)特征①,對大于400 aa的CE進(jìn)行剔除(盡管效應(yīng)分子典型特征①為50~300 aa,而大豆疫霉效應(yīng)分子的氨基酸大小一般小于400,故此處以400 aa作為標(biāo)準(zhǔn).),同時(shí),結(jié)合特征④,最終明確禾谷炭疽菌中含有82個(gè)典型的效應(yīng)分子(表1)和20個(gè)有待于進(jìn)一步試驗(yàn)驗(yàn)證的效應(yīng)分子(數(shù)據(jù)未顯示).
通過對82個(gè)典型效應(yīng)分子進(jìn)行SMART分析,結(jié)果顯示,并沒有發(fā)現(xiàn)與之前報(bào)道蛋白有關(guān)的保守區(qū)域,這與其他病原菌中的效應(yīng)分子所具有的序列高度特異性相一致,這也符合效應(yīng)分子的典型特征⑤.
表1 禾谷炭疽菌82個(gè)典型效應(yīng)分子基本信息Tab.1 The basics features of 82 typical effectors in C. graminicola
續(xù)表1
序列號ID基本特征信號肽氨基酸長度/aa富含Cys數(shù)量/個(gè)?位置切割位點(diǎn)跨膜區(qū)數(shù)量GLRG_06509180216-17AMA-SP0GLRG_06513301518-19VSA-QG0GLRG_06527281621-22SQA-RP0GLRG_0687162817-18VAS-SP0GLRG_07140274419-20ANG-AP0GLRG_07239122217-18VLA-AP0GLRG_0750455120-21REA-WE0GLRG_0758098819-20VQA-CD0GLRG_07736103120-21VVA-LP0GLRG_0777668620-21VYA-QI0GLRG_08117137619-20TSA-KP0GLRG_08163116824-25ACA-LY0GLRG_08235200120-21VLA-LP0GLRG_08359219619-20VNA-QA0GLRG_08374289116-17VSG-LS0GLRG_08566278218-19VPA-QP0GLRG_0859272318-19SLA-AP0GLRG_08861164618-19TSA-SL0GLRG_089913471225-26AAA-NI0GLRG_09337146420-21VVS-AP0GLRG_09545168617-18ASA-KN0GLRG_0960997421-22ASA-FS0GLRG_0968560418-19AAA-AG0GLRG_09801298318-19VAG-KV0GLRG_09822108821-22ACA-KY0GLRG_099022241217-18VLA-QS0GLRG_099101891017-18ALA-SR0GLRG_10126106120-21VQA-AP0GLRG_1023269417-18VSA-DY0GLRG_10505233120-21VQC-AV0GLRG_10719168622-23AAA-SG0GLRG_10803160319-20VAA-VN0GLRG_10977128322-23GSA-LS0GLRG_1101560315-16IRG-TW0GLRG_11092152325-26SEA-KI0GLRG_11273111818-19SLS-SQ0GLRG_11645200420-21ALT-AP0GLRG_1165981740-41VAA-QS0GLRG_11682120325-26TDA-FE0GLRG_11923249225-26VLS-TP0GLRG_1196490618-19VQA-TC0GLRG_11965113225-26AKA-MP0GLRG_119931901019-20SLA-AV0
*注:效應(yīng)分子多數(shù)富含半胱氨酸,但也有特例情況.
本研究基于前期已報(bào)道的禾谷炭疽菌中177個(gè)CE氨基酸序列數(shù)據(jù),結(jié)合已經(jīng)報(bào)道病原菌效應(yīng)分子所具有的5個(gè)典型特征,利用生物信息學(xué)方法對該菌所含的CE進(jìn)行評測,結(jié)果發(fā)現(xiàn)該菌含有82個(gè)典型效應(yīng)分子,為進(jìn)一步開展效應(yīng)分子motif找尋以及功能研究打下了堅(jiān)實(shí)的理論基礎(chǔ).同時(shí),還發(fā)現(xiàn)20個(gè)CE具有效應(yīng)分子典型特征①②③⑤,而缺少半胱氨酸殘基,不符合效應(yīng)分子典型特征④,有待于后續(xù)試驗(yàn)進(jìn)一步進(jìn)行驗(yàn)證.利用SMART在線分析網(wǎng)站,并未發(fā)現(xiàn)禾谷炭疽菌中82個(gè)典型效應(yīng)分子與已知蛋白具有相似的保守結(jié)構(gòu)域.另外,MEME(multiple Em for Motif Elicitation)作為在線分析蛋白質(zhì)motif的工具,為找尋禾谷炭疽菌中典型效應(yīng)分子的保守結(jié)構(gòu)域提供了可能.值得一提的是,前期利用SignalP、ProtComp、TMHMM、big-PI Fungal Predictor和TargetP已經(jīng)完成對該菌分泌蛋白預(yù)測工作,明確有630個(gè)分泌蛋白存在于該菌中[23],為進(jìn)一步篩選CE提供了重要數(shù)據(jù)基礎(chǔ).
此外,本研究所采用的氨基酸數(shù)據(jù)均來自于炭疽菌屬蛋白質(zhì)數(shù)據(jù)庫,而從數(shù)據(jù)庫中獲得的CE所含有的氨基酸數(shù)量與已經(jīng)報(bào)道的CE的氨基酸數(shù)量之間存在著差異,通過對比分析,發(fā)現(xiàn)177個(gè)中有101個(gè)CE不同,所占比例為57.06%,因此,這些CE的氨基酸數(shù)量有待于后期通過試驗(yàn)進(jìn)一步明確.
對已完成的植物病原菌全基因組序列進(jìn)行生物信息學(xué)分析,并結(jié)合生物學(xué)試驗(yàn)的進(jìn)一步驗(yàn)證,極大地推動了對病原菌致病基因、效應(yīng)分子功能等研究工作.同樣,對大豆疫霉、致病疫霉等植物病原卵菌RxLR效應(yīng)分子以及稻瘟菌LXAR效應(yīng)分子的功能研究,極大地豐富了效應(yīng)分子所具有的抑制BT-PCD、抑制PTI、ETI功能以及誘導(dǎo)細(xì)胞死亡、協(xié)同作用調(diào)控植物防衛(wèi)反應(yīng)等功能的試驗(yàn)數(shù)據(jù),極大地促進(jìn)了對其他病菌效應(yīng)分子的功能研究,而本研究無疑也為進(jìn)一步明確禾谷炭疽菌的效應(yīng)分子motif以及所具有的功能冗余性和多樣性特點(diǎn)起到重要的理論支撐作用.