夏宏林 何 穎 鄒澤紅 陶愛林 (廣州醫(yī)學(xué)院第二附屬醫(yī)院/呼吸疾病國家重點實驗室變態(tài)反應(yīng)研究室/過敏反應(yīng)與臨床免疫重點實驗室,廣州510260)
蘋果屬于薔薇科植物,因其豐富的營養(yǎng)物質(zhì)以及愉悅的風(fēng)味而被人們推薦為健康食品,雖然是一種健康食品,但在部分人群中會引起過敏反應(yīng)。據(jù)統(tǒng)計,歐洲大約有200萬人口對薔薇科水果過敏[1,2]。蘋果過敏主要臨床癥狀表現(xiàn)為口腔過敏綜合征、皮膚瘙癢、哮喘、蕁麻疹及過敏性鼻炎等,嚴(yán)重時可導(dǎo)致過敏性休克,甚至危及生命安全[2,3]。
蘋果過敏原主要有4種,Mald4蛋白是蘋果主要過敏原之一,在烘烤或經(jīng)胃腸道消化等條件下,理化性質(zhì)不穩(wěn)定。該過敏原蛋白與樺樹花粉過敏原Bet v 2有很高的同源性,存在交叉反應(yīng),10% ~20%蘋果過敏患者血清的前纖維蛋白能與樺樹過敏患者血清中的IgE結(jié)合,在免疫交叉反應(yīng)中前纖維蛋白扮演非常重要的角色[4]。引起免疫交叉反應(yīng)的物質(zhì)基礎(chǔ)是抗原表位(Antigenic epitope),分為線性表位和構(gòu)象表位,其中T細(xì)胞僅能識別抗原遞呈細(xì)胞加工處理的線性表位,B細(xì)胞則可識別線性或構(gòu)象表位[5]。
目前對蛋白抗原表位預(yù)測主要集中在B細(xì)胞單參數(shù)預(yù)測,有一定的局限性,為此我們引入多參數(shù)綜合預(yù)測分析B/T細(xì)胞抗原表位,以便提高預(yù)測的準(zhǔn)確性[6,7]。通過對蘋果 Mald4蛋白 B/T細(xì)胞抗原表位預(yù)測及同源序列空間構(gòu)象對比,尋找含有相同/相似優(yōu)勢抗原表位區(qū)域位點,預(yù)測目的蛋白與其同源蛋白之間的交叉反應(yīng)性,為我們以后利用基因突變技術(shù)改造蘋果Mald4蛋白及其同源蛋白的過敏原性提供了理論依據(jù)。
1.1 材料 蘋果Mald4蛋白(GenBank登錄號Q9XF41.1),其氨基酸序列為:MSWQAYVDDHLMCEIEGNHLSAAAIIGHNGSVWAQSATFPQLKPEEVTGIMNDFNEPGSLAPTGLYLGGTKYMVIQGEPGVVIRGKKGPGGVTVKKSTMALLIGIYDEPMTPGQCNMVVERLGDYLIEQGL。
1.2 方法
1.2.1 Mald4蛋白二級結(jié)構(gòu)預(yù)測及特性分析 利用在線分析軟件HNN對蘋果Mald4蛋白結(jié)構(gòu)進(jìn)行預(yù)測。運(yùn)用SignaIP 3.0和TMHMM在線軟件分析該蛋白氨基酸序列信號肽和跨膜區(qū)域(表1)。
1.2.2 Mald4蛋白B/T細(xì)胞抗原表位預(yù)測 運(yùn)用Bcepred在線軟件預(yù)測B細(xì)胞抗原表位,選取親水性好、抗原性強(qiáng)、可塑性好、分子可及性高的片段作為候選表位。采用DNAStar Protean軟件對目的蛋白抗原表位進(jìn)行預(yù)測,根據(jù)Kyte-Doolittle方案、Emini方案、Karplus-Schulz方案和 Jameson-Wolf方案,分別預(yù)測其蛋白的親水性、可及性、可塑性和抗原指數(shù)。在預(yù)測4種單參數(shù)中,取至少三個以上參數(shù)重疊區(qū)作為B細(xì)胞抗原表位候選區(qū)域。對上述二種軟件預(yù)測結(jié)果綜合分析,并兼顧二級結(jié)構(gòu)各參數(shù),避免α-螺旋區(qū),確定Mald4蛋白B細(xì)胞抗原表位區(qū)域;綜合運(yùn)用網(wǎng)絡(luò)服務(wù)器NetMHCⅡ、NetMHCⅡpan、Propred、Syfpeithi預(yù)測能與MHCⅡ類分子結(jié)合的外源性抗原肽,選取9個滑動抗原肽,預(yù)測T細(xì)胞抗原表位親和力[8-10]。
表1 生物信息學(xué)在線軟件Tab.1 Bioinformatics online software
以上述預(yù)測Mald4蛋白B細(xì)胞抗原表位區(qū)域參數(shù)為基礎(chǔ),結(jié)合T細(xì)胞抗原表位預(yù)測結(jié)果,獲得B/T細(xì)胞共同抗原表位優(yōu)勢區(qū)域[11]。
1.2.3 Mald4蛋白抗原表位免疫交叉反應(yīng)預(yù)測利用NCBI數(shù)據(jù)庫的Blastp工具,搜索與蘋果Mald4蛋白同源性高的前纖維蛋白序列,運(yùn)用Clustal X1.83軟件對其同源蛋白氨基酸序列進(jìn)行比對分析,并采用Mega 3.1軟件中的N-J法構(gòu)建進(jìn)化樹。利用Swiss-Model在線軟件,對Mald4蛋白與其同源蛋白氨基酸序列空間結(jié)構(gòu)進(jìn)行對比,預(yù)測它們之間可能發(fā)生交叉反應(yīng)的空間位點。
2.1 Mald4蛋白二級結(jié)構(gòu)預(yù)測及信號肽、跨膜區(qū)分析 運(yùn)用HNN在線軟件預(yù)測Mald4蛋白,結(jié)果顯示以無規(guī)則卷曲為主,分布在11個區(qū)域,高達(dá)53.44%;α-螺旋集中在 4 個區(qū)域,占 19.08%;伸展鏈主要分布在7個區(qū)域,占27.48%(表2)。利用在線軟件SignaIP 3.0分析Mald4蛋白的氨基酸序列,結(jié)果顯示該蛋白無信號肽。采用TMHMM軟件對Mald4蛋白跨膜區(qū)進(jìn)行預(yù)測,發(fā)現(xiàn)具有131個氨基酸殘基的Mald4蛋白無跨膜區(qū)。
2.2 Mald4蛋白的B細(xì)胞抗原表位預(yù)測 通過Bcepred在線軟件對Mald4蛋白相關(guān)參數(shù)進(jìn)行預(yù)測,結(jié)果顯示該蛋白B細(xì)胞抗原表位區(qū)域為40~46、53~61、85~95、107 ~113(表 3)。使用 DNAStar Protean軟件對Mald4蛋白相關(guān)參數(shù)進(jìn)行預(yù)測,結(jié)果表明B細(xì)胞抗原表位的區(qū)域為16~18、40~48、52~61、85~95、107~114(表4)。綜合上述2種方法預(yù)測B細(xì)胞抗原表位區(qū)域參數(shù),并兼顧二級結(jié)構(gòu)各參數(shù)預(yù)測結(jié)果,確定Mald4蛋白B細(xì)胞優(yōu)勢抗原表位區(qū)域為40~46、53~61、85~95、107~113。
表2 HNN預(yù)測Mald4二級結(jié)構(gòu)結(jié)果Tab.2 The result of Mald4 secondary structure predicted by HNN
2.3 T細(xì)胞抗原表位的預(yù)測 利用網(wǎng)絡(luò)服務(wù)器Propred和Syfpeithi對Mald4蛋白T細(xì)胞抗原表位親和力進(jìn)行預(yù)測,結(jié)果顯示親和力高的評分區(qū)域為2~5、49~93(圖1);運(yùn)用 NetMHCⅡ、NetMHCⅡpan軟件對Mald4蛋白T細(xì)胞抗原表位進(jìn)行預(yù)測,結(jié)果發(fā)現(xiàn)40~43、51~62、76~93、105~112為 T細(xì)胞抗原表位優(yōu)勢區(qū)域(圖2)。綜合上述T細(xì)胞表位預(yù)測結(jié)果,確定其T細(xì)胞共同抗原表位優(yōu)勢區(qū)域為51~62和76~93。
2.4 B細(xì)胞和T細(xì)胞抗原表位綜合分析 結(jié)合上述Mald4蛋白B細(xì)胞與T細(xì)胞抗原表位預(yù)測結(jié)果,對二者的重疊區(qū)域進(jìn)行擬合分析,確定Mald4蛋白B/T細(xì)胞共同表位優(yōu)勢區(qū)域為53~61和85~93。
2.5 Mald4蛋白抗原表位對比交叉反應(yīng)預(yù)測分析 以蘋果Mald4蛋白氨基酸序列為基礎(chǔ),經(jīng)NCBIBlastP分析,并運(yùn)用Cluster X1.83軟件對其同源序列進(jìn)行比對,結(jié)果顯示蘋果Mald4蛋白與桃Pru p 4(Q8GT39.1)、甜櫻桃 Pru du 4(ACE80972)、草莓Fra a 4(POCOY3.1)、芒果 Man i3(ABD62998)的氨基酸序列同源性分別為95%、95%、91%、88%,都屬于前纖維蛋白家族(Profilin family),而蘋果Mald4蛋白的抗原表位優(yōu)勢區(qū)域53~61和85~93,在這幾者之間是高度保守的(圖3),因此它們之間發(fā)生交叉反應(yīng)的概率很高。采用Mega 3.1軟件構(gòu)建系統(tǒng)進(jìn)化樹,發(fā)現(xiàn)有二個明顯的分支,桃Pru p 4和甜櫻桃Pru du 4前纖維蛋白首先聚在一組,然后與蘋果Mald4、芒果Man i3、草莓Fra a 4前纖維蛋白聚在一起(圖4)。進(jìn)化比對發(fā)現(xiàn),蘋果Mald4處于核心地位,與桃Pru p 4和甜櫻桃Pru du 4中前纖維蛋白親緣關(guān)系較近,具有較高保守遺傳穩(wěn)定性和演化趨同性,表明它們之間可能存在相似的功能。
表3 Bcepred預(yù)測Mald4蛋白B細(xì)胞表位Tab.3 Prediction results of the Mald4 B cell epitopes with Bcepred
表4 DNAStar預(yù)測Mald4蛋白B細(xì)胞表位Tab.4 Prediction results of the Mald4 B cell epitopes with DNAStar
圖1 Propred和Syfpeithi預(yù)測Mald4蛋白T細(xì)胞表位分析結(jié)果Fig.1 The results of the Mald4 protein T cell antigenic epitopes predicted by Propred and Syfpeithi
圖2 NetMHCⅡ和NetMHCⅡpan預(yù)測Mald4蛋白T細(xì)胞表位分析結(jié)果Fig.2 The results of the Mald4 protein T cell antigenic epitopes predicted by NetMHCⅡ and NetMHCⅡpan
圖3 不同物種前纖維蛋白優(yōu)勢抗原表位(方框表示區(qū))的對比分析Fig.3 Comparisons of dominant epitopes(Box said area)among different species profilins
圖4 蘋果Mald4蛋白與其它物種前纖維蛋白的系統(tǒng)進(jìn)化樹(N-J法)Fig.4 Phylogenetic tree of apple Mald4 protein and profilins from other species(N-J method)
圖5 不同物種蛋白空間構(gòu)象表位對比圖Fig.5 Conformational epitope comparison among different species proteins
利用Swiss-Model在線服務(wù)器,分別預(yù)測上述同源蛋白空間構(gòu)象表位所在區(qū)域,并用PyMOL 1.0軟件繪圖。結(jié)果表明蘋果Mald4蛋白與桃、甜櫻桃、草莓、芒果的前纖維蛋白空間構(gòu)象都含有4個α-螺旋,11個無規(guī)則卷曲,其中蘋果、桃和芒果的前纖維蛋白含有7個伸展鏈,甜櫻桃和草莓的前纖維蛋白含有6個伸展鏈(圖5),雖然它們空間結(jié)構(gòu)略有差異,但是具有很高的相似性。這提示前纖維蛋白家族成員之間相似的空間構(gòu)象和功能在決定過敏原性特征方面可能起到重要作用。
綜合上述預(yù)測結(jié)果可知,蘋果Mald4蛋白與桃、甜櫻桃、草莓、芒果的前纖維蛋白同源性高,空間結(jié)構(gòu)相似,有較近的親緣關(guān)系,發(fā)生交叉反應(yīng)可能區(qū)域為53~61和85~93。
近年來,生物信息學(xué)軟件在預(yù)測蛋白結(jié)構(gòu)、功能及生物學(xué)特性等方面起到了非常重要的作用,已廣泛運(yùn)用于蛋白質(zhì)抗原表位的預(yù)測[12]。理想的抗原表位是兼有B細(xì)胞表位和T細(xì)胞表位的功能[13],既可以通過刺激B細(xì)胞來產(chǎn)生抗原的特異性抗體,也可以與MHCⅡ類分子結(jié)合,通過抗原遞呈細(xì)胞把抗原信息遞呈給T淋巴細(xì)胞,引發(fā)T細(xì)胞的活化,產(chǎn)生特異性免疫應(yīng)答,為B細(xì)胞產(chǎn)生抗體提供支持。因此,引入兩種表位共預(yù)測的設(shè)想可提高抗原表位的預(yù)測準(zhǔn)確率。
目前對B細(xì)胞抗原表位預(yù)測主要是以線性表位為主,代表軟件有DNAStar、Bcepred等。由于不同預(yù)測軟件算法不同,預(yù)測的結(jié)果存在一些差異,所以綜合運(yùn)用不同軟件對多肽表位進(jìn)行多參數(shù)預(yù)測非常必要,對提高預(yù)測結(jié)果準(zhǔn)確性將起到一定作用[14]。
在預(yù)測B細(xì)胞抗原表位的同時,對蛋白質(zhì)二級結(jié)構(gòu)預(yù)測也非常重要[15]。對B細(xì)胞抗原表位進(jìn)行預(yù)測時,應(yīng)選擇無規(guī)則卷曲的區(qū)域,避免 α-螺旋。因螺旋區(qū)的結(jié)構(gòu)較為規(guī)則,化學(xué)鍵鍵能比較高,結(jié)構(gòu)穩(wěn)定,多位于蛋白質(zhì)內(nèi)部形成構(gòu)象表位,不易與配體結(jié)合;而無規(guī)卷曲的區(qū)域多位于蛋白質(zhì)分子的表面,易形成線性表位,有利于與配體結(jié)合,容易嵌合抗體,成為抗原表位的可能性較大[5]。隨著生物信息學(xué)發(fā)展及網(wǎng)絡(luò)數(shù)據(jù)庫的擴(kuò)充,應(yīng)用多參數(shù)綜合預(yù)測,已成為當(dāng)前抗原表位預(yù)測的主流[16]。基于人工神經(jīng)網(wǎng)絡(luò)軟件對T細(xì)胞表位進(jìn)行預(yù)測,本文選擇其中敏感性和特異性較高的軟件NetMHCⅡ、NetMHCⅡpan、Syfpeithi和Propred進(jìn)行綜合預(yù)測。
本研究以蘋果過敏原Mald4蛋白為基礎(chǔ),為排除信號肽或跨膜區(qū)對抗原表位篩選的干擾,首先采用SignaIP 3.0和TMHMM在線軟件分析Mald4蛋白氨基酸序列的信號肽及跨膜區(qū),結(jié)果表明該蛋白無信號肽和跨膜區(qū)。在B細(xì)胞表位的選擇上,綜合運(yùn)用Bcepred、DNAStar兩種軟件預(yù)測結(jié)果,選取親水性高、表面可及性強(qiáng)、抗原指數(shù)高以及柔韌性好的區(qū)域,兼顧該蛋白二級結(jié)構(gòu),選取無規(guī)則卷曲區(qū),避免 α-螺旋區(qū),并結(jié)合 NetMHCⅡ、NetMHCⅡpan、Propred及Syfpeithi在線軟件預(yù)測T細(xì)胞抗原表位結(jié)果,最后得出優(yōu)勢抗原表位區(qū)域為53~61,85~93。此外,蘋果Mald4蛋白與桃、甜櫻桃、草莓、芒果的前纖維蛋白之間具有高度的同源性,并有非常相似的空間構(gòu)象,表明它們之間發(fā)生交叉反應(yīng)的概率很高。目前多數(shù)學(xué)者認(rèn)為,若超過80個氨基酸的蛋白質(zhì),其序列的同源性大于35%,或有6個連續(xù)相同的氨基酸序列,則蛋白之間發(fā)生交叉反應(yīng)可能性就很高[17]。然而,Silvanovich 等[18]通過概率學(xué)研究表明,以8個或更少連續(xù)相同氨基酸序列來判定蛋白的交叉過敏反應(yīng),只是一個隨機(jī)產(chǎn)生的結(jié)果,對致敏性評估不具備任何意義。由于序列相似性分析僅僅局限于氨基酸順序的比較,不能包括構(gòu)象表位分析,因此對同源蛋白保守區(qū)空間構(gòu)象進(jìn)行相似性分析,預(yù)測目的蛋白與其它同源蛋白之間是否會存在交叉反應(yīng)是很有意義的。
總之,本研究利用生物信息學(xué)方法,綜合多種相關(guān)網(wǎng)絡(luò)軟件預(yù)測結(jié)果獲得蘋果Mald4蛋白T/B細(xì)胞的優(yōu)勢抗原表位。同時對蘋果Mald4蛋白及其同源蛋白進(jìn)行氨基酸序列比對和空間構(gòu)象預(yù)測,獲得它們之間可能發(fā)生交叉反應(yīng)的優(yōu)勢表位區(qū)域。這為我們以后利用基因突變技術(shù)改造蘋果Mald4蛋白及其同源蛋白的過敏原性,指導(dǎo)并深入開展無過敏性或低過敏性蘋果制品以及表位疫苗的相關(guān)研究奠定了理論基礎(chǔ)。
1 Marzban G,Puehringer H,Dey R et al.Localisation and distribution of the major allergens in apple fruits[J].Plant Science,2005;169(2):387-394.
2 Fernandez-Rivas M,Bolhaar S,Gonzalez-Mancebo E et al.Apple allergy across Europe:how allergen sensitization profiles determine the clinical expression of allergies to plant foods[J].JAllergy Clin Immunol,2006;118(2):481-488.
3 Ausukua M,Dublin I,Echebarria M A et al.Oral Allergy Syndrome(OAS).General and stomatological aspects[J].Med Oral Patol Oral Cir Bucal,2009;14(11):e568-572.
4 Ma Y,Zuidmeer L,Bohle B et al.Characterization of recombinant Mald4 and its application for component resolved diagnosis of apple allergy[J].Clinical& Experimental Allergy,2006;36(8):1087-1096.
5 Barlow D J,Edwards M S,Thornton J M.Continuous and discontinuous protein antigenic determinants[J].Nature,1986;322(6081):747-748.
6 Anandarao R,Swaminathan S,Khanna N.The identification of immunodominant linear epitopes of dengue type 2 virus capsid and NS4a proteins using pin-bound peptides[J].Virus Res,2005;112(1-2):60-68.
7 Saha S,Raghava G P.Prediction of continuous B-cell epitopes in an antigen using recurrent neural network[J].Proteins,2006;65(1):40-48.
8 Nielsen M,Lundegaard C,Lund O.Prediction of MHC classⅡ binding affinity using SMM-align,a novel stabilization matrix alignment method[J].BMC Bioinfomatics,2007;8:238-249.
9 Singh H,Raghava G P.ProPred:prediction of HLA-DR binding sites[J].Bioinformatics,2001;17(12):1236-1237.
10 Vordermeier M,Whelan A O,Hewinson R G.Recognition of mycobacterial epitopes by T cells across mammalian species and use of a program that predicts human HLA-DR binding peptides to predict bovine epitopes[J].Infect Immun,2003;71(4):1980-1987.
11 南文龍,金寧一,魯會軍et al.H5N1亞型禽流感病毒血凝素 Th和B細(xì)胞表位預(yù)測及抗原性分析[J].中國免疫學(xué)雜志,2009;25(7):630-633.
12 Korber B,LaBute M,Yusim K.Immunoinformatics comes of age[J].PLoSComput Biol,2006;2(6):484-492.
13 Parida R,Shaila M,Mukherjee S et al.Computational analysis of proteome of H5N1 avian influenza virus to define T cell epitopes with vaccine potential[J].Vaccine,2007;25(43):7530-7539.
14 Saha S,Raghava G P.Prediction of continuous B-cell epitopes in an antigen using recurrent neural network[J].Proteins,2006;65(1):40-48.
15 Jameson B A,Wolf H.The antigenic index:a novel algorithm for predicting antigenic determinants[J].Comput Appl Biosci,1988;4(1):181-186.
16 Florea L,Halldorsson B,Kohlbacher O et al.Epitope prediction algorithms for peptide-based vaccine design[J].Proc IEEE Comput Soc Bioinform Conf,2003;2:17-26.
17 Goodman R E.Practical and predictive bioinformatics methods for the identification of potentially cross-reactive protein matches[J].Mol Nutr Food Res,2006;50(7):655-660.
18 Silvanovich A,Nemeth M A,Song P et al.The value of short amino acid sequence matches for prediction of protein allergenicity[J].Toxicol Sci,2006;90(1):252-258.