陳季旺,劉珊珊,蔡廣霞,吳永寧,2
(1.武漢工業(yè)學(xué)院食品科學(xué)與工程學(xué)院,湖北 武漢 430023;2.中國疾病預(yù)防控制中心營養(yǎng)與食品安全所,北京 100050)
高血壓會造成腦、心、腎等重要器官損害,導(dǎo)致中風(fēng)等,已成為一個嚴(yán)重的社會公共衛(wèi)生問題。在發(fā)達(dá)國家,高血壓患病率高達(dá)25%以上,在發(fā)展中國家,近年來其患病率也在不斷增長。預(yù)計(jì)到2025年,全世界高血壓病人將達(dá)到1.5億人[1]。在高血壓人群中95%以上患者是原發(fā)性高血壓,通過抑制血管緊張素轉(zhuǎn)化酶(angiotensinⅠ-converting enzyme,ACE)活性可降低原發(fā)性高血壓[2]。食物源ACE抑制肽在溫和條件下由蛋白酶水解蛋白質(zhì)獲得,其食用安全性高,無毒副作用;對高血壓患者具有降壓效果,對血壓正常者無降壓作用;它同時具有減肥、免疫調(diào)節(jié)等功能,有著化學(xué)合成ACE抑制劑不可比擬的優(yōu)越性,其良好的安全性能以及多種生理功能吸引了眾多的研究者[3]。
1979年Oshima等[4]報道了第一個從食物蛋白質(zhì)中獲得的ACE抑制肽。隨后從乳蛋白[5]、雞蛋蛋白[6]、油料蛋白[7]、谷物蛋白[8]、魚蛋白[9]等中分離純化了大量的ACE抑制肽。定量構(gòu)效關(guān)系(quantitative structure-activity relationship,QSAR)研究是從一系列已知化合物中找出結(jié)構(gòu)和生物學(xué)活性之間的數(shù)量依賴關(guān)系,建立數(shù)學(xué)模型,用這種數(shù)學(xué)模型可以預(yù)測新化合物的活性,并為指導(dǎo)和設(shè)計(jì)新化合物提供理論依據(jù),因此對ACE抑制肽進(jìn)行QSAR研究有助于深入理解肽的結(jié)構(gòu)特征以及活性機(jī)理[10-11]。ACE 抑制肽的分子結(jié)構(gòu)表征在QSAR 研究中非常關(guān)鍵,通常以物理化學(xué)參數(shù)如電性、立體和疏水等來表征結(jié)構(gòu)。Hellberg等[12]首先以氨基酸側(cè)鏈為基礎(chǔ),從29種物化參數(shù)中提取氨基酸殘基的疏水性、立體性質(zhì)、電荷性質(zhì)3個主要參數(shù)來表征多肽結(jié)構(gòu)特征。隨后,許多研究者對ACE抑制肽結(jié)構(gòu)與活性關(guān)系進(jìn)行了研究,發(fā)現(xiàn)了多種潛在的ACE抑制肽和食物源[13-17]。Majumder等[18]報道采用QSAR模型預(yù)報了3種新的來源于雞蛋蛋白的ACE抑制三肽,并通過QSAR模型證明牛奶、禽肉、雞蛋、大豆等是良好的ACE抑制肽來源[11]。
從已報道的ACE抑制肽的QSAR模型發(fā)現(xiàn),這些模型對肽的活性預(yù)測、解釋能力有限,且預(yù)測結(jié)果與實(shí)測值差異較大。本實(shí)驗(yàn)在上述研究的基礎(chǔ)上,收集近年發(fā)現(xiàn)的ACE抑制三肽,以單個氨基酸側(cè)鏈的疏水值、立體性質(zhì)、電性參數(shù)為自變量,三肽的lg(IC50)為因變量,利用偏最小二乘回歸法(partial least squares regression,PLS)研究ACE抑制三肽的QSAR,建立數(shù)學(xué)模型,并采用“留一法”進(jìn)行交叉驗(yàn)證,闡明三肽結(jié)構(gòu)與ACE抑制活性的QSAR,并對已知氨基酸序列三肽的ACE抑制活性進(jìn)行預(yù)測和驗(yàn)證,擬為獲得高活性的ACE抑制肽提供理論基礎(chǔ)。
收集近年發(fā)現(xiàn)的ACE抑制三肽及其IC50值作為模型樣本,對于不同來源的相同肽序列,報道的IC50值有差異,本實(shí)驗(yàn)優(yōu)選較佳的IC50值,使得建立的模型具有準(zhǔn)確性。得到101個三肽的IC50值。因IC50值的相差倍數(shù)較大,為改善分析結(jié)果,采用lg(IC50)進(jìn)行數(shù)據(jù)分析。
根據(jù)Hellberg等[12]提出的20個天然氨基酸描述符Z-scales,從描述20個天然氨基酸的29種物化參數(shù)中,運(yùn)用主成分分析法,分別提取與氨基酸的疏水性(Z1)、立體性質(zhì)或者側(cè)鏈氨基酸的分子大小(Z2)和電性(Z3)有關(guān)的3個參數(shù)作為自變量(表1)。模型構(gòu)建(表2)以肽的lg(IC50)為因變量,引入肽的疏水性質(zhì)參數(shù)為X1(計(jì)算方法參考文獻(xiàn)[19]等),N端第一個氨基酸的疏水性、空間屬性和電性參數(shù)分別為自變量X2、X3、X4,N端第二個氨基酸的疏水性、空間屬性和電性參數(shù)分別為自變量X5、X6、X7,以此類推。運(yùn)用PLS對多重自變量和因變量進(jìn)行多元回歸分析,建立QSAR模型。數(shù)據(jù)統(tǒng)計(jì)分析采用SIMCA-P 12.0軟件在PC上完成。
表 1 20種天然氨基酸的物理化學(xué)參數(shù)[12]Table 1 Physico-chemical parameters of twenty natural amino acids[12]
表 2 101個三肽ACE抑制活性及Z-scales描述值Table 2 ACE inhibitory activity and Z-scales of 101 tripeptides
續(xù)表2
續(xù)表2
使用多元線性回歸建模時必須要對自變量進(jìn)行多重共線性檢測,診斷自變量系統(tǒng)中是否確實(shí)存在多重相關(guān)性[20]。較為常見的診斷方法[21]是使用方差膨脹因子(VIF),若VIF≥10,表示多重共線性將嚴(yán)重影響回歸結(jié)果的穩(wěn)定性和可靠性。采用Stata 11.0軟件分別計(jì)算ACE抑制三肽自變量的方差膨脹因子(VIF),對各自變量進(jìn)行共線性診斷。
對所采集的101樣本,10個自變量,1個自變量采用PLS建立數(shù)學(xué)模型,分析模型方程的標(biāo)準(zhǔn)回歸系數(shù),剔除對因變量影響不顯著的自變量,重新建立數(shù)學(xué)模型,得到優(yōu)化的較佳模型,分析影響ACE抑制三肽活性的關(guān)鍵因素及其作用效果,探討氨基酸序列與ACE抑制三肽活性之間的關(guān)系。
為考察模型的穩(wěn)定性和預(yù)測能力,對建立的模型用“留一法(leave-one-out)”分別作交互檢驗(yàn)(cross validation,CV),既每次從樣本集中抽出一個肽,用其余的三肽建模并預(yù)測抽出的三肽的IC50值,得到各肽的IC50預(yù)測值,計(jì)算交叉驗(yàn)證相關(guān)系數(shù)Q2。
Q2=1-∑(yexp-ypre)2/∑(yexp-yave)2
式中:yexp表示實(shí)際測得的活性值;ypre表示交叉驗(yàn)證的活性預(yù)測值;yave表示所有肽平均活性值。
根據(jù)所建立模型對本課題組分離所得的VNP(Val-Asn-Pro)[23]、VWP(Val-Trp-Pro)[23]和VAP(Val-Ala-Pro)[24]的IC50值進(jìn)行預(yù)測,比較實(shí)測值與預(yù)測值的差異,驗(yàn)證模型的預(yù)測能力。
采用Stata 11.0軟件計(jì)算三肽10個自變量的方差膨脹因子(VIF),對各自變量進(jìn)行共線性診斷。由表3可知,三肽樣本集中10個自變量的VIF值在1~4之間,均小于10,表明樣本自變量共線性不高,對回歸模型結(jié)果的穩(wěn)定性和可靠性影響較小,因此該樣本變量的選取可靠。采用PLS方法建立ACE抑制三肽的QSAR模型。
以收集的101個ACE抑制三肽中單個氨基酸側(cè)鏈的疏水性、立體性質(zhì)、電性參數(shù)和肽的總體疏水性等10個自變量為自變量,以三肽的lg(IC50)值為因變量,利用PLS研究ACE抑制三肽的QSAR,建立三肽的結(jié)構(gòu)與ACE抑制活性關(guān)系的QSAR模型方程,該方程10個自變量和1個因變量的回歸方程標(biāo)準(zhǔn)回歸系數(shù)值見表4。
表 4 初始模型標(biāo)準(zhǔn)回歸系數(shù)Table 4 PLS standard regression coeff icients of the initial model
由表4可知,自變量X1、X4、X6的標(biāo)準(zhǔn)回歸系數(shù)絕對值均小于0.05,對模型的影響不顯著,可解釋ACE抑制三肽的總體疏水參數(shù)、第一位氨基酸的電荷性質(zhì)、第二位氨基酸的立體性質(zhì)對因變量lg(IC50)的影響較小,可以剔除該自變量以進(jìn)一步優(yōu)化模型。
在第一步模型的基礎(chǔ)上,剔除影響不顯著的自變量后,重新采用PLS方法建立模型方程,其標(biāo)準(zhǔn)化回歸方程為:
將標(biāo)準(zhǔn)化變量表示為原變量回歸方程為:
樣本數(shù)101,R2(X)為0.729,R2(Y)為0.727,該模型對自變量X的解釋能力為0.729,對因變量Y的解釋能力為0.727,表明該模型對樣本集具備良好匹配性。該模型同比Wu Jianping等[15]報道采用140樣本建立的三肽模型(R2=0.4706)更精確。所得模型的自變量標(biāo)準(zhǔn)回歸系數(shù)圖見圖1。由回歸模型的相關(guān)系數(shù)可知,X2、X3、X5、X7、X8與三肽的lg(IC50)正相關(guān),X9、X10與其負(fù)相關(guān),且X8、X2即末、首位氨基酸的疏水值及X7中間氨基酸的電性參數(shù)對三肽的ACE抑制活性影響最大。X2、X5、X8即組成肽的單個氨基酸疏水值越小(如Val、Lys),該肽的ACE抑制活性越高。X7即中間氨基酸的電性參數(shù)對ACE抑制活性影響較大,呈正相關(guān),而X10即末端氨基酸的電性參數(shù)對ACE抑制活性呈負(fù)相關(guān)。X3、X9即首、末位氨基酸的體積參數(shù)對ACE抑制活性亦有較大影響。由模型可得,對于ACE抑制三肽的結(jié)構(gòu)組成,具較低疏水值、體積參數(shù)的氨基酸如Val、Leu和Ile傾向于處于N端第一位,較高疏水值和較低電性參數(shù)的氨基酸如Lys、Arg傾向于第二位,較低疏水值和較高體積、電性參數(shù)的氨基酸如Pro、Phe等傾向于第三位。
圖 1 PLS 標(biāo)準(zhǔn)回歸系數(shù)直方圖Fig.1 Histogram of PLS standard regression coeff icients
Cheung等[22]對ACE抑制三肽的構(gòu)效關(guān)系分析表明:C端為芳香族氨基酸且N端為支鏈氨基酸的三肽具有較高的活性。黎觀紅[13]以及Wu Jianping[15]等研究表明ACE抑制活性高的三肽C末端的氨基酸多為芳香族氨基酸,N端氨基酸多為疏水性氨基酸。但中間位置氨基酸分析各異,黎觀紅[13]指出中間位置的氨基酸傾向于電荷指數(shù)、側(cè)鏈體積和疏水性較小的氨基酸,Wu Jianping等[15]報道中間位置的氨基酸為電荷指數(shù)小而側(cè)鏈體積和疏水性大的氨基酸。本研究的QSAR結(jié)果中C端與N端氨基酸組成基本與報道一致,但模型表明中間位置氨基酸的體積參數(shù)對模型的影響不大,主要為電荷性質(zhì)的影響,即較高疏水值和較低電性參數(shù)的氨基酸傾向于第二位如Lys、Arg。
為了考察模型的穩(wěn)定性和預(yù)測能力,對建立的模型用“留一法”做交叉檢驗(yàn),計(jì)算整理出101個三肽ACE抑制活性的預(yù)測值,計(jì)算交叉驗(yàn)證相關(guān)系數(shù)Q2為0.549(Q2大于0.5表明模型具有較好的預(yù)測能力[15])。將三肽ACE抑制活性的預(yù)測值和實(shí)驗(yàn)值作圖。由圖2可知,模型的預(yù)測值和實(shí)驗(yàn)值具有較好的線性關(guān)系(R2=0.7250),表明該模型具有良好的預(yù)測能力。
圖 2 101個ACE 抑制三肽lg(IC50)實(shí)驗(yàn)值與預(yù)測值的相關(guān)圖Fig.2 Plot of experimental lg (IC50) versus predicted lg (IC50) of 101 ACE inhibitory tripeptides
QSAR模型預(yù)測包括高活性ACE抑制三肽源的發(fā)現(xiàn)和已知三肽序列活性的預(yù)測。綜合上述模型的分析和檢驗(yàn),該模型具有良好的匹配度和預(yù)測能力,可以利用其尋找具有較高ACE抑制活性的肽序列或預(yù)測ACE抑制活性,為后續(xù)的化學(xué)合成、體內(nèi)實(shí)驗(yàn)提供參考。利用建立的模型對本課題組分離純化得到的VNP、VWP和VAP的IC50值進(jìn)行預(yù)測,并與實(shí)際測定值進(jìn)行比較,驗(yàn)證模型的預(yù)測能力。
表 5 ACE抑制三肽活性預(yù)測值與實(shí)測值比較Table 5 Comparison of predicted and experimental IC50 of ACE inhibitory tripeptides
在該模型樣本范圍內(nèi),所選取的101個ACE抑制三肽lg(IC50)所有預(yù)測值和實(shí)測值的誤差值均小于1個單位值。由表5可知,利用該模型對3種新發(fā)現(xiàn)的ACE抑制三肽的lg(IC50)進(jìn)行預(yù)測,實(shí)測值和誤差值在0.06~0.23之間,符合該模型檢測范圍,且對VWP的誤差值最小僅為0.06,對VNP誤差值最大為0.23。該結(jié)果進(jìn)一步驗(yàn)證了模型的預(yù)測能力。
以采集ACE抑制三肽的氨基酸側(cè)鏈的疏水性質(zhì)、立體性質(zhì)、電荷性質(zhì)參數(shù)及三肽的總疏水參數(shù)為自變量,三肽的lg(IC50)為因變量,采用PLS方法建立三肽的組成和ACE抑制活性關(guān)系的初始數(shù)學(xué)模型,剔除對因變量影響不顯著的X1、X4、X6指標(biāo),得到優(yōu)化的QSAR模型的回歸方程為:Y=1.952+0.1229X2+ 0.0924X3+ 0.0425X5+0.1777X7+ 0.136X8-0.0809X9-0.1763X10。
樣本數(shù)101,R2(X)為0.729,R2(Y)為0.727,Q2為0.549。該模型對自變量X的解釋能力為0.729,對因變量Y的解釋能力為0.727,表明該模型對樣本集具備良好匹配性。Q2為0.549大于0.5,表明模型具有較好的預(yù)測能力。
對模型的分析結(jié)果表明:X8、X2即末、首位氨基酸的疏水值及X7中間氨基酸的電性參數(shù)對三肽的ACE抑制活性影響最大。X2、X5、X8即組成肽的各氨基酸疏水值越小(如Val、Leu),該肽的ACE抑制活性越高。X7即中間氨基酸的電性參數(shù)對ACE抑制活性呈正相關(guān),而X10即末端氨基酸的電性參數(shù)對ACE抑制活性呈負(fù)相關(guān)。對于ACE抑制三肽,具較低疏水值、體積參數(shù)的氨基酸如Val、Leu和Ile傾向于處于N端第一位,較低疏水值、電荷參數(shù)如Lys和Arg傾向于第二位,較低疏水值和較高體積參數(shù)、電荷參數(shù)如Pro、Phe等傾向于第三位。利用該模型預(yù)測新發(fā)現(xiàn)的ACE抑制三肽VNP、VWP和VAP,結(jié)果表明3種ACE抑制三肽實(shí)測值和誤差值在0.06~0.23之間,均在模型樣本誤差范圍內(nèi),進(jìn)一步驗(yàn)證該模型具備的良好預(yù)測能力。
[1] KEARNEY P M, WHELTON M, REYNOLDS K, et al. Global burden of hypertension: analysis of worldwide data[J]. Lancet, 2005,365: 217-223.
[2] BROWN N J, VAUGHAN D E. Angiotensin-converting enzyme inhibitors[J]. Circulation, 1998, 97: 1411-1420.
[3] GUANG C, PHILLIPS R D. Plant food-derived angiotensin Ⅰconverting enzyme inhibitory peptides[J]. Journal of Agricultural and Food Chemistry, 2009, 57: 5113-5120.
[4] OSHIMA G, SHIMABUKURO H, NAGASAWA K. Peptide inhibitors of angiotensin Ⅰ-converting enzyme in digests of gelatin by bacterial collagenase[J]. Biochimica Biophysica Acta, 1979, 566: 128-137.
[5] QUIR S A, MAR CONTRERAS M, RAMOS M, et al. Stability to gastrointestinal enzymes and structure–activity relationship of β-casein-peptides with antihypertensive properties[J]. Peptides, 2009,30: 1848-1853.
[6] YU Zhiping, LIU Boqun, ZHAO Wenzhu, et al. Primary and secondary structure of novel ACE-inhibitory peptides from egg white protein[J]. Food Chemistry, 2012, 133(2): 315-322.
[7] JIMSHEENA V K, GOWDA L R. Angiotensin Ⅰ-converting enzyme(ACE) inhibitory peptides derived from arachin by simulated gastric digestion[J]. Food Chemistry, 2011, 125: 561-569.
[8] YANG Yanjun, TAO Guanjun, LIU Pi, et al. Peptide with angiotensinⅠ-converting enzyme inhibitory activity from hydrolyzed corn gluten meal[J]. Journal of Agricultural and Food Chemistry, 2007, 55:7891-7895.
[9] FUJITA H, YOSHIKAW A. LKPNM: a prodrug-type ACE-inhibitory peptide derived from fish protein[J]. Immunopharmacology, 1999,44(1/2): 123-127.
[10] PRIPPA A H, ISAKSSON T, STEPANIAK L, et al. Quantitative structure activity relationship modelling of peptides and proteins as a tool in food science[J]. Trends in Food Science & Technology, 2005,16: 484-494.
[11] GU Yuchen, MAJUMDER K, WU Jianping. QSAR-aided in silico approach in evaluation of food proteins as precursors of ACE inhibitory peptides[J]. Food Research International, 2011, 44:2465-2474.
[12] HELLBERG S, SJ?STR?M M, SKAGERBERG B, et al. Peptide quantitative structure-activity-relationships, a multivariate approach[J].Journal of Medicinal Chemistry, 1987, 30(7): 1126-1135.
[13] 黎觀紅. 食品源血管緊張素抑制肽的研究[D]. 無錫: 江南大學(xué), 2005.
[14] PRIPP A H, ISAKSSON T, STEPANIAK L, et al. Quantitative structure-activity relationship modelling of ACE-inhibitory peptides derived from milk proteins[J]. European Food Research and Technology, 2004, 219(6): 579-583.
[15] WU Jianping, ALUKO R E, NAKAI S. Structural requirements of angiotensin Ⅰ-converting enzyme inhibitory peptides: quantitative structure- activity relationship study of di- and tripeptides[J]. Journal of Agricultural and Food Chemistry, 2006, 54: 732-738.
[16] 王毅梅. 草魚源ACE抑制肽的分離純化及定量構(gòu)效研究[D]. 武漢:武漢工業(yè)學(xué)院, 2011.
[17] HEMMATEENEJAD B, MIRI R, ELYASI M. A segmented principal component analysis-regression approach to QSAR study of peptides[J].Journal of Theoretical Biology, 2012, 305: 37-44.
[18] MAJUMDER K, WU Jianping. A new approach for identification of novel antihypertensive peptides from egg proteins by QSAR and bioinformatics[J]. Food Research International, 2010, 43(5): 1371-1378.
[19] 陶鵬, 王任小, 來魯華. 用氨基酸加和法計(jì)算多肽的脂水分配系數(shù)[J]. 物理化學(xué)學(xué)報, 1999, 15(5): 449-453.
[20] 王惠文. 偏最小二乘回歸的線性與非線性方法[M]. 北京: 國防工業(yè)出版社, 2006: 1-133.
[21] 馬雄威. 線性回歸方程中多重共線性診斷方法及其實(shí)證分析[J]. 華中農(nóng)業(yè)大學(xué)學(xué)報: 社會科學(xué)版, 2008(2): 78-83.
[22] CHEUNG H S, WANG Fenglai, ONDETTI E, et al. Binding of peptide substrate and inhibitors of angiotensin-converting enzyme[J].Journal of Biological Chemistry, 1980, 255: 401-407.
[23] 蔡廣霞. 大米源血管緊張素轉(zhuǎn)化酶抑制肽的復(fù)合酶法制備、純化及構(gòu)效關(guān)系研究[D]. 武漢: 武漢工業(yè)學(xué)院, 2012.
[24] CHEN Jiwang, WANG Yimei, ZHONG Qixin, et al. Purif ication and characterization of a novel angiotensin-I converting enzyme (ACE)inhibitory peptide derived from enzymatic hydrolysate of grass carp protein[J]. Peptides, 2012, 33(1): 52-58.