李 姣,蘇繼磊,陳 敏,戴世鯤,高永利,尹 浩,
(1.中國(guó)科學(xué)院南海海洋研究所,中國(guó)科學(xué)院熱帶海洋生物資源與生態(tài)重點(diǎn)實(shí)驗(yàn)室,儀器設(shè)備公共服務(wù)中心,廣東廣州 510301;2.中國(guó)科學(xué)院大學(xué),北京 100049;3.南方海洋科學(xué)與工程廣東省實(shí)驗(yàn)室(廣州),廣東廣州 511458)
近年來(lái),活性肽作為一種天然安全的食品補(bǔ)充劑得到了迅速發(fā)展,其重要的生理調(diào)節(jié)功能致使其在人類健康保健預(yù)防上占有一席之地[1]。目前的研究已證實(shí)牛奶,大豆等食品蛋白的水解物具有一系列生理活性,如抗氧化、抗炎、降血壓、降血糖血脂等[2?6]。糖尿病是一種高發(fā)高危性的慢性疾病,據(jù)報(bào)道,到2030年,全球糖尿病患病人數(shù)將突破4億,其中2型糖尿病占絕大多數(shù),約占比90%[7]。在糖尿病的發(fā)生發(fā)展中,胰島β細(xì)胞分泌的胰島素多肽(GIP)和胰高血糖素樣肽1(GLP-1)起著關(guān)鍵的調(diào)控作用,而二肽基肽酶IV(DPP-IV)則可以降解這些激素,致使其在體內(nèi)的含量降低,從而導(dǎo)致血糖的升高[8?10]。因此,抑制DPP-IV的活性,成為控制血糖的關(guān)鍵步驟。已知上市的具有DPP-IV 抑制活性的藥物有西格列汀、沙格列汀、阿格列汀等[11?12]。然而,其副作用使這些化學(xué)藥物的使用受到限制。因此,尋找安全有效的DPP-IV活性抑制替代物成為近年來(lái)的研究熱點(diǎn)。經(jīng)研究發(fā)現(xiàn),某些具有2~8個(gè)氨基酸的肽可抑制DPP-IV,其活性受氨基酸組成,序列長(zhǎng)短,疏水性等各種因素影響[13]。
在活性肽的制備過(guò)程中,傳統(tǒng)的制備方法是以活性為導(dǎo)向的一系列分離純化,然后鑒定出活性肽單體,其過(guò)程繁瑣,需要耗費(fèi)大量的人力物資,且收率低[14],并且因其分段的活性測(cè)定方法導(dǎo)致錯(cuò)過(guò)某些活性極強(qiáng)的單肽。因此需要尋找一種高效尋找活性肽的方法,以實(shí)現(xiàn)大量制備。
隨著計(jì)算機(jī)技術(shù)的發(fā)展,其在活性藥物篩選,結(jié)構(gòu)優(yōu)化設(shè)計(jì)上近年來(lái)有了明顯的突破,使用計(jì)算機(jī)對(duì)小分子化合物進(jìn)行虛擬篩選,結(jié)構(gòu)設(shè)計(jì)在醫(yī)藥領(lǐng)域已得到廣泛的應(yīng)用。然而,使用這一技術(shù)對(duì)活性肽進(jìn)行全面系統(tǒng)的虛擬篩選并不多見(jiàn)。常見(jiàn)的虛擬篩選方法包括基于受體蛋白的分子對(duì)接以及基于配體小分子的藥效團(tuán)模型。Nongonierma等[15]運(yùn)用分子對(duì)接技術(shù)預(yù)測(cè)了二肽抑制DPP-IV的潛力,然而,利用藥效團(tuán)模型對(duì)DPP-IV抑制活性多肽進(jìn)行篩選并不多見(jiàn)。Wang等[16]采用已知的ACE抑制肽構(gòu)建了藥效團(tuán)模型,并進(jìn)行了初步驗(yàn)證,然而并未利用構(gòu)建的藥效團(tuán)進(jìn)行肽分子的篩選。
在前期的研究中,利用Biopep數(shù)據(jù)庫(kù)采用在線虛擬酶解方法,發(fā)現(xiàn)馬氏珍珠貝蛋白來(lái)源的活性肽具有較高的DPP-IV抑制潛力。因此本研究繼續(xù)以馬氏珍珠貝蛋白為研究對(duì)象,利用PeptideCutter平臺(tái)在線酶解,產(chǎn)生小分子肽庫(kù),通過(guò)建立DPP-IV抑制肽的藥效團(tuán)模型,采用最優(yōu)藥效團(tuán)模型及分子對(duì)接方法對(duì)肽庫(kù)進(jìn)行虛擬篩選,以鑒定出具有高活性的DPP-IV抑制肽。
二肽基肽酶IV(DPP-IV)、抑二肽素A(IPI)、甘氨酰-脯氨酰-對(duì)硝基苯胺對(duì)甲苯磺酸(Gly-Pro-pNA)美國(guó)Sigma公司;合成肽LPIY、VQDR、PIY和APSL(純度>98%) 吉爾生化(上海)有限公司。
Discovery Studio(DS)軟件 美國(guó)Accelrys公司;K 3 Plus酶標(biāo)儀 上海寶予德科學(xué)儀器有限公司。
1.2.1 藥效團(tuán)模型的產(chǎn)生 如圖1所示,從Biopep數(shù)據(jù)庫(kù)中,收集了40個(gè)已知的具有DPP-IV抑制活性小肽作為模型建立和驗(yàn)證的數(shù)據(jù)集[17],其中20個(gè)作為訓(xùn)練集用于產(chǎn)生藥效團(tuán)模型,剩余的20個(gè)組成測(cè)試集用作藥效團(tuán)模型的驗(yàn)證。采用ChemOffice 2018構(gòu)建活性肽結(jié)構(gòu),并賦與CHARMM力場(chǎng)進(jìn)行能量?jī)?yōu)化。采用Discovery Studio軟件中“3D QSAR Pharmacophore Generation”生成藥效團(tuán)模型。在構(gòu)象產(chǎn)生時(shí),設(shè)置“Best”構(gòu)象生成方法,并限定產(chǎn)生的最大構(gòu)象數(shù)為250,新產(chǎn)生的構(gòu)象與最低能量構(gòu)象之間的能量差不大于20 kcal·mol?1,用于產(chǎn)生藥效團(tuán)模型的化學(xué)特征有:氫鍵受體(A)、氫鍵給體(D)、疏水中心(H)和陰離子中心(N)。將不確定值(Uncertainty)值設(shè)為2,其余參數(shù)為軟件默認(rèn)值。
圖1 用于構(gòu)建藥效團(tuán)模型的訓(xùn)練集的肽結(jié)構(gòu)Fig.1 Structure of peptidesin thetraining set used to construct the pharmacophore model
1.2.2 藥效團(tuán)模型的驗(yàn)證 為檢驗(yàn)藥效團(tuán)是否具有預(yù)測(cè)能力,采用測(cè)試集分子,F(xiàn)isher隨機(jī)驗(yàn)證對(duì)藥效團(tuán)模型進(jìn)行評(píng)價(jià)。
1.2.2.1 測(cè)試集分子驗(yàn)證 為檢測(cè)該藥效團(tuán)模型的預(yù)測(cè)能力,本研究選取除訓(xùn)練集以外已報(bào)道的20個(gè)不同結(jié)構(gòu)的DPP-IV抑制活性肽分子作為測(cè)試集,采用DS軟件中的“Ligand Pharmacophore Mapping”模塊對(duì)模型進(jìn)行驗(yàn)證,測(cè)試集肽分子的構(gòu)象產(chǎn)生方式與訓(xùn)練集相同。
1.2.2.2 Fisher 隨機(jī)驗(yàn)證 Fisher隨機(jī)驗(yàn)證是通過(guò)對(duì)訓(xùn)練集中的分子重新分配活性值,從而產(chǎn)生藥效團(tuán)模型,如果隨機(jī)產(chǎn)生的藥效團(tuán)模型優(yōu)于之前產(chǎn)生的模型,則證明先前產(chǎn)生的模型是隨機(jī)產(chǎn)生的,不具有統(tǒng)計(jì)學(xué)意義,反之則具有統(tǒng)計(jì)學(xué)意義,通過(guò)設(shè)置置信度為95%,對(duì)模型進(jìn)行Fisher隨機(jī)驗(yàn)證。
1.2.3 肽庫(kù)的構(gòu)建 從UniProt數(shù)據(jù)庫(kù)(http://www.uniprot.org/)中選取了十一條來(lái)源于馬氏珍珠貝肉的蛋白,其編碼為M 5AKJ3,M 5AJM 7,M 5AKK3,M 5AJP7,B3GRV7,Q2AAD2,Q967M 3,Q0ZVW7,A0A510EA 34,A0A0N7J6H6,A 0A 0P0LDM 5。參考Yang等[18]的做法,采用PeptideCutter在線酶切所選的蛋白序列,所用到的蛋白酶有胰蛋白酶、胃蛋白酶、糜蛋白酶以及脯氨酸內(nèi)切蛋白酶,在線虛擬酶解完后,選取氨基酸個(gè)數(shù)小于或等于5的小分子多肽組成多肽庫(kù)。
1.2.4 藥效團(tuán)模型對(duì)肽庫(kù)的篩選 使用構(gòu)建好的藥效團(tuán)模型對(duì)建立的小分子多肽庫(kù)進(jìn)行搜索,整個(gè)搜索過(guò)程在“Search 3D Database”中完成,設(shè)定搜索方法為‘BEST’,其余參數(shù)保持不變。
1.2.5 分子對(duì)接 參考Nongonierma等[19]的方法進(jìn)行分子對(duì)接,DPP-IV 3D結(jié)構(gòu)從PDB生物大分子數(shù)據(jù)庫(kù)(PDB code:1WCY)檢索獲得,使用AutoDock Tools(version 1.5.6)對(duì)其去水,加氫并設(shè)置搜索空間。格點(diǎn)坐標(biāo)及盒子體積設(shè)置如下:size_x=18,size_y=16,size_z=18,center_x=56.133,center_y=63.602,center_z=39.577。對(duì)接前將蛋白晶體結(jié)構(gòu)中原始配體Diprotin A提取出來(lái)重新對(duì)接,計(jì)算RMSD值,如果RMSD<2?,證明對(duì)接程序可信。將經(jīng)藥效團(tuán)模型篩選后理論活性值較高的前23個(gè)多肽(匹配值FitValue>6.0)與DPP-IV進(jìn)行Autodock Vina分子對(duì)接,進(jìn)一步篩選得到理論上活性高的多肽。肽結(jié)構(gòu)均由ChemOffice 2018軟件畫的,能量最小化后與蛋白對(duì)接,產(chǎn)生的結(jié)合能用于表示小分子與蛋白結(jié)合的穩(wěn)定性,結(jié)合能越低,表明小分子與蛋白結(jié)合得越穩(wěn)定,其理論上的活性值越大。
1.2.6 肽的固相合成 肽由上海吉爾生化有限公司合成的,純度大于98%,其分子量采用LC-MS確定,純度采用HPLC測(cè)定[20]。
1.2.7 體外DPP-IV抑制活性測(cè)定 DPP-IV抑制實(shí)驗(yàn)參考Ibrahim等[21]的方法稍作修改。將25μL的DPP-IV(總濃度為0.0035 U/mL)與100μL的樣品溶液混合并保溫10 min,控制組以Tris-HCl緩沖液代替樣品加入。隨后加50μL濃度為1 mM底物(Gly-Pro-pNA溶液)分別到樣品組和控制組,繼續(xù)保溫反應(yīng)1 h,使用酶標(biāo)儀測(cè)量405 nm的吸光度。每個(gè)樣品進(jìn)行三次重復(fù)實(shí)驗(yàn),DPP-IV酶活性抑制率根據(jù)以下公式計(jì)算:
式中:As組為多肽樣品存在時(shí)的吸光度;Ac為控制組的吸光度。
采用GraphPad Prism 8.0.1的單因素方差分析進(jìn)行統(tǒng)計(jì)分析。所有實(shí)驗(yàn)均重復(fù)三次,數(shù)據(jù)表示為平均值±標(biāo)準(zhǔn)偏差,以P<0.05時(shí)表示差異顯著。
由20個(gè)多肽組成的訓(xùn)練集產(chǎn)生了10個(gè)藥效團(tuán)模型,其相應(yīng)的統(tǒng)計(jì)評(píng)分如表1所示,一般來(lái)說(shuō),評(píng)差(Δcost),config值,均差(RMS),以及相關(guān)度可用于綜合評(píng)價(jià)藥效團(tuán)是否具有統(tǒng)計(jì)學(xué)意義。在理想的藥效團(tuán)模型中,總評(píng)值(total cost)應(yīng)位于固定值(fixed cost)和空值(null cost)之間,接近前者,并遠(yuǎn)離后者,并且,null cost和total cost差值(Δcost)應(yīng)大于60,才表明該模型統(tǒng)計(jì)學(xué)意義大于90%,即說(shuō)明模型具有良好的預(yù)測(cè)能力[22?24]。另外,模型的config值應(yīng)小于17,RMS值應(yīng)小于1.5,相關(guān)度應(yīng)大于0.9。從下表1可以看出,產(chǎn)生的十個(gè)藥效團(tuán)的Δcost,RMS,相關(guān)度都在合理的范圍內(nèi),均具有統(tǒng)計(jì)學(xué)意義。同時(shí),Hypo1因具有最大的Δcost和相關(guān)度,最小的RMS,被認(rèn)為是理論上最優(yōu)藥效團(tuán)模型。Hypo1對(duì)訓(xùn)練集的預(yù)測(cè)結(jié)果如表2所示,從表2可以看出,其對(duì)訓(xùn)練集中各分子的預(yù)測(cè)IC50值與真實(shí)IC50值較為接近,誤差值(Error)保持在±4以內(nèi),預(yù)測(cè)結(jié)果良好。
表1 建立的藥效團(tuán)的各項(xiàng)參數(shù)Table 1 Parameters of the established pharmacophore
表2 Hypo1對(duì)訓(xùn)練集分子的預(yù)測(cè)Table 2 Prediction of Hypo1 for training set molecules
Hypo1含有的藥效團(tuán)特征有氫鍵受體,氫鍵給體,疏水特征,各藥效團(tuán)之間的空間距離如下圖2A所示。Hypo1對(duì)訓(xùn)練集中的活性最強(qiáng),即真實(shí)IC50值最小的肽分子(Ile-Pro-Ile)以及活性最弱的肽分子(Gly-Pro)預(yù)測(cè)結(jié)果分別如圖2B和2C所示,活性最強(qiáng)的分子同藥效團(tuán)完全匹配上,而活性最弱的分子則有一個(gè)疏水特征沒(méi)有匹配上。
圖2 最優(yōu)藥效團(tuán)模型及其與訓(xùn)練集分子的匹配Fig.2 Optimal pharmacophore model and its aligning with training set molecules
為了驗(yàn)證Hypo1對(duì)除訓(xùn)練集以外的其他肽分子也有預(yù)測(cè)作用,以文獻(xiàn)中20個(gè)具有DPP-IV抑制作用的其他分子組成測(cè)試集,對(duì)Hypo1進(jìn)行驗(yàn)證,結(jié)果如圖3A所示,得到其真實(shí)活性與預(yù)測(cè)活性值之間的決定系數(shù)R2為0.81,相關(guān)性良好。這表明Hypo1不僅能預(yù)測(cè)訓(xùn)練集中的肽,對(duì)除訓(xùn)練集以外的多肽也具有一定活性預(yù)測(cè)能力。采用Fisher隨機(jī)驗(yàn)證以判斷藥效團(tuán)的產(chǎn)生是否具有偶然性,結(jié)果如圖4B,可以看出,隨機(jī)產(chǎn)生的19個(gè)藥效團(tuán)模型相比Hypo1(original),其總評(píng)值(cost值)都要更大,這表明本研究中產(chǎn)生的Hypo1不是偶然產(chǎn)生的,具有一定的統(tǒng)計(jì)學(xué)意義。
圖3 藥效團(tuán)模型的驗(yàn)證Fig.3 Verification of the pharmacophore model
將珍珠貝肉虛擬酶解產(chǎn)生的192個(gè)小分子多肽組成多肽庫(kù),能量最小化后,使用Hypo1對(duì)多肽庫(kù)進(jìn)行篩選,選擇Fit value值大于6.0的肽進(jìn)行分子對(duì)接,以進(jìn)一步篩選高活性DPP-IV抑制肽,其結(jié)果如下表3所示。從表3可以看出,多肽LPIY,VQDR,PIY及APSL與DPP-IV的結(jié)合能最低,分別為?8.0,?7.8,?7.6,?7.6 kcal/mol。因此選擇這四個(gè)肽分別固相合成,測(cè)定2.5 mg/mL時(shí)它們的DPP-IV抑制率,結(jié)果如圖4所示,VQDR和PIY并沒(méi)有展示活性,而LPIY及APSL卻表現(xiàn)了極好的DPP-IV抑制率,分別為79.43%±0.61%和80.3%±0.24%(P>0.05),而陽(yáng)性對(duì)照IPI在濃度為1.5 mg/mL時(shí),DPP-IV抑制率為80.06%±0.44%。進(jìn)一步測(cè)得LPIY和APSL的IC50值,分別為521.19和258.67μmol/L。通過(guò)觀察這兩個(gè)肽分子的結(jié)構(gòu)特點(diǎn),可以發(fā)現(xiàn)它們的N-端第二位均為脯氨酸(Pro),且兩端均有疏水性氨基酸。Nongonierma等[25]研究報(bào)道,肽氨基酸序列中含有脯氨酸可以極大地促進(jìn)DPP-IV抑制活性,Nong等[26]也指出,N-端第二個(gè)位置為Pro或Ala是DPPIV抑制肽的明顯特征。并且,兩端的疏水性氨基酸也可以促進(jìn)酶抑制活性的提高,本研究與以往的報(bào)道相符。
表3 23個(gè)預(yù)測(cè)的DPP-IV抑制肽及分子對(duì)接結(jié)合能Table 3 23 predicted DPP-IV inhibitory peptides and molecular docking binding energy
圖4 合成肽的DPP-IV抑制率Fig.4 DPP-IV inhibition rate of synthetic peptides
在多肽分子對(duì)接前,首先將原配體重新對(duì)接后到晶體結(jié)構(gòu)中,其RMSD值為1.2?,表明對(duì)接算法程序適用于本次對(duì)接。圖5展示了兩個(gè)高活性的四肽LPIY及APSL與DPP-IV之間的相互作用圖,從圖5A可以看出,兩個(gè)肽均很好地嵌合在DPP-IV的活性口袋中。DPP-IV一共包含有三個(gè)活性口袋,即S1、S2及S3,S1口袋包括氨基酸殘基Ser630、Asn710和His740,S2口袋由Arg125、Glu205和Glu206組成,S3口袋由Tyr547、Arg358和Phe357組成[27?28]。從圖5B可以看出,肽LPIY與DPP-IV中的Asn710形成了兩個(gè)氫鍵,與Glu206,Arg669各形成了一個(gè)氫鍵,其中Asn710為S1中的殘基,Glu206為S2中的氨基酸殘基。其中的脯氨酸(Pro)與Tyr547形成了Pi-Alkyl作用,Tyr547位于S3活性口袋中。圖5C表示四肽APSL與氨基酸殘基Glu205形成了兩個(gè)氫鍵,與Glu206、His740、Asn710、Arg125和Tyr631各形成了一個(gè)氫鍵,其中His740和Asn710屬于S1口袋,Glu205、Glu206和Arg125屬于S2口袋,中間的脯氨酸與Phe357形成了Pi-Alkyl作用,Phe357也是S3活性口袋中的氨基酸殘基??梢?jiàn),兩個(gè)肽均與DPP-IV活性口袋中的氨基酸殘基形成了相互作用,并且,它們N-端第二位的脯氨酸均與S3口袋中的氨基酸殘基形成了Pi-Alkyl作用,這些作用對(duì)于肽-酶結(jié)合的穩(wěn)定性起到了極為關(guān)鍵的作用。另外,肽與DPP-IV之間還有范德華作用,Pi-Sigma作用等。Xu等[29]發(fā)現(xiàn)他們鑒定的所有的肽均與S1,S2或S3口袋殘基有著相互作用,如PAGPF(Asn740和Ser630)、KTMPGP(Tyr547和Arg358)、IPQVS(Asn740,Arg125和Glu206)、ELHQEEPL(Arg125,Glu206和Arg358),且這些肽均含有一個(gè)或多個(gè)脯氨酸,這說(shuō)明脯氨酸及其與活性口袋殘基之間的相互作用可能是肽具有DPP-IV抑制作用的重要原因之一。
圖5 活性肽與DPP-IV的對(duì)接Fig.5 Molecular docking between the peptidesand DPP-IV
本研究構(gòu)建了用于DPP-IV抑制肽篩選的3DQSAR藥效團(tuán)模型,其中Hypo1經(jīng)評(píng)估后為最優(yōu)藥效團(tuán)模型,其Δcost為67.036,相關(guān)度為0.943,RMS為1.029,含有的藥效團(tuán)特征為兩個(gè)氫鍵受體,一個(gè)氫鍵給體,一個(gè)疏水基團(tuán)。采用在線網(wǎng)站PeptideCutter對(duì)珍珠貝肉蛋白進(jìn)行虛擬酶解,產(chǎn)生的192個(gè)氨基酸數(shù)小于或等于5的小分子肽組成肽庫(kù),采用Hypo1以及分子對(duì)接對(duì)肽庫(kù)進(jìn)行篩選,得到四個(gè)理論上具有高潛力的DPP-IV抑制活性肽(LPIY,VQDR,PIY和APSL)。活性驗(yàn)證后發(fā)現(xiàn)VQDR和PIY沒(méi)有活性,而LPIY和APSL具有較高的DPP-IV抑制活性,其IC50值分別為521.19和258.67μmol/L。經(jīng)文獻(xiàn)調(diào)研后發(fā)現(xiàn)肽序列中含有脯氨酸并且脯氨酸在N-端第二位時(shí)其DPP-IV抑制活性明顯,本研究篩選的兩個(gè)高活性肽符合這一特征。這一結(jié)果也表明,以后的研究工作中,虛擬篩選時(shí)若結(jié)合構(gòu)效關(guān)系研究將進(jìn)一步提高篩選的成功率。兩個(gè)肽與DPPIV的結(jié)合模式表明脯氨酸與活性口袋中氨基酸殘基形成的相互作用對(duì)于維持肽-酶穩(wěn)定性起到了關(guān)鍵作用,下一步的研究將集中在體內(nèi)活性抑制機(jī)理中。