仝建波,吳魯陽, 馮 怡, 王天浩
(1.陜西科技大學(xué)化學(xué)與化工學(xué)院, 西安 710021; 2.陜西省輕化工助劑重點實驗室, 西安 710021)
IL-2(Interleukin-2)是一種白介素,是免疫系統(tǒng)中的一類細胞生長因子,主要由T細胞或T細胞系產(chǎn)生.IL-2誘導(dǎo)的T細胞激酶(Itk)屬于非受體性酪氨酸(Tec)激酶[1].它在T細胞受體(TCR)及趨化因子受體信號轉(zhuǎn)導(dǎo)通路中起著重要作用[2, 3].IL-2誘導(dǎo)的T細胞激酶(Itk)參與調(diào)節(jié)T細胞的光重組、鈣動員和NFAT活化.同時還可介導(dǎo)Th2細胞因子的分泌,并在過敏性哮喘或寄生蟲感染時產(chǎn)生有效的Th2反應(yīng)[4].因此,Itk抑制劑被認為是治療Th2介導(dǎo)的炎癥性疾病(如哮喘、鼻炎、過敏和過敏性皮炎)的一個有希望的藥物靶點[5].最近,Itk抑制劑也被證明可以通過影響艾滋病毒復(fù)制的多個步驟來阻止艾滋病毒感染[6].
三維定量構(gòu)效關(guān)系(3D-QSAR)[7]是以配體和靶點的三維結(jié)構(gòu)特征為基礎(chǔ),探索生物活性分子的三維構(gòu)象性質(zhì)[8],通過圖形精確地反映生物活性分子與受體相互作用的能量變化,更深刻地揭示藥物與受體相互作用的機理.其中傳統(tǒng)的兩種方法分別為比較分子相似因子分析法(CoMSIA)[9]和比較分子力場分析法(CoMFA)[10],而新一代的易位體比較分子場分析法(Topomer CoMFA)[11]是Topomer和CoMFA技術(shù)的結(jié)合,它的優(yōu)點是快速、高效和易操作.在原文獻[12]對37個吡唑啉嘧啶類IL-2誘導(dǎo)T細胞激酶抑制劑CoMFA和CoMSIA的3D-QSAR研究基礎(chǔ)上,本文則采用Topomer CoMFA方法進行3D-QSAR研究,得到了較原文獻更好的結(jié)果,并在此基礎(chǔ)上進行了分子設(shè)計和分子對接,為藥物的設(shè)計研制提供了新的理論指導(dǎo).
本文的37個吡唑啉嘧啶類IL-2誘導(dǎo)T細胞激酶抑制劑來源于文獻[12].所有化合物的分子結(jié)構(gòu)見圖1,37個抑制劑的結(jié)構(gòu)和生物活性值見表1,數(shù)據(jù)集隨機地劃分為訓(xùn)練集與測試集兩部分,其中訓(xùn)練集為30個化合物,用于建立3D-QSAR模型,測試集為7個化合物,用于驗證模型的預(yù)測能力.所有化合物的生物活性用pIC50(-logIC50)表示,IC50為抑制劑的半抑制濃度.
圖1 Itk抑制劑化合物骨架Fig.1 Itk inhibitor compound skeleton
利用分子動力學(xué)程序Minimize對化合物進行能量優(yōu)化,優(yōu)化過程采用Tripos力場、powell能量梯度和Gasteiger-Huckel電荷[11],將迭代系數(shù)設(shè)置為1000次,能量收斂梯度值設(shè)為0.005 kcal/mol,并將RMS設(shè)為0.005,其余參數(shù)采用SYBYL-X 2.0默認值[13].
以活性值最高的22號化合物作為模板分子,切割方式如圖2所示,保留Itk抑制劑化合物的核心骨架.對訓(xùn)練集中30個化合物進行切割,生成Ra和Rb基團,通過對其周圍立體場和靜電場的結(jié)構(gòu)表征,采用偏最小二乘法(PLS)[14]實現(xiàn)模型擬合,研究化合物三維結(jié)構(gòu)與其生物活性之間的關(guān)系,生成3D-QSAR模型.采用留一法交互驗證[15]評價模型的內(nèi)部預(yù)測能力,外部測試集驗證模型的外部預(yù)測能力[16].
表1 Itk抑制劑的結(jié)構(gòu)與生物活性值
Table 1 Structures and pIC50values of derivatives used for modeling
No.R1Exp.pIC50Pred.pIC50Residual1對甲苯甲醚5.355.36-0.0124-甲基三氟甲苯4.284.32-0.0433-甲基三氟甲苯4.754.79-0.0443-三氟甲氧基甲苯5.185.32-0.1453,4-二甲氧基甲苯4.674.640.0364-甲基芐醇5.986.01-0.0372-甲氧基-5-甲基吡啶4.644.620.0282-(甲基氨基)-5-甲基吡啶4.994.940.0593-甲基喹啉5.014.960.05106-甲基喹啉5.135.020.11114-甲基喹啉4.694.78-0.1112甲基對甲苯亞楓4.664.620.04133-甲基三氟甲苯6.726.710.0114對甲苯甲醚6.746.740.0015間甲苯甲醚6.706.660.0416對氟苯甲醚6.146.130.01173,4-二氟甲苯5.855.87-0.02182,4-二氟甲苯6.286.260.02192,5-二甲基吡啶6.146.15-0.01206-甲基-3-氟吡啶5.996.02-0.03214-異丙基甲苯8.007.950.05221-異丙基-2,4-二甲基苯8.708.760.06234-乙基三氟化苯6.706.440.26244-乙基苯甲腈5.395.60-0.21255-乙基-2-(三氟甲基)吡啶5.825.96-0.14261-乙基-4-氟苯5.615.560.05274-氟丙苯5.765.760.0028甲基環(huán)己烷4.964.900.06291,1,1-三氟丙烷4.444.390.05303-叔丁基甲苯7.157.170.0231*間甲苯甲醚5.605.290.3132*對三氟甲氧基甲苯4.674.85-0.1833*3,4-(亞甲二氧基)甲苯5.084.740.3434*5-甲基嘧啶5.004.790.2135*3,5-二氟甲苯6.686.000.1836*對叔丁基甲苯8.007.170.8337*4-乙基苯甲醚5.195.34-0.15
注:*代表測試集化合物
圖2 模板分子的切割方式Fig.2 Cutting mode for template molecules
分子對接是通過受體的特征以及受體和藥物分子之間的相互作用方式來進行藥物設(shè)計的方法.本文采用Surflex-dock分子對接技術(shù)對新設(shè)計的分子與Itk三維晶體[17]的作用模式和機制進行研究.首先對原型分子進行可行性驗證,并作為參考,之后將活性值最高的分子以及新設(shè)計的分子與蛋白晶體進行對接,比較其打分函數(shù),篩選出較好的分子.打分函數(shù)用Total-Score、Crash和Polar表示[18].通常情況下,Total-Score為總的打分函數(shù),表示受體與配體的親和能力,分值越高越好;Crash絕對值越接近零,表示配體與受體對接時的不適當(dāng)程度越?。籔olar為極性函數(shù)得分,當(dāng)結(jié)合位點位于分子表面時,分值越高越好;當(dāng)結(jié)合位點位于分子內(nèi)部時,分值越低越好[19].
Topomer CoMFA模型的統(tǒng)計結(jié)果見表2,其中擬合相關(guān)系數(shù)r2、交互驗證相關(guān)系數(shù)q2分別為0.994和0.728,標準估計誤差SEE為0.097.在統(tǒng)計學(xué)中,一般情況下當(dāng)r2>0.6,q2>0.5時,說明所建立的模型具有統(tǒng)計學(xué)意義[19].因此本文中所建立的Topomer CoMFA模型有較好的穩(wěn)定性和預(yù)測能力,對應(yīng)37個化合物的預(yù)測活性值見表1.圖3為37個化合物實驗活性值與預(yù)測活性值的線性回歸圖,圖中所有點均勻分布在45°線附近,表明所建立的模型有較強的預(yù)測和擬合能力.
表2 Topomer CoMFA建模結(jié)果
圖3 Topomer CoMFA 模型實驗值與預(yù)測值的線性回歸圖Fig.3 Linear regression of experimental and predicted activities based on the Topomer CoMFA model
以活性值最高的22號化合物為模板,進行三維等勢圖分析.圖4中(a)、(b)分別為Rb基團的立體場和靜電場三維等勢圖.一般情況下,在立體場中黃色區(qū)域部分取代基基團體積減小或者綠色區(qū)域部分取代基基團體積增大分子活性均會增加.在靜電場中紅色區(qū)域加入帶負電的基團或者藍色區(qū)域加入帶正電的基團分子活性均會增加.
從圖4(a)中可以看出,Rb基團中苯環(huán)上的1、2位有大片的綠色區(qū)域,表明此處引入大體積的取代基有利于增加活性,例如:22號化合物(pIC50=8.70)苯環(huán)2位上的甲基比21號化合物 (pIC50=8.00)苯環(huán)2位上的氫基體積大,活性顯著增加.除此之外,可以看到Rb基團中苯環(huán)的5、6位被黃色區(qū)域所包圍,表明此處引入體積較小的基團可以增加分子活性,例如:16號化合物(pIC50=6.14)苯環(huán)6位上的氫基相比17號化合物(pIC50=5.85)6位上的氟基體積小,因此活性有所增加.
從圖4(b)中可以看出,Rb基團中苯環(huán)上2、5位有大片的藍色區(qū)域,表明此處引入帶正電的取代基有利于增加活性,例如:16號化合物(pIC50=6.14)苯環(huán)2位的H取代了17號化合物(pIC50=5.85)苯環(huán)2位的F,活性有所增加.除此之外,可以看到Rb基團中苯環(huán)4號位上的-NH-附近被紅色區(qū)域包圍,表明此處引入帶負電的基團可增加活性,例如:27號化合物(pIC50=5.76)與26號化合物(pIC50=5.61)相比在苯環(huán)4號位附近多了一個帶負電的-CH2-,因此活性有所增加.
圖4 Topomer CoMFA三維等勢圖(a)Rb立體等勢圖;(b)Rb靜電等勢圖.Fig.4 3D contours of Topomer CoMFA model(a) steric contour map of Rb;(b) electrostatic contour map of Rb.
利用Topomer Search對Rb基團進行虛擬篩選,挑選出貢獻值高且最大間距接近185的Rb基團10個.形成10個新分子,并對這10個新分子進行活性預(yù)測,最終保留活性高于22號模板分子的4個新分子和接近的2個新分子,分子結(jié)構(gòu)及預(yù)測活性值見表3.
利用Surflex-Dock技術(shù)進行分子對接,對接所使用的蛋白酶晶體結(jié)構(gòu)來源于PDB數(shù)據(jù)庫,其PDB ID為:4CHU,對接模式為SFXC.對蛋白酶進行分子對接前,把蛋白大分子中的晶體結(jié)構(gòu)從共晶配體中取出來,然后再用分子對接技術(shù)把晶體結(jié)構(gòu)重新接入共晶配體中,并且以原來的配體作為參考,如圖6所示,可以看到晶體結(jié)構(gòu)的構(gòu)象與配體對接后的構(gòu)象幾乎重疊.表明4CHU可以用來對新設(shè)計的分子進行分子對接.
表3 新設(shè)計分子的結(jié)構(gòu)和pIC50值預(yù)測
Table 3 Structures and predicted pIC50values of new designed molecules
No.StructurePred.pIC50019.32029.14038.89048.79058.64
晶體結(jié)構(gòu)進行預(yù)處理:加氫、加電荷、抽取原有配體、除去水分子和其他殘基及末端殘基.處理后的原型小分子與蛋白大分子的作用模式如圖5所示.
圖6 晶體結(jié)構(gòu)中共晶配體構(gòu)象與對接構(gòu)象疊合圖(綠色棒狀表示共晶配體對接構(gòu)象,紅色棒狀表示共晶配體構(gòu)象)Fig.6 Convergence of co-crystal ligand conformation and butt conformation in crystal structure (green bar indicates co-crystal ligand docking conformation, red bar indicates co-crystal ligand conformation)
將新設(shè)計的6個分子分別與蛋白大分子對接,其中01、02、03、04號分子總打分函數(shù)Total-score值大于6.通過01、02、03、04號分子分析Itk抑制劑與蛋白大分子的作用.圖7為分子對接的結(jié)果,圖中黃虛線代表氫鍵,綠色的代表氨基酸殘基,剩余部分則代表配體.表4為對接模型具體數(shù)值結(jié)果.
圖7(a)表示01號分子配體與氨基酸殘基形成了3個氫鍵,其中A/LYS391與配體中N的氫鍵距離為2.791 ?,A/MET438與配體中O的氫鍵距離為1.819 ?,與配體中H的氫鍵距離為2.608 ?.
表4 分子對接結(jié)果
圖7(b)表示02號分子配體與氨基酸殘基形成了5個氫鍵,A/LYS391與配體中的O形成了2個氫鍵,距離分別為2.550 ?和2.322 ?,A/MET438與配體中N的氫鍵距離為2.228 ?,A/SER371與配體中H的氫鍵距離為1.958 ?,A/ARG486與配體中H的氫鍵距離為1.977 ?.
圖7(c)表示03號分子配體與氨基酸殘基形成了6個氫鍵,A/ASP500與配體中的O形成了4個氫鍵,距離分別為2.153 ?、2.393 ?、2.519 ?和2.108 ?,A/MET438與配體中的N的氫鍵距離為2.134 ?,A/GLU436與配體中H的氫鍵距離為2.398 ?.
圖7(d)表示04號分子配體與氨基酸殘基形成了5個氫鍵,A/GLU436與配體中H的氫鍵距離為1.982 ?,A/MET438與配體中N的氫鍵距離為2.259 ?,A/CYS442與配體中O的氫鍵距離為1.838 ?,A/LYS391與配體中N形成了兩個氫鍵,氫鍵離分別為2.883 ?和2.544 ?.通過對分子對接圖分析,配體一般會與A/LYS391、A/MET438這兩個氨基酸殘基之間形成氫鍵.
為比較新設(shè)計分子與原分子對蛋白大分子的適配程度,此處選用原數(shù)據(jù)集中活性最高的22號分子進行分子對接,結(jié)果如圖8所示.從圖中可以看到配體與氨基酸殘基形成了2個氫鍵,A/LYS391與配體中N的氫鍵距離為2.251 ?,A/GLN373與配體中O的氫鍵距離為2.092 ?.所以新設(shè)計的分子與原數(shù)據(jù)集中的分子相比與大蛋白的適配程度更高,結(jié)合更穩(wěn)定,藥物藥物抑制病毒的作用也就更好.
圖7 a) 01號分子與4HCU氫鍵作用;b) 02號分子與4HCU氫鍵作用;c)03號分子與4HCU氫鍵作用;d) 04號分子與4HCU氫鍵作用(綠色棒狀表示氨基酸殘基,紫色虛線表示氫鍵)Fig.7 a) Hydrogen bonding between molecule No.01 and 4HCU; b) hydrogen bonding between molecule No.02 and 4HCU; c) hydrogen bonding with molecule No.3 and 4HCU; d) hydrogen bonding with molecule No.04 and 4HCU (green bar indicates amino acid Residue, purple dotted line indicates hydrogen bond)
圖8 原訓(xùn)練集22號分子與4HCU氫鍵作用Fig.8 Hydrogen bonding of the 22nd molecule and 4HCU in the original training set
本文采用Topomer CoMFA對37個吡唑啉嘧啶類IL-2誘導(dǎo)T細胞激酶抑制劑進行構(gòu)效關(guān)系建模,建立了3D-QSAR模型,其q2為0.728,r2為0.994,SEE為0.097.證明該模型對化合物活性具有可靠預(yù)測能力.之后通過對研究模型立體場和靜電場的三維等勢圖分析,確定了細胞激酶抑制劑的改造位點;進而設(shè)計出具有較高活性的4個細胞激酶抑制劑化合物,并通過分子對接探究配體和受體蛋白之間的作用關(guān)系,探明新設(shè)計的4個具有較高活性細胞激酶抑制劑與Itk蛋白的A/LYS391、A/MET438位點作用顯著,為設(shè)計吡唑啉嘧啶類抗感染性藥物提供了思路.