李美萍,張生萬
(山西大學(xué)生命科學(xué)學(xué)院,太原030006)
磺胺類藥物是一種典型的作為飼料添加劑和疾病防治的獸藥,在國內(nèi)外養(yǎng)殖業(yè)中廣泛使用.在動物養(yǎng)殖的應(yīng)用過程中很大部分會隨糞便排出體外而進(jìn)入環(huán)境. 磺胺類藥物一旦進(jìn)入環(huán)境會分布到土壤、水和空氣中,即開始在水體、懸浮物、土壤等環(huán)境介質(zhì)中發(fā)生遷移、轉(zhuǎn)化、吸附等一系列過程[1]. 而在環(huán)境介質(zhì)中的吸附和遷移行為是決定環(huán)境中磺胺類藥物分布和殘留的重要過程,其吸附行為與其電離常數(shù)pKa 有關(guān),盡管常見磺胺類藥物的pKa 值可以通過實驗確定或從相關(guān)手冊上查到,但是通常實驗得到的pKa 值的方法比較繁瑣,不僅如此,在某些情況下,實驗測定值還存在較大不確定性. 因此,研究磺胺類化合物的結(jié)構(gòu)和pKa 值之間的定量關(guān)系以及從理論和計算上尋找有效和可靠的預(yù)測pKa 值的方法十分重要. 李玉琴[2]曾報道了基于啟發(fā)式和基因表達(dá)式編程法預(yù)測磺胺類藥物的pKa 值,但關(guān)于三維全息原子場作用矢量(three-dimensional holographic vector of atomic interaction field,3D-HoVAIF)描述子用于磺胺類藥物的pKa 值預(yù)測還未見有關(guān)文獻(xiàn)報道. 最近,我們從磺胺類藥物的分子結(jié)構(gòu)出發(fā),提出了一個簡單而有效的方法來計算其pKa 值.通過使用定量結(jié)構(gòu)- 性質(zhì)相關(guān)(quantative-structure property relationonship,QSPR)方法,并結(jié)合三維全息原子場作用矢量參數(shù),對31 個磺胺類化合物的pKa 值進(jìn)行了預(yù)測,獲得比較滿意的結(jié)果.此研究不但可以對該類化合物的pKa 值進(jìn)行預(yù)測,還有助于對其在環(huán)境中的作用機理的研究.
三維全息原子場作用矢量(three-dimensional holographic vector of atomic interaction field,3DHoVAIF)[3]從原子之間相對距離和原子的自身性質(zhì)出發(fā),基于三種原子間非鍵作用方式—靜電、立體和疏水作用,將有機分子中常見的氫、碳、氮、磷、氧、硫、氟、氯、溴、碘原子分別按其所處元素周期表中不同主族劃分為5 大類,為了能充分表達(dá)分子的細(xì)微結(jié)構(gòu)特征,又將不同主族中原子按其雜化狀態(tài)分為10 類,這樣分類后一個分子內(nèi)部不同類別的原子之間,相互作用情況就有55 種. 由于3D-HoVAIF 分別采用靜電、立體和疏水三種勢能來表達(dá)原子間不同的作用形式,所以,對于一個有機分子而言,用于表征分子結(jié)構(gòu)信息的原子作用項就有3 ×55 =165 個. 這些三維矢量描述子可以不借助任何實驗參數(shù)得到. 其具體的描述公式參見文獻(xiàn)[3-6],在此不再贅述.
本文研究的31 種磺胺類藥物及其pKa 值來自于文獻(xiàn)[2],其名稱見表1. 使用Chemoffice8.0 繪制31 種磺胺類藥物的分子結(jié)構(gòu)圖,用Chem3D 自帶的MOPAC 半經(jīng)驗量子化學(xué)軟件在AM1 水平上最終優(yōu)化得到分子空間結(jié)構(gòu)(截斷值0.001KJ/mol),并采用Mulliken 布居分析法以單點(singlepoint)形式計算出原子的凈電荷數(shù)量,將分子中每個原子的空間位置及電荷分別以笛卡兒坐標(biāo)和凈電子數(shù)目的形式輸入 C 語言應(yīng)用程序3DHoVAIF. exe 加以處理,得到分子的3D-HoVAIF 描述子.
表1 磺胺類藥物名稱及pKa 值Table 1 Name and pKa values of sulfonamides
本文以R (建模相關(guān)系數(shù)),Rcv (交互檢驗相關(guān)系數(shù)),RMSEF (擬合誤差)和RMSEP (預(yù)測誤差)作為衡量模型預(yù)測能力的標(biāo)準(zhǔn). 關(guān)于模型建立過程中訓(xùn)練集和測試集的樣本選取,我們按照參考文獻(xiàn)[2]從31 個樣本中選取10 個樣本作為測試集,其余的21 個樣本作為訓(xùn)練集,選取的測試集在表1 中用“* ”號標(biāo)出.
為了研究3D-HoVAIF 描述子與磺胺類藥物pKa 值的內(nèi)在聯(lián)系,本文使用三維全息原子場作用矢量165 個描述子進(jìn)行逐步回歸 (Stepwise Multiple Regression,SMR),選出顯著性變量,分別采用多元線性回歸(Multiple Lines Regression,MLR)和偏最小二乘回歸 (Partial Least Square Regression,PLS)進(jìn)行建模. 并采用留一法交互檢驗對模型的穩(wěn)定性和預(yù)測能力進(jìn)行評估.
2.2.1 多元線性回歸
在多元線性回歸過程中,為了消除變量間偶然相關(guān)的影響,剔除影響模型穩(wěn)定性的自變量,使回歸方程始終顯著,需要在多元回歸分析中引入逐步回歸的方法. 本文采用SPSS 統(tǒng)計學(xué)軟件對變量進(jìn)行逐步回歸分析,得到如下方程:
其中,E 表示靜電作用. 如,E5-9表示第5 類N 原子與第9 類S 原子的靜電作用項,即sp3雜化的N原子與sp2雜化的S 原子之間的靜電作用;E8-8表示第8 類S 原子與第8 類S 原子的靜電作用項,即sp3雜化的S 原子與sp3雜化的S 原子之間的靜電作用;以此類推. 根據(jù)本實驗建立的模型能夠看出,sp3雜化的N 原子與sp2雜化的S 原子之間的靜電作用對磺胺類藥物的pKa 影響較大,且呈負(fù)相關(guān). 使用上述模型對31 個磺胺類化合物的pKa值進(jìn)行估計與預(yù)測,并將計算結(jié)果與實驗值相關(guān)情況繪于圖1 中.
2.2.2 偏最小二乘回歸
為了檢驗?zāi)P偷姆€(wěn)定性,繼而用偏最小二乘回歸方法進(jìn)行建模. 為保證變量單位空間尺度一致,首先采用自定標(biāo)法對原始變量標(biāo)準(zhǔn)化處理,隨后用化學(xué)計量學(xué)軟件Simca -p10.0 對訓(xùn)練集樣本建模,并以交叉檢驗最高值(交叉檢驗Y 的解釋方差)所對應(yīng)的主成分?jǐn)?shù)2 作為模型的復(fù)雜程度. 由4 個變量提取2 個主成分解釋了Y 變量89.6%方差,交叉檢驗解釋Y 的方差為78.3%,其結(jié)果見表2. 同時將pKa 值實驗值與預(yù)測值對比結(jié)果繪于圖1 中. 從圖1 和表2 可見PLS 計算結(jié)果與多元線性回歸結(jié)果基本吻合,說明所選模型具有較好的穩(wěn)定性和預(yù)測能力.
圖1 pKa 實驗值與預(yù)測值相關(guān)Fig.1 Plot of calculated value and experimental value
文獻(xiàn)1 運用啟發(fā)式方法(HM)和基因表達(dá)式編程(GEP)方法建立了磺胺類藥物pKa 值預(yù)測模型,為了便于比較將其結(jié)果與本文基于3D -HoVAIF 描述子建模的相關(guān)數(shù)據(jù)列表2.
表2 磺胺類藥物pKa 值QSPR 模型比較Table 2 Contrast of QSPR models for pKa values of sulfonamides
從表2 可看出,采用3D-HoVAIF 所建模型和文獻(xiàn)2 建模所得相關(guān)系數(shù)和交互檢驗復(fù)相關(guān)系數(shù)相當(dāng),但3D-HoVAIF 計算簡便,結(jié)構(gòu)參數(shù)的取值完全來自分子本身的結(jié)構(gòu),描述子的物理意義明確且所建的線性模型可以識別和提供對這些化合物的pKa 值起作用的描述符.
研究結(jié)果表明了靜電作用是影響磺胺類藥物pKa 值的主要因素,尤其是sp3雜化的N 原子與sp2雜化的S 原子之間的靜電作用對磺胺類藥物的pKa 值影響較大,且呈負(fù)相關(guān). 同時從本文的結(jié)果看出3D-HoVAIF 能夠較好地表征磺胺類藥物分子的結(jié)構(gòu)信息,具有計算簡便、物理意義明確的優(yōu)點,并且避免了當(dāng)今大多3D 分子設(shè)計技術(shù)在應(yīng)用前需要對分子進(jìn)行疊合操作等方面缺點,將其應(yīng)用在其他抗癌藥物活性[7-10]研究方面也取得了一定的效果,顯示出3D-HoVAIF 較為廣闊的應(yīng)用前景.
[1] He J H,Qiu J R,He D C,et al. Environmental behavior and related control technologies of sulfonamides[J]. Guangdong Agri. Sci.,2012,7:225(in Chinese)[何金華,丘錦榮,賀德春,等. 磺胺類藥物的環(huán)境行為及其控制技術(shù)研究進(jìn)展[J]. 廣東農(nóng)業(yè)科學(xué),2012,7:225][2] Li Y Q,Si H Z,Xiao Y L,et al. Quantitative structure activity relationship models based on heuristic method and gene expression programming for the prediction of the pKa values of sulfa drugs[J]. Acta Pharm. Sin.,2009,44(5):486(in Chinese)[李玉琴,司宏宗,肖玉良,等.基于啟發(fā)式和基因表達(dá)式編程法預(yù)測磺胺類藥物的pKa 值[J]. 藥學(xué)學(xué)報,2009,44 (5):486]
[3] Zhou P,Tian F F,Li Z L. Three dimensional holographic vector of atomic interaction field(3D - HoVAIF)[J]. Chem. Intell. Lab. Syst.,2007,87:88.
[4] Tong J B,Zhou P,Zhang S W,et al. QSAR studies of anti-HIV drug HEPT using (3D -HoVAIF)[J].Acta Phys. Chim. Sin.,2006,22:721(in Chinese)[仝建波,周鵬,張生萬,等.三維全息原子場作用矢量用于HEPT 類抗艾滋病藥物的QSAR 研究[J].物理化學(xué)學(xué)報,2006,22:721]
[5] Zhou P,Mei H,Tian F F,et al. Applying novel three dimensional holographic vector of atomic interaction field to QSAR studies for several classical drug systems[J]. Chem. J. Chin. Univ.,2007,28(6):1027(in Chinese)[周鵬,梅虎,田菲菲,等. 新型三維原子場全息相互作用矢量用于幾類典型藥物體系的QSAR 研究[J]. 高等學(xué)?;瘜W(xué)學(xué)報,2007,28(6):1027]
[6] Li M P,Zhang S W. QSAR studies of 5'-methylthioadenosine nucleosidase inhibitors using three -dimensional holographic vector of atomic interaction field[J]. J. Anal. Sci.,2011,27(5):566 (in Chinese)[李美萍,張生萬. 三維全息原子場作用矢量用于5' -甲硫腺苷核苷酶抑制劑的QSAR 研究[J]. 分析科學(xué)學(xué)報,2011,27(5):566]
[7] Tong J B,Wang P,Li Y F,et al. Quantitative structure activity relationship studies of 5 -pheny-1 -phebylamino-1H - imidazole of Anti - HIV drug using three-dimensional descriptors[J]. J.At.Mol.Phys.,2011,28(1):41(in Chinese)[仝建波,王平,李云飛,等. 咪唑衍生物類抗艾滋病藥物3D -QSSR 研究[J]. 原子與分子物理學(xué)報,2011,28(1):41]
[8] Tong J B,Chen Y,Che T,et al. Quantitative structure activity relationship studies of anti - tuberculosis drug using three - dimensional structure descriptors[J]. J. At. Mol. Phys.,2012,29(3):382(in Chinese)[仝建波,陳洋,車挺,等. 酰肼類抗結(jié)核病藥物的3D - QSAR 研究[J]. 原子與分子物理學(xué)報,2012,29(3):382]
[9] Xu L N,Liang G Z,Li Z L,et al. Three-dimensional holographic vector of atomic interaction field for quantitative structure - activity relationship of Aza -bioisosteres of anthrapyrazoles (Aza - APs)[J]. J.Mol. Graph. Model.,2008,26:1252.
[10] Zhu W P,Liang G Z,Liao L M,et al. Chemical structural characterization and design of influenza neuram inidase inhibitors using three - dimensional holographic vector of atomic interaction field through quantitative structure-activity relationship studies[J]. Chinese J.Anal.Chem.,2008,36(6):799(in Chinese)[朱萬平,梁桂兆,廖立敏,等. 三維全息原子場作用矢量(3D-HoVAIF)用于神經(jīng)氨酸酶抑制劑的結(jié)構(gòu)表征與設(shè)計及定量構(gòu)效關(guān)系(QSAR)研究[J]. 分析化學(xué),2008,36(6):799]