劉明地, 吳啟勛, 葉 丹
(青海民族大學化學與生命科學學院,青海 西寧 810007)
目前國際上對物質(zhì)的定量結(jié)構(gòu)與性質(zhì)之間的相關(guān)性研究是一個熱門問題,其中用拓撲指數(shù)與圖論來研究物質(zhì)的性質(zhì)成為熱點,分子的結(jié)構(gòu)決定分子的性質(zhì),從分子結(jié)構(gòu)提煉出的信息進行數(shù)值化即得到分子拓撲指數(shù)。用分子拓撲指數(shù)來進行定量結(jié)構(gòu)/性質(zhì)相關(guān)性(QSPR)研究是目前非?;钴S的領(lǐng)域。從維納指數(shù)[1]創(chuàng)建以來,人們已相繼提出數(shù)百種拓撲指數(shù)[2-9],利用這些拓撲指數(shù)來討論醚類化合物的性質(zhì)已經(jīng)取得了許多有益的結(jié)果。本文從距離矩陣、頂點鄰接矩陣、邊鄰接矩陣、關(guān)聯(lián)矩陣出發(fā),利用距離矩陣和頂點鄰接矩陣兩矩陣之積M矩陣的特征值T、邊鄰接矩陣的特征值B、關(guān)聯(lián)矩陣特征值C、支化度P以及碳原子數(shù)n,對醚類化合物的辛醇/水分配系數(shù)(Kow)及溶解度(S)進行關(guān)聯(lián),結(jié)果表明利用這種拓撲指數(shù)能很好地預測醚類化合物辛醇/水分配系數(shù)(Kow)及溶解度(S)。
醚類化合物的分子是由碳碳單鍵、碳氧單鍵、碳氫單鍵組成,為了能夠更清晰地看出醚類分子的結(jié)構(gòu),將分子中的碳氫單鍵隱去,以碳氧元素所構(gòu)成的骨架來寫出醚類分子的頂點鄰接矩陣和距離矩陣。對雜原子的處理,我們考慮到原子電負性化合物性質(zhì)的影響,將氧原子與碳原子的電負性之比作為碳氧單鍵之間的距離,將碳原子的電負性之比作為碳碳單鍵之間的距離。以甲基丙基醚(CH3OCH2CH2CH3)為例:碳原子與氧原子之間的距離為3.44/2.55=1.3490,碳原子與碳原子之間的距離為2.55/2.55=1,則其頂點鄰接矩陣A和距離矩陣D為:
將距離矩陣D與頂點鄰接矩陣A相乘得到矩陣M:
利用 MATLAB 7.0.1 可以求出矩陣 M 的特征值為:a1=12.8104,a2= - 5.6861,a3=0.0000,a4=1.3704,a5=0.9014。將矩陣M的最大特征值定義為拓撲指數(shù)T=a1=12.8104。該拓撲指數(shù)是從醚分子的頂點鄰接矩陣和距離矩陣演算而來的,毋庸置疑,其可以反映醚分子的結(jié)構(gòu)特點。再結(jié)合醚分子的支化度P和碳原子個數(shù)n以及邊鄰接矩陣和關(guān)聯(lián)矩陣的最大特征值B,C(值得注意的是在求關(guān)聯(lián)矩陣的特征值時需經(jīng)過技術(shù)處理在關(guān)聯(lián)矩陣之前加一列常數(shù)1)等因素進行擬合,結(jié)果表明可以很好地預測醚類化合物的辛醇/水分配系數(shù)(Kow)及溶解度(S)。
P2,P3,-log Kow,-log S來自文獻[10-11],結(jié)果見表1。
表1 醚的有關(guān)拓撲指數(shù)、辛醇/水分配系數(shù)的-log Kow值及溶解度的-log S值
將 T,P2,P3,n,B,C 分別與醚的辛醇/水分配系數(shù)(Kow)及溶解度(S),通過 SPSS 13.0 進行多元線性逐步回歸擬合,得到分配系數(shù)的線性回歸方程
其中 T的標準回歸系數(shù)為 0.873,C 的標準回歸系數(shù)為 0.215,并由此得到 R=0.993,R2=0.986,S=0.052357,F(xiàn)=264.280,sig=0.000,N=11。溶解度的線性回歸方程
其中 T的標準回歸系數(shù)為 0.710,P2的標準回歸系數(shù)為 0.344,并由此得到 R=0.993,R2=0.986,S=0.100499,F(xiàn)=284.199,sig=0.000,N=11。
2.3.1 F 檢驗,t檢驗
從所建立的線性回歸模型方程的相關(guān)系數(shù)可知:R都等于0.993,與文獻[10-11]中相當,屬于良級標準,F(xiàn)值較大,S值較小,sig=0.000,說明所建的回歸模型有意義。標準回歸系數(shù)也指出,本文自定義的拓撲指數(shù)標準系數(shù)最大,是影響-log Kow和-log S的關(guān)鍵因素,并且順利通過t檢驗,說明系數(shù)有意義,模型比較穩(wěn)定。最后我們做了預測值與實驗值之間的比較(見表2),發(fā)現(xiàn)預測值與實驗值之間基本吻合,誤差較小。綜上所述,所建回歸模型可以很好地預測醚類化合物的辛醇/水分配系數(shù)(Kow)及溶解度(S)。
2.3.2 殘差分布圖
從殘差分布圖(圖1,圖2)可知,所建模型的殘差符合正態(tài)分布,-log Kow的殘差集中在[-0.100,0.100]范圍之間,-log S 的殘差集中在[-0.200,0.200]范圍之間,說明所建模型預測值殘差小。通過檢驗,預測值與實驗值非常接近。
表2 醚的-log Kow和-log S計算值與實驗值比較
圖1 醚的-log Kow殘差分布圖
圖2 醚的-log S殘差分布圖
2.3.3 模型穩(wěn)定性評價
為了說明模型的穩(wěn)定性和對外部樣本的預測能力,對模型進行了留一法(LOO)交互檢驗。留一法交互檢驗是評價模型穩(wěn)定性和對外部樣本預測能力最重要也最有效的一種方法。交互檢驗如下:
-log Kow 的交互檢驗結(jié)果:N=11,R=0.986,S=0.066233,F(xiàn)=326.284;
-log S 的交互檢驗結(jié)果:N=11,R=0.985,S=0.138340,F(xiàn)=295.113。
交互檢驗結(jié)果顯示留一法得到的預測值與實驗值之間的相關(guān)性非常好,說明所建模型很穩(wěn)定,對外部樣本的預測能力很好。
通過對模型的回歸分析可知醚類化合物的辛醇/水分配系數(shù)(Kow)及溶解度(S)與距離矩陣、頂點鄰接矩陣、邊鄰接矩陣、關(guān)聯(lián)矩陣出發(fā)所定義的參數(shù)有密切的關(guān)系。本文所構(gòu)建的拓撲指數(shù)對醚類化合物的QSPR研究是可行的,能夠很好地預測醚類化合物的辛醇/水分配系數(shù)(Kow)和溶解度(S)。
[1]Wiener H.Structural determination of paraffin boiling points[J].J.Am.Chem.Soc.,1947,69(1):17-20.
[2]Hosoya H.Topological index.A proposed quantity characterizing the topological nature of structural isomers of saturated hydrocarbons[J].Bull.Chem.Soc.Jpn.,1971,44(9):2332-2339.
[3]Randic M.On characterization of molecular Branching[J].J.Am.Chem.Soc.,1975,97(23):6609-6615.
[4]肖方竹,聶長明,彭國文,等.量子拓撲指數(shù)法預測多氯聯(lián)苯醚的熱力學性質(zhì)[J].化工學報,2011,62(7):1808-1816.
[5]姜賽紅,聶長明,林達,等.誘導效應(yīng)描述符與胺、醇、醚類化合物電離能的關(guān)系[J].分子科學學報,2007,23(6):410-415.
[6]聶長明,彭國文,肖方竹,等.單硫醚氣相色譜保留指數(shù)拓撲化學研究[J].分析化學,2006,34(11):1560-1564.
[7]彭國文,聶長明,肖方竹,等.拓撲指數(shù)與路徑數(shù)預測單硫醚氣相色譜保留指數(shù)[J].南華大學學報:自然科學版,2006,20(1):1-4.
[8]許祿.化學計量方法[M].北京:科學出版社,1995.
[9]Balaban A T.Chemical graphs:looding back and glimpsing ahead[J].J.Chem.Inf.Comput.Sci.,1995,35(3):339-350.
[10]周長會,吳啟勛,祁正興.拓撲指數(shù)在醚中的應(yīng)用[J].山西大同大學學報:自然科學版,2012,28(3):42-44.
[11]羅北平,任碧野,鄧超群.有機物溶解度和辛醇/水分配系數(shù)的QSPR研究[J].湘潭大學自然科學學報,2000,22(2):63-67.