張彭非, 潘 勇, 管 進(jìn), 蔣軍成
(南京工業(yè)大學(xué) 安全科學(xué)與工程學(xué)院, 江蘇 南京 210009)
近年來(lái),乙醇汽油的使用量快速增長(zhǎng)。美國(guó)能源獨(dú)立和安全法案強(qiáng)制要求,美國(guó)可再生能源的使用量要從2007年的90億加侖(1美制加侖約3.79升)上升到2020年的360億加侖[1]。發(fā)動(dòng)機(jī)爆震現(xiàn)象是由火焰前鋒未燃燒的燃料與空氣混合物的自燃引起的[2-3],是制約火花發(fā)動(dòng)機(jī)達(dá)到更高熱效率的一個(gè)重要因素,這種自燃現(xiàn)象產(chǎn)生的壓力波會(huì)對(duì)發(fā)動(dòng)機(jī)硬件造成嚴(yán)重?fù)p壞[4]。辛烷值是衡量包括乙醇汽油在內(nèi)的汽油產(chǎn)品抗爆性能的重要參數(shù),辛烷值越高,抗爆震性越強(qiáng)。因此,研究乙醇汽油的辛烷值,對(duì)其安全使用和儲(chǔ)存具有重要意義。
通過(guò)實(shí)驗(yàn)測(cè)定是目前獲取汽油辛烷值數(shù)據(jù)的最有效方法。根據(jù)ASTM D2699[5]和ASTM D2700[6]的規(guī)定,辛烷值分為研究法辛烷值(RON)和馬達(dá)法辛烷值(MON)兩種。通過(guò)實(shí)驗(yàn)測(cè)定來(lái)改善調(diào)試汽油樣品的辛烷值從而確定其最佳配比,不僅需要昂貴的實(shí)驗(yàn)儀器及設(shè)備,還需要花費(fèi)大量的時(shí)間及試劑樣品[7]。因此,有必要開(kāi)展汽油辛烷值的理論預(yù)測(cè)研究,建立可靠的理論預(yù)測(cè)模型,彌補(bǔ)實(shí)驗(yàn)方法的缺陷與不足。
目前,分析化學(xué)法是文獻(xiàn)上預(yù)測(cè)汽油辛烷值的常見(jiàn)方法。Ghosh等[8]、Lugo等[9]和Albahri等[10]通過(guò)色譜分析法來(lái)預(yù)測(cè)汽油辛烷值,平均誤差值約為4~7。Kardamakis等[11]、王宗明等[12]、史月華等[13]則通過(guò)近紅外光譜法對(duì)汽油辛烷值進(jìn)行預(yù)測(cè)研究。分析化學(xué)法的缺陷在于同樣需要用到相應(yīng)分析測(cè)試儀器,其運(yùn)轉(zhuǎn)、維護(hù)費(fèi)用較高,且耗時(shí)耗力。因此,采用各種理論算法來(lái)建立汽油辛烷值的預(yù)測(cè)模型受到廣泛關(guān)注。
定量結(jié)構(gòu)-性質(zhì)相關(guān)性(Quantitative structure-property relationship, QSPR)研究是一種根據(jù)分子結(jié)構(gòu)有效預(yù)測(cè)有機(jī)物理化性質(zhì)的理論方法。目前,相關(guān)研究者已應(yīng)用該方法對(duì)單一汽油組分的辛烷值進(jìn)行了預(yù)測(cè)研究[14-17]。然而,文獻(xiàn)中針對(duì)含乙醇汽油混合體系的混合物定量結(jié)構(gòu)-性質(zhì)相關(guān)性(M-QSPR)的研究鮮見(jiàn)。
在本研究中,從分子結(jié)構(gòu)角度出發(fā),以乙醇-汽油參比燃料混合物為研究對(duì)象,針對(duì)其研究法辛烷值開(kāi)展混合體系的M-QSPR研究,建立相應(yīng)的理論預(yù)測(cè)模型,揭示相應(yīng)的特征結(jié)構(gòu)因素及其影響規(guī)律,為工程上提供一種根據(jù)分子結(jié)構(gòu)快速預(yù)測(cè)乙醇-汽油參比燃料混合物辛烷值的新方法。
乙醇在改善發(fā)動(dòng)機(jī)爆震現(xiàn)象方面作用明顯[18-20]。與傳統(tǒng)汽油相比,乙醇汽油具有明顯更高的辛烷值。按照我國(guó)的國(guó)家標(biāo)準(zhǔn),乙醇汽油是用普通汽油與燃料乙醇調(diào)和而成。在目前國(guó)內(nèi)外相關(guān)研究中,通常以正參比燃料(異辛烷與正庚烷的混合物)作為汽油產(chǎn)品的替代燃料來(lái)測(cè)定或研究汽油的辛烷值。在此基礎(chǔ)上,筆者對(duì)實(shí)際乙醇汽油體系進(jìn)行簡(jiǎn)化,針對(duì)乙醇與汽油參比燃料的混合物(即乙醇-異辛烷-正庚烷三元混合物)開(kāi)展相關(guān)研究。
在本研究中所使用的乙醇-汽油參比燃料混合物實(shí)驗(yàn)樣本集均來(lái)源于文獻(xiàn)[21],總計(jì)有44個(gè)研究法辛烷值(RON)樣本。其中80%的樣本劃分為訓(xùn)練集(序號(hào)1-35),用于建立預(yù)測(cè)模型;20%的樣本劃分為測(cè)試集(序號(hào)36-44),用于模型的外部驗(yàn)證。詳細(xì)樣本數(shù)據(jù)見(jiàn)表1[21]。
在本研究中應(yīng)用分子結(jié)構(gòu)的簡(jiǎn)單表征(Simplex representation of molecular structure, SiRMS)描述符對(duì)乙醇-汽油參比燃料混合物的分子結(jié)構(gòu)特征進(jìn)行表征。SiRMS描述符是一種分子結(jié)構(gòu)參數(shù)描述符[22-23],它通過(guò)對(duì)分子進(jìn)行四原子碎片化實(shí)現(xiàn)混合體系分子結(jié)構(gòu)特征的表征。SiRMS描述符不僅可以表征分子的原子類型、鍵型,還能表征原子之間的拓?fù)浣Y(jié)構(gòu)等信息。SiRMS描述符總計(jì)有11種拓?fù)浣Y(jié)構(gòu)類型,具體見(jiàn)表2。SiRMS描述符的計(jì)算公式如式(1):
D=x1D1+x2D2+x3D3
(1)
式中,x1、x2、x3為各組分的摩爾系數(shù);D1、D2、D3為各組分中某個(gè)四原子碎片的數(shù)量。
根據(jù)表2的結(jié)構(gòu)劃分方式可知,本研究中使用樣本中涉及的SiRMS描述符共計(jì)25個(gè)。
表1 乙醇-汽油參比燃料混合物各組分比例及其RON值[21]Table 1 Compositions and the RON values of ethanol-primary reference fuel mixtures[21]
表2 四原子碎片拓?fù)浣Y(jié)構(gòu)類型Table 2 Topological structure types of tetratomic fragments
在本研究中應(yīng)用遺傳-多元線性回歸(GA-MLR)組合算法對(duì)上述SiRMS描述符進(jìn)行優(yōu)化篩選與建模,建立最優(yōu)的乙醇-汽油參比燃料混合物辛烷值線性預(yù)測(cè)模型。GA-MLR算法結(jié)合了遺傳算法GA的全局優(yōu)化搜索能力[24]和多元線性回歸MLR簡(jiǎn)便直觀的建模能力,具有較好的變量選擇和模型優(yōu)化效果。GA-MLR算法通過(guò)MATLAB軟件編寫(xiě),相關(guān)參數(shù)設(shè)置為:群體中個(gè)體的數(shù)目為100,交叉概率Pc為0.5,變異概率Pm為0.0001,最大遺傳代數(shù)為500。
隨后采用威廉姆斯圖[26]對(duì)模型的應(yīng)用域進(jìn)行分析。威廉姆斯圖的橫軸為杠桿值,反映了某一樣本與訓(xùn)練集中樣本在結(jié)構(gòu)上的相似性,用hi表示。如果杠桿值hi大于警告杠桿值h*,則表明該樣本與訓(xùn)練集樣本在結(jié)構(gòu)上存在較大差異。警告杠桿值h*的計(jì)算公式如式(2):
(2)
其中,p′表示用于建模的描述符個(gè)數(shù);n′表示訓(xùn)練集中樣本的總數(shù)量。
為了明確篩選出的特征結(jié)構(gòu)參數(shù)對(duì)辛烷值的影響程度大小,掌握其對(duì)辛烷值的影響規(guī)律,本研究中采用平均影響值法對(duì)所建模型中各描述符的相對(duì)重要程度進(jìn)行評(píng)價(jià),其計(jì)算公式如式(3)[27]:
(3)
式中,ME為平均影響值;J為模型中描述符的個(gè)數(shù);aj表示第j個(gè)描述符的回歸系數(shù);Dij為第j個(gè)描述符對(duì)于每個(gè)樣本的數(shù)值;m為描述符的個(gè)數(shù)。ME的符號(hào)為正值,表明該描述符與目標(biāo)屬性呈正相關(guān);ME符號(hào)為負(fù)值,表明該描述符與目標(biāo)屬性呈負(fù)相關(guān)。ME的數(shù)值越大,表示該描述符對(duì)模型的影響越大;反之,描述符對(duì)模型的影響越小。
針對(duì)訓(xùn)練集樣本,應(yīng)用GA-MLR算法對(duì)計(jì)算出的SiRMS描述符進(jìn)行優(yōu)化篩選和建模,確定與乙醇-汽油參比燃料混合物研究法辛烷值最為密切相關(guān)的2個(gè)分子碎片描述符,其名稱及含義見(jiàn)表3;最優(yōu)描述符子集所對(duì)應(yīng)的最佳MLR預(yù)測(cè)模型如式(4)所示:
(4)
式中,X11、X13為篩選出的分子碎片描述符;R2為模型復(fù)相關(guān)系數(shù);RMSE為均方根誤差;n為訓(xùn)練集樣本數(shù);p為模型顯著性概率。
表3 RON模型篩選出的特征描述符及其含義Table 3 Meanings of the selected descriptors for prediction model of RON
隨后,應(yīng)用所建模型對(duì)35個(gè)訓(xùn)練集樣本進(jìn)行校驗(yàn),以評(píng)價(jià)模型的擬合能力;同時(shí),應(yīng)用所建模型對(duì)未參與建模的測(cè)試集樣本進(jìn)行預(yù)測(cè),以驗(yàn)證模型的外部預(yù)測(cè)能力。模型對(duì)所有樣本的預(yù)測(cè)值見(jiàn)表1,預(yù)測(cè)值與目標(biāo)值的比較見(jiàn)圖1。
圖1 RON模型預(yù)測(cè)值與目標(biāo)值的比較Fig.1 Comparisons between the predicted and observed RON values for the prediction model
RON模型的主要性能參數(shù)見(jiàn)表4。從表4可以看出,對(duì)訓(xùn)練集和測(cè)試集樣本的預(yù)測(cè)RMSE分別為1.840和1.925,誤差較小且較為接近,表明模型同時(shí)具有較優(yōu)的預(yù)測(cè)能力及較強(qiáng)的泛化性能。
在此基礎(chǔ)上,對(duì)預(yù)測(cè)模型的殘差進(jìn)行分析,結(jié)果見(jiàn)圖2。由圖2可見(jiàn),樣本集樣本較為均勻地分布在0軸兩側(cè),不存在明顯的規(guī)律性,表明模型建立過(guò)程中未產(chǎn)生系統(tǒng)誤差。
表4 RON模型的主要性能參數(shù)Table 4 Main performance parameters of prediction model of RON
AAE—Average absolute error; APE—Average percentage error; SE—Standard error
為了進(jìn)一步對(duì)所建模型的穩(wěn)定性進(jìn)行分析,本研究應(yīng)用“Y-隨機(jī)性檢驗(yàn)”方法[28]對(duì)預(yù)測(cè)模型重復(fù)運(yùn)行50次,得到相對(duì)最優(yōu)模型的R2為0.032,不足原始模型R2的1/10。由此可見(jiàn),只有在辛烷值與特征描述符一一對(duì)應(yīng)時(shí)才能獲得準(zhǔn)確可靠的預(yù)測(cè)模型,說(shuō)明在本研究中所建立的預(yù)測(cè)模型不存在“偶然相關(guān)”現(xiàn)象,具備較強(qiáng)的穩(wěn)定性。
圖2 RON預(yù)測(cè)模型殘差圖Fig.2 Plot of the residuals versus the observed RON values for the prediction model
為了確保模型對(duì)外部樣本預(yù)測(cè)結(jié)果的準(zhǔn)確性和可靠性,需要對(duì)模型應(yīng)用域進(jìn)行分析,避免其產(chǎn)生不合理的預(yù)測(cè)結(jié)果,確保模型的外推能力。
本研究中采用威廉姆斯圖方法對(duì)模型的應(yīng)用域進(jìn)行分析,分析結(jié)果見(jiàn)圖3。其中,橫坐標(biāo)為樣本杠桿值,縱坐標(biāo)為樣本的標(biāo)準(zhǔn)化殘差。選取模型的3倍標(biāo)準(zhǔn)化殘差作為樣本預(yù)測(cè)殘差判斷界限。由圖3可知,模型的警告杠桿值h*為0.17,模型大部分樣本都位于警告杠桿值和殘差判斷界限所構(gòu)成的矩形區(qū)域內(nèi),該區(qū)域即為預(yù)測(cè)模型的應(yīng)用域,當(dāng)預(yù)測(cè)模型對(duì)位于該區(qū)域內(nèi)的樣本進(jìn)行預(yù)測(cè)時(shí),可以認(rèn)為預(yù)測(cè)結(jié)果是有效、可靠的。
為了進(jìn)一步明確模型中各描述符對(duì)乙醇-汽油參比燃料混合物辛烷值的影響程度大小及規(guī)律,應(yīng)用描述符重要度分析方法,對(duì)模型中各描述符的重要度進(jìn)行比較和分析。
圖3 RON預(yù)測(cè)模型的威廉姆斯圖Fig.3 Williams plot for prediction model of RON
(1)對(duì)乙醇-汽油參比燃料混合物的研究法辛烷值開(kāi)展了混合物的定量結(jié)構(gòu)-性質(zhì)相關(guān)性(M-QSPR)研究,應(yīng)用SiRMS描述符對(duì)混合體系的分子結(jié)構(gòu)特征進(jìn)行表征,應(yīng)用遺傳算法從大量描述符中優(yōu)化篩選出與乙醇-汽油參比燃料混合物辛烷值最為密切相關(guān)的結(jié)構(gòu)參數(shù),建立了相應(yīng)的辛烷值理論預(yù)測(cè)模型。模型驗(yàn)證及穩(wěn)定性分析結(jié)果表明,模型具有較優(yōu)的預(yù)測(cè)能力和泛化性能,且穩(wěn)定性較高。
(3)本研究為工程上提供了一種根據(jù)分子結(jié)構(gòu)參數(shù)快速預(yù)測(cè)乙醇-汽油參比燃料混合物辛烷值的新方法。
[1] MARINOV N. A detailed chemical kinetic model for high temperature ethanol oxidation[J].International Journal of Chemical Kinetics, 1999, 31(2): 183-220.
[2] HEYWOOD J B. Internal Combustion Engine Fundamentals[M].New York: McGraw-Hill, 1988:723.
[3] FIENGO G, GAETA A D, PALLADINO A, et al. Introduction to Internal Combustion Engines[M].London: Springer London, 2013: 408-415.
[4] KALGHATGI G T. Fuel/Engine Interactions[M].Warrendale: SAE International, 2014: 201-231.
[5] ASTM D2699-08, Standard Test Method for Research Octane Number of Spark-Ignition Engine Fuel[S].
[6] ASTM D2700-14, Standard Test Method for Motor Octane Number of Spark-Ignition Engine Fuel[S].
[7] 仇愛(ài)波, 周如金, 邱松山, 等. 汽油組分及汽油辛烷值預(yù)測(cè)方法研究進(jìn)展[J].天然氣化工(C1化學(xué)與化工), 2014, 39(2): 62-66. (QIU Aibo, ZHOU Rujin, QIU Songshan, et al. Review of octane number prediction methods for gasoline components and gasoline[J].Natural Gas Chemical Industry(C1 Chemistry and Chemical Industry), 2014,39(2): 62-66.)
[8] GHOSH P, HICKEY K J, JAFFE S B. Development of a detailed gasoline composition-based octane model[J].Industrial & Engineering Chemistry Research, 2006, 45(1): 337-345.
[9] LUGO H J, RAGONE G, ZAMBRANO J. Correlations between octane numbers and catalytic cracking naphtha composition[J].Industrial & Engineering Chemistry Research, 1999, 38(5): 2171-2176.
[10] ALBAHRI T A, RIAZI M R, ALQATTAN A A. Analysis of quality of the petroleum fuels[J].Energy & Fuels, 2003, 17(3): 689-693.
[11] KARDAMAKIS A A, PASADAKIS N. Autoregressive modeling of near-IR spectra and MLR to predict RON values of gasolines[J].Fuel, 2010, 89(1): 158-161.
[12] 王宗明, 華偉英, 程桂珍, 等. 近紅外光譜法測(cè)定汽油辛烷值和辛烷值儀的研制[J].石油煉制與化工, 1997, 28(1): 22-27. (WANG Zongming, HUA Weiying, CHENG Guizhen, et al. Determination of octane numbers of gasoline by FT-near infrared (FT-NIR) spectroscopy and the development of a FT-NIR octane number analyzer[J].Petroleum Processing and Petrochemicals, 1997,28(1): 22-27.)
[13] 史月華, 陸勇, 徐光明, 等. 主成分回歸殘差神經(jīng)網(wǎng)絡(luò)校正算法用于近紅外光譜快速測(cè)定汽油辛烷值[J].分析化學(xué), 2001, 29(1): 87-91. (SHI Yuehua, LU Yong, XU Guangming, et al. Principal component regression residual artificial neural network calibration algorithm applied in neat infrared fast measurement of gasoline octane number[J].Chinese Journal of Analytical Chemistry, 2001, 29 (1): 87-91.)
[14] 朱曉, 蔣軍成, 潘勇, 等. 基于支持向量機(jī)方法的烷烴辛烷值預(yù)測(cè)[J].天然氣化工(C1化學(xué)與化工), 2011, 36(3): 54-57. (ZHU Xiao, JIANG Juncheng, PAN Yong, et al. Prediction of octane numbers of alkanes based on support vector machine[J].Natural Gas Chemical Industry (C1 Chemistry and Chemical Industry), 2011, 36(3): 54-57.)
[15] MEUSINGER R, MOROS R. Determination of quantitative structure-octane rating relationships of hydrocarbons by genetic algorithms[J].Chemometrics & Intelligent Laboratory Systems, 1999, 46(1): 67-78.
[16] LIU Zhefu, ZHANG Linzhou, ELKAMEL A, et al. Multiobjective feature selection approach to quantitative structure property relationship (QSPR) models for predicting the octane number of compounds found in gasoline[J].Energy & Fuels, 2017, 31(6): 5828-5839.
[17] 王寧, 徐亦方. 一種用拓?fù)渲笖?shù)和基團(tuán)組成預(yù)測(cè)烷烴辛烷值的方法[J].石油學(xué)報(bào)(石油加工), 1998, 14(3): 67-73. (WANG Ning, XU Yifang. A new prediction method for antiknock of alkanes with topological indices and group composition[J].Acta Petrolei Sinica (Petroleum Processing Section), 1998, 14(3): 67-73.)
[18] HSIEH W D, CHEN R H, WU T L, et al. Engine performance and pollutant emission of an SI engine using ethanol-gasoline blended fuels[J].Atmospheric Environment, 2002, 36(3): 403-410.
[19] KAPUS P E, FUERHAPTER A, FUCHS H, et al. Ethanol direct injection on turbocharged SI engines-potential and challenges[C]//Detroit: SAE World Congress & Exhibition, 2007: 989-991.
[20] KAR K, CHENG W K, ISHII K. Effects of ethanol content on gasohol PFI engine wideopen- throttle operation[J].SAE International Journal of Fuels & Lubricants, 2009, 2(1): 895-901.
[21] ALRAMADAN A S, SARATHY S M, KHURSHID M, et al. A blending rule for octane numbers of PRFs and TPRFs with ethanol[J].Fuel, 2016, 180: 175-186.
[22] KUZ’MIN V E, ARTEMENKO A G, MURATOV E N. Hierarchical QSAR technology based on the simplex representation of molecular structure[J].Journal of Computer-Aided Molecular Design, 2008, 22(6-7): 403-421.
[23] MURATOV E N, VARLAMOVA E V, ARTEMENKO A G, et al. Existing and developing approaches for QSAR analysis of mixtures[J].Molecular Informatics, 2012, 31(3-4): 202-221.
[24] MERCADER A G, DUCHOWICZ P R, FERNNDEZ F M, et al. Replacement method and enhanced replacement method versus the genetic algorithm approach for the selection of molecular descriptors in QSPR/QSAR theories[J].Journal of Chemical Information & Modeling, 2010, 50(9): 1542-1548.
[25] TROPSHA A, GRAMATICA P, GOMBAR V. The Importance of being earnest: Validation is the absolute essential for successful application and interpretation of QSPR models[J].QSAR & Combinatorial Science, 2003, 22(1): 69-77.
[26] SAHIGARA F, MANSOURI K, BALLABIO D, et al. Comparison of different approaches to define the applicability domain of QSAR models[J].Molecules, 2012, 17(5): 4791-4810.
[27] 蔣軍成, 潘勇. 有機(jī)化合物的分子結(jié)構(gòu)與危險(xiǎn)特性[M].北京: 科學(xué)出版社, 2011: 224-226.
[28] RüCKER C, RüCKER G, MERINGER M. Y-randomization and its variants in QSPR/QSAR[J].Journal of Chemical Information & Modeling, 2007, 47(47): 2345-2357.