田廣軍,徐光耀,田 青
1.燕山大學(xué)電氣工程學(xué)院,河北 秦皇島 066004 2.Department of Electrical and Computer Engineering,McGill University,QC H3A 2A7,Canada
化學(xué)需氧量(chemical oxygen demand,COD)作為衡量水體有機(jī)物相對含量的指標(biāo),反映了水體受還原性物質(zhì)污染的程度,是水質(zhì)監(jiān)測的一個(gè)重要參數(shù)指標(biāo)。目前,國標(biāo)法檢測水質(zhì)仍以常規(guī)化學(xué)方法為主,應(yīng)用也較為廣泛,但這類測量方法過程較為復(fù)雜,測量時(shí)間較長,測量結(jié)果不能及時(shí)反應(yīng)水質(zhì)的變化情況[1-2]。紫外光譜分析法是依據(jù)光譜數(shù)據(jù)對污染物進(jìn)行定性定量分析的純物理光學(xué)檢測方法,相比于常規(guī)化學(xué)方法,紫外光譜法由于設(shè)備結(jié)構(gòu)簡單、無二次試劑污染、實(shí)時(shí)響應(yīng)速度快、易于實(shí)現(xiàn)在線定量分析等優(yōu)點(diǎn),得到了廣泛關(guān)注和深入研究[3-5]。
紫外光譜法利用朗伯-比爾定律分析COD與吸光度關(guān)系時(shí)常選用鄰苯二甲酸氫鉀(分子量M為204.22)溶液[7-8],在實(shí)際溶液紫外光譜分析中,在朗伯-比爾定律適用范圍內(nèi)達(dá)到某濃度值之后,其COD與吸光度明顯偏離了線性關(guān)系,這一點(diǎn)在許多學(xué)者的研究文獻(xiàn)中被論及和描述。李玉春在254和280 nm處測量的10~450 mg·L-1COD與吸光度關(guān)系曲線中,254 nm的數(shù)據(jù)在COD大于200 mg·L-1后開始上翹,280 nm的數(shù)據(jù)在COD大于250 mg·L-1后開始上翹;李家琛[6]在測量25~666 mg·L-1的九種不同濃度鄰苯二甲酸氫鉀溶液在263和280 nm處的吸光度時(shí),鄰苯二甲酸氫鉀溶液在225 mg·L-1后的濃度與吸光度關(guān)系曲線走勢發(fā)生明顯變化。
為了拓展光譜法溶液濃度測量范圍上限,在更寬范圍內(nèi)建立精確的溶液吸光度與COD關(guān)系模型,本文研究了COD為40~560 mg·L-1的鄰苯二甲酸氫鉀溶液的紫外吸收光譜,結(jié)合相關(guān)系數(shù)法、一元魯棒線性回歸和非線性最小二乘回歸建立了吸光度-COD的線性-指數(shù)分段數(shù)學(xué)模型,實(shí)現(xiàn)了鄰苯二甲酸氫鉀溶液COD的準(zhǔn)確預(yù)測。
實(shí)驗(yàn)材料選用0.850 2 mg·mL-1鄰苯二甲酸氫鉀標(biāo)準(zhǔn)溶液(COD值為1 000 mg·L-1)和重蒸水,采用標(biāo)準(zhǔn)溶液稀釋步驟配置得到COD值為40~680 mg·L-1的34個(gè)不同濃度的溶液樣品。激發(fā)光源選用Ocean Optics公司的光譜儀專用脈沖氙燈PX-2,具有220~750 nm的穩(wěn)定連續(xù)光譜輸出;光譜測量儀器選用Ocean Optics公司的S2000微型光纖光譜儀,其光譜響應(yīng)范圍為200~1 100 nm,光學(xué)分辨率為0.3~10 nm FWHM;透射支架選用Ocean Optics公司的CUV-ALL-UV 4-WAY比色皿支架,實(shí)驗(yàn)用樣品池均為紫外透射率85%以上的10 mm石英玻璃比色皿。
實(shí)驗(yàn)在溫度20 ℃(±0.5 ℃)濕度35%(±5%)的暗室中進(jìn)行,實(shí)驗(yàn)系統(tǒng)方框圖如圖1所示。
圖1 實(shí)驗(yàn)系統(tǒng)原理方框圖Fig.1 Block diagram of experimental system
在光譜實(shí)驗(yàn)數(shù)據(jù)采集前,先將光源打開預(yù)熱30 min。設(shè)置積分時(shí)間為10 ms、平均光譜參數(shù)為300、Boxcar平滑參數(shù)為3,選擇暗電流校正。按以下步驟使用OOIBase32光譜軟件進(jìn)行吸收光譜測量:單擊工具欄按鈕“Scope Mode”,檢查并調(diào)整光信號強(qiáng)度,使參考光信號的峰值強(qiáng)度為3 500 counts;單擊工具欄上的“Store Reference Spectrum”按鈕,將當(dāng)前參考光譜記錄到計(jì)算機(jī)光譜實(shí)驗(yàn)文件;遮擋光路并單擊“Store Dark Spectrum”按鈕,保存實(shí)驗(yàn)系統(tǒng)的暗電流光譜文件以備暗電流校正用;將樣品放置在比色皿支架中,單擊“Absorbance Mode”按鈕進(jìn)入吸光度測量模式,單擊“Save”按鈕并選擇文件路徑后,將吸收光譜保存到計(jì)算機(jī)磁盤進(jìn)行分析處理。
分別配置COD值為40,80,160,180,190,200,210,220,240,260,280,300,320,340,360,380,400,440,480,520,560,600,640和680 mg·L-1的24份樣品作為校正集,通過對校正集樣品和鄰苯二甲酸氫鉀標(biāo)準(zhǔn)溶液原液的紫外吸收光譜掃描,得到了較寬濃度范圍的校正集樣品COD-吸光度紫外吸收光譜,如圖2所示。利用光譜儀系統(tǒng)軟件內(nèi)置的平滑濾波功能,結(jié)合光譜觀察分析,除選取暗電流校正外,還設(shè)置了適當(dāng)大的時(shí)間窗口和波長窗口參數(shù),省去了附加濾波,避免了實(shí)驗(yàn)室條件下對原始數(shù)據(jù)的過度預(yù)處理。
從圖2可見,樣品的吸光度有明顯的波長選擇性,即樣品在220~300 nm之間有明顯的吸收特性,樣品的吸光度在320 nm之后幾乎為零。樣品紫外吸收光譜存在兩個(gè)較大的特征峰,第一個(gè)特征峰在233 nm左右,但隨著樣品COD濃度的增大,第一個(gè)特征峰發(fā)生紅移,向著第二個(gè)特征峰的方向逐漸偏移和靠攏,第二個(gè)特征峰的位置相對固定為275 nm。
圖2 校正集樣品COD-紫外吸收光譜圖Fig.2 COD-UV absorption spectra of samples in calibration set
通過相關(guān)系數(shù)法計(jì)算樣品COD與吸光度兩個(gè)向量之間關(guān)系的相關(guān)程度。相關(guān)系數(shù)R由式(1)計(jì)算
(1)
用Matlab軟件編程計(jì)算出樣品COD值與吸光度的相關(guān)系數(shù)隨波長變化曲線如圖3所示。
圖3 樣品COD與吸光度的相關(guān)系數(shù)隨波長變化曲線Fig.3 Correlation coefficient between absorbance and COD of sample
由圖3可見,樣品COD與吸光度的相關(guān)系數(shù)是隨波長變化的。對比圖2與圖3的波長變化范圍可知,雖然相關(guān)系數(shù)的變化波段比吸光度的變化波段有所擴(kuò)展,但可測范圍主要還是在220~300 nm之間。由于相關(guān)系數(shù)最大時(shí)的波長超出了圖2中的吸收范圍,選擇相關(guān)系數(shù)大于0.8的波段為優(yōu)勢波段,對應(yīng)的波長范圍為251.35~319.91 nm。由于第一個(gè)特征峰的紅移現(xiàn)象,峰值波長不固定,且低濃度時(shí)第一個(gè)特征峰不在優(yōu)勢波段范圍內(nèi),所以選擇第二個(gè)特征峰275 nm作為備選優(yōu)勢波長。
由于紫外吸收光譜法常用254和280 nm分析水質(zhì)COD[7-8],對比254,275和280 nm三處COD-吸光度數(shù)據(jù)走勢如圖4所示,同一樣品在不同波長下吸光度不同,但是隨著樣品濃度增加,三個(gè)波長下數(shù)據(jù)變化趨勢基本相同,低濃度階段符合朗伯-比爾定律,濃度較高時(shí)樣品COD與吸光度會(huì)偏離正比例關(guān)系,呈現(xiàn)類指數(shù)規(guī)律變化,由于275 nm波長對應(yīng)的關(guān)系曲線具有較好的吸光度動(dòng)態(tài)特性,所以選用實(shí)驗(yàn)所測的第二個(gè)特征峰波長275 nm作為優(yōu)勢波長進(jìn)行分析。
圖4 254.18,275和279.93nm波長的COD-吸光度曲線走勢對比Fig.4 Trend comparison of COD-absorbance data at 254.18,275 and 279.93 nm
本文利用一元魯棒線性回歸方法建立低濃度段COD與吸光度關(guān)系的數(shù)學(xué)模型,對較高濃度段采用一元非線性最小二乘回歸方法?;貧w算法分別采用Matlab工具箱中的robustfit函數(shù)和nlinfit函數(shù)?;诶碚摵蛯?shí)驗(yàn)分析,驗(yàn)證濃度較低時(shí)COD與吸光度成正比例關(guān)系,符合朗伯-比爾定律;確定濃度較高時(shí)吸光度與COD呈現(xiàn)的指數(shù)關(guān)系。
首先,計(jì)算各擬合模型對各假設(shè)模型臨界點(diǎn)的下一個(gè)數(shù)據(jù)點(diǎn)的預(yù)測相對誤差R,以R連續(xù)三次大于5%或小于-5%為判斷條件,取第一次符合判斷條件時(shí)對應(yīng)的假設(shè)模型臨界點(diǎn)為分段點(diǎn),然后根據(jù)所確定的模型臨界點(diǎn)對各段數(shù)據(jù)進(jìn)行分段回歸以獲得更精確的模型。
2.2.1 低濃度段模型
以COD值40 mg·L-1為起點(diǎn)、190~300 mg·L-1的8個(gè)數(shù)據(jù)點(diǎn)為假設(shè)模型臨界點(diǎn)分別進(jìn)行一元魯棒線性回歸,得到各個(gè)回歸模型的均方根誤差RMSE、對下一個(gè)數(shù)據(jù)點(diǎn)的預(yù)測COD、預(yù)測相對誤差R等參數(shù)如表1所示。
由表1可見,假設(shè)模型臨界點(diǎn)為300 mg·L-1之后的預(yù)測相對誤差R均小于-5%,且偏差越來越大,即低濃度段中,COD大于300 mg·L-1之后的溶液吸光度與COD關(guān)系,已經(jīng)不再符合線性回歸方程。所以,選擇COD為300 mg·L-1的數(shù)據(jù)點(diǎn)為低濃度段數(shù)據(jù)模型臨界點(diǎn)。
表1 各模型臨界點(diǎn)的回歸方程參數(shù)Table 1 Regression equation parameters of critical point for each model
在波長275 nm處對COD為40~300 mg·L-1的數(shù)據(jù)建立一元魯棒線性回歸模型,得到樣品COD值y和吸光度x關(guān)系的回歸方程為
y=0.524 4+271.431 4x
(2)
回歸方程曲線如圖5所示,用均方根誤差作為評價(jià)指標(biāo),校正模型的均方根誤差為5.130 7,對預(yù)測集的均方根誤差5.158 3。
圖5 低濃度段樣品COD-吸光度關(guān)系回歸曲線Fig.5 Regression curve of sample COD and its absorbance in low concentration range
2.2.2 較高濃度段模型
以COD值300 mg·L-1為起點(diǎn)、480~600 mg·L-1的4個(gè)數(shù)據(jù)點(diǎn)為假設(shè)模型臨界點(diǎn)分別進(jìn)行一元非線性最小二乘回歸,得到各個(gè)回歸模型的均方根誤差RMSE、對下一個(gè)數(shù)據(jù)點(diǎn)的預(yù)測COD、預(yù)測相對誤差R等參數(shù)如表2所示。
由表2可見,假設(shè)模型臨界點(diǎn)為560 mg·L-1之后的預(yù)測相對誤差R均小于-5%,且偏差越來越大,即較高農(nóng)度段中,用COD大于560 mg·L-1之后的數(shù)據(jù)點(diǎn)進(jìn)行一元非線性最小二乘回歸的回歸方程精度不理想,數(shù)據(jù)點(diǎn)再次發(fā)生偏離。所以,選擇COD為560 mg·L-1時(shí)的數(shù)據(jù)點(diǎn)為較高濃度段數(shù)據(jù)模型臨界點(diǎn)。
表2 各模型臨界點(diǎn)的回歸方程參數(shù)Table 2 Regression equation parameters of critical point for each model
在波長275 nm處對COD為300~560 mg·L-1的數(shù)據(jù)建立一元非線性最小二乘回歸模型,得到樣品COD值y和吸光度x關(guān)系的回歸方程為
y=2.182 5e1.595 2x+3.192 1
(3)
回歸方程曲線如圖6所示,用均方根誤差作為評價(jià)指標(biāo),校正模型的均方根誤差為7.117 5,對預(yù)測集的均方根誤差7.856 3。
圖6 較高濃度段樣品COD-吸光度關(guān)系回歸曲線Fig.6 Regression curve of sample COD and its absorbance in higher concentration range
令式(2)和式(3)相等,得到最終模型轉(zhuǎn)折點(diǎn)的COD值y=288.350 3,吸光度x=1.060 4,則獲得40~560 mg·L-1段樣品COD-吸光度關(guān)系的回歸曲線如圖7所示。
同時(shí),由表2可見,在模型臨界點(diǎn)560 mg·L-1后所建立的回歸方程對下一個(gè)數(shù)據(jù)點(diǎn)COD的預(yù)測誤差越來越大,進(jìn)一步分析COD-吸光度數(shù)據(jù)變化趨勢可知,275 nm處COD為560~1 000 mg·L-1的鄰苯二甲酸氫鉀溶液的吸光度為1.469~1.535,只增大了0.066,溶液濃度過高導(dǎo)致溶液吸光度接近飽和。
對校正集樣品在COD值為300~560,40~560以及40~560 mg·L-1的全范圍內(nèi)分別進(jìn)行紫外吸收光譜的數(shù)據(jù)一元魯棒線性回歸和一元非線性最小二乘回歸,計(jì)算回歸模型的均方根誤差,得到各個(gè)模型擬合精度如表3所示,其中RMSE是校正集均方根誤差。
圖7 樣品COD-吸光度關(guān)系分段回歸曲線Fig.7 Regression curve of absorbance and COD
表3 不同模型的擬合精度Table 3 Fitting accuracys of each model
由表3可知,對全濃度段校正集樣品紫外吸收光譜數(shù)據(jù)建模時(shí),線性模型性能很差,RMSE達(dá)到了41.175 0;非線性模型性能也不好,其擬合數(shù)據(jù)在低濃度段時(shí)的RMSE達(dá)到了10.085 8,約為線性-指數(shù)分段模型的兩倍,所以不能直接使用非線性模型對水體COD進(jìn)行測定。對較高濃度段校正集樣品紫外吸收光譜數(shù)據(jù)建模時(shí),線性模型的性能依然不好,RMSE達(dá)到了14.109 8,為線性-指數(shù)分段模型的兩倍多,所以也不能采取兩段線性模型對水體COD進(jìn)行測定。線性-指數(shù)分段模型的擬合精度最高。
重新配置COD值為40~560 mg·L-1的31份樣品作為預(yù)測集,用所建線性-指數(shù)分段模型對預(yù)測集樣品的預(yù)測數(shù)據(jù)如表4所示,預(yù)測效果如圖8所示。
用均方根誤差作為評價(jià)指標(biāo),所得測量模型對預(yù)測集樣本的預(yù)測效果如表5所示,其中RMSE是校正模型的均方根誤差,RMSEP是預(yù)測均方根誤差。
由表5可見,所建線性-指數(shù)分段模型對預(yù)測集275 nm處COD范圍為40~560 mg·L-1的溶液的預(yù)測效果較好,預(yù)測均方根誤差僅為5.664 7。
表4 預(yù)測集各樣品對應(yīng)的預(yù)測數(shù)據(jù)Table 4 Predictive data corresponding to the prediction set of each sample
圖8 模型預(yù)測效果圖Fig.8 Prediction effect diagram
表5 測量模型預(yù)測效果Table 5 Prediction effect of model
鄰苯二甲酸氫鉀溶液的紫外吸收光譜實(shí)驗(yàn)結(jié)果分析表明,當(dāng)溶液濃度增大到一定程度時(shí),吸光度與COD值會(huì)明顯偏離線性關(guān)系,低濃度段吸光度-COD關(guān)系模型的臨界點(diǎn)位于COD值300 mg·L-1附近,此臨界點(diǎn)之后的吸光度-COD關(guān)系已經(jīng)不再符合朗伯-比爾定律,在300~560 mg·L-1較高濃度范圍內(nèi)COD與吸光度的關(guān)系呈指數(shù)變化規(guī)律。模型變化的內(nèi)在機(jī)理及轉(zhuǎn)折點(diǎn)的影響因素有待進(jìn)一步探討。本工作所建線性-指數(shù)分段測定模型對預(yù)測集樣品的預(yù)測均方根誤差僅為5.664 7,預(yù)測效果較好。線性-指數(shù)分段數(shù)學(xué)模型的建立,提高了溶液COD紫外光譜測量方法的泛化能力,對于具有較高COD濃度的水體質(zhì)量參數(shù)測量提供了可行性實(shí)驗(yàn)及理論依據(jù)。