宋建軍, 趙 凌
(四川師范大學(xué) 數(shù)學(xué)與軟件科學(xué)學(xué)院,四川 成都 610068)
隨著我國工業(yè)的快速發(fā)展,水環(huán)境污染問題已經(jīng)十分嚴(yán)峻,研究出一種用時較短的可在線水質(zhì)檢測傳感器具有重要意義[1]。水質(zhì)污染程度主要根據(jù)化學(xué)需氧量(chemical oxygen demand,COD)、五日生化需氧量、水體含磷量、水體含氮量等指標(biāo)評價[2]。COD指水體中易被強(qiáng)氧化劑氧化的還原性污染物所消耗的氧化劑的量,結(jié)果折算成氧的量,主要反映了水中受還原性物質(zhì)污染的程度,是水體受有機(jī)物污染的綜合性指標(biāo),也是水質(zhì)檢測的重要參數(shù)[3]。檢測COD的化學(xué)方法有重鉻酸鉀法與高錳酸鹽指數(shù)法。用化學(xué)方法檢測COD精度雖然較高,但存在測定速度慢、耗時長、所用化學(xué)試劑會對環(huán)境造成二次污染、需要調(diào)配大量的人力和物力、操作過程復(fù)雜以及穩(wěn)定性差等問題;基于物理光譜學(xué)測量物質(zhì)含量的紫外吸收光譜法在水質(zhì)檢測中的應(yīng)用在近年來備受關(guān)注,紫外吸收光譜法通常結(jié)合多元線性回歸[4]、偏最小二乘回歸[5]或神經(jīng)網(wǎng)絡(luò)等模型測定水樣中的COD值[6]。但上述方法主要存在以下問題:未能考慮濁度對模型的影響,由于生活污水含有懸浮微粒和膠體,其從屬性上分析不屬于COD的范疇,但會對經(jīng)過水體中的光線產(chǎn)生散射和干擾吸收,對測量結(jié)果造成很大的影響[7~9]。
為了解決上述問題,本文提出了一種基于濁度補(bǔ)償和偏最小二乘回歸相結(jié)合的模型預(yù)測污水中COD值,屬于免化學(xué)試劑的物理檢測方法,具有快速準(zhǔn)確、可在線監(jiān)測、綠色無污染、泛化能力更強(qiáng)等優(yōu)點。
當(dāng)一束單色平行入射光通過均勻非散射的稀溶液時,溶液的吸光度A與溶液濃度c以及液層厚度b的乘積成正比,即
(1)
式中A為吸光度;I0為入射光強(qiáng)度;It為透射光強(qiáng)度;T為透光率;k為比例系數(shù),其與入射光波長、溫度和吸光物質(zhì)有關(guān);c為溶液濃度;b為液層厚度。A具有可加性,即對于不發(fā)生化學(xué)反應(yīng)的多組分體系,其在某一波長處的吸光度等于各組分在該波長處吸光度值A(chǔ)i(i=1,2,…,n)之和,即
A=A1+A2+…+An
(2)
根據(jù)朗伯—比爾定律可知溶液的吸光度與其所含物質(zhì)的濃度之間具有極強(qiáng)的相關(guān)性[10]。
設(shè)因變量為y,自變量記為x1,x2,…,xp,且共取得n個樣本,則自變量矩陣記為X=(xij)n×p。通常記 經(jīng)過標(biāo)準(zhǔn)化處理后的變量為F0,記X經(jīng)過標(biāo)準(zhǔn)化處理后的變量矩陣為E0=(E01,E02,…,E0p)n×p,則可從矩陣E0中提取第一個成分t1。提取的原則是成分t1能最大程度地代表E0,且t1和F0要具有很強(qiáng)的相關(guān)性,則
(3)
(4)
式中r(xi,y)為xi與y的相關(guān)系數(shù)。得到成分t1后可求E0的信息殘差矩陣E1,即求E0對t1的回歸方程及其所對應(yīng)的回歸系數(shù)p1得
(5)
將E1作為新的E0并重復(fù)上述提取成分和求殘差矩陣的步驟,假設(shè)共提取了A個成分,則分別實施F0對t1,t2,…,tA的多元線性回歸可得
(6)
式中FA為殘差項,由于t1,t2,…,tA可以表示成E01,E02,…,E0P的線性組合,式(6)可化簡為
(7)
將標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣E0和F0還原可得y對x1,x2,…,xp的回歸方程
(8)
提取成分的終止條件為交叉有效性準(zhǔn)則,在偏最小二乘回歸建模過程中并不需要將全部的成分t1,t2,…,tp提取。一個成分被提取的條件是:當(dāng)提取了這個成分后能否對模型的預(yù)測功能有明顯的改進(jìn)。對于因變量y,成分th的交叉有效性定義為
(9)
(10)
1)將鄰苯二甲酸氫鉀置于烘箱中在105 ℃條件下烘干2 h,干燥器中冷卻后稱取0.063 6 g,并倒入500 mL的燒杯中,緩慢加入350 mL蒸餾水并不停攪拌,待其完全溶解后滴加0.1 mL濃度為98 %的硫酸,用玻璃棒將溶液引流至500 mL的容量瓶中,并用蒸餾水定容,此時溶液的COD值為150 mg/L,稀釋得到濃度從1~150 mg/L共150組數(shù)據(jù)的COD標(biāo)準(zhǔn)溶液。2)稱取1 g硫酸肼溶于重蒸餾水中,定容至100 mL得到硫酸肼溶液;稱取10 g六次甲基四胺溶于重蒸餾水中,定容至100 mL得到六次甲基四胺溶液。分別吸取5 mL硫酸肼溶液和5 mL六次甲基四胺溶液于100 mL的容量瓶中,在25 ℃條件下反應(yīng)24 h后定容至標(biāo)線,配得濁度為400 NTU的濁度標(biāo)準(zhǔn)液,稀釋得到濃度從1~400NTU共400組數(shù)據(jù)的濁度標(biāo)準(zhǔn)溶液。
使用島津公司的UV—2450紫外可見分光光度計對配制的化學(xué)需氧量標(biāo)準(zhǔn)溶液和濁度標(biāo)準(zhǔn)溶液進(jìn)行光譜掃描,可獲得溶液在200~725 nm處波長的吸光譜。在200~725 nm波段中,并不是所有波長的吸光度都與COD值有較強(qiáng)的相關(guān)性。為了提高模型的分析性能、降低計算量、簡化模型,有必要對全波段的吸光度數(shù)據(jù)進(jìn)行特征提取,篩選出與COD有很強(qiáng)相關(guān)性的特征波長,以及具有代表性的特征波長,如光譜中最大吸收峰、波谷、肩峰、次峰所對應(yīng)的波長[11]。通過觀察COD標(biāo)準(zhǔn)溶液的紫外吸收光譜發(fā)現(xiàn),水樣的紫外吸收度在230,240,250,260,270 nm波長處有明顯的局部最大、最小值,如圖1所示。分別計算樣本的COD值與上述波長處吸光度的相關(guān)系數(shù),可發(fā)現(xiàn)COD值與這5處波長的吸光度均有很強(qiáng)的相關(guān)性。
圖1 水樣的原始紫外光譜
與此同時,根據(jù)已有研究發(fā)現(xiàn)濁度與545 nm波長處的吸光度有較強(qiáng)的相關(guān)性[12]。因此,用濁度標(biāo)準(zhǔn)液收集到的光譜數(shù)據(jù)定量分析濁度與230,240,250,260,270,545 nm處波長吸光度的關(guān)系,發(fā)現(xiàn)這6處吸光度與濁度之間均有較強(qiáng)的相關(guān)性,而COD標(biāo)準(zhǔn)溶液在545 nm處波長的吸光度與COD值相關(guān)性較弱,如表1、表2所示。因此,可選擇230,240,250,260,270 nm處波長的吸光度建立偏最小二乘回歸模型來預(yù)測COD值;用545 nm處的吸光度建立一元線性回歸模型預(yù)測濁度的大小。
表1 COD與各特征波長的相關(guān)系數(shù)
表2 濁度與各特征波長的相關(guān)系數(shù)
將紫外光譜段中的230,240,250,260,270 nm處波長的吸光度作為自變量記為x1,x2,…,x5,將COD標(biāo)準(zhǔn)溶液的COD值作為因變量并記為y1,用配制的COD標(biāo)準(zhǔn)溶液吸光度數(shù)據(jù)建立COD值關(guān)于吸光度的偏最小二乘回歸模型為
y1=-0.737 9-3.210 3x1+2.320 9x2+19.735 6x3+
20.486 7x4+21.359 3x5
(11)
在建立偏最小二乘回歸模型的過程中,當(dāng)提取第一個主成分時交叉有效性系數(shù)Q2=0.365 9>0.097 5,當(dāng)提取第二個主成分時交叉有效性系數(shù)Q2=0.016 4<0.097 5,因此共提取2個成分。模型擬合結(jié)果如圖2所示,擬合優(yōu)度R2高達(dá)0.987 6,說明建模效果很好。
圖2 模型的擬合效果
根據(jù)配制的濁度標(biāo)準(zhǔn)溶液的光譜數(shù)據(jù),將545 nm波長處的吸光度記為x6,溶液的濁度值記為y2,并分別求濁度y2關(guān)于x1,x2,…,x6的一元線性回歸方程
(12)
對于COD值未知的污水,分別測得其在230,240,250,260,270,545 nm波長處的吸光度,并記其數(shù)值為a1,…,a6。并將a6代入y2=f(x6)=-6.394 3+345.514x6中求得溶液的濁度值y2,再將y2分別代入xi=f-1(y2)(i=1,2,…,5,xi=f-1(y2)為y2=f(xi)的反函數(shù))可求得濁度在230,240,250,260,270 nm波長處所造成的吸光度x1,x2,…,x5。再對230,240,250,260,270 nm波長處的吸光度進(jìn)行濁度補(bǔ)償,即分別計算ai-xi(i=1,2,…,5)的結(jié)果,同時將其結(jié)果分別記為A1,A2,…,A5。因此,A1,A2,…,A5即為230,240,250,260,270 nm波長處將濁度影響排除后的吸光度。最后將A1,A2,…,A5同時代入偏最小二乘回歸方程(11)中即可計算出待測溶液的COD值。
分別從四川省各江河取樣進(jìn)行檢測,同時使用化學(xué)分析方法和所建模型對以上待測水樣的COD進(jìn)行檢測,其結(jié)果如表3所示。模型預(yù)測值的平均誤差為0.252 7,平均誤差率為4.568 %,均在國家環(huán)境類測量儀器指定的誤差范圍之內(nèi)。因此,所建模型具有良好的預(yù)測性能。
表3 模型預(yù)測效果
為了進(jìn)一步分析基于濁度補(bǔ)償?shù)钠钚《嘶貧w預(yù)測水樣COD值的效果,用未經(jīng)濁度補(bǔ)償?shù)钠钚《嘶貧w模型同時對水樣的COD值進(jìn)行預(yù)測。對兩個模型的預(yù)測結(jié)果比較如圖3所示。
圖3 預(yù)測曲線
可以看出基于濁度補(bǔ)償?shù)钠钚《嘶貧w的預(yù)測效果始終優(yōu)于未經(jīng)濁度補(bǔ)償?shù)钠钚《嘶貧w模型,而且未經(jīng)濁度補(bǔ)償?shù)钠钚《嘶貧w的預(yù)測值始終大于理論值。說明濁度的存在使得待測污水在230,240,250,260,270 nm處波長的吸光度比實際值偏高,從而使預(yù)測的COD值也偏高。
系統(tǒng)地介紹了紫外吸收法測量COD的原理和偏最小二乘回歸模型的方法,建立了COD預(yù)測模型,同時還將濁度對測量的影響考慮在內(nèi),并進(jìn)行了補(bǔ)償處理。通過實驗表明:所建模型的平均誤差為0.252 7,平均誤差率為4.568 %。本文為適應(yīng)性強(qiáng)、快捷準(zhǔn)確、無二次污染、免化學(xué)試劑的COD在線檢測傳感器的研發(fā)提供了算法基礎(chǔ)。
參考文獻(xiàn):
[1] 環(huán)境保護(hù)部科技標(biāo)準(zhǔn)司.水污染連續(xù)自動監(jiān)測系統(tǒng)運(yùn)行管理[M].北京:化學(xué)工業(yè)出版社,2008.
[2] 趙友全,李玉春,郭 翼,等.基于光譜分析的紫外水質(zhì)檢測技術(shù)[J].光譜學(xué)與光譜分析,2012,32(5):1301-1304.
[3] 趙 輝,王 勤,戚海燕,等.基于光吸收原理的化學(xué)需氧量傳感器設(shè)計與應(yīng)用[J].傳感器與微系統(tǒng),2014,33(12):73-75.
[4] 周 娜,羅 彬,廖 激,等.紫外吸收光譜法直接測定化學(xué)需氧量的研究進(jìn)展[J].四川環(huán)境,2006,25(1):84-87.
[5] 張穎萍,董前民,張章源,等.雙波長紫外光譜法檢測豬場污水實驗研究[J].中國農(nóng)機(jī)化學(xué)報,2015(3):145-148.
[6] 吳國慶,畢衛(wèi)紅,呂佳明,等.近紅外透射和紫外吸光度法檢測水質(zhì)化學(xué)需氧量的研究[J].光譜學(xué)與光譜分析,2011,31(6):1486-1489.
[7] 張榮標(biāo),馮 俊,謝志超.基于廣義回歸神經(jīng)網(wǎng)絡(luò)的COD在線檢測方法研究[J].儀器儀表學(xué)報,2008,29(11):2357-2361.
[8] 羅繼陽,魏 彪,湯 斌,等.水質(zhì)COD檢測用光譜法的水體環(huán)境濁度解算方法[J].環(huán)境科學(xué)與技術(shù),2015,38(12Q):246-250.
[9] 張國強(qiáng),康戈文,黃建國,等.紫外分光光度法測定水質(zhì)COD的技術(shù)研究[J].環(huán)境污染與防治,2007(4):1-6.
[10] 畢新勝,賈金亮,王玉剛,等.近紅外光譜技術(shù)在籽棉回潮率檢測系統(tǒng)的應(yīng)用[J].自動化儀表,2015,36(9):73-76.
[11] 夏阿林,葉華俊,周新奇,等.基于粒子群算法的波長選擇方法用于蘋果酸度的近紅外光譜分析[J].分析實驗室,2010,29(9):12-15.
[12] 侯迪波,張 堅,陳 泠,等.基于紫外—可見光光譜的水質(zhì)分析方法研究進(jìn)展與應(yīng)用[J].光譜學(xué)與光譜分析,2013,33(7):1839-1844.