張 強(qiáng),魏儒義,嚴(yán)強(qiáng)強(qiáng),趙玉迪,張學(xué)敏,于 濤
1. 中國(guó)科學(xué)院西安光學(xué)精密機(jī)械研究所,中國(guó)科學(xué)院光譜成像技術(shù)重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710119 2. 中國(guó)科學(xué)院大學(xué)光學(xué)學(xué)院,北京 100049
大氣污染防治是當(dāng)前環(huán)保工作的重點(diǎn)之一,而大氣中濃度過(guò)高的揮發(fā)性有機(jī)化合物(volatile organic compounds,VOCs)嚴(yán)重影響了空氣質(zhì)量、氣候變化以及人類的健康[1]。 VOCs主要包括烴類、苯系物、氯化物、有機(jī)酮、胺、醇、醚、酯、酸和石油烴化物等,它們可通過(guò)呼吸道進(jìn)入人體,造成纖維化肺泡炎、肺癌等嚴(yán)重危害,此外作為臭氧(O3)和細(xì)顆粒物(PM2.5)的重要前體物,嚴(yán)重危害環(huán)境質(zhì)量[2-3]。 全面防治大氣污染的前提是準(zhǔn)確監(jiān)測(cè)大氣中VOCs的濃度,遙感-傅里葉變換紅外光譜(remote sensing-Fourier transform infrared spectroscopy, RS-FTIR)技術(shù)由于其多通道、高通量、低雜散光且不需要進(jìn)行樣品制備和處理等優(yōu)點(diǎn),可實(shí)現(xiàn)大范圍下的多組分實(shí)時(shí)監(jiān)測(cè), 測(cè)量速度快,檢測(cè)精度高,廣泛應(yīng)用于國(guó)內(nèi)外的大氣監(jiān)測(cè)領(lǐng)域[4-5]。
利用FTIR紅外光譜對(duì)多組分VOCs進(jìn)行濃度反演需要進(jìn)行多元分析,傳統(tǒng)的多元分析方法包括最小二乘法(CLS)、偏最小二乘法(PLS)、卡爾曼濾波法(KFM)、主成分回歸法(PCR)、非線性最小二乘擬合(NLSF)等。 有報(bào)道采用非線性模型多項(xiàng)式偏最小二乘法(polynomial partial least square, PPLS),對(duì)苯和氯仿的濃度預(yù)測(cè)均方根誤差分別達(dá)到了0.043和0.087。 2011年,馮明春[6]等采用非線性最小二乘法擬合乙炔(C2H2)和乙烷(C2H6)的混合氣體,擬合均方根誤差分別為0.088和0.104。 在實(shí)際測(cè)量中,由于待測(cè)樣品中各個(gè)組分之間的相互影響以及儀器自身的背景噪聲會(huì)使近紅外吸收光譜與樣品濃度之間存在一定程度的非線性關(guān)系,尤其是當(dāng)樣品濃度范圍較大時(shí)非線性更加嚴(yán)重,而對(duì)這種非線性關(guān)系的擬合能力則是準(zhǔn)確預(yù)測(cè)的關(guān)鍵。 相比于傳統(tǒng)的化學(xué)計(jì)量學(xué)方法,以反向傳播人工神經(jīng)網(wǎng)絡(luò)(back-propagation artificial neural network,BP-ANN)為代表的深度學(xué)習(xí)回歸方法可以逼近一些非線性關(guān)系的函數(shù),越來(lái)越多的科學(xué)研究人員將其應(yīng)用在紅外光譜的定量分析中。 有研究用18-7-8的BP-ANN模型,對(duì)8種VOCs混合物進(jìn)行了濃度反演,各組分標(biāo)準(zhǔn)預(yù)測(cè)誤差(%SEP)的平均值為8.69%,平均預(yù)測(cè)誤差(MPE)的平均值為-1.985,平均相對(duì)誤差(MRE)的平均值為0.084,結(jié)果滿足多組分微量氣態(tài)污染物的定量要求。 2006年,劉丙萍等利用人工神經(jīng)網(wǎng)絡(luò)(ANN)對(duì)嚴(yán)重混疊的傅里葉變換紅外光譜圖進(jìn)行了定量和定性的解析,苯乙烯和1,3-丁二烯這兩種氣體的標(biāo)準(zhǔn)預(yù)測(cè)誤差(%SEP)分別為2.14和2.99。 人工神經(jīng)網(wǎng)絡(luò)能夠擬合一定的非線性關(guān)系,因此在VOCs紅外光譜定量分析中有著較好的應(yīng)用,但ANN需要利用先驗(yàn)知識(shí)人工提取特征作為輸入,且淺層的網(wǎng)絡(luò)結(jié)構(gòu)擬合復(fù)雜的非線性關(guān)系時(shí),具有一定的局限性。
隨著計(jì)算機(jī)科學(xué)的進(jìn)步,特別是GPU的發(fā)展大大提高了網(wǎng)絡(luò)計(jì)算的速度,深度神經(jīng)網(wǎng)絡(luò)(deep neural network, DNN)越來(lái)越多的被用于非線性系統(tǒng)的回歸預(yù)測(cè)中, 在許多領(lǐng)域都表現(xiàn)出了最先進(jìn)的性能[7]。 DNN可以自動(dòng)提取特征,甚至將低級(jí)表示轉(zhuǎn)化為更抽象的級(jí)別,對(duì)于無(wú)關(guān)和具有復(fù)雜參數(shù)的特殊微小變化可以達(dá)到更高的精度[8]。
本文利用DNN對(duì)FTIR譜圖存在嚴(yán)重混疊干擾的苯(Benzene)、甲苯(Toluene)、1,3-丁二烯(1,3-butadiene)、乙苯(Ethyl benzene)、苯乙烯(Styrene)、鄰二甲苯(O-xylene)、間二甲苯(M-xylene)、對(duì)二甲苯(P-xylene)等8種VOCs氣體組成的混合污染物濃度進(jìn)行測(cè)定,用反演結(jié)果的均方根誤差(RMES)來(lái)評(píng)價(jià)其預(yù)測(cè)能力。 結(jié)果表明,使用DNN對(duì)多組分大氣污染物濃度進(jìn)行定量分析,能夠得到精確地結(jié)果; 當(dāng)訓(xùn)練樣本充足時(shí),相比于ANN,DNN對(duì)非線性關(guān)系的學(xué)習(xí)能力更強(qiáng),反演精度更高,模型更為穩(wěn)定。
利用氣體的吸光度譜對(duì)VOCs進(jìn)行濃度反演的理論依據(jù)是Lambert-Beer定律。 在路徑上的大氣各向同性且處于熱平衡狀態(tài)下,氣體的吸光度Aν與氣體濃度c和光程L的乘積成正比,即[9]
(1)
依據(jù)Beer-Lambert定律,當(dāng)不考慮散射以及儀器本身的影響時(shí),光程L為常數(shù),吸光度Aν與氣體濃度c成正比,因此可以直接利用吸光度譜進(jìn)行計(jì)算,這種方法的理論基礎(chǔ)是假設(shè)測(cè)量光路上的大氣氣溶膠散射對(duì)光程的影響以及大氣光譜儀探測(cè)器自身的響應(yīng)曲線在測(cè)量波段內(nèi)與分子的振轉(zhuǎn)光譜結(jié)構(gòu)相比是一個(gè)隨著頻率變化緩慢發(fā)生變化的量[10]。 但在實(shí)際應(yīng)用中,由于待測(cè)樣品中各個(gè)組分之間的相互影響以及儀器自身的背景噪聲會(huì)使近紅外吸收光譜與樣品濃度之間存在一定程度的非線性關(guān)系,尤其是當(dāng)樣品濃度范圍較大時(shí)非線性更加嚴(yán)重,而對(duì)這種非線性關(guān)系的擬合能力則是準(zhǔn)確預(yù)測(cè)的關(guān)鍵。 因此,需要根據(jù)待測(cè)樣品的非線性特點(diǎn)建立相應(yīng)的非線性校正模型[11]。
深度神經(jīng)網(wǎng)絡(luò)(DNN)指具有一定深度的神經(jīng)網(wǎng)絡(luò),根據(jù)不同的實(shí)際應(yīng)用需求,具有不同的網(wǎng)絡(luò)結(jié)構(gòu)。 以多層BP神經(jīng)網(wǎng)絡(luò)為代表的深度前饋神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用于非線性系統(tǒng)建模,來(lái)擬合難以用數(shù)學(xué)方式描述的非線性系統(tǒng),其特點(diǎn)在于信號(hào)的前向傳輸和誤差的反向傳播。 在信號(hào)前向傳輸中,通過(guò)隱藏層逐層計(jì)算輸入信號(hào),得到輸出信號(hào),如果輸出信號(hào)與預(yù)期值誤差太大,便轉(zhuǎn)入反向傳播并通過(guò)調(diào)整網(wǎng)絡(luò)權(quán)值和閾值,讓網(wǎng)絡(luò)的預(yù)測(cè)輸出逐漸靠近預(yù)期值。 圖1是深度神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖,其中x1,x2, …,xm是網(wǎng)絡(luò)的輸入值,y1, …,yn是網(wǎng)絡(luò)的輸出值。
圖1 深度神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖
深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練的步驟包括:
(1) 網(wǎng)絡(luò)初始化。 根據(jù)輸入矩陣X和輸出矩陣Y,結(jié)合經(jīng)驗(yàn)公式,確定神經(jīng)網(wǎng)絡(luò)的總層數(shù)為L(zhǎng)以及各層的節(jié)點(diǎn)數(shù)pl(l=1, 2, …,L); 隨機(jī)初始化各個(gè)隱藏層和輸出層之間的權(quán)值矩陣Wl和偏移向量bl(l=2, 3, …,L), 確定學(xué)習(xí)速率η、迭代閾值ε和神經(jīng)元激勵(lì)函數(shù)。
(2) 計(jì)算出每個(gè)隱藏層和輸出層的輸出Hl。
Hl=f(zl)=f(WlHl-1+bl)l=2, 3, …,L
(2)
式(2)中,f為神經(jīng)元激勵(lì)函數(shù),式(3)是本文選用的隱藏層神經(jīng)元激勵(lì)函數(shù)Sigmoid函數(shù)的表達(dá)式,式(4)是輸出層神經(jīng)元激勵(lì)函數(shù)ReLU函數(shù)的表達(dá)式。
(3)
f(x)=max(0,x)
(4)
(3) 根據(jù)式(6),利用損失函數(shù)J的計(jì)算公式計(jì)算出輸出層的梯度δL。 選用的均方差函數(shù)作為損失函數(shù),式(5)是其表達(dá)式。
(5)
δL=J(W,b,X,Y)?f′(zL)
(6)
(4) 計(jì)算出每各隱藏層的梯度δl[式(7)]
δl=(Wl+1)Tδl+1?f′(zl)l=L-1,L-2, …,2
(7)
(5) 調(diào)整各隱藏層和輸出層的權(quán)值矩陣Wl和偏移向量bl[式(8)]
Wl=Wl-ηδl(Hl-1)T
bl=bl-ηδll=2, 3, …,L
(8)
(6) 根據(jù)閾值ε判斷算法迭代是否完成,如果沒(méi)有完成,回到步驟(2)。
利用深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行回歸預(yù)測(cè),首先需要用訓(xùn)練樣本來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò),讓網(wǎng)絡(luò)可以準(zhǔn)確地描述輸入與輸出之間的未知關(guān)系,然后利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)待測(cè)樣本的輸出。
(9)
選取EPA數(shù)據(jù)庫(kù)中苯、甲苯、1,3-丁二烯、乙苯、苯乙烯、鄰二甲苯、間二甲苯、對(duì)二甲苯等八種揮發(fā)性有機(jī)化合物在8~12 μm(對(duì)應(yīng)波數(shù)為833.3~1 250 cm-1)波段范圍內(nèi)的吸光度譜作為仿真實(shí)驗(yàn)的原始數(shù)據(jù)。 圖2(a)是EPA數(shù)據(jù)庫(kù)中八種氣體在溫度為25 ℃,光程為3 m時(shí)所測(cè)的FTIR吸光度譜原始數(shù)據(jù),每種氣體各有四條不同濃度下的譜線(其中兩條譜線對(duì)應(yīng)濃度約為100×10-6,兩條譜線濃度約為500×10-6),而這四條譜線的吸光度值與對(duì)應(yīng)濃度值之間不成正比,證明了EPA數(shù)據(jù)庫(kù)中利用FTIR實(shí)測(cè)得到的VOCs氣體吸光度與對(duì)應(yīng)濃度值之間存在著非線性關(guān)系。 在不考慮氣體間的相互影響時(shí),多組分氣體混合物在某一波數(shù)處的吸光度值等于各個(gè)組分在該處的吸光度之和,將八種VOCs氣體不同濃度下的吸光度譜進(jìn)行隨機(jī)組合,共得到65 536種混合氣體吸光度譜。 圖2(b)是將8種VOCs氣體吸光度譜進(jìn)行加和得到的一個(gè)混合氣體樣本的吸光度譜樣本。 式(10)是利用單一氣體譜線人工合成多組分混合氣體吸光度譜的計(jì)算公式,其中Ai混合氣體在第i個(gè)波數(shù)處的吸光度,Aij是指第j種氣體在第i個(gè)波數(shù)處的吸光度。
(10)
圖2 波長(zhǎng)在8~12 μm范圍內(nèi)的吸光度譜
數(shù)據(jù)預(yù)處理是通過(guò)對(duì)譜線原始數(shù)據(jù)進(jìn)行降維來(lái)降低計(jì)算的復(fù)雜度,包括積分提取和主成分提取。 為了降低譜線噪聲對(duì)于反演精度的影響,采用較為普遍的梯形法提取吸光度值在各波數(shù)點(diǎn)前后10個(gè)波數(shù)范圍內(nèi)的積分強(qiáng)度來(lái)代替信號(hào)較弱的吸光度值。 式(11)是梯形法計(jì)算積分強(qiáng)度公式,將待積分區(qū)域分成n段,每段間隔為Δν,Ai是第i個(gè)波數(shù)處的吸光度值。
(11)
采用主成分分析法(principal components analysis,PCA)對(duì)積分提取后的光譜矩陣進(jìn)行主成分提取。 PCA是指通過(guò)分解原始矩陣,從而提取出能夠表征原始矩陣數(shù)據(jù)特征、且不失去主要信息的主成分矩陣作為新矩陣。 式(12)是矩陣X(n×k)的PCA分析式,其中X是原始矩陣,t是得分向量,p是載荷向量,E是描述X從pf到pk的變化的誤差矩陣。
(12)
為了確保樣本的隨機(jī)性,每次隨機(jī)選取一定數(shù)量且不重復(fù)的混合氣體吸光度譜進(jìn)行DNN回歸預(yù)測(cè)。 圖3(a)為隨機(jī)抽取的5 000條不同混合氣體的吸光度譜; 圖3(b)為對(duì)5 000條混合氣體的吸光度譜積分提取后得到的結(jié)果,可以看到積分提取強(qiáng)化了譜線特征,光譜維度由3 457維降低到了406維; 圖3(c)是對(duì)積分提取后的光譜矩陣進(jìn)行主成分分解的結(jié)果,可以看到誤差矩陣E對(duì)光譜矩陣的影響很小,而影響誤差矩陣E的主要因素是測(cè)量噪聲,因此忽略矩陣E不會(huì)造成原始數(shù)據(jù)中主要的有用信息丟失,同時(shí)可以在一定程度上減弱噪聲的影響; 圖3(d)是主成分提取后的光譜矩陣,光譜維度406維降到了30維。 根據(jù)主成分提取規(guī)則,一般情況下按特征值貢獻(xiàn)率從大到小排列,當(dāng)累計(jì)貢獻(xiàn)率達(dá)到80%時(shí),選取這些特征值的特征向量作為主成分,這里由于8種VOCs氣體的紅外光譜嚴(yán)重混疊,為了提高網(wǎng)絡(luò)對(duì)不同VOCs氣體的識(shí)別能力,選擇累計(jì)貢獻(xiàn)率達(dá)到99.9%作為主成分提取標(biāo)準(zhǔn),提取原始矩陣的載荷向量數(shù)為30。
圖3 5 000組樣本的數(shù)據(jù)預(yù)處理
本程序均由MATLAB2018a編寫而成,所有計(jì)算均在Dell OptiPlex7050計(jì)算機(jī)上進(jìn)行。 使用訓(xùn)練樣本訓(xùn)練神經(jīng)網(wǎng)絡(luò),使得經(jīng)過(guò)訓(xùn)練的網(wǎng)絡(luò)可以充分學(xué)習(xí)混合氣體的吸光度譜與對(duì)應(yīng)每個(gè)組分濃度之間的特定關(guān)系,從而可以根據(jù)待測(cè)樣本的吸光度譜預(yù)測(cè)每種VOC的濃度,過(guò)程可分為網(wǎng)絡(luò)構(gòu)建、網(wǎng)絡(luò)訓(xùn)練和網(wǎng)絡(luò)預(yù)測(cè)。
將5 000組經(jīng)過(guò)預(yù)處理的樣本,隨機(jī)選擇4 000組作為訓(xùn)練樣本,1 000組作為預(yù)測(cè)樣本。 將訓(xùn)練樣本中的光譜矩陣作為DNN的輸入,對(duì)應(yīng)八種氣體的濃度矩陣作為DNN的輸出。 對(duì)訓(xùn)練樣本的輸入輸出進(jìn)行歸一化處理,圖4是訓(xùn)練樣本歸一化的結(jié)果。 所選用歸一化函數(shù)為
xk=(xk-xmin)/(xmax-xmin)
(13)
利用深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行濃度反演,需要構(gòu)建合適的深度神經(jīng)網(wǎng)絡(luò)模型、選擇合適的網(wǎng)絡(luò)參數(shù)。 通過(guò)優(yōu)化,確定了以下參數(shù)來(lái)進(jìn)行構(gòu)建DNN模型。
(1)輸入、輸出: 輸入矩陣是經(jīng)過(guò)預(yù)處理后的混合氣體光譜矩陣,維數(shù)為30,因此輸入層的節(jié)點(diǎn)數(shù)為30; 輸出矩陣是混合氣體對(duì)應(yīng)的各組分濃度矩陣,維數(shù)為8,因此輸出層的節(jié)點(diǎn)數(shù)為8。
(2)隱藏層層數(shù): 隱藏層層數(shù)越高,泛化能力越強(qiáng),預(yù)測(cè)精度越高,但是網(wǎng)絡(luò)復(fù)雜度較高,訓(xùn)練時(shí)間較長(zhǎng)。 在選擇隱藏層層數(shù)時(shí)需要從網(wǎng)絡(luò)預(yù)測(cè)精度和訓(xùn)練效率兩方面綜合考量,在網(wǎng)絡(luò)精度達(dá)到要求且趨于穩(wěn)定的情況下,選擇較少的層數(shù)來(lái)加快訓(xùn)練速度。 從網(wǎng)絡(luò)預(yù)測(cè)精度和訓(xùn)練時(shí)間兩個(gè)方面比較其他網(wǎng)絡(luò)參數(shù)相同時(shí),不同隱藏層層數(shù)下的深度神經(jīng)網(wǎng)絡(luò)性能,表1列出了不同隱藏層層數(shù)下10次預(yù)測(cè)結(jié)果的平均值。
圖4 訓(xùn)練樣本的輸入輸出
表1 不同隱藏層層數(shù)下的深度神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果
可以看到隱藏層層數(shù)越多,訓(xùn)練時(shí)間越長(zhǎng); 在一定范圍內(nèi),隱藏層層數(shù)越多,網(wǎng)絡(luò)預(yù)測(cè)精度越高,當(dāng)隱藏層層數(shù)過(guò)多時(shí),會(huì)出現(xiàn)“過(guò)擬合”現(xiàn)象,預(yù)測(cè)誤差變大。 因此從預(yù)測(cè)精度和訓(xùn)練時(shí)間兩方面綜合考慮,選擇隱藏層層數(shù)為3的網(wǎng)絡(luò)模型用于網(wǎng)絡(luò)訓(xùn)練。
(3)隱藏層節(jié)點(diǎn)數(shù): 確定了隱藏層層數(shù)后,用試湊法來(lái)尋找最佳隱藏層節(jié)點(diǎn)數(shù),表2是不同隱藏層節(jié)點(diǎn)數(shù)下10次預(yù)測(cè)結(jié)果的平均值。
可以看到,當(dāng)某個(gè)隱藏層的節(jié)點(diǎn)數(shù)大于輸入層節(jié)點(diǎn)數(shù)時(shí),網(wǎng)絡(luò)的預(yù)測(cè)誤差較大,因此隱藏層節(jié)點(diǎn)數(shù)必須小于輸入層節(jié)點(diǎn)數(shù); 當(dāng)隱藏層節(jié)點(diǎn)數(shù)逐層遞減時(shí),網(wǎng)絡(luò)的預(yù)測(cè)誤差較小。 滿足上述兩個(gè)條件時(shí),網(wǎng)絡(luò)的預(yù)測(cè)誤差值較小,結(jié)合表2中的結(jié)果,選擇25,15,10作為三個(gè)隱藏層神經(jīng)元的最佳節(jié)點(diǎn)數(shù)。
表2 不同隱藏層節(jié)點(diǎn)數(shù)下的網(wǎng)絡(luò)預(yù)測(cè)誤差
選擇sigmoid函數(shù)作為隱藏層的神經(jīng)元激活函數(shù)、ReLU函數(shù)作為輸出層的神經(jīng)元激活函數(shù); 目標(biāo)損失函數(shù)為均方差函數(shù); 采用變學(xué)習(xí)速率法,最大學(xué)習(xí)速率為0.2,最小學(xué)習(xí)速率為0; 最大迭代次數(shù)設(shè)為1 000; 閾值ε設(shè)為0。 用訓(xùn)練樣本訓(xùn)練經(jīng)過(guò)優(yōu)化得到的深度神經(jīng)網(wǎng)絡(luò)模型,然后用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)各待測(cè)樣本的輸出,輸出結(jié)果反歸一化后得到反演出的各組分濃度值。
將預(yù)測(cè)出的各組分濃度與真實(shí)濃度作差可以得到預(yù)測(cè)結(jié)果的實(shí)際誤差,圖5是1 000組預(yù)測(cè)樣本的實(shí)際誤差圖。 可以看到實(shí)際誤差的范圍在-0.004×10-6~0.004×10-6之間,證明了該深度神經(jīng)網(wǎng)絡(luò)對(duì)每個(gè)樣本的每種氣體都有著較好的預(yù)測(cè)結(jié)果。
圖5 DNN反演的實(shí)際預(yù)測(cè)誤差
圖6(a)是每種VOCs預(yù)測(cè)濃度(共1 000個(gè)樣本)的均方根誤差,圖6(b)是每個(gè)樣本預(yù)測(cè)濃度(共8種氣體)的均方根誤差。 每種VOCs氣體的預(yù)測(cè)誤差都小于0.005×10-6,表明DNN可以很好地用于多組分分析; 每個(gè)樣本的誤差均小于0.006×10-6,表明了DNN預(yù)測(cè)模型具有較高的穩(wěn)定性; 1 000組預(yù)測(cè)樣本的均方根誤差為0.002 7×10-6,表明利用DNN模型進(jìn)行多組分VOCs濃度反演具有較高的精度。
圖6 預(yù)測(cè)結(jié)果的均方根誤差
表3是在不同樣本數(shù)下利用DNN進(jìn)行濃度反演得到的各組分濃度的誤差。 表中的每一列代表隨機(jī)抽取的樣本數(shù)量,其中4/5用作訓(xùn)練樣本,1/5用作預(yù)測(cè)樣本,每一行為各個(gè)組分在不同樣本數(shù)下訓(xùn)練測(cè)試得到的均方根誤差。 可以看到,當(dāng)訓(xùn)練樣本充足時(shí),DNN可以得到較好的預(yù)測(cè)結(jié)果,并且預(yù)測(cè)精度隨著樣本數(shù)量的增加不斷提高。 在實(shí)際應(yīng)用時(shí),可根據(jù)VOCs監(jiān)測(cè)在精度方面的需求,選擇合適的樣本數(shù)量進(jìn)行訓(xùn)練。 當(dāng)對(duì)精度要求較高時(shí),可選擇用更多不同種類的樣本訓(xùn)練神經(jīng)網(wǎng)絡(luò),使網(wǎng)絡(luò)可以充分學(xué)習(xí); 當(dāng)滿足精度要求時(shí),可選擇合適的樣本數(shù)量來(lái)減少網(wǎng)絡(luò)計(jì)算復(fù)雜度,提高反演效率。
表3 每種VOC氣體在不同樣本數(shù)下的均方根誤差
通過(guò)優(yōu)化參數(shù),建立30-11-8的單隱藏層人工神經(jīng)網(wǎng)絡(luò)模型,選擇隱藏層神經(jīng)元激活函數(shù)為sigmoid函數(shù),輸出層神經(jīng)元激活函數(shù)為ReLU函數(shù),最大學(xué)習(xí)速率為0.2,最小學(xué)習(xí)速率為0,附加動(dòng)量項(xiàng)為0.2,最大迭代次數(shù)設(shè)為1 000。 在不同樣本數(shù)下進(jìn)行濃度反演,對(duì)比驗(yàn)證DNN算法模型的精度。 圖7是DNN和ANN濃度反演結(jié)果的誤差隨著樣本數(shù)量變化的曲線圖。
圖7 DNN與ANN在不同樣本數(shù)下的精度對(duì)比
由圖7可以看出,當(dāng)樣本數(shù)量為300時(shí),DNN的誤差為0.26×10-6,ANN的誤差為0.19×10-6,這是因?yàn)楫?dāng)樣本數(shù)量較少時(shí),DNN網(wǎng)絡(luò)模型相較于ANN模型網(wǎng)絡(luò)更為復(fù)雜而不能夠得到充分訓(xùn)練,所以預(yù)測(cè)精度低于ANN; 隨著樣本數(shù)量增多,ANN和DNN的精度均呈現(xiàn)上升趨勢(shì),此時(shí)充分得到訓(xùn)練的DNN模型對(duì)數(shù)據(jù)的非線性特征的擬合優(yōu)勢(shì)就體現(xiàn)出來(lái),網(wǎng)絡(luò)預(yù)測(cè)精度相較于ANN模型有了大幅度提高,證明了深度神經(jīng)網(wǎng)絡(luò)在基于紅外光譜的多組分VOCs濃度反演方面有著很好的應(yīng)用前景。
從EPA數(shù)據(jù)庫(kù)中選取了八種有毒揮發(fā)性有機(jī)物8~12 μm范圍內(nèi)的吸光度譜,根據(jù)Beer-Lambert定律進(jìn)行混合,經(jīng)過(guò)積分提取、PCA降維等預(yù)處理后作為輸入,各組分濃度作為輸出,建立了30-25-15-10-8的深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行多組分易揮發(fā)性有機(jī)物濃度反演的研究。 實(shí)驗(yàn)顯示,深度神經(jīng)網(wǎng)絡(luò)無(wú)需利用先驗(yàn)知識(shí)人工提取特征,可直接從經(jīng)預(yù)處理后的原始數(shù)據(jù)中學(xué)習(xí)特征,比傳統(tǒng)的人工提取特征更為簡(jiǎn)單; 當(dāng)訓(xùn)練樣本數(shù)過(guò)少時(shí),深度神經(jīng)網(wǎng)絡(luò)無(wú)法充分學(xué)習(xí),訓(xùn)練誤差較大,精度低于淺層的人工神經(jīng)網(wǎng)絡(luò),但隨著訓(xùn)練樣本數(shù)量的增加,DNN的精度不斷提高,樣本數(shù)量為5 000時(shí)反演精度達(dá)到了0.002 7×10-6,相較于只有一個(gè)隱藏層的人工神經(jīng)網(wǎng)絡(luò)有了明顯的提高; 在多組分氣體反演時(shí),DNN同時(shí)對(duì)每種氣體都能達(dá)到較好的預(yù)測(cè)精度。 結(jié)果證明,在訓(xùn)練樣本充足時(shí)利用深度神經(jīng)網(wǎng)絡(luò)對(duì)多組分VOCs進(jìn)行濃度反演的結(jié)果精度較高,相比單隱藏層的人工神經(jīng)網(wǎng)絡(luò),能更充分地學(xué)習(xí)數(shù)據(jù)特征,具有更強(qiáng)的非線性擬合能力和穩(wěn)定性。