金秀章, 陳佳政, 李陽峰
(華北電力大學(xué) 控制與計(jì)算機(jī)工程學(xué)院,河北保定071003)
目前,火力發(fā)電仍是我國發(fā)電的主要支柱,而發(fā)電過程中產(chǎn)生的氮氧化物(NOx)又是大氣中NOx污染的主要來源之一。因鍋爐燃燒過程運(yùn)行工況復(fù)雜,反應(yīng)延遲較大,致使選擇性催化還原(selective catalytic reduction)煙氣脫硝系統(tǒng)(下文簡稱SCR)入口NOx濃度無法準(zhǔn)確地即時(shí)測量,從而使噴氨量無法準(zhǔn)確中和NOx[1]。因此建立精準(zhǔn)高效的預(yù)測模型來滿足對NOx排放濃度的實(shí)時(shí)監(jiān)測具有重要意義。
目前我國大部分電廠使用連續(xù)排放監(jiān)測系統(tǒng)(continuous emission monitoring system, CEMS)對NOx的排放進(jìn)行監(jiān)測,其測量方式為直接抽取排放煙氣進(jìn)行測量,但這種測量方法難以保證結(jié)果的實(shí)時(shí)性[2]。現(xiàn)針對NOx排放預(yù)測的建模方式包含反應(yīng)機(jī)理建模和以數(shù)據(jù)驅(qū)動(dòng)為基礎(chǔ)的建模2種。電廠發(fā)電過程極為復(fù)雜,其燃燒過程包含大量的物理化學(xué)反應(yīng),同時(shí)反應(yīng)過程中的各類擾動(dòng)也影響模型參數(shù)的確定,因此大大增加了機(jī)理建模難度[3]。近年來,隨著機(jī)器學(xué)習(xí)的快速發(fā)展,基于數(shù)據(jù)驅(qū)動(dòng)的“黑箱”建模進(jìn)入了大眾視線,其建模過程相對簡單,因此大受研究者們的喜愛。呂游等[4]利用最小二乘支持向量機(jī)建立了NOx排放預(yù)測模型,與支持向量機(jī)相比,提升了模型的泛化能力;Fu等[5]利用長短期記憶網(wǎng)絡(luò)(LSTM)建立了脫硫效率預(yù)測模型,預(yù)測精度較高。大量研究表明,加入時(shí)間序列預(yù)測方法的混合模型的建立能夠彌補(bǔ)神經(jīng)網(wǎng)絡(luò)模型對數(shù)據(jù)中線性部分預(yù)測結(jié)果較差這一缺陷,其混合模型的互補(bǔ)特性能夠有效地分析數(shù)據(jù)中線性和非線性的部分,提高了模型的預(yù)測精度。盧建昌等[6]建立了時(shí)間序列法和神經(jīng)網(wǎng)絡(luò)相混合的預(yù)測模型,大大提高了模型的預(yù)測精度;范京道等[7]建立了時(shí)間序列分析和支持向量機(jī)相結(jié)合的瓦斯?jié)舛阮A(yù)測混合模型,預(yù)測結(jié)果明顯優(yōu)于單一模型。
本文利用混合模型中優(yōu)勢互補(bǔ)的原理,提出了一種基于自回歸滑動(dòng)平均模型(autoregressive integrated moving average,ARIMA)和在線貫序極限學(xué)習(xí)機(jī)(online sequential extreme learning machine,OSELM)相混合的組合預(yù)測模型,并以2種組合方式:最優(yōu)權(quán)重法和殘差優(yōu)化法,構(gòu)建SCR入口NOx預(yù)測模型。利用現(xiàn)場實(shí)際運(yùn)行數(shù)據(jù)對模型進(jìn)行對比驗(yàn)證分析,并與單一ARIMA模型和OSELM模型進(jìn)行對比,以期為電廠SCR系統(tǒng)NOx排放濃度監(jiān)測提供參考。
自回歸滑動(dòng)平均模型是時(shí)間序列預(yù)測分析方法之一,在時(shí)間序列數(shù)據(jù)分析中流行且廣泛使用[8]。其模型表示為ARIMA(p,d,q),其中,AR代表自回歸,p為自回歸項(xiàng)數(shù);MA代表滑動(dòng)平均,q為滑動(dòng)平均項(xiàng)數(shù);d代表平穩(wěn)序列的差分階次,表達(dá)式為:
yt=θ0+φ1yt-1+…+φpyt-p+εt-
θ1εt-1-θ2εt-2-…-θqεt-q
(1)
式中:yt和εt分別為t時(shí)刻的實(shí)際值和隨機(jī)誤差,εt需符合正態(tài)分布;φt(t=1,2,…,p),θj(j=1,2,…,q)為模型參數(shù),p和q為模型階數(shù)。
一般的,ARIMA模型的建模步驟如下:1) 對時(shí)間序列進(jìn)行平穩(wěn)性檢驗(yàn),若序列檢驗(yàn)不通過,則對其進(jìn)行差分運(yùn)算。通常情況下,一階差分即可得到平穩(wěn)序列,差分階次過高,會(huì)導(dǎo)致數(shù)據(jù)信息損失,不利于模型的建立;2) 采用貝葉斯信息準(zhǔn)測(BIC)[9]來確定模型中p和q的階數(shù),BIC值越小說明模型效果越好;3) 使用確定好的模型階數(shù)對時(shí)間序列進(jìn)行擬合,并使用極大似然估計(jì)法對模型參數(shù)進(jìn)行估計(jì);4) 進(jìn)行殘差檢驗(yàn),查看殘差是否符合正態(tài)分布,如果不符合正態(tài)分布則需重新確定p、q值再次進(jìn)行定階;5) 通過檢驗(yàn)后進(jìn)行預(yù)測和誤差分析。建模流程如圖1所示。
圖1 ARIMA模型建模步驟流程圖Fig.1 ARIMA model modeling step-by-step flowchart
與傳統(tǒng)的單隱藏層前饋神經(jīng)網(wǎng)絡(luò)不同,極限學(xué)習(xí)機(jī)(ELM)選取輸入權(quán)重和隱藏層偏置是隨機(jī)的,通過最小化由訓(xùn)練誤差和輸出層權(quán)重范數(shù)的正則項(xiàng)構(gòu)成的損失函數(shù),反向計(jì)算出輸出層權(quán)重,在訓(xùn)練過程中只需要提前設(shè)置隱含層神經(jīng)元個(gè)數(shù)。ELM相比于其他神經(jīng)網(wǎng)路具有訓(xùn)練參數(shù)少、學(xué)習(xí)速度快、泛化能力強(qiáng)等優(yōu)點(diǎn)[10]。
ELM訓(xùn)練網(wǎng)絡(luò)過程如下:
1) 給定訓(xùn)練集Z=(X,T),X=[x1,x2,…,xd],T=[t1,t2,…,tm],其中xi=[xi1,xi2,…,xin]∈Rn表示輸入數(shù)據(jù);ti=[ti1,ti2,…,tin]∈Rn表示輸出數(shù)據(jù),隱含層節(jié)點(diǎn)數(shù)為L,激活函數(shù)為Sigmoid函數(shù),隨機(jī)初始輸入權(quán)重和隱含層偏置。
2) 計(jì)算隱藏層輸出H(x),表達(dá)式為
H(x)=[h1(x),…,hL(x)]
(2)
式中:hi(x)是第i個(gè)隱藏層節(jié)點(diǎn)輸出,計(jì)算式如下:
hi(x)=g(wix+bi)
(3)
式中:wi是輸入權(quán)重;bi是隱藏層偏置;g(x)是激活函數(shù)。
3) 求解出隱藏層與輸出層之間的輸出權(quán)重β,定義廣義單隱層ELM輸出為:
(4)
式中:β=[β1,β2,…,βL]T;T是訓(xùn)練數(shù)據(jù)的目標(biāo)矩陣。
為保證訓(xùn)練誤差最小,使用最小化近似平方差的方法對β進(jìn)行求解,目標(biāo)函數(shù)如下:
(5)
β可以通過β=H*T來求得,其中H*為隱含層輸出矩陣H的廣義逆矩陣。
在線貫序極限學(xué)習(xí)機(jī)(OSELM)是在ELM的基礎(chǔ)上演變出來的一種增量學(xué)習(xí)算法,其本質(zhì)為分批次數(shù)據(jù)學(xué)習(xí)。OSELM具有極限學(xué)習(xí)機(jī)本身的訓(xùn)練速度快,泛化能力強(qiáng)的優(yōu)點(diǎn),同時(shí)它還可以根據(jù)新導(dǎo)入的數(shù)據(jù)實(shí)現(xiàn)模型參數(shù)的在線更新。OSELM的在線學(xué)習(xí)主要包括2部分:
(6)
Tk=[t1,t2,…,tk]T
(7)
2) 在線學(xué)習(xí)階段:輸入第k+1組數(shù)據(jù),計(jì)算相應(yīng)的隱藏層輸出矩陣Hk+1(x),輸出權(quán)值更新公式如下:
(8)
式中:Pk+1更新公式如下:
(9)
令k=k+1,繼續(xù)進(jìn)行在線學(xué)習(xí),并不斷更新網(wǎng)絡(luò)參數(shù),直至訓(xùn)練完畢。
鍋爐燃燒系統(tǒng)極為復(fù)雜,參與燃燒反應(yīng)的輔助變量較多,故NOx濃度時(shí)間序列包含線性部分和非線性部分,使用單一ARIMA或OSELM無法精準(zhǔn)地預(yù)測NOx濃度[11]。由模型結(jié)構(gòu)可知,ARIMA模型對于序列中線性部分的預(yù)測更加準(zhǔn)確[12],OSELM模型則對非線性部分的數(shù)據(jù)更加敏感,其二者之間存在優(yōu)勢互補(bǔ)的特點(diǎn),所以將2種模型組合使用,更能發(fā)揮各自優(yōu)點(diǎn),提高模型的精確度。本文從2個(gè)角度:最優(yōu)權(quán)重組合和殘差優(yōu)化組合進(jìn)行研究,構(gòu)建ARIMA-OSELM組合預(yù)測模型,對火電廠實(shí)際運(yùn)行數(shù)據(jù)展開驗(yàn)證,最后與單一ARIMA和OSELM模型數(shù)據(jù)進(jìn)行對比。
2.3.1 最優(yōu)權(quán)重組合預(yù)測方法
使用單一ARIMA和OSELM模型分別進(jìn)行建模預(yù)測,以組合模型預(yù)測結(jié)果的最小誤差平方和為優(yōu)化目標(biāo),構(gòu)建數(shù)學(xué)優(yōu)化問題模型求得組合權(quán)重,最終得到組合預(yù)測結(jié)果。組合模型預(yù)測結(jié)果表達(dá)式為:
Yt=k1x1t+k2x2t
(10)
式中:k1,k2分別為ARIMA模型和OSELM模型的權(quán)重系數(shù);x1t為ARIMA模型在t時(shí)刻的預(yù)測結(jié)果,x2t為OSELM模型在t時(shí)刻的預(yù)測結(jié)果;Yt為組合模型在t時(shí)刻的預(yù)測結(jié)果。最優(yōu)權(quán)重組合法的重點(diǎn)就是根據(jù)誤差求取權(quán)重系數(shù)k1,k2。組合模型的誤差表達(dá)式為:
et=k1e1t+k2e2t=(k1x1t+k2x2t)-x0t
(11)
式中:et、e1t、e2t分別為組合模型在t時(shí)刻預(yù)測誤差、ARIMA模型在t時(shí)刻預(yù)測誤差、OSELM模型在t時(shí)刻預(yù)測誤差;x0t為在t時(shí)刻實(shí)際觀測值。
通過建立數(shù)學(xué)優(yōu)化問題模型求取加權(quán)系數(shù)是較為流行的方法之一,現(xiàn)以組合模型誤差平方和最小為優(yōu)化目標(biāo),建立優(yōu)化問題模型如下:
(12)
式中:m為時(shí)間序列長度。此處采用拉格朗日乘子法求得k1,k2:
(13)
(14)
最終基于ARIMA-OSELM組合模型的預(yù)測值為Yt=k1x1t+k2x2t。該預(yù)測方法的流程圖如圖2,具體步驟如下:
1) 首先對NOx濃度時(shí)間序列的平穩(wěn)性進(jìn)行檢驗(yàn),確定ARIMA模型的差分次數(shù)d;然后使用貝葉斯信息準(zhǔn)則(BIC)確定模型階數(shù)p和q;利用最小二乘法確定模型表達(dá)式參數(shù),將NOx濃度時(shí)間序列放入ARIMA模型中得到預(yù)測結(jié)果x1t。
2) 以前3 000組數(shù)據(jù)作為作為OSELM模型訓(xùn)練集,后600組數(shù)據(jù)作為模型的測試集;將前3 000組數(shù)據(jù)放入OSELM模型進(jìn)行訓(xùn)練,得到網(wǎng)絡(luò)權(quán)值參數(shù),建立OSELM模型,將測試集放入模型得到OSELM預(yù)測結(jié)果x2t。
3) 利用最優(yōu)權(quán)重組合方法確定組合權(quán)重值k1,k2,得出最終預(yù)測結(jié)果Yt=k1x1t+k2x2t。
圖2 基于ARIMA-OSELM神經(jīng)網(wǎng)絡(luò)最優(yōu)權(quán)重組合預(yù)測模型Fig.2 Optimal weight combination prediction model based on ARIMA-OSELM neural network
2.3.2 殘差優(yōu)化組合預(yù)測方法
首先使用ARIMA模型對SCR入口NOx濃度序列中的線性部分進(jìn)行預(yù)測,得到預(yù)測值為x1t,SCR入口NOx濃度實(shí)際序列為xt,則誤差表達(dá)式即為e=xt-x1t。誤差et中包含輔助變量:煙氣流量、負(fù)荷等非線性因素對NOx濃度的影響,再利用OSELM對NOx濃度中的非線性部分進(jìn)行預(yù)測,預(yù)測結(jié)果為x2t,則此時(shí)ARIMA-OSELM組合模型的預(yù)測結(jié)果即為x2t,該方法流程如圖3所示:
(1) 首先對NOx濃度時(shí)間序列的平穩(wěn)性進(jìn)行檢驗(yàn),確定ARIMA模型的差分次數(shù)d;然后使用貝葉斯信息準(zhǔn)則(BIC)確定模型階數(shù)p和q;最后利用最小二乘法確定模型表達(dá)式參數(shù),將NOx濃度時(shí)間序列放入ARIMA模型中得到預(yù)測結(jié)果x1t。
(2) 將ARIMA模型預(yù)測結(jié)果x1t與實(shí)際時(shí)間序列xt相比較,得到預(yù)測誤差et=xt-x1t。
(3) 把預(yù)測誤差et和輔助變量作為OSELM模型的輸入,對模型進(jìn)行訓(xùn)練得到網(wǎng)絡(luò)權(quán)值參數(shù),建立OSELM預(yù)測模型,再將測試集放入模型中,得到預(yù)測結(jié)果x2t,即最終預(yù)測結(jié)果。
圖3 基于ARIMA-OSELM神經(jīng)網(wǎng)絡(luò)殘差優(yōu)化組合預(yù)測模型Fig.3 Optimized combinatorial prediction model based on ARIMA-OSELM neural network residuals
實(shí)驗(yàn)數(shù)據(jù)為某電廠現(xiàn)場運(yùn)行數(shù)據(jù),共截取3 600組,采樣周期為5 s,總選取時(shí)間為5 h。其中前 3 000組數(shù)據(jù)進(jìn)行訓(xùn)練,后600組數(shù)據(jù)進(jìn)行測試。根據(jù)NOx生成機(jī)理初步選擇出14個(gè)輔助變量,包含:機(jī)組負(fù)荷、總煤量、A/B層給煤機(jī)電流轉(zhuǎn)速、SCR入口煙氣含氧量、SCR入口煙氣溫度、總風(fēng)量、鍋爐含氧量、尿素閥門開度、SCR入口煙氣流量、爐膛負(fù)壓和尿素流量。原始數(shù)據(jù)包含一些異常值,故先將數(shù)據(jù)進(jìn)行預(yù)處理,此處采用拉依達(dá)法則對數(shù)據(jù)進(jìn)行異常值替換。后對數(shù)據(jù)進(jìn)行歸一化處理,以保證各參數(shù)之間量綱相同,提高模型預(yù)測精度。
由于鍋爐燃燒過程具有大遲延的特性,所以在現(xiàn)場運(yùn)行過程中采集到的各個(gè)點(diǎn)位的相關(guān)數(shù)據(jù)與SCR入口NOx濃度實(shí)時(shí)數(shù)據(jù)存在一定的時(shí)間偏差。本文設(shè)計(jì)了一種基于最大互信息[13]的時(shí)延計(jì)算方法,選取相關(guān)性最大的一時(shí)刻作為時(shí)延補(bǔ)償,從而確定最終變量輸入序列。鍋爐燃燒過程參與反應(yīng)變量較多,各輔助變量之間存在冗余,且過多變量輸入模型后會(huì)造成模型復(fù)雜度變高,甚至出現(xiàn)模型的過擬合,所以需要對輔助變量進(jìn)行篩選,以提高模型預(yù)測精度。現(xiàn)利用mRMR[14]算法對所有輔助變量進(jìn)行變量篩選以剔除冗余,最終得到7個(gè)輔助變量,分別為:SCR入口煙氣溫度、SCR入口煙氣含氧量、煙氣流量、尿素流量、負(fù)荷、給煤機(jī)電流、爐膛負(fù)壓,將其作為模型的最終輸入。表1為各變量遲延的時(shí)間。
表1 變量遲延時(shí)間表Tab.1 Variable Latency Schedule s
ARIMA模型預(yù)測前,需對時(shí)間序列進(jìn)行平穩(wěn)性檢驗(yàn)、模型定階和殘差檢驗(yàn)。
3.2.1 平穩(wěn)性檢驗(yàn)
常用于時(shí)間序列平穩(wěn)性檢驗(yàn)的方法有自相關(guān)和偏自相關(guān)圖法(autocorrelation coefficient-partial autocorrelation coefficient,ACF-PACF)[15]、單位根檢驗(yàn)法(augmented dickey-fuller test,ADF)[16]。ACF-PACF法核心是自相關(guān)函數(shù)和偏自相關(guān)函數(shù),通過觀察自相關(guān)、偏相關(guān)函數(shù)的殘差分布圖是否在95%置信區(qū)間內(nèi),以及函數(shù)拖尾、截尾情況來判斷序列是否平穩(wěn),其缺點(diǎn)是當(dāng)時(shí)間序列數(shù)據(jù)量較多,模型較為復(fù)雜時(shí)不能夠客觀地判斷出序列的平穩(wěn)性,所以,本實(shí)驗(yàn)使用ADF單位根檢驗(yàn)法。
首先假設(shè)所處理時(shí)間序列存在單位根,即非平穩(wěn)序列,若求得的統(tǒng)計(jì)量(augmented dickey-fuller test statistic,ADF-TS)的值遠(yuǎn)小于置信空間的臨界統(tǒng)計(jì)值(1%、5%和10%),且P值小于顯著性水平0.05,則為拒絕假設(shè),即所使用時(shí)間序列為平穩(wěn)序列。若序列為非平穩(wěn)序列,則需對序列進(jìn)行差分運(yùn)算,但實(shí)際操作中,差分運(yùn)算次數(shù)不宜過多,以避免序列中信息損失嚴(yán)重。
將實(shí)驗(yàn)所用時(shí)間序列繪制圖像,如圖4(a)所示。通過圖像可直觀判斷出,此時(shí)序列較為凌亂,且無法觀測出其整體趨勢,故初步判定為非平穩(wěn)序列。使用ADF單位根檢驗(yàn)法進(jìn)一步驗(yàn)證,此時(shí)P值為0.013,大于顯著性水平0.05,說明無法拒絕該假設(shè),即序列為非平穩(wěn)序列;對序列進(jìn)行一階差分運(yùn)算,結(jié)果如圖4(b)所示。從圖中可以看出,此時(shí)序列圍繞著一個(gè)常數(shù)上下波動(dòng),經(jīng)過ADF單位根檢驗(yàn)計(jì)算此時(shí)P值為0.001,小于0.005,結(jié)果為拒絕原假設(shè)。所以經(jīng)過一階差分運(yùn)算后序列變?yōu)槠椒€(wěn),即ARIMA(p,d,q)中d=1。
圖4 NOx濃度序列和一階差分Fig.4 NOx concentration sequence and first-order differential
3.2.2 模型定階
使用BIC準(zhǔn)則[17]對模型的p,q定階,BIC準(zhǔn)則表達(dá)式為:
BBIC=mln(n)-2ln(L)
(15)
式中:m為模型參數(shù)個(gè)數(shù);n為樣本數(shù)量;L為似然函數(shù)。BBIC值越小,表明模型的擬合度越高,即預(yù)測結(jié)果越好。繪制平穩(wěn)序列自相關(guān)和偏自相關(guān)函數(shù)圖,見圖5。
圖5 ACF-PACF函數(shù)圖Fig.5 ACF-PACF function diagram
圖5中自相關(guān)函數(shù)明顯拖尾,偏自相關(guān)函數(shù)圖拖尾或者5階截尾,無法判斷其準(zhǔn)確值。所以有可能ARIMA模型階數(shù)為p=5,q=0,即ARIMA(5,1,0)。但序列數(shù)據(jù)量較大,且用ACF-PACF圖像法來確定p、q值并不完全準(zhǔn)確,所以需要繼續(xù)使用BIC準(zhǔn)則法進(jìn)一步確定p,q階數(shù)。取p,q的取值范圍為1~5,共25組模型進(jìn)行BIC準(zhǔn)則測試,表2為各模型BIC準(zhǔn)則計(jì)算值,橫向?yàn)閝,縱向?yàn)閜。由表格可得,其中最優(yōu)模型選擇經(jīng)計(jì)算得p=3,q=3時(shí)的BIC值最小,所以最終時(shí)間序列模型為ARIMA(3,1,3)。
表2 BIC準(zhǔn)則表Tab.2 BIC criteria table
3.2.3 模型檢驗(yàn)
在正式預(yù)測之前,需要對模型進(jìn)行殘差檢驗(yàn)。殘差需要滿足均值為0,方差為常數(shù)的正態(tài)分布且不滿足自相關(guān)性。現(xiàn)對殘差序列進(jìn)行正態(tài)分布檢驗(yàn)和Durbin-Watson(DW)檢驗(yàn)[18],DW統(tǒng)計(jì)是計(jì)量經(jīng)濟(jì)學(xué)分析中最常用的自相關(guān)度量。若殘差符合正態(tài)分布圖像,且DW檢驗(yàn)值接近2,則說明檢驗(yàn)通過,可以進(jìn)行下一步預(yù)測。圖6為標(biāo)準(zhǔn)化殘差圖和正態(tài)分布圖,由圖6(a)可看出大部分殘差落到(-5,5)區(qū)間內(nèi),基本服從正態(tài)分布,圖6(b)能夠更加直觀地看到殘差序列符合正態(tài)分布。經(jīng)過計(jì)算,DW檢驗(yàn)值為1.999 6,接近2。綜上可以確定,殘差序列滿足正態(tài)分布并且不存在自相關(guān)性,即所用模型可以較好地預(yù)測本次實(shí)驗(yàn)數(shù)據(jù)。
圖6 標(biāo)準(zhǔn)化殘差和正態(tài)分布圖Fig.6 Standardized residual and normal distribution plots
設(shè)置Sigmoid函數(shù)為OSELM模型的激活函數(shù);輸入權(quán)重的范圍為[-1,1];隱含層偏置的范圍設(shè)置為[0,1];模型在線學(xué)習(xí)是步長設(shè)置為1;模型試驗(yàn)過程中,利用交叉驗(yàn)證和網(wǎng)格搜索算法確定初始化訓(xùn)練樣本數(shù)量以及隱含層神經(jīng)元個(gè)數(shù)(保證N0≥L[10])。經(jīng)過多次實(shí)驗(yàn)對比,模型輸入維度:隱含層神經(jīng)元個(gè)數(shù)=1:2時(shí),模型預(yù)測效果最佳。
模型采用的評價(jià)指標(biāo)為FMAPE、MRMSE和R2:其中FMAPE表示預(yù)測序列較真實(shí)值序列的平均偏離百分比,其值越小說明模型預(yù)測精度越高;MRMSE為均方根誤差,表示預(yù)測值與真實(shí)值之間的標(biāo)準(zhǔn)偏差的大小,數(shù)值越小表明預(yù)測精度越高;R2為決定系數(shù),表示預(yù)測值相對真實(shí)值的偏離程度,其數(shù)值越接近于1,表明預(yù)測效果越好。將三者結(jié)合使用能夠更全面地評價(jià)預(yù)測模型的好壞,計(jì)算式如下:
(16)
(17)
(18)
為驗(yàn)證mRMR算法對變量篩選后的有效性,現(xiàn)建立對比模型實(shí)驗(yàn),分別以全部輔助變量和經(jīng)過mRMR篩選后的輔助變量為模型輸入對SCR入口NOx濃度進(jìn)行預(yù)測,其余實(shí)驗(yàn)條件均不變。圖7為變量篩選前后預(yù)測效果圖,表3為對應(yīng)的預(yù)測結(jié)果評價(jià)指標(biāo)。
由圖7和表3可知,經(jīng)過篩選后的變量放入模型后,使得模型預(yù)測精度有了明顯提高。相比于篩選前模型預(yù)測結(jié)果,模型FMAPE下降了28%;R2提高了26%;MRMSE下降了37%。以上數(shù)據(jù)表明,模型輸入變量之間存在冗余關(guān)系,將會(huì)影響模型預(yù)測精度,有效的篩選變量可以減少模型復(fù)雜度,提高模型預(yù)測精度。
圖7 輸入變量篩選前后預(yù)測結(jié)果Fig.7 Enter variables to filter the prediction results before and after
表3 變量篩選前后的模型評價(jià)指標(biāo)
現(xiàn)分別使用單一ARIMA預(yù)測模型、單一OSELM預(yù)測模型、ARIMA-OSELM最優(yōu)權(quán)重組合預(yù)測模型和ARIMA-OSELM殘差優(yōu)化組合預(yù)測模型這4種模型對SCR入口NOx濃度進(jìn)行預(yù)測。結(jié)果顯示(見表4),4種模型進(jìn)行單步預(yù)測所花費(fèi)的時(shí)間分別為:2.37×10-6、2.68×10-6、7.31×10-6和8.25×10-6s;所用時(shí)間均小于采樣周期5 s以及CEMS系統(tǒng)監(jiān)測時(shí)間,證明此預(yù)測過程可以用于下一步的閉環(huán)控制。模型預(yù)測結(jié)果曲線圖和模型評價(jià)指標(biāo)見表5。
表4 不同模型的預(yù)測時(shí)間
圖8 不同模型預(yù)測結(jié)果Fig.8 Different models predict outcomes
表5 不同模型的模型評價(jià)指標(biāo)
4種模型的預(yù)測結(jié)果見圖8。通過對比可以看出,ARIMA-OSELM組合模型的預(yù)測結(jié)果擬合曲線明顯優(yōu)于單一ARIMA模型和單一OSELM模型的預(yù)測結(jié)果擬合曲線,表明對線性數(shù)據(jù)預(yù)測有優(yōu)勢的ARIMA模型和對非線性預(yù)測能力較強(qiáng)的OSELM模型經(jīng)組合后,2個(gè)模型的優(yōu)勢進(jìn)行了互補(bǔ),提高了模型預(yù)測精度,對電廠SCR入口NOx濃度預(yù)測是有實(shí)際意義的。其中,單一ARIMA模型的誤差最大,預(yù)測效果也最不理想,結(jié)合模型評價(jià)指標(biāo)表4可以看出,各項(xiàng)評價(jià)指標(biāo)均為最差,由此可以說明ARIMA模型對非線性數(shù)據(jù)的預(yù)測確為劣勢,此單一模型不適用于復(fù)雜度較高的非線性數(shù)據(jù)的預(yù)測。結(jié)合圖、表進(jìn)一步分析可知,單一OSELM模型的評價(jià)指標(biāo)較好于單一ARIMA模型,預(yù)測效果分別別提升了6.9%、19.3%、5.7%,說明OSELM模型對高維度、高復(fù)雜度的非線性數(shù)據(jù)較為敏感,可以用來預(yù)測濃度。基于殘差優(yōu)化組合的ARIMA-OSELM模型的預(yù)測結(jié)果最優(yōu),其FMAPE、MRMSE和R2分別為:0.190、1.364、0.978,相比于最優(yōu)權(quán)重組合預(yù)測方法,預(yù)測結(jié)果分別提升了38.7%、32.8%、2.7%,表明將NOx濃度時(shí)間序列中的非線性部分作為模型的輸入之一,提取了殘差序列中的可用信息,有效地提升了模型預(yù)測精度。
針對火力發(fā)電廠中SCR入口NOx濃度難以準(zhǔn)確測量的問題,利用混合模型中優(yōu)勢互補(bǔ)的原理建立預(yù)測模型,得出以下結(jié)論:
(1) 以火電廠SCR入口氮氧化物濃度為研究對象建立了一種基于ARIMA和OSELM神經(jīng)網(wǎng)絡(luò)相組合的NOx濃度預(yù)測模型,使用實(shí)際電廠運(yùn)行數(shù)據(jù)進(jìn)行實(shí)驗(yàn),結(jié)果表明所建立模型能夠較好地預(yù)測NOx濃度序列,具有一定的實(shí)用性;
(2) 使用2種組合方法進(jìn)行對比研究,并與單一ARIMA模型和單一OSELM的預(yù)測結(jié)果相比較,得出基于殘差優(yōu)化的組合預(yù)測模型能夠更好地實(shí)現(xiàn)NOx濃度的預(yù)測,預(yù)測精度更高,表明殘差優(yōu)化組合模型能夠更好地提取NOx濃度序列中的非線性信息進(jìn)而提升預(yù)測精度;
(3) 使用對復(fù)雜度較低的線性數(shù)據(jù)預(yù)測能力更強(qiáng)的ARIMA模型與對復(fù)雜度較高、維度較高的非線性數(shù)據(jù)更敏感的OSELM模型相結(jié)合的組合模型方法建立預(yù)測模型,能夠使模型之間優(yōu)勢互補(bǔ),更能提高模型的預(yù)測精度。
綜上所述,實(shí)驗(yàn)所提出的火電廠SCR入口NOx濃度混合預(yù)測模型預(yù)測結(jié)果較好,可以為電廠實(shí)際濃度測量提供參考,具有一定的現(xiàn)實(shí)意義。