鄭茗友, 王 偉, 趙文杰, 王建峰, 郄英杰
(1.華北電力大學 控制與計算機工程學院,河北 保定 071003;2.山西漳山發(fā)電有限責任公司,山西 長治 046021)
我國是世界上最大的煤炭生產國和消費國,煤炭燃燒所產生的SO2、 NOX、粉塵等大氣污染物是現(xiàn)階段我國環(huán)境治理的關鍵[1]。燃煤電廠現(xiàn)已成為污染物排放的主要來源,其中的SO2主要通過脫硫系統(tǒng)來進行脫除,在我國燃煤電廠中石灰石—石膏濕法脫硫技術應用最為廣泛。隨著環(huán)保要求的日益嚴格,現(xiàn)階段電廠 SO2出口濃度一般都控制在35 mg/m3以下[2],SO2的優(yōu)化控制已經(jīng)成為各發(fā)電企業(yè)重點的研究方向。優(yōu)化控制策略的設計離不開脫硫效率計算的支撐。雖然電廠存在著大量的數(shù)據(jù)監(jiān)測設備,煙氣分析儀表也可以實時監(jiān)測SO2的濃度。但監(jiān)測出的數(shù)據(jù)往往存在著滯后性,不能夠及時反映工況的變化,同時監(jiān)測設備也存在著老化、故障等問題,使測量結果存在較大誤差。如果能夠使用數(shù)學方法,通過一定的運算規(guī)則直接計算得到脫硫系統(tǒng)的出口SO2濃度,將有效提高脫硫系統(tǒng)的控制水平。隨著人工智能的興起,大量的智能算法在脫硫出口濃度預測中得以應用,張浩[3]提出了基于聚類的偏最小二乘支持向量機脫硫出口濃度預測模型。將聚類分析、偏最小二乘法(PLS)、最小二乘支持向量機(LSSVM)結合起來,達到了良好的預測效果。崔仕文[4]等提出了基于偏最小二乘支持向量機的脫硫出口濃度預測模型,使用PLS方法進行了對脫硫效率影響因素的分析。并使用支持向量機(SVM)進行建模,取得了良好的效果,但模型計算復雜度較高。神經(jīng)網(wǎng)絡因其具有優(yōu)異的自學習功能在預測方面應用廣泛。馬雙忱等[5]提出基于深度神經(jīng)網(wǎng)絡的脫硫系統(tǒng)預測模型。蘇翔鵬等[6]基于RBF神經(jīng)網(wǎng)絡對雙堿法脫硫塔SO2排放量進行了預測;李斌等[7]提出了基于T-S模糊神經(jīng)網(wǎng)絡的脫硫出口濃度預測模型,李軍紅等[8]提出了廣義回歸神經(jīng)網(wǎng)絡對脫硫效率的預測。神經(jīng)網(wǎng)絡具有容錯度高,普適性強的優(yōu)點,但因其訓練存在隨機性,容易發(fā)生過擬合現(xiàn)象。
以上的方法因為其復雜的結構需要在一定的獨立軟件中進行仿真研究,難以得到具體的預測模型。同時大多數(shù)的研究者將目光放在脫硫效率的影響因素與脫硫效率之間的關系,但在實際的應用中,發(fā)電企業(yè)主要關注的是脫硫系統(tǒng)出口SO2濃度是否達標,鑒于此本文提出使用Lasso算法進行脫硫系統(tǒng)出口濃度的預測。將各參數(shù)以最優(yōu)的函數(shù)形式組合起來,并結合正交化法則進行訓練數(shù)據(jù)的選取,有效降低了模型的計算復雜度,提高了訓練樣本的豐富性,使模型具有較高的預測精度。使用某電廠實際的脫硫系統(tǒng)運行數(shù)據(jù)進行訓練和測試,并驗證模型的預測精度與穩(wěn)定性。
濕法脫硫系統(tǒng)主要工藝原理是通過漿液循環(huán)泵將漿液池中的石灰石漿液噴灑到脫硫塔的頂部,含硫煙氣經(jīng)過引風機引入吸收塔自下而上的與石灰石漿液進行接觸,使煙氣中的SO2與石灰石漿液充分反應,化學反應式如下:
CaCo3+2SO2+H2O→Ca(HSO3)2+CO2
(1)
反應后的產物經(jīng)氧化風機氧化后生成石膏,化學反應式如下:
Ca(HSO3)2+O2+CaCO3+3H2O→
2CaSO3·2H2O+CO2
(2)
經(jīng)過上述反應,煙氣中的SO2被脫除,生成了副產物石膏。整體的工藝流程如圖1所示。
圖1 石灰石-石膏濕法脫硫系統(tǒng)工藝流程圖Fig. 1 Process flow chart of limestone-gypsum wet desulfurization system
數(shù)據(jù)預處理是建模的關鍵步驟,在實際數(shù)據(jù)的采集過程中,往往因為設備老化,通信故障等問題造成數(shù)據(jù)跳變或者短暫缺失,根據(jù)對脫硫系統(tǒng)的經(jīng)驗,對于每個測量值發(fā)生跳變或缺失的數(shù)據(jù)進行刪除處理,保證數(shù)據(jù)集的有效性。
2.2.1 皮爾遜相關系數(shù)
脫硫系統(tǒng)中影響出口SO2濃度的因素有很多,建模過程中輸入維數(shù)過大會導致模型的效率下降,為了降低輸入的維度,需要尋找對因變量最具有強解釋力的自變量集合[9],相關性分析可以定量衡量自變量與因變量的密切關系,可以通過自變量的選擇來提高模型的解釋性和預測精度。目前使用較多的相關性分析方法主要有互信息、相關系數(shù)、協(xié)方差等,為了找到自變量集合的最優(yōu)解,本文使用皮爾遜相關系數(shù)進行變量的選取。皮爾遜相關系數(shù)定義為
(3)
(4)
(5)
(6)
2.2.2 分析結果
使用皮爾遜相關系數(shù)對影響脫硫出口SO2濃度的因素進行相關性分析,根據(jù)相關性的強弱篩選得到6組相關性最強的主要變量,篩選后的變量及波動范圍如表1所示。
表1 影響出口濃度的因素與波動范圍Tab.1 Influencing factors and fluctuation range of outlet concentration
漿液循環(huán)泵運行臺數(shù)的多少直接影響了相同工況下出口的濃度,但由于漿液循環(huán)泵投運臺數(shù)只有3個固定值,作為擬合的參數(shù)意義不大,考慮分情況進行討論,本文以4臺泵投運為例,建立出口SO2的預測模型。
對于出口SO2濃度Y和選定的參數(shù)X=(x1,x2,…,xn),假定模型為線性模型,則其具體的表達式可以寫為
Y=λ1×x1+λ2×x2+…+λn×xn+β
(7)
式中:λ為回歸系數(shù);β為整體的誤差。
在回歸模型中,為了保證擬合的效果,一般要求損失函數(shù)RRS最小,設損失函數(shù)為
(8)
Lasso回歸算法 (Least absolute shrinkage and selection operator)是一種壓縮估計。它通過構造一個罰函數(shù)得到一個較為精煉的模型[11],基本思想是在回歸系數(shù)的絕對值之和小于一個常數(shù)的約束條件下,使殘差平方和最小化,從而能夠產生某些嚴格等于0 的回歸系數(shù)[12],得到可以解釋的模型。具體的計算公式為
(9)
式中:X=(x1,x2,…,xn)T是數(shù)據(jù)矩陣即通過變量篩選后模型的輸入,Y=(y1,y2,…,yn)T是由標簽組成的列向量即預測模型的輸出,w為系數(shù)矩陣。
對于w的求解,采用坐標下降法,通過啟發(fā)式的方式進行迭代求解函數(shù)的最小值。首先設定初值w(0),括號里的數(shù)表示迭代輪數(shù)。在第k輪迭代中,w的n個維度的迭代公式為
(10)
(11)
…
(12)
如果w(k)和w(k-1)在各維度上變化都足夠小,那么w(k)即為所求,否則繼續(xù)進行下一輪迭代。
由于Lasso算法也屬于線性算法范疇,用單純的一次項進行擬合會導致模型復雜度不夠,預測精度不足,為了進一步提升預測精度,選取各參數(shù)最優(yōu)的函數(shù)形式來代替,最終得到的預測模型為
Y=λ1×h(x1)+λ2×h(x2)+…+λn×h(xn)+β
(13)
式中:h(x)為各參數(shù)最優(yōu)的函數(shù)表達式,包括線性函數(shù)h(x)=k×x+c,二次多項式函數(shù)h(x)=a×x2+b×x+c,冪函數(shù)h(x)=a×xb等。
3.2.1 粒子群優(yōu)化算法
粒子群優(yōu)化算法(PSO)是通過模擬鳥類覓食行為而提出的一種群體智能搜索算法。算法采用速度—位置搜索模型。每個粒子代表解空間的一個候選解,解的優(yōu)劣程度由適應度函數(shù)決定,而適應度函數(shù)根據(jù)優(yōu)化目標定義。
PSO算法隨機初始化一群粒子,然后通過迭代找到最優(yōu)解。在每一次迭代中,粒子通過跟蹤兩個“極值”來更新自己[13]。一個是粒子本身所找到的最優(yōu)解,即個體極值pbest;,另一個是整個種群目前找到的最優(yōu)解,稱之為全局極值gbest。具體的算法步驟如圖2所示。
圖2 PSO算法計算步驟Fig. 2 PSO algorithm calculation steps
3.2.2 函數(shù)形式篩選
假設各參數(shù)相互獨立,使用粒子群優(yōu)化算法對每一項參數(shù)以不同的函數(shù)形式進行擬合,對比其與出口SO2濃度的誤差,找到最優(yōu)的函數(shù)形式。經(jīng)過對比,擬采用線性、二次多項式、三次多項式、冪函數(shù)4種結構進行擬合。以SO2脫除量為例,最優(yōu)的擬合結果如圖3所示。
評價函數(shù)使用均方差表示,具體形式為
(14)
式中:r為擬合出的數(shù)學期望;N為樣本個數(shù)。
圖3 多項式函數(shù)擬合效果Fig. 3 Fitting effect of polynomial function
分別分析4種函數(shù)形式并計算相應的誤差,其結果如表2所示。
表2 不同函數(shù)形式擬合結果Tab.2 Fitting results of different functional forms
由表2可知,最優(yōu)的函數(shù)形式為二次多項式,具體的表達式為
f(x)=1.742e-6x2±0.02x+68.84
(15)
式中:x為SO2脫除量;f(x)為函數(shù)計算得到的出口SO2濃度。對剩余參數(shù)使用同樣的方法尋找最優(yōu)的函數(shù)形式。具體結果如表3所示。
表3 參數(shù)最優(yōu)的函數(shù)形式Tab.3 Function form with optimal parameters
在實際現(xiàn)場運行數(shù)據(jù)中選取工況較為穩(wěn)定的256組數(shù)據(jù),其中機組負荷數(shù)據(jù)如圖4所示??梢园l(fā)現(xiàn)機組負荷波動較大,數(shù)據(jù)的區(qū)間也分布不均,350 MW以下的時刻較多,只有個別時刻在400 MW以上,直接使用這種分布不均的數(shù)據(jù)作為訓練集會導致模型預測精度的偏移,訓練樣本多的區(qū)間預測的結果更加準確,樣本少的會有較大誤差。
圖4 機組負荷樣本Fig. 4 Unit load sample
因此根據(jù)正交化法則需要對訓練集的數(shù)據(jù)進行篩選[15],組成數(shù)據(jù)區(qū)間分布均勻的樣本,使訓練樣本能夠充分反應自身的特性。經(jīng)篩選后得到分布均勻的訓練集60組。
使用Lasso算法對篩選后的訓練樣本進行訓練,得到各參數(shù)的最優(yōu)系數(shù)組合λ,結合各參數(shù)最優(yōu)的函數(shù)形式得到最終的預測公式:
(16)
式中:Y為脫硫出口的SO2濃度;x1為機組負荷;x2為入口煙氣流量;x3為SO2脫除量;x4為入口SO2濃度;x5為PH值。
根據(jù)公式計算得到的訓練結果如圖5所示。
圖5 訓練結果Fig. 5 Training results
利用式(14)得到訓練結果的誤差為2.043 mg/m3,從訓練結果可以看出,模型的預測精度較高,能夠較為準確的反應出口SO2的變化。
選取一段新的運行數(shù)據(jù)進行預測,并結合現(xiàn)階段使用較為廣泛的支持向量機(SVM)進行對比,以此驗證模型的可行性,然后計算相應的誤差。結果如圖6所示。
圖6 預測結果Fig. 6 Predicting results
利用式(14)計算兩個模型的預測誤差,結果如表4所示。
表4 兩種模型的誤差Tab.4 Error of two models
可以發(fā)現(xiàn)兩種方法的預測效果都比較準確,基于Lasso算法的預測誤差低于SVM,說明增加計算復雜度后,簡單的計算方法也能達到較好的預測水平,結合Lasso算法能夠得到具體模型的優(yōu)點,可以將模型寫入到控制系統(tǒng)中,有助于控制系統(tǒng)的優(yōu)化等進一步的研究,具有很強的實踐意義。
(1)鑒于大多數(shù)主流的建模方法無法得到具體模型的缺點,本文提出了基于Lasso算法的脫硫系統(tǒng)出口濃度預測模型,通過PSO尋優(yōu)算法找到各參數(shù)最佳的函數(shù)形式,并通過正交化法則篩選訓練數(shù)據(jù),得到了具體的函數(shù)模型。
(2)相比于SVM算法,該模型在簡化計算復雜度的同時保持著較高的預測精度和運算速度。
(3)本文提出的方法是對脫硫出口預測的新的嘗試,在參數(shù)的選取,函數(shù)形式的確定方面還有待更深入的研究。