孫 潔,崔婷婷,劉曉悅,徐 彬
(1.華北理工大學(xué)電氣工程學(xué)院,河北 唐山063210;2.首鋼京唐鋼鐵聯(lián)合有限責(zé)任公司 煉鐵部,河北 唐山063210)
由于高爐內(nèi)的變量分布復(fù)雜和許多的物理化學(xué)反應(yīng),并且高爐內(nèi)的環(huán)境具有高溫、高壓、高腐蝕性以及高爐結(jié)構(gòu)的封閉性[1],因此高爐內(nèi)的熱狀態(tài)要想直接進(jìn)行測(cè)量有許多困難。鑒于鐵水硅含量和爐溫具有相關(guān)性,一般可以通過鐵水硅含量間接地反映爐內(nèi)溫度的變化[2]。因此,為了有效的控制爐溫,保證高爐的穩(wěn)定運(yùn)行要準(zhǔn)確的對(duì)鐵水中的硅含量進(jìn)行預(yù)測(cè)。
長(zhǎng)期以來,國內(nèi)外的許多研究人員做了很多針對(duì)鐵水硅含量預(yù)測(cè)模型的研究,隨著計(jì)算機(jī)等技術(shù)的發(fā)展,海量數(shù)據(jù)的獲得更加方便,數(shù)據(jù)驅(qū)動(dòng)模型受到了許多人的關(guān)注,其不必了解專家經(jīng)驗(yàn)和過程機(jī)理,僅僅通過數(shù)據(jù)就能捕捉過程變量間錯(cuò)綜復(fù)雜的關(guān)系。目前為止,基于數(shù)據(jù)驅(qū)動(dòng)思想建立的高爐鐵水硅含量預(yù)測(cè)模型主要有:貝葉斯模型[3]、偏最小二乘模型[4]、自回歸模型[5]、支持向量機(jī)模型[6]、神經(jīng)網(wǎng)絡(luò)模型[7-8]等。這幾類模型均有各自的優(yōu)點(diǎn)與缺陷,在生產(chǎn)條件不同的情況下,每個(gè)模型都曾起到過一定的積極作用,但其自身還存在一定的局限性,比如,貝葉斯模型建模比較耗時(shí)、適用不廣泛以及忽略了高爐冶煉機(jī)理;自回歸模型預(yù)測(cè)精度低,很難在復(fù)雜多變的高爐鐵水硅含量預(yù)報(bào)中有所表現(xiàn)等。而神經(jīng)網(wǎng)絡(luò)在本質(zhì)上可以認(rèn)為是非線性系統(tǒng),并且它具有并行分布處理、自適應(yīng)、自學(xué)習(xí)等能力,非常適合處理像高爐鐵水硅含量預(yù)測(cè)這種具有非線性、時(shí)變等性質(zhì)的問題,而且在鐵水硅含量波動(dòng)很大的情形下,該模型依然可以很好地跟蹤硅含量的變化軌跡,命中率較高。
ELM[9]算法是一種單隱含層前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,該算法在2004年由黃廣斌教授提出,具有學(xué)習(xí)速度快、泛化性能好以及在參數(shù)確定的過程中不用任何迭代調(diào)節(jié)等優(yōu)點(diǎn),因此利用ELM神經(jīng)網(wǎng)絡(luò)對(duì)鐵水硅含量進(jìn)行預(yù)測(cè)。然而ELM隨機(jī)生成輸入層權(quán)值矩陣和隱含層閾值矩陣,在ELM模型為固定時(shí),會(huì)引起預(yù)報(bào)精度下降、泛化性能減弱等問題。針對(duì)ELM存在的一些問題,將PSO和GA算法相結(jié)合,融合兩種算法各自的優(yōu)勢(shì),進(jìn)而優(yōu)化ELM的連接權(quán)值和閾值,建立基于PSO-GA-ELM的高爐鐵水硅含量預(yù)測(cè)模型,并通過分析ELM、GA-ELM、PSO-ELM和PSO-GAELM四種模型的仿真結(jié)果對(duì)比,來驗(yàn)證PSO-GA-ELM模型的有效性。
ELM的網(wǎng)絡(luò)結(jié)構(gòu),如圖1所示。由輸入層、隱含層和輸出層三部分組成:
圖1 ELM基本結(jié)構(gòu)圖Fig.1 Basic Structure Diagram of ELM
(1)輸入層:n個(gè)節(jié)點(diǎn)表示樣本維度,Xj表示第j個(gè)樣本;
(2)隱含層:有k個(gè)節(jié)點(diǎn),k越大,表達(dá)能力越強(qiáng);節(jié)點(diǎn)i與輸入層連接權(quán)值表示為αi=[α1i,α2i,…,αni],與輸出層連接權(quán)值表示為βi=[βi1,βi2,,…,βim]T;
(3)輸出層:O j表示樣本j的輸出,表示m個(gè)類別(m=1)。
其算法描述如下:
基于n個(gè)不同的訓(xùn)練樣本(xj,tj),其中x j=[x j1,xj2,…,xjn]T∈Rn,tj=[tj1,tj2,…,tjm]T∈Rm,有k個(gè)隱含層節(jié)點(diǎn)數(shù)目,其中隱含層輸出函數(shù)具有如下定義:
其中,bi是隱含層閾值,αi×x j表示αi和xj的乘積,激勵(lì)函數(shù)g(x)選用sigmoid非線性函數(shù),公式為:
圖1所示的ELM算法的最終目的是使得輸出的誤差為最小值,即:
因而目標(biāo)為:
展開為:
令
則式(5)可以寫為Hβ=T,通過計(jì)算它的最小二乘解,可得輸出層連接權(quán)值為:
式中:H-1—隱含層輸出矩陣H的Moore-Penrose廣義逆矩陣。通過以上計(jì)算方法可實(shí)現(xiàn)訓(xùn)練誤差的最小化。
粒子群算法是Kennedy和Eberhart在1995年提出的一種智能優(yōu)化算法,是從鳥群捕食的行為中得到啟發(fā)演變而來的[10]。PSO算法中每個(gè)粒子都代表待優(yōu)化問題的一個(gè)潛在最優(yōu)解,每個(gè)粒子的特征都由適應(yīng)度、位置和速度來表示,適應(yīng)度的好壞決定了粒子的優(yōu)劣。在每一次迭代過程中,粒子通過跟蹤兩個(gè)極值來更新自己,分別是:個(gè)體極值Pbest和群體極值Gbest。粒子的位置每次更新時(shí),適應(yīng)度值就計(jì)算一次,通過對(duì)比Pbest和Gbest的適應(yīng)度值與新粒子的適應(yīng)度值來更新Pbest和Gbest的速度和位置。
其算法描述如下:
設(shè)目標(biāo)搜索空間為d維,粒子數(shù)有m個(gè),則第i個(gè)粒子的位置為Xi=(Xi1,Xi2,…,Xi d),速度為Vi=(Vi1,Vi2,…,Vid),其中i=1,2,…,m,他們都是n維的空間向量。在進(jìn)行每一次迭代時(shí),速度和位置更新的公式如下:
式中:Pi=(Pi1,Pi2,…,Pid)—第i個(gè)粒子在迭代過程中尋找到的最優(yōu)位置,P g=(Pg1,Pg2,…,Pgd)—粒子群在迭代過程中尋找到的最優(yōu)位置;k—當(dāng)前迭代的次數(shù)和—第k次迭代時(shí)粒子的位置和速度;c1、c2—粒子的學(xué)習(xí)因子;r1、r2通常是(0,1)之間的任一隨機(jī)數(shù);w—慣性權(quán)重。
遺傳算法是在1975年由美國的J.Holland教授根據(jù)生物進(jìn)化理論和基因遺傳原理而提出來的一種全局搜索最優(yōu)值的智能算法,它具有高度并行性、隨機(jī)性和自適應(yīng)性等特征。遺傳算法的核心是選擇、交叉和變異等操作:
(1)選擇:通過個(gè)體評(píng)價(jià),將適應(yīng)度低的個(gè)體舍棄,適應(yīng)度高的個(gè)體留下組成新的種群,選擇時(shí)最常用的是輪盤賭選擇法,fi為個(gè)體i的適應(yīng)度值,則個(gè)體i被選擇的概率為:
(2)交叉:通過替換重組兩個(gè)父代個(gè)體的部分結(jié)構(gòu)而形成新的個(gè)體,交叉時(shí)最常用的是實(shí)數(shù)交叉方式,其公式為:
式中:r1—(0,1)之間的隨機(jī)數(shù);Smk、S nk—第m和第n個(gè)染色體在第k位上的交叉操作。
(3)變異:變動(dòng)群體中的個(gè)體串的某些基因座上的基因值從而形成新的個(gè)體,通過變異操作可以增加種群的多樣性,變異公式為:
其中,基因S ij的上下界分別為Smax和Smin,r2和r3為(0,1)之間的隨機(jī)數(shù),k和kmax分別為當(dāng)前和最大的迭代次數(shù),f(k)為變異概率。
PSO算法在尋優(yōu)時(shí),假若有一個(gè)粒子找到了當(dāng)前最優(yōu)解,別的粒子就會(huì)快速往此處聚攏,導(dǎo)致了種群全局搜索能力下降,因此就造成了算法出現(xiàn)“早熟”的現(xiàn)象,獲得的是局部最優(yōu)解。在GA算法中,經(jīng)過選擇、交叉和變異等操作可以提高種群的多樣性以及保留較優(yōu)個(gè)體。但在收斂速度上GA算法比PSO算法慢,而且PSO算法的結(jié)構(gòu)更簡(jiǎn)單并具有記憶功能。基于以上對(duì)PSO和GA這兩種算法的優(yōu)缺點(diǎn)對(duì)比,將GA算法和PSO算法融合成為PSO-GA算法,使得PSO-GA算法的收斂速度更快、魯棒性更強(qiáng)、全局搜索能力和優(yōu)化能力更高。
PSO-GA算法的基本思想為:以PSO算法為主,引入遺傳算法中的選擇、交叉和變異等操作。在每次進(jìn)行迭代尋優(yōu)時(shí),首先將適應(yīng)度值按由小到大的順序進(jìn)行排序,并將種群其平分為兩份,適應(yīng)度值小的部分為P1,適應(yīng)度值大的部分為P2;其次種群P1中粒子的適應(yīng)度值、位置和速度保持不變,對(duì)于種群P2中的粒子進(jìn)行速度更新時(shí)引入交叉操作,進(jìn)行位置更新時(shí)引入變異操作;最后將種群P1和經(jīng)過交叉變異操作的種群P2的適應(yīng)度值進(jìn)行比較,適應(yīng)度值最小的粒子為最優(yōu)粒子,并重新更新Pi和Pg。
由于ELM的輸入層權(quán)值矩陣和隱含層閾值矩陣是隨機(jī)選取的,這種隨機(jī)性會(huì)影響ELM訓(xùn)練的時(shí)間和精度,因此利用PSOGA優(yōu)化ELM的輸入層權(quán)值矩陣和隱含層閾值矩陣,進(jìn)而將選出的最優(yōu)輸入權(quán)值和閾值帶入ELM中,并進(jìn)行鐵水硅含量預(yù)測(cè)。其中PSO-GA-ELM的基本運(yùn)算步驟如下:
(1)初始化參數(shù)和粒子群。隨機(jī)生成ELM的輸入層權(quán)值α和隱含層閾值b構(gòu)成粒子群中的粒子,選定粒子的Pi和Pg。
(2)計(jì)算適應(yīng)度函數(shù)。適應(yīng)度函數(shù)為均方根誤差(Root mean square error,RMSE),其公式為:
式中:fi—第i個(gè)粒子的適應(yīng)度函數(shù);f(xi)—樣本預(yù)測(cè)值;ti—樣本實(shí)測(cè)值;n—輸入數(shù)據(jù)總數(shù),適應(yīng)度值越小,預(yù)測(cè)精度越高。
(3)引入遺傳算法中的選擇算子。首先計(jì)算每個(gè)粒子的適應(yīng)度值,然后將適應(yīng)度值按由小到大的順序進(jìn)行排序,將種群其平分為兩份,適應(yīng)度值小的部分為P1,適應(yīng)度值大的部分為P2,種群P1中粒子的適應(yīng)度值、位置和速度保持不變,對(duì)于種群P2進(jìn)行交叉和變異操作,這樣不僅能夠保留較多優(yōu)質(zhì)粒子,而且可以選出更優(yōu)的適應(yīng)度值,從而使算法的收斂速度得以提高。
(4)對(duì)種群P2中的粒子進(jìn)行速度更新時(shí),引入遺傳算法中的交叉算子,使速度更新公式變?yōu)椋?/p>
(5)對(duì)種群P2中的粒子進(jìn)行位置更新時(shí)引入遺傳算法中的變異算子。由于粒子具有記憶功能,會(huì)跟隨記憶進(jìn)行搜索從而陷入局部最優(yōu),因此引入變異算子來改變粒子的位置信息,改善粒子重復(fù)落在同一點(diǎn)的情況,跳出局部最優(yōu)解。位置更新公式變?yōu)椋?/p>
式中:上下界—Xmax和Xmin;r3、r4為(0,1)之間的隨機(jī)數(shù);k、kmax—當(dāng)前和最大的迭代次數(shù);f(k)—變異概率。
(6)重新將種群P1中的粒子和進(jìn)行遺傳操作后的種群P2中的粒子的適應(yīng)度值進(jìn)行排序,并且更新Pi和Pg。
(7)若算法滿足終止條件,即達(dá)到了設(shè)定的最大迭代次數(shù)或者得出最優(yōu)的適應(yīng)度值,則轉(zhuǎn)到步驟(8);否則轉(zhuǎn)到步驟(2),繼續(xù)進(jìn)行迭代。
(8)將輸出最優(yōu)的α和b代入到ELM預(yù)測(cè)模型中。
(9)將訓(xùn)練數(shù)據(jù)用于訓(xùn)練ELM模型,并將訓(xùn)練好的模型用于鐵水硅含量預(yù)測(cè)中。
實(shí)驗(yàn)數(shù)據(jù)來自于某鋼廠2號(hào)高爐實(shí)際在線采集的400組數(shù)據(jù),經(jīng)過對(duì)數(shù)據(jù)進(jìn)行去噪、剔除異常值以及對(duì)滯后步數(shù)數(shù)據(jù)進(jìn)行處理得到270組可用于實(shí)驗(yàn)的數(shù)據(jù)。在這些數(shù)據(jù)中,隨機(jī)抽取200組數(shù)據(jù)作為訓(xùn)練樣本,其余70組數(shù)據(jù)作為預(yù)測(cè)樣本。
在高爐冶煉過程中存在多種多樣的數(shù)據(jù)信息,有許多變量都和鐵水硅含量的變化有著密切的關(guān)系,如噴煤量、熱風(fēng)溫度、富氧流量、實(shí)際風(fēng)速、熱風(fēng)壓力、冷風(fēng)壓力、鼓風(fēng)動(dòng)能、富養(yǎng)壓力、透氣性指數(shù)以及全壓差等。如果模型的輸入變量過多會(huì)使模型變得復(fù)雜,過少又會(huì)使模型精度降低,因此根據(jù)現(xiàn)場(chǎng)經(jīng)驗(yàn)及相關(guān)性分析,選取與鐵水硅含量相關(guān)性較強(qiáng)的7個(gè)變量作為模型的輸入變量,如表1所示。
表1 模型的輸入變量Tab.1 The Input Variable of Model
由于以上各輸入變量的量綱和數(shù)量級(jí)不同會(huì)對(duì)建模有影響,因此要?dú)w一化處理樣本數(shù)據(jù)中各變量的范圍為[-1,1]。
在對(duì)模型的預(yù)測(cè)精度進(jìn)行評(píng)價(jià)時(shí),有兩個(gè)指標(biāo)起到關(guān)鍵的作用,分別為命中率(Hit rate,HR)和均方根誤差(Root mean square error,RMSE),其公式如下:
式中:n—樣本總數(shù);f(x i)—樣本預(yù)測(cè)值;ti—樣本實(shí)測(cè)值。在對(duì)預(yù)測(cè)模型進(jìn)行評(píng)價(jià)時(shí),HR越大,RMSE越小,說明模型的預(yù)測(cè)精度越高。
經(jīng)過多次實(shí)驗(yàn)分析,對(duì)模型的各參數(shù)進(jìn)行如下設(shè)置:ELM結(jié)構(gòu)為7-29-1,GA和PSO的最大迭代次數(shù)為500,種群規(guī)模為100,交叉概率為0.8,變異概率為0.3,慣性權(quán)重wmax=0.98,wmin=0.8,學(xué)習(xí)因子c1=2,c2=1.7。根據(jù)設(shè)置好的參數(shù)進(jìn)行模型的建立、學(xué)習(xí)訓(xùn)練和仿真預(yù)測(cè)。
為了驗(yàn)證文中所構(gòu)建的PSO-GA-ELM模型的有效性,分別通過ELM、GA-ELM、PSO-ELM和PSO-GA-ELM四種模型的預(yù)報(bào)結(jié)果進(jìn)行對(duì)比分析。不同建模方法對(duì)硅含量預(yù)報(bào)結(jié)果圖,如圖2所示。
由圖2看出,相比于ELM、GA-ELM和PSO-ELM三種預(yù)測(cè)模型來說,PSO-GA-ELM模型在硅含量波動(dòng)較大的爐次預(yù)測(cè)效果最好,并且隨著樣本爐次的增加,PSO-GA-ELM模型的預(yù)測(cè)值依舊能夠很好地跟蹤到實(shí)際值的變化,這能很好地說明在樣本數(shù)量較大時(shí),PSO-GA-ELM模型的泛化性能和學(xué)習(xí)能力均有所提高。
圖2 不同建模方法對(duì)硅含量預(yù)報(bào)結(jié)果圖Fig.2 The Prediction Result of Silicon Content Based on Different Modeling Methods
ELM、GA-ELM和PSO-ELM模型的預(yù)測(cè)誤差多數(shù)在[-0.1,0.1]之內(nèi),而PSO-GA-ELM模型的預(yù)測(cè)誤差多數(shù)在[-0.05,0.05]之內(nèi),這說明PSO-GA-ELM模型的預(yù)測(cè)誤差最為穩(wěn)定,增加了預(yù)測(cè)模型的穩(wěn)定性能,如圖3所示。
圖3 不同模型的預(yù)測(cè)誤差曲線Fig.3 Prediction Error Curve of Different Models
不同建模方法的預(yù)報(bào)結(jié)果對(duì)比,如表2所示。對(duì)于4種模型的預(yù)報(bào)結(jié)果對(duì)比,顯然PSO-GA-ELM模型的預(yù)測(cè)命中率最高,且均方根誤差最小,相比于原始的ELM模型,其預(yù)測(cè)命中率提高了13%,均方根誤差降低了0.017,有效的提高了模型的預(yù)測(cè)精度。
表2 不同建模方法的預(yù)報(bào)結(jié)果對(duì)比Tab.2 Comparison of Prediction Results of Different Modeling Methods
針對(duì)高爐冶煉過程的非線性、多尺度以及動(dòng)態(tài)等因素,提出了PSO-GA-ELM預(yù)測(cè)模型。在使用同一組實(shí)驗(yàn)數(shù)據(jù)的情況下,通過對(duì)比ELM、GA-ELM、PSO-ELM和PSO-GA-ELM這四種預(yù)測(cè)模型的預(yù)報(bào)結(jié)果圖、預(yù)報(bào)誤差、命中率以及均方根誤差可得到以下結(jié)論:
(1)利用PSO-GA算法優(yōu)化ELM模型的連接權(quán)值和閾值,使優(yōu)化后的預(yù)測(cè)模型的學(xué)習(xí)能力以及泛化性能上均有所提高,且具有更高的穩(wěn)定性。
(2)PSO-GA-ELM模型有效的解決了PSO-ELM模型易陷入早熟收斂問題的情況,跳出局部最優(yōu)解,提高了模型的預(yù)測(cè)精度。