王建華羅雷濤耿佳燦
(上海應(yīng)用技術(shù)學(xué)院電氣與電子工程學(xué)院1,上海 201418;華東理工大學(xué)化工過(guò)程先進(jìn)控制與優(yōu)化技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室2,上海 200237)
煤調(diào)濕系統(tǒng)蒸汽消耗量的多模型建模研究
王建華1羅雷濤2耿佳燦2
(上海應(yīng)用技術(shù)學(xué)院電氣與電子工程學(xué)院1,上海 201418;華東理工大學(xué)化工過(guò)程先進(jìn)控制與優(yōu)化技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室2,上海 200237)
煤調(diào)濕工藝是煉焦過(guò)程的關(guān)鍵技術(shù),建立煤調(diào)濕系統(tǒng)的蒸汽消耗量軟測(cè)量模型對(duì)節(jié)約生產(chǎn)成本、減少環(huán)境污染和提高焦炭質(zhì)量具有促進(jìn)作用。針對(duì)某煉鐵廠煤調(diào)濕裝置的非線性、強(qiáng)耦合、工況波動(dòng)大等特點(diǎn),提出了一種多模型建模方法。對(duì)模糊核C均值聚類(lèi)引入了基于密度的聚類(lèi)中心初始化方法和聚類(lèi)數(shù)目自適應(yīng)策略,并將其用于生產(chǎn)工況最優(yōu)劃分;使用最小二乘支持向量機(jī)對(duì)每個(gè)子工況進(jìn)行數(shù)據(jù)驅(qū)動(dòng)建模,并利用貝葉斯證據(jù)框架優(yōu)化最小二乘支持向量機(jī)的超參數(shù)。檢驗(yàn)結(jié)果表明,所提出的煤調(diào)濕系統(tǒng)蒸汽消耗量多模型具有良好的跟蹤性能與較高的預(yù)測(cè)精度。
煤調(diào)濕 模糊核C均值聚類(lèi) 最小二乘支持向量機(jī)(LSSVM) 貝葉斯證據(jù)框架 多模型
煤調(diào)濕工藝(coal moisture control,CMC)是焦炭煉制過(guò)程的一種預(yù)處理技術(shù)。CMC通過(guò)焦化生產(chǎn)的余熱對(duì)煉焦煤進(jìn)行直接或間接的加熱,使其中的水分降低到一定的程度,從而保證焦?fàn)t能在穩(wěn)定的條件下生產(chǎn),以達(dá)到提高焦?fàn)t生產(chǎn)能力、降低煉焦能耗、改善焦炭質(zhì)量的目的。煤調(diào)濕系統(tǒng)是復(fù)雜的非線性系統(tǒng),其精確的數(shù)學(xué)模型難以建立?;谀芰科胶鈾C(jī)理的煤調(diào)濕蒸汽消耗量預(yù)測(cè)模型精度較低,難以適用于復(fù)雜的現(xiàn)場(chǎng)生產(chǎn)。數(shù)據(jù)驅(qū)動(dòng)建模是一種有效的化工過(guò)程建模技術(shù),已被成功應(yīng)用于各種工業(yè)過(guò)程[1]。傳統(tǒng)建模技術(shù)的研究集中在各種建模方法的改進(jìn),如人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)、支持向量機(jī)(support vector machine,SVM)、高斯過(guò)程(Gaussian process,GP)等。但是,實(shí)際的工業(yè)過(guò)程往往伴隨著多變量、強(qiáng)耦合、工況浮動(dòng)大等特點(diǎn),難以用單一的模型精確描述。
近年來(lái),復(fù)雜工業(yè)過(guò)程的多模型建模方法得到了越來(lái)越多的研究。多模型建模方法根據(jù)工況的不同將系統(tǒng)劃分成不同的子區(qū)間,建立每個(gè)子區(qū)間對(duì)應(yīng)的模型,全局過(guò)程的輸出為子模型的輸出加權(quán)求和[2]。這種方法在提高模型精度的同時(shí)降低了模型的復(fù)雜度,彌補(bǔ)了單一模型難以真正描述全局模型的缺點(diǎn)。多模型建模可分為聚類(lèi)和建模兩個(gè)步驟,子工況的劃分和建模方法的選擇對(duì)于全局模型效果影響甚大,應(yīng)根據(jù)不同的研究對(duì)象確定合適的聚類(lèi)方法與建模策略。孫建平等[3]依據(jù)負(fù)荷和主蒸汽溫度,使用雙層K均值聚類(lèi)將某電廠的生產(chǎn)過(guò)程劃分為不同工況,并使用最小二乘支持向量機(jī)(least squares support vector machine, LSSVM)建立了不同工況下的模型。Yu等[4]使用多核高斯過(guò)程回歸和貝葉斯模型平均理論建立了批處理過(guò)程的多模型預(yù)測(cè)方法。陳貴華等[5]提出使用模糊核聚類(lèi)對(duì)石腦油數(shù)據(jù)庫(kù)進(jìn)行最優(yōu)劃分,建立了基于LSSVM的乙烯裂解深度的多模型,并使用差分進(jìn)化算法對(duì)模型參數(shù)尋優(yōu),模型跟蹤性能良好。
本文針對(duì)煤調(diào)濕過(guò)程蒸汽消耗量預(yù)測(cè)問(wèn)題,提出了一種多模型建模方法。使用模糊核C均值聚類(lèi)(fuzzy kernel C-means clustering,FKCM)對(duì)某煉鐵廠煤調(diào)濕過(guò)程的生產(chǎn)工況進(jìn)行自適應(yīng)聚類(lèi)。將工況劃分為不同的子區(qū)間,將LSSVM應(yīng)用于各子區(qū)間的數(shù)據(jù)驅(qū)動(dòng)建模;并通過(guò)貝葉斯證據(jù)框架(Bayesian evidence framework,BEF)的三層推斷對(duì)LSSVM的超參數(shù)進(jìn)行優(yōu)化;最后利用輸入向量的模糊隸屬度加權(quán)輸出煤調(diào)濕過(guò)程的蒸汽消耗量預(yù)測(cè)值。以該廠數(shù)據(jù)的實(shí)際生產(chǎn)數(shù)據(jù)進(jìn)行模型檢驗(yàn),檢驗(yàn)結(jié)果表明了該多模型建模方法的有效性。
在高爐煉鐵煉鋼及鑄造工業(yè)生產(chǎn)中,焦炭是不可缺少的主要燃料,焦炭的質(zhì)量直接影響到煉鐵和鑄造的質(zhì)量。煉焦是指將煤在隔絕空氣的條件下高溫加熱至950~1 050℃,經(jīng)過(guò)干燥、熱解、熔融、粘結(jié)、固化和收縮等加工工藝后,最終制成焦炭。煉焦過(guò)程主要在焦?fàn)t內(nèi)進(jìn)行,由于有水的存在,煤中的水分最先在煉焦?fàn)t內(nèi)蒸發(fā)汽化成水蒸氣,這就浪費(fèi)掉了部分寶貴的煤氣資源,同時(shí)降低了爐墻的表面溫度,對(duì)炭化室墻面也有腐蝕,影響了焦?fàn)t爐體嚴(yán)密性,無(wú)形中增加了煉焦煤氣的成本。因此,煉焦煤一般都需要經(jīng)過(guò)煤調(diào)濕工藝進(jìn)行干燥預(yù)處理,使入爐煤的水分降低到5%~6%。
某煉鐵廠的煤調(diào)濕采用多管回轉(zhuǎn)式干燥機(jī)間接加熱方式,其工藝流程如圖1所示。圖1中的蒸汽管式間接加熱轉(zhuǎn)筒干燥器是該套裝置的主體設(shè)備。從濕煤料槽進(jìn)入轉(zhuǎn)筒干燥機(jī)管間的濕煤,由于轉(zhuǎn)筒干燥器的旋轉(zhuǎn)而向前流動(dòng),與其內(nèi)部走管內(nèi)的低壓蒸汽進(jìn)行間接換熱,煤料與蒸汽逆向流動(dòng)。由于煤料被加熱后會(huì)產(chǎn)生大量水汽,因此在煤料入口處通入焦?fàn)t煙道氣作為載氣,以吹走這些水汽,而通入管內(nèi)的低壓蒸汽在換熱后轉(zhuǎn)換成飽和水,從蒸汽管式間接加熱轉(zhuǎn)筒干燥器中間的一根管子集中后流出,再送入干熄焦鍋爐的純水系統(tǒng)。被載氣從蒸汽管式間接加熱轉(zhuǎn)筒干燥器中吹出的大量含塵廢氣將進(jìn)入除塵系統(tǒng),經(jīng)除塵后排放。而集塵產(chǎn)生的煤粉經(jīng)加濕后會(huì)回配到煤處理流程中。該工藝所用熱源為煉焦廠干熄焦蒸汽發(fā)電后的低壓蒸汽(1.6 MPa,260℃),裝置可將含水量9.1%~12.2%的濕煤干燥處理成6.5%~6.9%的調(diào)濕煤。
圖1 煤調(diào)濕過(guò)程工藝流程Fig.1 Technological process of the coal moisture control
在實(shí)際生產(chǎn)中,煤調(diào)濕過(guò)程的主要目的是控制好出口煤濕度,在不投入過(guò)多成本的情況下使得出口煤濕度滿足后續(xù)裝置的生產(chǎn)要求。由于生產(chǎn)過(guò)程中濕煤的傳輸速度一般是固定的,因此控制出口煤濕度的關(guān)鍵是控制蒸汽消耗量。雖然煤調(diào)濕過(guò)程是一個(gè)不涉及化學(xué)反應(yīng)的換熱過(guò)程,但由于其涉及到的控制回路較多,它仍然是一個(gè)多參數(shù)、強(qiáng)耦合、非線性并且大時(shí)滯的復(fù)雜系統(tǒng)。在該廠生產(chǎn)中,主要由操作人員根據(jù)經(jīng)驗(yàn)對(duì)蒸汽流量進(jìn)行調(diào)節(jié)。由于不同班組、不同操作工對(duì)作業(yè)參數(shù)的理解不同,并不能準(zhǔn)確地把握蒸汽消耗量,造成出口煤濕度波動(dòng)較大,影響煉焦?fàn)t的平穩(wěn)運(yùn)行,因此十分有必要建立煤調(diào)濕系統(tǒng)的蒸汽消耗量模型,在指定出口煤濕度的情況下計(jì)算出相應(yīng)的蒸汽流量。由于實(shí)際生產(chǎn)過(guò)程中的工況浮動(dòng)范圍較大,因此本文考慮使用多模型建模技術(shù)對(duì)煤調(diào)濕過(guò)程進(jìn)行模型分析與求解。
2.1 模糊核C均值聚類(lèi)
模糊C均值聚類(lèi)(FCM)是Bezdek于1981年提出的一種用隸屬度確定每個(gè)樣本屬于某個(gè)聚類(lèi)的程度的一種聚類(lèi)算法,其主要思想是將數(shù)據(jù)的聚類(lèi)轉(zhuǎn)化成非線性?xún)?yōu)化問(wèn)題,并通過(guò)迭代進(jìn)行聚類(lèi)中心和隸屬度的求解。其聚類(lèi)準(zhǔn)則函數(shù)為:
式中:N為分類(lèi)樣本總數(shù);C為聚類(lèi)個(gè)數(shù);xi為待分類(lèi)的樣本向量;vj為聚類(lèi)中心;m>1為加權(quán)參數(shù);uij為樣本xi對(duì)應(yīng)于第j個(gè)聚類(lèi)的隸屬度。
FCM即尋找一種最佳分類(lèi),使目標(biāo)函數(shù)J取得最小值。模糊C均值聚類(lèi)難以處理分類(lèi)邊界為非線性或者樣本集很大的情況[6],這種情況可通過(guò)引入核函數(shù)的方法得到解決。模糊核C均值聚類(lèi)(FKCM)即采用非線性映射x→φ(x)將數(shù)據(jù)映射到高維空間,把低維空間中的線性不可分問(wèn)題轉(zhuǎn)換成高維空間中的線性可分問(wèn)題。在高維特征空間中,樣本的距離定義為:
式中:K為核函數(shù)。
在本文中,采用高斯核函數(shù),即:
式中:σ為高斯核參數(shù)。
由給定樣本集,σ確定為:
對(duì)于式(1)和式(2),構(gòu)造拉格朗日函數(shù)并分別對(duì)u和v求偏導(dǎo),可得FKCM算法的聚類(lèi)中心vj和隸屬度uij的更新公式,即:
2.2 基于密度的聚類(lèi)中心初始化
同其他聚類(lèi)方法一樣,FKCM算法的性能同樣依賴(lài)于初始聚類(lèi)中心的選取,較好的初始聚類(lèi)中心不僅能夠加快算法收斂速度,而且能提高分類(lèi)精度。在聚類(lèi)算法中,一般選取k個(gè)距離最遠(yuǎn)的數(shù)據(jù)作為初始聚類(lèi)中心,這些數(shù)據(jù)在一定程度上能夠代表數(shù)據(jù)的分布特征。文獻(xiàn)[7]采取聚類(lèi)對(duì)象分布密度方法來(lái)確定初始聚類(lèi)中心,選擇相互距離最遠(yuǎn)的k個(gè)高密度區(qū)域的點(diǎn)作為初始聚類(lèi)中心。該方法定義了一個(gè)密度參數(shù):以樣本點(diǎn)xi為中心,包含常數(shù)Minpts個(gè)數(shù)據(jù)對(duì)象的半徑稱(chēng)為xi的密度參數(shù),記為ε。ε越大,說(shuō)明樣本點(diǎn)所處的區(qū)域數(shù)據(jù)密度越低?;诿芏鹊木垲?lèi)中心初始化方法首先計(jì)算每個(gè)樣本點(diǎn)的密度參數(shù),刪除密度參數(shù)過(guò)大的低密度區(qū)域的樣本,得到高密度樣本點(diǎn)集合D。然后取集合D中密度參數(shù)最小的點(diǎn)作為第一個(gè)聚類(lèi)中心點(diǎn)c1,集合D中離c1最遠(yuǎn)的點(diǎn)作為第二個(gè)聚類(lèi)中心點(diǎn)c2,計(jì)算集合D中各樣本xi到聚類(lèi)中心c1和c2的距離,c3為滿足max{min[d(xi,c1)],min[d(xi,c2)]}的樣本點(diǎn)。以此類(lèi)推,ck為滿足max{min[d(xi,c1)],min[d(xi,c2)],…,min[d(xi,ck-1)]}的樣本點(diǎn)。依此得到k個(gè)初始聚類(lèi)中心。
2.3 聚類(lèi)數(shù)目的自適應(yīng)策略
對(duì)于某些分類(lèi)問(wèn)題來(lái)說(shuō),聚類(lèi)數(shù)目是固定的。但是對(duì)于類(lèi)似于工況子區(qū)間劃分的問(wèn)題,則需要給定聚類(lèi)個(gè)數(shù),這在一定程度上降低了算法的無(wú)監(jiān)督性,一旦設(shè)定的聚類(lèi)數(shù)目不合理,將直接影響分類(lèi)模型的使用效果。由于優(yōu)秀的聚類(lèi)劃分應(yīng)當(dāng)使得各類(lèi)內(nèi)樣本距離盡可能小,而不同類(lèi)間距離盡可能大。本文使用著名的Xie-Beni指標(biāo)[8]來(lái)評(píng)價(jià)聚類(lèi)的質(zhì)量。
因此,當(dāng)VXB取極小值時(shí)聚類(lèi)劃分最理想。將Xie-Beni指標(biāo)推廣到核空間,即有:
當(dāng)VKXB取極小值時(shí)聚類(lèi)數(shù)目最理想,記聚類(lèi)數(shù)目為C時(shí)的Xie-Beni指標(biāo)為VKXB(C),則本文所使用的模糊核C均值聚類(lèi)方法描述如下。
①確定算法參數(shù),包括加權(quán)參數(shù)m、算法最大迭代次數(shù)tmax、允許誤差ξ和密度常數(shù)Minpts,初始聚類(lèi)數(shù)目C=2。
②采用基于密度的聚類(lèi)中心初始化策略初始化聚類(lèi)中心。
③根據(jù)式(5)和式(6)更新聚類(lèi)中心V(t+1)和隸屬度矩陣U(t+1),t代表迭代次數(shù)。
④若‖U(t+1)-U(t)‖<ξ或t=tmax,則停止迭代,否則t=t+1,轉(zhuǎn)步驟③。
⑤按式(8)計(jì)算VKXB(c)。若VKXB(C-1)<VKXB(C-2)且VKXB(C-1)<VKXB(C),則算法過(guò)程結(jié)束,轉(zhuǎn)步驟⑥;否則,C=C+1,轉(zhuǎn)步驟②。
⑥輸出對(duì)應(yīng)的最優(yōu)聚類(lèi)數(shù)目C=C-1以及對(duì)應(yīng)的聚類(lèi)中心和隸屬度矩陣。
3.1 最小二乘支持向量機(jī)概述
LSSVM是在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上發(fā)展起來(lái)的一種回歸與建模方法,它的原型是SVM。與SVM相比, LSSVM采用等式約束取代了傳統(tǒng)支持向量機(jī)中的不等式約束,使用誤差的平方和作為松弛變量,把傳統(tǒng)SVM的解帶約束條件的二次規(guī)劃問(wèn)題轉(zhuǎn)化為求解線性方程組問(wèn)題,從而降低了計(jì)算復(fù)雜度,提高了算法的求解速度。
式中:x∈Rn,f(x)∈R;φ(x)為輸入向量x在高維空間中的映射。
基于LSSVM采用的結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,求解式(9)中的w和b即等價(jià)于優(yōu)化問(wèn)題。
式中:ξ∈Rl×1為誤差向量;c(c>0)為L(zhǎng)SSVM的正規(guī)化參數(shù)。
對(duì)于該問(wèn)題,可采用拉格朗日法進(jìn)行求解。引入拉格朗日因子a,則該問(wèn)題可轉(zhuǎn)化為:
進(jìn)一步可得:
通過(guò)引入核函數(shù)K(xi,xj)=φ(xi)·φ(xj)的概念,可以不用具體地計(jì)算非線性映射φ(·)即可非常方便地求解式(12),最終可得到LSSVM所需求解的線性方程組。
通過(guò)求解線性方程組,最終可得到式(13)所示的非線性模型。
3.2 基于貝葉斯證據(jù)框架的LSSVM參數(shù)優(yōu)化
LSSVM超參數(shù)的選擇對(duì)模型的性能影響很大,目前常用的超參數(shù)優(yōu)化估計(jì)方法有經(jīng)驗(yàn)法、確認(rèn)集、交叉驗(yàn)證、誤差界、貝葉斯學(xué)習(xí)法等[9]。本文采用Mackay[10]提出的貝葉斯證據(jù)框架對(duì)超參數(shù)進(jìn)行優(yōu)化。
貝葉斯證據(jù)框架的基本思想是根據(jù)貝葉斯規(guī)則分層次地最大化參數(shù)分布的后驗(yàn)概率,從而得到最佳參數(shù)值或模型。
推斷過(guò)程分為三個(gè)層次:①準(zhǔn)則1推斷確定模型參數(shù);②準(zhǔn)則2推斷確定正規(guī)化參數(shù);③準(zhǔn)則3推斷確定核參數(shù)。
①準(zhǔn)則1推斷
為了便于貝葉斯分析,將優(yōu)化問(wèn)題的目標(biāo)函數(shù)式(10)除以c,并用λ代替1/c。假設(shè)數(shù)據(jù)空間為D、模型空間為H,準(zhǔn)則1通過(guò)貝葉斯規(guī)則推斷w的后驗(yàn)。
式中:p(D|w,λ,H)和p(w|λ,H)分別為模型H對(duì)于數(shù)據(jù)D的概率分布和先驗(yàn)參數(shù)分布。
假設(shè)模型訓(xùn)練樣本獨(dú)立同分布,p(w|λ,H)服從高斯分布,即:
其中,p(xi|w,λ,H)可看作是常數(shù)。以L[yi,f(xi)]表示損失函數(shù),即L[yi,f(xi)]==[yi-wTφ(xi)-b]2,則有:
將式(15)~式(17)代入式(14),則有:
通過(guò)網(wǎng)絡(luò)分析儀調(diào)試的結(jié)果如圖8所示,其頻段為4.5 GHz~10 GHz。圖中通帶的邊頻點(diǎn)插損值分別達(dá)到了0.76 dB和0.57 dB,比圖4中協(xié)同仿真曲線上的A1、A2兩點(diǎn)值偏大,這是由低通濾波器、測(cè)試接頭及電纜線自身的損耗引起的;帶外兩邊的抑制分別達(dá)到了74 dB和35 dB,這與圖4中的協(xié)同仿真B1、B2值相比沒(méi)太大變化;而全腔仿真遠(yuǎn)端(6 GHz~10 GHz)的抑制均超過(guò)了34 dB,與圖4中協(xié)同仿真結(jié)果相比有極大的改善。
由式(17)可以看出,LSSVM的訓(xùn)練即最大化w的后驗(yàn)p(w|D,λ,H)分布,從而可以得到w的最優(yōu)值wMP。
②準(zhǔn)則2推斷
第二層推斷正規(guī)化參數(shù)c,通過(guò)最大化λ的后驗(yàn)概率p(λ|D,H),可得λ的最優(yōu)值。令,則:
對(duì)式(19)兩邊取對(duì)數(shù),可以得到:
通過(guò)最大化lnp(λ|D,H)可得λMP,如式(21)所示。
式中:γ=k-λtrA-1為參數(shù)的有效數(shù)[10]。
③準(zhǔn)則3推斷
第三層推斷核參數(shù)σ。通過(guò)最大化后驗(yàn)概率p(H|D)∝p(D|H)p(H)得到最優(yōu)核函數(shù)。
由于核寬度σ不能為負(fù),因此對(duì)核參數(shù)取絕對(duì)值。
3.3 多模型LSSVM建模
多模型建模方法是一種解決復(fù)雜非線性系統(tǒng)建模問(wèn)題的有效工具。多模型的建??煞譃樽訑?shù)據(jù)集的劃分、子模型的建立和多模型的輸出3個(gè)步驟。本文的多模型LSSVM建模步驟可描述如下。
①對(duì)訓(xùn)練樣本數(shù)據(jù)進(jìn)行數(shù)據(jù)歸一化處理,使用模糊核C均值聚類(lèi)算法對(duì)訓(xùn)練樣本數(shù)據(jù)進(jìn)行聚類(lèi)。
②采用LSSVM建立每個(gè)聚類(lèi)的數(shù)據(jù)驅(qū)動(dòng)模型,并使用貝葉斯證據(jù)框架優(yōu)化LSSVM的超參數(shù)。
③對(duì)測(cè)試樣本進(jìn)行數(shù)據(jù)歸一化處理,評(píng)價(jià)對(duì)應(yīng)樣本的聚類(lèi)模糊隸屬度。
④根據(jù)測(cè)試樣本的模糊隸屬度求取對(duì)應(yīng)子模型的輸出,并根據(jù)模糊隸屬度將各個(gè)子模型的輸出進(jìn)行加權(quán)求和,得到系統(tǒng)的模型輸出,即完成了多模型的建立。
本文以某煉鐵廠煤調(diào)濕裝置為研究對(duì)象,采用以上所提出的多模型建模方法構(gòu)建蒸汽消耗量的軟測(cè)量模型。該裝置利用干熄焦蒸汽發(fā)電后的低壓蒸汽作為熱載體,對(duì)裝爐煤料進(jìn)行干燥處理,煤料水分由10.2%左右降至6.5%左右。
整套裝置包括熱源供給系統(tǒng)、煤料輸送系統(tǒng)、換熱干燥系統(tǒng),涉及到的流量、溫度、壓力等操作參數(shù)多達(dá)30多個(gè),因此煤料水分控制系統(tǒng)是一個(gè)非線性、強(qiáng)耦合、大時(shí)滯的復(fù)雜系統(tǒng)。在充分了解煤調(diào)濕過(guò)程工藝機(jī)理的基礎(chǔ)上,同時(shí)對(duì)現(xiàn)場(chǎng)采集的數(shù)據(jù)進(jìn)行變量相關(guān)分析,綜合考慮數(shù)據(jù)采集成本和模型精確度,最后選取了煤切出量、干燥機(jī)出口氣體溫度、入口煤濕度、出口煤濕度和引風(fēng)機(jī)輸出功率作為煤調(diào)濕過(guò)程蒸汽消耗量模型的輸入,模型輸出即蒸汽的實(shí)際流量。
為了使模型盡可能涵蓋所有工況,采集了該廠煤調(diào)濕裝置不同班次的458組生產(chǎn)數(shù)據(jù)。剔除顯著誤差并進(jìn)行平滑和歸一化處理,最后共得到432組樣本數(shù)據(jù),其中的324組用于模型訓(xùn)練,剩余108組作為測(cè)試數(shù)據(jù),以檢驗(yàn)?zāi)P偷姆夯芰Α?/p>
本文所有仿真與試驗(yàn)均在Matlab R2012b環(huán)境下完成,LSSVM模型訓(xùn)練與貝葉斯證據(jù)框架推斷均采用了LS-SVM lab工具箱。聚類(lèi)最大迭代次數(shù)為tmax= 500,允許誤差ξ=10-3,加權(quán)參數(shù)m=2,密度常數(shù)Minpts=4。自適應(yīng)模糊核C均值聚類(lèi)算法求得最佳聚類(lèi)個(gè)數(shù)為5,使用基于貝葉斯證據(jù)框架的LSSVM建立了對(duì)應(yīng)的5個(gè)子模型。最終的多模型訓(xùn)練效果和檢驗(yàn)效果分別如圖2和圖3所示。
圖2 煤調(diào)濕蒸汽流量多模型訓(xùn)練結(jié)果Fig.2 Training results of the steam flow multi-model for coal moisture control
圖3 煤調(diào)濕蒸汽流量多模型測(cè)試結(jié)果Fig.3 Test results of steam flow multi-model for coal moisture control
從圖3可以看出,采用本文所提出的基于模糊核C均值聚類(lèi)和LSSVM的多模型建模方法,能夠較好地估算出煤調(diào)濕系統(tǒng)中蒸汽的消耗量,具有較高的預(yù)測(cè)精度與泛化能力。
為了進(jìn)一步驗(yàn)證所提出的多模型建模方法的有效性,在同樣的訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)下,分別采用LSSVM和核偏最小二乘(kernel partial least squares, KPLS)進(jìn)行單模型建模。采用平均絕對(duì)誤差(mean absolute deviation,MAD)、平均絕對(duì)百分比誤差(mean absolute percentage error,MAPE)和均方根誤差(root mean square error,RMSE)等3項(xiàng)指標(biāo)進(jìn)行模型效果對(duì)比,如式(25)~式(27)所示。
式中:yi為實(shí)際蒸汽流量;為模型輸出值;N為樣本數(shù)量。
模型對(duì)比結(jié)果如表1所示。
表1 煤調(diào)濕蒸汽流量多模型與單模型誤差比較Tab.1 Comparison of the errors of multi-model and single model of steam flow for coal moisture control
從表1可以看出,基于模糊核C均值聚類(lèi)和LSSVM的多模型建模方法在各項(xiàng)評(píng)價(jià)指標(biāo)上均明顯優(yōu)于傳統(tǒng)的LSSVM和KPLS單模型建模方法,從而為煤調(diào)濕過(guò)程的蒸汽流量預(yù)測(cè)提供了一種切實(shí)可行的建模方法。
本文以某煉鐵廠的煤調(diào)濕裝置為研究背景,提出了一種基于模糊核C均值聚類(lèi)和最小二乘支持向量機(jī)的多模型建模方法。采用模糊核C均值聚類(lèi)將生產(chǎn)工況劃分為不同的子區(qū)間,融合基于密度的聚類(lèi)中心初始化方法和聚類(lèi)數(shù)目自適應(yīng)策略,在提高聚類(lèi)收斂速度的同時(shí)保證了聚類(lèi)的準(zhǔn)確性。對(duì)于不通過(guò)的聚類(lèi)建立了與其對(duì)應(yīng)的子模型,并使用貝葉斯證據(jù)框架優(yōu)化LSSVM的超參數(shù)。最后利用模糊隸屬度的加權(quán)策略輸出新樣本的多模型預(yù)測(cè)值?,F(xiàn)場(chǎng)數(shù)據(jù)的測(cè)試結(jié)果表明,所提出的多模型建模方法優(yōu)于傳統(tǒng)的單模型建模方法,能夠在較高的精度內(nèi)預(yù)測(cè)煤調(diào)濕蒸汽流量值,為煤調(diào)濕過(guò)程蒸汽流量的實(shí)時(shí)控制提供了一種有效的手段。
[1] Kadlec P,Gabrys B,Strandt S.Data-driven soft sensors in the process industry[J].Computers&Chemical Engineering,2009,33(4): 795-814.
[2] Li Y,Su H,Chu J.Overview on subspace model identification methods[J].Journal of Chemical Industry and Engineering China, 2006,57(3):473.
[3] 孫建平,苑一方.復(fù)雜過(guò)程的多模型建模方法研究[J].儀器儀表學(xué)報(bào),2011,32(1):132-137.
[4] Yu J,Chen K,Rashid M M.A Bayesian model averaging based multi-kernel Gaussian process regression framework for nonlinear state estimationandqualitypredictionofmultiphasebatch processes with transient dynamics and uncertainty[J].Chemical Engineering Science,2013,93(10):96-109.
[5] 陳貴華,王昕,王振雷,等.基于模糊核聚類(lèi)的乙烯裂解深度DELSSVM多模型建模[J].化工學(xué)報(bào),2012,63(6):1790-1796.
[6] 李侃,劉玉樹(shù).模糊核聚類(lèi)的自適應(yīng)算法[J].控制與決策, 2004,19(5):595-597.
[7] 賴(lài)玉霞,劉建平.K-means算法的初始聚類(lèi)中心的優(yōu)化[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(10):147-149.
[8] Xie X L,Beni G.A validity measure for fuzzy clustering[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1991, 13(8):841-847.
[9] Yan W,Shao H,Wang X.Soft sensing modeling based on support vector machine and Bayesian model selection[J].Computers& Chemical Engineering,2004,28(8):1489-1498.
[10] Mackay D J.Probable networks and plausible predictions-a review of practical Bayesian methods for supervised neural networks[J]. Network:Computation in Neural Systems,1995,6(3):469-505.
Research on the Multi-model Modeling for Vapor Consumption of Coal Moisture Control System
Coal moisture control technology is the key technique of the coking process.Establishing the soft sensing model for vapor consumption in coal moisture control system may save production costs,reduce environmental pollution and improve the quality of coke.In accordance with the features of the coal moisture control equipment in certain ironworks,e.g.,nonlinearity,strong coupling and large fluctuations of working condition,the multi-model modeling method is proposed.The density-based clustering center initialization method and number of clusters adaptive strategy are integrated into the fuzzy C-means clustering to get optimal division of the production working conditions. The least squares support vector machines(LSSVM)is applied to conduct data-driven modeling for each sub-working conditions,and the parameters of the LSSVM is optimized by adopting Bayesian evidence framework.The checked results indicate that the proposed multi-model possesses good tracking performance and higher prediction accuracy.
Coal moisture control Fuzzy kernel C-means clustering Least squares support vector machines(LSSVM) Bayesian evidence framework Multi-model
TP391+.9
A
修改稿收到日期:2014-11-25。
王建華(1955-),男,1988年畢業(yè)于華東化工學(xué)院工業(yè)自動(dòng)化專(zhuān)業(yè),獲碩士學(xué)位,副教授;主要從事工業(yè)過(guò)程建模、控制與優(yōu)化。