梅從立,楊銘,劉國(guó)海
(江蘇大學(xué)電氣信息工程學(xué)院,江蘇 鎮(zhèn)江 212013)
基于證據(jù)合成的高斯過(guò)程回歸多模型軟測(cè)量方法
梅從立,楊銘,劉國(guó)海
(江蘇大學(xué)電氣信息工程學(xué)院,江蘇 鎮(zhèn)江 212013)
針對(duì)生物發(fā)酵過(guò)程,提出了一種基于證據(jù)理論的高斯過(guò)程回歸多模型軟測(cè)量方法,其中多模型融合策略同時(shí)考慮了數(shù)據(jù)聚類特性和軟測(cè)量子模型統(tǒng)計(jì)特性。首先,對(duì)聚類后的各子類建立高斯過(guò)程回歸子模型;然后,基于聚類隸屬度函數(shù)和高斯過(guò)程回歸子模型后驗(yàn)概率分別設(shè)計(jì)子模型權(quán)值,并利用證據(jù)合成規(guī)則將兩類權(quán)值進(jìn)行證據(jù)合成得到融合權(quán)值;最后,將該融合權(quán)值作為加權(quán)因子對(duì)子模型進(jìn)行融合。通過(guò)青霉素發(fā)酵過(guò)程仿真數(shù)據(jù)和紅霉素發(fā)酵過(guò)程工業(yè)數(shù)據(jù)研究表明, 相比單一模型和傳統(tǒng)多模型高斯過(guò)程回歸軟測(cè)量方法,本文所提方法具有較高的預(yù)測(cè)精度和較小的預(yù)測(cè)不確定度。
軟測(cè)量;多模型;高斯過(guò)程回歸;證據(jù)理論;儀表;發(fā)酵;算法
多模型軟測(cè)量模型建模方法一般為:首先,基于訓(xùn)練數(shù)據(jù)集各聚類子集建立子模型;然后,通過(guò)計(jì)算樣本點(diǎn)對(duì)聚類中心的隸屬度來(lái)獲得各子模型的權(quán)值;最后,基于所設(shè)計(jì)權(quán)值融合子模型,從而得到加權(quán)形式的多模型軟測(cè)量模型[4-10]。故就多模型軟測(cè)量建模而言,關(guān)鍵問(wèn)題在于如何設(shè)計(jì)子模型加權(quán)函數(shù)。為了進(jìn)一步優(yōu)化權(quán)值函數(shù),文獻(xiàn)[11-12]提出了基于證據(jù)合成規(guī)則融合隸屬度函數(shù)并獲得優(yōu)化權(quán)值的多模型軟測(cè)量方法。文獻(xiàn)[13-14]首先參數(shù)化權(quán)值函數(shù),然后通過(guò)迭代優(yōu)化方法對(duì)權(quán)函數(shù)參數(shù)進(jìn)行優(yōu)化辨識(shí),以提高多模型軟測(cè)量模型性能。上述方法在建模時(shí)均充分考慮了模型對(duì)數(shù)據(jù)的擬合性能,但是均沒(méi)有充分利用子模型的統(tǒng)計(jì)特性。
此外,根據(jù)測(cè)量原理,測(cè)量過(guò)程不僅應(yīng)該得到測(cè)量結(jié)果,而且應(yīng)給出相應(yīng)的精度參數(shù)[15],即測(cè)量不確定度。傳統(tǒng)軟測(cè)量建模采用支持向量機(jī)回歸、神經(jīng)網(wǎng)絡(luò)回歸等方法[4-7]。這類方法無(wú)法確定軟測(cè)量預(yù)測(cè)值的精度或者不確定區(qū)間,限制了軟測(cè)量模型在實(shí)際過(guò)程中的應(yīng)用。高斯過(guò)程回歸(Gaussian process regression, GPR)模型是一種相對(duì)新的軟測(cè)量建模方法[15-18],具有能夠集成先驗(yàn)概率、超參數(shù)較少,輸出具有概率意義等優(yōu)點(diǎn)。如何在保持其優(yōu)勢(shì)的前提下,把其推廣到多模型建模領(lǐng)域,以解決多工況復(fù)雜過(guò)程建模問(wèn)題,還有待進(jìn)一步研究。
針對(duì)上述問(wèn)題,本文提出一種基于證據(jù)理論(Dempster-Shafer theory,DS)的GPR多模型軟測(cè)量方法。該方法在設(shè)計(jì)子模型權(quán)值時(shí)不僅考慮了樣本點(diǎn)對(duì)數(shù)據(jù)集聚類中心的隸屬度,也充分考慮了各軟測(cè)量子模型的統(tǒng)計(jì)性質(zhì),且輸出結(jié)果保持了單模型高斯過(guò)程回歸軟測(cè)量模型所具有的概率特性,即輸出預(yù)測(cè)均值的同時(shí)輸出預(yù)測(cè)不確定度。最后,分別采用青霉素發(fā)酵過(guò)程仿真數(shù)據(jù)和紅霉素發(fā)酵過(guò)程工業(yè)數(shù)據(jù)驗(yàn)證所提方法的有效性。
使用模糊C均值(fuzzy C-means,F(xiàn)CM)聚類算法對(duì)訓(xùn)練樣本集進(jìn)行聚類處理。考慮樣本集
將此集合依據(jù)一定的準(zhǔn)則用FCM方法劃分為c個(gè)模糊子集。該準(zhǔn)則一般是用來(lái)表征聚類性能指標(biāo)的優(yōu)化目標(biāo)函數(shù)。FCM聚類算法的目標(biāo)函數(shù)是
對(duì)隸屬度函數(shù)做如下處理
2.1高斯過(guò)程回歸
定義一個(gè)高斯過(guò)程 (GP)[19]來(lái)描述輸入和輸出間的映射關(guān)系。GP是任意有限個(gè)隨機(jī)變量均具有聯(lián)合高斯分布的集合, 其性質(zhì)完全由均值和協(xié)方差確定,即
其中,K為對(duì)稱正定的協(xié)方差矩陣,x、y分別為訓(xùn)練集的輸入輸出變量,?x為測(cè)試輸入變量,分別為測(cè)試點(diǎn)與訓(xùn)練集的輸入的協(xié)方差以及測(cè)試點(diǎn)自身的協(xié)方差,分別是高斯過(guò)程預(yù)測(cè)輸出和預(yù)測(cè)輸出的均值,為了計(jì)算方便,通常在數(shù)據(jù)預(yù)處理時(shí)使其均值為 0??紤]如下回歸問(wèn)題
其中,x為輸入向量,輸入樣本點(diǎn)的總數(shù)為n,f為函數(shù)值,y為收到噪聲干擾的觀測(cè)值,ε是均值為0、標(biāo)準(zhǔn)差為nσ的白噪聲。進(jìn)一步可以得到y(tǒng)的先驗(yàn)分布為
觀測(cè)值y和預(yù)測(cè)值f?的聯(lián)合先驗(yàn)分布為
其中
GPR模型的建立首先要進(jìn)行模型的選擇,即確定協(xié)方差函數(shù)。所選協(xié)方差函數(shù)要保證對(duì)于任一輸入都能夠產(chǎn)生一個(gè)對(duì)稱半正定的協(xié)方差矩陣,同時(shí)希望相鄰的輸入產(chǎn)生相鄰的輸出??紤]到對(duì)協(xié)方差函數(shù)連續(xù)性和可導(dǎo)性的要求, 通常選擇徑向基函數(shù)作為協(xié)方差函數(shù)
其中,0v表示先驗(yàn)知識(shí)的總體度量,1v表示服從高斯分布的噪聲的方差,ijδ是Kronecker算子。協(xié)方差函數(shù)的超參數(shù)采用極大似然法來(lái)獲得其最優(yōu)值。對(duì)于上述給定的協(xié)方差函數(shù),其關(guān)于超參數(shù)的對(duì)數(shù)似然函數(shù)為
對(duì)超參數(shù)求偏導(dǎo)
2.2基于后驗(yàn)概率的權(quán)值設(shè)計(jì)
假設(shè)同等條件下同一被測(cè)變量的l次測(cè)量結(jié)果對(duì)應(yīng)的不確定度分別為。若對(duì)這l次測(cè)量也做一個(gè)加權(quán)組合來(lái)得到最后的測(cè)量結(jié)果,那么它們各自所占的權(quán)重[20]應(yīng)該滿足
在多模型軟測(cè)量方法中,通過(guò)聚類分析將樣本劃分成若干個(gè)子類,使得同類樣本之間的相似度盡可能高而不同類樣本之間的相似度盡可能小[9]。聚類算法將過(guò)程數(shù)據(jù)進(jìn)行了劃分,可以看作是對(duì)過(guò)程工況的劃分,不同工況可以看作是相互獨(dú)立的。所以各子數(shù)據(jù)集之間(或各子模型之間)可以看作是相互獨(dú)立的。多模型軟測(cè)量結(jié)果,可以看作是由 c個(gè)獨(dú)立子模型軟測(cè)量后經(jīng)過(guò)加權(quán)組合后所得的結(jié)果,那么這c個(gè)子模型的權(quán)值應(yīng)該滿足
式中,第 j個(gè)子模型的不確定度函數(shù)可據(jù)式(12)求得,即。對(duì)于某個(gè)樣本點(diǎn),各子模型的權(quán)值應(yīng)滿足
采用加權(quán)策略對(duì)各子模型進(jìn)行合成。GPR多模型軟測(cè)量模型合成規(guī)則為
代入式(20)可得
基于DS證據(jù)合成規(guī)則的GPR多模型軟測(cè)量算法具體步驟如下:
(1)數(shù)據(jù)預(yù)處理,將輸入樣本集進(jìn)行歸一化處理并用變量選擇方法選出輔助變量, 再將所有樣本數(shù)據(jù)分為訓(xùn)練樣本集和測(cè)試樣本集;
(2)使用FCM聚類方法將訓(xùn)練樣本集X聚類為c個(gè)子集,并獲得聚類中心V;
(3)用c個(gè)訓(xùn)練樣本子集建立c個(gè)GPR子模型。
(4)確定各GPR子模型的權(quán)值,針對(duì)測(cè)試樣本點(diǎn),將兩種權(quán)值設(shè)計(jì)方法所設(shè)計(jì)權(quán)值作為證據(jù),依據(jù)式(18)對(duì)兩類證據(jù)進(jìn)行融合獲得各子模型融合權(quán)值;
(5)多模型融合,根據(jù)式(20)得到 GPR的多模型軟測(cè)量的預(yù)測(cè)輸出值,并根據(jù)式(21)得到該軟測(cè)量結(jié)果的不確定度。
圖1 青霉素發(fā)酵過(guò)程軟測(cè)量結(jié)果對(duì)比Fig.1 Results of different soft sensors for penicillin fermentation process
青霉素發(fā)酵過(guò)程是一個(gè)典型的微生物發(fā)酵反應(yīng)過(guò)程。本文首先基于青霉素發(fā)酵過(guò)程仿真軟件(Pensim[24])模擬產(chǎn)生過(guò)程數(shù)據(jù),開(kāi)展軟測(cè)量模型研究工作。許多研究工作表明了該仿真平臺(tái)具有重要的研究?jī)r(jià)值[25-27]。
在Pensim正常工況初始條件范圍內(nèi),隨機(jī)產(chǎn)生30組初始設(shè)定值;然后,運(yùn)行Pensim軟件產(chǎn)生30批青霉素發(fā)酵過(guò)程數(shù)據(jù)。發(fā)酵過(guò)程周期設(shè)定為400 h,采樣時(shí)間間隔為1 h。任取3批數(shù)據(jù)作為測(cè)試數(shù)據(jù)集,剩下的27批數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集用于軟測(cè)量建模。為了說(shuō)明所提方法的優(yōu)越性,將其性能與單一模型高斯過(guò)程回歸軟測(cè)量方法[15](SGPR)、基于聚類算法的多模型GPR方法[17-18](FCM-MGPR)、基于證據(jù)理論和聚類算法多模型[11-12]GPR 方法(DS-FCM-MGPR)進(jìn)行了比較分析。同時(shí),采用均方根誤差(RMSE)和95%置信區(qū)間(2倍預(yù)測(cè)方差)的平均值[MCI,如式(22)]分別來(lái)定量評(píng)估軟測(cè)量模型的預(yù)測(cè)精度和不確定度。RMSE通常用來(lái)從全局的角度評(píng)估預(yù)測(cè)值對(duì)真實(shí)值的接近程度,MCI可以用來(lái)評(píng)估預(yù)測(cè)值的可靠性。
其中,n為樣本個(gè)數(shù),Ui和Li分別為第i個(gè)樣本點(diǎn)預(yù)測(cè)值95%置信區(qū)間上限和下限。
圖1為上述3種軟測(cè)量方法以及本文所提方法對(duì)第1個(gè)批次測(cè)試數(shù)據(jù)的預(yù)測(cè)結(jié)果。由圖1可以看出,本文所提軟測(cè)量模型預(yù)測(cè)值更逼近真實(shí)值。表1給出了不同軟測(cè)量方法對(duì)3個(gè)批次測(cè)試數(shù)據(jù)軟測(cè)量結(jié)果的性能指標(biāo)統(tǒng)計(jì)結(jié)果。從表1可以看出,本文所提方法RMSE和MCI值均優(yōu)于SGPR以及其他多模型GPR建模方法。
本文工業(yè)數(shù)據(jù)來(lái)源于江蘇鎮(zhèn)江某制藥公司紅霉素發(fā)酵生產(chǎn)過(guò)程,其發(fā)酵反應(yīng)流程如圖2所示??偣膊杉?0批發(fā)酵過(guò)程數(shù)據(jù)。
每批實(shí)驗(yàn)通過(guò)在線傳感器采集 15個(gè)狀態(tài)變量作為輸入變量,包括時(shí)間、溶解氧、pH、糊精流量、豆油流量、丙醇流量、水流量、糊精體積、豆油體積、丙醇體積、水體積、溫度、相對(duì)氣壓、攪拌馬達(dá)轉(zhuǎn)速和空氣流量,另外,每批實(shí)驗(yàn)通過(guò)離線分析方式采集生物量濃度作為輸出變量。利用主元分析對(duì) 15個(gè)輸入變量進(jìn)行輔助變量選擇[28],獲得溶解氧、pH、糊精流量、糊精體積、水體積5個(gè)變量作為軟測(cè)量模型的輸入輔助變量。在軟測(cè)量建模之前,首先將樣本數(shù)據(jù)分為兩類:訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。將 1~7批發(fā)酵數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,另外 3批作為測(cè)試數(shù)據(jù)集。
圖2 紅霉素發(fā)酵過(guò)程Fig.2 Schematic diagram of erythromycin fermentation process
分別采用本文所提方法和第5節(jié)提到的3種方法對(duì)紅霉素發(fā)酵過(guò)程工業(yè)數(shù)據(jù)進(jìn)行軟測(cè)量模型建模研究。測(cè)試數(shù)據(jù)集預(yù)測(cè)結(jié)果見(jiàn)圖3。從圖3可以直觀看出,本文所提方法預(yù)測(cè)值與真實(shí)值更為接近,且95%置信區(qū)間較小。為了進(jìn)一步從細(xì)節(jié)說(shuō)明4種方法預(yù)測(cè)值與真實(shí)值的逼近程度,圖4給出了各批次數(shù)據(jù)動(dòng)態(tài)預(yù)測(cè)標(biāo)準(zhǔn)差。從圖4可以看出,本文所提方法標(biāo)準(zhǔn)差小于其他3種方法。
表 2 給出了測(cè)試集數(shù)據(jù)的軟測(cè)量結(jié)果統(tǒng)計(jì)指標(biāo)。表2中RMSE指標(biāo)定量分析各種方法預(yù)測(cè)值與真實(shí)值的逼近程度,可以看出本文所提方法RMSE值小于其他3種方法。從表2中MCI指標(biāo)看出,對(duì)于各批次測(cè)試數(shù)據(jù),本文所提方法MCI指標(biāo)均小于其他3種方法。說(shuō)明本文預(yù)測(cè)方法的預(yù)測(cè)值具有更小的不確定性,可以理解為軟測(cè)量結(jié)果具有更高的可靠性。
表1 青霉素發(fā)酵過(guò)程不同軟測(cè)量方法性能比較Table 1 Comparisons of different soft sensors for penicillin fermentation process
本文方法之所以優(yōu)于其他3種方法,是因?yàn)椋簡(jiǎn)文P徒r(shí)考慮的樣本數(shù)過(guò)多,模型過(guò)于復(fù)雜,使得預(yù)測(cè)精度和預(yù)測(cè)不確定度都不夠理想;傳統(tǒng)的多模型方法建模時(shí)僅依據(jù)聚類結(jié)果確定子模型的權(quán)值,并沒(méi)有考慮到子模型本身的統(tǒng)計(jì)特性。本文所提方法從子模型本身的統(tǒng)計(jì)性質(zhì)和數(shù)據(jù)聚類特性兩個(gè)方面著手,充分利用高斯過(guò)程回歸方法給出預(yù)測(cè)不確定度的優(yōu)點(diǎn),將子模型的后驗(yàn)概率和聚類子集的隸屬度作為子模型權(quán)值分配兩類證據(jù),再用 DS合成規(guī)則進(jìn)行融合優(yōu)化各子模型權(quán)值,顯著改善了軟測(cè)量模型的預(yù)測(cè)精度,大大降低了預(yù)測(cè)不確定度。紅霉素發(fā)酵過(guò)程工業(yè)數(shù)據(jù)的軟測(cè)量建模驗(yàn)證了本文所提方法的有效性。
提出了一種基于DS證據(jù)理論的GPR多模型軟測(cè)量方法。該方法綜合考慮了測(cè)試樣本的聚類特性和軟測(cè)量子模型的統(tǒng)計(jì)特性,將聚類隸屬度函數(shù)和GPR子模型輸出后驗(yàn)概率作為證據(jù),利用DS合成規(guī)則進(jìn)行融合獲得各子模型融合權(quán)值,以提高軟測(cè)量模型的預(yù)測(cè)精度并降低預(yù)測(cè)不確定度。將所提方法應(yīng)用于生物發(fā)酵過(guò)程軟測(cè)量,研究結(jié)果表明本文所提方法相比較于其他方法具有預(yù)測(cè)精度高和不確定度小的優(yōu)點(diǎn),具有一定的應(yīng)用潛力。
圖3 紅霉素發(fā)酵過(guò)程不同軟測(cè)量方法對(duì)比Fig.3 Comparisons of different soft sensors for erythromycin fermentation process
表2 紅霉素發(fā)酵過(guò)程不同方法性能比較Table 2 Comparisons of different soft sensors of erythromycin fermentation process
圖4 不同軟測(cè)量方法預(yù)測(cè)標(biāo)準(zhǔn)差Fig.4 Comparisons of predictive standard deviations of different soft sensors
References
[1] Dai X, Wang W, Ding Y, Sun Z. “Assumed inherent sensor” inversion based ANN dynamic soft-sensing method and its application in erythromycin fermentation process [J]. Computers & Chemical Engineering, 2006, 30: 1203-1225.
[2] Liu G, Zhou D, Xu H, Mei C. Model optimization of SVM for a fermentation soft sensor [J]. Expert Systems with Applications, 2010, 37 (4): 2708-2713.
[3] Wang Bo (王博), Sun Yukun (孫玉坤), Ji Xiaofu (嵇小輔), Huang Yonghong (黃永紅), Huang Li (黃麗). Soft-sensor modeling for lysine fermentation processes based on PSO-SVM inversion [J]. CIESC Journal (化工學(xué)報(bào)), 2012, 63 (9): 3000-3007.
[4]Li Lijuan (李麗娟), Song Kun (宋坤), Zhao Yingkai (趙英凱). Modeling of ARA fermentation based on affinity propagation clustering [J]. CIESC Journal (化工學(xué)報(bào)), 2011, 62 (8): 2116-2121.
[5]Xu Haixia (徐海霞), Liu Guohai (劉國(guó)海), Zhou Dawei (周大為), Mei Congli (梅從立). Soft sensor modeling based on modified kernel fuzzy clustering algorithm [J]. Chinese Journal of Scientific Instrument(儀器儀表學(xué)報(bào)), 2009, 30 (10): 2226-2231.
[6]Sang Haifeng (桑海峰), Wang Fuli (王福利), He Dakuo (何大闊), Zhang Dapeng (張大鵬), He Jianyong (何建勇). Soft sensors of biomass concentration in nosiheptied fermentation process based on multiple support vector machines [J]. Journal of System Simulation(系統(tǒng)仿真學(xué)報(bào)), 2006, 18 (7): 1983-1986.
[7]Zhong Weimin (鐘偉民), Li Jie (李杰), Cheng Hui (程輝), Kong Xiangdong (孔祥東), Qian Feng (錢鋒). A soft sensor multi-modeling for furnace temperature of gasifier based FCM clustering [J]. CIESC Journal (化工學(xué)報(bào)), 2013, 63 (12): 3951-3955.
[8]Cong Qiumei (叢秋梅), Yuan Mingzhe (苑明哲), Chai Tianyou (柴天佑), Wang Hong (王宏). Online modeling for multi-model by adjusting the centers of operating ranges [J]. Control Theory & Applications (控制理論與應(yīng)用), 2013, 30 (6): 773-780.
[9]Suo Xingyi (索幸儀), Shi Hongbo (侍洪波). Soft sensor modeling of sewage disposal process based on multi-model fuzzy kernel clustering method [J]. Journal of East China University of Science and Technology: Natural Science Edition (華東理工大學(xué)學(xué)報(bào): 自然科學(xué)版), 2010, 36 (5): 732-736.
[10] Jin X, Wang S, Huang B, Forbes F.Multiple model based LPV soft sensor development with irregular/missing process output measurement [J]. Control Engineering Practice, 2012, 20 (2): 165-172.
[11]Wang Zhenlei (王振雷), Tang Ku (唐苦), Wang Xin (王昕). A multi-model soft sensing method based on D-S and ARIMA model [J]. Control and Decision (控制與決策), 2014, 29 (7): 1160-1166.
[12]Tang Ku (唐苦), Wang Xin (王昕), Wang Zhenlei (王振雷). Multi-model soft sensor based on Dempster-Shafer rule [J]. Control Theory & Applications (控制理論與應(yīng)用), 2014, 31 (5): 632-637.
[13] Domlan E, Huang B, Xu F, Espejo A. A decoupled multiple model approach for soft sensors design [J]. Control Engineering Practice, 2011, 19 (2): 126-134.
[14] Khatibisepehr S, Huang B, Xu F, Espejo A. A Bayesian approach to design of adaptive multi-model inferential sensors with application in oil sand industry [J]. Journal of Process Control, 2012, 22 (10): 1913-1929.
[15]Wang Huazhong (王華忠). Gaussian process and its application to soft-sensor modeling [J]. Journal of Chemical Industry and Engineering (China) (化工學(xué)報(bào)), 2007, 58 (11): 2840-2845.
[16]He Zhikun (何志昆), Liu Guangbin (劉光斌), Zhao Xijing (趙曦晶), Wang Minghao (王明昊). Overview of Gaussian process regression [J]. Control and Decision (控制與決策), 2013, 28 (8): 1121-1129.
[17]Lei Yu (雷瑜), Yang Huizhong (楊慧中). Combination model soft sensor based on Gaussian process and Bayesian committee machine [J]. CIESC Journal (化工學(xué)報(bào)), 2013, 64 (12): 4434-4438.
[18]Li X, Su H, Chu J. Multiple model soft sensor based on affinity propagation, Gaussian process and Bayesian committee machine [J]. Chinese Journal of Chemical Engineering, 2009, 17 (1): 95-99.
[19]Rasmussen C E. Gaussian Processes for Machine Learning [M]. Cambridge: The MIT Press, 2006:16-18.
[20]Sha Dingguo (沙定國(guó)). Error Analysis and Measurement Uncertainty Assessment (誤差分析與測(cè)量誤差評(píng)定) [M]. Beijing: China Metrology Press, 2003:218.
[21] Murphy C K. Combining belief functions when evidence conflicts [J]. Decision Support Systems, 2000, 29 (1): 1-9.
[22] Li X, Dezert J, Smarandache F, Huang X. Evidence supporting measure of similarity for reducing the complexity in information fusion [J]. Information Sciences, 2011, 181 (10): 1818-1835.
[23] Su Z, Wang P, Shen J, Yu X, Lv Z, Lu L. Multi-model strategy based evidential soft sensor model for predicting evaluation of variables with uncertainty [J]. Applied Soft Computing, 2011, 11 (2): 2595-2610.
[24]Birol G, ündey C, Cinar A. A modular simulation package for fed-batch fermentation: penicillin production [J]. Computers & Chemical Engineering, 2002, 26 (11): 1553-1565.
[25]Xiong Weili (熊偉麗), Wang Xiao (王肖), Chen Minfang (陳敏芳), Xu Baoguo (徐保國(guó)). Modeling for penicillin fermentation process based on weighted LS-SVM [J]. CIESC Journal (化工學(xué)報(bào)), 2012, 63 (9): 2913-2919.
[26]He Xiaoran (賀曉冉), Chen Chen (陳宸), Kim Kwang Sok (金光石), Xiong Zhihua (熊智華). Model simulation of fed-batch penicillin fermentation and optimization of substrate federate [J]. CIESC Journal (化工學(xué)報(bào)), 2012, 63 (9): 2831-2835.
[27]Yang Xiaomei (楊小梅), Liu Wenqi (劉文琦), Yang Jun (楊俊). LSSVM modeling for fermentation process based on dividing stages [J]. CIESC Journal (化工學(xué)報(bào)), 2013, 64 (9): 3262-3269.
[28]Li Xi (李喜). Research and soft sensing applications of partial least-squares regression [D]. Dalian: Dalian University of Technology, 2007.
A multi-model based soft sensor using evidence theory and Gaussian process regression
MEI Congli, YANG Ming, LIU Guohai
(School of Electrical and Information Engineering, Jiangsu University, Zhenjiang 212013, Jiangsu, China)
In this paper, a multi-model soft sensor method based on Dempster-Shafer theory (DS) and Gaussian process regression (GPR) was proposed. Firstly, GPR was used to build the sub-models of the proposed soft sensor after clustering training dataset. Secondly, the initial weightings were designed based on membership functions and output posteriori probabilities of GPR based sub-models, respectively. And the initial weightings were fused using the combination rule of DS. Finally, the weighted sum of sub-models with the fused weightings was used to output predictive means and uncertainty. The proposed method was validated on simulation data of a penicillin fermentation process and industrial data of an erythromycin fermentation process. For comparisons, single model-based soft sensor and traditional multi-model soft sensor were also studied. Simulations showed that the proposed method had better predictive accuracy and lower predictive uncertainty.
soft sensor; multi-model; Gaussian process regression; Dempster-Shafer theory; instrumentation;fermentation; algorithm
生物量濃度等發(fā)酵過(guò)程關(guān)鍵變量軟測(cè)量技術(shù)是生物發(fā)酵過(guò)程測(cè)控領(lǐng)域研究熱點(diǎn)之一[1-6]。生物發(fā)酵過(guò)程是一個(gè)非線性、多工況的復(fù)雜過(guò)程,一般可以分為若干個(gè)階段,如微生物生長(zhǎng)緩慢的生長(zhǎng)初期、生長(zhǎng)迅速的指數(shù)生長(zhǎng)期、生長(zhǎng)變化較小的生長(zhǎng)穩(wěn)定期以及由于抑制劑原因?qū)е碌乃俾瘦^低的生長(zhǎng)末期。發(fā)酵過(guò)程關(guān)鍵變量單一模型軟測(cè)量模型往往會(huì)出現(xiàn)模型訓(xùn)練復(fù)雜、預(yù)測(cè)精度低等缺點(diǎn)。多模型軟測(cè)量建模方法是解決這一問(wèn)題的有效策略之一。文獻(xiàn)[4-6]分別利用多模型軟測(cè)量方法對(duì)發(fā)酵過(guò)程建立軟測(cè)量模型,均獲得了比單一模型更好的建模效果。
date: 2015-04-17.
MEI Congli, clmei@ujs.edu.cn
supported by the Natural Science Foundation of Jiangsu Province (BK20130531) and the Project Funded by the Priority Academic Program Development of Jiangsu Higher Education Institutions (PAPD).
10.11949/j.issn.0438-1157.20150492
TP 13
A
0438—1157(2015)11—4555—10
2015-04-17收到初稿,2015-07-30收到修改稿。
聯(lián)系人及第一作者:梅從立(1978—),男,博士,副教授。
江蘇省自然科學(xué)基金項(xiàng)目(BK20130531);江蘇高校優(yōu)勢(shì)學(xué)科建設(shè)工程資助項(xiàng)目(PAPD)。