冀光峰
中海油天津分公司,天津 300461
近年來(lái),基于數(shù)據(jù)驅(qū)動(dòng)的軟儀表建模方法在石化過(guò)程中得到了越來(lái)越多的應(yīng)用[1]。然而,DCS系統(tǒng)采集的輔助變量的數(shù)據(jù)非常多,且往往伴隨著噪聲;另外,輔助變量與主導(dǎo)變量之間的關(guān)系多呈非線性。針對(duì)這兩個(gè)問(wèn)題,本文提出一種基于PCA和OFR的軟儀表建模方法,首先采用PCA提取輸入數(shù)據(jù)的主成分,對(duì)其進(jìn)行降維,消除噪聲影響;然后采用OFR建立提取到的主成分與輸出之間的非線性關(guān)系,最大程度地提高了模型的推廣性能及稀疏性。最后,將該方法應(yīng)用于柴油沸點(diǎn)的預(yù)報(bào),并與其它線性和非線性方法相比較。
PCA的原理[2]簡(jiǎn)介如下 :設(shè) X=(x1,x2,xm)為維輸入向量 ,其協(xié)方差陣為∑ ,∑的m個(gè)特征值為 λ1≥λ2≥… ≥λm≥0,相應(yīng)的標(biāo)準(zhǔn)化正交化特征向量為 l1,l2,…,lm,則X的第i個(gè)主成分ui為:
設(shè)非線性模型通過(guò)下式辨識(shí)[3-4]:
其中 pk(?)是已知的非線性基函數(shù),M為節(jié)點(diǎn)個(gè)數(shù),θ(k)、ξ(t)分別為模型參數(shù)和誤差項(xiàng) ,對(duì)P進(jìn)行正交分解 ,即P=WA,得
模型的留一預(yù)報(bào)誤差可以表示為:
其中 βM(t)=1-w( t)T[WTW]-1w( t )。若向模型中添加第k+1個(gè)節(jié)點(diǎn),那么ξk+1(t),βk+1(t )可以遞推獲取,即
本文提出的方法的軟儀表建模策略如圖1所示。
圖1 基于PCA-OFR的軟儀表建模結(jié)果圖
采用本文提出的方法建立輕柴油在50%收率時(shí)的沸點(diǎn)軟儀表模型。數(shù)據(jù)由Soutwest研究所提供 [6]。數(shù)據(jù)集中的數(shù)據(jù)已經(jīng)過(guò)預(yù)處理,含有401個(gè)輔助變量,是典型的高維工業(yè)過(guò)程。
分別采用PCA、偏最小二乘(Partial Least Squres,PLS)、最小二乘支持向量機(jī)(Least Squares Support Vector Machine,LSSVM)以及本文提出的方法(PCA-OFR)建立柴油沸點(diǎn)軟儀表模型。以均方根誤差(RMSE)、均方根相對(duì)誤差(ReRMSE)、最大誤差絕對(duì)值(MaxAE)作為衡量不同方法性能的指標(biāo)。上述四種方法的預(yù)報(bào)誤差如表1所示。
表1 不同方法對(duì)柴油沸點(diǎn)的預(yù)報(bào)誤差
從表1中可以看出,PCA和PLS這兩種線性方法的預(yù)報(bào)誤差較大,這是因?yàn)椴裼头悬c(diǎn)和輔助變量間呈非線性關(guān)系,所以PCA-OFR和LSSVM這兩種非線性方法有較好的預(yù)報(bào)結(jié)果。而本文提出的方法由于具有更好地稀疏性(建模樣本共113個(gè),而PCA-OFR自動(dòng)選擇的中心個(gè)數(shù)僅為45個(gè)),因此較LSSVM獲得了更高的預(yù)報(bào)精度。
PCA-OFR對(duì)柴油沸點(diǎn)的預(yù)報(bào)結(jié)果和誤差如圖2所示。
圖2 本文提出的方法對(duì)柴油沸點(diǎn)的預(yù)報(bào)結(jié)果和誤差曲線
面向變量維數(shù)高的工業(yè)過(guò)程,提出一種基于主成分分析和正交前向回歸的軟儀表建模方法,實(shí)現(xiàn)以下幾個(gè)功能:1)消除數(shù)據(jù)間的共線性,提取主成分;2)降低噪聲的影響;3)采用非線性模型辨析過(guò)程的輸入輸出關(guān)系,并實(shí)現(xiàn)模型的稀疏性、提高模型的推廣能力。最后通過(guò)仿真驗(yàn)證了本文提出的方法的有效性。
[1]俞金壽,劉愛(ài)倫,張克進(jìn).軟測(cè)量技術(shù)及其在石油化工中的應(yīng)用[M].北京:化學(xué)工業(yè)出版社,2000.
[2]常兆光,王清河,杜彩鳳.應(yīng)用統(tǒng)計(jì)方法[M].北京:石油工業(yè)出版社,2009.
[3]S.Chen,X.Hong,B.L.Luk et al.Orthogonalleast-squares regression:A unified approach for data modeling.Neurocomputing,2009,72(10-12):2670-2681.
[4]S.Chen,X.Hong,Harris C J,et al.Sparse modeling using orthogonal forward regression with PRESS statistic and regularization[J].IEEE transaction on system,man and cybernetics-part B:Cybernetics,2004,34(2):898-911.
[5]X.Hong,P.M.Sharkey,K.Warwick.Automatic nonlinear predictive model-construction algorithm using forward regression and the PRESS statistic.IEE.Proc.-Control Theory Appl.,2003,150(3):245-253.
[6]http://www.eigenvector.com/data/SWRI/index.html.