韓敏,張占奎
(大連理工大學(xué)電子信息與電氣工程學(xué)部,遼寧 大連 116023)
復(fù)雜工業(yè)過(guò)程如果發(fā)生故障,會(huì)造成巨大的損失,在線監(jiān)控工業(yè)過(guò)程的運(yùn)行狀態(tài),及時(shí)發(fā)現(xiàn)和識(shí)別故障至關(guān)重要。故障診斷主要研究如何對(duì)系統(tǒng)中出現(xiàn)的故障進(jìn)行檢測(cè)和辨識(shí),也就是判斷故障是否發(fā)生和故障發(fā)生的類型。其中,基于數(shù)據(jù)驅(qū)動(dòng)的多元過(guò)程統(tǒng)計(jì)方法不需要精確的數(shù)學(xué)模型和先驗(yàn)知識(shí),只需要對(duì)歷史數(shù)據(jù)進(jìn)行特征提取,在特征空間中構(gòu)建監(jiān)控統(tǒng)計(jì)量實(shí)現(xiàn)故障檢測(cè),并且根據(jù)貢獻(xiàn)圖識(shí)別引起故障的變量,是故障診斷領(lǐng)域研究的熱點(diǎn)方向之一[1-3]。
特征提取作為非常關(guān)鍵的一步,直接影響故障檢測(cè)與故障診斷的性能。一般來(lái)說(shuō),數(shù)據(jù)結(jié)構(gòu)特征包括全局結(jié)構(gòu)特征和局部結(jié)構(gòu)特征。全局結(jié)構(gòu)描述過(guò)程數(shù)據(jù)的整體結(jié)構(gòu),反映數(shù)據(jù)的外部形狀,而局部結(jié)構(gòu)描述過(guò)程數(shù)據(jù)近鄰點(diǎn)的排列情況,反映數(shù)據(jù)的內(nèi)在屬性[4]。故障診斷中特征提取主要的手段包括:主成分分析(principal component analysis,PCA)[5]、偏最小二乘(partial least squares,PLS)[2]和獨(dú)立成分分析(independent components analysis,ICA)[6]等。主成分分析通過(guò)求解歷史數(shù)據(jù)協(xié)方差矩陣的特征值和特征矢量實(shí)現(xiàn)特征提取,由于主成分分析是一種線性投影方法[7],無(wú)法解決過(guò)程監(jiān)控中的非線性問(wèn)題。為克服這一缺陷,核主成分分析(kernel principal component analysis,KPCA)被提出[8]。核主成分分析通過(guò)非線性映射函數(shù)將歷史數(shù)據(jù)從原始空間投影到高維特征空間再運(yùn)用線性PCA 技術(shù),保留原始數(shù)據(jù)中大部分方差信息,但方差主要描述的是樣本空間的全局結(jié)構(gòu)信息[4]。最近,研究表明流形學(xué)習(xí)(manifold learning)能夠提取數(shù)據(jù)集在原始變量空間中隱藏的局部結(jié)構(gòu),受到過(guò)程監(jiān)控領(lǐng)域的關(guān)注[9-11]。流形學(xué)習(xí)主要方法包括拉普拉斯特征映射法(Laplacian eigenmaps,LE)[12],局部線性嵌套法(locally linear embedding,LLE)[13],局部保持投影法(locality preserving projections,LPP)[14]等。其中,局部保持投影法在保持局部結(jié)構(gòu)的同時(shí)實(shí)現(xiàn)了線性計(jì)算,得到廣泛的應(yīng)用,并且通過(guò)引入核方法提出了核局部保持投影(kernel locality preserving projection,KLPP)[15]。然而,在特征提取過(guò)程中丟失局部結(jié)構(gòu)或者全局結(jié)構(gòu)都會(huì)影響特征提取的效果。因此,一些綜合保持全局結(jié)構(gòu)和局部結(jié)構(gòu)的方法不斷地被提出,例如global-local structure analysis(GLSA)[4]、local and global principal component analysis(LGPCA)[16]、tensor global-local structure analysis(TGLSA)[17]等。但這些方法本質(zhì)上是線性投影方法,不能有效地提取工業(yè)過(guò)程中的非線性特征。
在故障檢測(cè)與診斷問(wèn)題上,傳統(tǒng)方法采用T2統(tǒng)計(jì)量和平方預(yù)測(cè)誤差(squared prediction error,SPE)統(tǒng)計(jì)量?jī)蓚€(gè)監(jiān)控指標(biāo)判斷是否有故障發(fā)生,并且根據(jù)貢獻(xiàn)圖辨識(shí)引起故障的變量[1]。T2指標(biāo)采用馬氏距離作為度量,而SPE 指標(biāo)采用歐式距離作為度量,導(dǎo)致這兩個(gè)統(tǒng)計(jì)量不能聯(lián)合起來(lái)進(jìn)行故障檢測(cè),并且通過(guò)兩個(gè)指標(biāo)分別得到的貢獻(xiàn)圖無(wú)法準(zhǔn)確診斷出發(fā)生的故障類型[18]。由于過(guò)程監(jiān)控的任務(wù)是從大量的樣本數(shù)據(jù)中區(qū)分出正常樣本和故障樣本,因此故障檢測(cè)可以認(rèn)為是分類問(wèn)題。其中,費(fèi)舍爾判別分析(Fisher discriminant analysis,F(xiàn)DA)作為一個(gè)經(jīng)典的維數(shù)約減和模式分類方法,被廣泛應(yīng)用。例如,He 等[19]通過(guò)使用故障模式類標(biāo)簽知識(shí)建立故障分類模型,在此基礎(chǔ)之上,Zhang 等[20]使用費(fèi)舍爾判別分析求解滿足最大分離度的特征矢量和判別矢量來(lái)實(shí)現(xiàn)狀態(tài)監(jiān)測(cè),提高了系統(tǒng)故障檢測(cè)與診斷能力。
為解決傳統(tǒng)核主成分分析提取非線性特征時(shí)只考慮過(guò)程數(shù)據(jù)全局結(jié)構(gòu)而忽略局部結(jié)構(gòu)特征的缺陷,本文將核局部保持投影方法保持局部近鄰結(jié)構(gòu)思想融入到核主成分分析的目標(biāo)函數(shù)中,提出一種改進(jìn)核主成分分析方法(modified kernel principal component analysis,MKPCA),解決工業(yè)過(guò)程中數(shù)據(jù)變量存在非線性關(guān)系的問(wèn)題。該方法既能夠保持?jǐn)?shù)據(jù)集整體方差的最大化,又可以保持?jǐn)?shù)據(jù)集局部近鄰結(jié)構(gòu)不變。本文將所提方法用于過(guò)程數(shù)據(jù)降維和特征提取,并與費(fèi)舍爾判別分析相結(jié)合,將獲得的特征信息分類,以判別矢量的歐式距離為統(tǒng)計(jì)量檢測(cè)故障,并且根據(jù)特征矢量間的相似度系數(shù)快速識(shí)別故障類型。
作為非線性特征提取的經(jīng)典方法,核主成分分析(KPCA)通過(guò)非線性函數(shù)將輸入數(shù)據(jù)集從原始空間映射到高維特征空間運(yùn)用線性主成分分析技術(shù)進(jìn)行特征提取,實(shí)現(xiàn)了方差最大化,但方差主要描述數(shù)據(jù)集的全局結(jié)構(gòu)信息。另一方面,核局部保持投影(KLPP)是一種通過(guò)在核空間建立近鄰圖來(lái)保持?jǐn)?shù)據(jù)集局部結(jié)構(gòu)的方法,其本身著眼于局部結(jié)構(gòu)的保持,并沒(méi)有考慮全局結(jié)構(gòu)特征。借鑒核主成分 分析和核局部保持投影方法的思想,本文提出改進(jìn)核主成分分析方法(MKPCA),其優(yōu)化目標(biāo)可以分解為全局和局部?jī)蓚€(gè)目標(biāo)函數(shù)。全局目標(biāo)函數(shù)使映射得到的特征空間保留原始數(shù)據(jù)集的大部分方差信息,實(shí)現(xiàn)全局特征提??;局部目標(biāo)函數(shù)使映射得到的特征空間和原始數(shù)據(jù)集具有相似的局部近鄰結(jié)構(gòu),實(shí)現(xiàn)局部特征的提取。
核主成分分析(KPCA)通過(guò)非線性映射函數(shù)將歷史數(shù)據(jù)從原始空間投影到高維特征空間再運(yùn)用線性PCA 技術(shù),保留原始數(shù)據(jù)中大部分方差信息。假設(shè)已知數(shù)據(jù)集XT=[x1,x2,…,xn]∈Rm×n,m表示系統(tǒng)變量數(shù)目,n表示系統(tǒng)樣本數(shù)目,定義從原始空間到高維特征空間的非線性映射φ,Jglobal(w)的目標(biāo)是在特征空間中尋找一個(gè)投影向量w,使得投影后的yi=(φ(xi))Tw保留原始數(shù)據(jù)集的大部分方差信息,其中,i=1,2,…,n。核主成分分析的目標(biāo)函數(shù)Jglobal(w)可以用式(1)表示
式中,wTw=1。
因?yàn)樘卣骺臻g由過(guò)程數(shù)據(jù)的映射值φ(x1),φ(x2),…,φ(xn)組成,所以投影向量w必定在特征點(diǎn)φ(xi)展開(kāi)方向上,即存在一個(gè)向量α=(α1,α2,…,α n)T滿足
將式(2)代入式(1),目標(biāo)函數(shù)轉(zhuǎn)化為求解α,如式(3)所示
然后,為求解上述非線性問(wèn)題,引入核函數(shù)K(i,j)=φ(xi)Tφ(xj),可得核矩陣則目標(biāo)函數(shù)可以轉(zhuǎn)換為
式中,αΤKα=1,C=KK。
核主成分分析的目標(biāo)函數(shù)通過(guò)非線性函數(shù)將原始數(shù)據(jù)集映射到高維空間,因?yàn)樵诟呔S空間保留原始數(shù)據(jù)集的大部分方差信息,實(shí)現(xiàn)了全局結(jié)構(gòu)的特征提取。但是,全局目標(biāo)函數(shù)中并沒(méi)有考慮不同樣本點(diǎn)之間的內(nèi)在關(guān)系,樣本點(diǎn)之間的局部幾何關(guān)系有可能被打亂,導(dǎo)致過(guò)程信息的丟失。
核局部保持投影(KLPP)通過(guò)在核空間建立近鄰圖,對(duì)鄰域圖各邊賦加合理的權(quán)重,能夠很好地表現(xiàn)數(shù)據(jù)集流形的局部結(jié)構(gòu)。假設(shè)已知數(shù)據(jù)集XT=[x1,x2,???,xn]∈Rm×n,m表示系統(tǒng)變量數(shù)目,n表示系統(tǒng)樣本數(shù)目,定義從原始空間到高維空間的非線性映射φ,Jglobal(w)的目標(biāo)就是尋找投影向量w使得投影yi=(φ(xi))Tw在高維空間保持?jǐn)?shù)據(jù)點(diǎn)之間的近鄰關(guān)系,其中,i=1,2,???,n。也就是如果φ(xi)和φ(xj)是近鄰,即ε為閾值參數(shù),那么yi=(φ(xi))Tw和yj=(φ(xj))Tw也應(yīng)該是近鄰的。核局部保持投影的目標(biāo)函數(shù)定義如下:
S為權(quán)重矩陣,D為對(duì)角矩陣,
同樣,存在一個(gè)向量α=(α1,α2,…,α n)T滿足那么核局部保持投影的目標(biāo)函 數(shù)為
式中,L=D-S是Laplacian 矩陣,L′=KLK。
核局部保持投影的目標(biāo)函數(shù)通過(guò)在高維空間保持原始數(shù)據(jù)點(diǎn)之間的近鄰關(guān)系,實(shí)現(xiàn)對(duì)原始數(shù)據(jù)集的局部結(jié)構(gòu)提取。但是,其局部目標(biāo)函數(shù)僅僅關(guān)注樣本點(diǎn)之間的局部關(guān)系,并沒(méi)有考慮樣本點(diǎn)的全局特征。
結(jié)合核主成分分析和核局部保持投影算法的優(yōu)點(diǎn),本文將核局部保持投影方法保持局部結(jié)構(gòu)的思想融入核主成分分析的目標(biāo)函數(shù)中,提出改進(jìn)核主成分分析(MKPCA),使提取特征時(shí)得到的特征空間既能保留原始數(shù)據(jù)集的全局結(jié)構(gòu),又和原始數(shù)據(jù)集具有相似的局部近鄰結(jié)構(gòu),克服傳統(tǒng)核主成分分析方法只關(guān)注全局結(jié)構(gòu)特征而忽略局部結(jié)構(gòu)特征的缺陷。然而,這兩個(gè)目標(biāo)函數(shù)很難同時(shí)達(dá)到最優(yōu)。針對(duì)該問(wèn)題,引入?yún)?shù)η平衡這兩個(gè)目標(biāo)函數(shù)。改進(jìn)核主成分分析的優(yōu)化目標(biāo)定義如下
式中,M=ηC+(1 -η)L′,αΤKα=1,0≤η≤1。
求解上述目標(biāo)函數(shù),必須要認(rèn)識(shí)到不同的目標(biāo)函數(shù)可能有不同的規(guī)模和收斂速度,因此,應(yīng)選擇適當(dāng)?shù)膮?shù)η來(lái)統(tǒng)一目標(biāo)函數(shù)的規(guī)模,并且使它們具有相同的收斂速度。實(shí)際上,上述目標(biāo)函數(shù)的優(yōu)化問(wèn)題最終轉(zhuǎn)化為一個(gè)特征向量的問(wèn)題來(lái)求解。由于沒(méi)有采取迭代搜索的策略,在這里不會(huì)涉及收斂速度的問(wèn)題,只需要考慮兩個(gè)子目標(biāo)函數(shù)之間規(guī)模的差異。受到參考文獻(xiàn)[16-17]的啟發(fā),定義Jglobal(α)和Jlocal(α)的規(guī)模如下
式中,ρ(?)為相關(guān)矩陣的譜半徑。為了統(tǒng)一全局和局部結(jié)構(gòu)保持的不同規(guī)模,定義式(12)
因此,參數(shù)η可以用下式求解
當(dāng)確定η的值后,利用拉格朗日因子法求解α,最大化αTMα- λ(αΤKα- 1),對(duì)α求導(dǎo)并令其等于0,最終推導(dǎo)出式(14)
因此,改進(jìn)核主成分分析方法轉(zhuǎn)化為求解方程(14)的廣義特征值問(wèn)題。為了解決非奇異問(wèn)題,引入正則化的方法[9],式(14)中將 +nβK Ⅰ代替K,其中,β為一個(gè)非常小的正整數(shù),nⅠ為一個(gè)n n× 的單位矩陣。然后,得到按大小排列的特征值λ1,λ2,…,λn及與之對(duì)應(yīng)的特征向量α1,α2,…,α n,進(jìn)而得到投影矩陣Α=[α1,α2,???,α n]。根據(jù)特征提取后的能量保持率γ(通常取大于85%),即特征提取后需要滿足
選取最大的d個(gè)特征值[λ1,λ2,…,λd]所對(duì)應(yīng)的特征矢量α1,α2,…,α d構(gòu)成Α′=[α1,α2,…,α d]。另外,使用改進(jìn)核主成分分析方法時(shí)涉及核矩陣K的去中心化處理[21]。
基于改進(jìn)核主成分分析方法的特征提取步驟如下:
(1)給定正常工況下的訓(xùn)練數(shù)據(jù),進(jìn)行歸一化,得到原始數(shù)據(jù)集XT=[x1,x2,???,xn];
(2)選擇適當(dāng)?shù)膮?shù),確定原始數(shù)據(jù)集的核矩陣K和矩陣L;
(3)求解式(14),得到投影矩陣Α=[α1,α2,???,α n];
(4)按照式(15)選擇合適的主成分個(gè)數(shù),投影矩陣Α′=[α1,α2,???,α d];
(5)按照T=KTΑ′,提取數(shù)據(jù)集XT的特征。
費(fèi)舍爾判別分析(FDA)是一種通過(guò)確定滿足類間離散度最大化和類內(nèi)離散度最小化的線性變換,來(lái)降低特征空間維數(shù)的模式分類方法,它可以最大程度地將各類數(shù)據(jù)分開(kāi)[20]。設(shè)X∈Rn×m是一組由n個(gè)采樣和m個(gè)測(cè)量變量構(gòu)成的數(shù)據(jù)集,包含p類數(shù)據(jù),nj為第j類數(shù)據(jù)的個(gè)數(shù)。令Sa為類內(nèi)離散度矩陣,Sb為類間離散度矩陣。類內(nèi)離散度矩陣為
式中,f為所求的最優(yōu)投影矢量。求解如下廣義特征值問(wèn)題
求解式(19)可以得到n個(gè)特征值和與之相對(duì)應(yīng)的n個(gè)特征向量,取前s個(gè)特征值對(duì)應(yīng)的特征向量作為特征矩陣F,最大特征值對(duì)應(yīng)的特征向量作為最優(yōu)特征矢量fopt。
輸入數(shù)據(jù)集之間差異越大,費(fèi)舍爾判別分析方法的分類效果就越好。由于過(guò)程數(shù)據(jù)對(duì)象往往是高維、有噪聲的,一般情況首先使用特征提取技術(shù)將原始輸入空間映射到特征空間,而特征提取的效果會(huì)直接影響分類器性能。改進(jìn)核主成分分析(MKPCA)作為一種特征提取方法,兼顧數(shù)據(jù)集的全局結(jié)構(gòu)特征和局部結(jié)構(gòu)特征,能夠較好地保持?jǐn)?shù)據(jù)集之間的差異信息,將提取的特征信息作為分類器的輸入,可以提高分類器故障檢測(cè)與診斷的能力?;贛KPCA-FDA 的故障檢測(cè)與診斷方法通過(guò)MKPCA 提取正常工況下數(shù)據(jù)和各故障類別數(shù)據(jù)的非線性特征,使用FDA 建模,計(jì)算出特征矩陣和最優(yōu)特征矢量,構(gòu)建距離統(tǒng)計(jì)量并通過(guò)核密度估計(jì)確定其控制限,利用相似度的性能診斷方法識(shí)別發(fā)生的故障類型。
正常工況下訓(xùn)練數(shù)據(jù)的判別矢量和新采樣測(cè)試數(shù)據(jù)的判別矢量分別為
式中,Ttrain和Ttest分別為MKPCA 提取的正常工況下訓(xùn)練數(shù)據(jù)和新采樣測(cè)試數(shù)據(jù)的特征信息。將每一類數(shù)據(jù)的判別矢量看成一個(gè)簇,求取簇中判別矢量的均值確定正常工況下訓(xùn)練數(shù)據(jù)判別矢量的中心ξcenter,通過(guò)式(22)計(jì)算正常工況下訓(xùn)練數(shù)據(jù)的判別矢量ξtrain與中心ξcenter之間的歐氏距離
Dis 為正常工況下訓(xùn)練數(shù)據(jù)的監(jiān)控統(tǒng)計(jì)量,通過(guò)核密度估計(jì)的方法[22]確定監(jiān)控統(tǒng)計(jì)控制限D(zhuǎn)is?。當(dāng)獲取到新采樣數(shù)據(jù)時(shí),通過(guò)下式計(jì)算新采樣數(shù)據(jù)的判別矢量ξnew與正常數(shù)據(jù)判別矢量中心ξcenter之間的歐氏距離
當(dāng)計(jì)算出的新采樣數(shù)據(jù)的統(tǒng)計(jì)量Disnew大于控制限D(zhuǎn)is?時(shí),即可判斷出有故障發(fā)生。檢測(cè)到有故障發(fā)生之后,判斷故障發(fā)生的類型。首先,離線確定各故障的診斷閾值。使用最優(yōu)特征矢量建立故障診斷庫(kù),p為故障類的個(gè)數(shù),計(jì)算各類故障之間的相似度,定義最優(yōu)特征矢量與之間的相似度系數(shù)為 Simi,j,相似度系數(shù)Simi,j可以通過(guò)下式獲得
每種故障的閾值是故障診斷庫(kù)中不同于本故障的相似度的均值,通過(guò)式(25)計(jì)算可以得到第i類故障的診斷閾值
式中,p表示故障類個(gè)數(shù)。
當(dāng)在線檢測(cè)到故障后,計(jì)算新采樣數(shù)據(jù)的最優(yōu)特征矢量和故障診斷庫(kù)里最優(yōu)特征矢量之間的相似度系數(shù)為 Simnew,j,使用相似度系數(shù)Simnew,j來(lái)判斷故障類型。如果新采樣數(shù)據(jù)的最優(yōu)特征矢量與故障診斷庫(kù)里中第j個(gè)故障的最優(yōu)判別矢量之間的相似度最大,并且超過(guò)了該類故障的診斷閾值,則判斷為第j類故障發(fā)生。否則,將待測(cè)樣本發(fā)生的故障類型認(rèn)為是新的故障類型,更新故障診斷歷史數(shù)據(jù)庫(kù)。
傳統(tǒng)方法采用T2和SPE 統(tǒng)計(jì)量檢測(cè)故障是否發(fā)生。T2是當(dāng)前采樣數(shù)據(jù)主元向量的馬氏范數(shù),而SPE 表示主元模型對(duì)采樣數(shù)據(jù)的平方預(yù)測(cè)誤差,采用歐式距離作為度量。T2和SPE 統(tǒng)計(jì)量的不一致性,導(dǎo)致有時(shí)會(huì)得到不同的故障檢測(cè)和診斷結(jié)果。本文在特征空間中使用FDA 建立監(jiān)控統(tǒng)計(jì)量Dis,并且使用最優(yōu)特征矢量快速識(shí)別故障類型。FDA 充分考慮到了故障分類信息,提高了不同類別子集間的分離程度,有利于提高故障檢測(cè)和診斷能力。
基于MKPCA-FDA 的故障檢測(cè)與診斷流程:
(1)收集正常工況下過(guò)程變量數(shù)據(jù)集和p類歷史故障數(shù)據(jù)集;
(2)使用MKPCA 提取正常工況數(shù)據(jù)集和故障數(shù)據(jù)集的非線性特征Tnormal和Tfault;
(5)確定新采樣數(shù)據(jù)判別矢量ξnew和正常工況下數(shù)據(jù)集判別矢量的中心ξcenter之間的歐氏距離Disnew。
(6)比較監(jiān)控統(tǒng)計(jì)量 Disnew和監(jiān)控統(tǒng)計(jì)控制限D(zhuǎn)is?,如果 Disnew> D is?,判斷有故障產(chǎn)生,然后,計(jì)算相似度系數(shù),識(shí)別故障類型。
為驗(yàn)證本文所提方法的有效性,采用Tennessee Eastman(TE)過(guò)程故障檢測(cè)數(shù)據(jù)集進(jìn)行仿真實(shí)驗(yàn)。TE 過(guò)程[6]作為一個(gè)基于真實(shí)工業(yè)過(guò)程的仿真平臺(tái),在基于數(shù)據(jù)驅(qū)動(dòng)的故障檢測(cè)研究領(lǐng)域中被廣泛應(yīng)用于評(píng)價(jià)監(jiān)控方法的性能。該過(guò)程有12 個(gè)操作變量和41 個(gè)測(cè)量變量,包含了正常狀態(tài)及21 種不同狀態(tài)的故障。本文使用的數(shù)據(jù)下載自http://web.mit.edu/ braatzgroup/links.html,選取33 個(gè)變量作為過(guò)程監(jiān)測(cè)變量,每種狀態(tài)的數(shù)據(jù)包括訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集,分別是480 組和960 組數(shù)據(jù),每一種故障從第161 個(gè)數(shù)據(jù)點(diǎn)開(kāi)始引入。
為驗(yàn)證本文所提方法具有較好的特征提取效果,首先使用本文所提方法進(jìn)行特征提取仿真實(shí)驗(yàn)。從訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)中分別取1 組正常工況數(shù)據(jù)和3 組不同的故障數(shù)據(jù)(以故障4、故障8 和故障14 為例),使用本文所提MKPCA-FDA 方法將數(shù)據(jù)投影到特征矢量方向上,得到數(shù)據(jù)第一和第二特征矢量的分散圖,并分別KPCA 方法、KLPP 方法、LGPCA 方法、GLSA 方法、FDA 方法和KFDA 方法進(jìn)行比較。建立KPCA 模型時(shí),選取高斯核函數(shù)其中,核參數(shù)σ=20m,m為過(guò)程變量的維數(shù),采用方差累計(jì)百分比方法,確定主元個(gè)數(shù)為9。作為對(duì)照,同樣設(shè)定其余方法的潛隱變量個(gè)數(shù)為9。采用k最近鄰法來(lái)計(jì)算相似矩陣,其中,參數(shù)k=10,t=1。各方法的統(tǒng)計(jì)量置信限均選擇為99%。
圖1 基于KPCA 的特征提取Fig.1 Features extracted based on KPCA
圖2 基于KLPP 的特征提取Fig.2 Features extracted based on KLPP
圖3 基于LGPCA 的特征提取Fig.3 Features extracted based on LGPCA
圖4 基于GLSA 的特征提取Fig.4 Features extracted based on GLSA
圖5 基于FDA 的特征提取Fig.5 Features extracted based on FDA
從圖1和圖2KPCA 和KLPP 的前兩維特征提取結(jié)果可見(jiàn),KPCA 和KLPP 都無(wú)法將4 類數(shù)據(jù)有效地分離,特別是正常工況和故障4 存在大量的重合;圖3和圖4分別為L(zhǎng)GPCA 和GLSA 的前兩維特征提取結(jié)果,由于綜合保持了全局結(jié)構(gòu)和局部結(jié) 構(gòu),其效果要略好于前兩種方法;圖5為FDA 的前兩維特征提取結(jié)果,只有故障4 被有效地區(qū)分開(kāi),正常數(shù)據(jù)、故障8和故障14并不能被有效地區(qū)分開(kāi);從圖6中可以看出,非線性方法KFDA 能夠?qū)⒐?障4 和故障14 區(qū)分開(kāi),效果要好于線性方法 FDA,但是正常數(shù)據(jù)和故障8 仍有重疊;本文所提 MKPCA-FDA 方法的特征提取結(jié)果如圖7所示,由于MKPCA 方法可以提取信息量更加豐富的數(shù)據(jù)作為FDA 方法的輸入,本文方法在完成數(shù)據(jù)降維和可視化的同時(shí)能夠?qū)⒄?shù)據(jù)、故障4、故障8 和故障14 有效地分離,使得用判別矢量的歐氏距離作為統(tǒng)計(jì)量進(jìn)行過(guò)程監(jiān)控成為可能。
圖6 基于KFDA 的特征提取Fig.6 Features extracted based on KFDA
圖7 基于MKPCA-FDA 的特征提取Fig.7 Features extracted based on MKPCA-FDA
圖8 KPCA 方法的故障5 監(jiān)控結(jié)果Fig.8 Monitoring result of KPCA on fault 5
圖9 KLPP 方法的故障5 監(jiān)控結(jié)果Fig.9 Monitoring result of KLPP on fault 5
為驗(yàn)證本文所提方法的故障檢測(cè)能力,以故障5 為例進(jìn)行實(shí)驗(yàn)。故障5 是一個(gè)發(fā)生在冷凝器冷卻水入口溫度上的階躍型故障,故障發(fā)生后冷凝器的冷卻水流量會(huì)隨之發(fā)生一個(gè)顯著的階躍變化,同時(shí),從冷凝器出口到分離器的流速增加,進(jìn)而導(dǎo)致氣液分離器溫度增加,分離器冷卻水出口溫度也隨之增加。但是TE 仿真平臺(tái)的控制回路能夠通過(guò)反饋補(bǔ)償這個(gè)故障變化,最終分離器中的溫度降返回正常狀態(tài)。這也使得一些監(jiān)控方法只能在故障發(fā)生的初期檢測(cè)到這類故障,而不能持續(xù)地給出報(bào)警。圖8為基于KPCA 方法的2T和SPE 統(tǒng)計(jì)量的故障檢測(cè)結(jié)果,兩種統(tǒng)計(jì)量對(duì)故障5 的反應(yīng)不敏感;從圖9中可以看出,KLPP 方法的T2和SPE 統(tǒng)計(jì)量仍然無(wú)法有效地檢測(cè)故障;圖10為基于LGPCA 方法的T2和SPE 統(tǒng)計(jì)量的故障檢測(cè)結(jié)果,SPE 統(tǒng)計(jì)量對(duì)故障5 的反應(yīng)不敏感,T2能夠持續(xù)檢測(cè)出故障,但波動(dòng)較大;從圖11中可以看出,GLSA 方法的SPE統(tǒng)計(jì)量仍然無(wú)法有效地檢測(cè)故障,而且T2的波動(dòng)也較大;從圖12中FDA 方法的檢測(cè)結(jié)果可見(jiàn),直接使用FDA 的效果仍不理想;圖13為KFDA 方法的距離統(tǒng)計(jì)量檢測(cè)結(jié)果,其效果要好于KPCA 方法和FDA 方法;本文所提方法對(duì)故障5 的檢測(cè)結(jié)果如圖14所示,在前160 采樣時(shí)刻沒(méi)有發(fā)生誤報(bào),在第161采樣時(shí)刻距離統(tǒng)計(jì)量超過(guò)了監(jiān)測(cè)控制限,而且能持續(xù)穩(wěn)定地檢測(cè)出故障。
圖10 LGPCA 方法的故障5 監(jiān)控結(jié)果Fig.10 Monitoring result of LGPCA on fault 5
圖11 GLSA 方法的故障5 監(jiān)控結(jié)果Fig.11 Monitoring result of GLSA on fault 5
圖12 FDA 方法的故障5 監(jiān)控結(jié)果Fig.12 Monitoring result of FDA on fault 5
從表1中可以看出,本文所提方法在測(cè)試數(shù)據(jù)集中均取得了較好結(jié)果。KPCA 和KLPP 作為基本方法,其故障檢測(cè)性能接近;LGPCA 和GLSA 方法,在進(jìn)行特征提取時(shí)能夠關(guān)注數(shù)據(jù)集的局部和全局特征,檢測(cè)性能有一定的改善;作為一種有監(jiān)督的非線性模式分類方法KFDA,利用了數(shù)據(jù)的類別信息,其故障檢測(cè)性能要好于線性方法FDA;本文所提方法的故障檢測(cè)效果最好,本文方法利用MKPCA 全面提取各數(shù)據(jù)的全局特征和局部特征,能夠反映數(shù)據(jù)的內(nèi)在屬性,增大了數(shù)據(jù)間的差異,將之作為FDA 的輸入,提高了FDA 分類的效果。
表1 故障檢測(cè)率測(cè)試結(jié)果Table 1 Test results of fault detection rate
圖13 KFDA 方法的故障5 監(jiān)控結(jié)果Fig.13 Monitoring result of KFDA on fault 5
圖14 MKPCA-FDA 方法的故障5 監(jiān)控結(jié)果Fig.14 Monitoring result of MKPCA-FDA on fault 5
當(dāng)系統(tǒng)成功地檢測(cè)到故障后,需要判斷發(fā)生的故障類型,本文使用相似度的性能診斷方法識(shí)別發(fā)生的故障類型。首先,離線確定各故障的診斷閾值。對(duì)TE 過(guò)程每種故障(共21 種)的480 組訓(xùn)練數(shù)據(jù)建立MKPCA-FDA 模型,得到每種故障類型的最優(yōu)特征矢量,使用最優(yōu)特征矢量建立歷史故障診斷庫(kù),在建立歷史數(shù)據(jù)故障診斷庫(kù)的基礎(chǔ)上,計(jì)算各類故障最優(yōu)特征矢量之間的相似度系數(shù)值,最后,計(jì)算各故障的診斷閾值,每種故障的閾值是故障診斷庫(kù)中不同于本故障的相似度的均值,如表2所示。
以故障5 為例,圖15為本文方法在第161 時(shí)刻檢測(cè)出故障后,利用最優(yōu)特征矢量對(duì)故障5 的相似度分析,可以看出,在第161 時(shí)刻發(fā)生故障的最優(yōu)特征矢量與故障診斷庫(kù)中故障5 最優(yōu)特征矢量的相似度系數(shù)值最大,且超過(guò)了故障診斷閾值,因此判斷系統(tǒng)在第161 時(shí)刻所發(fā)生的故障類型為故障5,與實(shí)際情況吻合。
表2 各故障的診斷閾值Table 2 Diagnosis threshold of each fault
圖15 故障5 的診斷效果Fig.15 Fault diagnosis effect diagram of fault 5
為可視化本文所提方法具有較好的故障識(shí)別效果,從表1中挑選了9 種故障工況,從故障診斷庫(kù)中選擇相應(yīng)數(shù)據(jù)集的最優(yōu)特征矢量,得到各測(cè)試數(shù)據(jù)集的特征矢量與故障診斷庫(kù)中特征矢量的相似度系數(shù),如圖16所示,可以看到,本文所提方法能夠?qū)⒏鞣N故障識(shí)別出來(lái)。
圖16 9 種故障工況的識(shí)別結(jié)果Fig.16 Fault identification results among nine selected fault cases
本文針對(duì)傳統(tǒng)核主成分分析(KPCA)方法提取非線性特征時(shí),忽略數(shù)據(jù)局部結(jié)構(gòu)特征的缺陷,綜合核主成分分析全局結(jié)構(gòu)保持和核局部保持投影(KLPP)局部結(jié)構(gòu)保持的優(yōu)點(diǎn),提出一種改進(jìn)核主成分分析方法(MKPCA)。該方法在解決非線性問(wèn)題的同時(shí),能夠全面提取非線性系統(tǒng)中過(guò)程數(shù)據(jù)的全局特征和局部特征,包含更加豐富的特征信息,并將之作為FDA 方法的輸入,使用判別矢量的距離進(jìn)行故障檢測(cè),根據(jù)最優(yōu)特征矢量間的相似度系數(shù)來(lái)快速識(shí)別故障,充分利用了MKPCA 方法特征提取能力和FDA 方法監(jiān)督學(xué)習(xí)能力,實(shí)現(xiàn)兩種方法的優(yōu)勢(shì)結(jié)合。采用Tennessee Eastman 過(guò)程故障檢測(cè)數(shù)據(jù)集進(jìn)行仿真實(shí)驗(yàn),表明了本文所提方法在故障檢測(cè)與診斷中的優(yōu)勢(shì)。
[1]Zhou Donghua (周東華),Li Gang (李鋼),Li Yuan (李元).Data Driven Industrial Process Fault Diagnosis Technology Based on Principal Component Analysis and Partial Least Squares (數(shù)據(jù)驅(qū)動(dòng)的工業(yè)過(guò)程故障診斷技術(shù):基于主成分分析與偏最小二乘的方法) [M].Beijing:Science Press,2011:1-9.
[2]Yin S,Ding S X,Haghani A,et al.A comparison study of basic data-driven fault diagnosis and process monitoring methods on the benchmark Tennessee Eastman process [J].Journal of Process Control,2012,22 (9):1567-1581.
[3]Alcala C F,Joe Qin S.Analysis and generalization of fault diagnosis methods for process monitoring [J].Journal of Process Control,2011,21 (3):322-330.
[4]Zhang M,Ge Z,Song Z,et al.Global-local structure analysis model and its application for fault detection and identification [J].Ⅰndustrial & Engineering Chemistry Research,2011,50 (11):6837-6848.
[5]Garcia-Alvarez D,Fuente M J,Sainz G I.Fault detection and isolation in transient states using principal component analysis [J].Journal of Process Control,2012,22 (3):551-563.
[6]Xu Yuan (徐圓),Liu Ying (劉瑩),Zhu Qunxiong (朱群雄).A complex process fault prognosis approach based on multivariate delayed sequences [J].CⅠESC Journal(化工學(xué)報(bào)),2013,64 (12):4290-4295.
[7]Han Min (韓敏),Wang Yanan (王亞楠).Prediction of multivariate time series based on reservoir principal component analysis [J].Control and Decision(控制與決策),2009,24 (10):1526-1530.
[8]Lei Meng (雷萌),Li Ming (李明).NIRS prediction model of calorific value of coal with KPCA feature extract [J].CⅠESC Journal(化工學(xué)報(bào)),2012,64 (12):3991-3995.
[9]Song Bing (宋冰),Ma Yuxin (馬玉鑫),Fang Yongfeng (方永鋒),et al.Fault detection for chemical process based on LSNPE method [J].CⅠESC Journal(化工學(xué)報(bào)),2014,65 (2):620-627.
[10]Tong C,Yan X.Statistical process monitoring based on a multi-manifold projection algorithm [J].Chemometrics and Ⅰntelligent Laboratory Systems,2014,130:20-28.
[11]Zhang Ni (張妮),Tian Xuemin (田學(xué)民),Cai Lianfang (蔡連芳).Nonlinear process fault detection method based on RISOMAP [J].CⅠESC Journal(化工學(xué)報(bào)),2013,64 (6):2125-2130.
[12]Sprekeler H.On the relation of slow feature analysis and laplacian eigenmaps [J].Neural Computation,2011,23 (12):3287-3302.
[13]Ma Yuxin (馬玉鑫),Wang Mengling (王夢(mèng)靈),Shi Hongbo (侍洪波).Faule detection for chemical process based on locally linear embedding [J].CⅠESC Journal(化工學(xué)報(bào)),2012,63 (7):2121-2127.
[14]Wong W K,Zhao H T.Supervised optimal locality multi-manifold projection algorithm [J].Chemometrics and Ⅰntelligent Laboratory Systems,2014,130:20-28.
[15]Deng X,Tian X.Sparse kernel locality preserving projection and its application in nonlinear process fault detection [J].Chinese Journal of Chemical Engineering,2013,21 (2):163-170.
[16]Yu J.Local and global principal component analysis for process monitoring [J].Journal of Process Control,2012,22 (7):1358-1373.
[17]Luo L,Bao S,Gao Z,et al.Batch process monitoring with tensor global-local structure analysis [J].Ⅰndustrial & Engineering Chemistry Research,2013,52 (50):18031-18042.
[18]Alcala C F,Qin S J.Reconstruction-based contribution for process monitoring [J].Automatica,2009,45 (7):1593-1600.
[19]He Q P,Qin S J,Wang J.A new fault diagnosis method using fault directions in fisher discriminant analysis [J].AⅠChE Journal,2005,51 (2):555-571.
[20]Zhang X,Ma S,Yan W W,et al.A novel systematic method of quality monitoring and prediction based on FDA and kernel regression [J].Chinese Journal of Chemical Engineering,2009,17 (3):427-436.
[21]Fan J,Qin S J,Wang Y.Online monitoring of nonlinear multivariate industrial processes using filtering KICA-PCA [J].Control Engineering Practice,2014,22:205-216.
[22]Martin E B,Morris A J.Non-parametric confidence bounds for process performance monitoring charts [J].Journal of Process Control,1996,6 (6):349-358.