祝朋艷 徐進(jìn)學(xué) 張學(xué)磊
(大連海事大學(xué)船舶電氣工程學(xué)院 遼寧 大連 116026)
Graph regularization constraints
隨著工業(yè)生產(chǎn)過程控制系統(tǒng)內(nèi)部聯(lián)系越來越緊密,局部故障的發(fā)生往往影響整體的生產(chǎn),造成較大的經(jīng)濟(jì)損失。而大量傳感器以及智能儀器可隨時得到大量反映生產(chǎn)過程運(yùn)行狀態(tài)的數(shù)據(jù),通過分析采樣數(shù)據(jù)的特征信息,可尋找到適當(dāng)?shù)墓收蠙z測方法。采樣數(shù)據(jù)一般具有高維、非高斯分布和非線性的特點(diǎn)。故障檢測主要包括降維和挖掘數(shù)據(jù)兩部分內(nèi)容。對非線性數(shù)據(jù)來說,從高維空間中尋找一個更容易學(xué)習(xí)的低維嵌入不再是一種簡單的線性函數(shù)映射。核變換方法通過核變換將具有非線性結(jié)構(gòu)的數(shù)據(jù)投影到一個核空間,在此空間中復(fù)雜的非線性數(shù)據(jù)可以實(shí)現(xiàn)線性化表示,從而進(jìn)行降維[1],代表方法有核主成分分析(Kernel Principal Component Analysis,KPCA)[2]和核Fisher判別分析(Kernel Fisher Discrimination Analysis,KFDA)[3]。另外,故障檢測領(lǐng)域中常用到的主元分析法(Principal Component Analysis,PCA)[4]、偏最小二乘法(Partial least-squares,PLS)[5]和獨(dú)立主元分析法(Independent Components Analysis,ICA)[6]等多元統(tǒng)計(jì)方法可用于提取數(shù)據(jù)特征,其中ICA要求比較嚴(yán)苛不太適用于復(fù)雜的工業(yè)過程數(shù)據(jù)的處理。KPCA是核化后的PCA,能夠?qū)Ψ蔷€性數(shù)據(jù)進(jìn)行維數(shù)約簡,同時捕獲數(shù)據(jù)集的全局信息得以保留大部分的樣本特征,從而成為故障檢測領(lǐng)域中一種常用的多元統(tǒng)計(jì)方法。而實(shí)際過程中無論是描述一組數(shù)據(jù)集還是一幅圖像,都要選取其重要的局部特征加以分析,這些局部特征往往使得整個識別分析過程具有可解釋性,增加識別準(zhǔn)確率。非負(fù)矩陣分解法(Non-negative matrix factorization,NMF)具有降維和提取局部特征的優(yōu)點(diǎn)??紤]到原始數(shù)據(jù)不一定滿足非負(fù)的限制條件,多種NMF算法的變體應(yīng)運(yùn)而生,主要包括半非負(fù)矩陣分解法(Semi-NMF,SNMF)[7]、凸非負(fù)矩陣分解法(Convex-NMF,CNMF)[8]和凸包非負(fù)矩陣分解法(Convex-Hull NMF,CHNMF)[9]等。其中CHNMF選取數(shù)據(jù)集流形結(jié)構(gòu)的極端點(diǎn)作為局部特征,使其不再受矩陣非負(fù)的條件約束,放寬了傳統(tǒng)NMF算法的應(yīng)用范圍。另外,在局部信息的提取過程中,一般希望能夠盡量保持?jǐn)?shù)據(jù)固有的幾何結(jié)構(gòu)不發(fā)生改變,即數(shù)據(jù)集的大部分信息不隨矩陣分解過程而丟失。流行學(xué)習(xí)方法[10]廣泛應(yīng)用于故障檢測領(lǐng)域,研究表明基于譜圖理論的非線性流行學(xué)習(xí)方法[11]可以保持?jǐn)?shù)據(jù)變換過程中局部近鄰結(jié)構(gòu)不發(fā)生改變。
通過分析核主元分析法(KPCA)與凸包非負(fù)矩陣分解方法的優(yōu)勢所在,本文提出了核凸非負(fù)矩陣分解(KCNMF)算法,并測試了其有效性。該方法首先將原始采樣數(shù)據(jù)通過高斯核函數(shù)在高維空間中近似重構(gòu)形成新的樣本矩陣,并利用PCA對重構(gòu)數(shù)據(jù)進(jìn)行白化處理。然后利用凸包非負(fù)矩陣分解算法對白化處理后的數(shù)據(jù)矩陣進(jìn)行分解,找到能表示數(shù)據(jù)集群整體信息的局部特征,而圖正則化約束項(xiàng)則保證整個分解過程中數(shù)據(jù)分布的幾何結(jié)構(gòu)不發(fā)生改變。最后利用分解得到的基矩陣建立N2和SPE統(tǒng)計(jì)量,求得控制限,在與控制限數(shù)值的對比中完成對測試數(shù)據(jù)的故障檢測。
假設(shè)有一樣本矩陣Xm×n,有m個變量,而且每個變量有n個觀測值。本文選取z-score標(biāo)準(zhǔn)化方法對數(shù)據(jù)進(jìn)行無量綱處理。對序列x1,x2,…,xn進(jìn)行變換:
(1)
原始輸入空間中標(biāo)準(zhǔn)化后的樣本xk經(jīng)非線性映射Φ:Rm→F,在高維特征空間F中重構(gòu)表示為φ(xk)∈F。那么在空間F中φ(xk)的協(xié)方差矩陣為:
(2)
進(jìn)一步在特征空間中執(zhí)行PCA:
SFp=λsp
(3)
式中:λ為特征值;p是與λ相對應(yīng)的特征向量。將特征值按以下順序排列λ1≥λ2≥…≥λn,取前d個特征值對應(yīng)的特征向量作為PCA的主元方向。結(jié)合式(2)和式(3)得到:
(4)
在式(3)兩邊左乘映射向量φ(xk),形式如下:
〈φ(xk),SFp〉=λ〈φ(xk),p〉
(5)
聯(lián)合式(4)和式(5),化簡得到:
K2α=λsnKα
(6)
式中:K為核矩陣,(K)ij=k(xi,xj)=〈φ(xi),φ(xj)〉。
Kα=λkα
(7)
式中:λk=nλs。式(7)特征值分解運(yùn)算后得到矩陣K的特征值λk,且進(jìn)行降序排列λk1≥λk2≥…≥λkd,用下式選擇前q個最大特征值所對應(yīng)的特征向量α1,α2,…,αq:
(8)
由此可計(jì)算特征空間中的特征向量P而得到主元方向。
(9)
(10)
則白化后的樣本矩陣為:
(11)
非負(fù)矩陣分解(Non-negative matrix factorization,NMF)算法用于提取數(shù)據(jù)中“有意義的”部分變量,描述了數(shù)據(jù)集的局部特征。非負(fù)性要求使得該算法所關(guān)注的部分變量只會經(jīng)過加運(yùn)算去重構(gòu)原始樣本矩陣,特征之間不存在正負(fù)抵消的情況。用局部表現(xiàn)整體,分解過程簡潔高效,分解結(jié)果具有可解釋性是NMF算法的優(yōu)點(diǎn)所在。
設(shè)非負(fù)觀測數(shù)據(jù)矩陣V∈Rm×n,其中行向量表示樣本變量,列向量表示每個變量所包含的樣本。NMF方法對非負(fù)觀測數(shù)據(jù)V分解形式如下:
V=WHT+E
(12)
式中:W∈Rm×p表示基矩陣;H∈Rn×p稱作系數(shù)矩陣;E∈Rm×n表示殘差;參數(shù)p為近似描述分解之后的低維空間的維度。一般地,p NMF方法的求解是一個NP(Non-Deterministic Polynomial)問題,現(xiàn)有的方法都是將其歸結(jié)為一個約束優(yōu)化問題。最基本的優(yōu)化函數(shù)為Lee等[13]提出的基于歐氏距離(F-范數(shù))和廣義Kullback-Leibler散度的優(yōu)化模型。本文使用歐氏距離來度量矩陣V和兩個分解因子W和H分解前后的誤差大小: (13) s.t.W≥0,H≥0 對于W和H的求解遵循乘性更新法則,最終迭代形式如下[13]: (14) (15) 式(14)和式(15)在整個迭代過程中能夠保證目標(biāo)函數(shù)非增。目標(biāo)函數(shù)達(dá)到收斂狀態(tài)時,W和H便不再發(fā)生變化。 NMF算法提取數(shù)據(jù)局部特征,面對不完整的數(shù)據(jù)或者遇到局部噪聲過大的情況,也不會對描述其他元素產(chǎn)生較大的影響,具有良好的穩(wěn)定性和魯棒性。其中,CNMF算法將原始的NMF算法從一個非凸問題改成凸問題,避免求解優(yōu)化函數(shù)時得到局部最小值。不同于傳統(tǒng)的NMF算法,CNMF并不需要損失部分?jǐn)?shù)據(jù)信息。在凸非負(fù)矩陣分解算法中對基矩陣進(jìn)行約束,使得基矩陣的列向量是某些原始數(shù)據(jù)點(diǎn)的加權(quán)求和,W表示有意義的“集群中心體”,具體表現(xiàn)形式為: (16) 則得到: V=WHT+E=VGHT+E (17) 凸包非負(fù)矩陣(Convex-Hull NMF,CHNMF)是CNMF框架中的一種,將CNMF的基矩陣W限制為凸包頂點(diǎn)集合Y。首先,CHNMF的局部特征由數(shù)據(jù)云團(tuán)凸包頂點(diǎn)構(gòu)成,頂點(diǎn)數(shù)總是少于數(shù)據(jù)集中數(shù)據(jù)的總個數(shù),適用于大型數(shù)據(jù)集的分解。其次,很多研究中選取樣本數(shù)據(jù)聚類中心為局部特征,聚類中心作為聚類樣本均值往往代表著某類樣本的一般屬性。當(dāng)正常樣本與故障樣本基本屬性差別較大、中心位置距離較遠(yuǎn)時,聚類中心可作為檢測的主要依據(jù);反之,中心數(shù)據(jù)點(diǎn)作為局部特征具有較低的區(qū)分度,就需要獲取更多的數(shù)據(jù)信息。CHNMF選取數(shù)據(jù)集流形結(jié)構(gòu)的極端點(diǎn)(凸包頂點(diǎn))作為局部特征,將聚類中心之外的邊緣數(shù)據(jù)中蘊(yùn)含的有效信息也考慮進(jìn)去,進(jìn)一步捕捉樣本邊緣特征,比較完整的系統(tǒng)信息有助于提高故障檢測的準(zhǔn)確率。最后,因?yàn)闊o須考慮聚類中心位置,CHNMF中W初始值設(shè)定不會對最終結(jié)果產(chǎn)生較大的影響。 令Y=VG,Y∈Rm×k表示V的凸包頂點(diǎn)的集合。通過在凸包上找到k個合適的數(shù)據(jù)點(diǎn)來求解下面優(yōu)化函數(shù)的最小值: (18) s.t.yi∈v(V)i=1,2,…,k 若數(shù)據(jù)集過大,則凸包計(jì)算變得困難。對數(shù)據(jù)進(jìn)行二次降維,用數(shù)據(jù)低維映射后的凸包頂點(diǎn)來代替原空間中的凸包頂點(diǎn)[8]。實(shí)質(zhì)上,V中包含有限多的點(diǎn)在空間中形成一個多面體,由下面多面體定理可以得知,數(shù)據(jù)線性低維投影的凸包上的任何數(shù)據(jù)點(diǎn)也位于原始數(shù)據(jù)的凸包上。 多面體定理:在仿射映射π:x→Mx+t下的多面體P的每一幅圖像都是多面體[14]。 FastMap映射[15]可以將樣本矩陣線性投影到二維空間中得到新的樣本矩陣S∈Rm×r,在二維空間中我們選擇其中k個凸包頂點(diǎn)得到基矩陣Y。凸包頂點(diǎn)是特征數(shù)據(jù)點(diǎn),而每一個特征數(shù)據(jù)點(diǎn)是所有數(shù)據(jù)點(diǎn)的一個凸組合,所以離特征數(shù)據(jù)點(diǎn)距離越近的點(diǎn)對特征點(diǎn)構(gòu)成的影響就越大,對應(yīng)著參數(shù)矩陣G∈Rr×k中的數(shù)值就會越大[16]。 V=YHT+E≈SGHT+E (19) 式中:H∈Rn×k為系數(shù)矩陣。 優(yōu)化算法的目標(biāo)函數(shù)是: (20) s.t.G≥0,H≥0 迭代更新規(guī)則如下[9]: (21) (22) 式中:S是由數(shù)據(jù)V進(jìn)行FastMap投影后的數(shù)據(jù)集合。(STV)+=(|STV|+STV)/2,(STV)-=(|STV|-STV)/2,(STS)+=(|STS|+STS)/2,(STS)-=(|STS|-STS)/2分別表示數(shù)據(jù)矩陣的正數(shù)部分和負(fù)數(shù)部分。 將數(shù)據(jù)矩陣中的xi看作是圖中的一個頂點(diǎn),用G=(V,E)表示圖,V={v1,v2,…,vn}是圖的頂點(diǎn)集合,E={e1,e2,…,em}表示圖中邊的集合[17]。而兩點(diǎn)之間的權(quán)重wij構(gòu)成圖的帶權(quán)鄰接矩陣W=(wij),i,j=1,2,…,n,由于G是無向圖,令wij=wji。其中頂點(diǎn)vi∈V的度可以定義為:di=∑wij,度矩陣D是對角元素分別為度d1,d2,…,dn組成的對角矩陣。圖的構(gòu)建有幾種不同的形式,本文選擇全連通圖的構(gòu)建形式,頂點(diǎn)vi和vj之間的邊的權(quán)重值由高斯相似度函數(shù)來計(jì)算得到: (23) 式中:參數(shù)σ控制相鄰關(guān)系的寬度。由式(23)可知:當(dāng)兩數(shù)據(jù)點(diǎn)之間具有較近的物理距離時,二者之間的相似度較大,邊的權(quán)重值越大;反之,權(quán)重值越小。圖拉普拉斯矩陣L=D-W可用于表示包含度和邊的權(quán)重值等必要元素的圖。 數(shù)據(jù)映射之后,在新的基底下的數(shù)據(jù)表示形式為fk(xi)=hik。此時,數(shù)據(jù)點(diǎn)之間的近似程度計(jì)算如下[11]: (24) 由式(24)可以看出,原來距離較近的兩個數(shù)據(jù)點(diǎn)在新的基底下同樣能夠保持較近的距離和較大的相似度。 本節(jié)提出一種基于核凸非負(fù)矩陣分解算法(KCNMF)的故障檢測方法,主要用于解決非線性數(shù)據(jù)降維和樣本矩陣局部特征提取的問題。 非負(fù)觀測數(shù)據(jù)矩陣V∈Rm×n,其中行向量表示樣本變量,列向量表示每個變量所包含的樣本。對樣本矩陣X進(jìn)行白化處理得到KPCA空間中的樣本矩陣Z,對Z進(jìn)行CHNMF分解得到KCNMF模型的表達(dá)式如下: Z=SGHT+E (25) 式中:Z∈Rq×n為白化后的樣本矩陣;S∈Rq×r為FastMap映射降維后的樣本矩陣;G∈Rr×k為參數(shù)矩陣;H∈Rn×k表示系數(shù)矩陣;E∈Rq×n表示殘差矩陣。 采用歐氏距離用于度量矩陣分解前后的近似程度,目標(biāo)函數(shù)優(yōu)化過程中增加流形正則化約束。非負(fù)矩陣分解算法希望提取出的基矩陣能夠更好地近似于原數(shù)據(jù)矩陣。如果基向量能夠反映數(shù)據(jù)本身固有的黎曼結(jié)構(gòu)而不是歐幾里得結(jié)構(gòu),數(shù)據(jù)的關(guān)鍵信息就可以通過幾何結(jié)構(gòu)的局部不變性得以保留下來。如果兩個數(shù)據(jù)點(diǎn)zi和zj在數(shù)據(jù)分布的固有幾何形狀上相近,那么新的基底下的數(shù)據(jù)hi和hj也應(yīng)該是相接近的[18]。結(jié)合式(24)和式(25)得到目標(biāo)函數(shù)具體形式如下所示: (26) 式中:λ是常系數(shù)。 保持H不變,按下式更新G+: (27) 保持G不變,按下式更新H+: (28) N2=hTh=zT(SG)(SG)Tz=zTSGGTSTz (29) 而SPE統(tǒng)計(jì)量主要用來反映樣本在殘差空間中的投影變化,它表明數(shù)據(jù)樣本與核凸非負(fù)矩陣分解模型的偏離程度,用偏差設(shè)定檢測閾值也是一種重要的方法。 (30) 確定N2和SPE統(tǒng)計(jì)量之后,還需進(jìn)一步求得監(jiān)測統(tǒng)計(jì)量的控制限來判定樣本是否處于故障狀態(tài)。實(shí)際采樣數(shù)據(jù)大多具有非高斯的特點(diǎn),所以N2和SPE統(tǒng)計(jì)量的控制限就不能通過特定分布方法來確定,否則會造成較大的偏差。作為一種非參數(shù)估計(jì)方法,核密度估計(jì)法(KDE)[19]可用來估計(jì)過程數(shù)據(jù)的概率密度并提取數(shù)據(jù)分布信息,且不需要已知數(shù)據(jù)的先驗(yàn)知識和數(shù)據(jù)分布。具體形式如下: (31) 最后累積分布函數(shù)(CDF)用于計(jì)算N2和SPE統(tǒng)計(jì)量的控制限。 (32) 由此,在對測試數(shù)據(jù)進(jìn)行狀態(tài)分析時,如果新數(shù)據(jù)統(tǒng)計(jì)量處于控制限范圍內(nèi)可判定其屬于正常狀態(tài),如果高于控制限則為故障狀態(tài)。 實(shí)際工業(yè)生產(chǎn)過程是一個非線性系統(tǒng),但是在某個工作點(diǎn)采樣得到的過程數(shù)據(jù)可以近似成線性樣本,假設(shè)生產(chǎn)過程是擬平穩(wěn)過程。利用正常操作下的歷史數(shù)據(jù)構(gòu)建離線模型得到N2和SPE的故障檢測閾值,新采樣得到的在線數(shù)據(jù)根據(jù)在線檢測流程計(jì)算得到新的N2和SPE統(tǒng)計(jì)量,用于判斷是否在控制限范圍之內(nèi)從而說明數(shù)據(jù)是否故障。則故障檢測過程如下所示: 1) 離線建模階段過程如下: (1) 工業(yè)生產(chǎn)的正常操作之下采集傳感器中的數(shù)據(jù)樣本V∈Rm×n,利用一般的標(biāo)準(zhǔn)化方法對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理; (4) 利用式(10)求得白化矩陣P,并用式(11)將樣本矩陣進(jìn)行白化求取新的樣本數(shù)據(jù)Z; (5) 對白化后的新數(shù)據(jù)樣本矩陣Z進(jìn)行凸包非負(fù)矩陣分解,求得X和H; 2) 在線建模階段過程如下: (1) 在線數(shù)據(jù)測試時需先獲取新樣本vnew∈Rm,因?yàn)槭枪I(yè)生產(chǎn)是擬平穩(wěn)過程,使用訓(xùn)練樣本的均值和方差對此新樣本進(jìn)行標(biāo)準(zhǔn)化操作; (3) 利用式(11)對vnew求特征空間白化后的樣本znew; (4) 對白化后的新數(shù)據(jù)樣本矩陣Z進(jìn)行凸包非負(fù)矩陣分解,求得新的系數(shù)矩陣hnew; 本文中采用的實(shí)驗(yàn)數(shù)據(jù)來自于Tennessee Eastman(TE)仿真平臺。TE過程的流程圖如圖1所示。 圖1 TE過程的工作流程圖 整個TE生產(chǎn)過程中,可采得含有52個變量的數(shù)據(jù)集。數(shù)據(jù)集可分為22個測試集和22個訓(xùn)練集。第0號測試數(shù)據(jù)集和訓(xùn)練數(shù)據(jù)集分別表示數(shù)據(jù)是在生產(chǎn)機(jī)器在正常狀態(tài)下運(yùn)行48小時和25小時采集到的,得到的樣本數(shù)分別為960個和500個。第1-21號數(shù)據(jù)集是在21個不同故障模式下經(jīng)過48小時運(yùn)行仿真得到,在運(yùn)行過程的第8個小時處分別引入不同類型的故障,每個數(shù)據(jù)集都采集960個樣本,從160個樣本之后都為故障樣本。21個故障模式如表1所示。 表1 TE過程故障模式 續(xù)表1 對1-21種故障數(shù)據(jù)集進(jìn)行檢測時,其難易程度大致可分類如下[20]:檢測較容易的有故障IDV(1-2)、IDV(4-8)、IDV(12-14)和IDV(17-18)。不太容易被檢測的有IDV(10-11)、IDV(16)、IDV(19)和IDV(20-21)。非常難以被檢測到的有IDV(3)、IDV(9)和IDV(15)。 選取相對比較有代表性的故障4、故障10和故障19作為實(shí)驗(yàn)對象來測試核凸非負(fù)矩陣分解算法的故障檢測性能,以驗(yàn)證KCNMF對數(shù)據(jù)非線性的處理以及對局部特征的挖掘是有否有利于提高檢測準(zhǔn)確率。圖2-圖5分別是PCA、KPCA[21]、CHNMF和KCNMF四種方法對TE過程故障4的故障檢測的結(jié)果。 圖2 PCA方法的故障4檢測結(jié)果 圖3 KPCA方法的故障4檢測結(jié)果 圖4 CHNMF方法的故障4檢測結(jié)果 圖5 KCNMF方法的故障4檢測結(jié)果 從仿真結(jié)果可以看出,KPCA的檢測結(jié)果優(yōu)于線性檢測算法PCA,說明KPCA對于非線性故障數(shù)據(jù)的處理具有較好的效果。而KCNMF的檢測準(zhǔn)確率又優(yōu)于KPCA。因?yàn)楣收?是由反應(yīng)器冷卻水入口溫度產(chǎn)生改變而造成流速和反應(yīng)器中溫度兩個局部變量變化造成的,其他變量基本保持穩(wěn)定,KCNMF方法可以很好地提取數(shù)據(jù)中的局部信息,提高了工業(yè)過程的故障檢測性能。另外,KCNMF方法可以很好地應(yīng)對數(shù)據(jù)中的非線性關(guān)系,所以檢測效果比CHNMF方法更好。 故障10是物料C的溫度發(fā)生了改變,但由于TE過程可以反饋這個變化,并且緩慢地消除了這個誤差,使系統(tǒng)的溫度盡可能調(diào)整到正常值。圖6-圖9分別為PCA、KPCA、CHNMF、KCNMF對故障10的檢測結(jié)果??梢钥闯鯬CA和KPCA的N2和SPE統(tǒng)計(jì)量只能夠檢測出部分故障就是故障10的特點(diǎn)造成的。而CHNMF的檢測結(jié)果優(yōu)于上面兩種方法,對于局部特征關(guān)注優(yōu)勢明顯。不過,KCNMF方法的N2和SPE統(tǒng)計(jì)量還是比上述三種方法更勝一籌。 圖6 PCA方法的故障10檢測結(jié)果 圖7 KPCA方法的故障10檢測結(jié)果 圖8 CHNMF方法的故障10檢測結(jié)果 圖9 KCNMF方法的故障10檢測結(jié)果 圖10-圖13分別為PCA、KPCA、CHNMF和KCNMF方法對故障19的檢測結(jié)果。通過表1可知,雖然故障19的故障類型未知,但根據(jù)檢測結(jié)果可以推測出,故障19可能與局部變量發(fā)生變化有關(guān)??梢钥闯鯬CA、KPCA以及CHNMF算法的檢測準(zhǔn)確率普遍較低,而KCNMF方法因在數(shù)據(jù)非線性關(guān)系的處理以及局部特征的提取利用上面具有較大的優(yōu)勢,因此能夠表現(xiàn)出較高的檢測準(zhǔn)確率。 圖10 PCA方法的故障19檢測結(jié)果 圖11 KPCA方法的故障19檢測結(jié)果 圖12 CHNMF方法的故障19檢測結(jié)果 圖13 KCNMF方法的故障19檢測結(jié)果 表2中列出了對1-21種TE過程非線性數(shù)據(jù)分別使用三種故障檢測方法的檢測準(zhǔn)確率。其中核半非負(fù)矩陣分解算法(KSNMF)[22]提取的局部特征是數(shù)據(jù)云團(tuán)的聚類中心。表中結(jié)果比較可得,KSNMF和KCNMF這兩種方法的檢測都明顯優(yōu)于KPCA,這說明對于數(shù)據(jù)云團(tuán)局部信息的提取利用有助于故障數(shù)據(jù)的識別與檢測。而KCNMF方法相較于KSNMF方法檢測中結(jié)果表現(xiàn)更好,因?yàn)镵CNMF將偏離聚類中心的數(shù)據(jù)信息也考慮進(jìn)去,當(dāng)不同樣本聚類中心過于接近,以此為基礎(chǔ)的局部特征不具備良好的區(qū)分度,則邊緣數(shù)據(jù)所含信息對檢測會起到重要作用。對分解結(jié)果產(chǎn)生很大影響。KCNMF不再需要設(shè)置聚類中心的初始值,避免了迭代初始值和低維階次設(shè)定不準(zhǔn)確導(dǎo)致檢測結(jié)果存在誤差的情況出現(xiàn)??傮w來說,KCNMF對第一、二類故障數(shù)據(jù)整體檢測效果較好,而第三類故障檢測效果不佳,還需進(jìn)一步研究。 表2 KPCA、KSNMF和KCNMF方法故障檢測率比較 (%) 續(xù)表2 為解決高維非線性數(shù)據(jù)降維問題,并求取更有意義的樣本矩陣局部特征,本文提出了核凸非負(fù)矩陣分解算法。首先對數(shù)據(jù)集進(jìn)行核主元分析并對特征向量進(jìn)行縮放求得白化矩陣,利用白化矩陣對樣本方差進(jìn)行縮小或放大操作。接下來,對白化后的樣本矩陣進(jìn)行凸包非負(fù)矩陣分解。用凸包頂點(diǎn)作為局部特征所求得的故障檢測方法在關(guān)注數(shù)據(jù)集聚類中心之外,還充分利用了邊緣數(shù)據(jù)信息,能捕捉到其他方法捕捉不到的特征。流行正則化約束項(xiàng)又能保證分解過程中樣本矩陣的本質(zhì)不發(fā)生改變,這些算法的結(jié)合使得故障檢測更加準(zhǔn)確。本文利用TE過程數(shù)據(jù)集對KCNMF方法進(jìn)行仿真驗(yàn)證,取得了較好的診斷結(jié)果,并驗(yàn)證了所提方法的有效性。2.2 凸包非負(fù)矩陣分解算法
2.3 圖的基本理論
3 核凸非負(fù)矩陣分解的故障檢測方法
3.1 在KPCA空間進(jìn)行凸包非負(fù)矩陣分解
3.2 故障檢測統(tǒng)計(jì)量
3.3 基于核凸非負(fù)矩陣分解算法的故障檢測過程
4 仿真分析
4.1 實(shí)驗(yàn)數(shù)據(jù)
4.2 實(shí)驗(yàn)結(jié)果
5 結(jié) 語