王云會(huì),楊 杰,楊佳琳
(京能集團(tuán)北京京西燃?xì)鉄犭娪邢薰?,北?100041)
自動(dòng)控制水平的提高對(duì)生產(chǎn)系統(tǒng)的故障診斷技術(shù)提出了更高的要求。傳感器故障是致使系統(tǒng)異常的常見因素之一,而故障信息的特征提取是診斷識(shí)別的關(guān)鍵技術(shù)。本研究將類均值核主元分析應(yīng)用到故障診斷中,分析不同核函數(shù)的選取對(duì)判斷結(jié)果的影響。類均值核主元分析脫胎于周東華等[1-2]的豐富研究。主元分析是把相關(guān)變量數(shù)據(jù)轉(zhuǎn)換成部分無關(guān)變量數(shù)據(jù)的分析方法,但是不能解決非線性問題。因此,Scholkopf等[3]提出了核主元分析,不僅能處理非線性數(shù)據(jù),而且其計(jì)算復(fù)雜度由輸入數(shù)據(jù)空間的維數(shù)決定。彭紅星等[4]提出了基于核的主成分分析(Kernel Principal Component Analysis,KPCA)的非線性過程的監(jiān)控方法,成功應(yīng)用于廢水處理過程的檢測(cè),然而,該方法存在損失部分?jǐn)?shù)據(jù)樣本信息的缺點(diǎn)。因而,針對(duì)這一問題,一種被叫作類均值核主元分析的新方法被提出[5],它在原始數(shù)據(jù)非線性映射到高維空間后,先求出映射數(shù)據(jù)的類均值矢量,再進(jìn)行核主元分析,構(gòu)建類均值核主元,使之包含了數(shù)據(jù)樣本的全部信息,降低數(shù)據(jù)維度的同時(shí)實(shí)現(xiàn)無損。類均值核主元分析已在故障診斷研究中有所應(yīng)用[6-8],本文的目的在于探究不同核函數(shù)對(duì)故障診斷結(jié)果的影響,分別從故障識(shí)別和故障判斷角度進(jìn)行實(shí)驗(yàn),即將類均值核主元分析與BP神經(jīng)網(wǎng)絡(luò)結(jié)合[9-10],對(duì)比不同核函數(shù)下特征提取對(duì)故障識(shí)別率的作用。此外,計(jì)算T2和SPE統(tǒng)計(jì)量,比較故障判斷的準(zhǔn)確性和即時(shí)性。文章闡述了類均值核主元分析的基本原理,并在此基礎(chǔ)上介紹核參數(shù)優(yōu)化方法和實(shí)踐步驟,對(duì)不同核函數(shù)進(jìn)行仿真實(shí)踐,通過總結(jié)分析發(fā)現(xiàn),經(jīng)粒子群優(yōu)化后的混合模型在準(zhǔn)確性和即時(shí)性方面更為優(yōu)越。
設(shè)C的特征值μ對(duì)應(yīng)特征向量為v,則有:
其中,D表示類均值核矩陣,且D為對(duì)稱矩陣。將矩陣D代入式(5),化簡(jiǎn)得:
若類均值矢量均值不等于零,則需要對(duì)其進(jìn)行中心化處理得到Dˉ,則有:
1.2.1 核函數(shù)選取和優(yōu)化
分析類均值核主元的步驟可知,核函數(shù)的選取決定核主元的最終形式,不需要對(duì)數(shù)據(jù)進(jìn)行非線性映射操作,只需要選擇滿足條件的核函數(shù)即可。常用的核函數(shù)包括:多項(xiàng)式核函數(shù)、高斯徑向基核函數(shù)、神經(jīng)網(wǎng)絡(luò)核函數(shù)等。本文中采用多項(xiàng)式核函數(shù)、高斯徑向基核函數(shù)及其混合核函數(shù)作比較,分析優(yōu)越性。
多項(xiàng)式核函數(shù):
高斯徑向基核函數(shù):
混合核函數(shù):
在核參數(shù)的應(yīng)用中,分別存在d,σ,ρ3個(gè)未知參數(shù),人為經(jīng)驗(yàn)的設(shè)定對(duì)最終的判斷結(jié)果存在巨大的影響,本文通過粒子群優(yōu)化算法(Particle Swarm Optimization,PSO,PSO)尋找各個(gè)核函數(shù)在類均值核主元分析中的最優(yōu)參數(shù)設(shè)置,其算法流程如下:(1)初始化種群。(2)計(jì)算各個(gè)粒子的種群適應(yīng)度,求出個(gè)體極值和全體極值。(3)更新速度和位置。(4)判別結(jié)束條件,若不滿足,返回上一步繼續(xù)執(zhí)行。
1.2.2 故障類型識(shí)別方法
本文采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行故障類型識(shí)別的分類方法。BP神經(jīng)網(wǎng)絡(luò)是一種按誤差反向傳播訓(xùn)練的多層前饋網(wǎng)絡(luò),其算法稱為BP算法,基本思想是采用梯度下降法,使網(wǎng)絡(luò)的實(shí)際輸出值和期望輸出值的誤差均方差最小。結(jié)構(gòu)如圖1所示。
由于基于跨境電商平臺(tái)能實(shí)現(xiàn)了單個(gè)企業(yè)之間或單個(gè)企業(yè)與單個(gè)消費(fèi)者之間的交易,所以它已然成為外貿(mào)企業(yè)的轉(zhuǎn)型的創(chuàng)新途徑(任志新、李婉香,2014)。同時(shí),聶林海(2014)也指出電子商務(wù)一方面可以帶動(dòng)傳統(tǒng)企業(yè)加快轉(zhuǎn)型升級(jí),也能為中小企業(yè)進(jìn)入大市場(chǎng)提供更好助力,并為其創(chuàng)造更多的貿(mào)易機(jī)會(huì)和發(fā)展空間;另一方面,它也能成為企業(yè)開拓海外市場(chǎng)的利器。互聯(lián)網(wǎng)市場(chǎng)和實(shí)體市場(chǎng)協(xié)同融合發(fā)展將成為世紀(jì)經(jīng)濟(jì)發(fā)展的必然趨勢(shì)。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
BP神經(jīng)網(wǎng)絡(luò)擁有很強(qiáng)的非線性映射能力、自學(xué)習(xí)和自適應(yīng)能力,實(shí)質(zhì)上實(shí)現(xiàn)了一個(gè)從輸入到輸出的高維映射功能,正好映射了類均值核主元分析法中的高維映射過程。具有3層及以上的BP神經(jīng)網(wǎng)絡(luò)能夠以任意精度逼近任何非線性連續(xù)函數(shù)。BP神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時(shí),能夠通過不斷地更新并自動(dòng)提取輸出、輸出數(shù)據(jù)間的“合理規(guī)則”,自適應(yīng)地通過網(wǎng)絡(luò)的權(quán)值調(diào)整來逼近期望結(jié)果。上述兩點(diǎn)能保證其作為類均值核主元分析法中故障類型識(shí)別方法的合理性。
1.2.3 算法步驟
在進(jìn)行故障診斷時(shí),一方面,利用類均值核主元分析處理實(shí)驗(yàn)數(shù)據(jù),實(shí)現(xiàn)無損降維;另一方面,通過前者提取出的主元特征映射得到新數(shù)據(jù)集,采用BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練優(yōu)化,得到診斷模型。整個(gè)步驟中,變參數(shù)是作為核心的核函數(shù)被選取的,改變核函數(shù)的種類并通過PSO優(yōu)化得到最佳參數(shù),進(jìn)行實(shí)驗(yàn)對(duì)比,具體步驟如下:
(1)對(duì)數(shù)據(jù)樣本進(jìn)行去噪、平滑、標(biāo)準(zhǔn)化處理。
(2)應(yīng)用PSO算法優(yōu)化3種核參數(shù),分別就不同核參數(shù)進(jìn)行類均值核主元分析,計(jì)算類均值矩陣,并對(duì)其進(jìn)行中心化處理。
(3)計(jì)算中心化后的核矩陣的特征值和特征向量,并計(jì)算特征向量在特征空間上的投影,得到降維后的樣本數(shù)據(jù)集Q=H×X,其中,X為處理后的數(shù)據(jù)集,H為由核主元組成的特征矢量。
(4)確定網(wǎng)絡(luò)的輸入,將被檢測(cè)的故障狀態(tài)進(jìn)行編碼和樣本訓(xùn)練,計(jì)算各神經(jīng)元之間的權(quán)值。
(5)用訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行故障識(shí)別。
以圖2中上下水箱液位以及相關(guān)的控制器、執(zhí)行器輸出指令作為檢測(cè)變量,模擬各故障狀況,獲取實(shí)驗(yàn)數(shù)據(jù)。取各故障的前1 000組數(shù)據(jù)作為訓(xùn)練樣本,剩下的500組數(shù)據(jù)作為測(cè)試樣本,并對(duì)故障類型進(jìn)行獨(dú)熱編碼,輸出節(jié)點(diǎn)如表1所示。
圖2 實(shí)驗(yàn)平臺(tái)
表1 故障診斷網(wǎng)絡(luò)訓(xùn)練樣本目標(biāo)輸出編碼
續(xù)表1
通過粒子群優(yōu)化算法尋找各個(gè)核函數(shù)在類均值核主元分析中的最優(yōu)參數(shù)設(shè)置,所優(yōu)化核參數(shù)如表2所示。
表2 核參數(shù)優(yōu)化結(jié)果
針對(duì)上述3種核函數(shù)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果(即故障識(shí)別對(duì)比結(jié)果)如圖3所示。
圖3 3種核函數(shù)的故障識(shí)別對(duì)比結(jié)果
可以直觀看到,當(dāng)傳感器發(fā)生漂移、超限、恒增益、恒偏差、失效和斷線故障6種故障時(shí),上述3種核函數(shù)經(jīng)粒子群算法優(yōu)化核參數(shù)后都能以不低于90%的識(shí)別率準(zhǔn)確診斷出故障類型。高斯徑向基核函數(shù)在漂移、超限和恒偏差故障的特征提取中有優(yōu)勢(shì),多項(xiàng)式核函數(shù)在其余3種故障的診斷中有優(yōu)勢(shì)。而混合核函數(shù)則結(jié)合二者的優(yōu)點(diǎn),其診斷結(jié)果明顯優(yōu)于單一一種核函數(shù)的結(jié)果。
為進(jìn)一步驗(yàn)證混合核函數(shù)的優(yōu)越性,分別計(jì)算T2和SPE統(tǒng)計(jì)量,判別故障的發(fā)生的原因。其中,T2統(tǒng)計(jì)量反映了每個(gè)主成分在變化趨勢(shì)和幅值上偏離模型的程度,是對(duì)模型內(nèi)部化的一種度量,可以用來對(duì)多個(gè)主元同時(shí)進(jìn)行監(jiān)測(cè);SPE統(tǒng)計(jì)量刻畫了輸入變量的測(cè)量值對(duì)主元模型的偏離程度,是對(duì)模型外部變化的一種度量。結(jié)果如表3所示。
表3 故障診斷結(jié)果
表3中數(shù)據(jù)表示,在采集正常情況下的數(shù)據(jù)點(diǎn)800個(gè)(訓(xùn)練分類器用)之后,開始模擬6種故障的發(fā)生。表3中數(shù)值即為通過兩個(gè)統(tǒng)計(jì)量指標(biāo)檢測(cè)出當(dāng)前正確顯示故障原因的時(shí)刻,顯然,數(shù)值越靠近800表示越能及時(shí)發(fā)現(xiàn)故障。
通過對(duì)比表3中數(shù)據(jù)可以看出,采用混合核函數(shù)時(shí),對(duì)漂移故障、恒增益故障以及恒偏差故障的檢測(cè)及時(shí)性明顯快于其他兩種核函數(shù),分別提高了32次、35次和44次(和相對(duì)好的一種結(jié)果相比)。
本文針對(duì)工業(yè)工程中常見的傳感器故障類型(超限、失效、斷線、漂移、恒增益和恒偏差故障),利用類均值核主元分析法對(duì)其進(jìn)行診斷。分別利用3種核函數(shù)不同的故障類型是否發(fā)生進(jìn)行診斷。結(jié)果顯示,3種核函數(shù)對(duì)超限故障、失效故障和斷線故障具備相近的檢測(cè)能力,而對(duì)于漂移故障、恒增益故障和恒偏差故障,混合核函數(shù)的應(yīng)用具有更高的準(zhǔn)確性和及時(shí)性。進(jìn)而通過與BP神經(jīng)網(wǎng)絡(luò)結(jié)合證明故障識(shí)別的準(zhǔn)確性,通過T2和SPE統(tǒng)計(jì)量證明故障診斷的及時(shí)性。