崔韋達,李澤滔
(貴州大學電氣工程學院,貴州 貴陽 550025)
故障診斷技術由來已久,它最主要的目的是找到故障的發(fā)生位置,然后將這個位置的故障進行整理和排除,最后使機器正常運行。由于前人已對機器運行的故障有了充足的數(shù)據(jù)累計和調(diào)查基礎,于是基于知識的數(shù)據(jù)驅(qū)動診斷方法應運而生。故障診斷技術是在20世紀70年代由美國率先提出的,在建立之初的目的是為了更加順利的實施阿波羅登月計劃,節(jié)約機械故障所產(chǎn)生的成本。1971年, 在Automatica上,Mehra和 Peschon[1]發(fā)表的關于對多余故障的分析檢測方面的研究被認為是人類對故障診斷技術的一個初步探討。
近30年來,故障診斷技術逐步被運用于工程機械,車輛,船舶,飛機制造等復雜的機械系統(tǒng)上。然而隨著時代的發(fā)展,基于經(jīng)典控制理論和現(xiàn)代控制理論的傳統(tǒng)故障診斷方法往往不能滿足現(xiàn)實機械系統(tǒng)的需要。傳統(tǒng)的故障診斷方法通常是專業(yè)技術人員到機械故障現(xiàn)場進行實際觀察并運用所掌握的知識經(jīng)驗進行維修,這些一般是在機械發(fā)生故障之后才可以進行的。為了減少這些故障所產(chǎn)生的不必要的損失,同時利用好機械系統(tǒng)故障過程所產(chǎn)生的數(shù)據(jù)。一種將研究數(shù)據(jù)處理和故障診斷的方式連系起來的數(shù)據(jù)驅(qū)動故障診斷方式被提了出來。李晗等[2]將這種數(shù)據(jù)驅(qū)動故障診斷的方法分成三類,分別是基于定量經(jīng)驗的,基于神經(jīng)算法和基于模糊控制的三個方面的。
本文主要基于定量知識的數(shù)據(jù)驅(qū)動方法從三個方面來引申出當代較為領先的數(shù)據(jù)驅(qū)動故障診斷方法,并整理這三個方面的關系。
基于神經(jīng)網(wǎng)絡故障診斷方法的原理通常是利用大量已知的數(shù)據(jù)建立起故障分類和識別的映射,通過訓練這種映射來產(chǎn)生一種數(shù)學模型。近些年,很多人將神經(jīng)網(wǎng)絡和現(xiàn)代人工智能深度學習方法集合起來研究故障診斷的方法。本文將通過卷積神經(jīng)網(wǎng)絡、BP神經(jīng)網(wǎng)絡和RBF神經(jīng)網(wǎng)絡來介紹當今比較前沿的基于神經(jīng)網(wǎng)絡數(shù)據(jù)的故障診斷方法。
20世紀60年代,Huble和Wiesel[3]在對貓的大腦進行研究的時候,發(fā)現(xiàn)了一種神經(jīng)的反饋結(jié)構可以在降低誤差的同時減少對誤差分析的代價,他們將這些實驗數(shù)據(jù)進行分析,提出了卷積神經(jīng)網(wǎng)絡的算法。隨后的K.Fukushima[4]在1980年制作出來一種識別機,第一次將卷積神經(jīng)網(wǎng)絡的理論用實驗實現(xiàn)了出來。由于卷積神經(jīng)網(wǎng)絡具有前饋控制系統(tǒng)的特殊性,常常被用作對大量像素點的分類和識別。而今,卷積神經(jīng)網(wǎng)絡也應用在了數(shù)據(jù)驅(qū)動故障診斷的范圍中,主要是由卷積層和池化層構成,但是有些卷積神經(jīng)網(wǎng)絡為了滿足研究的需要通常還擁有輸入層、激活函數(shù)、全連接層,等等。
卷積神經(jīng)網(wǎng)絡輸入層的作用一般是對故障進行數(shù)據(jù)化處理,在輸入層采取各類的計算算法可以提高對故障診斷的精確度。激活函數(shù)的作用是將故障數(shù)據(jù)提供一個強度的范圍,如果沒有達到激活函數(shù)給故障數(shù)據(jù)定下的最低閥值的話,則輸出為0。這有效的減少了與故障特征無關的數(shù)據(jù)對卷積神經(jīng)訓練的干擾。卷積層在卷積升降網(wǎng)絡中的學習不是顯性的,同時,通道大小和計算復雜的程度也注定了它不能提取全局的特征,因此它只能提取部分特征進行研究。池化層主要就是將從上一個數(shù)據(jù)學習過程卷積層送過來的數(shù)據(jù)進行壓縮,并提取有效特征來簡化計算。卷積神經(jīng)網(wǎng)絡的全連接層是將部分的故障特征進行統(tǒng)一和整合,并送給分類器來更精確的完成對故障的識別。然而,卷積神經(jīng)網(wǎng)絡適用的數(shù)據(jù)比較小,同時訓練時間比較久,運算比較復雜且沒有可移植性。因此只有通過對卷積神經(jīng)網(wǎng)絡進行優(yōu)化才能對大量的故障擁有良好的效果。
近些年,一些和卷積神經(jīng)網(wǎng)絡結(jié)合的基于數(shù)據(jù)的故障研究成果在國內(nèi)不斷顯現(xiàn)。山東大學的李強[5]將希爾伯特黃算法和卷積神經(jīng)網(wǎng)絡結(jié)合起來,針對水利發(fā)電系統(tǒng)提出了一種數(shù)據(jù)驅(qū)動故障診斷的方法。電子科技大學的韋冬東[6]將深度學習和卷積神經(jīng)網(wǎng)絡結(jié)合起來,對變速工況下的行星齒輪箱太陽輪故障進行了分析研究,發(fā)現(xiàn)了小齒輪卷積核在較深的網(wǎng)絡中可以得到最好的效果。東南大學的孫文珺[7]對卷積的實驗特點進行嘗試。即通過對有限的故障浮標進行判別,并對感應電機的故障浮標進行高效的神經(jīng)網(wǎng)絡學習,最后利用這些浮標來診斷系統(tǒng)的故障。哈爾濱工業(yè)大學的張偉[8]將一維卷積結(jié)合誤差反向傳播和Adam優(yōu)化算法數(shù)據(jù)增強等方式應用在了軸承的數(shù)據(jù)中,取得了良好的實驗效果。北京交通大學的趙晶晶[9]將卷積神經(jīng)網(wǎng)絡應用在了計算機網(wǎng)絡的故障診斷中,這也是今后可以研究的一個方向。
BP算法是19世紀80年代美國智能控制團隊Rumelhart等人在結(jié)合前人研究的卷積神經(jīng)網(wǎng)絡的基礎發(fā)展出來的。與卷積神經(jīng)網(wǎng)絡不同,BP算法的前饋網(wǎng)絡不是單層的,這更有利于BP算法減少誤差和增加系統(tǒng)的穩(wěn)定性。同時,BP算法將它的偏差進行反向的傳遞,在傳播的過程中通過對梯度進行偏方差求導遞減的方式來調(diào)整傳遞過程中各個神經(jīng)元的權值。BP算法主要由三個部分組成[10],部分計算變量的關系和計算順序的方法如圖1所示。
圖1 BP神經(jīng)網(wǎng)絡算法流程圖Fig.1 BP neural network algorithm flow chart
BP算法的數(shù)學關系同樣不是顯式的,不需要推導出公式。但需要通過訓練神經(jīng)元將誤差調(diào)整到能夠接受的范圍內(nèi)并得到這個范圍內(nèi)各個神經(jīng)元的權值即可。同時,BP算法的計算也并不是單向的,在保持前向神經(jīng)元的正常進行時,BP的誤差需要反向傳播,在隱含層中一般是Sigmoid函數(shù),在這里提到Sigmoid函數(shù)也是為了為下一種方法提出準備。
在公式(1)中我們可以得到這個信息,Sigmoid函數(shù)收斂速度比較慢,同時Sigmoid函數(shù)在長時間計算后,不能得到正常的梯度值,因此能正確的得到訓練的權值。
BP算法雖然能達到減少誤差的目的,但它也有很多缺點。從上面的函數(shù)可以看出,卷積神經(jīng)網(wǎng)絡的學習速度有待提高,同時當一個函數(shù)有多個最小值時,BP算法不能夠判別出整個系統(tǒng)的極小值,這對一個系統(tǒng)整體來說也是相當致命的。當代有很多人對BP網(wǎng)絡和數(shù)據(jù)驅(qū)動故障診斷進行整合和優(yōu)化的研究。
電子科技大學的謝昭靈[11]將遺傳粒子群用于優(yōu)化BP算法來對壓縮機氣閥進行研究,實驗表明這種算法對壓縮機氣閥的故障診斷擁有著可行性和有效性。東北電力大學的宗憲爽[12]將BP神經(jīng)網(wǎng)絡運用在了光伏陣列的故障診斷方向,達到了95%以上的準確率。艾劍良等[13]提出一種結(jié)合比例因子和動量因子的BP神經(jīng)網(wǎng)絡并應用在航空發(fā)動機來解決局部最小的問題。
RBF神經(jīng)網(wǎng)絡方法是Broomhead和Lowe[14]在19世紀80年代末首次提出的,它們在論文中將RBF神經(jīng)網(wǎng)絡和傳統(tǒng)插值進行對比,從而提出一種三層的RBF神經(jīng)網(wǎng)絡。RBF神經(jīng)網(wǎng)絡與BP算法的結(jié)構相同也是由三個部分構成的,它們分別是輸入層、隱含層和輸出層。它們主要的不同是RBF神經(jīng)網(wǎng)絡在隱含層采用的激活函數(shù)是高斯基函數(shù),與BP神經(jīng)網(wǎng)絡算法進行對比,RBF神經(jīng)算法是一種部分逼近的神經(jīng)元網(wǎng)絡??梢哉f,幾個RBF神經(jīng)網(wǎng)絡組合起來,就可以看做一個BP神經(jīng)網(wǎng)絡。由于BP算法計算的是全局逼近的神經(jīng)網(wǎng)絡,容易陷入局部最小的狀況,且每一次學習都要調(diào)整神經(jīng)元的權值,因此RBF神經(jīng)網(wǎng)絡才能夠有取代BP神經(jīng)網(wǎng)絡的趨勢。然而,在要求相同神經(jīng)網(wǎng)絡的計算精度時,BP算法神經(jīng)網(wǎng)絡的隱含層往往更加的簡單。因此,只有在簡單系統(tǒng)且不需要考慮局部最小時BP是優(yōu)于RBF神經(jīng)網(wǎng)絡的。
近些年來,和RBF結(jié)合的數(shù)據(jù)驅(qū)動故障診斷也開始興起。王代超[15]將粒子群優(yōu)化和小波分析與RBF神經(jīng)網(wǎng)絡結(jié)合來對進行研究柴油機的故障,體現(xiàn)了其方法的高效和低誤判率。劉景燕等[16]將RBF與自適應遺傳算法對變壓器進行故障診斷的研究,提高了方法的自適應性和準確度。王婷等[17]將粒子群進行混合,并優(yōu)化RBF算法來對瓦斯傳感器進行分析,通過一系列的實驗證明了這種混合算法的可行性。
19世紀90年代末,在美國貝爾實驗室里Vapnik等人成功的研發(fā)出了一種新的學習方法,即支持向量機的機器學習算法。支持向量機是一種基于統(tǒng)計學的二類分類算法,在數(shù)據(jù)處理的本質(zhì)上就是將一堆數(shù)據(jù)分成兩個不同的類別。在分類上,支持向量機可以像我們學習數(shù)學的函數(shù)同樣的方式分為三種:線性、類似線性和非線性。當然部分線性可以用多個向量機進行疊加,通過以上三種的結(jié)合我們可以用支持向量機解決很多數(shù)據(jù)分類的相關問題。在這里,我們在數(shù)據(jù)驅(qū)動的故障診斷中一般解決的都是近似非線性或者非線性的問題,因此在本文中我們主要介紹近似線性和非線性的問題。
支持向量機的本質(zhì)就是找到一個平面,并且這個平面要將兩種數(shù)據(jù)用盡可能最優(yōu)的方式隔離出來。通過這種方法求得的平面,通常被稱為超平面,超平面才是我們要求的支持向量機的分類平面。在求解線性支持向量機時,求解過程往往就會演變成一個求二次規(guī)劃的問題。
近似支持向量機由于有部分異常點,我們僅僅需要設置滿足系統(tǒng)的松弛因子和代價項將異常的故障點排除,然后將剩下的故障點按照線性支持向量機的方法進行分類即可。然而當我們處理非線性支持向量機時就需要引進核函數(shù)來將數(shù)據(jù)有效的分類,引進的核函數(shù)一般為多項式核函數(shù)、Sigmoid函數(shù)、高斯函數(shù)等等。
近些年來基于支持向量機和人工智能的算法結(jié)合的研究也在數(shù)據(jù)驅(qū)動故障診斷的領域開始發(fā)展。呂鋒等[19]研究了一種數(shù)據(jù)描述方法用來和支持向量機方法進行結(jié)合,有效的提高了故障判別的準確性。吳映華等[20]將利用蜂群算法對支持向量機的學習過程進行改進和優(yōu)化,提高了對故障軸承的識別率。劉榮海[21]提出一種將經(jīng)驗模態(tài)分解成熵并和向量機共同對高壓變路器進行分析,提供給了我們一種基于數(shù)據(jù)故障分析的新思路。
19世紀70年代中期,英國科學家E.H.Mamdani初次利用模糊數(shù)學的理論編寫出了模糊控制代碼,并成功應用,這標志著模糊控制理論的誕生。模糊控制主要是針對一些無法利用數(shù)學模型來完好表達的故障通過模糊集合、模糊邏輯和模糊定理來進行分析的一種技術。在現(xiàn)代一般和機器學習相結(jié)合組成作為模糊控制系統(tǒng)來研究,比如神經(jīng)模糊控制網(wǎng)絡、支持向量機模糊控制等等。近些年,有些人利用模糊控制的數(shù)學知識針對擁有大量數(shù)據(jù)樣本的故障進行了分析研究。沈曉峰[22]將模糊控制和神經(jīng)網(wǎng)絡結(jié)合起來,對供熱管網(wǎng)故障損壞程度進行了診斷分析取得良好的實驗效果。馬志垚[23]將模糊控制和系統(tǒng)自適應的理論研究方法有機的結(jié)合了起來,同時在數(shù)據(jù)中驗證了其有效性。
本文對近些年出現(xiàn)的基于知識的數(shù)據(jù)驅(qū)動故障診斷方法進行了介紹和研究,通過分析和比較可以得知,RBF方法是目前基于數(shù)據(jù)驅(qū)動故障診斷的關于神經(jīng)網(wǎng)絡計算方式中較好的方法。此外,例如將比例和動量因子相結(jié)合的BP神經(jīng)網(wǎng)絡算法,也有取代RBF方法的可能性,因此人工智能算法結(jié)合傳統(tǒng)的BP算法、卷積神經(jīng)網(wǎng)絡算法在近些年的研究也越來越重要?;谙蛄繖C的數(shù)據(jù)驅(qū)動故障診斷研究已經(jīng)不僅僅局限于對一個或幾個超平面進行分類研究,更多的是和蟻群、經(jīng)驗模態(tài)等統(tǒng)計方法相結(jié)合用來提高故障診斷結(jié)果的精確度。基于模糊控制的數(shù)據(jù)驅(qū)動故障診斷方法也不僅僅停留在數(shù)學和代碼的意義上,而是和自適應,神經(jīng)網(wǎng)絡進行交叉融合來解決非線性的故障診斷問題。同時隨著人工深度學習的進一步發(fā)展,隨機森林和回歸算法也開始在數(shù)據(jù)驅(qū)動故障診斷的方向運用,結(jié)合并優(yōu)化這些新興算法是未來非常值得探究的一個課題。