王海龍,夏筱筠,孫維堂
(1. 中國科學(xué)院沈陽計算技術(shù)研究所,沈陽 110168; 2. 中國科學(xué)院大學(xué),北京 100049)
滾動軸承是機(jī)械設(shè)備中最常用的部件,同時也是很容易被損壞的部件,它的健康狀況對機(jī)器的穩(wěn)定性和壽命有很大的影響。因此滾動軸承的故障診斷被國內(nèi)外眾多學(xué)者所研究,提出了眾多的方法。一般的思路是,提取原始振動信號的特征,然后將特征向量作為輸入,通過各種分類器進(jìn)行分類識別。如于婷婷[1]提出時域特征和頻域特征作為BP神經(jīng)網(wǎng)絡(luò)輸入的診斷方法;楊宇等[2]提出將振動信號經(jīng)驗(yàn)?zāi)B(tài)分解后提取各頻帶能量作為特征參數(shù)的神經(jīng)網(wǎng)絡(luò)診斷方法。該思路的問題是所提出的特征具有人為主觀因素,并很難將故障特征完全反應(yīng)出來,因此難以達(dá)到很高的準(zhǔn)確度。
近年來,深度學(xué)習(xí)以其他方法不可比擬的優(yōu)勢,逐步的被引入到對軸承故障的診斷中來,并為之提供了新思路和新方法。單外平等[3]將深度信念網(wǎng)絡(luò)(DBN)引入軸承故障診斷中,并得出DBN可以直接通過原始數(shù)據(jù)對軸承故障進(jìn)行高效識別的結(jié)論。Wang等[4]提出了基于希爾伯特包絡(luò)譜和DBN的軸承故障診斷方法。衛(wèi)潔潔等[5]用深度神經(jīng)網(wǎng)絡(luò)對滾動軸承故障進(jìn)行診斷取得了比傳統(tǒng)方法更好的結(jié)果。
被廣泛應(yīng)用于模式識別領(lǐng)域的卷積神經(jīng)網(wǎng)絡(luò),以它獨(dú)有的優(yōu)勢,包括:局部感受野、權(quán)值共享以及池化,開始被引入滾動軸承的故障診斷中來。Lu等[6]將以時間序列重構(gòu)的二維矩陣作為CNN輸入診斷滾動軸承的故障,并驗(yàn)證了該方法在噪聲環(huán)境下的魯棒性。李恒等[7]提出基于短時傅里葉變換和卷積神經(jīng)網(wǎng)絡(luò)的軸承故障診斷方法。其核心思想是,如何將一維的故障振動信號轉(zhuǎn)化成適應(yīng)于CNN處理的二維矩陣數(shù)據(jù)。
本文提出了一種將EMD與卷積神經(jīng)網(wǎng)絡(luò)結(jié)合的方法。通過對振動信號進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解后,將分解的模態(tài)和原始振動數(shù)據(jù)組成的二維的特征圖作為CNN的輸入,對正常、內(nèi)圈故障、外圈故障及滾子故障的多種故障程度進(jìn)行診斷識別。實(shí)驗(yàn)結(jié)果表明,該方法具有很高的識別準(zhǔn)確度。
EMD方法是由Huang N E[8]于1998年提出的一種自適應(yīng)的對信號穩(wěn)定化處理的方法。它可以將信號中的不同尺度的波動或趨勢逐級分解出來,將信號細(xì)分為若干固有模態(tài)分量之和,非常適合非線性、非平穩(wěn)信號,目前已在機(jī)械故障診斷領(lǐng)域得到廣泛應(yīng)用。
分解過程在很多文獻(xiàn)中都有詳細(xì)介紹,可以參考[8]。其分解式為:
(1)
式中,ci為第i階IMF;r為殘差;n為IMF的階數(shù)[9]。通常該方法分解出來的前幾個IMF往往集中了原始信號中最顯著最重要的信息。
卷積神經(jīng)神經(jīng)網(wǎng)絡(luò)是一類包含卷積或相關(guān)計算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò)。它受視覺神經(jīng)機(jī)制的啟發(fā)而設(shè)計,通過建立多個濾波器提取輸入數(shù)據(jù)的特征。這些濾波器對輸入數(shù)據(jù)進(jìn)行逐層卷積和池化,不斷提取蘊(yùn)含在輸入數(shù)據(jù)中的特征。網(wǎng)絡(luò)層數(shù)越深入,提取到的特征越抽象,最終從原始輸入數(shù)據(jù)中得到具有平移、扭曲、縮放不變性的魯棒特征。CNN在圖像識別和目標(biāo)檢測方面被廣泛應(yīng)用,近年來也有部分學(xué)者將CNN 引入到故障診斷領(lǐng)域[10-12]。
一個典型的CNN網(wǎng)絡(luò)是由輸入層、卷積層、池化層、全連接層和輸出層組成。如圖1所示。
圖1 CNN結(jié)構(gòu)圖
卷積層是對輸入數(shù)據(jù)進(jìn)行特征提取的一層,由多個特征面組成,每個特征面由多個神經(jīng)元組成,每一個神經(jīng)元通過卷積核與上一層特征面的局部區(qū)域相連,該局部區(qū)域在文獻(xiàn)中被稱為感受野。卷積核是一個權(quán)值矩陣,它依次掃過前一層輸出的特征,并進(jìn)行卷積操作,利用激活函數(shù)可獲得卷積層中每個神經(jīng)元的輸出值,其數(shù)學(xué)模型可以描述為:
(2)
池化層通常接在一層或者多層的卷積層之后,旨在通過降低特征面的分辨率來獲得具有空間不變性的特征。它的泛化能力更強(qiáng),更不易產(chǎn)生過擬合。通過池化操作使得特征對噪聲和變形具有魯棒性。
在多個卷積層和池化層后,連接著一個或多個全連接層。全連接層中的每個神經(jīng)元與其前一層的所有神經(jīng)元進(jìn)行全連接。它有可以整合卷積層或池化層中具有類別區(qū)分的局部信息。通過丟失數(shù)據(jù)(dropout)技術(shù)避免訓(xùn)練過擬合。
將滾動軸承的振動數(shù)據(jù)切分成一定長度的樣本集,按一定比例隨機(jī)選取訓(xùn)練集與測試集。之后對每個樣本進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解,得到若干個模態(tài)分量。不同樣本長度經(jīng)驗(yàn)?zāi)B(tài)分解后的模態(tài)分量個數(shù)不同,一般樣本越長,模態(tài)分量個數(shù)越多。通常前幾個模態(tài)分量集中了原始信號中最顯著最重要的信息。如圖2是滾動軸承正常狀態(tài)下樣本長度為400的模態(tài)分解后的各模態(tài)分量。
將各個模態(tài)分量與原始振動信號一起構(gòu)成二維的特征圖,如樣本長度為400模態(tài)分量有5個,那么特征圖由400×6的矩陣表示,作為卷積神經(jīng)網(wǎng)絡(luò)的輸入。且大量的訓(xùn)練試驗(yàn)發(fā)現(xiàn),加入原始振動信號能得到更高的準(zhǔn)確率。
圖2 各模態(tài)分量
接下來調(diào)整CNN的結(jié)構(gòu)。因?yàn)镃NN實(shí)現(xiàn)過程實(shí)際上已經(jīng)包含了特征提取過程,并且層數(shù)越高,特征的表現(xiàn)形式也越抽象,能夠表示的特征空間也就越大,網(wǎng)絡(luò)學(xué)習(xí)能力也越強(qiáng),計算更復(fù)雜。
因此,在實(shí)際需要多次選取網(wǎng)絡(luò)深度、特征面數(shù)目、卷積核的大小和數(shù)目、池化層的大小及層數(shù)、全連接層的神經(jīng)元數(shù)目、卷積時滑動的步長、迭代次數(shù)、批次大小、激活函數(shù)及初始權(quán)重等參數(shù)。按照排列組合的方式不斷嘗試,直到找到一個分類準(zhǔn)確率夠好,同時訓(xùn)練時間可控的CNN結(jié)構(gòu)。其流程如圖3所示。
圖3 滾動軸承故障診斷流程圖
對于不同樣本長度的輸入,需要對CNN的結(jié)構(gòu)進(jìn)行重新調(diào)整,盡可能找出適合不同樣本長度的CNN結(jié)構(gòu)。隨著樣本長度的增加,往往需要更大的樣本集,更復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)。
采用美國凱斯西儲大學(xué)所公開的軸承試驗(yàn)數(shù)據(jù)進(jìn)行實(shí)驗(yàn)分析。電動機(jī)轉(zhuǎn)速為1730~1797 r/min,采樣頻率為12 kHz,故障種類包括內(nèi)圈、滾子和外圈,損傷直徑為0.07 mm、0.14mm及0.21mm,因此共10種故障分類,例如內(nèi)圈直徑0.07mm的故障類型是2。其編碼為[0,1,0,0,0,0,0,0,0,0]。每種分類樣本數(shù)約為300組。隨機(jī)選取80%作為訓(xùn)練集,20%作為測試集。
對如何確定CNN的結(jié)構(gòu)及參數(shù)還沒有明確的方法,需要不斷的調(diào)整參數(shù)來找出適合的值,很大程度上取決于經(jīng)驗(yàn)。本文在LetNet-5[13]基礎(chǔ)上,進(jìn)行了一些改變,找出了一個適應(yīng)于滾動軸承故障診斷的CNN模型。激活函數(shù)選擇修正線性單元(ReLU),它具有更加有效率的梯度下降以及反向傳播,較好的避免了梯度爆炸和梯度消失問題,并且由于偏導(dǎo)數(shù)簡單簡化了計算過程,同時活躍度的分散性使得神經(jīng)網(wǎng)絡(luò)整體計算成本下降。網(wǎng)絡(luò)結(jié)構(gòu)如表1所示。
表1 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
通過選取不同樣本長度進(jìn)行訓(xùn)練,發(fā)現(xiàn)樣本長度取400左右測試集準(zhǔn)確率最高,能達(dá)到99.5%,如圖4所示。
圖4 測試集樣本真實(shí)值與預(yù)測值
1代表正常軸承,以后依次表示內(nèi)圈、滾子及外圈故障在三種損傷直徑。多次試驗(yàn)發(fā)現(xiàn),幾乎不會對正常軸承錯誤診斷,錯誤診斷一般發(fā)生在對滾子故障診斷中。訓(xùn)練過程中訓(xùn)練集與測試集的準(zhǔn)確率及損失如圖5、圖6所示。
圖5 訓(xùn)練集與測試集準(zhǔn)
圖6 訓(xùn)練集及測試集的損失
可以看出,本方法只需要很少次數(shù)的迭代,便可以收斂得到很高準(zhǔn)確率且較小損失的結(jié)果。
多種方法各樣本長度準(zhǔn)確度對比如圖7所示。方法1為時域特征和頻域特征作為BP神經(jīng)網(wǎng)絡(luò)輸入的診斷方法,即取峭度、峰值因子、脈沖因子、裕度因子、波形因子、均方根頻率、頻率標(biāo)準(zhǔn)差這7個參數(shù)作為BP神經(jīng)網(wǎng)絡(luò)的特征輸入;方法2為振動信號經(jīng)驗(yàn)?zāi)B(tài)分解后提取各模態(tài)分量的能量作為特征參數(shù)的神經(jīng)網(wǎng)絡(luò)診斷方法;方法3為滾動軸承原始信號作為深度置信網(wǎng)絡(luò)輸入的診斷方法。
圖7 多種方法診斷結(jié)果對比
與方法1、方法2相比,本文提出的方法具有更高的識別準(zhǔn)確率,更加智能的特征提取避免了人為主觀因素的影響,更加適合處理大數(shù)據(jù)的故障診斷方法。方法3對深度置信網(wǎng)絡(luò)的結(jié)構(gòu)很難調(diào)整,容易出現(xiàn)過擬合,且識別的平均準(zhǔn)確率不如本文所提出的方法高。綜上對比可以看出,本文提出的方法是對滾動軸承故障檢測的有效方法。
基于EMD和CNN的滾動軸承故障診斷方法,利用CNN可以直接從低層到高層逐層智能學(xué)習(xí)得到很好的特征表示,避免了人為對特征的提取與選擇增強(qiáng)了識別過程的智能性。并且CNN是一種數(shù)據(jù)驅(qū)動的故障診斷方法,隨著數(shù)據(jù)量的增大,它的故障模式能表達(dá)的更完整,診斷的效果也就越好。結(jié)合EMD方法,能夠很好對滾動軸承的各種故障進(jìn)行分類和識別。實(shí)驗(yàn)結(jié)果表明通過增加訓(xùn)練樣本的數(shù)量可以提高該方法的魯棒性,更加適合處理針對大數(shù)據(jù)的故障診斷。