潘成龍, 應(yīng)雨龍
(上海電力大學(xué) 能源與機(jī)械工程學(xué)院, 上海 200090)
滾動軸承作為旋轉(zhuǎn)機(jī)械設(shè)備(如渦輪機(jī)、發(fā)電機(jī)等)的重要零部件,由于其本身的磨損、變形等損傷所引起的設(shè)備故障占機(jī)械設(shè)備故障的50%[1]。在設(shè)備實(shí)時(shí)運(yùn)行中,實(shí)時(shí)故障診斷可以在最大程度上減少重大事故的發(fā)生[2]。軸承故障診斷方法的基本原理就是從軸承設(shè)備端所采集到的數(shù)據(jù)中提取信號的特征并且進(jìn)行分類,從而實(shí)現(xiàn)對設(shè)備的故障檢測。
2016年之前,基于應(yīng)用統(tǒng)計(jì)學(xué)的傳統(tǒng)機(jī)器學(xué)習(xí)方法,例如基于支持向量機(jī)的風(fēng)險(xiǎn)最小化原理的故障診斷方法[3]、基于人工神經(jīng)網(wǎng)絡(luò)的故障診斷系統(tǒng)[4],作為當(dāng)時(shí)極其有效且流行的方法,得到了廣泛的應(yīng)用[5]。
近年來,隨著機(jī)械設(shè)備的監(jiān)測傳感器所采集的數(shù)據(jù)變得越來越多樣化、抽象化和復(fù)雜化[6]。以往傳統(tǒng)故障診斷方法在時(shí)效性和識別準(zhǔn)確率方面差強(qiáng)人意,但基于深度學(xué)習(xí)[7]的神經(jīng)網(wǎng)絡(luò),例如深度置信網(wǎng)絡(luò)、堆疊稀疏自編碼器[8]和卷積神經(jīng)網(wǎng)絡(luò),有著眾多隱含層,具有很強(qiáng)的自主學(xué)習(xí)能力,在復(fù)雜數(shù)據(jù)集上有很大的優(yōu)勢[9]。其中,卷積神經(jīng)網(wǎng)絡(luò)可以通過逐層學(xué)習(xí)故障信號,自適應(yīng)提取特征值[10-12],并且隨著模型網(wǎng)絡(luò)深度的提升,特征學(xué)習(xí)和故障分類的效果也會相應(yīng)地提高,但在時(shí)效性上可能會略有損失[13]。卷積神經(jīng)網(wǎng)絡(luò)以原始信號作為輸入,不需要進(jìn)行特征提取,從而達(dá)到端到端的故障診斷,不需要額外進(jìn)行去噪聲處理,解決了工作噪聲對故障識別的影響[14]。卷積神經(jīng)網(wǎng)絡(luò)在故障識別方面可以極大地減少人為提取信號特征的步驟,但是以往的卷積網(wǎng)絡(luò)故障診斷模型在滾動軸承的運(yùn)行載荷發(fā)生改變的情況下,故障診斷的準(zhǔn)確率與實(shí)時(shí)性并不理想。
因此,本文提出了一種在軸承運(yùn)行載荷發(fā)生改變時(shí),可以對其故障進(jìn)行準(zhǔn)確且有效診斷的二維卷積神經(jīng)網(wǎng)絡(luò)模型。該模型可以實(shí)現(xiàn)對故障進(jìn)行端到端檢測,僅需輸入原始數(shù)據(jù),無需人工提取特征向量,減少了特征提取過程中的損失,提高了模型診斷的準(zhǔn)確性,整個故障診斷過程都是在模型當(dāng)中進(jìn)行自適應(yīng)學(xué)習(xí)、訓(xùn)練和診斷。該模型的數(shù)據(jù)預(yù)處理方法在原始一維信號轉(zhuǎn)化為二維信號時(shí),無需額外定義任何參數(shù),減少了以往專家經(jīng)驗(yàn)對數(shù)據(jù)信號轉(zhuǎn)化過程的損失。另外,構(gòu)建模型時(shí),可以使特征信號在梯度下降后自適應(yīng)優(yōu)化權(quán)重參數(shù),增加故障診斷的識別準(zhǔn)確率。最后,根據(jù)多次試驗(yàn)數(shù)據(jù)和結(jié)果證明該故障診斷模型的有效性和準(zhǔn)確性。
在一維卷積神經(jīng)網(wǎng)絡(luò)中,往往需要至少1 024或2 048個數(shù)據(jù)點(diǎn)[15]來完成特征提取和數(shù)據(jù)識別,使得其在故障診斷的時(shí)效性方面略有不足,而且在運(yùn)行載荷發(fā)生變化的變工況狀態(tài)下,無法進(jìn)行有效且準(zhǔn)確的診斷。
相對于普通一維卷積神經(jīng)網(wǎng)絡(luò),二維卷積神經(jīng)網(wǎng)絡(luò)可以通過較少的樣本量全面反映滾動軸承的故障狀態(tài),而且耗時(shí)也會減少。為了在軸承的運(yùn)行載荷發(fā)生改變時(shí)對軸承故障進(jìn)行有效及準(zhǔn)確的診斷,對變工況下的二維卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行構(gòu)造。二維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 二維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
該故障診斷模型僅需要420個數(shù)據(jù)點(diǎn)作為一個樣本點(diǎn),大大縮短了故障診斷的時(shí)間。將軸承工況變量作為輸入信號,包含在420個數(shù)據(jù)點(diǎn)當(dāng)中,增加其對變工況故障診斷的有效性和準(zhǔn)確性。在模型中設(shè)置5層卷積層,最后3層卷積與池化層逐步完善特征信號的提取,其中輸入層的尺寸為20×21。為了提取數(shù)據(jù)集中的特征信號,降低信號維度,模型中5層卷積層與3層池化層互相交替,在輸入層與第1層卷積層之間的卷積核大小設(shè)置為5×5×1,在自適應(yīng)提取特征信號的同時(shí)降低維度,減少模型的學(xué)習(xí)和訓(xùn)練時(shí)間,第2層卷積層中的卷積核大小為5×5×32,從第4層卷積層開始,模型當(dāng)中的卷積核從第3層卷積層中的3×3×32變成為3×3×64;3層池化層的尺寸與步長相同,分別為3×3和2;在進(jìn)入全連接層和最后一層激活函數(shù)Softmax之前,通過過渡層,形狀(4,4,64)的輸出被展平為形狀64的向量,第11層為全連接層,其中包含了64個節(jié)點(diǎn);通過模型最后一層的Softmax分類器完成對變工況下4種故障類型、3種嚴(yán)重程度共44種故障類型的分類。
本文構(gòu)建的二維卷積神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)參數(shù)如表1所示。
表1 變工況下模型結(jié)構(gòu)參數(shù)
模型采用RMSProp優(yōu)化器。其數(shù)學(xué)模型可表達(dá)為
(1)
式中:vt——梯度平方在t時(shí)刻的指數(shù)平均值;
t——時(shí)刻;
ρ——衰減速率;
gt——參數(shù)更新之后在各個梯度方向上的投影向量。
RMSProp優(yōu)化算法中的參數(shù)優(yōu)化公式如下
ωt+1=ωt+Δωt
(2)
(3)
式中:ωt——t時(shí)刻的原始步長;
Δωt——更新過后的步長變量;
η——初始學(xué)習(xí)率;
等式右邊的負(fù)號表示它與梯度移動的方向相反。RMSProp算法與一般梯度下降算法最大的不同就是把學(xué)習(xí)率這個超參數(shù)從原來的標(biāo)量變成了一個向量。
通過消除梯度下降時(shí)的擺動從而加速梯度下降的過程,就能設(shè)置較大的學(xué)習(xí)率,使得訓(xùn)練加快[16]。為了防止模型運(yùn)行過程中出現(xiàn)過擬合,并加強(qiáng)神經(jīng)網(wǎng)絡(luò)的泛化能力,在全連接層后加入一個Dropout層,采用Dropout正則化,將其參數(shù)大小設(shè)置為0.5,以此加強(qiáng)網(wǎng)絡(luò)節(jié)點(diǎn)的魯棒性。該二維卷積網(wǎng)絡(luò)模型可以實(shí)現(xiàn)對于故障端到端的診斷,即從原始信號到故障識別,同時(shí)完成自適應(yīng)學(xué)習(xí),不需要定義額外參數(shù)。網(wǎng)絡(luò)模型的流程圖如圖2所示。
圖2 卷積神經(jīng)網(wǎng)絡(luò)流程
本文使用的數(shù)據(jù)集來自美國凱斯西儲大學(xué)軸承數(shù)據(jù)中心在4種載荷情況下所收集到的數(shù)據(jù)。該數(shù)據(jù)集是當(dāng)前軸承振動信號處理、故障診斷方面應(yīng)用最為廣泛的標(biāo)準(zhǔn)數(shù)據(jù)集[17-18]。
在12 kHz采樣頻率下,電機(jī)載荷分別為0 W,735 W,1 471 W,2 206 W,電機(jī)近似轉(zhuǎn)速為1 797 r/min時(shí),采用了4組內(nèi)圈故障、滾動體故障和外圈損傷點(diǎn)在6點(diǎn)方向上的10類故障數(shù)據(jù)集和1類正常數(shù)據(jù)集。故障分類如表2所示。
表2 故障分類
由于本文所構(gòu)建的故障診斷模型是二維卷積網(wǎng)絡(luò)模型,所以需要將原始的一維數(shù)據(jù)集進(jìn)行二維轉(zhuǎn)化處理。首先,對44類原始信號采集400個一維原始數(shù)據(jù)作為一個樣本,并將工況變量加入樣本信號中,共計(jì)420個數(shù)據(jù)點(diǎn),采集300個樣本;由于原始數(shù)據(jù)是一維數(shù)據(jù),需要將44類數(shù)據(jù)集通過reshape函數(shù)將其轉(zhuǎn)化為二維矩陣,并將數(shù)據(jù)集打亂;最后,將標(biāo)簽轉(zhuǎn)化為一位有效編碼,即每一次有且僅有一種狀態(tài)存在。
通過數(shù)據(jù)預(yù)處理,所得到的訓(xùn)練集和測試集樣本數(shù)據(jù)總數(shù)量為13 200,根據(jù)實(shí)驗(yàn)需要將其按照一定比例隨機(jī)分配。實(shí)驗(yàn)測試采用基于Tensor Flow深度學(xué)習(xí)架構(gòu),運(yùn)行環(huán)境為Windows 7,處理器采用的是英特爾公司的i7-4720HQ。將300個樣本按照4∶1的比例隨機(jī)分成訓(xùn)練集和測試集的情況下,在變工況下對該模型進(jìn)行100次迭代模擬實(shí)驗(yàn),實(shí)驗(yàn)的訓(xùn)練準(zhǔn)確率、損失曲線及可視化的混淆矩陣如圖3、圖4、圖5所示。其中:訓(xùn)練準(zhǔn)確率是指在訓(xùn)練過程中模型的成功率;損失曲線中的損失值代表了預(yù)測值和實(shí)際值的相似程度,損失值越小,表示相似程度越高;混淆矩陣是以矩陣形式將模型的故障診斷結(jié)果進(jìn)行匯總表示,矩陣中的行表示預(yù)測值,列表示真實(shí)值,對角線上的值越高表示診斷結(jié)果越好。
圖3 訓(xùn)練準(zhǔn)確率曲線
圖4 損失曲線
圖5 混淆矩陣
模型的診斷結(jié)果如表3所示。模型測試耗時(shí)466 s,單個診斷算列時(shí)間約為598 μs,由于選取的420個數(shù)據(jù)點(diǎn)少于傳統(tǒng)一維卷積神經(jīng)網(wǎng)絡(luò)所采用的1 024個,實(shí)驗(yàn)耗時(shí)大大減少。由于通過5層卷積和3層池化的特征提取,基于較少的訓(xùn)練樣本,經(jīng)過Python軟件模擬得到軸承故障診斷的識別準(zhǔn)確率可達(dá)99.6%,損失值維持在2.3%。
表3 故障診斷結(jié)果
測試集樣本數(shù)為60,通過圖5和表3的模型診斷結(jié)果可以看出,在60次的故障識別中,其中載荷為735 W時(shí)的內(nèi)圈故障、載荷為735 W時(shí)的外圈故障,載荷為1 471W時(shí)的滾動體故障分別有1次未能識別,其余均正確識別。
隨著迭代次數(shù)的增加,準(zhǔn)確率與損失值在迭代次數(shù)為40之后趨于平穩(wěn),變化幅度不超過千分之一,基本可以忽略。在變工況下對該模型進(jìn)行40次迭代模擬,模型測試耗時(shí)299 s,單個診斷算列時(shí)間約為598 μs,軸承故障診斷的識別準(zhǔn)確率為99.7%,損失維持在2.4%。與圖3和圖4的結(jié)果相符。
同時(shí)將本文所提的變工況下二維卷積神經(jīng)網(wǎng)絡(luò)(2DCNN)與傳統(tǒng)一維卷積神經(jīng)網(wǎng)絡(luò)(1DCNN)、未將工況變量作為輸入信號的二維神經(jīng)卷積網(wǎng)絡(luò)(2DCNN無變量)進(jìn)行10次軸承故障診斷的實(shí)驗(yàn)對比。將信號直接輸入到傳統(tǒng)一維卷積神經(jīng)網(wǎng)絡(luò)和未將工況變量加入樣本信號的二維卷積神經(jīng)網(wǎng)絡(luò)中,樣本同樣包含420個數(shù)據(jù)點(diǎn),模型的結(jié)構(gòu)為表2 所示的12層,進(jìn)行40次迭代。識別準(zhǔn)確率與實(shí)驗(yàn)耗時(shí)的對比情況如圖6和圖7所示。實(shí)驗(yàn)數(shù)據(jù)對比如表4所示。
圖7 不同工況下實(shí)驗(yàn)耗時(shí)的對比
表4 實(shí)驗(yàn)數(shù)據(jù)對比
通過圖6和圖7可以看出:一維卷積神經(jīng)網(wǎng)絡(luò)在迭代次數(shù)和樣本容量較小的情況下,無法完成對多工況、多故障的有效診斷,在40次的迭代后,故障診斷的識別準(zhǔn)確率僅為70%~88%;但在另外兩種二維卷積神經(jīng)網(wǎng)絡(luò)模型中,在相同的迭代次數(shù)和樣本量情況下,故障診斷的識別準(zhǔn)確分別在99%和90%左右,均高于一維卷積神經(jīng)網(wǎng)絡(luò);在故障診斷的時(shí)間方面,相同參數(shù)的情況下,一維卷積神經(jīng)網(wǎng)絡(luò)的單個診斷算列的識別時(shí)間遠(yuǎn)遠(yuǎn)多于另外兩種二維卷積神經(jīng)網(wǎng)絡(luò)模型,均超過780 μs。
通過對比實(shí)驗(yàn)結(jié)果得出,在較少的迭代次數(shù)和樣本量的情況下,本文所提方法在變工況下的識別準(zhǔn)確率和故障診斷識別時(shí)間上都更有優(yōu)勢。
本文提出了一種適用于軸承運(yùn)行載荷發(fā)生改變時(shí),可以對其故障進(jìn)行準(zhǔn)確且有效診斷的二維卷積神經(jīng)網(wǎng)絡(luò)模型。通過變工況的模擬實(shí)驗(yàn),證明了該模型的有效性以及可行性,并得出了以下結(jié)論。
(1) 本文原始一維信號的處理與轉(zhuǎn)化方式更能完整且有效地保留軸承故障的特征信號,無需額外定義任何參數(shù),盡量消除了專家經(jīng)驗(yàn)所帶來的影響,提高了模型的識別準(zhǔn)確率。
(2) 本文提出的變工況下二維卷積神經(jīng)網(wǎng)絡(luò)在軸承載荷發(fā)生改變的情況下,實(shí)現(xiàn)了對44種故障類型及其嚴(yán)重程度的端到端故障診斷,軸承故障診斷的識別準(zhǔn)確率達(dá)到了99.6%。
(3) 本文所提方法模型測試總耗時(shí)為466 s,單個診斷算列時(shí)間約為598 μs,模型的故障識別準(zhǔn)確率和診斷的實(shí)時(shí)性均優(yōu)于傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)。