周文宣, 劉 洋, 鄧敏強(qiáng), 丁 雪, 鄧艾東
(1.國家能源集團(tuán)宿遷發(fā)電有限公司,江蘇宿遷 223803;2.東南大學(xué) 能源與環(huán)境學(xué)院, 火電機(jī)組振動(dòng)國家工程研究中心,南京 210096)
滾動(dòng)軸承是旋轉(zhuǎn)機(jī)械設(shè)備中常用的零部件,其健康狀態(tài)關(guān)系到設(shè)備運(yùn)行的可靠性與穩(wěn)定性[1]。但滾動(dòng)軸承在高轉(zhuǎn)速、重負(fù)載工況下長(zhǎng)期運(yùn)行,故障頻發(fā),若得不到及時(shí)維護(hù),將導(dǎo)致設(shè)備其他零部件損壞,進(jìn)而造成更大的經(jīng)濟(jì)損失。因此,實(shí)現(xiàn)對(duì)滾動(dòng)軸承健康狀態(tài)的準(zhǔn)確識(shí)別具有重要意義。
受需求及環(huán)境等多種因素影響,滾動(dòng)軸承并非在單一工況下運(yùn)行,而是常常運(yùn)行在變速變載荷條件下,工況變化在一定程度上增加了故障特征與故障模式間映射關(guān)系的復(fù)雜性,給機(jī)械設(shè)備的狀態(tài)監(jiān)測(cè)帶來了巨大挑戰(zhàn)。針對(duì)滾動(dòng)軸承的故障診斷問題,國內(nèi)外學(xué)者開展了大量的研究工作。以數(shù)字信號(hào)處理為基礎(chǔ)的診斷方法研究較早,萬書亭等[2]提出了一種融合概率主成分分析和Teager能量譜的特征提取方法;唐明等[3]提出了一種基于階次解調(diào)譜的故障診斷方法。該類方法往往對(duì)專家經(jīng)驗(yàn)有較強(qiáng)的依賴性,在變工況條件下應(yīng)用有一定的局限性。隨著機(jī)器學(xué)習(xí)技術(shù)的不斷深入,基于數(shù)據(jù)驅(qū)動(dòng)的軸承故障診斷方法取得較大的進(jìn)展。張淑清等[4]提出用雙樹復(fù)小波分解振動(dòng)信號(hào)進(jìn)而提取故障特征,用深度信念網(wǎng)絡(luò)實(shí)現(xiàn)軸承故障模式識(shí)別的方法;康守強(qiáng)等[5]提出了一種利用變分模態(tài)分解構(gòu)造特征集與半監(jiān)督遷移成分分析相結(jié)合的方法,在變工況條件下取得了良好效果。然而這些依賴于人工提取特征的方法難以實(shí)現(xiàn)設(shè)備故障的自動(dòng)診斷。為了擺脫人工提取特征帶來的限制,深度學(xué)習(xí)方法展現(xiàn)了巨大潛力,趙小強(qiáng)等[6]提出一種基于改進(jìn)Alexnet的滾動(dòng)軸承變工況故障診斷方法,將構(gòu)建好的二維特征圖輸入到卷積神經(jīng)網(wǎng)絡(luò)中,實(shí)現(xiàn)了自適應(yīng)特征提取,以進(jìn)行軸承智能故障診斷。為了得到在變工況下故障診斷表現(xiàn)能力依然很強(qiáng)的特征,對(duì)于普通神經(jīng)網(wǎng)絡(luò)有必要選取足夠多的訓(xùn)練樣本,但在實(shí)際應(yīng)用中往往難以滿足。
筆者針對(duì)上述問題提出了一種基于卷積自編碼(Convolutional Auto-encoders,CAE)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)的軸承故障診斷模型CAECNN模型。該模型以單一工況下的數(shù)據(jù)作為源域,以變工況下的數(shù)據(jù)作為目標(biāo)域。卷積自編碼的編碼器由多層卷積層組成,解碼器由反卷積層組成,模型對(duì)源域和目標(biāo)域數(shù)據(jù)進(jìn)行訓(xùn)練,首先經(jīng)過編碼器獲得特征參數(shù)矩陣F,然后輸入到解碼器得到重構(gòu)數(shù)據(jù)并計(jì)算損失;軸承故障診斷模型為淺層卷積神經(jīng)網(wǎng)絡(luò),其輸入為源域數(shù)據(jù)經(jīng)過編碼器輸出的特征參數(shù)矩陣F,輸出軸承狀態(tài)類別并計(jì)算損失;以上述兩者的損失之和作為總損失進(jìn)行訓(xùn)練,使源域與目標(biāo)域數(shù)據(jù)經(jīng)過編碼器之后提取的特征分布更為接近,以此實(shí)現(xiàn)變工況下數(shù)據(jù)的特征域遷移,有助于CNN模型在變工況下的故障診斷。
卷積神經(jīng)網(wǎng)絡(luò)經(jīng)過多年的發(fā)展,已經(jīng)在圖像處理[7]等方面得到廣泛應(yīng)用。研究表明,通過卷積神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)人工提取難以得到的深層次特征,因此有助于提高模型的判別能力和泛化能力。圖1給出了常見的一維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。該卷積神經(jīng)網(wǎng)絡(luò)由輸入層、卷積層、池化層、全連接層和輸出層組成,卷積層和池化層兩者交替設(shè)置。卷積層使用一定大小的卷積核對(duì)輸入特征面的局部區(qū)域進(jìn)行卷積運(yùn)算,通過非線性激活函數(shù)后輸出多個(gè)特征面,同一輸入特征面與同一輸出特征面中共用相同的卷積核,以實(shí)現(xiàn)權(quán)值共享,易于訓(xùn)練。池化層一般設(shè)置在卷積層之后,其輸出的特征面一一對(duì)應(yīng)于上一層卷積層輸出的特征面,通過特定大小的窗口對(duì)局部接受域進(jìn)行下采樣,具有特征信息整合及降維的作用。
圖1 一維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
反卷積又稱為轉(zhuǎn)置卷積,在場(chǎng)景分割、生成模型等領(lǐng)域得到廣泛應(yīng)用。卷積操作可以實(shí)現(xiàn)特征尺寸的減小,而反卷積操作可以使特征尺寸增大,其正向與反向傳播運(yùn)算為卷積操作的正向與反向傳播的逆運(yùn)算。
自編碼神經(jīng)網(wǎng)絡(luò)(Auto-encoders Networks,AE)是一種基于數(shù)據(jù)重構(gòu)思想的網(wǎng)絡(luò)結(jié)構(gòu),其結(jié)構(gòu)多樣,常被應(yīng)用于異常檢測(cè)、模式識(shí)別[8]和噪聲處理[9]等領(lǐng)域。圖2為一個(gè)簡(jiǎn)單的自編碼神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖,其結(jié)構(gòu)主要由編碼器和解碼器組成,且兩者結(jié)構(gòu)對(duì)稱,即神經(jīng)元數(shù)量和層數(shù)相同,目標(biāo)是通過學(xué)習(xí)使輸出信號(hào)與輸入信號(hào)之間的差別最小,傳統(tǒng)的自編碼神經(jīng)網(wǎng)絡(luò)的編碼器和解碼器都是由全連接層組成的,通常設(shè)置中間隱藏層神經(jīng)元數(shù)量小于輸入數(shù)據(jù)維度,可以起到特征提取、篩選和融合的作用。
自編碼神經(jīng)網(wǎng)絡(luò)編碼階段和解碼階段的數(shù)學(xué)描述如下:
h=σe(W1x+b1)
(1)
y=σd(W2h+b2)
(2)
式中:h為隱藏層的輸出值;σe和σd為激活函數(shù);W1和b1分別為編碼器的權(quán)重和偏置;W2和b2分別為解碼器的權(quán)重和偏置;y為輸出數(shù)據(jù);x為輸入數(shù)據(jù)。
圖2 自編碼神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)較為單一,在提取深層次特征和多樣性特征方面有一定的局限性,卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)異性能推動(dòng)了卷積自編碼的誕生,它是傳統(tǒng)自編碼神經(jīng)網(wǎng)絡(luò)的一個(gè)變種,圖3為一個(gè)簡(jiǎn)單的卷積自編碼神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖。卷積自編碼的編碼器和解碼器不再使用全連接層,編碼器被卷積層和池化層代替,解碼器被反卷積層代替。卷積核數(shù)量和大小的多樣化設(shè)置使卷積層相比全連接層具有更加強(qiáng)大的特征提取能力,尤其是在圖像處理領(lǐng)域得到廣泛的應(yīng)用。
圖3 卷積自編碼神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
變工況下風(fēng)電滾動(dòng)軸承的故障特征不僅受到強(qiáng)背景噪聲的干擾,也受到轉(zhuǎn)速、扭矩等時(shí)變運(yùn)行參數(shù)的影響。所提出的CAECNN模型將卷積自編碼神經(jīng)網(wǎng)絡(luò)引入到基于卷積神經(jīng)網(wǎng)絡(luò)的軸承故障診斷模型中,其結(jié)構(gòu)如圖4所示,核心思想是以軸承故障診斷模型的中間特征空間作為遷移目標(biāo),利用卷積自編碼實(shí)現(xiàn)變工況下數(shù)據(jù)特征域的自適應(yīng)。卷積自編碼的損失函數(shù)Lcae(x,y)為均方誤差,如式(3)所示。軸承故障診斷模型采用交叉熵?fù)p失函數(shù)Lc(x,z),如式(4)所示。CAECNN模型的損失函數(shù)L(x,y,z)為兩者之和,如式(5)所示。
(3)
(4)
L(x,y,z)=Lcae(x,y)+Lc(x,z)
(5)
圖4 CAECNN結(jié)構(gòu)
CAECNN模型的網(wǎng)絡(luò)參數(shù)如表1所示,其訓(xùn)練的基本流程如下:
(1) 獲取數(shù)據(jù)。以某一工況下有標(biāo)簽的軸承振動(dòng)信號(hào)數(shù)據(jù)為源域,變工況下的數(shù)據(jù)作為目標(biāo)域。
(2) 將源域和目標(biāo)域數(shù)據(jù)一起輸入到編碼器中得到特征參數(shù)矩陣F,然后輸入到解碼器中得到還原數(shù)據(jù),并計(jì)算均方誤差損失。
(3) 將源域數(shù)據(jù)的特征參數(shù)矩陣F輸入到CNN中,輸出軸承狀態(tài)類別并計(jì)算交叉熵?fù)p失。
(4) 計(jì)算步驟(2)與步驟(3)的損失之和及其梯度,進(jìn)行反向傳播,更新模型參數(shù)。
(5) 重復(fù)步驟(2)~步驟(4),直到損失函數(shù)趨于穩(wěn)定,模型訓(xùn)練結(jié)束。
(6) 將變工況下的數(shù)據(jù)先輸入到編碼器中得到特征參數(shù)矩陣F,然后輸入到軸承故障診斷模型中得到狀態(tài)類別,完成變工況下的軸承故障診斷。
表1 CAECNN網(wǎng)絡(luò)參數(shù)
考慮變負(fù)載和變轉(zhuǎn)速都屬于軸承變工況,本文的2個(gè)軸承數(shù)據(jù)集中數(shù)據(jù)集Ⅰ采用美國凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)中心的滾動(dòng)軸承振動(dòng)加速度數(shù)據(jù),為變負(fù)載工況數(shù)據(jù)集;數(shù)據(jù)集Ⅱ選取加拿大渥太華大學(xué)的滾動(dòng)軸承振動(dòng)加速度數(shù)據(jù),為變轉(zhuǎn)速工況數(shù)據(jù)集。
數(shù)據(jù)集Ⅰ采集自電機(jī)驅(qū)動(dòng)端的6205-2RS-JEM SKF型深溝球滾動(dòng)軸承,信號(hào)采樣頻率為12 000 Hz,共有A、B、C、D 4種工況,具體見表2,每種工況包括4種狀態(tài)類型:正常、內(nèi)圈故障、外圈故障和滾動(dòng)體故障。取1 024個(gè)數(shù)據(jù)點(diǎn)為一個(gè)樣本,某一工況下每種狀態(tài)類型有480個(gè)樣本。
數(shù)據(jù)集Ⅱ測(cè)試軸承的型號(hào)為ER16K,主要包括正常、內(nèi)圈故障和外圈故障3種類別的振動(dòng)信號(hào)。在勻變速的工況下進(jìn)行實(shí)驗(yàn),轉(zhuǎn)速的變化范圍為900~1 620 r/min,信號(hào)的采樣頻率為200 000 Hz。取1 024個(gè)數(shù)據(jù)點(diǎn)為一個(gè)樣本,某一工況下每種狀態(tài)類型有120個(gè)樣本,具體的實(shí)驗(yàn)樣本情況見表3。
表2 數(shù)據(jù)集Ⅰ樣本
表3 數(shù)據(jù)集Ⅱ樣本
設(shè)置對(duì)比模型有以下3種:(1)CNN模型,即筆者所提模型中的CNN軸承故障診斷模型;(2)殘差卷積神經(jīng)網(wǎng)絡(luò)ResCNN,其結(jié)構(gòu)見參考文獻(xiàn)[10];(3)支持向量機(jī)(SVM),提取的特征參數(shù)包括6個(gè)時(shí)域特征參數(shù)(均方根、峭度、偏度、波形因子、峰值因子和標(biāo)準(zhǔn)差)、5個(gè)頻域特征參數(shù)(中心頻率、均方頻率、均方根頻率、頻率方差和頻譜散度)和4個(gè)時(shí)頻特征參數(shù)(包絡(luò)階次譜中旋轉(zhuǎn)階次以及滾動(dòng)軸承內(nèi)圈、外圈、滾動(dòng)體故障特征階次處的幅值)。
3.3.1 訓(xùn)練過程分析
本實(shí)驗(yàn)采用Pytorch深度學(xué)習(xí)框架,首先使用數(shù)據(jù)集Ⅰ進(jìn)行驗(yàn)證,以0 W負(fù)載工況下的數(shù)據(jù)作為源域,并將數(shù)據(jù)劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,以其余工況下的數(shù)據(jù)作為目標(biāo)域數(shù)據(jù),全部數(shù)據(jù)作為測(cè)試集進(jìn)行診斷效果評(píng)估。訓(xùn)練過程中采用Adam優(yōu)化器,學(xué)習(xí)率為0.000 3,訓(xùn)練輪數(shù)為600,小批量mini-batch大小為32。圖5給出了CAECNN模型訓(xùn)練過程中前100輪的損失函數(shù)。由圖5可以看出,模型整體訓(xùn)練過程較好,在訓(xùn)練初期損失函數(shù)迅速下降,在30輪之后損失函數(shù)已經(jīng)達(dá)到0.01,驗(yàn)證集診斷準(zhǔn)確率達(dá)到100%,該過程中CNN模型和CAE模型的損失函數(shù)均迅速下降;之后損失函數(shù)開始平穩(wěn)緩慢地下降,該過程主要是CAE模型損失函數(shù)的下降過程,600輪時(shí)損失函數(shù)為0.000 9,因其下降較緩慢不作展示。
圖5 損失函數(shù)
3.3.2 CAE模型訓(xùn)練結(jié)果分析
圖6給出了數(shù)據(jù)集Ⅰ工況A下原始數(shù)據(jù)與經(jīng)過CAE模型之后的重構(gòu)數(shù)據(jù)的對(duì)比。由圖6可以看出,原始數(shù)據(jù)與重構(gòu)數(shù)據(jù)的波形圖基本一致,由于CAE具有去噪功能,2種數(shù)據(jù)圖僅存在一些細(xì)微的差別。此外經(jīng)過600輪訓(xùn)練后,損失函數(shù)達(dá)到0.000 9,這也說明了CAE模型的訓(xùn)練效果較好。因此,經(jīng)過編碼器之后提取的特征參數(shù)矩陣F能很好地反映數(shù)據(jù)自身存在的一些性質(zhì)。
正常狀態(tài)
內(nèi)圈故障
滾動(dòng)體故障
外圈故障
3.3.3 診斷準(zhǔn)確率對(duì)比
為了對(duì)比所選取的4個(gè)模型的診斷效果,本實(shí)驗(yàn)以數(shù)據(jù)集Ⅰ工況A下的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),并將其20%的數(shù)據(jù)作為測(cè)試集,為了模擬變工況條件,以其余負(fù)載工況下的全部數(shù)據(jù)作為測(cè)試集,各模型在測(cè)試集上的的診斷準(zhǔn)確率如表4所示,每個(gè)模型中的每個(gè)診斷任務(wù)均是3次訓(xùn)練并預(yù)測(cè)取平均值的結(jié)果。由表4可以看出,對(duì)于A診斷任務(wù),即工況A下的測(cè)試集,各模型的診斷準(zhǔn)確率均較高,ResCNN、CNN、CAECNN模型的診斷準(zhǔn)確率可以達(dá)到100%,SVM的診斷準(zhǔn)確率達(dá)到97.6%,但是對(duì)于變工況下的數(shù)據(jù),各模型的診斷準(zhǔn)確率均有所下降。對(duì)比B、C、D診斷任務(wù)的診斷準(zhǔn)確率以及平均值可以看出,基于人工提取特征的SVM在3個(gè)變工況下的故障診斷準(zhǔn)確率均較低,其原因可能是所提取的特征并不具有很好的表達(dá)能力以及模型自身在變工況下的局限性;而ResCNN、CNN、CAECNN模型平均診斷準(zhǔn)確率都高于92%,其中ResCNN在變工況下的診斷能力較為穩(wěn)定且表現(xiàn)良好,在3個(gè)診斷任務(wù)上的診斷準(zhǔn)確率均比CNN模型高。CAECNN模型的診斷準(zhǔn)確率大幅提升,對(duì)于B、C診斷任務(wù)已經(jīng)超過99.5%,對(duì)于D診斷任務(wù)的診斷準(zhǔn)確率較低,為93.5%,但相比其他模型仍然具有優(yōu)勢(shì),該模型的平均診斷準(zhǔn)確率高于97%。
表4 測(cè)試集診斷準(zhǔn)確率
3.3.4 變轉(zhuǎn)速結(jié)果分析
為了驗(yàn)證CAECNN模型的普適性,使用數(shù)據(jù)集Ⅱ進(jìn)行驗(yàn)證,以轉(zhuǎn)速為900~1 080 r/min時(shí)的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),其余轉(zhuǎn)速下的數(shù)據(jù)視為變工況數(shù)據(jù),各模型在各工況下的診斷準(zhǔn)確率如圖7所示,其中每個(gè)模型有E、F、G、H 4個(gè)診斷任務(wù)。由圖7可以看出,在數(shù)據(jù)集Ⅱ上各個(gè)模型診斷準(zhǔn)確率的分布規(guī)律與數(shù)據(jù)集Ⅰ上基本一致,基于人工提取特征的機(jī)器學(xué)習(xí)模型SVM的診斷效果最差,而CAECNN模型在CNN的基礎(chǔ)上加入CAE,其診斷準(zhǔn)確率有了較大的提升,證明了該模型的有效性。
(1) 所提出的CAECNN模型聯(lián)合單一工況下有標(biāo)簽的數(shù)據(jù)和變工況下無標(biāo)簽的數(shù)據(jù)進(jìn)行訓(xùn)練,變工況下其平均診斷準(zhǔn)確率高于97%,相比未引入卷積自編碼神經(jīng)網(wǎng)絡(luò)的CNN模型有了較大提升。
圖7 診斷準(zhǔn)確率
(2) CAECNN模型訓(xùn)練過程較為穩(wěn)定,易于訓(xùn)練,且卷積自編碼神經(jīng)網(wǎng)絡(luò)基于數(shù)據(jù)重構(gòu)思想,有一定的降噪作用。CAECNN模型在變負(fù)載和變轉(zhuǎn)速工況數(shù)據(jù)集上均表現(xiàn)良好,具有一定的普適性。