徐 鵬, 皋 軍, 邵 星
(1. 鹽城工學(xué)院 機(jī)械工程學(xué)院,江蘇 鹽城 224051;2. 鹽城工學(xué)院 信息工程學(xué)院,江蘇 鹽城 224051)
由于現(xiàn)代工業(yè)生產(chǎn)的迅速發(fā)展,滾動(dòng)軸承的使用范圍日益廣闊,同時(shí)其運(yùn)行條件和工作環(huán)境也變得異常的復(fù)雜。當(dāng)滾動(dòng)軸承長(zhǎng)期處于高速、高負(fù)荷、高溫度等惡劣環(huán)境中,就很容易出現(xiàn)點(diǎn)蝕、磨損、剝落等狀況,導(dǎo)致整體設(shè)備出現(xiàn)故障,帶來巨大的潛在維護(hù)成本,甚至是引發(fā)安全事故。據(jù)統(tǒng)計(jì),在工業(yè)領(lǐng)域中大約30%的旋轉(zhuǎn)機(jī)械故障是由滾動(dòng)軸承的缺陷引起的[1]。因此,滾動(dòng)軸承的健康狀況影響著整個(gè)機(jī)械設(shè)備的性能、穩(wěn)定性和生命周期。
采用故障診斷技術(shù),可以有效地監(jiān)測(cè)機(jī)械設(shè)備的運(yùn)行狀態(tài),能夠識(shí)別出故障的損傷程度及故障類型,有效提高機(jī)械設(shè)備的可靠性[2]。因此,針對(duì)滾動(dòng)軸承進(jìn)行故障診斷方法研究,對(duì)于提高整個(gè)設(shè)備系統(tǒng)的安全性有重大意義[3]。傳統(tǒng)的故障診斷方法一般包括3個(gè)步驟:特征提取、特征選擇和故障分類。通過信號(hào)處理方法對(duì)輸入信號(hào)進(jìn)行特征提取,并對(duì)提取的特征進(jìn)行篩選,然后利用分類模型對(duì)篩選后的特征進(jìn)行故障分類。雖然,這類傳統(tǒng)方法在故障診斷領(lǐng)域已經(jīng)獲得相關(guān)成果,但是在特征提取方面較為依賴專家經(jīng)驗(yàn)和專業(yè)知識(shí),存在人為干擾,診斷結(jié)果不確定性高,因而制約了該類方法的實(shí)際應(yīng)用[4]。
近年來,隨著深度學(xué)習(xí)的快速發(fā)展,一種端到端的故障診斷方法逐漸成為故障領(lǐng)域的熱點(diǎn)方向。在實(shí)際應(yīng)用中,傳感器所采集的振動(dòng)信號(hào)多是一維時(shí)間序列,而不是二維圖像。一些研究表明,在使用二維卷積神經(jīng)網(wǎng)絡(luò)模型之前,必須先對(duì)采集的振動(dòng)信號(hào)進(jìn)行預(yù)處理。張訓(xùn)杰等[5]利用格拉姆角場(chǎng)將滾動(dòng)軸承一維振動(dòng)信號(hào)轉(zhuǎn)換為二維彩色圖像,既保留了信號(hào)完整的信息,也保持著信號(hào)對(duì)于時(shí)間的依賴性,最后由分類器實(shí)現(xiàn)分類識(shí)別。Zhang等[6]利用連續(xù)小波變換將在不同頻率變化條件下采集的滾動(dòng)軸承一維時(shí)頻信號(hào)變換到二維時(shí)頻灰度圖,并將灰度圖輸入到具有多個(gè)并行卷積層的卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,該方法有效提高滾動(dòng)軸承在變工況下的故障檢測(cè)精度。以上方法,通過不同的預(yù)處理方式將原始的一維信號(hào)轉(zhuǎn)換為二維圖像,雖在某些方面有一定的優(yōu)勢(shì)但容易損失原始振動(dòng)信號(hào)中的時(shí)序信息;而且,采集到的故障信號(hào)一般是一維的振動(dòng)信號(hào),直接使用一維的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行診斷理論上是比還需要維度轉(zhuǎn)換的網(wǎng)絡(luò)更加直接高效[7]。Wei等[8]采用原始的一維信號(hào)作為帶訓(xùn)練干擾的卷積神經(jīng)網(wǎng)絡(luò)的輸入,同時(shí)對(duì)訓(xùn)練樣本采用重疊切片的方式來增加訓(xùn)練樣本數(shù)量。他們的研究表明,使用原始信號(hào)作為卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)的輸入,在復(fù)雜的操作環(huán)境中具有更好的泛化能力和魯棒性。昝濤等[9]采用多輸入層輸入一維原始信號(hào),同時(shí)對(duì)樣本進(jìn)行重疊采樣,提升了傳統(tǒng)卷積模型的準(zhǔn)確率。雖然,以上方法使用重疊采樣可以有效增加樣本數(shù)量,但是未考慮到樣本本身長(zhǎng)度問題,增加了網(wǎng)絡(luò)模型的訓(xùn)練時(shí)間。
卷積神經(jīng)網(wǎng)絡(luò)更多的是提取局部空間特征,無法記住歷史數(shù)據(jù)信息,而循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN)對(duì)序列的非線性特征學(xué)習(xí)具有特殊優(yōu)勢(shì),可以學(xué)習(xí)不同位置的時(shí)間和隱藏特征,但在進(jìn)行反向傳播時(shí)容易出現(xiàn)的梯度問題導(dǎo)致傳統(tǒng)的RNN可能無法捕獲長(zhǎng)期的依賴關(guān)系[10]。門控循環(huán)單元(gated recurrent unit,GRU)使用了一種門控機(jī)制來有效克制RNN的梯度問題,它是RNN的變體。但僅考慮單向傳播是不合適的,因此選擇一種參數(shù)更少,性能更強(qiáng)的雙向門控循環(huán)單元(bidirectional gated recurrent unit,BiGRU)。張立鵬等[11]利用預(yù)處理后的機(jī)械振動(dòng)信號(hào),搭建BiGRU故障診斷模型,并采用注意力機(jī)制對(duì)模型進(jìn)行優(yōu)化,有效提高特征提取效率。Zhang等[12]提出一種DCA-BiGRU的小樣本故障診斷方法,能夠在各種復(fù)雜情況下有效地進(jìn)行診斷。
基于以上問題,本文提出一種基于注意力模塊的卷積神經(jīng)網(wǎng)絡(luò)-雙向門控循環(huán)單元(attention-based multi-scale convolutional neural network and bidirectional gated recurrent units, AMCNN-BiGRU)的滾動(dòng)軸承故障診斷模型。同時(shí),在樣本數(shù)量固定的情況下,對(duì)樣本進(jìn)行下采樣操作,每7位數(shù)據(jù)點(diǎn)保留一個(gè)。通過兩種不同核大小的CNN從下采樣后的原始振動(dòng)信號(hào)中提取不同尺度的特征信息,利用通道注意力模塊(efficient channel attention,ECA)對(duì)不同通道的特征進(jìn)行加權(quán)融合處理,增強(qiáng)相關(guān)特征并抑制無關(guān)特征,然后利用BiGRU實(shí)現(xiàn)對(duì)時(shí)間特征的提取,最后經(jīng)過Softmax函數(shù)將神經(jīng)元輸出轉(zhuǎn)換為關(guān)于10種滾動(dòng)軸承故障類型的概率分布。AMCNN-BiGRU模型具有以下優(yōu)點(diǎn):
(1) 使用經(jīng)過下采樣的一維原始振動(dòng)信號(hào)作為輸入,在保證準(zhǔn)確率的情況下,有效減少了模型的訓(xùn)練時(shí)間。
(2) 利用ECA-net通道注意力機(jī)制可以有效對(duì)不同通道特征進(jìn)行權(quán)重劃分,避免冗余特征對(duì)診斷過程的干擾。
(3) 結(jié)合CNN和BiGRU兩種不同網(wǎng)絡(luò),充分提取原始信號(hào)中的空間和時(shí)序特征,提高了診斷準(zhǔn)確率。
整個(gè)模型不僅解決了傳統(tǒng)故障診斷方法需要人工提取特征、診斷結(jié)果不確定性高的問題,而且模型訓(xùn)練時(shí)間大大減少,實(shí)現(xiàn)了端到端的故障診斷。最后,通過在凱斯西儲(chǔ)大學(xué)(Case Western Reserve University,CWRU)和江南大學(xué)數(shù)據(jù)集下的多組試驗(yàn),驗(yàn)證了AMCNN-BiGRU具有良好的準(zhǔn)確性和魯棒性。
CNN具有局部連接、權(quán)值共享的特點(diǎn),一般使用多個(gè)不同大小的卷積核進(jìn)行卷積計(jì)算,并將計(jì)算結(jié)果傳遞給非線性激活函數(shù),生成下一層的特征圖,增強(qiáng)了表示能力,使學(xué)習(xí)的特征具有可分性。卷積的具體過程如式(1)所示。
(1)
池化層常添加在卷積層之后,目的是為了降低卷積層輸出的維度,從而減少網(wǎng)絡(luò)中參數(shù)量,有效的防止發(fā)生過擬合現(xiàn)象。常見的池化方式包括平均池化和最大池化。在一維時(shí)間序列任務(wù)中,最大池化的性能常優(yōu)于平均池化。因此,采用最大池化方式,它對(duì)輸入特征進(jìn)行局部極大值運(yùn)算,具體公式如式(2)所示。
(2)
GRU使用一個(gè)更新門替代輸入門和遺忘門,同時(shí)將細(xì)胞狀態(tài)和隱藏狀態(tài)相混合,從而有效的減少了參數(shù)量[13]。GRU單元由重置門rt和更新門zt組成,t為當(dāng)前時(shí)刻。將上一時(shí)刻隱藏層狀態(tài)ht-1和當(dāng)前時(shí)刻的輸入xt輸入到rt和zt,對(duì)應(yīng)的權(quán)值分別為Wr和Wz,具體公式如式(3)~式(6)所示。
rt=σ[Wr(h(t-1),xt)]
(3)
zt=σ[Wz(h(t-1),xt)]
(4)
(5)
(6)
BiGRU是GRU的變體,由正向和反向的GRU共同組成,其輸出由兩個(gè)GRU的狀態(tài)共同決定,所以BiGRU能夠充分提取到容易被忽略特征信息,有效提高GRU的性能[14]。BiGRU的運(yùn)算過程與GRU類似,只是在GRU的基礎(chǔ)上加入了反向運(yùn)算[15]。
注意力機(jī)制在自然語言處理、圖像和語音識(shí)別、文本分類等各項(xiàng)任務(wù)中均獲得了顯著的成功[16]。本文將ECA-net引入滾動(dòng)軸承故障診斷領(lǐng)域,它是基于SE-net的擴(kuò)展,使用了一種無降維的局部跨通道交互策略,避免降維對(duì)學(xué)習(xí)通道注意力帶來的影響,適當(dāng)?shù)目缤ǖ澜换タ梢栽谔岣咝阅艿耐瑫r(shí)又顯著降低模型的復(fù)雜度[17]。計(jì)算融合特征yi的通道注意力僅考慮其k個(gè)相鄰的通道集合,公式如下
(7)
(8)
該策略可以通過1D卷積有效的實(shí)現(xiàn)。具體公式為
ω=σ[C1Dk(y)]
(9)
式中,C1D為1D卷積,只涉及k個(gè)參數(shù)信息。這樣做僅涉及極少的參數(shù),可以有明顯的性能提升,有效地避免了模型的復(fù)雜性。
同時(shí),該模塊對(duì)于局部跨通道交互的覆蓋范圍通過自適應(yīng)選擇一維卷積的核大小k,避免了因人工選擇帶來的干擾。具體公式為
(10)
式中:C為特征通道數(shù); |t|odd為最接近t的奇數(shù);γ和b固定設(shè)置為2和1。ECA模塊的基本結(jié)構(gòu)如圖1中的注意力模塊,因?yàn)楸灸P偷妮斎霝橐痪S振動(dòng)信號(hào),所以ECA模塊的輸入由(寬度、高度、通道數(shù))更改為(寬度、通道數(shù)),全局池化操作也更改為GlobalAveragePooling1D。后根據(jù)試驗(yàn)證明,選用的ECA模塊是有效可行的。
圖1 基于AMCNN-BiGRU的故障診斷模型Fig.1 Fault diagnosis model based on AMCNN-BiGRU
本研究的目的是使用下采樣后的一維原始振動(dòng)信號(hào)實(shí)現(xiàn)高準(zhǔn)確率的軸承故障診斷。通過對(duì)采樣后的原始信號(hào)進(jìn)行特征提取以獲得內(nèi)部特征表示,并利用注意力模塊對(duì)所提取的不同特征進(jìn)行權(quán)重劃分,最后將具有不同權(quán)重的特征輸入到分類器進(jìn)行故障分類,從而快速檢測(cè)出滾動(dòng)軸承發(fā)生故障時(shí)的故障類型。本模型的基本結(jié)構(gòu)包括卷積模塊、注意力模塊和分類器模塊,如圖1所示。卷積模塊由兩個(gè)并行的具有不同核大小和深度的一維CNN組成,這樣設(shè)計(jì)的目的是寬卷積核比小卷積核能更好地抑制高頻噪聲,而多層的小卷積核可以使得網(wǎng)絡(luò)更加深入,有助于獲得對(duì)輸入信號(hào)的良好表示,提高網(wǎng)絡(luò)的性能。同時(shí),在卷積層之后池化層之前加入批量歸一化層,不僅可以增強(qiáng)模型泛化能力,同時(shí)也降低了模型過擬合的風(fēng)險(xiǎn)。注意力模塊在不增加參數(shù)的原則上,首先對(duì)每個(gè)通道進(jìn)行全局平均池化,然后使用局部跨通道交互策略即使用卷積核大小為k的一維卷積對(duì)不同通道進(jìn)行權(quán)值計(jì)算,并通過Sigmoid函數(shù)輸出。將計(jì)算得到的權(quán)值和卷積模塊所提取的特征進(jìn)行逐元素乘積,得到新的融合特征。
分類器模塊使用了BiGRU和全連接層,用于建構(gòu)輸入和輸出之間的復(fù)雜非線性模型。BiGRU能夠通過正向反向相結(jié)合的方式同時(shí)獲取時(shí)序信號(hào)的特征,確保模型能擁有雙向的積聚依賴信息,達(dá)到豐富特征信息的目的。最終,特征信息包含原始信號(hào)的空間特征和時(shí)間特征,將其展平后由Softmax函數(shù)將神經(jīng)元輸出轉(zhuǎn)換為關(guān)于10種滾動(dòng)軸承故障類型的概率分布。
本文所提出的滾動(dòng)軸承故障診斷方法整體流程圖,如圖2所示。獲取原始振動(dòng)信號(hào)經(jīng)下采樣后,將其隨機(jī)劃分成訓(xùn)練集、驗(yàn)證集和測(cè)試集。訓(xùn)練集和驗(yàn)證集用于網(wǎng)絡(luò)模型的訓(xùn)練,在測(cè)試集上檢驗(yàn)?zāi)P蛯?duì)軸承故障類型診斷的準(zhǔn)確性。
圖2 故障診斷整體流程圖Fig.2 Overall flow chart of fault diagnosis
試驗(yàn)使用Tensorflow1.12.0和Keras2.2.4深度學(xué)習(xí)框架搭建模型,編程語言為Python,在Windows10中運(yùn)行。模型主要層的參數(shù),如表1所示。其中卷積層7是注意力模塊中的1D卷積層,k為卷積核大小,由式(10)根據(jù)通道數(shù)自動(dòng)計(jì)算得出。訓(xùn)練過程中采用Adam自適應(yīng)優(yōu)化器,Warm-up預(yù)熱策略,損失函數(shù)使用Mean_squared_error函數(shù),學(xué)習(xí)率設(shè)置為0.000 6,batch_size為16,epochs為400。
表1 AMCNN-BiGRU模型參數(shù)設(shè)置Tab.1 AMCNN-BiGRU model parameter settings
3.2.1 數(shù)據(jù)的描述和劃分
采用CWRU軸承數(shù)據(jù)集,該數(shù)據(jù)集常被用來檢驗(yàn)?zāi)P偷男Ч?具有一定代表性[18]。試驗(yàn)平臺(tái)如圖3所示。試驗(yàn)的對(duì)象為圖中的SKF-6205電機(jī)驅(qū)動(dòng)端軸承,利用放置在電機(jī)驅(qū)動(dòng)端的加速度計(jì)在0,745.7 W,1 491.4 W,2 237.1 W 4種工況下分別采集所需的振動(dòng)信號(hào),信號(hào)的采樣頻率包括12 kHz和48 kHz。故障由電火花加工制作而成,分別位于軸承的滾動(dòng)體、內(nèi)圈和外圈(3點(diǎn)鐘、6點(diǎn)鐘、12點(diǎn)鐘位置)。這3個(gè)位置的故障又分別分為0.177 8 mm,0.355 6 mm,0.533 4 mm 3種不同程度的損失,共計(jì)9種損傷類型。加上正常狀態(tài),每種工況下軸承的實(shí)際狀態(tài)可以分為10類。
圖3 CWRU數(shù)據(jù)采集試驗(yàn)平臺(tái)Fig.3 CWRU data acquisition text platform
本試驗(yàn)選取的數(shù)據(jù)來自放置在驅(qū)動(dòng)端的加速度計(jì),電機(jī)工況、采樣頻率和轉(zhuǎn)速分別固定在3 hp,48 kHz和1 730 r/min。具體數(shù)據(jù)集描述如表2所示,每類有240個(gè)長(zhǎng)度為2 000的樣本。將所有數(shù)據(jù)按7∶1.5∶1.5隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集用于模型訓(xùn)練和測(cè)試,其中訓(xùn)練集樣本數(shù)量為1 680,驗(yàn)證集和測(cè)試集樣本數(shù)量均為360,總計(jì)2 400個(gè)樣本即每種狀態(tài)僅240個(gè)樣本。
表2 CWRU數(shù)據(jù)集描述Tab.2 CWRU dataset description
3.2.2 數(shù)據(jù)下采樣
考慮到采用的試驗(yàn)數(shù)據(jù)是連續(xù)測(cè)量的時(shí)序信號(hào),正常情況下每位數(shù)據(jù)點(diǎn)與其相鄰的數(shù)據(jù)點(diǎn)是高度相似的,所以本次試驗(yàn)沒有選擇使用重疊采樣技術(shù)以增多樣本個(gè)數(shù),而是利用一種下采樣技術(shù)對(duì)樣本長(zhǎng)度進(jìn)行裁剪,每隔7位選擇一個(gè)數(shù)據(jù)點(diǎn),則樣本實(shí)際長(zhǎng)度由2 000縮減為250。選取局部振動(dòng)加速度信號(hào)進(jìn)行繪制,如圖4所示。左邊展示了正常和9種故障狀態(tài)下的原始振動(dòng)信號(hào),右邊展示了下采樣后的振動(dòng)信號(hào)。由圖4可知,下采樣后的數(shù)據(jù)基本依然能反應(yīng)出原始數(shù)據(jù)的特點(diǎn),但是輸入數(shù)據(jù)量大大減少。
圖4 下采樣前后的10種軸承狀態(tài)原始振動(dòng)信號(hào)Fig.4 Raw vibration signals of 10 bearing states before and after downsampling
3.2.3 試驗(yàn)結(jié)果
為了驗(yàn)證下采樣操作所帶來的實(shí)際提升,分別構(gòu)建輸入長(zhǎng)度為2 000和250的AMCNN-BiGRU模型,試驗(yàn)結(jié)果如表3所示。經(jīng)下采樣后的樣本依然能夠和未進(jìn)行下采樣的樣本一樣達(dá)到100%的準(zhǔn)確率,而且網(wǎng)絡(luò)模型的訓(xùn)練時(shí)間縮短為原來的1/8左右。說明下采樣后的樣本雖長(zhǎng)度被裁剪但并未丟失重要的原始數(shù)據(jù)特點(diǎn),分析發(fā)現(xiàn)下采樣操作對(duì)于卷積神經(jīng)網(wǎng)絡(luò)來說,效果和池化層比較類似,一般以少量數(shù)據(jù)代替全部數(shù)據(jù),從而達(dá)到壓縮的目的,而池化層的作用包括增加網(wǎng)絡(luò)感受野抑制噪聲,降低信息冗余減少參數(shù)和計(jì)算量,防止過擬合。所以,采用下采樣技術(shù)一定程度上在保證診斷準(zhǔn)確率的同時(shí)減輕網(wǎng)絡(luò)的輸入量,從而縮短網(wǎng)絡(luò)的訓(xùn)練時(shí)間,提高網(wǎng)絡(luò)的魯棒性。
表3 不同樣本長(zhǎng)度的試驗(yàn)結(jié)果Tab.3 Test results with different sample lengths
混淆矩陣圖,如圖5所示。圖5中:橫坐標(biāo)為預(yù)測(cè)故障類型的標(biāo)簽;縱坐標(biāo)為實(shí)際故障類型的標(biāo)簽,對(duì)角線上的數(shù)字表示正確分類的樣本數(shù)量,可以看出每一類故障都可以正確診斷。模型對(duì)應(yīng)訓(xùn)練過程中診斷準(zhǔn)確率隨著訓(xùn)練次數(shù)變化的曲線圖,如圖6所示。由圖6可知,模型收斂速度很快,約20個(gè)epochs就可以達(dá)到98%以上的準(zhǔn)確率,在此之后雖有小幅度波動(dòng)的跡象,但隨后就趨于穩(wěn)定狀態(tài),準(zhǔn)確率可達(dá)到100%。證明本模型可以在更短的時(shí)間內(nèi),取得更好的診斷效果。
圖5 混淆矩陣圖Fig.5 Confusion matrix diagram
圖6 準(zhǔn)確率與訓(xùn)練次數(shù)曲線圖Fig.6 Accuracy and training times curve
3.2.4 噪聲環(huán)境下的試驗(yàn)
通常軸承的工作環(huán)境都是復(fù)雜多變的,傳感器采集的信號(hào)中會(huì)包含不同程度的噪音,為了驗(yàn)證本模型在噪聲環(huán)境下的魯棒性,在信號(hào)中加入高斯白噪聲。當(dāng)SNR(signal to noise ratio)為0時(shí),復(fù)合噪聲信號(hào)圖,如圖7所示??梢悦黠@看出,原始的振動(dòng)信號(hào)已經(jīng)被破壞,很難提取故障信息。SNR的公式為
圖7 復(fù)合噪聲信號(hào)形成圖Fig.7 Complex noise signal formation diagram
(11)
式中,Ps和Pn分別為信號(hào)功率和噪聲功率。
對(duì)所提出的AMCNN-BiGRU模型和MCNN-LSTM等其他經(jīng)典模型在下采樣后的帶有噪聲的信號(hào)上進(jìn)行了對(duì)比測(cè)試。其中,CNN、LSTM(long short-term memory)和BiGRU模型的網(wǎng)絡(luò)結(jié)構(gòu)盡量保持與MCNN-LSTM和AMCNN-BiGRU模型對(duì)應(yīng)的模塊相同,為了保證試驗(yàn)的可靠性,部分相關(guān)超參數(shù)的設(shè)置保持與3.1節(jié)試驗(yàn)設(shè)置部分相同,詳細(xì)模型介紹如表4所示。以CNN為例,In[250×1],50C[20×1],P[2×1],De[10]分別為尺寸為250×1的輸入,50個(gè)尺寸為20×1的卷積核,池化層大小為2×1,神經(jīng)元個(gè)數(shù)為10的Dense層,花括號(hào)表示包含兩個(gè)并行的卷積通道。對(duì)比的噪聲范圍為-2~10 dB,其診斷準(zhǔn)確率如表5所示。根據(jù)表5的具體結(jié)果繪制了這5種方法在不同噪聲環(huán)境下的準(zhǔn)確率對(duì)比圖,如圖8所示。由圖8可知,隨著SNR的增加,每個(gè)模型的準(zhǔn)確率都在穩(wěn)步提升,在SNR=-2 dB時(shí),LSTM的準(zhǔn)確率最低僅為68%,所提出的模型與BiGRU可以取得相對(duì)較好的結(jié)果,但也只有80%左右,可以看出在高噪聲環(huán)境下模型的診斷效果均有待提高。在SNR達(dá)到4以上時(shí),其他4種模型的準(zhǔn)確率比較接近,而所提模型的準(zhǔn)確率提高了8%左右。在SNR=10 dB時(shí),所有模型均可以取得較高的診斷結(jié)果,其中本模型的準(zhǔn)確率更是達(dá)到了99.55%,基本可以忽略噪聲的影響,驗(yàn)證了模型具有很好的魯棒性。
表4 不同模型的相關(guān)參數(shù)Tab.4 Relevant parameters for different models
表5 不同模型在不同噪聲環(huán)境下的診斷結(jié)果Tab.5 Diagnosis results of different models in different noise environments
圖8 不同噪聲環(huán)境下的不同模型對(duì)比圖Fig.8 Comparison of different models in different noise environments
3.3.1 數(shù)據(jù)的描述和劃分
為了驗(yàn)證本模型在不同軸承環(huán)境下的通用性,采用江南大學(xué)的軸承數(shù)據(jù)集,試驗(yàn)裝置包括電動(dòng)機(jī)、信號(hào)記錄儀和加速度傳感器等[19]。該數(shù)據(jù)集分別在轉(zhuǎn)速為600 r/min,800 r/min和1 000 r/min下采集數(shù)據(jù),采樣頻率為50 kHz。故障由線切割加工制作而成,包括健康、內(nèi)圈故障、外圈故障和滾動(dòng)體故障4種健康狀態(tài)。
本次試驗(yàn)選取3種不同轉(zhuǎn)速下的軸承數(shù)據(jù),具體數(shù)據(jù)集描述如表6所示。根據(jù)轉(zhuǎn)速將其劃分為數(shù)據(jù)集A,B和C,其中樣本長(zhǎng)度同樣利用下采樣技術(shù)進(jìn)行裁剪,由2 000裁剪成250個(gè)數(shù)據(jù)點(diǎn)。同樣對(duì)每個(gè)數(shù)據(jù)集采用7∶1.5∶1.5隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集用于模型訓(xùn)練和測(cè)試,其中訓(xùn)練集樣本總數(shù)量為672,驗(yàn)證集和測(cè)試集樣本總數(shù)量均為144,共計(jì)960個(gè)樣本。
表6 江南大學(xué)軸承數(shù)據(jù)集描述Tab.6 Description of Jiangnan University bearing dataset
3.3.2不同負(fù)載下的試驗(yàn)
為了證明本模型在不同負(fù)載下依然能夠保持較高的準(zhǔn)確率,對(duì)于不同轉(zhuǎn)速的數(shù)據(jù)集A,B,C分別進(jìn)行試驗(yàn),同時(shí)將本模型與一些改進(jìn)的CNN模型[20]進(jìn)行對(duì)比,診斷結(jié)果如表7所示。可以看出本模型明顯優(yōu)于其他3種模型,尤其是在數(shù)據(jù)集B,C上可以達(dá)到100%的準(zhǔn)確率。在數(shù)據(jù)集A上的表現(xiàn)稍差一點(diǎn),但仍然比其他3種模型高出7%以上。證實(shí)了本模型能夠適應(yīng)在不同負(fù)載情況下對(duì)軸承健康狀態(tài)進(jìn)行診斷。同時(shí),對(duì)比兩個(gè)案例中CWRU和江南大學(xué)數(shù)據(jù)集的診斷結(jié)果發(fā)現(xiàn),其準(zhǔn)確率均接近100%,說明本模型在不同數(shù)據(jù)集下都能夠準(zhǔn)確的識(shí)別出軸承的故障類型,而不是僅適用于某個(gè)特定的數(shù)據(jù)集。
表7 不同工況下的不同模型的準(zhǔn)確率對(duì)比
通常來說,神經(jīng)網(wǎng)絡(luò)模型都被視為一個(gè)黑匣子,很難理解其內(nèi)部運(yùn)行機(jī)制。為了更好的理解模型每層的操作過程,以CWRU數(shù)據(jù)集中外圈故障的振動(dòng)信號(hào)作為模型輸入信號(hào)為例,模型分類過程中每一層神經(jīng)元的激活狀態(tài)進(jìn)行了可視化,如圖9所示。采用亮度漸變方式表示激活的程度,深灰色表示神經(jīng)元沒有激活,淺灰色表示神經(jīng)元最大激活??梢钥闯?模型是如何將一段原始的難以理解的振動(dòng)信號(hào)逐漸轉(zhuǎn)化為最后所輸出的故障標(biāo)簽。低層可以很好包含原始振動(dòng)信號(hào)的振蕩信息,但隨著層數(shù)的加深,所提取的特征越來越抽象,關(guān)于類別內(nèi)在信息就越多,到最后一層則僅包含類別的關(guān)鍵信息,即為對(duì)應(yīng)的故障標(biāo)簽。
同時(shí),為了驗(yàn)證所提出的方法能夠自動(dòng)從原始振動(dòng)信號(hào)中提取特征無需人工處理,可視化了樣本在AMCNN-BiGRU模型上的神經(jīng)元表達(dá)。10種狀態(tài)的軸承故障信號(hào)在經(jīng)過注意力模塊后的神經(jīng)元激活表達(dá),如圖10所示。圖10中:深灰色表示神經(jīng)元沒有激活;淺灰色表示神經(jīng)元最大激活。由圖10可知,經(jīng)過卷積模塊和注意力模塊后,不同故障類型的信號(hào),激活A(yù)MCNN-BiGRU第二個(gè)特征融合層的神經(jīng)元個(gè)數(shù)與位置也不相同。因此可證實(shí)本方法可以從原始振動(dòng)信號(hào)中自動(dòng)提取相應(yīng)的特征,而無需人工干預(yù)。
圖10 10種故障類型經(jīng)過注意力模塊后的神經(jīng)元表達(dá),淺灰為最大激活,深灰色為未激活Fig.10 Neuron expression of ten fault types after passing through the attention module, light gray is maximal activation, dar grey is non-activation
在圖11中將t-SNE方法應(yīng)用于不同層的可視化,其中不同的顏色表示不同的故障標(biāo)簽。首先,可以看出隨著模型的不斷深入,不同標(biāo)簽之間分布邊界逐漸清晰,可分性越來越好。比較圖11(a)~圖11(c),可以看出卷積模塊初步提取了特征,通過ECA-net注意力模塊進(jìn)一步分離了部分冗雜在一起的標(biāo)簽,如標(biāo)簽3、標(biāo)簽5、標(biāo)簽9。最后,通過BiGRU分類器模塊提取不同位置的隱藏特征對(duì)樣本進(jìn)行分類。證實(shí)了注意力模塊的引入有助于樣本分類,及本模型最終能夠?qū)λ袠颖具M(jìn)行正確分類。
圖11 不同層的可視化Fig.11 Visualization of different layers
為了進(jìn)一步解釋注意力機(jī)制的效果,使用Grad_CAM可視化方法提取注意力機(jī)制的卷積核特征圖來計(jì)算類激活映射圖,如圖12所示。
圖12 Grad-CAM下10種軸承狀態(tài)的可視化Fig.12 Visualization of ten bearing states under Grad-CAM
隨著顏色級(jí)別的提高,特征區(qū)分度就越高,用虛線矩形框圈出了CAM較高的部分??梢园l(fā)現(xiàn),正常狀態(tài)(標(biāo)簽0)下的CAM值基本都處于中等級(jí)別,而對(duì)于不同故障類型的CAM值多位于級(jí)別兩端且激活位置和區(qū)域大小也不相同,說明不同狀態(tài)下注意力機(jī)制所重視的通道不同,所以無需人工干預(yù)也可以有效區(qū)分故障類型。
提出了一種新的端到端的滾動(dòng)軸承故障診斷方法。模型包括卷積模塊、注意力模塊和分類器模塊。利用多尺度CNN從經(jīng)過下采樣裁剪的原始振動(dòng)信號(hào)中提取特征,并通過注意力機(jī)制對(duì)不同通道的特征進(jìn)行權(quán)重劃分,然后輸入到由BiGRU組成的分類器模塊中,最后通過Softmax函數(shù)將神經(jīng)元輸出轉(zhuǎn)換為滾動(dòng)軸承故障的概率分布。
所提出的AMCNN-BiGRU模型具有以下特點(diǎn):
(1) 可以適應(yīng)經(jīng)過下采樣的一維原始振動(dòng)信號(hào)作為輸入,在大大降低數(shù)據(jù)量從而縮短模型訓(xùn)練時(shí)間的同時(shí)依然能夠保持高準(zhǔn)確率。
(2) 利用ECA-net注意力機(jī)制可以有效對(duì)不同通道特征進(jìn)行權(quán)重劃分,彌補(bǔ)了通道特征丟失、卷積局部視野難以掌握全局特征的缺點(diǎn)。
(3) 無需人工干預(yù),即可直接從原始信號(hào)中自動(dòng)學(xué)習(xí)特征,并通過不同網(wǎng)絡(luò),充分挖掘原始信號(hào)中的空間特征和時(shí)間特征,最后訓(xùn)練的模型能夠準(zhǔn)確地識(shí)別不同的故障狀態(tài)。在CWRU和江南大學(xué)軸承數(shù)據(jù)集上驗(yàn)證了本方法的可行性,且診斷準(zhǔn)確率可以達(dá)到100%。通過多種可視化的分析,也印證所提出的方法具有良好的效果。