陳軻,黃民,李一鳴
(北京信息科技大學 機電工程學院,北京 100192)
滾動軸承作為旋轉機械的核心部件之一,其故障狀態(tài)關乎整個機械設備的可靠性[1]。而由于長期處于復雜的工況下,滾動軸承不可避免地會發(fā)生損傷[2]。因此,為了避免事故發(fā)生以及減少經濟損失,針對滾動軸承的故障診斷是十分必要的。
在軸承故障診斷中,振動信號能夠很好地反映出故障狀態(tài),且振動信號的檢測不受機械結構的影響,因此,如何從振動信號中提取特征信息是判斷軸承故障類型的關鍵。常用的特征提取方法包括經驗模態(tài)分解(empirical mode decomposition,EMD)[3]、小波變換(wavelet transform,WT)[4]、變分模態(tài)分解(variational mode decomposition,VMD)[5]等等。王一鵬等[6]將軸承的振動信號進行小波分解及重構,提取混合特征,通過t分布隨機近鄰嵌入(t-distribution stochastic neighbour embedding,t-SNE)方法將樣本數據集降維,觀測樣本集的數據分布,最后通過支持向量機(support vector machine,SVM)進行故障分類。谷玉海等[7]將軸承的振動信號通過EMD轉化為二值化圖像,將二值化圖像作為卷積神經網絡(convolutional neural network,CNN)的輸入得到訓練模型,與訓練好的模型作對比,確定故障類型。韓朋朋等[5]通過將峭度與包絡熵組合得到遺傳算法的適應度函數,進行參數尋優(yōu),對最優(yōu)參數進行增強包絡譜分析,提升軸承故障診斷的準確率。這類方法大多網絡結構淺,在復雜的工況下,診斷效果較差。
近年來隨著人工智能等技術發(fā)展,深度學習逐步應用于故障診斷領域。深度學習彌補了淺層網絡模型難以從海量數據中挖取表征軸承狀態(tài)的特征信息的不足,深度學習的深層網絡結構能夠直接從軸承的原始振動信號中提取特征,避免了手動提取信號特征的過程。謝錦陽等[8]將軸承特征信息進行注意力反向以及剪枝,凸顯重要特征,再通過長短時記憶網絡(long short-term memory network,LSTM)和全連接層進行故障分類。徐敏等[9]提出將反向注意力機制與LSTM相結合的軸承故障診斷方法,通過Inception網絡完成信號預處理,再經過融合雙向長短時記憶殘差網絡(fusion bidirectional LSTM residual network,FB-LSTM ResNet)完成故障特征的提取以及故障診斷分類。周俊宏等[10]將蝴蝶算法(butterfly optimization algorithm,BOA)優(yōu)化后的深度置信網絡(deep belief network,DBN)應用到軸承故障診斷中,提高模型故障診斷的精確度。茅健等[11]將卷積神經網絡與雙向長短時記憶網絡(bidrectional LSTM,BiLSTM)相結合,對原始信號進行特征提取,并在BiLSTM隱藏層中加入注意力機制,提高了故障診斷準確率。姚齊水等[12]提出一種基于改進Inception V2模塊和卷積注意力模塊(convolutional block attention module,CBAM)的軸承故障診斷方法,可以優(yōu)化網絡結構并加快模型收斂速度。
盡管上述方法取得相對不錯的診斷效果,但是軸承特征提取不充分,無法自適應提高模型對重要特征的關注程度,且故障診斷率有待提升。對此,本文提出一種融合CNN-LSTM和注意力機制的軸承故障診斷方法。軸承的原始振動信號作為模型的輸入,通過CNN模塊提取振動信號的特征信息,再通過注意力機制對特征信息分配權重,提高模型對關鍵信息的關注程度后輸入LSTM模塊,進一步提取時序特征,最后通過全連接層完成對軸承狀態(tài)的識別和分類。
CNN作為前饋神經網絡,通過利用局部相關性以及權值共享的思想,減少神經網絡的參數量,達到更高的訓練效率。CNN主要由卷積層、池化層以及全連接層3部分組成。卷積層通過卷積核對每個通道的矩陣進行互相關運算來提取數據的特征信息,再通過非線性激活函數,增加模型的表達能力。卷積層的計算公式如下:
(1)
池化層的作用是減少特征圖實現(xiàn)尺寸縮減,簡化網絡計算的復雜度;同時對特征進行壓縮,保留顯著特征,防止過擬合。池化層通常夾在連續(xù)的卷積層之間。全連接層的作用是將卷積層以及池化層計算得到的特征整合,映射到樣本空間中。全連接層通常放在卷積神經網絡結構的最后。
LSTM由科學家Hochreiter和Schmidhuber[13]于1997年提出。作為循環(huán)神經網絡(recurrent neural network,RNN)的優(yōu)秀變種模型,LSTM繼承了RNN的大部分特性。相對于RNN,其記憶力更強,更擅長于處理長序列信號數據。
LSTM引入門控機制,通過利用3個門控:輸入門、遺忘門和輸出門來控制信息的遺忘和刷新。其神經元結構如圖1所示。
圖1 LSTM神經元結構
ft=σ(Wf[ht-1,xt]+bf)
(2)
(3)
it=σ(Wi[ht-1,xt]+bi)
(4)
(5)
ot=σ(Wo[ht-1,xt]+bo)
(6)
ht=ot*tanh(ct)
(7)
式中:σ為Sigmoid激活函數;W和b為對應門的參數張量。
注意力機制是借鑒人類視覺的特有的信號處理機制。當人將注意力轉移到圖像重點區(qū)域時,會對該區(qū)域投入更多的注意力資源,并忽略無關部分。注意力機制本質上可以看成基于輸入圖像的特征動態(tài)調整權重的過程,通過相似度計算捕獲每一個特征信息的重要程度,再通過分配權重讓模型提高對重要特征的關注程度,并抑制無用特征。注意力機制已經成為計算機視覺、深度學習領域不可或缺的技術。
本文采用的注意力模型為高效通道注意力(efficient channel attention,ECA)網絡。ECA網絡由Wang等[14]首次提出。ECA模塊通過Sigmoid函數學習通道注意力,通過快速進行大小為k的一維卷積來生成每個通道的權重值s,將歸一化權重和原輸入X逐通道相乘,生成加權后的輸出Y。以此,讓神經網絡重點關注權重值大的通道,并抑制權重值低的特征通道。相比于SE模塊,該模塊避免了降維,并有效地捕獲了跨通道之間的交互。計算公式如下:
s=FECA(X,θ)=σ(Conv1D(GAP(X)))
(8)
Y=sX
(9)
(10)
式中:s為ECA模塊通道的權重值;X為輸入;θ為通道數;σ為Sigmoid激活函數;Conv1D表示穿過通道域的核為k的一維卷積;GAP表示全局平均池化;Y為輸出;k為局部跨通道交互的覆蓋范圍,通過通道維度C的映射自適應確定;γ和b為超參數;|·|odd表示求最近的奇數。
整體模型由CNN模塊、注意力模塊和LSTM模塊組成。傳統(tǒng)的CNN模型盡管能從軸承的原始振動信號中提取形狀特征,但是卻難以捕捉振動信號在時間序列上的特性,從而丟失時間序列的相關特征。LSTM通過特殊的門控機制能有效處理與時序高度相關的問題,學習振動信號中的時序特征。同時,注意力機制能夠對輸入的特征動態(tài)賦予權重,提高重要特征的表達能力,抑制無用的特征。故本文將幾個模塊融合,提出基于CNN-LSTM和注意力機制的軸承故障診斷方法。
本文采用的模型包括2個卷積池化層,1個注意力層、1個LSTM層、1個全連接層以及1個Softmax層,模型結構如圖2所示,其中BN層為批歸一化層,ReLU為激活函數。輸入信號長度為2 048,為了讓模型獲得較大感受野,將第一層的卷積步長設置為16,大小設置為64×1。為了抑制過擬合,將Dropout比率設置為0.5。Softmax層輸出為10種故障類別的概率,具體參數如表1所示。
圖2 模型結構
表1 模型的結構參數
本文仿真實驗環(huán)境為Windows10,采用Tensorflow2.0學習框架,計算機配置為AMD R7-5800H CPU,內存為16 GB。
實驗數據來自凱斯西儲大學(Case Western Reserve University,CWRU)軸承數據集。CWRU試驗臺主要由電機、扭矩傳感器和測功機組成,如圖3所示。本實驗的實驗對象為驅動端軸承,軸承型號為深溝球軸承6205-2RS JEMSKF。系統(tǒng)信號采樣頻率為12 kHz。實驗軸承通過電火花加工而引入單點故障,故障類型分為滾動體損傷、內圈損傷以及外圈損傷3種,損傷直徑分為0.178 mm、0.356 mm以及0.533 mm 3種,共計9種故障類別。
圖3 CWRU軸承試驗臺
本實驗數據集分別取電機轉速為1 797 r/min、1 772 r/min、1 750 r/min及1 730 r/min下滾動體、內圈、外圈正常及故障數據,外圈損傷位置在6點鐘方向。每個數據集包含7 000個訓練樣本、2 000個測試樣本,每個樣本包含2 048個數據點。其中,訓練樣本進行數據增強。數據集詳細信息如表2所示。
表2 數據集描述
實驗采用小批量訓練方法,將批大小設置為128,訓練次數為60次。將Adam算法學習率設置為0.001。為驗證訓練結果的可靠性,將每個數據集訓練20次,并取平均值作為最終結果。
3.3.1 對比傳統(tǒng)信號處理方法
如圖4所示為滾動軸承滾動體、內圈和外圈故障原始振動信號的時域圖和頻譜圖。
圖4 軸承典型故障振動信號的時域圖和頻譜圖
由圖可以看出,在時域圖和頻譜圖的波形中很難直接識別出故障沖擊信號。通過傳統(tǒng)信號處理方法如短時傅里葉變換、小波變換、魏格納分布、自適應時頻分析方法等實現(xiàn)振動信號的降噪以及分離,需合理選擇某一分解后的分量,通過包絡分析提取軸承的故障特征頻率從而實現(xiàn)故障分類。而本文模型直接將原始振動信號輸入神經網絡中,避免了手動提取時域特征、頻域特征。
3.3.2 模型穩(wěn)定性
模型在不同電機轉速下數據集的故障識別準確率如圖5所示,由圖可知,經過20次訓練,模型的數據集識別率均超過99%,其中,模型在轉速為1 750 r/min和1 730 r/min下故障識別準確率最高且最穩(wěn)定,準確率均不低于99.9%。
圖5 模型在不同電機轉速下數據集的故障識別準確率
3.3.3 模型性能分析
以轉速1 730 r/min最后一次訓練為例,訓練的準確率和損失如圖6所示。在訓練次數為4時,訓練集的準確率達到100%,損失由0.847 2降到0.0048;測試集的準確率達到97.6%,損失由0.8749降至0.0614。在訓練次數為7時,訓練集的準確率達到100%,損失降至0.004 3;測試集的準確率達到100%,損失降至0.004 7。此時,模型收斂且趨于穩(wěn)定。本文模型在經過較少的訓練次數后,可達到較高的準確率和較低的損失值。
3.3.4 故障診斷結果對比
為了驗證本文模型的優(yōu)勢,將本文方法與CNN、LSTM、CNN-LSTM診斷結果進行對比,將20次訓練平均值作為最終結果,每次訓練迭代次數設置為60次,如表3所示。本文方法平均準確率為99.83%,相對于CNN和LSTM模型,分別提高了11.63%和8.07%。本文模型擁有更高的故障診斷準確率,其綜合性能更優(yōu)秀。與未添加注意力機制的CNN-LSTM模型相比,本文模型平均準確率提高0.27%,說明注意力機制提高了模型的綜合性能。
圖6 故障診斷準確率和損失值
表3 對比實驗結果 %
本文提出一種結合CNN-LSTM和注意力機制的端對端軸承故障診斷模型。該模型以原始一維振動信號作為輸入,通過CNN和LSTM模塊自動提取特征信息,基于注意力機制自適應分配權重,突出重要特征,抑制無用特征,有效提高了模型的故障診斷精度。端對端的模型結構具有良好的通用性,避免了手動提取特征。
通過與其他模型作對比,本文模型的故障診斷能力更優(yōu)越,且診斷精度更高。與單一結構的算法如CNN和LSTM相比,本文模型具有更好的穩(wěn)定性。同時,本文模型在經過較少的迭代次數后,可達到較高的準確率和較低的損失值,模型的收斂速度快且穩(wěn)定。
然而,本文僅驗證定負載下模型的故障診斷能力,對于變負載的診斷能力以及噪聲環(huán)境的抗噪性能有待進一步研究。