楊淑潔,周楊
(浙江海洋大學(xué) 海洋工程裝備學(xué)院,浙江 舟山 316022)
軸承是旋轉(zhuǎn)機(jī)械的重要組成部分之一[1],它的性能好壞直接能影響到與之相連接的機(jī)器設(shè)備的運(yùn)行狀況。一旦軸承發(fā)生故障,輕則導(dǎo)致機(jī)器停機(jī),重則導(dǎo)致人員傷亡,這勢(shì)必會(huì)給企業(yè)的安全生產(chǎn)和經(jīng)濟(jì)收入帶來影響。所以,軸承故障的診斷成為了國內(nèi)外研究的熱點(diǎn)領(lǐng)域之一。
滾動(dòng)軸承是一種標(biāo)準(zhǔn)件,其基本結(jié)構(gòu)由內(nèi)圈、外圈、滾動(dòng)體、保持架4個(gè)部分組成,這4個(gè)部分是易發(fā)生故障的地方。當(dāng)滾動(dòng)軸承出現(xiàn)故障時(shí),會(huì)產(chǎn)生異常的振動(dòng)信號(hào)。因此,可以將振動(dòng)信號(hào)作為軸承故障診斷的特征信號(hào)[2]。
軸承故障診斷主要圍繞著故障特征提取和分類的問題進(jìn)行研究。文獻(xiàn)[3]提出了經(jīng)驗(yàn)?zāi)J椒纸?Empirical Mode Decomposition, EMD),這是一種新型自適應(yīng)信號(hào)的時(shí)頻處理方法,特別適用于非線性非平穩(wěn)信號(hào)的分析處理。文獻(xiàn)[4]針對(duì)EMD方法存在模態(tài)混疊的問題,采用噪聲輔助分析,提出了集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition, EEMD),能夠有效抑制模態(tài)混疊的問題。
傳統(tǒng)滾動(dòng)軸承故障診斷通過時(shí)域或頻域分析進(jìn)行故障分類是比較困難的[5],近幾年隨著機(jī)器學(xué)習(xí)和人工智能的發(fā)展,越來越多的學(xué)者將機(jī)器學(xué)習(xí)當(dāng)中的算法引入到機(jī)械的故障診斷當(dāng)中。文獻(xiàn)[6]提出了一種改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)與支持向量機(jī)(Support Vector Machine, SVM)相結(jié)合的方法,實(shí)驗(yàn)結(jié)果表明該方法在針對(duì)電動(dòng)機(jī)軸承微小故障的智能識(shí)別具有很高的準(zhǔn)確性。文獻(xiàn)[7]提出了一種基于長短時(shí)記憶網(wǎng)絡(luò)(Long Short-Term Memory Networks, LSTM)與遷移學(xué)習(xí)(Transfer Learning, TL)相結(jié)合的方法,實(shí)現(xiàn)了基于聲發(fā)射技術(shù)對(duì)滾動(dòng)軸承的智能分類。文獻(xiàn)[8]提出了一種基于隨機(jī)搜索與長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承故障狀態(tài)識(shí)別算法,通過LSTM模型實(shí)現(xiàn)了從原始數(shù)據(jù)出發(fā)對(duì)軸承的故障數(shù)據(jù)信號(hào)進(jìn)行特征提取和學(xué)習(xí),無需人工干預(yù),進(jìn)而可以對(duì)軸承故障的分類。文獻(xiàn)[9]提出了一種基于BP(Back Propagation, BP)神經(jīng)網(wǎng)絡(luò)滾動(dòng)軸承故障診斷的多尺度局部特征學(xué)習(xí)方法,相對(duì)于傳統(tǒng)的人為選擇故障特征而言,此智能故障診斷技術(shù)能夠更好地利用原始數(shù)據(jù),自適應(yīng)地從原始數(shù)據(jù)中學(xué)習(xí)故障特征,從而提高了故障診斷的準(zhǔn)確性。
針對(duì)滾動(dòng)軸承在發(fā)生故障時(shí),目標(biāo)振動(dòng)信號(hào)的不穩(wěn)定性和非線性導(dǎo)致故障特征難以提取,并且軸承的故障振動(dòng)信號(hào)是屬于時(shí)間序列數(shù)據(jù)且包含多種故障情況,為了提高故障分類問題的準(zhǔn)確性,本文提出了一種基于EEMD與LSTM神經(jīng)網(wǎng)絡(luò)相結(jié)合的滾動(dòng)軸承故障識(shí)別的方法。將軸承的振動(dòng)信號(hào)經(jīng)EEMD處理,得到了若干個(gè)本征模態(tài)函數(shù)(Intrinsic Mode Function, IMF)分量。為了剔除IMF分量當(dāng)中的虛假分量,選出其中最能反映振動(dòng)信號(hào)特征的分量,利用主成分分析法(Principal Component Analysis, PCA)對(duì)IMF分量進(jìn)行降維。然后在計(jì)算降維后的分量占各自總能量的比例,把能量比所組成的特征向量作為LSTM神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù)進(jìn)行故障識(shí)別,將識(shí)別結(jié)果與EMD-BP、EEMD-KNN不同的故障分類模型所得的結(jié)果進(jìn)行對(duì)比,結(jié)果表明,本文所用的方法對(duì)軸承故障識(shí)別的準(zhǔn)確率更高。
EEMD是基于EMD改進(jìn)而來,在原有信號(hào)基礎(chǔ)之上加入白噪聲,利用白噪聲頻譜均勻分布的特點(diǎn)有效解決了EMD所出現(xiàn)的模態(tài)混疊現(xiàn)象。EEMD算法分解目標(biāo)振動(dòng)信號(hào)的步驟如下[10]:
1)確定EEMD的運(yùn)算次數(shù)r和高斯白噪聲的標(biāo)準(zhǔn)差σ。
2)在原始信息x(t)的基礎(chǔ)之上,加入白噪聲hi(t),得到了新的信息xi(t),其中i=1,2,3…,r,代表第i次分解:
目標(biāo)振動(dòng)信號(hào)經(jīng)EEMD分解之后得到若干個(gè)IMF分量,在這些分量中,會(huì)存在一些虛假分量,它們的存在會(huì)影響后續(xù)LSTM神經(jīng)網(wǎng)絡(luò)分類的準(zhǔn)確性。因此,為了去除這些虛假分量,選出其中最能反映目標(biāo)振動(dòng)信號(hào)特征的分量,需要對(duì)各分量進(jìn)行降維。
PCA是一種無監(jiān)督學(xué)習(xí),屬于數(shù)據(jù)降維的一種重要方法。通過PCA算法可以將原始數(shù)據(jù)從一個(gè)高維空間映射到低維度空間,其本質(zhì)就是把原有的多個(gè)指標(biāo)轉(zhuǎn)化成幾個(gè)代表性好的綜合指標(biāo),這幾個(gè)指標(biāo)能夠反映原來指標(biāo)大部分的信息,并且各個(gè)指標(biāo)之間保持獨(dú)立。
利用PCA算法對(duì)EEMD分解后得到的j個(gè)IMF分量進(jìn)行降維的過程如下[11]:
1)假設(shè)每組IMF分量中有j個(gè)IMF分量,每個(gè)分量有p個(gè)變量,則樣本矩陣X如下:
4)計(jì)算標(biāo)準(zhǔn)化后的矩陣的相關(guān)系數(shù)矩陣和特征值λk,將其特征值從大到小排序。
5)根據(jù)主成分的累計(jì)貢獻(xiàn)率φ大于85%的原則,計(jì)算前q(q<j)個(gè)主成分累計(jì)貢獻(xiàn)率φ,從而起到了降維的作用。
不同故障狀態(tài)下,軸承振動(dòng)信號(hào)的能量分布是不同的,因此,利用這一特點(diǎn)計(jì)算IMF主成分分量的能量占總能量的比例,將其作為LSTM神經(jīng)網(wǎng)絡(luò)故障識(shí)別的輸入?yún)?shù)。提取能量特征的步驟如下[12]:
1)目標(biāo)振動(dòng)信號(hào)經(jīng)EEMD分解和PCA降維之后,得到了q個(gè)IMF主成分分量,計(jì)算各分量的能量
LSTM是在循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)的基礎(chǔ)之上改進(jìn)而來,是一種RNN特殊的類型。通過增加遺忘門、輸入門及輸出門的結(jié)構(gòu)來選擇性地決定信息的保留和遺忘[13],從而解決了RNN在較長時(shí)間序列訓(xùn)練過程中產(chǎn)生的梯度爆炸和梯度消失的問題。其中,遺忘門主要決定從細(xì)胞狀態(tài)中遺忘什么信息,輸入門決定向細(xì)胞狀態(tài)更新信息,輸出門決定向細(xì)胞狀態(tài)中更新信息[14]。LSTM的單元結(jié)構(gòu)示意圖如圖1所示,計(jì)算過程的公式如下:
圖1 LSTM單元結(jié)構(gòu)示意圖
針對(duì)滾動(dòng)軸承在發(fā)生故障時(shí),故障振動(dòng)信號(hào)的不穩(wěn)定性和非線性導(dǎo)致故障特征難以提取并且軸承的故障振動(dòng)信號(hào)是屬于時(shí)間序列數(shù)據(jù)且包含多種情況,為了提高故障分類問題的準(zhǔn)確性的這一情況,提取了一種基于EEMD-PCA與LSTM 神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承故障識(shí)別的流程如圖2所示,此方法的步驟如下:
圖2 故障識(shí)別的流程圖
1)分別采集不同工況狀態(tài)下的滾動(dòng)軸承的振動(dòng)信號(hào),利用EEMD算法對(duì)滾動(dòng)軸承的振動(dòng)信號(hào)進(jìn)行分解,得到了若干個(gè)本征模態(tài)函數(shù)分量IMF。
2)在這些經(jīng)分解后的若干個(gè)IMF分量中,會(huì)存在一些虛假分量,它們的存在會(huì)影響后續(xù)LSTM神經(jīng)網(wǎng)絡(luò)分類的準(zhǔn)確性。為了去除虛假分量,提高LSTM神經(jīng)網(wǎng)絡(luò)的識(shí)別率,可以利用主成分分析法對(duì)這若干個(gè)IMF分量進(jìn)行降維,選出其中最能反映目標(biāo)振動(dòng)信號(hào)的特征分量。
3)計(jì)算IMF主成分分量占各自總能量的比例,再將能量比作為LSTM神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù)。
4)將數(shù)據(jù)集劃分成訓(xùn)練集和測(cè)試集,用于LSTM神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練和測(cè)試。
5)將訓(xùn)練集作為LSTM神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù)進(jìn)行訓(xùn)練,最終得到了軸承的故障識(shí)別模型。然后再將測(cè)試集輸入到已經(jīng)訓(xùn)練好了的模型當(dāng)中去,將其輸出的結(jié)果與實(shí)際結(jié)果進(jìn)行對(duì)比來判斷模型的識(shí)別率。
為了驗(yàn)證本文所提出的EEMD-PCA與LSTM神經(jīng)網(wǎng)絡(luò)的有效性,本文利用軸承的故障數(shù)據(jù)對(duì)該算法進(jìn)行了仿真驗(yàn)證。仿真采用的實(shí)驗(yàn)數(shù)據(jù)來自美國凱斯西儲(chǔ)大學(xué)(Case Western Reserve University,CWRU)軸承數(shù)據(jù)中心[15],該數(shù)據(jù)集被廣泛用于軸承的故障診斷領(lǐng)域,所以,該數(shù)據(jù)被本領(lǐng)域所公認(rèn)有效。如圖3從左至右所示,實(shí)驗(yàn)器材有電動(dòng)機(jī)、轉(zhuǎn)矩傳感器、編碼器、測(cè)力計(jì)、測(cè)功器。被測(cè)軸承為6250-2RS JEM KSF,深溝球軸承,軸承直徑為0.1778 mm。采樣頻率為12 kHz,主軸轉(zhuǎn)速為1772 r/min。使用的是驅(qū)動(dòng)端(DE)軸承故障數(shù)據(jù),采用電火花技術(shù)進(jìn)行加工以模擬其故障,故障直徑為0.1778 mm。包括內(nèi)圈、外圈、滾動(dòng)體故障,其中外圈故障采用的是以負(fù)荷區(qū)6點(diǎn)鐘方向?yàn)橹行牡?點(diǎn)鐘方向的數(shù)據(jù)。每種故障共有12組數(shù),每組取4100個(gè)數(shù),8組訓(xùn)練組,4組測(cè)試組。
圖3 實(shí)驗(yàn)器材圖
圖4所示分別為軸承在滾動(dòng)體故障、內(nèi)圈故障、外圈故障、正常4種情況下振動(dòng)信號(hào)的時(shí)域圖和頻域圖。
圖4 軸承在不同情況下振動(dòng)信號(hào)的時(shí)域和頻域圖
根據(jù)Huang等[3]推薦的標(biāo)準(zhǔn)可知,本文的高斯白噪聲標(biāo)準(zhǔn)差選為0.2,平均運(yùn)算次數(shù)選為100,利用EEMD算法對(duì)軸承外圈故障的振動(dòng)信號(hào)進(jìn)行處理,得到了如圖5所示的IMF分量。
圖5 軸承外圈故障信號(hào)EEMD分解圖
從EEMD分解圖可以看出,軸承外圈故障信號(hào)可以分解為13組IMF分量。在這些分量中存在一些虛假分量,它們的存在會(huì)影響后續(xù)LSTM神經(jīng)網(wǎng)絡(luò)分類的準(zhǔn)確性。為了去除虛假分量,提高LSTM神經(jīng)網(wǎng)絡(luò)的識(shí)別率,可以利用主成分分析法對(duì)這若干個(gè)IMF分量進(jìn)行降維,選出其中最能反映目標(biāo)振動(dòng)信號(hào)特征的分量。表1是軸承外圈故障信號(hào)的所有IMF分量的貢獻(xiàn)率。
表1 軸承外圈故障信號(hào)的IMF分量的貢獻(xiàn)率
根據(jù)PCA的選取原則可知,選取表1的前8個(gè)主成分。同理可得,分別對(duì)軸承在正常情況下、內(nèi)圈故障、滾動(dòng)體故障進(jìn)行處理,各分量的累計(jì)貢獻(xiàn)率如表2所示。
表2 軸承在不同工況下各主成分的貢獻(xiàn)率
由表2可知,軸承在正常情況下、內(nèi)圈故障下、滾動(dòng)體故障下的IMF分量在經(jīng)過主成分分析法處理后,前8組主成分的累計(jì)貢獻(xiàn)率分別是90.660%、88.912%、89.704%,其值均大于85%。
利用式(8)和式(9)可以分別計(jì)算出軸承外圈的IFM主成分分量的能量比,如表3所示。
表3 軸承外圈IMF主成分分量的能量比
同理,可分別計(jì)算出軸承在正常情況下、內(nèi)圈故障下、滾動(dòng)體故障下IMF主成分分量的能量比,由于篇幅有限,此處僅給出3種情況下的4組樣本的IMF主成分分量能量比,如表4所示。
表4 軸承在不同工況下IMF主成分分量的能量比
再將訓(xùn)練集的IMF主成分分量的能量比作為特征向量輸入到LSTM神經(jīng)網(wǎng)絡(luò)當(dāng)中去進(jìn)行訓(xùn)練。從軸承的每種工況下隨機(jī)抽取8組作為訓(xùn)練樣本,4組作為測(cè)試樣本。為了更好地進(jìn)行LSTM神經(jīng)網(wǎng)絡(luò)訓(xùn)練,需要對(duì)軸承在不同工況下的IMF主成分分量的能量比進(jìn)行標(biāo)簽分類處理,處理結(jié)果如表5所示。
表5 軸承故障數(shù)據(jù)標(biāo)簽分類處理
LSTM神經(jīng)網(wǎng)絡(luò)測(cè)試的結(jié)果如表6所示,任取其中的一次訓(xùn)練過程如圖6所示。
圖6 LSTM神經(jīng)網(wǎng)絡(luò)訓(xùn)練進(jìn)度圖
表6 LSTM神經(jīng)網(wǎng)絡(luò)測(cè)試的結(jié)果
為了驗(yàn)證EEMD-PCA 與LSTM神經(jīng)網(wǎng)絡(luò)方法的有效性,在相同的數(shù)據(jù)下與EMDBP神經(jīng)網(wǎng)絡(luò)[16]、EEMD-KNN[17]進(jìn)行對(duì)比,取其中的一次誤差迭代曲線如圖7所示。
圖7 誤差迭代曲線
對(duì)比表7可知,在識(shí)別軸承故障狀態(tài)時(shí),本文的故障診斷模型分類正確率分別高于EMD-BP、EEMD-KNN故障診斷模型的分類正確率,由此可知,本文所采用的方法可以有效地進(jìn)行軸承的故障識(shí)別。
表7 不同模型下的分類正確率 %
本文提出了一種基于EEMD-PCA與LSTM神經(jīng)網(wǎng)絡(luò)相結(jié)合的滾動(dòng)軸承故障識(shí)別的方法,首先對(duì)軸承不同狀態(tài)下的目標(biāo)振動(dòng)信號(hào)進(jìn)行EEMD分解,得到了若干個(gè)IMF分量。在這些IMF分量中,會(huì)存在一些虛假分量,它們的存在會(huì)影響后續(xù)LSTM神經(jīng)網(wǎng)絡(luò)分類的準(zhǔn)確性。為了去除這些虛假分量,選出其中最能反映目標(biāo)振動(dòng)信號(hào)特征的分量,可以利用PCA算法對(duì)各分量進(jìn)行降維。然后再計(jì)算IMF主成分分量的能量占各自總能量的比例,將能量比所組成的特征向量作為LSTM神經(jīng)網(wǎng)絡(luò)故障識(shí)別的輸入?yún)?shù)。最后將識(shí)別結(jié)果與EMD-BP、EEMD-KNN所得的結(jié)果進(jìn)行對(duì)比,對(duì)比結(jié)果表明,本文所提出的方法在進(jìn)行軸承的故障診斷上更具有優(yōu)勢(shì),從而驗(yàn)證了該方法的有效性。