金海龍, 馬吳旭, 孟 宗, 孫登云, 曹 偉, 樊鳳杰
(燕山大學(xué)電氣工程學(xué)院,河北秦皇島066000)
隨著國(guó)家“智能制造”戰(zhàn)略的逐漸推進(jìn),機(jī)械系統(tǒng)開(kāi)始朝著大型化、復(fù)雜化、智能化的方向發(fā)展[1]。滾動(dòng)軸承作為旋轉(zhuǎn)機(jī)械設(shè)備必不可少的零部件,其故障可能導(dǎo)致旋轉(zhuǎn)機(jī)械系統(tǒng)停機(jī)、性能下降甚至是巨大的經(jīng)濟(jì)損失及人員傷亡[2,3]。因此,滾動(dòng)軸承運(yùn)行狀態(tài)及時(shí)準(zhǔn)確地診斷對(duì)保證許多復(fù)雜機(jī)械系統(tǒng)安全可靠運(yùn)行起著至關(guān)重要的作用。傳統(tǒng)的基于振動(dòng)信號(hào)的故障診斷方法主要包括3個(gè)步驟:數(shù)據(jù)預(yù)處理,特征提取以及模式分類(lèi)。文獻(xiàn)[4]利用相空間重構(gòu)、奇異值分解及獨(dú)立分量分析完成了軸承故障信號(hào)中故障特征的有效提取,實(shí)現(xiàn)了軸承故障的高效識(shí)別。文獻(xiàn)[5]利用變分模態(tài)分解分解、均方根熵及支持向量機(jī)完成了滾動(dòng)軸承振動(dòng)信號(hào)故障特征參量的有效提取,實(shí)現(xiàn)滾動(dòng)軸承運(yùn)行狀態(tài)的有效監(jiān)測(cè)。雖然,上述方法在故障診斷中取得了一定的成就,但是,這些傳統(tǒng)故障診斷方法需要大量的先驗(yàn)知識(shí)和專(zhuān)業(yè)知識(shí)以及花費(fèi)大量的時(shí)間選取合適的特征[6]。近年來(lái),深度學(xué)習(xí)技術(shù)[7~9]為設(shè)備的故障診斷提供了強(qiáng)有力的數(shù)學(xué)工具,成為眾多研究者關(guān)注的焦點(diǎn)。文獻(xiàn)[10]結(jié)合對(duì)稱(chēng)點(diǎn)模式圖像和卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了轉(zhuǎn)子故障可靠、準(zhǔn)確的識(shí)別。文獻(xiàn)[11]結(jié)合卷積神經(jīng)網(wǎng)絡(luò)及分層正則化實(shí)現(xiàn)了滾動(dòng)軸承故障的有效診斷。文獻(xiàn)[12]提出了一種基于優(yōu)化的帶有余弦損失的長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(long short-term memory,LSTM)的滾動(dòng)軸承故障診斷算法,消除了信號(hào)強(qiáng)度對(duì)滾動(dòng)軸承故障診斷的影響,提高了診斷精度。文獻(xiàn)[13]提出了一種基于門(mén)控遞歸神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承故障診斷方法,實(shí)現(xiàn)了滾動(dòng)軸承故障的快速精確診斷。
然而,目前多數(shù)研究只利用了振動(dòng)數(shù)據(jù)在空間或者時(shí)間的單個(gè)尺度上的特征,無(wú)法充分利用振動(dòng)數(shù)據(jù)所包含的信息。同時(shí)還存在故障診斷模型結(jié)構(gòu)復(fù)雜、泛化性能欠佳等問(wèn)題?;谏鲜龇治?本文將振動(dòng)數(shù)據(jù)空間及時(shí)間特征相融合,提出了一種改進(jìn)一維卷積神經(jīng)網(wǎng)絡(luò)(one-dimensional convolutional neural networks, 1DCNN)與門(mén)控遞歸神經(jīng)網(wǎng)絡(luò)(gated recurrent neural networks, GRU)相結(jié)合故障診斷方法。同時(shí),提出了一種IReLU激活函數(shù),改進(jìn)卷積網(wǎng)絡(luò)中的激活函數(shù),增強(qiáng)網(wǎng)絡(luò)的特征提取能力。
作為深度學(xué)習(xí)中提取數(shù)據(jù)特征的通用方法,CNN在圖像處理[14]、語(yǔ)音識(shí)別[15]及故障診斷[2~13]研究中取得了顯著的成就。典型CNN主要由3部分組成:卷積層、池化層和全連接層,如圖1所示。在軸承故障診斷中,軸承信號(hào)通常被轉(zhuǎn)換成頻域圖或者時(shí)頻圖,然后輸入到2DCNN進(jìn)行處理。鑒于信號(hào)在轉(zhuǎn)換過(guò)程中會(huì)造成部分信息丟失,本研究采用一維卷積操作對(duì)信號(hào)進(jìn)行特征提取。
圖1 典型CNN結(jié)構(gòu)圖Fig.1 Structure of typical CNN
卷積操作主要完成數(shù)據(jù)的空間特征提取,其數(shù)學(xué)表達(dá)式為:
(1)
激活函數(shù)的重要作用就是增強(qiáng)網(wǎng)絡(luò)的非線(xiàn)性表達(dá)能力,進(jìn)而增強(qiáng)網(wǎng)絡(luò)的分類(lèi)能力。由于ReLU激活函數(shù)在輸入值為負(fù)數(shù)時(shí)梯度為0,神經(jīng)元不再處于激活狀態(tài),導(dǎo)致信息丟失。為了充分利用信號(hào)所含信息,本研究提出IReLU激活函數(shù)曲線(xiàn)圖如圖2所示,其數(shù)學(xué)表達(dá)式為:
(2)
由圖2可知,當(dāng)輸入較大時(shí),IReLU激活函數(shù)仍有輸出,則可以防止模型進(jìn)入飽和狀態(tài);當(dāng)輸入較小時(shí),函數(shù)具有下限,又可以起到一定的正則化作用。此外,其允許輸入小于0時(shí),信號(hào)所含信息仍能夠深入神經(jīng)網(wǎng)絡(luò),從而減少信息丟失,增強(qiáng)網(wǎng)絡(luò)的特征提取能力。
圖2 IReLU曲線(xiàn)圖Fig.2 The curve of IReLU
池化層主要用來(lái)對(duì)上層輸出特征圖進(jìn)行縮放映射,進(jìn)而減少卷積網(wǎng)絡(luò)的參數(shù)量、加快運(yùn)算速度,同時(shí)抑制過(guò)擬合。目前常用的池化方法有最大池化和平均池化。本研究采用最大池化操作,數(shù)學(xué)表達(dá)式為:
(3)
循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)能夠充分提取序列數(shù)據(jù)中的時(shí)間特征信息。然而,標(biāo)準(zhǔn)的RNN在梯度更新過(guò)程中存在梯度消失和梯度爆炸的問(wèn)題。因此,RNN出現(xiàn)了2種常用的變體,即LSTM[12]和GRU[13]。但是,GRU的結(jié)構(gòu)更加簡(jiǎn)潔緊湊,在訓(xùn)練數(shù)據(jù)很大時(shí)既能保證準(zhǔn)確率,又能夠加快運(yùn)算速度。GRU結(jié)構(gòu)如圖3所示,其計(jì)算式為:
(4)
(5)
(6)
(7)
圖3 GRU結(jié)構(gòu)圖Fig.3 Structure of GRU
結(jié)合1DCNN、GRU及Dense網(wǎng)絡(luò)的優(yōu)勢(shì),本研究所建模型主要由3部分組成:空間特征提取部分、時(shí)間特征提取及空間-時(shí)間特征融合部分以及故障診斷部分,如圖4所示。首先,預(yù)處理后的數(shù)據(jù)通過(guò)具有不同尺度卷積核的1DCNN模塊,經(jīng)過(guò)一系列卷積和池化操作之后,數(shù)據(jù)的空間特征被提取出來(lái)。同時(shí),為了抑制高頻噪聲,網(wǎng)絡(luò)第1層的卷積核尺寸較大。接著,1DCNN模塊輸出的具有空間特征的數(shù)據(jù)經(jīng)過(guò)堆疊GRU模塊之后,數(shù)據(jù)中的時(shí)間特征也被提取出來(lái)并且完成了時(shí)間-空間特征融合。最后,具有時(shí)間-空間特征的數(shù)據(jù)通過(guò)Dense模塊之后,輸出診斷結(jié)果,實(shí)現(xiàn)滾動(dòng)軸承的智能故障診斷。
圖4 改進(jìn)1DCNN-GRU結(jié)構(gòu)圖Fig.4 Structure of the improved 1DCNN-GRU
實(shí)際工況時(shí),軸承往往工作在健康狀態(tài),因此軸承的故障數(shù)據(jù)較少。為增強(qiáng)網(wǎng)絡(luò)故障識(shí)別能力,本研究提出一種新的數(shù)據(jù)增強(qiáng)方法,如圖5所示。首先,將原始振動(dòng)數(shù)據(jù)分為2部分,第1部分用于得到訓(xùn)練集,第2部分用于得到驗(yàn)證集和測(cè)試集。對(duì)于第1部分?jǐn)?shù)據(jù),首先,在合適范圍內(nèi)隨機(jī)生成1個(gè)起始點(diǎn)以樣本長(zhǎng)度為窗口大小開(kāi)始滑窗,把樣本長(zhǎng)度與步長(zhǎng)的比值設(shè)為滑窗次數(shù),達(dá)到滑窗次數(shù)后,會(huì)隨機(jī)得到另1個(gè)滑窗起點(diǎn)再次將窗口滑動(dòng)相應(yīng)次數(shù)(每次滑窗次數(shù)相同),重復(fù)上述操作,得到訓(xùn)練集。對(duì)于第2部分?jǐn)?shù)據(jù),采用隨機(jī)切分方法,在一定數(shù)據(jù)長(zhǎng)度內(nèi), 隨機(jī)生成1個(gè)起始點(diǎn)以樣本長(zhǎng)度為切分尺寸切取樣本,然后按比例再分為驗(yàn)證集和測(cè)試集。此方法既可以實(shí)現(xiàn)數(shù)據(jù)增強(qiáng),又能夠保證訓(xùn)練集與驗(yàn)證集和測(cè)試集不發(fā)生數(shù)據(jù)混疊,進(jìn)而增強(qiáng)網(wǎng)絡(luò)的識(shí)別能力和泛化性能。
圖5 數(shù)據(jù)增強(qiáng)及劃分Fig.5 Data augmentation and partition
4.2.1 數(shù)據(jù)集描述及劃分
本試驗(yàn)首先采用西儲(chǔ)大學(xué)公開(kāi)的滾動(dòng)軸承數(shù)據(jù)集[16]對(duì)本文所提方法進(jìn)行實(shí)驗(yàn)分析。采用不同工況下的驅(qū)動(dòng)端滾動(dòng)軸承數(shù)據(jù)的10種狀態(tài)作為此次實(shí)驗(yàn)數(shù)據(jù)集,每個(gè)狀態(tài)下1 000個(gè)樣本,單個(gè)樣本長(zhǎng)度為2 048,按照7:2:1劃分訓(xùn)練集、驗(yàn)證集以及測(cè)試集,根據(jù)負(fù)載不同分為4組數(shù)據(jù)集A~D如表1所示。
表1 數(shù)據(jù)集信息表Tab.1 Datasets information table
4.2.2 模型優(yōu)化及結(jié)果分析
本研究所提模型包含2個(gè)1D卷積和最大池化層、2個(gè)GRU層及1個(gè)Dense模塊(包含輸出層)。為了防止過(guò)擬合及加快網(wǎng)絡(luò)訓(xùn)練速度,模型中引入批標(biāo)準(zhǔn)化層及dropout機(jī)制。運(yùn)行平臺(tái)為windows10+PyCharm,CPU為Intel(R) Core(TM) i7-6500U。
本研究所提模型的堆疊GRU模塊中含有2個(gè)GRU層,用于提取數(shù)據(jù)中的時(shí)間特征,因此需要討論每層所含神經(jīng)元個(gè)數(shù)以達(dá)到充分提取特征的目的。設(shè)置4組實(shí)驗(yàn),第1組堆疊GRU模塊中神經(jīng)元個(gè)數(shù)分別為128和64;第2組分別為64和32;第3組分別為32和16;第4組分別為16和8。以數(shù)據(jù)集A為例,進(jìn)行10次實(shí)驗(yàn),模型在測(cè)試集上的實(shí)驗(yàn)結(jié)果如圖6所示。
圖6 堆疊GRU中不同神經(jīng)元個(gè)數(shù)對(duì)模型準(zhǔn)確率的影響Fig...6 Effects of different number of neurons in stacked GRU on model accuracy
從圖6中可看出,當(dāng)2個(gè)GRU層的神經(jīng)元數(shù)目分別為32和16時(shí),模型準(zhǔn)確率較高且比較穩(wěn)定。故本研究所提模型的堆疊GRU模塊中的神經(jīng)元數(shù)目分別設(shè)為32和16。模型主要參數(shù)如表2所示。
表2 模型主要參數(shù)設(shè)計(jì)Tab.2 Model parameter design
4.2.3 模型性能評(píng)估
為了驗(yàn)證本文所建立模型的特征提取能力及泛化性能,采用t分布-隨機(jī)鄰近嵌入算法[17]對(duì)模型在不同數(shù)據(jù)集下的故障診斷結(jié)果進(jìn)行降維可視化,如圖7所示。從圖7可以看出,本文模型對(duì)不同負(fù)載下的數(shù)據(jù)集都能進(jìn)行有效的特征提取,具有較強(qiáng)分類(lèi)和泛化性能。
為了驗(yàn)證本文所建模型在故障診斷中的優(yōu)勢(shì),利用相同的數(shù)據(jù)集,將該模型與其他模型進(jìn)行對(duì)比,每個(gè)模型進(jìn)行10次測(cè)試,實(shí)驗(yàn)結(jié)果如表3所示。
圖7 不同數(shù)據(jù)集下模型的分類(lèi)結(jié)果可視化Fig.7 Visualization of classification results of the proposed model under different datasets
表3 不同模型性能對(duì)比Tab.3 The performance comparison of different models
測(cè)試集準(zhǔn)確率取均值。實(shí)驗(yàn)1、5中使用的是向后傳播網(wǎng)絡(luò)(back propagation neural network, BPNN);實(shí)驗(yàn)2、6中所用的模型為典型1DCNN網(wǎng)絡(luò);實(shí)驗(yàn)3、7中所用模型是1DCNN-LSTM模型且模型中的1DCNN模塊同實(shí)驗(yàn)2、6相同。
由表3可知,本文所提方法在不同數(shù)據(jù)集下的故障診斷中,平均準(zhǔn)確率最高可達(dá)99.96%,高于對(duì)比模型且準(zhǔn)確率標(biāo)準(zhǔn)差均低于對(duì)比模型,穩(wěn)定性能最優(yōu)。此外,當(dāng)使用本文所提的IReLU激活函數(shù)時(shí),模型的診斷準(zhǔn)確率以及穩(wěn)定性能普遍提高,進(jìn)一步說(shuō)明本文所提的IReLU激活函數(shù)能夠使模型更加充分地提取信號(hào)特征、提高模型故障診斷準(zhǔn)確率以及增強(qiáng)模型穩(wěn)定性。
4.3.1 數(shù)據(jù)集描述及劃分
實(shí)驗(yàn)室的軸承試驗(yàn)平臺(tái)是標(biāo)準(zhǔn)機(jī)械故障模擬試驗(yàn)臺(tái),如圖8所示。軸承故障的引入方式及信號(hào)采集頻率同西儲(chǔ)大學(xué)試驗(yàn)臺(tái)一致,電機(jī)轉(zhuǎn)速為1 800 r/min。實(shí)驗(yàn)中主要模擬了滾動(dòng)軸承的3種故障狀態(tài),即滾動(dòng)體故障(RF)、內(nèi)圈故障(IF)、外圈故障(OF),加上正常狀態(tài),總共4種狀態(tài)。數(shù)據(jù)集按照7∶2∶1劃分訓(xùn)練集、驗(yàn)證集和測(cè)試集,實(shí)驗(yàn)數(shù)據(jù)集如表4所示。
圖8 機(jī)械故障模擬試驗(yàn)臺(tái)Fig.8 Mechanical fault simulation test stand
表4 數(shù)據(jù)集劃分Tab.4 Datasets partition
4.3.2 故障診斷結(jié)果分析
為進(jìn)一步驗(yàn)證本文所提方法的優(yōu)越性,利用實(shí)驗(yàn)室中采集的滾動(dòng)軸承振動(dòng)數(shù)據(jù)對(duì)第4.2.2節(jié)實(shí)驗(yàn)1、2、3及實(shí)驗(yàn)8中模型進(jìn)行測(cè)試。10次對(duì)比實(shí)驗(yàn)準(zhǔn)確率均值如圖9所示。由圖9可知,本文所提方法測(cè)試準(zhǔn)確率均值高達(dá)98.58%,遠(yuǎn)高于其他方法,具有顯著的優(yōu)越性。
綜上所述,本文所提方法在不同的數(shù)據(jù)集上都具有較高的診斷準(zhǔn)確率,這也表明本文所構(gòu)建的模型具有較強(qiáng)的魯棒性和更好的泛化能力。
圖9 不同模型的故障診斷準(zhǔn)確率Fig.9 The fault diagnosis accuracy of different models
本文提出一種改進(jìn)的1DCNN-GRU滾動(dòng)軸承故障診斷方法,其優(yōu)越性如下:
1) 所提模型使用原始被測(cè)數(shù)據(jù)作為輸入,無(wú)需進(jìn)行人工特征提取及特征選擇,既保證了原始振動(dòng)信號(hào)中所含信息的完整性又減少了對(duì)先驗(yàn)知識(shí)和專(zhuān)家知識(shí)的依賴(lài);
2) 提出IReLU激活函數(shù),使振動(dòng)信號(hào)所含信息更好地深入網(wǎng)絡(luò),減少信號(hào)所含信息的丟失,進(jìn)而增強(qiáng)網(wǎng)絡(luò)的特征提取能力,提高模型的故障診斷性能;
3) 引入堆疊GRU模塊,從1DCNN模塊輸出的具有空間特征的數(shù)據(jù)中提取時(shí)間特征并進(jìn)行特征融合,提高模型的診斷準(zhǔn)確率;
4) 所提方法在不同的數(shù)據(jù)集上都表現(xiàn)出卓越的特征提取性能,故障識(shí)別率高達(dá)99.96%,高于對(duì)比模型且具有優(yōu)越的泛化性能,對(duì)實(shí)際工況下的滾動(dòng)軸承故障診斷有一定的幫助。