張姝婷 彭成 李長云
摘? 要:針對故障診斷中存在的由于特征提取單一或特征提取缺失導(dǎo)致的診斷準確率較低這一問題,提出一種基于多特征的Res-BiLSTM滾動軸承故障診斷方法。首先通過時域分析法和殘差網(wǎng)絡(luò)對時域特征值和空間特征進行提取并進行特征融合,其次將融合的特征值輸入雙向長短期記憶網(wǎng)絡(luò)進行時序特征提取,最后利用Softmax進行分類。實驗結(jié)果表明,該故障診斷方法增強了故障診斷網(wǎng)絡(luò)的特征提取能力,進而提高了診斷準確率。
關(guān)鍵詞:故障診斷;滾動軸承;殘差網(wǎng)絡(luò);雙向長短期記憶網(wǎng)絡(luò)
中圖分類號:TP183;TP306.3? 文獻標識碼:A? 文章編號:2096-4706(2023)15-0146-05
Res-BiLSTM Rolling Bearing Fault Diagnosis Based on Multiple Features
ZHANG Shuting, PENG Cheng, LI Changyun
(College of Computer Science, Hunan University of Technology, Zhuzhou? 412007, China)
Abstract: To address the problem of low diagnostic accuracy due to single feature extraction and missing feature extraction in fault diagnosis, Res-BiLSTM rolling bearing fault diagnosis method based on multiple features is proposed. Firstly, the time domain feature values and spatial features are extracted and feature fusion are performed by time domain analysis and residual network, then the fused feature values are input to the bidirectional long and short-term memory network for temporal feature extraction, and finally Softmax is used for classification. The experimental results show that this fault diagnosis method enhances the feature extraction ability of the fault diagnosis network, thus improving the diagnosis accuracy.
Keywords: fault diagnosis; rolling bearing; residual network; bidirectional long and short-term memory network
0? 引? 言
中國曾提出“中國制造2025”戰(zhàn)略,意在通過當(dāng)代信息技術(shù)的發(fā)展實現(xiàn)對傳統(tǒng)制造業(yè)的變革[1]。工業(yè)化的發(fā)展意味著旋轉(zhuǎn)機械應(yīng)用的范圍越來越廣泛,涉及采礦業(yè)、船舶制造業(yè)、航空航天業(yè)等不同領(lǐng)域[2]。不同機械的功能趨向完備,對精度的要求也在逐步提高,而滾動軸承是各類大型機械設(shè)備中不可或缺的重要部件,常用于高壓變速等復(fù)雜工況中,外加人工裝配導(dǎo)致的磨損損耗,損壞率較高,因此針對滾動軸承進行實時的故障檢測具有重要的研究意義和價值[3]。
信號傳感器接收到的滾動軸承振動信號表現(xiàn)出非平穩(wěn)性和非線性,通過相應(yīng)的信號處理方法可以獲取直觀豐富的狀態(tài)信息,直接利用時域信號和頻域信號進行故障特征的提取,再進行故障診斷,不會對故障振動信號造成損失[4]。Bai等[5]采用改進的傅里葉變換和遞歸圖變換法,使得卷積網(wǎng)絡(luò)可以自適應(yīng)軸承轉(zhuǎn)速和負載的變化,以此進行故障診斷。Han等[6]提出在實際工況下,通過對信號的時域等參數(shù)的相關(guān)性分析,利用最優(yōu)匹配小波和峭度準則構(gòu)造一組先驗周期濾波器組,計算得出不同振動特征值的映射系數(shù),根據(jù)映射系數(shù)進行時域分析和故障診斷。以上方法均可以利用故障數(shù)據(jù)的時域特征或頻域特征進行特征提取,實現(xiàn)故障診斷,但是由于振動信號還存在時序特性等多種特征值,利用單一的時域特征對故障進行特征提取學(xué)習(xí),容易出現(xiàn)因特征提取缺失而帶來的故障診斷錯誤,并且對多種信號的處理方法往往是依賴專家經(jīng)驗和信號處理的知識來對軸承進行故障診斷,帶來信號處理速度較慢、人力資源需求過高等問題。
隨著深度學(xué)習(xí)技術(shù)應(yīng)用領(lǐng)域的不斷擴大,越來越多的研究學(xué)者采用多種深度卷積神經(jīng)網(wǎng)絡(luò)對故障數(shù)據(jù)的特征進行自適應(yīng)提取學(xué)習(xí),并依據(jù)學(xué)習(xí)的特征值對滾動軸承進行故障診斷。可以采用深度學(xué)習(xí)模型提取出振動加速度信號中含有的空間特征,為提高網(wǎng)絡(luò)對特征的提取能力,選擇增加網(wǎng)絡(luò)層數(shù),而殘差網(wǎng)絡(luò)(ResNet)[7]通過多個按照首尾相連特點連接起來的殘差塊來學(xué)習(xí)特征,解決了淺層神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中根據(jù)反饋信息等對淺層網(wǎng)絡(luò)各項參數(shù)進行更新時出現(xiàn)的梯度消失現(xiàn)象。由于殘差網(wǎng)絡(luò)具有特有的跳躍連接,所以無需引入額外的參數(shù)和計算,即可達到對網(wǎng)絡(luò)整體正則化效果的優(yōu)化。
因為滾動軸承的故障數(shù)據(jù)具有特殊的時間相關(guān)特征,在時間上有著先后因果關(guān)系,而卷積神經(jīng)網(wǎng)絡(luò)未對隱含的時序特征進行提取,如果對其隱含的時間依賴關(guān)系即時序特征進行提取分析,可以從多個維度學(xué)習(xí)其特征關(guān)聯(lián)性,實現(xiàn)提高網(wǎng)絡(luò)特征提取能力的目的,達到提高診斷準確率的效果[8]。而雙向長短期記憶網(wǎng)絡(luò)(Bi-directional Long Short-Term Memory, BiLSTM)由前后向LSTM組合,可以實現(xiàn)對從后向前信息的編碼,將所學(xué)習(xí)到的未來時刻信息特征向前進行信息反饋,充分挖掘輸入的一維時間序列中早期與未來數(shù)據(jù)信息之間的關(guān)聯(lián)關(guān)系,更好地獲取雙向的信息特征依賴,提高網(wǎng)絡(luò)模型對時間序列數(shù)據(jù)的利用率[9]。
綜上所述,本文首先分別利用時域分析法和ResNet網(wǎng)絡(luò)對時域特征和空間特征進行提取和融合,然后使用BiLSTM網(wǎng)絡(luò)對隱含的深層時序特征進行提取,通過多種特征的提取提高了網(wǎng)絡(luò)的特征提取能力,從而提高了診斷準確率。
1? 故障診斷模型
為了實現(xiàn)對滾動軸承故障數(shù)據(jù)特征的深層完整提取,提高對滾動軸承故障診斷的分類準確率,本文構(gòu)建一個基于多特征的Res-BiLSTM診斷模型,主要包含特征提取模塊、特征融合模塊和故障分類模塊。首先分別利用時域分析法和殘差網(wǎng)絡(luò)對故障數(shù)據(jù)的時域特征值和空間特征值進行提取,并將時域特征值與空間特征值進行特征融合;其次將融合的特征數(shù)據(jù)信息輸入到BiLSTM中,進行隱含的時序特征值的提取,再次采用Adam優(yōu)化算法對網(wǎng)絡(luò)模型訓(xùn)練反饋調(diào)參過程進行優(yōu)化,最后利用Softmax進行故障分類。
1.1? 特征提取模塊
1.1.1? 時域分析法
對滾動軸承進行故障診斷時,通常利用傳感器對滾動軸承的運作狀態(tài)進行數(shù)據(jù)信息采集,采集到的數(shù)據(jù)多數(shù)是一維時序故障數(shù)據(jù),表現(xiàn)為非平穩(wěn)的振動信號?;谝痪S時序故障數(shù)據(jù)的特點,以及時域信號具有直觀的信息,本文實驗首先通過時域分析法對滾動軸承振動信號的多種時域特征進行提取,所提取的時域特征如表1所示。
1.1.2? ?ResNet網(wǎng)絡(luò)
本文模型中的ResNet通過數(shù)據(jù)重構(gòu)將輸入的振動加速度信號轉(zhuǎn)變?yōu)槎S特征圖,為了實現(xiàn)對所輸入振動加速度信號中存在的空間特征進行完整提取,通過多個殘差塊對特征進行提取,并且將二維數(shù)據(jù)展平為一維向量數(shù)據(jù)輸出。
計算式為:
其中,xi表示輸入值,F(xiàn)(x j + W j)表示殘差塊的輸出值,W j表示殘差網(wǎng)絡(luò)卷積層的權(quán)重矩陣。
在殘差網(wǎng)絡(luò)中選擇使用ReLU函數(shù)作為激活函數(shù),ReLU函數(shù)的計算式為:
ReLU(x)=max(x,0)(2)
由式(2)可以看出,由于ReLU函數(shù)選取了大于0的數(shù)值作為輸出值,自動剔除了小于0的數(shù)值,使得網(wǎng)絡(luò)提高了函數(shù)的計算速度,并且有效解決了梯度消失等梯度異常的問題。
1.1.3? BiLSTM網(wǎng)絡(luò)
殘差網(wǎng)絡(luò)針對預(yù)處理后振動加速度信息數(shù)據(jù)中的空間特征進行了提取,但未對一維時序樣本數(shù)據(jù)中隱含的深層時序特征進行處理,故將時域特征與空間特征融合后的輸出值輸入BiLSTM網(wǎng)絡(luò),通過前后向的LSTM網(wǎng)絡(luò)從正反兩個方向進行雙向處理,對數(shù)據(jù)的時序特征進行提取處理。
其中,正向LSTM網(wǎng)絡(luò)t時刻的隱藏層狀態(tài)計算方法如式(3)所示。在單層LSTM網(wǎng)絡(luò)中,通過t時刻的輸入計算出t時刻的隱藏層狀態(tài),LSTM為LSTM網(wǎng)絡(luò)中的單元:
ht=LSTM(xt,ht-1)(3)
反向LSTM t時刻的隱藏層狀態(tài)計算方法如式(4)所示。 表示t時刻反向LSTM網(wǎng)絡(luò)的隱藏層狀態(tài)值:
h't=LSTM(xt,h't-1)(4)
BiLSTM就是將正向和反向LSTM的隱藏層狀態(tài)疊加在一起,組成整體的雙向長短時記憶網(wǎng)絡(luò)的隱藏狀態(tài)值。
1.2? 特征融合模塊
特征融合即是將時域分析法提取出的多個時域特征值與通過ResNet網(wǎng)絡(luò)提取出的空間特征進行融合處理,ResNet網(wǎng)絡(luò)中利用疊加的殘差塊學(xué)習(xí)提取到的特征值會展平為一維形式的向量數(shù)據(jù)進行輸出。
網(wǎng)絡(luò)結(jié)構(gòu)中利用concatenate通過通道數(shù)的增加將多種特征進行特征融合。其中concatenate的concat操作可以通過增加通道數(shù)的方式來提高網(wǎng)絡(luò)性能。
假設(shè)兩個維度特征值的通道分別為Xi和Yi,則concatenate的通道輸出值為:
其中,Xi表示第i個通道上的特征值,Ki表示特征值Xi對應(yīng)的卷積核。
1.3? 故障分類模塊
該分類模塊即是采用Softmax對輸入的故障數(shù)據(jù)進行分類,實現(xiàn)對軸承的故障診斷。Softmax將輸入值映射為0到1之間的實數(shù),并對其進行歸一化處理,保證其多項和為1。假設(shè)將故障樣本分為n類,Softmax即是計算不同類別故障出現(xiàn)的概率并將其作為分類結(jié)果輸出,進而實現(xiàn)故障分類識別判斷。計算式為:
其中,xi表示第i個故障類別的故障樣本數(shù),P表示對應(yīng)故障類別出現(xiàn)的概率值。
2? 實驗及結(jié)果分析
2.1? 實驗數(shù)據(jù)集
本實驗所用數(shù)據(jù)源自凱斯西儲大學(xué)的公開軸承故障數(shù)據(jù)集(Case Western Reserve University, CWRU)[10],該試驗臺設(shè)備分別在滾動軸承的內(nèi)圈、外圈及其滾動體上,采用電火花技術(shù)對滾動軸承造成不同程度的單點軸承故障,存在損傷的軸承直徑分別為0.18 mm、0.36 mm、0.54 mm、0.71 mm,其采樣頻率設(shè)定為12 kHz。本文實驗中將軸承的故障類別分為10類,可用于對軸承的各類故障進行診斷及狀態(tài)監(jiān)測。
2.2? 參數(shù)設(shè)置
本文提出的基于多特征的Res-BiLSTM網(wǎng)絡(luò)中將軸承的振動加速度信號數(shù)據(jù)重構(gòu)為二維特征圖,輸入到殘差網(wǎng)絡(luò)中進行特征提取,殘差塊輸出時將輸出值展平為一維向量數(shù)據(jù),因此殘差網(wǎng)絡(luò)中的結(jié)構(gòu)均為二維卷積層和二維池化層,輸出特征值為一維數(shù)據(jù)。
基本結(jié)構(gòu)為17個卷積層,卷積核為3×3,步長分別設(shè)置為2和1,1個3×3的最大池化層和1個全連接層,使用ReLU函數(shù)作為其激活函數(shù),選用Adam作為本文實驗的優(yōu)化器,學(xué)習(xí)率設(shè)置為0.001。為防止過擬合和梯度異?,F(xiàn)象的發(fā)生,在卷積層后添加對應(yīng)的BN層。通過Concatenate將多種特征融合后,輸入到BiLSTM網(wǎng)絡(luò)中,最后利用Softmax進行十分類?;谝陨显O(shè)置的模型對診斷網(wǎng)絡(luò)進行迭代訓(xùn)練,迭代次數(shù)設(shè)為200次。
2.3? 實驗結(jié)果分析
為了驗證本文故障診斷方法的準確性和有效性,選擇使用準確率、精準度、召回率和調(diào)和平均值F1值等指標來對診斷效果進行評價,評價指標計算方式如表2所示。
TP是指將真實樣本判斷為真實樣本類別的數(shù)目;TN是指將虛假樣本判斷為虛假樣本類別的數(shù)目;FP是指將虛假樣本判斷為真實樣本類別的數(shù)目,即分類錯誤的樣本數(shù)目;FN是指將真實樣本判斷為虛假樣本類別的數(shù)目,即被遺漏的真實樣本數(shù)目。
通過CWRU的故障數(shù)據(jù)集對本文提出的故障診斷方法進行實驗驗證,并與ResNet網(wǎng)絡(luò)、BiLSTM網(wǎng)絡(luò)和未提取時域特征值的Res-BiLSTM網(wǎng)絡(luò)進行實驗對比,通過診斷準確率對診斷方法的有效性進行判斷。從圖1中可以看出,本文模型的診斷準確率最高,可達到99.54%的診斷準確率。
為了驗證本文提出的基于多特征的Res-BiLSTM網(wǎng)絡(luò)結(jié)構(gòu)可以有效提高分類效果,針對四種模型的診斷實驗使用多項評價指標(包括準確率、精準度、召回率和F1值),分別進行多次重復(fù)實驗,得出的評價指標值如表3所示。其中,準確率表示該網(wǎng)絡(luò)模型對故障類別預(yù)測準確度的比例,一般情況下準確率越高,代表網(wǎng)絡(luò)的分類效果越好;精準度表示網(wǎng)絡(luò)模型所識別出正確的真實樣本在所有真實樣本中的比例;召回率表明網(wǎng)絡(luò)模型在測試樣本中分類出正確真實樣本的能力;F1值平衡了精準度和召回率兩個評價指標。通過這四個評價指標的對比,綜合得出本文提出的故障診斷網(wǎng)絡(luò)模型具有更穩(wěn)定的故障診斷分類性能。
為了可視化故障分類效果,利用本文基于多特征Res-BiLSTM模型分類后的混淆矩陣來直觀展示模型對故障的分類情況,如圖2所示。
在混淆矩陣中,以熱力圖作為參考指標對識別精度進行顏色表示,顏色越深,數(shù)值越高,其中對角線中的數(shù)據(jù)信息表示模型對輸入數(shù)據(jù)診斷正確的比例。在圖2中,利用混淆矩陣清晰地表示出本文診斷方法只有極少的故障類別診斷失誤,整體效果表明本文模型對樣本類別的分類效果較好。
3? 結(jié)? 論
本文針對因特征提取單一等導(dǎo)致的診斷準確率較低問題,提出一種基于多特征的Res-BiLSTM故障診斷網(wǎng)絡(luò),通過多種特征的提取學(xué)習(xí),提高了網(wǎng)絡(luò)的特征提取學(xué)習(xí)能力。由對比實驗結(jié)果可知,該方法可以有效提高診斷準確率。但本文的診斷模型是利用公開的均衡故障數(shù)據(jù)集進行的診斷,其海量的故障數(shù)據(jù)可以使模型通過多次迭代訓(xùn)練達到最佳效果,而實際工況下采集到的故障數(shù)據(jù)樣本少而不均衡,下一步主要是針對小樣本數(shù)據(jù)和數(shù)據(jù)不均衡情況進行故障診斷,提出應(yīng)用于機械實際運轉(zhuǎn)過程中的故障診斷模型。
參考文獻:
[1] LOMBARDI M,PASCALE F,SANTANIELLO D. Internet of Things: A General Overview between Architectures, Protocols and Applications [J].Information,2021,12(2):87.
[2] 張潔,汪俊亮,呂佑龍,等.大數(shù)據(jù)驅(qū)動的智能制造 [J].中國機械工程,2019,30(2):127-133+158.
[3] PILTAN F,KIM J M. Bearing Fault Diagnosis by a Robust Higher-Order Super-Twisting Sliding Mode Observer [EB/OL].[2023-02-15].https://pubmed.ncbi.nlm.nih.gov/29642459/.
[4] NICOLAS W,EMILIANO P,ROGELIO G R,et al. Open-Circuit Fault Identification Method for Interleaved Converters Based on Time-Domain Analysis of the State Observer Residual [J].IEEE Transactions on Power Electronics,2019,34(4):3740-3749.
[5] BAI R X,MENG Z,XU Q S,et al. Fractional Fourier and time domain recurrence plot fusion combining convolutional neural network for bearing fault diagnosis under variable working conditions [EB/OL].[2023-02-16].https://www.sciencedirect.com/science/article/abs/pii/S0951832022006913?via%3Dihub.
[6] HAN C K,LU W,WANG H Q,et al. Multistate fault diagnosis strategy for bearings based on an improved convolutional sparse coding with priori periodic filter group [EB/OL].[2023-02-13].https://www.sciencedirect.com/science/article/abs/pii/S0888327022010639?via%3Dihub.
[7] HE K M,ZHANG X Y,REN S Q,et al. Deep residual learning for image recognition [C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas:IEEE,2016:770-778.
[8] RANAWAT N S R,PRAKASH J,MIGLANI A,et al. Performance evaluation of LSTM and Bi-LSTM using non-convolutional features for blockage detection in centrifugal pump [EB/OL].[2023-02-25].https://www.sciencedirect.com/science/article/abs/pii/S0952197623002762?via%3Dihub.
[9] ZHAO R,WANG D Z,YAN R Q,et al. Machine health monitoring using local feature-based gated recurrent unit networks [J].IEEE Transactions on Industrial Electronics,2018,65(2):1539-1548.
[10] CWRU Bearing Data Set.[EB/OL].[2023-02-24].https://engineering.case.edu/bearingdatacenter/apparatus-and-procedures.