趙志宏,李樂(lè)豪,楊紹普,李 晴
(1.石家莊鐵道大學(xué) 省部共建交通工程結(jié)構(gòu)力學(xué)行為與系統(tǒng)安全國(guó)家重點(diǎn)試驗(yàn)室,河北 石家莊 050043;2.石家莊鐵道大學(xué) 信息科學(xué)與技術(shù)學(xué)院,河北 石家莊 050043)
滾動(dòng)軸承是機(jī)械設(shè)備中最常使用的零部件之一,對(duì)于機(jī)械設(shè)備的可靠性至關(guān)重要,滾動(dòng)軸承的損壞輕則停機(jī)檢修,重則危害乘客的生命安全,因此對(duì)其展開(kāi)健康監(jiān)測(cè)具有重要意義。在滾動(dòng)軸承監(jiān)測(cè)過(guò)程中,對(duì)軸承進(jìn)行剩余壽命預(yù)測(cè)是實(shí)現(xiàn)預(yù)測(cè)性維護(hù)的重要途徑[1]。
隨著滾動(dòng)軸承壽命研究的不斷發(fā)展,壽命預(yù)測(cè)方法逐漸走向成熟,現(xiàn)有的預(yù)測(cè)方法有3種:基于失效機(jī)理的壽命預(yù)測(cè)、基于統(tǒng)計(jì)學(xué)的壽命預(yù)測(cè)和基于模型的壽命預(yù)測(cè)?;谀P偷膲勖A(yù)測(cè)中機(jī)器學(xué)習(xí)方法可以很好地針對(duì)不同退化趨勢(shì)進(jìn)行擬合,具有原理簡(jiǎn)單、專(zhuān)家經(jīng)驗(yàn)依賴(lài)少、適用性較廣等優(yōu)點(diǎn)[2];文獻(xiàn)[3]利用支持向量機(jī)建立軸承壽命預(yù)測(cè)模型,較為準(zhǔn)確地預(yù)測(cè)了滾動(dòng)軸承的剩余壽命;文獻(xiàn)[4]以方根均值為特征指標(biāo)評(píng)估軸承的退化狀態(tài),并結(jié)合多變量支持向量機(jī)在小樣本下實(shí)現(xiàn)了軸承剩余壽命預(yù)測(cè);文獻(xiàn)[5]使用多層感知機(jī)進(jìn)行軸承剩余壽命預(yù)測(cè),并與自回歸移動(dòng)平均方法進(jìn)行對(duì)比,驗(yàn)證了多層感知機(jī)具有更好的預(yù)測(cè)效果。
2006年,文獻(xiàn)[6]提出了深度學(xué)習(xí)理論,深度學(xué)習(xí)以其強(qiáng)大的函數(shù)擬合、特征提取能力推動(dòng)了很多領(lǐng)域的發(fā)展,由于深度學(xué)習(xí)模型相較于傳統(tǒng)的機(jī)器學(xué)習(xí)模型具有更深的網(wǎng)絡(luò)結(jié)構(gòu)和更強(qiáng)的非線(xiàn)性能力,越來(lái)越多的專(zhuān)家學(xué)者使用深度學(xué)習(xí)模型展開(kāi)軸承剩余壽命的研究;文獻(xiàn)[7]提出一種基于深度可分離卷積神經(jīng)網(wǎng)絡(luò)(depthwise separable convolutional,DSC)的軸承壽命預(yù)測(cè)方法,得到了優(yōu)于其他深度學(xué)習(xí)方法的預(yù)測(cè)結(jié)果;文獻(xiàn)[8]提出一種基于全卷積神經(jīng)網(wǎng)絡(luò)的軸承壽命預(yù)測(cè)方法,并使用加權(quán)平均方法對(duì)預(yù)測(cè)值進(jìn)行降噪,提高了預(yù)測(cè)精度,獲取了較為準(zhǔn)確的軸承剩余壽命;文獻(xiàn)[9]提出一種基于多尺度卷積神經(jīng)網(wǎng)絡(luò)的剩余壽命預(yù)測(cè)方法,提取軸承的多尺度退化特征信息,獲取了較高的預(yù)測(cè)精度。
本文使用深度可分離卷積提取軸承振動(dòng)信號(hào)中的空間特征信息,利用門(mén)控循環(huán)單元(gated recurrent unit,GRU)進(jìn)一步提取振動(dòng)信號(hào)中蘊(yùn)含的時(shí)間特征信息,并通過(guò)全連接層進(jìn)一步進(jìn)行特征提取和輸出健康指標(biāo)(heath indicator,HI),利用Savitzky-Golay濾波器對(duì)獲取的健康指標(biāo)進(jìn)行降噪,然后將健康指標(biāo)擬合為自變量為時(shí)間、因變量為已使用壽命的一次函數(shù),較為準(zhǔn)確地預(yù)測(cè)了軸承的剩余壽命。
深度可分離卷積的結(jié)構(gòu)如圖1所示,主要由深度卷積和逐點(diǎn)卷積組成。傳統(tǒng)卷積每個(gè)通道中卷積核的數(shù)量與輸入的通道數(shù)一致,而深度卷積的一個(gè)通道只有一個(gè)卷積核,因而深度卷積可以大幅減小參數(shù)量和計(jì)算量;逐點(diǎn)卷積為一種卷積核大小為1×1的傳統(tǒng)卷積,通過(guò)逐點(diǎn)卷積可以融合每個(gè)通道對(duì)應(yīng)位置提取到的特征,避免關(guān)鍵特征只存在于一個(gè)通道中,并且可以通過(guò)合理設(shè)置通道數(shù)實(shí)現(xiàn)特征的升維和降維。
圖1 深度可分離卷積結(jié)構(gòu)
自注意力機(jī)制(Self-attention)是Transformer神經(jīng)網(wǎng)絡(luò)的重要組成部分[10],常用于自然語(yǔ)言處理。自注意力機(jī)制計(jì)算時(shí),每一個(gè)特征都會(huì)和其他特征進(jìn)行加權(quán)計(jì)算,可以注意到不同特征之間的關(guān)系,并根據(jù)特征與特征之間的相關(guān)程度決定所提取的特征。自注意力機(jī)制的計(jì)算流程如圖2所示。
圖2 自注意力機(jī)制的計(jì)算流程
自注意力機(jī)制所提取的特征Z可通過(guò)softmax將Q、K之間的相關(guān)程度轉(zhuǎn)化為權(quán)重并乘以V獲?。?/p>
(1)
Q=X?WQ
(2)
K=X?WK
(3)
V=X?WV
(4)
式中:dk——Q的維度;
X——輸入數(shù)據(jù);
Q、K、V——分別為X與WQ、WK、WV相乘后經(jīng)過(guò)線(xiàn)性變換所提取到的特征;
Q?KT——Q、K之間的相關(guān)程度。
GRU是一種長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory,LSTM)的變體,為門(mén)控循環(huán)單元,可以解決循環(huán)神經(jīng)網(wǎng)絡(luò)梯度消失、梯度爆炸問(wèn)題,是一種可以較好地捕獲時(shí)間序列中較遠(yuǎn)時(shí)間距離依賴(lài)關(guān)系的神經(jīng)網(wǎng)絡(luò)[11]。相較于LSTM,GRU單元3個(gè)門(mén)(遺忘門(mén)、輸入門(mén)和更新門(mén))減少到了2個(gè)門(mén):重置門(mén)和更新門(mén),重置門(mén)決定了如何將新的輸入數(shù)據(jù)與前面GRU的狀態(tài)信息相結(jié)合,更新門(mén)決定了前面的狀態(tài)信息保存到當(dāng)前時(shí)間GRU的量。GRU的結(jié)構(gòu)如圖3所示。
圖3 GRU結(jié)構(gòu)
當(dāng)前GRU的狀態(tài)信息,即GRU輸出ht的計(jì)算方式為:
(5)
rt=σ(Wr?[ht-1,xt])
(6)
zt=σ(Wz?[ht-1,xt])
(7)
h't=tanh(Wh?[rt·ht-1,xt])
(8)
rt、zt——分別為重置門(mén)和更新門(mén)的輸出;
Wr、Wz和Wh——權(quán)值矩陣;
xt——當(dāng)前GRU的輸入數(shù)據(jù)。
為解決軸承壽命預(yù)測(cè)問(wèn)題,本文提出一種基于深度可分離卷積和門(mén)控循環(huán)單元、結(jié)合自注意力機(jī)制的DSC-Attention-GRU模型。DSC-Attention-GRU模型的網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示,圖4中,MaxPool為最大池化層(MaxPooling Layer),Dense為全連接層,DSConv為深度可分離卷積。
圖4 DSC-Attention-GRU模型網(wǎng)格結(jié)構(gòu)
首先使用LayerNorm對(duì)輸入數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化[12],LayerNorm的計(jì)算方式為:
(9)
式中:x——輸入數(shù)據(jù);
E(x)——求均值函數(shù);
Var(x)——求標(biāo)準(zhǔn)差函數(shù);
γ、β——分別為權(quán)值和偏置,是通過(guò)訓(xùn)練確定的參數(shù);
ε——極小的正數(shù)。
使用深度可分離卷積提取每個(gè)時(shí)間樣本的空間特征,深度可分離卷積網(wǎng)絡(luò)具有相同的參數(shù),在深度可分離卷積層間使用PReLU激活函數(shù)增強(qiáng)模型的非線(xiàn)性能力,使用最大池化層縮減特征尺寸;使用Self-Attention關(guān)注對(duì)于軸承壽命預(yù)測(cè)有用的信息;使用殘差連接將深度可分離卷積所提取的特征和自注意力層提取的特征融合;使用GRU提取特征間存在的時(shí)序信息,獲取蘊(yùn)含軸承剩余壽命信息的特征;最后使用全連接層進(jìn)一步提取特征,輸出剩余壽命。神經(jīng)網(wǎng)絡(luò)中的重要參數(shù)如表1所示。
表1 網(wǎng)絡(luò)參數(shù)
基于DSC-Attention-GRU的剩余壽命預(yù)測(cè)流程如圖5所示??梢苑譃橛?xùn)練階段和測(cè)試階段。
(1) 第一步,構(gòu)建DSC-Attention-GRU模型。
(2) 第二步,選擇DSC-Attention-GRU模型中的卷積核數(shù)量、通道數(shù)、學(xué)習(xí)率等超參數(shù)。
(3) 第三步,將訓(xùn)練數(shù)據(jù)集中的每15段連續(xù)時(shí)間對(duì)應(yīng)的水平和垂直方向的2個(gè)振動(dòng)信號(hào)作為一個(gè)樣本,并以軸承已使用壽命為樣本制作標(biāo)簽,該標(biāo)簽為軸承實(shí)際的健康指標(biāo),具體計(jì)算方式為:
(10)
式中:HIj——第j個(gè)樣本對(duì)應(yīng)的健康指標(biāo);
m——樣本個(gè)數(shù)。
使用訓(xùn)練數(shù)據(jù)迭代訓(xùn)練DSC-Attention-GRU模型,使用Adam優(yōu)化器進(jìn)行參數(shù)優(yōu)化調(diào)整權(quán)重。
(4) 第四步,評(píng)估模型。如果損失收斂到設(shè)定的閾值,保存模型,進(jìn)入測(cè)試階段;否則返回第三步繼續(xù)訓(xùn)練。
圖5 剩余壽命預(yù)測(cè)流程
(1) 第一步,將測(cè)試數(shù)據(jù)輸入DSC-Attention-GRU模型得到健康指標(biāo);
(2) 第二步,使用Savitzky-Golay濾波器[13]對(duì)健康指標(biāo)進(jìn)行降噪;
(3) 第三步,對(duì)降噪后的健康指標(biāo)進(jìn)行一次函數(shù)擬合,擬合成時(shí)間為自變量,健康指標(biāo)為因變量的一次函數(shù)。在一次函數(shù)下計(jì)算健康指標(biāo)為1時(shí)對(duì)應(yīng)的時(shí)間,該時(shí)間與當(dāng)前時(shí)間的差值即為預(yù)測(cè)的剩余壽命。
為驗(yàn)證本文所提方法在軸承剩余壽命預(yù)測(cè)中的有效性,使用PHM2012滾動(dòng)軸承全壽命數(shù)據(jù)集[14]進(jìn)行試驗(yàn)。采集數(shù)據(jù)的試驗(yàn)臺(tái)主要由采集模塊、調(diào)壓器、壓力傳感器、加速度計(jì)、交流電機(jī)、測(cè)試軸承等組成(圖6)。
圖6 數(shù)據(jù)采集試驗(yàn)臺(tái)
測(cè)試軸承的型號(hào)為6804DU,試驗(yàn)時(shí)對(duì)軸承施加徑向負(fù)載以加速軸承損壞,每隔10 s采集0.1 s的水平和垂直方向的振動(dòng)加速度信號(hào),采樣頻率為25.6 kHz,加速度超過(guò)20g時(shí)停機(jī)。分別在3種工況下對(duì)17個(gè)軸承進(jìn)行了試驗(yàn),工況1的轉(zhuǎn)速為1 800 r/min,負(fù)載為4 000 N;工況2的轉(zhuǎn)速為1 650 r/min,負(fù)載為4 200 N;工況3的轉(zhuǎn)速為1 500 r/min,負(fù)載為5 000 N。軸承與其數(shù)據(jù)組成如表2所示。
表2 試驗(yàn)數(shù)據(jù)
為了充分訓(xùn)練模型以得到較好的預(yù)測(cè)結(jié)果,使用軸承1_3和軸承2_6作為測(cè)試集,其余軸承作為訓(xùn)練集。模型訓(xùn)練過(guò)程的損失曲線(xiàn)如圖7所示。從圖7可以看出,損失下降的速度較快,同時(shí)收斂的過(guò)程也較為穩(wěn)定,沒(méi)有出現(xiàn)大幅度的波動(dòng),最終損失函數(shù)收斂至0.002 81,表明對(duì)訓(xùn)練集的擬合情況較好。
圖7 損失曲線(xiàn)
在測(cè)試集軸承1_3和軸承2_6上獲取的健康指標(biāo)如圖8所示,可以看到獲取的健康指標(biāo)曲線(xiàn)圍繞實(shí)際的健康指標(biāo)曲線(xiàn)上下波動(dòng),經(jīng)過(guò)Savitzky-Golay濾波平滑后,整體曲線(xiàn)較為光滑,可以反映軸承從健康至完全失效的退化過(guò)程。降噪前后的單調(diào)性和趨勢(shì)性的對(duì)比如表3所示,可以看到單調(diào)性顯著增加;趨勢(shì)性也略有增加,在軸承1_3上增加了0.006,在軸承2_6上增加了0.037。通過(guò)圖8和表3可以看出,Savitzky-Golay濾波器降噪效果較好,可以有效改善健康指標(biāo)的單調(diào)性和趨勢(shì)性,更好地?cái)M合軸承的退化過(guò)程。
表3 降噪前后軸承健康指標(biāo)單調(diào)性與趨勢(shì)性對(duì)比
使用t-SNE降維可視化方法[15]對(duì)軸承2_6的全壽命數(shù)據(jù)經(jīng)過(guò)GRU提取的特征進(jìn)行可視化,可視化結(jié)果如圖9所示。圖9中由淺到深的點(diǎn)代表從初始時(shí)刻到完全損壞時(shí)刻的樣本,可以看到不同階段的樣本排列有序,反映出DSC-Attention-GRU模型可以有效提取軸承的退化特征。
圖9 t-SNE降維可視化結(jié)果
在實(shí)時(shí)獲取健康指標(biāo)后,將降噪后的健康指標(biāo)擬合為一次函數(shù),然后計(jì)算該一次函數(shù)增長(zhǎng)至1所用的時(shí)間,使用誤差百分比對(duì)預(yù)測(cè)效果進(jìn)行評(píng)價(jià),誤差百分比Er的計(jì)算方式為:
(11)
式中:ActRUL——預(yù)測(cè)剩余壽命;
RUL——真實(shí)剩余壽命。
軸承1_3和軸承2_6在多個(gè)壽命階段的剩余壽命預(yù)測(cè)結(jié)果如表4所示。從表4中可以看到,軸承1_3隨著已使用壽命的增加,壽命預(yù)測(cè)效果逐漸改善,在已使用9 500 s和14 250 s時(shí)取得了較好的壽命預(yù)測(cè)效果,與真實(shí)剩余壽命的誤差較小;軸承2_6在多個(gè)壽命階段均都取得了較好的預(yù)測(cè)效果。
表4 剩余壽命預(yù)測(cè)結(jié)果
本文提出了一種使用自注意力機(jī)制的深度可分離卷積和門(mén)控循環(huán)單元的剩余壽命預(yù)測(cè)模型,使用Savitzky-Golay濾波器平滑健康指標(biāo),并結(jié)合一次函數(shù)擬合獲取剩余壽命值,實(shí)現(xiàn)了軸承的剩余壽命預(yù)測(cè)。壽命預(yù)測(cè)試驗(yàn)結(jié)果表明:DSC-Attention-GRU模型可以較好地從振動(dòng)信號(hào)中提取軸承的退化特征,可以有效擬合從振動(dòng)信號(hào)到健康指標(biāo)的映射關(guān)系。Savitzky-Golay濾波器對(duì)健康指標(biāo)的平滑降噪效果較好,可以顯著提升健康指標(biāo)的單調(diào)性,通過(guò)一次線(xiàn)性擬合可以較好地預(yù)測(cè)剩余壽命。