葉子健,張 強,邵思羽,楊新宇,牛天林,趙玉偉,焦曉璇
(1.空軍工程大學 防空反導學院,西安 710051;2.空軍工程大學 航空工程學院, 西安 710051)
滾動軸承被譽為旋轉(zhuǎn)機械設(shè)備的關(guān)節(jié),在工業(yè)生產(chǎn)、智能制造和交通運輸?shù)阮I(lǐng)域起著重要作用。滾動軸承一旦發(fā)生故障,輕則引起機械設(shè)備的停止工作,重則造成巨大的經(jīng)濟損失。因此,及時對滾動軸承的健康狀態(tài)進行分析,并對其剩余使用壽命(remaining useful life,RUL)進行預(yù)測具有重要的研究意義。RUL預(yù)測是預(yù)測與健康管理(prognostics and health management,PHM)中一項關(guān)鍵技術(shù),其概念是設(shè)備當前工作時間到出現(xiàn)故障時刻之間的時間間隔。對設(shè)備的RUL進行準確預(yù)測,可以輔助維護人員及時修正維修策略,合理的對設(shè)備零部件進行更換或者維修,提升設(shè)備視情維護能力,減少無效維護次數(shù),能夠起到提升維護效率,減少維護成本的作用。
當前,剩余使用壽命預(yù)測方法主要分為基于模型的方法和基于數(shù)據(jù)驅(qū)動的方法?;谀P偷姆椒ú捎脭?shù)學方法構(gòu)建機械部件退化趨勢的物理模型。然而,現(xiàn)代機械系統(tǒng)的復雜程度急劇增加,內(nèi)部組件高度耦合,并且通常在高負載、變工況和多噪聲等嚴峻環(huán)境下工作。因此,建立精確的退化模型是一件較為困難的事情,限制了基于模型方法的發(fā)展?;跀?shù)據(jù)驅(qū)動的方法是利用機器學習算法,來構(gòu)建傳感器的監(jiān)測數(shù)據(jù)和剩余使用壽命之間的映射關(guān)系。
深度學習是目前機器學習領(lǐng)域最熱門的研究方向之一,憑借其強大的數(shù)據(jù)處理和特征提取能力,深度學習廣泛的應(yīng)用于計算機視覺、自然語言處理和故障診斷等領(lǐng)域。鑒于深度學習的優(yōu)點,越來越多的研究人員將其應(yīng)用在剩余使用壽命預(yù)測領(lǐng)域。Wang等提出了一個多尺度卷積注意力網(wǎng)絡(luò)。首先將多傳感器數(shù)據(jù)進行融合,然后使用帶自注意力機制的多尺度卷積模塊進行特征提取,最后使用動態(tài)密集層對高層表示進行回歸分析,使用銑刀壽命數(shù)據(jù)驗證了模型的有效性。張等]通過建立全卷積層神經(jīng)網(wǎng)絡(luò)對軸承進行剩余使用壽命預(yù)測,能夠?qū)崿F(xiàn)特征自學習,并且減少了神經(jīng)網(wǎng)絡(luò)所需的訓練參數(shù)量。周哲韜等將Transformer模型應(yīng)用在滾動軸承的剩余使用壽命預(yù)測領(lǐng)域。孫鑫等提出了一種新型的改進均方誤差損失函數(shù),并結(jié)合多尺度卷積神經(jīng)網(wǎng)絡(luò)進行軸承的RUL預(yù)測。
健康指標(Health Index,HI)的提取是剩余使用壽命預(yù)測流程中的關(guān)鍵步驟。健康指標主要反映了機械設(shè)備的退化情況,因此,健康指標質(zhì)量的優(yōu)劣將直接影響剩余使用壽命預(yù)測的精度。Qiu等使用自組織映射(SOM)將提取的特征進行融合,以此構(gòu)建滾動軸承的健康指標。Chen等提出了一個簡單的健康指標構(gòu)建方案,將當前時刻的剩余使用壽命值與初始剩余使用壽命的比值作為健康指標,減少了昂貴先驗知識的需求。使用頻譜的5個帶通能量值作為特征,利用基于注意力機制的循環(huán)自編碼器構(gòu)建特征和健康指標直接的映射關(guān)系,最后利用線性回歸計算得到剩余使用壽命的值。
上述方法主要存在兩點問題:① 沒有充分利用振動信號的數(shù)據(jù)信息,通常只使用單一大小的時間窗對振動信號進行特征提取,沒有綜合考慮局部信息與全局信息。軸承的振動信號是一個包含時間信息的向量,如果缺乏對時間尺度的充分考慮,則會影響健康指標的有效性。② 通常在使用健康指標對RUL進行預(yù)測時,需要對健康指標的失效閾值進行確定。如在文獻[22]中,選擇軸承失效時的RMS最大值1.903作為失效閾值。這些方法往往需要一定的先驗知識或經(jīng)驗積累,否則會導致實際RUL預(yù)測的較大誤差。
為了解決上述問題,本文中提出一種新的深度學習框架,稱為多尺度卷積自編碼網(wǎng)絡(luò),用于滾動軸承健康指標的自動提取。多尺度卷積自編碼器由多個卷積核大小不同的卷積自編碼器融合得到。具有小卷積核的卷積自編碼器能夠針對局部的退化特征進行特征提取。與此相反,具有大卷積核的卷積自編碼器能夠考慮整個序列的退化趨勢進行特征提取。兩者相互結(jié)合,能夠解決振動信號時間信息利用不充分的問題。使用復合損失函數(shù)對多尺度卷積自編碼器進行訓練,實現(xiàn)健康指標的自動提取。在得到多尺度卷積自編碼器提取的健康指標后,使用門控循環(huán)單元(gate recurrent unit,GRU)神經(jīng)網(wǎng)絡(luò)用于軸承的剩余使用壽命預(yù)測,與其他方法不同,本文中提出方法得到的健康指標不需要增加失效閾值確定的步驟,直接將失效閾值定為1。
自編碼器(Autoencoder,AE)是一種無監(jiān)督學習方法,通常用于特征降維。AE由編碼器和解碼器構(gòu)成,前者對輸入數(shù)據(jù)進行降維,提取其高層表示,后者對提取的高層表示進行升維,對輸入數(shù)據(jù)進行重構(gòu)。利用反向傳播算法來更新自編碼器的內(nèi)部參數(shù),使得重構(gòu)誤差達到最小。AE的結(jié)構(gòu)如圖1所示。
圖1 自編碼器結(jié)構(gòu)示意圖Fig.1 The structure of autoencoder
假設(shè)AE的輸入為= [,,…,],為輸入數(shù)據(jù)的長度。則編碼器的輸出可以表示為:
=(+)
(1)
′=(+)
(2)
其中:和分別表示權(quán)重和偏差;表示解碼器的激活函數(shù)。AE通過誤差反向傳播來對內(nèi)部的權(quán)重和偏差進行更新,使得重構(gòu)誤差達到最小,AE的重構(gòu)誤差可以表示為:
(3)
圖2 多尺度卷積自編碼器結(jié)構(gòu)示意圖Fig.2 The structure of multi-scale convolutional autoencoder
(4)
其中:為MSCAE中的可訓練參數(shù);v是比例系數(shù)。由式(4)可以看出,本文中構(gòu)建的復合損失函數(shù)即包括數(shù)據(jù)重構(gòu)誤差,也包含HI和真實的退化標簽之間的誤差,在充分利用軸承振動數(shù)據(jù)的同時,有效的提取具有反應(yīng)軸承真實退化特性的HI。使用反向傳播算法優(yōu)化可訓練參數(shù),使復合損失函數(shù)達到最小,使構(gòu)建的MSCAE具備提取測試軸承的HI能力。
基于MSCAE的滾動軸承HI提取及RUL預(yù)測流程如圖3所示。具體步驟為:
圖3 滾動軸承的HI提取及RUL預(yù)測流程框圖Fig.3 HI extraction and RUL prediction process of rolling bearings
1) 訓練軸承的標簽構(gòu)建:由于軸承的振動信號沒有對應(yīng)的標簽,無法對有監(jiān)督學習的深度學習模型進行訓練,故需要人為的構(gòu)建振動信號的對應(yīng)標簽。假設(shè)軸承已經(jīng)運行的時間為t,軸承的運行總時間為,則對應(yīng)的標簽為。例如,軸承已經(jīng)運行14 000 s,而軸承的運行總時長為28 000 s,則當前的標簽值為0.5。值得注意的是,訓練軸承的標簽大小處于0~1。
2) 訓練MSCAE:將訓練軸承的振動信號輸入MSCAE,得到編碼器提取的HI值和解碼器對振動數(shù)據(jù)的重構(gòu)值,計算復合損失函數(shù)的損失值,使用誤差反向傳播算法對內(nèi)部的參數(shù)進行更新。在反復的參數(shù)優(yōu)化過程中,使得MSCAE能夠有效的提取軸承的HI。
3) 測試軸承的HI提?。簩y試軸承的振動數(shù)據(jù)輸入已經(jīng)訓練好的MSCAE,得到編碼器的結(jié)果,即為測試軸承的HI值。
4) RUL預(yù)測:在進行測試軸承的HI提取后,假設(shè)提取的HI序列為= [,,…,],假設(shè)的最后個點為未知量,則已知HI序列為′ = [,,…,-]。構(gòu)建訓練矩陣,可以表示為:
(5)
(6)
(7)
本文中的實驗數(shù)據(jù)來源于IEEE協(xié)會在2012年舉辦的PHM挑戰(zhàn)賽,數(shù)據(jù)由PRONOSTIA實驗臺獲得,如圖4所示。實驗臺主要由3部分組成:旋轉(zhuǎn)部分、退化產(chǎn)生部分和測量部分。其中,旋轉(zhuǎn)部分由帶變速箱的異步電機及其旋轉(zhuǎn)軸組成,目的支撐軸承的工作。退化產(chǎn)生部分可以模擬實際工作中的帶負載情況,給軸承施加徑向載荷。測量部分主要由水平、垂直和溫度3個傳感器組成,前2個傳感器測量軸承在工作中的振動量,溫度傳感器測量軸承工作中的溫度。
圖4 PRONOSTIA實驗臺實物圖Fig.4 PRONOSTIA test bench
PHM2012數(shù)據(jù)集給出了3種操作條件下的軸承運行到失效的全周期壽命數(shù)據(jù),每種操作條件下分別有7,7,3個測試軸承。實驗臺的采樣頻率為25.6 kHz,采樣持續(xù)時間為0.1 s,采樣間隔為10 s。這表明每10 s能夠得到2 560個采樣點。為了驗證本文所提出的MSCAE的有效性,需要將數(shù)據(jù)集劃分為測試集和訓練集,劃分方法如表1所示。由表1可知,本文中只使用操作條件1下的7個軸承,操作條件1為轉(zhuǎn)速1 800 r/min和負載4 000 N,將Bearing1_1和Bearing1_3作為測試集,其余5個軸承作為訓練集。
表1 訓練集和測試集劃分Table 1 Training set and testing set division
為了驗證本文所提出MSCAE模型提取HI的有效性,使用單調(diào)性和相關(guān)性來量化HI的性能。單調(diào)性和相關(guān)性的公式如下:
(8)
(9)
式(8)表示單調(diào)性的評價指標,式中:為HI的一階導數(shù);為HI的個數(shù),同時也是傳感器的采樣次數(shù)。本文中為了簡化運算,采用間隔三個點之間的差值表示。例如,=-。單調(diào)性衡量HI單調(diào)增加和單調(diào)減少的趨勢,若HI的單調(diào)性越強,其值越接近1,反之,單調(diào)性越弱,其值越接近0。式(9)表示相關(guān)性的評價指標,其中和分別表示指標和運行時間的值,()和()表示和的平均值。相關(guān)性衡量HI和運行時間之間的相關(guān)性。兩者越相關(guān),其值越接近1,反之,其值越接近0。
本文中所提出的MSCAE三條通路中的卷積核大小分別為3×1,7×1和11×1,編碼塊和解碼塊的個數(shù)都為3,詳細的模型超參數(shù)配置由表2所示。
表2 多尺度卷積自編碼器的超參數(shù)Table 2 Hyperparameter setting of multi-scale convolutional autoencoder
根據(jù)表2的模型配置構(gòu)建MSCAE,使用訓練集的軸承數(shù)據(jù)對模型進行訓練。在訓練完畢后,輸入測試軸承的原始振動數(shù)據(jù),得到編碼器的輸出,即HI,Bearing1_1和Bearing1_3的HI提取結(jié)果如圖5所示。由圖5可以發(fā)現(xiàn),軸承1和軸承3所提取的HI具有明顯的退化趨勢,并且在軸承的退化后期,即軸承即將損壞的時刻,HI的值接近于1。
圖5 Bearing1_1和Bearing1_3的HI提取結(jié)果圖Fig.5 HI extraction results of Bearing1_1 and Bearing1_3
為了驗證本文所提出的MSCAE的有效性,設(shè)置了一組對比實驗,將所提出的MSCAE和3個單尺度的卷積自編碼器進行對比。3個單尺度卷積自編碼器的卷積核大小分別為3×1,7×1和11×1,為了保證對比實驗的合理性,除了卷積核的大小不同之外,其余的模型超參數(shù)設(shè)置均和MSCAE模型相同。4種模型的結(jié)果如圖6和圖7所示,并且4種模型的單調(diào)性和相關(guān)性指標見表3。由圖6(c)和圖7(c)可以發(fā)現(xiàn),卷積核大小為7×1的卷積自編碼器提取的HI在退化后期,有很多點都接近于1,這會導致軸承RUL的提前預(yù)測,使預(yù)測的RUL值總是小于真實的RUL值,并且會帶來很大的預(yù)測誤差。由圖6(b)和圖7(b),卷積核大小為3×1的卷積自編碼器提取的HI也有類似的情況出現(xiàn),但是比卷積核大小7×1的現(xiàn)象要輕微。由圖6(d)和圖7(d),卷積核大小為11×1的模型提取的HI在退化后期波動情況比較明顯。同時,表3中使用MSCAE提取的HI在2個測試軸承上的單調(diào)性和相關(guān)性均高于其他3種模型。綜合上述分析,證明本文所提出的MSCAE模型能夠充分的利用振動信號的全局和局部信息,提取的HI相比于單尺度的卷積自編碼器更為有效。
表3 4種模型的單調(diào)性和相關(guān)性指標Table 3 Monotonicity and correlation indicators of the four models
圖6 4種模型在Bearing1_1上的HI提取結(jié)果圖Fig.6 HI extraction results of four models on Bearing1_1
圖7 4種模型在Bearing1_3上的HI提取結(jié)果圖Fig.7 HI extraction results of four models on Bearing1_3
為了進一步驗證本文提出的MSCAE的優(yōu)越性,將所提出的模型與AE和文獻[26]中提出的基于卷積神經(jīng)網(wǎng)絡(luò)的HI提取模型進行對比。AE內(nèi)部由6層隱藏層構(gòu)成,隱藏神經(jīng)元的個數(shù)分別為[320,40,1,40,320,2 560],其余的超參數(shù)設(shè)置和表2一致?;诰矸e神經(jīng)網(wǎng)絡(luò)的HI提取模型的詳細結(jié)構(gòu)見文獻[25]。最終,實驗結(jié)果如圖8和表4所示。圖8中,圖8 (a)和圖8 (b)表示MSCAE在Bearing1_1和Bearing1_3上的HI提取結(jié)果,圖8 (c)和圖8 (d)表示使用卷積神經(jīng)網(wǎng)絡(luò)的方法在Bearing1_1和Bearing1_3上的HI提取結(jié)果,圖8 (e)和圖8(f)表示AE在Bearing1_1和Bearing1_3上的HI提取結(jié)果。由圖9(c) 和圖9 (d)可以發(fā)現(xiàn),基于卷積神經(jīng)網(wǎng)絡(luò)的方法提取的HI波動比較明顯,并且在退化后期十分容易出現(xiàn)HI值接近1的情況,會對RUL的預(yù)測造成影響。由圖8(e)和圖8 (f)可以發(fā)現(xiàn)AE不具備有效的HI提取能力,提取結(jié)果波動非常明顯,并且不能反映真實的退化趨勢。表4可以進一步說明本文提出的MSCAE提取的HI具有最好的性能。
圖8 多尺度卷積自編碼器與其他2種方法的HI提取結(jié)果圖Fig.8 Comparison of HI extraction results between the multi-scale convolutional autoencoder and the other two methods
表4 卷積神經(jīng)網(wǎng)絡(luò)和AE的單調(diào)性和相關(guān)性指標Table 4 Monotonicity and correlation indicators of convolutional neural networks and AE
本文中使用GRU模型對提取的HI進行RUL預(yù)測,設(shè)置=100,即假設(shè)最后100個HI點為未知量,使用GRU對未知點進行預(yù)測,當預(yù)測值超過閾值1時,認定軸承失效,該時刻即為軸承的RUL。GRU模型的超參數(shù)設(shè)置見表5所示。為了描述RUL的預(yù)測準確率,使用平均絕對誤差(mean absolute error,MAE)來進行評價,MAE的具體表達式為
表5 GRU神經(jīng)網(wǎng)絡(luò)的超參數(shù)Table 5 Hyperparameter settings of GRU neural network
Bearing1_1和Bearing1_3的預(yù)測結(jié)果如圖9所示。由圖9可以看出,GRU模型能夠很好地預(yù)測軸承的未來趨勢,藍色的預(yù)測值與黑色的HI真實值具有很強的擬合程度,說明本文提出的MSCAE模型所提取的HI能夠很好的解決軸承的RUL預(yù)測問題。為了進一步驗證的大小對于RUL預(yù)測精度的影響,設(shè)置了=50、100、200三個不同的值進行對比實驗,Bearing1_1和Bearing1_3的MAE結(jié)果如圖10所示。由圖10可以發(fā)現(xiàn),隨著未知點個數(shù)的增加,GRU預(yù)測的MAE逐漸增大,這是因為未知點的個數(shù)越多,退化信息越少,GRU模型需要預(yù)測軸承的長期退化趨勢,必然會導致誤差增加。并且由圖10可以看出,隨著未知點個數(shù)的減少,GRU預(yù)測的MAE減少幅度也在減少,這是因為在未知點個數(shù)很少時,GRU模型的預(yù)測RUL已經(jīng)接近真實的RUL,未知點個數(shù)的減少對于RUL預(yù)測精度提升的影響變低。綜合分析為200和50的預(yù)測情況,Bearing1_1和Bearing1_3的RUL預(yù)測結(jié)果都能保持很高的預(yù)測精度,這對于實際的軸承RUL預(yù)測提供了很好的借鑒。
圖9 Bearing1_1和Bearing1_3的RUL預(yù)測結(jié)果圖Fig.9 RUL prediction results of Bearing1_1 and Bearing1_3
圖10 未知點個數(shù)不同的MAE結(jié)果Fig.10 MAE results with different unknown points
提出了一種基于MSCAE的HI提取方法,并基于提取的HI,使用GRU神經(jīng)網(wǎng)絡(luò)進行RUL預(yù)測。MSCAE能夠有效的利用振動數(shù)據(jù)的全局和局部信息,進行更為有效的健康指標提取。并且提取的HI在進行RUL預(yù)測時,不需要憑借專家的先驗知識設(shè)置特定的閾值,直接將閾值設(shè)定為1。通過PHM2012挑戰(zhàn)賽數(shù)據(jù)對提出的模型有效性進行驗證。實驗結(jié)果說明,使用MSCAE提取的HI相比于單尺度卷積自編碼器,具有更好的單調(diào)性和相關(guān)性,并且HI的波動較小,不會出現(xiàn)提前接近閾值的現(xiàn)象。與AE和卷積神經(jīng)網(wǎng)絡(luò)方法進行比較,進一步突顯MSCAE的優(yōu)越性。GRU神經(jīng)網(wǎng)絡(luò)的RUL預(yù)測實驗證明,使用本文提取的HI進行RUL預(yù)測具有很高預(yù)測精度。