步偉順,姚 磊,唐苑壽,劉國威
(濟南重工集團有限公司,山東 濟南 250000)
工業(yè)互聯(lián)網(wǎng)技術(shù)廣泛應(yīng)用于機械設(shè)備的健康檢測與管理。在設(shè)備運行的過程中,傳感器采集到海量數(shù)據(jù)對機械設(shè)備剩余壽命的預(yù)測帶來了新的機遇與巨大挑戰(zhàn)。隨著機械系統(tǒng)復(fù)雜程度不斷提高,建立精確的數(shù)學(xué)或物理預(yù)測模型已經(jīng)不太可能。準確地建立相應(yīng)的RUL預(yù)測模型,越來越成為研究的現(xiàn)實需要。
傳統(tǒng)的數(shù)據(jù)驅(qū)動RUL 預(yù)測包括四個主要過程:(1)數(shù)據(jù)獲取;(2)特征提取和選擇;(3)退化行為學(xué)習(xí);(4)RUL估計。利用傳感器監(jiān)測獲取數(shù)據(jù)并進行特征提取,提取的特征有些對退化特征不敏感,甚至不能為RUL提供有用信息。如,文獻[1]對輪齒裂縫的退化狀態(tài)采用均方根等信息,文獻[2]用卷積神經(jīng)網(wǎng)絡(luò)自適應(yīng)構(gòu)建HI。文獻[3]分析利用混沌原理進行故障特征重構(gòu);文獻[4]智能方法故障診斷,文獻[5]利用CNN和BP神經(jīng)網(wǎng)絡(luò)自適應(yīng)構(gòu)建模型。這些方法主要缺點如下:(1)人工構(gòu)造特征不穩(wěn)定;(2)模型復(fù)雜度較高;(3)與卷積神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)方法學(xué)習(xí)能力方面存在差距。
綜合研究分析,擬提出一種新的深度可分卷積神經(jīng)網(wǎng)絡(luò)(DSCNN軸承剩余壽命預(yù)測方法。引入可分離卷積層、壓縮激勵(SE)單元,創(chuàng)立可分離卷積構(gòu)建塊。基于多個可分離的卷積構(gòu)建塊疊加,從原始輸入數(shù)據(jù)中自動學(xué)習(xí)高維表示。通過將學(xué)習(xí)到的表示輸入最后一個完全連接層來估計RUL??煞蛛x卷積引入機械系統(tǒng)預(yù)測中,不僅有效地模擬了不同傳感器數(shù)據(jù)之間的相互關(guān)系,而且大大減小了預(yù)測網(wǎng)絡(luò)的寬度與深度,提高了預(yù)測網(wǎng)絡(luò)模型預(yù)測的精確性與準確性。
標準卷積在卷積的過程中,存在在卷積的深度過程中參數(shù)量無限的放大,增加計算量與時間。深度可分離卷積卷積神經(jīng)網(wǎng)絡(luò)提出了一種新的思路:對于不同的輸入通道采取不同的卷積核進行卷積,卷積過程分成兩個過程:深度卷積(Depthwise)過程和點卷積過程(Pointwise);卷積過程,如圖1所示。深度卷積,如圖1(a)所示。逐點卷積,兩者合起來就是深度可分離卷積,如圖1(b)所示。深度卷積負責(zé)濾波,特征信息為(A,A,1);輸入通道特征映射。逐點卷積轉(zhuǎn)換通道,特征信息為(1,1,D),深度卷積的輸出特征映射。深度卷積參數(shù)量為(A×A×1)×D,逐點卷積參數(shù)量為(1×1×D)×F,即深度可分離卷積參數(shù)量為:A×A×D+D×F;深度可分離卷積參數(shù)與標準卷積參數(shù)之比為:
圖1 標準卷積和深度卷積Fig.1 Standard and Deep Convolutions
(A×A×D+D×F)∕(A×A×D×F)=1∕F+1∕A2
深度網(wǎng)絡(luò)一般迭代次數(shù)較多,1∕E數(shù)值較小,深度可分離卷積參數(shù)縮小比例取決于卷積核信息量的大小。經(jīng)過推算可知,卷積核3×3×1具有較好的效果。
可分離卷積網(wǎng)絡(luò)特征信息,映射過程中包含不同權(quán)重的價值信息。為了突出權(quán)重價值信息較大的映射,過濾掉權(quán)重價值信息無用映射??煞蛛x卷積層后面設(shè)計壓縮激勵單元,該壓縮激勵單元能通過評估每個通道的映射權(quán)重自動調(diào)節(jié)響應(yīng)。信息特征響應(yīng)調(diào)節(jié)過程包括壓縮和激勵兩個步驟如下:
(1)壓縮操作將可分離卷積層的所有輸出信道的全局信息通過使用全局平均池化來縮小卷積輸出嵌入到信道描述符中,信息過程描述為下式計算:
整個響應(yīng)調(diào)節(jié)架構(gòu)通過研究設(shè)計如下:一個全局池化層、兩個全連接層、一個通道乘法層組成。全連接層包括D∕t個神經(jīng)元的縮減層和具有C個神經(jīng)元的維度增加層對自動響應(yīng)機制進行參數(shù)化。最后,通過將可分離卷積的特征映射與相應(yīng)的信道權(quán)值進行信道相乘,得到信息特征校準的映射。
整個網(wǎng)絡(luò)架構(gòu)分離為學(xué)習(xí)子網(wǎng)和壽命估計子網(wǎng)。網(wǎng)絡(luò)架構(gòu)如圖2所示。學(xué)習(xí)子網(wǎng)利用可分離卷積層卷積不同傳感器輸入數(shù)據(jù)尺寸H×1×D,信道卷積核大小設(shè)
圖2 可分卷積網(wǎng)絡(luò)架構(gòu)Fig.2 Dividable Convolutional Network Karchitecture
置為A×1,點卷積核的數(shù)量即輸出信道數(shù)量設(shè)置為D。采用平均池化層進行參數(shù)采樣,池大小p等于步長s,學(xué)習(xí)到的低層映射輸出給可分離卷積設(shè)計單元獲得更高的映射特征,兩個可分離卷積層的參數(shù)設(shè)置一致,即每個信道級卷積核尺寸A×1大小,并且每個可分離卷積層中包含總共2dN個點卷積核。平均池化采用非重疊窗口,設(shè)計成p=s,并且兼顧模型預(yù)測精度與計算效率,SE單元中的維數(shù)減少率T設(shè)置為16。
剩余壽命估計子網(wǎng)利用全局平均池化層從表示學(xué)習(xí)子網(wǎng)接收高維表示,最后第D個可分離卷積設(shè)計單元的2DN個輸入特征映射轉(zhuǎn)換為2DN大小的向量。通過全局平均池化實現(xiàn)降維與減少參數(shù)總數(shù)。通過利用全連接層作為DSCN 的輸出層來實現(xiàn)RUL估計。
實驗數(shù)據(jù)為滾動軸承加速壽命臺架試驗采集的振動加速度數(shù)據(jù),它來源于IEEE 2012年的PHM數(shù)據(jù)挑戰(zhàn)賽[6]。數(shù)據(jù)集包含3種工況條件,17個滾動軸承的全生命周期振動數(shù)據(jù)。使用加速度傳感器采集垂直和水平方向的振動加速度。數(shù)據(jù)采樣間隔為10s,采樣率為25.6kHz,持續(xù)時間為0.1s;因此,每條采集數(shù)據(jù)包含2560數(shù)據(jù)點,共2803條采集數(shù)據(jù)。描繪了工況一條件下的水平振動信號信息,如圖3所示。工況一與工況二各有8和6個數(shù)據(jù)集,4和2個數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù)集;工況三有3個數(shù)據(jù)集,都作為測試數(shù)據(jù)集。采集水平和垂直振動信號作為DSCNN的輸入。
圖3 原始振動信號Fig.3 Original Vibration Signal
在DSCNN網(wǎng)絡(luò)模型中,首先設(shè)計超參數(shù)包括信道卷積核大小A×1、點卷積核數(shù)目D、池化大小p、SE單元的降維比例t和可分離卷積設(shè)計單元數(shù)目N。為了得到可靠穩(wěn)定模型與預(yù)測精度,通過對訓(xùn)練數(shù)據(jù)集進行10折交叉驗證來設(shè)計參數(shù)。設(shè)計時間單元長度為6,處理歸一化振動信號。時間信息單元將連續(xù)采樣時間點處獲得的振動信號映射成高維向量,然后將該向量作為映射輸入DSCN中,包含7175680個數(shù)據(jù)點,輸入量大小為43054080×1×2。模型訓(xùn)練過程中損失函數(shù)采用均方誤差(MSE),利用優(yōu)化器迭代更新網(wǎng)絡(luò)權(quán)值和偏差,使MSE損失函數(shù)最小化。
時間單元大小的增加使得RUL預(yù)測更加準確,同時減少了RUL估計值的波動,網(wǎng)絡(luò)模型深度和寬度設(shè)置平衡了精度和計算時間。標準卷積、可分卷積預(yù)測網(wǎng)絡(luò)具有與DSCNN相同的架構(gòu)和超參數(shù)設(shè)置。與標準卷積相比,可分離卷積減小了82%模型參數(shù),從而降低了計算成本;與可分離卷積相比,壓縮激勵單元的引入只增加了5%的參數(shù)具體,如表1所示??煞志矸e與深度可分卷積預(yù)測網(wǎng)絡(luò)模型的性能估計結(jié)果,如圖4、圖5所示。通過充分分離時間相關(guān)性和跨通道相關(guān)性,DSCNN在精度和計算復(fù)雜度方面優(yōu)勢非常明顯。
表1 模型參數(shù)對比Tab.1 Comparison of Model Parameters
圖4 可分卷積模型預(yù)測結(jié)果Fig.4 Separable Convolution Model Prediction Results
圖5 深度可分卷積模型預(yù)測結(jié)果Fig.5 Prediction Results of Deep Separable Convolution Model
分析四種現(xiàn)有常用預(yù)測方法用來預(yù)測所測試軸承的剩余使用壽命。五種模型的剩余壽命預(yù)測,如圖6 所示。分析結(jié)果可知。深度學(xué)習(xí)模型DBN、CNN、LSTM和DSCN明顯優(yōu)于傳統(tǒng)的機器模型支持向量機SVM,深度學(xué)習(xí)網(wǎng)絡(luò)模型對軸承退化特征信息表征能力較強,能夠更好地挖掘有價值的軸承退化信息,建立更準確的RUL預(yù)測模型。此外,設(shè)計的DSCNN在所有深度預(yù)測模型中獲得較高的預(yù)測精度,這表明DSCNN能提供最準確的RUL估計結(jié)果。因此,提出的DSCNN方法在軸承剩余壽命預(yù)測方面優(yōu)于其他四種預(yù)測方法。所提出的DSCNN 具有較高的RUL 預(yù)測精度,優(yōu)于傳統(tǒng)的數(shù)據(jù)驅(qū)動方法和典型的深度學(xué)習(xí)模型。
圖6 模型預(yù)測對比Fig.6 Comparison of Model Predictions
(1)DSCNN 與傳統(tǒng)的方法對比,DSCNN 直接利用原始多傳感器數(shù)據(jù)作為輸入,避免了人工特征提取所需的先驗知識和專業(yè)知識,減少了人工參與環(huán)節(jié),提高了壽命預(yù)測精度。(2)改進DSCNN結(jié)構(gòu)充分分離時間相關(guān)性和跨通道相關(guān)性,捕捉不同傳感器數(shù)據(jù)故障在不同部件之間的傳播和相互作用,減少了訓(xùn)練模型數(shù)據(jù),提高精度。(3)引入信息特征響應(yīng)自動調(diào)節(jié)單元,對數(shù)據(jù)映射所需超參數(shù)減少,減少計算機利用空間,提高計算效率。