張振宇,王嬈芬,朱安康
(上海工程技術(shù)大學(xué)電子電氣工程學(xué)院,上海201620)
滾動軸承作為旋轉(zhuǎn)機(jī)械中必不可少的零部件,廣泛應(yīng)用于交通、航空等領(lǐng)域及各種工程機(jī)械、高端精密機(jī)床、儀表儀器上,一旦出現(xiàn)問題將造成經(jīng)濟(jì)損失和安全隱患。傳統(tǒng)的滾動軸承故障主要通過提取時域特征[1]、頻域特征[2]和時頻特征[3]結(jié)合機(jī)器學(xué)習(xí)方法進(jìn)行診斷。
陳強(qiáng)強(qiáng)等[4]采用經(jīng)驗?zāi)B(tài)分解(Empirical mode decomposition,EMD)方法對振動信號進(jìn)行分解,對IMF 分量的模糊熵值進(jìn)行特征提取,利用支持向量機(jī)(Support vector machines,SVM)實(shí)現(xiàn)滾動軸承的故障診斷;陳慧等[5]提出一種新的基于多尺度熵(Multiscale entropy,MSE) 和概率神經(jīng)網(wǎng)絡(luò)(Probabilistic neural networks,PNN)的滾動軸承故障診斷方法;張鈺等[6]從滾動軸承的振動信號中提取時域統(tǒng)計指標(biāo),將其作為特征向量,利用隨機(jī)森林(Random forest,RF)對滾動軸承故障進(jìn)行診斷。但是,傳統(tǒng)的機(jī)器學(xué)習(xí)方法分類結(jié)果依賴于特征提取[7]、特征降維、分類器選擇,造成了傳統(tǒng)方法模型適用的局限性。
目前,隨著深度學(xué)習(xí)(Deep learning,DL)的快速發(fā)展,軸承故障診斷領(lǐng)域也出現(xiàn)了一些基于深度學(xué)習(xí)的端到端的診斷方法。它可以自動學(xué)習(xí)原始數(shù)據(jù)的表示特征[8],減少特征提取過程所涉及的特征定義的影響,從而可以實(shí)現(xiàn)端到端的故障診斷[9]。袁文軍等[10]采用了一種基于深度編碼網(wǎng)絡(luò)的新型軸承故障智能診斷方法;曲建嶺等[11]采用自適應(yīng)一維卷積神經(jīng)網(wǎng)絡(luò)對滾動軸承進(jìn)行故障診斷。在某些情況下,時域信號可以通過二維格式表示[12–14],然后通過對圖像進(jìn)行分類識別故障類型。
本文提出了基于格拉姆角場法的卷積神經(jīng)網(wǎng)絡(luò)模型(Convolution neural network model of gramian angle field method,GCNN),先使用重疊采樣擴(kuò)充數(shù)據(jù)集,再采用格拉姆角場方法(Gramian angle field,GAF)將一維振動信號轉(zhuǎn)化為二維圖像,在映射過程中,原始信號隨著時間依次映射到圖像的左上角至右下角,保留了時間依賴性,使時間維度通過編碼嵌入到矩陣的幾何結(jié)構(gòu)中,將擴(kuò)充后的二維圖像數(shù)據(jù)集輸入具有4個卷積層的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行軸承故障診斷訓(xùn)練,實(shí)現(xiàn)滾動軸承故障的故障分類。
本文提出了一種新的將時域信號轉(zhuǎn)化為二維圖像的方法,并將其用在軸承故障信號上。在將時域信號轉(zhuǎn)化為圖像方法中,將采集的時域信號進(jìn)行分段,每段代表一個故障信號樣本。
在傳統(tǒng)的笛卡爾坐標(biāo)系中,時域信號是典型的一維信號,其中,x軸方向表示其采樣點(diǎn)或時間值,y軸方向表示采集的信號幅值??紤]將時域信號在極坐標(biāo)系中進(jìn)行表示,過程如下:
(1)X={x1,x2,xi,…,xn}為時域信號的時間序列表示,首先將X歸一化到[-1,1]的范圍內(nèi):
(2)通過式(2)將值編碼為角余弦φ,將時間編碼為半徑r,以極坐標(biāo)表示重新?lián)Q算的時間序列X:
隨著時間的增加,相應(yīng)的值在跨度圓上的不同角點(diǎn)之間發(fā)生扭曲。由于因此φ的范圍為[0,π]。因為cosφ在φ∈[0,π]是單調(diào)的,在給定時間序列的情況下,所提出的映射關(guān)系在極坐標(biāo)系中產(chǎn)生一個唯一的映射結(jié)果,即雙射關(guān)系。
將重新縮放的時間序列轉(zhuǎn)換為極坐標(biāo)系后,可以通過考慮每個點(diǎn)之間的三角和確定角度,以識別不同時間間隔內(nèi)的時間相關(guān)性。
接下來對格拉姆角場進(jìn)行定義:
G(i,j||i-j|=k)通過對方向值φ求和,保留了相對于時間間隔k的時間相關(guān)性。當(dāng)k=0 時,主對角線Gi,i是特殊情況,包含時間序列的原始值和角度信息。
利用格拉姆角場方法對信號進(jìn)行轉(zhuǎn)換有以下幾個優(yōu)勢:
(1)一維信號與二維圖像之間是雙映射關(guān)系,這樣不會丟失一維信號的任何信息[15];
(2)保持了信號的時間依賴性,信號的時間隨著其位置從矩陣的左上角到右下角的移動而增加。
1.2.1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
本文使用的卷積神經(jīng)網(wǎng)絡(luò)共包含8 層,其中包括4個卷積層、2個最大池化層、1個全連接層和1個Softmax輸出層。卷積層卷積核大小都為3×3,步長為1,池化層卷積核大小為2×2,輸出層激活函數(shù)采用Softmax函數(shù),針對傳統(tǒng)的激活函數(shù)Sigmoid容易出現(xiàn)梯度消失、訓(xùn)練時間長的問題,本文選擇了線性整流函數(shù)(Rectified linear unit,ReLU)激活函數(shù)ReLU作為卷積層激活函數(shù),有:
卷積神經(jīng)網(wǎng)絡(luò)具體的結(jié)構(gòu)參數(shù)如表1所示。卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
表1 二維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)
1.2.2 損失函數(shù)
本文采用交叉熵函數(shù)作為損失函數(shù)。假設(shè)卷積神經(jīng)網(wǎng)絡(luò)實(shí)際輸出的Softmax 值為q,其目標(biāo)分布p為one-hot 類型的向量,即當(dāng)目標(biāo)類別為j時,pj=0。交叉熵函數(shù)表達(dá)式見式(5):
式中:m為輸入的小批量(batch_size)大小。損失函數(shù)值越小,所訓(xùn)練的模型擬合性越好。
1.2.3 Adam 梯度下降優(yōu)化算法
在卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中,模型訓(xùn)練的參數(shù)及超參數(shù)將會影響最終測試分類的準(zhǔn)確率,如果超參數(shù)選擇不好,使用隨機(jī)梯度下降法(Stochastic gradient descent,SGD)進(jìn)行訓(xùn)練時容易陷入局部最優(yōu)點(diǎn)。同時,隨機(jī)梯度下降法中每一個參數(shù)都用相同的學(xué)習(xí)率進(jìn)行更新,但實(shí)際上各參數(shù)的重要性是不同的。本文采用自適應(yīng)矩估計(Adaptive moment estimation,Adam)優(yōu)化算法對卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行優(yōu)化,對不同的參數(shù)動態(tài)地采取不同的學(xué)習(xí)率,從而從目標(biāo)函數(shù)更快地收斂,可加快訓(xùn)練速度,同時能夠避免陷入局部最優(yōu)點(diǎn)。算法的基本實(shí)現(xiàn)步驟如下。
輸入:步長ε、矩估計的指數(shù)衰減速率ρ1和ρ2、數(shù)值穩(wěn)定常數(shù)δ、初始參數(shù)θ。
初始化1 階和2 階矩變量s=0,r=0,時間步t=0。
While沒有達(dá)到停止準(zhǔn)則do,
從訓(xùn)練集中隨機(jī)抽取小批量m個樣本{x(1),…,x(m)},對應(yīng)目標(biāo)為y(i)。
t←t+1,
更新有偏1階矩估計:s←ρ1s+(1-ρ1),
應(yīng)用更新:θ←θ+Δθ,
End while。
采用凱斯西儲大學(xué)的滾動軸承數(shù)據(jù)集,實(shí)驗裝置如圖2 所示。測試臺由1.5 kW 電動機(jī)(左)、扭矩傳感器/編碼器(中)、功率測試計(右)和控制電子設(shè)備(未顯示)組成。測試軸承支撐電機(jī)軸。軸承的損傷是用電火花加工造成的單點(diǎn)損傷。振動信號的數(shù)據(jù)是針對正常軸承、單點(diǎn)驅(qū)動端和風(fēng)扇端缺陷收集的。文中應(yīng)用了驅(qū)動端振動信號。采樣頻率為12 kHz。軸承總共有10 種狀況,包括9 種故障狀況和正常狀況。實(shí)驗數(shù)據(jù)集是在3 種工作負(fù)載條件(1、2、3 hp)下采集的,工作負(fù)載條件和近似速度如表2所示。
圖2 CWRU滾動軸承數(shù)據(jù)采集系統(tǒng)
表2 電機(jī)負(fù)載和電機(jī)轉(zhuǎn)速
數(shù)據(jù)集增強(qiáng)技術(shù)即通過增加訓(xùn)練樣本,達(dá)到增強(qiáng)深度神經(jīng)網(wǎng)絡(luò)泛化性能的目的。在樣本分割長度的選擇上,較短的樣本分割長度可以節(jié)省訓(xùn)練時間、提高模型的收斂速度,但是也會造成樣本所含有的信息量較少,影響識別準(zhǔn)確率;而較長的樣本分割長度則會增加算法的收斂速度,影響故障診斷模型的實(shí)時性。為了充分利用故障信號中的信息,采用重疊采樣的方法,即在劃分訓(xùn)練樣本時,對前一段信號與其后一段信號之間的區(qū)間重疊采樣,采樣方式如圖3所示。
圖3 數(shù)據(jù)集增強(qiáng)方式
對不同故障狀態(tài)下的原始振動信號以一定的重疊比例η進(jìn)行分割,并構(gòu)建訓(xùn)練集和測試集。設(shè)某一故障狀態(tài)下的振動信號S長度為N,設(shè)置樣本長度為l,則以重疊率η進(jìn)行樣本擴(kuò)充的實(shí)現(xiàn)方式為
(1)獲取在當(dāng)前信號下的最大可分割樣本數(shù)量:
其中:[ ]為向下取整運(yùn)算符。
(2)獲取分割樣本。第i個樣本在原始振動信號的位置可表示為:
xi為分割后的樣本數(shù)據(jù),可以根據(jù)不同的樣本規(guī)模設(shè)定重疊比例η。
文中每次采樣512個數(shù)據(jù)點(diǎn),重疊比例設(shè)為0.1。
實(shí)驗數(shù)據(jù)集共3個,如表3所示。每個數(shù)據(jù)集包括20 000 組訓(xùn)練樣本和2 000 組測試樣本,A、B、C分別是在負(fù)載為1 hp、2 hp、3 hp 條件下的數(shù)據(jù)集。樣本標(biāo)簽采用One-hot 形式。軸承包含3 種故障類型,分別由滾動體故障(B)、外圈故障(OR)和內(nèi)圈故障(IR)表示。每種故障類型都有3種不同的損傷尺寸,損傷尺寸(inch)分別為0.07、0.014 和0.021。因此,總共有10 種狀況,包括9 種故障狀況和正常狀況。
表3 試驗數(shù)據(jù)集描述
將采集得到的故障信號通過格拉姆角場方法轉(zhuǎn)換為二維圖像作為訓(xùn)練數(shù)據(jù)集,通過卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練出故障診斷模型,通過模型的代價函數(shù)判斷模型的魯棒性,并驗證診斷準(zhǔn)確率,最后基于驗證集通過卷積神經(jīng)網(wǎng)絡(luò)判斷故障類型,并根據(jù)整體驗證集數(shù)據(jù)得出故障診斷模型的預(yù)測準(zhǔn)確率,驗證模型的有效性,整體流程圖見圖4。
圖4 軸承故障訓(xùn)練診斷流程圖
一種負(fù)載狀態(tài)下信號共存在10種狀態(tài),每種狀態(tài)下的圖片大小為512×512 ,轉(zhuǎn)換后的圖片如圖5所示。圖5中的故障類型依次為滾動體故障(B)、外圈故障(IR)、內(nèi)圈故障(OR)和正常狀態(tài)(Normal),每種故障類型都有3種不同的損傷尺寸。
圖5 軸承故障信號-圖像轉(zhuǎn)換圖
3.2.1 參數(shù)設(shè)置
仿真平臺的配置如下:64 位的Windows10 操作系統(tǒng),CPU 采用i7-8750H@2.20 GHz,GPU 采用NVIDIA GTX 1060,使用Keras 框架,程序運(yùn)行的環(huán)境是python3.6。
選擇Adam optimizer 優(yōu)化器作為優(yōu)化器,學(xué)習(xí)率設(shè)置為0.005,采用Relu 激活函數(shù)。使用Dropout層抑制過擬合,參數(shù)設(shè)置為0.5,即每次訓(xùn)練時,有一半的神經(jīng)元隨機(jī)停止工作。A、B、C 每個數(shù)據(jù)集訓(xùn)練集有20 000 張圖片,測試集有2 000 張圖片,對3個數(shù)據(jù)集分別進(jìn)行訓(xùn)練和測試,在訓(xùn)練過程中,迭代步數(shù)為20次,每批處理的樣本個數(shù)batch_size為64,采用交叉熵?fù)p失函數(shù)作為損失函數(shù)。
3.2.2 結(jié)果與分析
利用凱斯西儲大學(xué)的滾動軸承數(shù)據(jù)集對搭建好的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,模型訓(xùn)練過程中,3種負(fù)載的損失函數(shù)的下降趨勢如圖6所示。隨著模型迭代次數(shù)的增加,損失值逐漸收斂。
圖6 損失函數(shù)值變化曲線
3組數(shù)據(jù)集準(zhǔn)確率見表4。由表4可以更清晰看到模型對于這3組數(shù)據(jù)集都達(dá)到較高的準(zhǔn)確率,3組數(shù)據(jù)集平均準(zhǔn)確率為99.73%。圖7顯示了3組數(shù)據(jù)集的混淆矩陣,可以看出對于數(shù)據(jù)集B、C 診斷效果最好,對于A數(shù)據(jù)集有部分B021故障類型被誤分到B007類型中。
圖7 混淆矩陣
表4 3種負(fù)載下的模型識別準(zhǔn)確率
近年來,已有不少文獻(xiàn)針對滾動軸承故障診斷問題展開了研究,將本文基于GCNN 方法的仿真結(jié)果與其他文獻(xiàn)所述方法進(jìn)行比較,結(jié)果如表5所示。
表5 不同算法的結(jié)果對比
通過對比可以發(fā)現(xiàn),相比于基于時頻域特征提取結(jié)合傳統(tǒng)的機(jī)器學(xué)習(xí)算法如人工神經(jīng)網(wǎng)絡(luò)[16–17]、SVM[18]、決策樹[19]等,本文所提方法可識別的故障類型多達(dá)10 類,同時分類準(zhǔn)確率有明顯提高。并且,在可識別故障類型相同的情況下,對比一些深度學(xué)習(xí)方法如深度神經(jīng)網(wǎng)絡(luò)、長短期記憶網(wǎng)絡(luò)[19](Long short term memory,LSTM)、卷積神經(jīng)網(wǎng)絡(luò)[20],本文所使用的方法有著更高的準(zhǔn)確率,見圖8。此外與其他圖像轉(zhuǎn)換方法如通過短時傅里葉變換得到時頻譜圖[21]比較,本文所提方法效果更好,由此驗證了其優(yōu)越性。
圖8 不同算法的結(jié)果對比
本文提出一種用于軸承故障診斷的二維卷積神經(jīng)網(wǎng)絡(luò)診斷方法,采用格拉姆角場方法對一維故障信號進(jìn)行信號–圖像轉(zhuǎn)換,并利用卷積神經(jīng)網(wǎng)絡(luò)結(jié)合Adam算法對模型進(jìn)行訓(xùn)練,仿真結(jié)果驗證了在3種負(fù)載數(shù)據(jù)集下的訓(xùn)練效果與分類準(zhǔn)確率,得出了以下結(jié)論:
采用格拉姆角場方法,對一維信號進(jìn)行數(shù)學(xué)上的變換,得到它的格拉姆矩陣并轉(zhuǎn)為二維圖像,該轉(zhuǎn)換方法更多地保留了原始信號內(nèi)的時序特征,也保留了原始信號的時間依賴性。相比于傳統(tǒng)的特征提取方式以及已有的一維信號轉(zhuǎn)二維圖像的方法,采用該方法能節(jié)省更多處理時間。
所采用的卷積神經(jīng)網(wǎng)絡(luò)能夠自動從圖像中提取特征,然后對其分類識別,降低了對人工的依賴,可以準(zhǔn)確地判斷滾動軸承的故障類型,并且識別準(zhǔn)確率很高。該方法具有較大的實(shí)用價值,可以推廣至閥門、齒輪等零部件的故障診斷中。