楊蘭柱,劉文廣
(1.內(nèi)蒙古科技大學工程訓練中心,內(nèi)蒙古包頭 014010;2.內(nèi)蒙古科技大學機械工程學院,內(nèi)蒙古包頭 014010)
軸承是旋轉(zhuǎn)機械的基本部件之一,45%~55%的機器停機是由軸承故障引起的[1],所以,有效的軸承故障診斷方法是保證機器正常工作的重中之重。但軸承故障診斷一直是故障診斷領域中的難題。
到目前為止,大多數(shù)基于數(shù)據(jù)驅(qū)動的智能診斷方法已被應用于軸承故障診斷領域中。如人工神經(jīng)網(wǎng)絡(Artificial Neural Network,ANN),隨機森林和支持向量機(Support Vector Machine,SVM)。利用這些淺層機器學習模型進行軸承故障診斷需要手工提取一系列的振動信號特征(例如方差、能量熵、均方根等),將所提取的特征作為模型輸入從而利用分類器進行故障分類。以往的研究結(jié)果表明,特征提取是達到理想診斷準確率的重要前提。但實際上,人為的提取很難準確表征軸承故障特性的有效特征,主要有以下3個難以解決的問題[2]:(1)需要足夠的專業(yè)知識和經(jīng)驗知識;(2)在難以消除的硬件干擾及多變的機械系統(tǒng)環(huán)境下,提取的特征也應該是多變的;(3)手工提取特征可能對數(shù)據(jù)利用率較低,從而導致有效信息缺失。因此,上述經(jīng)典的淺層模型不適用于軸承故障診斷。
為了避免上述問題,近年來,各種基于模式識別[3]的深度學習方法被提出,其中CNN受到各個領域的廣泛關注。與其他深度學習模型相比,CNN采用權值共享、局部感知和子采樣策略,可以顯著減少待優(yōu)化參數(shù)數(shù)量,使網(wǎng)絡訓練速度大大提升。同時,由于CNN卷積過程中對局部變化不敏感的特點,使CNN具有了較強的抗噪能力。CNN作為主要的深度學習模型之一,已經(jīng)成功應用于許多領域。
但由于傳統(tǒng)CNN網(wǎng)絡自身特性,在用于軸承振動信號深層次特征提取時,在提取過程中往往會產(chǎn)生過擬合現(xiàn)象,導致測試集準確率較低且訓練速度較慢?;诖耍疚脑谠械腃NN網(wǎng)絡架構基礎上對網(wǎng)絡進行了改進,增加了一個批歸一化(batch normalization,BN)層[4],一個指數(shù)線性單元層(exponential linear unit,ELU)[5],并通過實驗表明提出的網(wǎng)絡更具有有效性及泛化性。
改進的CNN網(wǎng)絡目的是完善傳統(tǒng)CNN在提取信號局部特征時的一些弊端。改進的CNN網(wǎng)絡信號提取層由一個卷積層(Convolution),一個BN層,一個ELU層和一個最大池化層(Max Pooling,MP)構成,結(jié)構如圖1所示。其中,卷積層和池化層是改進的CNN網(wǎng)絡的核心層。BN層提高了深度網(wǎng)絡的性能和穩(wěn)定性。ELU層加快了設計網(wǎng)絡的學習速度,提高了的識別精度。最大池化層可以減少噪聲對提取故障特征的干擾[6]。它將輸入劃分為一組互不重疊的區(qū)域,并輸出每個子區(qū)域的最大值[7]。改進的CNN網(wǎng)絡是由對輸入噪聲具有魯棒性的層構建而成,因此改進的CNN網(wǎng)絡學習到的特征具有一定的魯棒性。
圖1 改進的CNN網(wǎng)絡
將信號x(n)作為輸入輸入到大小為l的卷積核w(n)中進行卷積來獲得結(jié)果z(n),實驗中隨機初始化卷積核w(n)。
然后將卷積得到的特征輸入到BN層,使這些特征在激活后得以歸一化。歸一化后,這些特征的平均值接近于0,標準差接近于1。歸一化的特征可以表示為:
經(jīng)過函數(shù)BN(?)的處理后,卷積層獲得的特征已被規(guī)范化,函數(shù)σ(?)為ELU層的激活函數(shù),可表示為:
將所得特征傳遞給最大池化層,池化層具有非線性下采樣功能,可以降低特征分辨率,最大池化層生成的特征可表示為:式中:Ωk為索引為j的池化區(qū)域。
本文構建了改進的CNN網(wǎng)絡來對軸承振動信號進行處理,通過疊加4個特征提取層來提取軸承振動信號深層次特征。其流程圖如下,其中每一個LFLB為一個特征提取層,每個LFLB層由一個卷積層,一個BN層,一個ELU層及一個最大池化層組成。4個LFLB組成的LFLBS層提取出了信號的深層次特征如圖2所示。該網(wǎng)絡目的是從軸承振動信號中學習深層特征,軸承振動信號是一維的,因此,每個LFLB模塊的卷積核和池化內(nèi)核都是一維的,且每個LFLB模塊的卷積核大小都為3,步長都為1,填充方式都為SAME。其中LFLB1與LFLB2卷積核數(shù)量為64,LFLB3和LFLB4卷積核數(shù)量為128。每個LFLB模塊中的最大池化內(nèi)核大小與步長都為4。網(wǎng)絡參數(shù)如表1所示。網(wǎng)絡頂層使用softmax分類器,分類器根據(jù)學習到的深層次特征來判別軸承故障類型。
然后將學習到的深層次特征輸入到全連接中,全連接層輸出的故障特征可表示為:
圖2 改進的CNN網(wǎng)絡流程圖
表1 改進的網(wǎng)絡參數(shù)(C為卷積層,P為池化層)
全連接層輸出輸入到Softmax分類器中進行分類。Softmax是一種分類器,在多分類問題中,標簽z包含兩個以上的值。Softmax函數(shù)可以定義為:式中:zi為softmax的輸入;hj為倒數(shù)第二層的激活;Wji為倒數(shù)第二層和softmax層之間的權重。
因此,預測類標簽為:
西儲大學軸承數(shù)據(jù)集被認為是檢驗機械故障診斷方法的基準。所用故障軸承故障為正常軸承;內(nèi)圈故障軸承,外圈故障軸承,滾動體故障軸承。該試驗使用電火花加工技術分別在軸承外圈(3點鐘、6點鐘、12點鐘方向)、內(nèi)圈、滾動體上布置了單點故障,故障直徑分別為0.007英寸(1英寸=2.54 cm)、0.014英寸、0.021英寸、0.028英寸、0.040英寸,轉(zhuǎn)速分別對應于 1 797 r/min、1 772 r/min、1 750 r/min、1 730 r/min。信號的采樣頻率為12 000 Hz。將西儲大學正常軸承振動數(shù)據(jù)及3種故障軸承振動數(shù)據(jù)每類故障下的每個樣本裁剪為10個大小為12 000個點的子樣本,隨機性的將子樣本集以8∶2∶2的比例分割為訓練集、驗證集及測試集。
圖3 HZXT-DS-003雙跨雙轉(zhuǎn)子滾動軸承試驗臺簡圖
表2 6205軸承參數(shù)
2.2.1 傳統(tǒng)CNN在該數(shù)據(jù)集上的應用
使用傳統(tǒng)的CNN來對該數(shù)據(jù)集數(shù)據(jù)進行處理,網(wǎng)絡架構如圖4所示,網(wǎng)絡參數(shù)如表3所示。
圖4 傳統(tǒng)CNN架構圖
表3 CNN參數(shù)
實驗結(jié)果如圖5所示。從結(jié)果可以看出,使用傳統(tǒng)CNN來對該數(shù)據(jù)集數(shù)據(jù)進行分析,要達到模型最優(yōu)需要的迭代次數(shù)有230次左右,且驗證集準確率最高僅有76.33%,使用測試集對訓練好的網(wǎng)絡進行測試,準確率為75.26%,顯然,傳統(tǒng)的CNN并不適合處理軸承原始振動信號。
2.2.2 改進的CNN在該數(shù)據(jù)集上的應用
使用改進的CNN網(wǎng)絡來對數(shù)據(jù)集進行處理,網(wǎng)絡架構如圖2 所示,網(wǎng)絡參數(shù)與表1參數(shù)相同。處理結(jié)果如圖6所示,當?shù)螖?shù)達到34次時模型達到最優(yōu),此時驗證集準確率最高為98.75%。使用測試集對模型進行測試,得到的軸承故障混淆矩陣如表4所示,測試集準確率為97.35%。結(jié)果表明,與使用傳統(tǒng)CNN實驗結(jié)果相比較,網(wǎng)絡達到最優(yōu)所用迭代次數(shù)大大減少,表明改進的CNN運算成本大大降低。且準確率方面,改進后的CNN性能明顯優(yōu)于傳統(tǒng)CNN。
圖5 傳統(tǒng)CNN訓練準確率和驗證準確率隨迭代次數(shù)的變化圖
圖6 改進的CNN訓練正確率和驗證準確率隨迭代次數(shù)的變化圖
表4 軸承故障混淆矩陣準確率%
使用改進的CNN網(wǎng)絡來對軸承進行故障診斷,可以避開人工提取特征過程,減少診斷成本。又由于是在海量數(shù)據(jù)中尋找特征,所以具有更高的泛化性。本文提出的改進的CNN網(wǎng)絡可以有效地學習到軸承振動信號深層次特征,相比于使用傳統(tǒng)CNN網(wǎng)絡,其提取的特征更具有代表性,診斷效果遠好于使用傳統(tǒng)CNN神經(jīng)網(wǎng)絡。