白麗麗,韓振南,任家駿,秦曉峰
(太原理工大學(xué) 機(jī)械與運(yùn)載工程學(xué)院,太原 030024)
滾動(dòng)軸承作為旋轉(zhuǎn)機(jī)械系統(tǒng)中的關(guān)鍵部件,對(duì)其故障診斷技術(shù)的研究具有重要的現(xiàn)實(shí)意義[1]。而故障診斷技術(shù)的核心是對(duì)該部件進(jìn)行模式識(shí)別,過程包括特征提取、特征選擇和分類識(shí)別[2-4]。在機(jī)械系統(tǒng)運(yùn)轉(zhuǎn)的過程中,可以通過分析采集到的信號(hào)得到一些包含了滾動(dòng)軸承運(yùn)行狀態(tài)的信息,這些信息構(gòu)成了表征滾動(dòng)軸承運(yùn)行狀態(tài)的特征集。由于不同特征的靈敏度不同,因此它所表征的故障信息量也是不同的[5]。特征太多會(huì)造成特征之間的冗余性,故需要對(duì)特征集進(jìn)行特征選擇,選用數(shù)量較少的且較敏感的特征來準(zhǔn)確的表征滾動(dòng)軸承的運(yùn)行狀態(tài)。
目前,常用的特征選擇方法為費(fèi)舍爾分值法(fishes score,FS)[6]和拉普拉斯分值法(laplace score,LS)[7]。FS更注重有類別信息的特征,而忽略了保留特征的局部信息。作為一種無監(jiān)督的特征選擇方法,LS結(jié)合了特征的局部保留能力,同時(shí)使用方差值來表征包含信息的能力。LS可以從原始特征集中有效地選取包含故障信息的特征,不僅可以避免維數(shù)災(zāi)難,而且可以改進(jìn)滾動(dòng)軸承故障識(shí)別的表現(xiàn)。
在特征選擇之后,有必要引入支持向量機(jī)(support vector machine,SVM)來進(jìn)行故障的自動(dòng)識(shí)別。SVM是以統(tǒng)計(jì)學(xué)習(xí)為理論進(jìn)行小樣本分類和預(yù)測(cè)的機(jī)器學(xué)習(xí)算法,但是SVM參數(shù)的選擇嚴(yán)重影響最終的識(shí)別效果[8]。由于參數(shù)選取的不同,同樣的訓(xùn)練樣本建立的模型也會(huì)產(chǎn)生較大的差別,最后的識(shí)別精度也會(huì)有較大的差異。本文將一種新型的元啟發(fā)式智能仿生算法——鯨魚優(yōu)化算法[9-11]用于尋找SVM的最佳參數(shù),即基于鯨魚算法尋優(yōu)的支持向量機(jī)(support vector machine optimized by whale algorithms,WOASVM)。
本文是基于LS和WOASVM方法對(duì)滾動(dòng)軸承進(jìn)行故障診斷的研究。首先,形成一個(gè)包含時(shí)域、頻域以及時(shí)頻域中若干特征的特征集,然后計(jì)算其LS值,并按其值的大小排序,選擇一些特征形成特征向量。接著使用鯨魚算法來尋找SVM中最佳的懲罰因子和核參數(shù)。最后,利用WOASVM來進(jìn)行滾動(dòng)軸承的故障狀態(tài)識(shí)別。
當(dāng)機(jī)械設(shè)備產(chǎn)生故障時(shí),時(shí)域信號(hào)的幅值和分布由于脈沖或振動(dòng)的產(chǎn)生而改變。所以從時(shí)域波形中提取的時(shí)域統(tǒng)計(jì)特征參數(shù)可以最直觀、最簡(jiǎn)便的反映機(jī)械系統(tǒng)的故障。本文選擇波形指標(biāo)、峭度指標(biāo)、峰值指標(biāo)、裕度指標(biāo)和脈沖指標(biāo)作為時(shí)域特征參數(shù),依次標(biāo)記為特征1-5.
如果發(fā)生故障,一些異常頻率成分可以反映機(jī)器的運(yùn)行狀況。所以,在頻域提取一些指標(biāo)對(duì)故障診斷至關(guān)重要。本文選取了頻率均值、頻率方差、標(biāo)準(zhǔn)偏差頻率、均方根頻率和重心頻率作為頻域特征參數(shù),依次標(biāo)記為特征6-10.
時(shí)頻域特征具有良好的聚合性和直觀性,可以同時(shí)反映信號(hào)的時(shí)域和頻域特性,因此,有效提取時(shí)頻特征參數(shù)對(duì)于故障診斷的準(zhǔn)確性有著至關(guān)重要的意義。本文選取了更加完善的完整自適應(yīng)噪聲集成經(jīng)驗(yàn)?zāi)B(tài)分解方法(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN),將信號(hào)通過CEEMDAN分解后,取前5個(gè)本征模態(tài)函數(shù)的相對(duì)能量特征作為時(shí)頻特征參數(shù)(標(biāo)記為特征11-15)來監(jiān)控滾動(dòng)軸承的健康狀況。
因此,本文從時(shí)域、頻域、時(shí)頻域3個(gè)角度,共選取了15個(gè)特征,形成一個(gè)原始的特征集來表征滾動(dòng)軸承的運(yùn)行狀態(tài)。
特征維數(shù)的增加將導(dǎo)致很大的計(jì)算負(fù)擔(dān)并降低計(jì)算的效率。因此,為了提高故障診斷的效率和有效性,通常需要進(jìn)行特征選擇來消除冗余信息,以提高分類的性能。
拉普拉斯分值是一種基于拉普拉斯特征映射(laplacian eigenmaps,LE)和保局投影(locality preserving projection,LPP)的有效的特征選擇方法[12]。其基本思想是:采用樣本的局部特征來衡量特征,對(duì)于特征空間中的兩個(gè)樣本,它們的距離越小,則屬于同類的概率就越高[13]。LS算法步驟描述如下:
1) 使用給定的m個(gè)數(shù)據(jù)樣本點(diǎn)構(gòu)造近鄰圖G.如果數(shù)據(jù)點(diǎn)xi和xj足夠接近,則認(rèn)為樣本i和樣本j之間有邊連接;否則,認(rèn)為樣本i和樣本j沒有邊連接。
2) 定義權(quán)重矩陣S,如果i和j是連通的,則Sij如式(1)定義,否則Sij=0.
(1)
式中,t是一個(gè)常量。S是對(duì)數(shù)據(jù)空間的局部結(jié)構(gòu)建模,用于測(cè)量?jī)蓚€(gè)樣本點(diǎn)的相似性,同時(shí)也描述了數(shù)據(jù)空間的固有局部幾何結(jié)構(gòu)。
3) 定義fr=(fr1,fr2,…,frm)T,I=(1,1,…,1)T,D=diag(SI),L=D-S.其中,fri代表了第i個(gè)樣本的第r個(gè)特征;I表示m維的單位向量;矩陣L為拉普拉斯矩陣。為了避免某些維數(shù)據(jù)之間的差異很大而支配近鄰圖的構(gòu)造,對(duì)每個(gè)特征去均值處理,如下:
(2)
4) 第r個(gè)特征的拉普拉斯分值Lr計(jì)算如下:
(3)
式中,Var(fr)為第r個(gè)特征的估計(jì)方差。將這些特征按照LS從低到高排序,最重要的特征排名在最前面。
支持向量機(jī) (support vector machine,SVM)的計(jì)算原理簡(jiǎn)單描述如下[14]。
將輸入空間中線性不可分離的訓(xùn)練樣本映射到新空間,轉(zhuǎn)換為線性可分的數(shù)據(jù)加以分類。對(duì)于分類問題,SVM成為以下雙重優(yōu)化問題:
(4)
式中:α是對(duì)應(yīng)的拉格朗日乘數(shù);C為懲罰參數(shù)。
1) 包圍獵物。鯨魚可以確定獵物位置并包圍它們。在WOA算法中,假設(shè)當(dāng)前群體中的最佳位置是獵物,并且種群中的其他個(gè)體均向著最佳位置移動(dòng)。使用式(5)更新位置:
X(t+1)=Xp(t)-A·|C·Xp(t)-X(t)| .
(5)
A=2ar1-a.
(6)
C=2r2.
(7)
式中:r1和r2是[0,1]之間的隨機(jī)數(shù);α稱為收斂因子。
2) 泡網(wǎng)攻擊。收縮包圍機(jī)制:隨著收斂因子α的減小,用公式(5)實(shí)現(xiàn)了收縮包圍機(jī)構(gòu)。螺旋更新位置:使用以下公式(8)模擬鯨魚捕捉獵物的螺旋運(yùn)動(dòng):
X(t+1)=D′eblcos(2πl(wèi))+Xp(t) .
(8)
式中:D′=|Xp(t)-X(t)|代表獵物與第i條鯨魚之間的距離;b定義了對(duì)數(shù)螺旋形狀,l為[-1,1]的隨機(jī)數(shù)。鯨魚不僅在獵物的收縮環(huán)周圍游動(dòng),而且沿著螺旋路徑運(yùn)動(dòng)。
3) 搜尋獵物。鯨魚可以根據(jù)彼此的位置隨機(jī)進(jìn)行搜索:
X(t+1)=Xrand(t)-A·|C·Xrand(t)-X(t)| .
(9)
式中,Xrand是隨機(jī)選擇的鯨魚的位置向量。
鯨魚優(yōu)化算法(WOA)的流程圖如圖1所示。
圖1 鯨魚優(yōu)化算法(WOA)流程圖Fig.1 Flowchart of the WOA
基于LS和WOASVM的滾動(dòng)軸承故障診斷的流程圖如圖2所示,其具體步驟如下:
1) 將原始振動(dòng)信號(hào)分類,分別提取各個(gè)類別中前文介紹的時(shí)域、頻域和時(shí)頻域的特征,形成一個(gè)15維的初始特征集。
2) 將初始特征集按照LS值從小到大的順序排序,并選擇前若干個(gè)特征形成特征矩陣。
3) 將新的特征矩陣中的前60個(gè)樣本作為訓(xùn)練樣本,后90個(gè)樣本用于測(cè)試。
4) 設(shè)置WOA的初始化參數(shù),計(jì)算相應(yīng)的適應(yīng)度函數(shù),得到最優(yōu)的懲罰因子和核參數(shù)的值。這里所使用的適應(yīng)度函數(shù)與粒子群尋優(yōu)所使用的適應(yīng)度函數(shù)類似,設(shè)定為搜索到的懲罰因子和核函數(shù)代入SVM訓(xùn)練后得到的識(shí)別精度。最優(yōu)的懲罰因子和核函數(shù)的值,最終可得到最優(yōu)的識(shí)別精度。
5) 使用得到的最優(yōu)參數(shù)進(jìn)行訓(xùn)練,然后對(duì)測(cè)試樣本的特征矩陣進(jìn)行診斷,從而實(shí)現(xiàn)對(duì)滾動(dòng)軸承故障的診斷。
圖2 故障診斷流程圖Fig.2 Flow chart of the fault diagnosis
本文利用Case Western Reserve University提供的滾動(dòng)軸承試驗(yàn)數(shù)據(jù)[16]進(jìn)行了研究。使用的軸承為6205-2RS深溝球軸承,直徑為0.177~0.533 mm的單點(diǎn)故障是通過電火花加工的。使用正常滾動(dòng)軸承、滾動(dòng)體故障、外滾道故障和內(nèi)滾道故障4種故障類型的試驗(yàn)數(shù)據(jù)。在本文中,使用轉(zhuǎn)速1 797 r/min、采樣頻率12 kHz的驅(qū)動(dòng)端軸承數(shù)據(jù)。數(shù)據(jù)的詳細(xì)分類信息如表1所示。
將以上10組類別的每一類分類類別中各取150個(gè)樣本,得到1 500個(gè)樣本。將這1 500個(gè)樣本分別提取前文所述的時(shí)域、頻域和時(shí)頻域特征,共15個(gè),形成一個(gè)1 500×15的初始矩陣。
然后LS用于對(duì)初始特征進(jìn)行排序,根據(jù)LS新的特征順序從低到高為:11,7,10,9,6,13,2,3,1,8,4,5,12,15,14.可以看出使用LS方法后,特征順序完全打亂。其中通過CEEMDAN分解后的第一個(gè)本征模態(tài)函數(shù)的相對(duì)能量特征最為重要,包含的信息最多。
表1 滾動(dòng)軸承的詳細(xì)分類信息Table 1 Detailed classification information of the rolling bearing
取LS順序中的前3個(gè)特征元素作散點(diǎn)圖,如圖3,可以直觀地看出,前3個(gè)特征元素已經(jīng)可以將滾動(dòng)軸承的故障類型完全區(qū)分開,甚至故障的嚴(yán)重程度也在一定程度上得到了分離。說明LS選擇的特征可以表征最多的故障信息。
圖3 前三個(gè)特征元素形成的散點(diǎn)圖Fig.3 Scatter plot of the three feature elements
選取LS選擇后的前5個(gè)特征元素,將每組中的前60個(gè)樣本輸入WOASVM進(jìn)行訓(xùn)練,其余用于測(cè)試。設(shè)定WOA算法的鯨魚種群數(shù)目為30,最大迭代次數(shù)為100.通過WOA尋找到的最佳懲罰因子為0.633 5,最佳核函數(shù)為60.401 1.利用這些參數(shù)對(duì)測(cè)試樣本進(jìn)行測(cè)試,可得到如圖4的結(jié)果。由圖可以看出,測(cè)試集的識(shí)別率達(dá)到了98%.
圖4 使用所提出的方法后測(cè)試樣本的輸出Fig.4 Outputs of testing samples by using the proposed method
為了進(jìn)一步驗(yàn)證所選出的特征數(shù)的影響,用選擇出的不同數(shù)目的敏感特征來進(jìn)行測(cè)試,可以得到,前1個(gè)特征的識(shí)別率為70.56%,使用前3個(gè)特征的識(shí)別率可達(dá)到95.44%, LS重新排序后的前5-6個(gè)特征,識(shí)別率就可以達(dá)到98%左右。之后特征數(shù)目越多,識(shí)別率反而越低,最終前15個(gè)特征的識(shí)別率僅能達(dá)到89.33%.這是因?yàn)?,有些特征?duì)滾動(dòng)軸承的缺陷并不敏感,而特征太多反而使得故障信息產(chǎn)生了冗余,甚至干涉到了敏感信息對(duì)于相關(guān)故障的分類。所以通過LS對(duì)特征進(jìn)行選擇不僅降低了特征太多所產(chǎn)生的計(jì)算代價(jià),而且提高了分類精度,更加準(zhǔn)確地識(shí)別出故障的類型及嚴(yán)重程度。
通過對(duì)比來進(jìn)一步驗(yàn)證本文所提出方法的有效性,應(yīng)用常見的交叉驗(yàn)證法、網(wǎng)格搜索法、遺傳算法、粒子群算法和鯨魚算法分別對(duì)SVM的懲罰因子和核參數(shù)進(jìn)行尋優(yōu)。同時(shí)對(duì)這幾種方法的初始參數(shù)值設(shè)置進(jìn)行了統(tǒng)一,即種群大小設(shè)為30,迭代次數(shù)為300,搜索空間為[0.1,100]和[0.01,1 000].同樣使用上文通過LS選擇后的前5個(gè)特征進(jìn)行訓(xùn)練、測(cè)試,每組實(shí)驗(yàn)進(jìn)行10組,取其識(shí)別率和運(yùn)行時(shí)間的平均值。具體的分類識(shí)別率和運(yùn)行時(shí)間見表2.
表2 不同尋優(yōu)算法對(duì)SVM的影響Table 2 Influence of different optimization methods on SVM
從表2可知,所有經(jīng)過尋優(yōu)算法優(yōu)化后的SVM都得到了不錯(cuò)的識(shí)別率。交叉驗(yàn)證和網(wǎng)格搜索法的識(shí)別率是這其中較低的,且交叉驗(yàn)證法的運(yùn)行時(shí)間特別長(zhǎng)。啟發(fā)式算法,如遺傳算法、粒子群算法得到的識(shí)別率都比較高,但這兩者的運(yùn)行時(shí)間都較長(zhǎng)。而鯨魚算法不僅得到了很高的識(shí)別率,耗時(shí)也是最短的。
本文自建試驗(yàn)臺(tái)的實(shí)物圖如圖5所示。試驗(yàn)的軸承在試驗(yàn)齒輪箱中,為2612圓柱滾子軸承,采用轉(zhuǎn)速為1 420 r/min、采樣頻率為2 000 Hz的4種狀態(tài)下輕載和重載時(shí)的振動(dòng)信號(hào)。其中故障為寬度0.3 mm的劃痕,輕載和重載表現(xiàn)為扭矩的不同,其詳細(xì)的分類情況參見表3.
圖5 自建試驗(yàn)平臺(tái)的實(shí)物圖Fig.5 Physical chart of self-built test platform
故障類型故障尺寸/mm加載情況分類類別正常軸承0輕載0重載1外圈故障0.5輕載0.5重載2滾動(dòng)體故障0.7輕載0.7重載3內(nèi)圈故障0.3輕載0.3重載4
將每組故障類型同樣分別取150個(gè)樣本且提取時(shí)域、頻域和時(shí)頻域的15個(gè)特征,形成1 200×15的初始矩陣。計(jì)算LS,得到新的特征排序?yàn)椋?,7,10,11,14,6,9,3,2,4,1,12,13,15,5.通過LS選擇后將前3個(gè)特征元素做散點(diǎn)圖在圖6中顯示,可以看出每一類的分類類別基本上可以各自聚在一起,滾子故障與其余故障狀態(tài)分離明顯,其余的故障狀態(tài)基本上可以分離,但交匯處有些干涉。但這只是前3個(gè)特征元素所表現(xiàn)的分離效果,選取前若干個(gè)特征元素輸入SVM后,可以得到準(zhǔn)確的分類精度的數(shù)值。
圖6 前三個(gè)特征元素形成的散點(diǎn)圖Fig.6 Scatter plot of the three feature elements
在狀態(tài)識(shí)別過程中,選取的特征數(shù)過多會(huì)造成計(jì)算量過大,選取的特征數(shù)過少,又無法全面的表征故障狀態(tài)。使用不同數(shù)目的敏感特征來表征滾動(dòng)軸承的故障狀態(tài),同樣運(yùn)行10次,去平均的故障識(shí)別率,具體結(jié)果見圖7.由圖可以看出,隨著選擇的特征數(shù)目的增加,識(shí)別率不總是增長(zhǎng)的,特征數(shù)目在5-7,11-14范圍內(nèi)的識(shí)別率總體較高,為后續(xù)選擇合適的敏感特征數(shù)目提供了參考。
圖7 不同數(shù)目的特征的識(shí)別率Fig.7 Recognition rate of different numbers of features
由上,本文選擇前5個(gè)特征形成敏感特征矩陣來進(jìn)行分類識(shí)別。同樣選取60個(gè)樣本訓(xùn)練,其余90個(gè)樣本測(cè)試,輸入WOA優(yōu)化的SVM中,得到了99.31%的識(shí)別精度(最佳懲罰因子為11.13,最佳核參數(shù)為86.99),運(yùn)行時(shí)間僅為3.41 s.再一次證實(shí)了本文所提方法的有效性與高效性。
本文提出了一種基于LS和WOASVM的滾動(dòng)軸承故障診斷算法。首先,將原始振動(dòng)信號(hào)時(shí)域、頻域和時(shí)頻域中的一些特征參數(shù)運(yùn)用LS進(jìn)行特征排序,選擇敏感特征形成特征矩陣,并將形成的特征矩陣進(jìn)行模式識(shí)別。接著,通過鯨魚算法對(duì)SVM進(jìn)行參數(shù)尋優(yōu),通過WOASVM得到最終的識(shí)別結(jié)果。該方法利用LS方法的保局能力來衡量特征,從而可以有效地選擇出包含故障信息較多的特征,同時(shí)減少冗余特征,提高故障識(shí)別率。同時(shí)利用鯨魚算法優(yōu)化SVM的參數(shù),構(gòu)造出最優(yōu)的故障模式識(shí)別分類器,使得其收斂速度和精度均優(yōu)于其他優(yōu)化算法。通過實(shí)驗(yàn)和對(duì)比結(jié)果表明本文所提出的方法能夠有效地實(shí)現(xiàn)滾動(dòng)軸承故障類型和故障嚴(yán)重程度的診斷。本文提出的方法簡(jiǎn)單有效,可以為機(jī)械傳動(dòng)系統(tǒng)的智能故障診斷提供新的參考。