基于ICEEMDAN和松鼠算法優(yōu)化極限學(xué)習(xí)機的滾動軸承故障診斷

2023-07-13 09:12:04趙鳳強史書杰

大連民族大學(xué)學(xué)報 2023年3期

周陽,趙鳳強,喬浩,王波,史書杰

(大連民族大學(xué) 機電工程學(xué)院,遼寧大連 116650)

滾動軸承作為旋轉(zhuǎn)機械的核心組成部分,起著承受載荷、傳遞動力的重要作用,其穩(wěn)定性和可靠性是整個設(shè)備健康工作的關(guān)鍵。根據(jù)統(tǒng)計,滾動軸承故障造成的旋轉(zhuǎn)機械設(shè)備故障占所有機械故障的30%[1]。當(dāng)滾動軸承發(fā)生故障時,通常會有異常的振動噪聲和異常的溫升,振動噪聲會影響機械設(shè)備的正常運轉(zhuǎn),并且嚴重時會造成重大事故;而溫升過高會導(dǎo)致軸承過早損壞或降低軸承壽命,所以精準識別與判斷軸承故障是保持機械設(shè)備長久運營的關(guān)鍵。工作時,軸承有無故障都會產(chǎn)生一定的振動信號,經(jīng)過多年的技術(shù)發(fā)展,提取振動信號中的有效特征信號和分析軸承故障原因的方法也逐漸多樣化、高效化。

在處理非平穩(wěn),非線性的振動信號時,經(jīng)驗?zāi)B(tài)分解(EMD)是強有力的工具[2],復(fù)雜的信號集可以通過該方法自適應(yīng)分解為若干分量和殘差,即固有模態(tài)函數(shù)(IMF)。EMD有很好的自適應(yīng)能力和信噪比[3],能夠從瞬時頻率中提取重要信息,鮑懷謙[4]為增強傳統(tǒng)軸承強噪聲背景下故障診斷精度和穩(wěn)定度,用EMD處理振動信號,有效地提取到前期的微弱信號,更好地識別軸承故障特征。然而,經(jīng)驗?zāi)B(tài)分解也存在著一些缺陷,當(dāng)采集到的信號存在強噪音干擾,脈沖干擾等異常事件或者信號分量頻率和幅值之間相互作用,就會發(fā)生模態(tài)混疊,從而影響了IMF的信號特征。同時,在由極值點確定包絡(luò)線的過程中,存在端點被當(dāng)做極值點的情況,從而產(chǎn)生較大的計算誤差,引發(fā)端點效應(yīng)問題,導(dǎo)致產(chǎn)生虛假分量和失真現(xiàn)象。為此,集合經(jīng)驗?zāi)B(tài)分解(EEMD)[5]、互補經(jīng)驗?zāi)B(tài)分解(CEEMD)[6]、完整集合經(jīng)驗?zāi)B(tài)分解(CEEMDAN)[7]等EMD的改進算法依次被提出。Jinde Zheng[8]也提出了均值優(yōu)化模式分解(MOMD)方法,以提高原始EMD在均值曲線構(gòu)建中的性能,結(jié)果表明,MOMD方法比原始EMD方法獲得了更準確的IMF分量和故障診斷效果。改進的自適應(yīng)噪聲完備集合經(jīng)驗?zāi)B(tài)分解(ICEEMDAN)是2014年由Colominas[9]提出的,在重構(gòu)信號時,它能消除噪聲影響從而避免信號被污染,同時能夠有效克服模態(tài)混疊和端點效應(yīng)問題[10]。

在模式識別方面,常用的方法有隨機森林[11]、支持向量機(SVM)[12]、人工神經(jīng)網(wǎng)絡(luò)(ANN)[13]、極限學(xué)習(xí)機(ELM)[14]等,相對于其他方法,極限學(xué)習(xí)機具有學(xué)習(xí)效率高、參數(shù)設(shè)定簡單、泛化性好等優(yōu)點。董治麟[15]將多尺度排列熵與ELM結(jié)合,應(yīng)用于對滾動軸承故障類型和程度進行識別,相對于其他方法具有更高的識別率。同時,ELM是一種單層前饋神經(jīng)網(wǎng)絡(luò),算法參數(shù)少,訓(xùn)練時間快,但其輸入權(quán)值和隱含層閾值對分類精度有較大的影響。本文為提高ELM的識別準確率和泛化能力,選擇適合的網(wǎng)絡(luò)參數(shù),提出松鼠搜索算法優(yōu)化極限學(xué)習(xí)機SSA-ELM的模式識別方法。

1 特征提取方法

1.1 ICEEMDAN原理

在 ICEEMDAN算法中,分解過程的每個階段,把白噪聲一步步地加入,與此同時,在 EMD分解白噪聲所得的模態(tài)中,選出特殊的模態(tài)信號,并將其添加到殘差信號中,從而得到信號的每一模態(tài)分量,實現(xiàn)對原始信號的完全分解[16]。

ICEEMDAN有以下算子Ek(·)、M(·)、〈·〉,Ek(·)表示經(jīng)過EMD分解得到的第k個模態(tài)分量,M(·)是生成局部平均值運算符,〈·〉表示求平均值,具體實現(xiàn)步驟如下:

(1)對原始信號x加入經(jīng)過EMD分解的具有零均值和單位方差的高斯白噪聲分量,根據(jù)xi=x+β0E1(ωi)得到分解序列的局部均值信號為M(x+β0E1(ωi)),其中,β0為第一個噪聲振幅,ωi表示被添加的第i個白噪聲。

第一個殘差:

r1=〈M(xi)〉 (i=1,2....S)。

(1)

第一個分量:

IMF1=x-r1。

(2)

對第一個殘差r1加入白噪聲作為第二次局部平均值M(r1+β1E2(ωi))可以得到第二個分量:

IMF2=r1-r2=r1-〈M(r1+β1E2(ωi)) 〉。

(3)

以此類推,直到不能分解為止,得到第K個分量:

IMFK=rK-1-rK=rK-1-〈M(rK-1+βK-1EK(ωi)) 〉。

(4)

式中,噪聲振幅βk由以下公式確定:

(5)

式中,εk為第k次加噪信號與分析信號間的期望信噪比倒數(shù),std為標(biāo)準差。

可以看出,ICEEMDAN算法的核心依然是經(jīng)驗?zāi)B(tài)分解,與CEEMDAN向信號分解的每一個階段都加入高斯白噪聲不同,它先利用EMD將自適應(yīng)高斯白噪聲分解,獲取其中特定第K個IMF分量作為輔助噪聲,接著對IMF分量計算信號和噪聲的局部均值并把殘差減去局部均值,最后得到K階差值,計算過程中,噪聲信號和偽分量也大大減少。因此ICEEMDAN能有效地避免重構(gòu)誤差、模態(tài)混疊等問題,其流程圖如圖1。

圖1 分解流程圖

1.2 相關(guān)系數(shù)

由于原始信號中含有大量虛假的分量,相關(guān)性較差,不能有效反應(yīng)原始信號特征,所以在將它分解后可與原始信號的互相關(guān)系數(shù)作為區(qū)分虛假分量的評定指標(biāo),并將互相關(guān)系數(shù)較小的IMF分量剔除。

在時域中,對于容量為n的樣本,兩個信號xi和yi的互相關(guān)系數(shù)r表示為

(6)

1.3 奇異值分解(Singular Value Decomposition,SVD)

SVD[17]是一種矩陣分解方法,在機器學(xué)習(xí)、信號處理、統(tǒng)計分析等方面有著廣泛應(yīng)用。奇異值分解能夠有效獲取矩陣中所代表的重要信息,本文將利用這個特點提取篩選出的IMF分量的特征值。在線性相關(guān)的矩陣左右分別乘以一個正交矩陣進行變換,可將原始矩陣轉(zhuǎn)換為線性獨立的矩陣。例如對于矩陣Bm×n,秩為r,則存在兩個標(biāo)準正交矩陣U和W及對角矩陣D,滿足

B=UDWT。

(7)

2 故障分類方法

2.1 松鼠搜索算法(Squirrel Search Algorithm,SSA)

在松鼠搜索算法中[18],松鼠的位置分為三種:山核桃樹、橡子樹、普通樹,分別表示最優(yōu)解,次優(yōu)解和一般解。松鼠們通過移動位置尋找更好的食物源。具體流程如下:

初始森林中的n只松鼠可以用下面的矩陣表示:

(8)

式中,d為待優(yōu)化變量的維度,FSi,j表示第幾只松鼠在第j維上的值,由式(9)所確定。

FSi,j=FSiL+U(0,1)×(FSi,u-FSi,L)。

(9)

式中,U(0,1)是0和1之間的隨機值,FSi,u和FSi,L是第j維的上下界。

所有松鼠的適應(yīng)度函數(shù)表示為

(10)

計算排序所有松鼠的適應(yīng)度值,最佳適應(yīng)度值的松鼠停留在山核桃樹上,次佳適應(yīng)度值的三只松鼠停留在橡子樹上,其他的松鼠則停留在普通樹上。接下來根據(jù)天敵出現(xiàn)的概率Pdp以及松鼠們所在位置決定對應(yīng)的三種移動策略。當(dāng)沒有天敵出現(xiàn),松鼠可以通過滑行來更好的獲取食物,尋找山核桃樹和橡樹;而存在天敵時,松鼠們會謹慎前行,隨機轉(zhuǎn)移到一個新的地方。

(1)第一種移動策略是由橡樹去往山核桃樹。

(11)

(2)第二種移動策略是由普通樹去往橡樹。

(12)

式中,R2為0和1之間的隨機數(shù)。

(3)第三種移動策略是部分已經(jīng)有過食物的松鼠會由普通樹去往山核桃樹。

(13)

式中,R3為0和1之間的隨機數(shù)。

為了防止陷入局部最優(yōu),松鼠優(yōu)化算法中引入了季節(jié)變化機制,通過季節(jié)檢測常量Sc檢測季節(jié)的變化。

(14)

當(dāng)季節(jié)變化條件Sct

(15)

式中,Smin主要用于平衡全局和局部搜索能力,t和tm分別為當(dāng)前迭代和最大迭代值。

當(dāng)滿足季節(jié)變化條件(冬季結(jié)束),普通樹上的松鼠就會按照式(16)移動。

(16)

式中,Levy表示列維分布中的步長,列維分布通過隨機改變步長能夠提高全局搜索能力。

(17)

式中,ra和rb是[0,1]間的正態(tài)分布隨機數(shù),β為常數(shù),一般取1.5,σ取值如式(18)。

(18)

式中,τ(x)=(x-1)!。

2.2 極限學(xué)習(xí)機

極限學(xué)習(xí)機(Extreme Learning Machine,ELM)是由Huang[19]等人在2014年提出,它的輸入權(quán)值矩陣與隱含層閾值均為隨機生成,只需選擇合適的隱含層神經(jīng)元個數(shù),與傳統(tǒng)的基于梯度下降的學(xué)習(xí)算法如反向傳播算法相比,具有訓(xùn)練參數(shù)少、學(xué)習(xí)速度快、泛化能力強等優(yōu)勢。目前已被廣泛應(yīng)用于分類、回歸以及預(yù)測問題。

設(shè)m、M、n分別為ELM網(wǎng)絡(luò)輸入層、隱含層和輸出層的節(jié)點數(shù),g是隱層神經(jīng)元的激活函數(shù),bi為閾值。

設(shè)有N個任意數(shù)據(jù)樣本(xi,ti),1≤i≤N,其中:

xi=[xi1,xi2,…,xim]T∈Rm;

(19)

ti=[ti1,ti2,…,tin]T∈Rn。

(20)

ELM模型如圖2。

圖2 極限學(xué)習(xí)機的網(wǎng)絡(luò)訓(xùn)練模型圖

數(shù)學(xué)表達式為

(21)

式中:βi=[βi1,βi2…,βin]T為第i個隱層節(jié)點與輸出權(quán)值向量;ωi=[ω1i,ω2i,…ωmi]T為輸入層節(jié)點與第i個隱層節(jié)點的輸入權(quán)值向量;oi=[oi1,oi2,…,oin]T為最終輸出值。

ELM算法用于故障分類時,有兩個決定模型訓(xùn)練性能和最終分類準確率的關(guān)鍵因素,便是初始輸入權(quán)值ωi和隱藏層閾值bi。為了減小這兩個參數(shù)給診斷精度帶來性能和精度的影響,本文采用SSA算法對ELM兩個參數(shù)進行迭代尋優(yōu),進而建立SSA-ELM分類模型。

2.3 SSA-ELM模型

SSA優(yōu)化ELM流程圖如圖3。以訓(xùn)練集錯誤率作為適應(yīng)度函數(shù),即當(dāng)錯誤率最小時,所對應(yīng)的ωi和bi,作為該模型的最優(yōu)參數(shù)。具體優(yōu)化步驟如下[20]:

圖3 優(yōu)化模型流程圖

步驟1:設(shè)置初始化參數(shù),包括迭代次數(shù)、升力系數(shù)、天敵出現(xiàn)概率、種群大小等;

步驟2:按初始適應(yīng)度值劃分食物等級,適應(yīng)度值最佳的為山核桃樹,其次接下來三個為橡樹,其他為普通樹;

步驟3:根據(jù)是否出現(xiàn)天敵,橡樹上的松鼠利用式(11)開始移動,更新位置;

步驟4:普通樹上未有食物的松鼠利用式(12)開始移動,更新位置;

步驟5:普通樹上已有食物的松鼠利用式(13)開始移動,更新位置;

步驟6:將此時所有松鼠得到的最佳適應(yīng)度值與上一次做對比,更新最佳適應(yīng)度值并將它們分配到山核桃樹、橡樹和普通樹上;

步驟7:判斷季節(jié)變化,如果滿足就改變普通樹上松鼠的位置;

步驟8:根據(jù)公式(15)更新Smin值;

步驟9:排序新的適應(yīng)度值,根據(jù)排序結(jié)果再次分配松鼠位置;

步驟10:判斷是否達到迭代次數(shù),達到就退出循環(huán)并輸出最佳值,否則返回步驟2繼續(xù)運行。

3 實驗分析

3.1 數(shù)據(jù)準備

本文實驗數(shù)據(jù)采用凱斯西儲大學(xué)軸承數(shù)據(jù)集部分數(shù)據(jù)[21],實驗平臺如圖4。該平臺擁有一個2馬力的電機(左)、一個扭矩傳感器(中)、一個功率測試計(右)以及相應(yīng)的電控設(shè)備。被測試軸承廠商為SKF軸承和等效的NTN軸承。其中,SKF軸承會被電火花加工技術(shù)在軸承的內(nèi)圈、外圈、滾動體位置制造出0.007英寸、0.014英寸、0.021英寸的單點故障;TNT軸承則被制造出0.028 英寸和0.040英寸的單點故障。測試中采用的加速度傳感器通過16通道的記錄器記錄振動信號,分別放置于驅(qū)動端和風(fēng)扇端采集,采樣頻率為12 kHz和48 kHz兩種。

圖4 西儲大學(xué)軸承實驗平臺

本文選用采樣頻率為12 kHz、負載為0、轉(zhuǎn)速為1 797 r·min-1的驅(qū)動端數(shù)據(jù),其中包含了正常狀態(tài)和內(nèi)圈故障、外圈故障、滾動體故障三種故障狀態(tài),以及故障狀態(tài)下直徑為0.007、0.014、0.021英寸的三種故障尺寸。將上述的9種故障狀態(tài)與正常狀態(tài)共計10種類型作為實驗樣本數(shù)據(jù),實驗樣本每個序列長度為2 048,正常狀態(tài)分為100組數(shù)據(jù)(數(shù)字1作為其狀態(tài)值),故障狀態(tài)分為450組數(shù)據(jù),每種故障有150組(數(shù)字2作為內(nèi)圈故障狀態(tài)值、數(shù)字3作為外圈故障值、數(shù)字4作為滾動體故障值),每個故障狀態(tài)都囊括三種尺寸并打亂順序,以3:2的比例分為訓(xùn)練集和測試集,具體數(shù)據(jù)見表1。

表1 實驗樣本表

3.2 信號分析和特征提取

使用ICEEMDAN對樣本集信號進行分解,得到的正常狀態(tài)及其IMF分量時域圖如圖5。

圖5 正常狀態(tài)信號分解圖

經(jīng)過ICEEMDAN,原信號被分解出為若干IMF分量,這其中包括一些虛假分量,不利于信號分析。根據(jù)相關(guān)系數(shù)法,選取相關(guān)程度較高、能夠明顯反映信號特征的分量。軸承正常狀態(tài)下的11個IMF分量與原始信號的相關(guān)系數(shù)如圖6。經(jīng)過多次測試發(fā)現(xiàn),系數(shù)最高的前5個分量能夠較好地表示原信號特征。

圖6 正常狀態(tài)分量的相關(guān)系數(shù)圖

對選出的IMF分量進行奇異值求解,每種狀態(tài)可由5個奇異值(即特征值)表示,每種故障狀態(tài)都包含三種尺寸故障,把狀態(tài)值與特征值列表歸類,部分數(shù)值見表2。

表2 軸承工作下四種狀態(tài)的部分特征值

3.3 故障診斷

本文將分別使用極限學(xué)習(xí)機、核極限學(xué)習(xí)機(KELM)和松鼠有算法優(yōu)化的ELM對訓(xùn)練集中各狀態(tài)的特征值進行訓(xùn)練,其中,極限學(xué)習(xí)機的參數(shù)設(shè)置:隱含層個數(shù)為20,傳遞函數(shù)為Sigmoid函數(shù);核極限學(xué)習(xí)機的參數(shù)設(shè)置:核函數(shù)為徑向基函數(shù)(RBF);松鼠算法的參數(shù)設(shè)置:種群數(shù)量為30,最大迭代次數(shù)為100,天敵出現(xiàn)概率0.1,滑動系數(shù)為1.9,以訓(xùn)練集錯誤率為適應(yīng)度值。

利用這三種方法對測試集分類,單次診斷結(jié)果如圖7～ 9。

圖7 極限學(xué)習(xí)機單次診斷圖

圖7中可以看出僅用極限學(xué)習(xí)機方法分類識別,準確率只有90.909 1%,軸承的外圈故障,內(nèi)圈故障,滾動體故障識別精度均有較大的誤差。圖8中可以看出核極限學(xué)習(xí)機分類準確率為93.181 8%,比ELM提高了大約2.272 7%,誤差主要集中在軸承內(nèi)圈故障和滾動體故障的識別分類上,外圈故障僅有2組診斷失敗。圖9看出經(jīng)過松鼠算法優(yōu)化后的極限學(xué)習(xí)機分類準確率98.636 4%,比ELM提高了7.727 3%,失敗樣本僅外圈故障、內(nèi)圈故障和滾動體故障各一例。

圖8 核極限學(xué)習(xí)機單次診斷圖

圖9 松鼠算法優(yōu)化后極限學(xué)習(xí)機單次診斷圖

為了進一步驗證實驗準確性和魯棒性,對比了ELM、KELM、SSA-ELM三種方法重復(fù)20次實驗得到的訓(xùn)練集和測試集的平均精度,具體數(shù)據(jù)見表3。

表3 實驗結(jié)果對比 %

由表3可知,SSA-ELM的平均訓(xùn)練精度為100%,平均測試精度為98.18%,相比較于ELM和KELM具有更高的診斷精度。

4 結(jié) 語

本文對滾動軸承故障診斷方法進行了研究,通過ICEEMDAN和奇異值方法完成對軸承故障振動信號的特征提取,并將提取到的奇異值特征輸入到本文提出的SSA-ELM模型中,完成了對西儲大學(xué)軸承數(shù)據(jù)集的10類故障狀態(tài)的識別。結(jié)果證明,基于SSA-ELM的滾動軸承故障診斷模型準確率可達98.18%,相比于傳統(tǒng)的ELM、KELM模型而言,診斷準確率分別提高了7.76%和4.64%,該方法有較高的識別精準和識別能力。