陳 劍,蔡坤奇,陶善勇,楊 斌,劉圓圓,劉幸福,黃凱旋
(1.合肥工業(yè)大學(xué) 噪聲振動(dòng)研究所,安徽 合肥 230009;2.安徽省汽車NVH技術(shù)研究中心,安徽 合肥 230009)
滾動(dòng)軸承是大多數(shù)機(jī)械和電氣設(shè)備的重要支承部件,它發(fā)生故障將直接影響設(shè)備的正常工作,導(dǎo)致重大經(jīng)濟(jì)損失。準(zhǔn)確有效地軸承故障診斷既可提高設(shè)備運(yùn)行的可靠性和穩(wěn)定性,也可避免重大事故的發(fā)生[1]。
滾動(dòng)軸承故障診斷主要包括兩個(gè)方面,故障特征提取和故障模式識(shí)別。通常,故障特征提取可進(jìn)行時(shí)域特征、頻域特征或者時(shí)頻特征分析,進(jìn)而構(gòu)建特征向量。對(duì)于非平穩(wěn)、非線性信號(hào),時(shí)頻分析是最有效的分析方法。常見的滾動(dòng)軸承故障時(shí)頻提取方法有:局部均值分解、經(jīng)驗(yàn)?zāi)B(tài)分解、變分模態(tài)分解、小波變換、固有時(shí)間尺度分解等[2,3]。故障模式識(shí)別是人工智能研究領(lǐng)域的一個(gè)重要研究方向,基于系統(tǒng)論、控制論和信息論,主要研究參數(shù)估計(jì)、系統(tǒng)辨識(shí)等。常見方法有:神經(jīng)網(wǎng)絡(luò)、聚類分析和支持向量機(jī)方法等[4,5,15]。
固有時(shí)間尺度分解(intrinsic time scale decomposition,ITD)是Frei M G等人提出的一種自適應(yīng)時(shí)頻分析方法[6],相比經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)和局部均值分解(local mean decomposition,LMD),ITD方法在端點(diǎn)效應(yīng)和計(jì)算效率方面優(yōu)勢(shì)明顯,且適合在線監(jiān)測(cè)和分解[7]。但I(xiàn)TD方法自身也存在一些不足,即采用線性變換構(gòu)造基線號(hào)有可能導(dǎo)致分解后的信號(hào)出現(xiàn)毛刺而失真;IITD(improved intrinsic time scale decomposition)方法改善了ITD分解的波形失真和端點(diǎn)效應(yīng)問題,廣泛應(yīng)用于故障診斷領(lǐng)域[8,9]。文獻(xiàn)[10]提出基于固有時(shí)間尺度分解和近似熵結(jié)合隨機(jī)森林(RF)的軸承故障診斷方法,雖提高了微弱信號(hào)故障診斷準(zhǔn)確率,但近似熵采用硬閾值判據(jù)指標(biāo),影響數(shù)據(jù)統(tǒng)計(jì)結(jié)果穩(wěn)定性。文獻(xiàn)[11]提出基于IITD樣本熵和支持向量機(jī)的齒輪故障診斷方法,但樣本熵易受數(shù)據(jù)波動(dòng)影響,支持向量機(jī)在處理大樣本數(shù)據(jù)能力不足以及多分類問題精度較低等缺陷。
本文擬將IITD分解和模糊熵方法用于滾動(dòng)軸承振動(dòng)故障信號(hào)特征提取,構(gòu)建其特征向量,作為隨機(jī)森林分類器的輸入用于軸承故障類型識(shí)別與診斷,以解決近似熵和樣本熵易受數(shù)據(jù)波動(dòng),支持向量機(jī)處理大樣本數(shù)據(jù)能力不足等問題。其主要原理是:對(duì)原振動(dòng)信號(hào)進(jìn)行IITD分解得到多個(gè)PR分量,提取PR分量的模糊熵構(gòu)建特征向量來表達(dá)故障軸承的信號(hào)特征;然后采用隨機(jī)森林算法對(duì)軸承故障進(jìn)行模式識(shí)別分類,最后與支持向量機(jī)識(shí)別結(jié)果對(duì)比,驗(yàn)證方法的準(zhǔn)確性和優(yōu)越性。
ITD分解的分量出現(xiàn)明顯變形和端點(diǎn)效應(yīng),對(duì)原信號(hào)分解精度產(chǎn)生影響,進(jìn)而導(dǎo)致各PR分量發(fā)生改變且分解得到的信號(hào)左、右兩端偽局部極值點(diǎn)。IITD分解,采用端點(diǎn)延拓和三次樣條擬合的方法,使IITD分解后的分量更精準(zhǔn)地體現(xiàn)原始信號(hào)的頻率成分。
IITD分解具體步驟如下[12]:
1) 確定信號(hào)Xt(t≥0)的局部極值點(diǎn)XN對(duì)應(yīng)的時(shí)刻τk(k=1,2,…,N),N為極值點(diǎn)的個(gè)數(shù),在連續(xù)極值點(diǎn)[τk,τk+1]上,定義信號(hào)線性提取因子L為:
(1)
式中:
式中:α為線性縮放因子,一般取值為0.5。
2) 上述公式提取到的基線控制點(diǎn)Lk,通過對(duì)時(shí)間序列采用鏡像對(duì)稱延拓方法,可得左右兩端極值點(diǎn)(τ0,X0),(τM+1,XM+1),令k分別為0和M-1進(jìn)而求出L1與LM的值,再用三次樣條插值函數(shù)擬合得到基線信號(hào)L1(t)。
3) 原信號(hào)Xt與基線信號(hào)Lt之差得到固有旋轉(zhuǎn)因子h1(t):
h1(t)=Xt-L1(t)
(2)
判斷基線Lk+1≠0,則h1(t)是一個(gè)固有旋轉(zhuǎn)分量,輸出h1(t),令PR1=h1(t),如果Lk+1=0,則h1(t)作為原始數(shù)據(jù),重復(fù)上述步驟直到滿足:
h1k(t)=PR1
(3)
4) 從原始數(shù)據(jù)中分離出來PR1分量,得到新信號(hào)r1(t),具體過程為:
r1(t)=Xt-PR1
(4)
5) 將r1(t)作為新的給定信號(hào)重復(fù)步驟(1)~(4),循環(huán)n-1次之后,直到將rn(t)為一單調(diào)函數(shù)或常函數(shù),最終,原始信號(hào)Xt被分解為n個(gè)PR分量和一個(gè)殘余項(xiàng)r1(t)之和。
(5)
為了驗(yàn)證IITD分解信號(hào)的有效性,分別采用IITD、ITD方法對(duì)一解析信號(hào)進(jìn)行分解。設(shè)仿真信號(hào)為:x1=(1+0.5cos(8 π t))·cos(200 π t+2cos(10 π t)),x2=cos(30 π t),x=x1+x2,采樣頻率為1 kHz,采樣點(diǎn)數(shù)為1 000。3種方法的分解結(jié)果分別如圖1、圖2、圖3所示。
圖1 仿真信號(hào)波形圖Fig.1 Simulation signal waveform
圖2 信號(hào)x(t) ITD分解結(jié)果Fig.2 ITD decomposition result of signal x(t)
圖3 信號(hào)x(t) IITD分解結(jié)果Fig.3 IITD decomposition results of signal x(t)
比較二者的分解結(jié)果,從圖2、圖3分解的分量效果表明,ITD分解得到的第二個(gè)分量出現(xiàn)了明顯的端點(diǎn)效應(yīng),IITD分解得到的分量較ITD光滑,更準(zhǔn)確地體現(xiàn)仿真信號(hào)的頻率組成。
模糊熵是由Zadeh L A在1968年首次提出,它用來描述一個(gè)模糊集模糊程度[13]。采用近似熵和樣本熵處理信號(hào)時(shí),信號(hào)的絕對(duì)幅值差決定其相似性,數(shù)據(jù)的波動(dòng)對(duì)結(jié)果產(chǎn)生影響。模糊熵算法則通過均值運(yùn)算,采用指數(shù)函數(shù)代替絕對(duì)幅值差,除去基線漂移和數(shù)據(jù)波動(dòng)的影響,向量的相似度由模糊函數(shù)形狀決定,保證模糊熵值隨參數(shù)平穩(wěn)變化。
模糊熵的定義為:
1) 對(duì)于給定的N點(diǎn)時(shí)間序列{u(i):1≤i≤N},處理后得到m維向量:
(6)
(7)
(u(i+k)-u0(j))|)
(8)
i,j=1,2…N-m;i≠j
(9)
4) 定義函數(shù):
(10)
5) 同樣,根據(jù)以上步驟構(gòu)造m+1維向量:
(11)
6) 定義模糊熵為:
FuzzyEn(m,n,r)=
(12)
當(dāng)N為有限數(shù)時(shí),上述表達(dá)為:
(13)
上述公式中,模糊熵的值不僅與數(shù)據(jù)長度N有關(guān),還與參數(shù)m、r和n有關(guān)。根據(jù)文獻(xiàn)[14]的研究,嵌入維數(shù)m一般選擇1或2,模糊函數(shù)的梯度n,相似容限r(nóng)取0.1~0.5 SD(SD是原數(shù)據(jù)的標(biāo)準(zhǔn)差),本文計(jì)算取值:N取2 048,n取2,m取2,r取0.2 SD。
隨機(jī)森林(random forest)是Breiman在2001年提出的一種分類方法,采用Bagging技術(shù)訓(xùn)練多個(gè)決策樹組合得到隨機(jī)森林?;贐agging算法,隨機(jī)森林同時(shí)加入了樣本和特征兩個(gè)方面的隨機(jī)屬性選擇。隨機(jī)森林分類的思想是隨機(jī)選擇一些特征屬性構(gòu)建一個(gè)決策樹,重復(fù)這個(gè)過程建立多個(gè)決策樹,并由產(chǎn)生的決策樹作為投票原則產(chǎn)生分類結(jié)果。
1) 生成每顆決策樹的訓(xùn)練集。隨機(jī)森林利用Bootstrap法重采樣從原始訓(xùn)練集中有放回?zé)o權(quán)重地抽取T個(gè)訓(xùn)練子集,每一個(gè)子集對(duì)應(yīng)一個(gè)決策樹。未被抽中的數(shù)據(jù)稱為袋外OOB(out-of-bag)數(shù)據(jù),OOB數(shù)據(jù)用來評(píng)估分類器的正確率,且對(duì)異常數(shù)據(jù)具有抗干擾能力,這樣可以避免隨機(jī)森林中的決策樹產(chǎn)生局部最優(yōu)解,使分類更準(zhǔn)確。
3) 特征β把節(jié)點(diǎn)分成2個(gè)分支,然后從剩下的特征中尋找分類效果最好的特征,最終決策樹按照不純度最小原則充分生長,且不剪枝處理,直到?jīng)Q策樹的屬性生長到葉子節(jié)點(diǎn)或完全被使用。
4) 通過構(gòu)建的決策樹對(duì)測(cè)試樣本預(yù)測(cè)后分類,分類的標(biāo)簽來自于所有決策樹的綜合?;贗ITD模糊熵的隨機(jī)森林模式識(shí)別具體方法如圖4所示。
圖4 基于IITD模糊熵和RF的滾動(dòng)軸承診斷方法Fig.4 Diagnosis method of rolling bearing based on IITD fuzzy entropy and RF
實(shí)驗(yàn)數(shù)據(jù)來自合肥工業(yè)大學(xué)航空發(fā)動(dòng)機(jī)軸承試驗(yàn)臺(tái)。試驗(yàn)臺(tái)的整體結(jié)構(gòu)布置如圖5所示。實(shí)驗(yàn)軸承采用NSK的NU1010型號(hào)單列圓柱滾子軸承。為滿足實(shí)驗(yàn)需求,利用激光打標(biāo)機(jī)和線切割加工出內(nèi)圈、外圈、滾動(dòng)體等3種軸承故障。
圖5 軸承試驗(yàn)臺(tái)總體結(jié)構(gòu)Fig.5 Overall structure of bearing test bench
利用LMS Test.lab軟件在電腦上采集額定軸向載荷等4種故障狀態(tài)3種轉(zhuǎn)速振動(dòng)信號(hào),傳感器測(cè)點(diǎn)布置如圖6所示。試驗(yàn)工況設(shè)定:采樣頻率為20 480 Hz。轉(zhuǎn)速為3 000 rpm,軸向載荷為2 kN,定轉(zhuǎn)速每類故障狀態(tài)采集長度為634 880。
圖6 傳感器測(cè)點(diǎn)布置Fig.6 Sensor measuring point arrangement
隨機(jī)選取45組長度為1 000個(gè)采樣點(diǎn)的樣本,其中隨機(jī)選擇30組作為訓(xùn)練,另外15組用來測(cè)試。IITD分解得到前5個(gè)PR分量與原信號(hào)Xt之間相關(guān)度高于設(shè)定閾值λ=0.2,相關(guān)性較高; 第6個(gè)分量相關(guān)性為0.023,遠(yuǎn)小于0.2,故選取前5個(gè)PR分量進(jìn)行計(jì)算得到模糊熵?cái)?shù)據(jù)。4種故障狀態(tài)經(jīng)過計(jì)算,最終形成(4×45)×5即維數(shù)為180×5的數(shù)據(jù)集。
隨機(jī)抽取120組訓(xùn)練集數(shù)據(jù)訓(xùn)練得到隨機(jī)森林分類器模型。剩余60組測(cè)試集數(shù)據(jù)用來驗(yàn)證。為了體現(xiàn)隨機(jī)森林分類方法的準(zhǔn)確性,使用模糊熵?cái)?shù)據(jù)集訓(xùn)練SVM、BPNN對(duì)比。三者分類輸出結(jié)果分別如圖7(a)、(b)、(c)和表1所示。其中圖7中縱坐標(biāo)類別標(biāo)簽1、2、3、4分別對(duì)應(yīng)軸承的滾子故障、內(nèi)圈故障、外圈故障、正常狀態(tài)。
圖7 RF、SVM與BPNN分類結(jié)果對(duì)比Fig.7 Comparison of classification results of RF, SVM and BPNN
表1 隨機(jī)森林和支持向量機(jī)診斷準(zhǔn)確率對(duì)比Tab.1 Comparison of diagnosis accuracy between random forest and support vector machine (%)
針對(duì)IITD分解得到模糊熵?cái)?shù)據(jù)構(gòu)成的特征向量,IITD-RF方法識(shí)別率最高,誤判數(shù)為1次;IITD-SVM以及IITD-BPNN方法誤判次數(shù)分別為3次和4次。由表1可以看出IITD模糊熵與隨機(jī)森林的滾動(dòng)軸承故障診斷方法準(zhǔn)確率高于其余兩種,對(duì)滾動(dòng)軸承故障診斷更有優(yōu)勢(shì)。
本文提出了一種將IITD與模糊熵結(jié)合并利用隨機(jī)森林分類的滾動(dòng)軸承故障診斷方法。IITD方法克服了ITD的缺點(diǎn),分解得到的分量曲線光滑;模糊熵應(yīng)用到滾動(dòng)軸承故障診斷,消除了數(shù)據(jù)波動(dòng)的影響;采用隨機(jī)森林和支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)等3種算法對(duì)故障軸承進(jìn)行模式識(shí)別,實(shí)驗(yàn)對(duì)比結(jié)果表明,本文方法能準(zhǔn)確地診斷出滾動(dòng)軸承的故障類型,且分類總精度大于98%,驗(yàn)證了該方法的有效性,為滾動(dòng)軸承故障診斷提供了新思路。