王嘉浩,羅 倩,胡園園
(北京信息科技大學(xué)信息與通信工程學(xué)院,北京 100192)
隨著工業(yè)的進(jìn)步,旋轉(zhuǎn)機(jī)械日益向集成化、大型化、高速化和智能化的方向發(fā)展[1]。在各種旋轉(zhuǎn)機(jī)械中,滾動(dòng)軸承是常見也是易于損壞的零部件之一,具有易啟動(dòng)、摩擦小、潤滑簡單和更換方便的優(yōu)點(diǎn),廣泛用于精密儀器、航空航天、汽車、機(jī)床、機(jī)器人等領(lǐng)域。據(jù)有關(guān)資料統(tǒng)計(jì),旋轉(zhuǎn)機(jī)械的故障中振動(dòng)故障占70%,而30%的振動(dòng)故障是由滾動(dòng)軸承故障引起的[2]。因此,滾動(dòng)軸承的故障診斷理論和應(yīng)用研究一直是旋轉(zhuǎn)機(jī)械故障診斷領(lǐng)域的一個(gè)重點(diǎn)。
由于機(jī)車滾動(dòng)軸承發(fā)生故障時(shí)信號(hào)是非平穩(wěn)的,其振動(dòng)信號(hào)各頻帶的能量發(fā)生相應(yīng)變化,利用各頻帶能量分布作為該狀態(tài)下軸承故障特征[3]。傳統(tǒng)的距離度量方法,多數(shù)針對(duì)空間中不同的樣本點(diǎn),對(duì)不同分布間的相似度難以實(shí)現(xiàn)有效度量。傳統(tǒng)的分布相似度度量方法,在度量不同分布間的相似度時(shí),受重疊程度的影響嚴(yán)重,難以實(shí)現(xiàn)有效的相似性度量。EMD在度量不同分布間的相似度時(shí),具有不受分布位置影響的優(yōu)勢(shì)[4]。針對(duì)EMD的這種特性,本文將EMD引入KNN算法中,提出了基于KNN-EMD算法的機(jī)車軸承故障診斷方法,提高診斷準(zhǔn)確率。
小波包分解以小波變換為基礎(chǔ),但比小波分解更加精細(xì)。小波包分解不僅針對(duì)信號(hào)的低頻部分進(jìn)行分解,對(duì)信號(hào)的高頻部分也同樣進(jìn)行分解[5]。這種分解方式解決了小波分解再高頻段內(nèi)頻率分辨率差,在低頻段內(nèi)時(shí)間分辨率差的缺陷。
在多分辨率過程中,將小波包分解視為對(duì)一個(gè)函數(shù)空間逐級(jí)進(jìn)行正交分解的過程[6]。小波包分解公式為
(1)
小波包變換對(duì)信號(hào)的分解相對(duì)于小波變換來說更加的細(xì)致,基于小波包分析方法,通過對(duì)原始信號(hào)分解,可以得到原始信號(hào)在不同的頻帶內(nèi)的能量分布?;谶@種方法,可以針對(duì)在原始信號(hào)中需要分析的頻率范圍,將原始信號(hào)在指定的尺度上進(jìn)行分解,并得到其能量分布,進(jìn)而達(dá)到提取特征的目的。將這種分析方法成為能量分析[7]。
基于小波包變換對(duì)信號(hào)進(jìn)行能量分析主要依賴于小波包的分解原理及小波包分解頻帶能量檢測(cè)技術(shù)。信號(hào)經(jīng)小波包分解后得到的信號(hào)在各頻帶上的能量折射出原始信號(hào)能量分布的整體特征,因此可以利用原始信號(hào)的能量特征對(duì)信號(hào)進(jìn)行分類[8]。
信號(hào)經(jīng)過j層小波包分解后,信號(hào)的總能量也被分解到了2j個(gè)互不重疊的頻率區(qū)間內(nèi),因此通過考察信號(hào)整體能量在各個(gè)頻段內(nèi)分布比例的變化,便可以作為原始信號(hào)的特征信息[9]。
信號(hào)小波包分解后第j層上第k個(gè)頻帶Xjk(n)上的能量
(2)
歸一化后得到能量特征如下
p=[E1,E2,…E(2j-1)]/E總
(3)
其中
(4)
K近鄰法(K-nearest neighbor,KNN)是一種基本分類與回歸方法,其基本做法是:給定測(cè)試實(shí)例,基于某種距離度量找出訓(xùn)練集中與其最靠近的K個(gè)實(shí)例點(diǎn),然后基于這K個(gè)最近鄰的信息來進(jìn)行預(yù)測(cè)。通常,在分類任務(wù)中使用“投票法”,即選擇這K個(gè)樣本中出現(xiàn)最多的類別標(biāo)記作為預(yù)測(cè)結(jié)果。
KNN 算法是一種簡單高效的分類算法,該算法規(guī)則分為以下3個(gè)步驟:
1)計(jì)算數(shù)據(jù)集中的點(diǎn)與當(dāng)前測(cè)試樣本中點(diǎn)之間的距離,并且按照距離遞增的順序進(jìn)行排序;
2)選取與當(dāng)前測(cè)試樣本點(diǎn)距離最小的K個(gè)點(diǎn);
3)統(tǒng)計(jì)前K個(gè)點(diǎn)所在類別中所出現(xiàn)的頻率,并返回前K個(gè)點(diǎn)出現(xiàn)頻率最高的類別作為當(dāng)前的預(yù)測(cè)分類結(jié)果,即多數(shù)表決的分類決策。
K=3與K=5時(shí)的KNN決策流程如圖1。
圖1 KNN決策流程
EMD是一種衡量2個(gè)分布相似性的度量。它的正式定義是一個(gè)線性規(guī)劃問題[10],給定兩個(gè)分布
P={(p1,ωp1),…(pm,ωpm)}
(5)
Q={(q1,ωq1),…(qn,ωqn)}
(6)
分布P和分布Q之間的EMD的規(guī)范化定義為
(7)
其中對(duì)fij有以下四個(gè)約束條件
fij≥0,i=1,2,…,M;j=1,2,…,N
(8)
(9)
(10)
(1)
EMD在直方圖中的體現(xiàn)如圖2。
圖2 EMD圖示
傳統(tǒng)KNN算法中,度量數(shù)據(jù)集中兩點(diǎn)之間的距離采用歐式距離。歐式距離在度量不同分布的差異時(shí),難以做到準(zhǔn)確有效。EMD在度量不同分布間的相似度時(shí),具有不受分布位置影響的優(yōu)勢(shì)[4]。同時(shí),原始信號(hào)在經(jīng)過小波包分解后產(chǎn)生的能量分布與直方圖具有相同的特征,因此本文將EMD引入到KNN算法中,代替歐式距離對(duì)能量分布進(jìn)行度量。
在不同的K值下,計(jì)算測(cè)試數(shù)據(jù)與周圍K個(gè)最近鄰點(diǎn)的EMD,最后根據(jù)多數(shù)表決的分類決策規(guī)則將測(cè)試數(shù)據(jù)分類。
KNN-EMD算法步驟可總結(jié)如下:
1)設(shè)X=(x1,x2,…xm)為小波包能量法提取的滾動(dòng)軸承振動(dòng)信號(hào)能量特征的集合;
2)將X劃分為訓(xùn)練集Xtrain與測(cè)試Xtest;
3)對(duì)不同參數(shù)K值進(jìn)行訓(xùn)練,K的取值一般位于區(qū)間[1,10];
4)計(jì)算訓(xùn)練集與測(cè)試集之間的EMD;
5)為測(cè)試集樣本選取K個(gè)與之距離最小的樣本;
6)使用多數(shù)表決分類決策規(guī)則得到測(cè)試集樣本分類結(jié)果。
在本次仿真中,利用美國凱斯西儲(chǔ)大學(xué)所給出的軸承故障數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。待檢測(cè)的軸承支撐著電動(dòng)機(jī)的轉(zhuǎn)軸,驅(qū)動(dòng)端軸承型號(hào)為SKF6205,風(fēng)扇端軸承型號(hào)為SKF6203.
在數(shù)據(jù)測(cè)量中,機(jī)器風(fēng)扇端和驅(qū)動(dòng)端的軸承座上方各放置一個(gè)加速度傳感器。振動(dòng)加速度信號(hào)由16通道數(shù)據(jù)記錄儀采集得到,采樣頻率為12kHz,所測(cè)試損傷直徑為0.1778mm。
仿真數(shù)據(jù)包含滾動(dòng)軸承的4種運(yùn)行狀態(tài),分別是正常狀態(tài)、內(nèi)圈故障狀態(tài)、滾動(dòng)體故障狀態(tài)、外圈故障狀態(tài)。仿真采集的滾動(dòng)軸承各狀態(tài)下時(shí)域振動(dòng)信號(hào)波形如圖3。
圖3 軸承各個(gè)狀態(tài)下時(shí)域振動(dòng)信號(hào)圖
通過觀察圖3,滾動(dòng)軸承的時(shí)域振動(dòng)波形區(qū)分度較低,很難將軸承各狀態(tài)區(qū)分開,為了更為直觀的區(qū)分度,對(duì)滾動(dòng)軸承實(shí)現(xiàn)有效的故障診斷,對(duì)4種運(yùn)行狀態(tài)下的滾動(dòng)軸承振動(dòng)信號(hào)進(jìn)行小波包能量分布提取,結(jié)果如圖4-圖7。
圖4 內(nèi)圈故障信號(hào)能量譜
圖5 滾動(dòng)體故障信號(hào)能量譜
圖6 外圈故障信號(hào)能量譜
圖7 正常信號(hào)能量譜
通過圖4,圖5,圖6,圖7可以比較直觀的觀察到滾動(dòng)軸承處于不同狀態(tài)時(shí),其振動(dòng)信號(hào)各子頻帶的能量分布具備較大的區(qū)分度。正常狀態(tài)下,軸承能量主要集中分布在前4個(gè)子頻帶,與故障狀態(tài)下能量分布有明顯差異。三種故障狀態(tài)下能量分布均集中分布在第3子頻帶與第7子頻帶,但三者仍具備分布上的差異。滾動(dòng)體故障信號(hào)能量譜與外圈故障信號(hào)能量譜相比,前者能量譜子頻帶3能量所占比重小于子頻帶7,而后者與之相反。相比這兩種故障能量譜能量分布,內(nèi)圈故障信號(hào)能量譜分布相對(duì)分散。
對(duì)上述軸承4種狀態(tài)下共4*81(324)組數(shù)據(jù)進(jìn)行劃分,對(duì)其數(shù)據(jù)集隨機(jī)提取20%的數(shù)據(jù)作為測(cè)試集,其余數(shù)據(jù)作為訓(xùn)練集。
在小波基的選取上,daubechies和haar小波常用于對(duì)數(shù)字信號(hào)進(jìn)行處理。在實(shí)際工程應(yīng)用中,所選的的小波基支集長度多為5-10。haar小波支集長度較小,僅為1,對(duì)于現(xiàn)在大部分的工程應(yīng)用都不合適,而在db系列小波中,僅db3小波滿足工程應(yīng)用對(duì)支集長度的要求,故本文選用‘db3’小波作為小波基。
本文中,將所提取到第三層各結(jié)點(diǎn)能量值組成一維能量分布,因此,在計(jì)算不同分布間EMD時(shí),可將其權(quán)重設(shè)置為1。
在不同K值下進(jìn)行訓(xùn)練測(cè)試,并將測(cè)試結(jié)果與傳統(tǒng)KNN比較。
利用傳統(tǒng)KNN算法對(duì)測(cè)試集進(jìn)行分類時(shí),得到分類見表1。
表1 KNN準(zhǔn)確率
對(duì)不同K值時(shí),分類準(zhǔn)確率曲線如圖8。
圖8 不同K值KNN準(zhǔn)確率曲線
從表1可以看出,對(duì)測(cè)試集使用KNN分類時(shí),對(duì)不同的K值可以獲得不同的分類效果。從圖8中看出,傳統(tǒng)KNN算法的分類精度在K=1時(shí)可以達(dá)到最佳分類效果,其分類準(zhǔn)確率為98.46%。
利用KNN-EMD算法對(duì)測(cè)試集進(jìn)行分類時(shí),得到不同K值下分類準(zhǔn)確率見表2。
表2 KNN-EMD準(zhǔn)確率
對(duì)不同K值時(shí),分類準(zhǔn)確率曲線如圖9。
圖9 不同K值KNN-EMD準(zhǔn)確率曲線
圖9反映出KNN-EMD算法與KNN算法相同,在K=1時(shí)達(dá)到最佳分類效果。由表2可以看出,本文提出的KNN-EMD算法分類準(zhǔn)確率相較于K=1時(shí)的KNN算法提高了接近百分之一,診斷準(zhǔn)確率達(dá)到99.23%,能夠有效軸承故障部位對(duì)軸承故障部位進(jìn)行分類定位,達(dá)到工業(yè)生產(chǎn)要求,可以在工業(yè)生產(chǎn)中實(shí)際應(yīng)用。
理論上EMD度量特征分布之間的距離,因而在處理經(jīng)過小波包分解提取的軸承振動(dòng)信號(hào)的能量分布時(shí)具有它本身優(yōu)異的特性。EMD在對(duì)多個(gè)分布間距離進(jìn)行度量時(shí),具有不受分布位置影響的優(yōu)勢(shì),因此可以對(duì)提取到的能量特征進(jìn)行有效度量,并結(jié)合KNN算法分類決策規(guī)則實(shí)現(xiàn)有效分類。
本文通多對(duì)小波包分解,能量分布提取以及KNN-EMD的綜合使用,提出了一種機(jī)車軸承故障診斷方法。針對(duì)故障信號(hào)時(shí)域特征不明顯這一問題,
利用小波包對(duì)故障信號(hào)能量特征進(jìn)行提取進(jìn)而得到差異較大的特征量。針對(duì)傳統(tǒng)KNN算法中,歐式距離在度量不同分布相似度的局限性以及EMD在度量不同分布間的相似度的優(yōu)勢(shì),將EMD引入到KNN算法中,代替歐式距離對(duì)能量分布進(jìn)行度量。相較于傳統(tǒng)KNN算法,在診斷準(zhǔn)確率上得到有效提高。但由于EMD的計(jì)算需要涉及到線性規(guī)劃問題,因此造成了計(jì)算量的增加,這一缺陷會(huì)增加故障診斷的時(shí)間,本文下一步的研究重點(diǎn)將是通過對(duì)線性規(guī)劃的分析解決EMD計(jì)算復(fù)雜度的問題。