程軍圣,馬興偉,楊 宇
(湖南大學(xué) 汽車車身先進設(shè)計制造國家重點實驗室,長沙 410082)
機械故障診斷過程本質(zhì)上是一個故障模式識別的過程[1],針對某一具體的機械故障診斷問題,選擇不同的模式識別方法,其分類精度和準確性可能會有較大的差異[2-3]。神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和類型的選擇過分依賴于先驗知識或經(jīng)驗,而這將會影響其分類精度[4]。支持向量機分類結(jié)果受到核函數(shù)及其參數(shù)的影響。此外,其搜索算法本質(zhì)上是二進制的,對于多類分類問題則需要進行多次的二進分類[5]。
熵不但能表征信號的復(fù)雜性,而且能夠度量一個系統(tǒng)或一段信息的不確定性,因而有利于處理非線性問題。排列熵(Permutation Entropy,簡稱PE)算法是由Bandt等[13]最近提出的一種新的檢測時間序列隨機性和動力學(xué)突變的方法。Yan等[14]將其應(yīng)用于旋轉(zhuǎn)機械振動信號的特征提取,并將排列熵與近似熵和Lempel-Ziv復(fù)雜度進行了對比,結(jié)果表明,排列熵算法能夠有效地檢測和放大振動信號的動態(tài)變化,表征滾動軸承在不同狀態(tài)下的工況特征。
本征時間尺度分解(Intrinsic Time-scale Decomposition,簡稱ITD)是由Frei等[15]提出的一種自適應(yīng)時頻分析方法,該方法能將非平穩(wěn)信號分解成為若干瞬時頻率具有物理意義的合理旋轉(zhuǎn)(Proper Rotation,簡稱PR)分量。與EMD相比,ITD在端點效應(yīng)和計算速度上都有明顯優(yōu)勢[16],且可以避免EMD方法中的包絡(luò)誤差。
論文將排列熵和VPMCD方法相結(jié)合應(yīng)用于滾動軸承故障診斷,利用ITD方法對原始信號進行分解得到若干固有旋轉(zhuǎn)分量,提取各個分量的排列熵并將其作為特征值,進一步采用VPMCD方法進行故障診斷。將VPMCD方法與BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)以及支持向量機(Support Vector Machine,簡稱SVM)進行了實驗對比分析,結(jié)果表明,VPMCD方法可以有效地應(yīng)用于滾動軸承故障診斷。
在VPMCD方法中,為特征值Xi定義的變量預(yù)測模型VPMi為一個線形或非線性的回歸模型,可以選擇以下的模型之一:
① 線性模型(L):
高校圖書館的特色資源是高校資源的優(yōu)勢所在,越來越凸顯其不可替代的核心作用,并儼然成為圖書館核心競爭力的重要指標。特色資源為教學(xué)科研以及專業(yè)人才培養(yǎng)提供了有力的資源保障。
(1)
② 線性交互模型(LI):
(2)
③ 二次交互模型(QI):
(3)
④ 二次模型(Q):
(4)
式中,r≤p-1為模型階數(shù)。以p個特征值問題為例,以上述四種模型中任意一個模型,采用特征值Xj(j≠i)對Xi進行預(yù)測,都可以得到:
Xi=f(Xj,b0,bj,bjj,bjk)+e
(5)
式(5)稱為特征值Xi的變量預(yù)測模型VPMi。其中,特征值Xi稱為被預(yù)測變量;Xj(j≠i)稱為預(yù)測變量;e為預(yù)測誤差;b0,bj,bjj,bjk為模型參數(shù),他們可以通過訓(xùn)練樣本數(shù)據(jù)對預(yù)測模型進行訓(xùn)練得到,這其實是采用所有訓(xùn)練樣本的特征值X=[X1,X2,…,Xp]對b0,bj,bjj,bjk等模型參數(shù)進行估計的問題。
在VPMCD方法中,采用同一類別下所有特征值的預(yù)測誤差平方和值最小為判別函數(shù)對測試樣本進行分類,因此該方法可以有效地應(yīng)用于具有多種樣本的模式識別。
排列熵算法不考慮數(shù)據(jù)具體值,而是基于相鄰數(shù)據(jù)的對比對數(shù)據(jù)進行分析,因此計算簡潔、速度快,抗干擾能力強,特別適用于非線性數(shù)據(jù),具有很好的魯棒性,對噪聲有很好的抑制作用[13]。
在排列熵的計算中,有三個參數(shù)值需要考慮和設(shè)定,即時間序列長度N,嵌入維數(shù)m和時延τ。Bandt等[13]建議,嵌入維數(shù)m的取值為3~7,因為如果m等于1或2,此時重構(gòu)的向量中包含太少的狀態(tài),算法失去意義和有效性,不能檢測時間序列的動力學(xué)突變。但是,如果m取值過大,也不合適,因為相空間的重構(gòu)將會均勻化時間序列,此時不僅計算比較耗時,而且也無法反映序列的細微變化[17-18]。
時延τ對時間序列的計算影響較小,以長度為1 024的隨機信號為例,在不同τ下的排列熵值隨嵌入維數(shù)的變化關(guān)系如圖1所示,由圖1可以看出,時延τ對信號熵值的影響較小,因此,論文中均取τ=1。
圖1 隨機信號在不同時延下的排列熵
為研究數(shù)據(jù)長度N對排列熵值的影響,論文取時延τ=1,以長度分別為256,512,1 024,2 048的隨機信號為例,求得對應(yīng)排列熵值,分別記為PE1,PE2,PE3,PE4,如圖2所示,它們在不同嵌入維數(shù)下差值如表1所示。
由圖2和表1可知,當m=5,τ=1時,數(shù)據(jù)長度為1 024與長度512,熵值相差0.017 8,而與長度2 048熵值相差0.006 4,因此,此時選數(shù)據(jù)長度為1 024較合適。一般,嵌入維數(shù)較小時,數(shù)據(jù)長度則要求越小。論文中,嵌入維數(shù)m=5,時延τ=1,數(shù)據(jù)長度N=1 024。
圖2 不同長度的隨機信號的排列熵
表1 不同長度的隨機信號排列熵在不同嵌入維數(shù)下的差值
對原始振動加速度信號進行ITD分解(具體算法見文獻[15]),提取各個PR分量的排列熵作為特征值并構(gòu)建特征值向量,結(jié)合VPMCD分類器進行模式識別。具體步驟如下:
① 分別在滾動軸承正常狀態(tài)、外圈故障、內(nèi)圈故障、滾動體故障狀態(tài)下,按照一定的采樣頻率f進行N次重采樣,共獲得4N個振動加速度信號作為訓(xùn)練樣本。
② 對滾動軸承四種狀態(tài)下的每一個振動加速度信號進行ITD分解,得到若干個PR分量,選擇前m個含有故障信息的PR分量作為研究對象。
③ 對含有故障信息的前m個PR分量分別提取排列熵Xi(i=1,2,…,m),并構(gòu)建特征值向量X=[X1,X2,…,Xm]。
⑤采集測試信號。按照步驟①、②、③構(gòu)建測試樣本特征值向量X′,并將其作為VPMCD分類器的輸入,以VPMCD分類器的輸出來確定滾動軸承的工作狀態(tài)和故障類型。
機械設(shè)備在運行時,其關(guān)鍵零部件滾動軸承可能會出現(xiàn)內(nèi)圈故障、外圈故障或滾動體故障。為驗證排列熵和VPMCD方法的有效性,采用美國凱斯西儲大學(xué)電氣工程實驗室的滾動軸承數(shù)據(jù)[19],選用的滾動軸承為6205-2RS JEM SKF型深溝球軸承,采樣頻率為12 kHz,電機負載為0 HP,轉(zhuǎn)速為1 797 r/min。故障點的直徑為0.177 8 mm,故障深度為0.279 4 mm。圖3為采集到的滾動軸承故障振動加速度信號:
圖3 滾動軸承滾動體故障狀態(tài)下的振動加速度信號
對圖3滾動軸承滾動體故障狀態(tài)下的振動加速度信號進行ITD分解,得到的各個PR分量如下圖4所示:
圖4 滾動軸承滾動體故障狀態(tài)下的振動信號的ITD分解結(jié)果
ITD是將信號分解為從高到低不同頻率段的單分量信號,滾動軸承故障振動信號的故障信息主要集中在高頻段。由圖4可知,滾動軸承的主要故障信息集中在前4個PR分量,故論文中選取了前4個PR分量提取排列熵并結(jié)合VPMCD方法進行故障診斷。
論文選取滾動軸承正常狀態(tài)下的振動信號200組數(shù)據(jù),外圈故障、內(nèi)圈故障、滾動體故障三類狀態(tài)下的振動信號各110組數(shù)據(jù)。在正常樣本數(shù)據(jù)中隨機抽取100組數(shù)據(jù),其余三類故障樣本數(shù)據(jù)中各隨機抽取60組數(shù)據(jù)作為訓(xùn)練樣本數(shù)據(jù),將剩下的100組正常樣本數(shù)據(jù)和外圈故障、內(nèi)圈故障、滾動體故障三類故障狀態(tài)下各50組數(shù)據(jù)作為測試樣本。
首先,對訓(xùn)練樣本數(shù)據(jù)進行ITD分解,對每一組樣本數(shù)據(jù)分解后的前4個PR分量分別提取排列熵,形成排列熵特征值向量。將特征值向量輸入到VPMCD分類器中對其進行訓(xùn)練。
其次,將正常狀態(tài)下剩余的100組測試樣本和其余三類狀態(tài)剩余的各50組數(shù)據(jù)按照上述同樣的方法提取排列熵特征值向量,輸入到已經(jīng)訓(xùn)練好的VPMCD分類器中進行模式識別。
VPMCD方法利用訓(xùn)練樣本估計模型參數(shù),建立變量預(yù)測模型VPMk(k=1,2,3,4時,分別對應(yīng)為正常、滾動體故障、內(nèi)圈故障、外圈故障樣本的預(yù)測模型),從而對測試樣本的故障類型分類。對滾動軸承四種狀態(tài)共250組測試樣本用訓(xùn)練好的VPMCD分類器進行分類,識別率達100%。表2給出了四組測試樣本的診斷結(jié)果。
為研究VPMCD方法在估計模型參數(shù)時,樣本數(shù)量的選取問題,論文選取上述美國凱斯西儲大學(xué)滾動軸承正常狀態(tài)、外圈故障、內(nèi)圈故障、滾動體故障四類狀態(tài)下的振動信號各110組數(shù)據(jù)。在正常樣本和其余三類故障樣本數(shù)據(jù)中各隨機抽取20、40、50、60、80組數(shù)據(jù)作為訓(xùn)練樣本數(shù)據(jù),將剩下的樣本數(shù)據(jù)作為測試樣本。表3給出了在不同訓(xùn)練樣本數(shù)情況下VPMCD分類器的分類結(jié)果。
表2 基于排列熵與VPMCD的滾動軸承故障識別結(jié)果
表3 不同訓(xùn)練樣本數(shù)下VPMCD分類器識別結(jié)果
由表3可知,當訓(xùn)練樣本數(shù)超過60,VPMCD分類器分類精度可達100%。在模式識別中,樣本數(shù)量并不是與分類精度成正比的。而且訓(xùn)練樣本數(shù)量增多,運算時間也會增加。因此,針對上述西儲大學(xué)滾動軸承數(shù)據(jù),VPMCD分類器在估計模型參數(shù)時,樣本數(shù)量可根據(jù)表3進行選取。
為比較VPMCD方法和常用神經(jīng)網(wǎng)絡(luò)和支持向量機的識別效果,論文同樣選取上述美國凱斯西儲大學(xué)滾動軸承正常狀態(tài)、外圈故障、內(nèi)圈故障、滾動體故障四類狀態(tài)下的振動信號各110組數(shù)據(jù)。在正常樣本和其余三類故障樣本數(shù)據(jù)中各隨機抽取60、80組數(shù)據(jù)作為訓(xùn)練樣本數(shù)據(jù),分別對SVM、BP神經(jīng)網(wǎng)絡(luò)和VPMCD進行訓(xùn)練,將剩下的樣本數(shù)據(jù)作為測試樣本,并將三類分類器的識別結(jié)果進行對比分析,如表4所示。
表4 VPMCD、BP和SVM識別結(jié)果對比
由表4可知采用不同數(shù)量的訓(xùn)練樣本對VPMCD、BP神經(jīng)網(wǎng)絡(luò)和SVM分別進行訓(xùn)練后,各分類器識別率均較高,說明排列熵算法能夠有效地檢測和放大振動信號的動態(tài)變化,表征滾動軸承在不同狀態(tài)下的工況特征。同時,VPMCD分類器的訓(xùn)練、測試時間要比BP神經(jīng)網(wǎng)絡(luò)和SVM短,說明VPMCD方法不僅避免了神經(jīng)網(wǎng)絡(luò)的迭代學(xué)習(xí)而且避免了SVM的尋優(yōu)過程以及SVM對于多類分類問題需要進行多次的二進分類問題,大大減少了運算量。在使用BP神經(jīng)網(wǎng)絡(luò)時還發(fā)現(xiàn),誤差指標如果過小還會出現(xiàn)過學(xué)習(xí)現(xiàn)象。另外,BP神經(jīng)網(wǎng)絡(luò)和SVM需要進行嚴格的結(jié)構(gòu)參數(shù)的優(yōu)化選擇才能達到較高的識別率,而VPMCD分類器無需進行結(jié)構(gòu)參數(shù)的優(yōu)化選擇。由表4也可看出當訓(xùn)練樣本較少時,VPMCD分類器仍然能達到較高的識別率。在實際工程應(yīng)用中可用的故障特征信號是比較缺乏的,顯然VPMCD方法更適用于實際的滾動軸承故障診斷和狀態(tài)監(jiān)測。
本文提出了一種基于排列熵和VPMCD的滾動軸承故障診斷方法。排列熵算法用來檢測時間序列的動力學(xué)突變,但由于機械系統(tǒng)的復(fù)雜性,振動信號表現(xiàn)不同尺度的動力學(xué)突變,基于此,本文提出用ITD方法將振動信號進行多尺度分解,提取排列熵特征值向量,然后進行VPMCD模式識別,根據(jù)VPMCD模式識別結(jié)果判斷滾動軸承的工作狀態(tài)。通過分析得到如下結(jié)論:
(1) 從原始數(shù)據(jù)中提取的特征值實際上反映了原始數(shù)據(jù)的本質(zhì)特征,VPMCD方法依據(jù)特征值之間的相互內(nèi)在關(guān)系建立預(yù)測模型,避免了神經(jīng)網(wǎng)絡(luò)的迭代學(xué)習(xí)和支持向量機的尋優(yōu)過程,能更有效地實現(xiàn)分類。
(2) VPMCD方法采用各類樣本數(shù)據(jù)對預(yù)測模型參數(shù)進行估計,從而得到不同類別的預(yù)測模型,然后,采用預(yù)測模型對測試樣本進行分類。實驗分析結(jié)果表明,VPMCD方法在訓(xùn)練樣本數(shù)較少也能有效地對預(yù)測模型參數(shù)進行估計。
(3) 在訓(xùn)練樣本數(shù)不同的情況下將VPMCD與BP、SVM相比,分析結(jié)果表明VPMCD能更有效地識別滾動軸承故障的特征信息。VPMCD方法避免了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和類型的選擇、支持向量機核函數(shù)及其參數(shù)的選擇依靠先驗知識或經(jīng)驗問題,同時避免了支持向量機的二進分類問題,可以同時進行多類分類。
(4) 排列熵算法是一種新的檢測時間序列隨機性和動力學(xué)突變的方法,具有計算簡單、快速,抗噪能力強,適合在線監(jiān)測等優(yōu)點。將排列熵和VPMCD方法引入滾動軸承故障診斷中,結(jié)果表明了該方法可以有效地識別滾動軸承的工作狀態(tài)。
[1]溫熙森.模式識別與狀態(tài)監(jiān)控[M].北京:科學(xué)出版社,2007.
[2]LEI Ya-guo,HE Zheng-jia,ZI Yan-yang,et al. New clustering algorithm-based fault diagnosis using compensation distance evaluation technique [J].Mechanical Systems and Signal Processing, 2008,22(2):419-435.
[3]Rafiee J, Tse P W,Harifi A,et al. A novel technique for selecting mother wavelet function using an intelligent fault diagnosis system [J].Expert System with Applications, 2009, 36(3):4862-4875.
[4]Wang C C,Kang Y,Shen P C,et al. Applications of fault diagnosis in rotating machinery by using time series analysis with neural network[J].Expert System With Application, 2010,37(2):1696-1702.
[5]FEI Sheng-wei,ZHANG Xiao-bin.Fault diagnosis of power transformer based on support vector machine with genetic algorithm[J]. Expert Systems with Application, 2009, 36(8):11352-11357.
[6]Raghuraj R,Lakshminarayanan S. Variable predictive models-A new multivariate classification approach for pattern recognition applications[J].Pattern Recognition, 2009, 42(1):7-16.
[7]Raghuraj R,Lakshminarayanan S.Variable predictive model based classification algorithm for effective separation of protein structural classes[J].Computational Biology and Chemistry, 2008,32(4):302-306.
[8]Raghuraj R,Lakshminarayanan S.VPMCD:Variable interaction modeling approach for class discrimination in biological system[J].FEBS Letter,2007,581(5):826-830.
[9]Wang X Y,Makis V,Yang M. A wavelet approach to fault diagnosis of a gearbox under varying load conditions[J].Journal of Sound and Vibration,2010,329(9):1570-1585.
[10]Kankar P K,Sharma S C,Harsha S P. Fault diagnosis of ball bearing using continuous wavelet transform[J]. Applied Soft Computing, 2011, 11(2):2300-2312.
[11]WU Fang-ji,QU Liang-sheng.Diagnosis of subharmonic faults of large rotating machinery based on EMD[J].Mechanical Systems and Signal Processing,2009,23(2):467-475.
[12]CHENG Jun-sheng,YANG Yu,YU De-jie.The envelope order spectrum based on generalized demodulation time-frequency analysis and its application to gear fault diagnosis[J]. Mechanical System and Signal Processing,2010,24(2):508-521.
[13]Bandt C, Pompe B. Permutation entropy: a natural complexity measure for time series[J]. Physical Review Letters, The American Physiological Society,2002,88(17):174102(1-4).
[14]Yan R Q,Liu Y B,Gao R X. Permutation entropy: A nonlinear statistical measure for status characterization of rotary machines[J]. Mech. Syst. Signal Process, 2012 (29): 474-484.
[15]Frei M G, Osorio I. Intrinsic time-scale decomposition: time-frequency-energy analysis and real-time filtering of non-stationary signals[J]. Proceedings of the Royal Society. A, 2007, 463: 321-342.
[16]安金坤,田斌,孫永軍,等.一種基于ITD算法的直擴信號檢測算法[J].電子與信息學(xué)報,2010,32(5):1178-1182.
AN Jin-kun,TIAN Bin,SUN Yong-jun,et al. An algorithm for direct sequence spread spectrum signal detection based on intrinsic time-scale decomposition[J]. Journal of Electronics & Information Technology, 2010,32(5):1178-1182.
[17]Yan R Q,Gao R X. Approximate entropy as a diagnostic tool for machine health monitoring[J]. Mechanical Systems and Signal Process, 2007,21 (2) 824-839.
[18]Cao Y,Tung W W, Gao J B, et al. Detecting dynamical changes in time series using the permutation entropy[J]. Phys. Rev, 2004 (E70) 046217.
[19]Case Western Reserve University Bearing Data Center. Bearing data center fault test data. [EB/OL].[2012-11-10]. http://www.eecs.case.edu/laboratory/bearing.