基于WMRMR的滾動(dòng)軸承混合域特征選擇方法
戴豪民,許愛強(qiáng),李文峰,孫偉超
(海軍航空工程學(xué)院飛行器檢測與應(yīng)用研究所,山東煙臺(tái)264001)
摘要:為充分利用時(shí)域、頻域以及時(shí)頻域中的有效特征,提高滾動(dòng)軸承故障診斷準(zhǔn)確率,提出一種混合域特征集構(gòu)建方法,利用原始信號(hào)分別生成時(shí)域和頻域特征集,通過經(jīng)驗(yàn)?zāi)J椒纸馓崛」逃心B(tài)函數(shù)的排列熵和Hilbert譜的奇異值作為時(shí)頻域特征集,使得混合域特征集比單域特征更能全面準(zhǔn)確反映軸承運(yùn)行狀態(tài)。針對混合域特征集存在維數(shù)過高、特征之間冗余性嚴(yán)重的問題,采用加權(quán)最大相關(guān)最小冗余的特征選擇方法,以支持向量機(jī)分類正確率為依據(jù),選取7個(gè)有效特征向量。實(shí)驗(yàn)結(jié)果表明:基于WMRMR的混合域特征選擇方法的分類準(zhǔn)確率可達(dá)98%,能夠有效的識(shí)別軸承故障信息。
關(guān)鍵詞:混合域;經(jīng)驗(yàn)?zāi)J椒纸?;Hilbert譜奇異值;排列熵;加權(quán)最大相關(guān)最小冗余
中圖分類號(hào):TN911.7;TH165
文獻(xiàn)標(biāo)志碼:A
DOI:10.13465/j.cnki.jvs.2015.19.009
Abstract:In order to improve the accuracy of rolling bearings fault diagnosis by making full use of effective features in time domain,frequency domain and time-frequency domain, a mixed domain feature construction approach was proposed. With it, time domain and frequency domain features were generated using the original signals, permutation entropies of intrinsic mode functions obtained with EMD and singular values of Hilbert spectrum were extracted as time-frequency domain feature sets, and mixed domain feature sets were made to more fully and accurately reflect bearing running states than the single domain features do. Aiming at mixed domain feature sets having shortcomings of too high dimensions and serious redundancy, a feature selection method based on weighted minimal redundancy maximal relevance (WMRMR) was proposed, it could select seven major feature vectors based on the classification accuracy of support vector machine. The test results showed that the classification accuracy of mixed domain feature selection can reach 98% based on WMRMR, and it can effectively identify the bearing fault information.
基金項(xiàng)目:國家自然科學(xué)基金(11202162);中國博士后科學(xué)基金(2014M560803)
收稿日期:2014-11-25修改稿收到日期:2015-03-31
Fault diagnosis of rolling bearings in mixed domain based on WMRMR
DAIHao-min,XUAi-qiang,LIWen-feng,SUNWei-chao(Institute of Aircraft Detection and Application,College of Naval Aeronautical and Engineering, Yantai 264001, China)
Key words:mixed domain; empirical mode decomposition (EMD); singular values of Hilbert spectrum; permutation entropy; weighted minimal redundancy maximal relevance (WMRMR)
滾動(dòng)軸承發(fā)生故障時(shí)常會(huì)引起非線性、非平穩(wěn)振動(dòng),對其故障進(jìn)行診斷的關(guān)鍵是如何從非線性、非平穩(wěn)信號(hào)中提取典型故障特征信息[1]。目前,針對非平穩(wěn)信號(hào)的時(shí)頻域分析方法,如小波變換[2]和經(jīng)驗(yàn)?zāi)J椒纸鈁3](Empirical Mode Decomposition,EMD),已經(jīng)廣泛應(yīng)用于旋轉(zhuǎn)機(jī)械故障診斷中。但是,作者對西儲(chǔ)大學(xué)軸承數(shù)據(jù)中心提供的實(shí)測數(shù)據(jù)[4]仿真發(fā)現(xiàn),時(shí)頻域特征提取方法有時(shí)并不能達(dá)到理想的診斷效果。由于單域特征難以全面、準(zhǔn)確地刻畫出復(fù)雜機(jī)械系統(tǒng)不同類型的故障特性,本文提出一種混合域故障診斷方法,充分利用時(shí)域、頻域、時(shí)頻域典型故障特征信息,使得混合域特征集比單域特征更能全面準(zhǔn)確反映軸承運(yùn)行狀態(tài)。針對混合域特征集存在維數(shù)過高、特征之間冗余性嚴(yán)重等問題,采用加權(quán)最大相關(guān)最小冗余(Weighted Minimal Redundancy Maximal Relevance,WMRMR)的特征選擇方法,以支持向量機(jī)(Support Vector Machine,SVM)的分類正確率為依據(jù),實(shí)現(xiàn)特征的有效選擇。
1混合域特征集的構(gòu)成
1.1時(shí)域和頻域特征集生成
時(shí)域指標(biāo)是一種比較直觀的信號(hào)特征,可以通過觀察信號(hào)的時(shí)域統(tǒng)計(jì)特征來辨別軸承故障。本文主要引進(jìn)6個(gè)常用的特征量以及文獻(xiàn)[5]提出的2個(gè)特征量TALAF指標(biāo)和THIKAT指標(biāo),組成8維時(shí)域特征向量構(gòu)成時(shí)域特征集。
時(shí)域特征所能提供的信息量是非常有限的,軸承在發(fā)生故障時(shí),振動(dòng)信號(hào)的頻域中也蘊(yùn)含了大量的對診斷有用的信息,可以通過傅里葉分析方法將其提取出來。本文主要引進(jìn)3個(gè)常用的特征量構(gòu)成頻域特征集。
時(shí)域、頻域特征向量見表1,其具體定義可以參見文獻(xiàn)[5-6]。
表1 時(shí)域、頻域特征集
1.2時(shí)頻域特征集生成
軸承故障的重要信息往往包含在瞬態(tài)信號(hào)或突變信號(hào)中,而單一的時(shí)域或頻域特征只能對信號(hào)進(jìn)行整體刻畫,不能同時(shí)對信號(hào)進(jìn)行局域性分析。基于EMD的時(shí)頻分析方法可以從不同尺度對信號(hào)的局部特征進(jìn)行描述,能夠準(zhǔn)確的刻畫信號(hào)的時(shí)頻特性。為了較全面的描述振動(dòng)信號(hào)的時(shí)頻域特征,本文從能量和復(fù)雜度兩個(gè)層面,分別選取Hilbert譜奇異值和固有模態(tài)函數(shù)(Intrinsic Mode Function,IMF)的排列熵(Permutation Entropy,PE)作為時(shí)頻域的特征向量。
1.2.1基于Hilbert譜奇異值的時(shí)頻域特征
Hilbert譜作為軸承振動(dòng)信號(hào)的一種時(shí)頻域表示方法,描述了信號(hào)的幅值在整個(gè)頻率段上隨時(shí)間和頻率的變化規(guī)律,同時(shí)Hilbert譜也包含了軸承信號(hào)大量的特征信息[7]。對Hilbert譜進(jìn)行奇異值分解,將得到的奇異值作為特征向量,也是一種有效的特征選擇方法[8]。考慮到軸承故障信息主要包含在前幾個(gè)較大的奇異值中,本文選取Hilbert譜中前5個(gè)奇異值構(gòu)建時(shí)頻域特征向量TF1=[λ1,λ2,λ3,λ4,λ5]。
1.2.2基于IMF排列熵的時(shí)頻域特征
復(fù)雜度是刻畫非線性時(shí)間序列的一個(gè)重要指標(biāo),它反映了信號(hào)序列的混亂程度[9]。軸承正常運(yùn)行時(shí),其波形為平穩(wěn)的隨機(jī)信號(hào)。軸承出現(xiàn)故障時(shí),由于激起系統(tǒng)的共振頻率,振動(dòng)信號(hào)會(huì)變得越來越復(fù)雜,越來越不平穩(wěn)。從時(shí)域的角度上看,其波形將會(huì)產(chǎn)生新的振動(dòng)模式或狀態(tài);從頻域的角度上看,其頻率結(jié)構(gòu)發(fā)生了改變,產(chǎn)生新的頻率成分。復(fù)雜度正是反映了一個(gè)時(shí)間序列隨著序列長度的增加出現(xiàn)新模式的速率。因此,一個(gè)時(shí)間序列的復(fù)雜度能夠描述出系統(tǒng)狀態(tài)發(fā)生變化的情況。所以從這個(gè)意義上來說,可以用復(fù)雜度刻畫軸承振動(dòng)信號(hào)隨時(shí)間變化的狀態(tài)。
排列熵作為時(shí)間序列復(fù)雜度的一種度量[10],可以用來檢測時(shí)間序列的動(dòng)力學(xué)突變,能夠敏感地捕捉軸承振動(dòng)信號(hào)的故障信息,所以本文提取各IMF排列熵作為特征向量,考慮到軸承故障信息主要包含在高頻帶,計(jì)算信號(hào)前5個(gè)IMF 排列熵,構(gòu)建時(shí)頻域特征向量TF2=[PE1,PE2,PE3,PE4,PE5],其中排列熵的定義為:
(1)
式中,Pj為不同符號(hào)序列出現(xiàn)的概率,k=n-(m-1)τ,n,m和τ分別為原始信號(hào)的序列長度、嵌入維數(shù)和延遲時(shí)間。
2加權(quán)最大相關(guān)最小冗余算法
最大相關(guān)最小冗余算法(Minimal Redundancy Maximal Relevance,MRMR)使用互信息衡量特征的相關(guān)性與冗余度,并使用信息差和信息熵兩個(gè)代價(jià)函數(shù)來構(gòu)建特征子集的搜索策略[11]。MRMR算法中最大相關(guān)和最小冗余的定義分別如式(2)和式(3)所示:
(2)
(3)
結(jié)合以上兩個(gè)測度指標(biāo),就可以得到MRMR算法的兩個(gè)評價(jià)函數(shù)來指導(dǎo)特征子集的選擇,即:
maxΦ1(D,R),Φ1=D-R
(4)
maxΦ2(D,R),Φ2=D/R
(5)
在式(4)中,刻畫相關(guān)性的互信息值D與刻畫冗余度的互信息值R是賦予相同的權(quán)重。但是實(shí)際應(yīng)用中,一些特征既具有較大相關(guān)性又具有較大的冗余度,MRMR算法對這類特征篩選出的特征子集并不是最佳的。WMRMR通過引入權(quán)重因子μ來權(quán)衡相關(guān)性和冗余性的度量,以獲得最好的特征選擇結(jié)果,相應(yīng)地MRMR評價(jià)函數(shù)可以修正為[12]:
maxΦ3(D,R),Φ3=μD-(1-μ)R
(6)
式中,μ的取值范圍是0≤μ≤1,當(dāng)μ=0.5時(shí),式(6)就退化為式(4)的標(biāo)準(zhǔn)MRMR評價(jià)函數(shù)。
3基于WMRMR的軸承信號(hào)特征提取方法
為了驗(yàn)證WMRMR算法所選擇的特征子集的優(yōu)劣,本文采用支持向量機(jī)的分類準(zhǔn)確率作為評價(jià)指標(biāo),實(shí)驗(yàn)步驟如下:
步驟1選取軸承正常態(tài)、內(nèi)圈故障態(tài)、外圈故障態(tài)以及滾動(dòng)體故障態(tài)四類樣本,每種狀態(tài)包含50個(gè)樣本。為了方便對特征進(jìn)行排序,分別對時(shí)域、頻域以及時(shí)頻域特征進(jìn)行編號(hào),其中,時(shí)域特征的有效值、峰值、峭度、峰值因數(shù)、脈沖因數(shù)、裕度因數(shù)、TALAF、THIKAT編號(hào)為1~8,頻域特征的重心頻率、均方頻率、頻率方差編號(hào)為9~11,時(shí)頻域特征IMF排列熵編號(hào)為12~16,Hilbert譜奇異值編號(hào)為17~21。
步驟2將權(quán)重因子μ以0.1為步長進(jìn)行賦值,即μi=0,0.1,…1,i=1,2,…,11,采用WMRMR分別得到與權(quán)重因子μi對應(yīng)的一組候選特征集Si。
按照步驟1、2即可求取不同權(quán)重因子μ對應(yīng)的特征子集,將特征子集按Φ3(D,R)進(jìn)行降序排列的結(jié)果見表2。
表2 特征降序排列分布
由表2可知,不同權(quán)重因子排序后的特征子集的次序是不同的,這表明權(quán)重因子能夠細(xì)致地區(qū)分特征的敏感程度。按照步驟3和4采用SVM分類器測試特征子集,并按照特征排序結(jié)果逐一添加特征,所得分類正確率的變化情況見圖1。
圖1 不同權(quán)重因子對應(yīng)的分類準(zhǔn)確率曲線 Fig.1 Classification accuracy curves corresponding to different weighting factors
從圖1可以看出,隨著特征數(shù)量的增加,分類正確率首先逐漸增大,當(dāng)達(dá)到一個(gè)峰值后,將基本保持不變或下降。這表明峰值之后增加的特征沒有改善分類效果,有些反而給分類帶來了不利影響。同時(shí),不同權(quán)重因子對應(yīng)的最高分類準(zhǔn)確率也不同,當(dāng)μ=0,μ=0.1,μ=0.3時(shí),可以達(dá)到最高分類準(zhǔn)確率98.5%,而μ=0.3時(shí)達(dá)到最高分類準(zhǔn)確率所需的特征個(gè)數(shù)最少,僅為7個(gè),所以本文選取權(quán)重因子μ=0.3時(shí)對應(yīng)的前7個(gè)特征向量做為最終的特征子集,對應(yīng)的特征分別是λ1、有效值、重心頻率、TALAF、PE1、λ4、λ2。
為了說明本文方法的優(yōu)越性,參照文獻(xiàn)[13]采用核主成分分析方法對原始特征集合進(jìn)行降維處理,核函數(shù)選用高斯核,核參數(shù)取100。保留原始數(shù)據(jù)95%的方差,可將原始特征集降成9維的特征子集,具體結(jié)果見圖2。將得到的200×9的訓(xùn)練集矩陣輸入SVM中訓(xùn)練,采用網(wǎng)格搜索法來獲得最佳的分類準(zhǔn)確率,其中,網(wǎng)格搜索的范圍是[2-8,28]。從圖3可以看出,利用核主成分分析選擇出的特征子集,其分類準(zhǔn)確率最高能達(dá)到96.5%。通過以上對比分析可以發(fā)現(xiàn),基于WMRMR的特征選擇方法不僅分類準(zhǔn)確率更優(yōu),而且特征子集的維數(shù)更低。
圖2 原始特征集核主成分分析結(jié)果 Fig.2 The kernel principal component analysis’s result of original feature set
圖3 網(wǎng)格搜索分類準(zhǔn)確率 Fig.3 Classification accuracy of grid search
4基于支持向量機(jī)的軸承故障診斷實(shí)例
為了驗(yàn)證2.3小節(jié)選擇出的混合域特征子集的故障診斷效果,本文仍選取上述四類狀態(tài)樣本進(jìn)行仿真,其中,每種狀態(tài)包含100個(gè)樣本,50個(gè)用于SVM訓(xùn)練,50個(gè)用于測試。圖4是訓(xùn)練集的網(wǎng)格搜索分類準(zhǔn)確率,高達(dá)99.5%。表3是最終測試集的分類準(zhǔn)確率,整體分類準(zhǔn)確率為98%。表4是基于IMF排列熵的SVM診斷結(jié)果,從這兩個(gè)表的對比結(jié)果可以明顯看出:混合域的分類效果要明顯優(yōu)于單一的時(shí)頻域分類效果。
表3 基于混合域的SVM診斷結(jié)果
圖4 訓(xùn)練集網(wǎng)格搜索分類準(zhǔn)確率 Fig.4 Classification accuracy of training set by means of grid search
故障模式測試樣本數(shù)錯(cuò)分樣本數(shù)分類準(zhǔn)確率/%正常60296.67內(nèi)圈601181.67外圈60690滾動(dòng)體601280總計(jì)2403187.08
圖5 遺傳算法參數(shù)尋優(yōu)適應(yīng)度曲線 Fig.5 Fitness curve of parameter optimization by genetic algorithm
圖6 粒子群算法參數(shù)尋優(yōu)適應(yīng)度曲線 Fig.6 Fitness curve of parameter optimization by particle swarm optimization
為了說明特征選擇的重要性,分別采用遺傳算法和粒子群算法對SVM進(jìn)行參數(shù)尋優(yōu)。從圖5和圖6可以看出,這兩種方法可以很“輕松”的使訓(xùn)練集的分類準(zhǔn)確率達(dá)到99%,這充分說明了特征向量的選擇至關(guān)重要,“優(yōu)秀”的特征向量對模式識(shí)別起到?jīng)Q定性作用,從另一方面也說明了本文提出的混合域的故障診斷方法能夠有效的識(shí)別軸承故障信息。
5結(jié)論
(1)混合域特征集比單域特征更能全面、準(zhǔn)確地反映軸承運(yùn)行狀態(tài)。
(2)加權(quán)最大相關(guān)最小冗余特征選擇方法能夠有效的提取敏感特征向量,與核主成分分析方法相比,不僅分類準(zhǔn)確率更高,而且特征子集的維數(shù)更低。
(3)特征向量的有效選擇關(guān)系到故障診斷效果的好壞,本文提出的基于WMRMR的混合域特征選擇方法分類準(zhǔn)確率可達(dá)98%,能夠有效的識(shí)別軸承故障信息。
參考文獻(xiàn)
[1]Randall R B, Antoni J. Rolling element bearing diagnostics A tutorial[J]. Mechanical Systems and Signal Processing, 2011, 25(2): 485-520.
[2]羅榮,田福慶,李克玉,等.卷積型小波變換實(shí)現(xiàn)及機(jī)械早期故障診斷應(yīng)用[J]. 振動(dòng)與沖擊, 2013, 32(7): 64-69.
LUO Rong, TIAN Fu-qing, LI Ke-yu, et al. Realization of convolution wavelet transform and its application in mechanical incipient fault diagnosis[J]. Journal of Vibration and Shock, 2013, 32(7): 64-69.
[3]張超,陳建軍,郭迅.基于EMD能量熵和支持向量機(jī)的齒輪故障診斷方法[J].振動(dòng)與沖擊, 2010, 29(10): 216-220.
ZHANG Chao, CHEN Jian-jun, GUO Xun. A gear fault diagnosis method based on EMD energy entropy and SVM [J]. Journal of Vibration and Shock, 2010, 29(10): 216-220.
[4]The Case Western Reserve University Bearing Data Center Website [DB/OL]. http://csegroups.case.edu/bearingdatacenter/pages/download-data-file
[5]Sassi S, Badri B, Thomas M. TALAF and THIKAT as innovative time domain indicators for tracking ball bearings[C]//Proceedings of the 14th Seminar on Machinery Vibration, Vancouver, IEEE, 2006: 24-27.
[6]楊國安.滾動(dòng)軸承故障診斷實(shí)用技術(shù)[M].北京:中國石化出版社,2012:65-70.
[7]Huang N E, Shen Z, Long S R, et al. The empirical mode decomposition and the hilbert spectrum for nonlinear and non-stationary time series analysis [J]. Proceedings of the Royal Society of London Series A: Mathematical, Physical and Engineering Sciences, 1998, 454(1971): 903-995.
[8]趙志宏,楊紹普,李韶華.基于Hilbert譜奇異值的軸承故障診斷[J].中國機(jī)械工程, 2013, 24(3): 346-350.
ZHAO Zhi-hong, YANG Shao-pu, LI Shao-hua. Bearings fault diagnosis based on singular values of Hilbert spectrum [J]. China Mechanical Engineering, 2013, 24(3): 346-350.
[9]饒國強(qiáng),馮輔周,司愛威,等. 排列熵算法參數(shù)的優(yōu)化確定方法研究[J]. 振動(dòng)與沖擊, 2014,33(11): 188-193.
RAO Guo-qiang, FENG Fu-zhou, SI Ai-wei, et al. Method for optimal determination of parameters in permutation entropy algorithm [J]. Journal of Vibration and Shock, 2014, 33(1): 188-193.
[10]Bandt C, Pompe B. Permutation entropy: a natural complexity measure for time series [J]. Physical Review Letters, 2002, 88(17): 1-4.
[11]Ding C, Peng H. Minimum redundancy feature selection from microarray gene expression data [J]. Journal of Bioinformatics and Computational Biology, 2005, 3(2): 185-205.
[12]李揚(yáng),顧雪平.基于改進(jìn)最大相關(guān)最小冗余判據(jù)的暫態(tài)穩(wěn)定評估特征選擇[J].中國電機(jī)工程學(xué)報(bào), 2013, 33(34): 179-186.
LI Yang, GU Xue-ping. Feature selection for transient stability assessment based on improved maximal relevance and minimal redundancy criterion [J]. Proceedings of the CSEE, 2013, 33(34): 179-186.
[13]彭濤,楊慧斌,李健寶,等.基于核主元分析的滾動(dòng)軸承故障混合域特征提取方法[J]. 中南大學(xué)學(xué)報(bào):自然科學(xué)版, 2011, 42(11): 3384-3391.
PENG Tao, YANG Hui-bin, LI Jian-bao, et al. Mixed-domain feature extraction approach to rolling bearings faults based on kernel principle component analysis[J]. Journal of Central South University:Science and Technology, 2011, 42(11): 3384-3391.
第一作者王偉男,博士生,1988年8月生
通信作者周洲女,博士,教授,博士生導(dǎo)師/長江學(xué)者,1966年生