謝素超 ,李雅鑫 ,譚鴻創(chuàng)
(1.中南大學 軌道交通安全教育部重點實驗室,湖南 長沙 410075;2.中南大學 軌道交通安全關(guān)鍵技術(shù)國際合作聯(lián)合實驗室,湖南 長沙 410075;3.中南大學 軌道交通列車安全保障技術(shù)國家地方聯(lián)合工程研究中心,湖南 長沙 410075)
伴隨智能運維技術(shù)的完善,軟硬件設施的發(fā)展,多種新技術(shù)被引入到鐵路系統(tǒng)當中。列車故障檢測和維護擴展到了系統(tǒng)協(xié)同工作、大數(shù)據(jù)融合和智能維護領(lǐng)域。基于數(shù)據(jù)驅(qū)動的健康監(jiān)測系統(tǒng)成為列車故障檢測系統(tǒng)未來的發(fā)展方向[1-2]。軸承作為列車走行部中關(guān)鍵零部件,其工作狀態(tài)直接影響列車的安全,研究軸承故障識別,提高識別效率對于實現(xiàn)實時故障檢測,建立列車智能健康監(jiān)測系統(tǒng)有重要意義。在列車軸承故障診斷中常使用振動信號作為媒介,而振動傳感器采集到的列車軸承振動信號往往是多種信號的調(diào)制、疊加,而且實際使用的數(shù)據(jù)多為不平衡數(shù)據(jù)集,這對軸承故障特征提取和故障識別帶來較大困難[3]。在常用的信號分析方法中,傅里葉變換適用于平穩(wěn)線性信號分析,小波分析在數(shù)據(jù)驅(qū)動的故障診斷方法當中自適應性不高[4]。經(jīng)驗模態(tài)分解(Empirical Mode Decomposition,EMD)克服了小波基函數(shù)自適應低的問題。VAN 等[4]將非局域(Non-local Means,NLM)方法和EMD 相結(jié)合對軸承信號進行分解,組合時域上的數(shù)據(jù)構(gòu)建特征集,構(gòu)建了59維的特征向量,增加了分類器的學習負擔。集合經(jīng)驗模態(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)[5],通過白噪聲掩蓋信號本身噪聲,解決了EMD 分解過程中模式混疊的現(xiàn)象。姚德臣等[6]采用EEMD 分解小波降噪后的信號,將IMF 分量的多尺度排列熵構(gòu)成特征向量,使用SA-SVM對進行分類有較好的效果。李笑梅等[7]利用EEMD對信號進行分解后提取IMF 的能量值作為特征向量,利用徑向基函數(shù)神經(jīng)網(wǎng)絡中實現(xiàn)列車軸承故障分類。但當故障信號噪聲比較大時,為減少殘余噪聲,需要較高的迭代次數(shù)[8]。互補經(jīng)驗模態(tài)分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD)解決了殘余噪聲問題且其迭代次數(shù)遠小于EEMD[9]。LIU等[10]使用CEEMD對軸承故障信號進行分解,將IMF 分量的能量矩作為特征向量,使用LDWPSO-PNN 進行分類識別。CHEN 等[11]對高速列車齒輪箱內(nèi)的齒輪故障信號進行CEEMD 分解,對不同故障的齒輪狀態(tài)進行診斷。支持向量機(Support Vector Machine,SVM)在小樣本分類中有較好分類效果,適用于現(xiàn)場樣本量較少的學習情況。為提高分類精度,有學者采用遺傳算法、粒子群算法、最小二乘法[12-13]等進行SVM 參數(shù)優(yōu)化,或者將仿生智能優(yōu)化算法引入到SVM 參數(shù)優(yōu)化中[14-16]。張龍等[17]提出了一種基于多尺度熵和粒子群優(yōu)化的SVM 機車軸承故障識別方法,識別精度達到了99.5%以上。針對分類數(shù)據(jù)集不平衡現(xiàn)象,RICHHARIYA 等[18]將一元學習同SVM 相結(jié)合,并通過欠采樣和過采樣解決數(shù)據(jù)不平衡問題。孟宗等[19]通過數(shù)據(jù)滑動取樣構(gòu)造平衡數(shù)據(jù)集,并使用深度卷積網(wǎng)絡進行故障特征提取和故障種類識別?;谏鲜龇治觯瑢EEMD 應用于振動信號的自適應分解,并根據(jù)相關(guān)性系數(shù)準則篩選分解后的IMF 分量,提取能夠有效表征軸承的沖擊和磨損狀態(tài)的特征。采用人工魚群優(yōu)化過后的SVM 分類器進行故障類型識別,通過實驗驗證了該方法在小樣本復雜種類的軸承故障識別中有較好的分類能力,且在不平衡數(shù)據(jù)集中展現(xiàn)出較強的魯棒性。
為降低噪聲影響提取出包含異常信息的振動頻段,采用CEEMD 對軸承的振動信號進行分解。已知原始信號為x(t)(如圖1所示),在原始信號中附加互補高斯白噪聲n(t),獲得2n組新的信號。
圖1 原始信號以及重構(gòu)信號Fig.1 Original signal and reconstructed signal
得到imfj為x(t)經(jīng)過CEEMD 后的各階本征模態(tài)函數(shù),其中j為信號分解為本征模態(tài)函數(shù)的階次,j=1,2,…,m。已知IMF分量同原始信號具有互相關(guān)關(guān)系,計算其同原始信號的相關(guān)性系數(shù)并進行排序:
提取相關(guān)性系數(shù)大于0.5 的IMF 分量,記作IMF=[imf1,imf2,…,imfi]。對比重構(gòu)和原始信號可以看出,經(jīng)過CEEMD 分解后,基于相關(guān)性重構(gòu)本征模態(tài)函數(shù)的重構(gòu)信號除去了一些異常高幅值的振動。重構(gòu)信號與原始信號時域圖形重合度較高,較好地保留了原始信號的信息[20]。
按列車軸承故障形式,可將故障分為磨損類故障以及表面損傷故障。磨損類故障軸承,其振動為無規(guī)則隨機的振動。表面損傷類故障,常表現(xiàn)為一個能量較大的寬頻沖擊,覆蓋在原有軸承固有的振動信號當中引起諧振。在軸承故障信號中,不同的故障形式引起的沖擊程度不同,將能量作為特征向量的一個要素,提取特征故障特征如下:
在軸承故障早期,時域指標對于軸承故障狀態(tài)變化表現(xiàn)出較好的靈敏性,無量綱的時頻域函數(shù)能夠直觀地表達出軸承在運轉(zhuǎn)過程中的狀態(tài)信息。其中峰值因子可以表征信號當中是否含有尖峰,峭度因子描述隨機變量分布,裕度因子表征部件當中的磨損狀態(tài)。因此將上述3個時域指標作為特征向量因子。N為信號長度:
雖然時頻域的特征計算簡單且直觀,但穩(wěn)定性不高,故加入頻域特征進行補充。對重構(gòu)信號進行短時快速傅里葉變換并計算其頻率均方根:
T=(F1,F(xiàn)2,F(xiàn)3,F(xiàn)4,F(xiàn)5)為上述5 種指標構(gòu)成的故障特征向量。從軸承故障振動信號特征出發(fā),分析其較明顯的時頻域特征,耦合其中較為敏感且具有一定穩(wěn)定性的指標構(gòu)成特征向量,有利于實現(xiàn)高效的故障識別。
在軸承故障類型識別階段,常使用機器學習,深度學習模型,比如KNN,PNN 和SVM 等實現(xiàn)軸承的故障分類。由于SVM 在小樣本學習有較好的效果,被廣泛應用于軸承的故障識別。為提高SVM 參數(shù)尋優(yōu)速度和質(zhì)量,使用人工魚群算法對傳統(tǒng)SVM 進行優(yōu)化改進。人工魚群算法是一種基于魚群覓食行為的新型仿生種群全局智能搜索算法。在一個全局范圍內(nèi)尋找最優(yōu)解時其有較好的找尋能力以及收斂速度。使用該算法對SVM 參數(shù)尋找過程進行優(yōu)化,流程圖如圖2所示。
圖2 軸承故障識別流程圖Fig.2 Bearing failure identification flow chart
基于上述分析,采用CEEMD 和SVM 實現(xiàn)軸承的故障特征提取和特征分類,構(gòu)建了一種基于互補經(jīng)驗模態(tài)分解—支持向量機(CEEMD-SVM)軸承故障識別方法,具體流程如下:
1) 對原始信號進行CEEMD 分解獲得IMF 分量:imf1,imf2,imf3,…,imfn;
2) 根據(jù)相關(guān)性原理,計算各個IMF 分量同原始信號的相關(guān)性系數(shù),選取相關(guān)性較大的IMF 分量,對其進行重構(gòu),根據(jù)1.2 節(jié)的方法計算特征向量并進行歸一化處理;
3) 從各個不同狀態(tài)的軸承特征集中隨機提取部分數(shù)據(jù)集構(gòu)成平衡和不平衡訓練集分別用于模型訓練;
4) 剩余的數(shù)據(jù)集構(gòu)成測試集測試分類器效果。
為驗證所提出的軸承故障方法的可行性,泛化性能和優(yōu)越性,分別使用美國西儲大學的軸承故障數(shù)據(jù)以及實驗室機械故障綜合仿真測試平臺的軸承故障數(shù)據(jù)進行故障識別實驗。
數(shù)據(jù)來自凱斯西儲大學,采用6205-2RS JEM SKF 深溝球軸承,采樣頻率為12 kHz。按照軸承故障狀態(tài)分為內(nèi)圈故障、外圈故障、滾子故障以及正常狀態(tài)4種情況。對列車軸承故障類型進行識別時,用于訓練的各種狀態(tài)的特征集樣本量較小,所以在進行軸承故障分類仿真測試時訓練樣本量少于測試樣本量。實驗時設置每種故障數(shù)據(jù)集中包含40組特征向量,其中10組為訓練集30組為測試集。
首先使用CEEMD 對信號進行自適應分解,圖3 為軸承內(nèi)圈故障的原始信號,對其進行傅里葉變換得到頻譜圖(圖4),4 000~5 000 Hz 以及1 000~2 000 Hz內(nèi)存在幅值較大頻段,可判斷出在此頻段內(nèi)存在沖擊能量。
圖3 軸承原始信號圖Fig.3 Original signal diagram of bearing
圖4 振動信號頻譜圖Fig.4 Bearing failure identification flow chart
使用CEEMD 對信號進行分解得到10 個模態(tài)分量如圖5 所示,對imf1,imf2,imf3,imf4進行快速傅里葉變化得到頻譜圖(圖6),可以看出高頻信號存在于前幾階IMFs 中。基于相關(guān)性對IMF 進行篩選,相關(guān)性系數(shù)如圖7所示。imf1,imf2,imf3與原始信號相關(guān)性較高,其余同原始信號的相關(guān)性并不高。因此提取前3階IMF重構(gòu)后計算特征向量。由于特征元素之間的數(shù)量級差別較大,所以對數(shù)據(jù)進行歸一化處理。圖8 可以看出選取的5 個特征向量能夠?qū)⒉煌瑺顟B(tài)的軸承分離。特征向量集隨機分為測試集和訓練集輸入AFSA-SVM 分類器中進行分類測試。如圖9所示,得到了精度較高的分類結(jié)果(120/120),驗證了所提出的診斷方法的有效性。
圖5 分解后IMF分量Fig.5 Decomposed IMF components
圖6 前4階IMF分量頻譜圖Fig.6 Spectra of the first four IMF components
圖7 相關(guān)性系數(shù)Fig.7 Vector correlation coefficient
圖8 不同狀態(tài)下的特征向量Fig.8 Eigenvectors in different states
圖9 4種狀態(tài)的測試集分類結(jié)果Fig.9 Test set classification results for four states
使用中南大學軌道交通安全教育部重點實驗室數(shù)據(jù)進行實驗測試。實驗室機械故障綜合仿真測試試驗臺,如圖10 所示。測試軸承的型號為MBER-12K,滾子數(shù)為8,球直徑為0.312 5 mm,使用EDM 點蝕技術(shù)得到故障直徑為1mm 的故障軸承進行實驗。電動機轉(zhuǎn)速為2 000 r/min,采樣頻率為32 kHz。采集了正常狀態(tài)、內(nèi)圈故障、外圈故障、滾子故障以及復合故障5種狀態(tài)下軸承的振動信號用于軸承的故障識別實驗。
圖10 機械故障綜合仿真測試試驗臺示意圖Fig.10 Schematic diagram of mechanical fault comprehensive simulation test bench
樣本長度為3 000,樣本數(shù)量為500,IMF分量的相關(guān)性系數(shù)如圖11 所示,在該段信號中,前4個分量同原始數(shù)據(jù)相關(guān)性系數(shù)在0.5 以上,故選取前4個IMFs進行重構(gòu)。
圖11 IMF分量同原始信號的相關(guān)性系數(shù)Fig.11 Schematic diagram of mechanical fault comprehensive simulation test bench
圖12(a),12(b)和12(c)為時域范圍內(nèi)的3 個特征向量,在時域范圍內(nèi),3 個無量綱指標均表現(xiàn)出了其對于異常狀態(tài)的靈敏度。但是基于時域特征構(gòu)成的特征向量并不足以將5種狀態(tài)完全分離,因此加入頻域特征和能量值對其進行補充。圖12(d)和圖12(e)為樣本的能量值和頻率均方根。從數(shù)量級上來看在能量維度上能夠有效的分開正常狀態(tài)、外圈故障以及滾子故障,但是內(nèi)圈故障和復合故障交織在一起。在頻域中,復合故障和外圈故障交織在一起,借助頻率均方根可以將內(nèi)圈和復合故障進行區(qū)分。將上述的特征值進行耦合,構(gòu)成五維的特征向量,既包含了對異常沖擊的靈敏性,同時兼?zhèn)淞藢τ? 種狀態(tài)的故障類型識別的穩(wěn)定性。
圖12 樣本特征值Fig.12 Sample eigenvalues
對500 組樣本進行劃分,輸入AFSA-SVM 分類實驗,分別測試了訓練集與測試集數(shù)量比例為8∶2,7∶3,6∶4,5∶5,4∶6,3∶7,2∶8 的分類能力。每組實驗進行3次重復實驗取最低準確率作為最終結(jié)果,如圖13 所示,訓練集只有100 組時準確率可以達到99.5%,在7 組學習訓練中AFSASVM 分類器的準確率均在99%以上,當訓練集比例為7:3 及以上時,可以準確識別每一個樣本的故障類型。
圖13 各個測試組的識別準確率Fig.13 Recognition accuracy of each test group
根據(jù)軸承故障發(fā)生的位置,可以將軸承的故障類型分為內(nèi)圈故障,外圈故障,滾子故障以及混合故障。軸承的振動具有周期性特征,當經(jīng)過損傷部位時表現(xiàn)出周期性的沖擊。只同軸承材料、結(jié)構(gòu)、制造情況等有關(guān)的頻率稱為固有頻率。出現(xiàn)損傷時由于損傷部位的沖擊造成的頻率稱為故障頻率,在頻譜圖中表現(xiàn)為故障頻率的倍頻出現(xiàn)[21]。如表1 所示,根據(jù)軸承的尺寸可計算出軸承轉(zhuǎn)頻與故障頻率的關(guān)系。對樣本信號進行快速傅里葉變化,選取軸承2 倍頻到4 倍頻之間特征頻率范圍內(nèi)幅值的最大值作為特征向量使用SVM 和AFSA-SVM 進行分類測試,結(jié)果如表2 實驗組1,2所示。
表1 軸承故障頻率Table 1 Bearing failure frequency
表2 改進方法前后對比Table 2 Improvement and comparison for improvement methods
基于EMD 以及SVM 的軸承故障識別方法中,較成熟的識別方法為使用EMD 對原始信號進行分解,提取IMF 分量的能量熵作為分類的特征向量。基于網(wǎng)格搜索進行SVM 的參數(shù)尋優(yōu),實現(xiàn)軸承的故障診斷。此方法在凱特西儲大學軸承故障數(shù)據(jù)當中表現(xiàn)出較優(yōu)的效果,但在噪聲較大以及故障類別復雜的數(shù)據(jù)分類當中泛化能力不高,如表2所示,基于軸承故障頻率范圍提取特征的方法準確率在80%以上,使用ASFA-SVM 時識別準確率相較于SVM 有所提高,但相較于本文所提出的特征工程方案,準確率下降了3%左右,且當訓練組多于測試組時出現(xiàn)過學習現(xiàn)象。實驗組3的數(shù)據(jù)組為使用EMD 對數(shù)據(jù)進行分解重構(gòu),構(gòu)成特征向量未進行歸一化處理輸入SVM 進行分類訓練和測試。實驗組4 在1 組數(shù)據(jù)基礎(chǔ)下進行了歸一化處理。實驗組5 則為本文方法。在7 種比例的分類識別實驗中,由于數(shù)據(jù)的數(shù)量級差別很大所以是否歸一化對識別準確度有很明顯的影響。EMD-SVM 的識別效果相較于本章方法準確率較低,但基本在90%以上,一方面因為實驗室數(shù)據(jù)噪聲較小,且認為破壞得到的軸承故障特征比較明顯,數(shù)據(jù)質(zhì)量較高。另一方面,基于故障振動特點選取的特征向量,有較好的表征能力。從分類速度來看,為尋得較優(yōu)參數(shù)需擴大網(wǎng)格搜索范圍縮小步長,因此在達到90% 以上準確率的基礎(chǔ)下,EMD-SVM 方法的尋優(yōu)時間在100 s 以上,而CEEMD-AFSASVM 的尋優(yōu)時間在20~30 s 之間,極大的提高了識別效率。
將所提出的方法同在分類任務中表現(xiàn)較好的網(wǎng)絡對比,如表3所示。深度網(wǎng)絡利用卷積層代替人為的特征工程,雖然能夠節(jié)約人工篩選的時間且保證較高的識別精度,但是在工程實際應用中,一個好的特征工程,往往要比深度網(wǎng)絡更合適。由表3 可以看出雖然CNN,ResNet18 等深度網(wǎng)絡可以達到98%以上的準確率,但是對于變化比例的測試組識別結(jié)果不穩(wěn)定,CEEMD-AFSF-SVM 的效果更佳,識別準確率能夠穩(wěn)定保持在99%以上。
表3 同深度學習網(wǎng)絡的對比Table 3 Comparison with deep learning networks
在上述任務中中,使用的數(shù)據(jù)集是標簽量一致的平衡數(shù)據(jù)。但在實際中用于模型訓練的數(shù)據(jù)集多為不平衡數(shù)據(jù)集。在有監(jiān)督分類器中,標簽數(shù)量多少直接影響其學習結(jié)果,當使用SVM 對不平衡數(shù)據(jù)進行分類時,其對于數(shù)據(jù)量較大的標簽更加敏感,這將對識別精度產(chǎn)生影響。
在解決不平衡數(shù)據(jù)集分類問題時,常從2個方面入手,一是對數(shù)據(jù)集進行欠采樣或者過采樣處理,得到平衡數(shù)據(jù)集。二是對算法進行改進,通過提高算法對于小樣本數(shù)據(jù)集的學習能力,提高識別準確率。3.2 節(jié)驗證了所提出的故障識別方法對于小樣本集有理想的識別效果。可以認為改進的軸承故障識別方法在面臨不平衡數(shù)據(jù)集時,能夠克服樣本較豐富類別對于分類器靈敏度的影響。為驗證其對于不平衡數(shù)據(jù)集的識別效果,從實驗2故障特征向量集中以1∶9,2∶8,3∶7,4∶6,5∶5的比例從各個狀態(tài)中提取訓練集進行軸承不平衡數(shù)據(jù)集的訓練及分類測試。
如圖14 所示,5 種提取比例在軸承5 種狀態(tài)中進行排列組合,一共進行120 組識別訓練和測試。用于驗證模型識別準確率的樣本量為250組。改進SVM 的軸承故障識別方案在不平衡數(shù)據(jù)分類測試中,識別準確率最高可達100%(250/250),最低為98.4%(245/250),平均準確率為99.3%。在使用BP網(wǎng)絡以及KNN 實現(xiàn)不平衡故障分類實驗中(圖15),各個故障狀態(tài)數(shù)據(jù)比例影響了分類器的穩(wěn)定性,準確率低于CEEMD-AFSA-SVM 軸承故障識別方法,驗證了該方法在不平衡數(shù)據(jù)識別中的有效性和穩(wěn)定性。
圖14 不平衡數(shù)據(jù)集識別準確率Fig.14 Identification accuracy of unbalanced data sets
圖15 不平衡數(shù)據(jù)集識別準確率Fig.15 Identification accuracy of unbalanced datasets
1) 采用CEEMD分解原始信號,對IMF分量篩選重構(gòu)后提取5 個維度的數(shù)據(jù)構(gòu)成故障特征向量,降低了軸承故障特征向量集的計算難度,同時兼具了對軸承故障表征的敏感性和穩(wěn)定性。
2) 在工程實際應用中軸承故障往往并不是單一的,在進行故障軸承仿真實驗時增加了復合故障軸承,提出的提取特征向量方法對于區(qū)別復合故障以及其余3種單一故障和正常狀態(tài)達到了理想效果。
3) 經(jīng)過2個試驗臺的軸承故障數(shù)據(jù)對提出的軸承故障診斷方法進行測試,該方法能有效識別多種故障類型,且對于不平衡數(shù)據(jù)集也能達到98.3%以上的識別準確率,對于列車軸承故障識別具有實際應用價值。