戶(hù)文剛,張燕霞
(甘肅交通職業(yè)技術(shù)學(xué)院,蘭州 730070)
滾動(dòng)軸承是離心泵的關(guān)鍵部件,其正常與否決定著離心泵的穩(wěn)定運(yùn)行,有研究統(tǒng)計(jì)數(shù)據(jù)表明30%以上的離心泵故障是軸承故障引起的,因此研究離心泵滾動(dòng)軸承故障診斷方法具有重要意義[1]。離心泵滾動(dòng)軸承運(yùn)行過(guò)程中的振動(dòng)信號(hào)往往包含著豐富的狀態(tài)信息,通過(guò)分析處理滾動(dòng)軸承的振動(dòng)信號(hào)并基于時(shí)域、頻域和時(shí)頻分析提取特征向量,利用提取的特征向量進(jìn)行軸承故障辨識(shí)是廣泛應(yīng)用的故障診斷方法。離心泵滾動(dòng)軸承的振動(dòng)信號(hào)往往表現(xiàn)出非線(xiàn)性、非平穩(wěn)特點(diǎn),并且早期微弱故障信號(hào)易受噪聲干擾而難以提取和識(shí)別,因此,如何有效提取早期微弱故障特征及準(zhǔn)確辨識(shí)故障,對(duì)實(shí)現(xiàn)離心泵運(yùn)行狀態(tài)監(jiān)測(cè)及故障早期預(yù)判等具有重要意義與價(jià)值[2-3]。
傳統(tǒng)的振動(dòng)信號(hào)分析方法如傅里葉變換、小波變換、希爾伯特-黃變換等大多在處理非線(xiàn)性和非平穩(wěn)振動(dòng)信號(hào)時(shí)存在局限性[4-5]。為解決傳統(tǒng)振動(dòng)信號(hào)分析方法的缺陷,Norden等[6]提出經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)方法;Smith[7]提出了局部均值分解(Local Mean Decomposition,LMD)方法;Wu等[8]在EMD的基礎(chǔ)上提出了集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)方法;Gilles[9]提出經(jīng)驗(yàn)小波變換(Empirical wavelet transform,EWT)。它們都可以自適應(yīng)非線(xiàn)性和非平穩(wěn)振動(dòng)信號(hào)處理,但是仍存在一定的缺陷,其中EMD算法存在模態(tài)混疊現(xiàn)象、邊界效應(yīng)、對(duì)噪聲敏感、依賴(lài)插值方法選擇等問(wèn)題,LMD有計(jì)算量大、平滑次數(shù)最優(yōu)確定等問(wèn)題,EEMD在中低頻存在模態(tài)混疊現(xiàn)象,EWT在面對(duì)復(fù)雜頻譜是存在過(guò)切分問(wèn)題。Dragomiretskiy等[10-12]提出變分模態(tài)分解(Variational Modal Decomposition,VMD)方法,變分模態(tài)分解是近些年廣泛應(yīng)用的一種新的自適應(yīng)信號(hào)分解方法,它從低到高排序信號(hào)頻率,自適應(yīng)分解成多個(gè)模態(tài)分量(IMF),在處理非線(xiàn)性、非平穩(wěn)信號(hào)能取得理想的效果。該方法克服了EMD等方法模態(tài)混疊現(xiàn)象、噪聲敏感,同時(shí)避免了遞歸模型的缺陷。
傳統(tǒng)的故障識(shí)別方法主要有k近鄰分類(lèi)器(K-nearest Neighbor Classification,KNN)[13]、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)[14]、支持向量機(jī)(Support Vector Machine,SVM)[15]。這些方法在故障診斷方面應(yīng)用頗多,KNN簡(jiǎn)單、易懂,在處理分類(lèi)問(wèn)題時(shí)對(duì)異常值不敏感,分類(lèi)準(zhǔn)確度高,但是KNN無(wú)法給出數(shù)據(jù)的內(nèi)在含義,同時(shí)計(jì)算復(fù)雜度高,無(wú)法處理樣本不平衡問(wèn)題。ANN具有較強(qiáng)的自學(xué)能力與泛化能力、較好的適應(yīng)性、能很好的非線(xiàn)性逼近等優(yōu)點(diǎn),但是ANN也存在參數(shù)多及優(yōu)化難、學(xué)習(xí)時(shí)間過(guò)長(zhǎng)等缺點(diǎn)。SVM作為比較經(jīng)典的分類(lèi)算法,克服了ANN學(xué)習(xí)速度慢和過(guò)擬合的問(wèn)題,但也存在面對(duì)大樣本數(shù)據(jù)時(shí)處理能力不足以及解決多分類(lèi)問(wèn)題時(shí)分類(lèi)精度較低等缺陷。隨機(jī)森林(Random Forests,RF)[16-17]是比較經(jīng)典的集成學(xué)習(xí)算法,其將隨機(jī)性引入決策樹(shù),改善了決策樹(shù)易過(guò)擬合的問(wèn)題,并具有較強(qiáng)的抗噪聲能力,能夠解決ANN繁瑣的參數(shù)尋優(yōu)過(guò)程、收斂速度過(guò)慢問(wèn)題,同時(shí)解決了SVM在面對(duì)大樣本數(shù)據(jù)時(shí)處理能力不足與分類(lèi)精度低的缺點(diǎn)?;谏鲜龇治?,本文將變分模態(tài)分解(Variational Modal Decomposition,VMD)方法與隨機(jī)森林(Random Forests,RF)相結(jié)合,提出基于基于VMD和隨機(jī)森林的離心泵滾動(dòng)軸承故障診斷。RF不需要繁瑣的參數(shù)尋優(yōu)過(guò)程和最優(yōu)的特征向量選擇。
變分模態(tài)分解(Variational Modal Decomposition,VMD)[8]是Dragomiretskiy和Zosso于2014年提出的一種新的非線(xiàn)性非平穩(wěn)信號(hào)自適應(yīng)分解計(jì)算方法,VMD方法通過(guò)預(yù)設(shè)分解個(gè)數(shù)K值,尋找變分模型最優(yōu)解確定各模態(tài)分量相關(guān)中心頻率和帶寬帶,自適應(yīng)將原始信號(hào)分成K個(gè)模態(tài)分量(Intrinsic Modal Function,IMF)。假定一原始信號(hào)x(t),通過(guò)VMD分解為K個(gè)離散模態(tài)分量uk(t),k=1,2,…,K。算法的具體步驟如下:
(1)對(duì)每一個(gè)模態(tài)分量uk(t)應(yīng)用Hilbert變換獲取其單邊譜:
式中:δ(t)為脈沖函數(shù)。
(2)將每個(gè)模態(tài)分量uk(t)頻譜轉(zhuǎn)移到到相應(yīng)基頻帶:
式中:wk為uk(t)的中心頻率。
(3)通過(guò)對(duì)各模態(tài)分量uk(t)解調(diào)信號(hào)的高斯平滑方式估算各模態(tài)分量的帶寬,構(gòu)造約束變分模型:
式中:?t表示對(duì)t求偏導(dǎo),表示L2范數(shù)。
為了求解上述變分問(wèn)題,引入懲罰因子α和拉格朗日乘法算子λ,從而將約束問(wèn)題轉(zhuǎn)變?yōu)闊o(wú)約束的問(wèn)題,得到擴(kuò)展的Lagrange表達(dá)式為:
式中:ε為求解精度。
求解過(guò)程中的單個(gè)變量更新表達(dá)式如下:
式中:n為正整數(shù);∧為傅里葉變換;τ為保真系數(shù)或者噪聲容限參數(shù)。
根據(jù)實(shí)際信號(hào)的頻域特性進(jìn)行信號(hào)頻帶的自適應(yīng)分割,原始信號(hào)被分解成K個(gè)有限帶寬值的IMF分量。變分模態(tài)分解具體分解流程如圖1所示。
圖1 變分模態(tài)分解流程Fig.1 Flow chart of variational modal decomposition
隨機(jī)森林(Random Forest,RF)是Leo Breiman等在決策樹(shù)的基礎(chǔ)上提出的一種組合分類(lèi)器,通過(guò)引入隨機(jī)屬性選擇,由多個(gè)決策樹(shù)的投票來(lái)決定最終的分類(lèi)結(jié)果,相比單個(gè)分類(lèi)器有更高的分類(lèi)結(jié)果,可以有效地提升學(xué)習(xí)系統(tǒng)的泛化能力。
給定數(shù)據(jù)集D={Xi,Yi},Xi∈Rk,Yi∈{1,2,…,c},由多個(gè)決策樹(shù){h( )x,θm,m=1,2,…,M}組成森林,隨機(jī)森林的基決策樹(shù)在輸入樣本x情況下給出各自的分類(lèi)結(jié)果,最后利用投票方式輸出最終的分類(lèi)結(jié)果。隨機(jī)森林算法步驟如下。
(1)從原始數(shù)據(jù)集中利用bootstrap重采樣方法隨機(jī)抽取n個(gè)樣本組成單決策樹(shù)的訓(xùn)練集,其大小約為原始數(shù)據(jù)集的2∕3,依次為每一個(gè)bootstrap訓(xùn)練集訓(xùn)練組建分類(lèi)數(shù),共產(chǎn)生n棵決策樹(shù)構(gòu)成一片“森林”,這些決策樹(shù)均不進(jìn)行剪枝。
(2)隨機(jī)森林自上而下從單棵決策樹(shù)的根節(jié)點(diǎn)開(kāi)始遞歸分裂。定義訓(xùn)練樣本的輸入特征個(gè)數(shù)為M,在每個(gè)節(jié)點(diǎn)上進(jìn)行分裂時(shí),從M個(gè)特征向量里隨機(jī)(無(wú)放回)選擇m(m保持不變)個(gè)特征向量,然后按照分裂節(jié)點(diǎn)不純度最小的原則從上述特征中挑選出一個(gè)最好的特征進(jìn)行分裂生長(zhǎng),重復(fù)上述過(guò)程依次分裂直至該決策樹(shù)遍歷所有的特征屬性。
(3)在分類(lèi)階段,集合n棵決策樹(shù)的分類(lèi)結(jié)果,利用投票決策最終的類(lèi)別。
隨機(jī)森林的分類(lèi)原理降低了數(shù)之間的相關(guān)性,保證了因模型輸入數(shù)據(jù)維數(shù)上升過(guò)高情況下,仍能獲得良好的分類(lèi)效果。分類(lèi)過(guò)程如圖2所示。
圖2 隨機(jī)森林分類(lèi)過(guò)程Fig.2 Randomforest classification process
基于VMD和隨機(jī)森林的離心泵滾動(dòng)軸承故障辨識(shí)具體實(shí)現(xiàn)步驟如下:
(1)從待測(cè)設(shè)備采集振動(dòng)信號(hào)并進(jìn)行VMD分解,得到K個(gè)模態(tài)分量IMF;
(2)基于模態(tài)分量IMF,提取如表1所示時(shí)域和頻域方面特征指標(biāo),構(gòu)建原始信號(hào)特征向量集;
表1 各通道故障特征參數(shù)Tab.1 Fault characteristic parametersof each channel
(3)將構(gòu)建的原始信號(hào)特征集輸入RF中進(jìn)行訓(xùn)練學(xué)習(xí);
(4)將測(cè)試集輸入到RF分類(lèi)器中進(jìn)行模式識(shí)別,得到測(cè)試數(shù)據(jù)的故障分類(lèi)診斷結(jié)果。
基于VMD和隨機(jī)森林的離心泵滾動(dòng)軸承故障診斷的基本流程如圖3所示。
圖3 故障診斷流程Fig.3 Fault diagnosis flowchart
本文采用如圖4所示某型號(hào)離心泵作為試驗(yàn)對(duì)象進(jìn)行故障診斷試驗(yàn)驗(yàn)證。通過(guò)振動(dòng)傳感器采集驅(qū)動(dòng)端軸承振動(dòng)數(shù)據(jù),設(shè)定電機(jī)轉(zhuǎn)速2 600 r∕min,采樣頻率為6 kHz,通過(guò)振動(dòng)加速度傳感器分別采集滾動(dòng)軸承正常狀態(tài)、內(nèi)環(huán)裂紋、外環(huán)裂紋、滾動(dòng)體損壞4種狀態(tài)下的振動(dòng)信號(hào),其中軸承故障由電火花加工技術(shù)而成,如圖5所示。
圖4 離心式化工泵故障模擬實(shí)驗(yàn)臺(tái)Fig.4 Centrifugal chemical pump fault simulation test bench
圖5 故障軸承Fig.5 Faulty bearing
為了更完整表征滾動(dòng)軸承故障狀態(tài),采集各狀態(tài)信號(hào)各60組,以其中的40組作為訓(xùn)練樣本,20組作為測(cè)試樣本。滾動(dòng)軸承幾種狀態(tài)的原始振動(dòng)信號(hào)波形圖如圖6所示。
圖6 滾動(dòng)軸承在不同狀態(tài)下的振動(dòng)信號(hào)Fig.6 Vibration signalsof rollingbearingsin different states
選擇內(nèi)圈故障信號(hào)進(jìn)行VMD分解,分解結(jié)果如圖7所示。根據(jù)文獻(xiàn)[12],設(shè)定K=7。由圖可知,原始振動(dòng)信號(hào)被分解成7個(gè)IMG分量。基于表1提取各IMF分量特征向量,構(gòu)建原始信號(hào)特征向量集,即提取此狀態(tài)下第一組信號(hào)經(jīng)VMD分解的特征向量,得到7×14=98個(gè)特征向量,同理提取其他狀態(tài)的98個(gè)特征向量。最后得到一個(gè)維數(shù)為1 680×14的特征向量矩陣。
圖7 內(nèi)圈故障樣本的VMD分解結(jié)果Fig.7 VMDdecomposition resultsof inner ringfault samples
將得到的1 680×7特征向量矩陣隨機(jī)抽取各故障模式數(shù)據(jù)組成比例為(1 120,560)的訓(xùn)練集與測(cè)試集,利用訓(xùn)練集訓(xùn)練RF模型,在RF訓(xùn)練完成后,通過(guò)測(cè)試集驗(yàn)證模型分類(lèi)的精度,如表2所示。由表可知,每種故障狀態(tài)的分類(lèi)識(shí)別正確率都比較高,平均分類(lèi)準(zhǔn)確率達(dá)到了97.96%,因此表明基于VMD-RF的故障辨識(shí)是可行的且有效的。
表2 各故障狀態(tài)的識(shí)別準(zhǔn)確率Tab.2 Recognition accuracy rateof each fault state
為了進(jìn)一步驗(yàn)證所提方法的優(yōu)越性,分別建立VMD-RF、VMD-BP和VMD-SVM模型并分類(lèi)。3種模型的分類(lèi)結(jié)果如表3所示。結(jié)果表明,3類(lèi)模型中VMD-RF分類(lèi)的準(zhǔn)確率最高,而VMD-BP分類(lèi)誤差最大,VMDSVM介于兩者之間。由此可以看出VMD分解提取的信號(hào)特征有效地表征了原始信號(hào)的信息,同時(shí)說(shuō)明VMD-RF模型在滾動(dòng)軸承故障識(shí)別方面要優(yōu)于傳統(tǒng)的BP和SVM,驗(yàn)證了本文所提方法具有一定的可行性。
表3 各分類(lèi)模型的識(shí)別準(zhǔn)確率Tab.3 Recognition accuracy rate of each classification model
故障診斷的本質(zhì)是模式識(shí)別,為了更直觀地表達(dá)故障類(lèi)型的分類(lèi)效果,將各分類(lèi)方法的可視化三維分類(lèi)結(jié)果繪制成如圖8所示的散點(diǎn)圖。從圖8中可以很直觀地看出,基于VMD-RF的滾動(dòng)軸承不同故障模式的特征具有很好的可分性,分類(lèi)效果很理想,而其他組合方法VMD-BP和VMD-SVM幾類(lèi)故障模式有一定的重疊。
圖8 各分類(lèi)方法的三維可視化分類(lèi)結(jié)果Fig.8 Three-dimensional visual classification results of each classification method
為解決離心泵滾動(dòng)軸承的故障診斷問(wèn)題,本文將變分模態(tài)分解與隨機(jī)森林相結(jié)合,提出了基于VMD和隨機(jī)森林的離心泵滾動(dòng)軸承故障診斷方法。首先對(duì)滾動(dòng)軸承振動(dòng)信號(hào)進(jìn)行VMD分解得到K個(gè)IMF分量;然后基于時(shí)頻域指標(biāo)構(gòu)建各IMF分量的特征向量,以此作為隨機(jī)森林分類(lèi)的依據(jù);最后利用離心泵軸承數(shù)據(jù)對(duì)該方法進(jìn)行了可行性驗(yàn)證,結(jié)果表明所提方法可以有效對(duì)滾動(dòng)軸承故障類(lèi)型進(jìn)行識(shí)別分類(lèi),與BP和SVM傳統(tǒng)分類(lèi)方法相比,本文提出的VMD與隨機(jī)森林結(jié)合的方法具有更高的分類(lèi)準(zhǔn)確率,為滾動(dòng)軸承故障診斷提供了新的思路。