張 萍,張文海,趙新賀,吳顯騰,劉 寧
(河北工業(yè)大學人工智能與數(shù)據(jù)科學學院,天津300130)
軸承是旋轉機械關鍵部件之一,發(fā)生故障時易導致機械停產(chǎn)、安全事故等問題的產(chǎn)生[1]。其工作環(huán)境干擾噪聲較多,軸承振動信息所含頻率復雜,使其早期故障特征信息難以提取和診斷[2]。滾動軸承故障診斷是一個模式識別的過程,包含特征提取和故障識別兩部分,能夠準確提取故障信號特征并進行診斷意義重大[3]。因此,本文對滾動軸承振動信號的特征提取和故障診斷方法進行研究,以便提高機械運行的經(jīng)濟性和安全性。
軸承振動信號發(fā)生早期故障時,會產(chǎn)生微弱周期性沖擊信號,但會被噪聲信號淹沒,所以需要對振動信號進行分解處理[4]。變分模態(tài)分解(Variational mode decomposition,VMD)是由Dragomiretskiy 等2014年提出的一種自適應處理信號方法[5]。與傳統(tǒng)經(jīng)驗模態(tài)分解(EMD)分解相比,VMD在端點效應和模態(tài)混疊方面具有很大優(yōu)勢[6]。目前VMD 已在信號特征提取方面得到成功應用,張超等提出采用VMD提取齒輪信號特征,并結合最小二乘支持向量機進行故障診斷[7]。楊秋玉等提出VMD 結合Hilbert邊際譜能量熵對高壓斷路器進行特征提取[8]。VMD 中模態(tài)個數(shù)K和懲罰參數(shù)α 會影響分解效果[9]。對VMD參數(shù)優(yōu)化多用中心頻率觀察法,但該法只能優(yōu)化K值,懲罰參數(shù)α則采取默認值[10]。本文通過分析[K,α]的影響效果,提出采用鯨魚優(yōu)化算法(WOA)優(yōu)化VMD 參數(shù)的方法,并計算IMF 能量熵作為特征向量,從而能更有效提取各頻帶故障特征。
提取信號特征后還需要采用有效的模式識別算法進行故障診斷,支持向量機(SVM)是一種針對小樣本及非線性問題的模式識別方法[11–12]。胡勤等針對SVM 對參數(shù)依賴強的問題,采用遺傳算法優(yōu)化SVM 對機械軸承進行故障診斷[13]。趙春華等針對軸承故障診斷問題,提出采用WOA 優(yōu)化SVM 的診斷方法[14]。鯨魚優(yōu)化算法(Whale Optimization Algorithm,WOA)是Mirjalili等2016年提出的,具有參數(shù)少、收斂快等優(yōu)點[15]。但其種群迭代機制易陷入局部極值,導致精度不高[16]。因此本文將在WOA中引入隨機變異策略,增加種群多樣性,提高全局搜索能力,使分類模型具有更高精度。
綜上,本文在特征提取部分采用WOA-VMD能量熵方法,故障診斷部分采用改進WOA-SVM 模型識別方法。首先采用WOA優(yōu)化VMD參數(shù),將原始信號分解得到IMF 分量,根據(jù)峭度準則對IMF 進行篩選,并計算IMF 能量熵作為特征向量。然后將提取的特征向量應用改進WOA-SVM 模型進行分類。最后,通過不同故障類型的軸承數(shù)據(jù)進行實驗仿真,結果表明,該方法診斷準確率高達99.2%,相比中心頻率觀察法-VMD 與PSO-VMD,準確率提升了10%,證明該方法能夠有效提取特征和診斷故障。
VMD 能夠自適應匹配每種模態(tài)的最佳中心頻率和有限帶寬,實現(xiàn)固有模態(tài)分量(IMF)有效分離,其核心思想是構建和求解變分問題。VMD 將原始信號分解為K個IMF的如下變分模型:
其中:{uk}和{ωk}分別是所有模態(tài)和對應中心頻率集合,δ(t)是狄拉克函數(shù),k為模態(tài)個數(shù),f為原始信號為經(jīng)過Hilbert 變換后uk(t)的頻譜,*為卷積運算,?t為梯度運算。
為求解式(1),引入Lagrange 乘法算子λ,使約束變分問題轉化為非約束變分問題,得到增廣Lagrange表達式為
式中:α是懲罰因子,λ為Lagrange算子,采用交替方向乘子法將原始最小化問題轉化為增廣拉格朗日函數(shù)的鞍點問題。
VMD實現(xiàn)步驟為:
(c)判斷是否滿足終止條件,
式中:ε為判斷精度(ε>0),若不滿足,則返回步驟(b),若滿足,則輸出K個模態(tài)分量。
由VMD分解步驟可知,分解信號前需要設置合適的模態(tài)個數(shù)K和懲罰參數(shù)α,K取值過大會導致過分解,反之,則會欠分解,α取值過大,會造成頻帶信息丟失,反之,會信息冗余,所以需要確定最佳參數(shù)組合[K,α]。目前多用中心頻率觀察法,通過觀察不同K值下的中心頻率確定K值,但該法具有偶然性,且只能確定模態(tài)個數(shù)K,無法確定懲罰參數(shù)α。所以本文提出運用鯨魚優(yōu)化算法(WOA)對VMD參數(shù)進行尋優(yōu),以包絡熵極小值作為適應度函數(shù),包絡熵代表原始信號的稀疏特性,當IMF中噪聲較多,特征信息較少時,則包絡熵值較大,反之,則包絡熵值較小[17]。
信號x(i)(i=1,2,…,N)包絡熵EP可以式(5)表示,式中a(i)是由VMD 分解的k個模態(tài)分量經(jīng)Hilbert 解調(diào)后的包絡信號,ε(i)是通過計算a(i)的歸一化得到的概率分布序列,N為采樣點數(shù),計算概率分布序列ε(i)的熵值即為包絡熵EP。
采用WOA 出發(fā)點是該方法具有尋優(yōu)速度快、全局收斂性強、參數(shù)少等特點。WOA是一種模擬座頭鯨狩獵行為的元啟發(fā)式優(yōu)化算法。如圖1 所示。算法采用螺旋來模擬座頭鯨泡泡網(wǎng)攻擊機制,該機制是座頭鯨的覓食方法,當捕食獵物時,座頭鯨會潛到水下,在獵物周圍制造螺旋狀泡泡網(wǎng),將其逼向泡泡網(wǎng)中心,最后吞掉網(wǎng)集的獵物。
圖1 座頭鯨泡泡網(wǎng)攻擊機制原理圖
算法步驟如下:
(a)鯨魚個體種群、位置、迭代次數(shù)等參數(shù)初始化,第i個個體位置如下:
式中:r∈[0,1]內(nèi)隨機數(shù),Xi的取值范圍為[lb,ub],lb為參數(shù)邊界最小值,ub為參數(shù)邊界最大值。
(b)當p<0.5 且 |A|<1 時,根據(jù)最佳搜索代理進行收縮包圍如式(7)所示:
當p<0.5 且 ||A≥1 時,選擇隨機搜索代理進行迭代更新如式(8)所示,式中為隨機選取鯨魚位置向量。
當p≥0.5 時,采用螺旋收縮方式迭代如式(9)所示:
(c)判斷是否滿足終止條件,即t=tmax(tmax視具體問題迭代精度而定),達到最大迭代次數(shù),且式(7)中收斂因子減小到0。若不滿足,則返回步驟(b),若滿足,則輸出最佳搜索代理。
采用WOA優(yōu)化VMD參數(shù)流程如圖2所示。首先初始化鯨群位置向量[K,α],以包絡熵作為適應度函數(shù),并計算每個鯨魚適應度,然后通過判斷收斂因子大小選擇迭代公式進行迭代更新,直到滿足終止條件,輸出最優(yōu)VMD參數(shù)。
圖2 基于WOA優(yōu)化VMD參數(shù)流程圖
特征向量提取流程如圖3 所示。VMD 利用WOA 尋優(yōu)后的參數(shù)組合[K,α]采用VMD 對原信號分解,得到K個模態(tài)分量,計算每個IMF 峭度值,將其定義為
圖3 特征提取流程圖
式中:μ為信號x的均值,σ為信號x的標準差。
峭度可以反映信號波形尖峰度,由于每個IMF含有沖擊成分不同,則對應峭度值也不同,含有沖擊成分越多的IMF 分量峭度值越大,所含故障信息也越多,正常信號峭度值等于3左右[18]。篩選出峭度值較大IMF,即含瞬時能量變化的IMF,為表示各IMF能量分布情況,計算對應IMF能量熵[H1,H2,…,Hn]作為特征向量,能量熵反映能量分布均勻性,若IMF所含頻率復雜,則表明能量分布混亂,能量熵較大,能量熵定義為
式中:n為模態(tài)個數(shù),Ei為模態(tài)分量的能量,Pi為能量歸一化形式。
WOA 有3 種迭代機制,分別為收縮包圍、螺旋收縮和隨機探索機制。雖然隨機探索會增加種群多樣性,增強全局搜索能力,但執(zhí)行概率小,迭代過程中依然會損失種群多樣性。執(zhí)行收縮包圍和螺旋收縮時,所有個體會根據(jù)當前最優(yōu)代理進行迭代,向最優(yōu)個體移動,易陷入局部極值。
為增加種群多樣性,提高全局搜索能力,將隨機變異策略引入WOA 螺旋收縮中,在螺旋收縮的同時產(chǎn)生變異個體,使收縮包圍和螺旋收縮的局部搜索能力和全局搜索能力更加平衡,如式(12)所示。
式中:t為迭代次數(shù),(t)是當前最優(yōu)解位置向量,(t)是當前解位置向量是鯨群與獵物之間距離,b為螺線常數(shù),l為(-1,1)之間隨機數(shù)為隨機選取鯨魚位置向量,r為[0,1]之間隨機數(shù)。
采用種群分布的標準差來衡量種群多樣性,如圖4 所示。迭代初期,WOA 與改進WOA 的種群分布都很豐富,隨著迭代次數(shù)增加,種群向最優(yōu)解移動,使得WOA 與改進WOA 種群多樣性都下降,但改進WOA的種群多樣性顯著優(yōu)于WOA。
圖4 WOA與改進WOA種群多樣化對比圖
SVM中有兩個重要參數(shù),懲罰參數(shù)C和核函數(shù)參數(shù)g,C決定支持向量到超平面的距離,C越大代表距離越小,對樣本分類錯誤容忍度越低,準確度越高,但易造成過擬合,使泛化能力降低。反之,泛化能力強,但易造成欠擬合。核函數(shù)參數(shù)g越大,低維樣本向高維空間映射維度越高,分類效果好,但會使模型復雜,易造成過擬合,反之,易造成欠擬合。
為優(yōu)化SVM參數(shù),采用改進WOA對參數(shù)尋優(yōu),改進WOA-SVM的診斷流程如圖5所示。首先初始化鯨群位置向量[c,g],根據(jù)每個鯨魚位置向量采用SVM分別對訓練集進行訓練,根據(jù)K-折交叉驗證法得到驗證集平均準確率,以平均準確率作為適應度函數(shù),記錄最優(yōu)個體位置。通過判斷WOA 收斂因子選擇迭代公式,對SVM 參數(shù)進行迭代更新,直到滿足終止條件,輸出最優(yōu)SVM 參數(shù)。最后,利用最優(yōu)參數(shù)采用SVM對測試集進行分類。
圖5 基于改進WOA-SVM的診斷流程圖
為驗證本文提出的基于WOA-VMD 能量熵特征提取和改進WOA-SVM 故障識別方法的有效性,采用美國凱斯西儲大學軸承數(shù)據(jù)(CWRU)進行仿真實驗,此數(shù)據(jù)對全球學者開放,數(shù)據(jù)特征明顯,常用于軸承數(shù)據(jù)研究[19–20]。實驗平臺由電動機、扭矩傳感器、功率測試計、電子控制器組成,故障設置采用電火花單點損傷,使用加速度傳感器采集振動加速度信號,采樣頻率分為12 kHz和48 kHz。
選用轉速為1 750 r/min、采樣頻率為12 kHz 的驅動端軸承數(shù)據(jù),其中包括正常數(shù)據(jù)、內(nèi)圈、外圈、滾動體故障4 種數(shù)據(jù),對每種數(shù)據(jù)采取100 個樣本,每個樣本長度為1 024。為驗證VMD中模態(tài)個數(shù)K和懲罰參數(shù)α對SVM分類結果的影響,以驅動端滾動體損傷直徑為0.355 6 mm和0.533 4 mm時的兩種數(shù)據(jù)為例,模態(tài)個數(shù)K∈[2,10],K取整數(shù),懲罰參數(shù)α∈[200,4 000],仿真結果如圖6所示。
圖6 VMD參數(shù)選擇結果
由圖6 可知,根據(jù)不同組合[K,α]所提取數(shù)據(jù)集對SVM分類結果影響不同,在此基礎上,采用WOA對VMD 參數(shù)進行尋優(yōu)。設置鯨魚個體為30,最大迭代次數(shù)tmax=200,K取值范圍為[2,10],且為整數(shù),懲罰參數(shù)α取值范圍為[200,4 000],為提高精確度,尋優(yōu)10組最優(yōu)參數(shù)求其平均值,采用WOA-VMD對4種數(shù)據(jù)尋優(yōu),最優(yōu)參數(shù)如表1所示。
表1 最優(yōu)VMD參數(shù)
以滾動體故障數(shù)據(jù)為例,VMD中模態(tài)個數(shù)K為7,懲罰參數(shù)α為1 469.4,噪聲容限τ和判斷精度?對分解影響較小,采取默認值τ=0和?=1.0×10-7,圖7為滾動體故障信號經(jīng)VMD分解后的模態(tài)分量時域圖,圖8為模態(tài)分量頻譜圖。
圖7 滾動體故障信號VMD時域圖
由圖8 可知各IMF 中心頻率相互獨立,能夠有效避免模態(tài)混疊問題,且VMD與遞歸式模態(tài)分解不同,即沒有采用極值包絡線遞歸方式求取IMF,邊界效應問題遠弱于遞歸式模態(tài)分解,采用該方法能夠得到較單純模態(tài)分量。
圖8 滾動體故障信號VMD頻譜圖
當發(fā)生故障時,不同的模態(tài)分量會含有不同的沖擊成分。為查看每個模態(tài)分量含有故障信息情況,計算每個IMF分量的峭度值,正常信號的峭度值等于3 左右,由圖9 可知IMF3~IMF7含較豐富的故障信息,即含有較多的沖擊成分,經(jīng)過峭度值篩選,分別計算其模態(tài)分量的能量熵并組成特征向量,用作故障診斷的輸入數(shù)據(jù)。
圖9 IMF峭度值
采用WOA-VMD 提取軸承數(shù)據(jù)特征,如表2 所示,正常數(shù)據(jù)、內(nèi)圈、外圈、滾動體等故障數(shù)據(jù)的特征向量為[H1,H2,H3,H4,H5],對應標簽分別為1、2、3、4,各100個樣本,共400個樣本。
表2 4種數(shù)據(jù)特征向量
為驗證WOA 對VMD 參數(shù)尋優(yōu)的有效性,分別采用中心頻率觀察法-VMD、PSO-VMD、WOAVMD進行對比。采用中心頻率觀察法-VMD方法,以外圈故障信號為例,可得不同K值對應的外圈故障信號中心頻率見表3。中心頻率觀察法用于優(yōu)化VMD 參數(shù)K,當出現(xiàn)較接近中心頻率,則認為出現(xiàn)過分解[21]。由表3 可知,當模態(tài)個數(shù)K=5 時,出現(xiàn)較接近中心頻率,即3 361.0 Hz 和3 552.9 Hz,出現(xiàn)過分解,因此K=4。但此方法只能優(yōu)化模態(tài)個數(shù)K,懲罰參數(shù)α等于標準VMD 中默認值α=2 000[22]。所以采用中心頻率觀察法所確定4種數(shù)據(jù)最優(yōu)參數(shù)組合如表4所示。
表3 外圈信號中心頻率
采用PSO 對VMD 參數(shù)尋優(yōu)中,設置粒子群個體為30,迭代次數(shù)為200,模態(tài)個數(shù)K取值范圍為[2,10],且為整數(shù),懲罰參數(shù)取值范圍為[200,4 000],基于PSO-VMD 對4 種數(shù)據(jù)尋優(yōu),最優(yōu)參數(shù)如表4所示。
表4 VMD參數(shù)優(yōu)化結果
將觀察法-VMD、PSO-VMD、WOA-VMD 3 種方法提取的特征向量分別輸入同一個診斷模型中,且該診斷模型中采取同樣參數(shù)進行診斷,診斷模型采用改進WOA-SVM 時,鯨魚種群為30 個,最大迭代次數(shù)tmax=200 次,數(shù)據(jù)共400 組,每種故障100 組,70組用于SVM訓練,30組用于SVM測試,K折交叉驗證中取K=5,仿真結果如圖10至圖12所示。圖10為基于中心頻率觀察法優(yōu)化VMD診斷適應度曲線,圖11 為基于PSO 優(yōu)化VMD 診斷適應度曲線,圖12為基于WOA 優(yōu)化VMD 診斷適應度曲線,3 種方法對比如表5所示。
圖10 基于中心頻率觀察法優(yōu)化VMD診斷適應度曲線
圖11 基于PSO優(yōu)化VMD診斷適應度曲線
圖12 基于WOA優(yōu)化VMD診斷適應度曲線
平均準確率是指K折交叉驗證下,將訓練集分為K組,將每個子集分別作為一次驗證集,將K個驗證集分類準確率的平均數(shù)作為平均準確率,準確率是指測試集在已經(jīng)訓練好的模型上的分類準確率。由表5 可以看出基于觀察法-VMD、PSO-VMD 提取的數(shù)據(jù)集經(jīng)診斷后平均準確率分別為90.714 3%、92.857 1 %,準確率均為89.166 7 %,而基于WOAVMD 提取的數(shù)據(jù)集經(jīng)診斷后平均準確率為95.714 3%,準確率達99.166 7%,相比其他兩種方法,準確率提高10%。由此通過實驗驗證基于WOA-VMD特征提取能夠更有效提取特征向量,從而提高診斷準確率。
表5 基于WOA-VMD特征提取
為驗證基于改進WOA-SVM 的診斷模型具有更好的故障診斷能力,采用WOA-VMD 提取4 種軸承數(shù)據(jù)的特征向量,作為輸入數(shù)據(jù)分別輸入到WOA-SVM、PSO-SVM、改進WOA-SVM 模型中進行故障識別,且3種模型中的種群參數(shù)均為30,最大迭代次數(shù)為200 次,SVM 懲罰參數(shù)C尋優(yōu)范圍為[0.01,100],核函數(shù)參數(shù)g尋優(yōu)范圍為[0.01,100],訓練數(shù)據(jù)為280 組,測試數(shù)據(jù)為120 組,K折交叉驗證中取K=5,最后將3種模型分類結果進行對比分析如表6 所示。WOA-SVM、PSO-SVM、改進WOASVM3種分類模型測試集預測結果對比圖分別如圖13至圖15所示。
圖13 WOA-SVM預測結果對比圖
圖14 PSO-SVM預測結果對比圖
圖15 改進WOA-SVM預測結果對比圖
由表6 可看出3 種分類模型平均準確率都可達到95.71%,且尋優(yōu)時間接近,但改進WOA-SVM 模型對于測試集分類準確率達99.166 7%,相比WOASVM模型準確率提高2.5%,相比PSO-SVM模型準確率提高0.8%。經(jīng)對比實驗驗證,改進WOA-SVM分類模型的泛化能力更好,識別準確率更高,該方法在故障診斷中具有有效性。
表6 基于改進WOA-SVM模式識別
(1)本文提出了基于WOA-VMD能量熵的特征提取方法,并利用改進WOA-SVM 進行故障識別。通過WOA 對VMD 中模態(tài)個數(shù)K和懲罰參數(shù)α尋優(yōu),以IMF包絡熵為適應度函數(shù),根據(jù)峭度準則篩選分解后的IMF,進一步提取能量熵作為特征向量。通過對比實驗可知,對于相同診斷模型,根據(jù)觀察法-VMD、PSO-VMD、WOA-VMD提取的數(shù)據(jù)集,準確率分別為89.166 7%、89.166 7%、99.166 7%,證明WOA-VMD能夠更有效提取特征向量,從而提高診斷準確率。
(2)基于改進WOA-SVM 的故障識別方法,針對WOA 種群迭代機制易陷入局部極值問題,通過在WOA 螺旋收縮部分中引入隨機變異策略,增強鯨群多樣性,提高全局搜索能力。通過對比可知,WOA-SVM、PSO-SVM、改進WOA-SVM 3 種分類模型,準確率分別為96.666 7 %、98.333 3 %、99.166 7%,證明該故障識別方法具有更好的泛化能力和識別準確率。