葉震,李琨
(昆明理工大學(xué)信息工程與自動(dòng)化學(xué)院,云南昆明 650500)
滾動(dòng)軸承由于其運(yùn)行環(huán)境常處于高速、高載、高溫狀態(tài)下,導(dǎo)致各種故障頻發(fā)。對(duì)于軸承振動(dòng)信號(hào)非平穩(wěn)、非線性特性,如何更豐富、更全面地提取出信號(hào)中的深層故障信息顯得尤為重要。熵值是提取特征信息的方法之一,被廣泛應(yīng)用于各種模式識(shí)別中,如樣本熵[1]、近似熵[2]、模糊熵[3]和散布熵[4-5]等。但上述方法僅從單一尺度對(duì)時(shí)間序列復(fù)雜程度進(jìn)行刻畫(huà)。而針對(duì)機(jī)械系統(tǒng)故障診斷問(wèn)題,振動(dòng)信號(hào)往往過(guò)于復(fù)雜,此時(shí)單一地對(duì)它進(jìn)行信號(hào)特征提取存在著信息表達(dá)不足、無(wú)法全面概括不同故障類型特征信息的問(wèn)題,從而無(wú)法準(zhǔn)確診斷機(jī)械系統(tǒng)故障。同時(shí),散布熵值的求解局限于待求解時(shí)間序列的信號(hào)特征,有必要在單一尺度散布熵的基礎(chǔ)上,對(duì)振動(dòng)信號(hào)進(jìn)行深層次故障信息提取。因此,本文作者提出模糊信息?;?散布熵(Fuzzy Information Granulation-Dispersion Entropy,FIG-DE)的方法,從多個(gè)尺度有效提取軸承振動(dòng)信號(hào)的故障信息。
在信號(hào)故障特征提取的基礎(chǔ)上,選擇合適的診斷模型也尤為重要。支持向量機(jī)(Support Vector Machine,SVM)適用于處理小樣本和非線性問(wèn)題,憑借其學(xué)習(xí)效率高及泛化性能好等優(yōu)點(diǎn),已經(jīng)廣泛應(yīng)用于故障診斷、模式識(shí)別等眾多領(lǐng)域。但其懲罰系數(shù)c和核函數(shù)參數(shù)g的取值影響算法的分類性能。張小龍等[6]利用粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法搜索出SVM的最優(yōu)參數(shù),有效提高了滾動(dòng)軸承的分類準(zhǔn)確率。戚曉利等[7]利用灰狼優(yōu)化算法優(yōu)化SVM,在行星齒輪故障診斷上取得了較好的效果。但這些方法優(yōu)化效率低,迭代時(shí)間較長(zhǎng)且診斷精度不高。麻雀搜索算法(Sparrow Search Algorithm,SSA)是在2020年提出的一種優(yōu)化算法。SSA算法在搜索精度、收斂速度、穩(wěn)定性和避免局部最優(yōu)值方面均優(yōu)于現(xiàn)有算法[8]。
基于此,本文作者利用模糊信息?;瘜?duì)軸承振動(dòng)信號(hào)進(jìn)行?;幚恚玫絝Low、fR、fUp3個(gè)尺度下的模糊信息粒,對(duì)3組信號(hào)從3個(gè)尺度下分別求取散布熵并作為特征向量輸入,由麻雀搜索算法(SSA)優(yōu)化的SVM模型,實(shí)現(xiàn)滾動(dòng)軸承的故障診斷識(shí)別。
美國(guó)數(shù)學(xué)家ZADEH[9]教授提出的信息?;?Information Granulation,IG)的概念,就是將一個(gè)整體時(shí)間序列多尺度?;癁橐粋€(gè)個(gè)的部分進(jìn)行分析研究。對(duì)于軸承振動(dòng)信號(hào)而言,可以根據(jù)故障信息特點(diǎn)把信號(hào)劃分為若干個(gè)信息粒來(lái)提取信號(hào)特征。關(guān)于模糊信息粒化方法,給出了數(shù)據(jù)粒的一種命題描述:
(1)
式中:x為論域U中取值的變量;G為U的凸模糊子集,由隸屬函數(shù)μ刻畫(huà);λ為可能性的概率。一般定義U為實(shí)數(shù)集合R(Rn),λ為位區(qū)間的模糊子集。
模糊信息?;褪且阅:问奖硎拘畔⒘?含?;翱诤托盘?hào)模糊化兩個(gè)部分。粒化窗口指的是將信號(hào)序列分割截取成若干子序列,作為操作窗口;信號(hào)模糊化即為將分割的子序列進(jìn)行模糊化,得到模糊集(模糊信息粒)。
梯形、三角形、高斯型等是常用的模糊粒子,現(xiàn)有關(guān)于FIG應(yīng)用的文獻(xiàn)[10-12]大多采用三角形粒子,因此文中也以三角形模糊粒子作為隸屬函數(shù):
(2)
式中:x表示劃分的?;盘?hào);l、m、n分別表示?;翱趦?nèi)數(shù)據(jù)變化的最小值、大致平均水平和最大值。
散布熵是描述時(shí)間序列復(fù)雜程度的非線性動(dòng)力學(xué)方法。對(duì)于長(zhǎng)度為N的時(shí)間序列x={xi|1≤i≤N},首先使用標(biāo)準(zhǔn)正態(tài)累計(jì)分布函數(shù)將x歸一化為yi= [y1,y2,…,yN],yi∈(0,1)。進(jìn)一步,將y映射到c個(gè)類別:
(3)
對(duì)映射序列zc按如下公式相空間重構(gòu):
(4)
計(jì)算πv0v1…vm-1的概率:
(5)
根據(jù)信息熵理論定義散布熵為
(6)
sDE值越大,時(shí)間序列的不規(guī)則性越高;相反sDE值越小,不規(guī)則性越低。
麻雀搜索算法是在2020年提出的一種新型優(yōu)化算法。SSA算法的尋優(yōu)步驟主要分為3個(gè)部分:
(1)發(fā)現(xiàn)者尋找并引導(dǎo)整個(gè)麻雀種群覓食。
發(fā)現(xiàn)者在每次的迭代過(guò)程中位置按如下公式更新:
(7)
式中:Xi,j為麻雀i在第j維中的位置信息;t為當(dāng)前迭代次數(shù);tmax為最大迭代次數(shù);α∈(0,1]為一個(gè)任意數(shù);Q為服從正態(tài)分布的隨機(jī)數(shù);L為d維列向量,元素均為1;R2∈[0,1]為預(yù)警值;fST∈[0.5,1]為安全值。
(2)追隨者是根據(jù)發(fā)現(xiàn)者所引導(dǎo)的新位置進(jìn)行覓食,在整個(gè)麻雀種群中,發(fā)現(xiàn)者與追隨者的位置是實(shí)時(shí)更新的,只要追隨者找到好的食物就能稱為發(fā)現(xiàn)者,反之成為追隨者,但其數(shù)量比重是不變的。
追隨者在每次的迭代過(guò)程中位置按如下公式更新:
(8)
式中:XP為當(dāng)前發(fā)現(xiàn)者所占據(jù)的最優(yōu)位置;Xworst為當(dāng)前全局適應(yīng)度最差的位置;A∈{0,1}為d列向量,且滿足A+=AT(AAT)-1,其中A+為偽逆矩陣。當(dāng)i>n/2時(shí),表明適應(yīng)度較低的追隨者i無(wú)法獲取食物,需要更新位置尋找食物。
(3)在整個(gè)麻雀種群中,定義警惕者占總數(shù)量的10%~20%,且警惕者的初始位置是在種群中隨機(jī)分布的,當(dāng)警惕者意識(shí)到周圍存在捕食者時(shí),外圍的麻雀將快速地向安全的地方飛行,來(lái)獲取較好的搜索環(huán)境;內(nèi)部的麻雀將在安全的區(qū)域內(nèi)覓食。
警惕者在每次的迭代過(guò)程中位置按如下公式更新:
(9)
式中:Xbest為當(dāng)前全局適應(yīng)度最優(yōu)位置;β為服從正態(tài)分布的隨機(jī)數(shù),起步長(zhǎng)控制的作用;K∈[-1,1],是一個(gè)隨機(jī)數(shù),表示麻雀種群位置移動(dòng)的方向,同時(shí)也起到步長(zhǎng)控制的作用;fi為當(dāng)前個(gè)體的適應(yīng)度值;fg、fw分別為當(dāng)前全局最優(yōu)和最差的適應(yīng)度值;ε為最小的常數(shù)。當(dāng)fi>fg時(shí),外圍麻雀發(fā)現(xiàn)了捕食者;反之區(qū)域內(nèi)的麻雀發(fā)現(xiàn)捕食者。
SVM是一種常用的模式識(shí)別方法,具體理論見(jiàn)文獻(xiàn)[13]。懲罰因子c及核函數(shù)參數(shù)g的取值密切影響著SVM算法的性能,本文作者提出利用SSA算法對(duì)SVM進(jìn)行參數(shù)優(yōu)化,對(duì)最優(yōu)參數(shù)設(shè)置下的SVM模型進(jìn)行故障分類識(shí)別,流程如圖1所示,具體的實(shí)現(xiàn)步驟如下:
(1)獲取滾動(dòng)軸承不同故障程度的振動(dòng)信號(hào)處理后劃分為訓(xùn)練集和測(cè)試集;
(2)SSA參數(shù)初始化。設(shè)置種群規(guī)模、最大迭代次數(shù)N,設(shè)置參數(shù)c和g的取值范圍為[0.01,50],選用高斯核函數(shù);
(3)按照式(7)—(9)更新麻雀的空間位置;
(4)利用適應(yīng)度函數(shù)重新計(jì)算優(yōu)化后各麻雀的個(gè)體適應(yīng)度,更新并保存當(dāng)前種群中最優(yōu)的麻雀?jìng)€(gè)體位置及適應(yīng)度;
(5)若滿足運(yùn)算終止條件,則結(jié)束優(yōu)化,輸出適應(yīng)度最優(yōu)的麻雀?jìng)€(gè)體所對(duì)應(yīng)的位置,即為最優(yōu)參數(shù)c和g,否則繼續(xù)循環(huán)。
圖1 SSA-SVM流程
將信號(hào)模糊信息粒化處理后,得到3組信號(hào)序列fLow、fR、fUp。求取這3組數(shù)據(jù)的散布熵,組成特征向量輸入SSA-SVM模型中,完成滾動(dòng)軸承的故障診斷識(shí)別,診斷流程如圖2所示。具體診斷步驟如下:
(1)選取合適大小的預(yù)設(shè)?;翱趯?duì)原始軸承振動(dòng)信號(hào)進(jìn)行模糊信息粒化,得到fLow、fR、fUp3個(gè)尺度下的?;瘮?shù)據(jù)。
(2)對(duì)3組?;蛄羞M(jìn)行量化處理,設(shè)置DE參數(shù),求取?;?組數(shù)據(jù)的散布值,構(gòu)建特征向量矩陣。
(3)取特征向量的1/2作為訓(xùn)練集對(duì)SSA-SVM模型進(jìn)行訓(xùn)練,再利用訓(xùn)練完成的SSA-SVM模型對(duì)剩余部分特征向量進(jìn)行故障識(shí)別,從而實(shí)現(xiàn)軸承故障診斷分類。
圖2 故障診斷流程
基于文中所提出的FIG-DE的特征提取方法,對(duì)?;蟮?組fLow、fR、fUp求取散布熵值,可以提取更為豐富的故障特征信息。但在FIG-DE的特征提取的過(guò)程中,參數(shù)的取值也尤為重要。
在模糊信息?;瘮?shù)據(jù)劃分?;翱跁r(shí),窗口的取值不宜過(guò)小,當(dāng)?;翱跒?時(shí),則為直接對(duì)振動(dòng)信號(hào)求取散布熵,失去了?;囊饬x;當(dāng)粒化的窗口過(guò)大時(shí),會(huì)導(dǎo)致?;蟮臅r(shí)間序列長(zhǎng)度過(guò)短,且會(huì)失去部分較為重要的信號(hào)特征。因此文中初始化?;翱趙in_num為3。
在DE值的計(jì)算過(guò)程中,需要定義3個(gè)參數(shù):映射類數(shù)c、數(shù)據(jù)維數(shù)m、時(shí)間延遲t。參考文獻(xiàn)[14-15],選取時(shí)間序列的映射類別參數(shù)c=6,時(shí)間延遲t=1;針對(duì)嵌入維數(shù)m越大,對(duì)應(yīng)所需的數(shù)據(jù)長(zhǎng)度越長(zhǎng)的問(wèn)題,綜合考慮選取m=3。
選用公共數(shù)據(jù)集——?jiǎng)P斯西儲(chǔ)大學(xué)電氣工程實(shí)驗(yàn)室的軸承故障振動(dòng)信號(hào)進(jìn)行仿真實(shí)驗(yàn)。選用轉(zhuǎn)速為1 797 r/min、采樣頻率為12 kHz時(shí)軸承不同故障類型和故障程度的振動(dòng)信號(hào)作為數(shù)據(jù)樣本。取每種故障類型的前120 000個(gè)采樣點(diǎn)平均分為40個(gè)數(shù)據(jù)樣本,每個(gè)樣本的數(shù)據(jù)長(zhǎng)度為3 000個(gè)采樣點(diǎn),為分析方便,分別以代碼F1—F7的形式表示故障類型,其具體信息如表1所示。不同故障類型的時(shí)域波形如圖3所示。
表1 軸承的故障碼和故障類別
圖3 7種狀態(tài)的時(shí)域圖
首先,對(duì)軸承各種狀態(tài)的振動(dòng)信號(hào)進(jìn)行模糊信息?;幚怼R訤1的振動(dòng)信號(hào)為例,設(shè)置窗口長(zhǎng)度win_num為3,經(jīng)模糊信息?;髷?shù)據(jù)長(zhǎng)度由3 000變?yōu)? 000,在一定程度上明顯優(yōu)化了對(duì)信號(hào)的處理效率,信號(hào)經(jīng)過(guò)粒化處理后得到3組數(shù)據(jù)序列fLow、fR、fUp。模糊信息?;Y(jié)果如圖4所示。
圖4 信號(hào)模糊?;Y(jié)果
由圖4可知:經(jīng)過(guò)粗?;蟮臐L動(dòng)軸承故障振動(dòng)信號(hào),通過(guò)fLow、fR、fUp3組具有更明顯特征的模糊?;瘮?shù)據(jù),彌補(bǔ)了滾動(dòng)軸承故障振動(dòng)信號(hào)在單一尺度下提取故障特征信息不全的問(wèn)題。粗?;臅r(shí)間序列保留了原始振動(dòng)信號(hào)的特征信息,同時(shí)用3組模糊粒子對(duì)特征信息進(jìn)行了深層次刻畫(huà),提高了對(duì)原始振動(dòng)信號(hào)故障特征信息的提取能力。在?;翱趙in_num為3的條件下,對(duì)3個(gè)尺度下的fLow、fR、fUp分別進(jìn)行DE求解,并將所求得的熵值組成特征向量矩陣:
V=[fDE,Low,fDE,R,fDE,Up]
(10)
為進(jìn)一步體現(xiàn)所選特征向量的可分性,將計(jì)算所得7組40×3的DE值進(jìn)行可視化,其三維散點(diǎn)圖如圖5所示。
圖5 FIG-DE的三維散點(diǎn)圖
由圖5可知:不同故障類型的數(shù)據(jù)樣本呈現(xiàn)出較好的分離狀態(tài),各數(shù)據(jù)樣本之間基本無(wú)交叉混疊現(xiàn)象,這表明滾動(dòng)軸承振動(dòng)信號(hào)經(jīng)FIG-DP特征提取后所取得到的特征向量具有良好的區(qū)分度。
為量化采用FIG-DE進(jìn)行故障特征提取的效果,建立SSA-SVM模型進(jìn)行軸承故障診斷識(shí)別。SSA-SVM模型分類器的參數(shù)設(shè)置如下:麻雀初始種群為20,最大迭代次數(shù)為100,懲罰因子c和核函數(shù)參數(shù)g的尋優(yōu)范圍設(shè)定為[0.01,50]。將訓(xùn)練集輸入至SSA-SVM模型中進(jìn)行訓(xùn)練,經(jīng)過(guò)優(yōu)化后,c和g的最優(yōu)參數(shù)分別為15.23和0.41,然后對(duì)訓(xùn)練完成的SSA-SVM模型使用測(cè)試集進(jìn)行測(cè)試,測(cè)試效果如圖6所示。
圖6 基于FIG-DE與SSA-SVM診斷結(jié)果
由圖6可以看出:所有測(cè)試樣本類別基本上都得到了準(zhǔn)確分類,實(shí)際故障結(jié)果與預(yù)測(cè)故障結(jié)果基本完全吻合,故障識(shí)別準(zhǔn)確率達(dá)到了99.29%,這表明文中所提方法不僅能正確判斷出軸承故障位置,還能準(zhǔn)確識(shí)別出故障的損傷等級(jí)。
為驗(yàn)證SSA-SVM故障分類器的優(yōu)越性以及高效性,使用PSO-SVM、GWO-SVM和SSA-SVM分別進(jìn)行故障類型識(shí)別,3種模型統(tǒng)一設(shè)置種群數(shù)量為20,最大迭代次數(shù)為100,其各自的適應(yīng)度迭代曲線如圖7所示。可知:PSO-SVM優(yōu)化算法容易陷入局部最優(yōu);GWO-SVM優(yōu)化算法在第30代左右趨于穩(wěn)定,其尋優(yōu)結(jié)果和收斂速度均低于SSA-SVM優(yōu)化算法;SSA-SVM優(yōu)化算法在第20代左右即尋優(yōu)結(jié)束,其收斂速度快并且可以得到更好的尋優(yōu)結(jié)果。
圖7 分類適應(yīng)度尋優(yōu)曲線
經(jīng)3種模型搜索出適應(yīng)度最優(yōu)對(duì)應(yīng)的c和g設(shè)置為SVM參數(shù)并進(jìn)行訓(xùn)練,訓(xùn)練完成后輸入測(cè)試集進(jìn)行測(cè)試,c和g的優(yōu)化及3種模型的測(cè)試結(jié)果如表2所示??芍翰煌瑑?yōu)化方法得到的c和g的值不同,其中SSA-SVM模型的優(yōu)化效果最好,測(cè)試準(zhǔn)確率可達(dá)99.28%,與PSO-SVM及GWO-SVM模型的優(yōu)化效果相比,在分類準(zhǔn)確率上分別提高了2.85%和0.7%;在優(yōu)化時(shí)長(zhǎng)上,SSA-SVM模型所需迭代時(shí)間為2.53 s,明顯優(yōu)于其他2種算法,且分類錯(cuò)誤數(shù)量?jī)H為1,這充分表明了文中所提SSA-SVM方法在同類優(yōu)化支持向量機(jī)模型中效果更佳。
表2 軸承的故障碼和故障類別
本文作者結(jié)合模糊信息?;c散布熵對(duì)軸承故障振動(dòng)信號(hào)進(jìn)行分析,提出了新的FIG-DE熵值求解方法,在多個(gè)粗?;蛄邢聦?duì)振動(dòng)信號(hào)的特征向量進(jìn)行了深層次提取。對(duì)模糊信息?;蟮恼駝?dòng)信號(hào)求取DE值并作為特征向量矩陣,輸入經(jīng)SSA算法優(yōu)化后的SVM進(jìn)行分類診斷,取得了較好的效果。結(jié)果表明:
(1)相比基于散布熵的故障特征信息提取,F(xiàn)IG-DE方法通過(guò)粗?;绞降玫?個(gè)尺度下的粗?;蛄械男畔?,所提取的故障狀態(tài)特征向量更加全面,具有一定的精度優(yōu)勢(shì)。
(2)FIG-DE算法簡(jiǎn)單、參數(shù)設(shè)置較少且定義了?;翱谠O(shè)置標(biāo)準(zhǔn),經(jīng)模糊信息?;髷?shù)據(jù)長(zhǎng)度明顯縮短,在一定程度上優(yōu)化了對(duì)信號(hào)的處理效率,并且所提取的特征向量?jī)H有3組,緩解了特征向量過(guò)多造成的數(shù)據(jù)冗余問(wèn)題,同時(shí)也改善了算法的自適應(yīng)性。
(3)采用SSA算法優(yōu)化SVM模型,可以更加準(zhǔn)確快速地搜素出最優(yōu)的懲罰參數(shù)c和核函數(shù)參數(shù)g組合,提高了SVM的分類精度。