賈萌珊,齊子元,薛德慶,朱常安,2
(1.陸軍工程大學(xué)石家莊校區(qū),石家莊 050003; 2.中國人民解放軍61035部隊,北京 100094)
健康狀態(tài)評估方法包括基于物理模型的方法和基于數(shù)據(jù)驅(qū)動的方法。基于物理模型的健康狀態(tài)評估需要對機械系統(tǒng)深入了解,這對于復(fù)雜機械系統(tǒng)存在著建模難度大、驗證困難等問題。近幾年,隨著人工智能技術(shù)的迅猛發(fā)展,基于數(shù)據(jù)驅(qū)動的健康狀態(tài)評估得到了廣泛應(yīng)用。
軸承在運轉(zhuǎn)一段時間后會出現(xiàn)一系列問題,如磨損或疲勞剝落等,從而影響機器的正常工作。設(shè)備大多數(shù)故障屬于漸變故障,一般代表著因為損失或磨損引起的輸出參數(shù)變化導(dǎo)致機械產(chǎn)生故障的過程,這類故障產(chǎn)生的概率與機械運轉(zhuǎn)的時間相關(guān),運轉(zhuǎn)時間越長,發(fā)生故障的概率越大,可以通過儀器事先進行測試和監(jiān)控。軸承的故障多由磨損引起,屬于漸變故障,其耗損程度與使用時間呈正相關(guān)。因此,分析其故障機理以及研究其演化過程,可以有效控制和預(yù)防故障的出現(xiàn)。對軸承進行健康狀態(tài)評估能夠降低安全風(fēng)險和維修成本,保證機械系統(tǒng)的安全運行。越來越多的研究人員專注于軸承健康狀態(tài)評估,并取得了一系列成果。西北工業(yè)大學(xué)的史曉雪和吳亞鋒等人提出了基于AGPF的滾動軸承性能衰退趨勢預(yù)測,準(zhǔn)確預(yù)測出了軸承性能衰退趨勢,有利于進一步開展預(yù)測性維護[1]。
隨著人工智能的發(fā)展,許多學(xué)者將基于數(shù)據(jù)驅(qū)動的健康狀態(tài)評估方法引入到了軸承的健康狀態(tài)評估過程。1992年Boser等人首次提出支持向量機(support vector machine,SVM)用于解決二分類問題。隨著對SVM的不斷改進,SVM能夠完成回歸(support vector regression,SVR)和分類(support vector classification,SVC)等學(xué)習(xí)任務(wù),前者多用于分類,后者多用于預(yù)測,因此,SVM成為了機器學(xué)習(xí)領(lǐng)域典型方法之一[2]。
SVM的基本思想是將原數(shù)據(jù)樣本通過一個非線性映射函數(shù)從原始空間映射到高維空間,并在高維空間尋找一個分類面。能夠?qū)颖痉指糸_,與最近的樣本距離最大的分類面稱為最優(yōu)超平面。與傳統(tǒng)的機器學(xué)習(xí)相比,SVM能夠解決小樣本問題、高維問題、局部極值問題和結(jié)構(gòu)選擇問題,被廣泛應(yīng)用于自然語言處理、計算機視覺等多個研究領(lǐng)域[3]。
但利用SVM進行解決故障診斷和健康狀態(tài)評估等問題時,又存在著需要人工設(shè)置參數(shù)而導(dǎo)致自適應(yīng)能力差的問題,進而導(dǎo)致分類精度的下降。因此,研究人員提出了使用優(yōu)化算法對SVM的參數(shù)進行尋優(yōu)選取,以提高SVM的分類精度。
宋立業(yè)、孫琳提出了基于EEMD-GSSA-SVM的滾動軸承故障診斷,結(jié)果表明,利用全局麻雀群搜索算法能夠有效提高支持向量機的分類精度,得出了精確的滾動軸承故障診斷結(jié)果[4]。張吳飛、李帥帥等人提出了基于IGWO-SVM的軸承故障分類預(yù)測,通過改進灰狼算法收斂支持向量機的參數(shù),并對數(shù)據(jù)進行訓(xùn)練優(yōu)化,與其他主流分類模型相比分類精度進一步提高,驗證了該算法的優(yōu)越性[5]。時培明等人提出了基于粒子群優(yōu)化的支持向量機齒輪智能故障診斷模型。該模型現(xiàn)了中速軸大齒輪不同故障類型的可靠識別,驗證了粒子群算法對支持向量機參數(shù)優(yōu)化的可靠性[6]。
因此,利用智能優(yōu)化算法對其參數(shù)進行尋優(yōu),能夠提高支持向量機的分類精度。應(yīng)用在軸承健康狀態(tài)評估領(lǐng)域中,可以提高對軸承健康狀態(tài)評估的準(zhǔn)確度,使其結(jié)果更加可靠。
從數(shù)據(jù)采集系統(tǒng)獲得的數(shù)據(jù)通常為時域信號,且由于采集系統(tǒng)自身或環(huán)境因素影響,在信號中含有噪聲,需要對數(shù)據(jù)進行適當(dāng)?shù)奶幚砗笤龠M行特征提取。
相對于常用于信號降噪處理的小波變換,經(jīng)驗?zāi)B(tài)分解不僅吸收了小波變換多分辨率的優(yōu)勢,還克服了小波變換中需選取小波基與確定分解尺度的困難。EMD是一種基于信號局部特征的信號分解方法,該算法不需要信號的頻率、幅度等先驗知識即可對信號進行分解處理,在分析非平穩(wěn)非線性信號方面具有獨特的優(yōu)勢[7]。軸承的振動信號是一種非線性、非平穩(wěn)信號,因此EMD分解在處理軸承振動信號時具有一定的優(yōu)勢。
經(jīng)驗?zāi)B(tài)分解的主要思想是自適應(yīng)地將輸入信號分解為有限的單一頻率零均值基本分量,這些基本分量稱為固有模態(tài)函數(shù)(intrinsic mode function,IMF),且每一個IMF分量都是獨立的。利用EMD分解,可以對軸承信號按照真實存在的不同尺度或趨勢分量逐級分解,將軸承信號分解為一系列具有相同特征尺度的數(shù)據(jù)序列。與原始信號相比,具有更強的規(guī)律性。
EMD的分解式為:
(1)
IMF應(yīng)滿足條件[8]:
1)極值點的數(shù)目等于過零點的數(shù)目,或者二者差值相差為1;
2)包絡(luò)線平均值在任何點上都為零(分別用極大值和極小值組成上包絡(luò)線和下包絡(luò)線)。
EMD的中心理念是提取出具有更高原始波形的相似性,同時也包含了更小的沖擊信息的IMF成分,從而消除影響判斷的噪聲數(shù)據(jù)。
軸承的故障信號中往往存在著瞬時沖擊。峭度是一個能夠反應(yīng)信號瞬時沖擊強弱的時域參數(shù),對該類沖擊特征非常敏感,與軸承的尺寸、載荷、轉(zhuǎn)速無關(guān),因此常用于分析軸承振動成分的強弱和軸承故障診斷。
譜峭度(spectral kurtosis,SK)是一種能夠描述軸承發(fā)生故障時的沖擊特性頻率變化的統(tǒng)計參數(shù),能夠有效的檢測出軸承的故障沖擊信號[9-10]。
譜峭度的計算公式:
(2)
式中,H(t,f)為信號x(t)在頻率f處的復(fù)包絡(luò),由短時傅里葉變換計算。<·>,|·|分別代表數(shù)學(xué)期望和模。
其中:
(3)
式中,γ(t)為時間長度極小的窗函數(shù)。
根據(jù)EMD方法判斷,滾動軸承正常工作的峭度值約為3,因此,當(dāng)IMF分量峭度值K大于3時,該IMF分量中含有較多的故障信息。當(dāng)K的值不斷增大時,說明故障程度在不斷加深。因此,在優(yōu)選IMF分類時,選擇K值較大的分類,即為需要保留的有用IMF分量。利用峭度準(zhǔn)則,篩選出有效的IMF分量,并對有效IMF分量進行重構(gòu),達到剔除原始信號中噪聲信號的目的[11]。
雞群優(yōu)化算法(CSO)是Meng等人在2014年根據(jù)雞群的等級制度和覓食行為提出的一種優(yōu)化算法[12-13]。雞群優(yōu)化算法集成了粒子群算法、遺傳算法、蝙蝠算法等的優(yōu)化特性。對雞群生活規(guī)律抽象化得到了一種新的群智能全局優(yōu)化算法。雞群優(yōu)化算法的主體思路是模擬雞群等級制度和雞群行為。該算法模擬了雞群行為和雞群的等級制度,根據(jù)不同雞所遵循的差異化移動規(guī)律和雞群中存在的等級制度、競爭關(guān)系,母雞孵化后代以及小雞成長為公雞或母雞等真實雞群行為規(guī)律,實現(xiàn)了群智優(yōu)化算法。
雞群優(yōu)化算法能夠?qū)崿F(xiàn)多子群協(xié)同搜索,并且具有優(yōu)秀的自適應(yīng)能力,廣泛應(yīng)用于計算科學(xué)、管理科學(xué)、工程科學(xué)等領(lǐng)域中。雞群優(yōu)化算法為全局優(yōu)化問題提供了新的思路和解決途徑[14]。
在雞群的等級制度中,具有較強覓食行為的公雞占優(yōu)勢,其周圍圍繞著小雞和母雞。這種等級制度會在覓食和搜索食物的過程中不斷更新。在雞群算法中,按照雞的適應(yīng)度值,將其分為若干子種群和類型,包括公雞、母雞、小雞。其中,公雞具有最高適應(yīng)度值、并作為每一個子種群的領(lǐng)頭。緊接著的幾只雞,作為母雞的適應(yīng)度值。而適應(yīng)度值最低的雞被隨機分配到一個子種群中,相應(yīng)地,確定了母雞與小雞之間的母子親密關(guān)系。其等級制度一旦確立將數(shù)代保持不變,等級制度每隔G(G∈[2,20])代更新一次。每一組內(nèi),母雞跟隨公雞覓食,同時也隨機偷取其他組內(nèi)食物,小雞跟隨母雞覓食。每一只雞的位置對應(yīng)優(yōu)化問題的一個解,而公雞、母雞、小雞的位置迭代方式也有所不同,其流程圖如圖1所示。
圖1 雞群優(yōu)化算法流程圖
公雞位置更新公式:
公雞的覓食領(lǐng)域隨著其適應(yīng)度值增大而增大。適應(yīng)度值較大的公雞比適應(yīng)度值較小的公雞在食物競爭中更具有競爭性,能夠在更廣泛的領(lǐng)域內(nèi)尋找食物。
xi,j(t+1)=xi,j(t)*(1+randn(0,σ2))
(4)
k∈[1,NR],k≠i
(5)
其中:randn(0,σ2)是高斯分布函數(shù),其均值為 0、標(biāo)準(zhǔn)差為σ2,fi為個體適應(yīng)度值,fk為個體k的適應(yīng)度分配值,為個體k從公雞的群體中隨機選擇出來的公雞。ε為無窮小數(shù)。
母雞更新公式:
母雞可以在同一組中公雞處獲取食物,還可以竊取其他雞所尋覓的食物,因此其在小組中具有獨特的優(yōu)勢,因此適應(yīng)度值較高的母雞比適應(yīng)度值較低的母雞具有優(yōu)勢。
xi,j(t+1)=xi,j(t)+S1*rand(xr1,j(t)-
xi,j(t))+S2*rand*(xr2,j(t)-xi,j(t))
(6)
(7)
S2=exp(fr2-fi)
(8)
其中:r1為第i只母雞所配公雞的位置,r2為任一公雞或母雞個體編號,且r1≠r2,rand為[0,1]內(nèi)的隨機數(shù)。
小雞位置更新公式:
小雞跟隨母雞尋找食物。
xi,j(t+1)=xi,j(t)+FL*(xm,j(t)-xi,j(t)
(9)
其中:xi,j(t)為第t次迭代時第i只小雞追隨的母雞的位置,F(xiàn)L(FL∈0,2])為跟隨系數(shù)。
支持向量機是一種基于統(tǒng)計學(xué)習(xí)理論的有監(jiān)督機器學(xué)習(xí),其主要思想是對結(jié)構(gòu)風(fēng)險最小化的近似實現(xiàn)[15]。支持向量機因其構(gòu)造簡便容易運行,在處理小樣品數(shù)據(jù)分析、處理不確定性問題中具有一定的優(yōu)勢。
當(dāng)支持向量機用于分類時,其目的是構(gòu)建樣本之間最優(yōu)的分類界限,即邊界函數(shù),當(dāng)樣本為二維時,邊界函數(shù)為一個線性函數(shù)或一組線性函數(shù),在高維空間中,邊界函數(shù)為一組超平面。
設(shè)一組帶標(biāo)簽的樣本集為:
Data={(x1,y1),(x2,y2),(x3,y3),…(xm,ym)}
式中,xi,yi為第i個樣本輸入值和輸出值,xi∈Rd,yi∈R。SVM的回歸函數(shù)為:
g(x)=wTψ(x)+v
(10)
式中,w為權(quán)值,(·)為映射函數(shù),其目的是將輸入映射到高維空間,v為偏移量。
拉格朗日函數(shù)[16-17]:
(11)
式中,ai為拉格朗日乘子;
最終回歸函數(shù):
(12)
其中:K(·)為徑向基核函數(shù):
(13)
式中,σ為核寬度。
由支持向量機的結(jié)構(gòu)可知,核寬度σ和懲罰因子t直接關(guān)系到支持向量機的分類效果。其中,懲罰t的作用是平衡支持向量的復(fù)雜度與誤差率。t取值越大,支持向量越多,模型越復(fù)雜;反之亦然,t取值越小,支持向量越少,模型越簡單。核寬度σ反映單個樣本對超平面的影響。σ越小,單個樣本對超平面的影響越??;反之,σ越大,單個樣本對超平面的影響越大。
因此,不合適的核寬度σ和懲罰系數(shù)t取值會使降低SVM的回歸效果。采用優(yōu)化算法對參數(shù)σ和t尋優(yōu)能提高回歸效果,進而提高SVM的分類精度。
基于CSO-SVM的軸承健康狀態(tài)評估流程如圖2所示。
圖2 基于CSO-SVM軸承健康狀態(tài)評估流程
基于上述EMD、CSO和SVM模型,構(gòu)建CSO-SVM健康狀態(tài)識別模型,步驟如下。
Step 1:對原始信號進行經(jīng)驗?zāi)B(tài)分解,根據(jù)公式(2)計算各IMF分量的峭度值,保留峭度值大于3的IMF分量,并重構(gòu)信號,達到振動信號降噪的目的。
Step 2:降噪后的重構(gòu)信號進行特征提取,利用熵權(quán)法進行特征降維,篩選出最能表現(xiàn)出軸承退化趨勢的特征。然后對特征進行歸一化處理,得到軸承的退化趨勢曲線。
Step 3:利用CSO優(yōu)化SVM的核寬度σ和懲罰因子t。分別對歸一化后的數(shù)據(jù)進行訓(xùn)練和測試,得到最終識別結(jié)果。
Step 4:計算識別精度,并將上述結(jié)果與傳統(tǒng)的分類模型進行對比。
本文的數(shù)據(jù)來源為IEEE可靠性協(xié)會和FEMTO-ST研究所組織的IEEE PHM 2012數(shù)據(jù)挑戰(zhàn)賽軸承全壽命數(shù)據(jù)[18]。數(shù)據(jù)采集過程采用兩個振動傳感器,其安裝位置呈90°,第一個安裝在縱向軸上,第二個安裝在水平軸上。傳感器的類型為微型加速度計,沿徑向放置在軸承的外圈上。采樣頻率為25.6 kHz。采樣間隔為10秒,一次采樣時間持續(xù)0.1 s,即每次采集2 560個點,共2 802個訓(xùn)練樣本。本文選用Bearing1_1數(shù)據(jù)的縱軸方向數(shù)據(jù),對軸承進行健康狀態(tài)評估。
軸承是旋轉(zhuǎn)元件,且大多數(shù)振動數(shù)據(jù)包含周期性運動,但隨著故障的進行,軸承退化的過程會存在大量的噪聲。相較于其他的信號處理方法,EMD在處理非平穩(wěn)非線性信號表現(xiàn)出了一定的優(yōu)越性,因此,采用EMD對振動信號進行降噪處理。首先對信號進行IMF分解,挑選出峭度大于3的IMF分量。
根據(jù)公式(2),得出各IMF分量的峭度值。正常狀態(tài)下軸承IMF分量的峭度值和故障狀態(tài)下軸承IMF分量的峭度值分別如表1、表2所示。
表1 正常軸承信號各IMF分量峭度值
表2 故障軸承信號各IMF分量峭度值
由表1~2可見,失效后的信號中包含故障信息的IMF分量逐漸增多。以正常的振動信號為例,提取出IMF2、IMF3、IM4分量進行信號重構(gòu)。正常狀態(tài)下原始信號和重構(gòu)信號如圖3所示。
圖3 正常狀態(tài)下原始信號和重構(gòu)信號
對振動信號時間域進行處理所得到的特征成為時域特征[19]。當(dāng)軸承出現(xiàn)故障時,時域信號的概率和幅值會隨之發(fā)生變化。但是,時域信號的統(tǒng)計特征計算簡單,適用于在線監(jiān)測,缺乏穩(wěn)定性和敏感性。當(dāng)信號呈現(xiàn)非周期和故障不典型的問題時,難以從時域波形上看出設(shè)備的故障狀態(tài)信息。因此,在對軸承振動信號進行特征提取時,還應(yīng)該考慮頻域特征,對信號進行頻譜分析,通過頻譜分析,可以觀察到信號在頻域上的分布情況。當(dāng)軸承發(fā)生故障時,其振動信號的頻率結(jié)構(gòu)發(fā)生改變,體現(xiàn)在不同頻率成分的能量以及頻譜的主能量譜峰位置的變化[20-21]。通過對軸承振動信號的時域信息和頻域信息的描述,可以全面反映軸承的運行狀態(tài)。
通過傅里葉變換,時域信號轉(zhuǎn)化為頻域信號,再根據(jù)頻域信號反映出的頻域特征進行統(tǒng)計分析。傅里葉變換公式為:
(14)
經(jīng)過EMD和譜峭度法對軸承振動信號進行降噪處理,然后對軸承信號進行時域特征提取和頻域特征提取。時域特征和頻域特征能夠反映振動信號的概貌,從全局的角度對振動信號進行描述。因此,本文綜合利用時域特征和頻域特征的參數(shù),共提取了27維的時域、頻域特征。
高維數(shù)據(jù)包含著大量的無關(guān)信息和冗余信息,對機器學(xué)習(xí)算法的性能產(chǎn)生負面影響。因此,面對高維數(shù)據(jù)時,特征降維能夠有效地消除無關(guān)和冗余特征,提高挖掘任務(wù)的效率,增強機器學(xué)習(xí)的準(zhǔn)確性,增強學(xué)習(xí)結(jié)果的易理解性。
基于數(shù)據(jù)驅(qū)動的健康狀態(tài)評估方法中,大多采用將時域特征、頻域特征籠統(tǒng)的進行模型訓(xùn)練,未注意到每個特征量來表征軸承健康狀態(tài)。而特征指標(biāo)的權(quán)重系數(shù)能夠較為客觀地反映軸承時域、頻域特征的重要程度,因此本文利用熵權(quán)法來優(yōu)選特征,達到特征降維的目的[22]。
熵權(quán)法賦權(quán)步驟。
1)歸一化處理:
(15)
xij表示第i個采樣點的第j個特征。
2)各指標(biāo)的信息熵:
(16)
(17)
3)確定各指標(biāo)權(quán)重:
(18)
利用熵權(quán)法計算時域和頻域信號的權(quán)重,得到權(quán)重最大的三個特征,分別為偏斜度、方差、標(biāo)準(zhǔn)差。時域和頻域特征權(quán)重如圖4所示。
圖4 時域和頻域特征權(quán)重
偏斜度:
(19)
方差:
(20)
標(biāo)準(zhǔn)差:
(21)
根據(jù)所提取的特征,構(gòu)建如圖5所示的滾動軸承的退化趨勢曲線。
圖5 軸承退化趨勢曲線
健康狀態(tài)評估本質(zhì)是識別軸承退化狀態(tài)和不同退化階段的模式。根據(jù)軸承退化曲線圖可知,軸承的退化趨勢從0~1代表著從健康狀態(tài)逐步退化到故障狀態(tài)[21]??梢源_認(rèn)軸承在0~1 400組樣本時,軸承退化趨勢相對穩(wěn)定,認(rèn)為軸承此時出具健康狀態(tài);在1 401~2 769組樣本點時,退化趨勢曲線的幅值小幅度高于正常狀態(tài)下的幅值,并且以較低的斜率增加,此時軸承處于退化狀態(tài)。在2 770~2 802組樣本中,退化趨勢曲線的幅值明顯高于正常狀態(tài),并且以較大的斜率快速增加,此時認(rèn)為軸承處于故障狀態(tài)。根據(jù)上述分析,以退化趨勢曲線的斜率為判斷準(zhǔn)則,將軸承退化狀態(tài)分為三個階段:健康、亞健康和故障。
首先對實驗數(shù)據(jù)劃分訓(xùn)練集和數(shù)據(jù)集,利用訓(xùn)練樣本對CSO-SVM模型進行訓(xùn)練。利用訓(xùn)練好的模型對測試樣本進行分類,并對模型的分類效果進行評估。進而得到基于CSO-SVM模型的軸承健康狀態(tài)評估結(jié)果。
基于CSO-SVM的軸承健康狀態(tài)評估結(jié)果如圖6所示,對照組分別為傳統(tǒng)的機器學(xué)習(xí)模型,基于SVM的軸承健康結(jié)果如圖7示,基于極限學(xué)習(xí)機(ELM)的軸承健康狀態(tài)評估結(jié)果如圖8所示。
圖6 CSO-SVM康狀態(tài)評估結(jié)果
圖7 SVM健康狀態(tài)評估結(jié)果
圖8 ELM健康狀態(tài)評估結(jié)果
其中,1、2、3分別代表健康、亞健康和故障三個階段。利用CSO-SVM的健康狀態(tài)評估準(zhǔn)確率為97%,而利用SVM和ELM的健康狀態(tài)評估的準(zhǔn)確率為分別為88.6%和87.5%。結(jié)果表明,基于雞群優(yōu)化算法的支持向量機(CSO-SVM)的評估精度遠高于傳統(tǒng)的機器學(xué)習(xí)模型。
在機器學(xué)習(xí)中,常用混淆矩陣來分析、總結(jié)分類模型的預(yù)測結(jié)果。其作用機理是,對集中記錄的數(shù)據(jù)按照真實類別和分類模型預(yù)測的結(jié)果以矩陣的形式匯總。其中,混淆矩陣的行向量表示真實值,列向量表示預(yù)測值。CSO-SVM、SVM和ELM的混淆矩陣分別如圖9、圖10、圖11所示。
圖9 CSO-SVM混淆矩陣圖
圖10 SVM混淆矩陣圖
圖11 ELM混淆矩陣圖
本文的數(shù)據(jù)來源為IEEE可靠性協(xié)會和FEMTO-ST研究所組織的IEEE PHM 2012數(shù)據(jù)挑戰(zhàn)賽軸承全壽命數(shù)據(jù)。構(gòu)建健康狀態(tài)評估模型時,以支持向量機為基本模型,利用雞群優(yōu)化算法對支持向量機的超參數(shù)進行優(yōu)化,進而達到提高支持向量機的分類能力的目的。最后應(yīng)用軸承全壽命數(shù)據(jù)進行健康狀態(tài)評估并得出以下結(jié)論:
1)利用經(jīng)驗?zāi)B(tài)分解(EMD)對軸承的原始振動信號進行分解、重構(gòu)能夠達到降噪目的。分解后的IMF分量中,峭度值大于3的IMF分量進行重構(gòu),這種方法對處理非平穩(wěn)、非線性的信號的健康狀態(tài)識別的精度較高,能實現(xiàn)對振動信號的降噪。
2)雞群優(yōu)化算法(CSO)具有良好的參數(shù)優(yōu)化能力。利用雞群優(yōu)化算法對支持向量機(SVM)模型中的核寬度和懲罰因子的取值進行尋優(yōu)。結(jié)果表明,與傳統(tǒng)的SVM模型相比,該優(yōu)化算法提高了SVM的分類精度,使得模型的優(yōu)化效果更加顯著。
3)實驗結(jié)果表明,基于CSO-SVM的識別模型能夠準(zhǔn)確、快速地識別軸承的健康狀況,為識別其健康狀況提供了一種新思路。