解曉婷,李少波,楊觀賜,劉國凱,姚雪梅
(貴州大學 現代制造技術教育部重點實驗室,貴陽 550025)
智能的故障診斷技術,就是利用先進的分析算法對數據中的隱性知識進行挖掘和建模,進而進行機械故障的分類及預測。支持向量機以其基于統(tǒng)計學習理論的特點,在故障診斷領域一直是研究的熱點。目前,支持向量機在軸承、齒輪、電機等機械狀態(tài)監(jiān)測及故障診斷中得到了廣泛的應用,并且取得了良好的診斷效果[1-5]。但是,單一的支持向量機算法通常存在如對樣本的分布假設過于理想,樣本的構造過于復雜且樣本數據存在冗余、無法提取數據的有效特征信息、模式識別的精度低等問題,SVM的性能依賴于訓練樣本數據的質量和SVM核函數參數g以及其懲罰因子c的選擇[6-9]。故本文將從支持向量機的樣本特征提取方法及采用智能群體算法對支持向量機的參數進行優(yōu)化的方法這兩方面作為研究的切入點。
一維時間序列信號的統(tǒng)計量或頻率域的幅值信息雖然可以提供機械故障狀態(tài)的相關特征,但是在利用支持向量機進行多分類時缺少對信息空間狀態(tài)關聯的表述能力,所以,本文提出了利用基于Hanning窗插值快速傅里葉變換的RMS特征提取方法來獲取故障信號的特征。該方法在一定程度上能保留信號在功率譜上的最大能量,故而能反映頻率譜上的特征屬性[10]。 建立布谷鳥算法優(yōu)化支持向量機的算法模型,可以充分利用布谷鳥優(yōu)化算法在優(yōu)化過程中的局部搜索和全局搜索能力[11],提高了搜索到最優(yōu)解的效率特性來更好的優(yōu)化支持向量機的優(yōu)化參數c、g。
快速傅里葉變換(FFT)是1965年 J W Cooley 和J W Tukey 巧妙地利用 WN 因子的周期性和對稱性,構造了離散傅里葉變換(DFT)的快速算法,即快速離散傅里葉變換(FFT)。DFT的運算過程如下:
(1)
傅里葉變換的振幅譜和能量譜分別為:
|F(u,v) |=[R2(u,v)+I2(u,v) ]1/2
(2)
E(u,v)=R2(u,v)+I2(u,v)
(3)
式中,R(u,v),I(u,v)分別表示傅里葉變換的實部和虛部。
快速傅里葉變換已經應用于滾動軸承故障診斷中,并且取得了不錯的實驗效果[10,12],利用快速傅里葉變換使時域信號變換至頻域信號的示意圖如圖1所示。此次特征提取過程中的信號由時域信號變?yōu)轭l域信號所用的快速傅里葉變換,設置采樣頻率Fs=12000Hz,采樣點數為1024點。
圖1 時頻域示意圖
為了避免頻譜泄漏,我們將所選擇的時域信號與Hanning窗口相乘,然后獲得FFT頻譜圖。而Hanning窗口的大小非常關鍵,直接影響所得到的樣本數據質量,本文中對于給定的原始加速器信號,我們使用具有移位步長200的大小為512的Hanning滑動窗口,來掃描由Nfft=16384個傅里葉系數的數目生成的信號并生成原始數據樣本的頻譜圖,并利用樣本頻譜特征構造出RMS的映射樣本數據,并且最后選擇經過傅里葉變換及Hanning窗口處理過的特征信號樣本集。經過傅里葉變換后的頻譜如圖2中的上圖所示;由于信號數據的對稱性,則可選取單邊數據來作為樣本的輸入,單邊數據的頻譜圖如圖2中的下圖所示。
圖2 快速傅里葉變換圖
支持向量機(SVM)是不同于傳統(tǒng)的基于經驗風險最小化的原則的機器學習方法。由于它是基于結構風險最小化的原則,所以在解決非線性及高維分類中有自己獨特的優(yōu)勢[19-21]。
支持向量機的理論基礎是尋找在線性可分的情況下最優(yōu)分類超平面。首先給定一個樣本集:
(4)
其中,xi為數據;yi為數據所屬的類別。
若超平面方程wxi+b=0達到了最優(yōu)分類平面的標準(即在分類間隔最大的情況下將樣本正確地分開),則求解最優(yōu)分類平面的問題可以轉換為下述目標函數和約束條件:
(5)
其中,w為權重向量;b為偏置向量。
然而在許多情況下,一些樣本往往不能被正確分類,故而引入了松弛因子來保證對樣本分類的正確性,這里引入了松弛因子i≥0(i=1,2,3…,n),則正則化問題可以表示為:
(6)
通過懲罰因子的大小可以調和算法復雜程度與分類之間的矛盾。式(6)則變成了一個二次規(guī)劃問題,通過求拉格朗日的鞍點來使問題得到最優(yōu)的解決進而得到問題的最優(yōu)解。
由最優(yōu)化條件(簡稱KKT)定理得知最初的求解最優(yōu)超平面的問題被轉換為求解二次優(yōu)化問題:
(7)
通過對式(7)的求解可以得到SVM中的拉格朗日算子αi,然后通過任何一個已知向量xk以及其對應的ak來得出偏置b的解。對所給的未知類型的樣本x,只需計算:
f(x)=sign[(wx)+b]
(8)
由式(8)即可得該樣本所屬的類別。支持向量機在解決非線性分類問題時,采用的是通過核函數來處理信息維度問題,以實現數據信息從低維向高維的映射,并在高維特征空間中使用核函數進行線性分類。目前,比較常用的核函數有高斯徑向基核函數、多項式核函數、指數徑向基核函數等。
支持向量機的可調參數包括懲罰因子c和核函數參數g,并且c、g的選擇好壞決定著預測分類的精度高低[13-14]。從算法分析的角度來看,Civicioglu 和 Desdo[15-16]提出的布谷鳥算法(CS)與粒子群優(yōu)化(PSO),差分進化(DE)和人工蜂群(ABC)的概念比較表明,CS 與差分進化算法比 PSO 與 ABC 提供了更健壯的結果[17-18],并且布谷鳥算法本身有局部搜索和全局搜索能力,且迭代次數越大,群狀態(tài)序列將收斂到最優(yōu)狀態(tài)/解集,所以本文采用布谷鳥群體智能優(yōu)化算法來對支持向量機進行參數優(yōu)化。
布谷鳥算法的步驟如下:
步驟4:如果滿足停止要求,則gt*(c,g)是目前為止發(fā)現的最好的全局解。否則,返回步驟2。
步驟1:處理由軸承實驗平臺上的加速度傳感器采集滾動軸承在不同狀態(tài)下的振動信號,并通過數據分割構造信號樣本集;
步驟2:通過對樣本中的振動信號進行快速傅里葉變換和Hanning窗口相乘,并提取出SVM的訓練及測試樣本的特征;
步驟3: CS算法的種群初始個數由n個隨機位置的巢穴組成,遍歷每個巢穴,對每個巢穴隨機初始化參數,對目標函數進行初始化;確定CS算法中迭代的最小步長stepmin、最大步長stepmax及迭代次數,并根據經驗確定SVM參數c、g的上下界取值范圍;
步驟5:設置巢穴的發(fā)現概率參數pa為0.25,利用隨機生成的一個狀態(tài)向量與巢穴的發(fā)現概率相比較,保留發(fā)現概率小的鳥巢,淘汰部分發(fā)現概率大的劣質巢穴,并重新隨機排列巢穴;
步驟6:定義用于尋找當前的最優(yōu)巢穴和最優(yōu)適應度目標函數值的函數,通過遍歷每個舊巢穴,如果更新的巢穴的新目標適應度函數值優(yōu)于對應的舊的目標函數值則更新當前巢穴目標函數值并更新對應的巢穴,直到最后迭代完成時找出迭代過程的最優(yōu)目標函數值、最佳巢穴和參數g*t(c,g);
布谷鳥算法優(yōu)化支持向量機的流程圖如圖3所示。
圖3 布谷鳥算法優(yōu)化支持向量機的流程
振動數據來源于美國凱斯西儲大學(Case Western Reserve University, CWRU)的開放數據集。軸承實驗裝置如圖4所示,該實驗以電機驅動端的軸承作為診斷對象,分別在測試軸承的內圈IRF、滾動體REF及外圈ORF上采用電火花的加工方式引入單點損傷來模擬軸承的三種故障,其代表故障程度的故障損傷尺度分別為0.007inch、0.014inch以及0.021inch,然后在三種不同工況下(負載和轉速不同),由電機驅動端上側的加速度傳感器采集得到故障信號,采樣頻率為12kHz。
圖4 軸承實驗裝置
軸承狀態(tài)故障直徑樣本個數類別標簽Normal0501IRF10.007’’502IRF20.014’’503IRF3 0.021’’504REF10.007’’505REF20.014’’506REF30.021’’507ORF10.007’’508ORF20.014’’509ORF30.021’’5010
表1為實驗所用的數據的樣本描述,為了獲取樣本數據的時頻圖,經過處理可以得到如圖5的正常樣本的信號時域圖以及內圈IRF、滾動體REF、外圈ORF故障信號的時域圖。
圖5 故障信號時域圖
由圖5可以看出,單純的根據樣本數據信號的時域圖來進行判別分類,難度很大且分類精度低,所以要對故障的信號信息進行特征提取,本研究方法中采用FFT及Hanning窗口并提取RMS[12]特征參數作為樣本特征。
在10個故障類別中,每個類別分別選擇50個,這樣可以得到500個樣本,且在每個類別中的50個中再選擇其中的30個作為訓練樣本,其余的20個作為測試樣本。
當支持向量機的核函數選擇高斯徑向基核函數時,通過迭代計算得出基于布谷鳥算法對支持向量機的參數優(yōu)化的尋優(yōu)參數Bestc= 100,Bestg= 0.01,用經過傅里葉變換并提取的頻譜特征的均方根特征RMS作為樣本的特征輸入后,得到的分類結果見圖6。
圖6 分類結果
布谷鳥更新巢穴尋找最優(yōu)解的過程如圖7所示。
(a)當前巢穴的參數
(b)遍歷新巢穴時最優(yōu)參數 圖7 巢穴參數尋優(yōu)
其中圖例上的1、2分別代表診斷模型算法需要優(yōu)化的SVM的兩個參數c、g。
表2 實驗對比結果
從表2的對比實驗編號1、2、3及5可知用群智能優(yōu)化算法可以有效提高分類的正確率,特別是結合本文提出的軸承故障診斷的方法結果來看,布谷鳥優(yōu)化支持向量機(CS-SVM)的參數后,實驗分類結果有所提高,其中,特別是經過快速傅里葉變換及Hanning窗口處理后的頻譜提取到的特征樣本的分類效果最高。通過對比實驗4,5可以得出FFT-CS-SVM算法在分類的準確率方面依然比較有優(yōu)勢。
本論文針對旋轉機械故障診斷中的軸承故障診斷問題提出了一套基于FFT特征提取與CS-SVM參數優(yōu)化的智能軸承故障診斷模型。該模型利用RMS特征參數作為頻域信號的特征值能有效保留原始信號的能量信息、對原始數據進行降維、降低模型復雜度以及訓練測試的時間;通過布谷鳥CS算法對故障診斷分類模型進行參數優(yōu)化能有效提高故障診斷模型的診斷準確率。通過與同類智能故障診斷方法進行對比,本文所提出的模型在CWRU公開數據集上的性能表現得到了顯著提高。