李 勝,張培林
(軍械工程學(xué)院 一系,石家莊 050003)
在對振動(dòng)信號進(jìn)行特征選擇時(shí),由于其非平穩(wěn)的特性,導(dǎo)致大量的故障信息淹沒在背景中,利用傳統(tǒng)的時(shí)域或頻域方法很難從中提取出有效地故障特征[1-2]。Huang[3-4]提出的一種適用于分析非平穩(wěn)信號的新方法EMD法,該方法基于信號的局部特征時(shí)間尺度,可以把信號分解成若干個(gè)固有模態(tài)函數(shù)(Intrinsic mode function,IMF)之和,分解出的各個(gè)IMF分量突出了數(shù)據(jù)的局部特征,對其分析可以更準(zhǔn)確有效地把握原始數(shù)據(jù)的特征信息。最重要的是分解后的各個(gè)IMF分量是經(jīng)過平穩(wěn)化處理的。
AR(Auto-regressive)模型是一種時(shí)間序列分析方法,該模型參數(shù)凝聚了系統(tǒng)狀態(tài)的重要信息,準(zhǔn)確的AR模型能夠深刻地、集中地表達(dá)動(dòng)態(tài)系統(tǒng)的客觀規(guī)律。研究表明,AR模型的自回歸參數(shù)對狀態(tài)變化規(guī)律反映最敏感[5-6]。因此采用AR模型的自回歸系數(shù)作為特征向量對手動(dòng)換向閥的工作狀態(tài)進(jìn)行分析是非常有效的。由于AR模型適用于平穩(wěn)信號,并且各個(gè)IMF分量是平穩(wěn)的,所以就可以對各個(gè)IMF分量建立AR模型,提取AR模型的自回歸系數(shù)和殘差作為故障特征向量?;贓MD的AR模型已經(jīng)成功地應(yīng)用于高壓齒輪泵、往復(fù)泵等部件的故障特征提?。?-8]。
Leardi等[9-10]提出了把遺傳算法(GA)與偏最小二乘法(PLS)結(jié)合起來發(fā)展的一個(gè)變量選擇方法(GA-PLS)并將其用于波譜數(shù)據(jù)中波長的特征選擇,獲得了令人滿意的結(jié)果。GA-PLS方法由于結(jié)合了GA的全局優(yōu)化搜索能力和PLS有效地解決變量間多重共線性問題的能力,具有較好的變量選擇及模型優(yōu)化效果,能篩選出與故障信息更相關(guān)的特征向量,并且剔除數(shù)據(jù)中大量冗余和無關(guān)的變量。
本文提出了基于EMD和GA-PLS的特征選擇算法。該算法首先對振動(dòng)信號進(jìn)行EMD分解,得到多個(gè)IMF分量,然后對各個(gè)IMF分量利用AR模型進(jìn)行建模,用AR模型的自回歸系數(shù)和殘差作為初始特征向量,然后,利用GA-PLS對初始特征向量進(jìn)行進(jìn)一步的特征篩選,最后,以該特征向量為輸入,采用三種典型的分類器,建立故障分類器,識別手動(dòng)換向閥的工作狀態(tài)和判斷故障類型。通過對實(shí)驗(yàn)信號的分析,驗(yàn)證了將EMD方法和GA-PLS算法相結(jié)合能有效地應(yīng)用于手動(dòng)換向閥的故障特征選擇,從而為手動(dòng)換向閥的故障診斷提供了一種新的特征選擇方法。
EMD方法的目的是通過對非線性、非平穩(wěn)信號的分解獲得一系列表征信號特征時(shí)間尺度的固有模態(tài)函數(shù),使得各個(gè) IMF是單分量的幅值或頻率調(diào)制信號[6-7]。每個(gè) IMF滿足以下2個(gè)條件:
(1)在整個(gè)數(shù)據(jù)段內(nèi),極值點(diǎn)的個(gè)數(shù)和過零點(diǎn)的個(gè)數(shù)必須相等或最多相差一個(gè);
(2)信號上任意一點(diǎn),由局部極大值點(diǎn)確定的包絡(luò)線和由局部極小值點(diǎn)確定的包絡(luò)線的均值均為零,即信號關(guān)于時(shí)間軸局部對稱。
對任一實(shí)信號x(t)進(jìn)行EMD的具體步驟是:
(1)確定信號x(t)的所有局部極值點(diǎn),然后用三次樣條插值分別將所有的局部極大值點(diǎn)和局部極小值點(diǎn)連接起來,形成上包絡(luò)線和下包絡(luò)線,這兩條包絡(luò)線包絡(luò)了所有的信號數(shù)據(jù)。m1(t),用x(t)減去m1(t)得:
(2)計(jì)算上、下包絡(luò)線的平均值,記為 m1(t),求出:
如果h1(t)是一個(gè)IMF,那么它就是信號x(t)的第一個(gè)IMF。
(3)如果h1(t)不是一個(gè)IMF,則將h1(t)作為原始數(shù)據(jù),重復(fù)步驟(1)、(2)得到上、下包絡(luò)線的平均值,記為m11(t),計(jì)算h11(t)=h1(t)-m11(t),并判斷是否滿足IMF的條件,如不滿足,則重復(fù)循環(huán),計(jì)算h1k(t)=h1(k-1)(t)- m1k(t),直到 h1k(t)是一個(gè) IMF。記c1(t)=h1k(t),則c1(t)為信號x(t)的第一個(gè)IMF。
(4)將c1(t)從x(t)中分離出來,得到:
將r1(t)作為原始數(shù)據(jù),重復(fù)步驟(1)-(3),得到第二個(gè)IMF c2(t)。重復(fù)循環(huán)n次,到信號x(t)的n個(gè)IMF,于是有:
當(dāng)rn成為一個(gè)單調(diào)函數(shù)不能再從中提取滿足IMF條件的分量時(shí),循環(huán)結(jié)束。這樣信號可表示:
其中,rn稱為殘余函數(shù),代表信號的平均趨勢。
GA-PLS算法對變量的選擇過程由以下五個(gè)基本步驟組成。
(1)隨機(jī)地給每個(gè)染色體賦值,確定染色體初始長度,1代表選中相應(yīng)的變量,0代表變量未被選中。染色體長度的具體數(shù)目由需要解決問題的維數(shù)決定;
(2)確定每個(gè)染色體的個(gè)體適應(yīng)度,由以下的內(nèi)部預(yù)測模型給出評估:
q2是通過留一法得到的交叉驗(yàn)證值,SSY是變量的平方和,PRESS是留一法交叉驗(yàn)證后的預(yù)測平方和,n是樣本個(gè)數(shù),c是被選擇出的變量個(gè)數(shù)。不但模型的可靠性由q2決定,而且被選擇的變量個(gè)數(shù)也由適應(yīng)度函數(shù)決定。
(3)具有較高適應(yīng)度的染色體均選自以任意比例的長度。其他必要的染色體,通過交叉和變異得到,從而彌補(bǔ)下一代的數(shù)量,以確保種群的多樣性。
(4)在一個(gè)交叉過程中,隨機(jī)挑選一對染色體,對其單獨(dú)分割,互相交換,并以預(yù)先確定的交叉頻率合并。在一個(gè)突變過程中,對每一個(gè)染色體的二進(jìn)制模式改變一個(gè)小概率。
(5)根據(jù)個(gè)體適應(yīng)度,對后代重新進(jìn)行安置并取代上一代的位置。重復(fù)運(yùn)行以上的四個(gè)步驟(步驟2到步驟(5)直到世代的數(shù)目達(dá)到給定的最大數(shù)目的世代[9-10]。圖 1 描述了GA-PLS進(jìn)行特征選擇的過程。
GA-PLS算法有以下的優(yōu)點(diǎn)[11-12]。與其他方法相比,在全局搜索能力方面,GA-PLS方法能更精確地找到優(yōu)化的解決方法。偏最小二乘法能解決多元回歸多重共線性問題。當(dāng)樣本點(diǎn)個(gè)數(shù)比變量少時(shí),也對回歸模型進(jìn)行了分析。因此,GA-PLS算法結(jié)合了兩種算法的優(yōu)點(diǎn),并大量地成功地應(yīng)用在不同的數(shù)據(jù)類型的特征選擇。
圖1 GA-PLS的特征選擇過程Fig.1 Feature selection process by GA-PLS
采用根均方誤差(root-mean-square error,RMSE)作為誤差函數(shù),根據(jù)以下的公式計(jì)算:
其中,yi是訓(xùn)練集中的理想輸出,f(xi)是通過留一法交叉驗(yàn)證得到的實(shí)際輸出,N是訓(xùn)練集中的樣本數(shù)目。
在GA-PLS算法中,根據(jù)經(jīng)驗(yàn)值,影響其性能的參數(shù)的設(shè)置如下[9-10]:在初始群中每條染色體平均由5個(gè)變量組成,種群大小30,迭代次數(shù)100,突變概率0.01,交叉概率 0.5,遺傳迭代次數(shù) 100。
基于EMD和GA-PLS的特征選擇算法過程如下。
(1)分別在各個(gè)工作狀態(tài)下,按一定的采樣頻率fs進(jìn)行N次采樣,得到振動(dòng)信號。
(2)對每一種狀態(tài)下的每一個(gè)訓(xùn)練樣本進(jìn)行i層EMD 分解,得到 i個(gè) IMF 分量 c1,c2,…,ci。
(3)對每一個(gè)IMF分量ci建立AR模型,采用FPE準(zhǔn)則確定模型的階數(shù)m,由最小二乘法估計(jì)自回歸參數(shù) φik,k=1,2,…,m 和模型的殘差 ei,提取 φik和 ei形成初始故障特征向量,因此,得到一個(gè) l×(m+1)的矩陣:Ai={φi1,…,φim,ei}。
(4)GA-PLS算法對 l×(m+1)的矩陣進(jìn)行特征選擇以減少維數(shù),并得到更有效的特征向量,得到的新的特征向量Bi作為輸入量。
(5)采用分類器對由故障特征向量Bi組成的訓(xùn)練樣本進(jìn)行訓(xùn)練,得到對應(yīng)的分類器,用測試樣本進(jìn)行測試,得到輸出結(jié)果?;贓MD和GA-PLS的特征選擇算法流程如圖2所示。
圖2 基于EMD和GA-PLS的特征選擇算法流程Fig.2 The flow chart of feature selection
對上述理論分析進(jìn)行實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)裝置為液壓系統(tǒng)綜合檢測與試驗(yàn)設(shè)備。采用某型工程車輛的手動(dòng)換向閥作為實(shí)驗(yàn)器件,圖3為該手動(dòng)換向閥的結(jié)構(gòu)圖。在手動(dòng)換向閥進(jìn)油口、出油口、裝填回路管路和助力回路管路上,安裝壓電加速度傳感器,傳感器型號為CAYD-185。手動(dòng)換向閥實(shí)驗(yàn)裝置、傳感器測點(diǎn)布置與信號采集裝置如圖4所示。該裝置能模擬正常狀態(tài)、裝填故障、助力故障等多種故障狀態(tài),壓電加速度傳感器測量手動(dòng)換向閥油管管口的振動(dòng)信號。
在液壓系統(tǒng)綜合檢測與試驗(yàn)設(shè)備上,對手動(dòng)換向閥三種工作狀態(tài)分別采樣。實(shí)驗(yàn)中,電動(dòng)機(jī)轉(zhuǎn)速為1 000 r/min,采樣頻率為 10 kHz,采樣時(shí)間為 0.41 s,分別采集正常狀態(tài)、裝填故障和助力故障三種工作狀態(tài)下的振動(dòng)信號各50組數(shù)據(jù),其中,20組數(shù)據(jù)作為訓(xùn)練樣本,30組數(shù)據(jù)作為測試樣本。
對振動(dòng)信號進(jìn)行EMD分解。由于EMD方法是一種主成分分析方法,其主要的故障信息集中在前幾個(gè)IMF分量。因此,本文進(jìn)行11層EMD分解,并選用了前6個(gè)IMF分量。對3種工作狀態(tài)信號的前6個(gè)IMF分量分別建立AR模型,采用FPE準(zhǔn)則確定模型階數(shù)m。在本文的實(shí)驗(yàn)中,AR模型的階數(shù)設(shè)定為8階。因此,手動(dòng)換向閥的故障信息主要包含8個(gè)AR模型系數(shù)和殘差作為特征參數(shù)。圖5為三種工作狀態(tài)的振動(dòng)信號對比。以裝填故障的振動(dòng)信號為例,圖6表示了該信號的11個(gè)IMF分量。
圖5 三種工作狀態(tài)的振動(dòng)信號Fig.5 The vibration signals of three states
表1給出的是三種狀態(tài)下各一個(gè)手動(dòng)換向閥振動(dòng)信號的初始特征向量(由于篇幅關(guān)系,其它特征向量未列出),然后將初始特征向量作為輸入,利用GA-PLS特征選擇方法進(jìn)行進(jìn)一步的篩選。
表2給出每個(gè)特征向量對應(yīng)的個(gè)體適應(yīng)度值。從表中可以得出不同故障狀態(tài)的特征向量。表3為經(jīng)GA-PLS方法篩選后的特征向量Bi。將表1和表3進(jìn)行對比后發(fā)現(xiàn),經(jīng)過GA-PLS方法篩選后,特征向量數(shù)量大大減少,維數(shù)大大降低,有利于分類。
圖6 裝填故障的IMF分量Fig.6 The IMFs ofloading fault states
表1 手動(dòng)換向閥各種狀態(tài)下的特征向量Tab.1 The parameters of AR model for IMFs of each fault state
表2 被選擇特征向量對應(yīng)的個(gè)體適應(yīng)度值Tab.2 Selected features and corresponding fitness values by GA-PLS
表3 經(jīng)GA-PLS選擇后的特征向量Tab.3 The new parameters selected by GA-PLS
表4 三種分類器對特征向量的分類結(jié)果Tab.4 The results by using three classifiers with two methods
為了說明GA-PLS方法的有效性,采用三種典型分類器對未經(jīng)GA-PLS選擇的特征向量和經(jīng)GA-PLS選擇的特征向量進(jìn)行分類,結(jié)果如表4所示。從表4可以看出,用經(jīng)GA-PLS選擇的特征向量能夠?qū)颖具M(jìn)行正確率為99%的故障分類,分類效果比用未經(jīng)GA-PLS選擇的特征向量要好很多,而且在分類時(shí)間方面,GAPLS方法節(jié)省了大量的時(shí)間,可對故障進(jìn)行在線分類。因此,基于EMD和GA-PLS的特征選擇算法對手動(dòng)換向閥故障診斷是有效的。
EMD方法是一種能把非平穩(wěn)信號轉(zhuǎn)變成平穩(wěn)信號的信號處理方法。AR模型是一個(gè)信息的凝聚器,可將手動(dòng)換向閥振動(dòng)信號的特性及工作狀態(tài)都凝聚其中,因而可依據(jù)它對手動(dòng)換向閥的工作狀態(tài)進(jìn)行識別。EMD方法和AR模型相結(jié)合能解決振動(dòng)信號的非平穩(wěn)特性和特征向量不能反映故障狀態(tài)的問題。同時(shí),GAPLS方法能很好的地克服特征間相關(guān)的影響。該方法能得到較好RMSE值,較短的分類時(shí)間和較高的分類準(zhǔn)確率。與其他特征選擇方法相比,實(shí)驗(yàn)結(jié)果清楚地顯示了基于EMD和GA-PLS特征選擇方法能有效地應(yīng)用于手動(dòng)換向閥的故障診斷,為手動(dòng)換向閥的故障診斷提供了一種新的方法。
[1] Mcfadden P D.Window function for the calculation of the time domain averages of the vibration of the individual planet gears and sun gear in an epicyclic gearbox[J].ASME Journal of Vibration and Acoustics.1994,116 179-187.
[2] 林 京,劉紅星,屈梁生,等.信號時(shí)域平均處理中的若干問題探討[J].振動(dòng)工程學(xué)報(bào),1997,10(4):446-450.
[3] Huang N E,Shen Z.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].Proc.R.Soc.Lond.A,1998,454:903-905.
[4] Huang N E,Shen Z,Long S R.A new view of non-linear water waves:the Hilbert spectrum[J].Annu Rev Fluid Mech,1999(31):417-457.
[5] Ljung L.System Identification:Theory for the User(2nd Edition)[M]. Beijing, China:Tsinghua University Press,2002.
[6] 賀湘宇,何清華,鄒湘伏,等.基于RBF網(wǎng)絡(luò)和ARX模型的液壓系統(tǒng)故障診斷方法[J].系統(tǒng)仿真學(xué)報(bào),2009,21(1):282-285.
[7] 江四厚,陳小虎,王漢功,等.基于Hilbert-Huang變換的振動(dòng)信號特征提?。跩].機(jī)床與液壓,2008,36(11):199-201.
[8] 徐長航,劉吉飛,陳國明,等.經(jīng)驗(yàn)?zāi)B(tài)分解和魏格納-維利分布在往復(fù)泵泵閥振動(dòng)信號特征提取中的應(yīng)用[J].中國石油大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,34(3):99-103.
[9] Gonzalez A L.Leardi R.Genetic algorithms applied to feature selection in PLS regression:how and when to use them[J].Chemometr Intell Lab,1998,41(2):195-208.
[10] Leardi R.Application of genetic algorithm-PLS for feature selection in spectral data sets[J].J Chemometr,2000,14(5/6):643.
[11] Azizi A,Niazi A,Leardi R.A comparative study between PLS and OSC-PLS in the simultaneous determination of lead and mercury in water samples:effect of wavelength selection.Canadian Journal of Analytical Sciences and Spectroscopy,2007,52(6):365-374.
[12] Khajehsharifi H,Pourbasheer E.Genetic-algorithm-based Wavelength Selection in Multi-component Spectrophotometric Determination by PLS:Application on Ascorbic Acid and Uric Acid Mixture[J].Journal of the Chinese Chemical Society,2008,55:163-170.