吳定海,張培林,任國全,傅建平
(軍械工程學(xué)院 火炮工程系,河北 石家莊050003)
柴油機是武器裝備底盤系統(tǒng)的動力心臟,直接關(guān)系到整體機動性能,對柴油機的運行狀態(tài)進行在線監(jiān)測具有極其重要的意義。由于柴油機的結(jié)構(gòu)和各種激勵相互作用的復(fù)雜性,使得人們難以從原理上建模來研究外在所測信號與柴油機內(nèi)在故障之間的對應(yīng)關(guān)系。因此,目前對柴油機故障診斷的研究大多基于對歷史樣本的分析和建模,研究其分布規(guī)律,從而建立分類器進行故障類型的判別。這種方法常常面臨這樣的問題,正常樣本多而故障樣本難以捕捉,這就造成了故障樣本數(shù)據(jù)的嚴(yán)重不平衡[1]。對柴油機運行狀態(tài)進行在線監(jiān)測時,及時地發(fā)現(xiàn)其運轉(zhuǎn)的異常,進行在線報警更具有重要的現(xiàn)實意義。因此,需要立足于數(shù)據(jù)樣本不足的現(xiàn)狀,研究能夠解決此類問題的異常檢測模型。
基于數(shù)據(jù)樣本分布不平衡問題的機器學(xué)習(xí)問題的研究,Scholkopf[2]在支持向量機的基礎(chǔ)上建立了單類分類支持向量機(One-class SVM),Tax 等[3]建立支持向量描述(SVDD),只需要目標(biāo)類數(shù)據(jù)訓(xùn)練樣本,在核空間以最小的超球包括目標(biāo)樣本,從而建立分類器,這是一種無監(jiān)督的學(xué)習(xí)方法,缺乏異常數(shù)據(jù)樣本的信息,模型參數(shù)難以確定,沒能權(quán)衡分類器的描述精度和泛化性能。
本文研究柴油機的運行狀態(tài)異常監(jiān)測問題,引入一種有監(jiān)督的超球分類器,結(jié)合異常數(shù)據(jù)樣本的信息,分析模型的參數(shù)選擇對分類器性能的影響,提出運用ROC 曲線的下方面積(AUC)作為評價指標(biāo)的參數(shù)優(yōu)化選擇方法,實例分析驗證了該故障診斷方法的優(yōu)越性。
SVDD 采用一個或多個超球?qū)⒛繕?biāo)數(shù)據(jù)包裹在其中,實現(xiàn)對分布不平衡數(shù)據(jù)的很好分離[3-7]。然而,SVDD 只考慮將目標(biāo)類“包緊包實”,沒有考慮異常類樣本信息,其超球面沒能將2 類數(shù)據(jù)以最大間隔分離,并非最優(yōu)分類超球面,提高了描述精度但損失了泛化性能。
而支持向量機(SVM)最優(yōu)分類超平面在確保正確分類的同時,決策超平面將2 類樣本以最大間隔分離,使得SVM 在遵循結(jié)構(gòu)風(fēng)險最小化的原則下獲得了最好的泛化性能。
結(jié)合支持向量分類超平面的思想,在核空間中尋求一個超球S(a,R),將2 類樣本以最大間隔分離,如圖1所示。引入距離變量d,對給定的樣本集xi∈Rd,yi∈{-1,1},i=1,…,n,2 類訓(xùn)練樣本約束為[6]
這樣問題便轉(zhuǎn)化為在上述約束下尋求最大分類間隔[8]
圖1 最大分類間隔超球分界面Fig.1 Hyper-sphere classification with maximal distance
也即等同于尋求最小化R2/d2,則引入分離比例參數(shù)K=R2/d2,最優(yōu)分離超球面描述為[3,5,7-8]
式中:ξi為松弛因子;φ 為非線性映射;ν 為控制錯分比例,將上述問題轉(zhuǎn)化為對偶問題
解(5)式凸二次規(guī)劃問題,獲得球心
則決策超球面的半徑通過(6)式求解
求解完成后,模型的判別函數(shù)為
圖2為由Prtool[3]工具箱產(chǎn)生的二維2 類Banana 數(shù)據(jù)集分類效果。其中目標(biāo)類樣本154 個,非目標(biāo)類樣本46 個。對本文模型設(shè)置經(jīng)驗參數(shù)v=0.01,σ=4,K 為10,在v 的控制下實現(xiàn)2 類樣本的最大間隔分離。
以某型軍用12 缸柴油發(fā)動機為研究對象,測試工況轉(zhuǎn)速為900 r/m,空載,采集第1 缸蓋振動加速度信號,采用等空間同步采樣,每工作循環(huán)(720°)采集1 024 點。測試了柴油機的正常狀態(tài)、異常狀態(tài)(單缸失火、噴油器壓力過小和進氣門漏氣)等4種工況。
發(fā)動機缸蓋振動信號是典型的非平穩(wěn)信號,取1 個完整工作循環(huán)的數(shù)據(jù)作短時傅里葉變換,得其時頻譜分布如圖3所示。分析其時頻域上的特性[9-10]如下。
1)時域分布特性:振動信號由許多瞬態(tài)沖擊成分組成(主要為燃燒氣體的壓力沖擊和進、排氣門開、閉時產(chǎn)生的沖擊),特定的沖擊響應(yīng)與一定時間頻率段的幅值相對應(yīng)。
2)頻域分布特性:振動信號中高頻信息豐富,且時間頻率局部性明顯,燃爆壓力響應(yīng)與進排氣門落座段沖擊響應(yīng)分布在不同的頻段,但是存在一定的交疊。發(fā)動機在正常工作狀態(tài)下,各激勵力作用的振動響應(yīng)是相對穩(wěn)定的,當(dāng)發(fā)動機出現(xiàn)故障時,相應(yīng)時頻段內(nèi)的能量或譜峰值將發(fā)生變化,為故障特征提取和診斷提供依據(jù)。
3)工作循環(huán)間時頻特性呈現(xiàn)出明顯的周期性,時頻特性的周期性是整工作循環(huán)缸蓋振動信號特征提取的依據(jù),等角度采樣相當(dāng)于將不同轉(zhuǎn)速下的采樣過程進行了歸一化處理,有效地預(yù)制了波動影響,使其具有各態(tài)歷經(jīng)性。同時柴油缸蓋振動信號更具復(fù)雜性,并沒有特定明顯的頻率與其故障相對應(yīng),并且受噪聲干擾嚴(yán)重。
根據(jù)以上的分析,運用小波包進行分解提取小波包能量特征是對柴油機進行監(jiān)測的有效手段。本文采用雙樹復(fù)小波包[11-12]進行3 層分解,閾值降噪后,提取頻帶能量特征如圖4所示,所提取的特征能夠較好的表征柴油機運行工況,具有較好的可分性。
圖4 不同工況頻帶能量特征Fig.4 Energy spectrum features of different conditions
超球分類器異常檢測模型中參數(shù)的優(yōu)化選擇對于提高柴油機在線異常檢測精度具有重要影響,需要對各參數(shù)進行詳細分析。對于上述超球分類器,核函數(shù)的選擇具有最好描述性能的高斯核,因此,需要選擇的參數(shù)有3 個:高斯核σ,控制錯分比例v,分離比例K.
高斯核σ 決定了樣本映射到高維空間的聚集性,當(dāng)σ 越小,超球體越小,對應(yīng)分類面投影復(fù)雜程度越高,體現(xiàn)為支持向量的個數(shù)也越多,描述精度高,而泛化能力則較差??梢?,該核參數(shù)主要影響樣本間的分布距離,從而影響分類器的泛化能力,同時支持向量的個數(shù)又影響了在線異常檢測的執(zhí)行效率。
控制錯分比例參數(shù)的意義:對于檢測的數(shù)據(jù)樣本在空間的分布往往存在野點,超球分類器數(shù)據(jù)描述為了將所有正常樣本包含在超球體內(nèi),必然要增大超球半徑,導(dǎo)致描述精度的下降。引入控制錯分比例v 使得超球分界面能夠提供一種軟間隔,將偏離某一類別的奇異點排除在超球外,作為支持向量,提高描述的精度??刂棋e分比例代替了傳統(tǒng)的懲罰參數(shù),具有具體的物理含義,即為邊界支持向量比例的上界和支持向量比例的下界,更有利于參數(shù)的取值。
而本文介紹的最大間隔超球分類器在結(jié)合異常類訓(xùn)練樣本信息,引入分離比例參數(shù)K,從正常樣本和異常樣本之間的邊界距離角度出發(fā),綜合權(quán)衡兩類樣本交界處2d 范圍內(nèi)的分布情況,以最大分離間隔分離目標(biāo)樣本和非目標(biāo)樣本,通過改變K 可以得到從球面到平面變化的靈活的決策邊界,增大K 也勢必增加了支持向量的數(shù)量。
建立柴油機異常模型,最為重要是考察模型的泛化性能。取正常工況訓(xùn)練樣本120 個,異常類訓(xùn)練樣本30 個(單缸失火、噴油器壓力過小、進氣門漏氣工況各10 個),另外取相同數(shù)量的樣本作為測試樣本。
由于特征維數(shù)(8 維)較高,無法直接觀察特征空間的分布情況,可以由ROC 曲線進行評價,它是以正常樣本正確判別的個數(shù)與所有目標(biāo)數(shù)據(jù)樣本個數(shù)的比值(正檢率)為橫坐標(biāo),以異常樣本被誤判的個數(shù)與所有異常樣本個數(shù)的比值(虛警率)為縱坐標(biāo)的二維圖,并通過匹配不同的閾值水平得到的不同點,從而連成一條曲線來全面刻畫模型分類性能。因此,曲線越接近坐標(biāo)的左上方模型性能越好,AUC越大。
通過以上對各參數(shù)的分析,本文在綜合考慮模型描述精度和泛化性能的同時兼顧模型的復(fù)雜度,以AUC 和支持向量個數(shù)為評價指標(biāo)對超球分類器異常檢測模型參數(shù)進行分步優(yōu)化。
根據(jù)經(jīng)驗初始化{v=0.01;σ=1;K=10},根據(jù)AUC 和支持向量的個數(shù),調(diào)節(jié)σ 初步確定合適的取值區(qū)間為[0,0.5],對其進行進一步細化搜索,模型的評價指標(biāo)隨核參數(shù)變化如圖5所示。當(dāng)σ <0.15 時,支持向量的個數(shù)將迅速增加;當(dāng)σ >0.15時,支持向量的分布趨于平穩(wěn),是比較合理的選擇,同時考查ROC 曲線的評價指標(biāo)發(fā)現(xiàn)當(dāng)σ 取0.2 時,能獲得較好的泛化性能。
圖5 高斯核參數(shù)的選擇Fig.5 Choose of Gaussian kernel parameter
為保證檢測精度,一般v 取較小的值,觀測其在[0,0.1]間的變化規(guī)律如圖6所示,可見隨著其增長,支持向量數(shù)量基本成線性增加,泛化檢測性能下降,由圖中曲線可確定v 的值為0.01 為宜。
圖6 控制比例參數(shù)的選擇Fig.6 Choose of control proportion parameter
在獲得σ 和v,調(diào)整K,如圖7所示。隨著K 的增大,支持向量個數(shù)隨著增多,當(dāng)K >30,迅速增大,ROC 曲線評價指標(biāo)也顯示分類器的性能在逐步提高,綜合考慮,確定K=30.然后再重復(fù)按以上步驟進行微調(diào),直到AUC 變化小于1%停止,最終模型的最優(yōu)參數(shù)如表1所示。
用同樣的參數(shù)選擇方法確定SVDD 模型的參數(shù),并對比2 種模型的分類效果,如表1所示。經(jīng)對比可看出,本文模型引入K 后,分類效果要好于SVDD 模型,對柴油機異常檢測具有明顯的優(yōu)勢。
表1 分類器檢測效果對比Tab.1 Detection effects of different classifiers
圖7 分離比例參數(shù)的選擇Fig.7 Choose of radius to separation margin ratio
1)該模型能夠結(jié)合2 類樣本分布信息和SVM分類超平面所具有最大分類間隔的特點,能夠很好解決柴油機異常檢測故障樣本分布不平衡問題,體現(xiàn)了優(yōu)良的檢測性能。
2)柴油機異常檢測需要同時兼顧檢測精度和檢測效率,本文所提評價指標(biāo)和分步優(yōu)化能夠用最小的代價迅速找到次優(yōu)參數(shù),具有實用意義。
3)引入分離比例參數(shù),異常檢測模型具有更好的靈活性,缺點是最優(yōu)參數(shù)的確定復(fù)雜度相對要高一點。
References)
[1] 潘志松,陳斌,繆志敏.One-class 分類器研究[J].電子學(xué)報,2009,37(11):2496-2503.PAN Zhi-song,CHEN Bin,MIAO Zhi-min.Overview of study on one-class classifiers[J].Acta Electronica Sinica,2009,37(11):2496-2503.(in Chinese)
[2] Scholkopf B.Estimating the support of a high-dimensional distribution[J].Neural Computation,2001,13(7):1443- 1471.
[3] David M J T.Support vector data description[J].Machine Learning Research,2004,54(1):45-66.
[4] 王自營,邱綿浩,安鋼.基于支持矢量聚類的機械故障診斷[J].機械工程學(xué)報,2009,45(4):226-230.WANG Zi-ying,QIU Mian-hao,AN Gang.Fault diagnosis of machine based on support vector clustering[J].Journal of Mechanical Engineering,2009,45(4):226-230.(in Chinese)
[5] David M J T,Robert P W.Duin.Uniform object generation for optimizing one-class classifiers[J].Machine Learning Research,2001,2:155-173.
[6] 李凌均,韓捷,王昆,等.基于單分類的機械故障診斷研究及其應(yīng)用[J].機械強度,2008,30(5):697- 701.LI Ling-jun,HAN Jie,WANG Kun,et al.Mechamcal fault diagnosis based on one-class classification and its application[J].Journal of Mechanical Strength,2008,30(5):697-701.(in Chinese)
[7] 王自營,邱綿浩,安鋼,等.基于一類超球面支持向量機的機械故障診斷研究[J].振動工程學(xué)報,2008,21(6):553-558.WANG Zi-ying,QIU Mian-hao,AN Gang,et al.Fault diagnosis investigation of machine based on one-class hyperspherical SVM[J].Journal of Vibration Engineering,2008,21(6):553-558.(in Chinese)
[8] Wang J,Neskovic P,Cooper L N.Pattern classification via single spheres[J].Discovery Science,2005,3735:241-252.
[9] 曹建軍,張培林,張英堂,等.基于提升小波包變換的發(fā)動機缸蓋振動信號特征提取[J].振動與沖擊,2008,27(2):34-38.CAO Jian-jun,ZHANG Pei-lin,ZHANG Ying-tang,et al.Feature extraction of an engine cylinder head vibration signal based on lifting wavelet package transformation[J].Journal of Vibration and Shock,2008,27(2):34-38.(in Chinese)
[10] 曹龍漢.柴油機智能化故障診斷技術(shù)研究[M].北京:國防工業(yè)出版社,2001:64-68.CAO Long-han.Intelligent fault diagnosis technique of diesel engine[M].Beijing:National Defense Industry Press,2001:64-68.(in Chinese)
[11] Wu D H,Zhang P L,Ren G Q,et al.Study on engine vibration signal denoising method of SURE Block threshold based on DTCWPT[C]∥Proceedings of International Conference on Measuring Technology and Mechatronics Automation.Hunan,China:IEEE 2009,1:719-722.
[12] Baraniuk R G,Kingsbury N,Selesnick I W.The dual-tree complex wavelet transform-a coherent framework for multiscale signal and image processing[J].Signal Processing Magazine,2005,22(6):123-151.