郝騰飛,陳 果
(南京航空航天大學(xué) 民航學(xué)院,南京 210016)
核方法是模式識(shí)別領(lǐng)域的一場革命,其基本思想是首先將原始樣本通過核函數(shù)隱含地映射到一個(gè)高維特征空間中,然后在該空間中執(zhí)行相應(yīng)的線性算法。由于核函數(shù)隱含地實(shí)現(xiàn)了一個(gè)非線性映射,同時(shí)又避開了維數(shù)災(zāi)難,因此,核方法可高效地解決非線性模式識(shí)別問題[1]。機(jī)械故障診斷本質(zhì)上是一個(gè)模式識(shí)別問題。目前,許多核方法已廣泛應(yīng)用于機(jī)械故障診斷。文獻(xiàn)[2]與文獻(xiàn)[3]分別對支持向量機(jī)(support vector machine,SVM)在機(jī)械故障診斷中的應(yīng)用進(jìn)行了很好的綜述。文獻(xiàn)[4]研究了核主成分分析(kernel principal component analysis,KPCA)在齒輪故障診斷中的應(yīng)用。文獻(xiàn)[5]將粗糙集理論的屬性約簡與KPCA結(jié)合,提出了一種基于粗糙KPCA的機(jī)械故障特征提取方法并將其應(yīng)用于滾動(dòng)軸承故障特征提取。文獻(xiàn)[6]提出了一種利用KPCA對故障信號(hào)的小波尺度譜圖像進(jìn)行特征提取的方法,并將其應(yīng)用于轉(zhuǎn)子故障診斷。文獻(xiàn)[7]研究了核判別分析(kernel discriminant analysis,KDA)在風(fēng)機(jī)與齒輪故障診斷中的應(yīng)用。
以上研究充分展示了核方法在機(jī)械故障診斷中的明顯優(yōu)勢。但應(yīng)用上述各種核方法到機(jī)械故障診斷時(shí)均存在一個(gè)共同的問題,即核參數(shù)的選擇問題。核參數(shù)對各種核方法的性能有很大影響,若核參數(shù)選擇恰當(dāng),則核方法可獲得比相應(yīng)的線性方法更好的性能,否則,甚至可能不及對應(yīng)的線性方法,因此,在應(yīng)用核方法時(shí),核參數(shù)的選擇至關(guān)重要。目前,核參數(shù)一般通過交叉驗(yàn)證的方法選取,但該方法計(jì)算量較大且只能在給定的一組參數(shù)中選擇一個(gè)最優(yōu)參數(shù),因此不一定能找到全局最優(yōu)的參數(shù)。
許多研究[8-10]表明KDA與SVM具有類似的分類性能,但與SVM相比,KDA在機(jī)械故障診斷中的應(yīng)用研究相對較少。本文研究了KDA在機(jī)械故障診斷中的應(yīng)用。針對KDA中核參數(shù)的選擇問題,本文采用You等[11]提出的同方差性準(zhǔn)則來選擇核參數(shù),由于使用該準(zhǔn)則可以得到最優(yōu)的核參數(shù),因此將使用該準(zhǔn)則來優(yōu)化核參數(shù)的KDA稱為貝葉斯最優(yōu)KDA。最后建立了一種基于貝葉斯最優(yōu)KDA的故障診斷模型,并以滾動(dòng)軸承故障診斷為例研究了該方法在機(jī)械故障診斷中的應(yīng)用。
線性判別分析(linear discriminant analysis,LDA)是一種經(jīng)典的監(jiān)督特征提取及分類方法,其基本思想是尋找一組投影方向,將原始樣本向該組方向上投影后可使不同類別的樣本盡量遠(yuǎn)離,同類樣本盡量靠近。如果不同類別樣本的分布滿足同方差性(即具有相同的協(xié)方差矩陣),則用LDA可求得一個(gè)最佳子空間,不同類別的樣本向該子空間投影后具有最佳判別性。但實(shí)際中不同類別的樣本一般很難滿足同方差性,為解決該問題,Baudat等[10]與 Mika等[12]分別獨(dú)立地將核技巧引入LDA,提出了KDA。KDA的基本思想是先用核技巧將原始樣本隱含地映射到一個(gè)高維特征空間;然后在該特征空間中執(zhí)行LDA。根據(jù)核方法的原理,核技巧隱含地實(shí)現(xiàn)了一個(gè)非線性映射,從而利用核技巧可使不同類別的樣本在高維特征空間中滿足同方差性,因此KDA可有效地解決LDA中要求不同類別樣本分布滿足同方差性的問題。以下具體介紹KDA算法的基本原理。
設(shè)有x1,x2,…,xm∈Rnm 個(gè)樣本,分別屬于 c個(gè)類別,φ為由核技巧誘導(dǎo)的非線性映射,則KDA的目標(biāo)函數(shù)為:
最優(yōu)投影向量w可通過求解下列廣義特征值問題獲得:
KDA雖在理論上解決了LDA中類分布的同方差性的假定問題,但實(shí)際應(yīng)用KDA時(shí),由于不同的核參數(shù)對應(yīng)不同的非線性映射,只有選擇一個(gè)恰當(dāng)?shù)暮藚?shù),才能使不同類別的樣本在高維特征空間中滿足同方差性,因此應(yīng)用KDA的關(guān)鍵是選擇一個(gè)恰當(dāng)?shù)暮藚?shù)。目前,核參數(shù)一般通過交叉驗(yàn)證的方法進(jìn)行選取,但該方法計(jì)算量較大且只能在給定的一組參數(shù)中選擇一個(gè)最優(yōu)參數(shù),因此不一定能找到全局最優(yōu)參數(shù)。針對KDA中的核參數(shù)選擇問題,You等[11]提出了一個(gè)同方差性準(zhǔn)則Q1:
用上述同方差性準(zhǔn)則雖可保證各類樣本在特征空間中滿足同方差性,但將KDA應(yīng)用于分類問題時(shí),不僅需要各類樣本滿足同方差性,而且需要各類樣本盡量遠(yuǎn)離,為此You等又引入另一個(gè)準(zhǔn)則Q2測量各類樣本的可分性:
圖1 應(yīng)用同方差性準(zhǔn)則的四個(gè)例子Fig.1 Four examples of the use of the homoscedastic criterion
圖2 同方差性準(zhǔn)則值隨兩個(gè)分布相似性變化關(guān)系Fig.2 The relationship between the value of homoscedastic criterion and the similar of two distributions
該準(zhǔn)則實(shí)際上是特征空間中類間散度矩陣的跡,顯然可以用來測量各類樣本的可分性。根據(jù)以上分析,在應(yīng)用KDA時(shí),最優(yōu)核參數(shù)應(yīng)為Q1與Q2同時(shí)取最大值時(shí)對應(yīng)的核參數(shù),因此最終準(zhǔn)則應(yīng)為上述兩個(gè)準(zhǔn)則的乘積[11],即:
由于測量各類樣本可分性的準(zhǔn)則比較明顯,因此將最終準(zhǔn)則仍稱為同方差性準(zhǔn)則。
在應(yīng)用KDA時(shí),可用梯度下降法優(yōu)化上述準(zhǔn)則找到最優(yōu)核參數(shù),該核參數(shù)對應(yīng)的非線性映射可將原始樣本映射到一個(gè)高維特征空間中,在該空間中不同類別的樣本具有相同的協(xié)方差矩陣并且相互之間盡量遠(yuǎn)離。在該空間中應(yīng)用LDA可求得一個(gè)最優(yōu)的子空間,各類樣本向該子空間投影后可獲得最佳的判別性。因此,將用上述準(zhǔn)則尋找核參數(shù)的KDA稱為貝葉斯最優(yōu)KDA。
基于貝葉斯最優(yōu)核判別分析的機(jī)械故障診斷流程如圖3所示。
具體診斷方法如下:
(1)用相關(guān)傳感器采集反映機(jī)械設(shè)備運(yùn)行狀態(tài)的振動(dòng)信號(hào);
圖3 基于貝葉斯最優(yōu)核判別分析的機(jī)械故障診斷流程Fig.3 Flow chart of machinery fault diagnosis based on Bayes optimal kernel discriminant analysis
(2)用各種信號(hào)分析技術(shù)(如時(shí)域分析技術(shù)、頻域分析技術(shù)以及時(shí)頻域分析技術(shù)等)構(gòu)造原始特征集;
(3)根據(jù)(1)和(2)產(chǎn)生一批訓(xùn)練樣本的原始特征集,基于該組樣本,用梯度下降法優(yōu)化同方差性準(zhǔn)則,確定最優(yōu)核參數(shù);
(4)基于訓(xùn)練樣本的原始特征集,采用最優(yōu)核參數(shù),用KDA求解一組最優(yōu)投影向量,該組投影向量張成一個(gè)最優(yōu)子空間;
(5)對于測試樣本,首先用與訓(xùn)練樣本相同的信號(hào)分析技術(shù)進(jìn)行處理,形成測試樣本的原始特征集,然后將訓(xùn)練樣本與測試樣本的原始特征集分別投影到上述最優(yōu)子空間;
(6)在最優(yōu)子空間內(nèi)用最近鄰分類器進(jìn)行故障分類。
滾動(dòng)軸承在旋轉(zhuǎn)機(jī)械中應(yīng)用極為廣泛,其運(yùn)行狀態(tài)往往直接影響到整臺(tái)機(jī)器的精度、可靠性及壽命。由于滾動(dòng)軸承的壽命離散性很大,無法進(jìn)行定時(shí)維修,因此,對滾動(dòng)軸承實(shí)施狀態(tài)監(jiān)測與故障診斷具有重要意義[13]。本文以滾動(dòng)軸承故障診斷為例,研究了貝葉斯最優(yōu)核判別分析在機(jī)械故障診斷中的應(yīng)用。實(shí)驗(yàn)數(shù)據(jù)采用美國Case Western Reserve University電氣工程實(shí)驗(yàn)室的滾動(dòng)軸承實(shí)驗(yàn)臺(tái)數(shù)據(jù)[14]。在該實(shí)驗(yàn)臺(tái)中,實(shí)驗(yàn)軸承支撐電機(jī)轉(zhuǎn)軸,在其內(nèi)圈、外圈及滾動(dòng)體上分別用電火花技術(shù)加工單點(diǎn)損傷,以模擬內(nèi)圈故障、外圈故障與滾動(dòng)體故障。在軸承座上方設(shè)置加速度傳感器測試軸承振動(dòng)信號(hào),采樣頻率為12 kHz。選取正常樣本、內(nèi)圈故障樣本、外圈故障樣本及滾動(dòng)體故障樣本各200個(gè)。每個(gè)樣本的數(shù)據(jù)點(diǎn)為4 096個(gè)。將每一種狀態(tài)的樣本隨機(jī)選取一半用于訓(xùn)練,一半用于測試,即訓(xùn)練樣本和測試樣本均為400個(gè)。
用兩種方法構(gòu)造原始特征集。第一種首先計(jì)算原始振動(dòng)信號(hào)的均值、有效值、峰值、波形指數(shù)、波峰指數(shù)、沖擊指數(shù)、裕度指數(shù)、歪度指數(shù)及峭度指數(shù),然后由這9個(gè)時(shí)域特征組成原始特征集。第二種用經(jīng)驗(yàn)?zāi)J椒纸猓?5]構(gòu)造原始特征集,具體方法為首先使用經(jīng)驗(yàn)?zāi)J椒纸?,將原始振?dòng)信號(hào)分解為一系列本征模函數(shù)分量之和,由于滾動(dòng)軸承的故障信息主要包含在高頻段且分解得到的本征模函數(shù)分量依頻率從高到低排列,據(jù)大量實(shí)驗(yàn)分析、比較,發(fā)現(xiàn)前4個(gè)本征模函數(shù)分量一般包含了滾動(dòng)軸承故障的特征信息,因此選取前4個(gè)本征模函數(shù)分量并求其相應(yīng)的包絡(luò)譜,然后從各包絡(luò)譜中提取旋轉(zhuǎn)頻率、內(nèi)圈故障特征頻率、外圈故障特征頻率及滾動(dòng)體故障特征頻率的包絡(luò)譜值,其中每個(gè)包絡(luò)譜值均取4個(gè)本征模函數(shù)分量包絡(luò)譜中的最大值,最后用本征模函數(shù)分量的這4個(gè)包絡(luò)譜值形成原始特征集。
用KDA可獲得的子空間維數(shù)最高為C-1,其中C為樣本的類別數(shù)。在本文實(shí)驗(yàn)中,滾動(dòng)軸承樣本包括正常、內(nèi)圈故障、外圈故障及滾動(dòng)體故障4種類型,因此子空間的維數(shù)最高為3。為檢驗(yàn)本文方法的性能,同時(shí)使用KPCA,LDA與SVM進(jìn)行故障診斷。其中基于KPCA和LDA的故障診斷方法與KDA類似,即首先使用這兩種方法將原始特征集投影到一個(gè)三維子空間中,然后在相應(yīng)的子空間內(nèi)使用最近鄰方法進(jìn)行故障分類。實(shí)驗(yàn)中,所有核方法的核函數(shù)均選用高斯核函數(shù),KDA的核參數(shù)通過優(yōu)化同方差性準(zhǔn)則獲得,KPCA的核參數(shù),SVM的核參數(shù)及正則化參數(shù)均用十折交叉驗(yàn)證方法選取。
根據(jù)上述實(shí)驗(yàn)方法,對于KPCA,LDA與KDA首先用訓(xùn)練樣本的原始特征集求解各自的最優(yōu)子空間,然后將訓(xùn)練樣本和測試樣本的原始特征集分別投影到相應(yīng)的子空間,其中測試樣本的投影結(jié)果如圖4、圖5所示。圖4為時(shí)域特征的投影結(jié)果,圖5為包絡(luò)譜特征的投影結(jié)果。從兩圖中可以看出,對時(shí)域特征和包絡(luò)譜特征,KPCA和LDA的投影結(jié)果中均有一部分樣本發(fā)生了重疊,而在KDA的投影結(jié)果中四種狀態(tài)樣本相互分離,可分性均非常好。對上述三種方法進(jìn)一步基于投影后的樣本用最近鄰方法進(jìn)行故障分類,對SVM則直接基于原始特征集進(jìn)行故障分類,分類結(jié)果如表1、表2所示。表1為時(shí)域特征的診斷結(jié)果,表2為包絡(luò)譜特征的診斷結(jié)果。由兩表可以看出,對時(shí)域特征和包絡(luò)譜特征,KDA的診斷結(jié)果均優(yōu)于KPCA和LDA的診斷結(jié)果,與SVM的診斷結(jié)果相當(dāng),且對各種狀態(tài)樣本的分類正確率均達(dá)到了100%。實(shí)驗(yàn)中,KDA作為一種監(jiān)督學(xué)習(xí)方法,在訓(xùn)練中利用了類標(biāo)號(hào)信息,因此故障診斷的性能明顯優(yōu)于無監(jiān)督的學(xué)習(xí)方法KPCA;同時(shí)由于KDA使用了核技巧,因此其故障診斷的性能同樣優(yōu)于線性方法LDA;與SVM相比,KDA獲得了同樣的故障診斷性能,但是通過引入同方差性準(zhǔn)則,KDA實(shí)現(xiàn)了核參數(shù)的自動(dòng)選取。
為進(jìn)一步說明同方差性準(zhǔn)則在優(yōu)化KDA核參數(shù)中的有效性,圖6、圖7給出了KDA用于時(shí)域特征時(shí)的參數(shù)優(yōu)化過程。圖6為同方差性準(zhǔn)則值隨迭代次數(shù)的變化過程:隨著迭代次數(shù)的增加,同方差性準(zhǔn)則的值逐漸增大,最終穩(wěn)定于一個(gè)最大值;圖7為分類識(shí)別率隨迭代次數(shù)的變化過程:隨著迭代次數(shù)的增加,分類識(shí)別率逐漸增加,最終達(dá)到100%。綜合圖6、圖7可以看出,分類識(shí)別率隨同方差性準(zhǔn)則值的增大而增加,在同方差性準(zhǔn)則值取最大時(shí),分類識(shí)別率達(dá)到最高,表明同方差性準(zhǔn)則可有效地用于KDA中的核參數(shù)優(yōu)化。
圖4 時(shí)域特征的投影結(jié)果Fig.4 Projective results of the time domain features
圖5 包絡(luò)譜特征的投影結(jié)果Fig.5 Projective results of the envelope spectrum features
表1 基于時(shí)域特征的診斷結(jié)果Tab.1 Diagnosis results based on the time domain features
表2 基于包絡(luò)譜特征的診斷結(jié)果Tab.2 Diagnosis results based on the envelope spectrum features
圖6 同方差性準(zhǔn)則的值隨迭代次數(shù)的變化過程Fig.6 The change process of the value of homoscedastic criterion with the number of iteration
圖7 識(shí)別率隨迭代次數(shù)的變化過程Fig.7 The change process of the recognition rate with the number of iteration
針對應(yīng)用KDA到機(jī)械故障診斷時(shí)核參數(shù)選取困難的問題,本文提出了一種基于貝葉斯最優(yōu)KDA的機(jī)械故障診斷方法。該方法通過優(yōu)化同方差性準(zhǔn)則可尋找到最優(yōu)核參數(shù),因此可有效地解決KDA中核參數(shù)的選取問題。將該方法應(yīng)用于滾動(dòng)軸承故障診斷,實(shí)驗(yàn)結(jié)果表明,該方法的故障診斷性能明顯優(yōu)于KPCA方法和LDA方法,與SVM方法的性能相當(dāng),而該方法可實(shí)現(xiàn)核參數(shù)的自動(dòng)選取,因此可進(jìn)一步提高故障診斷的自動(dòng)化水平。
[1]Muller K R,Mika S,Ratsch G,et al.An introduction to kernel-based learning algorithms[J].IEEE Trans.Neural Networks,2001,12(2):181 -201.
[2]袁勝發(fā),褚福磊.支持向量機(jī)及其在機(jī)械故障診斷中的應(yīng)用[J].振動(dòng)與沖擊,2007,26(11):29-35.
[3]Widodo A,Yang B S.Support vector machine in machine condition monitoring and fault diagnosis[J].Mechanical Systems and Signal Processing,2007,21(6):2560 -2574.
[4]李巍華,廖廣蘭,史鐵林.核函數(shù)主元分析及其在齒輪故障診斷中的應(yīng)用[J].機(jī)械工程學(xué)報(bào),2003,39(8):65 -70.
[5]胡金海,謝壽生,侯勝利,等.粗糙核主元分析方法及其在故障特征提取中的應(yīng)用[J].振動(dòng)與沖擊,2008,27(3):50-54.
[6]孫麗萍,陳 果,譚真臻.基于核主成分分析的小波尺度譜圖像特征提?。跩].交通運(yùn)輸工程學(xué)報(bào),2009,9(5):62-66.
[7]李巍華,史鐵林,楊叔子.基于非線性判別分析的故障分類方法研究[J].振動(dòng)工程學(xué)報(bào),2005,18(2):133-138.
[8] Bo L,Wang L,Jiao L.Feature scaling for kernel fisher discriminant analysis using leave-one-out cross validation[J].Neural Computation,2006,18(4):961 -978.
[9]Cai D,He X,Han J.Speed up kernel discriminant analysis[J].The VLDB Journal,2011,20(1):21 -33.
[10] Baudat G,Anouar F.Generalized discriminant analysis using a kernel approach[J].Neural Computation,2000,12(10):2385-2404.
[11] You D,Hamsici O C,Martinez A M.Kernel optimization in discriminant analysis[J].IEEE Trans.Pattern Analysis and Machine Intelligence,2011,33(3):631 -638.
[12] Mika S,Ratsch G,Weston.Fisher discriminant analysis with kernels[C].Proceedings of the 1999 IEEE Signal Processing Society Workshop,1999:41-48.
[13]梅宏斌.滾動(dòng)軸承振動(dòng)監(jiān)測與診斷[M].北京:機(jī)械工業(yè)出版社,1996.
[14] Bearing Data CenterWebsite. Case Western Reserve University[OL].http://www.eecs.cwru.edu/laboratory/bearing.
[15]褚福磊,彭志科,馮志鵬,等.機(jī)械故障診斷中的現(xiàn)代信號(hào)處理方法[M].北京:科學(xué)出版社,2009.