譚 巍,徐 健,張 睿
(1.中國人民解放軍海軍航空兵學院 飛行理論系,遼寧 葫蘆島 125001; 2.海軍駐沈陽地區(qū)發(fā)動機專業(yè) 軍事代表室,沈陽 110031;3.沈陽航空航天大學 機電工程學院,沈陽 110136)
基于核主成分分析的發(fā)動機性能衰退評估
譚 巍1,徐 健2,張 睿3
(1.中國人民解放軍海軍航空兵學院 飛行理論系,遼寧 葫蘆島 125001; 2.海軍駐沈陽地區(qū)發(fā)動機專業(yè) 軍事代表室,沈陽 110031;3.沈陽航空航天大學 機電工程學院,沈陽 110136)
針對發(fā)動機在使用過程中的性能衰退評估問題,提出了一種基于核主成分分析的發(fā)動機參數(shù)特征提取方法。通過對發(fā)動機性能衰退程度的分類,并與傳統(tǒng)的主成分分析方法相比,該方法能夠較好地解決航空發(fā)動機各參數(shù)之間存在的非線性問題,能夠在保留原始數(shù)據(jù)主要信息的基礎上獲得較好的降維效果,在處理小樣本非線性參數(shù)指標綜合和維數(shù)壓縮處理方面具有一定的推廣價值。
性能衰退;狀態(tài)評估;核主成分分析;主成分分析
發(fā)動機性能衰退評估是對其運行狀態(tài)的模式識別[1],其實質(zhì)是利用當前數(shù)據(jù)和歷史數(shù)據(jù),獲取發(fā)動機當前運行狀態(tài)的信息,識別發(fā)動機當前運行狀態(tài),為發(fā)動機的狀態(tài)監(jiān)控和后續(xù)的趨勢預測打下良好的基礎。張亮提出了一種基于粗糙核距離度量的復雜裝備健康評估方法,首先用粗糙集進行健康特征的約簡和權重系數(shù)的確定,以得到優(yōu)化的聯(lián)合健康特征向量,然后基于加權核距離度量進行健康狀態(tài)分類[2]。楊帆針對核主元分析方法只能實現(xiàn)故障診斷,但無法實現(xiàn)故障變量識別的問題,提出一種基于數(shù)據(jù)重構(gòu)的核主元分析的故障變量識別方法。采用改進的數(shù)據(jù)重構(gòu)方法對參數(shù)進行重構(gòu),然后利用故障識別指數(shù)對監(jiān)控參數(shù)進行故障變量識別[3]。
發(fā)動機在運行過程中,由于氣流通道污染引起性能衰退,會導致發(fā)動機氣路部件的特性變化,引起壓氣機抽氣能力、渦輪效率下降。特性參數(shù)的變化會導致轉(zhuǎn)速、流量、供油量、溫度、壓力等氣流通道的熱力性能參數(shù)發(fā)生變化[4]。這些監(jiān)測參數(shù)眾多,會對后續(xù)的模式分析造成維數(shù)災難問題。為解決這一問題,本文將核主成分分析應用到多維數(shù)據(jù)的約簡中,并使用相關數(shù)據(jù)對約簡效果進行了分析,最后通過發(fā)動機狀態(tài)分類結(jié)果驗證了核主成分分析方法的有效性。
主成分分析[5]是一種常用的特征提取、特征約簡方法,它利用特征向量方向上投影的子空間,得到主特征矢量。依據(jù)輸入變量的線性變換,由輸入變量的互相關矩陣的主要特征值大小確定坐標變換和變量壓縮,其目的就是在數(shù)據(jù)空間中找出一組正交矢量,它們最大可能地捕獲數(shù)據(jù)方差,以便將數(shù)據(jù)從原始的n維空間中映射到這組正交矢量所生成的m維子向量上,完成降維的任務,得到主特征矢量。但是,由于航空發(fā)動機結(jié)構(gòu)復雜,工作情況多變,再加以發(fā)動機中一些結(jié)構(gòu)的非線性,使得發(fā)動機的工作參數(shù)具有一定的非線性特征。通過上述基于線性變換的特征選擇方法提取的特征可能不再反映這種非線性特征,當數(shù)據(jù)間存在大量非線性關系時,主成分分析已不能滿足需求。為此,Scholkopf等人[6]在研究支持向量機的時候提出了一個新方法,那就是通過核函數(shù)方法將原始輸入向量映射到高維特征空間,然后在高維空間中對映射數(shù)據(jù)進行線性PCA計算,實現(xiàn)對數(shù)據(jù)維數(shù)的降低,這種方法稱為核主成分分析[7](Kernel Principal Component Analysis,KPCA)。
1.1 核主成分分析的基本原理
核主成分分析是通過使用“核技巧”將線性PCA 拓展為非線性PCA 的一種方法[8-9]。具體推導過程如下:
首先對原始數(shù)據(jù)中心化,將原始樣本集的核矩陣K用K來取代,即
(1)
式中,I表示n×n維的單位矩陣,ln表示n×n維的全1矩陣。
(2)
(3)
將每個樣本與式(3)做內(nèi)積,則有
λ(φ(xk)·▽)=(φ(xk)·C▽)
k=1,2,L,N
(4)
對于特征向量▽來說,可以用φ(xi)的線性組合表示為
(5)
合并式(4)和式(5)得到
(6)
定義一個m×m維的矩陣K,可以得到
Kij=(φ(xi)·φ(xj))
(7)
其中,α=(α1,L,αm)T,通過求解特征方程得到α
mλα=Kα
(8)
進一步得到式(5),為提取主成分,需要計算φ(x)在特征空間上的投影。
k=1,2,L,p
(9)
1.2 算法求解主要步驟
通過上述分析,可以看出該算法的流程為:
(1)首先對輸入樣本進行初始化,計算m×m維的核矩陣K={k(xi,xj)}。
(2)中心化核矩陣K,得到核矩陣K。
(3)求出核矩陣K的特征值和特征向量,并歸一化特征向量,得到高維空間中的特征向量主成分。
1.3 數(shù)據(jù)約簡判別準則
核主成分方法首先將在原空間中非線性不可分的數(shù)據(jù)映射到高維特征空間中,然后在該空間中利用線性PCA算法進行特征約簡。而Fisher判別函數(shù)[11]通過選擇使得Fisher準則函數(shù)達到極值的向量作為最佳投影方向,從而使得樣本在該方向上投影后,達到最大的類間離散度和最小的類內(nèi)離散度。因此,為了尋求優(yōu)化數(shù)據(jù)的約簡方法,可以借鑒Fisher判別函數(shù)思想。
Fisher判別準則是針對兩類數(shù)據(jù)的情況提出的。設訓練樣本集Ω中包含n個d維樣本{xi,yi},yi∈{1,-1},i=1,2,L,n,其中n1個屬于“+1”類的樣本記為X1,n2個屬于“-1”類的樣本記為X2,即
X1={x1i|(x1i,yi)∈Ω,yi=+1}i=1,2,L,n1
(10)
X2={x2i|(x2i,yi)∈Ω,yj=-1}j=1,2,L,n1
(11)
則這兩類在特征空間中的均值向量分別為
(12)
(13)
類間距離的平方為
(14)
X1內(nèi)離散度的平方為
(x1i,x1i)
(15)
同理,有
(16)
樣本的類內(nèi)離散度矩陣Si和總類內(nèi)離散度矩陣Sw為
(17)
Sw=S1+S2
(18)
樣本類間離散度矩陣Sb為
Sb=(m1-m2)(m1-m2)T
(19)
定義類內(nèi)類間距離為
(20)
根據(jù)Fisher準則的判別思想,(m1-m2)越大越好,Sb越小越好。因此,綜合來看,數(shù)據(jù)之間的類內(nèi)類間距離J(θ)越大,分類效果越好。
2.1 原始數(shù)據(jù)核主成分的構(gòu)建
本文選取發(fā)動機低壓壓氣機流量、高壓壓氣機流量、高壓渦輪效率、低壓渦輪效率、低壓轉(zhuǎn)子轉(zhuǎn)速、高壓轉(zhuǎn)子轉(zhuǎn)速、高壓壓氣機后壓力、尾噴口溫度共8維數(shù)據(jù),均為相對變化量。采用機理分析和發(fā)動機數(shù)學模型相結(jié)合的方法產(chǎn)生數(shù)據(jù)樣本[12-15],得到46組發(fā)動機性能衰退數(shù)據(jù),定義絕對值在0~0.2%變化的參數(shù)為性能正常的數(shù)據(jù)(分類記為-1);否則為性能衰退的數(shù)據(jù)(分類記為+1)。
采用支持向量機方法對發(fā)動機正常數(shù)據(jù)和性能衰退數(shù)據(jù)進行分類[16]。在分類之前,為了檢驗核主成分分析對數(shù)據(jù)的約簡能力,本文還選取了主成分分析方法處理原始數(shù)據(jù),以此作為對比。三種形式的數(shù)據(jù)分別為:原始數(shù)據(jù)、原始數(shù)據(jù)利用主成分方法得到的數(shù)據(jù)、原始數(shù)據(jù)經(jīng)核主成分分析得到的數(shù)據(jù)。其中,原始數(shù)據(jù)經(jīng)過主成分分析和核主成分分析后的結(jié)果分別見表1和表2。
表1 主成分分析結(jié)果
表2 核主成分分析結(jié)果
從表1和表2可以看出主成分分析和核主成分分析都可用于樣本數(shù)據(jù)的特征選擇,達到降低樣本數(shù)據(jù)維數(shù)的目的。但是核主成分分析主元數(shù)遠多于主成分分析的主元數(shù),核主成分分析有46個主元,而主成分分析只有8個主元,因此核主成分分析主元攜帶的信息更為全面、豐富;核主成分分析是從46個主元中選取需保留的主元,而主成分分析只是從8個主元中選取需保留的主元,并且按照累積貢獻率的大小來看,前3個主成分的累積貢獻率已經(jīng)達到99.9%,因此只需要選擇前面3個核主成分就可以達到與主成分分析一樣的效果[17],這樣可避免丟失較小的主元中可能包含的重要非線性特征信息,同時還不會帶來更多的噪聲信息,這說明核主成分分析能夠選擇更有利于數(shù)據(jù)分類的特征。
依據(jù)判別準則[18-19],類間距離越大對應分類效果越好。3種數(shù)據(jù)對應的類內(nèi)類間距離計算結(jié)果見表3。
表3 3種數(shù)據(jù)形式對應的類內(nèi)類間距離
從表3可以看出,原始數(shù)據(jù)形式與主成分分析的方法得到的類內(nèi)類間距離相同,這是因為主成分分析是對原始數(shù)據(jù)進行線性變換,并不能改變原始數(shù)據(jù)的類內(nèi)類間距離。而核主成分分析是非線性的,它利用核函數(shù)對原始數(shù)據(jù)進行了高維空間的特征映射[20],本文選擇高斯核函數(shù)作為核主成分分析的核函數(shù),經(jīng)計算,核主成分分析數(shù)據(jù)所對應的類內(nèi)類間距離最大,因此采用原始數(shù)據(jù)經(jīng)核主成分分析方法得到的數(shù)據(jù)進行分類會取得較好的效果。
2.2 分類結(jié)果分析
采用高斯核函數(shù)支持向量機方法對3種形式的數(shù)據(jù)進行分類。取前3個主成分在二維和三維情況進行分類,結(jié)果如圖1~圖6所示。
圖1 原始數(shù)據(jù)的二維分類結(jié)果
圖2 原始數(shù)據(jù)的三維分類結(jié)果
圖3 主成分分析數(shù)據(jù)的二維分類結(jié)果
圖4 主成分分析數(shù)據(jù)的三維分類結(jié)果
圖5 核主成分分析數(shù)據(jù)的二維分類結(jié)果
圖6 核主成分分析數(shù)據(jù)的三維分類結(jié)果
圖1、圖3和圖5分別是原始數(shù)據(jù)、主成分分析數(shù)據(jù)以及核主成分分析數(shù)據(jù)的二維分類結(jié)果,對于二維分類情況,三種數(shù)據(jù)形式在二維情況下,利用支持向量機方法都能得到很好的分類。圖2、圖4和圖6分別是原始數(shù)據(jù)、主成分分析數(shù)據(jù)以及核主成分分析數(shù)據(jù)的三維分類結(jié)果,從這三幅圖中可以看出,三種數(shù)據(jù)形式在三維分類情況下,原始數(shù)據(jù)、主成分分析的數(shù)據(jù)得不到很好的分類,而核主成分分析得到的數(shù)據(jù)仍能得到很好的分類。究其原因,在二維情況下,兩個主成分的線性趨勢較強,所以三種數(shù)據(jù)形式都能得到很好的分類;在三維情況下,三個主成分的線性趨勢變?nèi)酰蔷€性趨勢增加,雖然采取了主成分分析的方法,但主成分分析是一種線性變換,而性能衰退數(shù)據(jù)的非線性程度很強,所以對非線性主成分進行分類并不能得到很好的分類結(jié)果,圖4可以說明這點。而核主成分分析則把低維的非線性不可分關系變成高維的線性可分關系,從圖5和圖6可以看出,兩主成分和三主成分情況都呈線性分布趨勢。圖6指出對應核主成分分析的情況,性能衰退越嚴重,主成分參數(shù)離最優(yōu)分界面距離越遠,圖6三維分類中的主成分參數(shù)對應的衰退程度依次增大。
針對發(fā)動機性能衰退過程中的衰退程度的分類進行了研究,通過核主成分分析方法對發(fā)動機狀態(tài)數(shù)據(jù)進行了特征約簡,并對數(shù)據(jù)進行了分類,得出如下結(jié)論。
(1)相對于原始數(shù)據(jù)和經(jīng)主成分分析方法約簡后的數(shù)據(jù)來說,采用核主成分分析方法提取的特征主成分數(shù)據(jù)在二維和三維情況下都能對發(fā)動機的性能衰退狀態(tài)進行很好的分類。
(2)KPCA方法能較好的解決航空發(fā)動機各參數(shù)之間存在的非線性問題,能夠在保留原始數(shù)據(jù)主要信息的基礎上獲得較好的降維效果,具有一定的推廣價值。
(3)在對發(fā)動機進行性能衰退評估過程中,如何綜合發(fā)動機的各個性能數(shù)據(jù),建立反映發(fā)動機性能衰退的綜合指標,對于指導發(fā)動機工作人員掌握發(fā)動機工作狀態(tài)十分重要,在下一步的工作中要加強對這方面的研究。
[1]Lee J.Measurement of machine performance degradation using a neural network model[J].Computers In Industry,1996,30(3):193-209.
[2]張亮,張鳳鳴,杜純.復雜裝備健康狀態(tài)評估的粗糙核距離度量方法[J].計算機工程與設計,2009,30(18):4269-4271.
[3]楊帆,李應紅,石斌.一種基于數(shù)據(jù)重構(gòu)的KPCA故障識別方法[J].控制工程,2007,14(7):109-112.
[4]廉筱純,吳虎.航空發(fā)動機原理[M].西安:西北工業(yè)大學出版社,2001:101-104.
[5]歐陽成麗.基于主成分分析的航空發(fā)動機單元體性能辨識[D].天津:中國民用航空學院,2004:15-16.
[6]Scholkopf B,Smola A,Muller K.Nonlinear component analysis as a kernel eigenvalue problem[J].Neural Computation,1998,10(5):1299-1319.
[7]Cao L J,Chua K S,Chong W K,et al.A comparison of PCA,KPCA and ICA for dimensionality reduction in support vector machine[J].Neurocomputing,2003,55(1-2):321-33.
[8]胡金海,謝壽生,陳衛(wèi),等.基于核函數(shù)主元分析的航空發(fā)動機故障檢測方法[J].推進技術,2008,29(1):79-83.
[9]孫麗萍,陳果,陳立波,等.基于KPCA的航空發(fā)動機滑油濾磨屑圖像識別[J].機械科學與技術,2010,29(6):731-736.
[10]李岳,溫熙森,呂克洪.基于核主成分分析的鐵譜磨粒特征提取方法研究[J].國防科技大學學報,2007,29(2):113-116.
[11]何學文.基于支持向量機的故障智能診斷理論與方法研究[D].長沙:中南大學,2004:46-65.
[12]尹大偉.某型發(fā)動機模型修正研究[D].煙臺:海軍航空工程學院,2007:89-105.
[13]馮廣斌,吳震宇,袁惠群.基于混沌理論與SVM的內(nèi)燃機振動信號趨勢預測[J].振動.測試與診斷,2011(1):64-69.
[14]胡金海,謝壽生,駱廣琦,等.基于支持向量機方法的發(fā)動機性能趨勢預測[J].推進技術,2005(3):260-264.
[15]郭磊.基于核模式分析方法的旋轉(zhuǎn)機械性能退化評估技術研究[D].上海:上海交通大學,2009:56-77.
[16]Dimogianopoulos D,Hios J,F(xiàn)assois S.Aircraft engine health management via stochastic modeling of flight data interrelations[J].Aerospace Science and Technology,2011(3):1-12.
[17]胡金海,謝壽生,駱廣琦,等.基于支持向量機方法的發(fā)動機性能趨勢預測[J].推進技術,2005(03):260-264.
[18]徐啟華,師軍.應用SVM的發(fā)動機故障診斷若干問題研究[J].航空學報,2005(6):961-967.
[19]許偉鴿,雷勇.某型航空發(fā)動機試車數(shù)據(jù)處理系統(tǒng)的設計[J].機械設計與制造,2008(12):73-75.
[20]李曉白,崔秀伶,郎榮玲.航空發(fā)動機性能參數(shù)預測方法[J].北京航空航天大學學報,2008(3):253-256.
(責任編輯:宋麗萍 英文審校:劉紅江)
ResearchontheassessmentofengineperformancedeteriorationbasedonKPCA
TAN Wei1,XU Jian2,ZHANG Rui3
(1.Flight Theory Department,Naval Aviation Academy,Huludao 125001,China; 2.Navy Station in Shenyang Military Representative Office on Engine,Shenyang 110031,China;3.Mechanical and Electrical Engineering Shenyang Aerospace University,Shenyang 110136,China)
In order to assess the engine performance deterioration,a method of extracting engine parameter features is presented based on Kernel Principal Component Analysis(KPCA).Compared with the traditional KPCA,this method proposes a new classification of deterioration to solve the nonlinear problems in parameters,which realizes the dimensionality reduction and the preservation of main information of original parameters.It is worth of promoting in the synthesis of small sample nonlinear parameter index and dimensionality reduction.
performance deterioration;state assessment;KPCA;PCA
2013-11-26
譚巍(1982-),男,湖北天門人,主要研究方向:發(fā)動機性能與測試,E-mail:twchy@sina.cn。
2095-1248(2014)03-0092-05
V235
A
10.3969/j.issn.2095-1248.2014.03.018