韓亞娟, 章露露, 雷小虎
(上海大學管理學院, 上海 200444)
航空發(fā)動機被稱為飛機的心臟,其健康狀況直接影響飛行的安全性。對發(fā)動機健康狀況進行準確評估,不僅能減少飛行事故,增強安全性,還可依此作出合理維修決策,提高經濟性。高揚等將熵權法引入灰靶技術,建立航空發(fā)動機狀態(tài)評估模型,該研究在評估時僅考慮了各指標的客觀權重。崔建國等將層次分析法與熵權法結合,同時考慮了主、客觀權重,建立了基于模糊灰色聚類的發(fā)動機健康評估模型,提高了健康評估的準確性。然而,熵權法在計算指標客觀權重時,忽略了指標間的相關性信息。Wang等利用模糊層次分析法和模糊聚類分析法分別確定指標的主、客觀權重,進而基于逼近理想解的排序法(technique for order preference by similarity to an ideal solution,TOPSIS)對發(fā)動機健康狀況進行評估,提高了健康評估分類準確性。Li等將航空發(fā)動機健康評估問題歸為一個多準則決策問題,提出了一個兩步評估模型。該模型首先利用模糊層次分析法確定多個評估標準的相對權重,進而考慮評估者的態(tài)度偏好,使用TOPSIS確定發(fā)動機的排序。然而,TOPSIS方法在插入新的樣本計算時,會產生逆序問題。
部分學者基于相似性度量評估航空發(fā)動機的健康狀況。楊洲等針對評估中的多工況、非線性和小子樣問題,提出評估發(fā)動機健康狀況的變精度粗集決策方法,其利用交叉信息熵確定屬性客觀權重,根據專家經驗和運行工況確定屬性主觀權重,最終形成基于綜合權重的加權相似性度量方法。Sun等通過分析發(fā)動機無故障狀態(tài)和當前狀態(tài)的狀態(tài)信息,提出利用相似性指數評估單個航空發(fā)動機的運行可靠性。張春曉等利用Holt雙參數指數平滑方法,建立基于機載快速存取記錄器數據的對稱發(fā)動機性能參數的差異監(jiān)控模型,可有效識別發(fā)動機運行狀態(tài),預測發(fā)動機故障征兆。張研等通過度量待測樣本數據與歷史數據的相似性,判斷發(fā)動機的健康狀態(tài),并預測發(fā)動機的剩余使用壽命。該類方法判斷準確性與歷史數據的數量相關,且當出現新的故障模式時,判斷準確性將會大幅下降。
航空發(fā)動機屬于典型的復雜系統,Lim等提出使用切換卡爾曼濾波器確定系統經歷的各種退化階段,進而對每個階段使用合適的卡爾曼濾波器進行剩余壽命預測,實現了對航空發(fā)動機剩余壽命和退化階段的連續(xù)和離散預測。彭宅銘等基于加權馬氏距離構建多指標融合成的健康指數模型,對發(fā)動機健康狀況進行評估。然而,強相關問題將使馬氏距離難以計算或很不準確。Wang等針對未標記、不平衡狀態(tài)監(jiān)測數據和預測過程不確定性帶來的問題,提出航空發(fā)動機剩余使用壽命的多元健康評估模型和多元多步提前長期退化預測模型,這種數據驅動的退化預測模型高度依賴于退化數據的數量和質量。Ma等提出一種數據驅動的航空發(fā)動機健康狀態(tài)評估框架,其基于密度距離聚類生成偽標簽,進而基于模糊貝葉斯風險模型分配權重和選擇特征。該評價方法擴展了健康狀態(tài)評估的維度和視角,更全面衡量發(fā)動機的健康狀態(tài)。另外,也有學者們采用機器學習類方法對發(fā)動機健康狀況進行評估,如支持向量機、隱馬爾可夫模型等,這類方法前期需要大量數據作為訓練集,且機器學習方法易出現過擬合問題,其推理過程和最終結果較難解釋。
方舜嵐提出使用離散度函數(function of degree of disagreement, FDOD)度量評估商業(yè)銀行的穩(wěn)健性,并與線性判別法和單層神經網絡法的分析結果進行對比,結果顯示FDOD度量的評估效果更好。韓亞娟提出使用FDOD度量代替馬氏距離函數作為綜合評價指標,并將FDOD度量與田口方法結合進行多維系統優(yōu)化降維,徹底解決多維系統優(yōu)化中的強相關問題。利用FDOD度量進行綜合評價時,需要的數據量小,評價結果更優(yōu),且有利于后期樣本異常原因的解釋。因此,本文擬采用FDOD度量對航空發(fā)動機健康狀況進行綜合評估,同時為了提高評估結果的準確性,擬對傳統FDOD度量進行改進。
FDOD度量由方偉武教授于1994年提出,通過度量多個序列/信息源間的信息離散度,來對序列進行比對分析,被用于度量一組序列間的差異程度。
定義一個序列∶=(,,…,),且
=2,3,…
(1)
則FDOD度量為
(2)
(3)
(4)
FDOD度量具有許多重要特性,如非負性、連續(xù)性、單調遞增性等,同時其也被證明是一種距離測度函數。早期FDOD度量主要被應用于多序列相似性比較,目前已擴展到調查表分析、多指標綜合評估等領域。
如文獻[17]所述,如果將多維系統的樣本(每一個樣本包含多項指標)作為一個信息源,用代表第個樣本的第項指標值,則可利用式(3)計算第個樣本相對于其余樣本的離散度。如果將正常參考樣本構成一個組,則可計算待測樣本相對于正常參考組的離散度。值越大,待測樣本偏離正常參考組越遠,待測樣本的異常程度越高。然而,分析式(3)可知,計算時僅考慮了各指標數據的離散程度,未考慮指標間的相關性和各指標的相對重要程度,降低了樣本綜合評價的準確性。因此,有必要對FDOD度量中的進行改進,全面考慮各指標的貢獻,以提高樣本綜合評價的準確性。
(5)
通過對式(3)分析可知,的計算已考慮了各指標數據的離散程度,但未涉及指標間的相關性信息,而此類信息客觀存在,因此需要進行客觀賦權。同時,各指標對樣本健康狀況的貢獻不同,因此還需要進行主觀賦權。綜上,本文將選用組合賦權法對FDOD度量進行改進。
目前,組合賦權主要分為兩大類:乘法合成和線性加法合成。乘法合成法是將主、客觀賦權法確定的權重對應相乘,再歸一化得到各指標的組合權重。該方法適用于指標個數較多且權重在指標間分配相對均勻的情況,當指標較少時會產生乘數倍增效應。線性加法合成法是將多種賦權方法求得的權重向量賦以權重系數進行加法合成,合成時需要考慮決策者對不同賦權方法的偏好;若決策者無明顯偏好,則需進一步確定不同賦權方法的權重系數。賦權方法權重系數的確定有多種方法,從是否考慮指標值角度可分為兩類:① 只考慮權重值,不考慮指標值;② 既考慮權重值,又考慮指標值。第一類方法求解結果完全不受指標值的影響,但受指標個數的影響,且穩(wěn)定性不足。第二類方法將權重值與指標值進行融合,通過建立基于不同目標的優(yōu)化模型進行權重系數的求解,歸納起來主要有3種模型:① 基于綜合評價值最大化的組合優(yōu)化模型;② 基于偏差最小化的組合優(yōu)化模型;③ 基于離差最大化的組合優(yōu)化模型。其中,基于綜合評價值最大化的組合賦權法是在綜合決策結果最優(yōu)的原則下求解主、客觀賦權的權重系數。該方法從評價結果層面求組合權重,更加靈活,解釋性更強,但未考慮評價對象之間的區(qū)分度。基于偏差最小化的組合賦權法是使組合權重評價值與單一賦權方法評價下的評價值之間的偏差盡可能小,以此建立模型求解主、客觀賦權方法的權重系數。該方法提高了組合評價結果與主、客觀賦權方法下評價結果之間的一致性,也未考慮評價對象之間的區(qū)分度?;陔x差最大化的組合賦權法是基于各評價對象之間的差異達到最大的思想,建立模型并求解使評價對象綜合評價值更加分散的權重向量,進而提高分類的準確率。該方法可以使最終得到的綜合評價值更加分散,便于區(qū)分。因此,本文擬采用基于離差最大化的組合賦權法確定各指標的最終權重。
序關系分析法(簡稱為G1法)的中心思想是對各指標的重要程度進行對比,確立指標間的序關系,得到指標的主觀權重。G1法不僅解決了層次分析法需要檢驗判斷矩陣一致性的問題,而且根據指標重要度來遞歸排序,保證了思維過程的穩(wěn)定性,賦權結果更加合理。因此,本文擬采用G1法獲得各指標的主觀權重,其具體步驟如下。
確定指標的重要性排序
確定各指標的相對重要程度
表1 指標重要性評分量表Table 1 Index importance rating scale
(6)
計算各指標的權重
(7)
式中:上標“(1)”代表G1法。接著,逆序計算剩余指標的權重:
(8)
因子分析法由Spearman教授提出,通過分析指標的相關性矩陣,將多指標綜合成少數因子,以再現原始指標之間的相對影響程度及其對綜合評價值的影響程度,也即各指標的權重值。因子分析法能較好地反映指標間的相關性信息,彌補FDOD度量在進行綜合評價時未考慮相關性信息的不足。因此,本文擬采用因子分析法求取各指標的客觀權重,其計算步驟如下。
數據標準化處理
設有個樣本,項評價指標,表示第個樣本的第項指標值。為了消除指標量綱不同帶來的影響,對進行標準化處理:
(9)
利用標準化后的數據,計算相關矩陣
求的特征值和特征向量
用Jacobi方法求的特征值(=1,2,…,)和相應特征向量(=1,2,…,)。其中,≥≥…≥>0。
選取主因子,建立初始因子載荷矩陣
(10)
式中:為第項指標在第個因子處的載荷。
對初始因子載荷矩陣進行旋轉變換
如果某個指標同時在多個主因子上有較大載荷,將導致主因子的實際含義模糊不清,此時需對進行旋轉變換,使得指標僅在一個主因子上有較大載荷。旋轉變換后新的因子載荷矩陣為=()×。
建立因子模型
利用因子載荷矩陣,建立因子模型=+。其中,=(,,…,),為公共因子矩陣,為特殊因子矩陣。
計算主因子得分
根據因子模型,將主因子表示為指標的線性組合,如下所示:
(11)
求各指標的權重
根據矩陣得到:
(12)
(1) 模型構建
基于離差最大化的組合賦權法由王應明教授提出。該方法通過建立一個使各賦權方法下的結果值之間距離達到最大的模型,求得各單一賦權方法的權重系數,進而將各單一賦權法求得的權重組合起來,得到各指標的組合權重值。
設有個評價對象,項評價指標,評價對象集為={,,…,}。有種賦權方法,構成賦權方法集={,,…,}。若對象在單一賦權方法下的評價值為,則可得評價結果矩陣=()×(=1,2,…,;=1,2,…,)。設=[,,…,]為各單一賦權方法進行組合時的權重系數向量,為的權重系數。
設為單一賦權方法下評價對象與的離差,則
=|-|
(13)
組合賦權下評價對象與的離差為
(14)
所有評價對象的總離差為
(15)
基于離差最大化思想,構建組合賦權下的最優(yōu)化模型為
(16)
(2) 模型求解
運用拉格朗日函數求解,得到權重系數:
(17)
(18)
(3) 確定組合權重
(19)
由此,通過基于離差最大化的組合賦權法得到指標的組合權重為[,,…,]。
利用改進FDOD度量來綜合評估航空發(fā)動機的健康狀況,其具體步驟如下。
根據要求,將數據規(guī)范化。
對于效益型指標(越大越好型),進行規(guī)范化:
(20)
對于成本型指標(越小越好型),進行規(guī)范化:
(21)
求各指標的組合權重。
首先,分別采用G1法和因子分析法確定各指標的主、客觀權重;接著,基于離差最大化的組合賦權法求得各指標的組合權重。
利用Jackknife方式,根據式(5)計算所選取發(fā)動機與各類發(fā)動機的信息離散度,并按照最近鄰原則進行分類。
統計分類準確率。
利用改進FDOD度量對航空發(fā)動機健康狀況進行綜合評估,具有如下優(yōu)點。
(1) 對數據要求少。
(2) 不受多重共線性的影響,同時又考慮了指標間的相關性信息,提高了分類準確率。
FDOD度量在計算過程中不涉及相關矩陣及逆矩陣,因此不受多重共線性影響。利用因子分析法對指標進行客觀賦權,又考慮了指標間相關性信息,提高了樣本評價準確度和分類準確率。
本文選用仿真模型C-MAPSS生成的數據集作為樣本數據。該仿真數據包含4組數據,每組數據均包含訓練集和測試集。本文選取訓練集FD001,該數據集包含100臺發(fā)動機,記錄了每臺發(fā)動機從正常運行到完全故障停止運行期間的所有飛行循環(huán)數據。選取每臺發(fā)動機的第一條數據作為健康樣本,最后一條數據作為故障樣本。因此,本文有100條健康樣本數據和100條故障樣本數據。所有發(fā)動機的檢測數據均包含21項性能指標和3項狀態(tài)指標。
發(fā)動機結構復雜,不同指標將反映不同方面的信息。如果指標過少,將難以全面反映發(fā)動機的健康狀況。然而,并不是指標越多越好,過多指標將造成信息冗余,甚至給評價帶來干擾。學者們基于C-MPASS平臺生成的數據集進行了航空發(fā)動機相關研究,周俊提出一種基于信息理論的指標選擇方法,從21項性能指標中選擇了6項;Wang等先是根據數據集中所有指標的時間序列數據走勢選擇了11項指標,而后進一步選擇若干指標進行組合,最后選出了使剩余壽命預測更準確的7項指標作為評價指標。本文基于上述文獻和對數據的預處理分析,從21項性能指標中選取了7項性能指標進行發(fā)動機健康狀況評估,如表2所示。
表2 航空發(fā)動機健康狀況評估指標Table 2 Aero-engine health status evaluation index
(1) 對原始數據進行規(guī)范化與歸一化處理
當發(fā)動機有故障發(fā)生或者壓氣機、渦輪效率下降時,在同樣初始條件下,燃油流量和排氣溫度就會升高,導致指標,,,,的值變大,指標和的值變小。另外,通過對FD001中的時間序列數據進行分析可以看出,隨著故障程度的加深,指標,,,,的值總體趨勢逐漸變大,而指標和的值則逐漸變小。由此可見,指標,,,,屬于成本型,可采用式(20)進行規(guī)范化處理;指標和屬于效益型,可采用式(21)進行規(guī)范化處理。之后,再對數據進行歸一化處理。
(2) 確定指標權重
首先,專家根據經驗確定上述7項指標的序關系,參照表1得到相鄰指標之間的重要性比值,根據式(7)和式(8)計算得到各指標的主觀權重,如表3第3列所示。
表3 基于G1法求得的主觀權重Table 3 Subjective weight based on G1 method
其次,利用因子分析法得到指標(,,,,,,)的客觀權重:
最后,利用式(14)~式(20),得到指標(,,,,,,)的組合權重:
=[,,,,,,]=[0141, 0152, 0136, 0124, 0175, 0114, 0135]
(3) 利用Jackknife方式,將組合權重代入式(5)計算所選取發(fā)動機與各類發(fā)動機的信息離散度,并按照最近鄰原則進行分類,其分類準確率如表4所示。
表4 分類準確率Table 4 Classification accuracy
由表4可知,健康發(fā)動機樣本數據的分類準確率達到93%,故障發(fā)動機樣本數據的分類準確率達到92%。
為了進一步說明改進FDOD度量的有效性,對比分析如表5所示。
表5 不同賦權方法下結果對比分析Table 5 Comparative analysis of results under different weighting methods
由表5可知,相比于傳統未加權FDOD度量,單一賦權法能提高綜合評估時的分類準確率,其中因子分析法賦權效果好于G1法;采用組合賦權法時,乘法合成法、基于決策者主觀偏好的線性加法合成法和基于綜合評價值最大化組合賦權法僅提高了健康樣本的分類準確率,故障樣本的分類準確率反而降低了,而提高故障樣本的分類準確率更有意義;基于偏差最小化組合賦權加權后兩類樣本的分類準確率均得到提高,但其均低于基于離差最大化組合賦權法加權后的分類準確率。由此可見,基于離差最大化的組合賦權法對FDOD度量的改進是最有效的,可以大幅度提高航空發(fā)動機分類的準確率。
本文重點研究了航空發(fā)動機健康狀況的準確評估問題。分析現有綜合評價方法,選擇FDOD度量對航空發(fā)動機健康狀況進行評估;分析傳統FDOD度量在綜合評價時的不足和各種賦權方法的優(yōu)缺點,選用基于離差最大化的組合賦權法對FDOD度量進行改進。首先,分別使用G1法和因子分析法確定各指標的主、客觀權重,接著基于離差最大化的組合賦權法確定組合權重,最后利用組合權重對傳統FDOD度量進行改進。對美國國家航空航天局提供的渦扇發(fā)動機性能仿真數據進行綜合評估與對比分析,結果驗證了本文所選用賦權方法的科學合理性,以及改進的綜合評估方法的有效性。在此基礎上,將進一步研究如何對識別出來的故障發(fā)動機進行潛在異常原因分析。