安 航,王 瑛,馮博宇
AN Hang,WANG Ying,FENG Bo-yu
(空軍工程大學(xué) 工程學(xué)院,西安 710038)
隨著現(xiàn)代科學(xué)技術(shù)的快速發(fā)展,以及軍事斗爭準備工作的不斷深入,飛機的使用強度越來越大。我國規(guī)定同型飛機的平均剩余壽命百分比不能低于一定的比例,為航空工程保障計劃的順利實施,需經(jīng)常安排好飛機的使用和保持最大數(shù)量的飛機處于良好狀態(tài),這就對飛機的使用壽命提出了更高的要求。飛機壽命資源的消耗量直接影響到壽命資源的存儲量(即可用飛行小時),飛機壽命資源存儲量是開展各種飛行活動和任務(wù)的根本基礎(chǔ)。因此,構(gòu)建模型實現(xiàn)對飛機壽命資源消耗量的準確預(yù)測,可以進一步完善飛機壽命管理方法,使得飛機做到物盡其用[1]。
目前針對飛機壽命的研究較多,文獻[2]研究了飛行強度對使用壽命的影響;文獻[3]研究分析了腐蝕環(huán)境對飛機結(jié)構(gòu)和使用壽命的影響;何宇廷提出了飛機結(jié)構(gòu)壽命包線的建立方法[4]。然而文獻中分析并預(yù)測在使用過程中飛機壽命資源消耗的論述較少,基于此,筆者融合粗糙集方法和人工神經(jīng)網(wǎng)絡(luò)技術(shù)各自的優(yōu)勢,在不改變樣本分類質(zhì)量的條件下,運用粗糙集理論約簡樣本指標,確定網(wǎng)絡(luò)輸入層變量和神經(jīng)元個數(shù)[5],建立基于粗糙集-神經(jīng)網(wǎng)絡(luò)的飛機壽命資源消耗量預(yù)測模型,并應(yīng)用這一非線性模型對飛機壽命資源消耗量進行了預(yù)測。
結(jié)合粗糙集屬性約簡的特點和神經(jīng)網(wǎng)絡(luò)對復(fù)雜函數(shù)全局逼近的優(yōu)勢[6],本文采用基于RS-BP神經(jīng)網(wǎng)絡(luò)的智能建模方法對飛機壽命資源消耗量進行預(yù)測。因為航空裝備的使用以及管理一般是成建制進行的,所以,在研究飛機壽命消耗量時,以機群為研究對象更有意義。首先全面考察影響飛機壽命資源消耗量的因素,然后使用粗糙集理論針對決策屬性來約簡條件屬性,從條件屬性中去掉對于決策屬性而言冗余的(或相對不重要的)屬性,隨后我們將這些約簡后的條件屬性(影響因素)和決策屬性(消耗量)作為神經(jīng)網(wǎng)絡(luò)的輸入和輸出數(shù)據(jù)進行訓(xùn)練,最終得到影響因素和飛機壽命消耗量之間的映射關(guān)系。構(gòu)建基于RS-BP神經(jīng)網(wǎng)絡(luò)模型的步驟如圖1所示。
圖1 基于RS-BP神經(jīng)網(wǎng)絡(luò)建模流程
由于現(xiàn)實中所采集數(shù)據(jù)的度量單位不同,各維數(shù)據(jù)值相差也較大,如果不對這些數(shù)據(jù)進行處理或選擇,而直接用粗糙集算法進行屬性約簡,勢必會造成效率較低,所以在使用約簡算法前,應(yīng)先將原始數(shù)據(jù)進行規(guī)范化處理。
最小-最大規(guī)范化方法:
假定min和max分別為變量的最小值和最大值,通過
可將的區(qū)間映射到[0,1]區(qū)間。這里的x1f,x2f,…,x1f是的f幾個度量值。
由于粗糙集理論無法直接使用連續(xù)型數(shù)據(jù),所以在使用粗糙集理論進行屬性約簡前需先對具有連續(xù)值特征的屬性進行離散化。經(jīng)過離散化之后,原來的決策系統(tǒng)被一個新的決策系統(tǒng)所代替,且不同的斷點集會將決策系統(tǒng)轉(zhuǎn)換成不同的決策系統(tǒng)。由于最終的決策屬性值均為一維的,故對決策列采用較為簡單且成熟的K-means值聚類法進行離散化[7]。
粗糙集理論中對連續(xù)屬性離散化的方法很多,在這里采用苗奪謙[8]提出的基于動態(tài)層次聚類的連續(xù)屬性離散化算法。其的指導(dǎo)思想是在保證離散后的決策表應(yīng)當同離散化前一樣保持其相容性的前提下,尋找使得約簡效率最高的聚類劃分。該算法無需事先指定聚類的數(shù)目,而是根據(jù)聚類后的決策表相容度的限制條件、聚類的距離閥值實現(xiàn)自動聚類。
通過屬性約簡可以去除冗余的或?qū)勖牧款A(yù)測結(jié)果影響不大的屬性,以減少屬性數(shù)目,提高分析效率。文獻[9]提出的基于系統(tǒng)正域的屬性主要性的數(shù)據(jù)約簡方法,盡管不能保證一定能夠找到系統(tǒng)信息的最優(yōu)解,但筆者認為依據(jù)單個屬性重要的約簡算法依然具有合理性。其算法得到的約簡即使不是最優(yōu)約簡,健壯性和穩(wěn)定性也是較好的。因此本文采用基于屬性重要性的約簡方法作為粗糙集的數(shù)據(jù)約簡算法。具體步驟如下:
1)REDU=核;
2)候選屬性集AR=C-REDU;
3)找出AR中具有最大屬性重要性SGF (a,R,D)的屬性a;
4)如果有多個屬性ai(i=1,,m)具有相同的最大重要性,則選取與REDU具有最小屬性取值組合的屬性ai;
5)REDU=REDU ? {aj};AR=AR - {aj};
6)如果K(REDU,D)=1,則算法中止,否則轉(zhuǎn)回3)。
應(yīng)用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)[10]的詳細步驟如圖2所示。
圖2 GA-BP算法詳細步驟
由上一節(jié)屬性約簡所確定的屬性數(shù)量作為網(wǎng)絡(luò)輸入向量,接下來則要考慮網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計,由于影響網(wǎng)絡(luò)泛化能力的因素與研究問題的復(fù)雜程度、網(wǎng)絡(luò)結(jié)構(gòu)的選擇等諸多因素有關(guān),因此BP網(wǎng)絡(luò)結(jié)構(gòu)的確定要根據(jù)實際問題來決定。
1.4.1 網(wǎng)絡(luò)結(jié)構(gòu)的確定
一個S型隱含層加上一個線性輸出層的BP網(wǎng)絡(luò),能夠逼近任何在閉區(qū)間內(nèi)的一個連續(xù)有理函數(shù)[11],因而一個三層的神經(jīng)網(wǎng)絡(luò)就具有模擬任意復(fù)雜的非線性映射的能力,并且可以通過增加隱含層神經(jīng)元的個數(shù)來提高網(wǎng)絡(luò)的精度。
隱含層神經(jīng)元個數(shù)的確定目前還沒有統(tǒng)一的方法,本文采用試算法來確定隱含層的神經(jīng)元個數(shù):開始根據(jù)經(jīng)驗公式使用很少的隱含層神經(jīng)元數(shù)對網(wǎng)絡(luò)進行訓(xùn)練和測試,然后不斷增加隱含層神經(jīng)元數(shù),比較不同訓(xùn)練和測試的結(jié)果,最終選取合適的隱含層神經(jīng)元個數(shù)。
1.4.2 采用GA算法優(yōu)化權(quán)值和閥值
BP神經(jīng)網(wǎng)絡(luò)采取的權(quán)值更新方法為最速梯度下降法,其缺陷是容易陷入局部極小、收斂速度慢[12]。本文采用遺傳算法來優(yōu)化初始權(quán)值、閥值,主要步驟如下:
1)種群初始化,包括交叉概率Pc、交叉規(guī)模、突變概率Pm以及初始化w1ij、w1jk、q1j和q1k進行;采用實數(shù)編碼,初始種群取50各個體均是由w1ij、w1jk、q1j和q1k四部分組成的實數(shù)串;
2)各個體評價函數(shù)計算,進行各個體排序。按照下式概率值進行網(wǎng)絡(luò)個體的選擇。
其中為個體的適配值,可用誤差平方和E來衡量,即:
其中,i=1,2,…,N為染色體數(shù);k=1,…,4為輸出層節(jié)點數(shù),本文中k取1;p=1,…,10為訓(xùn)練樣本數(shù);Tk為預(yù)期輸出值。
3)按照概率Pc對個體Gi和Gi+1交叉操作,從而產(chǎn)生新個體和,未進行交叉操作的個體,則直接進行復(fù)制。
4)運用概率Pm突變,從而產(chǎn)生Gj的新個體;
5)將新個體插到種群P中,并且計算其評價函數(shù);
6)計算誤差平方和,如果達到預(yù)定值εGA,那么轉(zhuǎn)(7)。反之,則轉(zhuǎn)入(3),繼續(xù)執(zhí)行遺傳操作;
7)將GA輸出的優(yōu)化初值作為閾值和初始權(quán)值。再用BP算法訓(xùn)練網(wǎng)絡(luò),直到達到指定精度εBP(εBP<εGA)。
1.4.3 預(yù)測結(jié)果評價參數(shù)
選擇平均相對誤差MAPE、相關(guān)系數(shù)R、輸出數(shù)據(jù)可行度Z三個參數(shù)來評價神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果的預(yù)測精度。因為它們既不受樣本規(guī)模的影響,又不受樣本單位的制約,便于將預(yù)測結(jié)果與前面的線性預(yù)測方法進行對比,其公式表示為:
其中xi代表模型模擬輸出值,yi表示實測值。平均相對誤差MAPE反映了預(yù)測值的總體質(zhì)量,相關(guān)系數(shù)R反映了觀測值的變化對預(yù)測值的影響,輸出數(shù)據(jù)可信度Z反映了預(yù)測值在給定的可信度內(nèi)的分類精度。
運用具體數(shù)據(jù)和已建立的模型,預(yù)測飛機壽命資源的消耗量。選取某單位2007-2009每月飛行數(shù)據(jù),對原始數(shù)據(jù)進行變換處理后如表1所示。
結(jié)合實地調(diào)研結(jié)論,將影響飛機壽命資源消耗量的因素歸納為以下5種,即:當月飛行訓(xùn)練消耗量M、惡劣天氣占當月的比例U、調(diào)出飛機消耗量N、事故P、機務(wù)素質(zhì)差的機務(wù)人員所占的比例Q。
將表1中原始數(shù)據(jù)預(yù)處理后,使用K-means法和文獻[8]中的算法對決策屬性和條件屬性進行離散化。將決策屬性(飛機壽命資源消耗量)和條件屬性(當月飛行訓(xùn)練消耗量、惡劣天氣占當月的比例、調(diào)出飛機消耗量、事故、機務(wù)素質(zhì)差的機務(wù)人員所占的比例)進行分類從而將連續(xù)屬性離散化,離散結(jié)果如下:
每月飛機壽命總消耗量:{1:[0,0.059];2:[0.078,0.139];3:[0.167,0.227];4:[0.307,0.394];5:[1,1]}。
當月飛行訓(xùn)練消耗量:{1:[0,0.195];2:[0.3,0.356];3:[0.388,0.455];4:[0.598,0.758];5:[0.825,1]}。
惡劣天氣占當月的比例:{1:[0,0.221];2:[0.279,0.485];3:[0.618,0.765];4:[0.824,1]}。
調(diào)出飛機的壽命消耗量:{1:[0,0];2:[0.531,0.766];3:[0.813,1]}。
機務(wù)素質(zhì)差的機務(wù)人員所占的比例:{1:[0,0.077];2:[0.154,0.269];3:[0.462,0.731];4:[0.769,1]}。
對于飛行事故,可將其屬性值量化為1、2。其中1表示沒有發(fā)生飛行事故,2表示發(fā)生飛行事故。
表1 某單位飛機壽命消耗統(tǒng)計數(shù)據(jù)
屬性約簡的步驟為,首先求出屬性規(guī)約集的核心,然后運用約簡算法計算歸約集,并根據(jù)某種評判標準確定最佳歸約集。
令D=決策屬性集={D}={L},C=條件屬性全集={C}={M,U,N,P,Q}
首先計算得到Card(POSC(D))=24,計算系統(tǒng)的核為:{當月飛行訓(xùn)練消耗量,惡劣天氣占當月的比例},由REDU={當月飛行訓(xùn)練消耗量,惡劣天氣占當月的比例},Card(POSCred(D))=14,而后計算其余屬性的重要性為:
SGF(N,REDU,D)=12/24,SGF(P,REDU,D)=3/24,SGF(POSCred(D))=3/24
屬性N的重要性最大,因此將該屬性加入到中,由于此時,因此算法中止。最終得到的屬性約簡結(jié)果為:{當月飛行訓(xùn)練消耗量,惡劣天氣占當月的比例,調(diào)出飛機消耗量}。
由上節(jié)粗糙集屬性約簡結(jié)果分析可知,網(wǎng)絡(luò)的輸入層節(jié)點數(shù)為3,輸出層節(jié)點數(shù)為1,下面需要確定隱層節(jié)點的個數(shù)。本文采用試湊法,先通過經(jīng)驗公式給出隱層節(jié)點數(shù),而后逐漸增加或減少隱層單元數(shù),最后依據(jù)網(wǎng)絡(luò)均方誤差最小的原則(或較快的收斂速度)確定網(wǎng)絡(luò)的隱層節(jié)點數(shù)。經(jīng)過驗證,當隱含層單元數(shù)為8時,訓(xùn)練誤差和學(xué)習(xí)步數(shù)都比較理想,因此網(wǎng)絡(luò)結(jié)構(gòu)為3-8-1,3個輸入層節(jié)點分別對應(yīng)當月飛行訓(xùn)練消耗量、惡劣天氣占當月的比例、調(diào)出飛機消耗量,8個隱層神經(jīng)元,1個輸出層節(jié)點對應(yīng)飛機壽命資源消耗量。
采用Matlab神經(jīng)網(wǎng)絡(luò)工具箱,取表1中前24組為訓(xùn)練樣本,后6組為檢驗樣本。在樣本訓(xùn)練過程中,種群規(guī)模50,遺傳代數(shù)110,交叉概率為0.7,變異率為0.01訓(xùn)練步數(shù)為1000,誤差為1.00E-13,當訓(xùn)練步數(shù)為144時,期望輸出值與實際輸出值的訓(xùn)練誤差達到設(shè)定要求,BP-GA網(wǎng)絡(luò)訓(xùn)練誤差變化如圖3所示。
圖3 訓(xùn)練誤差變化
為了檢驗網(wǎng)絡(luò)的泛化能力,取2009年1-6月的壽命消耗量數(shù)據(jù)對網(wǎng)絡(luò)進行檢驗。將數(shù)據(jù)歸一化處理后,用訓(xùn)練好的網(wǎng)絡(luò)進行預(yù)測,預(yù)測結(jié)果如表2所示。除6月份的預(yù)測結(jié)果外,其余相對誤差均在較低的水平。
為了驗證經(jīng)過粗糙集屬性約簡后的影響因素具有較高的可信度,取未經(jīng)過粗糙集約簡的全指標體系(當月飛行訓(xùn)練消耗量、惡劣天氣占當月的比例、調(diào)出飛機消耗量、事故、機務(wù)素質(zhì)差的機務(wù)人員所占的比例)作為輸入元素,輸出為飛機壽命資源消耗量,其他條件不變,網(wǎng)絡(luò)訓(xùn)練誤差變化如圖4,預(yù)測結(jié)果如表3所示。
表2 神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果
圖4 訓(xùn)練誤差變化
表3 神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果
圖5 神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果與實際結(jié)果對比
由圖5可以看出,兩種預(yù)測模型的預(yù)測結(jié)果與實測值的擬合度高,無論對于平穩(wěn)數(shù)列還是在有數(shù)據(jù)波動的情況下,都表現(xiàn)出良好的預(yù)測能力。
表4 預(yù)測結(jié)果比較
表4給出了經(jīng)過粗糙集屬性約簡的BP神經(jīng)網(wǎng)絡(luò)壽命消耗量預(yù)測模型,與沒有進行屬性約簡的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型的預(yù)測結(jié)果比較。兩種預(yù)測方法的可信度都為83.3%,經(jīng)過屬性約簡的神經(jīng)網(wǎng)絡(luò)模型的MAPE僅為4.11%,雖比未進行屬性約簡的BP預(yù)測模型的MAPE略高,但兩個模型的平均相對誤差均處于較低的水平,保證了模型預(yù)測的準確性。
1)利用粗糙集理論來化簡樣本及條件屬性,通過屬性約簡求核,篩選分析出了對飛機壽命資源消耗量影響較大的因素,從而簡化了網(wǎng)絡(luò)輸入變量的個數(shù),減少了網(wǎng)絡(luò)的訓(xùn)練時間,改善了學(xué)習(xí)的效率。
2)應(yīng)用實測數(shù)據(jù)進行仿真,結(jié)果表明,屬性約簡后的指標體系與原有全指標體系對于壽命消耗量的預(yù)測有同樣的效果,與實際值擬合度高,平均相對誤差小,通過粗糙集屬性約簡去除了對飛機壽命消耗影響不大的、冗余的因素,證明了粗糙集是神經(jīng)網(wǎng)絡(luò)樣本分析及處理的有效方法。
3)將粗糙集理論與GA-BP神經(jīng)網(wǎng)絡(luò)算法結(jié)合,應(yīng)用于飛機壽命消耗量預(yù)測的方法使得預(yù)測結(jié)果準確、可靠,具有較高的實用價值。此研究結(jié)果為下一步建立飛機壽命資源存儲量、消耗量、補給量之間的制約關(guān)系模型打下了基礎(chǔ)。
[1] 戚燕杰,呂志剛,劉馬寶. 壽命無極限:飛機壽命管理的技術(shù)革命[J]. 中國民航大學(xué)學(xué)報,2011,29(1): 29-34.
[2] 楊茂勝,陳躍良,郁大照. 考慮飛行強度影響的飛機使用壽命綜合評定方法[J]. 海軍航空工程學(xué)學(xué)報,2007,22(2): 257-260.
[3] 殷建新,宋智桃. 飛機結(jié)構(gòu)腐蝕與使用壽命研究[J]. 海軍航空工程學(xué)院學(xué)報,2005,20(6): 623-626.
[4] 何宇廷. 飛機結(jié)構(gòu)壽命包線的確定方法[J]. 空軍工程大學(xué)學(xué)報(自然科學(xué)版),2006,7(6): 1-3.
[5] Leung Y,Wu W Z,Zhang W X. Knowledge Acquisition in Incomplete Information Systems: A rough set approach [J].European Journal of Operational Research,2006,168(1):164-180.
[6] 陳小玉,張靜. 基于粗糙集-神經(jīng)網(wǎng)絡(luò)的變壓器故障診斷方法[J]. 制造業(yè)自動化,2011,33(9): 52-54.
[7] 王全,楊國梁. 一種改進的K平均聚類算法[J]. 國外電子元器件,2008,9: 73-74.
[8] 苗奪謙. Rough Set理論中連續(xù)屬性的離散化方法[J]. 自動化學(xué)報,2001. 5: 296-302.
[9] Thangavel K,PethalakshmiA.Dimensionality reduction based on rough set theory: a review[H]. Applied Soft Computing,2009,9: 1-12.
[10] 吳德勝,梁墚. 遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)及信用評價研究[J]. 中國管理科學(xué),2004,12(1): 68-74.
[11] 焦李成. 神經(jīng)網(wǎng)絡(luò)系統(tǒng)理論[M]. 西安: 西安電子科技大學(xué)出版社,1992.
[12] Tushman M,L. Hybrid Neural-Network Genetic-Algorithm Technique for Aircraft Engine Performance Diagnostics[J]. 2005,21(4): 42-45.