(海軍航空大學(xué)航空基礎(chǔ)學(xué)院 煙臺(tái) 264001)
飛機(jī)發(fā)動(dòng)機(jī)由上萬(wàn)個(gè)零件組成,各種問(wèn)題都有可能發(fā)生,高壓渦輪葉片在發(fā)動(dòng)機(jī)維修過(guò)程中,是修理費(fèi)用最為昂貴的零部件之一。軍用飛機(jī)與民用飛機(jī)最主要的區(qū)別在于經(jīng)常執(zhí)行各種不同強(qiáng)度作戰(zhàn)任務(wù),常常使發(fā)動(dòng)機(jī)在不同的工作狀態(tài)間反復(fù)變換,從而帶來(lái)葉片近千攝氏度的燃?xì)鉁囟?、高壓氣流和轉(zhuǎn)速發(fā)生激烈變化。處于這一環(huán)境下,葉片一旦接觸到空氣中的污染物就會(huì)發(fā)生化學(xué)反應(yīng),并隨著時(shí)間推移逐漸遭受腐蝕,從而造成葉片損傷。
為了確保高壓渦輪葉片的損傷不影響飛機(jī)的正常飛行,目前軍用飛機(jī)保障單位往往采取定期檢查的方式:將帶有微型攝像頭的專(zhuān)業(yè)探傷儀器深入發(fā)動(dòng)機(jī)內(nèi),并根據(jù)葉片的裂紋程度、材料丟失情況判定它的損傷程度如何、損傷等級(jí),從而決定葉片下次接受檢查的時(shí)間,葉片損傷如果越嚴(yán)重,檢查的間隔時(shí)間就會(huì)越短,直到它最終達(dá)到送修標(biāo)準(zhǔn)。
這種依靠人工探傷的工作方式對(duì)于軍用飛機(jī)保障單位來(lái)說(shuō)效率相對(duì)較低,本文依據(jù)某型渦扇發(fā)動(dòng)機(jī)高壓渦輪葉片維修報(bào)告、零部件更換清單等各類(lèi)信息及歷史氣象信息,提出通過(guò)發(fā)動(dòng)機(jī)歷史運(yùn)行的數(shù)據(jù)及氣象數(shù)據(jù),進(jìn)行數(shù)據(jù)整理與分析,建立葉片損傷預(yù)測(cè)模型,提前預(yù)判每臺(tái)發(fā)動(dòng)機(jī)葉片的損傷情況,進(jìn)行預(yù)測(cè)性維修。建立葉片損傷預(yù)測(cè)模型,對(duì)于保障飛行安全、降低葉片損傷和報(bào)廢率,降低飛機(jī)的維護(hù)成本有著重大意義。
如何準(zhǔn)確地進(jìn)行預(yù)測(cè)性維修,除了有效的算法之外,最重要的就是能夠方便有效地獲取可靠數(shù)據(jù),獲取過(guò)程中需要注意兩類(lèi)問(wèn)題。
1)數(shù)據(jù)電子化。近兩年,軍用飛機(jī)保障單位的信息化程度普遍較低,涉及發(fā)動(dòng)機(jī)葉片維修數(shù)據(jù)和零部件更換清單數(shù)據(jù)的維修報(bào)告均為紙質(zhì)版。數(shù)據(jù)獲取過(guò)程中,首先需要將紙質(zhì)維修報(bào)告涉及的重要數(shù)據(jù)電子化,個(gè)別數(shù)據(jù)需要進(jìn)行人工校驗(yàn)。
2)數(shù)據(jù)收集。模型建立前需要為收集與發(fā)動(dòng)機(jī)葉片損傷相關(guān)聯(lián)的數(shù)百個(gè)參數(shù)數(shù)據(jù)。在進(jìn)行多變量分析法進(jìn)行排序篩選后,幾個(gè)關(guān)聯(lián)度最大的參數(shù)被最終確定,主要包括飛行時(shí)間、大修工時(shí)、氣流擾動(dòng)、溫度分布、維修頻率等。
目前常用的飛機(jī)發(fā)動(dòng)機(jī)葉片損傷預(yù)測(cè)模型主要是機(jī)器學(xué)習(xí)預(yù)測(cè)模型,主要有支持向量機(jī)(Sup?port Vector Machine,SVM)[1]、最小二乘支持向量機(jī)(Least Square Support Vector Machine,LSSVM)[2~4]、隨機(jī)森林(Random Forest,RF)[5~6]和 GBRT(Gradi?ent Boosting Regression Tree,GBRT)[5,7]等。LSSVM的優(yōu)點(diǎn)是能夠提高求解速度,降低計(jì)算復(fù)雜度,適用于負(fù)荷增長(zhǎng)較大時(shí)的預(yù)測(cè)情況,缺點(diǎn)是訓(xùn)練時(shí)間和難度較大,且對(duì)異常值的魯棒性不夠好[8]。隨機(jī)森林和GBRT兩種算法的本質(zhì)是樹(shù)型算法,優(yōu)點(diǎn)是對(duì)異常值的魯棒性好,需要的模型訓(xùn)練參數(shù)少,預(yù)測(cè)精度高,缺點(diǎn)是在負(fù)荷增長(zhǎng)較大時(shí)預(yù)測(cè)精度不高[8]。
多變量分析就是對(duì)各種因素進(jìn)行收集并分析,其基本原理是依據(jù)時(shí)序序列曲線變化趨勢(shì)的相似水平來(lái)判定其聯(lián)系密切與否[9~10]。增量式學(xué)習(xí)是在保存上一次訓(xùn)練結(jié)果的基礎(chǔ)上,對(duì)新加樣本進(jìn)行二次再學(xué)習(xí),即達(dá)到持續(xù)學(xué)習(xí)的效果,是目前解決大數(shù)據(jù)的重要方法之一[11~12]。增量式學(xué)習(xí)主要有兩個(gè)優(yōu)勢(shì):1)不須要保存之前的訓(xùn)練數(shù)據(jù),能夠減少儲(chǔ)存空間;2)現(xiàn)在時(shí)刻的樣本訓(xùn)練中須要借用之前的訓(xùn)練結(jié)果,能明顯縮短未來(lái)訓(xùn)練所需的時(shí)間,提高訓(xùn)練效率。
本文提出多變量選取與增量式隨機(jī)森林學(xué)習(xí)算法結(jié)合的預(yù)測(cè)方法,通過(guò)多變量分析法對(duì)影響發(fā)動(dòng)機(jī)負(fù)荷的各種變量進(jìn)行相關(guān)性分析,從而找出對(duì)發(fā)動(dòng)機(jī)損傷影響因數(shù)大的相關(guān)變量構(gòu)成訓(xùn)練集,通過(guò)隨機(jī)森林算法訓(xùn)練得到預(yù)測(cè)模型,再將待預(yù)測(cè)時(shí)刻最近一段時(shí)間的維修預(yù)測(cè)值與實(shí)際值構(gòu)成融合矩陣,使用隨機(jī)森林算法進(jìn)行增量式學(xué)習(xí),得到最終預(yù)測(cè)結(jié)果。本文將該方法應(yīng)用在某小型軍用飛機(jī)渦輪葉片每日總負(fù)荷強(qiáng)度預(yù)測(cè)中,通過(guò)構(gòu)建多變量與隨機(jī)森林算法結(jié)合的預(yù)測(cè)模型,達(dá)到預(yù)測(cè)性維修的目的。
在收集好各方的原始資料并對(duì)資料數(shù)據(jù)進(jìn)行再提取后,利用多變量分析法與增量式隨機(jī)森林算法進(jìn)行預(yù)測(cè)性維修的流程如圖1所示。
圖1 預(yù)測(cè)性維修流程圖
2.3.1 多變量的歸一化及變量選取
根據(jù)多變量統(tǒng)計(jì)的過(guò)程,首先應(yīng)當(dāng)選取統(tǒng)計(jì)變量所需數(shù)據(jù)。統(tǒng)計(jì)數(shù)據(jù)為某型號(hào)軍用飛機(jī)影響維修頻率的多變量數(shù)據(jù)統(tǒng)計(jì)信息表,由于篇幅有限,表1列舉出2018年按月統(tǒng)計(jì)數(shù)據(jù)。其中包括:損傷敏感性(飛行時(shí)間(小時(shí))、大修次數(shù),維修頻率)、熱應(yīng)力(天氣:氣流擾動(dòng)、溫度分布不均)。對(duì)于影響維修頻率的偶然損傷(斷裂韌性、應(yīng)力水平、裂紋擴(kuò)展、可能損傷尺寸、臨界損傷尺寸)不能預(yù)測(cè),所以不列在表中。這里只根據(jù)熱應(yīng)力和損傷敏感性對(duì)發(fā)動(dòng)機(jī)葉片負(fù)荷強(qiáng)度進(jìn)行預(yù)測(cè)。
在進(jìn)行發(fā)動(dòng)機(jī)葉片維修預(yù)測(cè)過(guò)程中,最重要的是分析影響發(fā)動(dòng)機(jī)葉片壽命的各變量。由于各個(gè)影響因素的度量單位不同,進(jìn)行相關(guān)性分析相對(duì)困難。為避免數(shù)據(jù)溢出同時(shí)提高訓(xùn)練的時(shí)間和精確度,在訓(xùn)練之前需要對(duì)訓(xùn)練樣本進(jìn)行處理以加快運(yùn)算速率。針對(duì)此問(wèn)題,需要按照式(1)對(duì)各個(gè)變量進(jìn)行[0,1]區(qū)間歸一化處理[13~14],歸一化后的數(shù)據(jù)統(tǒng)計(jì)表見(jiàn)表1。
表1 2018年影響預(yù)測(cè)性維修的多變量歸一化數(shù)據(jù)統(tǒng)計(jì)表
2.3.2 多變量與維修頻率相關(guān)性分析
通過(guò)對(duì)各個(gè)影響因素進(jìn)行分析得到,飛行時(shí)間與維修頻率之間相關(guān)系數(shù)為0.9531;大修工時(shí)與維修頻率之間的相關(guān)系數(shù)為0.8023;氣流擾動(dòng)與維修頻率之間的相關(guān)系數(shù)為0.9892;溫度分布與維修頻率之間的相關(guān)系數(shù)為0.9798,見(jiàn)表2。
表2 各影響因素與維修頻率相關(guān)系數(shù)表
各變量與維修頻率進(jìn)行相關(guān)性分析得到的相關(guān)性圖如圖2。
通過(guò)多變量與維修頻率之間的相關(guān)性分析可以選定飛行時(shí)間、大修工時(shí)、氣流擾動(dòng)、溫度分布這四個(gè)變量作為主要的影響因素使用。
特征值所選數(shù)據(jù)集包括歷史飛行時(shí)間、大修工時(shí)、氣流擾動(dòng)、溫度分布數(shù)據(jù)。這里,本文對(duì)氣象特征值相關(guān)的氣流擾動(dòng)和溫度分布數(shù)據(jù)進(jìn)行特征值分析,氣象特征值來(lái)自于中國(guó)氣象科學(xué)數(shù)據(jù)共享網(wǎng)提供的近3年的數(shù)據(jù)。氣流擾動(dòng)和溫度分布這兩項(xiàng)又包括溫度、氣壓、濕度、風(fēng)速等,不同因素對(duì)維修預(yù)測(cè)的影響程度強(qiáng)弱不同,需要進(jìn)行相關(guān)信息降序排列。圖3是氣象多變量特征值與維修負(fù)荷之間的相關(guān)信息按降序排列圖。在進(jìn)行模型搭建時(shí),需要充分計(jì)算各特征值相關(guān)信息進(jìn)行信息選取與輸入。
圖2 多變量與維修頻率相關(guān)性分析圖
圖3 氣象特征值與維修負(fù)荷降序排列圖
本文實(shí)驗(yàn)環(huán)境主要包括:阿里云服務(wù)器ECS,2核4G內(nèi)存50G磁盤(pán),操作系統(tǒng)為Windows 7。
首先進(jìn)行基于瞬時(shí)系統(tǒng)模擬程序軟件搭建數(shù)據(jù)中心研究對(duì)象的模型,然后利用PYTHON進(jìn)行聯(lián)合仿真,共311組數(shù)據(jù)用來(lái)進(jìn)行訓(xùn)練,并用實(shí)時(shí)的12組數(shù)據(jù)進(jìn)行測(cè)試,預(yù)測(cè)下一時(shí)刻維修概率值。如圖3所示。
需要注意的幾個(gè)環(huán)節(jié)有:
1)在虛擬機(jī)中安裝Linux;
2)配置Linux和Linux的目錄結(jié)構(gòu);
3)文件目錄操作命令;
4)安裝常用軟件。
1)根據(jù)第一步計(jì)算出的影響因素相關(guān)性大小進(jìn)行排序篩選出特征值。
2)固定好抽樣比例,按照抽樣比例從原始樣本中重復(fù)N次抽樣,得到N個(gè)樣本集。
3)融合矩陣的構(gòu)建。利用隨機(jī)森林算法對(duì)對(duì)待預(yù)測(cè)的前N次維修頻率進(jìn)行預(yù)測(cè),將預(yù)測(cè)值作為融合矩陣的特征值,與實(shí)際維修頻率M進(jìn)行融合,構(gòu)成融合矩陣。因?yàn)橛绊懸蛩刈兓哂蟹蔷€性特性,融合矩陣較小。增量式隨機(jī)森林算法是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,在小樣本和非線性情況下,使用增量式隨機(jī)森林算法對(duì)融合矩陣進(jìn)行學(xué)習(xí),仍然能保證較好的泛化能力。再使用隨機(jī)森林算法進(jìn)行增量式學(xué)習(xí),得到最終預(yù)測(cè)結(jié)果。
4)最終預(yù)測(cè)。通過(guò)前兩步得到的訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集輸入到融合矩陣決策模型中進(jìn)行預(yù)測(cè),得到最終預(yù)測(cè)結(jié)果。
表3 不同方案預(yù)測(cè)誤差MAPE數(shù)據(jù)對(duì)比%
本文通過(guò)實(shí)驗(yàn)對(duì)增量式隨機(jī)森林預(yù)測(cè)模型與LSSVM、GBRT和SVM三種不同算法構(gòu)成的預(yù)測(cè)模型進(jìn)行研究,分別采用多變量并排序方法與不進(jìn)行相關(guān)性分析兩種策略得到特征值。表3是對(duì)比幾種不同算法在維修頻率預(yù)測(cè)中的平均絕對(duì)百分比誤差(MAPE),根據(jù)結(jié)果得到結(jié)論:在相同的特征值選取方法情況下,利用增量式隨機(jī)森林算法比LSSVM算法的維修頻率預(yù)測(cè)MAPE減少了0.4%,維修峰值預(yù)測(cè)MAPE減少了0.6%。說(shuō)明該模型克服了LSSVM算法中訓(xùn)練時(shí)間和難度較大,對(duì)異常值魯棒性不好等缺點(diǎn),提高了在負(fù)荷增長(zhǎng)較大時(shí)預(yù)測(cè)精度不高的問(wèn)題,應(yīng)用更加自由。
本文以某型軍用飛機(jī)歷史維修數(shù)據(jù)為例,首次提出利用大數(shù)據(jù)平臺(tái)構(gòu)建多變量分析法與增量式隨機(jī)森林算法結(jié)合,構(gòu)建葉片損傷預(yù)測(cè)模型,并建立相應(yīng)數(shù)學(xué)模型。實(shí)驗(yàn)過(guò)程上,本文詳細(xì)分析各影響因素與維修頻率的相關(guān)性,合理選取特征值,輸入預(yù)測(cè)模型,通過(guò)多種方案的MAPE數(shù)據(jù)對(duì)比結(jié)果可知模型在訓(xùn)練集上表現(xiàn)出了較好的回歸效果,達(dá)到了提前預(yù)判每臺(tái)發(fā)動(dòng)機(jī)葉片的損傷情況的目的。通過(guò)對(duì)預(yù)測(cè)性維修的研究,提高了未來(lái)軍用飛機(jī)的預(yù)測(cè)性維修精度,對(duì)于保障飛行安全、降低葉片損傷和報(bào)廢率、降低機(jī)隊(duì)的維護(hù)成本有著重大意義。