錢 宇,張 恒,楊 俊
(中國民用航空飛行學院飛行技術(shù)學院,四川 廣漢 618307)
燃油作為不可再生能源,一直是航空公司和相關(guān)領(lǐng)域人員潛心研究的重要指標之一[1]。據(jù)統(tǒng)計,絕大多數(shù)航空公司的燃油消耗成本約占到航空公司總運營成本的40%,成為航空公司最大的運營成本[2]。航班的燃油攜帶量直接決定了航空公司運營成本,但實際飛行過程環(huán)境多樣,油耗影響因素復雜,各因素及其組合對油耗影響的貢獻難以區(qū)別界定[3],進而對燃油加載量的準確判斷造成影響。因此,進行燃油消耗誘因研究具有實際意義。
多元線性回歸模型是一種常用的分析方法,馬鈺等[4]采用多元線性回歸模型分析了2006-2016年的甘肅省民航數(shù)據(jù),對甘肅省民航客運量的影響因素進行相關(guān)研究;王澤坤等[5]用多元線性回歸法分析低空空域的利用現(xiàn)狀和對軍民航的影響因素,通過回歸模型輸出結(jié)果得出低空空域的可用性程度;石傳華[6]通過建立回歸方程,挖掘研究影響下降率的因素,最終得出了影響因素權(quán)重,為飛行品質(zhì)監(jiān)控提供了研究基礎(chǔ);陳斌等[7]在研究管制員疲勞時,應(yīng)用多元回歸預測模型分析疲勞和眼動指標,為管制員疲勞預警和檢測提供了技術(shù)支持;程明等[8]建立多元線性回歸模型,分析社會經(jīng)濟指標與民航安全的關(guān)聯(lián)度;Bartel和Young[9]采用高度和馬赫數(shù)構(gòu)建了TSFC(Thrust-specific Fuel Consumption Model)模型,提出了一種推力油耗模型;Turgut和Rosen[10]研究了下降階段低高度平飛過程影響燃油消耗的顯著因素,然后采用遺傳算法建立并優(yōu)化了燃油消耗模型;T.Baklacioglu[11]使用多元回歸模型,分析得出飛機爬升段高度、真空速與油耗的表達式。目前對燃油消耗誘因分析方面研究較少,多為定性研究或作為燃油消耗預測模型中次要部分進行簡要分析[12]。
研究以落地剩余油量為對象,利用相關(guān)性分析和主成分分析對影響落地剩余油量的多個參數(shù)進行篩選和降維,建立了多元線性回歸模型,得出各參數(shù)對落地剩余油量的影響程度。
燃油消耗涉及多個變量,且變量間相關(guān)性明顯,但變量數(shù)過大會對高效研究造成一定困難。為使研究問題得到簡化,降低建立模型的難度和復雜性,并保證模型的合理性,需先進行研究參數(shù)的選取。根據(jù)飛機實際運行中燃油消耗的特性,從快速存取記錄器 (Quick Access Recorder,QAR)中選取與落地剩余油量關(guān)聯(lián)度較高的17個參數(shù)進行研究。所選參數(shù)分為飛行軌跡類、飛行操縱類、氣象因素類和其它因素類等4類,具體分類情況見表1。
表1 燃油消耗影響參數(shù)的分類
相關(guān)性分析(Correlation Analysis, CA)指衡量不同變量間相互依賴、相互制約、相互影響程度的指標,主要用于實驗數(shù)據(jù)處理、管理標準的測定和經(jīng)驗公式的建立等。相關(guān)性分析模型建立過程如下:
3.1.1 皮爾遜(Pearson)相關(guān)系數(shù)
用來判斷不同變量間的相關(guān)關(guān)系,其計算公式如下
(1)
上式代表樣本的相關(guān)系數(shù),其中,n代表樣本個數(shù),xi,yi代表第i個樣本值,特點如下:
1)r∈[-1,1],當0<|r|<1時,表明兩個變量間存在相關(guān)關(guān)系,|r|值越大,相關(guān)性越強。若r>0,表明兩個變量為正相關(guān);若r<0,表明兩個變量為負相關(guān);
2)當r=0時,表明兩個變量不是線性相關(guān);
3)當|r|=1時,表明兩個變量關(guān)系可由直線方程描述;當|r|>0.5時,表明X與Y屬于中強相關(guān)。
3.1.2 相關(guān)系數(shù)的顯著性檢驗
需對相關(guān)系數(shù)計算結(jié)果進行顯著性檢驗,避免計算出的數(shù)值是由于抽樣誤差所導致的。具體檢驗步驟如下:
1)提出假設(shè)
原假設(shè)H0:β=0,兩個變量間不存在相關(guān)關(guān)系;
備擇假設(shè)H1:β≠0,兩個變量間存在相關(guān)關(guān)系。
2)計算檢驗的統(tǒng)計量
(2)
其中n為樣本數(shù)量,r為計算所得的皮爾遜相關(guān)系數(shù)。
3)進行決策。
根據(jù)給定的顯著性水平α(一般默認為α=0.05)和自由度df=n-2查t分布表,得出顯著性概率p值。若p>0.05,則接受原假設(shè),即r值無統(tǒng)計學意義;若p≤0.05,則拒絕原假設(shè),即兩變量之間有相關(guān)性。
主成分分析(Principal Component Analysis, PCA)是考慮個指標之間的相互關(guān)系,使用降維的方法將多個變量轉(zhuǎn)換為少數(shù)幾個互不相關(guān)的主分量,從而達到簡化研究的目的。主成分分析模型的建立過程如下:
1)原始數(shù)據(jù)的標準化處理。
在實際中,需對不同量綱的指標樣本進行標準化處理,使每個指標屬性均值為0,方差為1。處理公式如下
(3)
(4)
(5)
2)計算相關(guān)系數(shù)矩陣
(6)
(7)
3)計算特征值及單位特征向量。
首先解特征方程|λI-Rc=0,可用雅可比法(Jacobi)計算R的特征值λi(i=1,2,…,p)及其對應(yīng)的單位特征向量ei,并將特征值按由大到小的排序,即λ1≥λ2≥…≥λp,此處求出的特征向量ei為主成分表達式的系數(shù)。
4)計算主成分的貢獻率和累計貢獻率。
主成分的貢獻率
(8)
(9)
通常選取前m個主成分,使得累計貢獻率≥80%(或選取特征值>1的前m個主成分)。
5)計算主成分得分
(10)
式中i,j=1,2,…,p,ej為相應(yīng)主成分表達系數(shù),主成分的得分可用于進一步的誘因分析研究。
3.3.1 模型的建立
建立因變量y關(guān)于主成分z1,z2,…,zm的回歸模型
y=b0+b1z1+b2z2+…+bkzk+ε
(11)
3.3.2 模型參數(shù)的檢驗
3.3.2.1 回歸方程的顯著性檢驗(F檢驗)
1)提出假設(shè)。
原假設(shè)H2:b1=…bk=0;
備擇假設(shè)H3:b1,…,bk不全為0。
2)計算檢驗的統(tǒng)計量。
(12)
3)進行決策。
根據(jù)給定的顯著性水平α(一般默認為α.05),檢驗的拒絕域為F>Fα(k,n-k-1)。
3.3.2.2 回歸系數(shù)的顯著性檢驗(t檢驗)
1)提出假設(shè)
原假設(shè)H4:bj=0;
備擇假設(shè)H5:bj≠0(j=0,1,…,k)。
2)計算檢驗的統(tǒng)計量
(13)
式中,cjj是c=(xTx)-1對角線上第j(j=0,1,…,k)個元素。
3)進行決策。
根據(jù)給定的顯著性水平α(一般默認為α=0.05),檢驗的拒絕域為|tj|>tα/2(n-k-1)。
3.3.3 多重共線性診斷
(14)
3.3.4 殘差分析和異常值診斷
通過計算模型的標準化殘差值,并結(jié)合殘差直方圖和殘差正態(tài)概率圖,判斷殘差是否服從正態(tài)分布。然后再通過標準化殘差查找出異常值,并去除異常值。
3.3.5 輸出回歸表達式
去除存在異常值的數(shù)據(jù)組,重新建立回歸模型,輸入數(shù)據(jù),得到回歸模型輸出結(jié)果。
燃油消耗誘因分析模型算法框圖見圖1。
研究選取某航空公司空客A320執(zhí)飛“成都-三亞”航線的212組QAR數(shù)據(jù)作為樣本。通過相關(guān)性分析處理樣本數(shù)據(jù),得出參數(shù)與落地剩余油量的相關(guān)系數(shù)和對應(yīng)相關(guān)系數(shù)的顯著性檢驗值,具體輸出結(jié)果如表2。
表2 所選參數(shù)與落地剩余油量的相關(guān)性檢驗
通過對表2中得出的顯著性值和相關(guān)系數(shù)進行決策,剔除掉不符合要求的參數(shù),最終選擇8個與落地剩余油量相關(guān)度高的參數(shù)做進一步研究,篩選后得到的參數(shù)如表3。
表3 燃油消耗誘因模型的相關(guān)性分析
圖1 燃油消耗誘因分析模型算法框圖
將篩選后的參數(shù)進行主成分分析處理,以便得到更具代表性的主成分,進而達到降低輸入?yún)?shù)維度、簡化誘因分析模型的整體結(jié)構(gòu)。
4.2.1 KMO和巴特利特檢驗
主成分分析前,首先進行KMO(Kaiser-Meyer-Olkin)檢驗和巴特利特球體檢驗,考察變量間的偏相關(guān)性,判斷主成分分析效果。若KMO檢驗系數(shù)>0.5、巴特利特球形檢驗的顯著值<0.05時,證明主成分分析輸出結(jié)果滿足數(shù)據(jù)信度和效度要求,能對研究的燃油消耗誘因分析起代表性作用。
通過對參數(shù)樣本數(shù)據(jù)進行KMO和巴特利特檢驗,判斷得出研究中KMO和巴特利特檢驗均通過,具體KMO和巴特利特檢驗結(jié)果見表4。
表4 燃油消耗誘因模型的KMO和巴特利特檢驗
4.2.2 主成分提取
圖2為主成分分析輸入?yún)?shù)之間的相關(guān)系數(shù)矩陣圖。圖中橢圓塊形狀代表兩個變量的線性相關(guān)度,值越接近1,橢圓越圓;值越接近0,橢圓越扁。從相關(guān)系數(shù)矩陣圖來看,變量之間的相關(guān)性比較強,的確存在信息上的重疊,該結(jié)果進一步確認了信息濃縮的必要性。
圖2 誘因模型輸入?yún)?shù)相關(guān)系數(shù)矩陣圖
通過對不同量綱的參數(shù)原始數(shù)據(jù)進行標準化處理,然后對處理后的標準化數(shù)據(jù)進行主成分分析,得到總方差解釋表和主成分貢獻圖,具體結(jié)果見表5和圖3。
圖3 燃油消耗誘因模型的主成分貢獻圖
表5 燃油消耗誘因模型的主成分總方差解釋
成分總計方差的%累積%總計方差的%累積%60.4015.00897.22470.2222.77599.99986.17E-50.001100.000
由總方差解釋圖和主成分貢獻圖輸出結(jié)果知,前4個主成分的特征值大于1,并且前4個主成分的累計方差貢獻率達到83.944%(大于80%),因此研究提取前4個主成分,相應(yīng)的主成分系數(shù)矩陣見表6。
表6 燃油消耗誘因模型的主成分系數(shù)矩陣
4.2.3 計算主成分表達式
由表6中主成分系數(shù)矩陣的輸出結(jié)果,可分別得出主成分的表達式,具體如下:
z1=0.965x4-0.963x7+0.891x14+0.231x17
z2=-0.889x2+0.871x10+0.230x16
z3=0.211x10+0.109x14+0.734x16+0.812x17
z4=-0.107x4+0.112x7-0.117x10+0.927x15-0.379x16+0.221x17
將得到的主成分表達式作為多元線性回歸模型的輸入,進行建模研究。
4.3.1 模型的建立
在模型建立過程中,提取的主成分為自變量,落地剩余油量為因變量。采用“步進法”,即先算出每個自變量對因變量的影響值,把影響值最大的變量引入模型之中,然后重復此過程,直至引入所有變量為止。本研究中根據(jù)得到的非標準化系數(shù)B數(shù)值可知,逐步建立的四個回歸模型如表7。
表7 燃油消耗誘因分析的回歸模型系數(shù)
由表7可得知,得出回歸模型表達式如下:
y=0.461z3+0.382z4-0.343z2-0.185z1
4.3.2 參數(shù)檢驗和共線性診斷
四個回歸模型的方差分析見表8。
表8 燃油消耗誘因的回歸模型方差分析
由表8中輸出結(jié)果可知,F(xiàn)1,F(xiàn)2,F(xiàn)3,F(xiàn)4分別為56.715,58.430,63.068,53.957;p1, p2, p3, p4均小于0.001;回歸方程顯著性檢驗通過。
由表7中t檢驗輸出結(jié)果可知,四個回歸模型中,常量不滿足顯著性要求(剔除),四個主成分自變量的檢驗值均小于0.001,故回歸系數(shù)顯著性檢驗通過。
由表7中共線性統(tǒng)計結(jié)果可知,四個模型中各自變量VIF值均為1,遠遠小于5,故不存在共線性或共線性較弱。
4.3.3 殘差分析和異常值診斷
建立多元燃油消耗誘因的回歸模型殘差直方圖和殘差正態(tài)概率圖,如圖4和圖5,并且列出回歸模型的個案診斷表,如表9。
圖4 燃油消耗誘因的回歸模型標準化殘差直方圖
圖5 燃油消耗誘因的回歸模型標準化殘差正態(tài)概率圖
表9 燃油消耗誘因的回歸模型個案診斷表
由圖4和圖5結(jié)果可看出,殘差基本服從正態(tài)分布;由表9可以看出,共有9組個案存在異常值。
4.3.4 輸出回歸表達式
剔除掉異常的9組個案數(shù)據(jù),重新建立多元回歸模型,重新進行參數(shù)檢驗和殘差分析,分析得到優(yōu)化后的回歸模型滿足參數(shù)檢驗和殘差分析要求。將主成分表達式代入優(yōu)化后的回歸模型,得到模型的表達式如下:
y=0.476z3+0.412z4-0.354z2-0.196z1
=0.315x2-0.233x4+0.235x7-0.256x10-
0.123x14+0.382x15+0.112x16+0.432x17
根據(jù)多元線性回歸建模分析得到的表達式,可得到如下分析:
1)自變量(實際主高度層、航程距離偏差、計劃起飛重量、實際起飛重量、起飛滑跑油量)在表達式式中系數(shù)均為正,表明因變量(落地剩余油量)隨這些變量增加而增加,與這些自變量屬于正相關(guān)關(guān)系。
2)實際航程距離、巡航平均空速、飛行時間等這三個變量與落地剩余油量成負相關(guān)關(guān)系。
3)這8個自變量中,起飛滑跑油量和計劃起飛重量這兩個變量對落地剩余油量的影響最大,而且都是正相關(guān)影響。
研究采用了相關(guān)性分析篩選出所需參數(shù),再用主成分分析進行了數(shù)據(jù)降維,將主成分輸出結(jié)果進行了多元線性回歸建模研究,最終得出落地剩余油量與相應(yīng)自變量參數(shù)的回歸模型表達式。從最終輸出結(jié)果得出了影響落地剩余油量的參數(shù)名稱和具體的影響程度,為進一步的落地剩余油量的預測研究和航空公司的節(jié)油策略研究提供了算法支持。