劉楊
摘要:本文主要用于民航客運量的預測研究,針對多元線性回歸建立預測模型出現(xiàn)的擬合度過高、存在嚴重多重共線性和模型變量不顯著等問題進行改進,最終使用部分線性模型進行預測。通過對經(jīng)濟數(shù)據(jù)進行差分來減少數(shù)據(jù)的多重共線性,根據(jù)差分之后各變量與民航客運量的相關關系,采用部分線性模型進行數(shù)據(jù)的擬合并檢驗。經(jīng)過多種評價指標對不同模型的對比發(fā)現(xiàn),該模型預測準確度高,模型擬合效果好。
關鍵詞:航客運量;線性模型;部分線性模型;評價指標
隨著民用航空的廣泛發(fā)展,近年來不少學者對民航客運量的預測了進行深入研究和剖析。程小康(2008)通過改進傳統(tǒng)的ε支持向量回歸機(SVR),構(gòu)造了基于進化ε-SVR的“影響因素一民航客運量”預測模型影響因素,選用國民收入、人均國內(nèi)生產(chǎn)總值、運輸客運總量、民用航空航線條數(shù)、航空運輸業(yè)職工人數(shù),城鎮(zhèn)居民人均可支配收入、城鎮(zhèn)居民家庭平均每人全年交通通信消費等因素,并將該模型預測結(jié)果與其他方法所得結(jié)果進行對比。紀躍芝等(2012)建立分階段多元線性回歸模型,以國民收入,最終消費,鐵路客運量,民航航線里程,來華人境人數(shù)等為影響客運量的主要因素,分析了改革開放前后這些因素與民航客運量之間的關系。文軍等(2016)通過主成分回歸模型構(gòu)建了人均國內(nèi)生產(chǎn)值、國內(nèi)生產(chǎn)總值、職工平均工資、居民消費水平、境旅游人數(shù)以及對外貿(mào)易總額等因素與民航客運量關系的預測模型,所得結(jié)果較好。李維,肖紅專(2017)采用偏最小二乘回歸方法構(gòu)建預測模型,發(fā)現(xiàn)對民航客運量的影響程度按從高到低分別為運輸、郵政業(yè)增加值、國內(nèi)生產(chǎn)總值、居民消費水平、鐵路客運量、定期航班航線里程、入境游客等因素,且模型有效解決了變量問的多重相關性和在回歸中樣本點少的難題。
文獻多采用多元線性回歸、時間序列和機器學習的方法進行預測。而在一些文獻中也有提到,多元線性回歸方法得到的預測模型效果雖然較好,但是存在影響因素不顯著的問題,若只用單個顯著變量進行預測則會丟失較多信息,導致預測效果不準確。針對此問題,本文進行模型的探索與修正,并使用部分線性模型重新建立預測模型,預測效果較好。
一、預測方法
(一)多元線性回歸模型
二、民航客運量預測模型
(一)數(shù)據(jù)獲取與處理
影響民航客運量的因素有很多,根據(jù)文獻及相關資料選取以下7個變量作為預測模型的影響因素進行探討分析,分別是國民總收入指數(shù)X1、第三產(chǎn)業(yè)增加值指數(shù)X2、年末總?cè)丝跀?shù)X3、城鎮(zhèn)人口X4、入境游客X5、國內(nèi)游客X6、民用航空航線里程X7。民航客運量作為因變量y。
數(shù)據(jù)來源于中經(jīng)網(wǎng)統(tǒng)計數(shù)據(jù)庫,選取1999年-2017年共19年數(shù)據(jù)進行分析。
(二)多元線性回歸模型的改進與修正
1多元線性回歸模型
首先根據(jù)表1中Pearson相關系數(shù)判斷出各個變量與民航客運量之間具有將強的線性關系。用R語言軟件做民航客運量關于x的線性回歸模型,得到表2回歸估計結(jié)果:
從得到的結(jié)果中,F(xiàn)值為1000,R2為0.9984,說明模型整體通過了檢驗且擬合得很好。從表一相關系數(shù)中看到,國民經(jīng)濟收入與民航客運量為正相關,但在模型中國民總收入指數(shù)的系數(shù)為負,經(jīng)濟意義不明確,且只有一個變量通過了檢驗。經(jīng)驗證模型的條件數(shù)為87453,該模型存在嚴重的多重共線性,可能導致所得參數(shù)的估計量無效。使用逐步回歸法或主成分法消除共線性使得影響民航客運量的因素變少,易丟失大量信息。
2.部分線性模型
一般來說,現(xiàn)實經(jīng)濟數(shù)據(jù)將會隨著時間的變化存在著相同的變化趨勢,因此產(chǎn)生共線性。差分變換能使數(shù)據(jù)中趨勢性部分的比重降低,波動和變化部分的比重加強,從而降低多重共線性問題。因此對原始數(shù)據(jù)進行一階差分。
圖1給出差分之后各變量與因變量之間的散點圖。明顯的,差分之后除國民總收入指數(shù)、第三產(chǎn)業(yè)增加值指數(shù)、國內(nèi)游客與民航客運量存在線性關系,其他變量與民航客運量的關系未知,于是本文試圖建立民航客運量的部分線性模型進行客運量的預測研究。
(三)模型的評價與比較
為了比較不同模型擬合效果的優(yōu)劣,本文選取了常見了三個評價指標,分別為均方誤差(MSE),赤池信息準則(AIC),擬合優(yōu)度(R2)。為方便評價,模型預測指標定義如下:
根據(jù)評價指標來看,部分線性模型的MSE和AIC的值小;線性模型的R2接近于1,很可能模型存在虛假信息。而部分線性模型的R2達到0.8747,較為合理。另外,部分線性模型參數(shù)部分的系數(shù)均為正,符合經(jīng)濟意義。
綜上所述,使用部分線性模型建立民航客運量的預測模型,效果較好。
結(jié)語
本文采用1999-2017年共19年數(shù)據(jù)進行民航客運量預測模型的研究。綜合之前學者的研究,發(fā)現(xiàn)了民航客運量線性模型雖然擬合效果較好,但共線性嚴重,影響因素不顯著,經(jīng)濟意義不符合實際等問題。針對存在的問題,文章進行了模型的探索與修正,并使用部分線性模型重新建立預測模型。部分線性模型將國民總收入指數(shù)、第三產(chǎn)業(yè)增加值指數(shù)、國內(nèi)游客作為線性部分,年末總?cè)丝凇⒊擎?zhèn)人口、入境游客、民用航空航線里程作為非線性部分進行建模。最后綜合對不同模型擬合效果及檢驗指標的對比,使用半?yún)?shù)部分線性回歸方法建立的民航客運量的預測模型,解決了數(shù)據(jù)具有多重共線性,變量系數(shù)經(jīng)濟意義不明顯等問題,在民航客運量的預測問題上具有良好的使用意義。