李忠虎,何 苗
(1.中國(guó)民航信息網(wǎng)絡(luò)股份有限公司 民航旅客服務(wù)智能化應(yīng)用技術(shù)重點(diǎn)實(shí)驗(yàn)室,北京101318;2.成都民航西南凱亞有限責(zé)任公司 研發(fā)中心,四川 成都610000)
民用航空運(yùn)輸作為現(xiàn)代運(yùn)輸行業(yè)中的重要組成部分,其發(fā)展程度代表著國(guó)家的經(jīng)濟(jì)發(fā)展水平,同時(shí)民用航空業(yè)作為科技型新興產(chǎn)業(yè),其發(fā)展程度還代表著國(guó)家科學(xué)技術(shù)水平.民航客運(yùn)量是衡量行業(yè)發(fā)展程度的重要指標(biāo),基于OD市場(chǎng)和航線的民航客運(yùn)量需求預(yù)測(cè)與分析,對(duì)于民航業(yè)資源優(yōu)化配置、交通規(guī)劃設(shè)計(jì)和運(yùn)營(yíng)管控具有重要意義.[1-4]隨著社會(huì)進(jìn)步和國(guó)民受教育水平提升,民航市場(chǎng)新增客戶中高學(xué)歷人群占比日益提升,因此研究民航客運(yùn)量與國(guó)民受教育水平的相關(guān)性,并借此實(shí)現(xiàn)中長(zhǎng)期民航客運(yùn)量預(yù)測(cè)具有積極意義,特別是中長(zhǎng)期的民航客運(yùn)量預(yù)測(cè),將成為民航業(yè)交通規(guī)劃與管理重要的規(guī)劃基準(zhǔn)和決策依據(jù).
本文數(shù)據(jù)來自《中國(guó)民用航空局民航行業(yè)發(fā)展統(tǒng)計(jì)公報(bào)》、[5]中華人民共和國(guó)教育部官方網(wǎng)站發(fā)布《教育統(tǒng)計(jì)數(shù)據(jù)-各級(jí)各類學(xué)歷教育學(xué)生情況》和國(guó)家統(tǒng)計(jì)局官方網(wǎng)站,選取2008-2017年的民航旅客運(yùn)輸人次數(shù)和各級(jí)各類學(xué)歷教育學(xué)生數(shù)作為樣本數(shù)據(jù)集,探究民航客運(yùn)量與國(guó)民受教育水平的相關(guān)性.
國(guó)民受教育水平按照教育部官方網(wǎng)站發(fā)布的分類標(biāo)準(zhǔn),按教育層次類型可以分為:學(xué)前教育、義務(wù)教育(包括小學(xué)和初中)、中等教育(包括高中及中等職業(yè)教育)、高等教育(包括研究生、普通本??啤⒊扇吮緦??、網(wǎng)絡(luò)本??坪透叩冉逃詫W(xué)考試本??疲┖吞厥饨逃宸N類型;按照教育階段類型可以分為:招生、在校、畢業(yè)三個(gè)維度.
皮爾遜相關(guān)系數(shù)用于度量?jī)蓚€(gè)連續(xù)變量之間的相關(guān)性,其值介于-1 與1 之間,兩個(gè)變量 iX和 jX 總體間的皮爾遜相關(guān)系數(shù) ji,XXρ 定義為:
其中Xi表示第i 指標(biāo)變量, cov(Xi,Xj)表示第i 指標(biāo)變量和第j 指標(biāo)變量之間的協(xié)方差,δXi表示第i 指標(biāo)變量的總體標(biāo)準(zhǔn)差,μXi表示第i指標(biāo)變量的總體均值.
兩個(gè)變量間的皮爾遜相關(guān)系數(shù)無(wú)法直接求出,必須先收集兩個(gè)指標(biāo)變量對(duì)應(yīng)的樣本,求出兩個(gè)變量樣本間的皮爾遜相關(guān)系數(shù),進(jìn)而估算兩個(gè)變量總體間的相關(guān)系數(shù).兩個(gè)變量Xi和Xj樣本間的皮爾遜相關(guān)系數(shù) rXi,Xj定義為:
其中ikX表示第i 指標(biāo)變量的第k 個(gè)分量,n為樣本量.
本文相關(guān)性分析均選取2008-2017 年數(shù)據(jù)樣本,民航客運(yùn)量通過客運(yùn)人次數(shù)來刻畫,各教育類型就讀規(guī)模為對(duì)應(yīng)教育類型招生、在校和畢業(yè)的總?cè)藬?shù).首先分析近年民航客運(yùn)人次數(shù)及各教育類型就讀規(guī)模的相關(guān)性,在0.01 水平上與民航客運(yùn)人次數(shù)顯著相關(guān)的變量為:高等教育就讀規(guī)模、學(xué)前教育就讀規(guī)模和義務(wù)教育就讀規(guī)模.
表1 民航客運(yùn)量與各教育類型就讀規(guī)模的相關(guān)性
民航客運(yùn)量與高等教育就讀規(guī)模的皮爾遜相關(guān)系數(shù)高達(dá)0.971,進(jìn)一步分析民航客運(yùn)量分別與高等教育招生規(guī)模、在校規(guī)模和畢業(yè)規(guī)模的相關(guān)性.在0.01 水平上這三個(gè)變量均與民航客運(yùn)人次數(shù)顯著相關(guān),民航客運(yùn)量與高等教育畢業(yè)規(guī)模相關(guān)系數(shù)最高,皮爾遜相關(guān)系數(shù)值為0.984.
表2 民航客運(yùn)量與高等教育各階段規(guī)模的相關(guān)性
經(jīng)過前面的相關(guān)性分析,我們得到了與民航客運(yùn)量顯著相關(guān)的變量:高等教育畢業(yè)規(guī)模,皮爾遜相關(guān)系數(shù)為0.984,接下來通過調(diào)整數(shù)據(jù)計(jì)算口徑、提出適當(dāng)假設(shè)等方法,在高等教育畢業(yè)規(guī)模的基礎(chǔ)上構(gòu)造相關(guān)系數(shù)更高的字段.
1.4.1 年度滾動(dòng)累計(jì)口徑
聚焦高等教育畢業(yè)規(guī)模數(shù)據(jù)字段計(jì)算口徑,各年高等教育(包括研究生、普通本??啤⒊扇吮緦??、網(wǎng)絡(luò)本專科和高等教育自學(xué)考試本??疲┑漠厴I(yè)總?cè)藬?shù),但是僅用一年的畢業(yè)人數(shù)無(wú)法有效刻畫國(guó)民受高等教育的整體規(guī)模,故引入年度滾動(dòng)累計(jì)口徑,構(gòu)造字段40年滾動(dòng)累計(jì)畢業(yè)規(guī)模.
40 年滾動(dòng)累計(jì)普通本專科畢業(yè)規(guī)模,表示從當(dāng)年開始(包含當(dāng)年)向前追溯共計(jì)40 年每年普通本??飘厴I(yè)總?cè)藬?shù)累加和,即X 年40年滾動(dòng)累計(jì)普通本專科畢業(yè)規(guī)模,即為(X-39)年至X 年(包含(X-39)年和X 年)各年普通本??飘厴I(yè)總?cè)藬?shù),即為(X-35)年至(X-4)年(包含(X-35)年和(X-4)年)各年普通本??普猩?cè)藬?shù).
1.4.2 提出數(shù)據(jù)假設(shè)
用當(dāng)年高等教育畢業(yè)人數(shù)預(yù)測(cè)當(dāng)年民航客運(yùn)量,時(shí)間上存在明顯滯后性,故根據(jù)大致實(shí)際情況,提出適當(dāng)假設(shè):普通本??普猩鷶?shù)即為4 年后普通本??飘厴I(yè)數(shù).
鑒于該數(shù)據(jù)假設(shè),獲取國(guó)家統(tǒng)計(jì)局官網(wǎng)1949-2018 年普通本??普猩鷶?shù),采用年度滾動(dòng)累計(jì)口徑,構(gòu)造字段40年滾動(dòng)累計(jì)普通本專科畢業(yè)規(guī)模,并分析民航客運(yùn)量與該字段的相關(guān)性,皮爾遜相關(guān)系數(shù)為0.994.
表3 民航客運(yùn)量與40年滾動(dòng)累計(jì)普通本??飘厴I(yè)規(guī)模的相關(guān)性
根據(jù)前面的相關(guān)性分析,民航客運(yùn)量與40年滾動(dòng)累計(jì)普通本專科畢業(yè)規(guī)模呈現(xiàn)強(qiáng)正相關(guān),并且基于假設(shè)未來4年的畢業(yè)規(guī)??捎汕捌谡猩?guī)模推算,即2019 年至2022 年40 年滾動(dòng)累計(jì)普通本??飘厴I(yè)規(guī)模,分別為1976-2015 年普通本專科招生總?cè)藬?shù)、1977-2016 年普通本??普猩?cè)藬?shù)、1978-2017 年普通本??普猩?cè)藬?shù)、1979-2018 年普通本??普猩?cè)藬?shù).接下來將采用單變?cè)貧w的方式建立模型,并預(yù)測(cè)未來兩年的民航客運(yùn)量.
民航客運(yùn)量與40 年滾動(dòng)累計(jì)普通本??飘厴I(yè)規(guī)模,近年明細(xì)數(shù)據(jù)詳見表4 .
表4 民航客運(yùn)量(Y)與40年滾動(dòng)累計(jì)普通本??飘厴I(yè)規(guī)模(X)數(shù)據(jù)(單位:萬(wàn)人)
根據(jù)表4 中1998-2019 年明細(xì)數(shù)據(jù),我們將嘗試采用普通最小二乘(OLS)回歸法,[6-7]包括簡(jiǎn)單線性回歸、多項(xiàng)式回歸擬合模型,并評(píng)價(jià)擬合優(yōu)度、檢驗(yàn)假設(shè)條件和模型的選擇.
普通最小二乘(OLS)回歸擬合模型的形式:
其中,i=1……n,n為觀測(cè)的數(shù)目,k為預(yù)測(cè)變量的數(shù)目,為第i 次觀測(cè)對(duì)應(yīng)的因變量的預(yù)測(cè)值,Xji為第i 次觀測(cè)對(duì)應(yīng)的第j 個(gè)預(yù)測(cè)變量值,為截距項(xiàng),為預(yù)測(cè)變量j 的回歸系數(shù).我們的目標(biāo)通過減少因變量的真實(shí)值與預(yù)測(cè)值的差值來獲得模型參數(shù),即殘差平方和最小.
為了能夠恰當(dāng)解釋OLS 模型的參數(shù),數(shù)據(jù)必須滿足以下統(tǒng)計(jì)假設(shè):正態(tài)性:對(duì)于固定非自變量值,因變量值成正態(tài)分布;獨(dú)立性:Yi 值之間相互獨(dú)立;線性:因變量與自變量之間為線性相關(guān);同方差性:因變量的方差不隨自變量的水平不同而變化.
當(dāng)回歸模型包含一個(gè)因變量時(shí),我們稱為簡(jiǎn)單線性回歸.當(dāng)只有一個(gè)預(yù)測(cè)變量,但同時(shí)包含變量的冪(比如,X、X2、X3)時(shí),我們稱為多項(xiàng)式回歸.
利用數(shù)據(jù)分析軟件建立由40 年滾動(dòng)累計(jì)普通本??飘厴I(yè)規(guī)模(X)預(yù)測(cè)民航客運(yùn)量(Y)的OLS簡(jiǎn)單線性回歸,利用軟件分析D.W統(tǒng)計(jì)量為0.461,殘差獨(dú)立性未通過檢驗(yàn),并明顯存在尾部預(yù)測(cè)數(shù)據(jù)值過低的問題,詳見圖1.
圖1 普通最小二乘(OLS)簡(jiǎn)單線性回歸
建立由40 年滾動(dòng)累計(jì)普通本??飘厴I(yè)規(guī)模(X)預(yù)測(cè)民航客運(yùn)量(Y)的二次多項(xiàng)式回歸,D.W 統(tǒng)計(jì)量為0.487,殘差獨(dú)立性仍未通過檢驗(yàn).進(jìn)一步建立三次多項(xiàng)式回歸,由于次數(shù)偏高,出現(xiàn)擬合曲線變化趨勢(shì)過快,預(yù)測(cè)值顯著偏高的突出問題.
為降低多項(xiàng)式回歸次數(shù),嘗試引入變量lnX建立回歸模型,通過軟件分析詳細(xì)的輸出見表5.
表5 變量初始分析
接下來進(jìn)行回歸方程與回歸系數(shù)的顯著性檢驗(yàn).
顯著性檢驗(yàn)的原假設(shè)H0:回歸系數(shù)與0 無(wú)顯著差異,檢測(cè)采用F 統(tǒng)計(jì)量和t 統(tǒng)計(jì)量,該回歸模型F統(tǒng)計(jì)量為5505.780,對(duì)應(yīng)概率值0.000小于顯著性水平0.05,則拒絕原假設(shè),表明回歸系數(shù)與0有顯著差異,即因變量與自變量有線性關(guān)系,回歸方程有意義.由表5中最后一列回歸系數(shù),對(duì)應(yīng)概率值小于顯著性水平0.005,表明回歸系數(shù)顯著不為0,即在控制其他變量不變時(shí),變量X2、X、lnX均分別與Y線性相關(guān).
模型的R2 值為0.999,表明模型的方差解釋率為99.9%,初步判斷模型擬合效果很好,模型的表達(dá)式為:Y=0.001X2-4.600X+20598.601lnX-137739.041.
最后進(jìn)行殘差分析,[8]正態(tài)性:從標(biāo)準(zhǔn)化殘差直方圖、標(biāo)準(zhǔn)化殘差的P-P 圖來看,散點(diǎn)近似均靠近斜線,近似滿足正態(tài)性,詳見圖2、圖3;獨(dú)立性:模型的D.W 統(tǒng)計(jì)量為1.849,接近2.0 落在無(wú)自相關(guān)性的值域中,認(rèn)定殘差獨(dú)立通過檢驗(yàn);同方差性:殘差散點(diǎn)圖擬合的直線大致平行于橫坐標(biāo),可以大致認(rèn)為殘差是齊性的.經(jīng)過殘差分析,該回歸模型有效且擬合效果很好.
圖2 標(biāo)準(zhǔn)化殘差直方圖
圖3 標(biāo)準(zhǔn)化殘差直方圖和P-P圖
通過殘差檢驗(yàn),前面建立的回歸模型有效,于是可得到未來兩年年民航客運(yùn)量(Y)的預(yù)測(cè)值詳見表6,旅客量的年增長(zhǎng)率在10%-11%之間,符合民航客運(yùn)量整體增長(zhǎng)趨勢(shì).
表6 2019-2022年民航客運(yùn)量預(yù)測(cè)值(單位:萬(wàn)人)
在許多關(guān)于民用航空客運(yùn)量影響因素的實(shí)證研究[9]中,多用國(guó)內(nèi)生產(chǎn)總值、人均國(guó)內(nèi)生產(chǎn)總值及鐵路客運(yùn)量作為因變量來建立回歸模型進(jìn)行分析和預(yù)測(cè),本文從國(guó)民受教育水平出發(fā),發(fā)現(xiàn)高等教育畢業(yè)規(guī)模與民用航空客運(yùn)量有著顯著的相關(guān)性.進(jìn)一步構(gòu)建強(qiáng)相關(guān)變量40年滾動(dòng)累計(jì)普通本??飘厴I(yè)規(guī)模,并建立回歸模型實(shí)現(xiàn)對(duì)民航客運(yùn)量的未來兩年的預(yù)測(cè),預(yù)測(cè)值契合民航客運(yùn)量增長(zhǎng)的整體趨勢(shì).