代玲虹 李瑞欣
摘 要:鐵路貨運量是鐵路基礎(chǔ)設(shè)施建設(shè)的重要依據(jù),準確的鐵路貨運量預(yù)測對未來鐵路建設(shè)發(fā)展有著重大意義。本文結(jié)合鐵路貨運量現(xiàn)狀,分析影響鐵路貨運量的主要因子,在傳統(tǒng)的回歸預(yù)測模型基礎(chǔ)上,利用最小二乘法進行參數(shù)標定,構(gòu)建鐵路貨運量預(yù)測的五元線性回歸模型,并對2020年鐵路貨運量進行預(yù)測。
關(guān)鍵詞:多元線性回歸;鐵路貨運量;預(yù)測
中圖分類號:U491.13 ????????文獻標識碼:A
0引言
預(yù)測方法可分為定性與定量兩種。定性預(yù)測法包括經(jīng)濟調(diào)查法、特爾菲法等;定量預(yù)測法包括時間序列法、影響因素分析法等。為保證預(yù)測的準確度,應(yīng)根據(jù)實際情況采用合適的方法。本文采用回歸分析法進行預(yù)測?;貧w分析預(yù)測法,是在分析自變量和因變量之間的相關(guān)關(guān)系基礎(chǔ)上,建立變量間回歸方程,并將此作為預(yù)測模型。根據(jù)模型中自變量個數(shù)的多少,將回歸模型分為一元回歸模型和多元回歸模型;根據(jù)模型是否呈線性,分為線性回歸模型和非線性回歸模型。
1模型介紹
1.1一元回歸模型
一元線性回歸是分析只有一個自變量x與因變量y線性相關(guān)關(guān)系的方法。
理論模型為:,其中y為因變量,x為自變量,;為回歸常數(shù),;為回歸系數(shù),;表示隨機誤差。用最小二乘法求解;,;的估計值,得:
,其中 ,
1.2多元回歸模型
多元回歸分析是研究因變量對兩個或兩個以上自變量的統(tǒng)計依賴關(guān)系。給定數(shù)據(jù)集,存在,使得,則:
用最小二乘法求解;和b得:;令,得多元回歸模型為:
2建立鐵路貨運量預(yù)測模型
2.1 影響因素
通過國家統(tǒng)計局查詢2010年-2019年鐵路貨運量,繪表如下(表1)。
由數(shù)據(jù)可知,鐵路貨運量在2013年至2016年出現(xiàn)急劇下滑。除此之外,貨運量基本呈現(xiàn)上升趨勢。即貨運量變化是一條折線,用一條直線或曲線描述不準確,因此需要考慮采用多變量預(yù)測模型。經(jīng)研究分析,影響貨運量并可以查詢到的因子如表2。
2.2 相關(guān)性分析
根據(jù)表1與表2數(shù)據(jù),繪制貨運量隨各個因素變化的散點圖(如圖1所示),明確貨運量隨自變量變化的大致趨勢,選擇相應(yīng)的回歸模型。由于2015-2016年受宏觀經(jīng)濟影響,煤炭等大宗商品的需求量急劇下跌,導致這兩年鐵路貨運量大幅度降低。除卻這一特殊時期,各因子對鐵路貨運量的影響趨勢基本呈現(xiàn)線性相關(guān)。因此,本文選擇線性回歸模型進行預(yù)測。
2.3 因子選擇
采用多元逐步回歸法對上述選取的14個因子進行篩選。利用matlab工具箱中stepwise命令實現(xiàn)此目的,因子篩選結(jié)果為:第二產(chǎn)業(yè)增加值x1,工業(yè)增加值x2,建筑業(yè)增加值x3,交通運輸、倉儲和郵政業(yè)增加值x4,民用航空貨運量x5,管道貨運量x6。
2.4 模型建立
對鐵路貨運量y與x1,x2,x3,x4,x5,x6這6個因子建立多元線性回歸模型:
其中,;利用最小二乘法解得:
計算得模型回歸系數(shù)為:
綜上,該預(yù)測模型函數(shù)表達式為(令為第t年鐵路貨運量預(yù)測值):
2.5 模型檢驗
2.5.1 多元線性回歸模型檢驗
采用Excel回歸分析函數(shù)對模型進行檢驗,可知:模型R2=0.997672638,擬合效果很好。F=214.3355207,在;=0.05的條件下,F(xiàn)0.05(6,3 )=8.94,F(xiàn)>F0.05(6,3 ),線性關(guān)系顯著,t檢驗值依次為2.190014726,4.886588204,4.644454095,4.399264312,19.48717078,3.484784469,5.940206129,P-value值分別為0.11625278,0.016389566,0.018816999,0.021772952,0.000295204,0.03991693,0.009537661,存在P-value=0.11625278>;,各變量顯著性水平低。無法準確預(yù)測未來鐵路貨運量,模型需要改進。
2.5.2 模型改進與檢驗
建立鐵路貨運量y與x1,x2,x3,x4,x6這5個因子的多元線性回歸模型:
y=;+;1x1+;2x2+;3x3+;4x4+;6x6
經(jīng)計算,該預(yù)測模型函數(shù)表達式為:
檢驗得:模型R2= 0.988251692,擬合效果很好。F=67.29491385,在;=0.05的條件下,F(xiàn)0.05(5,4 )=6.26,F(xiàn)>F0.05(5,4),線性關(guān)系顯著且t檢驗值依次為7.378041251,4.962325579,4.839805253,4.492190675,10.17516225,4.299317272, P-value值分別為0.001798816,0.007693364,0.008401268,0.010887507,0.000525444,0.012652452,存在P-value<;,各變量顯著性水平較高,能夠用此模型預(yù)測未來鐵路貨運量。
3鐵路貨運量預(yù)測
預(yù)測未來鐵路貨運量,只需在模型中輸入自變量的值,便可求得。通過數(shù)據(jù)分析可知,各因子隨年份變化趨勢滿足一元線性相關(guān),建立一元線性回歸模型,對各因子進行預(yù)測。預(yù)測結(jié)果為:2020年第二產(chǎn)業(yè)增加值394676.2億元,工業(yè)增加值323558.9億元,建筑業(yè)增加值73027億元,交通運輸、倉儲和郵政業(yè)增加值44789.8億元,管道貨運量95781.9萬噸。將各因子的預(yù)測值代入貨運量預(yù)測模型求得2020 年的貨運量為391098.21萬噸。
4結(jié)論
本文采用國家統(tǒng)計局近十年各指標數(shù)據(jù),并結(jié)合多元線性回歸預(yù)測模型,對鐵路貨運量進行預(yù)測,使預(yù)測結(jié)果平均誤差在0.63%左右。此模型擬合度高,預(yù)測結(jié)果準確。本文不足之處在于各因子的預(yù)測值是采用一元線性回歸模型進行預(yù)測,較多元線性回歸模型來說,準確度相對較低,最終鐵路貨運量預(yù)測會產(chǎn)生一定的誤差。
作者簡介:代玲虹(1998-)女,漢族,四川成都人,本科,研究方向:交通運輸。
參考文獻
[1]薛方,蘇芮鋒,楊升等.基于回歸分析的公路貨運量預(yù)測[J].汽車實用技術(shù),2019(15):65-69.
[2]孫風華.區(qū)域貨運需求預(yù)測方法研究[D].西安:長安大學,2011:64-70.
[3]宋光平.鐵路貨運量預(yù)測方法研究[D].北京:北京交通大學,2007:19-23.
[4]張岄.鐵路貨運量預(yù)測及影響因素研究[D].北京:北京交通大學,2016:43-49.
[5]展紅亮.鐵路貨運量預(yù)測及開行方案優(yōu)化設(shè)計[D].石家莊:石家莊鐵道大學,2017.
[6]高醒,李夏苗,彭鵬.鐵路貨運量預(yù)測過程中的關(guān)鍵技術(shù)分析[J].科技和產(chǎn)業(yè),2018,18(05):1-6.