薛方,蘇芮鋒,楊升,姚遠征,張俊
(陜西重型汽車有限公司,陜西 西安 710200)
公路貨運量反應了國民經濟水平,同時也是重卡銷量的基石。國內很多學者都對公路貨運量進行過相關的分析,可概括為:(1)基于公路貨運量統(tǒng)計方法的研究:梁仁鴻、仵思燃研究了公路貨物運輸量統(tǒng)計新試行方案問題及完善思路[4];張忠民做了公路貨物運輸量統(tǒng)計方案完善與應用研究[5];孫磊磊、李瓊提出了公路運輸量統(tǒng)計中的計量誤差分析[6];劉擁華等人提出了高速公路貨物運輸量統(tǒng)計方法[7]。(2)基于調查方法的研究:于丹陽等人提出了北京市公路貨物運輸量抽樣調查分析與建議[8];郭紅霞、栗慶耀提出了公路貨運量統(tǒng)計調查方法的改進[9];張志俊、周婭提出了滿足多層次需要的公路運輸量抽樣調查方法[10]。(3)基于公路貨運量預測的研究:王俊波提出了組合預測方法在公路運輸量預測中的應用研究[11];吳鳳山、范林業(yè)做了中國公路貨物運輸量的長期預測[12];瞿爾仁等人做了公路運輸量預測的綜合時序分析[13]。
公路貨運量預測是制定公路運輸業(yè)發(fā)展規(guī)劃和重卡銷量研究的基礎。本文從宏觀上影響公路貨運量的因子出發(fā),首先利用散點圖分析各因子和公路貨運量之間的關系,然后用逐步回歸法剔除掉對公路貨運量不顯著的因子,建立了多元線性回歸方程對貨運量進行預測。經檢驗預測模型擬合效果好。
公路貨運量,如下圖所示。貨運量數據呈現上升趨勢,且跌宕起伏,是一條折線,用一條直線或者曲線是描述不清楚的。因此需要考慮使用多變量預測模型。
表1 2010-2017 年貨運量統(tǒng)計
圖1 公路貨運量隨著年份的變化趨勢
表2 2010-2017 國內生產總值、國民總收入、第一產業(yè)增加值、第二產業(yè)增加值
經過嚴格的分析可知,與貨運量相關的可以獲取到的數據有:國內生產總值,國民總收入,人均國內生產總值,工業(yè)增加值,建筑業(yè)增加值,批發(fā)和零售業(yè)增加值,交通運輸、倉儲和郵政業(yè)增加值,第一產業(yè)增加值,第二產業(yè)增加值,第三產業(yè)增加值這10 種數據。
表3 2010-2017 第三產業(yè)增加值、人均國內生產總值、工業(yè)增加值、建筑業(yè)增加值
表4 2010-2017 批發(fā)和零售業(yè)增加值、交通運輸、倉儲和郵政業(yè)增加值
能否使用線性回歸模型,要先分析自變量和因變量之間是否有線性關系,最常見的方法是散點圖法,畫出自變量和因變量之間的二維散點圖,進行觀察,如果呈現線性關系,就用線性回歸,如果呈現非線性關系,就使用非線性函數來進行非線性回歸。
圖2 公路貨運量隨著各個因子的變化趨勢
觀察圖2 中的散點圖,可見各因子對公路貨運量的影響不是直接的線性但是可以近似為線性關系。因此可以建立多元線性回歸模型求解。
這10 個因子對公路貨運量的影響程度決定了回歸模型的優(yōu)劣。通常情況下,如果方程中含有對因變量不起作用或者作用極小的自變量,也就是不顯著的自變量,會造成回歸方程預測效果下降,因此先使用多元逐步回歸法對因子進行選擇。
逐步回歸的思想是有進有出。引入一個自變量,對已引入的變量要進行逐個檢驗,當原引入的變量由于后面變量的引入而變得不再顯著時,要將其剔除。引入一個變量或從回歸方程中剔除一個變量為逐步回歸的一步,每一步都要進行F 檢驗,以確保每次引入新的變量之后回歸方程中只包含顯著的變量。這個過程反復進行,直到既無顯著的自變量引入回歸方程,也無不顯著的自變量從回歸方程中剔除為止。這樣就可以保證最后所得的變量子集中的所有變量都是顯著的。經過若干步以后可得到“最優(yōu)”變量子集。
使用MATLAB 工具箱中的stepwise 命令進行因子選擇,結果見表5。
表5 因子選擇的結果
回歸分析預測法,是在分析了自變量和因變量之間相關關系的基礎上,建立變量之間的回歸方程,并將建立的回歸方程作為預測模型。根據自變量的變化來預測因變量的變化,變化關系一般為相關關系?;貧w分析預測法主要是對具有因果關系的變量進行分析預測?;貧w分析所建立的模型,只有通過了各種檢驗,并且預測誤差很小,才能應用到實際的預測中。
根據模型中自變量個數的多少,可以將回歸模型分為一元回歸模型和多元回歸模型;根據模型是否是線性的,可分為線性回歸模型和非線性回歸模型。本文主要使用了一元和多元線性回歸模型。
一元線性回歸只涉及一個因變量y 和一個自變量x,用x的線性函數對y 建模,即y=a+bx,其中a,b 稱為回歸系數對應的直線稱為回歸直線。在用一元線性回歸模型進行預測時,首先必須對a,b 進行評估。一般采用最小二乘法。根據最小二乘法得到的參數估計值為:
式中,xi,yi是已知的歷史數據,x,y 是自變量和因變量的算數平均值??紤]到隨機因素的影響,可以加入隨機干擾項ε,一般假定服從正態(tài)分布,且各εi互不相關。一元線性回歸預測模型為:yi=a+bxi+εi。
用最小二乘法求解ω 和b
當XTX 為滿秩矩陣或正定矩陣時,另上式為零可得:,其中(XTX)-1是矩陣(XTX)的逆矩陣,令,則最終學得的多元線性模型為。
對貨運量y 與國民總收入、人均國內生產總值、工業(yè)增加值、建筑業(yè)增加值、批發(fā)和零售業(yè)增加值、交通運輸、倉儲和郵政業(yè)增加值這6 個因子建立6 元線性回歸模型:
其中,
應用最小二乘法解得:
得到模型的回歸系數
其中β0為常數項,β1,…,β6為各因子系數。因此該模型的函數表達式為:
x1,…x6依次為國民總收入(億元),人均國內生產總值(元),工業(yè)增加值(億元),建筑業(yè)增加值(億元),批發(fā)和零售業(yè)增加值(億元),交通運輸、倉儲和郵政業(yè)增加值(億元)。為貨運量預測值。
預測結果見表6。
表6 多元線性回歸模型預測結果
圖3 原始貨運量與預測貨運量的曲線圖
對回歸模型進行檢驗,結果見表7。
表7 檢驗結果
該模型使得p=0.02137<0.05,樣本可決系數R2=0.99987,接近于1,因此模型的擬合效果較好。
要對未來1 年或者未來2-5 年的貨運量進行預測,只需要在模型中輸入自變量的值,就可以求得。但是本文自變量的數據來源于國家統(tǒng)計局,統(tǒng)計局的數據是根據真實數據測得的,因此不可能提前得知自變量的真實值。
所以需對6 種自變量進行預測,根據因子的變化趨勢可知,各因子的變化和年份成一元線性關系,因此可以建立一元線性模型,分別對各項因子進行預測。預測結果見表8。使用一元線性回歸模型預測的結果和原始值的對比圖見圖4。
表8 2018 年各因子的預測值
圖4 各因子原始值與預測值的曲線圖
將2018 年各因子的預測值代入貨運量預測模型可以求得2018 年的貨運量為:3747247.95 萬噸。
圖5 貨運量預測結果曲線圖
本文以中華人民共和國交通運輸部公開的公路貨運量數據為基準,結合國家統(tǒng)計局公開的年度數據搭建多元線性回歸預測模型來預測未來某時段的公路貨運量,模型可行性較好,預測效果優(yōu)。
不足之處:各因子都近似為線性模型,如果可以找到一種非線性的函數形式替換效果估計更好。