吳樂 陳剛
摘? 要:為了提高上海市物流需求量預(yù)測精度,運(yùn)用GM1,1和嶺回歸組合預(yù)測方法基于9個(gè)影響因素構(gòu)建需求預(yù)測指標(biāo)體系,選取近13年的歷史數(shù)據(jù)預(yù)測上海市未來4年的物流需求量并與BP神經(jīng)網(wǎng)絡(luò)和GM1,1預(yù)測模型進(jìn)行對(duì)比。結(jié)果表明,文章提出的組合預(yù)測模型預(yù)測精度優(yōu)于其他模型,其均方根誤差和平均相對(duì)誤差分別至少減少了42.8%和45.4%,證明模型的優(yōu)越性和可行性,可為其他地區(qū)的物流需求預(yù)測提供研究方向。
關(guān)鍵詞:嶺回歸模型;GM1,1模型;物流需求預(yù)測;上海市
中圖分類號(hào):F259.27? ? 文獻(xiàn)標(biāo)志碼:A? ? DOI:10.13714/j.cnki.1002-3100.2023.15.002
Abstract: In order to improve the prediction accuracy of Shanghai's logistics demand, the GM1,1 and ridge regression combined forecasting method is used to construct the demand forecasting index system based on nine influencing factors. The historical data of the past 13 years are selected to predict the logistics demand of Shanghai in the next 4 years and compared with the BP neural network and GM1,1 prediction model. The results show that the prediction accuracy of the combined forecasting model proposed in this paper is better than other models, and its root mean square error and average relative error are reduced by at least 42.8% and 45.4% respectively, which proves the superiority and feasibility of the model and can provide research directions for logistics demand forecasting in other regions.
Key words: ridge regression model; GM1,1 model; logistics demand forecasting; Shanghai
0? 引? 言
近年來,隨著全球經(jīng)濟(jì)和物流行業(yè)的快速發(fā)展,上海市作為中國國家中心城市、滬杭甬大灣區(qū)核心城市,地處長江入???,其每年物流貨運(yùn)量巨大。因此,預(yù)測上海市未來物流需求量具有重要的現(xiàn)實(shí)意義,有助于了解社會(huì)經(jīng)濟(jì)活動(dòng)對(duì)物流供給能力的需求強(qiáng)度,從而保障供給平衡,為高效社會(huì)物流活動(dòng)的實(shí)現(xiàn)提供基礎(chǔ)[1]。
針對(duì)物流需求預(yù)測問題。首先,多數(shù)學(xué)者使用不同模型進(jìn)行仿真預(yù)測[2-3],其預(yù)測方法主要包括BP神經(jīng)網(wǎng)絡(luò)[1]、灰色預(yù)測模型[4]、隨機(jī)森林[5]、時(shí)間序列[6]等。還有部分學(xué)者將組合預(yù)測方法進(jìn)行實(shí)際應(yīng)用,如黃建華[7]提出了改進(jìn)GM-BPNN組合預(yù)測方法,利用ARIMA和遺傳算法分別改進(jìn)GM1,1和BPNN,更具有效度確定加權(quán)系數(shù)并構(gòu)建線性組合模型進(jìn)行預(yù)測。其次,多數(shù)學(xué)者在分析物流需求量影響因素及其指標(biāo)體系的構(gòu)建過程時(shí)一般會(huì)選擇常用的指標(biāo)[1],但未能得到良好的預(yù)測結(jié)果[3]。人口規(guī)模在影響全球經(jīng)濟(jì)發(fā)展和人民日常生活[8]的同時(shí)也會(huì)明顯影響物流需求量的變化,因此將其作為影響因素之一。
基于此,本文結(jié)合以往學(xué)者研究物流需求預(yù)測影響因素基礎(chǔ)上使用9個(gè)影響因素基于GM1,1和嶺回歸組合預(yù)測模型預(yù)測上海市未來4年物流需求量。
1? 模型介紹
本文在進(jìn)行上海市物流需求預(yù)測時(shí)首先使用GM1,1模型進(jìn)行影響因素預(yù)測,再使用嶺回歸模型對(duì)物流需求進(jìn)行預(yù)測,此操作適用于研究不確定性系統(tǒng)。
1.1? GM1,1模型
灰色系統(tǒng)理論預(yù)測模型中學(xué)者們最常使用的就是GM1,1模型,1,1表示對(duì)一個(gè)一階方程的自變量進(jìn)行預(yù)測,其一般計(jì)算步驟如下:
Step 1:獲得初始序列X=X1,X2,…,XN。
Step 2:將各時(shí)刻數(shù)據(jù)依次累加得到累加序列X=X1,X2,…,XN。
Step 3:判斷序列X的級(jí)比σk===ρk+1,此時(shí),隨著k增加,ρk會(huì)逐漸接近0,當(dāng)ρk∈0,0.5時(shí)X有準(zhǔn)指數(shù)規(guī)律時(shí),便可進(jìn)行灰色系統(tǒng)建模預(yù)測。
1.2? 嶺回歸模型
當(dāng)回歸方程自變量之間出現(xiàn)多重共線性問題時(shí),使用最小二乘法進(jìn)行預(yù)測的估計(jì)量均方誤差會(huì)變得很大,因此,于1962年Heer對(duì)最小二乘方法進(jìn)行改進(jìn)提出嶺回歸[9],其表達(dá)式為:
w=
XX+λIXy? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (1)
其中:λ為嶺系數(shù),I為單位矩陣。嶺回歸屬于一種有偏估計(jì),通過引入懲罰項(xiàng)來減少不重要因素的重要度得到更好的估計(jì),其代價(jià)函數(shù)為:
Jθ=
hx-y
+
λ
θ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (2)
通過公式可以得到嶺回歸方程,再輸入影響因素預(yù)測值即可上海市物流需求預(yù)測。
2? 上海市物流需求預(yù)測
2.1? 上海市物流需求預(yù)測模型構(gòu)建
在物流需求預(yù)測時(shí),不合適的指標(biāo)會(huì)導(dǎo)致預(yù)測效果變差且增加數(shù)據(jù)收集的工作量,因此需要結(jié)合本地發(fā)展特性選取合適的影響因素以建立合適指標(biāo)體系預(yù)測。對(duì)不確定變化數(shù)據(jù)預(yù)測時(shí),僅用外推方法進(jìn)行預(yù)測會(huì)導(dǎo)致預(yù)測偏差大,而通過外部因素結(jié)合時(shí)間發(fā)展進(jìn)行預(yù)測更能獲得準(zhǔn)確的結(jié)果。本文給出預(yù)測模型圖如圖1所示。
首先,本文考慮多重共線性問題,選擇總均方誤差最優(yōu)的嶺回歸預(yù)測方法。其次,在進(jìn)行物流需求預(yù)測時(shí)嶺回歸需要輸入影響因素的未來預(yù)測值,此數(shù)據(jù)通過GM1,1模型進(jìn)行預(yù)測即可。最后,輸入歷史數(shù)據(jù)到嶺回歸模型中即可獲得嶺回歸方程,將獲得的影響因素預(yù)測數(shù)據(jù)輸入嶺回歸方程中預(yù)測未來4年的物流需求數(shù)據(jù)。此組合預(yù)測模型通過GM1,1預(yù)測影響因素與嶺回歸預(yù)測物流需求的方法相結(jié)合從而實(shí)現(xiàn)結(jié)果的準(zhǔn)確性。
2.2? 物流需求指標(biāo)體系建立
如圖1所示,在獲得物流需求預(yù)測結(jié)果之前需要構(gòu)建指標(biāo)體系,指標(biāo)體系的構(gòu)建關(guān)乎預(yù)測結(jié)果的準(zhǔn)確性。因此,一般選擇與輸出指標(biāo)相關(guān)性強(qiáng)的影響因素,參考文獻(xiàn)[1]可知經(jīng)濟(jì)指標(biāo)、消費(fèi)水平、對(duì)內(nèi)和對(duì)外貿(mào)易是常用影響因素。然而隨著新冠疫情的到來,物流行業(yè)在一段時(shí)間內(nèi)發(fā)展緩慢、國外疫情嚴(yán)重?zé)o變好趨勢、外部輸入導(dǎo)致國內(nèi)疫情反復(fù)都要求考慮國際形勢和國內(nèi)突發(fā)事件的影響,張森[10]認(rèn)為在一個(gè)地區(qū)內(nèi)消費(fèi)水平由人口密度決定,人口密度越大消費(fèi)水平越高,物流需求量越大,同時(shí)人口密度一般由常住人口數(shù)進(jìn)行計(jì)算?;诖?,本文在做上海市物流需求預(yù)測時(shí)增加常住人口數(shù)指標(biāo)建立新的指標(biāo)體系,并以貨運(yùn)量為輸出向量,考慮數(shù)據(jù)可得性選取2009—2021年的上海市各類數(shù)據(jù)作為原始數(shù)據(jù),如表1所示。
3? 實(shí)例分析
為檢驗(yàn)本文模型方法的可行性和有效性,第一,本文基于歷史數(shù)據(jù)得到預(yù)測值驗(yàn)證其可行;第二,對(duì)比預(yù)測模型與BP神經(jīng)網(wǎng)絡(luò)、GM1,1的預(yù)測結(jié)果,并通過均方根誤差、平均相對(duì)誤差和擬合優(yōu)度三個(gè)方面預(yù)測結(jié)果來評(píng)價(jià)本文改進(jìn)模型的優(yōu)越性。
3.1? 數(shù)據(jù)獲取與處理
通過上海市統(tǒng)計(jì)局官網(wǎng)查詢得表1中的相關(guān)指標(biāo)數(shù)據(jù),基于數(shù)據(jù)可獲得性,整理了2009年至2021年的上海市物流需求預(yù)測相關(guān)數(shù)據(jù),如表2所示。
3.2? 實(shí)例驗(yàn)證
根據(jù)圖1流程,首先進(jìn)行嶺回歸預(yù)測,第一步:確定K值,如圖2所示。
圖2以可視形式化展示了本次模型的各個(gè)自變量的標(biāo)準(zhǔn)化系數(shù)趨于穩(wěn)定時(shí)的情況,并根據(jù)方差擴(kuò)大因子法確定K=0.153,為了更好地展示效果,將原先橫坐標(biāo)幅度由0~1至0~0.10。
第二步:輸出嶺回歸分析結(jié)果如下,基于F檢驗(yàn)顯著性P值為0.120*,水平上不呈現(xiàn)顯著性,接受原假設(shè),表明自變量與因變量之間不存在著回歸關(guān)系。同時(shí),模型的擬合優(yōu)度R為0.932,模型表現(xiàn)較為優(yōu)秀。模型的公式:Y=126 228.768+0.517×X
+258.335×X+5.32×X+0.522×X+0.061×X-67.991×X-0.149×X
+1.597×X+3.712×X,最終結(jié)果如表3所示。
第三步:對(duì)二級(jí)指標(biāo)X—X使用GM1,1模型預(yù)測未來4年的數(shù)值,得到結(jié)果如表4所示。實(shí)驗(yàn)發(fā)現(xiàn)總體預(yù)測趨勢良好,其影響因素的預(yù)測偏差僅為0.5~4%。最重要的是,所有影響因素平移轉(zhuǎn)換后序列的所有級(jí)比值都位于區(qū)間0.867,1.154內(nèi),說明平移轉(zhuǎn)換后序列適合構(gòu)建灰色預(yù)測模型。
第四步:將影響因素的預(yù)測數(shù)據(jù)輸入嶺回歸方程中即得到未來4年上海市物流需求量預(yù)測值,如表5所示。
3.3? 不同模型預(yù)測效果對(duì)比分析
為了驗(yàn)證本文模型和方法的優(yōu)越性,現(xiàn)從橫向和縱向分析其優(yōu)越性并以平均相對(duì)誤差、均方根誤差和擬合優(yōu)度進(jìn)行評(píng)比,其中MAPE和RMSE公式如下:
MAPE=? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (3)
RMSE=? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (4)
基于此,給出表6不同模型的MAPE、RMSE和R值,可以發(fā)現(xiàn)本文模型在三個(gè)方面都優(yōu)于其他模型和方法,并至少減少了25.3%的平均相對(duì)誤差、30.34%的均方根誤差及更優(yōu)的擬合優(yōu)度,證明本文所選模型和方法的可行性和有效性。
此外,為了直觀觀察給出圖3不同模型對(duì)上海市物流需求預(yù)測結(jié)果對(duì)比圖,可以發(fā)現(xiàn)紅色線條的預(yù)測效果最好。
4? 結(jié)? 論
本文利用上海市物流需求預(yù)測相關(guān)影響因素建立了嶺回歸-GM1,1組合預(yù)測模型?;谝酝鶎W(xué)者在進(jìn)行物流需求預(yù)測影響因素指標(biāo)體系基礎(chǔ)上分析了海市物流需求的9個(gè)主要影響因素,重新構(gòu)建需求指標(biāo)體系進(jìn)行預(yù)測。同時(shí)鑒于上海市物流需求在總體上表現(xiàn)為波動(dòng)大、難預(yù)測特點(diǎn)上,使用嶺回歸和GM1,1組合預(yù)測,在過程中先對(duì)影響因素使用GM1,1得到的預(yù)測結(jié)果,結(jié)合新指標(biāo)體系在嶺回歸結(jié)果上進(jìn)行未來4年的上海市物流需求預(yù)測。最后,在研究中對(duì)比了本文提出的模型、GM1,1和BP神經(jīng)網(wǎng)絡(luò)的平均相對(duì)誤差、均方根誤差和擬合優(yōu)度指標(biāo),來證明本文模型方法的可行性和優(yōu)越性。
最終結(jié)果表明,本文預(yù)測未來4年上海市物流需求逐年上升,嶺回歸-GM1,1組合預(yù)測模型能更好地預(yù)測上海市物流需求,同時(shí)能有效減少不確定數(shù)據(jù)預(yù)測問題,可為其他市區(qū)的物流需求預(yù)測提供方向。
參考文獻(xiàn):
[1] 楊麒,張志清. 基于BP神經(jīng)網(wǎng)絡(luò)法和二次指數(shù)平滑法的珠海市物流需求預(yù)測比較分析[J]. 物流科技,2022,45(15):27-32.
[2] 武亞鵬,李慧穎,李婷,等. 基于多模型組合的物流需求預(yù)測分析——以武漢市為例[J]. 物流技術(shù),2022,41(6):60-63.
[3] 鄧熠. 基于BP神經(jīng)網(wǎng)絡(luò)的福州都市圈物流需求預(yù)測[J]. 物流工程與管理,2022,44(8):29-31.
[4] 劉新文,劉曉霞. 廣西R&D投入強(qiáng)度預(yù)測——基于灰色GM1,1模型[J]. 生產(chǎn)力研究,2022(9):55-60.
[5] 夏偉懷,劉嘉莉,馮芬玲. 基于隨機(jī)森林的鐵路冷藏運(yùn)輸需求預(yù)測[J]. 鐵道科學(xué)與工程學(xué)報(bào),2022,19(4):909-916.
[6] 徐子涵. 基于組合模型的合肥市航空貨運(yùn)需求預(yù)測研究[D]. 合肥:安徽理工大學(xué),2020.
[7] 黃建華,張迪. 面向不確定物流需求的改進(jìn)GM-BPNN組合預(yù)測方法[J]. 統(tǒng)計(jì)與決策,2022,38(16):26-29.
[8] 段容谷,莊媛媛,張克勇,等. 突發(fā)公共衛(wèi)生事件下多階段應(yīng)急救援物資配置研究[J]. 中國安全生產(chǎn)科學(xué)技術(shù),2021,17(12):142-148.
[9] 邵楠,許冰. 基于嶺回歸的大壩變形位移模型[J]. 測繪與空間地理信息,2021,44(6):191-192,196.
[10] 張森. 基于粗糙集理論和最小二乘支持向量機(jī)的區(qū)域物流需求預(yù)測研究[D]. 深圳:深圳大學(xué),2020.
[11] 劉玉囡,閆國東,紀(jì)如雪. 港口物流與旅游經(jīng)濟(jì)的協(xié)調(diào)發(fā)展研究——基于面板數(shù)據(jù)的實(shí)證分析[J]. 物流科技,2022,45(7):17-21,32.
收稿日期:2023-05-23
基金項(xiàng)目:國家自然科學(xué)基金資助項(xiàng)目(71761006)
作者簡介:吳? 樂(1997—),男,安徽滁州人,貴州大學(xué)管理學(xué)院碩士研究生,研究方向:物流與供應(yīng)鏈管理;陳? 剛(1987—),男,四川廣安人,貴州大學(xué)管理學(xué)院,副教授,博士,研究方向:物流系統(tǒng)優(yōu)化。
引文格式:吳樂,陳剛. 基于嶺回歸和GM1,1組合的上海市物流需求預(yù)測模型[J]. 物流科技,2023,46(15):6-9.