馬 歡,廖 燕
(1.武漢理工大學 汽車學院,湖北 武漢 430070;2.現(xiàn)代汽車零部件技術湖北省重點實驗室(武漢理工大學),湖北 武漢 430070;3.汽車零部件技術湖北省協(xié)同創(chuàng)新中心,湖北 武漢 430070)
城市物流系統(tǒng)為區(qū)域經(jīng)濟發(fā)展和城市各項功能的正常運轉(zhuǎn)提供了保證。物流需求預測是城市物流系統(tǒng)規(guī)劃的前提,是物流行業(yè)合理配置物流資源和制定發(fā)展規(guī)劃的重要依據(jù)。因此,及時而準確的物流需求規(guī)模預測有利于城市物流系統(tǒng)的優(yōu)化和完善,有助于物流企業(yè)進一步降低成本、提升效率。
目前用于物流需求預測的理論方法較多,主要包括回歸分析法、時間序列法、灰色預測、人工智能算法等。武進靜等[1]選取與物流需求相關性較高的經(jīng)濟指標作為自變量,建立物流需求和相關經(jīng)濟因素的多元回歸預測模型,對此后10年的江蘇省貨運量進行預測,總體反映了未來的物流需求量。Yavuz Acar[2]認為在供應鏈管理中,預測是經(jīng)營業(yè)績的重要影響因素,采用集成指數(shù)平滑法優(yōu)化和仿真實際的日常需求建立供應鏈模型,實驗表明,預測方法的選擇會對經(jīng)營業(yè)績產(chǎn)生顯著差異。劉源[3]認為交通運輸系統(tǒng)沒有物理原型以及內(nèi)部機理不明確,因此將其視作灰色系統(tǒng),使用GM(1,1)模型對河南省歷史貨運數(shù)據(jù)建立預測模型并進行外推,灰色模型可以在數(shù)據(jù)有限的情況下進行比較準確的預測。賈素琴等[4]利用ARIMA模型對影響物流的經(jīng)濟指標進行預測,將各指標的預測值作為輸入,貨運量作為期望建立RBF神經(jīng)網(wǎng)絡預測模型,具有較好的精度。
綜合上述文獻,以回歸分析和時間序列為代表的傳統(tǒng)預測方法無法應對物流需求量突發(fā)性和隨機性的情況,灰色系統(tǒng)預測模型沒有考慮物流需求的多個影響因素,人工神經(jīng)網(wǎng)絡雖然具有很強的非線性擬合特性,但其容易陷入局部最優(yōu)和輸出不穩(wěn)定。
支持向量回歸機(Support Vector Regression,SVR)適用于解決小樣本、非線性和高維數(shù)據(jù)空間計算問題,并且得到的解為全局最優(yōu)[5]。針對區(qū)域物流需求非線性和波動性的特征,SVR能夠最大限度地挖掘隱含于物流需求歷史數(shù)據(jù)中的信息[6],在預測方面更具優(yōu)勢。但在實際應用中SVR對參數(shù)選擇的依賴性很大,實驗證明不同的核函數(shù)參數(shù)、懲罰參數(shù)及損失函數(shù)都會影響最終的預測性能[7]。傳統(tǒng)的SVR模型參數(shù)確定方法以人工選擇法和網(wǎng)格搜索法為主,存在主觀性大、運算量大和耗時長的問題。遺傳算法(Genetic Algorithm,GA)是一種借鑒生物進化過程自然選擇和遺傳理論的一種全局優(yōu)化搜索算法,具有群體搜索和內(nèi)在啟發(fā)式隨機搜索的特性,不易陷入局部最優(yōu),非常適用于大規(guī)模并行計算[8]?;诖?,將遺傳算法與支持向量回歸算法相結合,充分發(fā)揮二者的優(yōu)勢,利用GA尋優(yōu)的特性得到SVR模型中的關鍵參數(shù),進而建立物流需求預測模型,得到精確的結果。
支持向量回歸是利用支持向量的思想和拉格朗日乘子式的方式對數(shù)據(jù)擬合回歸的一種方法。其基本思想是,對于給定訓練數(shù)據(jù)集,通過一個非線性映射φ(x)把樣本向量從原空間映射到高維特征空間,在高維空間構造決策函數(shù):
ω是權值向量,b是偏置量。根據(jù)風險最小化原則,引入松弛因子 ξi、ξi*和不敏感損失系數(shù)ε,SVR問題轉(zhuǎn)化為:
引入Lagrange乘子α、α*,轉(zhuǎn)化為該問題的對偶問題:
求解上述問題,得SVR的決策函數(shù):
核函數(shù)選取RBF核函數(shù),表達式為:
支持向量回歸的預測精度很大程度上依賴于核函數(shù)及其中的參數(shù)選取,核函數(shù)的引入避免了復雜計算[9]。其形式與參數(shù)變化會隱式地改變從函數(shù)的映射關系,進而改變映射特征空間的復雜程度,從而影響支持向量回歸機的性能。RBF核函數(shù)的關鍵參數(shù)是σ即核的寬度,它控制著函數(shù)的徑向作用范圍。懲罰參數(shù)C在模型復雜度和訓練誤差之間起平衡調(diào)節(jié)的作用,C值越大,表示對超出損失函數(shù)的數(shù)據(jù)懲罰越大,影響模型的推廣能力。損失函數(shù)ε表示訓練數(shù)據(jù)和真實數(shù)據(jù)的逼近精度,若數(shù)值過小,則回歸精度較高,但有可能導致模型過于復雜,推廣能力差;若過大則模型簡單,導致學習精度不夠。目前還沒有確定的理論來指導支持回歸機的參數(shù)選擇,針對該問題將參數(shù)選擇看作多變量組合優(yōu)化問題。
遺傳算法對SVR參數(shù)優(yōu)化的基本思想是:把生物進化原理引入優(yōu)化參數(shù)(C,σ,ε)形成的編碼串聯(lián)群體中,按照所選擇的適應度函數(shù),通過遺傳中的選擇、交叉和變異對個體進行迭代,直至滿足終止條件,達到智能尋優(yōu)的目的。
遺傳算法優(yōu)化SVR預測模型的實現(xiàn)流程如下:
(1)獲取物流需求量數(shù)據(jù),并且對其進行預處理,確定訓練樣本集和測試樣本集。
(2)設置GA參數(shù)及對SVR參數(shù)進行編碼。染色體以{x1,x2,x3}形式表示,其中x1,x2,x3分別代表C,σ,ε,以實數(shù)編碼方式進行染色體編碼,即每個染色體用一個實數(shù)串表示。
(3)計算每個個體的適應度。適應度計算采用K-交叉驗證后的均方誤差平均值作為適應度值,衡量選取參數(shù)的優(yōu)劣,計算方法如下:
(4)判斷是否滿足迭代條件。若不滿足則進行選擇、交叉和變異操作。
選擇操作采用輪盤賭法篩選適應度值高的種群進入下一代,個體Xi的適應度值為f(Xi),則被選取為下一代的概率為:
交叉操作采用線性組合的方式,以某概率p(p∈[0,1])對兩個染色體進行交叉操作,即:
變異操作采用均勻變異方式,即對于要變異的個體X=(x1,x2,···,xn),隨機產(chǎn)生一個隨機數(shù)k∈[1,n],產(chǎn)生新的后代 X=(x1,x2,···,xk’,···,xn),其中 xk’是[lk,uk]中服從均勻分布的一個隨機數(shù)。
如果滿足條件則輸出SVR參數(shù)。
(5)構造SVR預測模型,將遺傳算法尋優(yōu)最終得到的參數(shù)代入SVR預測模型中進行仿真預測。
具體流程如圖1所示。
圖1 GA-SVR預測建模流程
現(xiàn)階段關于物流需求量的統(tǒng)計沒有一個明確的指標,考慮數(shù)據(jù)的可得性及完整性,一般把貨運量作為物流需求規(guī)模的指標。綜合物流需求相關研究結論[10-11],將物流需求影響因素分為經(jīng)濟總量類、產(chǎn)業(yè)結構類、人口發(fā)展類、固定投資類、進出口貿(mào)易類。利用灰色關聯(lián)分析法,選取關聯(lián)度大的因子建立武漢市物流需求影響因素指標體系,最終確定與貨運量關聯(lián)度最高的8個因子為影響武漢市物流需求變化的驅(qū)動因子,包括人口規(guī)模X1(萬人)、地區(qū)生產(chǎn)總值X2(億元)、第一產(chǎn)業(yè)產(chǎn)值X3(億元)、第二產(chǎn)業(yè)產(chǎn)值X4(億元)、第三產(chǎn)業(yè)產(chǎn)值X5(億元)、固定資產(chǎn)投資總額X6(億元)、進出口貿(mào)易總額X7(億美元)、居民人均可支配收入X8(元)等生產(chǎn)或經(jīng)濟指標作為因變量,自變量為貨運量Y(萬t)。
數(shù)據(jù)來源于《武漢統(tǒng)計年鑒》,選取2006-2016年貨運量及其影響因素數(shù)據(jù)作為研究對象,進行物流需求的預測分析,具體數(shù)據(jù)見表1。
表1 物流需求及經(jīng)濟指標統(tǒng)計數(shù)據(jù)
由于原始變量數(shù)據(jù)的單位不統(tǒng)一以及數(shù)據(jù)間量級相差過大,為提高數(shù)據(jù)訓練效率和預測模型精度,需要對原始數(shù)據(jù)進行歸一化處理,轉(zhuǎn)化為無量綱的數(shù)據(jù)。歸一化公式如下:
其中xi為初始值,xi*為歸一化值,xmin,xmax表示變量的最大值和最小值。
將經(jīng)過歸一化處理的2006-2014年數(shù)據(jù)作為樣本訓練集數(shù)據(jù),利用RBF核函數(shù)建立SVR物流需求預測模型。模型的參數(shù)設置如下:選用ε-SVR,懲罰因子C的取值范圍為[0,100],RBF核函數(shù)參數(shù)σ的取值范圍為[0,1 000],遺傳算法最大的進化代數(shù)為100,種群最大數(shù)量為20,交叉概率為0.4,變異概率為0.01,交叉驗證參數(shù)設置為5。
根據(jù)已確定的最優(yōu)懲罰參數(shù)、核半徑、不敏感損失參數(shù),建立SVR物流需求預測模型。將2006-2014年的數(shù)據(jù)作為訓練數(shù)據(jù),再將2015-2016年的數(shù)據(jù)作為測試數(shù)據(jù),對GA-SVR模型的推廣能力進行測試。仿真結果如圖2,可以看出模型對于訓練集的擬合性能較好。
利用建立的模型對測試集數(shù)據(jù)進行預測,同時,分別采用網(wǎng)格搜索SVR模型、BP神經(jīng)網(wǎng)絡預測模型對武漢市2015-2016年物流需求量進行對比預測,各模型預測結果見表2。
圖2 GA-SVR模型對訓練集的擬合效果
表2 3種模型預測結果對比
使用均方根誤差(RMSE)和平均絕對誤差百分比(MAPE)作為評價指標,定義如下:
其中y∧i代表預測值,yi代表真實值,n為預測樣本數(shù)。
表3 3種模型誤差對比
使用RMSE和MAPE衡量模型預測結果的優(yōu)劣,兩個指標的值越小,預測結果越精確。從表3可以看出GA-SVR預測模型RMSE和MAPE均優(yōu)于未經(jīng)優(yōu)化的SVR和BP神經(jīng)網(wǎng)絡預測模型,預測精度較好。未經(jīng)優(yōu)化的SVR模型次之,神經(jīng)網(wǎng)絡模型效果最差。
SVR具有人工智能算法強大的非線性擬合特性,同時克服了其輸出結果不穩(wěn)定的缺點,在處理小樣本情況下復雜非線性規(guī)律的問題時具有優(yōu)良的特性,但其在實際應用中存在參數(shù)值難以確定的問題。通過將遺傳算法和支持向量回歸相結合,利用優(yōu)化的參數(shù)建立SVR預測模型并對武漢市物流需求數(shù)據(jù)進行實例驗證,結果表明預測模型具有良好的預測精度。通過與網(wǎng)格搜索SVR模型和BP神經(jīng)網(wǎng)絡模型相比,GA-SVR模型能夠更為準確地預測物流需求量,為物流需求預測提供了一種新的參考方法。
[參考文獻]
[1]武進靜,韓興勇.基于多元線性回歸模型對江蘇省物流需求的預測分析[J].上海農(nóng)業(yè)學報,2015,31(4).
[2]Acar Y,Gardner E S.Forecasting method selection in a global supply chain[J].InternalJournalofForecasting,2012,28(4):842-848.
[3]劉源.基于灰色預測模型的物流需求分析[J].物流技術,2012,31(6).
[4]賈素琴,楊家其.基于ARIMA—RBF模型的區(qū)域物流需求預測[J].物流技術,2016,35(4).
[5]汪海燕,黎建輝,楊風雷.支持向量機理論及算法研究綜述[J].計算機應用研究,2014,31(5).
[6]王霞,王占岐,金貴,等.基于核函數(shù)支持向量回歸機的耕地面積預測[J].農(nóng)業(yè)工程學報,2014,30(4).
[7]朱霄珣,徐博超,焦宏超,等.遺傳算法對SVR風速預測模型的多參數(shù)優(yōu)化[J].電機與控制學報,2017,21(2).
[8]馬永杰,云文霞.遺傳算法研究進展[J].計算機應用研究,2012,29(4).
[9]鄧乃揚,田英杰,數(shù)據(jù)挖掘中的新方法—向量機[M].北京:科學出版社,2004.
[10]胡小建,張美艷,盧林.物流需求預測模型構建[J].統(tǒng)計與決策,2017,(19).
[11]陳海英,張萍,柳合龍.人工魚群算法優(yōu)化支持向量機的物流需求預測模型研究[J].數(shù)學的實踐與認識,2016,46(2).