耿立艷,郭 斌
物流需求預測在制定物流發(fā)展整體規(guī)劃、整合物流資源、進行有效物流管理中起到非常重要的作用。物流需求是社會經(jīng)濟活動的派生需求,主要受到經(jīng)濟發(fā)展整體水平、產(chǎn)業(yè)結構、技術進步等眾多因素的影響,而且各因素之間的關系復雜,導致物流需求與其影響因素之間具有難以用精確數(shù)學模型描述的復雜非線性關系。
目前,物流需求預測模型主要包括時間序列分析模型、回歸分析模型、灰色預測模型、粗糙集理論、神經(jīng)網(wǎng)絡法、支持向量機等,但這些方法在物流需求預測中尚存在一定問題,難以獲得理想的預測效果。最小二乘支持向量機[1](Least Squares Support Vector Machines,LSSVM)是一種改進型SVM,以等式約束替換SVM中的不等式約束,將求解二次規(guī)劃轉(zhuǎn)化為求解線性方程組,降低了計算復雜性,提高了運算速度,在物流需求預測中得到應用[2,3]。LSSVM的預測精度取決于其參數(shù)的選擇,目前對LSSVM參數(shù)的選取沒有統(tǒng)一的規(guī)則,主要依賴于經(jīng)驗與試算,在一定程度上限制了LSSVM的推廣與應用。為解決這一問題,智能算法,如遺傳算法[4]、蟻群算法[5]、粒子群算法[6]等,被引入到LSSVM參數(shù)優(yōu)化中,一定程度上改善了LSSVM預測效果。
粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法以其算法簡單、有效的特點,被廣泛用于選擇LSSVM最優(yōu)參數(shù)。但標準PSO算法存在收斂速度慢、易于陷入極值等缺陷,限制了其尋優(yōu)能力的提高。近年來,許多學者對影響標準PSO算法的兩個關鍵參數(shù)——慣性權重和加速系數(shù)進行了改進,提出了不同的改進PSO算法。在加速系數(shù)改進PSO算法中,獲得廣泛認可的有時變加速系數(shù)粒子群優(yōu)化(Time Varying Acceleration Coefficients Particle Swarm Optimization,TVACPSO)算法[7]和動態(tài)加速系數(shù)粒子群優(yōu)化(Dynamic Acceleration Coefficients Particle Swarm Optimization,DACPSO)算法[8]。文獻[9]利用時TVACPSO算法選擇LSSVM最優(yōu)參數(shù),并通過區(qū)域物流需求數(shù)據(jù),驗證了其有效性。目前有關DACPSO算法選擇LSSVM最優(yōu)參數(shù)的研究很少,因此,DACPSO算法選擇LSSVM最優(yōu)參數(shù)的有效性有待驗證。
本文提出一種LSSVM結合DACPSO算法的物流需求預測模型,利用LSSVM的非線性映射能力預測物流需求量,同時采用DACPSO算法優(yōu)化選擇LSSVM的最優(yōu)參數(shù)。利用我國的物流數(shù)據(jù),根據(jù)所選用的評價指標評價模型的有效性。結果表明,與其他模型相比,本文模型在物流需求預測方面具有更好的性能。
設一個給定的樣本集 (xk,yk),k=1,2,...,N ,xk∈Rd為d維輸入向量,yk∈R為相應一維輸出變量,利用內(nèi)積定義的非線性映射函數(shù)?(·)將樣本集從原始輸入空間映射到高維特征空間中,然后在這個高維特征空間中利用如下線性函數(shù)擬合樣本集:
基于結構風險最小化原理,回歸問題可轉(zhuǎn)化為以下優(yōu)化問題:
約束條件:
其中,ω和b分別為LSSVM的權向量和偏差值,γ為懲罰參數(shù),ek為誤差。為求解上述帶約束優(yōu)化問題,引入拉格朗日乘子αk,定義拉格朗日方程:
根據(jù)KKT優(yōu)化條件,可得到以下線性方程組:
其中,IN為N階單位矩陣,1N為由N個1組成的列向量,y=[y1,…,yN]T,α=[α1,…,αN]T為拉格朗日乘子矩陣,Ωkj=?(xk)T?(xj),k,j=1,2,...N.。
根據(jù)Mercer條件定義核函數(shù):
解出α和b后,可得到LSSVM的回歸模型為:
標準PSO算法已成功應用于函數(shù)優(yōu)化、極值優(yōu)化、多目標優(yōu)化等領域,但在某些問題優(yōu)化方面,標準PSO算法在搜索初期粒子缺乏多樣性,容易落入局部最優(yōu)值,在搜索后期收斂速度減慢。而DACPSO算法通過動態(tài)調(diào)節(jié)加速系數(shù)的自適應能力,實現(xiàn)算法的多樣性,避免陷入局部最優(yōu)值。
設在D維搜索空間中,粒子的群體規(guī)模為m,每個粒子代表所優(yōu)化問題的一個潛在解。設第i個粒子的速度和位置分別為Vi=(vi1,vi2,…,viD)和Si=(si1,si2,…,siD)。每個粒子根據(jù)前一次迭代中的個體最優(yōu)位置Pibest=(pi1,pi2,…,piD)和粒子群的全局最優(yōu)位置Pgbest=(gi1,gi2,…,giD)變換自身的搜索方向?qū)ふ易顑?yōu)解。每個粒子的位置對應一個適應度值,粒子的優(yōu)劣由適應度值度量。每個粒子的速度和位置根據(jù)以下公式更新:
其中,wmax與wmin分別為最大、最小慣性權重,tmax為最大迭代次數(shù)。
c1與c2為加速系數(shù),分別表示粒子的個體經(jīng)驗信息和其它粒子經(jīng)驗信息對該粒子尋優(yōu)路徑的影響。尋優(yōu)過程中,在搜索初期,應有大的c1值和小的c2值,使粒子進行全局尋優(yōu)、避免陷入局部極值;在搜索后期,應有小的c1值和大的c2值,使粒子不受其它粒子影響,增加粒子的多樣性,提高收斂速度和搜索精度。為達到該目的,在迭代過程中,將兩加速系數(shù)設為隨粒子的適應度值不斷更新:
其中,c1(t)∈[0,4],c2(t)∈[0,4]。fa(t)為當前粒子的平均適應度值,fg(t)為當前粒子群最優(yōu)位置對應的適應度值。由式(12)可知,在迭代初期,fa(t)與 fg(t)差異較大,c1(t)值較大、c2(t)值較小,有利于全局尋優(yōu);在迭代后期,fa(t)與fg(t)差異較小,c1(t)值較小、c2(t)值較大,有利于提高收斂速度和搜索精度[8]。
LSSVM的形式?jīng)Q定于核函數(shù)的選擇,選擇不同的核函數(shù)可形成不同的LSSVM模型。常用的核函數(shù)中,徑向基(Radial Basis Function,RBF)函數(shù)具有較強的泛化能力,應用最為廣泛,若選取RBF函數(shù)為核函數(shù):
其中,σ2為核參數(shù),則LSSVM回歸模型轉(zhuǎn)化為:
為獲得較好的性能,需調(diào)整LSSVM參數(shù)(γ,σ2),一般采用交叉驗證法,但該方法比較耗時,且?guī)в幸欢ǖ闹饔^性和隨意性,難以獲得最優(yōu)解,在一定程度上影響LSSVM的預測精度和建模速度。
LSSVM-DACPSO模型將LSSVM的構建及預測步驟嵌入到DACPSO算法尋優(yōu)過程中,利用DACPSO算法搜索LSSVM參數(shù)(γ,σ2)?;舅枷胧?,每個粒子在γ和σ2構成的二維空間中搜索全局最優(yōu)解,將LSSVM的預測誤差設為適應度函數(shù),計算每個粒子的位置對應的適應度值,通過適應度值來尋找粒子的全局最優(yōu)位置。具體設計如下:
①數(shù)據(jù)標準化處理。對原始數(shù)據(jù)樣本進行標準化處理,將其轉(zhuǎn)化為[0,1]之間的無量綱數(shù)據(jù),標準化公式如下:
②初始化粒子群。設定群體規(guī)模數(shù)m,最大、最小慣性權重wmax、wmin的值,以及最大迭代次數(shù)tmax。在二維搜索空間中隨機產(chǎn)生一組參數(shù)(γ,σ2)作為粒子的初始速度和位置。
③定義適應度函數(shù)。將適應度函數(shù)定義為均方根誤差:
④粒子進化。根據(jù)式(16)計算每個粒子的適應度值,在迭代過程中,搜索每個粒子的最優(yōu)位置Pibest和粒子群的全局最優(yōu)位置Pgbest。根據(jù)式(8)、式(9)更新粒子的速度和位置,根據(jù)式(10)計算慣性權重,根據(jù)式(11)、式(12)計算加速系數(shù)。
⑤終止條件判斷。若最大迭代次數(shù)滿足要求,則停止計算,此時全局最優(yōu)位置Pgbest即為LSSVM最優(yōu)參數(shù)值;否則t=t+1,轉(zhuǎn)到步驟③。
⑥LSSVM模型建立。將最優(yōu)參數(shù)(γ*,σ2*)代入式(5)求解出α和b,根據(jù)式(14)建立LSSVM模型并進行預測,再對預測值進行反標準化處理,最終得到原始數(shù)據(jù)的預測值。
物流需求包括質(zhì)量和數(shù)量兩個方面,質(zhì)量方面指物流活動提供的物流服務水平;數(shù)量方面指物流活動中運輸、儲存、裝卸、包裝、流通加工等物流作業(yè)量的總和,即物流需求規(guī)模。相應的,物流需求的量化指標分為兩類:物流需求質(zhì)量指標和物流需求規(guī)模指標。物流需求質(zhì)量指標主要有物流時間、物流費用、物流效率,在定量預測中很少使用該類指標。物流需求規(guī)模指標主要有社會物流總費用、社會物流總額、貨運量及貨物周轉(zhuǎn)量。社會物流總費用是一定時期內(nèi)社會物流活動中各項支出的總費用,它從物流成本角度衡量物流需求,其變化反映了物流需求的變化趨勢,是比較準確的物流需求量化指標;社會物流總額是一定時期內(nèi)全社會物流物品的價值總額,它從價值量角度衡量物流需求,其變化能在一定程度上反映物流需求的變化趨勢;貨運量及貨物周轉(zhuǎn)量從貨運規(guī)模角度衡量物流需求,物流活動中除了貨物運輸環(huán)節(jié)外,還包括儲存、包裝、流通加工等多個緊密相關的環(huán)節(jié),所以貨物運輸量不能完全代表物流作業(yè)量。綜上分析,本文選取社會物流總費用作為物流需求的量化指標。
物流需求的影響因素廣泛且復雜,可概括為以下幾個方面:(1)國家經(jīng)濟發(fā)展水平。物流需求作為經(jīng)濟活動的派生需求,與國家經(jīng)濟發(fā)展水平密切相關。國家經(jīng)濟發(fā)展水平及速度對物流需求產(chǎn)生直接影響,經(jīng)濟發(fā)展水平越高、發(fā)展速度越快,對物流的需求就越大。(2)產(chǎn)業(yè)結構。各產(chǎn)業(yè)對物流的需求程度不同,第一產(chǎn)業(yè)和第二產(chǎn)業(yè)的產(chǎn)品產(chǎn)量是物流運輸?shù)闹饕獙ο?,它的多少直接反映了物流需求的大??;第三產(chǎn)業(yè)以服務業(yè)為主,對物流的依賴程度較小。但隨著我國產(chǎn)業(yè)結構的調(diào)整與升級,尤其是第三產(chǎn)業(yè)比重的快速增長將會帶動批發(fā)零售業(yè)和運輸業(yè)的發(fā)展,從而帶動物流的需求的快速增長。(3)固定資產(chǎn)投資總額。固定資產(chǎn)投資總額是固定資產(chǎn)投資的外在表現(xiàn)形式,固定資產(chǎn)的投資將轉(zhuǎn)化為下一時期的生產(chǎn)能力,促使物流需求相應增加。(4)貨物進出口總額。國內(nèi)外貿(mào)易能夠促進社會商品的流通,商品的流通要依賴于物流的支持,從而對物流需求起拉動作用。隨著貨物進出口總額的增長,物流需求不斷增長。(5)社會消費品零售總額。社會消費品零售總額的大小,直接反映一個國家的商品產(chǎn)銷和配送的發(fā)展水平,是衡量物流需求直接表現(xiàn)的指標,社會消費品零售總額的增長將加快物流需求的增長。(6)居民消費水平。居民消費水平直接決定了企業(yè)的生產(chǎn)和銷售活動,從而對物流需求產(chǎn)生影響。居民消費水平的提高會促使企業(yè)生產(chǎn)和銷售新產(chǎn)品,推動物流的需求,反之,則會抑制物流的需求。(7)信息技術。信息技術的發(fā)展可以提升物流需求的服務質(zhì)量和范圍,進而增加對物流的需求。郵電業(yè)務總量在一定程度上可以反映一個國家的信息技術發(fā)展水平,可作為信息技術的衡量指標。(8)物流運輸需求。運輸是實現(xiàn)貨物位置轉(zhuǎn)移的重要環(huán)節(jié),物流運輸需求在物流需求中占較大比重,對物流需求產(chǎn)生重要影響,物流運輸需求的增長將引起物流需求的增長。
綜上所述,依據(jù)指標的可量化性和數(shù)據(jù)的可得性,選取以下11項指標為物流需求的影響因素:國內(nèi)生產(chǎn)總值、固定資產(chǎn)投資總額、第一產(chǎn)業(yè)總產(chǎn)值、第二產(chǎn)業(yè)總產(chǎn)值、第三產(chǎn)業(yè)總產(chǎn)值、郵電業(yè)務總量、貨物進出口總額、社會消費品零售總額、居民消費水平、貨運量,以及貨物周轉(zhuǎn)量。以我國1991~2011年相關數(shù)據(jù)為樣本進行實例分析。
首先將數(shù)據(jù)樣本標準化到[0,1]區(qū)間,然后將整個數(shù)據(jù)樣本分為兩部分:1991~2005年的數(shù)據(jù)作為訓練樣本訓練模型,2006~2011年的數(shù)據(jù)作為檢驗樣本驗證模型的預測能力。
LSSVM-DACPSO中,DACPSO算法的自身參數(shù)作如下設置:粒子群規(guī)模m設為10;最大迭代次數(shù)tmax設為30;最大、最小慣性權重分別設為wmax=0.9,wmin=0.1,加速系數(shù)c1(t)和c2(t)依賴于粒子群的適應度值,這里無須設置。DACPSO算法尋優(yōu)過程中,為減少隨機性對LSSVM參數(shù)選擇的影響,選取連續(xù)運行10次中獲得的最優(yōu)參數(shù)(γ*,σ2*)建立LSSVM模型,然后進行向前一步預測。
為驗證本文模型的預測性能,同時利用TVACPSO算法、標準PSO算法、交叉驗證法(Cross Validation,CV)選擇LSSVM最優(yōu)參數(shù)并建立預測模型預測物流需求,分別記為LSSVM-TVACPSO模型、LSSVM-PSO模型、LSSVM-CV模型,其中,TVACPSO算法的自身參數(shù)設為:m=10;wmax=0.9,wmin=0.1;c1,ini=2.5,c1,fin=0.5,c2,ini=0.5,c2,fin=2.5;tmax=30。PSO算法自身參數(shù)設為:m=10;wmax=0.9,wmin=0.1;c1=c2=2。CV方法采用5折交叉驗證法確定LSSVM參數(shù)。四種算法搜索的最優(yōu)參數(shù)及所用時間如表1所示。
表1 最優(yōu)參數(shù)及搜索時間
DACPSO算法、TVACPSO算法和PSO算法搜索LSSVM最優(yōu)參數(shù)的時間均明顯少于5折交叉驗證法,其中,DACPSO算法有效的局部與全局搜索能力使得尋優(yōu)所用時間最少,僅為20.5765秒,而基于5折交叉驗證法的尋優(yōu)過程計算工作量很大,所用時間達到138.7785秒。
圖1 預測結果比較
表2和圖1分別給出四種模型的預測結果和相對預測誤差。LSSVM-DACPSO模型的預測精度明顯優(yōu)于其他三模型,預測出的社會物流總費用較其他三模型更接近于實際值。LSSVM-DACPSO模型預測期內(nèi)的最大、最小相對預測誤差僅為2.92%和0.66%,其他三模型的最大、最小相對預測誤差較大,分別為3.68%和1.33%、3.69%和0.97%、3.64%和0.87%。
表2 相對預測誤差比較
采用均方根誤差(Root Mean Squared Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)、平均相對誤差(Mean Percentage Error,MPE)、西爾統(tǒng)計量(Theil)共 4項指標評價模型的預測能力,指標定義如下:
其中,n為檢驗樣本個數(shù),yl和分別為社會物流總費用的實際值與預測值。以上指標值越小,模型的預測能力越好,結果如表3所示。
表3 預測能力比較
由表3可知,LSSVM-DACPSO模型的預測能力優(yōu)于其他三模型,其RMSE、MAE、MPE、Theil值均明顯小于其他三模型的對應值,這主要是由于DACPSO算法通過使加速系數(shù)隨適應度值不斷變化,保障粒子的多樣性和算法的收斂性,進而提高了LSSVM的預測能力。TVACPSO算法通過使加速系數(shù)隨迭代次數(shù)不斷變化,增加粒子的多樣性及收斂性,搜索性能較標準PSO算法有所改善,因而LSSVM-TVACPSO模型的預測能力介于LSSVM-DACPSO模型與LSSVM-PSO模型之間;而LSSVM-CV模型由于5折交叉驗證法的主觀性與隨意性,預測能力在四模型中最差。
本文提出一種基于DACPSO算法的LSSVM物流需求預測模型,并以我國物流需求為研究對象,通過最優(yōu)參數(shù)搜索時間、相對預測誤差和預測性能評價指標RMSE、MAE、MPE、Theil驗證模型的有效性。結果顯示,LSSVM-DACPSO模型的相對預測誤差值和四個預測性能評價指標值均小于LSSVM-TVACPSO、LSSVM-PSO及LSSVM-CV模型的對應值,且DACPSO算法搜索LSSVM最優(yōu)參數(shù)的時間小于TVACPSO算法、PSO算法及CV方法。因此,從提高預測能力與建模速度角度,LSSVM-DACPSO模型是一種有效的物流需求預測方法,為物流需求預測提供有益參考。
[1] Suykens J T,Van G I.Least Squares Support Vector Machines[M].Singapore:Singapore Word Scientific,2002.
[2] 龐明寶,謝玲,郝然等.基于偏最小二乘支持向量機回歸區(qū)域物流量預測[J].河北工業(yè)大學學報,2008,37(2).
[3] 梁毅剛,耿立艷.基于核主成分-最小二乘支持向量機的區(qū)域物流需求預測.鐵道運輸與經(jīng)濟,2012,34(11).
[4] 許桂梅,黃圣國.應用LS-SVM的飛機重著陸診斷[J].系統(tǒng)工程理論與實踐,2010,30(4).
[5] 王娟,劉明治.蟻群算法滾動優(yōu)化的LS-SVM預測控制研究[J].控制與決策,2009,24(7).
[6] 陳如清,俞金壽.基于粒子群最小二乘支持向量機的軟測量建模[J].系統(tǒng)仿真學報,2007,19(22).
[7] Chaturvedi K T,Pandit M,Srivastava L.Particle Swarm Optimization With Time Varying Acceleration Coefficients For Non-Convex Eco?nomic Power Dispatch[J].Electrical Power and Energy Systems,2009,(31).
[8] 紀震,廖惠連等.粒子群算法及應用[M].北京:科學出版社,2009.
[9] Geng L Yan,Dong Q T.Forecast of Regional Logistics Demand Us?ing KPCA-Based LSSVMs Optimized By PSOTVAC[J].Advanced in Information Sciences and Services Sciences,2012,4(19).