鄭作文 薛紅 張鵬 等
摘要:突發(fā)事件發(fā)生時,如何提高應(yīng)急物流能力是連鎖零售企業(yè)亟待解決的問題。將粗糙集理論引入連鎖零售企業(yè)應(yīng)急需求的預(yù)測中,建立基于粗糙集與支持向量機(jī)的連鎖零售企業(yè)應(yīng)急需求預(yù)測模型。首先利用粗糙集約減數(shù)據(jù),剔除冗余信息,然后把它們作為支持向量機(jī)的輸入矢量來預(yù)測應(yīng)急需求。結(jié)果表明,與傳統(tǒng)支持向量機(jī)模型相比,新的模型預(yù)測精度更高,更能有效預(yù)測應(yīng)急需求。
關(guān)鍵詞:粗糙集;支持向量機(jī);應(yīng)急需求預(yù)測;連鎖零售企業(yè)
中圖分類號:F25
文獻(xiàn)標(biāo)識碼:A
文章編號:16723198(2015)17005503
0引言
連鎖零售企業(yè)的需求預(yù)測是指對消費(fèi)者所需購買的商品數(shù)目進(jìn)行預(yù)測。當(dāng)實(shí)際上需要的商品數(shù)目和預(yù)測數(shù)目有較大差異時,連鎖零售企業(yè)供應(yīng)鏈會受到極大擾動,并且會提高成本,競爭力會降低。如果產(chǎn)品受季節(jié)、廣告和特賣活動等其他因素影響較大時,精確快速的物資需求可以高效提示企業(yè)產(chǎn)品需求量的變化,這能夠顯著減少零售企業(yè)的庫存量,使成本更低,企業(yè)在市場中的競爭力有效提高。所以當(dāng)發(fā)生了突發(fā)事件時,如何能夠快速精確預(yù)測連鎖零售企業(yè)應(yīng)急物資需求量對于企業(yè)供應(yīng)鏈的穩(wěn)定和優(yōu)化具有重大意義。
現(xiàn)在國內(nèi)外對物資需求預(yù)測的方法主要包括回歸分析法和時間序列法,對它們的研究已經(jīng)比較成熟,由于能夠快速得到結(jié)果,所以很多研究員都喜歡這種方法,可是由于它們的模型一般不夠復(fù)雜,且假定實(shí)驗(yàn)條件相對理想,僅考慮了小部分影響因素,因此預(yù)測出來的結(jié)果精度不高,效果不夠理想。除此以外,還有部分研究員利用人工神經(jīng)網(wǎng)絡(luò)、專家系統(tǒng)模型等其他方法進(jìn)行預(yù)測,其中通過人工神經(jīng)網(wǎng)絡(luò)建立模型來進(jìn)行預(yù)測,最后的結(jié)果更加精確,所以越來越多的學(xué)者開始利用人工神經(jīng)網(wǎng)絡(luò)來對物資需求進(jìn)行預(yù)測。但是由概率統(tǒng)計(jì)學(xué)可得,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法僅僅是根據(jù)經(jīng)驗(yàn)風(fēng)險最小化原理(empirical riskminimization)來進(jìn)行學(xué)習(xí),但沒有有效降低期望風(fēng)險;除此以外,由于沒有準(zhǔn)確的理論知識來對神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行確定,它只能通過多次試驗(yàn)得出的經(jīng)驗(yàn)來確定。
最近貝爾實(shí)驗(yàn)室的Vapnik等提出了支持向量機(jī)(support vector machine,SVM),它是一種新的機(jī)器學(xué)習(xí)算法。SVM不僅能將結(jié)構(gòu)風(fēng)險減至最小,而且還最大化地縮小了VC維和經(jīng)驗(yàn)風(fēng)險之間的界限,與神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法相比較,它的預(yù)測效果更好,能更好的代替神經(jīng)網(wǎng)絡(luò)方法,應(yīng)用前景更加優(yōu)越。當(dāng)要處理大規(guī)模數(shù)據(jù)時,由于存在過多的冗余信息,這會極大降低支持向量機(jī)算法的運(yùn)算速度,導(dǎo)致訓(xùn)練消耗更多的時間。為了將SVM算法應(yīng)用于對實(shí)時性要求較高的連鎖零售企業(yè)應(yīng)急需求預(yù)測這個課題上,由于粗糙集算法具有屬性約簡的特點(diǎn),本文引入粗糙集算法用于對與連鎖超市應(yīng)急物資需求量相關(guān)的各種歷史數(shù)據(jù)進(jìn)行約簡,把和決策信息關(guān)系不大的屬性消除,極大地減少了SVM的輸入變量,因此使得SVM算法速度更快,預(yù)測結(jié)果更準(zhǔn)確。
1基于粗糙集與支持向量機(jī)的預(yù)測模型
1.1粗糙集屬性約簡
由粗糙集理論可得,把客觀世界簡化成一個信息系統(tǒng),用A=〈W,Q,V,f〉來表示它,其中:W=x1,x2,…,xn是論域;Q=S∪D是屬性有限集,上式中S=s1,s2,…,sm是條件屬性集;V=v1,v2,…,vm是屬性的值域集,上式中vi是屬性ci的值域:f:W×S→V為信息函數(shù),由上式可得出論域W與條件屬性集S到值域集V的映射。一個決策屬性的決策表的一般表達(dá)形式如表1所示,下表中f(xi,sj)=uj,i,fxi,d=vi,并且uj,i的值和對象xi和條件屬性si相對應(yīng),vi的值和對象xi與決策屬性d相對應(yīng)。
表1決策表的一般表達(dá)形式
假定B是Q的隨便一個屬性子集,可得下式的等價關(guān)系I(B)={(x,y)∈W×W:f(x,a)=f(y,a),a∈B}。假定(x,y)∈I(B),那么x,y相對于B是不可分辨的;假定R為等價關(guān)系族,如果I(R)=I(R-{r}),那么在R中r能夠被消除;如果P=R-{r}相互獨(dú)立,那么P是R中的一個約簡。對于R中無法消除的關(guān)系,我們把它稱為核,核所組成的集合稱為R的核集。
由上可得,粗糙集屬性約簡過程如下所示:
(1)通過論域中的決策屬性和條件屬性建立決策表。
(2)找出決策表中的條件屬性和決策屬性,然后根據(jù)粗糙集算法離散化這些變量。
(3)求出新決策表,然后對它屬性簡約,最終得到約簡的決策規(guī)則。
1.2支持向量機(jī)的基本原理
支持向量機(jī)(Support Vector Machines,簡稱SVM)是一種新的機(jī)器學(xué)習(xí)算法,由Vapnik等人提出,在時間序列預(yù)測和優(yōu)化控制等領(lǐng)域得到廣泛的應(yīng)用。SVM先分解非線性函數(shù)樣本集,然后把它們轉(zhuǎn)化成向量形式,與高維空間相映射,經(jīng)過線性回歸后再映射回原空間。由上可得,它就是一個對非線性數(shù)據(jù)進(jìn)行線性回歸變換,最開始一般用來解決尋優(yōu)分類問題。
通過下圖1詳細(xì)說明了SVM的計(jì)算原理,假設(shè)有實(shí)心點(diǎn)和空心點(diǎn)這兩類樣本,H是最優(yōu)分類線,它兩邊的H1、H2分別代表2類中離分類線H最近且平行于分類線的直線,H1與H的距離和H2與H的距離都被稱作分類間隔,用margin表示。假定分類線H不但可以準(zhǔn)確分開2類樣本,還要使margin最大,那么距離最優(yōu)分類線H最近的樣本向量就稱為支持向量。此外如果要使H能保證經(jīng)驗(yàn)風(fēng)險最小,要求margin最大也就是要保證推廣性的界中的置信區(qū)間最小,這樣也就能夠最小化真實(shí)風(fēng)險。
圖1支持向量機(jī)原理圖
1.3支持向量機(jī)的基本算法
SVM的原理就是找到一個非線性映射j,它能將數(shù)據(jù)x映射到高維特征空間并進(jìn)行線性回歸?,F(xiàn)在給定訓(xùn)練數(shù)據(jù)xi,yi,i=1,2,…,l,其中xi∈Rn是第i個樣本點(diǎn)的n維輸入值,yi∈R為對應(yīng)的目標(biāo)值,l為訓(xùn)練樣本輸目。SVM算法的目標(biāo)就是求出函數(shù)fx,它可以盡量逼近全部樣本點(diǎn)。由上可得,支持向量機(jī)的估計(jì)函數(shù)即:
fx=
(1)
式中:fx是目標(biāo)函數(shù);w,b是目標(biāo)函數(shù)的法向量及偏移量;jx是特征映射函數(shù)。
那么標(biāo)準(zhǔn)支持向量回歸算法就能描述成下面的問題,即
式中:b是通過支持向量計(jì)算求出;核函數(shù)Kxi,x是滿足Mercer條件的任何對稱的核函數(shù)對應(yīng)于特征空間的點(diǎn)積。一般支持向量機(jī)使用的核函數(shù)包括多項(xiàng)式核函數(shù),線性核函數(shù)和徑向基核函數(shù)(RBF)等,本文采用徑向基核函數(shù)。
2基于粗糙集和SVM的短期應(yīng)急需求預(yù)測
首先找出歷史數(shù)據(jù),然后構(gòu)建屬性值決策表A=〈W,Q,V,f〉,其中Q=S∪D。條件屬性S指歷史負(fù)荷和影響因素信息,決策集D指預(yù)測日的應(yīng)急需求值。因?yàn)榇植诩惴ㄊ菍﹄x散數(shù)據(jù)進(jìn)行分析,所以首先要離散化原有數(shù)據(jù),構(gòu)造一個新的信息決策表,然后再采用增量約簡算法進(jìn)行屬性約簡,最后可求出推理規(guī)則集。
由于支持向量機(jī)算采用了RBF核函數(shù),它的參數(shù)c值可以極大影響SVM計(jì)算結(jié)果,所以c值通常大于10小于100,如果c值超過100時,就會產(chǎn)生欠學(xué)習(xí)現(xiàn)象,所以本文假定c=95。
圖2是基于RS預(yù)處理的SVM預(yù)測系統(tǒng)。
圖2基于RS預(yù)處理的SVM預(yù)測系統(tǒng)
3應(yīng)急物資需求量預(yù)測的仿真實(shí)驗(yàn)
在進(jìn)行連鎖零售企業(yè)應(yīng)急物資需求預(yù)測的分析中,主要利用北京城區(qū)應(yīng)急物資需求的數(shù)據(jù)進(jìn)行預(yù)測。
3.1模型參數(shù)選擇
粗糙集理論是一種刻畫不完備、不確定信息的數(shù)學(xué)工具,在保留關(guān)鍵信息的前提下,對數(shù)據(jù)進(jìn)行化簡,使其屬性達(dá)到最小約簡,求得知識的最小表達(dá)。
影響應(yīng)急物資需求的因素有很多,所以首先要采用粗糙集屬性約簡法約減這些影響因素。首先將原始數(shù)據(jù)制成決策表,然后離散化樣本數(shù)據(jù),同時不降低數(shù)據(jù)的原始分類能力。本文采用等頻率離散化方法,首先把連續(xù)屬性值分成k個區(qū)間內(nèi)數(shù)值相等的離散區(qū)間。現(xiàn)在假定有l(wèi)個數(shù)值,可以求出每個區(qū)間有l(wèi)/k個數(shù)值,本文中k=3。在保證決策表決策屬性和條件屬性間不變化依賴關(guān)系前提下,消除多余的條件屬性,約減后求出的核屬性為x1,x2,x3,x4,x5,x6,此時約減后求出的指標(biāo)就是支持向量機(jī)模型的輸入數(shù)據(jù)。
本文將數(shù)據(jù)進(jìn)行粗糙集算法屬性約簡后,得到最優(yōu)屬性集,如表2所示。
表2應(yīng)急物資需求量與影響因素數(shù)據(jù)統(tǒng)計(jì)
其中①為受災(zāi)程度,②為受災(zāi)時間,③為零售企業(yè)門店位置,④為商品消耗周期,⑤為門店商品庫存,⑥為應(yīng)急物資需求量。將表2中1~13組樣本作為訓(xùn)練樣本,14~18組樣本作為檢驗(yàn)樣本。
3.2應(yīng)急物資需求預(yù)測
要建立應(yīng)急物資需求預(yù)測模型,必須求出適當(dāng)?shù)暮撕瘮?shù)基寬γ和懲罰參數(shù)C等,這樣可以有效提高模型預(yù)測精確度,使模型更有效。本文采用交叉驗(yàn)證網(wǎng)格搜索方法來確定優(yōu)化參數(shù)。首先把訓(xùn)練樣本集隨機(jī)分成K個集合,然后訓(xùn)練它里面的K-1個集合,求出一個決策函數(shù),再利用決策函數(shù)測試余下的那個集合,循環(huán)測試K次后,當(dāng)預(yù)測完全部子集后把測試錯誤的平均值定位推廣誤差,這樣就能避免人為選取C和γ所產(chǎn)生的主觀誤差。
對參數(shù)優(yōu)化后再根據(jù)已定的輸入和輸出參數(shù)構(gòu)建建模數(shù)據(jù)Xi,Yii=1,2,…,K,求出輸入?yún)?shù)X和輸出參數(shù)Y之間的非線性映射關(guān)系:Yi=fXif:Rn→R。根據(jù)支持向量機(jī)預(yù)測理論通過求解一個二次規(guī)劃問題即可求出αi、α*i和b,即可求出所需要的預(yù)測模型。最后把檢驗(yàn)樣本代入進(jìn)行預(yù)測,其結(jié)果見表3所示。
表3預(yù)測結(jié)果
基于粗糙集-支持向量機(jī)的應(yīng)急物資需求預(yù)測結(jié)果如圖3所示。由表3和圖3可見,采用基于粗糙集與支持向量機(jī)的預(yù)測模型對連鎖零售企業(yè)應(yīng)急物資需求進(jìn)行預(yù)測,達(dá)到了很高的預(yù)測精度,其最大誤差為5.71%,最小誤差為0.60%,平均誤差分別為2.84%。
圖3基于粗糙集-支持向量機(jī)的應(yīng)急物資需求預(yù)測結(jié)果
4結(jié)束語
本文針對支持向量機(jī)在處理數(shù)據(jù)時無法將數(shù)據(jù)簡化的問題,提出了基于粗糙集與支持向量機(jī)的連鎖零售企業(yè)應(yīng)急物資需求預(yù)測方法,在支持向量機(jī)對樣本數(shù)據(jù)進(jìn)行處理之前,利用粗糙集數(shù)據(jù)屬性約簡的能力對原始數(shù)據(jù)樣本集進(jìn)行預(yù)處理,以實(shí)現(xiàn)與支持向量機(jī)的優(yōu)勢互補(bǔ)。結(jié)果表明,這種預(yù)測方法具有很好的精確性和有效性,具有較高的參考價值。
參考文獻(xiàn)
[1]Martin Christopher. Logistics and Supply Chain Management[M].北京:電子工業(yè)出版社,2010.
[2]洪菁,趙毅,陳強(qiáng).基于模糊粗糙集的瓦斯涌出量預(yù)測模型的研究[J].微計(jì)算機(jī)信息,2007,23(32):259261.
[3]王巍,劉德勝.基于支持向量機(jī)理論的煤礦瓦斯涌出量預(yù)測研究[J].煤礦機(jī)械,2011,32(2):7880.
[4]常甜甜.支持向量機(jī)學(xué)習(xí)算法若干問題的研究[D].西安:西安電子科技大學(xué),2010.
[5]湯建國,祝峰,佘堃.粗糙集與其他軟計(jì)算理論結(jié)合情況研究綜述[J].計(jì)算機(jī)應(yīng)用研究.2010,27(7):24042410.
[6]Ashish Agarwal ,Ravi Shankar. Modeling supply chain performance variables[J]. Asian Academy of Management Journal,2005,10(2):47–68.