謝榮燕 ,趙明
(1.河海大學(xué)商學(xué)院,江蘇南京211100;2.海軍航空大學(xué),山東煙臺264000)
支持向量機(jī)(Support Vector Machine,SVM),是由Vapnik提出的一種新興的基于數(shù)據(jù)學(xué)習(xí)的機(jī)器學(xué)習(xí)技術(shù),是最大間隔超平面、Mercer核、凸二次規(guī)劃、稀疏解和松弛變量等技術(shù)的集大成者。與以人工神經(jīng)網(wǎng)絡(luò)為代表的其他機(jī)器學(xué)習(xí)技術(shù)不同的是,SVM的理論基礎(chǔ)是統(tǒng)計學(xué)習(xí)理論,而不是傳統(tǒng)的統(tǒng)計學(xué)理論。利用SVM進(jìn)行預(yù)測的應(yīng)用領(lǐng)域正在逐步拓展,SVM預(yù)測方法除了在工業(yè)界得以應(yīng)用外,在經(jīng)濟(jì)金融、生物學(xué)等領(lǐng)域也逐漸得到應(yīng)用。支持向量機(jī)是統(tǒng)計學(xué)習(xí)理論中最核心的部分,其在回歸算法的研究方面表現(xiàn)出了極好的性能,尤其對小樣本問題有非常好的擬合效果。支持向量機(jī)(SVM)方法根據(jù)結(jié)構(gòu)風(fēng)險最小化(SRM)原則,通過轉(zhuǎn)化為一個凸二次規(guī)劃問題來求解,能夠保證得到的極值就是全局最優(yōu)解,一方面可以有效地克服過學(xué)習(xí)問題,另一方面又可以防止造成維數(shù)災(zāi)難,在解決小樣本學(xué)習(xí)問題上具有神經(jīng)網(wǎng)絡(luò)等方法不可比擬的優(yōu)勢。
以影響生產(chǎn)設(shè)備采購量發(fā)生的因素作為輸入,以生產(chǎn)設(shè)備采購量作為輸出,建立基于支持向量機(jī)生產(chǎn)設(shè)備采購量預(yù)測模型,其基本步驟如圖1所示。
圖1 支持向量機(jī)生產(chǎn)設(shè)備采購量預(yù)測流程
第1步,尋找與生產(chǎn)設(shè)備采購量相關(guān)的各個影響因素。影響生產(chǎn)設(shè)備采購量的因素有很多,采購量不僅與歷史需求有關(guān),而且與其他多種影響因素有關(guān),同時各影響因素相互之間的關(guān)系比較復(fù)雜。如生產(chǎn)設(shè)備運轉(zhuǎn)時間、生產(chǎn)設(shè)備綜合性能、生產(chǎn)設(shè)備的采購的難易程度等因素,都對生產(chǎn)設(shè)備采購量有不同程度的影響。
第2步,生產(chǎn)設(shè)備采購量驅(qū)動因子(描述各個影響因素的說明性變量)的選取。生產(chǎn)設(shè)備采購量驅(qū)動因子的確定原則:采購量驅(qū)動因子合乎邏輯地和各個影響因素相聯(lián)系;采購量驅(qū)動因子的變化引起生產(chǎn)設(shè)備采購量的變化具有一貫性;采購量驅(qū)動因子的量值易于確定。
第3步,對數(shù)據(jù)進(jìn)行預(yù)測處理,采用支持向量機(jī)對生產(chǎn)設(shè)備采購量樣本進(jìn)行學(xué)習(xí),生產(chǎn)設(shè)備采購量驅(qū)動因子是輸入,生產(chǎn)設(shè)備采購量為輸出;并對精度進(jìn)行分析,若不能達(dá)到要求的精度,重新選擇核函數(shù),若達(dá)到精度要求,生成合適的SVM預(yù)測函數(shù)。
第4步,輸入新的生產(chǎn)設(shè)備采購量情況樣本或者已有生產(chǎn)設(shè)備采購量在不同情況下的樣本,到支持向量機(jī)模型中進(jìn)行生產(chǎn)設(shè)備采購量預(yù)測。
第6步,增添新的生產(chǎn)設(shè)備采購量樣本到支持向量機(jī)進(jìn)行學(xué)習(xí),不斷地提高生產(chǎn)設(shè)備采購量預(yù)測的精度。
第7步,預(yù)測生產(chǎn)設(shè)備采購量數(shù)據(jù),保存模型。
根據(jù)對某企業(yè)采購情況的分析研究,影響生產(chǎn)設(shè)備采購量的主要因素包括:生產(chǎn)設(shè)備運轉(zhuǎn)時間、生產(chǎn)設(shè)備綜合性能、生產(chǎn)設(shè)備的采購的難易程度。
(1)生產(chǎn)設(shè)備運轉(zhuǎn)時間,運轉(zhuǎn)時間越長,發(fā)生故障的概率也就越大,需要采購量增加。
(2)生產(chǎn)設(shè)備綜合性能:制造工藝、產(chǎn)品質(zhì)量等也會對生產(chǎn)設(shè)備的消耗產(chǎn)生重要的影響,生產(chǎn)設(shè)備質(zhì)量越好,平均故障間隔時間越小,生產(chǎn)設(shè)備的需要采購量就越小。
(3)生產(chǎn)設(shè)備的采購的難易程度:生產(chǎn)設(shè)備易于采購,采購時間短,則生產(chǎn)設(shè)備的儲備量就不用太多;反之,生產(chǎn)設(shè)備采購困難,采購時間長,則儲備量就要相對多一些,采購量也就更高一些。
根據(jù)此原則將生產(chǎn)設(shè)備采購量C的主要影響因素歸納為:生產(chǎn)設(shè)備運轉(zhuǎn)時間T、故障率Q,平均故障間隔時間M、不易采購的程度S。將影響生產(chǎn)設(shè)備采購的4個因素作為支持向量機(jī)的輸入?yún)?shù),將生產(chǎn)設(shè)備的采購量C作為輸出。
在上述4個影響因素中,前3個指標(biāo)均為數(shù)值指標(biāo),很容易量化。而對于第4個因素,可以通過查詢生產(chǎn)設(shè)備的訂貨紀(jì)錄結(jié)合工作人員的經(jīng)驗,將這一指標(biāo)轉(zhuǎn)化為0~1的數(shù)值指標(biāo),即極易容易采購則賦值為1,否則為0。
對于設(shè)備采購量的預(yù)測準(zhǔn)確度評,可以從常用的測評價方法中選取合適的指標(biāo)作為評價標(biāo)準(zhǔn)。本文選用平均絕對誤差(MAE,Mean Absolute Eror)、均方誤差(MSE,Mean Squared Error)對采購量的預(yù)測結(jié)果進(jìn)行綜合評價。評價指標(biāo)計算如下:
根據(jù)上述定義可知,MAE、MSE值越小,表明預(yù)測值與實際值的擬合精度越高,則需求預(yù)測的準(zhǔn)確度越高。
以年為單位,對某生產(chǎn)設(shè)備2000年到2009年采購影響因素的相關(guān)數(shù)據(jù)進(jìn)行搜集整理,結(jié)果見表1。以前9年的數(shù)據(jù)作為訓(xùn)練樣本,以第10年(2009年)的數(shù)據(jù)作為測試樣本,應(yīng)用基于支持向量機(jī)的生產(chǎn)設(shè)備采購模型進(jìn)行采購量預(yù)測。
表1 某生產(chǎn)設(shè)備各年采購影響因素的相關(guān)數(shù)據(jù)
為了適應(yīng)支持向量機(jī)的對數(shù)據(jù)的要求,減少誤差,進(jìn)而更加準(zhǔn)確的進(jìn)行采購量預(yù)測,采用極差變換法分別對數(shù)據(jù)按照下列步驟進(jìn)行歸一化處理:
(1)尋找各數(shù)據(jù)中的最大值和最小值,分別記為MAX,MIN;
(2)將第t年的數(shù)據(jù)Xi轉(zhuǎn)化為:
通過極差變換法,將每年影響生產(chǎn)設(shè)備采購量的相關(guān)數(shù)據(jù)均變?yōu)閷儆赱0,1]區(qū)間的值。某生產(chǎn)設(shè)備各年采購量影響因素的相關(guān)數(shù)據(jù)經(jīng)歸一化處理的結(jié)果見表2。極差變換歸一化處理并不改變各期數(shù)據(jù)之間的相對關(guān)系,因此,不會影響到采購量預(yù)測模型的構(gòu)建。
表2 歸一化某生產(chǎn)設(shè)備各年采購量影響因素的相關(guān)數(shù)據(jù)
運用支持向量機(jī)回歸原理進(jìn)行該生產(chǎn)設(shè)備的采購量進(jìn)行預(yù)測。選擇RBF核函數(shù)作為核函數(shù),因為RBF核函數(shù)只有一個g,再加上一個懲罰系數(shù)C,所以只需對這兩個參數(shù)進(jìn)行優(yōu)化。選擇網(wǎng)格搜索法對懲罰系數(shù)C和核參數(shù)g進(jìn)行優(yōu)化,參數(shù)尋優(yōu)的過程如圖2所示。當(dāng)C=1024,g=0.0315時MSE取達(dá)到最小值,此時的(C,g)取值為最優(yōu)值。
由圖3可知,預(yù)測曲線與實際數(shù)據(jù)的擬合性能較好,經(jīng)計算得到MAE=0.645,MSE=0.7191,2009的采購預(yù)測值為12.316。
圖3 生產(chǎn)設(shè)備采購量預(yù)測SVM-RBF核函數(shù)
根據(jù)以上數(shù)據(jù)實驗的結(jié)果與分析,對比此種方法的MAE、MSE值及2009年的采購預(yù)測值可以得出以下結(jié)論:采用RBF優(yōu)化參數(shù)的支持向量機(jī)進(jìn)行預(yù)測所得到的結(jié)果和實際值十分接近。利用支持向量機(jī)回歸理論對生產(chǎn)設(shè)備采購量進(jìn)行預(yù)測,方法簡單,對數(shù)據(jù)的樣本量要求較少,預(yù)測過程比較客觀,不存在主觀因素,可以高效、準(zhǔn)確地對采購量進(jìn)行預(yù)測。因此,運用支持向量機(jī)這種新興的工具能夠較好地解決小樣本生產(chǎn)設(shè)備采購量預(yù)測問題。
采購工作是一個企業(yè)正常運轉(zhuǎn)的一項重要內(nèi)容,它與一個企業(yè)合理優(yōu)化各種資源配置密切相關(guān)。生產(chǎn)設(shè)備作為一個企業(yè)采購的核心部心,價值大、重要性高,其采購量預(yù)測模型是企業(yè)管理理論研究的一個重要領(lǐng)域。一般模型在預(yù)測采購量時通常假定其服從某種概率分布,如正態(tài)分布、泊松分布等,然后通過樣本數(shù)據(jù)進(jìn)行參數(shù)估計和假設(shè)檢驗,進(jìn)而得到采購預(yù)測數(shù)據(jù)。但是這類方法的理論基礎(chǔ)是基于樣本數(shù)目趨于無窮大的漸進(jìn)理論。生產(chǎn)設(shè)備的小樣本的采購特征決定其歷史使用數(shù)據(jù)的樣本量有限,這使得對其采購量預(yù)測的難度非常大。支持向量機(jī)是基于統(tǒng)計學(xué)習(xí)理論的一種新的機(jī)器學(xué)習(xí)算法,它根據(jù)有限樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折衷,以期獲得最好的推廣能力,解決了以往學(xué)習(xí)方法中存在的小樣本、非線性、過學(xué)習(xí)、高維數(shù)、局部極小等實際問題。本文將支持向量機(jī)回歸原理應(yīng)用到生產(chǎn)設(shè)備采購量預(yù)測領(lǐng)域,提出了基于支持向量機(jī)生產(chǎn)設(shè)備采購量預(yù)測的基本步驟。以實際數(shù)據(jù)為例,運用支持向量機(jī)進(jìn)對生產(chǎn)設(shè)備采購量進(jìn)行預(yù)測,驗證了支持向量機(jī)預(yù)測性能的先進(jìn)性。