汪 明 李少波 傅 廣 馬 旺
(1.貴州大學(xué)機(jī)械工程學(xué)院 貴陽 550000)
(2.貴州大學(xué)公共大數(shù)據(jù)國家重點(diǎn)實(shí)驗(yàn)室 貴陽 550000)
采購經(jīng)理指數(shù)(PMI)最早起源于20 世紀(jì)30 年代,它是通過對采購經(jīng)理或者企業(yè)采購的主要負(fù)責(zé)人的月度問卷調(diào)查結(jié)果匯總計算得到的。國家統(tǒng)計局以及相關(guān)的機(jī)構(gòu)每個月都會進(jìn)行調(diào)查并且公布在國家統(tǒng)計局的網(wǎng)站上。中國PMI 指標(biāo)體系和國際上主要國家PMI 體系基本相同[1]。作為國際上慣用的監(jiān)測宏觀經(jīng)濟(jì)的先行性指標(biāo)之一,PMI具有很強(qiáng)的預(yù)測性,涉及《國民經(jīng)濟(jì)行業(yè)分類》(GB/T4754-2017)中制造業(yè)的31個行業(yè)大類,3000家調(diào)查樣本。它幾乎涵蓋了企業(yè)生產(chǎn)、運(yùn)輸、采購、雇員、配送等企業(yè)運(yùn)轉(zhuǎn)的每一個流程,可以衡量一個國家的生產(chǎn)情況,就業(yè)情況以及物價表現(xiàn)。是反映經(jīng)濟(jì)增長與衰退的晴雨表[2]。同時對于政府來說,通過采購經(jīng)濟(jì)指數(shù)也便于為監(jiān)督和決策工作提供依據(jù)[3~4]。采購經(jīng)理指數(shù)一般分為制造業(yè)采購經(jīng)理指數(shù)、非制造業(yè)采購經(jīng)理指數(shù)以及綜合采購經(jīng)理指數(shù)。采購經(jīng)理指數(shù)以50%作為國家經(jīng)濟(jì)形勢的分界線(榮枯線),PMI>50%表示經(jīng)濟(jì)總體擴(kuò)張,多數(shù)企業(yè)愿意生產(chǎn),企業(yè)營收可觀,此時企業(yè)可擴(kuò)大生產(chǎn)規(guī)模,新建生產(chǎn)線,招聘更多的員工,經(jīng)濟(jì)總體趨勢向好。PMI<50%表示經(jīng)濟(jì)總體收縮,多數(shù)企業(yè)不想生產(chǎn),生產(chǎn)和銷售不成正比,庫存積壓嚴(yán)重,企業(yè)可能面臨裁員的風(fēng)險,經(jīng)濟(jì)在衰退。對于大多數(shù)的中小生產(chǎn)企業(yè)而言,PMI主要可以反映各企業(yè)目前的營運(yùn)狀況,可以為企業(yè)的生產(chǎn)經(jīng)營提供依據(jù),更能有助于企業(yè)管理層預(yù)測行業(yè)未來的經(jīng)濟(jì)的趨勢。在如今高速發(fā)展的社會,企業(yè)如果能更快地掌握行業(yè)經(jīng)濟(jì)形式,就能減少“牛鞭效應(yīng)”,提前布局,提前規(guī)劃[5]。更合理地安排企業(yè)生產(chǎn)運(yùn)行的各個環(huán)節(jié),提升企業(yè)的整體競爭性。而企業(yè)新建生產(chǎn)線擴(kuò)大產(chǎn)能需要的時間較長,所以根據(jù)歷史的PMI值預(yù)測未來的PMI 值對于企業(yè)來說尤為重要。對于PMI 的預(yù)測可以為企業(yè)規(guī)劃布局提供理論依據(jù)及參考。本文通過PSO-SVM 算法對PMI 進(jìn)行了預(yù)測,并且對比了PSO-SVM 算法與傳統(tǒng)SVM 算法的預(yù)測準(zhǔn)確性。
支持向量機(jī)的非線性回歸問題就是擬合一條曲線y=f(x),使訓(xùn)練的樣本基本擬合在一條曲線上。它是依靠一個非線性映射將數(shù)據(jù)映射到一個高維空間,再到高維空間進(jìn)行線性回歸[6]。在本文中假設(shè)有一組訓(xùn)練樣本信號集(xi,yi),i=1,2,…,N,其xi∈Rn,yi∈Rn,N為樣本的數(shù)量。通過一個映射函數(shù)Φ(x)實(shí)現(xiàn)從低維空間到高維空間的非線性映射。函數(shù)f(x)轉(zhuǎn)換為如下形式[7]:
式中,y為輸出向量;x為輸入向量;W為權(quán)重系數(shù);b為偏置項(xiàng);Φ(x)為輸入向量在高維空間上的映射函數(shù)。
因?yàn)轭A(yù)測值和實(shí)際值之間會有偏差,所以引入不敏感損失函數(shù)ε:
式中,f(x,w)為SVM 的預(yù)測值;y為樣本集的真實(shí)值;w為權(quán)重參數(shù)。
假設(shè)在支持向量機(jī)回歸學(xué)習(xí)的精度ε下,所有樣本表示為
函數(shù)的回歸最優(yōu)化問題等價于如下函數(shù)最小化問題:
在SVM 訓(xùn)練學(xué)習(xí)中,非線性擬合曲線會存在一定的偏差,為了適應(yīng)這種偏差,需要添加一個松弛變量ξi[8]。如圖1所示,松弛變量添加后擬合曲線更加精確。此外,還需要引入懲罰系數(shù)C,并且在引入一個懲罰系數(shù)C后,此時函數(shù)的回歸最優(yōu)化問題變?yōu)?/p>
圖1 SVM非線性擬合曲線
懲罰系數(shù)C對支持向量機(jī)的預(yù)測準(zhǔn)確率有較大的影響,所以懲罰系數(shù)C的選取尤為重要。
為了求解最優(yōu)化問題,在引入拉格朗日乘子對偶參數(shù)αi、和徑向核函數(shù)k(xi,xj)后,式(5)這個具有線性不等式約束的二次規(guī)劃最優(yōu)問題可以轉(zhuǎn)化為如下問題[9]。
由于高斯徑向基(RBF)核函數(shù)計算量小,運(yùn)算快,收斂區(qū)間寬,適用于小樣本的數(shù)據(jù)處理。所以本文采用RBF核函數(shù),RBF核函數(shù)如下所示[10]:
式中σ為核參數(shù),對支持向量機(jī)的預(yù)測準(zhǔn)確率也有較大影響,通常選取的C和σ不能確保支持向量機(jī)預(yù)測的準(zhǔn)確率,所以我們引用粒子群算法對參數(shù)C和σ進(jìn)行尋優(yōu)。引入核函數(shù)后求解最優(yōu)回歸函數(shù)表達(dá)式為
粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法是Kennedy 和Eberhart 在1995 年提出的一種群智能優(yōu)化算法[11]。粒子群算法是受鳥類在覓食的過程中個體和整體行為規(guī)則的啟發(fā),在PSO算法中個體最優(yōu)值是個體經(jīng)過的最佳位置,全局最優(yōu)值是種群覓食過程中的最佳位置。在不斷的迭代過程中,每個粒子會根據(jù)個體最優(yōu)值和全局最優(yōu)值更新自己的速度和位置[12]。算法經(jīng)過隨機(jī)初始化后,每個粒子按如下式(9)和式(10)進(jìn)行迭代,直到滿足收斂準(zhǔn)則:
式中,為粒子i在上一次迭代結(jié)束后的速度且,在迭代過程中如果粒子的速度超過了vmax,則認(rèn)為粒子的最大速度為vmax;表示粒子i在任意t+1 時刻的速度和位置的更新;為粒子在i時刻的位置;w為慣性權(quán)重;c1為認(rèn)知參數(shù);c2為社會參數(shù);為個體i在迭代過程中的歷史最優(yōu)位置;gbestt為迭代過程中所有粒子的全局最優(yōu)位置。粒子群優(yōu)化算法流程如圖2 所示,通過不斷迭代更新個體最優(yōu)位置和種群最優(yōu)位置來滿足迭代條件。
圖2 粒子群優(yōu)化算法流程
用粒子群算法優(yōu)化SVM,實(shí)際上就是優(yōu)化參數(shù)懲罰系數(shù)C和核參數(shù)σ[13~15],其尋優(yōu)過程如下:
1)生成訓(xùn)練的樣本,進(jìn)行歸一化處理到[0,1]區(qū)間,并劃分?jǐn)?shù)據(jù)集。
2)初始化參數(shù)C1、C2以及最大進(jìn)化數(shù)量、種群最大數(shù)量等參數(shù)。
3)通過更新粒子的速度、位置等參數(shù)尋優(yōu)SVM。
4)利用最新得到最優(yōu)懲罰參數(shù)C與核參數(shù)σ重新訓(xùn)練一次支持向量機(jī)。
5)用訓(xùn)練的PSOSVM對數(shù)據(jù)進(jìn)行預(yù)測。
本文用Matlab2019 進(jìn)行實(shí)驗(yàn)仿真,對比PSOSVM 與SVM 的預(yù)測準(zhǔn)確率。采取的實(shí)驗(yàn)數(shù)據(jù)來自于國家統(tǒng)計局[16]。本實(shí)驗(yàn)選取了從2016年12月到2021 年3 月的月度制造業(yè)采購經(jīng)理指數(shù),共計52個實(shí)驗(yàn)數(shù)據(jù),分成13 組。用前四個月的制造業(yè)采購經(jīng)理指數(shù)預(yù)測后四個月的采購經(jīng)理指數(shù),原始數(shù)據(jù)如表1所示,歸一化處理后的數(shù)據(jù)如表2所示。
表1 原始數(shù)據(jù)
表2 歸一化處理后的數(shù)據(jù)
在只運(yùn)用傳統(tǒng)支持向量機(jī)的情況下用Matlab進(jìn)行仿真結(jié)果如圖3。
圖3 SVM仿真結(jié)果
可以看出雖然SVM 能預(yù)測指數(shù)的漲跌情況,但是預(yù)測結(jié)果與真實(shí)結(jié)果存在了一定的差異。這些差異就是沒有尋優(yōu)懲罰系數(shù)C和核參數(shù)σ所導(dǎo)致的。利用2.3 節(jié)中的訓(xùn)練方法,設(shè)置粒子群算法尋優(yōu)的基本參數(shù),設(shè)置最大迭代次數(shù)K=100 次,種群最大數(shù)量sizepop 為20 個,種群最大進(jìn)化數(shù)量為200 個。認(rèn)知參數(shù)C1 的初始值為1.5,社會參數(shù)C2的初始值為1.7。用Matlab 進(jìn)行適應(yīng)度尋優(yōu)迭代過程如圖4。
圖4 PSOSVM尋優(yōu)曲線
由圖4 可知此預(yù)測模型迭代到50 次左右達(dá)到最優(yōu)值。根據(jù)此模型,在尋優(yōu)最優(yōu)參數(shù)的基礎(chǔ)上,對SVM進(jìn)行仿真結(jié)果如圖5。
圖5 PSOSVM仿真結(jié)果
可以看出PSO-SVM 的每次一的預(yù)測結(jié)果都比SVM 預(yù)測結(jié)果更加接近真實(shí)值,PSO-SVM 的預(yù)測準(zhǔn)確率較高,與真實(shí)值差異小。
制造業(yè)企業(yè)需要能夠時刻調(diào)整自己的生產(chǎn)規(guī)劃來適應(yīng)市場的需求變化,PMI以其可靠性為企業(yè)提供了參考。通過對支持向量機(jī)參數(shù)的尋優(yōu),PSO-SVM 算法能夠大致判斷PMI 的漲跌情況,預(yù)測值與實(shí)際值相差不大,且PSO-SVM 算法具有較強(qiáng)的穩(wěn)定性,收斂速度也比傳統(tǒng)SVM 快,相比于傳統(tǒng)SVM,PSO-SVM 算法能夠提供更精準(zhǔn)地預(yù)測來滿足企業(yè)的需求。