裴 欽,雷 昭
(1.皖江工學(xué)院 財(cái)經(jīng)學(xué)院,安徽 馬鞍山 243031;2.安徽工業(yè)大學(xué) 化工學(xué)院,安徽 馬鞍山 243032)
隨著經(jīng)濟(jì)發(fā)展越來(lái)越快,我國(guó)在很短的周期內(nèi)實(shí)現(xiàn)了工業(yè)大國(guó)的發(fā)展進(jìn)程,而甲醇一直是我國(guó)工業(yè)發(fā)展進(jìn)程中不可或缺的重要角色[1]。隨時(shí)間的變化,受月度產(chǎn)量、季節(jié)、國(guó)家宏觀(guān)經(jīng)濟(jì)等因素影響,甲醇產(chǎn)品價(jià)格具有波動(dòng)性、不穩(wěn)定性[2]。對(duì)于傳統(tǒng)預(yù)測(cè)方法來(lái)說(shuō),其預(yù)測(cè)過(guò)程的主要依據(jù)為專(zhuān)家經(jīng)驗(yàn)與統(tǒng)計(jì)學(xué)相關(guān)信息,對(duì)價(jià)格波動(dòng)的預(yù)測(cè)準(zhǔn)確性可能會(huì)存在誤差[3]。由于甲醇是我國(guó)工業(yè)發(fā)展進(jìn)程中不可或缺的一部分,而大宗商品又與經(jīng)濟(jì)興衰直接相關(guān),因此很多研究人員對(duì)預(yù)測(cè)甲醇產(chǎn)品價(jià)格投入極大精力[4]。甲醇價(jià)格在原材料價(jià)格、市場(chǎng)供求關(guān)系和其他系列相關(guān)產(chǎn)品影響下,會(huì)出現(xiàn)比較明顯的波動(dòng)[5]。在關(guān)乎國(guó)家戰(zhàn)略意義的大宗商品當(dāng)中,甲醇會(huì)對(duì)農(nóng)業(yè)發(fā)展起到關(guān)鍵的推動(dòng)作用,因此其重要性可見(jiàn)一斑[6]。對(duì)甲醇價(jià)格進(jìn)行精確預(yù)測(cè)面臨巨大挑戰(zhàn)性,大宗商品的數(shù)據(jù)正在飛速累積,與此同時(shí)網(wǎng)絡(luò)技術(shù)也正在迅速發(fā)展,如果有效利用網(wǎng)絡(luò)技術(shù)篩選有用信息,對(duì)預(yù)測(cè)過(guò)程非常重要[7]。
甲醇和很多商品價(jià)格走勢(shì)預(yù)測(cè)是我們國(guó)內(nèi)外很多學(xué)者關(guān)心熱點(diǎn)話(huà)題[8-10],李康琪等采用MA(3)-GARCH(1,1)模型專(zhuān)業(yè)地分析了BRENT原油期貨收盤(pán)價(jià)波動(dòng)性的相關(guān)數(shù)據(jù)[11];董振宇等多人搭建了國(guó)際原油價(jià)格預(yù)測(cè)的雙層隨機(jī)整數(shù)規(guī)劃模型[12];陳羽瑱采用Copula及小波分析法,研究了原油期貨價(jià)格的波動(dòng)與人民幣匯率變動(dòng)[13];王新宇等提出CPAAVS-CAViaR原油市場(chǎng)的風(fēng)險(xiǎn)預(yù)測(cè)模型[14]。基于這些,本文基于甲醇價(jià)格影響因素的專(zhuān)業(yè)分析,提出甲醇價(jià)格的短期與長(zhǎng)期預(yù)測(cè)等問(wèn)題,構(gòu)建短期和長(zhǎng)期預(yù)測(cè)的模型。
神經(jīng)系統(tǒng)網(wǎng)絡(luò)的迅猛發(fā)展,為深層前饋神經(jīng)系統(tǒng)網(wǎng)絡(luò)帶來(lái)機(jī)遇,受眾范圍也越來(lái)越廣[15],極端學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)為這一類(lèi)單隱層前饋神經(jīng)網(wǎng)絡(luò)(Single-hidden Layer Feed forward Network,SLFN)的學(xué)習(xí)方法,與單隱層前饋神經(jīng)系統(tǒng)網(wǎng)絡(luò)學(xué)習(xí)算法相比,其不同之處就是當(dāng)其處于訓(xùn)練狀態(tài)時(shí),輸入權(quán)值的多選性可隨機(jī)進(jìn)行指令,即將輸入層和隱層權(quán)值連接,權(quán)值輸出后將會(huì)對(duì)輸出層與隱層權(quán)值進(jìn)行連接,并基于分析方法確定。
極端學(xué)習(xí)機(jī)單隱層前饋神經(jīng)網(wǎng)絡(luò)神經(jīng)元有三層,然而輸入層不執(zhí)行計(jì)算,但提供數(shù)據(jù)特征,隱層為非線(xiàn)性神經(jīng)元,輸出層是線(xiàn)性的,無(wú)偏置或轉(zhuǎn)換函數(shù)。在ELM方法中隨機(jī)設(shè)置輸入層權(quán)重w和偏差b。固定輸入權(quán)重后,輸出權(quán)重β是相對(duì)獨(dú)立的,不需迭代處理算法學(xué)習(xí)。線(xiàn)性輸出層計(jì)算速度非常快,且最終可得到線(xiàn)性解。隨機(jī)輸入層權(quán)重產(chǎn)生幾乎正交隱含層特征,可提高線(xiàn)性輸出層解的泛化性質(zhì)。因系數(shù)較小,在輸出時(shí)線(xiàn)性系統(tǒng)不增加輸入誤差,則權(quán)重小使系統(tǒng)抗噪性更強(qiáng)、更穩(wěn)定。給定一組N個(gè)不同訓(xùn)練樣本(xi,ti),i∈[1,N],且xi∈Rn,ti∈Rm。帶有隱層神經(jīng)元L個(gè)的輸出方程如式(1)所示。
(1)
在公式(1)當(dāng)中,βi、bi分別表示輸出權(quán)重與偏差。網(wǎng)絡(luò)的輸入與輸入權(quán)重分別為xi、wi,激活函數(shù)用φ表示,而ti則表示期望輸出,公式(2)所示為估計(jì)輸出yi關(guān)系。
(2)
其中,ε表示噪聲。隨機(jī)噪聲與輸入中未顯示的變量關(guān)系都屬于噪聲的一部分。輸入數(shù)據(jù)通過(guò)隱層神經(jīng)元進(jìn)行轉(zhuǎn)換后,會(huì)轉(zhuǎn)變?yōu)椴煌谋憩F(xiàn)形式?;谳斎雽悠?、權(quán)重實(shí)現(xiàn)隱層數(shù)據(jù)的投影。轉(zhuǎn)換投影數(shù)據(jù)后,非線(xiàn)性轉(zhuǎn)換函數(shù)可將ELM學(xué)習(xí)能力極大提高,轉(zhuǎn)換后,隱層數(shù)據(jù)尋找輸出權(quán)重用H表示。圖1為極端學(xué)習(xí)機(jī)的輸出示意圖。
圖1 極端學(xué)習(xí)機(jī)的輸出示意圖
在神經(jīng)元中,隱層變換函數(shù)不受函數(shù)類(lèi)型限制,可運(yùn)用曲正切函數(shù)、sigmoid函數(shù)、閾值函數(shù)等。一般情況下,神經(jīng)數(shù)量與線(xiàn)性數(shù)據(jù)特征數(shù)量存在相等的關(guān)系,且神經(jīng)元的特征都會(huì)被其復(fù)制,即一個(gè)w和零個(gè)b。對(duì)于ELM來(lái)說(shuō),徑向基神經(jīng)元比較常見(jiàn),其隱層輸入為到原心距離,基于非線(xiàn)性投影函數(shù)進(jìn)行操作。當(dāng)ELM當(dāng)中存在RBF神經(jīng)元時(shí),發(fā)揮原心、樣本間的任何距離函數(shù)的作用,預(yù)測(cè)主要基于相似訓(xùn)練數(shù)據(jù)樣本進(jìn)行,從而推動(dòng)解決目標(biāo)、數(shù)據(jù)特征間復(fù)雜依賴(lài)關(guān)系。當(dāng)基于矩陣表示ELM,此時(shí)會(huì)輸出并聚集隱層神經(jīng)元,表示形式如式(3)、式(4)所示。
(3)
(4)
在隨機(jī)初始化SLFN輸入偏差、權(quán)重條件下,激活函數(shù)無(wú)限可微,對(duì)隱層輸出矩陣進(jìn)行確定,并提供一個(gè)估計(jì)值,該值是帶有任意小噪聲目標(biāo)值估計(jì)。
設(shè){(xi,ti)|xi∈Rn,ti∈Rm,i=1,2,…,N}為算法參數(shù)學(xué)習(xí)樣本集合,給定隱層神經(jīng)元個(gè)數(shù)、激活函數(shù)類(lèi)型后,第一步是連接輸入層、隱層間突觸權(quán)值wi及隱層神經(jīng)元偏差,隨機(jī)生成bi,i=1,2,…,L;第二步是對(duì)隱層神經(jīng)元的輸出H進(jìn)行計(jì)算;第三步是利用隱層輸出的廣義逆,對(duì)隱層和輸出間的連接突觸權(quán)值β進(jìn)行計(jì)算,β=H+T,T=[t1,t2,…,tN]T。
要提高甲醇價(jià)格預(yù)測(cè)精度,需將影響甲醇價(jià)格的主要因素找出來(lái),影響甲醇價(jià)格因素眾多,在預(yù)測(cè)甲醇產(chǎn)品價(jià)格前,需對(duì)相關(guān)評(píng)價(jià)指標(biāo)進(jìn)行確定。
(1)影響甲醇價(jià)格的因素
甲醇市場(chǎng)供需是影響甲醇價(jià)格的諸多元素中的一項(xiàng),該因素包括甲醇的進(jìn)出口量、產(chǎn)量等,如果在某個(gè)階段國(guó)外甲醇產(chǎn)品的價(jià)格較低,而產(chǎn)量和進(jìn)口量又較高時(shí),國(guó)內(nèi)市場(chǎng)將出現(xiàn)供大于需的情況,產(chǎn)品價(jià)格自然下降;而如果某個(gè)階段國(guó)外甲醇產(chǎn)品價(jià)格較高,出口量較大時(shí),此時(shí)國(guó)內(nèi)將會(huì)出現(xiàn)供小于需的情況,產(chǎn)品價(jià)格自然提高。需求量也是對(duì)甲醇價(jià)格產(chǎn)生很大影響的關(guān)鍵因素,然而統(tǒng)計(jì)參數(shù)過(guò)程復(fù)雜,且很難統(tǒng)計(jì)完全。因此,本文將需求量作為定量,選取甲醇價(jià)格產(chǎn)量、進(jìn)口量、出口量作為自變量,衡量甲醇價(jià)格波動(dòng)的情況。
(2)甲醇的歷史價(jià)格及成本因素
歷史價(jià)格、供需都會(huì)對(duì)甲醇未來(lái)價(jià)格產(chǎn)生影響,也就是說(shuō)過(guò)去的價(jià)格是決定甲醇未來(lái)價(jià)格的重要因素。因此,要參考甲醇?xì)v史價(jià)格才能更客觀(guān)地預(yù)測(cè)甲醇未來(lái)價(jià)格。煤炭成本是甲醇價(jià)格成本的重要支出,這是由于其生產(chǎn)流程中煤炭作為主要消耗品決定的,這就意味著煤炭?jī)r(jià)格因素會(huì)對(duì)甲醇價(jià)格產(chǎn)生直接影響。
影響甲醇價(jià)格的因素并不只有一個(gè),而是多個(gè)因素同時(shí)對(duì)其產(chǎn)生協(xié)同作用,預(yù)測(cè)甲醇產(chǎn)品價(jià)格評(píng)價(jià)指標(biāo)的相關(guān)性分析非常必要。本文采用關(guān)聯(lián)分析對(duì)相關(guān)因素進(jìn)行確定,所選取的方法為比較常見(jiàn)的回歸關(guān)聯(lián)分析法和皮爾遜(Pearson)相關(guān)系數(shù)法。
(1)皮爾遜(Pearson)相關(guān)系數(shù)
皮爾遜相關(guān)系數(shù)指的是兩變量相近程度的統(tǒng)計(jì)值,可對(duì)其特性和類(lèi)別之間的相似值進(jìn)一步核算,以此可對(duì)其提取出的特性和種類(lèi)的程度進(jìn)行一一判斷核驗(yàn)??梢源朔椒▉?lái)判斷兩個(gè)變量之間的相關(guān)方位,將X設(shè)為一定變量,Y為可變量,皮爾遜相關(guān)系數(shù)為ρX,Y為因變量,皮爾遜相關(guān)系數(shù)為ρX,Y,增大自變量后因變量隨之增大時(shí),ρX,Y>0;反之,ρX,Y<0;ρX,Y=0表示兩者間無(wú)關(guān)系。通常ρX,Y∈[1,1],可得到更大絕對(duì)值的相關(guān)系數(shù),此時(shí)有更高的相關(guān)(正、負(fù))關(guān)系;如果得到較小絕對(duì)值的相關(guān)系數(shù),此時(shí)有更小的相關(guān)(正、負(fù))程度,1、-1分別表示完全正相關(guān)與完全負(fù)相關(guān),式(5)所示為Pearson相關(guān)系數(shù)公式。
(5)
表1 Pearson算法計(jì)算的相關(guān)系數(shù)表
根據(jù)表1,分析甲醇價(jià)格影響因素之間的關(guān)聯(lián)性,由此得出甲醇價(jià)格與出口量、進(jìn)口均價(jià)、出口均價(jià)呈線(xiàn)性相關(guān),與甲醇進(jìn)口量呈負(fù)相關(guān),與其他影響因素相比,與月產(chǎn)量、煤炭?jī)r(jià)格相關(guān)性相對(duì)較低。
(2)回歸關(guān)聯(lián)分析
回歸關(guān)聯(lián)分析方法是確定兩組或兩組以上變量間的關(guān)系,本文通過(guò)線(xiàn)性回歸的方式處理變量,將甲醇價(jià)格作為研究過(guò)程的因變量,其價(jià)格影響因素則分別作為自變量。相關(guān)性分析結(jié)果如表2所示。
表2 相關(guān)性分析結(jié)果表
分析表2可以看出,甲醇價(jià)格與煤炭?jī)r(jià)格、進(jìn)口量、進(jìn)口均價(jià)、出口量、出口均價(jià)月產(chǎn)量存在如式(6)所示的關(guān)聯(lián)。
y=1.810x1-2.592x2+6.418x3+19.885x4+
(6)
其中,煤炭?jī)r(jià)格為x1,進(jìn)口量為x2,進(jìn)口均價(jià)為x3,出口量為x4,出口均價(jià)為x5,月產(chǎn)量為x6,甲醇價(jià)格為y。分析式(6)可以看出,甲醇價(jià)格的影響因素中,煤炭?jī)r(jià)格與月產(chǎn)量的相關(guān)性較低,進(jìn)出口均價(jià)、出口量與甲醇價(jià)格為線(xiàn)性相關(guān),同時(shí)與進(jìn)口量負(fù)相關(guān),所以能夠準(zhǔn)確分析得出不同變量與甲醇價(jià)格之間的關(guān)聯(lián)。
為提高預(yù)測(cè)甲醇價(jià)格的準(zhǔn)確度,劃分輸入變量,基于甲醇價(jià)格間影響關(guān)系重構(gòu)甲醇價(jià)格空間,在預(yù)測(cè)甲醇價(jià)格時(shí),要結(jié)合其價(jià)格變化趨勢(shì)動(dòng)態(tài)進(jìn)行。建立ELM模型并用2011—2020年甲醇價(jià)格構(gòu)成時(shí)間序列進(jìn)行訓(xùn)練,對(duì)相應(yīng)模型中參數(shù)進(jìn)行確定,利用2020年5月中30天實(shí)際價(jià)格數(shù)據(jù)與預(yù)測(cè)值進(jìn)行比較,對(duì)模型的有效性進(jìn)行確認(rèn)。
(1)數(shù)據(jù)的預(yù)處理
使用ELM極端學(xué)習(xí)機(jī)構(gòu)建甲醇價(jià)格預(yù)測(cè)模型時(shí),需輸入神經(jīng)網(wǎng)絡(luò)變量,即煤炭?jī)r(jià)格、甲醇價(jià)格、進(jìn)口均價(jià)、表觀(guān)消費(fèi)量、出口均價(jià)進(jìn)行相空間重構(gòu),對(duì)輸入變量的延遲時(shí)間τ、嵌入維數(shù)m進(jìn)行確定。在甲醇價(jià)格短期預(yù)測(cè)中,通過(guò)算法仿真有τ=1,選取嵌入維數(shù)m=10。分析甲醇數(shù)據(jù),針對(duì)短期預(yù)測(cè),本文通過(guò)相空間重構(gòu)的方式處理甲醇價(jià)格時(shí)間序列,選取2011—2020年甲醇價(jià)格作為時(shí)間序列,使用ELM模型展開(kāi)訓(xùn)練,確定模型參數(shù),在確定τ=1、m=10后,對(duì)原時(shí)間序列空間重構(gòu)獲得式(7)所示的相空間矢量式。
p(ti)=F(P(ti-1),P(ti-2),…,P(ti-10))
(7)
其中,預(yù)測(cè)的產(chǎn)品價(jià)格為p(ti),P(tk),i-1≤k≤i-10表示甲醇價(jià)格。將自變量輸入極端學(xué)習(xí)機(jī),維數(shù)為10,同時(shí)確定10個(gè)輸入層神經(jīng)元;甲醇實(shí)際價(jià)格為自變量,維變量和輸出層神經(jīng)元均為1。
(2)短期結(jié)果預(yù)測(cè)分析
本文在MATLAB7.1環(huán)境下,計(jì)算CPU為3.2GHz的奔騰四機(jī)器上進(jìn)行,驗(yàn)證算法有效性,采用Sigmoid函數(shù)為ELM學(xué)習(xí)算法激活函數(shù),激活函數(shù)個(gè)數(shù)為20個(gè)。以2011—2020年每天甲醇價(jià)格為數(shù)據(jù)進(jìn)行訓(xùn)練,并進(jìn)行數(shù)據(jù)相空間重構(gòu),對(duì)樣本點(diǎn)進(jìn)行篩選,最終選取2885個(gè)訓(xùn)練樣本,單個(gè)樣本為10維數(shù),測(cè)試樣本為2020年5月樣本點(diǎn)數(shù)據(jù),共有樣本點(diǎn)30個(gè)。如圖2所示。
圖2 甲醇價(jià)格真實(shí)值與預(yù)測(cè)值間的絕對(duì)誤差
本文給出2020年5月份30個(gè)數(shù)據(jù)為甲醇價(jià)格實(shí)際值和預(yù)測(cè)值間絕對(duì)誤差。由圖2可知,絕對(duì)誤差在44元左右,相比于甲醇的平均價(jià)格2750元/噸,預(yù)測(cè)精度較好。
圖3 甲醇價(jià)格的實(shí)際值與預(yù)測(cè)值比較
圖3為2020年5月甲醇價(jià)格的實(shí)際值與預(yù)測(cè)值比較曲線(xiàn),由圖3可知,基于2011—2020年11月數(shù)據(jù),12月份預(yù)測(cè)值可跟蹤擬合甲醇實(shí)際值,且預(yù)測(cè)精度較高,能夠在一定程度上指導(dǎo)甲醇真實(shí)的價(jià)格。
(1)數(shù)據(jù)的預(yù)處理
針對(duì)長(zhǎng)期預(yù)測(cè),本文選取2011—2020年期間煤炭?jī)r(jià)格、甲醇價(jià)格、進(jìn)口均價(jià)、表觀(guān)消費(fèi)量、出口均價(jià)等數(shù)據(jù),構(gòu)建神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型非線(xiàn)性時(shí)間序列,輸出變量則為甲醇預(yù)測(cè)價(jià)格。這與短期預(yù)測(cè)模式相似,把不同的數(shù)據(jù)分別作為混沌時(shí)間序列,并進(jìn)行相空間重構(gòu),從而將不同影響因素的特征提取出來(lái),可將甲醇價(jià)格預(yù)測(cè)精度提高。計(jì)算機(jī)仿真選擇τ=1,嵌入維數(shù)m=2,確定τ=1,m=2,從而可得到新空間矢量式如式(8)所示。
(8)
其中,p(ti)表示要預(yù)測(cè)的產(chǎn)品價(jià)格,Q(tk)為表觀(guān)消費(fèi)量、P(tk)為甲醇價(jià)格、I(tk)為進(jìn)口均價(jià)、O(tk)為出口均價(jià)、C(tk)為煤炭?jī)r(jià)格(i-1≤k≤i-2),均為輸入變量,在極端學(xué)習(xí)機(jī)中變量取2維,確定10個(gè)神經(jīng)網(wǎng)絡(luò)輸入層神經(jīng)元。
(2)長(zhǎng)期結(jié)果預(yù)測(cè)分析
本文搜集并分析每個(gè)月甲醇價(jià)格的平均值以及不同影響因素的相關(guān)數(shù)據(jù),進(jìn)行甲醇價(jià)格長(zhǎng)期預(yù)測(cè),選取2011年1月至2020年12月份期間內(nèi)的數(shù)據(jù),展開(kāi)相空間重構(gòu),確定10維輸入數(shù)據(jù),每個(gè)影響因素2維,從而對(duì)甲醇的價(jià)格進(jìn)行預(yù)測(cè)。利用2020年5-12月份實(shí)際值與預(yù)測(cè)值進(jìn)行對(duì)比,說(shuō)明本文方法有效性,表3為基于長(zhǎng)期預(yù)測(cè)方法的甲醇實(shí)際值與預(yù)測(cè)值比較。
表3 基于長(zhǎng)期預(yù)測(cè)方法的甲醇實(shí)際值與預(yù)測(cè)值比較
由表3知,利用本文方法獲得的甲醇實(shí)際值與預(yù)測(cè)值間的相對(duì)誤差最小值為0.67%,最大為3.78%,預(yù)測(cè)精度較好。
圖4 基于長(zhǎng)期預(yù)測(cè)方法甲醇價(jià)格預(yù)測(cè)值及真實(shí)值比較曲線(xiàn)
圖4為基于長(zhǎng)期預(yù)測(cè)方法甲醇價(jià)格預(yù)測(cè)值及真實(shí)值比較曲線(xiàn),由圖4可知,預(yù)測(cè)值能跟蹤真實(shí)值變化,市場(chǎng)指導(dǎo)價(jià)值較好。
甲醇價(jià)格與我國(guó)國(guó)民經(jīng)濟(jì)發(fā)展直接相關(guān),但其影響因子較多,想要準(zhǔn)確預(yù)測(cè)難度較大,為將甲醇價(jià)格預(yù)測(cè)精度提高,本文基于甲醇價(jià)格影響因素的分析,采用極端學(xué)習(xí)機(jī)算法,提出甲醇價(jià)格的短期與長(zhǎng)期預(yù)測(cè)等問(wèn)題,構(gòu)建短期和長(zhǎng)期預(yù)測(cè)模型,得出如下結(jié)論。
(1) 甲醇價(jià)格與甲醇進(jìn)出口均價(jià)、出口量為線(xiàn)性相關(guān),與甲醇進(jìn)口量負(fù)相關(guān),而月產(chǎn)量及煤炭?jī)r(jià)格與甲醇的相關(guān)性比較低。
(2)短期預(yù)測(cè)表明,甲醇價(jià)格實(shí)際值和預(yù)測(cè)值間絕對(duì)誤差在44元左右,相比于甲醇的平均價(jià)格2750元/噸,預(yù)測(cè)精度較好。長(zhǎng)期預(yù)測(cè)表明,甲醇實(shí)際值與預(yù)測(cè)值間的相對(duì)誤差最小值為0.67%,最大為3.78%,預(yù)測(cè)精度較好。
(3)本文預(yù)測(cè)結(jié)果雖然精確度有一定提高,但還存在誤差,在今后的研究中,重點(diǎn)是進(jìn)一步提高甲醇產(chǎn)品價(jià)格預(yù)測(cè)精度、減少預(yù)測(cè)誤差。