• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于非結(jié)構(gòu)化數(shù)據(jù)的LLE-WOA-LSSVR碳價(jià)格組合預(yù)測(cè)模型

      2022-05-05 13:53:54周熠烜陳華友周禮剛朱家明
      關(guān)鍵詞:降維結(jié)構(gòu)化誤差

      周熠烜, 陳華友, 周禮剛, 朱家明

      (1.安徽大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,安徽 合肥 230601; 2.安徽大學(xué) 互聯(lián)網(wǎng)學(xué)院,安徽 合肥 230039)

      0 引 言

      在控制全球變暖的過程中,減少碳排放是至關(guān)重要的環(huán)節(jié)和有效途徑。為了控制二氧化碳的排放,全球碳交易市場(chǎng)應(yīng)運(yùn)而生。碳交易有利于合理地對(duì)碳配額進(jìn)行分配,進(jìn)而減緩全球變暖的進(jìn)程。因此,如何有效預(yù)測(cè)碳價(jià)格是學(xué)術(shù)界需要解決的重要而迫切的研究課題。

      傳統(tǒng)的組合預(yù)測(cè)模型使用的數(shù)據(jù)大多來(lái)源于政府或相關(guān)統(tǒng)計(jì)部門,這些數(shù)據(jù)為年度統(tǒng)計(jì)數(shù)據(jù),并有一定的滯后期,此類數(shù)據(jù)為類型單一的結(jié)構(gòu)化數(shù)據(jù)。然而在網(wǎng)絡(luò)環(huán)境下,搜索引擎的使用越來(lái)越頻繁,從而導(dǎo)致非結(jié)構(gòu)化數(shù)據(jù)廣泛存在,因此有必要探討非結(jié)構(gòu)化數(shù)據(jù)所提供的有效信息來(lái)提高預(yù)測(cè)的準(zhǔn)確度。

      實(shí)際上,百度指數(shù)就是一類重要的非結(jié)構(gòu)化數(shù)據(jù)。它以關(guān)鍵詞的搜索次數(shù)為基礎(chǔ),科學(xué)地分析計(jì)算各關(guān)鍵詞在百度搜索中的加權(quán)和,進(jìn)而揭示大眾關(guān)注對(duì)信息的影響機(jī)制[1]。文獻(xiàn)[2]利用格蘭杰因果關(guān)系檢驗(yàn)分析實(shí)際游客流量和網(wǎng)絡(luò)搜索量之間的聯(lián)系,構(gòu)建了基于百度指數(shù)的故宮游客流量預(yù)測(cè)模型;文獻(xiàn)[3]利用百度指數(shù)衡量用戶關(guān)注度,探究普通投資者的關(guān)注程度對(duì)股票流動(dòng)性及股票收益可能造成的影響。

      近年來(lái),人工智能算法得到了很大程度的發(fā)展,相比較傳統(tǒng)的組合預(yù)測(cè)方法具有更高的魯棒性和精確性。因此結(jié)合人工智能算法構(gòu)建組合預(yù)測(cè)模型能提高容錯(cuò)率,挖掘數(shù)據(jù)中的潛在信息,提高預(yù)測(cè)精準(zhǔn)度。文獻(xiàn)[4]應(yīng)用改進(jìn)的v-支持向量回歸(v-support vector regression,v-SVR)模型預(yù)測(cè)股票價(jià)格;文獻(xiàn)[5]采用粒子群優(yōu)化算法改進(jìn)支持向量機(jī)模型,并用改進(jìn)后的模型進(jìn)行房?jī)r(jià)預(yù)測(cè);文獻(xiàn)[6]運(yùn)用神經(jīng)網(wǎng)絡(luò)集成學(xué)習(xí)方法建立模型對(duì)股票市場(chǎng)進(jìn)行預(yù)測(cè);文獻(xiàn)[7]運(yùn)用非線性自回歸神經(jīng)網(wǎng)絡(luò)(nonlinear autoregressive neural network,NANN)對(duì)大氣密度進(jìn)行了預(yù)測(cè);文獻(xiàn)[8]應(yīng)用最小二乘支持向量機(jī)(leasts squares support vector machine,LSSVM)方法對(duì)太陽(yáng)黑子進(jìn)行預(yù)測(cè),并對(duì)模型中的參數(shù)進(jìn)行優(yōu)化,取得了很好效果。

      國(guó)內(nèi)外對(duì)碳市場(chǎng)價(jià)格的分析與研究一直是學(xué)術(shù)界關(guān)注的熱點(diǎn)問題之一[9],國(guó)內(nèi)外學(xué)者提出了多種方法實(shí)現(xiàn)對(duì)碳價(jià)格的預(yù)測(cè)。文獻(xiàn)[10]考慮灰色理論的特點(diǎn),利用帶有殘差修正的GM(1,1)結(jié)果優(yōu)化模型對(duì)碳交易試點(diǎn)的價(jià)格進(jìn)行預(yù)測(cè);文獻(xiàn)[11]結(jié)合灰色預(yù)測(cè)方法和馬爾科夫理論,使用改進(jìn)的Grey-Markov模型對(duì)碳價(jià)格的波動(dòng)進(jìn)行預(yù)測(cè);文獻(xiàn)[12]應(yīng)用差分整合移動(dòng)平均自回歸模型(autoregressive integrated moving average model,ARIMA)模型和LSSVM組合模型預(yù)測(cè)國(guó)際交易市場(chǎng)的碳交易價(jià)格;文獻(xiàn)[13]針對(duì)焦炭消費(fèi)的特點(diǎn),構(gòu)建了帶BP神經(jīng)網(wǎng)絡(luò)的半?yún)?shù)組合預(yù)測(cè)模型。實(shí)驗(yàn)表明上述模型具有較高的預(yù)測(cè)精度。

      然而,上述有關(guān)碳價(jià)格預(yù)測(cè)模型利用的數(shù)據(jù)均是結(jié)構(gòu)化數(shù)據(jù),并沒有考慮非結(jié)構(gòu)化數(shù)據(jù)對(duì)碳價(jià)格的影響。因此,目前的碳價(jià)格預(yù)測(cè)若采用傳統(tǒng)的組合預(yù)測(cè)模型,則存在一定的缺陷。具體表現(xiàn)為傳統(tǒng)的組合預(yù)測(cè)模型大多對(duì)單項(xiàng)預(yù)測(cè)結(jié)果進(jìn)行線性的加權(quán)平均獲得預(yù)測(cè)結(jié)果,因此預(yù)測(cè)精度過分依賴于單項(xiàng)預(yù)測(cè)模型的選擇。例如,假設(shè)某個(gè)指標(biāo)的實(shí)際值為100,而3種單項(xiàng)預(yù)測(cè)結(jié)果均大于110,因此線性加權(quán)算術(shù)平均導(dǎo)致組合預(yù)測(cè)的結(jié)果也至少是110以上,從而造成較大的誤差。實(shí)際上,碳價(jià)格預(yù)測(cè)考慮到非結(jié)構(gòu)化數(shù)據(jù)的影響,在混合數(shù)據(jù)結(jié)構(gòu)下碳價(jià)格和影響因素呈現(xiàn)非線性數(shù)據(jù)特征,這是傳統(tǒng)的組合預(yù)測(cè)方法所不能反映的。本文所構(gòu)建的基于局部線性嵌入和鯨魚優(yōu)化算法的最小二乘支持向量回歸(locally linear embedding-whale optimization algorithm-least squares support vector regression,LLE-WOA-LSSVR)預(yù)測(cè)模型改變了傳統(tǒng)的組合預(yù)測(cè)模型的思路,把組合預(yù)測(cè)看成是一個(gè)預(yù)測(cè)過程。先考慮對(duì)眾多的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行降維處理,提取出數(shù)據(jù)有效信息特征,降低一些次要的或偶然因素對(duì)系統(tǒng)行為擾動(dòng)的影響。在此基礎(chǔ)上,利用機(jī)器學(xué)習(xí)算法LSSVR進(jìn)行非線性建模,并對(duì)模型的參數(shù)利用鯨魚算法(whale optimization algorithm,WOA)進(jìn)行優(yōu)化,從而進(jìn)一步改進(jìn)傳統(tǒng)的組合預(yù)測(cè)方法。

      為此,本文在現(xiàn)有文獻(xiàn)基礎(chǔ)上,構(gòu)建新的基于非結(jié)構(gòu)化數(shù)據(jù)的LLE-WOA-LSSVR碳價(jià)格組合預(yù)測(cè)模型。該模型具有如下創(chuàng)新性:

      (1) 為了克服結(jié)構(gòu)化數(shù)據(jù)包含信息的不全面性,本文考慮非結(jié)構(gòu)化數(shù)據(jù)對(duì)碳價(jià)格的影響,調(diào)查碳價(jià)格相關(guān)關(guān)鍵詞的百度指數(shù),并運(yùn)用局部線性嵌入(locally linear embedding,LLE)算法對(duì)數(shù)據(jù)進(jìn)行降維。

      (2) 利用WOA算法優(yōu)化LSSVR模型中的參數(shù),并利用優(yōu)化后的模型對(duì)碳價(jià)格數(shù)據(jù)進(jìn)行訓(xùn)練、測(cè)試和預(yù)測(cè)。

      (3) 通過比較4種不同預(yù)測(cè)方法的碳價(jià)格預(yù)測(cè)結(jié)果。實(shí)例分析表明,本文提出的組合預(yù)測(cè)模型合理且有效。

      1 非結(jié)構(gòu)化數(shù)據(jù)與單項(xiàng)模型基本原理

      1.1 非結(jié)構(gòu)化數(shù)據(jù)

      非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,沒有預(yù)先定義的數(shù)據(jù)。相比較結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)隱藏著很多重要的信息,引入非結(jié)構(gòu)化數(shù)據(jù),可以完善數(shù)據(jù)提供的信息,使得信息更加全面,有利于獲得更加精準(zhǔn)的預(yù)測(cè)結(jié)果。

      本文利用百度指數(shù)作為非結(jié)構(gòu)化數(shù)據(jù)來(lái)源,通過相關(guān)關(guān)鍵詞在百度的每日搜索量,分析并預(yù)測(cè)未來(lái)碳價(jià)格的變化趨勢(shì)。假設(shè)樣本集X={X1,X2,…,Xn}為影響碳價(jià)格影響因素的指標(biāo)集合。

      1.2 LLE算法

      LLE算法是文獻(xiàn)[14]提出的一種流行的學(xué)習(xí)非線性降維方法。該方法假設(shè)高維空間內(nèi)的樣本點(diǎn)在局部?jī)?nèi)的關(guān)系是線性的,即一個(gè)樣本點(diǎn)可以由若干個(gè)相鄰的點(diǎn)來(lái)線性表示。通過LLE算法降維后,樣本點(diǎn)集合在低維空間中仍保持這樣的線性關(guān)系不變。

      LLE算法基本思想是將高維樣本數(shù)據(jù)集X={X1,X2,…,Xn}(Xi∈Rd)映射到低維樣本數(shù)據(jù)集Y={Y1,Y2,…,Yn}(Yi∈Rd′),其中維數(shù)d′

      (1) 對(duì)于高維空間的樣本集X={X1,X2,…,Xn}中的元素,計(jì)算每個(gè)樣本點(diǎn)Xi和剩余的n-1個(gè)樣本點(diǎn)之間的歐式距離dij=|Xi-Xj|。按距離從小到大進(jìn)行排序,選擇前K個(gè)距離Xi最近的樣本點(diǎn)作為xi的近鄰點(diǎn)集合Qi。

      (1)

      (2)

      1.3 LSSVR

      LSSVR是文獻(xiàn)[15]對(duì)支持向量回歸的改進(jìn),在標(biāo)準(zhǔn)算法的基礎(chǔ)上將最小二乘估計(jì)引入SVR算法中,通過把原算法中的不等式約束轉(zhuǎn)化為等式約束,對(duì)二次線性規(guī)劃問題的求解轉(zhuǎn)變?yōu)閷?duì)線性方程組的求解,可以極大地減少運(yùn)算量,提高運(yùn)算效率。在原始的低維空間中,線性回歸的問題可以由如下線性方程表示:

      f(x)=ωTx+b

      (3)

      其中:ω為權(quán)重向量;b為偏差。在選用合適的核函數(shù)映射到高維特征空間后,線性回歸的問題可以由下式表示:

      y=ωTφ(x)+b

      (4)

      其中,φ(x)為非線性變換。和SVM算法相類似,根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,LSSVR算法的優(yōu)化目標(biāo)函數(shù)可以表示為:

      (5)

      其中:ei為誤差;γ為懲罰系數(shù)。

      (5)式是一個(gè)等式約束非線性規(guī)劃問題,引入Lagrange函數(shù)將其轉(zhuǎn)化為無(wú)條件極值問題,有:

      (6)

      其中,αi為L(zhǎng)agrange乘子。

      對(duì)(6)式中的ω、b、ei、αi分別求偏導(dǎo),可得(6)式的駐點(diǎn),即令:

      i=1,2,…,N,

      從而如下方程組成立:

      (7)

      消去(7)式中的ω和ei,可以將(7)式化為如下的線性方程組:

      (8)

      其中:1=[1 1 … 1]T;Ω=(Ωij)n×n,Ωij=φ(xi)Tφ(xj)=K(xi,xj);α=[α1α2…αn]T;Y=[y1y2…yn]T。

      由(8)式可以得到模型參數(shù)b和α1,α2,…,αn的估計(jì),從而LSSVR算法的預(yù)測(cè)模型為:

      (9)

      1.4 WOA優(yōu)化算法

      鯨魚優(yōu)化算法(whale optimization algorithm,WOA)是由文獻(xiàn)[16]于2016年提出的模仿座頭鯨捕獵行為的一種新的仿生智能算法,具有操作簡(jiǎn)單,調(diào)整參數(shù)較少和跳出局部最優(yōu)解的能力強(qiáng)等特點(diǎn),可運(yùn)用于模型參數(shù)優(yōu)化等問題。

      在WOA算法中,假設(shè)在一個(gè)D維的空間中,有n個(gè)鯨魚組成了一個(gè)種群X={X1,X2,…,Xn},其中個(gè)體Xi=(xi1,xi2,…,xiD)是該鯨魚在空間中的位置,它表示解空間中的一個(gè)解;解空間中的最優(yōu)解可以抽象為獵物的位置。WOA算法分為3個(gè)部分,分別是環(huán)繞捕食、泡泡網(wǎng)攻擊以及搜索捕食。

      (1) 環(huán)繞捕食。座頭鯨在捕食時(shí),可以識(shí)別獵物的位置并對(duì)其進(jìn)行包圍,該行為可以由下式表示:

      Xi(t+1)=X*(t)-A·D

      (10)

      D=|C·X*(t)-Xi(t)|

      (11)

      其中:“·”為矩陣的Hadamard積;| |為向量的每一個(gè)分量取絕對(duì)值后構(gòu)成的新向量;X*(t)為迭代到第t次時(shí)當(dāng)前種群最優(yōu)解的位置;A=a(2r-1)、C=2r為系數(shù)向量,1=[1 1 … 1]T,r為[0,1]上的隨機(jī)向量,a為在迭代的過程中從2到0線性下降的控制參數(shù)。

      (2) 泡泡網(wǎng)攻擊。在WOA算法中,運(yùn)用收縮包圍機(jī)制和螺旋更新位置機(jī)制模擬泡泡網(wǎng)攻擊的行為。

      收縮包圍機(jī)制可以通過減少a的大小實(shí)現(xiàn),當(dāng)A的每個(gè)分量在[-1,1]時(shí),鯨魚會(huì)通過(10)式、(11)式在原始位置和當(dāng)前最優(yōu)位置之間選擇任意的位置。

      螺旋更新位置機(jī)制的實(shí)現(xiàn)是通過在鯨魚和獵物之間建立螺旋方程,即

      Xi(t+1)=D′eblcos(2πl(wèi))+X*(t)

      (12)

      D′=|X*(t)-Xi(t)|

      (13)

      其中:b為控制螺旋形狀的參數(shù),通常取b=1;l為[-1,1]上的隨機(jī)數(shù);| |含義同上。

      為了模擬泡泡網(wǎng)攻擊行為,WOA算法認(rèn)為這2種機(jī)制發(fā)生的概率相同,即各為50%。因此構(gòu)建如下的算法模型:

      (14)

      (3) 搜索捕食。在實(shí)際的捕食過程中,個(gè)體會(huì)根據(jù)其他個(gè)體的位置隨機(jī)搜索食物,在搜索捕食的機(jī)制下,個(gè)體通過隨機(jī)選擇其他個(gè)體的位置代替最優(yōu)個(gè)體的位置,以增強(qiáng)算法在全局范圍內(nèi)的搜索能力。該機(jī)制的算法可以表示為:

      Xi(t+1)=Xrand(t)-A·D

      (15)

      D=|C·Xrand(t)-Xi(t)|

      (16)

      搜索捕食機(jī)制是通過控制參數(shù)a的變化來(lái)控制的。當(dāng)|A|<1時(shí),選擇最優(yōu)個(gè)體位置更新,即(10)式、(11)式;當(dāng)|A|≥1時(shí),選擇隨機(jī)個(gè)體位置更新,即(15)式、(16)式。

      2 LLE-WOA-LSSVR組合預(yù)測(cè)模型構(gòu)建

      在用LSSVR模型對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)時(shí),預(yù)測(cè)精度很大程度上依賴于γ和σ的選取。其中:γ為懲罰系數(shù);σ為核函數(shù)半徑。γ越大,分類越嚴(yán)格,允許錯(cuò)分的樣本受到的限制越大,錯(cuò)分的樣本數(shù)少,容易出現(xiàn)過擬合,泛化能力差;γ越小,允許錯(cuò)分的樣本受到的限制越少,容易出現(xiàn)欠擬合。σ越小,模型只作用于支持向量樣本附近,訓(xùn)練效果好,但預(yù)測(cè)效果差;σ越大,越容易出現(xiàn)平滑效應(yīng),造成訓(xùn)練效果差。因此選取合適的γ和σ顯得尤為重要。

      本文結(jié)合WOA算法對(duì)LSSVR中的參數(shù)γ和σ進(jìn)行優(yōu)化,利用最優(yōu)的參數(shù)對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)。同時(shí)為了防止過擬合導(dǎo)致訓(xùn)練效果好但預(yù)測(cè)效果差,本文運(yùn)用留出法(hold-out)將數(shù)據(jù)X分為訓(xùn)練集S、驗(yàn)證集T和測(cè)試集P。在訓(xùn)練集S上訓(xùn)練模型,用驗(yàn)證集T評(píng)估模型的測(cè)試誤差,作為對(duì)泛化誤差的估計(jì)。為此,本文構(gòu)建新的基于非結(jié)構(gòu)化數(shù)據(jù)的LLE-WOA-LSSVR組合預(yù)測(cè)模型的流程如圖1所示。

      圖1 基于非結(jié)構(gòu)化數(shù)據(jù)的LLE-WOA-LSSVR組合預(yù)測(cè)模型

      基于非結(jié)構(gòu)化數(shù)據(jù)的LLE-WOA-LSSVR預(yù)測(cè)模型的步驟如下:

      (1) 收集相關(guān)的非結(jié)構(gòu)化數(shù)據(jù)X={X1,X2,…,Xn}。

      (2) 運(yùn)用LLE降維方法對(duì)原始樣本集X進(jìn)行降維處理,得到低維樣本集Y,并將樣本集Y劃分為訓(xùn)練集S、驗(yàn)證集T和測(cè)試集P。

      (3) 利用WOA算法優(yōu)化LSSVR模型參數(shù)γ和σ。

      1、在高位推動(dòng)上聯(lián)合。切實(shí)把宣傳定位于衛(wèi)生計(jì)生工作的重要位置,納入衛(wèi)生計(jì)生目標(biāo)管理責(zé)任,在日常工作中更加突出宣傳先行先導(dǎo)的作用。

      (4) 結(jié)合優(yōu)化后的γ和σ,利用LSSVR模型對(duì)訓(xùn)練集S進(jìn)行訓(xùn)練,適應(yīng)度函數(shù)為驗(yàn)證集T的誤差平方和。

      (5) 利用訓(xùn)練后的模型對(duì)測(cè)試集P中的數(shù)據(jù)進(jìn)行預(yù)測(cè),并進(jìn)行誤差分析,比較多種預(yù)測(cè)方法之間的優(yōu)劣。

      3 案例分析

      為了評(píng)價(jià)基于非結(jié)構(gòu)化數(shù)據(jù)的LLE-WOA-LSSVR預(yù)測(cè)模型的有效性,本文利用2015年1月1日至2018年6月30日的百度指數(shù)數(shù)據(jù)對(duì)碳價(jià)格進(jìn)行預(yù)測(cè)。通過在百度指數(shù)中輸入相應(yīng)的關(guān)鍵詞,可以得到每日用戶對(duì)關(guān)鍵詞的搜索量。本文選取碳匯、碳足跡、碳交易、碳關(guān)稅、碳排放、低碳經(jīng)濟(jì)、減排、碳中和、低碳生活和低碳這10個(gè)關(guān)鍵詞作為影響碳價(jià)格的因素。所有實(shí)驗(yàn)是在Windows 10,MATLAB R2017a環(huán)境下進(jìn)行的。

      運(yùn)用LLE算法對(duì)10組數(shù)據(jù)進(jìn)行降維處理,本文將數(shù)據(jù)降成二維數(shù)據(jù)h1、h2,選取參數(shù)為k=3,每個(gè)樣本點(diǎn)距離最近的3個(gè)點(diǎn)作為近鄰點(diǎn)。運(yùn)用得到的h1、h2和前一期的碳價(jià)格作為訓(xùn)練集,運(yùn)用LSSVR算法預(yù)測(cè)碳價(jià)格。

      為了防止過擬合,本文采用留出法,選取2015年1月1日至2017年12月29日的數(shù)據(jù)作為訓(xùn)練集,2018年1月2日至2018年2月28日的數(shù)據(jù)作為驗(yàn)證集,2018年3月1日至2018年6月30日作為測(cè)試集。利用WOA算法優(yōu)化參數(shù)γ和σ,以驗(yàn)證集的誤差平方和為適應(yīng)度函數(shù);另外,WOA算法的相關(guān)參數(shù)中,令種群數(shù)量為30,最大迭代次數(shù)為500,γ的取值區(qū)間為[0.01, 6 000],σ取值區(qū)間為[0.01, 100],得到γ=6 000,σ=49.343 1為最優(yōu)參數(shù)。運(yùn)用最優(yōu)組參數(shù),使用LSSVR工具箱程序預(yù)測(cè)數(shù)據(jù),得到預(yù)測(cè)結(jié)果。

      為了說明本文方法的有效性,選取如下預(yù)測(cè)模型進(jìn)行對(duì)比分析:

      (1) 采用非結(jié)構(gòu)化數(shù)據(jù)加入WOA算法尋優(yōu)的LLE-WOA-LSSVR組合預(yù)測(cè)模型,記為模型一,即本文算法。

      (2) 采用結(jié)構(gòu)化數(shù)據(jù)且加入WOA算法尋優(yōu)的模型,記為模型二。

      (3) 采用非結(jié)構(gòu)化數(shù)據(jù)未加入WOA算法尋優(yōu)的模型,記為模型三。

      (4) 采用結(jié)構(gòu)化數(shù)據(jù)且未加入WOA算法尋優(yōu)的模型,記為模型四。

      (5) 無(wú)LLE降維算法,采用非結(jié)構(gòu)化數(shù)據(jù)加入WOA算法尋優(yōu)的模型,記為模型五。

      本文采用的結(jié)構(gòu)化數(shù)據(jù)是碳價(jià)格的時(shí)滯為3期的數(shù)據(jù),即利用前3期數(shù)據(jù)作為預(yù)測(cè)下一期的標(biāo)準(zhǔn)。先將前4種預(yù)測(cè)方法的結(jié)果進(jìn)行比較,如圖2、圖3所示。

      圖2 4種預(yù)測(cè)方法訓(xùn)練和測(cè)試結(jié)果

      從圖2可以看出,4種預(yù)測(cè)方法的訓(xùn)練和測(cè)試結(jié)果,與實(shí)際值相比,趨勢(shì)基本一致,擬合程度較好,沒有太大的誤差。為了對(duì)比4種預(yù)測(cè)方法的泛化能力,對(duì)預(yù)測(cè)集結(jié)果進(jìn)行單獨(dú)比較,結(jié)果如圖3所示。

      圖3 4種預(yù)測(cè)方法預(yù)測(cè)集結(jié)果

      從圖3可以看出,4種方法和實(shí)際值相比,整體變化趨勢(shì)一致,誤差在可接受范圍內(nèi),本文所用的方法與實(shí)際值更接近。此外,為了分析降維方法對(duì)預(yù)測(cè)模型是否有效,比較模型一和模型五,分析降維方法引入的合理性,結(jié)果如圖4所示。

      圖4 有LLE降維和無(wú)降維模型預(yù)測(cè)結(jié)果和誤差圖

      從圖4可以看出,引入LLE降維方法后,結(jié)果與無(wú)降維方法,直接使用WOA+LSSVR預(yù)測(cè)模型的結(jié)果總體差距不大,從誤差大小來(lái)看,本文提出模型總體誤差較小。為了比較不同模型更加精確的預(yù)測(cè)能力,現(xiàn)引入5種誤差度量標(biāo)準(zhǔn)進(jìn)行誤差分析。

      4 5種預(yù)測(cè)模型的誤差分析

      為了比較不同預(yù)測(cè)模型之間的優(yōu)劣性,體現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)和WOA算法優(yōu)化參數(shù)對(duì)模型求解的優(yōu)勢(shì),多種誤差標(biāo)準(zhǔn)被用來(lái)評(píng)價(jià)模型的有效性。本文采用的誤差度量標(biāo)準(zhǔn)是SSE、MSE、MAE、MAPE和MSPE,見表1所列。

      表1 5種誤差度量標(biāo)準(zhǔn)

      將本文模型(模型一)得到的預(yù)測(cè)結(jié)果與其他4種方法得到的預(yù)測(cè)結(jié)果進(jìn)行比較,得到測(cè)試集的誤差結(jié)果見表2所列。

      表2 4種預(yù)測(cè)方法參數(shù)和測(cè)試集誤差結(jié)果比較

      從表2可以看出,本文所提出的組合預(yù)測(cè)模型一在5種誤差標(biāo)準(zhǔn)下的值均為最小,這表明本文所用的方法是4種預(yù)測(cè)方法中最優(yōu)的。

      另外,對(duì)比模型一和模型三,可以發(fā)現(xiàn)運(yùn)用了WOA算法尋優(yōu)后,效果比直接運(yùn)用LSSVR模型預(yù)測(cè)的精度要高,說明將智能算法和仿生尋優(yōu)算法結(jié)合的可行性與有效性。對(duì)比模型二和模型四也有類似的結(jié)論。對(duì)比模型一和模型二,可以發(fā)現(xiàn)在考慮非結(jié)構(gòu)化數(shù)據(jù)后,效果相較于只考慮結(jié)構(gòu)化數(shù)據(jù)得到的結(jié)果要優(yōu),這表明非結(jié)構(gòu)化數(shù)據(jù)在數(shù)據(jù)預(yù)測(cè)方面提供更多的信息。對(duì)比模型三和模型四,也有類似的結(jié)論。

      同時(shí),將無(wú)LLE降維的模型和其他4個(gè)模型對(duì)比可以發(fā)現(xiàn),本文提出的模型一在各項(xiàng)誤差上都有顯著提高,并且模型二至模型四的誤差也略優(yōu)于無(wú)LLE降維的模型,這說明運(yùn)用了LLE降維算法后,預(yù)測(cè)的精度有明顯提高,表明降維并沒有導(dǎo)致主要信息的缺失,同時(shí)降維后數(shù)據(jù)量的減少會(huì)提高模型計(jì)算的效率,說明降維算法在實(shí)際問題中的合理性。

      綜上所述,本文提出的基于非結(jié)構(gòu)化數(shù)據(jù)的LLE-WOA-LSSVR碳價(jià)格組合預(yù)測(cè)模型具有較好的可行性和適用性。

      5 結(jié) 論

      為了解決碳價(jià)格的預(yù)測(cè)問題,本文首先引入非結(jié)構(gòu)化數(shù)據(jù),完善數(shù)據(jù)的信息完整性;其次利用LLE降維算法,將搜集到的10個(gè)影響碳價(jià)格的非結(jié)構(gòu)化數(shù)據(jù)降成二維數(shù)據(jù),并與滯后一期的碳價(jià)格構(gòu)成影響碳價(jià)格的因素,運(yùn)用LSSVR模型對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行訓(xùn)練,并將測(cè)試集數(shù)據(jù)的誤差作為適應(yīng)度函數(shù),結(jié)合WOA優(yōu)化算法對(duì)參數(shù)優(yōu)化,得到預(yù)測(cè)結(jié)果;最后比較4種不同預(yù)測(cè)方法的預(yù)測(cè)結(jié)果并分析誤差,發(fā)現(xiàn)本文提出的基于非結(jié)構(gòu)化數(shù)據(jù)的LLE-WOA-LSSVR碳價(jià)格組合預(yù)測(cè)模型的精度最高,說明本文模型具有較高的可行性和有效性。在未來(lái)的研究中,可以對(duì)WOA方法中的參數(shù),以及種群初始化進(jìn)行優(yōu)化調(diào)整,使算法收斂速度更快,提高運(yùn)算精度和運(yùn)算時(shí)間。

      猜你喜歡
      降維結(jié)構(gòu)化誤差
      Three-Body’s epic scale and fiercely guarded fanbase present challenges to adaptations
      促進(jìn)知識(shí)結(jié)構(gòu)化的主題式復(fù)習(xí)初探
      角接觸球軸承接觸角誤差控制
      哈爾濱軸承(2020年2期)2020-11-06 09:22:26
      結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
      Beidou, le système de navigation par satellite compatible et interopérable
      降維打擊
      海峽姐妹(2019年12期)2020-01-14 03:24:40
      壓力容器制造誤差探究
      九十億分之一的“生死”誤差
      山東青年(2016年2期)2016-02-28 14:25:41
      基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
      拋物化Navier-Stokes方程的降維仿真模型
      磐石市| 化州市| 惠州市| 长宁区| 安远县| 惠东县| 宜昌市| 时尚| 夏河县| 台南市| 阿克陶县| 文水县| 隆昌县| 西平县| 织金县| 昂仁县| 南江县| 黄梅县| 泸水县| 雷州市| 沅陵县| 广元市| 来凤县| 阿坝县| 汉中市| 南江县| 新绛县| 腾冲县| 伊川县| 莆田市| 庆阳市| 乌鲁木齐县| 武威市| 宣恩县| 理塘县| 额济纳旗| 台江县| 铅山县| 承德县| 长沙县| 梨树县|