徐建軍,王碩昌,袁 碩,張銘橋,馬 睿,潘立超
(東北石油大學(xué) 電氣信息工程學(xué)院,黑龍江 大慶 163318)
目前應(yīng)用的預(yù)測(cè)模型基本上都是通過(guò)對(duì)數(shù)據(jù)生成的曲線(xiàn)的特點(diǎn)和趨勢(shì)進(jìn)行分析,然后建立一定的邏輯關(guān)系,并通過(guò)邏輯關(guān)系預(yù)測(cè)后續(xù)的數(shù)據(jù)變化。常見(jiàn)的預(yù)測(cè)模型有灰色預(yù)測(cè)模型、ARIMA(Autoregressive Integrated Moving Average)模型、BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)模型、模糊預(yù)測(cè)模型、插值預(yù)測(cè)模型、回歸預(yù)測(cè)模型等,這些模型都是通過(guò)上述方法進(jìn)行數(shù)據(jù)預(yù)測(cè)的。但都沒(méi)考慮數(shù)據(jù)背后隱藏的局部和整體之間的重要聯(lián)系和運(yùn)動(dòng)規(guī)律。Mandelbrot通過(guò)對(duì)自然界中的局部與整體的聯(lián)系建立了一門(mén)新的學(xué)科----分形學(xué)[1]。該學(xué)科可以通過(guò)研究混亂現(xiàn)象和不規(guī)則構(gòu)型解決上述問(wèn)題。
1986年分形插值函數(shù)被提出[2],與提供適合經(jīng)驗(yàn)數(shù)據(jù)的初等函數(shù)一樣,分形插值函數(shù)可以用公式科學(xué)地表示。分形插值函數(shù)的優(yōu)點(diǎn)是其具有一組非正維數(shù)。陶興龍[3]利用分形維數(shù)可以表征曲面的粗糙程度的特點(diǎn),通過(guò)分形維數(shù)估算修正參數(shù)以降低低頻噪聲。李小燕[4]通過(guò)分形插值函數(shù)選取相似日對(duì)實(shí)測(cè)日進(jìn)行氣象預(yù)測(cè),再選取參考日的數(shù)據(jù)對(duì)實(shí)測(cè)日的預(yù)測(cè)數(shù)據(jù)進(jìn)行回歸,進(jìn)一步提高了預(yù)測(cè)精度。李萌[5]通過(guò)設(shè)置調(diào)整參數(shù)和不斷更新迭代初始點(diǎn)對(duì)分形插值函數(shù)進(jìn)行修正,使其能對(duì)中長(zhǎng)期電力負(fù)荷進(jìn)行預(yù)測(cè)。佟宇[6]利用經(jīng)驗(yàn)?zāi)B(tài)分解對(duì)原始的預(yù)測(cè)序列進(jìn)行分解,再利用分型理論中的拼貼定理和分形插值函數(shù)對(duì)每個(gè)分解序列進(jìn)行合理的預(yù)測(cè)。李如琦等[7]通過(guò)灰色關(guān)聯(lián)法選取相似日的數(shù)據(jù),并通過(guò)數(shù)據(jù)的特點(diǎn)對(duì)數(shù)據(jù)進(jìn)行分段,再利用分形插值函數(shù)對(duì)分段數(shù)據(jù)進(jìn)行預(yù)測(cè)和擬合。劉映等[8]通過(guò)改進(jìn)垂直因子的分形插值函數(shù)對(duì)樣本數(shù)據(jù)進(jìn)行小波分析,通過(guò)小波分析確定分形插值點(diǎn),從而有效提高了預(yù)測(cè)精度。筆者對(duì)基準(zhǔn)日負(fù)荷數(shù)據(jù)進(jìn)行重標(biāo)極差法分析、二次分形插值和數(shù)據(jù)擬合,其中利用插值區(qū)間和插值點(diǎn)確定分形插值法中的自由參量垂直尺度因子di,通過(guò)和傳統(tǒng)分形插值模型及BP神經(jīng)網(wǎng)絡(luò)模型對(duì)比,預(yù)測(cè)數(shù)據(jù)更加精準(zhǔn)。文中所有負(fù)荷數(shù)據(jù)來(lái)源于美國(guó)PJM電力市場(chǎng)官方網(wǎng)站,氣象數(shù)據(jù)參考美國(guó)國(guó)家氣象局官網(wǎng)。
分形插值函數(shù)需要通過(guò)給定的插值點(diǎn)數(shù)據(jù),根據(jù)數(shù)據(jù)本身的規(guī)律進(jìn)行插值[9],相比其他插值方法,如拉格朗提插值法、分段線(xiàn)性插值法、埃爾米特插值法和三次樣條插值法,分形插值法不是在區(qū)間內(nèi)構(gòu)造函數(shù),而是構(gòu)造一個(gè)迭代函數(shù)系統(tǒng)(IFS:Iterative Function System),這可避免因?yàn)檫^(guò)擬合而導(dǎo)致的龍格現(xiàn)象(Runge Phenomenon)。該迭代函數(shù)系統(tǒng)(IFS)滿(mǎn)足壓縮映射定理和拼貼定理[10]。
給定一個(gè)數(shù)據(jù)集{(xi,yi)∈R2,i=0,1,2,…,N},其吸引子A是內(nèi)插函數(shù)的連續(xù)函數(shù)F:[x0,xN]→R的圖像。下面構(gòu)造在R2上的一個(gè)IFS。
IFS{R2:ωi,i=1,2,…,N},ωi是
(1)
的仿射變換。且端點(diǎn)滿(mǎn)足以下條件
(2)
式(1)對(duì)應(yīng)的迭代函數(shù)系統(tǒng)IFS根據(jù)放射變換生成的分形插值函數(shù)(FIS)兩端的端點(diǎn)必須滿(mǎn)足式(2)的條件,所以每個(gè)變換都要滿(mǎn)足
(3)
(4)
IFS的吸引子A即分形插值函數(shù)(FIS)可以通過(guò)式(4)計(jì)算得到各種參數(shù)。
重標(biāo)極差法是對(duì)時(shí)間序列的預(yù)測(cè)性進(jìn)行分析,其一般步驟如下。
對(duì)時(shí)間序列{xt,t=0,1,2,…,N},設(shè)EN為時(shí)間序列的均值,X(t,N)為該序列的累積離差,R(N)為該序列的極差,S(N)為標(biāo)準(zhǔn)差。
(5)
(6)
(7)
則R(N)/S(N)為重標(biāo)極差,即為
(R/S)N=cNH
(8)
其中H為Hurst指數(shù),c為正常數(shù),與參數(shù)N無(wú)關(guān)。時(shí)間序列中的Hurst指數(shù)H和分形維數(shù)D滿(mǎn)足:H+D=2。
首先對(duì)基準(zhǔn)日的時(shí)間序列進(jìn)行分析,判斷該時(shí)間序列是否具有分形特征,所以要對(duì)基準(zhǔn)日的時(shí)間序列進(jìn)行R/S分析。選取美國(guó)AECO(Atlantic Electric Power Company)公司的2021年9月3日作為基準(zhǔn)日,對(duì)其進(jìn)行R/S分析,結(jié)果如圖1所示。通過(guò)圖1中的曲線(xiàn)可看出,該時(shí)間序列具有明顯的分形特征,且通過(guò)計(jì)算Hurst指數(shù)得到H=0.871 476,0.5 圖1 美國(guó)AECO公司2021年9月3日的電力負(fù)荷數(shù)據(jù)R/S分析Fig.1 Rescale range analysis of AECO’s electrical load data for September 2021-09-03 1) 首先選取基準(zhǔn)日[2],即對(duì)預(yù)測(cè)負(fù)荷所在的日期設(shè)為起點(diǎn)。選取氣象數(shù)據(jù)最為接近的一天作為基準(zhǔn)日。筆者將基準(zhǔn)日選為2021年9月3日,即實(shí)測(cè)日的前一天。 2) 根據(jù)文獻(xiàn)[2]選取的分形插值函數(shù)的插值點(diǎn)為1、4、7、11、15、18、20、22、24,選取9月3日的9個(gè)整數(shù)點(diǎn)作為基準(zhǔn)值。 3) 建立基準(zhǔn)日的電力負(fù)荷曲線(xiàn)的IFS。迭代函數(shù)通過(guò)步驟1)~2)建立。通過(guò)實(shí)驗(yàn)得出垂直尺度因子di。 4) 在實(shí)測(cè)日中進(jìn)行插值,插值點(diǎn)分別為1、4、7、11、15、18、20、22、24,建立IFS。通過(guò)式(1)~式(4)計(jì)算ai、ei、ci、fi。 5) 預(yù)測(cè)2021年9月5日的電氣負(fù)荷數(shù)據(jù),利用確定性迭代算法獲得IFS的吸引子,對(duì)9月5日的數(shù)據(jù)進(jìn)行預(yù)測(cè)。 如圖2所示,虛線(xiàn)為實(shí)際電力負(fù)荷曲線(xiàn),實(shí)線(xiàn)為傳統(tǒng)分形插值函數(shù)預(yù)測(cè)的電力負(fù)荷數(shù)據(jù)。從圖2中可看出,傳統(tǒng)模型預(yù)測(cè)曲線(xiàn)和實(shí)際負(fù)荷曲線(xiàn)相差較大,數(shù)據(jù)的相對(duì)誤差受到傳統(tǒng)分形模型數(shù)據(jù)量少,數(shù)據(jù)波動(dòng)大的影響,導(dǎo)致相對(duì)誤差受到插值點(diǎn)的影響,距離插值點(diǎn)越近則預(yù)測(cè)數(shù)據(jù)的相對(duì)誤差越小。 圖2 未改進(jìn)模型預(yù)測(cè)數(shù)據(jù)和實(shí)測(cè)數(shù)據(jù)Fig.2 Comparison of predicted and measured data 計(jì)算可得MSE為7 753和MAPE為0.314 8,由此可以得出無(wú)論是均方誤差還是平均絕對(duì)百分比誤差的數(shù)值都不是很理想,這表明傳統(tǒng)的分形預(yù)測(cè)模型的預(yù)測(cè)效果不佳[11]。 在分形插值函數(shù)中,垂直尺度因子di的數(shù)值直接影響分形插值曲面的粗糙程度。所以在分形插值預(yù)測(cè)中,預(yù)測(cè)的精度主要取決于垂直尺度分子di。傳統(tǒng)分形預(yù)測(cè)模型中的垂直尺度分子是通過(guò)大量實(shí)驗(yàn)或?qū)Υ怪背叨纫蜃拥募俣ǖ贸龅腫2],無(wú)法滿(mǎn)足預(yù)測(cè)模型對(duì)數(shù)據(jù)的精度需要,所以需要改進(jìn)垂直尺度因子的選取方法。筆者將時(shí)間序列劃分為6個(gè)子序列,經(jīng)過(guò)式(9)的計(jì)算可得di=0.71。 筆者借鑒了文獻(xiàn)[12]和文獻(xiàn)[1]的方法,利用自身數(shù)據(jù)的特點(diǎn)計(jì)算垂直尺度因子,具體步驟如下。 1) 將時(shí)間序列劃分長(zhǎng)度為n+1的第N個(gè)連續(xù)的子序列。 2) 將所有序列的第1個(gè)數(shù)據(jù)和最后的子序列的最后一個(gè)數(shù)據(jù),組成一個(gè)數(shù)據(jù)量為N+1的插值點(diǎn)集。 3) 過(guò)每個(gè)子序列的第1個(gè)點(diǎn)和最后一個(gè)點(diǎn)做一條直線(xiàn),令d為子序列中剩余的點(diǎn)到直線(xiàn)距離的最大值。 4) 對(duì)每個(gè)子序列都進(jìn)行上述操作,得到集合為{ui}。通過(guò) (9) 計(jì)算垂直尺度因子。 5) 求出每個(gè)子序列的dq,垂直壓縮因子就是所有dq的算術(shù)平均值。通過(guò)上述步驟求得筆者的垂直尺度因子di=0.71。 通過(guò)上述方法可以有效減少di的實(shí)驗(yàn)工作量,并且為確定分形插值函數(shù)的垂直壓縮因子提供了一種更為科學(xué)的方法。 在所有分形預(yù)測(cè)模型中,都是采用一次迭代方法進(jìn)行插值預(yù)測(cè)。由于迭代次數(shù)少,從而產(chǎn)生的數(shù)據(jù)量少,分形特征不明顯,不能體現(xiàn)分形預(yù)測(cè)模型的優(yōu)越性。圖3和圖4分別給出一次迭代產(chǎn)生的數(shù)據(jù)和二次迭代產(chǎn)生的數(shù)據(jù)的對(duì)比結(jié)果。 圖3 一次迭代的數(shù)據(jù) 圖4 二次迭代的數(shù)據(jù)Fig.3 Data for one iteration Fig.4 Data for the second iteration 通過(guò)圖3和圖4可看出,二次迭代生成的分形預(yù)測(cè)模型效果圖更具有分形的特征且數(shù)據(jù)量更大[13],更適合進(jìn)行預(yù)測(cè)。 通過(guò)二次迭代模型可得到迭代的周期為0.244 8,設(shè)置移動(dòng)平均函數(shù)的向量絕對(duì)值為半個(gè)周期。設(shè)通過(guò)移動(dòng)平均函數(shù)處理后的數(shù)據(jù)集為[ti-0.244 8,ti+0.244 8],其中ti為預(yù)測(cè)點(diǎn)對(duì)應(yīng)的時(shí)間數(shù)據(jù),通過(guò)上述方法得到的預(yù)測(cè)數(shù)據(jù)更能體現(xiàn)二次迭代分形插值的精準(zhǔn)性。 通過(guò)對(duì)二次迭代生成的數(shù)據(jù)進(jìn)行移動(dòng)平均函數(shù)處理,并利用二次迭代生成函數(shù)的周期性對(duì)數(shù)據(jù)處理。通過(guò)Matlab軟件中的隨機(jī)函數(shù)對(duì)每個(gè)周期內(nèi)的數(shù)據(jù)進(jìn)行抽取。然后通過(guò)最小二乘法(OLS:Ordinary Least Squares)對(duì)數(shù)據(jù)進(jìn)行擬合處理。 通過(guò)對(duì)處理后的數(shù)據(jù)進(jìn)行數(shù)據(jù)擬合可得出 f(x)=p1x6+p2x5+p3x4+p4x3+p5x2+p6x+p7 (10) 其中p1=-0.000 475 5,p2=0.038 13,p3=-1.243,p4=20.53,p5=-171.8,p6=658.4,p7=11.4。ESSE=3.386×10-5,R2=0.987 3,誤差均方和(ESSE)接近于0和擬合優(yōu)度(R2)接近于1表明擬合效果很好。圖5給出了擬合曲線(xiàn)。 因?yàn)閿M合函數(shù)的局限性,導(dǎo)致在區(qū)間[0,2]中的數(shù)據(jù)并不理想,所以實(shí)測(cè)日的前兩個(gè)數(shù)據(jù)均為基準(zhǔn)日數(shù)據(jù)(見(jiàn)圖6)。通過(guò)式(10)中的擬合函數(shù)計(jì)算出時(shí)間軸為整數(shù)點(diǎn)對(duì)應(yīng)的負(fù)荷。通過(guò)文獻(xiàn)[14-15]建立BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行對(duì)比,結(jié)果如表1所示。 表1 模型數(shù)據(jù)對(duì)比Tab.1 Comparison of model data 圖6是經(jīng)過(guò)數(shù)據(jù)處理后的最終數(shù)據(jù)和實(shí)測(cè)數(shù)據(jù)的對(duì)比圖。最終生成的數(shù)據(jù)得到的MSE為3 376.24,MPSE為0.048 16,傳統(tǒng)模型的MSE為7 753,MPSE為0.314 8,BP神經(jīng)網(wǎng)絡(luò)模型的MSE為4 536.12,MPSE為6.083 7。通過(guò)對(duì)比3種模型可知,改進(jìn)后的模型均方誤差降低了近50%,平均絕對(duì)百分比誤差降低近30%,對(duì)比BP神經(jīng)網(wǎng)絡(luò)模型的均方誤差下降了30%,平均絕對(duì)百分比降低了5%。對(duì)比圖2和圖5可得出,改進(jìn)的分形預(yù)測(cè)模型比傳統(tǒng)模型更好的預(yù)測(cè)了電力負(fù)荷短期的數(shù)據(jù),減少了運(yùn)算步驟,降低了預(yù)測(cè)誤差,提高了預(yù)測(cè)精度。 圖5 數(shù)據(jù)擬合曲線(xiàn) 圖6 數(shù)據(jù)對(duì)比Fig.5 Data fitting curve Fig.6 Final data and measured data 改進(jìn)的分形預(yù)測(cè)模型和傳統(tǒng)的預(yù)測(cè)模型對(duì)比具有以下優(yōu)點(diǎn): 1) 改進(jìn)后的分形預(yù)測(cè)模型中垂直尺度因子的計(jì)算方法,降低了分形預(yù)測(cè)模型的不確定性; 2) 改進(jìn)后的分形預(yù)測(cè)模型適應(yīng)性很強(qiáng),可以適用于多種應(yīng)用情形,如天氣預(yù)測(cè)、流量預(yù)測(cè)等; 3) 改進(jìn)后的分形預(yù)測(cè)模型使用二次迭代比一次迭代更具有分形的特征即標(biāo)度不變形和自相似性; 4) 仿真實(shí)驗(yàn)證明改進(jìn)后的分形預(yù)測(cè)模型比傳統(tǒng)的分形預(yù)測(cè)模型精確度更高,且均方誤差和平均絕對(duì)百分比誤差明顯降低。 綜上所述,改進(jìn)后的分形預(yù)測(cè)模型在短期電力負(fù)荷預(yù)測(cè)中更具有優(yōu)勢(shì)。3 傳統(tǒng)分形預(yù)測(cè)模型
3.1 建模步驟
3.2 建模結(jié)果
4 改進(jìn)的分形預(yù)測(cè)模型
4.1 分形預(yù)測(cè)模型中垂直尺度因子的改進(jìn)
4.2 分形預(yù)測(cè)模型迭代次數(shù)改進(jìn)
4.3 二次迭代產(chǎn)生數(shù)據(jù)的選取
5 結(jié) 論