張傳輝,田建艷,b,高 煒,王 芳,b
(太原理工大學 a.信息工程學院,b.電力系統(tǒng)運行與控制山西省重點實驗室,c.機械工程學院,太原 030024)
風的間歇性和隨機性導致了風電功率預測具有很大的不穩(wěn)定性,特別是近年來風電場數(shù)量和裝機容量不斷增大,一旦將風電并入電網(wǎng)運行,這種功率波動將會給電網(wǎng)的運行造成不可估量的沖擊[1]。因此,提高風電功率的預測精度,可以更好地保障電網(wǎng)的安全穩(wěn)定運行、合理安排調(diào)度計劃以及有效提高電網(wǎng)對風電的接納能力等[2]。胡亞偉等[3]提出了基于橫、縱向誤差平移修正的風電功率預測精度改善方法,能有效提高預測精度。張露等[4]提出了基于不同優(yōu)化準則的風電功率預測模型,與各單項預測模型及其他組合模型相比,優(yōu)化模型的整體誤差指標較小,有效地提高了預測精度。翟軍昌等[5]針對傳統(tǒng)的風電功率預測模型的不足,提出了一種參數(shù)自調(diào)整的風電功率預測方法,通過加權(quán)遞推最小二乘方法建立預測模型,該方法具有較高的預測精度。ZHANG[6]在有限數(shù)據(jù)的情況下,采用一致預測方法,根據(jù)在不同高度上的風電數(shù)據(jù)對預測精度影響的不同,通過組合幾種預測模型提高了預測精度。
人工神經(jīng)網(wǎng)絡(luò)具有并行處理、分布式存儲以及容錯性等特征,具有自學習、自組織和自適應能力[7],被廣泛應用于風電功率預測中,但是神經(jīng)網(wǎng)絡(luò)模型的建立對訓練樣本具有較高的依賴性,訓練樣本的選擇既要包含足夠廣的選擇范圍,使得模型具有更強的泛化能力[8],同時又要保證模型具有更快的預測速度和更高的預測精度。但是如果樣本范圍足夠廣,樣本數(shù)量足夠多,必然會影響模型預測的速度和精度。因此,保證范圍足夠廣的樣本數(shù)量的同時又能使得模型更具有針對性,將能在很大程度上提高模型的預測能力。為此,本文提出了基于模糊C均值聚類的神經(jīng)網(wǎng)絡(luò)建模方法。該方法首先對訓練樣本進行聚類,將相似的訓練樣本分為若干個聚類集,對每個聚類集分別建立相應的神經(jīng)網(wǎng)絡(luò)模型,計算預測樣本與各聚類集的匹配度,將其劃分到相似度最高的聚類集,采用相應的神經(jīng)網(wǎng)絡(luò)對風電功率進行預測,從而提高了神經(jīng)網(wǎng)絡(luò)模型的預測精度。
聚類就是把事物間的相似性作為類屬劃分的準則,按照一定的要求和規(guī)律對事物進行區(qū)分并歸類的過程[9]。在聚類算法中,模糊C均值(FCM)算法理論完善、應用廣泛。FCM算法屬于無監(jiān)督學習方法,通過采用隸屬度來表征每個樣本點隸屬于某個聚類的程度[10]。FCM算法原理如下:
將待聚類樣本集X={x1,x2,…,xN}劃分為c類,其中x1,x2,…,xN為聚類樣本,N為樣本數(shù),2≤c≤N,且聚類中心矩陣為V=(v1,v2,…,vc)T,目標函數(shù)及其約束條件分別如式(1)和式(2)所示:
(1)
(2)
式中:uki為隸屬度,表示第i(i=1,2,…,N)個樣本屬于第k(k=1,2,…,c)個類的程度;U為uki構(gòu)成的隸屬矩陣;vk為第k個聚類中心;dki為vk與xi之間的歐式距離,計算式為dki=‖vk-xi‖;m0為模糊參數(shù),通常m0=2.
采用拉格朗日乘子求最優(yōu)解,可以得到:
(3)
(4)
在聚類數(shù)(c)、模糊參數(shù)(m0)、最大迭代次數(shù)等聚類參數(shù)已知時,由式(3),(4)反復迭代即可實現(xiàn)訓練樣本的聚類過程。
FCM算法對初始聚類中心十分敏感,采用人為確定聚類數(shù)和隨機初始化的方法對最終模型的預測精度產(chǎn)生影響,而減法聚類是一種快速近似聚類方法,它將所有的樣本都作為聚類中心的可能解,然后根據(jù)樣本本身的規(guī)律自動確定出較合理的聚類中心和聚類數(shù)[11-12]。本文引入減法聚類,將其與FCM相結(jié)合,以獲取訓練樣本的最優(yōu)聚類結(jié)果。
采用減法聚類獲取聚類數(shù)c與初始聚類中心V*的具體方法為:
(5)
(6)
式中,rb為鄰域半徑,為了削弱各聚類中心之間的影響,通常取rb=1.5ra.
聚類有效性的評價標準公式如下:
(7)
式中:分子部分體現(xiàn)了各聚類內(nèi)部的緊湊性,分子越小,說明各類內(nèi)部越緊湊;分母部分體現(xiàn)了各聚類之間的獨立性,當每個類之間的距離越大時,即分母越大,說明各類之間獨立性越強。當Vxie(U,V,c)結(jié)果較小時,說明各聚類內(nèi)部比較緊湊、各聚類之間比較獨立,也就表明聚類分析結(jié)果較為合理[14]。
為了能夠全面對預測結(jié)果進行評價,本文選取可以體現(xiàn)預測值偏離實際值最大幅度的最大絕對誤差(Emax)、可以體現(xiàn)預測模型對系統(tǒng)誤差的宏觀評價的平均絕對誤差(EMA)、用來衡量誤差的分散程度的均方根誤差(ERMS)、可以體現(xiàn)預測模型總體性能的平均絕對百分比誤差(EMAP)以及反映預測誤差分布的誤差標準差(ESD)作為評價指標,各指標的計算公式如下:
Emax=max(|et|) .
(8)
(9)
(10)
(11)
(12)
訓練樣本經(jīng)過聚類之后會得到若干個聚類集,編號為D1,D2,…,Dc,c為聚類集的總個數(shù)。同時選取課題組建立小波神經(jīng)網(wǎng)絡(luò)模型M1、GABP神經(jīng)網(wǎng)絡(luò)模型M2、Elman神經(jīng)網(wǎng)絡(luò)模型M3、GRNN廣義回歸神經(jīng)網(wǎng)絡(luò)模型M4、T-S模糊神經(jīng)網(wǎng)絡(luò)模型M5作為預測模型。根據(jù)風電功率預測的時序性和對功率影響較大的因素的相關(guān)性分析,選取前一時刻風速X1、當前時刻風速X2、風向的正弦值X3、風向的余弦值X4以及溫度X5共5個因素作為模型的輸入,風電功率作為模型的輸出Y.
采用D1,D2,…,Dn分別訓練上述5種神經(jīng)網(wǎng)絡(luò)模型,得到模型M1,M2,…,M5.比較每一個聚類集對應的5種神經(jīng)網(wǎng)絡(luò)的誤差指標Emax、EMA、ERMS、EMAP、ESD,合理選取模型作為該聚類集的解。具體的選取原則分以下兩種情況。
2.2.1 單模型預測
綜合考慮5種模型的預測誤差評價指標,若第i個神經(jīng)網(wǎng)絡(luò)模型Mi的各項指標均最佳,即將Mi模型作為聚類集Di上對應的預測模型。
2.2.2 多指標融合評價
模型Mi和模型Mj的預測效果指標各有優(yōu)劣,直接觀察并不能分出哪個模型的預測效果最好。當單指標評價結(jié)果不一致時,采用多指標融合評價方法對模型進行融合評價[15],該方法中將離差最大化與主觀修正系數(shù)相結(jié)合,確定各模型的綜合權(quán)重,計算綜合評價值,得到模型的排序。將5種模型的融合評價值的平均值作為閾值,選取融合評價值大于閾值的模型作為該聚類集對應的預測模型。
當數(shù)據(jù)集對應一個模型時,則直接用該模型進行預測。當數(shù)據(jù)集對應多個模型時,采用融合預測方法,融合權(quán)重采用誘導有序加權(quán)平均(induced ordered weighted average,IOWA)算子[16]確定。與傳統(tǒng)的方法不同,它考慮到單模型在不同時刻點的預測精度可能不同,因此把單模型各個時刻點上的預測精度值作為誘導值,并以最小誤差平方和為準則建立目標函數(shù)來求解權(quán)重系數(shù),進行融合預測。具體步驟如下:
設(shè)經(jīng)過模型融合評價后共有m種單一模型,t時刻的實際風電功率序列為{yt}(t=1,2,…,n),用m種單一模型對風電功率進行預測,第i種預測模型在第t時刻的風電功率預測值為yit,(i=1,2,…,m).設(shè)m種單一模型在融合模型中的權(quán)重為ω=(ω1,ω2,…,ωm),且滿足:
(13)
令第i種模型在第t時刻的預測精度為ait,其表達式為:
(14)
顯然,ait∈[0,1].
若將預測精度ait作為預測值yit的誘導值,則m種單模型在第t時刻的預測精度和預測值構(gòu)成了m個二維數(shù)組:
(〈a1t,y1t〉,〈a2t,y2t〉,…,〈ait,yit〉,…,〈amt,ymt〉),
其中,ait為預測值yit排序的誘導值。將m種單一模型在第t時刻的預測精度a1t,a2t,…,ait,…,amt,按照從大到小的順序排列,由預測精度序列產(chǎn)生的基于IOWA算子融合預測值為:
(15)
式中,a-index(it)表示第t時刻第i種模型的預測精度下標。
令ea-index(it)=yt-ya-index(it),則n個時刻總的融合預測誤差平方和為:
(16)
則以預測誤差平方和為準則的基于IOWA算子的融合預測模型可以表示成如下最優(yōu)化模型:
(17)
其約束條件為:
(18)
通過求取式(17)的值就可以得到ωi的值。
本文首先根據(jù)預測樣本到聚類中心的距離來判斷該樣本點屬于哪個數(shù)據(jù)集,然后采用該數(shù)據(jù)集對應的預測模型對風電功率進行預測。由于高斯指標法[17]易于處理非線性數(shù)據(jù),本文采用此方法對預測樣本進行歸類,步驟如下:
假設(shè)樣本第s個風電功率影響因素的權(quán)重ωs∈[0,1],且∑ωs=1.預測樣本和數(shù)據(jù)集第s個因素的歐氏距離為:
(19)
式中:Xas為預測樣本第s個因素;Xbs為數(shù)據(jù)集聚類中心第s個因素,則其第s個值的高斯指標為:
(20)
σs=σ×(smax-smin) .
(21)
式中:a為預測樣本;b為數(shù)據(jù)集對應的聚類中心;σs為撓曲點;smax為第s個因素的最大值;smin為第s個因素的最小值;σ為常數(shù),取值范圍為[0,1].
計算出高斯指標后,利用式(22)即可求出預測樣本和樣本集的相似度:
(22)
式中:SIM(a,b)為相似度;ωs是權(quán)重值,通過計算相關(guān)性系數(shù)確定。SIM(a,b)越大,表明預測樣本與該樣本集越相似,則把該預測樣本歸為該數(shù)據(jù)集中。
筆者采用山西某風電場的實際數(shù)據(jù)進行了大量的仿真實驗。由于篇幅所限,僅給出以下數(shù)據(jù)進行說明:以2015年一整年的數(shù)據(jù)作為訓練樣本進行聚類,采用2016年1月1日—1月4日的數(shù)據(jù)作為預測樣本。
1) 本文取δ=0.5,采用減法聚類得到聚類數(shù)cmax=11和初始聚類中心V*:
2) 由上一步得到的聚類數(shù)和聚類中心對模糊聚類算法進行初始化。然后根據(jù)式(3)和式(4)可得到最終的隸屬矩陣U和聚類中心V,然后計算聚類有效性函數(shù)值Vxie(U,V,c),公式如下:
(12)
根據(jù)上面得到的聚類數(shù)和聚類中心對模糊聚類算法進行初始化。然后通過計算聚類有效性函數(shù)值Vxie(U,V,c)得出最合適的聚類數(shù)和聚類中心,求得不同的類對應的Vxie如表1所示。
表1 聚類數(shù)和對應的有效性函數(shù)值Table 1 The number of cluster and the values of validity function
由表1可知,當聚類數(shù)為8時,所得Vxie的值最小,因此將聚類數(shù)定為8個。
對預測樣本進行聚類,得到的數(shù)據(jù)集為8個,數(shù)據(jù)集編號分別為D1,D2,D3,D4,D5,D6,D7,D8.
采用D1—D8分別對5種神經(jīng)網(wǎng)絡(luò)模型進行訓練。比較每一個數(shù)據(jù)集對應的5種模型的誤差,根據(jù)2.2節(jié)的原則,合理選取模型作為該聚類集的解,得到每種數(shù)據(jù)集對應的預測模型如表2所示。
表2 每種數(shù)據(jù)集對應的預測模型Table 2 Each data set corresponding to the forecasting model
由表2可知,當聚類集對應唯一的預測模型時,就采用該模型進行預測;當聚類集對應多個模型時,則采用2.2節(jié)給出的融合方法求取融合模型的權(quán)重,最終的結(jié)果如表3所示。
表3 聚類建模結(jié)果Table 3 Results of clustering modeling
由表3可知,不同聚類集對應不同的模型進行風電功率的預測。將基于模糊聚類的神經(jīng)網(wǎng)絡(luò)建模用M6表示。
預測模型庫建立好以后,采用2.3節(jié)所述的方法對96組預測樣本進行歸類,歸類結(jié)果如表4所示。
表4 每種聚類集對應的預測樣本個數(shù)Table 4 Each data set corresponding to the number of samples
根據(jù)表4的聚類結(jié)果,歸于不同聚類集的預測樣本需要采用不同的神經(jīng)網(wǎng)絡(luò)模型進行預測。而傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)風電功率預測方法沒有對預測樣本進行聚類,所有預測樣本都采用同一種神經(jīng)網(wǎng)絡(luò)模型進行預測。下面對兩類方法的預測結(jié)果進行對比分析。
3.5.1 單模型預測效果分析
采用未經(jīng)聚類的訓練樣本分別訓練5種神經(jīng)網(wǎng)絡(luò)模型,利用每個模型分別對預測樣本進行預測,以M1和M3模型為例說明單一模型的預測效果,其風電功率預測結(jié)果分別如圖1和圖2所示。
圖1 M1模型的風電功率預測結(jié)果Fig.1 Wind power forecasting results of model M1
圖2 M3模型的風電功率預測結(jié)果Fig.2 Wind power forecasting results of model M3
以預測誤差絕對值為例,將預測誤差超過42 kW(平均絕對誤差值的120%)的時刻作為大誤差點時刻,由圖1和圖2可知,神經(jīng)網(wǎng)絡(luò)模型單獨預測時,在某些點的預測誤差較大,比較明顯的是M1模型中的第9點、12點、32點、75點等共25個大誤差點數(shù);M3模型中的26點、44點、53點、69點等共28個大誤差點數(shù)。
3.5.2 基于聚類的神經(jīng)網(wǎng)絡(luò)模型預測效果分析
由表4可知,預測樣本中有9組數(shù)據(jù)歸為D1,再由表3可知這9組數(shù)據(jù)應該采用M1模型進行預測;有15組數(shù)據(jù)歸為D2,應采用M4和M5模型進行融合預測;有7組數(shù)據(jù)歸為D3,應采用M3模型進行預測,其他的預測樣本也是根據(jù)其歸屬的聚類集不同,而選擇不同的模型進行預測。所有樣本最終的預測結(jié)果如圖3所示。
圖3 基于聚類的神經(jīng)網(wǎng)絡(luò)模型預測結(jié)果Fig.3 Wind power forecasting results of neural network model based on Clustering
由圖3可知,基于聚類的神經(jīng)網(wǎng)絡(luò)模型的預測效果相對較好,如單一神經(jīng)網(wǎng)絡(luò)模型中出現(xiàn)誤差較大的9點、26點、32點、44點、69點、75點等,在本方法中得到了較大的改善,大誤差點數(shù)只有12個,整體預測精度明顯提高。
3.5.3 各模型預測誤差對比分析
為進一步說明不同方法的預測效果,將不同神經(jīng)網(wǎng)絡(luò)模型的各個預測誤差指標列表如表5所示。
由表可知,5種單一神經(jīng)網(wǎng)絡(luò)模型中M4預測效果最好,EMA為21.07,EMAP為8.98%,而基于聚類的神經(jīng)網(wǎng)絡(luò)模型M6中EMA為16.74,EMAP為7.35%,相比較于M4,EMA減小18.1%,EMAP減小21%,其他指標均有不同幅度的減小。
表5 各個模型預測誤差指標Table 5 Forecasting error of each model
為了進一步驗證M6的預測效果,在2015年11月數(shù)據(jù)的基礎(chǔ)上,同時增加2015年3月、6月和9月的各100組數(shù)據(jù)作為檢驗數(shù)據(jù),每種模型的大誤差點個數(shù)統(tǒng)計如表6所示。
表6 各個預測模型大誤差點統(tǒng)計Table 6 The number of large error of each model
由表6可知,M6的風電功率預測誤差在大的預測誤差點上有了很大的改善,進而提高了模型的整體預測精度和穩(wěn)定性。
風的間歇性和隨機性給風電功率預測帶來了很大困難,針對神經(jīng)網(wǎng)絡(luò)模型的預測精度對訓練樣本依賴性較強的問題,本文提出采用基于聚類算法的神經(jīng)網(wǎng)絡(luò)對風電功率進行預測,研究結(jié)果表明:
1) 通過減法聚類來確定FCM的聚類中心,解決了FCM人為確定聚類數(shù)和初始聚類中心的問題,提高了FCM的聚類有效性。
2) 采用基于FCM的方法對數(shù)據(jù)進行聚類分析,然后進行神經(jīng)網(wǎng)絡(luò)模型的訓練,既充分考慮了樣本空間的特征,又使得模型具有針對性。采用山西某風電場的實際數(shù)據(jù)進行仿真研究,結(jié)果表明本文方法減少了預測模型的大誤差點數(shù),提高了模型的整體預測精度。該方法原理簡單、步驟清晰、易操作,為提高風電功率的預測精度提供了一種可行的方法。
[1] 韓肖清,張健,張友民,等.風電場諧波分析與計算[J].太原理工大學學報,2009,40(5):540-544.
HAN X Q,ZHANG J,ZHANG Y M,et al.Analysis of harmonics in pinglu wind power plants in Shanxi province[J].Journal of Taiyuan University of Technology,2009,40(5):540-544.
[2] JUNG J,BROADWATER R P.Current status and uture advances for wind speed and power forecasting[J].Renewable and Sustainable Energy Reviews,2014,31(2):762-777.
[3] 胡亞偉,王筱,晁勤,等.采用橫縱向誤差平移插值修正的風電預測精度改善方法[J].電網(wǎng)技術(shù),2015,39(10):2758-2765.
HU Y W,WANG Y,CAO Q,et al.Improvement of wind power forecasting accuracy using transverse error interpolation interpolation method[J].Power System Technology,2015,39(10):2758-2765.
[4] 張露,盧繼平,梅亦蕾,等.基于不同優(yōu)化準則的風電功率預測[J].電力自動化設(shè)備,2015,35(5):139-145.
ZHANG L,LU J P,MEI Y L,et al.Wind power prediction based on different optimization criteria[J].Electric Power Automation Equipment,2015,39(10):2758-2765.
[5] 翟軍昌,葛延峰,梁鵬,等.一種參數(shù)自調(diào)整風電功率預測模型[J].東北大學學報,2016,37(2):153-156.
ZHAI J C,GE Y F,LIANG P,et al.A parameter self-adjusting wind power forecasting model[J].Journal of Northeastern University,2016,37(2):153-156.
[6] ZHANG F.Effect analysis of NWP wind speed at different height on the improvement of wind power forecast accuracy[C]∥4th International Conference on Energy and Environmental Protection (ICEEP).2015:3383-3387.
[7] 何東,劉瑞葉.基于主成分分析的神經(jīng)網(wǎng)絡(luò)動態(tài)集成風功率超短期預測[J].電力系統(tǒng)保護與控制,2013,41(4):50-54.
HE D,LIU R Y.Ultra-short-term wind power prediction using ANN ensemble based on the principal components analysis[J].Power System Protection and Control,2013,41(4):50-54.
[8] 武妍,張立明.神經(jīng)網(wǎng)絡(luò)的泛化能力與結(jié)構(gòu)優(yōu)化算法研究[J].計算機應用研究,2002,19(6):21-25.
WU Y,ZHANG L M.Research on generalization ability and structure optimization algorithm of neural networks[J].Computer Application Research,2002,19(6):21-25.
[9] 紀浩林,彭亮.基于聚類的超閉球算法短期風速預測研究[J].測控技術(shù),2016,35(8):138-141.
JI H L,PENG L.Research on short-term wind speed prediction based on clustering algorithm[J].Journal of Measurement & Control Technology,2016,35(8):138-141.
[10] DUNN J C.A fuzzy relative of the ISODATA process and its use in detecting compact well-separated clusters[J].Journal of Cybernetics,1974,3(3):32-57.
[11] GABRIELLA C,NICOLETTA D,CORRADO M.Subtractive clustering for seeding non-negative matrix factorizations[J].Information Sciences,2014,257(2):369-387.
[12] 董瑞,黃民翔.基于減法聚類的FCM算法在電力負荷分類中的應用[J].華東電力,2014,42(5):917-921.
DONG R,HUANG M X.Application of FCM algorithm based on subtractive clustering in power load classification[J].East China Electric Power,2014,42(5):917-921.
[13] NIKHIL R P,CHAKRABORTY D.Mountain and subtractive clustering method:improvements and generalizations[J].International Journal of Intelligent Systems,2000,15(4):329-341.
[14] WANG W N,ZHANG Y J.On fuzzy cluster validity indices[J].Fuzzy Sets and Systems,2007,158(19):2095-2117.
[15] TIAN J,LIU T,AMIT B,et al.Wind power forecasting model fusion evaluation based on comprehensive weights[C]∥Proceedings of ASME's International Mechanical Engineering Congress and Exposition.2016:1-9.
[16] YAGER R R.Induced aggregation operators[J].Fuzzy Sets and Systems,2003,137(1):59-69.
[17] 鄭康寧,李向陽,楊凱.高斯-案例推理方法的預測模型及應用[J].運籌與管理,2011,20(6):99-105.
ZHENG K N,LI X Y,YANG K.Gaussian method in case-based reasoning and appIications[J].Operations Research and Management Science,2011,20(6):99-105.