黃 健,季克勤,陳梓翰,鄭 慶
(國網(wǎng)浙江電力有限公司 金華供電公司,浙江 金華 321000)
在當(dāng)前高風(fēng)電滲透率電網(wǎng)大背景下,精確的風(fēng)電功率預(yù)測結(jié)果有助于改善電網(wǎng)內(nèi)“源網(wǎng)荷”間的互動效率,對未來電網(wǎng)的建設(shè)發(fā)展以及提高電網(wǎng)內(nèi)綜合能源利用率具有重要意義[1]。
現(xiàn)有風(fēng)電功率預(yù)測技術(shù)分為物理預(yù)測法、統(tǒng)計預(yù)測法、學(xué)習(xí)預(yù)測法以及組合預(yù)測法等。物理預(yù)測法通過采集風(fēng)電場所在位置的物理信息和氣象數(shù)據(jù),建立風(fēng)電轉(zhuǎn)換模型進行預(yù)測,因無需歷史運行數(shù)據(jù)常被用于新建風(fēng)電場的功率預(yù)測。例如文獻[2]在新建風(fēng)電場內(nèi)建立了計及風(fēng)電場局地效應(yīng)與風(fēng)電機組尾流影響的風(fēng)電功率物理預(yù)測模型。統(tǒng)計預(yù)測法通過大量歷史風(fēng)電功率數(shù)據(jù)在得出風(fēng)電場運行規(guī)律的基礎(chǔ)上,建立風(fēng)電功率預(yù)測模型。例如文獻[3]基于大量數(shù)據(jù)的統(tǒng)計分析研究,建立了基于自回歸滑動平均模型風(fēng)電功率預(yù)測系統(tǒng);文獻[4]利用風(fēng)電場歷史運行數(shù)據(jù),建立了基于馬爾科夫鏈的風(fēng)電功率預(yù)測模型。學(xué)習(xí)預(yù)測法是基于人工智能技術(shù)興起的一種預(yù)測技術(shù),通過準(zhǔn)確地刻畫風(fēng)速等數(shù)據(jù)與風(fēng)電功率間的非線性關(guān)系得到最終的預(yù)測結(jié)果。例如文獻[5],采用深度學(xué)習(xí)算法深入挖掘了風(fēng)電場歷史運行數(shù)據(jù)間的非線性關(guān)系,建立了基于深度學(xué)習(xí)算法的風(fēng)電功率預(yù)測模型。組合預(yù)測法則是利用以上不同算法的優(yōu)勢建立起的一種風(fēng)電功率組合預(yù)測模型。例如文獻[6-7],通過將不同單一預(yù)測法進行優(yōu)化組合,使預(yù)測模型能夠發(fā)揮不同預(yù)測方法在預(yù)測過程中的優(yōu)勢,從而提高風(fēng)電功率預(yù)測精度。
風(fēng)電場輸出功率受風(fēng)電場所在位置的氣候環(huán)境特征影響較大。不同的氣候環(huán)境特征,對風(fēng)電場的出力情況具有不同程度的影響。傳統(tǒng)風(fēng)電功率預(yù)測模型在進行風(fēng)電功率預(yù)測時,并未考慮氣候環(huán)境的變化過程對風(fēng)電場出力的影響,預(yù)測精度仍存在提升空間。基于此,本文建立了一種基于天氣影響的風(fēng)電功率分類預(yù)測模型。根據(jù)各層高風(fēng)速與風(fēng)電場輸出功率間的相關(guān)性檢驗結(jié)果以及風(fēng)電場輸出功率理論表達式確定了預(yù)測模型輸入量,并由風(fēng)電功率和各影響因素序列的自相關(guān)檢驗結(jié)果確定了影響風(fēng)電場輸出功率的時間尺度,以上2點為預(yù)測模型輸入數(shù)據(jù)內(nèi)容的確定提供了理論依據(jù)。確定預(yù)測模型輸入數(shù)據(jù)內(nèi)容后,在分類預(yù)測建模時,為簡化天氣過程聚類時的計算、實現(xiàn)分類結(jié)果的可視化,采用了深度學(xué)習(xí)自編碼技術(shù)對輸入數(shù)據(jù)進行降維處理,并利用改進的K-means聚類法進行了天氣過程的聚類劃分,根據(jù)聚類結(jié)果利用廣義回歸神經(jīng)網(wǎng)絡(luò)(Generalized Regression Neural Network,GRNN)算法對風(fēng)電場輸出功率進行分類預(yù)測。最后通過實際算例驗證了本文方法能夠獲得更加有效的風(fēng)電功率預(yù)測結(jié)果。
分析風(fēng)電機組的運行機理,有助于更好地挖掘影響風(fēng)電場輸出功率的各類影響因素。風(fēng)能是由大氣環(huán)境中的空氣流動所產(chǎn)生的,風(fēng)力發(fā)電則是利用風(fēng)電機組的葉片對流動的風(fēng)能進行捕捉,進而實現(xiàn)能量的轉(zhuǎn)化,生產(chǎn)出日常生產(chǎn)生活所需的電能[8]。實際運行過程中,某一時刻的風(fēng)能通常滿足式(1)所示函數(shù)表達形式。
E=0.5ρAv3
(1)
式中,E為對應(yīng)時刻的風(fēng)能;ρ為空氣密度;A為風(fēng)機葉片的捕捉面積;v為風(fēng)速。
根據(jù)貝茲理論[9]的研究可知,在式(1)所示的風(fēng)能條件下,風(fēng)機能夠獲得式(2)所示的最大輸出功率。
Pmax=0.296ρAv3
(2)
將式(1)和式(2)相結(jié)合,可以求得式(3)所示的風(fēng)機極限轉(zhuǎn)化效率Cp。
(3)
以上均為理想條件下的風(fēng)電機組電能生產(chǎn)過程,實際中受設(shè)備狀態(tài)等多重因素的影響,風(fēng)機轉(zhuǎn)化效率必然小于0.593。為將理論模型與實際過程相結(jié)合,提出了式(4)所示的風(fēng)機實際輸出功率函數(shù)表達式。
P=0.5CpρAv3
(4)
從以上風(fēng)機的運行機理的分析過程中可以看出,風(fēng)電場的輸出功率會受到風(fēng)電機組的運行效率、風(fēng)速、風(fēng)向、空氣密度以及風(fēng)機設(shè)備型號等多重因素的影響。
同時,空氣密度以及風(fēng)電機組的運行效率等因素還會受到氣壓、相對濕度以及環(huán)境溫度等多重因素的影響,風(fēng)電機組的各個影響因素間仍會存在有一定內(nèi)部關(guān)聯(lián)關(guān)系。所以,在進行風(fēng)電功率預(yù)測時,可以選取風(fēng)電場所在位置的風(fēng)速、風(fēng)向、溫度、氣壓、相對濕度天氣預(yù)報數(shù)據(jù),作為預(yù)測模型的輸入數(shù)據(jù)。
受場站內(nèi)設(shè)備型號的影響,不同層高的風(fēng)速與風(fēng)電場輸出功率間存在一定的差異性,風(fēng)速的選取過程中按照式(5)計算風(fēng)電場內(nèi)各層高風(fēng)速與風(fēng)電場輸出功率的皮爾遜相關(guān)系數(shù)進行選取,風(fēng)向可以選取與風(fēng)速相同層高的數(shù)據(jù)。
(5)
場站內(nèi)各層高風(fēng)速與風(fēng)電場輸出功率的皮爾遜相關(guān)系數(shù)計算結(jié)果見表1。
根據(jù)表1,最終選取70 m層高風(fēng)速作為最終的風(fēng)速研究對象。將對應(yīng)的70 m層高風(fēng)向數(shù)據(jù)作為風(fēng)向研究對象,同時為避免風(fēng)向數(shù)據(jù)過0時的躍變對模型預(yù)測精度的影響,將風(fēng)向數(shù)據(jù)轉(zhuǎn)化為了連續(xù)變化的正余弦值。除以上兩參量的選取外,由于其余各參量與風(fēng)電場輸出功率間的相關(guān)系數(shù)較低,且這些參量的選取是通過風(fēng)機運行機理的分析過程所確定的所以不在進行相關(guān)系數(shù)的計算。
表1 風(fēng)速與風(fēng)電場輸出功率皮爾遜相關(guān)系數(shù)計算結(jié)果
無論是風(fēng)力發(fā)電系統(tǒng)還是天氣的變化過程,兩種均具有一定的慣性特征,也即當(dāng)前的狀態(tài)量會受前一時刻甚至一定時段內(nèi)的狀態(tài)量變化影響較大?;谝陨显颍谶M行風(fēng)電功率預(yù)測時不能僅進行影響因素的選取,還需要分析各影響因素對風(fēng)電場輸出功率作用的時間尺度。在進行時間尺度的選取時,本文首先利用式(6)所示的函數(shù)表達式計算延遲步長條件下的自相關(guān)系數(shù)。
(6)
根據(jù)式(6),計算得到圖1所示的各影響因素及風(fēng)電功率序列的自相關(guān)系數(shù)計算結(jié)果。
圖1 自相關(guān)系數(shù)檢驗結(jié)果
此次樣本集中數(shù)據(jù)的采樣間隔為每15 min/次,1 d中對各影響因素的采樣量為96次。根據(jù)樣本數(shù)據(jù)的采樣特征繪制了圖1所示的延遲步長在0~96內(nèi)各影響因素以及風(fēng)電功率序列的自相關(guān)檢驗結(jié)果,以此得到1 d內(nèi)各影響因素內(nèi)部所具有的關(guān)聯(lián)特征。從圖1的變化過程可以看出,溫度和氣壓的自相關(guān)檢驗結(jié)果始終在大于0.9的高度自相關(guān)條件下,原因在于這2個參量受季節(jié)變化的影響較大,在1 d內(nèi)差異性較小,可以忽略這2個因素對風(fēng)電功率時間尺度的影響;濕度的自相關(guān)檢驗結(jié)果在1 d內(nèi)呈先下降后上升的變化趨勢,由此可知濕度的變化特征在1 d內(nèi)具有一定的規(guī)律性;除以上影響因素,其余的70 m層高風(fēng)速、風(fēng)向正余弦值以及風(fēng)電功率序列的自相關(guān)檢驗結(jié)果則呈現(xiàn)出迅速下降的變化趨勢。
為了提高風(fēng)電功率預(yù)測模型的預(yù)測精度,簡化預(yù)測模型建模時輸入數(shù)據(jù)的復(fù)雜性,本文以自相關(guān)系數(shù)0.8作為截斷選取了待預(yù)測點前16個觀測點的數(shù)據(jù)(4 h內(nèi)的數(shù)據(jù))作為輸入數(shù)據(jù)進行風(fēng)電功率的預(yù)測。
根據(jù)上文風(fēng)電功率主要影響因素以及時間尺度的選取結(jié)果,將風(fēng)電功率預(yù)測過程所需的數(shù)據(jù)集進行整合得到式(7)所示第i個時間點所對應(yīng)的風(fēng)電功率預(yù)測模型輸入數(shù)據(jù)內(nèi)容。
(7)
式中,Ti-15、Hi-15、Pi-15分別為時間點i之前4 h處的溫度、濕度、氣壓數(shù)據(jù),三者均為一個點數(shù)據(jù);V、usin、ucos分別為時間點i之前4 h內(nèi)的風(fēng)速、風(fēng)向正余弦值,三者均為集合數(shù)據(jù)。
根據(jù)式(7)可以看出,對應(yīng)于時間點i處的風(fēng)電預(yù)測模型輸入數(shù)據(jù)集為一個1×51維的數(shù)據(jù)結(jié)構(gòu)形式。
2.2.1 自編碼網(wǎng)絡(luò)技術(shù)
根據(jù)數(shù)據(jù)構(gòu)建方式的介紹,為了找到一個天氣過程對風(fēng)電場輸出功率的影響,構(gòu)建了一個1×51維的樣本數(shù)據(jù)。高維樣本數(shù)據(jù)既不能在便于觀察分析的可視化二維空間能進行展示,也會因過高的樣本維度增加建模過程的計算量,進而影響到分析過程和預(yù)測模型的準(zhǔn)確性。為了排除以上問題對預(yù)測過程的影響,本文采用自編碼技術(shù)對所構(gòu)建的樣本數(shù)據(jù)進行了降維處理。
自編碼網(wǎng)絡(luò)技術(shù)(AutoEncoder,AE)通過輸入等于輸出的方式構(gòu)建了一種典型的無監(jiān)督神經(jīng)網(wǎng)絡(luò)算法模型[10]。自編碼網(wǎng)絡(luò)的結(jié)構(gòu)如圖2所示。
圖2 自編碼網(wǎng)絡(luò)結(jié)構(gòu)
假設(shè)輸入數(shù)據(jù)為x,輸出數(shù)據(jù)為x′,x、x′∈Rn×1,n為輸入輸出數(shù)據(jù)的維數(shù),自編碼網(wǎng)絡(luò)的編碼過程可以表示為式(8)所示的函數(shù)表達形式。
y=f(x)=s(ωx+b)
(8)
式中,s(·)為激活函數(shù),為進一步簡化計算過程,選取具有一定稀疏能力的ReLU函數(shù);ω和b為自編碼網(wǎng)絡(luò)中隱含層的權(quán)值和閾值,其結(jié)構(gòu)與輸入數(shù)據(jù)相同;y為隱含層輸出,y∈Rr×1。
輸入數(shù)據(jù)在經(jīng)過編碼計算后,還需要經(jīng)過自編碼網(wǎng)絡(luò)的解碼計算,其函數(shù)計算過程如式(9)所示。
x′=g(y)=s(ω′x+b′)
(9)
式中,ω′∈Rn×r;b′∈Rr×1;r為隱含層節(jié)點數(shù)。
經(jīng)過以上計算過程得到,自編碼網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)調(diào)整過程同傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相似[11]。經(jīng)過自編碼網(wǎng)絡(luò)的降維處理后,最終得到了圖3所示的處理結(jié)果。
2.2.2 改進K-means聚類算法
具有高維特征的天氣變化過程在圖3所示的二維平面內(nèi)得到了展示。為了能夠進一步提高風(fēng)電功率預(yù)測模型的預(yù)測精度,本文在自編碼網(wǎng)絡(luò)降維處理的基礎(chǔ)上,采用K-means聚類算法對不同的天氣變化過程進行聚類劃分。K-means算法的聚類過程如下:①在圖3所示的樣本數(shù)據(jù)中選定K個樣本點作為樣本數(shù)據(jù)的初始聚類中心;②計算所有樣本點到①中所選定的初始聚類中心的距離,并將樣本點劃分到與其最近的初始樣本點所屬的類別中;③根據(jù)②中進行的聚類結(jié)果,重新計算每一類樣本的質(zhì)心選出新的樣本聚類中心;④重新計算所有樣本同新樣本聚類中心的距離,并重新計算新聚類中心與原始聚類中心之間的距離,如果兩者距離小于一定的閾值則認為達到了預(yù)期聚類效果,終止聚類過程,否則重復(fù)進行②—④步,直到滿足最終的閾值設(shè)置結(jié)果。
圖3 自編碼網(wǎng)絡(luò)降維處理樣本
在K-means聚類過程中,選取了式(10)所示的2個樣本在二維空間中的歐氏距離作為樣本點間距離的計算依據(jù)。
(10)
式中,x1和y1分別為樣本1在第一維度和第二維度的值;x2和y2分別為樣本2在第一維度和第二維度的值;d為最終計算得到的2個樣本間的歐氏距離。樣本質(zhì)心的計算為此類樣本中所有樣本點各個維度數(shù)值的平均值。
由于K-means聚類算法在進行聚類時K值為隨機設(shè)置的,不同的K值設(shè)置結(jié)果會對聚類結(jié)果產(chǎn)生很大的影響[12]。為了能夠得到最佳的聚類結(jié)果本文將不同K值設(shè)置條件下,聚類結(jié)果的類內(nèi)平均距離與類間平均距離的比值作為最終的評價指標(biāo)對比了不同K值設(shè)置結(jié)果的聚類效果。類內(nèi)平均距離代表聚類后同一類樣本的聚集程度,類間平均距離代表聚類后不同類樣本間的離散程度,兩者的比值越小則證明獲得了更好的聚類效果。不同K值設(shè)置條件下聚類效果評價指標(biāo)的變化情況如圖4所示。
從圖4的評價指標(biāo)變化過程可以看出,當(dāng)設(shè)置聚類數(shù)為8時能夠得到最佳的聚類效果。根據(jù)以上結(jié)果,最終得到圖5所示的樣本聚類結(jié)果,每一類樣本的質(zhì)心用三角形進行了標(biāo)注。
圖4 聚類效果評價指標(biāo)
圖5 聚類結(jié)果
GRNN網(wǎng)絡(luò)是基于非線性回歸分析理論所形成的一種徑向基神經(jīng)網(wǎng)絡(luò),具有很強的非線性映射能力和穩(wěn)定的柔性容錯網(wǎng)絡(luò)結(jié)構(gòu)[13]。GRNN網(wǎng)絡(luò)包含有4層網(wǎng)絡(luò)結(jié)構(gòu),分別是輸入層、模式層、求和層以及輸出層[14]。
(1)輸入層。輸入層節(jié)點數(shù)與待學(xué)習(xí)樣本中輸入數(shù)據(jù)的維數(shù)相同,輸入層神經(jīng)元間無連接結(jié)構(gòu),直接將輸入數(shù)據(jù)以線性傳遞的方式傳遞至下一層網(wǎng)絡(luò)中[15]。
(2)模式層。模式層的網(wǎng)絡(luò)節(jié)點數(shù)等于學(xué)習(xí)樣本數(shù),模式層的網(wǎng)絡(luò)節(jié)點對應(yīng)于不同的樣本數(shù)據(jù)[16],模式層的網(wǎng)絡(luò)傳遞函數(shù)如式(11)所示。
(11)
其中,i=1,2,…,N。
(3)求和層。在求和層中對所有模式層中的神經(jīng)元進行算術(shù)求和以及加權(quán)求和[17],2種求和模式的函數(shù)表達形式如式(12)和式(13)所示。
(12)
(13)
式中,k為輸出向量維數(shù);Yi為求和層節(jié)點i的權(quán)值矩陣;yij為求和層節(jié)點i在j維的權(quán)值。
(14)
根據(jù)式(14)可知,GRNN網(wǎng)絡(luò)的輸出為式(15)所示。
(15)
(16)
式中,xi和Oi為隨機變量的輸入和輸出;p為輸入量的維數(shù)。
根據(jù)以上GRNN網(wǎng)絡(luò)的介紹,按以下步驟進行風(fēng)電功率預(yù)測。
(1)將降維處理后在圖5中展示的每一類天氣過程樣本數(shù)據(jù)作為輸入數(shù)據(jù),對應(yīng)的風(fēng)電功率值作為輸出數(shù)據(jù),進行不同天氣類型條件下GRNN網(wǎng)絡(luò)模型的訓(xùn)練。
(2)聚類劃分處理后,每一類樣本數(shù)據(jù)的數(shù)據(jù)量相比于未分類時總的樣本數(shù)據(jù)量均減少了很多。為使預(yù)測模型得到更好的訓(xùn)練效果,并獲得適用于每類樣本數(shù)據(jù)的平滑因子,采用交叉驗證的方式訓(xùn)練適用于每一類樣本數(shù)據(jù)的GRNN模型。
(3)按照式(7)所示的方式對待預(yù)測日的樣本數(shù)據(jù)進行重構(gòu),并將重構(gòu)后的數(shù)據(jù)采用自編碼網(wǎng)絡(luò)技術(shù)進行降維處理。
(4)計算降維處理后的待預(yù)測日數(shù)據(jù)與每一類樣本數(shù)據(jù)間的歐氏距離,將待預(yù)測日樣本數(shù)據(jù)劃入與其距離最近的一類中,最后采用對應(yīng)類別內(nèi)訓(xùn)練好的GRNN模型進行風(fēng)電功率預(yù)測。
根據(jù)以上預(yù)測流程,最終得到圖6所示的GRNN風(fēng)電功率預(yù)測結(jié)果。
圖6 GRNN模型風(fēng)電功率預(yù)測結(jié)果
為進一步驗證本文模型預(yù)測結(jié)果的有效性,選取相同的輸入輸出數(shù)據(jù)建立了BP神經(jīng)網(wǎng)絡(luò)風(fēng)電功率預(yù)測模型,預(yù)測結(jié)果如圖7所示。
圖7 BP神經(jīng)網(wǎng)絡(luò)風(fēng)電功率預(yù)測結(jié)果
本文采用均方根誤差、合格率以及累計電量損失作為預(yù)測結(jié)果的評價指標(biāo),通過以上指標(biāo)的對比計算,進一步證明了本文模型預(yù)測結(jié)果的有效性。
(1)均方根誤差。均方根誤差反映的是預(yù)測結(jié)果總體偏離真實值的程度[19],其對應(yīng)的計算方法如式(17)所示。
(17)
(2)合格率。合格率反映的是預(yù)測結(jié)果能夠應(yīng)用于電網(wǎng)調(diào)度運行的數(shù)量[20],其對應(yīng)的計算方法如式(18)所示。
(18)
其中,Bi為1時表示該點的預(yù)測結(jié)果合格,反之取0;T為合格閾值,一般取0.2。
(3)累計電量損失。電量損失是風(fēng)電場實際運行過程中的一個重要考核指標(biāo)。為衡量不同模型預(yù)測結(jié)果的有效性本文引入了累計電量損失這一評價指標(biāo),累計電量損失是整體預(yù)測結(jié)果偏離真實值的累計,通過計算該值得到不同預(yù)測模型最終的損失電量,其對應(yīng)的計算方法如式(19)所示。
(19)
綜上所述,最終得到評價指標(biāo)見表2。
表2 評價指標(biāo)
根據(jù)以上風(fēng)電功率預(yù)測模型的預(yù)測結(jié)果可以看出,本文采用GRNN網(wǎng)絡(luò)所建立的基于天氣過程影響的風(fēng)電功率預(yù)測模型在均方根誤差上相比于傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)所創(chuàng)建的風(fēng)電功率預(yù)測模型降低了4.67%,預(yù)測結(jié)果的合格率方面提高了6.25%,共計減少了107.22 MW累計電量損失。由此可見,本文模型在進行風(fēng)電功率預(yù)測時具有一定的有效性。