楊 茂,王凱旋
(現(xiàn)代電力系統(tǒng)仿真控制與綠色電能新技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室 東北電力大學(xué),吉林 吉林 132012)
近年來(lái),傳統(tǒng)能源急劇消耗,由此帶來(lái)的環(huán)境問(wèn)題越來(lái)越凸顯。同時(shí),人們對(duì)電力的需求也日益增長(zhǎng)。在此背景下,光伏發(fā)電逐漸向結(jié)構(gòu)化、規(guī)?;l(fā)展。然而,大面積光伏場(chǎng)站的接入將影響電力系統(tǒng)的安全穩(wěn)定運(yùn)行,因此,準(zhǔn)確預(yù)測(cè)光伏出力變得尤為重要[1],[2]。環(huán)境的局地效應(yīng)和表層大氣運(yùn)動(dòng)的隨機(jī)性給光伏出力的預(yù)測(cè)帶來(lái)了不可忽視的干擾,同時(shí),光伏出力的周期性和自相關(guān)性為光伏出力的預(yù)測(cè)帶來(lái)了得天獨(dú)厚的優(yōu)勢(shì),即相似日/相似片段的選取(光伏出力匹配研究)[3]。
光伏出力的預(yù)測(cè)方法包括以BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、相關(guān)向量機(jī)為代表的靜態(tài)機(jī)器學(xué)習(xí)算法和以生成式對(duì)抗網(wǎng)絡(luò)、長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-term Memory,LSTM)為代表的動(dòng)態(tài)機(jī)器學(xué)習(xí)算法等[4]~[8]。光伏出力匹配研究是提高預(yù)測(cè)精度的有效手段。目前,光伏出力匹配常用的方法包括K均值聚類、K近鄰算法、集對(duì)分析以及光伏出力特性建模等[9]~[12]。文獻(xiàn)[13]對(duì)光伏出力進(jìn)行不同時(shí)間尺度的聚類建模,提取了光伏出力小時(shí)級(jí)和分鐘級(jí)波動(dòng)特征,明確建立了不同天氣類型的聚類中心,并通過(guò)短期光伏出力預(yù)測(cè)驗(yàn)證了建模的有效性。文獻(xiàn)[14]篩選出與對(duì)光伏出力相關(guān)性較高的氣象因素,然后,通過(guò)K臨近算法對(duì)相似樣本進(jìn)行選取,最后,通過(guò)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了對(duì)光伏出力的概率預(yù)測(cè)。光伏出力匹配工作主要是從歷史實(shí)測(cè)數(shù)據(jù)和數(shù)值天氣預(yù)報(bào)(Numerical Weather Prediction,NWP)信息中篩選出與光伏出力相關(guān)性較強(qiáng)的變量,并通過(guò)匹配算法進(jìn)行匹配。由于不同天氣類型、相同天氣類型下的氣象變量均有可能不同,因此,若采用固有強(qiáng)相關(guān)變量進(jìn)行光伏出力匹配會(huì)導(dǎo)致匹配結(jié)果不理想。
本文提出一種基于最大相關(guān)最小冗余原則(Minimal Redundancy Maximal Relevance,MRMR)的光伏出力匹配研究方法。該方法先采用皮爾遜相 關(guān) 系 數(shù)(Pearson Correlation Coefficient,PCC)對(duì)數(shù)據(jù)庫(kù)進(jìn)行相關(guān)性分析,篩選出固有氣象變量;再根據(jù)互信息理論對(duì)初步篩選后的數(shù)據(jù)樣本和預(yù)測(cè)日NWP信息按短波輻射進(jìn)行特征抽取,選取當(dāng)日氣象變量,進(jìn)一步提高匹配效果;然后,將提取出來(lái)的待匹配日特征通過(guò)馬氏距離進(jìn)行光伏出力匹配;最后,基于MRMR的光伏出力匹配結(jié)果,通過(guò)長(zhǎng)短期記憶網(wǎng)絡(luò)對(duì)新疆某實(shí)際光伏場(chǎng)站進(jìn)行短期預(yù)測(cè),預(yù)測(cè)結(jié)果驗(yàn)證了本文方法的有效性。
受多種氣象因素和組件狀態(tài)的影響,光伏出力具有不穩(wěn)定性,難以控制。因此,在進(jìn)行光伏出力匹配前,須要對(duì)影響光伏出力的氣象變量進(jìn)行分析。光伏場(chǎng)站配備的傳感器可以接收多類數(shù)據(jù),結(jié)合NWP信息,可為數(shù)據(jù)分析處理提供極大的便利。本文以新疆某實(shí)際光伏場(chǎng)站為研究對(duì)象,進(jìn)行相關(guān)性分析及特征提取。
本文選取的歷史實(shí)測(cè)數(shù)據(jù)和NWP信息共計(jì)26類數(shù)據(jù),數(shù)據(jù)長(zhǎng)度為2017年2月5日-2018年4月30日,采樣時(shí)間間隔為5 min。其中,歷史實(shí)測(cè)數(shù)據(jù)通過(guò)所屬光伏電站數(shù)據(jù)采集系統(tǒng)獲得,歷史實(shí)測(cè)數(shù)據(jù)的種類包括總輻射(V1)、散射輻射(V2)、直 接 輻 射(V3)、背 板 溫 度(V4)、溫 度(V5)、濕 度(V6)、風(fēng) 速(V7)、壓 強(qiáng)(V8)、風(fēng) 向(V9)、光 伏出力(V10);NWP信息來(lái)自于當(dāng)?shù)貧庀缶謹(jǐn)?shù)值天氣預(yù)報(bào)信息系統(tǒng),NWP數(shù)據(jù)種類包括10 m風(fēng)速(W1)、30 m風(fēng) 速(W2)、50 m風(fēng) 速(W3)、70 m風(fēng)速(W4)、10 m風(fēng) 向(W5)、30 m風(fēng) 向(W6)、50 m風(fēng) 向(W7)、70 m風(fēng) 向(W8)、溫 度(W9)、2 m相 對(duì)濕 度(W10)、2 m濕 度(W11)、長(zhǎng) 波 輻 射(W12)、短波 輻 射(W13)、云 量(W14)、氣 壓(W15)、降 水 量(W16)。
根據(jù)上述數(shù)據(jù)庫(kù)可以看出,26類數(shù)據(jù)不能全部作為光伏出力匹配的標(biāo)準(zhǔn),因此,須要對(duì)這些數(shù)據(jù)進(jìn)行初步相關(guān)性分析。本文采用PCC方法對(duì)原始數(shù)據(jù)進(jìn)行特征抽取,PCC方法的理論公式為
式中:r為相關(guān)系數(shù);Y為分析光伏出力與歷史實(shí)測(cè)信息時(shí)的光伏出力以及分析NWP信息之間關(guān)系時(shí)的短波輻射;X為分析光伏出力與歷史實(shí)測(cè)信息時(shí)的歷史實(shí)測(cè)氣象信息以及分析NWP信息之間關(guān)系時(shí)的其他氣象信息;N為樣本數(shù)目。
通過(guò)PCC方法對(duì)數(shù)據(jù)特征初步抽取的結(jié)果如表1,2所示,其中r為相關(guān)系數(shù)。
表1 基于歷史實(shí)測(cè)信息的抽取結(jié)果Table 1 Extraction results based on measured historical information
當(dāng)相關(guān)系數(shù)的絕對(duì)值小于0.2時(shí),認(rèn)為NWP信息與光伏出力、短波輻射不相關(guān)。依據(jù)PCC方法可初步篩選出相關(guān)氣象信息,包括歷史實(shí)測(cè)信息(V1~V7,V10)8種,NWP信 息(W2,W3,W9~W13)7種,從而將原始?xì)庀髷?shù)據(jù)由26維縮至15維。
通過(guò)上文的初步篩選,實(shí)現(xiàn)了對(duì)原始數(shù)據(jù)的縮減,但從預(yù)測(cè)日光伏出力匹配角度來(lái)看,數(shù)據(jù)樣本質(zhì)量仍須進(jìn)一步改善。
在概率論和信息論中,2個(gè)隨機(jī)變量的互信息(Mutual Information,MI)或 轉(zhuǎn) 移 信 息 為 變 量 間相互依賴性的量度[15]。不同于相關(guān)系數(shù),互信息能夠衡量2個(gè)隨機(jī)變量之間的相關(guān)性,即一個(gè)隨機(jī)變量中包含著關(guān)于另一個(gè)隨機(jī)變量的信息量。利用互信息有兩個(gè)目的,一為對(duì)PCC方法篩選后的數(shù)據(jù)通過(guò)減少耦合和冗余的數(shù)據(jù)空間來(lái)提高光伏出力匹配的速度和效率;二為利用MRMR原則進(jìn)一步去除噪聲,提高匹配精度。
對(duì)于所要篩選的影響變量X和待匹配量Y之 間 的 互 信 息I(X,Y)的 計(jì) 算 式 為
式 中:PXY(x,y)為X與Y的 聯(lián) 合 概 率 分 布 函 數(shù);PX(x)為X的邊緣概率分布函數(shù);PY(y)為Y的邊緣概率分布函數(shù);a為對(duì)數(shù)基底,取2。
能夠最大程度反映光伏出力信息的氣象特征被稱為最大相關(guān),不同氣象特征之間的最大耦合為 最 小 冗 余[16],[17]。
通過(guò)PCC方法篩選后的數(shù)據(jù)樣本,基于互信息理論和MRMR原則,將數(shù)據(jù)樣本分為3類進(jìn)行特征抽取。數(shù)據(jù)樣本種類分別為待匹配日NWP數(shù)據(jù)樣本集、歷史NWP數(shù)據(jù)樣本集和歷史實(shí)測(cè)數(shù)據(jù)樣本集。其中,待匹配日NWP數(shù)據(jù)樣本集根據(jù)待匹配日NWP互信息值的大小選定。歷史NWP數(shù)據(jù)樣本集則須要通過(guò)MRMR原則進(jìn)一步篩選。由表1,2可知,經(jīng)過(guò)PCC方法篩選后發(fā)現(xiàn),W2(30 m風(fēng) 速)和W3(50 m風(fēng) 速)存 在 耦 合;W10(2 m相對(duì)濕度)和W11(2 m濕度)存在耦合。而歷史實(shí)測(cè)數(shù)據(jù)樣本集有兩個(gè)作用,一為光伏出力的預(yù)測(cè)應(yīng)用,可以依據(jù)歷史實(shí)測(cè)數(shù)據(jù)樣本集選取輸入變量,提高LSTM的訓(xùn)練速度和效率;二為利用該樣本集可以進(jìn)行光伏出力匹配研究。但該樣本集中的V3(直接輻射)、V6(背板溫度)和V10(光伏出力)不能作為匹配的標(biāo)準(zhǔn),因?yàn)榇ヅ淙諆H有NWP信息。
表3為基于不同樣本集,對(duì)4種不同天氣類型的互信息特征抽取結(jié)果。
表3 對(duì)4種不同天氣類型的互信息特征抽取結(jié)果Table 3 Mutual information feature extraction results from different sample sets
由表3可知,待匹配日NWP樣本集特征與歷史實(shí)測(cè)數(shù)據(jù)樣本集相同,但不同天氣類型下的主要?dú)庀笞兞坎煌?。影響光伏出力匹配的氣象特?的 共 性 結(jié) 果 為(V1~W13)和(V2~W12),個(gè) 性 表現(xiàn)為不同天氣類型、相同天氣類型下,溫度、濕度、風(fēng)速上的差異。由表3還可以看出,即使在不同天氣類型條件下,氣象特征的個(gè)性結(jié)果表現(xiàn)為溫度>濕度>風(fēng)速這一固定排序,此結(jié)果與表1,2中基于PCC方法抽取結(jié)果相互驗(yàn)證。因此,根據(jù)歷史實(shí)測(cè)變量與光伏出力進(jìn)行相關(guān)性分析,選取相關(guān)性較高的變量作為光伏出力匹配的標(biāo)準(zhǔn)時(shí),忽略了風(fēng)速、濕度等變量在光伏出力匹配中的貢獻(xiàn)。
通過(guò)上述分析可知,對(duì)于歷史NWP數(shù)據(jù)樣本集中的耦合特征,W3(50 m風(fēng)速)優(yōu)于W2(30 m風(fēng) 速),W11(2 m濕 度)優(yōu) 于W10(2 m相 對(duì) 濕度)。本文對(duì)新疆某實(shí)際光伏場(chǎng)站2018年5月份的4種天氣類型(晴天、多云、雨天和晴轉(zhuǎn)多云)進(jìn)行光伏出力匹配研究。從工程實(shí)際角度出發(fā),由于光伏出力待匹配日僅有NWP信息,而NWP信息中的短波輻射的重要程度等同于實(shí)測(cè)信息中的總輻射,因此,對(duì)短波輻射的研究是必要的。通過(guò)對(duì)新疆1 a的短波輻射通量進(jìn)行研究可知,年短波輻射通量在時(shí)間上的分布為單峰曲線,近似于正態(tài)分布,具體如圖1所示。
圖1 年短波輻射通量分布Fig.1 Distribution of annual shortwave radiation flux
由圖1可知,年短波輻射通量最高時(shí)節(jié)為5-7月。因此,5月的光伏出力匹配到8-12月的概率很小,可以進(jìn)一步縮小匹配空間。
本文對(duì)5月份的2個(gè)晴天、2個(gè)多云、1個(gè)雨天和1個(gè)晴轉(zhuǎn)多云天進(jìn)行光伏出力匹配研究。光伏場(chǎng)站裝機(jī)容量為30 MW,采樣時(shí)間間隔為15 min,根據(jù)不同天氣類型氣象變量的互信息值大小,采用馬氏距離進(jìn)行光伏出力匹配,對(duì)于n個(gè)p維 樣 本 集X=(x1,x2,…,xn),xi,xj∈Rp,每2個(gè) 樣 本之間距離的計(jì)算式為
為比較本文方法的優(yōu)越性,現(xiàn)將MRMR法與PCC方法的計(jì)算結(jié)果進(jìn)行對(duì)比。不同天氣條件下,光伏出力的匹配結(jié)果如圖2所示。
圖2 不同天氣類型下,光伏出力的匹配結(jié)果Fig.2 Matching results of PV output under different weather types
由圖2可知,晴天天氣的光伏出力表現(xiàn)為一條光滑的單峰曲線,從匹配結(jié)果來(lái)看,雖然兩種方法均可匹配到晴天日,但本文提出的匹配方法效果更佳。多云天氣的光伏出力波動(dòng)特性與局部區(qū)域的云層運(yùn)動(dòng)有關(guān),依據(jù)歷史實(shí)測(cè)信息篩選出的固有氣象變量(對(duì)應(yīng)的NWP信息分別為短波輻射、長(zhǎng)波輻射和溫度)的光伏出力匹配效果僅能追蹤到部分波動(dòng)區(qū)段,結(jié)合表3和圖2(b)可以看 出,該 天 氣 類 型 下 的W3(風(fēng) 速)、W11(濕 度)的互信息值均大于W9(溫度),其中,W3的互信息值最大。圖2(c)左側(cè)為雨天的光伏出力匹配結(jié)果,該天氣條件下的光伏出力值很小,波動(dòng)情況是由短時(shí)的云層運(yùn)動(dòng)導(dǎo)致的。另外,根據(jù)表2中雨天氣象特征的互信息值可以看出,風(fēng)速互信息值為0.6,與長(zhǎng)波輻射相近。但歷史實(shí)測(cè)數(shù)據(jù)樣本集中,該日的風(fēng)速互信息值僅為0.1,進(jìn)而容易忽略風(fēng)速這一變量對(duì)光伏出力匹配的貢獻(xiàn),因此,MRMR的匹配效果明顯優(yōu)于歷史匹配方法。圖2(c)右側(cè)為晴轉(zhuǎn)多云的光伏出力匹配結(jié)果,該天氣類型的光伏出力的最大值出現(xiàn)在實(shí)驗(yàn)前期,同樣,因?yàn)楹雎援?dāng)日氣象變量的影響,造成當(dāng)日光伏出力的歷史匹配結(jié)果與晴天一致,而MRMR的光伏出力匹配結(jié)果符合該天氣類型特征。
表2 基于NWP信息的抽取結(jié)果Table 2 Extraction results based on NWP information
根據(jù)國(guó)家電網(wǎng)公司2014年5月1日發(fā)布的《光伏發(fā)電功率預(yù)測(cè)系統(tǒng)功能規(guī)范》中的均方根誤差(Root Mean Square Error,RMSE)、平 均 絕 對(duì) 誤差(Mean Absolute Error,MAE)和 合 格 率(Quality Rate,QR),這些指標(biāo)同樣可以用來(lái)量化歷史天氣匹配結(jié)果的準(zhǔn)確率,RMSE,MAE,QR的計(jì)算式分別為
表4為4種天氣類型(共6 d)條件下,不同方法的光伏出力匹配結(jié)果。
表4 不同方法的光伏出力匹配結(jié)果Table 4 Comparison of matching results of different methods
由表4可知,除了2018年5月7日,晴天條件下,2種方法的光伏出力匹配結(jié)果相近外,其余天氣類型均為本文提出方法的匹配效果優(yōu)于歷史匹配方法。
光伏出力的準(zhǔn)確預(yù)測(cè)有利于電網(wǎng)可靠性的評(píng)估和調(diào)度部門備用計(jì)劃的設(shè)定等[18]。然而,由前文可知,對(duì)于僅有NWP信息的待預(yù)測(cè)日,通過(guò)PCC方法處理后的可用信息分別為短波輻射、長(zhǎng)波輻射、溫度、濕度和風(fēng)速5種,利用這5種信息進(jìn)行預(yù)測(cè)很難取得較好的預(yù)測(cè)結(jié)果。但通過(guò)光伏出力匹配可以得到待匹配日的實(shí)測(cè)氣象信息,對(duì)待匹配日的實(shí)測(cè)氣象信息進(jìn)行氣象變量與光伏出力之間的相關(guān)性分析,篩選出輸入變量,有利于提升光伏出力的預(yù)測(cè)精度。本文匹配方法在光伏出力短期預(yù)測(cè)的應(yīng)用流程如下。
①通過(guò)互信息理論和MRMR原則篩選出待預(yù)測(cè)日的氣象變量,根據(jù)篩選出的氣象變量的互信息值的大小選取輸入變量進(jìn)行匹配。
②對(duì)①得到的待匹配日的實(shí)測(cè)氣象信息,進(jìn)行氣象變量與光伏出力之間的相關(guān)性分析,篩選出變量作為L(zhǎng)STM的輸入變量。
③設(shè)置LSTM模型的參數(shù)為7-17-1,激活函數(shù)為sigmoid函數(shù),最佳迭代次數(shù)為100,通過(guò)模擬得到最優(yōu)預(yù)測(cè)結(jié)果。
基于前文分析,得到4種天氣類型的光伏出力預(yù)測(cè)結(jié)果如圖3所示。
圖3 光伏出力預(yù)測(cè)結(jié)果Fig.3 PV output prediction results
根據(jù)評(píng)價(jià)指標(biāo)RMSE,MAE和QR,得到光伏出力的預(yù)測(cè)誤差評(píng)價(jià)結(jié)果如表5所示。
表5 光伏出力預(yù)測(cè)誤差評(píng)價(jià)結(jié)果Table 5 PV output prediction error evaluation results
由表可知,4種天氣類型的光伏出力預(yù)測(cè)結(jié)果的均方根誤差和平均相對(duì)誤差分別為5.56%和5.81%,合格率為99.65%,滿足光伏出力短期預(yù)測(cè)的指標(biāo)要求(均方根誤差小于20%、合格率大于80%)。
本文針對(duì)氣象變量篩選結(jié)果不同導(dǎo)致光伏出力匹配結(jié)果不確定的問(wèn)題,提出了一種基于最大相關(guān)最小冗余原則的光伏出力匹配方法,通過(guò)算例分析得到以下結(jié)論。
①根據(jù)待匹配日NWP氣象數(shù)據(jù)的互信息特征,提取與待匹配日實(shí)測(cè)氣象數(shù)據(jù)的后驗(yàn)知識(shí),可得影響光伏出力匹配的共性結(jié)果為短波輻射-總輻射、長(zhǎng)波輻射-散射輻射;個(gè)性結(jié)果表現(xiàn)在溫度、濕度、風(fēng)速上的差異。
②根據(jù)歷史實(shí)測(cè)氣象數(shù)據(jù)樣本集的互信息計(jì)算發(fā)現(xiàn),即使不同天氣類型,篩選后的氣象特征個(gè)性結(jié)果一般表現(xiàn)為溫度>濕度>風(fēng)速這一固定排序,其中,風(fēng)速在光伏出力匹配時(shí)的貢獻(xiàn)易被忽略。