謝國(guó)民,陳天香
(遼寧工程技術(shù)大學(xué)電氣與控制工程學(xué)院,葫蘆島 125105)
作為清潔能源的一種,光伏發(fā)電具有十分廣闊的應(yīng)用前景[1-3],但大規(guī)模接入電網(wǎng)后會(huì)給電力系統(tǒng)帶來(lái)巨大挑戰(zhàn)[4-5],因此如何最大限度消納這些間歇性的可再生能源,已經(jīng)成為新能源領(lǐng)域的熱點(diǎn)問(wèn)題[6-7]
文獻(xiàn)[8]根據(jù)不同天氣類(lèi)型建立人工神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),在相對(duì)平穩(wěn)的天氣類(lèi)型下預(yù)測(cè)效果良好,但在突變天氣的預(yù)測(cè)效果較差;文獻(xiàn)[9]提出了基于主因子分析的BP神經(jīng)網(wǎng)絡(luò)的光伏發(fā)電短期預(yù)測(cè)模型,但其未考慮季節(jié)影響,泛化能力不強(qiáng),復(fù)雜天氣下精度不高;文獻(xiàn)[10]利用相似日聚類(lèi)劃分多個(gè)數(shù)據(jù)集,針對(duì)不同類(lèi)型數(shù)據(jù)集分別建立基于長(zhǎng)短期神經(jīng)網(wǎng)絡(luò)的光伏短期發(fā)電預(yù)測(cè)模型,提高了預(yù)測(cè)精度,但在相似日劃分時(shí)未能充分考慮環(huán)境與天氣的影響,預(yù)測(cè)精度有待提升;文獻(xiàn)[11]針對(duì)BP 神經(jīng)網(wǎng)絡(luò)參數(shù)難以確定的問(wèn)題,使用煙花算法優(yōu)化參數(shù),提升了預(yù)測(cè)精度,但神經(jīng)網(wǎng)絡(luò)在大樣本下才能發(fā)揮更佳效果;文獻(xiàn)[12]利用加權(quán)灰色關(guān)聯(lián)投影法優(yōu)化了相似日選取,但每次模型訓(xùn)練樣本容量過(guò)少,在極端天氣情況模型的泛化效果不佳;文獻(xiàn)[13]運(yùn)用經(jīng)驗(yàn)?zāi)B(tài)分解EMD(empirical mode decomposition)建立模型,獲得了較高的預(yù)測(cè)精度,但其分解存在明顯模態(tài)混疊的現(xiàn)象,在一定程度上會(huì)影響模型的預(yù)測(cè)性能;文獻(xiàn)[14]利用變分模態(tài)分解VMD(variational mode decomposition)平穩(wěn)化處理光伏功率序列,對(duì)子序列預(yù)測(cè)重構(gòu)后得出最終預(yù)測(cè)結(jié)果,一定程度上消除了模態(tài)分解導(dǎo)致的模態(tài)混疊的現(xiàn)象,但其對(duì)其對(duì)極端天氣的處理能力不強(qiáng),算法所需時(shí)間過(guò)長(zhǎng)。
綜上所述,針對(duì)現(xiàn)階段光伏發(fā)電功率短期預(yù)測(cè)方法中的不足,本文提出基于改進(jìn)K-means++自適應(yīng)聚類(lèi)和改進(jìn)黑猩猩優(yōu)化算法CHOA(chimpanzee optimization algorithm)優(yōu)化最小二乘支持向量機(jī)LSSVM(least squares support vector machine)的短期光伏發(fā)電功率預(yù)測(cè)模型。首先,考慮不同季節(jié)下氣象因素與光伏發(fā)電功率的影響程度不同,增強(qiáng)氣象因素與發(fā)電功率之間的關(guān)聯(lián)程度,對(duì)不同季節(jié)下氣象因素進(jìn)行自適應(yīng)聚類(lèi),選用相似樣本作為訓(xùn)練集。為了更好地利用天氣因素,用相關(guān)性分析確定了與光伏發(fā)電功率相關(guān)的變量步長(zhǎng),同時(shí)考慮到數(shù)據(jù)的維度冗余度,用隨機(jī)森林進(jìn)行特征提取構(gòu)建模型的輸入特征集。
由于每類(lèi)樣本數(shù)量較少,易出現(xiàn)欠擬合的消極現(xiàn)象,因此使用在小樣本情況下有較強(qiáng)擬合能力特性的最小二乘支持向量機(jī)可以有效改善模型的擬合能力[14],再利用改進(jìn)黑猩猩算法優(yōu)化LSSVM模型的懲罰參數(shù)和核函數(shù),增強(qiáng)模型對(duì)訓(xùn)練樣本的擬合能力和對(duì)測(cè)試樣本的預(yù)測(cè)能力。將所提模型分別與BP 神經(jīng)網(wǎng)絡(luò)BPNN(back propagation neural network)、長(zhǎng)短期記憶LSTM(long short term memory)神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比,并通過(guò)實(shí)驗(yàn)驗(yàn)證本文模型在精度和適用性方面的優(yōu)勢(shì)。
對(duì)于數(shù)據(jù)集X={(xi,yi)|i=1,2,…,n},xi為第i個(gè)輸入向量,yi為第i個(gè)輸出向量,n為訓(xùn)練樣本組數(shù),則線(xiàn)性回歸函數(shù)h(x)為
式中:α為線(xiàn)性權(quán)重系數(shù)矩陣;λ(xi)為非線(xiàn)性函數(shù);β為偏置矩陣。
LSSVM優(yōu)化目標(biāo)函數(shù)為
式中:c為誤差懲罰因子;ωi為經(jīng)驗(yàn)誤差。
約束條件為
拉格朗日函數(shù)為
式中:δ為拉格朗日乘子,δ=[δ1,δ2,…,δn]T;ω=[ω1,ω2,…,ωn]T。
根據(jù)Karush-Kuhn-Tucker條件,分別對(duì)α、β、ωi、δi求偏導(dǎo),并令其等于0,則消去α、ωi可得到線(xiàn)性方程組為
式中:I=[1,1,…,1]T;h=[h1,h2,…,hn]T;E為n維的單位矩陣;Φ為核函數(shù),Φ=λ(xi)Tλ(xi),i=1,2,…,n。
LSSVM預(yù)測(cè)函數(shù)為
式中:K(xi,xj)為RBF核函數(shù),其中i,j=1,2,…,n;σ為RBF函數(shù)的寬度。
LSSVM 的核函數(shù)是提高泛化能力和學(xué)習(xí)精度的關(guān)鍵,而核函數(shù)易受條件限制,對(duì)懲罰參數(shù)敏感,易陷入過(guò)擬合。所以引入CHOA[16]對(duì)核參數(shù)進(jìn)行尋優(yōu),獲取模型的最佳支撐參數(shù),進(jìn)一步提升LSSVM的泛化能力。
1.2.1 黑猩猩優(yōu)化算法(CHOA 算法)
黑猩猩優(yōu)化算法是根據(jù)黑猩猩表現(xiàn)的不同智力與能力提出的一種啟發(fā)式優(yōu)化算法,其引用了概率和混沌因子,能較其他算法有更快的收斂速度和精度。
在自然界中,黑猩猩被分為5種不同等級(jí):“驅(qū)趕者(Driver)”、“阻攔者(Barrier)”、“追捕者(Chaser)”、“攻擊者(Attacker)”和“執(zhí)行者(Executor)”,其中Attacker 黑猩猩權(quán)利最大,指揮整個(gè)種群的捕獵行動(dòng);Barrier黑猩猩是Attacker黑猩猩助手的角色,協(xié)助Attacker 黑猩猩指揮行動(dòng);Chaser 黑猩猩服從Attacker 黑猩猩和Barrier 黑猩猩的命令,同時(shí)支配下一階層的Driver 黑猩猩;Executor 黑猩猩為最底層的黑猩猩,由余下的黑猩猩組成,是命令的執(zhí)行者。
在黑猩猩種群中,黑猩猩在狩獵時(shí)會(huì)出現(xiàn)混亂捕獵行為,所以在優(yōu)化中以50%的概率選擇正常更新或混沌模型更新。黑猩猩包圍獵物的數(shù)學(xué)模型為
式中:t為當(dāng)前迭代次數(shù);Xprey(t) 為當(dāng)前獵物的位置;dg為黑猩猩與獵物之間的距離;mg為混沌映射矢量;Ag、Cg為系數(shù)向量,其更新表達(dá)式為
式中:rand()為[0,1]區(qū)間的隨機(jī)向量;ag(t) 為收斂因子,隨著t增加逐漸較小,其更新表達(dá)式為
式中,Tmax為最大迭代次數(shù)。
為便于理論研究和公式化處理,定義種群中最優(yōu)個(gè)體為Attacker黑猩猩,次優(yōu)個(gè)體為Barrier黑猩猩,第3優(yōu)個(gè)體為Chaser黑猩猩,第4優(yōu)個(gè)體為Driver黑猩猩,其余為Executor黑猩猩。
Executor黑猩猩位置由Attacker、Barrier、Chaser、Driver共同決定,其更新公式為
式中:Xu為Executor 黑猩猩中第u只黑猩猩的位置;Di(i=1,2,3,4)為第u只Executor 黑猩猩與4 個(gè)最優(yōu)個(gè)體黑猩猩之間的距離;XAttacker、XBtarrier、XChaser、XDriver分別為4個(gè)最優(yōu)個(gè)體黑猩猩的當(dāng)前迭代位置;X1、X2、X3、X4分別為4個(gè)最優(yōu)個(gè)體黑猩猩的更新位置;Ag1~Ag4、Cg1~Cg4、mg1~mg4分別為Ag、Cg、m中的4個(gè)系數(shù)向量。
1.2.2 改進(jìn)的黑猩猩算法(PCHOA 算法)
雖然CHOA算法引入混亂捕獵行為加快了收斂速度,但還存在精度低和收斂慢等不足。為了進(jìn)一步提高算法搜索能力和收斂性能,引入粒子群算法記錄黑猩猩個(gè)體經(jīng)歷的最佳位置以及群體最佳位置,來(lái)更新當(dāng)前Executor黑猩猩的位置,表達(dá)式為
式中:c1、c2為學(xué)習(xí)因子;r1、r2為[0,1]區(qū)間的隨機(jī)向量;Xbest為黑猩猩最優(yōu)的位置;P1、P2、P3、P4為慣性權(quán)重系數(shù),其具體公式為
其PCHOA算法流程如圖1所示。
圖1 改進(jìn)黑猩猩優(yōu)化算法流程Fig.1 Flow chart of improved chimpanzee optimization algorithm
步驟1設(shè)置相關(guān)參數(shù),本文種群數(shù)N為30,最大迭代次數(shù)為80。
步驟2初始化黑猩猩種群位置。
步驟3計(jì)算適應(yīng)度,確定前4個(gè)最優(yōu)解XAttacker、XBtarrier、XChaser和XDriver。
步驟4更新Ag、Cg,按照式(14)更新執(zhí)行黑猩猩的位置。
步驟5通過(guò)粒子群算法的群個(gè)體記憶機(jī)制,按照式(15)更新執(zhí)行黑猩猩位置。
步驟6判斷是否滿(mǎn)足迭代次數(shù),若滿(mǎn)足輸出最優(yōu)黑猩猩位置XAttacker,否則繼續(xù)迭代。
步驟7獲得最佳參數(shù),保存最優(yōu)LSSVM模型。
傳統(tǒng)的K-means++聚類(lèi)算法原理簡(jiǎn)單,適用性強(qiáng),在光伏功率初始數(shù)據(jù)處理上得到廣泛的適用[17],但是算法需要人為定義K值,隨機(jī)選取聚類(lèi)中心,會(huì)受數(shù)據(jù)分布、人為因素的影響,處理精度不高。本文采用密度聚類(lèi)算法[17]的思想,綜合考慮季節(jié)內(nèi)、季節(jié)間的差異度,根據(jù)綜合評(píng)價(jià)函數(shù)自適應(yīng)得出最佳K個(gè)聚類(lèi)中心,降低算法陷入局部最優(yōu)的可能。
樣本xi、xj之間的距離為
式中,M為聚類(lèi)樣本維度。
距離閾值內(nèi)的局部密度ρi為
式中:Dt為閾值距離;z為聚類(lèi)樣本數(shù)目。
密度聚類(lèi)初始聚類(lèi)中心mk的更新公式為
式中:k為聚類(lèi)數(shù)目;X為總數(shù)據(jù)集。
綜合評(píng)價(jià)函數(shù)為
式中:Dout為不同類(lèi)樣本之間的歐式距離;Din為同類(lèi)樣本之間的距離。
F(k)越接近1,聚類(lèi)效果越好;F(k)越接近-1,聚類(lèi)效果越差。
改進(jìn)算法的步驟如下。
步驟1輸入數(shù)據(jù)X,閾值距離Dt,計(jì)算xi、xj之間的距離d(xi,xj),計(jì)算距離閾值Dt內(nèi)的局部密度ρi。
步驟2對(duì)ρi排序,選擇max{ρi} 為第1個(gè)聚類(lèi)中心m1,根據(jù)max{d(x,m1)}選出離m1最遠(yuǎn)且密度最大的聚類(lèi)中心m2,依次按照式(19)獲得其最佳聚類(lèi)中心mi。
步驟3迭代計(jì)算,根據(jù)式(20)得出最優(yōu)的F(k),對(duì)應(yīng)的k即為最佳聚類(lèi)數(shù)目K。
步驟4計(jì)算樣本xi到mi的距離d,劃分樣本xi到最近的mi。
步驟5重新計(jì)算各簇類(lèi)的平均值,判斷聚類(lèi)中心是否改變。未改變則直接輸出聚類(lèi)結(jié)果,若改變返回步驟4重新迭代。
步驟6保存聚類(lèi)結(jié)果,等待預(yù)測(cè)模型調(diào)用。
不同季節(jié)下氣象因子有很大不同,光伏功率的輸出變化也會(huì)深受影響??紤]不同季節(jié)對(duì)光伏輸出功率的影響,隨機(jī)選取5 d 進(jìn)行斯皮爾曼相關(guān)性分析,結(jié)果如表1所示。
表1 斯皮爾曼相關(guān)性分析Tab.1 Spearman correlation analysis
由表1 可知,春季輻照度和環(huán)境溫度對(duì)光伏出力呈現(xiàn)強(qiáng)相關(guān),組件溫度、大氣壓、濕度呈現(xiàn)弱相關(guān);在夏、秋、冬3季,輻照度、環(huán)境溫度、組件溫度與光伏出力呈現(xiàn)強(qiáng)相關(guān),而大氣壓與濕度幾乎對(duì)光伏出力沒(méi)有影響。因此,春季將5個(gè)氣候因素都作為輸入特征;而在夏、秋、冬3 季僅選取輻照度、環(huán)境溫度、組件溫度3個(gè)環(huán)境因素表征光伏出力特征。
考慮t+1時(shí)刻的光伏功率與前n個(gè)時(shí)刻功光伏率有很強(qiáng)的相關(guān)性,光伏輸出功率自相關(guān)性分析,如表2所示。
表2 輸出功率的自相關(guān)性Tab.2 Autocorrelation of output power
由表2可知,隨著時(shí)間的推移,光伏出力與前n個(gè)時(shí)刻的相關(guān)性逐漸減弱,因此選用前5個(gè)時(shí)刻功率已經(jīng)能基本表征t+1時(shí)刻的功率。
綜上所述,構(gòu)建的輸入/輸出變量如表3所示。
表3 預(yù)測(cè)模型的輸入/輸出變量Tab.3 Input/output variables in prediction model
采用平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)、擬合優(yōu)度(R2)衡量預(yù)測(cè)模型性能,它們分別定義為
式中:為預(yù)測(cè)值;Pi為實(shí)際值;為平均值;N為預(yù)測(cè)點(diǎn)個(gè)數(shù)。
基于上述討論,本文構(gòu)建DK-PCHOA-LSSVM的光伏輸出功率預(yù)測(cè)模型,其流程如圖2所示。
圖2 預(yù)測(cè)模型流程Fig.2 Flow chart of predictive model
步驟1數(shù)據(jù)清洗,以天為單位剔除由于異常、故障等原因產(chǎn)生的不良數(shù)據(jù)。
步驟2利用改進(jìn)的K-means++算法將季節(jié)數(shù)據(jù)聚類(lèi),將數(shù)據(jù)分類(lèi)為A~K類(lèi)相似日數(shù)據(jù)。
步驟3對(duì)步驟2中分類(lèi)得到的相似日數(shù)據(jù)進(jìn)行相關(guān)性分析,選擇主要的氣象因子和歷史光伏輸出功率數(shù)據(jù)作為輸入特征,再利用隨機(jī)森林算法消除數(shù)據(jù)的冗余性。
步驟4對(duì)步驟3 數(shù)據(jù)歸一化,轉(zhuǎn)化為A~K類(lèi)相似日數(shù)據(jù)包。
步驟5初始化黑猩猩優(yōu)化模型參數(shù),將樣本的訓(xùn)練集輸入到改進(jìn)的CHOA-LSSVM 模型中進(jìn)行訓(xùn)練,直到獲得最優(yōu)的訓(xùn)練模型。
步驟6保存最優(yōu)訓(xùn)練模型,輸入預(yù)測(cè)樣本進(jìn)行測(cè)試。輸出模型評(píng)估指標(biāo)MAE、R2、RMSE結(jié)束模型。
本算例實(shí)驗(yàn)數(shù)據(jù)來(lái)源于我國(guó)寧夏回族自治區(qū)某100 kW 光伏電站監(jiān)數(shù)據(jù),樣本數(shù)據(jù)為2020 年1 月1 日—2020 年12 月31 日的實(shí)測(cè)光伏功率和環(huán)境監(jiān)測(cè)儀所測(cè)得到的太陽(yáng)輻照度、組件溫度、空氣溫度、相對(duì)濕度、大氣壓力的數(shù)據(jù)集,其采樣時(shí)間為15 min/次,其中各監(jiān)測(cè)設(shè)備運(yùn)行情況正常,數(shù)據(jù)可靠。由于晚間時(shí)段光伏出力為0,所以截取每日05:00—19:00 的數(shù)據(jù)頻段作為輸入樣本,共計(jì)365天的數(shù)據(jù)(21 900 個(gè)樣本點(diǎn))。考慮不同季節(jié)對(duì)光伏輸出功率的影響,按照季節(jié)將全年數(shù)據(jù)分為4個(gè)季節(jié)子集,其中12 月—次年2 月為冬季,3—5 月為春季,6—8 月為夏季,9—11 月為秋季。將各季節(jié)實(shí)際運(yùn)行數(shù)據(jù)劃分為2個(gè)部分,同類(lèi)型歷史氣象及光伏發(fā)電功率數(shù)據(jù)作為訓(xùn)練集,待測(cè)日溫度和風(fēng)速為數(shù)值天氣預(yù)報(bào)NWP(numerical weather prediction)數(shù)據(jù)及光伏發(fā)電功率數(shù)據(jù)作為測(cè)試集,對(duì)待預(yù)測(cè)日05:00—19:00時(shí)段進(jìn)行提前24 h預(yù)測(cè)。
利用改進(jìn)的K-means++自適應(yīng)聚類(lèi),不同季節(jié)天氣類(lèi)型聚類(lèi)天數(shù)如表4所示。
表4 不同季節(jié)聚類(lèi)天數(shù)Tab.4 Clustered days by season
由表4可知,數(shù)據(jù)的聚類(lèi)簇?cái)?shù)與季節(jié)有關(guān),如春季有A類(lèi)31 d,B、C、D類(lèi)分別為22 d、24 d、15 d,而夏季只被分A類(lèi)和B類(lèi),其中,A類(lèi)為傳統(tǒng)意義下的晴空類(lèi)數(shù)據(jù),B、C、D類(lèi)為非晴空類(lèi),包括多云、雨天(大雨,小雨,暴雨)、陰天、雪天等各種天氣類(lèi)型。
雖然不同年份、不同季節(jié)氣象數(shù)據(jù)存在差異性、隨機(jī)性,但改進(jìn)的K-means++聚類(lèi)能自適應(yīng)出最優(yōu)聚類(lèi)數(shù)目,能以此建立不同數(shù)量的預(yù)測(cè)模型,能更好地適應(yīng)氣候、季節(jié)變化,應(yīng)對(duì)極端天氣的出現(xiàn),提高了模型的抗干擾能力和穩(wěn)定性。
根據(jù)不同季節(jié)的聚類(lèi)結(jié)果,分別采用PCHOA和CHOA算法對(duì)LSSVM模型進(jìn)行尋優(yōu),得到各類(lèi)型下最優(yōu)核參數(shù)向量,從而獲得最優(yōu)LSSVM 預(yù)測(cè)模型。為驗(yàn)證改進(jìn)K-means++聚類(lèi)算法和PCHOA 優(yōu)化LSSVM 模型的優(yōu)良泛化性能,從數(shù)據(jù)中隨機(jī)抽取2020 年2 月22 日、5 月27 日、8 月24 日、11 月14日數(shù)據(jù)進(jìn)行預(yù)測(cè),將本文改進(jìn)K-means++聚類(lèi)的改進(jìn)黑猩猩優(yōu)化支持向量機(jī)模型(DK-PCHOA-LSSVM)與普通K-means++聚類(lèi)的改進(jìn)黑猩猩優(yōu)化支持向量機(jī)模型(K-PCHOA-LSSVM)、改進(jìn)K-means++聚類(lèi)的普通黑猩猩優(yōu)化支持向量機(jī)模型(DKCHOA-LSSVM)的預(yù)測(cè)結(jié)果進(jìn)行比較。預(yù)測(cè)曲線(xiàn)分別如圖3~圖6所示。
圖3 2 月22 日各模型對(duì)比Fig.3 Comparison among models on February 22
圖4 5 月27 日各模型對(duì)比Fig.4 Comparison among models on May 27
圖5 8 月24 日各模型對(duì)比Fig.5 Comparison among models on August 24
圖6 11 月14 日各模型對(duì)比Fig.6 Comparison among models on November 14
從圖3~圖6 可知,8 月24 日的晴空條件下KPCHOA-LSSVM、DK-CHOA-LSSVM、DK-PCHOALSSVM 3 個(gè)預(yù)測(cè)模型均能良好預(yù)測(cè)光伏發(fā)電功率的變化,但K-PCHOA-LSSVM有更大的誤差;在2月22 日的非晴空條件下,K-PCHOA-LSSVM 模型的跟蹤性能最差,特別是在10:00—15:00 這段時(shí)間,預(yù)測(cè)值偏離實(shí)際值較多,而其他兩類(lèi)模型偏離程度較小,這表明基于自適應(yīng)類(lèi)別劃分相似日的數(shù)據(jù)處理是改善B、C、D類(lèi)非晴空模型預(yù)測(cè)性能的有效途徑;而在5月27日和11月14日,DK-PCHOA-LSSVM預(yù)測(cè)模型很好地跟隨了實(shí)際輸出功率,偏離程度最小。而K-PCHOA-LSSVM 和DK-CHOA-LSSVM 預(yù)測(cè)結(jié)果相近,在功率波動(dòng)時(shí)刻偏離誤差較大,表明改進(jìn)黑猩猩算法提高了算法搜索能力,增強(qiáng)了模型泛化能力和挖掘數(shù)據(jù)隨機(jī)波動(dòng)規(guī)律的能力,提升了B、C、D類(lèi)非晴空模型預(yù)測(cè)精度。
分別計(jì)算各模型輸出功率的MAE、R2、RMSE,結(jié)果如表5 所示。從表5 可知,對(duì)比于目前流行的傳統(tǒng)K-means 相似日選取方法,改進(jìn)的K-means++在B、C、D 類(lèi)非晴空天氣下R2提高了21%左右,RMSE減小40%左右,MAE減了37%左右;在A類(lèi)晴空天氣下各預(yù)測(cè)指標(biāo)也均有提升。從表5 中也能看出,PCHOA-LSSVM算法與CHOA-LSSVM算法相比,有著更優(yōu)的擬合優(yōu)度,更小的誤差。
表5 模型評(píng)價(jià)指標(biāo)Tab.5 Model evaluation indicators
為驗(yàn)證PCHOA-LSSVM 的預(yù)測(cè)能力,在改進(jìn)的K-means++聚類(lèi)下將本文預(yù)測(cè)模型與文獻(xiàn)天牛須搜索算法優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)(DK-BAS-BPNN)和長(zhǎng)短期神經(jīng)網(wǎng)絡(luò)(DK-LSTM)預(yù)測(cè)模型進(jìn)行對(duì)比,4 天的對(duì)比效果分別如圖7~圖10 所示。由圖7~圖10可知,在晴空天氣下DK-PCHOA-LSSVM 較參考模型有更高的精度;在非晴空天氣下,DK-BAS-BPNN和DK-LSTM 模型的預(yù)測(cè)值與實(shí)際偏差較大,尤其是對(duì)突變點(diǎn)的追蹤能力不強(qiáng),而DK-PCHOA-LSSVM 模型的偏差程度最小,能對(duì)光伏出力的突變作出很好的預(yù)測(cè),體現(xiàn)了較好預(yù)測(cè)性能,表現(xiàn)出PCHOA-LSSVM在小樣本數(shù)據(jù)集和數(shù)據(jù)集波動(dòng)較大時(shí)較強(qiáng)的擬合能力,有效避免了神經(jīng)網(wǎng)絡(luò)等方法中常出現(xiàn)的局部最優(yōu)合和過(guò)擬合等問(wèn)題。
圖7 2 月22 日各模型對(duì)比Fig.7 Comparison among models on February 22
圖8 5 月27 日各模型對(duì)比Fig.8 Comparison among models on May 27
圖9 8 月24 日各模型對(duì)比Fig.9 Comparison among models on August 24
圖10 11 月14 日各模型對(duì)比Fig.10 Comparison among models on November 14
為進(jìn)一步驗(yàn)證本文方法的泛化能力和普適性,隨機(jī)抽取光伏電站功率變化波動(dòng)大的5 d,即11 月24 日—11 月28 日進(jìn)行連續(xù)5 d 功率滾動(dòng)預(yù)測(cè)。其預(yù)測(cè)結(jié)果如圖11所示,預(yù)測(cè)誤差如表6所示。
表6 模型評(píng)價(jià)指標(biāo)Tab.6 Model evaluation indicators
圖11 連續(xù)5 d 預(yù)測(cè)結(jié)果對(duì)比Fig.11 Comparison of prediction results for five consecutive days
由表6 可知,預(yù)測(cè)誤差的MAE、RMSE 均小于5%。基于以上對(duì)比分析,本文預(yù)測(cè)模型相較于傳統(tǒng)方法在天氣大波動(dòng)下也能良好地追蹤實(shí)際輸出功率,適用于晴空、非晴空條件下的光伏發(fā)電短期功率預(yù)測(cè)。
(1)基于傳統(tǒng)K-means++的不足,引入密度聚類(lèi)和綜合評(píng)價(jià)函數(shù)評(píng)估聚類(lèi)結(jié)果,獲得自適應(yīng)的Kmeans++算法。聚類(lèi)數(shù)目隨著季節(jié)氣候變化而發(fā)生改變,克服了人為設(shè)置聚類(lèi)數(shù)和隨機(jī)選取聚類(lèi)中心的缺點(diǎn),充分考慮了光伏發(fā)電功率預(yù)測(cè)中各氣象相關(guān)因素的影響,為提取待預(yù)測(cè)光伏功率的特征提供依據(jù)。
(2)基于黑猩猩算法收斂速度過(guò)慢、易陷入過(guò)擬合的缺點(diǎn),引入粒子群算法記錄黑猩猩個(gè)體經(jīng)歷的最佳位置以及群體最佳位置來(lái)優(yōu)化黑猩猩算法,通過(guò)與原始方法比較,改進(jìn)的黑猩猩算法能提高算法搜索能力,優(yōu)化效果明顯。
(3)構(gòu)建的DK-PCHOA-LSSVM 的功率預(yù)測(cè)模型不僅融合多源外部氣象因素模塊,克服了收斂速度慢等弊端,而且PCHOA 算法實(shí)時(shí)優(yōu)化LSSVM 的核函數(shù)和懲罰因子,提高了模型預(yù)測(cè)的適應(yīng)度,預(yù)測(cè)精度較其他傳統(tǒng)模型在天氣大波動(dòng)下也能良好追蹤,實(shí)際輸出功率有顯著提升,能夠滿(mǎn)足短期實(shí)時(shí)調(diào)度需求。
電力系統(tǒng)及其自動(dòng)化學(xué)報(bào)2024年2期