韓璐,宋海亮,宋佳,劉太豪
(西南石油大學(xué)電氣信息學(xué)院,四川 成都 610500)
因光伏發(fā)電自身帶有特殊的間歇特性以及波動(dòng)特性,當(dāng)含有大量分布式光伏微電源并入電網(wǎng)時(shí),會(huì)使電網(wǎng)的安全性能和經(jīng)濟(jì)性能遭受巨大的挑戰(zhàn)[1-2]。光伏發(fā)電會(huì)因當(dāng)時(shí)的天氣情況不斷變化,因此具有很大的不確定性,會(huì)給調(diào)度過(guò)程帶來(lái)一定的影響[3]。精準(zhǔn)的預(yù)測(cè)方法能夠有效地避免出現(xiàn)諸如光伏出力造成的配電網(wǎng)損耗增加[4]等問(wèn)題。
目前,針對(duì)光伏發(fā)電功率預(yù)測(cè)的精度問(wèn)題,在國(guó)內(nèi)外被越來(lái)越多的學(xué)者研究,并取得了一定的成果。李樂(lè)等[5]針對(duì)傳統(tǒng)預(yù)測(cè)算法在突變天氣條件下預(yù)測(cè)精度較低的問(wèn)題,提出基于近鄰傳播聚類和回聲狀態(tài)網(wǎng)絡(luò)的組合算法,通過(guò)近鄰傳播網(wǎng)絡(luò)狀態(tài)方程進(jìn)行光伏出力預(yù)測(cè)的方法。張程熠等[6]提出了一種適用于雙層神經(jīng)網(wǎng)絡(luò)小樣本的單步光伏預(yù)測(cè)方法,有效減少對(duì)訓(xùn)練樣本數(shù)量的需求,同時(shí)保證預(yù)測(cè)的準(zhǔn)確度。李練兵等[7]提出一種采用Elman神經(jīng)網(wǎng)絡(luò)算法,結(jié)合與預(yù)測(cè)日同日類型下整點(diǎn)時(shí)刻的氣象數(shù)據(jù)和光伏輸出功率數(shù)據(jù),建立光伏發(fā)電短期功率預(yù)測(cè)模型,但是因其并沒(méi)有考慮到更多的真實(shí)天氣情況,從而使預(yù)測(cè)的效果和精度欠佳。文獻(xiàn)[8-10]都是基于深度學(xué)習(xí)對(duì)光伏發(fā)電預(yù)測(cè)進(jìn)行了研究,但是就影響因素方面,并沒(méi)有涉及天氣情況。
本文考慮更全面的天氣信息對(duì)光伏發(fā)電預(yù)測(cè)精度的影響,加入特征提取的方法,尋找光伏發(fā)電在天氣數(shù)據(jù)中影響因素的主要組成成分。由于光伏發(fā)電時(shí)常伴隨著隨機(jī)性和不確定性,導(dǎo)致使用預(yù)測(cè)中的傳統(tǒng)方法對(duì)其進(jìn)行預(yù)測(cè)時(shí),會(huì)有很大的缺陷和約束。BP神經(jīng)網(wǎng)絡(luò)的引入會(huì)有效改善光伏發(fā)電的預(yù)測(cè)效果,但是單一的傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練性能和求解精度都欠佳,而FA是新崛起的一種智能優(yōu)化算法,在優(yōu)化局部和全局,以及魯棒性能等發(fā)面有著獨(dú)特的優(yōu)勢(shì)。所以本次研究在基于特征提取的方法上利用FA優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的初始閾值與權(quán)值,進(jìn)而提高預(yù)測(cè)模型的訓(xùn)練效果以及求解精度。
特征提取是根據(jù)原始數(shù)據(jù)加工植入出一些具有實(shí)際意義的特征,目的是替代從原始數(shù)據(jù)中收獲有用的信息[11],以供算法和模型使用。光伏發(fā)電功率預(yù)測(cè)的精度與天氣情況有很大的關(guān)系,歷史數(shù)據(jù)特征提取的好壞會(huì)直接影響預(yù)測(cè)的精度,所以精準(zhǔn)的特征提取是使預(yù)測(cè)模型達(dá)到更好預(yù)測(cè)結(jié)果的前提,在預(yù)測(cè)環(huán)節(jié)中尤為重要。主成分分析法(PCA)僅僅需要考慮對(duì)特征值進(jìn)行分解,就可以對(duì)數(shù)據(jù)維度進(jìn)行精簡(jiǎn),達(dá)到特征提取的目的。
PCA的中心思想是:
1) 將數(shù)據(jù)降維。
2) 將原變量利用線性組合得到新變量。
3) 依據(jù)所得新變量的貢獻(xiàn)率,選擇出少數(shù)的主要成分。
PCA的主要優(yōu)點(diǎn)有:
1) 只需通過(guò)方差來(lái)權(quán)衡各個(gè)信息量的比重,不會(huì)受到數(shù)據(jù)集本身以外任何因素的影響。
2) 通過(guò)各主成分間正交的方法,從而使初始各成分不受彼此之間的影響。
3) 采用的主要運(yùn)算是特征分解,方法簡(jiǎn)單,易于實(shí)現(xiàn)。
本文針對(duì)全面復(fù)雜的天氣數(shù)據(jù)(其中包括云覆蓋、溫度、陣風(fēng)風(fēng)速、降水類型、降水強(qiáng)度以及降水概率等共計(jì)15項(xiàng))采用PCA技術(shù)進(jìn)行歷史數(shù)據(jù)的特征提取,作為后面BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型與FA-BP預(yù)測(cè)模型的輸入,利用PCA可以對(duì)歷史天氣數(shù)據(jù)進(jìn)行去噪與數(shù)據(jù)降維,即去除對(duì)光伏發(fā)電預(yù)測(cè)結(jié)果影響小的因素,提取對(duì)光伏發(fā)電預(yù)測(cè)結(jié)果的主要影響因素,使原始數(shù)據(jù)的維度得到有效的壓縮,使后述模型的求解速度顯著加快。
針對(duì)光伏發(fā)電預(yù)測(cè)非線性、特征參數(shù)較多等特點(diǎn),由于BP神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的學(xué)習(xí)以及映射擬合的能力,能夠很好地處理非線性以及復(fù)雜參數(shù)的問(wèn)題,于是采用構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型的方法對(duì)光伏發(fā)電進(jìn)行功率預(yù)測(cè)研究。就非線性系統(tǒng)而言,使用BP神經(jīng)網(wǎng)絡(luò)能夠很好地調(diào)整系統(tǒng)內(nèi)各神經(jīng)元之間的權(quán)重值。BP神經(jīng)網(wǎng)絡(luò)是一種能夠以樣本的輸入和目標(biāo)的輸出為依據(jù)來(lái)初始化其權(quán)值和閾值,并進(jìn)行網(wǎng)絡(luò)訓(xùn)練的多層前饋型神經(jīng)網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)模型的自身性能會(huì)隨著隱含層的增加而得到提高,但是同時(shí)網(wǎng)絡(luò)的規(guī)模會(huì)隨之變大,增強(qiáng)復(fù)雜性,增大計(jì)算量,減慢計(jì)算速度。經(jīng)理論研究表明,僅含有一個(gè)隱含層的神經(jīng)網(wǎng)絡(luò)可以逼近任意精度的連續(xù)函數(shù),因此本次研究采用3層的BP神經(jīng)網(wǎng)絡(luò)模型對(duì)光伏發(fā)電進(jìn)行預(yù)測(cè),BP神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)如圖1所示,BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)流程如圖2。
圖1 BP神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)Fig.1 BP neural network structure
BP神經(jīng)網(wǎng)絡(luò)的工作原理如下:
1) 權(quán)重和偏差值的隨機(jī)初始化,訓(xùn)練數(shù)據(jù)歸一化。
2) 使用以下公式計(jì)算每次迭代的輸出:
圖2 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)流程Fig.2 BP neural network prediction process
(1)
(2)
式中:ωbi為節(jié)點(diǎn)b到i的權(quán)重;yi為變換函數(shù)。根據(jù)上述兩個(gè)公式,能夠分析BP神經(jīng)網(wǎng)絡(luò)的輸出計(jì)算結(jié)果。xb由每個(gè)神經(jīng)元接收yi與權(quán)重ωbi產(chǎn)生,然后通過(guò)激勵(lì)函數(shù)產(chǎn)生yb,并將信號(hào)傳遞至下面一層的聯(lián)接神經(jīng)元,然后將結(jié)果依次輸出。
3) 計(jì)算誤差和權(quán)重更新,然后根據(jù)BP規(guī)則調(diào)整權(quán)重。
4) 不斷更新權(quán)重以及誤差,然后針對(duì)所有的訓(xùn)練數(shù)據(jù)重復(fù)第2步和第3步。
5) 重復(fù)第2步到第4步,直到誤差能夠達(dá)到合理的范圍。
隱含層中神經(jīng)元個(gè)數(shù)的改變會(huì)影響預(yù)測(cè)誤差以及網(wǎng)絡(luò)性能。計(jì)算最佳神經(jīng)元數(shù)量的公式如式(3):
(3)
式中:Hn為最佳神經(jīng)元數(shù)量;M和N分別為輸入和輸出參數(shù);而Tn為訓(xùn)練數(shù)據(jù)集的數(shù)量。
針對(duì)傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練效果欠佳和求解精度較低的問(wèn)題,提出一種FA-BP的預(yù)測(cè)模型對(duì)光伏發(fā)電進(jìn)行預(yù)測(cè),該模型的基礎(chǔ)結(jié)構(gòu)為BP神經(jīng)網(wǎng)絡(luò)模型,利用FA對(duì)基礎(chǔ)網(wǎng)絡(luò)模型的參數(shù)進(jìn)行優(yōu)化,進(jìn)而增強(qiáng)其訓(xùn)練效果,提高其預(yù)測(cè)精度。
盡管目前缺少嚴(yán)格的數(shù)學(xué)分析去證明螢火蟲(chóng)優(yōu)化算法的合理性,但是根據(jù)大量的實(shí)驗(yàn)以及與其他群智能優(yōu)化算法(粒子群、遺傳算法等)進(jìn)行分析與對(duì)比,能夠得出螢火蟲(chóng)優(yōu)化算法在尋優(yōu)速度和精度上表現(xiàn)出較高的性能[12]。
FA主要尋優(yōu)過(guò)程如下:
假設(shè)一個(gè)螢火蟲(chóng)的固定位置為X,同時(shí)該螢火蟲(chóng)的亮度可以表示為i(x)f(x),然而,吸引力β是相互作用的,即表示某個(gè)螢火蟲(chóng)對(duì)其他螢火蟲(chóng)的吸引程度,由此可知β會(huì)因螢火蟲(chóng)i與螢火蟲(chóng)j之間間隔大小rij的改變而改變[13]。其亮度會(huì)隨著兩者間隔距離的增大而降低,表明亮度在傳播過(guò)程中會(huì)受到介質(zhì)的影響,因此吸引力會(huì)隨著亮度的吸收程度的變化而改變。
由上述過(guò)程可得亮度公式為:
I=I0e-γr
(4)
式中:I0為開(kāi)始時(shí)的亮度;γ為光的吸收系數(shù);r為螢火蟲(chóng)之間的距離。
根據(jù)以上描述的過(guò)程和原理,可知個(gè)體吸引力與其他個(gè)體所能看到的亮度大小有關(guān),即可以將個(gè)體吸引力β定義為:
β=β0e-γr2
(5)
式中:β0為當(dāng)r=0時(shí)個(gè)體所具有的吸引力,此時(shí)最大,并且一般情況下取β0=1。
任意兩個(gè)個(gè)體xi和xj之間的距離大小rij可以表示為式(6):
(6)
位置更新公式為:
(7)
式中:ζi為服從高斯分布的變化量;α在0~1之間,為常數(shù)。因此當(dāng)β0=0時(shí),即個(gè)體周?chē)鸁o(wú)其他個(gè)體時(shí),其會(huì)進(jìn)行隨機(jī)移動(dòng)。
FA的基本步驟為:
1) 個(gè)體參數(shù)和位置的初始化;
2) 通過(guò)目標(biāo)函數(shù)求解個(gè)體適應(yīng)度值;
3) 螢火蟲(chóng)位置更新;
4) 螢火蟲(chóng)亮度更新;
5) 具有最高的亮度個(gè)體就是所要尋找的最優(yōu)個(gè)體;
6) 判別可否滿足結(jié)束的要求,如若滿足,流程結(jié)束;否則返回執(zhí)行步驟3)。
FA基本工作流程如圖3所示。
圖3 FA基本工作流程Fig.3 Basic process of FA algorithm
PCA-FA-BP模型的構(gòu)建思路是:首先,利用PCA技術(shù)對(duì)該模型所需的歷史數(shù)據(jù)進(jìn)行降維去噪。然后,根據(jù)本文的研究目的與方向,結(jié)合研究現(xiàn)狀,選擇和構(gòu)建所需的基礎(chǔ)預(yù)測(cè)模型,即3層的BP神經(jīng)網(wǎng)絡(luò)模型。最后,利用FA對(duì)BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值進(jìn)行優(yōu)化。
模型構(gòu)建的基本步驟如下:
1) 數(shù)據(jù)預(yù)處理。利用PCA技術(shù)對(duì)光伏發(fā)電歷史數(shù)據(jù)以及天氣數(shù)據(jù)進(jìn)行預(yù)處理。
2) 產(chǎn)生訓(xùn)練集/測(cè)試集。選取處理后數(shù)據(jù)中的前29 d(每天24 h)的數(shù)據(jù)作為預(yù)測(cè)模型的訓(xùn)練集,未來(lái)24 h的數(shù)據(jù)作為預(yù)測(cè)模型的測(cè)試集。
3) PCA-FA-BP神經(jīng)網(wǎng)絡(luò)。把經(jīng)過(guò)PCA處理后的訓(xùn)練集輸入到預(yù)測(cè)模型中,并進(jìn)行網(wǎng)絡(luò)訓(xùn)練,直至滿足訓(xùn)練要求停止。
4) 光伏發(fā)電功率預(yù)測(cè)。網(wǎng)絡(luò)訓(xùn)練完成后,即可得出根據(jù)相應(yīng)的天氣數(shù)據(jù)的光伏發(fā)電預(yù)測(cè)結(jié)果。
FA-BP預(yù)測(cè)流程如圖4所示。
圖4 FA-BP預(yù)測(cè)流程Fig.4 FA-BP forecasting process
本文以國(guó)外某地小型光伏發(fā)電站為研究對(duì)象,根據(jù)歷史天氣數(shù)據(jù)(每天24 h)以及對(duì)應(yīng)時(shí)刻的光伏發(fā)電量數(shù)據(jù)進(jìn)行未來(lái)24 h的短期光伏發(fā)電功率預(yù)測(cè),將云覆蓋、溫度、濕度、露點(diǎn)、紫外線強(qiáng)度、風(fēng)向、平均風(fēng)速、陣風(fēng)風(fēng)速、降水類型、降水強(qiáng)度、降水概率、臭氧含量、能見(jiàn)度以及日出與日落時(shí)間等15個(gè)原始變量數(shù)據(jù)作為模型的輸入,各時(shí)刻的光伏發(fā)電量為輸出,建立BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型和FA-BP預(yù)測(cè)模型,并采用PCA方法對(duì)輸入數(shù)據(jù)進(jìn)行降維處理,根據(jù)PCA方法中解釋程度(explained=78.984 1;6.996 3;5.010 6;5.004 6;4.003 2;6.159 4e-4;3.505 3e-4;8.173 1e-5;3.669 8e-5;1.455 9e-5;1.012 1e-5;5.134 9e-6;4.241 8e-6;2.618 9e-6;4.100 9e-9),可以看出前5個(gè)天氣因素(紫外線強(qiáng)度、溫度、日出時(shí)間、日落時(shí)間、云覆蓋率)能夠達(dá)到98%以上的解釋程度,即將原有的15維數(shù)據(jù)降到5維,然后分別建立PCA-BP預(yù)測(cè)模型以及PCA-FA-BP預(yù)測(cè)模型。
在光伏發(fā)電預(yù)測(cè)模型中選取2019年5月1日—29日的光伏發(fā)電數(shù)據(jù)以及對(duì)應(yīng)的天氣數(shù)據(jù),利用1日—29日的各項(xiàng)數(shù)據(jù)進(jìn)行訓(xùn)練,利用30日的各項(xiàng)數(shù)據(jù)進(jìn)行測(cè)試(FA的參數(shù)設(shè)置最大迭代次數(shù)為20,吸收系數(shù)為1)各種預(yù)測(cè)模型比較結(jié)果如圖5所示。
圖5為BP神經(jīng)網(wǎng)絡(luò)模型、PCA-BP模型、FA-BP模型以及PCA-FA-BP模型4種光伏發(fā)電預(yù)測(cè)結(jié)果。表1為4種預(yù)測(cè)方式比較結(jié)果,可以看出PCA-FA-BP光伏發(fā)電預(yù)測(cè)模型誤差明顯低于其他3種預(yù)測(cè)模型。由于將PCA技術(shù)引入到本次預(yù)測(cè)研究中,將原始多維數(shù)據(jù)的主要成分提取出來(lái),降低了數(shù)據(jù)的維度,去除了干擾項(xiàng),使輸入節(jié)點(diǎn)減少,收斂速度與FA-BP模型相比,得到了有效提到。
t/h圖5 各種預(yù)測(cè)模型比較結(jié)果Fig.5 Comparison results of various forecats
表1 4種預(yù)測(cè)方式結(jié)果比較Tab.1 Comparison of four forecasting methods
光伏發(fā)電的功率預(yù)測(cè)對(duì)新能源的開(kāi)發(fā)與利用,以及微電網(wǎng)的優(yōu)化調(diào)度等方面具有重要的工程意義。本次研究提出了一種基于PCA-FA-BP的光伏發(fā)電預(yù)測(cè)模型。通過(guò)仿真算例分析,PCA-FA-BP光伏發(fā)電預(yù)測(cè)模型分別與BP神經(jīng)網(wǎng)絡(luò)模型、PCA-BP模型以及FA-BP模型相比,精確度分別提高54.9%、45.8%和37.1%。由于PCA技術(shù)的引入,在預(yù)測(cè)時(shí)間上PCA-BP模型比BP神經(jīng)網(wǎng)絡(luò)模型減少1.3%;PCA-FA-BP模型比FA-BP模型減少25.9%。仿真結(jié)果表明PCA-FA-BP光伏發(fā)電預(yù)測(cè)模型擁有更佳的訓(xùn)練效果以及預(yù)測(cè)精度。