陳振祥 林培杰 程樹英 陳志聰 吳麗君
基于K-means++和混合深度學(xué)習(xí)的光伏功率預(yù)測
陳振祥 林培杰 程樹英 陳志聰 吳麗君
(福州大學(xué)物理與信息工程學(xué)院微納器件與太陽能電池研究所,福州 350116)
光伏發(fā)電輸出具有較強(qiáng)的波動性,影響電力系統(tǒng)的調(diào)度管理。對此,本文提出一種基于K-means++和混合卷積神經(jīng)網(wǎng)絡(luò)(CNN)與長短期記憶(LSTM)網(wǎng)絡(luò)的光伏功率預(yù)測模型。首先,利用K-means++對歷史數(shù)據(jù)集進(jìn)行分類,選取合適的數(shù)據(jù)集作為訓(xùn)練集;其次,搭建以歷史功率為輸入的LSTM模型獲得待修正預(yù)測功率值,采用卷積神經(jīng)網(wǎng)絡(luò)挖掘氣象參數(shù)與光伏功率的非線性關(guān)系,獲取修正系數(shù),對待修正預(yù)測功率值進(jìn)行修正,提高預(yù)測精度;最后,在點預(yù)測模型的基礎(chǔ)上,給予輸入?yún)?shù)一定的隨機(jī)波動,進(jìn)行多次預(yù)測,獲取預(yù)測誤差集,進(jìn)而獲得預(yù)測區(qū)間。通過澳大利亞沙漠太陽能研究中心光伏電站數(shù)據(jù)集,選擇LSTM、CNN-LSTM及K-LSTM算法進(jìn)行對比,驗證了本文方法具有較高的預(yù)測精度和穩(wěn)定性,且能實現(xiàn)準(zhǔn)確的輸出功率區(qū)間預(yù)測。
光伏功率預(yù)測;K-means聚類;卷積神經(jīng)網(wǎng)絡(luò);長短期記憶網(wǎng)絡(luò)
光伏發(fā)電因綠色環(huán)保、能源取之不盡的優(yōu)勢,得到世界各國的關(guān)注和推廣應(yīng)用。據(jù)國際能源機(jī)構(gòu)預(yù)測,到2030年,全球光伏發(fā)電容量的安裝量將超過1 700GW[1]。然而,天氣變化等因素使光伏發(fā)電表現(xiàn)出較強(qiáng)的間歇性和波動性,嚴(yán)重影響電力系統(tǒng)的管理調(diào)度[2]。因此,準(zhǔn)確預(yù)測光伏輸出功率,有利于電力系統(tǒng)運行和規(guī)劃,提高系統(tǒng)安全穩(wěn)定性[3]。
隨著不斷探索研究,國內(nèi)外在光伏功率預(yù)測領(lǐng)域已取得一定的成果。根據(jù)預(yù)測方法,可大致分為物理方法、統(tǒng)計方法及人工智能方法。物理方法基于物理方程實現(xiàn)預(yù)測,需要大量的傳感器獲取物理參數(shù),實際應(yīng)用受到一定限制。傳統(tǒng)的統(tǒng)計方法通過回歸分析等方法來映射發(fā)電量和歷史數(shù)據(jù)間的關(guān)系,但處理非線性數(shù)據(jù)效果不理想[4]。相比之下,人工智能技術(shù)具有處理復(fù)雜的非線性問題的能力和更強(qiáng)的容錯性[5]。長短期記憶(long short-term memory, LSTM)網(wǎng)絡(luò)優(yōu)越的時間序列問題處理能力,能很好地映射序列數(shù)據(jù)與目標(biāo)輸出之間的非線性關(guān)系[6]。光伏功率輸出具有很強(qiáng)的時間相關(guān)性,文獻(xiàn)[7]以歷史功率數(shù)據(jù)作為LSTM的輸入,簡單方便,獲得較好的預(yù)測效果。但氣象參數(shù)是光伏發(fā)電的直接影響因素,能直接體現(xiàn)光伏發(fā)電的變化性[8]。文獻(xiàn)[9]將相似時間段氣象參數(shù)結(jié)合歷史功率,利用LSTM模型進(jìn)行預(yù)測,進(jìn)一步提高了預(yù)測的準(zhǔn)確性。同時,數(shù)據(jù)的差異性也會影響預(yù)測模型的性能,K-means聚類能快速對數(shù)據(jù)集進(jìn)行分類,魯棒性強(qiáng),文獻(xiàn)[10]采用K-means對數(shù)據(jù)集進(jìn)行預(yù)先劃分,歷史功率結(jié)合氣象參數(shù)通過Elman神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測,提高了預(yù)測精度。此外,氣象因素間也具有關(guān)聯(lián)性,如從中提取價值信息,也可提高預(yù)測準(zhǔn)確度。文獻(xiàn)[11]采用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)獲取風(fēng)力和風(fēng)速間的相關(guān)性,提高了風(fēng)速預(yù)測的精度。CNN內(nèi)部采用局部連接和參數(shù)共享,具有強(qiáng)大的特征自提取能力,可充分提取輸入氣象參數(shù)間的相關(guān)性[12]。相比點預(yù)測,區(qū)間預(yù)測給出了未來時刻光伏功率輸出的預(yù)測誤差分布,包含更多信息,在實際應(yīng)用中,更符合電力系統(tǒng)的管理和調(diào)度需求。
因此,為結(jié)合歷史功率和氣象參數(shù)預(yù)測光伏功率的優(yōu)勢,提取氣象參數(shù)和輸出功率的非線性關(guān)系,本文提出一種混合聚類算法和深度學(xué)習(xí)的光伏功率預(yù)測方法。首先,利用K-means++對數(shù)據(jù)集進(jìn)行劃分,選擇合適的數(shù)據(jù)集作為訓(xùn)練集,搭建LSTM模型獲得待修正功率值,然后利用皮爾遜相關(guān)性分析選取關(guān)鍵氣象參數(shù),構(gòu)造二維氣象矩陣,結(jié)合CNN模型提取氣象因素的自相關(guān)性和互相關(guān)性,對待修正值進(jìn)行修正,提高預(yù)測精度;并且通過給予輸入?yún)?shù)一定的隨機(jī)波動,多次預(yù)測獲取誤差數(shù)據(jù)集,準(zhǔn)確地實現(xiàn)區(qū)間預(yù)測。此外,為了驗證算法的性能,選擇LSTM、CNN-LSTM及K-LSTM算法進(jìn)行對比。
K-means算法是典型的硬聚類算法,具有簡單、快速的特點。但是,標(biāo)準(zhǔn)的K-means依賴初始質(zhì)心的選取,不同選取方案的聚類結(jié)果有所區(qū)別。對此, D. Arthur等人提出改進(jìn)K-means,即K-means++,改進(jìn)初始質(zhì)心的選取方法,顯著改善聚類結(jié)果的最終誤差[13]。K-means++的實現(xiàn)過程如下:
1)隨機(jī)選取一個樣本作為第一個質(zhì)心1。
3)重復(fù)步驟2),直到選出個聚類質(zhì)心。
4)計算數(shù)據(jù)集中的每個樣本與個聚類質(zhì)心的距離,并將其劃分到距離最小的聚類質(zhì)心對應(yīng)的 簇中。
5)根據(jù)式(2)更新每個簇的質(zhì)心C。
6)重復(fù)步驟4)和步驟5),直到聚類質(zhì)心的位置不再改變。
在本文中,采用K-means++聚類算法將光伏電站的歷史功率數(shù)據(jù)集劃分為不同簇類,使得每個簇類具有獨特的功率特性,并作為預(yù)測模型的訓(xùn)練集,降低數(shù)據(jù)差異性的影響。聚類結(jié)果的好壞與樣本特征值的選取有關(guān),為進(jìn)一步提高數(shù)據(jù)集劃分效果,選取常用于序列分析的五項統(tǒng)計指標(biāo)(標(biāo)準(zhǔn)差、偏態(tài)系數(shù)k變異系數(shù)v、峰值系數(shù)ur及總功率sum),歸一化后作為樣本的特征值,其公式為[10]
式中:為每小時步長為5min的采樣點數(shù),=13;mean為小時平均光伏功率;P為每個時刻的光伏功率;min和max分別為指標(biāo)的最小值和最大值。式(8)為歸一化公式。
此外,在該算法中,值需預(yù)先給定,其在大多數(shù)情況下是難于估計的。本文采用輪廓系數(shù)來評價聚類效果,越趨近于1,說明聚類效果越優(yōu)。結(jié)合試錯法來選取合適的值,最終確定數(shù)據(jù)集劃分的類別數(shù)。輪廓系數(shù)計算公式為[14]
式中:()為簇內(nèi)不相似度,表示樣本到同簇類其他樣本的平均距離;()為簇間不相似度,表示樣本與其他簇類各樣本的最小平均距離。
已有大量研究將太陽輻射度及其他氣象參數(shù)作為模型輸入?yún)?shù),用于估算光伏功率輸出[15]。同時,預(yù)測模型的性能高度依賴模型輸入與輸出之間的關(guān)聯(lián)性。因此,研究氣象參數(shù)與光伏功率輸出之間的相關(guān)性,對光伏功率預(yù)測具有重要的意義。
本文采用澳大利亞沙漠太陽能研究中心(DKASC)的多變量氣象因素數(shù)據(jù)集,結(jié)合皮爾遜相關(guān)系數(shù)(Pearson correlation coefficient)分析法[16]分析各氣象因素與光伏輸出功率的相關(guān)性,選取關(guān)鍵氣象參數(shù)作為CNN修正模型的輸入。相關(guān)系數(shù)2計算公式為
式中:為采樣總數(shù);X為第時刻氣象參數(shù);mean為該氣象參數(shù)的平均值;Y為第時刻光伏輸出功率;mean為光伏輸出功率的平均值。
表1 氣象參數(shù)與光伏功率輸出相關(guān)性分析結(jié)果
不同的氣象參數(shù)不僅會影響光伏功率輸出,它們之間也會相互影響。表2為關(guān)鍵氣象參數(shù)之間的相關(guān)系數(shù)2。由表2可得,關(guān)鍵氣象參數(shù)之間呈現(xiàn)出較強(qiáng)的互相關(guān)性,共同作用于光伏功率輸出。將氣象參數(shù)的耦合性和關(guān)聯(lián)性納入模型中,可進(jìn)一步提高預(yù)測模型的性能。但是,一般的輸入方式很難挖掘其中的互相關(guān)性。為此,將每小時的關(guān)鍵氣象參數(shù)構(gòu)造成一個二維氣象矩陣(見圖1)作為輸入,直觀地表示序列數(shù)據(jù)特征,以便于CNN提取各氣象參數(shù)的自相關(guān)性和互相關(guān)性,進(jìn)而建立氣象參數(shù)與光伏輸出功率之間的非線性關(guān)系,提高預(yù)測的準(zhǔn)確性。
表2 關(guān)鍵氣象參數(shù)之間的相關(guān)系數(shù)R2
Schmidhuber等人提出LSTM,改進(jìn)了傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN),在網(wǎng)絡(luò)結(jié)構(gòu)中增加了對信息進(jìn)行分析處理的特殊單元(cell),解決傳統(tǒng)RNN無法處理長期依賴的問題,有效克服傳統(tǒng)RNN梯度消失和梯度爆炸問題[17]。
圖1 二維氣象矩陣
LSTM的結(jié)構(gòu)如圖2所示,每個cell由遺忘門、輸入門及輸出門構(gòu)成。遺忘門將上一隱藏層狀態(tài)值h?1和當(dāng)前輸入x拼接起來,通過sigmoid函數(shù)()決定丟棄哪些舊信息。輸入門和tanh層決定從h?1和x保留哪些新信息,結(jié)合遺忘門丟棄的信息,得到當(dāng)前的信息狀態(tài)C。輸出門結(jié)合tanh層決定h-1、x、C中哪些信息輸出作為當(dāng)前隱藏層狀態(tài)值h。遺忘門、輸入門、輸出門計算公式如下[9]。
遺忘門為
輸入門為
輸出門為
式中:、C、h分別為遺忘門、輸入門和輸出門的輸出;和為各個門的權(quán)重和偏置。
圖2 LSTM結(jié)構(gòu)
二維卷積神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于圖像和二維數(shù)據(jù)處理領(lǐng)域。通常,CNN基本結(jié)構(gòu)由卷積層、池化層及全連接層組成[18]。卷積層是CNN核心部分,通過內(nèi)部的卷積核在輸入圖或輸入矩陣上水平和垂直滑動,在卷積核的接受域內(nèi)計算卷積,提取相應(yīng)特征為特征圖。池化層對特征圖進(jìn)行特征降維,減少冗余信息,進(jìn)而提高網(wǎng)絡(luò)計算效率。全連接層通常位于CNN的最后一部分,對最終提取的大量特征進(jìn)行非線性組合,獲得目標(biāo)輸出。卷積層、池化層和全連接層計算式分別見式(17)~式(19)[18]。
車子嗚嗚發(fā)動。身側(cè)那人還是舉著盒子擋住劉雁衡,劉雁衡暗想,今天真是碰上怪事了,一瞥眼間,看到對方穿著一雙小巧的馬靴,這才放下心來,用右手食指在盒子上啪啪彈了兩下:“小姐,請開門?!?/p>
本文提出的預(yù)測方法中,采用LSTM和CNN的混合深度學(xué)習(xí)模型進(jìn)行光伏功率預(yù)測,混合深度學(xué)習(xí)模型結(jié)構(gòu)如圖3所示。LSTM模型針對光伏歷史功率獲取待修正值,CNN模型提取二維氣象矩陣中氣象參數(shù)的相關(guān)性特征,獲得修正權(quán)重和偏差對該值進(jìn)行修正,進(jìn)一步提高預(yù)測的準(zhǔn)確性。
圖3 混合深度學(xué)習(xí)模型結(jié)構(gòu)
CNN模型的結(jié)構(gòu)參數(shù)見表3。由于池化層在特征壓縮的過程中,會導(dǎo)致特征信息的遺失,且構(gòu)造的二維氣象矩陣尺寸較小,包含的氣象特征信息不足以造成特征冗余,因此提出的CNN模型采用無池化層模型。兩層的二維卷積神經(jīng)網(wǎng)絡(luò)提取氣象矩陣中有價值的特征信息,通過全連接層1和2對這些特征進(jìn)行整合映射,輸出兩個修正參數(shù)和。
表3 CNN模型結(jié)構(gòu)參數(shù)
綜合LSTM模型的待修正值和CNN模型修正,最終獲得的光伏預(yù)測功率為
傳統(tǒng)的區(qū)間預(yù)測使用參數(shù)估計方法,參數(shù)估計的前提是假設(shè)概率密度函數(shù)是已知的,而光伏發(fā)電具有較強(qiáng)的不確定性,輸出功率無法滿足特定的分布,因此使用參數(shù)估計方法進(jìn)行光伏功率區(qū)間預(yù)測效果是不理想的。已有大量研究通過Bootstrap自舉算法,結(jié)合神經(jīng)網(wǎng)絡(luò)搭建多個模型實現(xiàn)區(qū)間預(yù)測,但搭建多個預(yù)測模型增加了模型的復(fù)雜度[19]。本文在深度學(xué)習(xí)網(wǎng)絡(luò)的基礎(chǔ)上,在預(yù)測過程中給予輸入?yún)?shù)50次一定的隨機(jī)波動,獲得50個波動數(shù)據(jù)樣本,進(jìn)行預(yù)測以得到預(yù)測誤差數(shù)據(jù)集,根據(jù)誤差數(shù)據(jù)集計算預(yù)測均值和標(biāo)準(zhǔn)誤差,得到光伏功率的預(yù)測區(qū)間。
所提光伏功率預(yù)測方法實施流程如圖4所示:①對數(shù)據(jù)集進(jìn)行預(yù)處理,包括異常數(shù)據(jù)、夜間發(fā)電無效數(shù)據(jù)的清洗及歸一化處理;②通過K-means++對數(shù)據(jù)集進(jìn)行劃分,根據(jù)待測時刻前1h的功率選取相應(yīng)的數(shù)據(jù)集作為訓(xùn)練集;③選定關(guān)鍵氣象參數(shù),構(gòu)造二維氣象矩陣作為CNN模型的輸入;④搭建LSTM模型和CNN修正模型,根據(jù)訓(xùn)練集進(jìn)行訓(xùn)練獲得預(yù)測模型,將待測時刻前1h的功率和氣象參數(shù)輸入到預(yù)測模型中,獲得功率點預(yù)測輸出,并給予輸入?yún)?shù)一定的隨機(jī)波動,獲得波動數(shù)據(jù)樣本,進(jìn)行預(yù)測獲得預(yù)測誤差數(shù)據(jù)集,據(jù)此得到預(yù)測區(qū)間。
圖4 所提光伏功率預(yù)測方法實施流程
本文選擇DKASC的Yulara太陽能系統(tǒng)電站4從2017年1月1日到2018年12月30日的多元氣象數(shù)據(jù)集和歷史功率數(shù)據(jù)集驗證所提預(yù)測模型的可行性,訓(xùn)練集和測試集比例為7:3。同時,與未使用K-means++的LSTM模型、CNN-LSTM模型及未使用CNN修正的K-LSTM模型進(jìn)行比較,驗證所提方法的性能。
使用試錯法選取合適的聚類值,不同值的輪廓系數(shù)見表4??梢钥闯?,值為2時,對應(yīng)的輪廓系數(shù)取得最大值,因此所提方法中的值取2。
表4 不同k值的輪廓系數(shù)
隨機(jī)選取測試集中四天從7:00~18:00進(jìn)行驗證。預(yù)測結(jié)果和預(yù)測標(biāo)準(zhǔn)誤差分別如圖5和圖6所示。從圖5可看出,K-CNN-LSTM和K-LSTM的預(yù)測結(jié)果均比未使用K-means++的模型(CNN-LSTM、LSTM)更接近實際功率,尤其是在功率曲線波動性較大的情況下。從圖6可得出,使用CNN模型對LSTM模型的待修正值進(jìn)行修正,預(yù)測結(jié)果的誤差比K-LSTM波動更小,更為穩(wěn)定。采用平均絕對誤差(MAE)、方均根誤差(RMSE)指標(biāo)評估模型的性能,表5為四天7:00~18:00各個模型的平均評價指標(biāo)值。所提方法的平均MAE和RMSE分別為3.861 5kW和5.481 1kW,由表5可得,與未使用K-means++和CNN模型修正的模型相比,所提方法的預(yù)測精度得到提升。使用K- means++對數(shù)據(jù)集進(jìn)行劃分,利用同一種類型數(shù)據(jù)訓(xùn)練模型,減少數(shù)據(jù)之間差異性對模型性能的影響,提高了預(yù)測的準(zhǔn)確性。盡管歷史功率數(shù)據(jù)中隱藏著光伏發(fā)電的規(guī)律性和序列相關(guān)性,但氣象參數(shù)的變化更能夠直接反映光伏發(fā)電的變化,這種變化關(guān)系經(jīng)過CNN處理,提取特征反映到功率數(shù)據(jù)中,結(jié)合兩者的優(yōu)勢,提高了模型的預(yù)測精度和穩(wěn)定性。
為進(jìn)一步驗證模型的適用性,對上述四天進(jìn)行2h和3h預(yù)測,預(yù)測結(jié)果如圖7所示。從圖7可看出,在實際功率發(fā)生突變和波動幅度較大時,預(yù)測具有一定的偏差。發(fā)生突變時,天氣的不確定性變大,捕獲實際天氣變化難度加大,導(dǎo)致預(yù)測誤差增大。而當(dāng)實際功率波動較平緩時,預(yù)測曲線能較好地擬合實際功率。因此,除天氣變化較為劇烈外,本文提出的方法能夠較好實現(xiàn)2h和3h預(yù)測輸出。
圖5 預(yù)測結(jié)果
圖6 預(yù)測標(biāo)準(zhǔn)誤差
表5 各模型的平均評價指標(biāo)值
圖7 2h和3h預(yù)測結(jié)果
區(qū)間預(yù)測結(jié)果如圖8所示,采用區(qū)間覆蓋率(PI coverage probability, PICP)和平均區(qū)間寬度目標(biāo)值范圍百分比(PI normalized average width, PINAW)評估區(qū)間預(yù)測的效果。四天的平均PICP為0.855 3,平均PINWA為0.499 3,說明預(yù)測區(qū)間在較好地覆蓋真實功率的同時,區(qū)間寬度較窄。因此,在深度學(xué)習(xí)模型的基礎(chǔ)上,給予輸入?yún)?shù)隨機(jī)波動,獲得預(yù)測誤差集進(jìn)行區(qū)間預(yù)測效果較好。
圖8 區(qū)間預(yù)測結(jié)果
本文提出和驗證了基于K-means++和混合深度學(xué)習(xí)的光伏功率預(yù)測模型:①通過K-means++將數(shù)據(jù)集劃分為不同類別,根據(jù)待測時刻前1h功率選取合適的數(shù)據(jù)集作為模型的訓(xùn)練集,減小數(shù)據(jù)差異性對模型性能的影響;②通過LSTM模型處理歷史功率序列,獲得待修正功率值,根據(jù)皮爾遜相關(guān)性分析選取關(guān)鍵氣象參數(shù),構(gòu)造二維氣象矩陣,便于CNN提取氣象參數(shù)的相關(guān)特征,挖掘氣象參數(shù)與光伏功率的非線性關(guān)系,獲得修正參數(shù),對待修正功率值進(jìn)行修正,進(jìn)一步提高預(yù)測準(zhǔn)確度;③通過給予輸入?yún)?shù)多次隨機(jī)波動,獲得波動數(shù)據(jù)樣本,進(jìn)而獲得預(yù)測誤差數(shù)據(jù)集,計算預(yù)測區(qū)間。通過DKASC電站4的數(shù)據(jù)集進(jìn)行模型性能驗證,所提模型的平均MAE和RMSE分別為3.861 5kW和5.481 1kW,同時進(jìn)行2h和3h預(yù)測,驗證了方法的適用性。與LSTM、CNN-LSTM及K-LSTM模型相比,所提的K-CNN-LSTM模型預(yù)測精度和穩(wěn)定性更高,且準(zhǔn)確地實現(xiàn)了區(qū)間預(yù)測。
[1] CHOUDHARY P, SRIVASTAVA R K. Sustainability perspectives-a review for solar photovoltaic trends and growth opportunities[J]. Journal of Cleaner Production, 2019, 227: 589-612.
[2] 彭周寧, 林培杰, 賴云鋒, 等. 基于混合灰色關(guān)聯(lián)分析-廣義回歸神經(jīng)網(wǎng)絡(luò)的光伏電站短期功率預(yù)測[J]. 電氣技術(shù), 2019, 20(10): 11-18.
[3] 姜雲(yún)騰, 李萍. 基于改進(jìn)粒子群神經(jīng)網(wǎng)絡(luò)短期負(fù)荷預(yù)測[J]. 電氣技術(shù), 2018, 19(2): 87-91.
[4] 龔鶯飛, 魯宗相, 喬穎, 等. 光伏功率預(yù)測技術(shù)[J]. 電力系統(tǒng)自動化, 2016, 40(4):140-151.
[5] 李安壽, 陳琦, 王子才, 等. 光伏發(fā)電系統(tǒng)功率預(yù)測方法綜述[J]. 電氣傳動, 2016, 46(6): 93-96.
[6] 田劍剛, 張沛, 彭春華, 等. 基于分時長短期記憶神經(jīng)網(wǎng)絡(luò)的光伏發(fā)電超短期功率預(yù)測[J]. 現(xiàn)代電力, 2020, 37(6): 629-638.
[7] 黃亞峰, 何威, 吳光琴, 等. 基于K-means++和LSTM網(wǎng)絡(luò)的光伏功率預(yù)測研究[J]. 電氣自動化, 2020, 42(5): 25-27.
[8] 王仕俊, 平常, 薛國斌, 等. 影響光伏功率輸出因素的研究與分析[J]. 電氣技術(shù), 2018, 19(8): 68-71.
[9] CHEN Biaowei, LIN Peijie, LIN Yaohai, et al. Hour- ahead photovoltaic power forecast using a hybrid GRA-LSTM model based on multivariate meteoro- logical factors and historical power datasets[C]//IOP Conference Series: Earth and Environmental Science, 2020, 431: 012059.
[10] LIN Peijie, PENG Zhouning, LAI Yunfeng, et al. Short-term power prediction for photovoltaic power plants using a hybrid improved Kmeans-GRA-Elman model based on multivariate meteorological factors and historical power datasets[J]. Energy Conversion and Management, 2018, 177: 704-717.
[11] 王晨, 寇鵬. 基于卷積神經(jīng)網(wǎng)絡(luò)和簡單循環(huán)單元集成模型的風(fēng)電場內(nèi)多風(fēng)機(jī)風(fēng)速預(yù)測[J]. 電工技術(shù)學(xué)報, 2020, 35(13): 2723-2735.
[12] AJIT A, ACHARYA K, SAMANTA A. A review of convolutional neural networks[C]//International Con- ference on Emerging Trends in Information Techno- logy and Engineering, 2020, 10: 1-5.
[13] ARTHUR D, VASSILVITSKII S. K-means++: the advantages of careful seeding[C]//Eighteenth Acm- Siam Symposium on Discrete Algorithms, New Orleans, Louisiana, 2007: 1027-1035.
[14] BAE K Y, JANG H S, SUNG D K. Hourly solar irradiance prediction based on support vector machine and its error analysis[J]. IEEE Transactions on Power Systems, 2017, 32(2): 935-945.
[15] 賴昌偉, 黎靜華, 陳博, 等. 光伏發(fā)電出力預(yù)測技術(shù)研究綜述[J]. 電工技術(shù)學(xué)報, 2019, 34(6): 1201-1217.
[16] XIONG Rui, LI Linlin, TIAN Jinpeng. Towards a smarter battery management system: a critical review on battery state of health monitoring methods[J]. Journal of Power Sources, 2018, 405: 18-29.
[17] HOCHREITER S, SCHMIDHUBER J. Long short- term memory[J]. Neural Computation, 1997, 9(8): 1735-1780.
[18] 李彥冬, 郝宗波, 雷航. 卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 計算機(jī)應(yīng)用, 2016, 36(9): 2508-2515.
[19] 薛陽, 張寧, 俞志程, 等. 基于BiLSTM和Bootstrap方法的風(fēng)電功率區(qū)間預(yù)測[J]. 可再生能源, 2020, 38(8): 1059-1064.
Photovoltaic power prediction based on K-means++ and hybrid deep learning
CHEN Zhenxiang LIN Peijie CHENG Shuying CHEN Zhicong WU Lijun
(Institute of Micro-Nano Devices and Solar Cells, College of Physics and Information Engineering, Fuzhou University, Fuzhou 350116)
The output of photovoltaic power generation shows strong volatility, which affects the dispatching management of power system. In this paper, a photovoltaic power prediction model using the hybrid of K-means++ and convolutional neural network and long short-term memory network (K- CNN-LSTM) is proposed. Firstly, the historical data set is classified by K-means++, then the appropriate data set is selected as the training set. Secondly, the LSTM prediction model with historical power as input is built to obtain the predicted power value to be modified. Then, the nonlinear relationship between meteorological parameters and photovoltaic power is mined by CNN, which is applied to obtain the correction coefficient for predicted power to improve the prediction accuracy. Finally, the random fluctuation of the input parameters is predicted for multiple times based on the point prediction model and the prediction error set is obtained to achieve interval prediction. Through the data set of photo- voltaic power station of Australian Desert Knowledge Solar Energy Center (DKASC), LSTM, CNN- LSTM and K-LSTM algorithms are selected for comparison. The results demonstrate that this method has high prediction accuracy and stability, and also achieves accurate output power interval prediction.
photovoltaic power prediction; K-means clustering; convolutional neural network (CNN); long short-term memory (LSTM) network
2021-01-19
2021-02-07
陳振祥(1995—),男,福建省泉州市人,碩士研究生,主要從事光伏電站發(fā)電功率預(yù)測工作。