馮裕祺,李輝,2,李利娟,周彥博,譚貌,彭寒梅
(1.湘潭大學(xué) 自動(dòng)化與電子信息學(xué)院,湖南 湘潭 411105;2.湘潭大學(xué) 多能協(xié)同控制技術(shù)湖南省工程研究中心,湖南 湘潭 411105)
隨著光伏等可再生能源并網(wǎng)容量的不斷攀升,它對配電網(wǎng)電能質(zhì)量可能產(chǎn)生的影響也激起了人們的廣泛關(guān)注。光伏電站由于出力間歇性和隨機(jī)性,會(huì)產(chǎn)生電壓波動(dòng)、閃變等電能質(zhì)量問題,電壓質(zhì)量作為電能質(zhì)量指標(biāo)之一,其好壞會(huì)直接影響配電網(wǎng)的安全穩(wěn)定運(yùn)行[1-2]。因此,通過挖掘光伏電站電壓質(zhì)量的歷史數(shù)據(jù)信息提前預(yù)測電壓變化趨勢,為電壓質(zhì)量的治理預(yù)留出一定時(shí)間,極大降低光伏電站電壓波動(dòng)對配電網(wǎng)產(chǎn)生的影響,成為可再生能源并網(wǎng)可靠運(yùn)行的關(guān)鍵技術(shù)之一[3-4]。
傳統(tǒng)預(yù)測方法主要是以累積式自回歸移動(dòng)平均模型(autoregressive integrated moving average model,ARIMA)[5]為代表的時(shí)間序列預(yù)測法和以支持向量回歸(support vector regression,SVR)[6]為代表的人工智能方法等。文獻(xiàn)[7]提出了一種結(jié)合線性回歸模型、隨機(jī)時(shí)間序列模型和灰色模型的電壓質(zhì)量組合預(yù)測模型,采用方差-協(xié)方差方法組合3種模型的預(yù)測結(jié)果。文獻(xiàn)[8]利用混沌理論對歷史數(shù)據(jù)進(jìn)行相空間重構(gòu),提出一種基于混沌理論和最小二乘支持向量機(jī)的電壓偏差預(yù)測模型。文獻(xiàn)[9]定義了3個(gè)不同的標(biāo)準(zhǔn)來評價(jià)所有電能質(zhì)量參數(shù)組合的預(yù)測模型的性能,并采用隨機(jī)森林模型進(jìn)行電壓質(zhì)量預(yù)測。但文獻(xiàn)[7-8]未對與電壓質(zhì)量變化相關(guān)的變量進(jìn)行分析,電壓質(zhì)量的變化不僅與其自身歷史數(shù)據(jù)相關(guān),還可能與外部環(huán)境因素變量相關(guān)。文獻(xiàn)[9]雖考慮了電壓質(zhì)量與其他變量之間的關(guān)系,但未進(jìn)行特征篩選,特征維數(shù)較高導(dǎo)致訓(xùn)練模型復(fù)雜度變高且泛化能力較差。文獻(xiàn)[10]采用Relief算法進(jìn)行輸入特征的相關(guān)性理解及篩選,然后利用灰色關(guān)聯(lián)分析將Elman神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林和RBF-SVM模型組合完成電壓偏差預(yù)測,結(jié)果優(yōu)于未進(jìn)行特征相關(guān)性理解及篩選的方法。
近年來,隨著深度學(xué)習(xí)的快速發(fā)展,各種深度神經(jīng)網(wǎng)絡(luò)被用于時(shí)間序列預(yù)測,如卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)[11]、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)[12-13]、長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)[14-15]等,并在負(fù)荷和功率預(yù)測領(lǐng)域取得了不錯(cuò)的效果。文獻(xiàn)[16]提出一種以極端梯度提升和LSTM作為基學(xué)習(xí)器的Stacking集成學(xué)習(xí)模型用于負(fù)荷預(yù)測,結(jié)果優(yōu)于傳統(tǒng)支持向量機(jī)模型。文獻(xiàn)[17]提出一種基于CNN-LSTM的短期風(fēng)電功率預(yù)測方法,先利用CNN提取輸入數(shù)據(jù)的高層特征再通過LSTM網(wǎng)絡(luò)完成預(yù)測,相比未經(jīng)高層特征提取單一LSTM模型誤差更小。對于電壓質(zhì)量預(yù)測,文獻(xiàn)[18]提出一種基于K-means聚類和LSTM的主動(dòng)配電網(wǎng)電壓偏差預(yù)測方法,相較于ARIMA和BP模型誤差更低。文獻(xiàn)[19]提出一種基于動(dòng)態(tài)時(shí)間規(guī)整算法相關(guān)性測度和LSTM的穩(wěn)態(tài)電壓質(zhì)量預(yù)測模型,預(yù)測精度高于單輸入量模型。但LSTM也存在模型參數(shù)較多、訓(xùn)練速度較慢的問題[20-21],門控循環(huán)單元(gated recurrent unit,GRU)作為RNN的一種變體,是LSTM的改進(jìn)版本,相比LSTM的輸入門、輸出門、遺忘門3個(gè)門結(jié)構(gòu),GRU只有更新門和重置門,在保證預(yù)測精度的同時(shí)模型參數(shù)更少,訓(xùn)練速度更快,在時(shí)效性要求較高的場合更有優(yōu)勢[22]。文獻(xiàn)[23]提出一種基于GRU-NN模型的短期電力負(fù)荷預(yù)測方法,結(jié)果表明,GRU模型相比LSTM模型在預(yù)測誤差接近的同時(shí)訓(xùn)練耗時(shí)有明顯的降低。
綜上所述,本文提出一種基于CNN-GRU的電壓軌跡預(yù)測方法。首先,通過計(jì)算自相關(guān)系數(shù)和最大信息系數(shù)(maximal information coefficient,MIC)進(jìn)行電壓相關(guān)性理解,確定電壓數(shù)據(jù)在時(shí)序上的關(guān)聯(lián)程度及其與外部因素變量的相關(guān)性。然后,利用CNN提取輸入數(shù)據(jù)中的高層特征。最后,輸入至雙層GRU網(wǎng)絡(luò)完成模型訓(xùn)練。本文所提方法在時(shí)效性較高的同時(shí)有效解決了海量數(shù)據(jù)高層特征提取困難及模型學(xué)習(xí)長期信息易出現(xiàn)梯度消失的問題,具有更高的預(yù)測精度,通過某地光伏電站實(shí)測數(shù)據(jù)驗(yàn)證了方法的優(yōu)越性。
電壓趨勢預(yù)測分為電壓要素提取、電壓趨勢理解和電壓軌跡預(yù)測3個(gè)階段,其架構(gòu)如圖1所示。
圖1 電壓趨勢預(yù)測架構(gòu)Fig.1 Voltage trend prediction architecture
電壓要素提取是指在動(dòng)態(tài)環(huán)境中,面向光伏電站端實(shí)現(xiàn)狀態(tài)信息采集,包括實(shí)時(shí)電壓數(shù)據(jù)、動(dòng)態(tài)環(huán)境信息等,以此信息構(gòu)建時(shí)間序列,是實(shí)現(xiàn)電壓趨勢預(yù)測的數(shù)據(jù)基礎(chǔ)。
電壓趨勢理解是指基于計(jì)算機(jī)系統(tǒng)管理平臺(tái),針對電壓要素提取所提供的數(shù)據(jù)信息中隱含的相關(guān)性關(guān)系、數(shù)據(jù)特殊性進(jìn)行深度挖掘,充分理解電壓變化規(guī)律,是對提取信息的深度理解。
電壓軌跡預(yù)測是指通過智能算法學(xué)習(xí)經(jīng)趨勢理解后的數(shù)據(jù)高層特征,挖掘長時(shí)間序列前后關(guān)系,實(shí)現(xiàn)電壓未來變化軌跡預(yù)測。
1.2.1 電壓自相關(guān)性理解
電壓數(shù)據(jù)作為一種時(shí)序數(shù)據(jù),首先需要分析其在時(shí)序上的相關(guān)性,以提供軌跡預(yù)測模型的輸入時(shí)間步長。自相關(guān)系數(shù)C(p)可以度量在2個(gè)不同時(shí)間點(diǎn)的電壓時(shí)序數(shù)據(jù)相關(guān)程度。C(p)的取值范圍為[–1,1],若C(p)>0,則兩電壓時(shí)序數(shù)據(jù)正相關(guān),反之則負(fù)相關(guān);|C(p)|越大,相關(guān)程度越高。其計(jì)算公式為
式中:p為滯后時(shí)間點(diǎn);vt為時(shí)刻t的電壓值;vt+p為時(shí)刻t+p的電壓值 ;為整個(gè)電壓序列均值;m為總時(shí)刻。
1.2.2 變量相關(guān)性理解
光伏電站的電壓變化可能與多種影響因素有關(guān),為充分考慮其他變量因素的影響,指導(dǎo)軌跡預(yù)測模型輸入維度選取,提升預(yù)測精度,需進(jìn)行變量相關(guān)性理解。目前多數(shù)文獻(xiàn)中都是采用Pearson、Spearman等線性相關(guān)性理解方法,未考慮變量因素間的非線性關(guān)系,可能導(dǎo)致模型輸入維度冗余或缺失[24]。最大互信息系數(shù)(maximal information coefficient,MIC)是一種優(yōu)秀的變量關(guān)聯(lián)性計(jì)算方式,用于衡量2個(gè)變量之間的線性及非線性關(guān)聯(lián)強(qiáng)度。MIC的基本思想是:如果變量之間存在相關(guān)性,可以在2個(gè)變量的散點(diǎn)圖上畫一個(gè)網(wǎng)格來劃分和封裝它們之間的相關(guān)性,MIC 通過互信息(mutual information,MI)和網(wǎng)格劃分方法計(jì)算[25]。給定2個(gè)具有離散值的隨機(jī)變量x={xi,i=1,2,···,n}和y={yi,i=1,2,···,n}, 其中n是這些變量中元素的數(shù)量,互信息I(x,y)被定義為
式中:p(x,y)為變量x和y之間的聯(lián)合概率。
對互信息進(jìn)行標(biāo)準(zhǔn)化,求出最大信息系數(shù)(MIC)CMI(x,y)為
式中:a、b分別為在x、y軸方向上劃分格子的數(shù)目;B(n)為劃分網(wǎng)格數(shù)目上限值,一般為數(shù)據(jù)量n的0.6次方左右。CMI取值區(qū)間為[0, 1],其值越大,兩變量間的相關(guān)性就越強(qiáng)。
1.2.3 數(shù)據(jù)預(yù)處理
在通過相關(guān)性理解得出數(shù)據(jù)輸入維度之后,由于不同維度數(shù)據(jù)之間的量綱和數(shù)量級不一樣,直接將其輸入模型會(huì)導(dǎo)致某些維度數(shù)據(jù)在模型訓(xùn)練中貢獻(xiàn)度過大,且在訓(xùn)練迭代的過程中可能導(dǎo)致計(jì)算溢出[26],因此有必要對這些數(shù)據(jù)進(jìn)行數(shù)據(jù)歸一化處理,即
1.2.4 評價(jià)指標(biāo)選取
本文選取2個(gè)預(yù)測評價(jià)指標(biāo)評估模型的精度,分別是平均絕對誤差(MAE)EMA和均方根誤差(RMSE)ERMS,計(jì)算公式分別為
式中:N為測試集樣本總數(shù);為預(yù)測日第i個(gè)時(shí)間點(diǎn)的電壓實(shí)際值;為預(yù)測日第i個(gè)時(shí)間點(diǎn)的電壓預(yù)測值。
1.3.1 CNN 模型
CNN對網(wǎng)格數(shù)據(jù)具有強(qiáng)大的處理能力,廣泛應(yīng)用于圖像分析任務(wù)中,其主要結(jié)構(gòu)為卷積層和池化層。卷積操作是以指定數(shù)量、窗口大小的卷積核沿?cái)?shù)據(jù)窗口進(jìn)行逐步滑動(dòng)做張量積的運(yùn)算,最大池化操作是從輸入數(shù)據(jù)中提取給定大小的窗口,輸出窗口的最大值。CNN通過卷積層和池化層中的特征變換和提取對輸入層的數(shù)據(jù)進(jìn)行計(jì)算,得到輸入數(shù)據(jù)的高層特征,全連接層將經(jīng)過池化計(jì)算的特征進(jìn)一步整合,并映射到輸出層輸出信息。CNN基本結(jié)構(gòu)如圖2所示。
圖2 CNN基本結(jié)構(gòu)Fig.2 Basic structure of CNN
1.3.2 GRU 模型
GRU模型是LSTM模型的一種高級變體,LSTM結(jié)構(gòu)包括輸入門、輸出門和遺忘門,而GRU只有重置門和更新門2個(gè)門,它將LSTM的輸入門和遺忘門合并到了更新門。因?yàn)槭褂玫拈T結(jié)構(gòu)更少,GRU參數(shù)更少,計(jì)算過程簡化,相比LSTM在模型訓(xùn)練的過程中效率更高。LSTM及GRU單元結(jié)構(gòu)如圖3所示,GRU計(jì)算過程為
圖3 LSTM和GRU單元結(jié)構(gòu)Fig.3 Unit structures of LSTM and GRU
式中:rt為重置門;zt為更新門;xt為輸入信息;ht?1為前一時(shí)刻隱藏層狀態(tài); σ 為sigmoid激活函數(shù);f為 ta nh 激活函數(shù);為輸入xt和上一隱藏層狀態(tài)ht?1的復(fù)合運(yùn)算得到的候選狀態(tài);ht為隱藏層輸出數(shù)據(jù);Wr、Ur、Wz、Uz、Wh、Uh為對應(yīng)門和候選集的權(quán)重矩陣; ⊙ 表示點(diǎn)乘運(yùn)算。
1.3.3 CNN-GRU 融合模型
本文所提CNN-GRU融合模型如圖4所示,首先通過一維卷積(Conv1 D)和最大池化(MaxPooling1 D)層完成輸入數(shù)據(jù)的高層特征提取,然后輸入至GRU網(wǎng)絡(luò)層完成訓(xùn)練并預(yù)測,再通過扁平化層(Flatten)把GRU輸出的三維數(shù)據(jù)壓縮成二維數(shù)據(jù),最后通過全連接層(Dense)輸出預(yù)測數(shù)據(jù)。
圖4 CNN-GRU融合模型結(jié)構(gòu)Fig.4 Structure of CNN-GRU fusion model
針對光伏電站出力間歇性和不確定性易引發(fā)并網(wǎng)點(diǎn)電壓大幅波動(dòng)的問題,考慮將CNN的高層特征提取能力和GRU學(xué)習(xí)長時(shí)序數(shù)據(jù)前后信息能力結(jié)合起來,提出一種CNN-GRU融合模型。模型將高層特征提取和時(shí)間序列預(yù)測2個(gè)任務(wù)進(jìn)行解耦,以期實(shí)現(xiàn)對并網(wǎng)點(diǎn)電壓大幅波動(dòng)情形下的高效處理和準(zhǔn)確預(yù)測,模型在電壓趨勢預(yù)測場景下的預(yù)測流程如圖5所示。
圖5 預(yù)測流程Fig.5 Prediction flowchart
為驗(yàn)證本文所提方法的有效性,以澳大利亞DKA光伏電站2020年1月1日—6月11日的實(shí)測數(shù)據(jù)進(jìn)行實(shí)驗(yàn),包括電壓、太陽輻照度、溫度、相對濕度、有功功率、風(fēng)速、降雨量等。其中,1月1日—5月11日的38 016條數(shù)據(jù)用于訓(xùn)練,5月12日—6月11日的8 928條數(shù)據(jù)用于測試,共46 944條數(shù)據(jù),數(shù)據(jù)間隔時(shí)間為5 min,電壓時(shí)間序列如圖6所示。
圖6 電壓時(shí)間序列Fig.6 Time series of voltage
實(shí)驗(yàn)硬件環(huán)境為 Intel i5-6500 處理器,8 GB 內(nèi)存, NVIDIA GTX750 ti顯卡。軟件環(huán)境為 Visual Studio Code,采用Python語言編寫程序,以Tensorflow為后端的高級API接口Keras搭建神經(jīng)網(wǎng)絡(luò)模型。
CNN-GRU模型設(shè)計(jì)包括CNN層數(shù)、卷積核數(shù)目和大小、GRU層數(shù)、GRU隱藏神經(jīng)元數(shù)目等參數(shù)的確定。初始化CNN-GRU模型參數(shù)設(shè)置為:一層Conv1 D層,卷積核數(shù)目為16,大小為2,一層GRU網(wǎng)絡(luò),神經(jīng)元數(shù)目為40。實(shí)驗(yàn)中先不變動(dòng)GRU模塊的參數(shù)進(jìn)行預(yù)測,計(jì)算CNN層數(shù)、卷積核數(shù)目和大小變動(dòng)后的MAE和RMSE,確定預(yù)測誤差最低的CNN模塊參數(shù);然后CNN模塊參數(shù)不變動(dòng)進(jìn)行預(yù)測,計(jì)算GRU層數(shù)和神經(jīng)元數(shù)目變動(dòng)后的MAE和RMSE,最后得到最優(yōu)的CNN-GRU模型結(jié)構(gòu)參數(shù)。根據(jù)模型訓(xùn)練時(shí)的收斂情況確定實(shí)驗(yàn)中模型迭代次數(shù)epochs均為55次,實(shí)驗(yàn)結(jié)果如表1、表2所示。
表1 CNN模塊參數(shù)設(shè)計(jì)結(jié)果對比Table 1 Design result comparison of CNN module parameters
表2 GRU模塊參數(shù)設(shè)計(jì)結(jié)果對比Table 2 Design result comparison of GRU module parameters
由表1、表2可知,最優(yōu)的CNN-GRU模型結(jié)構(gòu)參數(shù)為:CNN為兩層Conv1 D層,第一層卷積核數(shù)為16,大小為3,第二層卷積核數(shù)為32,大小為3,其后連接MaxPooling1 D層;GRU層數(shù)為兩層,神經(jīng)元數(shù)分別為40、80。
3.3.1 自相關(guān)性理解結(jié)果分析
電壓數(shù)據(jù)作為一種時(shí)序數(shù)據(jù),通過分析其自相關(guān)性能夠指導(dǎo)模型的最佳輸入步長選擇,電壓自相關(guān)系數(shù)如圖7所示。
圖7 電壓自相關(guān)系數(shù)曲線Fig.7 Curve of voltage autocorrelation coefficient
從圖7可以看出,自相關(guān)程度高的電壓時(shí)間序列主要集中在滯后時(shí)間較短的區(qū)間,且越靠近當(dāng)前時(shí)刻自相關(guān)程度越高,因此考慮將當(dāng)前時(shí)刻前幾十分鐘內(nèi)的真實(shí)電壓數(shù)據(jù)作為輸入。通過枚舉1~10的值確定模型輸入時(shí)間步長為6。
3.3.2 變量相關(guān)性理解結(jié)果分析
為分析不同變量因素對電壓軌跡預(yù)測的影響,本文分別計(jì)算太陽輻照度、溫度、相對濕度、有功功率、風(fēng)速和降雨量6種指標(biāo)與電壓的MIC,其結(jié)果如表3所示。
表3 電壓與其他變量因素間的MICTable 3 MIC of voltage relative between other variables
從表3可知,有功功率、太陽輻照度與電壓之間相關(guān)性最強(qiáng),CMI分別為0.721和0.651。因此,為了降低建模復(fù)雜度,提高模型泛化能力,本文只考慮有功功率、太陽輻照度對電壓軌跡預(yù)測的影響,將其作為模型的輸入變量。
為更好體現(xiàn)本文方法的優(yōu)越性,將使用了MIC相關(guān)性理解的多輸入CNN-GRU模型和僅有電壓歷史數(shù)據(jù)的單輸入模型進(jìn)行預(yù)測結(jié)果對比,結(jié)果如表4所示。
表4 模型加入MIC前后預(yù)測指標(biāo)對比Table 4 Prediction index comparison before and after MIC addition into model
由表4可知,經(jīng)MIC輸入特征選擇后的CNNGRU模型相比單輸入模型的MAE和RMSE分別下降了27%和23%左右,MIC的加入較大地提升了模型預(yù)測精度。
圖8為加入MIC理解后,分別使用SVR、LSTM、GRU、CNN-LSTM和CNN-GRU模型進(jìn)行電壓預(yù)測,隨機(jī)選取測試集某日的電壓真實(shí)曲線和預(yù)測曲線展示。不同模型的測試集整體預(yù)測指標(biāo)對比如表5所示。
圖8 電壓真實(shí)值與預(yù)測值對比Fig.8 Comparison of actual voltage with predicted voltage
表5 不同模型預(yù)測指標(biāo)對比Table 5 Prediction index comparison among different models
從圖8可以看出,在09:00—16:00時(shí)間段,各模型預(yù)測偏差波動(dòng)開始增大,本文所提模型和CNN-LSTM模型在該時(shí)間段依然能較好地?cái)M合電壓真實(shí)值曲線,模型表現(xiàn)更穩(wěn)定。
由表5可知,在提前5 min預(yù)測電壓時(shí),所提CNN-GRU融合模型相較于CNN-LSTM、GRU、LSTM、SVR等模型, MAE分別下降了23.0%、51.9%、51.5%、66.3%, RMSE分別下降了7.3%、41.4%、44.2%、57.1%,實(shí)現(xiàn)了更好的預(yù)測效果。
在一些時(shí)效性要求較高的場合,需要考慮較高預(yù)測精度的同時(shí)兼顧模型訓(xùn)練耗時(shí),表6為CNN-GRU、CNN-LSTM、GRU、LSTM 4種模型的訓(xùn)練耗時(shí)對比。
表6 模型訓(xùn)練時(shí)間對比Table 6 Model training time comparison
由表6可知,CNN-GRU模型相比CNNLSTM模型,在提前5 min預(yù)測電壓模型訓(xùn)練時(shí)速度提升了27%左右,在提前15 min預(yù)測電壓模型訓(xùn)練時(shí)速度提升了25%左右,模型訓(xùn)練效率更高。
本文針對光伏電站出力間歇性和不確定性易引起并網(wǎng)點(diǎn)電壓大幅波動(dòng)的問題,提出了一種基于CNN-GRU的電壓軌跡預(yù)測方法。通過某地光伏電站的實(shí)測數(shù)據(jù)驗(yàn)證,對比CNN-LSTM、GRU、LSTM、SVR等模型,模型評價(jià)指標(biāo)MAE和RMSE均為最低;對比CNN-LSTM模型,模型訓(xùn)練效率提升在25%以上。本文所提電壓軌跡預(yù)測方法的特點(diǎn)如下。
(1)通過自相關(guān)系數(shù)和MIC理解電壓自身及其與外部變量在時(shí)序上的相關(guān)性,以此確定模型輸入步長及維度,減少了特征冗余,降低了模型訓(xùn)練復(fù)雜度。
(2)先利用CNN提取輸入數(shù)據(jù)的高層特征,再利用GRU學(xué)習(xí)長時(shí)間序列前后關(guān)系,解決了海量電壓數(shù)據(jù)高層特征提取困難及模型學(xué)習(xí)長時(shí)間序列信息易梯度消失的問題,實(shí)現(xiàn)了對光伏電站數(shù)據(jù)的充分挖掘。
(3)相比單輸入模型和單一模型預(yù)測精度更高,同時(shí)具有較好的模型訓(xùn)練效率,為光伏電站電壓軌跡預(yù)測提供了新的思路和方法。
本文分別計(jì)算了太陽輻照度、溫度、相對濕度、有功功率、風(fēng)速和降雨量6種指標(biāo)與電壓的相關(guān)性,未來可以進(jìn)一步考慮配電網(wǎng)拓?fù)浼柏?fù)荷對電壓的影響。