黃冬梅, 張寧寧, 胡安鐸*, 孫園, 孫錦中, 陳岸青
(1.上海電力大學電子與信息工程學院, 上海 201306; 2.上海電力大學數(shù)理學院, 上海 201306;3.國網(wǎng)信通億力科技有限責任公司, 福州 350001)
空間負荷預測(space load forecasting,SLF)可以預測某區(qū)域未來負荷的位置和大小。根據(jù)SLF的結果來確定供電設備應當配置的容量及其最佳位置,可提高電力系統(tǒng)建設的經(jīng)濟性、高效性、可靠性[1-3]。因此空間負荷預測研究對國民生活的影響越來越大。
區(qū)域電力負荷的大小受到社會經(jīng)濟發(fā)展狀況和氣候等多種因素的影響,相對于短期時間負荷預測,空間負荷預測的總體精度不高。文獻[4]提出了一種基于分區(qū)分類的空間負荷預測方法,考慮了不同時間的氣象類型因素。文獻[5]主要是考慮到氣候變化導致氣溫升高來預測洛杉磯的峰值電力需求。文獻[6]考慮了秩次集對分析理論在處理系統(tǒng)不確定性方面的優(yōu)勢,提出一種新的空間負荷預測方法。文獻[7]提出了一種基于元胞負荷特性分析的徑向基函數(shù)(radial basis function,RBF)神經(jīng)網(wǎng)絡空間負荷預測方法,構建出了一種峰值時段最大負荷數(shù)據(jù)群(maximum load data group,MLDG)的雙向選取模型。文獻[8]提出一種GAN生成數(shù)據(jù)和循環(huán)卷積生成式對抗網(wǎng)絡(recurrent convolutional generative adversarial networks,RCGAN)預測的空間負荷預測方法。上述文獻提出的方法未綜合考慮經(jīng)濟發(fā)展情況、人口水平、氣候條件、產(chǎn)業(yè)結構等對負荷變化的影響因素。
空間負荷預測面臨的另外一個問題是歷史數(shù)據(jù)匱乏[9],因此小樣本條件下生成數(shù)據(jù)來擴充樣本量是其重要解決方案。文獻[10]提出一種基于條件深度卷積生成對抗網(wǎng)絡的新能源發(fā)電場景數(shù)據(jù)遷移方法,解決了歷史數(shù)據(jù)缺失情況下生成方法精度較低甚至失效的問題。文獻[11]提出了一種用GAN重建地磁數(shù)據(jù)的方法,解決了大量數(shù)據(jù)缺失導致重建方法精度不高的問題。文獻[12]提出了一種基于生成對抗網(wǎng)絡的缺失值填充方法,解決了傳統(tǒng)方法難以處理的時序數(shù)據(jù)歷史隱含規(guī)律及樣本不完整的問題。文獻[13]基于深度生成性對抗網(wǎng)絡的海雜波數(shù)據(jù)生成方法進行了數(shù)據(jù)增強,生成的海雜波數(shù)據(jù)與真實數(shù)據(jù)分布類似。由此可見,通過GAN能夠保持多種特征變量與負荷之間的映射關系,從而實現(xiàn)樣本量的擴充。
針對空間負荷預測的影響因素多樣及數(shù)據(jù)量不足的問題,現(xiàn)提出一種考慮多維特征和數(shù)據(jù)增強的空間負荷預測方法。該方法首先建立地區(qū)多維度特征模型,從不同維度選取了影響電力負荷的因素。然后再利用GAN進行無監(jiān)督訓練,生成足夠的新數(shù)據(jù)增強樣本的數(shù)據(jù)量。最后選擇PSO-BP神經(jīng)網(wǎng)絡訓練樣本搭建預測模型,把測試樣本放入訓練好的模型中實現(xiàn)空間負荷預測。本文方法考慮了影響區(qū)域電力負荷的多個維度的特征,同時實現(xiàn)了小樣本數(shù)據(jù)的增強,具有較高空間負荷預測精度。
本文提出的考慮多維特征和數(shù)據(jù)增強的空間負荷預測方法的基本原理如圖1所示。
z為隨機向量;Pz(z)為均勻分布函數(shù)圖1 基本原理示意圖Fig.1 Schematic diagram of basic principle
(1)多維度特征的選取。首先需要對電力負荷特性的主要影響因素進行分析討論,根據(jù)地區(qū)的實際情況,考慮影響當?shù)仉娏ω摵傻囊蛩?,從不同維度建立地區(qū)多維度特征模型。電力系統(tǒng)具有龐大性和復雜性的特點,因此能夠影響電力負荷的因素有很多,而在實踐中,主要的因素有人口密度[14]、人均可支配收入、產(chǎn)業(yè)結構、氣候條件等。
(2)數(shù)據(jù)收集。根據(jù)有限的資料按年份查找近10年的數(shù)據(jù),每條數(shù)據(jù)包括此地區(qū)該年份的多個負荷特征因素和用電量信息,每個地區(qū)都劃分好數(shù)據(jù)組成訓練樣本集和測試樣本集。在搜集的數(shù)據(jù)中會存在資料有限導致一條數(shù)據(jù)中個別特征值缺失的問題,本文采用其他年份該變量的平均值來補充缺失的數(shù)據(jù)。
(3)利用GAN進行數(shù)據(jù)增強。由于劃分后的訓練集數(shù)據(jù)較少,在用神經(jīng)網(wǎng)絡[15-16]預測的時候難以達到理想的精度。為解決數(shù)據(jù)不足的問題,利用GAN建立生成模型以實現(xiàn)樣本數(shù)據(jù)量的擴充。模型中的生成器和判別器采用多層感知器(multi-layer perceptron,MLP)網(wǎng)絡結構,通過選取合適的參數(shù)使其彼此之間不斷優(yōu)化,以便能夠生成可用于空間負荷預測的數(shù)據(jù)。
(4)采用PSO-BP神經(jīng)網(wǎng)絡預測。將生成的和原始的訓練樣本一起放入經(jīng)粒子群算法優(yōu)化初始權重和閾值后的BP[17]神經(jīng)網(wǎng)絡中進行訓練,待訓練完成后,再將測試樣本放入該模型中完成預測。PSO每個粒子的位置表示BP神經(jīng)網(wǎng)絡當前迭代中權值的集合,粒子的維數(shù)由權值的數(shù)量和閾值的個數(shù)決定,并以神經(jīng)網(wǎng)絡輸出誤差作為神經(jīng)網(wǎng)絡訓練問題的適應度函數(shù),改變粒子的速度也就是更新網(wǎng)絡權值,以減少均方誤差。
為了深入探究電力負荷特性及其變化規(guī)律和發(fā)展趨勢,需要對能影響電力負荷特性的主要影響變量進行分析。本文研究在電力負荷影響因素研究現(xiàn)狀的基礎上,從不同維度建立了地區(qū)多維度特征模型。
地區(qū)多維度特征模型如圖2所示,該模型能夠充分利用配電網(wǎng)和城市各地區(qū)大量的量測數(shù)據(jù),為在數(shù)據(jù)驅動下通過深度學習進行空間負荷預測奠定了基礎。在現(xiàn)有的參考資料下,本文考慮了地區(qū)的三個維度屬性對空間負荷特征的影響,分別為開發(fā)強度、發(fā)展水平和氣候條件。
本文結合地區(qū)的用電構成和《城市用地分類與規(guī)劃建設用地標準》進行歷史數(shù)據(jù)的相關性分析,三個維度屬性選用的典型特征如表1所示,各特征說明具體如下。
開發(fā)強度直接影響到一個地區(qū)的用電量[18]。例如,人口密度高的地區(qū)比人口密度低的地區(qū)用電量明顯要多;對于人口密度大的地區(qū),其房屋居住面積和工廠面積也會相對較大,相反人口密度小的地區(qū)房屋居住面積和工廠面積也會相對較小。本文采用人口密度、房屋居住面積和工廠面積三個特征作為地區(qū)開發(fā)強度的衡量指標如表1所示。用電量和該地區(qū)的整體經(jīng)濟社會發(fā)展水平息息相關,人均可支配收入和工業(yè)總產(chǎn)值是體現(xiàn)地區(qū)發(fā)展水平最直觀的指標,此外政府的財政收入也體現(xiàn)了該地區(qū)的經(jīng)濟發(fā)展水平,所以將一般公共預算收入也作為衡量地區(qū)發(fā)展水平的特征之一。由于近年來暴雨、高溫和低溫等氣象災害頻繁發(fā)生,導致了空調和電采暖設備的大量使用,因此氣候條件對用電量的影響也逐漸的重要起來。將平均氣溫、總降水量、極端最高氣溫和極端最低氣溫作為描述氣候條件的重要特征。
圖2 地區(qū)多維度特征模型Fig.2 Regional multi-dimensional feature model
表1 地區(qū)多維屬性特征及描述Table 1 Regional multi-dimensional features and their description
發(fā)展水平和氣候條件屬性的空間分辨率很大,并不能與小地塊相對應,難以識別和獲取小地塊的這些特征數(shù)據(jù)。因此本文不細分小地塊,選擇城市的區(qū)級地域大小,同時以年為時間單位來收集數(shù)據(jù),使得數(shù)據(jù)格式簡單,并且容易實現(xiàn)。
上述所有的指標數(shù)據(jù)都可以從地區(qū)統(tǒng)計年鑒和區(qū)域發(fā)展數(shù)據(jù)庫中獲得??紤]到如果數(shù)據(jù)年份太過久遠,時間跨度大會形成社會發(fā)展水平不同,將影響到數(shù)據(jù)用電量和各特征之間的映射關系,本文按照區(qū)級地域只需獲取近10年的數(shù)據(jù)。
雖然可以獲得10年的年度統(tǒng)計特征數(shù)據(jù),但是對于以數(shù)據(jù)驅動[19]的神經(jīng)網(wǎng)絡方面而言,仍然存在數(shù)據(jù)匱乏的問題。本文利用GAN來訓練樣本,學習各特征與用電量的非線性規(guī)律,并產(chǎn)生新的樣本數(shù)據(jù),以此來提高樣本的數(shù)量。
由于數(shù)據(jù)的量綱或者取值大小不一樣,因此在進行數(shù)據(jù)生成之前需要對每條數(shù)據(jù)做歸一化處理。數(shù)據(jù)歸一化處理是指將數(shù)據(jù)按比例縮放,使其縮放到一個小的特定區(qū)間;它是數(shù)據(jù)挖掘的基礎性工作和重要的數(shù)據(jù)預處理過程,旨在消除各指標間尺度和量綱影響。鑒于需要將這些數(shù)據(jù)放入GAN模型中進行訓練,采用Min-Max歸一化方法,其公式為
(1)
式(1)中:yi為原始值xi歸一化后的值;xmin和xmax分別為所有數(shù)據(jù)中各特征的最小值和最大值。
首先需要將原始的訓練集設為x,并將訓練集中的各條數(shù)據(jù)之間存在著某種復雜的關系設為Px(x)[8]。整個網(wǎng)絡模型中,產(chǎn)生的隨機向量z作為模型輸入,且服從于均勻分布Pz(z)。G(z,δG)為生成器的輸出,D(z,δD)為判別器的輸出,δG與δD分別表示各自的網(wǎng)絡權重。在深度神經(jīng)網(wǎng)絡中建立反映Pz(x)與Px(x)的映射關系,然后就可以通過GAN模型進行訓練,生成滿足原數(shù)據(jù)用電量與多特征關系的新數(shù)據(jù)。
模型訓練相對復雜,可將其分為兩個部分,作用都是交替優(yōu)化GAN以實現(xiàn)最好的結果。第一階段,固定判別器更新生成器的網(wǎng)絡權重,再通過損失函數(shù)優(yōu)化生成器的參數(shù),從而使判別器的準確率能夠降到最低。第二階段,固定生成器更新判別器的網(wǎng)絡權重,再通過損失函數(shù)優(yōu)化判別器的參數(shù),從而使生成器的準確率能夠達到最高。生成器將目標函數(shù)(2)優(yōu)化達到最小化:
VG=Ez^Pz(z)[log2{1-D[G(z)]}]
(2)
式(2)中:VG為生成器的目標函數(shù);Ez^Pz(z)為Pz(z)的數(shù)學期望;D[G(z)]為判別器判別的結果;G(z)為生成器產(chǎn)生的新數(shù)據(jù)。判別器將目標函數(shù)(3)優(yōu)化達到最大化:
VD=Ex ^Px(x)[log2D(x)]+
Ez ^Pz(z)(log2{1-D[G(z)]})
(3)
式(3)中:VD為判別器的目標函數(shù);Ex ^Px(x)為Px(x)的數(shù)學期望;D(x)為真實數(shù)據(jù)。將兩式組合可得到GAN模型訓練過程的整個目標函數(shù)為
Ez ^Pz(z)(log2{1-D[G(z)]})
(4)
式(3)中:V(G,D)為GAN的目標函數(shù)。
GAN模型中的生成器和判別器均采用MLP網(wǎng)絡結構,損失函數(shù)為二分類交叉熵函數(shù)。生成器和判別器均采用LeakyReLU函數(shù)作為激活函數(shù),可以解決訓練過程中會出現(xiàn)神經(jīng)飽和的問題,提高計算效率。
采用Adam優(yōu)化器進行更新優(yōu)化GAN模型中兩部分的網(wǎng)絡參數(shù)。通過利用優(yōu)化網(wǎng)絡參數(shù)后的判別器進行多次無監(jiān)督訓練生成器來優(yōu)化其網(wǎng)絡參數(shù),以便生成器能夠生成更具真實性的數(shù)據(jù),直到判別器判別全部的新生數(shù)據(jù)為真實數(shù)據(jù)為止。將生成的數(shù)據(jù)進行反歸一化,最終生成可用于空間負荷預測的新數(shù)據(jù),實現(xiàn)最好的數(shù)據(jù)增強效果,滿足實驗的可行性。
以東部某市4個區(qū)為例,每個區(qū)搜集了2010—2019年的數(shù)據(jù),每條數(shù)據(jù)包含該年用電量和地區(qū)多維度的10個特征變量。將2010—2015年的數(shù)據(jù)劃分為訓練集的樣本,2016—2019年的數(shù)據(jù)劃分為測試集的樣本。劃分后的訓練樣本達不到深度學習訓練的數(shù)量規(guī)格和數(shù)據(jù)多樣性要求,因此需要將4個地區(qū)的訓練樣本作為GAN生成模型的原始樣本進行數(shù)據(jù)生成,充分學習和把握用電量和10個特征變量之間的關系和規(guī)律,使生成的數(shù)據(jù)滿足豐富歷史數(shù)據(jù)的數(shù)量和多樣性。4個地區(qū)部分數(shù)據(jù)如表2所示。
4.2.1 多維度與單維度屬性特征預測結果對比
不同維度的特征對負荷的影響程度并不一樣,在實驗中,預測效果最好的維度屬性是開發(fā)強度。因此,將不同維度特征綜合的預測值與開發(fā)強度屬性下特征的預測值進行比較,具體如表3所示。
表2 各區(qū)2010—2019年部分數(shù)據(jù)Table 2 Partial data of each district from 2010 to 2019
預測值相對誤差區(qū)間比例如圖3所示。結果表明,考慮多個維度特征的預測結果要與只考慮單個維度特征的預測結果相比,效果要好很多。其中,多維度屬性特征的預測結果相對誤差在5%以內的達到43.75%,而對應的單維度屬性特征預測結果只達到12.5%。因此,考慮多個維度特征的方法具有更高的預測精度。
表3 多維度與單一維度屬性特征的空間負荷預測結果Table 3 Spatial load forecasting results based on multi-dimensional and single dimensional attribute characteristics
圖3 多維度與單一維度屬性變量預測結果對比Fig.3 Comparison of results of multi-dimensional and single-dimensional aided prediction
4.2.2 有無數(shù)據(jù)增強的預測結果對比
考慮每個地區(qū)用電量與多特征變量的映射關系會存在差異,為了減少生成數(shù)據(jù)的平均絕對誤差,保證生成的數(shù)據(jù)具有較高的精度,因此需要每個地區(qū)的數(shù)據(jù)分別單獨用GAN模型進行生成數(shù)據(jù)。經(jīng)過實驗分析,每個地區(qū)的數(shù)據(jù)生成4倍最為合適,把生成后的數(shù)據(jù)與4個地區(qū)的原始訓練樣本放在一起實際上就實現(xiàn)了樣本的數(shù)據(jù)增強,再將增強后的數(shù)據(jù)放入PSO-BP網(wǎng)絡模型中訓練,訓練完成后,最后將測試樣本放入該模型中進行預測。將預測值與未增強訓練樣本的預測值進行比較,具體如表4所示。
表4 基于PSO-BP神經(jīng)網(wǎng)絡的空間負荷預測結果Table 4 Spatial load forecasting results based on PSO-BP neural network
圖4 有無數(shù)據(jù)增強預測結果對比Fig.4 Comparison of prediction results with and without data enhancement
預測值相對誤差區(qū)間比例如圖4所示。結果表明,用GAN進行數(shù)據(jù)增強后預測結果的相對誤差遠低于未使用GAN數(shù)據(jù)增強預測結果的相對誤差。其中,數(shù)據(jù)增強的全部預測結果中相對誤差均小于20%,相對誤差小于5%的比例為75%,相對誤差在5%~10%的比例為12.5%,兩者之和的比例就達到了87.5%。而未數(shù)據(jù)增強預測結果對應的比例分別為43.75%和18.75%,兩者之和為62.5%。由此可見,用GAN進行數(shù)據(jù)增強可以大幅提高預測精度。
4.2.3 其他傳統(tǒng)方法的預測結果對比
本文所提出的考慮多維特征和數(shù)據(jù)增強的空間負荷預測方法是否具有有效性,這里將其預測結果與現(xiàn)有的一些預測方法進行比較驗證,即傳統(tǒng)的3種預測方法:灰色理論法、指數(shù)平滑法和線性回歸法,以及能夠較好處理高維屬性性能的最小二乘支持向量機[20-24](least square support vector machine,LS-SVM)方法。不同方法的預測結果如表5所示。
表5 不同方法的空間負荷預測結果Table 5 Spatial load forecasting results of different methods
圖5 不同預測方法的相對誤差比較Fig.5 Comparison of relative error of different prediction methods
求取各種方法的相對誤差百分數(shù),統(tǒng)計各誤差區(qū)間比例,如圖5所示。從表5和圖5的結果可以看出:就預測結果整體而言,采用本文方法得到的用電量預測結果,相較于LS-SVM和傳統(tǒng)的3種預測方法的預測結果而言,各預測結果的相對誤差明顯較小,預測精度明顯提高;同時本文方法所得到的預測結果在較小的相對誤差區(qū)間內的個數(shù)比例較大,這表明本文方法整體上優(yōu)于灰色理論法、指數(shù)平滑法、線性回歸法和LS-SVM的預測方法。因此。與現(xiàn)有的一些傳統(tǒng)方法相比,在進行空間負荷預測時本文的方法具有較好的特征提取性能和較高的負荷預測精度。
針對空間負荷預測影響因素多樣及數(shù)據(jù)匱乏的問題,提出了一種考慮多維特征和數(shù)據(jù)增強的空間負荷預測方法。與現(xiàn)有的一些方法相比,該方法具有以下優(yōu)點。
(1)綜合3個維度的主要特征因素來反映與負荷變化的關系,考慮的影響因素更加全面,更符合區(qū)域負荷在不同類型因素下受到不同影響的情況。相比于不考慮影響空間負荷影因素或只考慮單種類型因素的方法,其預測精度更高。
(2)本文方法可以學習到用電量與各影響特征之間的映射關系,實現(xiàn)在歷史數(shù)據(jù)匱乏的場景下生成符合原始數(shù)據(jù)變化規(guī)律的新樣本,使得用于空間負荷預測的訓練樣本得到充分、有效的增強,提高了模型的預測精度,為新建成或歷史樣本不足的待預測區(qū)域提供了一種新方法。