劉 牮,李佳偉
(上海理工大學(xué) 機(jī)械工程學(xué)院,上海 200093)
隨著分布式發(fā)電技術(shù)與電力物聯(lián)網(wǎng)的發(fā)展,電力系統(tǒng)的組成更加多樣化,用電調(diào)度和電力市場(chǎng)的平穩(wěn)運(yùn)行面臨新的挑戰(zhàn)。為滿(mǎn)足電網(wǎng)安全運(yùn)行的需求,提高電力系統(tǒng)的可靠性與穩(wěn)定性,電力負(fù)荷數(shù)據(jù)的重要性不言而喻。然而,電力負(fù)荷具有隨機(jī)性和不確定性,并且傳統(tǒng)負(fù)荷數(shù)據(jù)的預(yù)測(cè)與生成受到很多因素影響,如天氣、季節(jié)、社會(huì)活動(dòng)等,這些因素對(duì)于電網(wǎng)的穩(wěn)定性構(gòu)成威脅。
文獻(xiàn)[1]提出一種基于模糊集隸屬度改進(jìn)均值生成函數(shù)的方法,通過(guò)新的模糊集隸屬度改進(jìn)均值生成函數(shù)構(gòu)造,在與最優(yōu)子集模型結(jié)合后,使用模型對(duì)負(fù)荷進(jìn)行短期預(yù)測(cè);文獻(xiàn)[2]提出一種考慮風(fēng)電場(chǎng)出力波動(dòng)趨勢(shì)和相關(guān)性的建模方法生成風(fēng)電負(fù)荷數(shù)據(jù);文獻(xiàn)[3]提出基于支持向量回歸的負(fù)荷數(shù)據(jù)生成方法;文獻(xiàn)[4]將卷積神經(jīng)網(wǎng)絡(luò)和支持向量回歸模型相結(jié)合,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取,將新特征輸入支持向量回歸模型進(jìn)行預(yù)測(cè)。然而,文獻(xiàn)[1]的方法只適合進(jìn)行短期數(shù)據(jù)預(yù)測(cè),且無(wú)法生成大量數(shù)據(jù);文獻(xiàn)[2]和文獻(xiàn)[3]的方法容易受到特殊因素影響,如天氣因素等,使得生成結(jié)果往往具有局限性,而不具有普遍性;文獻(xiàn)[4]的模型雖然能夠生成大量精確的電力負(fù)荷數(shù)據(jù),但該方法模型結(jié)構(gòu)復(fù)雜、計(jì)算量較大,且網(wǎng)絡(luò)訓(xùn)練時(shí)間較長(zhǎng)。
本文運(yùn)用對(duì)抗神經(jīng)網(wǎng)絡(luò)模型生成新的電力負(fù)荷數(shù)據(jù),該方法不會(huì)受到特殊因素影響,使新生成的數(shù)據(jù)更具有普遍性,并且具有網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單、訓(xùn)練時(shí)間短等優(yōu)點(diǎn)。對(duì)抗神經(jīng)網(wǎng)絡(luò)是一種無(wú)監(jiān)督學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),伴隨著監(jiān)督式學(xué)習(xí)性能瓶頸的到來(lái),針對(duì)非監(jiān)督學(xué)習(xí)的研究越來(lái)越多。運(yùn)用DCGAN網(wǎng)絡(luò)進(jìn)行電力負(fù)荷場(chǎng)景建模,分析驗(yàn)證其在保留電力負(fù)荷數(shù)據(jù)原始序列時(shí)間、空間相關(guān)特性方面的能力。該模型通過(guò)生成器與判別器兩者之間的相互博弈,從中學(xué)習(xí)歷史負(fù)荷數(shù)據(jù)時(shí)空分布規(guī)律,并使用DCGAN網(wǎng)絡(luò)生成電力數(shù)據(jù),可防止出現(xiàn)原始GAN在訓(xùn)練過(guò)程中梯度下降、訓(xùn)練不穩(wěn)定以及無(wú)法進(jìn)行單純的數(shù)據(jù)生成等問(wèn)題。將電力數(shù)據(jù)通過(guò)坐標(biāo)系轉(zhuǎn)化為曲線(xiàn)圖,將這些曲線(xiàn)圖作為數(shù)據(jù)樣本、深度卷積生成對(duì)抗網(wǎng)絡(luò)結(jié)構(gòu)作為模型進(jìn)行訓(xùn)練,得到的新的電力負(fù)荷數(shù)據(jù)。通過(guò)將訓(xùn)練得到的新數(shù)據(jù)與原始數(shù)據(jù)進(jìn)行相關(guān)性分析,并與傳統(tǒng)支持向量法與均值生成函數(shù)法進(jìn)行對(duì)比,結(jié)果證明本文模型能夠生成大量符合要求的新數(shù)據(jù)。
GAN網(wǎng)絡(luò)優(yōu)化目標(biāo)函數(shù)如下:
對(duì)于判別器而言,這是一個(gè)二分類(lèi)問(wèn)題,V(G,Z) 為二分類(lèi)里常見(jiàn)的交叉熵?fù)p失。
對(duì)于生成器而言,為了盡可能地欺騙判別器D,判別概率D(G(z)) 需要最大化,也即使log(1-D(G(z))) 最小化。在實(shí)際訓(xùn)練過(guò)程中,生成器與判別器交替進(jìn)行訓(xùn)練,不斷往復(fù),當(dāng)判別器與生成器二者達(dá)到納什均衡,生產(chǎn)樣本和真實(shí)樣本就達(dá)到了以假亂真的程度。
Fig.1 Adversarial neural network model圖1 對(duì)抗神經(jīng)網(wǎng)絡(luò)模型
CNN網(wǎng)絡(luò)主要由3 種模塊構(gòu)成:卷積層、采樣層和全連接層。CNN網(wǎng)絡(luò)訓(xùn)練過(guò)程可理解為:首先通過(guò)第一層卷積提取圖片特征圖(feature map);然后通過(guò)第一層采樣層對(duì)特征圖進(jìn)行特征選擇,去掉不需要的特征后得到新的特征圖;第二層卷積層再次對(duì)上一層采樣層的feature map提取特征,第二層采樣層也對(duì)上一層進(jìn)行二次選擇;全連接層根據(jù)上述過(guò)程的特征結(jié)果進(jìn)行分類(lèi)。
DCGAN將CNN與GAN的兩種網(wǎng)絡(luò)進(jìn)行結(jié)合,將卷積網(wǎng)絡(luò)引入模型中。卷積網(wǎng)絡(luò)具有非常強(qiáng)的特征提取能力,將其加入到GAN網(wǎng)絡(luò)進(jìn)行無(wú)監(jiān)督訓(xùn)練生成的新的電力負(fù)荷數(shù)據(jù)。由于GAN網(wǎng)絡(luò)訓(xùn)練具有不穩(wěn)定性,DCGAN選擇使用CNN結(jié)構(gòu)以穩(wěn)定GAN的訓(xùn)練。
網(wǎng)絡(luò)改進(jìn)如下:
(1)取消所有pooling層,G網(wǎng)絡(luò)中使用轉(zhuǎn)置卷積進(jìn)行上采樣,D網(wǎng)絡(luò)中用加入stride的卷積代替pooling。
(2)在D和G中均使用batch normalization,去掉FC層,使網(wǎng)絡(luò)變?yōu)槿矸e網(wǎng)絡(luò)。
(3)G網(wǎng)絡(luò)中使用ReLU作為激活函數(shù),最后一層使用tanh。
(4)D網(wǎng)絡(luò)中使用LeakyReLU作為激活函數(shù)。
DCGAN對(duì)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)作出的改變,可以提高樣本質(zhì)量和收斂速度。在預(yù)處理環(huán)節(jié),將圖像scale到tanh的[-1,1],學(xué)習(xí)率必須很小。本文設(shè)置學(xué)習(xí)率為rate=0.000 2,初始化參數(shù)由均值為0、方差為0.002 的正態(tài)分布中得到,LeakyReLU的斜率是0.2,將momentum參數(shù)beta從0.9 降為0.5,以防止震蕩及不穩(wěn)定。在訓(xùn)練過(guò)程中,判別器與生成器均采用adam優(yōu)化算法。對(duì)數(shù)據(jù)結(jié)果進(jìn)行比較分析,隨著訓(xùn)練的逐步進(jìn)行,基于DCGAN網(wǎng)絡(luò)的模型可生成大量滿(mǎn)足多樣性和準(zhǔn)確性的數(shù)據(jù)序列。
圖2-圖4 分別為總迭代次數(shù)e=10、e=50、e=200 時(shí)的生成結(jié)果,從圖中可以看出,神經(jīng)網(wǎng)絡(luò)逐漸學(xué)習(xí)到數(shù)據(jù)變化分布規(guī)律,生成的結(jié)果越來(lái)越好。在網(wǎng)絡(luò)訓(xùn)練過(guò)程中,迭代次數(shù)越多,模型生成的曲線(xiàn)越清晰,并且可以大量生成電力負(fù)荷數(shù)據(jù)曲線(xiàn),在程序中稍加修改還可得到生成的單張數(shù)據(jù)曲線(xiàn)圖。如圖5 為迭代次數(shù)為300 時(shí)其中的某單張電力數(shù)據(jù)曲線(xiàn)圖,通過(guò)坐標(biāo)系可提取出曲線(xiàn)中的電力數(shù)據(jù)。
Fig.2 Result generated when e=5圖2 e=5 時(shí)生成結(jié)果
Fig.3 Result generated when e=50圖3 e=50 時(shí)生成結(jié)果
Fig.4 Result generated when e=200圖4 e=200 時(shí)生成結(jié)果
Fig.5 Single electric data curve generated when e=300圖5 e=300 時(shí)生成的單張電力數(shù)據(jù)曲線(xiàn)
經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)可用來(lái)處理非平穩(wěn)數(shù)據(jù)序列:假如一個(gè)原始數(shù)據(jù)序列X(t)的極大值或極小值數(shù)目比上跨零點(diǎn)或下跨零點(diǎn)的數(shù)目多2 個(gè)(或2 個(gè)以上),則需要對(duì)該數(shù)據(jù)序列進(jìn)行平穩(wěn)化處理。先選取序列長(zhǎng)度為T(mén)的數(shù)據(jù)序列X(t):x1,x2,…,xT,令h(t)=X(t),找出全部的極大值點(diǎn),并用樣條函數(shù)插值作為原數(shù)據(jù)序列X(t)的上包絡(luò)線(xiàn),找出全部的極小值點(diǎn)。將樣條函數(shù)插值作為原數(shù)據(jù)序列的下包絡(luò)線(xiàn),m(t)為均值序列,用數(shù)據(jù)序列h(t)減去該平均包絡(luò)后得到去掉低頻的一個(gè)新數(shù)據(jù)序列hl(t),從而得到第一個(gè)IMF分量C1(t):C1(t)=hk(t)。
第一個(gè)IMF分量代表原始數(shù)據(jù)序列中最高頻的組成成分。用X(t)減去第一個(gè)IMF分量C1(t),得到一個(gè)去掉最高頻成分后的新數(shù)據(jù)序列r1(t)。同理,對(duì)r1(t)用同樣的方法經(jīng)過(guò)平穩(wěn)化處理便得到第二個(gè)IMF分量C2(t),一直到序列rn(t)不可再被分解時(shí),rn(t)便可作為數(shù)列X(t):x1,x2,....xT的均值或趨勢(shì):
經(jīng)過(guò)前面的多次平穩(wěn)化處理后,可得到原始序列中的多組IMF分量和殘差表示:
從上述過(guò)程可以看出,EMD算法是一種將原始數(shù)據(jù)用多組特征波形進(jìn)行疊加的算法,具體流程如圖6 所示。
Fig.6 Algorithm flow圖6 算法流程
將輸入的電力負(fù)荷數(shù)據(jù)序列通過(guò)經(jīng)驗(yàn)?zāi)B(tài)分解算法進(jìn)行多時(shí)間尺度分解,得到若干個(gè)IMF分量和一個(gè)趨勢(shì)分量Rn。不同分量代表序列在不同時(shí)間周期上的波動(dòng)規(guī)律,能更準(zhǔn)確地反映電力負(fù)荷時(shí)間序列的變化,并保留序列本身的特征。
本文對(duì)原始電力負(fù)荷數(shù)據(jù)和生成的電力負(fù)荷數(shù)據(jù)分別求出其每個(gè)時(shí)間點(diǎn)上的平均值,將得到的兩個(gè)樣本轉(zhuǎn)換成電力數(shù)據(jù)曲線(xiàn),通過(guò)EMD算法將兩個(gè)曲線(xiàn)進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解,便可得到其特征尺度數(shù)據(jù)序列和一個(gè)趨勢(shì)分量,如圖7、圖8 所示。從圖中可清晰看出生成的數(shù)據(jù)與原始數(shù)據(jù)樣本在時(shí)間分布上的相似程度,最后的趨勢(shì)分量更能體現(xiàn)生成數(shù)據(jù)可保留原始數(shù)據(jù)隨時(shí)間變化趨勢(shì)的特征規(guī)律,表明基于對(duì)抗生成網(wǎng)絡(luò)的模型能夠準(zhǔn)確生成大量符合要求的負(fù)荷數(shù)據(jù)。
Fig.7 Raw data load curve圖7 原始數(shù)據(jù)負(fù)荷曲線(xiàn)
Fig.8 Data load curve圖8 數(shù)據(jù)負(fù)荷曲線(xiàn)
為進(jìn)一步證明電力原始樣本與生產(chǎn)樣本之間的關(guān)系,對(duì)兩組數(shù)據(jù)使用皮爾遜分析法作相關(guān)性檢驗(yàn)。皮爾遜相關(guān)系數(shù)是用來(lái)反映兩個(gè)變量線(xiàn)性相關(guān)程度的統(tǒng)計(jì)量。其中,r為相關(guān)系數(shù),用來(lái)表現(xiàn)兩組被測(cè)數(shù)據(jù)之間的線(xiàn)性相關(guān)程度,r的絕對(duì)值越大,兩組變量之間的相關(guān)性越強(qiáng);n為數(shù)據(jù)樣本數(shù)量,對(duì)應(yīng)觀(guān)測(cè)值和均值。
兩個(gè)變量之間的皮爾遜相關(guān)系數(shù)定義為兩個(gè)變量之間的協(xié)方差和標(biāo)準(zhǔn)差的商:
皮爾遜相關(guān)系數(shù)體現(xiàn)了兩者之間的線(xiàn)性關(guān)聯(lián)性,系數(shù)取值總是在-1~1 之間,接近0 的變量被稱(chēng)為無(wú)相關(guān)性,接近1 或-1 被稱(chēng)為具有強(qiáng)相關(guān)性。
利用皮爾遜分析法對(duì)本文方法獲得的數(shù)據(jù)與傳統(tǒng)支持向量法和均值生成函數(shù)法獲得的數(shù)據(jù)進(jìn)行分析,得到結(jié)果如表1、表2 所示。
從表1、表2 結(jié)果可以看出,原始的電力負(fù)荷數(shù)據(jù)與生成的電力負(fù)荷數(shù)據(jù)之間的皮爾遜相關(guān)性系數(shù)為0.971,而支持向量法的相關(guān)性系數(shù)為0.968,均值生成函數(shù)法的相關(guān)性系數(shù)為0.968。數(shù)據(jù)結(jié)果表明,本文方法比兩種傳統(tǒng)方法的相關(guān)性更強(qiáng),證明了基于對(duì)抗生成網(wǎng)絡(luò)模型在電力負(fù)荷數(shù)據(jù)生成上的可行性與優(yōu)越性。
Table 1 Descriptive statistics表1 描述統(tǒng)計(jì)
Table 2 Pearson correlation表2 皮爾遜相關(guān)性
在實(shí)驗(yàn)過(guò)程中,傳統(tǒng)方法在數(shù)據(jù)生成上往往只能生成少量樣本,隨著深度學(xué)習(xí)和人工智能技術(shù)的發(fā)展,對(duì)于樣本數(shù)量的需求不斷增加。本文模型在訓(xùn)練穩(wěn)定后能充分學(xué)習(xí)原始數(shù)據(jù)分布規(guī)律,每一輪都可得到大量數(shù)據(jù)樣本,為增加神經(jīng)網(wǎng)絡(luò)的泛化能力提供了大量數(shù)據(jù)支持,可提高電力系統(tǒng)的穩(wěn)定性與可靠性。
電力負(fù)荷數(shù)據(jù)是電力設(shè)備與配電網(wǎng)設(shè)計(jì)的關(guān)鍵因素之一。社會(huì)經(jīng)濟(jì)的發(fā)展對(duì)電力設(shè)備與配電網(wǎng)設(shè)計(jì)提出了更高要求,這就需要大量精準(zhǔn)的電力負(fù)荷數(shù)據(jù)。本文基于實(shí)測(cè)數(shù)據(jù)使用DCGAN場(chǎng)景建模方法,通過(guò)實(shí)驗(yàn)驗(yàn)證了該方法在保留原始數(shù)據(jù)樣本時(shí)空規(guī)律特性等方面的能力,證明了該方法的可行性,能夠在數(shù)據(jù)樣本匱乏的情況下大量生成符合要求的數(shù)據(jù)。本文基于DCGAN的建模方法相比傳統(tǒng)場(chǎng)景建模方法能更好地體現(xiàn)無(wú)監(jiān)督神經(jīng)網(wǎng)絡(luò)的優(yōu)越性,可降低人為因素影響、減少訓(xùn)練時(shí)間、降低成本等。但是,如何改進(jìn)DCGAN模型以更準(zhǔn)確地把握電力負(fù)荷序列的時(shí)序特性,仍有待進(jìn)一步研究。