虞殷樹(shù),陳東海,朱 耿,賀 旭,白文博
(1. 國(guó)網(wǎng)浙江省電力有限公司寧波供電公司,浙江 寧波 315000;2. 寧波市電力設(shè)計(jì)院有限公司,浙江 寧波 315000)
短期電力負(fù)荷預(yù)測(cè)是調(diào)度計(jì)劃安排的重要依據(jù),對(duì)于電力系統(tǒng)的安全經(jīng)濟(jì)運(yùn)行具有重要意義[1-3]。在進(jìn)行地區(qū)電網(wǎng)的短期負(fù)荷預(yù)測(cè)時(shí),由于各個(gè)行業(yè)的負(fù)荷特性差異較大,需利用配電網(wǎng)臺(tái)賬信息按所屬行業(yè)對(duì)負(fù)荷進(jìn)行分解和預(yù)測(cè),以提高負(fù)荷預(yù)測(cè)的精細(xì)化程度。隨著各行業(yè)歷史負(fù)荷數(shù)據(jù)、氣象數(shù)據(jù)等多元數(shù)據(jù)的積累,利用大數(shù)據(jù)、機(jī)器學(xué)習(xí)技術(shù)對(duì)各行業(yè)的負(fù)荷特性和影響因素進(jìn)行分析,有助于提高對(duì)不同行業(yè)負(fù)荷的預(yù)測(cè)準(zhǔn)確性,進(jìn)而提升短期電力負(fù)荷預(yù)測(cè)的效果[4-6]。
目前,針對(duì)短期電力負(fù)荷預(yù)測(cè)已有不少研究。文獻(xiàn)[7]通過(guò)集合經(jīng)驗(yàn)?zāi)B(tài)分解將電力負(fù)荷分解為低頻和高頻分量,再分別使用線性回歸和神經(jīng)網(wǎng)絡(luò)方法對(duì)低頻和高頻分量進(jìn)行預(yù)測(cè);文獻(xiàn)[8]采用LSTM(長(zhǎng)短期記憶)網(wǎng)絡(luò)和XGBoost(極端梯度增強(qiáng))模型分別進(jìn)行負(fù)荷預(yù)測(cè)后,使用誤差倒數(shù)法對(duì)兩者的預(yù)測(cè)結(jié)果進(jìn)行組合,得到最終的預(yù)測(cè)結(jié)果;文獻(xiàn)[9]對(duì)用戶負(fù)荷數(shù)據(jù)進(jìn)行聚類處理,得到不同負(fù)荷特性的用戶群,并針對(duì)不同用戶群進(jìn)行負(fù)荷預(yù)測(cè)模型構(gòu)建,最終將各個(gè)用戶群的預(yù)測(cè)負(fù)荷整合為全局預(yù)測(cè)結(jié)果;文獻(xiàn)[10]采用卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)對(duì)歷史負(fù)荷序列的規(guī)律進(jìn)行特征學(xué)習(xí)和提取,并引入注意力機(jī)制提升短期負(fù)荷預(yù)測(cè)的精度。上述研究?jī)H利用歷史負(fù)荷數(shù)據(jù)進(jìn)行短期負(fù)荷預(yù)測(cè),而行業(yè)負(fù)荷不僅與歷史負(fù)荷數(shù)據(jù)有內(nèi)在的相關(guān)性,也受到氣象、日類型等外部因素的顯著影響,需要對(duì)外部影響因素加以考慮,以提升負(fù)荷預(yù)測(cè)的準(zhǔn)確性。
為此,一些研究在進(jìn)行短期負(fù)荷預(yù)測(cè)時(shí)考慮了外部影響因素與負(fù)荷的關(guān)聯(lián)性。文獻(xiàn)[11-12]采用Pearson相關(guān)系數(shù)分析電力負(fù)荷與外部影響因素的相關(guān)性,為負(fù)荷相似日的選擇提供依據(jù),但Pearson 相關(guān)系數(shù)只適用于線性相關(guān)性的分析,無(wú)法捕捉到電力負(fù)荷與外部影響因素的非線性相關(guān)性;文獻(xiàn)[13-14]采用Copula函數(shù)衡量電力負(fù)荷與外部影響因素之間的非線性相關(guān)性,但是Copula函數(shù)的具體形式需要人為確定,關(guān)聯(lián)分析的準(zhǔn)確性容易受到主觀因素的影響,同時(shí)上述研究的關(guān)聯(lián)性分析結(jié)果只用于選取一部分與負(fù)荷關(guān)聯(lián)性強(qiáng)的外部影響因素,無(wú)法全面地量化各個(gè)因素對(duì)電力負(fù)荷的影響;文獻(xiàn)[15-18]采用機(jī)器學(xué)習(xí)方法對(duì)電力負(fù)荷與外部影響因素之間的關(guān)聯(lián)性進(jìn)行自動(dòng)提取,但機(jī)器學(xué)習(xí)方法的可解釋性較差,且在沒(méi)有足夠大的數(shù)據(jù)量時(shí)容易受到變量隨機(jī)波動(dòng)的影響而陷入過(guò)擬合。
針對(duì)上述問(wèn)題,本文提出一種基于關(guān)聯(lián)分析和卷積神經(jīng)網(wǎng)絡(luò)的行業(yè)短期電力負(fù)荷預(yù)測(cè)模型。通過(guò)優(yōu)化k-means 聚類算法和引入標(biāo)準(zhǔn)互信息指標(biāo),改進(jìn)了外部影響因素與負(fù)荷關(guān)聯(lián)性的計(jì)算方法,并基于卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)一種計(jì)及外部影響因素關(guān)聯(lián)性的負(fù)荷預(yù)測(cè)網(wǎng)絡(luò),提升了地區(qū)電網(wǎng)各行業(yè)短期電力負(fù)荷預(yù)測(cè)的準(zhǔn)確性。
基于關(guān)聯(lián)分析和卷積神經(jīng)網(wǎng)絡(luò)的行業(yè)短期電力負(fù)荷預(yù)測(cè)模型整體結(jié)構(gòu)如圖1所示。將歷史負(fù)荷數(shù)據(jù)、外部影響因素?cái)?shù)據(jù)、行業(yè)負(fù)荷數(shù)據(jù)都劃分為訓(xùn)練集和測(cè)試集,在訓(xùn)練階段使用訓(xùn)練集的數(shù)據(jù)進(jìn)行關(guān)聯(lián)性結(jié)果的計(jì)算和負(fù)荷預(yù)測(cè)網(wǎng)絡(luò)的訓(xùn)練,在測(cè)試階段則利用訓(xùn)練后的負(fù)荷預(yù)測(cè)網(wǎng)絡(luò)進(jìn)行行業(yè)負(fù)荷預(yù)測(cè)。
圖1 行業(yè)短期電力負(fù)荷預(yù)測(cè)模型整體結(jié)構(gòu)Fig.1 Overall structure of the short-term power load forecasting model for industrial sectors
訓(xùn)練階段主要分為優(yōu)化k-means 聚類、改進(jìn)關(guān)聯(lián)分析和負(fù)荷預(yù)測(cè)網(wǎng)絡(luò)訓(xùn)練3 個(gè)步驟,具體如下:
1)對(duì)k-means 聚類算法進(jìn)行優(yōu)化,并采用優(yōu)化后的k-means 聚類算法對(duì)外部影響因素?cái)?shù)據(jù)和行業(yè)負(fù)荷數(shù)據(jù)進(jìn)行聚類處理,以改善后續(xù)關(guān)聯(lián)分析的準(zhǔn)確性。
2)對(duì)關(guān)聯(lián)分析方法進(jìn)行改進(jìn),以標(biāo)準(zhǔn)互信息為關(guān)聯(lián)性指標(biāo),并采用聚類后的數(shù)據(jù)代替原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)互信息計(jì)算,定量分析各種外部影響因素與行業(yè)負(fù)荷的關(guān)聯(lián)性。
3)設(shè)計(jì)一種計(jì)及外部影響因素關(guān)聯(lián)性的負(fù)荷預(yù)測(cè)網(wǎng)絡(luò),將關(guān)聯(lián)性結(jié)果作為網(wǎng)絡(luò)的超參數(shù),并以訓(xùn)練集的歷史負(fù)荷數(shù)據(jù)和外部影響因素?cái)?shù)據(jù)為輸入特征、行業(yè)負(fù)荷數(shù)據(jù)為輸出標(biāo)簽,對(duì)負(fù)荷預(yù)測(cè)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
在測(cè)試階段,將測(cè)試集的歷史負(fù)荷數(shù)據(jù)和外部影響因素?cái)?shù)據(jù)作為輸入特征,輸入訓(xùn)練后的負(fù)荷預(yù)測(cè)網(wǎng)絡(luò),即可輸出相應(yīng)的行業(yè)負(fù)荷預(yù)測(cè)值。
在分析外部影響因素與行業(yè)負(fù)荷之間的關(guān)聯(lián)性前,需要對(duì)數(shù)據(jù)進(jìn)行聚類處理,以提高關(guān)聯(lián)分析的準(zhǔn)確性。對(duì)于無(wú)監(jiān)督的聚類問(wèn)題,目前較為常用的是k-means 聚類方法[19],但k-means 聚類方法需要人為指定聚類的簇?cái)?shù)k,適應(yīng)性不夠且主觀性較強(qiáng),聚類效果容易受到數(shù)據(jù)數(shù)量和分布情況的影響。為此,本文對(duì)k-means 聚類算法進(jìn)行優(yōu)化,采用平均輪廓系數(shù)進(jìn)行最佳k值的確定,避免聚類算法對(duì)于人工經(jīng)驗(yàn)的依賴,提高算法的適應(yīng)性。優(yōu)化后的k-means聚類算法步驟如下:
1)輸入待聚類數(shù)據(jù)(例如溫度數(shù)據(jù))在一個(gè)時(shí)間段內(nèi)所有的C個(gè)采樣值x(c)(c∈{1,2,…,C}),并設(shè)定k值的上限kmax為10。
2)令k=2。
3)采用k-means 聚類算法對(duì)所有采樣值進(jìn)行一維聚類,聚類時(shí)以采樣值和聚類中心數(shù)值之差的絕對(duì)值作為劃分聚類簇的標(biāo)準(zhǔn),聚類后生成k個(gè)簇。
4)聚類完成后,計(jì)算每個(gè)采樣值x(c)的輪廓系數(shù)l(c)。若采樣值x(c)為孤立點(diǎn),即x(c)所在簇內(nèi)只有x(c)一個(gè)采樣值,則其輪廓系數(shù)l(c)為0;否則,按照式(1)至(4)計(jì)算x(c)的輪廓系數(shù)l(c):
式中:x(j)為x(c)所在簇內(nèi)的其他采樣值;x(q)為x(c)所在簇外第p個(gè)簇內(nèi)的采樣值;l1(c)為簇內(nèi)凝聚度;l2(p,c)為x(c)所在簇與其他第p個(gè)簇的簇間分離度;l3(c)為所有簇間分離度的最小值;n1(c)為x(c)所在簇內(nèi)的采樣值數(shù)目;n2(p,c)為除x(c)所在簇外第p個(gè)簇內(nèi)的采樣值數(shù)目。
5)計(jì)算出每個(gè)采樣值x(c)對(duì)應(yīng)的輪廓系數(shù)l(c)后,求出此時(shí)的k值對(duì)應(yīng)的平均輪廓系數(shù):
6)令k自加1,若k>kmax,則繼續(xù)執(zhí)行步驟7),否則返回步驟3)。
7)取所有的平均輪廓系數(shù)l0(k)(k∈{2,3,…,kmax})中的最大者所對(duì)應(yīng)的k值,作為最佳的聚類簇?cái)?shù),記為k0,并將步驟3)中聚類簇?cái)?shù)為k0時(shí)的聚類結(jié)果作為最終的聚類結(jié)果。
優(yōu)化k-means聚類后共形成k0個(gè)簇,每個(gè)簇都有1個(gè)聚類中心,聚類中心的值為簇內(nèi)所有采樣值的平均值。
行業(yè)負(fù)荷和外部影響因素之間的相關(guān)性往往是非線性的,例如溫度因素對(duì)居民負(fù)荷的影響,在低溫和高溫時(shí)居民負(fù)荷都會(huì)升高,而溫度適中時(shí)居民負(fù)荷較低。若采用Pearson系數(shù)、Spearman系數(shù)等常用的相關(guān)系數(shù)對(duì)相關(guān)性進(jìn)行計(jì)算,由于正相關(guān)部分與負(fù)相關(guān)部分互相抵消,將得出負(fù)荷與溫度相關(guān)性接近于0的結(jié)論,不符合實(shí)際情況。
為此,本文借鑒信息論中的互信息概念[20-21],采用標(biāo)準(zhǔn)互信息對(duì)行業(yè)負(fù)荷與外部影響因素的關(guān)聯(lián)性進(jìn)行分析,以充分考慮兩者的非線性相關(guān)性。對(duì)于待分析的行業(yè)負(fù)荷與外部影響因素,已知一個(gè)時(shí)間段內(nèi)C個(gè)采樣時(shí)刻的影響因素值x(c)和負(fù)荷值y(c)(c∈{1,2,…,C}),所有x(c)構(gòu)成序列X,所有y(c)構(gòu)成序列Y,其中x(c)共有M種可能取值(M≤C),記為x1(m)(m∈{1,2,…,M}),y(c)共有N種可能取值(N≤C),記為y1(n)(n∈{1,2,…,N}),影響因素與負(fù)荷的標(biāo)準(zhǔn)互信息值J(X;Y)計(jì)算方法如下:
其中:
式中:I(X;Y)表示X與Y的互信息值;H(X)和H(Y)分別為X和Y的信息熵;P(x1(m),y1(n))表示同時(shí)滿足x(c)=x1(m)和y(c)=y1(n)的采樣時(shí)刻占所有采樣時(shí)刻的比例;P(x1(m))表示滿足x(c)=x1(m)的采樣時(shí)刻占所有采樣時(shí)刻的比例;P(y1(n))表示滿足y(c)=y1(n)的采樣時(shí)刻占所有采樣時(shí)刻的比例;J(X;Y)的取值范圍為[0,1],其值越大表明影響因素與負(fù)荷的關(guān)聯(lián)性越強(qiáng)。
但是,直接采用原始數(shù)據(jù)X與Y的標(biāo)準(zhǔn)互信息會(huì)使關(guān)聯(lián)性分析受到數(shù)值細(xì)微差異的影響,無(wú)法把握變量的主要變化趨勢(shì)。以表1中的兩組數(shù)據(jù)為例,每組數(shù)據(jù)均由4個(gè)采樣時(shí)刻的溫度值和負(fù)荷值構(gòu)成,按照式(6)—(9)計(jì)算,第1 組數(shù)據(jù)的J(X;Y)為1(表明溫度和負(fù)荷的關(guān)聯(lián)性很強(qiáng)),而第2組數(shù)據(jù)的J(X;Y)為0(表明溫度和負(fù)荷的關(guān)聯(lián)性很弱),兩組數(shù)據(jù)的關(guān)聯(lián)性結(jié)果差別很大,但實(shí)際上兩組數(shù)據(jù)僅僅存在小數(shù)點(diǎn)后的細(xì)微差別,表明其中一組數(shù)據(jù)的關(guān)聯(lián)性結(jié)果不合理。
表1 溫度與負(fù)荷采樣數(shù)據(jù)示例Table 1 Temperature and load data samples
按照實(shí)際經(jīng)驗(yàn),在溫度值x(c)出現(xiàn)較明顯的變化(從約20 ℃變化到約30 ℃)時(shí),如果負(fù)荷值y(c)的分布基本沒(méi)有變化(50%概率約為1 000 MW,50%概率約為2 000 MW),則應(yīng)當(dāng)認(rèn)為溫度和負(fù)荷的關(guān)聯(lián)性很弱,因此對(duì)于這兩組數(shù)據(jù)而言,第2組數(shù)據(jù)J(X;Y)=0的結(jié)果更為合理。
為了避免由于數(shù)值細(xì)微差異導(dǎo)致關(guān)聯(lián)性結(jié)果不合理的問(wèn)題(如表1中第1組數(shù)據(jù)的情況),本文對(duì)關(guān)聯(lián)分析方法進(jìn)行改進(jìn),采用經(jīng)過(guò)聚類處理后的數(shù)據(jù)替換原始數(shù)據(jù),進(jìn)行標(biāo)準(zhǔn)互信息的計(jì)算。記采樣值x(c)所在簇的聚類中心值為u(c),所有u(c)構(gòu)成序列U,采樣值y(c)所在簇的聚類中心值為v(c),所有v(c)構(gòu)成序列V。u(c)共有F種可能取值(F≤C),記為u1(f)(f∈{1,2,…,F(xiàn)}),v(c)共有G種可能取值(G≤C),記為v1(g)(g∈{1,2,…,G}),則影響因素與負(fù)荷經(jīng)過(guò)聚類中心替換后標(biāo)準(zhǔn)互信息值J0(U;V)計(jì)算方法如下:
其中:
式中:I0(U;V)為u(c)與v(c)的互信息值;H0(U)和H0(V)分別為U和V的信息熵;P(u1(f),v1(g))為同時(shí)滿足u(c)=u1(f)和v(c)=v1(g)的采樣時(shí)刻占所有采樣時(shí)刻的比例;P(u1(f))為滿足u(c)=u1(f)的采樣時(shí)刻占所有采樣時(shí)刻的比例;P(v1(g))為滿足v(c)=v1(g)的采樣時(shí)刻占所有采樣時(shí)刻的比例;J0(U;V)的取值范圍為[0,1],其值越大表明影響因素與負(fù)荷的關(guān)聯(lián)性越強(qiáng)。
表1的兩組原始數(shù)據(jù)經(jīng)過(guò)聚類處理后如表2所示,表2的兩組數(shù)據(jù)按照式(10)—(13)計(jì)算得到的J0(U;V)均為0,與實(shí)際經(jīng)驗(yàn)相符,說(shuō)明原始數(shù)據(jù)經(jīng)過(guò)聚類處理后,求得的標(biāo)準(zhǔn)互信息能更準(zhǔn)確合理地反映行業(yè)負(fù)荷與外部影響因素的關(guān)聯(lián)性。
表2 聚類處理后溫度與負(fù)荷采樣數(shù)據(jù)示例Table 2 Temperature and load data samples after clustering
卷積神經(jīng)網(wǎng)絡(luò)具有模型復(fù)雜度較低、易于并行計(jì)算的優(yōu)勢(shì),且可通過(guò)多尺寸窗口同時(shí)提取多種時(shí)間跨度的信息,在負(fù)荷預(yù)測(cè)任務(wù)中被廣泛采用[22-23]。本文采用卷積神經(jīng)網(wǎng)絡(luò)對(duì)原始數(shù)據(jù)進(jìn)行特征提取,以挖掘原始數(shù)據(jù)中的關(guān)鍵信息,用于短期負(fù)荷預(yù)測(cè)。原始數(shù)據(jù)包括歷史負(fù)荷數(shù)據(jù),以及溫度、相對(duì)濕度、風(fēng)速、降水量、節(jié)假日等外部影響因素?cái)?shù)據(jù)。
對(duì)于歷史負(fù)荷數(shù)據(jù),進(jìn)行歸一化后采用待預(yù)測(cè)時(shí)刻前t1個(gè)小時(shí)的采樣值作為輸入數(shù)據(jù),構(gòu)成一個(gè)t1維的輸入向量,記為V,然后用多個(gè)h×1 維的卷積窗口對(duì)V進(jìn)行卷積運(yùn)算(h可有多種取值,對(duì)應(yīng)不同的時(shí)間跨度)。假設(shè)用h×1維的卷積窗口W對(duì)V進(jìn)行卷積運(yùn)算,并進(jìn)行最大值池化,得到特征值e:
式中:Va:a+h-1表示由輸入向量V的第a至a+h-1維的值組成的向量;b為偏置項(xiàng)。
最后將多個(gè)卷積窗口得到的特征值進(jìn)行拼接,得到歷史負(fù)荷特征向量e0。
對(duì)于外部影響因素?cái)?shù)據(jù),進(jìn)行歸一化后采用待預(yù)測(cè)時(shí)刻前t2個(gè)小時(shí)的所有采樣值以及從待預(yù)測(cè)時(shí)刻起t3個(gè)小時(shí)的所有預(yù)報(bào)值作為輸入數(shù)據(jù),構(gòu)成(t2+t3)維的輸入向量。然后,同樣采用多個(gè)卷積窗口,對(duì)輸入向量進(jìn)行卷積運(yùn)算。最終每個(gè)外部影響因素均生成一個(gè)特征向量,其中第r個(gè)外部影響因素(r∈{1,2,…,R},R為外部影響因素個(gè)數(shù))的特征向量為e1,r。
不同外部因素對(duì)行業(yè)負(fù)荷受的影響程度不盡相同,因此在進(jìn)行各個(gè)行業(yè)的電力負(fù)荷預(yù)測(cè)時(shí),應(yīng)充分考慮行業(yè)負(fù)荷與各個(gè)外部影響因素的關(guān)聯(lián)性強(qiáng)弱。為此,采用第3章基于標(biāo)準(zhǔn)互信息的改進(jìn)關(guān)聯(lián)分析得到的關(guān)聯(lián)性結(jié)果,作為負(fù)荷預(yù)測(cè)網(wǎng)絡(luò)的超參數(shù),融合到負(fù)荷預(yù)測(cè)網(wǎng)絡(luò)結(jié)構(gòu)中,從而構(gòu)建計(jì)及外部影響因素關(guān)聯(lián)性的行業(yè)短期負(fù)荷預(yù)測(cè)網(wǎng)絡(luò),如圖2所示。
圖2 行業(yè)短期負(fù)荷預(yù)測(cè)網(wǎng)絡(luò)Fig.2 Short-term load forecasting network for industries
首先,按照4.1節(jié)的方法,基于卷積神經(jīng)網(wǎng)絡(luò)對(duì)歷史負(fù)荷和外部影響因素?cái)?shù)據(jù)進(jìn)行特征提取,得到歷史負(fù)荷特征向量e0和外部影響因素特征向量e1,1到e1,R。
然后,在預(yù)測(cè)某一行業(yè)的電力負(fù)荷時(shí),采用第3章基于標(biāo)準(zhǔn)互信息的改進(jìn)關(guān)聯(lián)分析方法得到的關(guān)聯(lián)性結(jié)果,即行業(yè)負(fù)荷與各個(gè)外部影響因素之間的標(biāo)準(zhǔn)互信息值,作為權(quán)重超參數(shù)。具體做法為:將行業(yè)負(fù)荷與第r個(gè)外部影響因素(r∈{1,2,…,R},R為外部影響因素個(gè)數(shù))的標(biāo)準(zhǔn)互信息值記為J0,r,對(duì)標(biāo)準(zhǔn)互信息值進(jìn)行歸一化處理,得到行業(yè)負(fù)荷與第r個(gè)外部影響因素的歸一化標(biāo)準(zhǔn)互信息值J1,r:
并以J1,r為第r個(gè)外部影響因素的特征向量e1,r的權(quán)重,將所有外部影響因素特征向量加權(quán)求和,得到融合向量e2:
最后,將歷史負(fù)荷數(shù)據(jù)的特征向量e0和融合向量e2進(jìn)行拼接,得到拼接向量e3:
再使用SVR(支持向量回歸)模型對(duì)拼接向量e3進(jìn)行預(yù)測(cè),得到待預(yù)測(cè)時(shí)刻的負(fù)荷預(yù)測(cè)值。
實(shí)驗(yàn)采用某地區(qū)電網(wǎng)公司2016—2020 年的電力負(fù)荷數(shù)據(jù),該地區(qū)的電力用戶按所屬行業(yè)性質(zhì)可分為工業(yè)、商業(yè)、公共事業(yè)和居民用戶,通過(guò)配電變壓器和用戶的對(duì)應(yīng)關(guān)系,統(tǒng)計(jì)用戶所屬行業(yè)及其用電負(fù)荷,可收集各個(gè)行業(yè)的負(fù)荷數(shù)據(jù),同時(shí)采集溫度、相對(duì)濕度、風(fēng)速、降水量、是否節(jié)假日等外部影響因素?cái)?shù)據(jù)進(jìn)行實(shí)驗(yàn),數(shù)據(jù)的采樣間隔均為1 h,其中節(jié)假日因素由于只有1 或0兩種取值,因此在關(guān)聯(lián)分析前無(wú)需對(duì)其進(jìn)行聚類處理。將2016—2019 年的數(shù)據(jù)作為訓(xùn)練集,用于計(jì)算各行業(yè)負(fù)荷與各種外部影響因素的關(guān)聯(lián)性,并訓(xùn)練行業(yè)短期負(fù)荷預(yù)測(cè)網(wǎng)絡(luò);2020 年的數(shù)據(jù)作為測(cè)試集,用于測(cè)試本文所提方法的預(yù)測(cè)效果。
為評(píng)估行業(yè)短期負(fù)荷和地區(qū)電網(wǎng)總負(fù)荷預(yù)測(cè)的精度,采用MAPE(平均絕對(duì)百分比誤差)作為一個(gè)評(píng)價(jià)指標(biāo)。同時(shí),在評(píng)估負(fù)荷預(yù)測(cè)精度的基礎(chǔ)上,采用RMSE(均方根誤差)指標(biāo)對(duì)預(yù)測(cè)結(jié)果圍繞實(shí)際值的波動(dòng)程度進(jìn)行衡量,以評(píng)估負(fù)荷預(yù)測(cè)結(jié)果的穩(wěn)定性。
設(shè)共有D個(gè)待預(yù)測(cè)時(shí)刻,每個(gè)時(shí)刻的負(fù)荷預(yù)測(cè)值為y(d)(d∈{1,2,…,D}),負(fù)荷實(shí)際值為y0(d),則MAPE指標(biāo)計(jì)算方法為:
RMSE指標(biāo)計(jì)算方法為:
實(shí)驗(yàn)對(duì)照模型的設(shè)置,主要從是否對(duì)k-means聚類算法進(jìn)行優(yōu)化、是否對(duì)關(guān)聯(lián)分析方法進(jìn)行改進(jìn)、是否在負(fù)荷預(yù)測(cè)網(wǎng)絡(luò)設(shè)計(jì)中計(jì)及外部影響因素關(guān)聯(lián)性這3個(gè)方面進(jìn)行考慮,對(duì)應(yīng)地設(shè)置3個(gè)對(duì)照模型組A、B、C,如表3 所示。對(duì)照模型組A包括A1、A2、A3 3 個(gè)對(duì)照模型,采用不經(jīng)過(guò)優(yōu)化的原始k-means 聚類算法對(duì)原始數(shù)據(jù)進(jìn)行聚類處理,并分別指定聚類簇?cái)?shù)k為3、6、9;對(duì)照模型組B包括B1、B2、B3 3個(gè)對(duì)照模型,分別采用無(wú)聚類的標(biāo)準(zhǔn)互信息、Pearson 相關(guān)系數(shù)、t-Copula 相關(guān)系數(shù)進(jìn)行關(guān)聯(lián)分析;對(duì)照模型組C 包括C1、C2 2 個(gè)對(duì)照模型,其中C1 模型不計(jì)及外部影響因素的作用,在負(fù)荷預(yù)測(cè)網(wǎng)絡(luò)中不生成融合向量e2,只通過(guò)歷史負(fù)荷特征向量e0進(jìn)行負(fù)荷預(yù)測(cè),C2 模型不計(jì)及外部影響因素關(guān)聯(lián)性的作用,在負(fù)荷預(yù)測(cè)網(wǎng)絡(luò)中將所有代表關(guān)聯(lián)性的權(quán)重超參數(shù)J1,r均設(shè)置為1/R,即對(duì)各個(gè)外部影響因素特征向量e1,r等權(quán)重求和。
表3 對(duì)照模型設(shè)置情況Table 3 Settings of controlled models
經(jīng)過(guò)預(yù)實(shí)驗(yàn)的參數(shù)尋優(yōu),將歷史負(fù)荷輸入向量維數(shù)t1設(shè)置為72,外部影響因素輸入向量相關(guān)參數(shù)t2和t3分別設(shè)置為72 和24,對(duì)每個(gè)輸入向量均采用30 個(gè)3×1 維、30 個(gè)6×1 維和30 個(gè)12×1維的卷積窗口進(jìn)行卷積運(yùn)算。
實(shí)驗(yàn)采用基于標(biāo)準(zhǔn)互信息的改進(jìn)關(guān)聯(lián)分析方法對(duì)訓(xùn)練集各行業(yè)負(fù)荷與各種外部影響因素的關(guān)聯(lián)性進(jìn)行分析,得到每個(gè)行業(yè)的負(fù)荷與各種外部影響因素的歸一化標(biāo)準(zhǔn)互信息,即關(guān)聯(lián)性結(jié)果,如圖3所示。
圖3 行業(yè)負(fù)荷與外部影響因素關(guān)聯(lián)性Fig.3 Correlation between industry load and external influencing factors
從圖3可以看出,該地區(qū)對(duì)各行業(yè)負(fù)荷有較大影響的外部因素主要是溫度和節(jié)假日,但不同行業(yè)的負(fù)荷與兩者關(guān)聯(lián)性的相對(duì)強(qiáng)弱也有所區(qū)別,工業(yè)和公共事業(yè)負(fù)荷與節(jié)假日因素的關(guān)聯(lián)性更強(qiáng),而商業(yè)和居民負(fù)荷與溫度因素的關(guān)聯(lián)性更強(qiáng)。除此之外,相對(duì)濕度對(duì)于各個(gè)行業(yè)負(fù)荷的影響比重較為均勻,而風(fēng)速對(duì)于工業(yè)負(fù)荷的影響比重明顯高于其他三類行業(yè)負(fù)荷,降水量對(duì)于公共事業(yè)負(fù)荷的影響比重則明顯低于其他三類行業(yè)負(fù)荷。
結(jié)合上述關(guān)聯(lián)性結(jié)果,采用基于關(guān)聯(lián)分析和卷積神經(jīng)網(wǎng)絡(luò)的行業(yè)短期電力負(fù)荷預(yù)測(cè)模型對(duì)測(cè)試集各行業(yè)負(fù)荷進(jìn)行預(yù)測(cè),并將各行業(yè)負(fù)荷的預(yù)測(cè)值求和,得到地區(qū)電網(wǎng)總負(fù)荷的預(yù)測(cè)結(jié)果。同時(shí),用表3中的對(duì)照模型進(jìn)行同樣的實(shí)驗(yàn),并分別統(tǒng)計(jì)各個(gè)模型在測(cè)試集上的預(yù)測(cè)結(jié)果,得到相應(yīng)的MAPE和RMSE指標(biāo)如表4和表5所示。
表4 各行業(yè)負(fù)荷和總負(fù)荷預(yù)測(cè)MAPE值Table 4 The predicted MAPE values of industrial loads and total loads
從表4可以看出,本文模型在各個(gè)行業(yè)負(fù)荷和總負(fù)荷預(yù)測(cè)的MAPE 值均為最小,即對(duì)于各個(gè)行業(yè)負(fù)荷和總負(fù)荷的預(yù)測(cè)均有最高的準(zhǔn)確率。由于各個(gè)行業(yè)負(fù)荷預(yù)測(cè)值求和時(shí)有部分誤差會(huì)相互抵消,因此每個(gè)模型總負(fù)荷的MAPE 值均低于單個(gè)行業(yè)的MAPE值。進(jìn)一步分析可以發(fā)現(xiàn):
1)A 組的A1、A2、A3 模型雖然通過(guò)聚類處理提高了關(guān)聯(lián)分析的準(zhǔn)確性,相比于不經(jīng)過(guò)聚類處理的B1模型預(yù)測(cè)準(zhǔn)確率有較大提升。但因?yàn)榫垲惔財(cái)?shù)k需要人為指定,無(wú)法根據(jù)不同外部影響因素和行業(yè)負(fù)荷數(shù)據(jù)的特點(diǎn)進(jìn)行自適應(yīng)變化,因而影響了聚類的效果,預(yù)測(cè)誤差相比于采用優(yōu)化kmeans聚類的本文模型也更大。
2)B組模型中,B1和B2模型的MAPE值相對(duì)較高,說(shuō)明直接采用未聚類的標(biāo)準(zhǔn)互信息關(guān)聯(lián)分析方法,或者Pearson相關(guān)系數(shù),均難以準(zhǔn)確地衡量外部影響因素與行業(yè)負(fù)荷之間的非線性相關(guān)性,導(dǎo)致行業(yè)負(fù)荷預(yù)測(cè)的精度受到影響。相比而言,B3模型的預(yù)測(cè)精度有所提高,可以較好地衡量非線性相關(guān)性,但由于Copula 函數(shù)的相關(guān)性分析結(jié)果會(huì)受到數(shù)據(jù)本身分布特點(diǎn)的影響,對(duì)不同行業(yè)負(fù)荷數(shù)據(jù)的適應(yīng)性不足,整體上預(yù)測(cè)誤差仍大于本文模型。
3)C 組模型中,不計(jì)及外部影響因素的C1 模型在所有模型中預(yù)測(cè)誤差最大,說(shuō)明外部影響因素對(duì)于各個(gè)行業(yè)負(fù)荷的變化均有較為顯著的影響,僅利用行業(yè)歷史負(fù)荷數(shù)據(jù)無(wú)法準(zhǔn)確捕捉未來(lái)負(fù)荷的變化規(guī)律。C2 模型的MAPE 值整體上也比較高,說(shuō)明在不計(jì)及外部影響因素關(guān)聯(lián)分析結(jié)果的情況下,僅依靠機(jī)器學(xué)習(xí)模型自主學(xué)習(xí)不同外部因素對(duì)不同行業(yè)負(fù)荷的影響,仍難以較好地適應(yīng)外部因素與行業(yè)負(fù)荷之間復(fù)雜多變的相關(guān)關(guān)系。
從表5可以看出,本文模型在各個(gè)行業(yè)負(fù)荷和總負(fù)荷預(yù)測(cè)的RMSE 值均為最小,說(shuō)明本文模型的預(yù)測(cè)結(jié)果圍繞負(fù)荷實(shí)際值的波動(dòng)程度最小,負(fù)荷預(yù)測(cè)結(jié)果具有良好的穩(wěn)定性。未考慮外部影響因素的對(duì)照模型C1在各行業(yè)負(fù)荷預(yù)測(cè)中具有最大的RMSE 值,表明對(duì)外部影響因素的分析對(duì)于跟蹤行業(yè)負(fù)荷的變化有重要意義。另外,雖然對(duì)照模型B3 與本文模型在MAPE 值上最接近,但RMSE 值與本文模型仍有較大的差距,主要是由于本文模型除了能準(zhǔn)確地分析行業(yè)負(fù)荷與溫度、節(jié)假日的關(guān)聯(lián)性,對(duì)相對(duì)濕度、降水量等次要影響因素的關(guān)聯(lián)分析結(jié)果也較為準(zhǔn)確,因此預(yù)測(cè)誤差的離散程度更小,預(yù)測(cè)結(jié)果有更好的穩(wěn)定性。
為了更直觀地對(duì)比本文模型與各對(duì)照模型的預(yù)測(cè)結(jié)果差異,從測(cè)試集中截取48 h 的總負(fù)荷預(yù)測(cè)結(jié)果,其中前24 h 屬于工作日,后24 h 屬于節(jié)假日,繪制實(shí)際負(fù)荷曲線與各個(gè)實(shí)驗(yàn)?zāi)P偷念A(yù)測(cè)負(fù)荷曲線。對(duì)照模型組A、B、C與本文模型的對(duì)比結(jié)果分別如圖4—6所示。
圖4 對(duì)照模型組A與本文模型的對(duì)比結(jié)果Fig.4 Comparison results between controlled model group A and the proposed model
從圖4可以看出,A1、A2、A3模型和本文模型均采用了“聚類+標(biāo)準(zhǔn)互信息”的改進(jìn)關(guān)聯(lián)分析方法,總負(fù)荷的預(yù)測(cè)曲線基本能夠較好地跟蹤實(shí)際負(fù)荷的變化趨勢(shì),但由于A1、A2、A3 模型的聚類方法未進(jìn)行優(yōu)化,進(jìn)而影響了數(shù)據(jù)聚類效果和后續(xù)的關(guān)聯(lián)分析準(zhǔn)確性,因此相比于本文模型仍有更大的預(yù)測(cè)誤差。
從圖5 可以看出,本文模型和B3 模型能較好地模擬實(shí)際負(fù)荷曲線,尤其是在負(fù)荷高峰和低谷時(shí)能比較準(zhǔn)確地跟蹤負(fù)荷的變化,同時(shí)本文模型更少出現(xiàn)與實(shí)際負(fù)荷相差較大的預(yù)測(cè)點(diǎn),因此RMSE 值相對(duì)于B3 模型有比較明顯的優(yōu)勢(shì);B1、B2 模型對(duì)行業(yè)負(fù)荷與外部影響因素的關(guān)聯(lián)性分析不夠準(zhǔn)確,影響了負(fù)荷預(yù)測(cè)的整體精度,特別是在負(fù)荷高峰和低谷時(shí)難以準(zhǔn)確跟蹤負(fù)荷的變化。
圖5 對(duì)照模型組B與本文模型的對(duì)比結(jié)果Fig.5 Comparison results between controlled model group B and the proposed model
從圖6 可以看出,C1 模型未計(jì)及外部影響因素的作用,只能從歷史負(fù)荷中挖掘有限的信息進(jìn)行負(fù)荷預(yù)測(cè),無(wú)法有效捕捉到外部影響因素對(duì)各行業(yè)負(fù)荷的影響,因此預(yù)測(cè)負(fù)荷曲線與實(shí)際負(fù)荷曲線存在明顯的偏差;C2模型雖有考慮外部影響因素,但未對(duì)外部影響因素與各行業(yè)負(fù)荷的關(guān)聯(lián)性進(jìn)行分析,負(fù)荷預(yù)測(cè)準(zhǔn)確性與本文模型相比仍有較大差距。另外,為了說(shuō)明本文模型在進(jìn)行短期負(fù)荷預(yù)測(cè)時(shí)對(duì)不同行業(yè)的用戶分別進(jìn)行負(fù)荷預(yù)測(cè)的意義,另設(shè)計(jì)一個(gè)不區(qū)分用戶所屬行業(yè)的對(duì)照模型D1。D1的總負(fù)荷預(yù)測(cè)結(jié)果不通過(guò)各行業(yè)負(fù)荷預(yù)測(cè)值求和得到,而是采用第2、3 章的方法分析總負(fù)荷與各外部影響因素的關(guān)聯(lián)性后,采用第4章的方法直接對(duì)總負(fù)荷進(jìn)行預(yù)測(cè)。統(tǒng)計(jì)預(yù)測(cè)結(jié)果后得到相應(yīng)的MAPE和RMSE指標(biāo)如表6所示。
表6 對(duì)照模型D1與本文模型的總負(fù)荷預(yù)測(cè)結(jié)果Table 6 The predicted total loads of controlled model D1 and the proposed model
圖6 對(duì)照模型組C與本文模型的對(duì)比結(jié)果Fig.6 Comparison results between controlled model group C and the proposed model
從表6 可以看出,D1 模型的總負(fù)荷預(yù)測(cè)MAPE 值和RMSE 值均高于本文模型,說(shuō)明本文模型針對(duì)每個(gè)行業(yè)分別進(jìn)行關(guān)聯(lián)分析和神經(jīng)網(wǎng)絡(luò)訓(xùn)練后,可以更好地?cái)M合各個(gè)行業(yè)負(fù)荷的變化規(guī)律,提高行業(yè)負(fù)荷預(yù)測(cè)的準(zhǔn)確性,進(jìn)而提升總負(fù)荷預(yù)測(cè)的效果。
本文提出了一種基于關(guān)聯(lián)分析和卷積神經(jīng)網(wǎng)絡(luò)的行業(yè)短期電力負(fù)荷預(yù)測(cè)模型,通過(guò)算例分析,得到主要結(jié)論如下:
1)通過(guò)平均輪廓系數(shù)確定最佳k值,優(yōu)化了k-means聚類算法,提升了外部影響因素和行業(yè)負(fù)荷原始數(shù)據(jù)的聚類處理效果。
2)通過(guò)以標(biāo)準(zhǔn)互信息為關(guān)聯(lián)性指標(biāo),并用聚類后的數(shù)據(jù)替換原始數(shù)據(jù),改進(jìn)了關(guān)聯(lián)分析方法,實(shí)現(xiàn)了外部影響因素與行業(yè)負(fù)荷關(guān)聯(lián)性的準(zhǔn)確定量分析。
3)設(shè)計(jì)了一種計(jì)及外部影響因素關(guān)聯(lián)性的負(fù)荷預(yù)測(cè)網(wǎng)絡(luò),將關(guān)聯(lián)性分析結(jié)果作為超參數(shù)融合到負(fù)荷預(yù)測(cè)網(wǎng)絡(luò)中,提升了對(duì)不同行業(yè)短期電力負(fù)荷預(yù)測(cè)的準(zhǔn)確性。
目前負(fù)荷數(shù)據(jù)通過(guò)配變和用戶的對(duì)應(yīng)關(guān)系,能劃分到用戶所屬的行業(yè),后續(xù)可通過(guò)配電網(wǎng)臺(tái)賬信息的完善和細(xì)化,研究對(duì)用戶屬性進(jìn)行更加細(xì)分的方法,進(jìn)一步提高地區(qū)電網(wǎng)短期負(fù)荷預(yù)測(cè)的準(zhǔn)確性。