楊 婧 安 江
(貴州電網(wǎng)有限責(zé)任公司計(jì)量中心 貴陽 550000)
眾所周知,電力負(fù)荷預(yù)測(cè)一直是電力系統(tǒng)運(yùn)行的關(guān)鍵工具[1]。許多運(yùn)營(yíng)決策都基于負(fù)荷預(yù)測(cè),例如發(fā)電機(jī)的調(diào)度調(diào)度、可靠性分析和發(fā)電機(jī)的維護(hù)計(jì)劃,特別是隨著全球電力行業(yè)放松管制和自由競(jìng)爭(zhēng)的加劇,負(fù)荷預(yù)測(cè)變得比以往任何時(shí)候都更加重要[2]。同時(shí),負(fù)荷預(yù)測(cè)對(duì)于競(jìng)爭(zhēng)性電力市場(chǎng)中的能源交易至關(guān)重要。此外,準(zhǔn)確地估計(jì)負(fù)荷是電價(jià)預(yù)測(cè)的關(guān)鍵步驟。預(yù)測(cè)錯(cuò)誤對(duì)利潤(rùn)、市場(chǎng)份額以及最終的股東價(jià)值具有重要指導(dǎo)意義[3]。然而,由于市場(chǎng)參與者的動(dòng)態(tài)競(jìng)價(jià)策略和依賴于價(jià)格的負(fù)荷多變性和非平穩(wěn)性,電力負(fù)荷越來越難以預(yù)測(cè)。因此現(xiàn)代電力系統(tǒng)需要更高精度和更復(fù)雜的預(yù)測(cè)工具。
在過去的幾年中,針對(duì)負(fù)荷預(yù)測(cè)問題[1]已經(jīng)嘗試了各種各樣的技術(shù),其中大多數(shù)是基于時(shí)間序列分析。時(shí)間序列模型主要包括基于統(tǒng)計(jì)方法和基于人工神經(jīng)網(wǎng)絡(luò)(ANN)的方法。統(tǒng)計(jì)模型是基于系統(tǒng)精確模型的硬計(jì)算技術(shù),包括隨機(jī)過程[1]、數(shù)據(jù)挖掘方法[2]、移動(dòng)平均和指數(shù)平滑方法[2]、線性回歸模型[3]、移動(dòng)平均(ARMA)模型[4]、Box-Jenkins方法[5]和基于卡爾曼濾波的方法[6]?;旧?,大多數(shù)統(tǒng)計(jì)方法都是基于線性分析。然而負(fù)荷序列通常是外生變量的非線性函數(shù)。因此,為了適應(yīng)非線性,人工神經(jīng)網(wǎng)絡(luò)在解決負(fù)荷預(yù)測(cè)問題方面受到了更多的關(guān)注[7~10]。神經(jīng)網(wǎng)絡(luò)不僅能夠?qū)W習(xí)時(shí)間序列的負(fù)荷曲線,而且能夠模擬負(fù)荷和天氣變量之間未指明的非線性關(guān)系。其中,基于機(jī)器學(xué)習(xí)技術(shù)和支持向量機(jī)(SVM)的預(yù)測(cè)方法已廣泛應(yīng)用于電力負(fù)荷的預(yù)測(cè),并取得了良好的測(cè)試性能[11~12]。
本文重點(diǎn)關(guān)注短期負(fù)荷預(yù)測(cè)(STLF),特別是預(yù)測(cè)日前負(fù)荷情況,重點(diǎn)解決負(fù)荷序列的非平穩(wěn)性、預(yù)測(cè)模型的適應(yīng)性和預(yù)測(cè)工具的魯棒性。提出了一種基于自組織映射(SOM)和支持向量機(jī)(SVM)自適應(yīng)混合算法分兩階段預(yù)測(cè)短期電力負(fù)荷,該方法采用具有兩階段自適應(yīng)混合架構(gòu)的非平穩(wěn)模型。采用貴陽市獨(dú)立系統(tǒng)運(yùn)營(yíng)商(ISO)的負(fù)荷曲線數(shù)據(jù)來驗(yàn)證所提出方法的學(xué)習(xí)和預(yù)測(cè)的有效性。利用平均絕對(duì)百分誤差(MAPE)和平均絕對(duì)誤差(MAE)作為性能比較的標(biāo)準(zhǔn),表明了召回的準(zhǔn)確性。此外,為了比較研究,還使用支持向量機(jī)檢查了網(wǎng)絡(luò)。本文還給出了詳細(xì)的數(shù)值結(jié)果和討論過程中的誤差。
本文通過與貴陽市國(guó)家電網(wǎng)有限公司(SGCC)的預(yù)測(cè)結(jié)果比較,將貴陽市的每小時(shí)電力需求序列為例進(jìn)行驗(yàn)證。為了建立一個(gè)合適的模型,研究每小時(shí)負(fù)載系列的主要特征。圖1為2017年7月1日到2018年6月30日的電力需求。
根據(jù)圖1(a)所示,負(fù)荷特征具有多個(gè)季節(jié)性模式,分別對(duì)應(yīng)于每日和每周的周期性,并且還受節(jié)假日的影響,例如周末和假期。有時(shí)電力需求呈現(xiàn)高波動(dòng)性和非恒定均值。本文可以得出一個(gè)結(jié)論:由于市場(chǎng)和季節(jié)效應(yīng),在時(shí)間序列中存在不同的模式,這通常引起分段式的平穩(wěn)性?;谶@樣的分析,本文使用混合模型將非平穩(wěn)價(jià)格的數(shù)據(jù)集分類為具有不同特征的若干子集,例如:分段靜止數(shù)據(jù)子集,這與傳統(tǒng)方法相比,可以獲得較精確的預(yù)測(cè)結(jié)果。
本文接下來分析負(fù)荷和溫度之間的相關(guān)性。眾所周知,溫度信息對(duì)于負(fù)荷預(yù)測(cè)非常重要。然而,負(fù)荷和溫度之間的相關(guān)性并不總是恒定的或線性的。例如,相同時(shí)間點(diǎn)的負(fù)荷和溫度之間的相關(guān)系數(shù)通常具有針對(duì)不同季節(jié)和不同負(fù)荷預(yù)測(cè)問題的各種值。這一事實(shí)解釋了為什么有些研究表明負(fù)荷對(duì)溫度非常敏感,而另一些研究則表明溫度不會(huì)對(duì)負(fù)荷產(chǎn)生很大影響[11]。因此,本文有必要分析特定系統(tǒng)的負(fù)荷和溫度之間的固有相關(guān)性。圖1(b)顯示了2017年7月1日到2018年6月30日貴陽市的負(fù)荷和溫度之間的相關(guān)性。
圖1 貴陽市電力負(fù)荷
如圖1(b)所示,在負(fù)荷和溫度之間存在大致相關(guān)的分段線性關(guān)系,其差異約10℃,可以使用以下公式計(jì)算每個(gè)階段中的相關(guān)性:
其中,Cov( d,y )是負(fù)荷d 和y 的協(xié)方差,σd和σy是d 和y 的標(biāo)準(zhǔn)偏差。 ρd,y=1 表示完全的線性相關(guān),而中間值表示部分相關(guān),而ρd,y=0 表示沒有相關(guān)性。
圖1(b)中的虛線表示兩個(gè)分段之間的分離點(diǎn),這是通過最大化分段上的兩個(gè)相關(guān)系數(shù)而獲得的。根據(jù)本文的計(jì)算,分離點(diǎn)大約是12℃,兩個(gè)分段上的ρd,y分別為-0.19 和0.69。本文將在下一節(jié)的負(fù)荷數(shù)據(jù)集建模中使用這些信息。
在本文中,基于時(shí)間序列的非線性離散時(shí)間動(dòng)力學(xué)模型的負(fù)荷預(yù)測(cè)由式(2)表示:
其中,y( t )表示時(shí)間t 的電力負(fù)荷曲線向量,m 是動(dòng)態(tài)系統(tǒng)的階數(shù),它是一個(gè)預(yù)設(shè)的常數(shù)。T 是表示動(dòng)力系統(tǒng)的控制參數(shù)的矢量,例如溫度、濕度、風(fēng)速和日期類型等。STLF 中的任務(wù)是推斷過去的負(fù)荷行為,同時(shí)也考慮其他影響因素的影響。
自適應(yīng)混合網(wǎng)絡(luò)的可觀測(cè)量的時(shí)間序列可以來重建電負(fù)荷消耗的動(dòng)態(tài)特征。本文提出的網(wǎng)絡(luò)如圖2所示。
圖2 電力負(fù)荷預(yù)測(cè)的混合模型
該模型基于兩階段架構(gòu),在第一階段,應(yīng)用SOM 網(wǎng)絡(luò)以非無人監(jiān)督的方式將輸入訓(xùn)練數(shù)據(jù)集聚類成具有相似動(dòng)態(tài)特性的若干子集。在此階段,本文還將輸入數(shù)據(jù)分為兩組:常規(guī)日和異常日。然后,在第二階段中,使用若干組24個(gè)SVM 以監(jiān)督方式擬合每個(gè)子集中的訓(xùn)練數(shù)據(jù)。換句話說,取決于它們的平穩(wěn)性以及其他動(dòng)態(tài)特征,該方法將時(shí)間序列分成不同的段或子集,由于相似的屬性,同一段中的數(shù)據(jù)可以由相同的SVR 建模。值得注意的是每個(gè)子集有24 個(gè)SVR,分別用于訓(xùn)練和預(yù)測(cè)第二天的24小時(shí)負(fù)荷。
如圖2 所示,SOM 和SVM 網(wǎng)絡(luò)的輸入變量不同,輸入變量見表1、表2和表3。
如表1 所示,SOM 的輸入數(shù)據(jù)由六個(gè)元素組成:負(fù)荷矢量L0,溫度矢量T0,濕度標(biāo)量H ,風(fēng)速標(biāo)量W 和日期類型矢量D,兩個(gè)二進(jìn)制代碼作為周末和假日指示(周末和假日為1,其他日子為0)。如前一節(jié)所述,本文使用溫度靈敏度系數(shù)來表示負(fù)荷和溫度之間的不同相關(guān)性。如果溫度大于12℃,則該系數(shù)設(shè)置為1,否則設(shè)置為0。考慮到短時(shí)間內(nèi)溫度和濕度的不斷變化,本文應(yīng)用這兩個(gè)元素的最大值來提高靈敏度。相反地,由于風(fēng)速的變化通常是隨機(jī)的,本文使用平均值。因此,SOM 網(wǎng)絡(luò)總共有九個(gè)輸入變量,預(yù)計(jì)可以識(shí)別負(fù)荷序列中的開關(guān)動(dòng)態(tài)特征。
除了預(yù)測(cè)溫度和實(shí)際溫度之外,SVM的輸入變量是可用的最后一天的每小時(shí)負(fù)荷值以及前幾天或幾周中的類似小時(shí)數(shù)。在實(shí)際電力系統(tǒng)中,存在許多異常情況,例如周末、假期、故障后的突然變化和體育賽事等。這種異常日期說明加載預(yù)測(cè)是一項(xiàng)非常艱巨的任務(wù),因?yàn)檫@些非典型負(fù)荷條件很少,并且與常規(guī)工作日完全不同。因此,本文有必要在常規(guī)日和第二階段的異常日使用不同的饋線。本文所提出的方法需能夠分別處理常規(guī)天和異常天,并且能在編程的網(wǎng)格切換操作下執(zhí)行負(fù)荷預(yù)測(cè)。常規(guī)日的SVM網(wǎng)絡(luò)的輸入數(shù)據(jù)如表2所示。
表1 SOM網(wǎng)絡(luò)的輸入數(shù)據(jù)
表2 常規(guī)日SVM網(wǎng)絡(luò)的輸入數(shù)據(jù)
常規(guī)日訓(xùn)練數(shù)據(jù)的輸入包括過去的每小時(shí)負(fù)荷需求和預(yù)測(cè)的溫度。為了捕獲負(fù)荷中的時(shí)間序列模式,本文預(yù)測(cè)了前七天的電力負(fù)荷。因?yàn)闇囟茸兓ǔT谪?fù)荷變化之前,使用比預(yù)測(cè)時(shí)間提前一小時(shí)和兩小時(shí)的溫度信息。本文的實(shí)驗(yàn)表明,只輸入集中包含的預(yù)測(cè)日的溫度,不能產(chǎn)生準(zhǔn)確的預(yù)測(cè)結(jié)果,所以在包含負(fù)荷的每個(gè)時(shí)間點(diǎn)都會(huì)添加溫度變量。
除周末外,如何處理假期也是一個(gè)重要問題。用于預(yù)測(cè)常規(guī)日的輸入數(shù)據(jù)可以包括除周末之外的異常天數(shù)。例如當(dāng)本文預(yù)測(cè)1月2日的負(fù)荷情況時(shí),用于預(yù)測(cè)的輸入數(shù)據(jù)通常包括1 月1 日的假日數(shù)據(jù)。在這種情況下,一般負(fù)荷序列被擾亂,這導(dǎo)致預(yù)測(cè)性能偏差。因此,在本文中SVM 的輸入不使用異常日的實(shí)際負(fù)荷數(shù)據(jù),而是使用當(dāng)天的預(yù)測(cè)負(fù)荷數(shù)據(jù),因?yàn)樗浅R?guī)日。
根據(jù)歷史負(fù)荷數(shù)據(jù),同一類型的假期顯示出與往年相似的負(fù)荷分布趨勢(shì)。以前的工作已經(jīng)表明,應(yīng)該針對(duì)常規(guī)日和異常天開發(fā)不同的方案[16]。例如,一些研究得出的結(jié)論是,假日的負(fù)荷圖與當(dāng)天之前的兩個(gè)星期六以及最新的可用圖表有很強(qiáng)的聯(lián)系,假期的預(yù)測(cè)應(yīng)該作為周末行為的函數(shù)進(jìn)行評(píng)估。基于上述分析,本文選擇了異常天的SVM 網(wǎng)絡(luò)的輸入數(shù)據(jù),如表3所示。
SVM 網(wǎng)絡(luò)在常規(guī)日和異常日之間的輸入數(shù)據(jù)的差異如表3 所示。除了最近兩天的負(fù)荷數(shù)據(jù)外,還使用了八個(gè)輸入變量表示在預(yù)測(cè)異常天數(shù)之前的兩個(gè)周末的預(yù)測(cè)小時(shí)周圍的負(fù)荷數(shù)據(jù)。所有輸入變量都是基于以下假設(shè)選擇的:負(fù)荷預(yù)測(cè)是在第二天的午夜進(jìn)行,時(shí)間設(shè)為零,這意味著前一天的所有小時(shí)負(fù)荷都是已知的。另一方面,如果在午夜之前執(zhí)行預(yù)測(cè),則SVM 的輸入將不包括當(dāng)天的圖表(滯后小時(shí)從24h 到47h),因?yàn)樗鼈儾皇峭耆捎玫摹?/p>
由于電力負(fù)荷的動(dòng)態(tài)特征與訓(xùn)練數(shù)據(jù)集的離散變化相關(guān)的切換性質(zhì),其在短時(shí)間內(nèi)是非平穩(wěn)的或近似分段靜止的。在本文中,SOM網(wǎng)絡(luò)用作門控網(wǎng)絡(luò),用以識(shí)別第一階段輸入訓(xùn)練數(shù)據(jù)集的切換或分段靜態(tài)動(dòng)態(tài)。
SOM是一種無監(jiān)督的神經(jīng)模型,旨在建立未標(biāo)記數(shù)據(jù)集的矢量之間鄰域關(guān)系[19~20]。二維SOM 網(wǎng)絡(luò)的結(jié)構(gòu)如圖3 所示。SOM 中的神經(jīng)元被放在一維、兩維或三維陣列的輸出層A 中。每個(gè)神經(jīng)元i具有權(quán)重向量ω,其具有與輸入向量X=(y(t),…,y(t-m+1),D)相同的維度,其存儲(chǔ)了關(guān)于正在研究的映射的輸入和輸出的信息。在輸出矢量的呈現(xiàn)之后,根據(jù)競(jìng)爭(zhēng)協(xié)作方案訓(xùn)練網(wǎng)絡(luò)權(quán)重,更新獲勝神經(jīng)元及其輸出陣列中的鄰居的權(quán)重向量。
圖3 SOM網(wǎng)絡(luò)
學(xué)習(xí)過程包括一系列訓(xùn)練步驟。在訓(xùn)練階段,基于訓(xùn)練樣本X 的輸入,來確定在步驟n 處的獲勝神經(jīng)元i*,如公式所示:
這意味著神經(jīng)元i*具有所有輸出層A 的神經(jīng)元中的權(quán)重向量ωi與輸入向量X 之間的最小距離。用于更新權(quán)重的學(xué)習(xí)規(guī)則如以下公式所示:
其中,α( n )是學(xué)習(xí)速率,而hii*是由下列公式得到:
其中,ri( n )和分別是神經(jīng)元i 和i*的位置。σ( n )確定鄰域的大小,α( n )和σ( n )的數(shù)值首先會(huì)相應(yīng)較大,以便快速適應(yīng)神經(jīng)元,并且它們隨迭代次數(shù)快速衰減:
其中,αi和σi表示它們的初始值,αf和σf是最終值,N 是總迭代次數(shù)。式(6)實(shí)際上類似于模擬退火過程的冷卻時(shí)間表[20~21]。
在訓(xùn)練完成之后,SOM網(wǎng)絡(luò)可以用于識(shí)別輸入數(shù)據(jù)子集的類型:
其中,獲勝神經(jīng)元i*的數(shù)量可在式(3)中找到。由于SOM 是一個(gè)無監(jiān)督網(wǎng)絡(luò),它能夠以無人監(jiān)督的方式將輸入訓(xùn)練或測(cè)試數(shù)據(jù)集分解為具有特定特征的若干子集,例如季節(jié)相關(guān)數(shù)據(jù)或分段靜止數(shù)據(jù),SOM 隨后將在下一個(gè)SVR 訓(xùn)練和預(yù)測(cè)中加以考慮。
從分類中可以獲得的另一個(gè)好處是類似日子的組合。如上所述,在特殊情況下的異常時(shí)期,預(yù)測(cè)結(jié)果并不十分令人滿意,其原因是這些事件代表的只是基于歷史數(shù)據(jù)學(xué)習(xí)的算法的周統(tǒng)計(jì)樣本。本文沒有足夠的歷史數(shù)據(jù)來了解這些異常日子。但是如果本文可以找到與異常日相似的天數(shù)并將一些異常日合并為一組,那么異常日的訓(xùn)練樣本量將會(huì)增加,并且可能具有更好的預(yù)測(cè)性能。
在該階段,幾組SVR用于每個(gè)子集中的加載時(shí)間序列學(xué)習(xí)和預(yù)測(cè),并且每個(gè)SVR 對(duì)應(yīng)于一個(gè)時(shí)刻。假設(shè)本文給出了訓(xùn)練數(shù)據(jù)如{(xi,yi)},其中xi是輸入模式,并且yi是xi的相關(guān)輸出值,支持向量回歸分析解決了一個(gè)優(yōu)化問題:
其中,xi被映射通過函數(shù)Φ 到更高維度空間,是上訓(xùn)練誤差(ξi是更低)的松弛變量,受ε 不敏感管( ωTφ( xi)+b )-yi≤ε 的影響。常數(shù)C >0 確定平坦度和損失之間的權(quán)衡??刂苹貧w質(zhì)量的參數(shù)是誤差C 的成本、管ε 的寬度和映射函數(shù)Φ。
式(8)的約束意味著本文將大多數(shù)數(shù)據(jù)xi放在管ε 中。如果xi不在管中,則存在錯(cuò)誤ξi或ξi*,本文傾向于在目標(biāo)函數(shù)中最小化這些錯(cuò)誤,這可以在圖4 中看到。SVR 通過最小化訓(xùn)練誤差)以及正則化項(xiàng)來避免訓(xùn)練數(shù)據(jù)的欠擬合和過擬合。對(duì)于傳統(tǒng)的最小二乘回歸,ε始終為零,并且數(shù)據(jù)不會(huì)映射到更高維空間。因此,SVR是對(duì)回歸問題的更一般和靈活的處理。
圖4 SVR擬合曲線
由于Φ 可能將xi映射到高維或無限維空間,而不是在高維中求解式(8)中的ω,所以本文需處理其對(duì)偶問題:
其中,Qij=φ( xi)Tφ( xj),因?yàn)棣? x )的元素太多了,這個(gè)內(nèi)部產(chǎn)品的計(jì)算成本可能很高,所以本文應(yīng)用“內(nèi)核技巧”來隱式地進(jìn)行映射。也就是說,采用一些特殊的形式,可以在原始空間中計(jì)算更高空間的內(nèi)部產(chǎn)品。內(nèi)核函數(shù)的典型示例是多項(xiàng)式內(nèi)核和RBF 內(nèi)核(xj)=e-γ(x1-x2)2。它們是非常高維空間(或無限維空間)的內(nèi)積,即使不知道φ(x) ,也可以通過內(nèi)核技巧有效地計(jì)算。
由于從SOM 分類的每個(gè)數(shù)據(jù)子集被認(rèn)為是近似靜止的,因此通過利用所有過去的信息和類似的動(dòng)態(tài)特性,分別應(yīng)用24 個(gè)SVR 來擬合每小時(shí)電力負(fù)荷曲線數(shù)據(jù)。第二天的電力負(fù)荷由受過訓(xùn)練的網(wǎng)絡(luò)以SOM 和SVR 中的投票方式和可接受的準(zhǔn)確度來進(jìn)行預(yù)測(cè)。對(duì)于本文中的數(shù)值實(shí)驗(yàn),本文使用的是LIBSVM[22]軟件,它支持向量機(jī)的庫,包括式(9)的有效求解功能。
本文考慮了貴陽市的日常用電量和天氣數(shù)據(jù)。選擇了兩個(gè)典型月份來預(yù)測(cè)和驗(yàn)證所提出模型的性能。第一個(gè)對(duì)應(yīng)于2018年1月,這是一個(gè)需求旺盛的冬季。第二個(gè)對(duì)應(yīng)于2018年7月,這也是一個(gè)需求量很大的夏季月份。用于預(yù)測(cè)第一個(gè)月的每小時(shí)數(shù)據(jù)是從2017 年1 月1 日到2017 年12 月31日,一共365天。用于預(yù)測(cè)第二個(gè)月的每小時(shí)數(shù)據(jù)是從2017 年7 月1 日到2018 年6 月30 日,也 是366 天。由于貴陽市在2017 年8 月14 日經(jīng)歷了電力停電,因此從訓(xùn)練樣本中消除了一周的數(shù)據(jù),包括停電日和隨后的六天。通過鄰值間插值的方法,填補(bǔ)了一些載荷和溫度數(shù)據(jù)的缺失。
基本上大數(shù)據(jù)集是對(duì)抗過度擬合的有效方法。但是過去通過聚合數(shù)據(jù)來增加數(shù)據(jù)集的大小可能是不可行的,因?yàn)樨?fù)荷序列顯示出非常明顯的上升趨勢(shì),并且負(fù)荷模式在年復(fù)一年略有變化??紤]到本文的工作是用于學(xué)術(shù)研究,本文選擇一年的訓(xùn)練數(shù)據(jù)以簡(jiǎn)化。但是本文認(rèn)為應(yīng)該在實(shí)際應(yīng)用中使用更多的訓(xùn)練樣本,例如兩年。
測(cè)試集與訓(xùn)練集完全分開,并且測(cè)試集在學(xué)習(xí)過程中不被使用。因?yàn)檩^大的預(yù)測(cè)提前期并不一定意味著更大的預(yù)測(cè)誤差,這取決于不同時(shí)期的數(shù)據(jù)可變性。
如上所述,SOM 和SVM 的訓(xùn)練模式是不同的。SOM 的訓(xùn)練模式僅包括輸入數(shù)據(jù),而SVM 的訓(xùn)練模式由輸入-輸出對(duì)組成,SVM 訓(xùn)練模式的輸出是實(shí)際的每小時(shí)負(fù)荷。一旦經(jīng)過訓(xùn)練,建議的網(wǎng)絡(luò)就可用于預(yù)測(cè)第二天的每小時(shí)負(fù)荷。
輸入變量、負(fù)荷和其他變量分別在本文的程序中進(jìn)行了縮放。此過程可以設(shè)置具有統(tǒng)一范圍的輸入變量,這可以避免數(shù)值問題并使每個(gè)輸入變量具有相同的重要性。
在訓(xùn)練數(shù)據(jù)之前,本文仍然需要預(yù)處理訓(xùn)練樣本。如圖1 所示,訓(xùn)練數(shù)據(jù)中存在極高或極低的電力需求。其中一些是由高溫,發(fā)電機(jī)的緊急維護(hù)等隱含原因引起的。然而其他一些不能用可評(píng)估的原因來解釋,這可以被認(rèn)為是訓(xùn)練樣本中的噪聲。數(shù)據(jù)中的噪聲可能導(dǎo)致過度擬合和欠擬合問題。為了提高訓(xùn)練的準(zhǔn)確性,本文根據(jù)負(fù)荷和溫度之間的相關(guān)關(guān)系去除訓(xùn)練樣本中的噪聲數(shù)據(jù)。
本文已經(jīng)計(jì)算出兩組訓(xùn)練數(shù)據(jù)的歷史相關(guān)性分別為-0.19 和-0.69。從訓(xùn)練數(shù)據(jù)中刪除不合理的數(shù)據(jù)后,本文可以分別獲得-0.26 和0.75 的更高的需求-負(fù)荷相關(guān)性,這是由于需求和溫度之間的具有近似的線性關(guān)系,這可以提高訓(xùn)練精度。
在本文所提出的架構(gòu)的學(xué)習(xí)過程中使用交叉驗(yàn)證過程,其概述如下:
步驟1:將整個(gè)訓(xùn)練數(shù)據(jù)集分為兩組:用于更新網(wǎng)絡(luò)參數(shù)的訓(xùn)練集和用于測(cè)試性能的驗(yàn)證集。
步驟2:預(yù)設(shè)SOM 網(wǎng)絡(luò)中神經(jīng)元的最小數(shù)量和最大數(shù)量,并設(shè)置為神經(jīng)元的初始數(shù)量。
步驟3:使用訓(xùn)練數(shù)據(jù)集訓(xùn)練SOM 網(wǎng)絡(luò),并將神經(jīng)單元分為兩組:常規(guī)日和異常日。
步驟4:在輸入空間的每個(gè)子集中,根據(jù)式(9)訓(xùn)練SVM以適合數(shù)據(jù)子集。
步驟5:使用用于驗(yàn)證的數(shù)據(jù)集預(yù)測(cè)負(fù)荷簡(jiǎn)檔,并計(jì)算MAPE。
步驟6:增加SOM 中神經(jīng)元的數(shù)量,并重復(fù)步驟1至步驟5。
步驟7:通過比較SOM 網(wǎng)絡(luò)的不同神經(jīng)單元的MAPE,將MAPE 最小的網(wǎng)絡(luò)參數(shù)用作最終的網(wǎng)絡(luò)參數(shù)。
對(duì)于不同的系統(tǒng),主要區(qū)別可能僅在于分類的數(shù)量。因此本文可以輕松地將所提出的模型應(yīng)用于不同的電力系統(tǒng)。
在SOM 的訓(xùn)練過程中,有幾個(gè)參數(shù)可能會(huì)影響所提出模型的性能。首先,本文需要選擇和確定SOM 的神經(jīng)單元的最小值和最大值Nmin和Nmax,然后確定每個(gè)子集中的訓(xùn)練數(shù)據(jù)集的數(shù)量,即要分區(qū)的負(fù)荷狀態(tài)的數(shù)量?;旧希嗟臓顟B(tài)可為模型提供了更高的分類能力,但也存在過度擬合和高計(jì)算量的風(fēng)險(xiǎn),此外具有太多狀態(tài)的模型也更難以解釋。另一方面,較少數(shù)量的狀態(tài)可能導(dǎo)致不合適的問題。
對(duì)于SOM 的訓(xùn)練,有兩個(gè)參數(shù)α 和σ 可供選擇。在本文中,α 的初始值和最終值設(shè)置為αi=1和αf=0.01。σ 的初始值選擇為σi=2,最終值為σi=0.1。
而對(duì)于SVM 模型,有兩個(gè)關(guān)鍵參數(shù),即RBF 函數(shù)中的錯(cuò)誤C 和成本γ。為了確定適當(dāng)?shù)膮?shù),每個(gè)數(shù)據(jù)子集被分成兩個(gè)子集:訓(xùn)練子集和驗(yàn)證子集。訓(xùn)練數(shù)據(jù)子集用于更新網(wǎng)絡(luò)的參數(shù),而驗(yàn)證數(shù)據(jù)子集用于監(jiān)控訓(xùn)練過程中的訓(xùn)練性能?;诖朔謪^(qū),本文通過以下測(cè)試過程進(jìn)行交叉驗(yàn)證以選擇合適的參數(shù):
1)使用門控SOM 網(wǎng)絡(luò),根據(jù)測(cè)試日和前幾天的信息確定測(cè)試日的類型。
2)使用相應(yīng)的SVM網(wǎng)絡(luò)輸出預(yù)測(cè)負(fù)荷。
比較性能的標(biāo)準(zhǔn)是本文中的MAE和MAPE,它們表明了召回的準(zhǔn)確性,MAE定義如下:
其中,yai是實(shí)際值,yfi是預(yù)測(cè)值,n 是預(yù)測(cè)值的總數(shù),MAPE定義如下:
對(duì)于比較研究,還進(jìn)行了與其他方法比較的數(shù)值模擬。首先,本文計(jì)算貴陽市在同一時(shí)期發(fā)布的預(yù)測(cè)負(fù)荷的MAE和MAPE。同時(shí),為了驗(yàn)證混合結(jié)構(gòu)的有效性,還建立了一個(gè)不使用SOM 選通階段的SVM網(wǎng)絡(luò)模型,并研究了該模型的性能。
表4和表5顯示了使用三種不同方法的兩個(gè)測(cè)試月的每小時(shí)MAE 和MAPE。其中,表4 顯示了兩個(gè)月總天數(shù)的結(jié)果,而表4 和表5 分別顯示了常規(guī)天數(shù)(工作日)和異常天數(shù)(包括周末和假日)的結(jié)果。從三個(gè)表中可以看出,混合網(wǎng)絡(luò)幾乎在所有情況下都優(yōu)于其他網(wǎng)絡(luò)。唯一的例外是單個(gè)SVM 可以更準(zhǔn)確地預(yù)測(cè)2018 年1 月的異常天數(shù)。本文認(rèn)為,其原因是混亂網(wǎng)絡(luò)在異常天的情況下缺乏訓(xùn)練樣本。然而常規(guī)日子的擬議方法的總體準(zhǔn)確性要好得多。
表4 每天的誤差值統(tǒng)計(jì)
表5 常規(guī)日誤差值統(tǒng)計(jì)
圖5 顯示了預(yù)測(cè)結(jié)果以及2018 年1 月和2018年7 月的實(shí)際負(fù)荷需求。為避免混淆,數(shù)據(jù)標(biāo)記在兩個(gè)數(shù)字中每12h設(shè)置一次。
圖5 預(yù)測(cè)電力負(fù)荷和實(shí)際電力負(fù)荷對(duì)比
表6 異常日誤差值統(tǒng)計(jì)
為了進(jìn)一步研究所提方法的適應(yīng)性,本文還分別比較了常規(guī)日的SVM 異常和異常日專用的SVM的預(yù)測(cè)結(jié)果,如表7所示。
表7 常規(guī)日與異常日SVM誤差值統(tǒng)計(jì)
圖6 顯示出了2017 年7 月的長(zhǎng)周末的預(yù)測(cè)值和實(shí)際負(fù)荷。可以看出,當(dāng)應(yīng)用本文模型時(shí),異常的準(zhǔn)確性得到改善。
圖6 短期電力負(fù)荷預(yù)測(cè)對(duì)比
本文所有的數(shù)值研究都在1GB RAM 內(nèi)存和2.79GHz 的計(jì)算機(jī)上運(yùn)行。一般包括訓(xùn)練和預(yù)測(cè)在內(nèi),一次測(cè)試通常不到7min。
本文所提出的模型具有三個(gè)顯著的優(yōu)點(diǎn)。首先,它有能力解決電力負(fù)荷時(shí)間序列中的非平穩(wěn)性問題,由于市場(chǎng)影響,電力負(fù)荷時(shí)間序列變得越來越重要。其次,它可以在編程的網(wǎng)格切換操作下使用不同的方案處理常規(guī)日和異常日。最后,它具有很強(qiáng)的魯棒性,可以很容易地針對(duì)不同的電力系統(tǒng)或市場(chǎng)進(jìn)行修改。
電力負(fù)荷的預(yù)測(cè)結(jié)果在過去幾年的誤差為1%~3%[1],雖然已達(dá)到合理的性能狀態(tài),但這個(gè)問題仍然是一項(xiàng)艱巨的任務(wù),以至于提出全面而通用的解決方案遠(yuǎn)非易事。這也可以通過過去幾年關(guān)于負(fù)荷預(yù)測(cè)的大量出版物來解釋。對(duì)于特定系統(tǒng),只有在對(duì)系統(tǒng)的固有特性進(jìn)行深入研究的情況下才能實(shí)現(xiàn)最佳性能。對(duì)于本文所提出的方法,應(yīng)根據(jù)系統(tǒng)的特性選擇SOM 網(wǎng)絡(luò)的不同饋線組,因?yàn)檩斎胱兞康撵`敏度可能隨系統(tǒng)變化而變化。例如濕度對(duì)于熱帶地區(qū)和夏季的負(fù)荷預(yù)測(cè)非常重要。但是在溫帶和秋季,負(fù)荷可能對(duì)濕度不敏感。未來本文將進(jìn)一步將運(yùn)營(yíng)和市場(chǎng)因素納入本文的模型,以提高預(yù)測(cè)的準(zhǔn)確性。
本文提出了一種基于SOM 和SVR 網(wǎng)絡(luò)的自適應(yīng)混合模型來預(yù)測(cè)電力負(fù)荷。所提出的方法中的SOM 門控網(wǎng)絡(luò)可以識(shí)別負(fù)荷狀態(tài)并以無監(jiān)督的方式將輸入數(shù)據(jù)集聚類成若干子集。然后在每個(gè)子集中,使用不同的SVM 以監(jiān)督的方式擬合屬于不同市場(chǎng)狀態(tài)的輸入數(shù)據(jù)。該方法應(yīng)用于貴陽市第二天負(fù)荷分布的預(yù)測(cè),證明了學(xué)習(xí)和預(yù)測(cè)的有效性和效率。