王詩(shī)涵 周法國(guó)
摘? 要:基于現(xiàn)有的電力負(fù)荷預(yù)測(cè)方法提高電力負(fù)荷預(yù)測(cè)的準(zhǔn)確性,提出了一種基于支持向量機(jī)(SVM)的電力負(fù)荷預(yù)測(cè)模型。首先分析支持向量機(jī)的理論基礎(chǔ),通過建立支持向量機(jī)預(yù)測(cè)模型,將經(jīng)過預(yù)處理的真實(shí)電力數(shù)據(jù)輸入該模型進(jìn)行學(xué)習(xí)預(yù)測(cè),借助均方根誤差(RMSE)、平均絕對(duì)百分比誤差(MAPE)以及預(yù)測(cè)圖表對(duì)模型預(yù)測(cè)性能進(jìn)行驗(yàn)證分析。實(shí)驗(yàn)結(jié)果表明,SVM預(yù)測(cè)模型能夠較為準(zhǔn)確地對(duì)電力負(fù)荷預(yù)測(cè)進(jìn)行刻畫。
關(guān)鍵詞:機(jī)器學(xué)習(xí);電力負(fù)荷;支持向量機(jī)
中圖分類號(hào):TP273.4? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2020)24-0120-03
Load Forecasting of Power Grid Based on Support Vector Machine
WANG Shihan,ZHOU Faguo
(School of Mechanical Electronic & Information Engineering,China University of Mining and Technology-Beijing,
Beijing? 100083,China)
Abstract:Based on the existing power load forecasting methods to improve the accuracy of power load forecasting,a power load forecasting model based on support vector machine(SVM)is proposed. First,analyze the theoretical basis of support vector machines,and by establishing a support vector machine prediction model,input the pre-processed real power data into the model for learning prediction. The prediction performance of the model is verified and analyzed with the help of root mean square error(RMSE),mean absolute percentage error(MAPE)and prediction chart. The experimental results show that the SVM prediction model can describe the power load forecast more accurately.
Keywords:machine learning;electric load;support vector machine
0? 引? 言
電力負(fù)荷在電力管理系統(tǒng)中有著極為重要的地位。隨著電力事業(yè)的不斷發(fā)展,準(zhǔn)確地對(duì)電力負(fù)荷進(jìn)行預(yù)測(cè)[1,2],可以更加經(jīng)濟(jì)且合理地對(duì)電網(wǎng)進(jìn)行規(guī)劃、對(duì)內(nèi)部發(fā)電機(jī)組進(jìn)行啟停,實(shí)現(xiàn)供電的穩(wěn)定性與合理性,充分滿足用戶需求,促進(jìn)電力市場(chǎng)的進(jìn)一步發(fā)展。
然而,由于電力負(fù)荷變化極其復(fù)雜,與天氣因素、時(shí)間因素、季節(jié)因素甚至是否為節(jié)假日等方面的因素都息息相關(guān)。目前常見的負(fù)荷預(yù)測(cè)方法主要有兩類:一類是基于數(shù)理統(tǒng)計(jì)的方法,另一類是智能預(yù)測(cè)方法。基于數(shù)理統(tǒng)計(jì)的方法有回歸分析、時(shí)間序列法以及趨勢(shì)外推法等;智能預(yù)測(cè)方法則主要是機(jī)器學(xué)習(xí)方法,比如支持向量機(jī)預(yù)測(cè)方法以及神經(jīng)網(wǎng)絡(luò)方法等。
由于各個(gè)因素與電力負(fù)荷并非都是線型相關(guān)的,其中也存在大量的非線性因素。因此,想要通過數(shù)學(xué)方法去建立相應(yīng)的顯式公式以及物理模型將會(huì)非常困難。正因?yàn)槿绱?,?shù)理統(tǒng)計(jì)方法往往存在很大的偏差,并且很難將許多因素綜合考慮在內(nèi)。同時(shí),電力公司在多年的運(yùn)營(yíng)中已經(jīng)產(chǎn)生了海量用電數(shù)據(jù),借助這些數(shù)據(jù),使用機(jī)器學(xué)習(xí)的方法進(jìn)行分析,構(gòu)建基于機(jī)器學(xué)習(xí)方法的電力負(fù)荷預(yù)測(cè)模型,就能夠更好地解決非線性、局部值變化過大以及多維性等難題。其中深度學(xué)習(xí)作為一種嶄新的機(jī)器學(xué)習(xí)方法,借助內(nèi)部構(gòu)建的多層感知器創(chuàng)建非線性網(wǎng)絡(luò),對(duì)目標(biāo)預(yù)測(cè)進(jìn)行函數(shù)逼近。對(duì)于海量的數(shù)據(jù)來說,基于機(jī)器學(xué)習(xí)的預(yù)測(cè)算法將會(huì)具備更優(yōu)秀的數(shù)據(jù)處理能力,同時(shí)還能夠更好地提取有效數(shù)據(jù)。
1? 現(xiàn)狀分析
機(jī)器學(xué)習(xí)是一種致力于探究計(jì)算機(jī)如何通過算法來仿照或?qū)崿F(xiàn)人類的學(xué)習(xí)能力,學(xué)習(xí)新的知識(shí)并根據(jù)自身經(jīng)驗(yàn)對(duì)新的難題進(jìn)行求解,從而不斷提升自身性能的方法。通過學(xué)習(xí)不但可以靈活應(yīng)對(duì)層出不窮的新問題,而且還可以對(duì)未來數(shù)據(jù)的特征和規(guī)律進(jìn)行推演和預(yù)測(cè)。然而,通常情況下,現(xiàn)實(shí)生活中的樣本往往數(shù)量不足且質(zhì)量一般,難以找到足夠多適用于機(jī)器學(xué)習(xí)的理想數(shù)據(jù),因此Vapnik團(tuán)隊(duì)提出了一項(xiàng)統(tǒng)計(jì)學(xué)習(xí)理論[3],這是一項(xiàng)專門研究在訓(xùn)練集所含樣本數(shù)量有限的情況下如何進(jìn)行機(jī)器學(xué)習(xí)的理論科學(xué)。統(tǒng)計(jì)學(xué)習(xí)理論一般從部分訓(xùn)練樣本出發(fā),通過一定的方式得到一些還無法用確切的理論或原理進(jìn)行分析的規(guī)律,并通過這些規(guī)律來對(duì)需要進(jìn)行預(yù)測(cè)的數(shù)據(jù)進(jìn)行比較精確的分析預(yù)測(cè)。
基于統(tǒng)計(jì)學(xué)習(xí)理論,產(chǎn)生了一種新的機(jī)器學(xué)習(xí)方法:支持向量機(jī)[4-6](Support Vector Machine,SVM),SVM是機(jī)器學(xué)習(xí)方法中被廣泛研究和使用的一種方法。SVM是一類按監(jiān)督學(xué)習(xí)方式對(duì)數(shù)據(jù)進(jìn)行二元分類的廣義線性分類器,但是隨著SVM方面的研究越來越深入,在分類之外也得到了廣泛的應(yīng)用,比如回歸、離散值分析以及排序等。為了改進(jìn)現(xiàn)有負(fù)荷預(yù)測(cè)方法所存在的預(yù)測(cè)精確度不足等問題,本文通過構(gòu)建基于支持向量機(jī)的電力負(fù)荷預(yù)測(cè)模型,將數(shù)據(jù)進(jìn)行預(yù)處理后,將其作為訓(xùn)練集輸入預(yù)測(cè)模型中,進(jìn)行特征提取。通過逐層學(xué)習(xí)與參數(shù)調(diào)試,將所提取出來的數(shù)據(jù)特征作為訓(xùn)練集進(jìn)行測(cè)試,然后通過輸入預(yù)測(cè)集,利用電力負(fù)荷預(yù)測(cè)模型對(duì)其進(jìn)行數(shù)據(jù)預(yù)測(cè)。
2? 支持向量機(jī)算法
在給定的訓(xùn)練樣本集D={(x1,y1),(x2,y2),…,(xn,yn)},yi∈{-1,1}中,線性分類器將會(huì)根據(jù)訓(xùn)練樣本D在二維空間中尋找到一個(gè)超平面來將二類樣本分離。
將該平面用函數(shù)f(x)=wTx+b表示,其中T為矩陣的轉(zhuǎn)置,因此如果當(dāng)f(x)恰好等于0的時(shí)候,x便是位于超平面上的點(diǎn),而當(dāng)f(x)大于0的點(diǎn)對(duì)應(yīng)y=1的數(shù)據(jù)點(diǎn),f(x)小于0的點(diǎn)對(duì)應(yīng)的是y=-1的點(diǎn)。
此時(shí)我們令:
通過簡(jiǎn)單平面幾何知識(shí)可求得空間中任意樣本點(diǎn)x到超平面的距離為: 。
由于yi∈{-1,1},因此我們將兩個(gè)異類支持向量與超平面之間的距離之和表示為? 。我們需要找到一個(gè)符合條件的超平面來分開兩類數(shù)據(jù):該超平面離兩類樣本都足夠遠(yuǎn),能夠使得距離之和達(dá)到最大,也就是說最終確定的參數(shù)w和b能夠使得r達(dá)到最大,即: ,s.t.yi(wTxi+b)≥
1,i=1,2,…,n。
以上便是基本線性可分情況下的SVM模型的基本思想。而對(duì)于回歸模型部分而言,優(yōu)化目標(biāo)函數(shù)部分與分類模型是一致的,但是區(qū)別在于約束條件有所不同?;貧w模型的目的是為了讓訓(xùn)練集樣本中的所有樣本點(diǎn)都盡可能地?cái)M合到同一個(gè)線性模型之上。SVM回歸算法采用ε-insensitive誤差函數(shù),用Lε表示該函數(shù),其定義為? ,其中ε為所能容忍的最大誤差。因此優(yōu)化目標(biāo)可以定為將誤差函數(shù)最小化:,其中C為正則化常數(shù),n為平面中的樣本點(diǎn)總數(shù)。
由于在上述的目標(biāo)函數(shù)中含有絕對(duì)值項(xiàng)而不可微。因此考慮將其轉(zhuǎn)化為約束優(yōu)化問題,即為每一個(gè)樣本數(shù)據(jù)都設(shè)置兩個(gè)松弛變量ζi≥0, ≥0,將誤差函數(shù)改寫成一個(gè)凸二次優(yōu)化問題: 。
通過引入拉格朗日乘子,將目標(biāo)優(yōu)化函數(shù)轉(zhuǎn)化成無約束的形式,其中α>0, >0,μ>0, >0是拉格朗日的系數(shù):
在滿足約束條件時(shí),,此時(shí)拉格朗日系數(shù)全部取0,。當(dāng)不滿足約束 時(shí),則? 無解。換言之? 在滿足約束條件時(shí)的解即? 的解,并且在約束外無解。因此求解? 即能得到滿足約束的的解。因此首先對(duì)w,b,ζi,分別求偏導(dǎo)數(shù)并將其帶回至拉格朗日函數(shù)中,化簡(jiǎn)后能夠得到關(guān)于αi,的函數(shù),將該函數(shù)最大化則為接下來的目標(biāo):
(1)
式(1)的約束條件為0≤αi≤C,0≤≤C。其中κ(xi,yi)=(xi)Txj為向量?jī)?nèi)積。接下來我們考慮KKT條件,KKT最優(yōu)化條件一般用來判斷一個(gè)非線性最優(yōu)化問題是否包含一個(gè)待確定的解。以下僅列出核心部分:
αi(ε+ζi+wTxi+b-)=0? ? ? ? ? ? ? ? ? ? ? ?(2)
(ε+-(wTxi+b)+)=0? ? ? ? ? ? ? ? ?(3)
由式(2)、式(3)可知當(dāng)αi>0時(shí),必定有ε+ζi+wT xi+b-=0,ζi≥0,此時(shí)預(yù)測(cè)值將會(huì)小于真實(shí)值;當(dāng)? >0時(shí),必定有(ε+-(wTxi+b)+)=0, ≥0,此時(shí)預(yù)測(cè)值將會(huì)大于真實(shí)值。而且對(duì)于每一個(gè)任意的數(shù)據(jù)點(diǎn),由于ε>0,則αi和不會(huì)出現(xiàn)同時(shí)大于0的情況,并且為了得到在誤差范圍以內(nèi)的點(diǎn),必定有αi=0以及=0。
由上述計(jì)算可得知? ,接下來進(jìn)一步對(duì)b值進(jìn)行計(jì)算,由式(2)可知某點(diǎn)預(yù)測(cè)值大于真實(shí)值時(shí),有:ζi=0且(ε+ζi+wT xi+b-)=0。
可推導(dǎo)得出預(yù)測(cè)函數(shù),其中(xi,)為預(yù)測(cè)值大于真實(shí)值的某個(gè)點(diǎn):
3? 預(yù)測(cè)實(shí)驗(yàn)
3.1? 數(shù)據(jù)來源
為了驗(yàn)證所構(gòu)建的SVM預(yù)測(cè)模型的有效性與精確性,實(shí)驗(yàn)將使用河北省某地區(qū)2017年6月1日到6月30日之間的真實(shí)電力數(shù)據(jù),共包含17 279組電力負(fù)荷數(shù)據(jù)。數(shù)據(jù)中包含電壓、功率等數(shù)據(jù)的實(shí)時(shí)最高值、最低值以及平均值,在實(shí)驗(yàn)中采用平均值進(jìn)行計(jì)算。
3.2? 數(shù)據(jù)預(yù)處理
在將數(shù)據(jù)輸入模型之前,需要預(yù)處理原始電力負(fù)荷數(shù)據(jù)。由于數(shù)據(jù)按時(shí)間序列有部分缺失數(shù)據(jù),直接將空值讀入模型會(huì)導(dǎo)致模型運(yùn)行、計(jì)算出錯(cuò)。因此需要將空值處理為有效值,將缺失值設(shè)置為上下時(shí)間序列按時(shí)間間隔的均值。
同時(shí)為了避免因數(shù)據(jù)范圍不同而導(dǎo)致計(jì)算時(shí)出現(xiàn)飽和現(xiàn)象,需要對(duì)實(shí)驗(yàn)所用的數(shù)據(jù)進(jìn)行歸一化處理。采用下列方式完成數(shù)據(jù)歸一化: 。
其中x為預(yù)處理數(shù)據(jù)的樣本,xmax和xmin分別為樣本數(shù)據(jù)中的最大值及最小值,ymax和ymin則為期望數(shù)據(jù)中每一行中的最大值及最小值。
3.3? 模型評(píng)價(jià)指標(biāo)
均方根誤差RMSE,也被稱為標(biāo)準(zhǔn)誤差,一般被用來測(cè)量觀測(cè)值與實(shí)際值之間的誤差大小。計(jì)算公式為:。
平均絕對(duì)百分比誤差MAPE也是機(jī)器學(xué)習(xí)中常用的一個(gè)評(píng)價(jià)指標(biāo),可以用來衡量一個(gè)模型預(yù)測(cè)結(jié)果的好壞,計(jì)算公式為:。
其中,yi和? 分別為樣本的真實(shí)值及預(yù)測(cè)值,n則為測(cè)試集中的樣本數(shù)量。
3.4? 預(yù)測(cè)結(jié)果與分析
將17 279組電力負(fù)荷數(shù)據(jù)分為三組,首先對(duì)其進(jìn)行預(yù)處理使其變?yōu)榭刹僮鞯暮侠頂?shù)據(jù)。其中8 000組數(shù)據(jù)作為訓(xùn)練集,用以構(gòu)建短期電力負(fù)荷預(yù)測(cè)模型,對(duì)模型進(jìn)行學(xué)習(xí)訓(xùn)練;5 000組數(shù)據(jù)作為測(cè)試集,用以對(duì)學(xué)習(xí)后的電力負(fù)荷預(yù)測(cè)模型的預(yù)測(cè)準(zhǔn)確性進(jìn)行檢驗(yàn);其余4 279組數(shù)據(jù)作為預(yù)測(cè)集,默認(rèn)其為未來數(shù)據(jù),即只有時(shí)間數(shù)據(jù)而無電力負(fù)荷數(shù)據(jù),通過預(yù)測(cè)其電力負(fù)荷再與實(shí)際電力負(fù)荷值比對(duì),進(jìn)一步檢驗(yàn)其預(yù)測(cè)性能。測(cè)試結(jié)果如圖1所示。
對(duì)應(yīng)的模型輸出的評(píng)價(jià)指標(biāo)如表1所示。
對(duì)圖1及表1中的結(jié)果進(jìn)行分析,可以發(fā)現(xiàn):
(1)SVM模型可以較好地對(duì)電力負(fù)荷進(jìn)行預(yù)測(cè),結(jié)果能比較準(zhǔn)確地刻畫出電力負(fù)荷在一定時(shí)間內(nèi)的變化趨勢(shì)。
(2)對(duì)于特定時(shí)段的電力負(fù)荷的峰值變化難以把握,模型在預(yù)測(cè)峰值負(fù)荷的時(shí)候往往趨于平穩(wěn),導(dǎo)致對(duì)極端情況下的電力負(fù)荷預(yù)測(cè)準(zhǔn)確性不高。因?yàn)樵趯?shí)際用電環(huán)境下,電力負(fù)荷往往不不僅僅只與時(shí)間有一定關(guān)系,還有大量其他因子會(huì)影響電力負(fù)荷。
4? 結(jié)? 論
本文通過構(gòu)建SVM模型實(shí)現(xiàn)對(duì)電力負(fù)荷數(shù)據(jù)特征的學(xué)習(xí),并通過此數(shù)據(jù)特征對(duì)電力負(fù)荷數(shù)據(jù)進(jìn)行預(yù)測(cè)。對(duì)實(shí)際數(shù)據(jù)進(jìn)行測(cè)試調(diào)試后發(fā)現(xiàn),本文所提出的電力負(fù)荷預(yù)測(cè)模型可較為精準(zhǔn)地對(duì)電力負(fù)荷進(jìn)行預(yù)測(cè),與真實(shí)值接近,模型有效性良好。對(duì)于其他會(huì)影響電力負(fù)荷的因素,如何將其合理地融入模型以對(duì)電力負(fù)荷進(jìn)行更加準(zhǔn)確的預(yù)測(cè),還需要進(jìn)一步研究。
參考文獻(xiàn):
[1] 韓禹.非侵入式低壓電力負(fù)荷構(gòu)成識(shí)別與聚合建模的研究及應(yīng)用 [D].鎮(zhèn)江:江蘇大學(xué),2020.
[2] 鞠平,郭德正,曹路,等.含主動(dòng)負(fù)荷的綜合電力負(fù)荷建模研究綜述與展望 [J].河海大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,48(4):367-376.
[3] 林洪樺.測(cè)量誤差分析及數(shù)據(jù)處理若干要點(diǎn)系列論文(四) ——統(tǒng)計(jì)學(xué)習(xí)理論及支持向量機(jī)方法統(tǒng)用于形位誤差評(píng)定 [J].自動(dòng)化與信息工程,2020,41(4):1-5.
[4] 陳衛(wèi)東,梁朔,肖園園,等.基于模糊最小二乘支持向量機(jī)的微電網(wǎng)群狀態(tài)評(píng)估方法 [J].電力系統(tǒng)自動(dòng)化,2019,43(2):76-82.
[5] 姜濤,王長(zhǎng)江,陳厚合,等.基于正則化投影孿生支持向量機(jī)的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估 [J].電力系統(tǒng)自動(dòng)化,2019,43(1):141-148.
[6] 胡天宇,郭慶來,孫宏斌.基于堆疊去相關(guān)自編碼器和支持向量機(jī)的竊電檢測(cè) [J].電力系統(tǒng)自動(dòng)化,2019,43(1):119-125.
作者簡(jiǎn)介:王詩(shī)涵(1996—),男,漢族,廣東中山人,碩士研究生在讀,研究方向:計(jì)算機(jī)應(yīng)用技術(shù);周法國(guó)(1976—),男,漢
族,山東聊城人,副教授,博士,研究方向:數(shù)據(jù)挖掘、人工智能等。