葉遠(yuǎn)勝 張靜
摘? 要:隨著電力系統(tǒng)的飛速發(fā)展,以往基于小規(guī)模數(shù)據(jù)的傳統(tǒng)電力負(fù)荷預(yù)測算法可能無法容納大量數(shù)據(jù)集和效率上的要求。為改善預(yù)測模型的工程實(shí)用性、效率和準(zhǔn)確度,將傳統(tǒng)的時(shí)間序列預(yù)測方法與機(jī)器學(xué)習(xí)中的支持向量機(jī)算法相結(jié)合,應(yīng)用于短時(shí)電力負(fù)荷預(yù)測。即使用某一時(shí)刻對應(yīng)的以往時(shí)間點(diǎn)的電力數(shù)據(jù)作為屬性值,使用支持向量回歸構(gòu)建模型進(jìn)行預(yù)測。通過實(shí)踐證明,模型可以快速有效地處理數(shù)據(jù),并且具有較高的預(yù)測準(zhǔn)確度。
關(guān)鍵詞:時(shí)間序列;支持向量機(jī);電力負(fù)荷預(yù)測;機(jī)器學(xué)習(xí)
中圖分類號:TP183;TM715 文獻(xiàn)標(biāo)識碼:A? ? 文章編號:2096-4706(2020)24-0017-03
SVM Short Term Power Load Forecasting Based on Time Series
YE Yuansheng,ZHANG Jing
(China University of Mining and Technology-Beijing,Beijing? 100083,China)
Abstract:With the rapid development of power systems,traditional power load forecasting algorithms based on small-scale data in the past may not be able to accommodate large data sets and efficiency requirements. In order to improve the engineering practicability,efficiency and accuracy of the forecasting model,the traditional time series forecasting method is combined with the support vector machine algorithm in machine learning and applied to short term power load forecasting. That is,the power data corresponding to a certain point in the past is used as the attribute value,and the support vector regression is used to construct a model for prediction. Practice has proved that the model can process data quickly and effectively,and has high prediction accuracy.
Keywords:time series;support vector machine;power load forecasting;machine learning
0? 引? 言
關(guān)于電力負(fù)荷特性的研究是研究電力的一項(xiàng)重要內(nèi)容。由于用電負(fù)荷宏觀上受經(jīng)濟(jì),市場政策,文化,地理等因素影響,微觀上又受到節(jié)假日、工作日等日期類型屬性,氣象狀況,社會(huì)活動(dòng)等諸多因素的影響。且影響機(jī)制屬于非線性關(guān)系,常規(guī)方法難以取得較高精度[1]。精確的短期負(fù)荷預(yù)測結(jié)果能夠幫助電力工作人員指定合理的電力調(diào)配方案,即維持了供需平衡,保證了電網(wǎng)安全[2]。本文針對實(shí)際情況,利用支持向量機(jī)算法在解決線性不可分、高維數(shù)等問題上的優(yōu)勢,研究基于時(shí)間序列的短時(shí)電力負(fù)荷預(yù)測模型,以達(dá)到優(yōu)化電力負(fù)荷管理的目的。
1? 國內(nèi)外研究現(xiàn)狀
國內(nèi)外的學(xué)者們對電力負(fù)荷預(yù)測進(jìn)行了很多的研究,并取得了很多不俗的成果。按照預(yù)測手段的不同,電力負(fù)荷預(yù)測的方法主要有傳統(tǒng)和現(xiàn)代兩大分支。首先出現(xiàn)的是建立在數(shù)學(xué)基礎(chǔ)上的傳統(tǒng)預(yù)測方法。時(shí)間序列法是當(dāng)前進(jìn)行短時(shí)電力負(fù)荷預(yù)測較為完善成熟且可靠性較高的一種傳統(tǒng)算法[3],每過一定的時(shí)間間隔對電力負(fù)荷數(shù)據(jù)進(jìn)行一次記錄并形成序列,并參考過往的負(fù)荷數(shù)據(jù)對未來進(jìn)行預(yù)測??柭鼮V波法同樣常用于短時(shí)電力負(fù)荷預(yù)測,它的原則與基礎(chǔ)是線性無偏最小均方差估計(jì),首先依據(jù)歷史電力數(shù)據(jù)估計(jì)出模型參數(shù),再預(yù)測觀測的數(shù)據(jù)序列[4]。人工智能快速發(fā)展推動(dòng)了現(xiàn)代預(yù)測方法的興起,最常見的有人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)和支持向量機(jī)(Support Vecotor Machine,SVM)。人工神經(jīng)網(wǎng)絡(luò)理論建立神經(jīng)元網(wǎng)絡(luò)模型,首先用訓(xùn)練樣本集進(jìn)行訓(xùn)練學(xué)習(xí),初步得出各個(gè)輸出與輸入層之間的參數(shù),并以后項(xiàng)傳播的方式不斷進(jìn)行參數(shù)修正直到得到一個(gè)理想的模型,最后再用該模型得到預(yù)測結(jié)果[6-8]。SVM擁有較強(qiáng)的推廣能力,可以在保證較高的預(yù)測精確度的同時(shí)求解到全局最優(yōu)解[9]。在解決小樣本、線性不可分、高維數(shù)和多分類等實(shí)際問題上,支持向量機(jī)算法擁有很大的優(yōu)勢,故可以建立出比較理想的短時(shí)電力負(fù)荷預(yù)測模型[10]。
2? 支持向量機(jī)原理與時(shí)間序列法
2.1? SVM簡介
SVM是一類按監(jiān)督學(xué)習(xí)方式對數(shù)據(jù)進(jìn)行二元分類的廣義線性分類器,其決策邊界是對學(xué)習(xí)樣本求解的最大邊距超平面。SVM的任務(wù)就是尋找一劃分超平面,且該劃分超平面剛好處于兩類訓(xùn)練樣本的正中間位置,即最終的分類結(jié)果具有較高的魯棒性和泛化能力[11]。其線性判別函數(shù)的表達(dá)式為:
f(x)=wTx+b? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(1)
wTx+b=0即為劃分超平面。其中w=(w1,w2,w3,…)為法向量,決定了方向,b為位移項(xiàng),決定了原點(diǎn)與超平面的距離。令兩類樣本都滿足f(x)≥1,離分類面最近的樣本滿足f(x)=1。假設(shè)超平面能將訓(xùn)練樣本全部正確分類,則需滿足:
yi[(w·xi)+b]≥1,i=1,…,n? ? ? ? ? ? ? ? (2)
求出w與b即可得到模型:
f(x)=wTx+b=aiyixiT+b? ? ? ? ? ? ? ? ? ? ? (3)
2.2? 核函數(shù)
在現(xiàn)實(shí)場景中,原始樣本空間內(nèi)也許并不存在這樣的超平面,能夠?qū)⒂?xùn)練樣本劃分為兩類。對于這樣的問題,我們使用到了核函數(shù)方法。作為SVM中最重要的一部分,核函數(shù)方法的思路是通過非線性變換?將n維向量空間中的向量x映射到高維特征空間,使得樣本在這個(gè)高維特征空間中線性可分,然后在高維特征空間中構(gòu)造線性學(xué)習(xí)算法。一般而言,對于一個(gè)有限維的樣本,總是存在一個(gè)高維特征空間使訓(xùn)練樣本線性可分[12]。根據(jù)式(1)轉(zhuǎn)換后的模型表達(dá)為:
f(x)=wT·?(x)+b? ? ? ? ? ? ? ? ? ? ? ? ? (4)
加入了Lagrange乘子后并加以轉(zhuǎn)換得到二次規(guī)劃尋優(yōu)問題:
(5)
我們通常會(huì)使用以下函數(shù)來簡化這個(gè)高緯度的問題:
k(xi,xj)=?(xi),?(xj)=?(xi)T?(xj)? ? (6)
即可以將xi與xj在特征空間的內(nèi)積轉(zhuǎn)換為它們在原始樣本空間中通過函數(shù)k(·,·)計(jì)算的結(jié)果來簡化計(jì)算。通過這樣的等價(jià)轉(zhuǎn)換,我們就可以避免直接去計(jì)算高維乃至無窮維特征空間中的內(nèi)積[13]。于求解后可得到:
(7)
這里的函數(shù)k(·,·)就是“核函數(shù)”(kernel function)。核函數(shù)的選擇是支持向量機(jī)問題的核心所在,核函數(shù)選擇將直接影響到分類的效果。本文用到高斯核函數(shù)。
2.3? 支持向量機(jī)回歸
分類問題與回歸問題是支持向量機(jī)問題的兩大分支。在基礎(chǔ)理論、如何選擇核函數(shù)等方面上,SVM分類問題和回歸問題存在很多相似的地方。與SVM分類問題不同,yi可以取任意實(shí)數(shù)值,而并非固定取值-1或+1。SVM回歸問題實(shí)質(zhì)上還是通過尋找一個(gè)最優(yōu)函數(shù)y=f(x)來擬合輸入數(shù)據(jù)與輸出數(shù)據(jù)之間的關(guān)系,期待得到一個(gè)擬合誤差最小的結(jié)果。支持向量回歸中往往采用“不敏感損失函數(shù)”來做為誤差函數(shù),傳統(tǒng)線性回歸一般直接使用模型輸出值f(x)與真實(shí)值y之間的差別作為損失,故此損失值通常不為零。而支持向量機(jī)回歸允許f(x)與y之間有?的誤差,則只要樣本落在以f(x)為中心,寬度為2?的矩形區(qū)域內(nèi),都認(rèn)為不存在誤差。
其表達(dá)式為:
(8)
優(yōu)化問題即求:
(9)
引入松弛變量ξi和,引入Lagrange函數(shù),即可得到SVR的對偶問題:
(10)
代入求解有:
f(x)=(-ai)xiTxi+b? ? ? ? ? ? ? ? ? (11)
結(jié)合KKT條件,對每個(gè)樣本(xi,yi),都有(C-ai)ξi=0且ai(f(xi)-yi-ε-ξi)=0。
于是,在得到ai后,若0 b=yi+?-(-aj)xjTxi? ? ? ? ? ? ? ? ? ? ?(12) 考慮到特征映射形式,則相應(yīng)的,式(12)將形如: w=(-ai)?(xi)? ? ? ? ? ? ? ? ? ? ? (13) 將式(13)代入到式(4),則SVR可以表示為: f(x)=(-ai)k(x,xi)+b? ? ? ? ? ? ? (14) 其中k(x,xi)=?(xi)T?(xj)為核函數(shù)。 2.4? 時(shí)間序列法 時(shí)間序列法是一種統(tǒng)計(jì)學(xué)上的分析方法,它用來描述事物隨著時(shí)間發(fā)展變化的特征,又被稱作稱時(shí)間序列趨勢外推法。時(shí)間序列法假設(shè)事物的發(fā)展趨勢會(huì)延伸到未來,并忽略事物發(fā)展之間的因果關(guān)系,使用一定時(shí)間內(nèi)的歷史數(shù)據(jù)構(gòu)成的數(shù)據(jù)序列來對未來該事物的情況進(jìn)行預(yù)測。因此,時(shí)間序列法要求事物具有穩(wěn)定的變化趨勢和明確的相互關(guān)系。但很多時(shí)候事物的歷史數(shù)據(jù)都會(huì)受到一些偶然因素的影響而變現(xiàn)出不太規(guī)則的變化,因此我們在使用歷史數(shù)據(jù)時(shí),還需采用算數(shù)平均、加權(quán)平均、指數(shù)平均等方法來減少偶然因素所帶來的影響。時(shí)間序列傳統(tǒng)的預(yù)測方法有移動(dòng)平均法、加權(quán)移動(dòng)平均、法指數(shù)平滑法等,現(xiàn)代方法有Box-Jenkins的自回歸模型(ARIMA)。 3? 實(shí)驗(yàn) 3.1? 數(shù)據(jù)預(yù)處理 所使用的數(shù)據(jù)集為河北某電廠從2017年6月1日至2017年9月1日的電力數(shù)據(jù)。每隔三分鐘記錄一次,而且每隔幾行表格中會(huì)出現(xiàn)一次空行數(shù)據(jù),因此應(yīng)先刪除掉這些空行數(shù)據(jù)。在Python環(huán)境下,可以調(diào)用pandas包,讀取表格數(shù)據(jù)后,使用DataFrame下的drop方法完成刪除操作。因?yàn)槭褂脮r(shí)間序列法進(jìn)行負(fù)荷預(yù)測,即通過前一天,前一周等的負(fù)荷來預(yù)測當(dāng)前的電力負(fù)荷。所以首先要對原始數(shù)據(jù)進(jìn)行操作,將與當(dāng)前行對應(yīng)的前一天、前一周這樣的歷史數(shù)據(jù)輸入到本行作為屬性值。對于某些特殊情況,如6月1日當(dāng)天是沒有前一天、前一周這樣的數(shù)據(jù)作為參考的,故可以考慮使用當(dāng)天的數(shù)據(jù)作為歷史數(shù)據(jù)進(jìn)行填充。這類缺少歷史數(shù)據(jù)的數(shù)據(jù)約占整體的5%。大部分的機(jī)器學(xué)習(xí)算法無法在缺失的數(shù)據(jù)集上工作,所以需要使用一些函數(shù)來處理這些缺失值。Scikit-Learn提供了一個(gè)非常方便的工具:Imputer。創(chuàng)建該實(shí)例后,選擇均值來替換缺失值。工作日、雙休日、節(jié)假日等時(shí)段對電力負(fù)荷會(huì)產(chǎn)生較大的影響。因此需要從日期中提取出這些信息,并使用One-hot編碼的形式將這些信息記錄到電力數(shù)據(jù)集當(dāng)中。
3.2? 預(yù)測與結(jié)果評估
由于電力負(fù)荷數(shù)據(jù)分布的范圍比較接近,因此不需要再進(jìn)行標(biāo)準(zhǔn)化、歸一化操作。在數(shù)據(jù)預(yù)處理完成后,選擇3/4的數(shù)據(jù)作為訓(xùn)練集,1/4的數(shù)據(jù)作為測試集。將數(shù)據(jù)傳入到SVR回歸模型中。模型使用高斯徑向基(RBF)函數(shù),懲罰系數(shù)C=50,核函數(shù)的次數(shù)選定為3。預(yù)測的結(jié)果如圖1所示。
預(yù)測精確度為0.923 1,均方誤差為131.00,可以看出具有較高的預(yù)測精度。部分實(shí)際值與預(yù)測結(jié)果數(shù)據(jù)表1所示。
4? 結(jié)? 論
本文以時(shí)間序列法為基礎(chǔ),通過構(gòu)建支持向量機(jī)回歸(SVR)模型完成對短時(shí)電力負(fù)荷的預(yù)測,同時(shí)也兼并考慮到了節(jié)假日屬性對電力負(fù)荷的影響,既提高了短期電力負(fù)荷預(yù)測的預(yù)測精度,還同時(shí)兼顧到了時(shí)效性問題,提升了模型的整體預(yù)測能力。與傳統(tǒng)的短時(shí)電力負(fù)荷預(yù)測方法相比,本文所使用的基于時(shí)間序列的支持向量機(jī)回歸(SVR)預(yù)測能夠在較高的效率下獲得更高的負(fù)荷預(yù)測精度。未來可以考慮研究在溫度、天氣狀況、濕度、降雨量等影響因素下更復(fù)雜環(huán)境的短期負(fù)荷預(yù)測問題,并與其他負(fù)荷預(yù)測方法相結(jié)合,進(jìn)一步提升預(yù)測模型的普適性和處理數(shù)據(jù)的能力。
參考文獻(xiàn):
[1] 康重慶,夏清,劉梅.電力系統(tǒng)負(fù)荷預(yù)測 [M].北京:中國電力出版社,2007.
[2] 牛東曉,曹樹華,盧建昌,等.電力負(fù)荷預(yù)測技術(shù)及其應(yīng)用:第2版 [M].北京:中國電力出版社,2009.
[3] 趙希正.中國電力負(fù)荷特性分析與預(yù)測 [M].北京:中國電力出版社,2002.
[4] 張文哲.電力系統(tǒng)短時(shí)負(fù)荷預(yù)測模型研究 [D].重慶:重慶大學(xué),2004.
[5] 廖旎煥,胡智宏,馬瑩瑩,等.電力系統(tǒng)短期負(fù)荷預(yù)測方法綜述 [J].電力系統(tǒng)保護(hù)與控制,2011,39(1):147-152.
[6] 孟思齊,楊洪耕.基于灰色生成的卡爾曼濾波短期負(fù)荷預(yù)測 [J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2008,20(6):78-82.
[7] 張亞軍,張大波,許誠昕.神經(jīng)網(wǎng)絡(luò)在電力系統(tǒng)短期負(fù)荷預(yù)測中的應(yīng)用綜述 [J].浙江電力 2007(2):5-9.
[8] 李重春,祝安琪,王爍罡,等.電力大數(shù)據(jù)下的短期電力負(fù)荷預(yù)測 [J].電力大數(shù)據(jù),2019,22(1):66-70.
[9] 杜莉,張建軍.神經(jīng)網(wǎng)絡(luò)在電力負(fù)荷預(yù)測中的應(yīng)用研究 [J].計(jì)算機(jī)仿真,2011,28(10):297-300.
[10] 周志華.機(jī)器學(xué)習(xí) [M].北京:清華大學(xué)出版社,2016.
[11] BATES J M,GRANGER C. The Combination of forecast [J].Journal of the Operational Research Society,1969,20(4):451-468.
[12] VAPNIK V N. The nature of statistical learning theory [M].New York:Springer,1995.
[13] THOMOPOULOS N T. Applied Forecastin Methods [M].Englewood Cliffs:Prentice-Hall,1980.
作者簡介:葉遠(yuǎn)勝(1995—),男,漢族,安徽安慶人,碩士研究生在讀,研究方向:機(jī)器學(xué)習(xí);張靜(1996—),女,漢族,安徽淮北人,碩士研究生在讀,研究方向:自然語言處理。