孟鑫 梁霄
關鍵詞:電力負荷預測;ARIMA; SVM;組合預測
1引言
電力系統(tǒng)負荷在當下能源緊缺的環(huán)境中成為各個國家和地區(qū)的重要議題。近年來,全球氣候呈現以變暖為主要特征的顯著變化,極端氣候事件發(fā)生的概率和強度不斷上升。天氣系統(tǒng)復雜多變和社會事件(政策變化、節(jié)假日、電網故障、經濟活動、疫情影響等)等不確定因素給準確的預測帶來困難,選擇合適的預測算法成為研究電力負荷的關鍵。
電力系統(tǒng)負荷可以由線路中設備總功率求和得到,根據用戶的用電習慣和生活工作規(guī)律,電力負荷會隨時間產生一定的規(guī)律性變化,符合時間序列的基本特征。電力系統(tǒng)負荷時間序列具有復雜性、不確定性、非線性等特征,由于受到復雜多變的氣候和能源供應鏈等可變性因素影響,其數據包含線性和高度非線性特征,這導致電力系統(tǒng)負荷預測難度較大。目前,電力負荷傳統(tǒng)預測模型主要關注數據的時序性特征而忽略了數據存在的非線性特征。我們希望構建一種既能反映數據的時間序列特征,又能體現出數據的非線性屬性的模型,于是本文重點將ARIMA模型和SVM模型進行組合優(yōu)化,對電力負荷的預測進行研究。
2基本模型
2.1ARIMA模型
ARIMA模型是研究時間序列的一類經典統(tǒng)計模型,在處理線性問題上有巨大優(yōu)勢[1]。ARIMA模型的本質是將不平穩(wěn)的時間序列經過差分使原始數據平穩(wěn)化后再對其建立自回歸和滑動平均模型(ARMA)。構建和預測模型之前需要對數據進行平穩(wěn)化處理,通過參數估計方法得到殘差最小化的模型。ARIMA(p,d,g)模型的設定如下[2]:其中,L是滯后算子,表示殘差序列。
2.2SVM模型
支持向量機方法是一類在解決非線性問題上有許多特有優(yōu)勢的機器學習算法,由Vapnik等首先提出,其基本原理是根據統(tǒng)計學VC理論的系統(tǒng)問題最小化原則,對特定訓練樣本的訓練精度與學習質量關系的折中,以期望模型顯示出最佳的泛化水平[3]。
2.3ARIMA-SVM組合模型
ARIMA模型和SVM模型分別在處理線性和非線性問題上具有各自的優(yōu)點和特色[4].因此本文將二者結合起來構建組合模型,對電力負荷進行預測,以期望取得較好的預測效果。在數據線性規(guī)律由ARIMA模型捕捉的基礎上,提取ARIMA擬合模型的殘差序列作為構建SVM模型的訓練樣本,用編程語言循環(huán)搜尋殘差最優(yōu)化的參數,讓SVM算法捕捉到數據的非線性趨勢,形成組合模型,最終的預測值由ARIMA和SVM預測的結果相加得到。
2.4評價指標
為了驗證組合模型在電力負荷預測中的有效性,本文選擇ARIMA和SVM為參照模型,同時為了便于模型預測和模型評價,本文中三種模型的預測方法均采用一步預測法,并且所有模型均基于R語言編程實現。為了更有效地反映模型的優(yōu)劣性,本文結合均方根誤差(RMSE)和平均絕對誤差百分比(MAPE)來評價組合模型的預測效果。RMSE和MAPE的計算公式如下[5]:
3電力負荷預測仿真
3.1數據來源
本文采用的數據整理自廣東省某市2018年1月1日0:00—2018年1月14日23:45電網間隔15分鐘的負荷數據,該時間段內該市無極端氣候和能源供應等不穩(wěn)定性影響,時間序列內沒有異常變化。選取數據中前13日的負荷數據(共1248個數據),并劃分為訓練樣本進行模型擬合和預測,14日的負荷數據劃分為測試樣本,以驗證擬合模型的優(yōu)劣。圖1為前13日共1248個電力負荷數據的變化圖,由圖1可見數據的周期性特征較為顯著。
3.2電力負荷預測及擬合效果
3.2.1ARIMA模型建立及預測
首先對原始日寸間序列進行預處理,依據拉依達準則,借助R語言boxplot()函數畫出數據箱線圖,觀察得到數據中無異常值,原始數據可直接進行建模。利用R語言中的unitrootTest()函數檢驗電力負荷數據的單位根,從而判斷數據是否為非平穩(wěn)時間序列。若數據無法通過單位根檢驗,則可以利用差分對數據進行變換。單位根檢驗結果如表1所列,其中單位根檢驗P值小于0.05,說明數據為非平穩(wěn)時間序列。
原始時間序列經過一階差分后通過了單位根檢驗,并且有99%的置信度??梢哉J為一階差分序列為平穩(wěn)序列,因此設定ARIMA模型參數d=1。借助R語言中的auto. arima()函數來選擇模型AIC和BIC中最小的參數p,g,得到擬合的最優(yōu)模型為ARIMA(5,1,1)(0,1,0)[96]。此時,擬合模型的AIC=23 514.47。由ARIMA模型預測值和真實值在圖2中的對比可知,模型捕捉日寸間序列數據的線性特征較為充分。
3.2.2SVM模型預測
將訓練集中前12天的數據作為輸入,第13天的數據作為輸出,選取徑向基核函數作為核函數進行擬合模型,這是一個基于樣本點之間的距離決定映射方式的函數,徑向基核函數屬于局部核函數,當數據點距離中心點變遠時,取值會變小。高斯核函數的形式如下:
由擬合的ARIMA模型可知,時間序列周期為96,將2018年1月1日~2018年1月13日的電力負荷ARIMA模型預測值殘差使用SVM模型進行擬合,尋求到最優(yōu)SVM模型參數擬合模型進行預測,在數據線性規(guī)律由ARIMA模型捕捉的基礎上,提取ARIMA擬合模型的殘差序列作為構建SVM模型的訓練樣本,用編程語言循環(huán)搜尋殘差最優(yōu)化的參數,讓SVM算法捕捉到數據的非線性趨勢,形成ARIMA-SVM組合模型,最終的預測值由ARIMA和SVM預測的結果相加得到。由圖3可知,組合模型的預測值能夠更好地擬合電力負荷的實際值,主要原因是組合模型很好地利用了兩種模型的優(yōu)勢,充分提取數據特征。
三種模型部分預測值(1月14日)如表2所列,可以發(fā)現ARIMA-SVM預測值最為接近真實值。
3.3模型評價
根據上述三個模型的預測值和實際值進行誤差指標計算,得到模型預測的均方根誤差(RMSE)和平均絕對誤差百分比(MAPE)的結果,如表3所列。SVM模型的預測值偏差略優(yōu)于ARIMA模型.ARIMA模型的預測值偏離度優(yōu)于SVM模型,這表明時間序列中的線性因素和非線性因素對模型預測的影響相當,而組合模型的預測誤差和偏離度均優(yōu)于單一模型,充分證明本文ARIMA-SVM組合模型能夠最大限度地提取數據的時間序列特征和數據的非線性屬性,并大幅提高預測精度。
4結束語
本文利用ARIMA模型捕捉電力負荷數據中的線性趨勢,結合SVM算法預測數據的非線性趨勢?;趶V東某市電力負荷數據的算例分析表明了ARIMA-SVM組合模型在預測具有非線性特征的時間序列中的準確性。線性與非線性高度結合的ARIMA-SVM組合模型可以成功應用到電力負荷時間序列預測模型中,通過更全面地挖掘數據中蘊含的信息,構建出更加系統(tǒng)和準確的模型,從而提升預測效果。