陳明帆,寧光濤,李琳瑋,何禮鵬,劉麗新
(1. 海南電網(wǎng)有限公司,???570204;2. 北京清軟創(chuàng)新科技股份有限公司,北京 100085)
隨著電力體制改革的不斷深入,城鄉(xiāng)居民暫不參與電力市場,需要電網(wǎng)公司對其承擔保底供電責任。所以電網(wǎng)公司越來越重視城鄉(xiāng)居民月度用電量的預測,以便于合理安排月度計劃、更好履行保底供電責任。
城鄉(xiāng)居民用電特性受氣象、經(jīng)濟等因素影響顯著。隨著經(jīng)濟快速發(fā)展,城鄉(xiāng)居民的生活用電量迅速增加;由于家用電器的普及率越來越高,特別是空調負荷已經(jīng)成為城鄉(xiāng)居民用電的重要組成部分,并且從根本上改變了居民生活用電特性。若要提高城鄉(xiāng)居民月度電量的預測精度,不能單純依靠歷史序列進行外推,需要結合經(jīng)濟、氣象等多因素的影響,篩選出相關性強的指標,再利用相關因素分析法建立回歸模型進行預測。傳統(tǒng)只依賴相關因素分析法建立回歸模型的預測誤差往往較大,如文獻[1]通過基于粗糙集理論找到相關因素后進行回歸分析的預測方法。自回歸差分移動平均模型(autoregressive integrated moving average model,ARIMA)對預測非平穩(wěn)時間序列具有很大優(yōu)勢,文獻[2]在ARIMA 模型的基礎上先消除季節(jié)周期分量影響再對月度電量進行預測;文獻[3]提出一種結合X12季節(jié)分解方法的ARIMA 月度電量預測方法。但這些研究多集中在應用ARIMA模型進行月度電量預測,忽視了ARIMA模型是可以對預測誤差進行修正的價值。
本文在考慮相關因素建立回歸模型進行預測的基礎上,充分利用ARIMA 模型對誤差修正的優(yōu)勢,創(chuàng)新性地提出基于K-L信息量法和ARIMA誤差修正的月度電量預測法。在篩選相關性強的指標基礎上,利用相關分析法對影響因素與電量進行回歸建模,計算擬合誤差并構建新的非平穩(wěn)時間序列,結合ARIMA 模型對此序列進行修正,提升月電量的預測準確率。
城鄉(xiāng)居民用電呈現(xiàn)出變化趨勢相對穩(wěn)定、空調用電明顯的特征。如圖1所示某地城鄉(xiāng)居民歷年月電量,一般表現(xiàn)為6 月份開始電量快速上升,8 月達到頂峰,9月開始回落,每年11月至來年5月是全年用電低谷。
圖1 2016—2019年城鄉(xiāng)居民生活用電情況Fig.1 Domestic electricity consumption of urban and rural residents in 2016—2019
根據(jù)城鄉(xiāng)居民用電特性,如歷年變化趨勢相對穩(wěn)定,空調用電特性明顯等特點,采用K-L信息量法從多種影響因素中篩選出最相關因素建立回歸模型進行初步預測。
K-L信息量法是對指標總體概率分布的擬合程度進行評價的一種方法[4]。對于帶有隨機性的現(xiàn)象,可以認為它是服從某一概率分布的隨機變量的一些實際值。如果已知真正的概率分布,通過估計選擇的概率模型與實際的概率分布相近的程度來判斷模型的好壞。具體計算公式如下。
(1)設一個基準指標y={y1,,y2,,…,yn} ,該指標的概率分布列為p={p1,,p2,,…,pn} ,則標準化處理后的基準變量序列pt為
式中:yj為基準隨機變量;pt為對yt進行標準化處理后的序列。
(2) 設另一個指標為被選指標為x={x1,x2,…,xn} ,該備選指標概率分布序列為q={q1,q2,…,qn} ,則標準化處理后的指標序列qt為
式中:xj為備選指標隨機變量;qt為對xt進行標準化處理后的序列。
(3)定義分布列q關于分布列p的K-L信息量kl為
以某地城鄉(xiāng)居民月電量為歷史數(shù)據(jù),選取盡可能豐富的外部影響指標,應用K-L 信息量法計算出的各個指標的K-L 信息量,從表1 可以看出,與城鄉(xiāng)居民月度電量最相關的影響因素為最高氣溫平均值。
表1 月度電量與各個指標的K-L信息量Table 1 Monthly electric quantity and K-L information of each indicator
相比于時間序列模型,相關因素回歸模型不再只針對歷史電量數(shù)據(jù)進行分析,而是把時間項換為相關因素,建立電力需求與一個或多個相關變量的回歸方程式?;貧w分析法對相關因素的選擇要求比較高,使用的相關因素必須與電力需求之間具有長期的穩(wěn)定的相關關系。
常用的回歸模型有線性模型、指數(shù)模型、對數(shù)模型、冪函數(shù)模型、拋物線模型、多元回歸模型。
根據(jù)城鄉(xiāng)居民的月度電量與當?shù)卦伦罡邭鉁仄骄抵g的擬合誤差最小建立回歸方程,得到歷史月擬合誤差時間序列和預測月預測誤差。但只依賴相關因素分析法建立回歸模型的預測誤差往往較大,需要對預測誤差進行修正后再預測才能更好地提高預測精度。
ARIMA 模型對預測非平穩(wěn)時間序列具有很大優(yōu)勢。利用上述回歸模型得到的歷史月電量誤差值剛好構成一個非平穩(wěn)時間序列,所以可以采用ARIMA模型進行修正。
ARIMA 模型是采用差分運算或對數(shù)運算后將非平穩(wěn)時間序列轉換成對平穩(wěn)時間序列后,利用自相關和偏自相關函數(shù)建立的一種時間序列預測方法[3],該模型已成熟應用在時間序列分析領域。ARMA是對平穩(wěn)時間序列的預測模型,ARIMA是對非平穩(wěn)時間序列先進行平穩(wěn)化檢驗與處理后再利用ARMA模型進行預測的模型。
針對非平穩(wěn)時間序列Xt的ARIMA(m,d,n)模型表達式為
式中:d為差分次數(shù);B為滯后算子;Xt為經(jīng)過d次差分后的平穩(wěn)時間序列;m和n分別為自回歸階數(shù)和滑動平均階數(shù);φ1,φ2,…,φn分別為自回歸系數(shù);ω1,ω2,…ωq分別為滑動平均系數(shù);εt,εt-1,…,εn-1為零均值白噪聲序列。
ARIMA模型預測步驟如下:
(1)首先,獲取時間序列,檢查該序列數(shù)據(jù)是否屬于平穩(wěn)時間序列。常用的方法是時序圖法,如果不平穩(wěn),需要對非平穩(wěn)時間序列進行d次差分直到平穩(wěn)。一般d≤2。
(2)其次,用Box-Jenkins 法進行模型識別,即計算自相關函數(shù)和偏自相關函數(shù),利用兩個函數(shù)的截尾和拖尾特性判斷模型階數(shù)p和q。
(3)再次,用最小二乘法計算自回歸系數(shù)和滑動平均系數(shù)。
(4)最后,進行模型驗證。主要檢查εt是否為白噪聲序列,檢查方法是利用Barlett 定理構造檢驗統(tǒng)計量[1]。若為白噪聲序列,模型通過,若不是白噪聲序列,需要重新進行模式識別。
設歷史月度電量序列為y={y1,y2,…,yt} 。結合K-L 信息量和ARIMA 誤差修正的月度電量預測流程步驟如下,流程如圖2所示。
(1)采用K-L 信息量篩選指標:首先采用K-L信息量計算月度電量與多指標的分布函數(shù),通過KL信息量的計算公式得到各個指標與月度電量的KL信息量。選取K-L信息量在50以內的一個或多個影響指標作為月度電量的相關因素建立回歸方程。
(2)相關因素分析法建立回歸方程:若為一個影響指標,則建立一元回歸方程;若為多個影響指標,則建立多元回歸方程。
(3)獲取誤差時間序列:通過回歸方程,計算擬合曲線與歷史真實值之間的誤差值。構建擬合誤差時間序列D={D1,D2,…,Dt} 。
(4)利用ARIMA 模型進行誤差修正[5]:運用R語言中的 ARIMA 工具包[6]對誤差時間序列Dt直接建模,通過ARIMA預測模型實現(xiàn)對誤差值的修正。
(5)基于修正誤差預測月度電量:將相關因素分析法的預測值與修正后的預測誤差值進行加減預算,得到修正后的月度電量預測值。
圖2 基于K-L信息量和ARIMA誤差修正的預測流程Fig.2 Prediction process based on K-L information and ARIMA error correction
為驗證本文所提出的基于K-L 信息量和ARIMA誤差修正的月度電量預測模型的可行性,選取某地2016 年1 月至2019 年6 月的城鄉(xiāng)居民月度電量作為歷史數(shù)據(jù)序列,以2019年7、8、9月作為預測目標,預測具體步驟如下。
(1)為對比多元回歸模型與一元回歸模型的預測精度,結合K-L信息量計算結果,首先選取對電量影響較大的前四種影響因素,選擇多元回歸模型,建立月度電量與最高氣溫平均值a、房間空氣調節(jié)器產(chǎn)量b、降雨量c、房地產(chǎn)開發(fā)施工面積d的月度電量值y多元回歸模型為
(2)在K-L信息量得出溫度對電量影響最大基礎上,選擇一元回歸方程的拋物線模型,建立月度電量y與最高氣溫平均值x的回歸模型為
(3)利用回歸模型獲取誤差時間序列,得到修正前的預測誤差精度如表2所示。
表2 修正前擬合誤差Table 2 Fitting error before correction%
(4)利用ARIMA模型修正誤差
選取歷史誤差值為歷史值構建訓練樣本集,2019 年 7 月至 9 月為預測月,結合 R 語言的 ARIMA工具包,將上述誤差時間序列逐次進行平穩(wěn)化處理、模型識別、參數(shù)估計、模型檢驗等,最后輸出誤差修正值。修正后的預測誤差如表3所示。
表3 修正后預測誤差Table 3 Fitting error after correction%
(5)基于修正誤差的月度電量預測
由于一元方程的預測誤差更小,因此采用一元回歸方程結合ARIMA 修正方法對月度電量進行預測,即將相關因素分析中的預測值與ARIMA修正后的預測誤差值進行加減運算,得到修正后的預測值見表4。
表4 預測誤差修正值Table 4 Modification of prediction error萬kWh
最后,單獨采用相關分析法及文獻[7]中的ARIMA 預測法兩種預測方法進行計算,與基于K-L信息量與ARIMA誤差修正預測法進行對比,并進一步計算3種結果預測誤差,結果如表5,誤差越小,預測精度越高。由此可見,本文所提的基于K-L 信息量和ARIMA 誤差修正的月度電量預測方法對于城鄉(xiāng)居民用電具有較好的預測效果。
表5 3種預測方案對比Table 5 Comparison of three forecasting schemes
將回歸方程的擬合誤差構建成新的非平穩(wěn)時間序列,利用ARIMA 對非平穩(wěn)時間序列的預測優(yōu)勢,修正預測誤差,為提高預測精度提供思路。
基于K-L 信息量和ARIMA 誤差修正的月度電量預測方法既考慮了對城鄉(xiāng)居民用電量影響較大的相關因素,又修正了相關因素分析法的預測誤差,提高了預測精度。