潘 攀,陳 凡
(國網浙江省電力有限公司溫州供電公司,浙江 溫州)
電能生產具有一定特殊性,電力系統(tǒng)內部無法大量儲存電力負荷,所以在電力系統(tǒng)供電過程中需要精準掌握用戶負荷的變化動態(tài)平衡,實現(xiàn)用戶用多少負荷電網就生產多少負荷,這一過程就是電力系統(tǒng)的短期電力負荷預測。文獻[1]提出Dropout-ILATM預測模型,解決了傳統(tǒng)方法難以處理負荷數(shù)據間關聯(lián)的問題,適用于更多預測寬度的負荷預測;文獻[2]設計Prophet 和XGBoost 相混合的預測模型,可以準確快速地預測電力負荷。但電力負荷的產生是一個隨機非平穩(wěn)過程,歷史負荷觀測值具有波動性,導致傳統(tǒng)方法的精度不夠,因此,提出關于短期電力負荷預測方法的研究。
本文參考模糊聚類原理挖掘歷史電力負荷數(shù)據的規(guī)律,從而選取相似日[3],簡單來說就是根據模糊規(guī)則構建電力負荷特性指標數(shù)據的模糊系數(shù)特征映射表,并挖掘負荷數(shù)據之間的規(guī)律,該方法可以有效降低負荷隨機性,進而提升挖掘精度。假設兩個不同的電力負荷數(shù)據樣本分別為那么為構建樣本數(shù)據的模糊相似矩陣[4],需要根據下式求出這兩個樣本之間的相似程度:
式中,smn表示電力負荷數(shù)據Xm與Xn之間的相似度。在式(1)的基礎上,即可構建電力負荷數(shù)據樣本空間的模糊相似矩陣[5],表達式如下所示:
式中,S 表示電力數(shù)據的模糊相似矩陣。根據式(2)所求模糊相似矩陣,即可完成相似日的選取,通常一個相似矩陣就可以獲得一個樣本數(shù)據的分類,在根據傳遞閉包設置一個合適的閾值后,就可以利用該閾值對矩陣進行截割,以此實現(xiàn)電力負荷數(shù)據的動態(tài)聚類,最終分類結果即為相似日選取結果。在選取相似日的過程中,為篩選出最為接近的相似日,可以對預測日與歷史日之間的相似程度進行排序,以此確定最佳的相似日,保障挖掘相似日電力負荷數(shù)據的有效性。在相似日確定后,最后對選取的相似日電力負荷數(shù)據進行提取,以此作為后續(xù)負荷預測樣本。
歷史相似日電力負荷數(shù)據是本文所設計預測方法的基石[6],挖掘的相似日數(shù)據質量將直接影響本文設計方法的預測精度,所以為保障后續(xù)負荷預測的正確性與有效性,本文在上述研究內容的基礎上,對挖掘數(shù)據進行一定的預處理[7]。一般來說,受電力系統(tǒng)自身以及外界環(huán)境等因素的影響,會導致挖掘的相似日電力負荷數(shù)據存在異常值,所以本文首先對相似日數(shù)據做清洗處理,數(shù)據清洗主要分別兩步,一是電力負荷數(shù)據異常值的辨識,這里本文采用絕對中位差法進行異常數(shù)據的辨識,對于相似日的電力負荷數(shù)據來說,異常數(shù)據辨識的具體流程如下:獲取電力負荷數(shù)據集合的平均值X;根據該平均值與集合中各采樣點數(shù)據之間的絕對偏差,即可求出絕對偏差的中位數(shù)W,計算公式如下所示:
式中,median 表示中值函數(shù)。根據上式確定中位數(shù)后,即可掌握相似日電力負荷數(shù)據的合理取值范圍并將超出該范圍的負荷數(shù)據判斷為異常數(shù)據,本文以X'表示相似日的異常負荷數(shù)據。二是對辨識出的異常數(shù)據X'缺失值進行補全操作,這里本文采用拉格朗日差值法進行缺失數(shù)據的補全,就是通過負荷數(shù)據點之間連續(xù)性的變化規(guī)律,以缺失點前后的數(shù)值對缺失點進行插值修復,表達式如下所示:
式中,I(X')表示異常電力負荷數(shù)據缺失點插入的缺失值近似值;a1…an表示多項式。與此同時,為避免不同量綱差別為負荷預測帶來的誤差,本文還需要對挖掘相似日數(shù)據進行歸一化處理[8],也就是將挖掘數(shù)據按一定比例全部縮放至一個特定的區(qū)間中,使其量綱一致,本文主要采用下式所示的最小- 最大歸一化處理原始數(shù)據:
式中,X0表示歸一化后的相似日電力負荷數(shù)據,其取值區(qū)間為[0,1];X 表示原始相似日電力負荷數(shù)據;Xmin、Xmax分別表示相似日電力負荷數(shù)據集中的最小與最大數(shù)據。利用式(5)處理數(shù)據,可以實現(xiàn)相似日電力負荷數(shù)據的等比例縮放。綜上,本章對挖掘的相似日電力負荷數(shù)據做了兩個主要預處理工作,分別是數(shù)據清洗與數(shù)據歸一化,通過數(shù)據清洗可以將原始負荷數(shù)據中的異常值修復,通過數(shù)據歸一化可以將不同量綱的原始數(shù)據轉換映射至相同特定區(qū)間中,將經過預處理后的相似日電力負荷數(shù)據用于后續(xù)預測環(huán)節(jié),可以保障數(shù)據質量。
前文通過對電力系統(tǒng)歷史相似日的各類電力負荷數(shù)據進行深入挖掘并預處理后,形成了訓練樣本數(shù)據,本章將基于上述數(shù)據構建SVM模型,從而形成短期負荷的預測[9]。支持向量機(SVM)屬于統(tǒng)計學習范疇,主要是針對分類問題研究出來的,將其應用于電力系統(tǒng)短期負荷預測中,在預測過程中不會陷入局部最優(yōu)[10],而且具有較好的推廣性。本文所構建的SVM預測模型,與常規(guī)神經網絡有著相似的網絡結構,均由輸入、隱藏以及輸出層組成,但不同的是,本文建立的SVM模型隱藏層的神經元節(jié)點個數(shù)利用電力負荷數(shù)據樣本中支持向量數(shù)目來確定,這樣可以避免模型在訓練過程中陷入局部極值[11]。那么SVM預測模型的具體建模過程如下:一般來說,線性回歸問題的本質就是通過一個合理的函數(shù),求解出樣本數(shù)據的對應輸出值,本文所構建的SVM預測模型也是這樣,當相似日電力負荷數(shù)據輸入模型時,通過線性擬合函數(shù)將輸入數(shù)據映射至高維空間中,從而得到輸出值,該函數(shù)的表達式如下所示:
式中,Y 表示模型輸入變量對應的輸出值;T 表示模型輸入變量原始特征空間的維數(shù);α(X)表示模型輸入相似日電力負荷數(shù)據的線性映射函數(shù);表示Y 與α(X)之間的點積運算;p 表示閾值。在式(6)基礎上,參考結構風險最小化原則,即可確定SVM 預測模型的最優(yōu)回歸函數(shù),表達式如下:
本章選擇我國某地區(qū)2022 年12 月的電力系統(tǒng)的電力負荷數(shù)據作為實驗數(shù)據,展開仿真實驗,以對文中設計的短期電力負荷預測方法的優(yōu)勢進行驗證。在本次仿真實驗中,以本文設計基于數(shù)據挖掘的預測方法作為實驗組,并選用基于BP 神經網絡的預測方法、基于LSTM網絡的預測方法作為對照組。首先,將收集的實驗數(shù)據中前20 天的電力負荷數(shù)據作為訓練樣本,后10 天的電力負荷數(shù)據作為測試樣本,其中測試樣本的原始電力負荷數(shù)據曲線如圖1 所示。
圖1 原始電力負荷曲線
在此基礎上,先采用訓練樣本分別對實驗組方法與對照組方法進行訓練,實現(xiàn)各方法下預測模型最優(yōu)參數(shù)的設置;再采用圖1 所示測試樣本分別輸入三種不同的預測模型中,從而獲得最終電力負荷預測結果。
經過不同預測模型的訓練與測試后,所得最終電力負荷預測對比結果如圖2 所示。
圖2 電力負荷預測結果
通過圖2 可以發(fā)現(xiàn),整體來說,本文設計方法預測的短期電力負荷曲線,與原始負荷曲線之間的擬合效果較對照組方法更好,說明本文設計方法下的短期電力負荷更接近于真實值。為進一步對比實驗組方法與對照組方法的預測性能,本文以下式所求誤差作為預測方法的評價指標:
式中,ε 表示平均絕對叟分比誤差;N 表示電力負荷采樣點數(shù)量;H(i)表示第i 個采樣點的電力負荷實際值;H'(i)第i 個采樣點的電力負荷預測值。根據上述內容,分別求出每種方法下的絕對叟分比預測誤差,結果如表1 所示。
表1 不同預測方法的性能對比
從表1 中數(shù)據可知,基于BP 神經網絡的預測方法的平均絕對叟分比誤差為9.37%,基于LSTM網絡的預測方法的平均絕對叟分比誤差為5.93%,而本文設計方法的平均絕對叟分比誤差為3.08%,較對照組方法降低了6.29%、2.85%。由此可以說明,本文所提基于數(shù)據挖掘的短期電力負荷預測方法是有效且可靠的,整體預測精度較高,滿足電力系統(tǒng)的用電負荷預測需求。
在我國國家與民眾對電力需求不斷增加的大背景下,電力負荷預測不僅影響電力系統(tǒng)的供需平衡,而且影響系統(tǒng)供電可靠性,所以如何精準有效地預測電力系統(tǒng)短期電力負荷已經成為我國社會熱點問題?;诖?,本文設計一種基于數(shù)據挖掘的預測方法,文中通過挖掘相似日的歷史用電負荷數(shù)據,完成了負荷預測,并通過仿真實驗驗證了設計方法的優(yōu)越性。當然,目前本文僅針對電力系統(tǒng)的短期負荷做了預測,設計方法是否可以同時精準預測長期電力負荷有待進一步深入研究。