段博文 許沈彬 馬騁 張強 衣濤
摘? ?要:針對傳統(tǒng)典型日負荷特性選取方法誤差較大的問題,文章提出了基于K-means的典型日負荷特性計算方法。首先,以月為尺度對全年日負荷特性曲線進行分組。其次,計算日負荷特性曲線的最大值、最小值、最大值發(fā)生時間、最小值發(fā)生時間、峰谷差率5個指標對其進行歸一化,利用K-means聚類分析方法對每組樣本數(shù)據(jù)5個特征值進行聚類分析。最后,在排除突變負荷特性后,選擇距離聚類中心最遠的樣本為本月典型日負荷特性。結果表明:所提方法能有效選取典型日負荷特性曲線。
關鍵詞:K-means;典型日;負荷特性
通常選取典型日負荷特性進行電力系統(tǒng)相關計算分析。目前,對于典型日負荷特性曲線的選取方法沒有統(tǒng)一規(guī)定,國內(nèi)一般采用主觀選擇法[1],由于是人為選擇,結果誤差較大。另一種是抽樣法,但傳統(tǒng)的隨機采樣易出現(xiàn)數(shù)據(jù)聚集的現(xiàn)象,在數(shù)據(jù)密集區(qū)抽取的樣本較多,從而導致采取數(shù)據(jù)在整個樣品中不均衡,出現(xiàn)很多誤差。一般的聚類法面對大數(shù)據(jù)會存在耗時長、聚類數(shù)目不確定等問題。國外采用的啟發(fā)式場景消減法的算法擴大了數(shù)據(jù)處理能力,能有效改善算法的執(zhí)行效率,解決了一般的聚類問題,但是聚類內(nèi)個體數(shù)分配典型日權重,當?shù)湫腿諗?shù)量較少時,所得到的典型場景在負荷和資源總量方面與原始數(shù)據(jù)將存在一定的偏差。K-means方法簡單易行、操作簡單,是目前使用最為廣泛的聚類分析方法之一,采用K-means聚類分析方法,在相關指數(shù)基礎上進行日負荷特征曲線的提取,一定程度上解決了典型日負荷計算中存在的誤差。
1? ? K-means聚類理論
K-means聚類算法是一種常用的動態(tài)聚類算法,實現(xiàn)過程是:首先,選擇聚類中心,對樣本作初始分類;其次,根據(jù)聚類準則,判斷聚類是否合理,不合理就修改聚類,直至合理為止。相對于經(jīng)典的無監(jiān)督聚類算法而言,K-means聚類算法具有簡化計算、加快收斂速度等特點。
每個聚類內(nèi)的成員應盡可能地接近,所以聚類密集性越小越好。但是在極端情況下,當每個輸入矢量被分為單獨的類時,聚類密集性有最小0,因此,需要對聚類數(shù)目進行選擇,找到具有實用性且較優(yōu)的聚類數(shù)目[6]。
2? ? 某電網(wǎng)典型日負荷特性曲線的選取
以某電網(wǎng)某一年全年8 760點負荷數(shù)據(jù)為聚類分析樣本,以月為時間尺度進行典型日負荷特性的提取。首先,以月為時間尺度,計算樣本數(shù)據(jù)的按照月負荷特性樣本的最大值、最小值、最大值發(fā)生時間、最小值發(fā)生時間、峰谷差率5個指標進行歸一化處理;其次,分別對12個月日負荷特性曲線特征值進行K-means聚類,根據(jù)類中90%樣本到類中心距離小于某個距離確定分類數(shù)目,并選取距離類中心樣本數(shù)據(jù)較遠且非孤立點的樣本為典型日負荷特性。某電網(wǎng)12個月負荷特性曲線樣本數(shù)據(jù)與月負荷特性中心樣本距離分布如圖1所示,1~12月樣本數(shù)據(jù)密集性較好,與中心樣本的距離較小。提取某電網(wǎng)月負荷特性典型日詳細步驟如下[7-8]:
第1步,以某電網(wǎng)全年365日負荷特性數(shù)據(jù)為樣本,以月為單位進行分組。
第2步,按照月負荷特性樣本的最大值、最小值、最大值發(fā)生時間、最小值發(fā)生時間、峰谷差率5個指標進行聚類分析計算。將最大值、最小值按照公式(3)進行歸一化處理,最大值發(fā)生時間、最小值發(fā)生時間按照公式(5)進行歸一化處理,峰谷差率用公式(4)進行歸一化處理,然后用K-means聚類方法進行聚類。
第3步,每組類數(shù)目的確定判據(jù)為可采用簇內(nèi)90%的樣本距離類中心的距離小于某個特定誤差值確定的分類數(shù)目,本次項目取每組類數(shù)目等于1。
第4步,選取距類中心距離最遠的樣本為本月典型日負荷特性以確定典型日。
第5步,典型日修正,觀察類內(nèi)樣本距離,在密集性好的樣本中選擇距離類中心距離最遠的樣本為典型日。
3? ? 基于K-means方法選取典型日負荷特性的相關討論
(1)利用K-means聚類分析方法確定典型日負荷特性,也是一種多指標中心計算的方法。K-means聚類分析方法是一種基于機器學習的智能數(shù)據(jù)分類方法,與常規(guī)統(tǒng)計方法相比,是兼顧樣本多個特征值的分類方法。提取的類中心表示了多個指標的中心。
(2)利用K-means聚類分析方法計算類中心時,由于其初始解的不確定性,導致運算結果可能不唯一,但這些解均為滿足聚類誤差的解。為了得到最優(yōu)解,在計算結果處理上采用了3個甄別最優(yōu)中心解的準則:首先,如果兩次聚類獲得的類中心不同,而兩個分類結果的類內(nèi)90%樣本數(shù)據(jù)距離類中心的平均距離又相等,則存在距離類中心最遠距離最小的解為最優(yōu)解。其次,如果兩次聚類獲得的類中心不同,而兩次分類結果的類內(nèi)90%樣本數(shù)據(jù)距離類中心平均距離不等,則平均距離小的解為最優(yōu)解。最后,如果兩次聚類獲得的類中心不同,且兩次分類結果的類數(shù)不同,則類數(shù)少的解為最優(yōu)解。
(3)利用K-means聚類分析方法選取典型日負荷特性時,聚類效果與數(shù)據(jù)是否具有明顯分類特征有關,當樣本數(shù)據(jù)具有明顯的分類特征時,聚類計算結果可較好收斂,不具有振蕩性。當聚類結果出現(xiàn)局部振蕩時,可用人工方法進行進一步甄別,以獲得最優(yōu)解。
(4)某電網(wǎng)負荷特性分類結果表明了很好的收斂性,經(jīng)過20次實驗計算,無多解出現(xiàn)。
4? ? 結語
本文針對電力系統(tǒng)典型日負荷特性曲線提取問題進行了研究,提出了一種基于K-means聚類分析方法的電力系統(tǒng)典型日負荷特性曲線提取方法,并以某電網(wǎng)全年365日歷史負荷數(shù)據(jù)樣本為例,以月為時間尺度,計算了每個月的典型日負荷特性曲線,驗證了此方法的有效性。
[參考文獻]
[1]劉嬌揚,郭力,楊書強,等.配電網(wǎng)中多光儲微網(wǎng)系統(tǒng)的優(yōu)化配置方法[J].電網(wǎng)技術,2018(9):2806-2815.
[2]GAO Y,HU X Y,WANG L,et al.Multi-objective bilevel coordinated planning of distributed generation and distribution network frame based on multiscenario technique[J].IEEE Transactions on Sustainable Energy,2017(4):1415-1429.
[3]BARINGO J M,BARINGO L,CONEJO A J,et al.Probabilistic power?ow with correlated wind sources[J].IET Generation,Transmission&Distribution,2012(5):641-651.
[4]蔡國偉,王大亮,王燕濤,等.一種基于最短距離聚類與關聯(lián)度分析的典型日選取新方法[J].中國電力,2008(4):19-22.
[5]孟令奎,段紅偉,黃長青,等.一種基于語義聚類的典型日負荷曲線選取方法[J].華北電力大學學報(自然科學版),2013(1):43-48.
[6]方茂益,孫志杰,周國鵬,等.基于FCM配電側典型電力日負荷曲線分類研究[J].華北電力技術,2016(11):15-19.
[7]彭秋生,魏文紅.基于核方法的并行模糊聚類算法[J].計算機工程與設計,2008(8):1881-1883.
[8]LI J H,LAN F,WEI H.A Scenario optimal reduction method for wind power time series[J].IEEE Transactions on Power Systems,2014(6):2628-2635.
Abstract:The paper presents a typical daily load characteristic calculation method based on K-means, aiming at the problem of large error in the traditional typical daily load characteristic selection method. First, the annual load characteristic curve is grouped in a monthly scale. Next, the maximum value, the minimum value, the maximum value generation time, the minimum value generation time, the peak-to-valley and the 5 indexes of the daily load characteristic curve are normalized, and the five characteristic values of each group of sample data are clustered by the K-means cluster analysis method. and finally, after the characteristic of the mutation load is eliminated, the sample furthest from the cluster center is selected to be the typical daily load of the current month characteristic. The results show that the proposed method can effectively select the typical daily load characteristic curve.
Key words:K-means; typical day; load characteristic