祁夢雪,梅林玨昊,李知藝,辛煥海
(浙江大學電氣工程學院,浙江省 杭州市 310027)
精細化的負荷劃分結果將為精準負荷調(diào)控奠定基礎,而負荷曲線聚類是主流的負荷劃分思路[1-3]。按照工、商、民、農(nóng)等行業(yè)性質對配電網(wǎng)末梢負荷進行的傳統(tǒng)類別劃分,往往忽略電力用戶負荷波動態(tài)勢的復雜性,缺乏對電力用戶用電行為的個性化分析,難以滿足負荷調(diào)控的多樣化、靈活性需求[4-6]。事實上,負荷特性受到氣候、經(jīng)濟、節(jié)假日等多個維度的因素影響,呈現(xiàn)出短期波動性大的特點。即使是同一個用戶,其電力消費模式也可能在連續(xù)幾日內(nèi)發(fā)生很大變化。因此,增加負荷分析對象的時間尺度,可避免負荷波動規(guī)律分析的偶然性。
主流的聚類研究大致可以分為基于距離的方法[7-12]、自組織映射方法[13]以及概率生成模型[14]三類,但這些方法在實現(xiàn)上均存在參數(shù)調(diào)節(jié)問題。少量文獻也考慮了負荷波動的影響。文獻[15]提出基于移動形狀的魯棒模糊K 模態(tài)(MS-RFKM)聚類方法,但難以平衡選取的符號化區(qū)間長度與聚類效果的關系;文獻[16]采用動態(tài)時間規(guī)整方法識別電力曲線的變化趨勢,文獻[17]提出兩階段負荷聚類方法,降低了聚類算法的特征空間維度,但聚類效果都受到數(shù)據(jù)維度的限制。以上問題出現(xiàn)的根本原因在于,在高維數(shù)據(jù)情況下,數(shù)據(jù)點間的距離傾向于彼此接近,造成數(shù)據(jù)點之間的距離關系弱化[18]。因此,負荷曲線聚類研究經(jīng)常局限于單日負荷曲線的分析,導致聚類結果的準確度和魯棒性不足,難以準確把握用戶的周期性電力消費特征。
網(wǎng)絡科學為非線性時間序列的分析提供了全新的視角[19]。通過一定的映射方法[20],將初始時間序列轉換為一個或多個網(wǎng)絡,借助網(wǎng)絡理論描述時間序列的動態(tài)行為,有益于深化對系統(tǒng)狀態(tài)的理解[21]??梢晥D(visibility graph,VG)[22-23]及水平可視圖(horizontal visibility graph,HVG)[24]方法是將非線性時間序列轉換為網(wǎng)絡的重要手段之一,在描述金融市場的長期價格動態(tài)特性、不確定性、復雜性等方面有著廣泛的應用,所分析的對象也不受限于時間序列的維度。這種映射方法也為從網(wǎng)絡科學的角度研究多日負荷曲線架設了橋梁。文獻[25]引入網(wǎng)絡中的“模體”工具實現(xiàn)不同行業(yè)負荷曲線特性的挖掘,是網(wǎng)絡方法在分析電力負荷曲線中應用的一次嘗試。在面對多個分析對象時,文獻[26]構建了多層網(wǎng)絡,并從量子理論的角度,對多層網(wǎng)絡結構進行約簡。由上述分析可知,網(wǎng)絡分析方法克服了傳統(tǒng)時間序列分析方法難以應對的高維數(shù)據(jù)分析問題,可實現(xiàn)時間序列的動態(tài)行為分析,這對分析電力用戶的用電行為具有很好的借鑒意義。
針對當前聚類方法存在的參數(shù)調(diào)節(jié)、難以分析高維度數(shù)據(jù)、可解釋性不強等問題,本文提出一種基于網(wǎng)絡結構約簡理念的多日負荷曲線聚類新思路。通過將配電網(wǎng)末梢負荷曲線從時間域映射到網(wǎng)絡域,實現(xiàn)了多日曲線聚類向多層網(wǎng)絡冗余結構約簡的等價轉化。相關分析過程既能避免繁多的參數(shù)調(diào)節(jié)問題,又能增強聚類結果的可解釋性,為后續(xù)負荷高效調(diào)控研究提供了理論與方法支撐。
HVG 方法[27]根據(jù)特定的幾何標準將時間序列映射到圖形中,以便利用網(wǎng)絡理論來挖掘時間序列的隱含信息。已有研究表明,通過HVG 方法轉換成的網(wǎng)絡,仍能保持時間序列的固有特征,且可以捕獲 生 成 序 列 過 程 的 動 態(tài) 特 征[28]。HVG 是 對VG 方法的幾何簡化,它將時間序列中的每個點看作網(wǎng)絡中的一個節(jié)點,節(jié)點間是否存在連邊則是由時間序列中對應的采樣點能否在幅值水平上無阻礙地互相看見決定。圖1 展示了負荷時間序列通過HVG 方法從時間域轉換到網(wǎng)絡域的過程。具體的映射方法過程參見附錄A。所形成的網(wǎng)絡可以表示為G=(V,E,A),其中V為網(wǎng)絡中的節(jié)點,E為連邊,A為網(wǎng)絡的鄰接矩陣。另外,負荷曲線是由有限個負荷數(shù)據(jù)采樣點構成的,故本文中的負荷曲線與負荷時間序列是同一種概念。典型周負荷曲線如附錄A圖A1 所示,可以發(fā)現(xiàn)連續(xù)多日內(nèi)負荷存在著波動幅度、波動頻次、波峰出現(xiàn)位置以及波動周期上的明顯差異,而周間負荷波動則在整體上差異較小。因此,本文以周作為負荷分析的時間尺度。在多日負荷曲線聚類分析中,為了不使HVG 方法在應用的過程中放大局部的微小波動,本文在時間序列向網(wǎng)絡映射時忽略跨過采樣間隔不足整體采樣數(shù)據(jù)量1%(本文為4)的連邊。附錄A 圖A2 展示了典型周居民負荷曲線(每天48 個采樣點,共336 個采樣點)轉化為網(wǎng)絡的示意圖。在這個過程中,不會出現(xiàn)傳統(tǒng)HVG 下相鄰采樣點天然有連邊的結果,所形成的網(wǎng)絡也可能是非連通圖。
圖1 HVG 方法示意圖Fig.1 Schematic diagram of HVG method
多層網(wǎng)絡[29]在反映網(wǎng)絡層間節(jié)點關系的同時也能反映網(wǎng)絡層內(nèi)節(jié)點的關系。由于負荷曲線分析對象的數(shù)據(jù)采樣時間段和采樣頻率一致,本文將時間作為網(wǎng)絡之間的關聯(lián)點,建立網(wǎng)絡相鄰層之間的聯(lián)系。在應用HVG 方法將M個電力用戶一周的負荷時間序列轉換成網(wǎng)絡后,對時刻點相同的層間節(jié)點進行連接,形成M維多層負荷網(wǎng)絡模型Λ={A(1),A(2),…,A(M)}。
在負荷曲線聚類問題中,若時間序列過短,就會因電力消費行為在宏觀消費周期內(nèi)的隨機性而降低聚類結果的魯棒性與可解釋性;若時間序列長度變大,將面臨高維時間序列帶來的聚類效率問題,依賴參數(shù)調(diào)節(jié)的聚類方法難以確保結果的準確性。
目前已出現(xiàn)大量將負荷時間序列轉換為伴生網(wǎng)絡的研究[27-30],在拓寬網(wǎng)絡理論適用范圍的同時,也為負荷時間序列分析提供了全新的視角和工具。負荷曲線聚類問題實質上是一種多維信息的去冗余過程,即在最大程度上保留系統(tǒng)原有信息的基礎上,最小化聚類內(nèi)部差異性,最大化聚類外部的區(qū)別度。與這個過程相對應的是多層網(wǎng)絡結構約簡的過程。具體來說,在負荷時間序列轉換為網(wǎng)絡后,根據(jù)不同電力用戶之間的時間關聯(lián)性,可建立與之相關的多層伴生網(wǎng)絡。因某些用戶的用電行為存在相似性,反映在網(wǎng)絡中即為結構冗余。將結構相似的網(wǎng)絡層進行聚合,簡化多層伴生網(wǎng)絡的各層網(wǎng)絡結構和網(wǎng)絡層數(shù),即得到緊湊的聚合層內(nèi)部結構以及各個極具區(qū)分度的聚合后的網(wǎng)絡層。由于多層伴生網(wǎng)絡中的各層網(wǎng)絡代表的是各個用戶的周負荷時間序列的波動情況,簡化后的多層伴生網(wǎng)絡中的聚合層表征了有著相似負荷波動特性的用戶集合,聚合層個數(shù)則表征負荷曲線聚類的類別數(shù)。由此,得到負荷曲線聚類結果。多層伴生網(wǎng)絡約簡與負荷曲線聚類對應過程演示圖見附錄A 圖A3。針對聚類結果,從負荷波動相對大小、波動頻次、波動周期等方面實現(xiàn)多日負荷曲線的波動態(tài)勢分析,進而實現(xiàn)不同電力用戶的調(diào)度潛力挖掘。
圖2 為基于網(wǎng)絡結構約簡理念的多日負荷曲線聚類分析框架,旨在從多層伴生網(wǎng)絡結構的角度出發(fā),挖掘連續(xù)多日負荷波動態(tài)勢,并在此基礎上實現(xiàn)電力用戶的集群劃分。具體來說,該分析框架主要包括3 個部分:
圖2 基于網(wǎng)絡結構約簡的多日負荷曲線聚類分析框架Fig.2 Analysis framework for multi-day load curve clustering based on structural reducibility of networks
1)生成負荷時間序列多層伴生網(wǎng)絡:采用HVG方法,建立多個用戶的負荷時間序列多層伴生網(wǎng)絡;
2)多層網(wǎng)絡結構約簡:應用信息熵理論,量化多層伴生網(wǎng)絡中網(wǎng)絡層間的差異,對相似的網(wǎng)絡進行聚合直到多層網(wǎng)絡聚合為一層,并評估歷次聚合后的多層伴生網(wǎng)絡的結構冗余度;
3)多日負荷曲線聚類結果解讀:選擇最優(yōu)層聚合結果作為最終的負荷分類結果,對聚類結果進行波動態(tài)勢以及社會屬性分析。
將多日負荷曲線作為對象,采用多層伴生網(wǎng)絡結構約簡的方法進行電力用戶負荷波動態(tài)勢研究。一方面,可以在依據(jù)行業(yè)性質的宏觀分類下,進一步細化,針對性分析具體用戶的負荷波動情況,將其波動特性與社會屬性結合起來,實現(xiàn)更為全面的分析;另一方面,多日負荷曲線聚類分析的結果可以為電網(wǎng)的需求側響應、電網(wǎng)規(guī)劃和電力市場商業(yè)報價等方面提供參考。
馮諾依曼熵[26]是香農(nóng)熵在量子力學領域的擴展,也可用于表征圖,作為描述負荷時間序列對應的伴生網(wǎng)絡的狀態(tài)參數(shù)。單層伴生網(wǎng)絡的狀態(tài)具體表現(xiàn)為網(wǎng)絡中邊的數(shù)量,而多層伴生網(wǎng)絡的狀態(tài)則體現(xiàn)為網(wǎng)絡的層數(shù)。一般而言,馮諾依曼熵值越大,狀態(tài)就越復雜。
對給定的單層負荷時間序列的伴生網(wǎng)絡G=(V,E,A),其中,節(jié)點個數(shù)N=|V|,連邊數(shù)K=|E|,鄰接矩陣A=(aij),G的馮諾依曼熵定義如下:
式中:Tr(·)表示矩陣的跡;LG=c×(D-A)為與圖關聯(lián)的組合拉普拉斯矩陣,其中c=為節(jié)點度的對角矩陣。形式上,LG具有密度矩陣的所有性質,根據(jù)LG的特征值集合{λ1,λ2,…,λN},hA可以寫成如下形式:
負荷時間序列的多層伴生網(wǎng)絡馮諾依曼熵H(Λ)定義為其M層網(wǎng)絡的馮諾依曼熵之和,即
式中:上標(α)表示α層對應的變量。
多層伴生網(wǎng)絡Λ={A(1),A(2),…,A(M)}的馮諾依曼熵值由網(wǎng)絡層數(shù)M和每層的具體結構決定。而在多層伴生網(wǎng)絡結構約簡的過程中,存在網(wǎng)絡聚合這一過程,必然會導致馮諾依曼熵值的變化。為了衡量層間聚合后的多層伴生網(wǎng)絡的結構冗余度,應用相對熵的概念進行網(wǎng)絡聚合效果的量化分析。
若M層網(wǎng)絡Λ的所有層聚合為一層,將此時的全層聚合網(wǎng)絡記為A,則其鄰接矩陣為A=A(1)+A(2)+…+A(M),記hA為A的馮諾依曼熵。更一般地,對多層伴生網(wǎng)絡Λ的某些層聚合后,得到一個層數(shù)約簡后的X層網(wǎng)絡Φ:
式中:鄰接矩陣C(α)(α=1,2,…,X)為多層伴生網(wǎng)絡Λ的一個鄰接矩陣或者是多個鄰接矩陣之和,簡化后多層網(wǎng)絡Φ的層均熵如式(5)所示。
q(Φ)越大,簡化后的多層網(wǎng)絡Φ與全聚合網(wǎng)絡A的差異越大。一個極端的例子就是當Φ的所有層都相同時,q(Φ)=0,這意味著簡化后的網(wǎng)絡Φ與A是完全等效的。此時,需要放棄具有多層結構的簡化網(wǎng)絡Φ而考慮結構更為精簡的全聚合網(wǎng)絡A。
有了相對熵對負荷時間序列的多層伴生網(wǎng)絡結構冗余度的量化,多層伴生網(wǎng)絡約簡問題就轉換為尋找最佳相對熵值,這是一個典型的多項式復雜程度的非確定性(NP)難題。為解決這個問題,采用詹森-香農(nóng)(Jensen-Shannon,J-S)距離來量化多層伴生網(wǎng)絡所有層對之間的相似性,選擇距離最小的兩層作為該次迭代時的最佳聚合層對。
J-S 距離[31]是為解決K-L 距離的非負、非對稱性且不滿足三角不等式等問題而被提出的,是K-L 距離的對稱和平滑版本。給定兩個密度矩陣ρ和σ,K-L 距離定義如下:
將μ=1/2(ρ+σ)作為這兩個密度矩陣的結合物,則密度矩陣ρ和σ之間的J-S 距離DJS(ρ||σ)可以表示為:
式中:h(·)表示求馮諾依曼熵。
附錄A 圖A4 展示了負荷時間序列多層伴生網(wǎng)絡結構約簡的主要過程。M維負荷時間序列通過HVG 方法映射得到多層伴生網(wǎng)絡Λ={A(1),A(2),…,A(M)}后,基于分層聚類的思想,利用圖的馮諾依曼熵的概念,使用J-S 距離來量化多層伴生網(wǎng)絡所有層對之間的相似性,形成多層伴生網(wǎng)絡層對間的J-S 距離矩陣。將距離最小的層對進行聚合,得到一個新的多層網(wǎng)絡Φ,計算并記錄多層網(wǎng)絡Φ的相對熵。如果此時多層網(wǎng)絡Φ的層數(shù)不為1,即多層網(wǎng)絡Λ還未聚合成一層網(wǎng)絡,則重復上述操作,直到多層網(wǎng)絡Λ聚合成一個網(wǎng)絡。一般選擇各次迭代中相對熵值為全局最大的情況作為最佳層網(wǎng)絡聚合結果。
需要說明的是,在層間具有特定度相關性的情況下,多層伴生網(wǎng)絡的各層會有等譜特性,使得各次迭代得到的相對熵的最大值出現(xiàn)在多層網(wǎng)絡尚未進行層聚合的初始狀態(tài)時。這意味著,如果將網(wǎng)絡層進行聚合會損失部分信息。但通常情況是,在聚合一定數(shù)量的層網(wǎng)絡之前,相對熵的大小非常接近初始狀態(tài)時相對熵的大小,即聚合這些層網(wǎng)絡損失的信息量不大。在進一步網(wǎng)絡層聚合時,才會出現(xiàn)相對熵值的大幅度降低。因此,在考慮損失較少信息的同時,獲得歷次相對熵值斜率絕對值最大的聚合情況,能在可接受的誤差范圍內(nèi)獲得最合理的網(wǎng)絡聚合結果。
為了更好地量化和比較本文方法與其他方法的聚類效果,這里提出了簇內(nèi)波動相似性指數(shù)和簇間波動差異性指數(shù)分別用以衡量聚類后負荷曲線簇內(nèi)波動相似度以及簇間波動差異度。
對于一個具有M條用戶負荷曲線且每條負荷曲 線 有N個 數(shù) 據(jù) 采 樣 點 的 樣 本l={xi}i=1,2,…,N,在負荷曲線聚類后得到ξ組負荷曲線簇,{αs}s=1,2,…,ξ為簇s中所含的 負 荷曲線集 合,{βs}s=1,2,…,ξ為簇s中所含的負荷曲線數(shù)量。 負荷曲線m記作lm={}i=1,2,…,N,其 波 動 序 列Γm定 義 為 每 兩 個 數(shù) 據(jù) 采樣 點 間 的 波 動 趨 勢,記 作Γm={}i=1,2,…,N-1,其中的表達式如式(9)所示。簇s的簇內(nèi)負荷曲線平均波動序列為{}i=1,2,…,N-1,其中的表達式如式(10)所示。
負荷曲線簇內(nèi)平均波動序列中元素的絕對值越大,反映該時刻下簇內(nèi)曲線趨勢的相似性越大。為了綜合衡量各個負荷曲線簇內(nèi)部的曲線相似程度,以簇內(nèi)負荷曲線數(shù)量占樣本數(shù)量的比例作為權重,以平均波動絕對值大于0.5 時刻數(shù)量衡量簇內(nèi)曲線的相似程度,將這兩項相乘,對每個簇的此項結果進行加和,得到簇內(nèi)波動相似性指數(shù)αSI為:
式中:
αSI越大,簇內(nèi)波動相似性越高。簇間波動差異性指數(shù)通過與簇內(nèi)波動相似指數(shù)相類似的思路得到。首先,根據(jù)聚類后得到的ξ組負荷曲線簇構建ξ×ξ簇間差異度矩陣B:
式中:
簇間差異度矩陣B中的元素反映了不同簇間的波動性差異。簇間波動差異性指數(shù)αDI可定義為不同簇間差異度的平均值,即
αDI越大,表明不同負荷曲線簇之間的差異性越大,負荷聚類效果越好。
在開始真實數(shù)據(jù)集的算例分析前,為了說明本文方法所用到的距離量度方式與其他方法在多日負荷曲線量度效果上的差異,本節(jié)設計了4 種波動類型的測試曲線。每種波動類型中隨機生成10 條加入高斯噪聲的曲線樣本,其中,高斯噪聲分布均滿足期望為0,方差為1,噪聲大小為各采樣點數(shù)據(jù)幅值的30%與噪聲幅度的乘積,共得到40 條測試曲線樣本,曲線樣本編號i∈[0,39]。為了與3.2 節(jié)真實算例中的數(shù)據(jù)采樣頻率和數(shù)據(jù)長度相對應,這里每條曲線的采樣點數(shù)量均為336,48 個采樣點為一天的負荷數(shù)據(jù)采集量。4 種類型的測試曲線、曲線所對應的編號及特征如附錄A 表A1 所示。
針對本文方法所用到的J-S 距離、MS-RFKM聚類算法所用到的漢明距離、K-means 算法及近鄰傳播(AP)聚類算法所用到的歐氏距離,分別計算這3 種距離度量方式下40 條測試曲線之間的距離,得到歸一化距離分布熱力圖如圖3 所示。
圖3 3 種距離量度方式下測試曲線的歸一化距離分布熱力圖Fig.3 Normalized distance distribution heat map of test curves under three distance measurement methods
由測試曲線的歸一化距離分布熱力圖可以看出,沿著對角線的方向,本文方法所用到的J-S 距離將測試曲線分成了明顯的4 類,對應的恰好分別是4 種類別下測試曲線所屬的曲線編號,同類別測試曲線內(nèi)部之間的J-S 距離很小,體現(xiàn)了同類別內(nèi)的曲線之間的相似性;第1、2、3 類測試曲線之間的J-S距離稍大些,而第4 類測試曲線則與其他3 類測試曲線之間的距離最大,這與測試曲線特征中的“谷-峰-谷”波動模式頻次是相對應的,而尖峰間的相隔距離與尖峰數(shù)則造成了測試曲線類別之間的差異。MSRFKM 聚類算法所用到的漢明距離雖然同樣反映了第4 類測試曲線與第1、2、3 類測試曲線之間的差異,但是卻忽略了第1、2、3 類曲線之間的差異性,不能反映尖峰數(shù)目以及尖峰間距離的差異性。K-means 算法及AP 聚類算法所用到的歐氏距離則完全不能對測試曲線進行正確分類。
本節(jié)在愛爾蘭電力和天然氣行業(yè)的監(jiān)管機構——能源監(jiān)管委員會(CER)數(shù)據(jù)集中隨機選擇100 個家庭住宅用戶的8 月第1 周的負荷曲線數(shù)據(jù),日采樣頻率為半小時,一周共計336 個采樣點。將100 個家庭住宅的周負荷時間序列通過HVG 方法映射成層數(shù)為100 的多層伴生網(wǎng)絡。在此基礎上,計算各層對間的J-S 距離矩陣(部分迭代過程中的JS 距離熱力圖如圖4(a)所示)。對J-S 距離最小的層對進行聚合,更新層間聚合所形成的新網(wǎng)絡層的鄰接矩陣,記錄層聚合后的相對熵(歷次迭代相對熵值如圖4(b)所示),并重復上述過程直到整個多層網(wǎng)絡完全聚合為一層。
圖4 家庭住宅用戶的J-S 距離熱力圖及相對熵折線圖Fig.4 J-S distance heat maps and relative entropy line chart of residential users
第97 次迭代的相對熵值(黑色標記位置)未達到全局最大值,即多層伴生網(wǎng)絡層間存在較強的度相關性而存在等光譜特性。而在第89 次層對聚合時折線的斜率絕對值達到最大(紅色標記位置),故選擇第89 次迭代結果作為最優(yōu)層聚合方案。該種層聚合方式將100 個家庭住宅的周負荷曲線分成8 類,具體的歸一化負荷波動圖見附錄A 圖A5。此外,采用2.5 節(jié)的方法將本文方法、MS-RFKM 聚類算法、K-means 算法、AP 聚類算法對同一數(shù)據(jù)集的聚類結果進行分析和比較,結果見附錄A 圖A6。可以看出,本文方法對家庭住宅用戶的負荷曲線聚類結果無論是在簇內(nèi)波動相似性方面還是在簇間波動差異性方面的表現(xiàn)都優(yōu)于其他方法。
從負荷波動態(tài)勢上來看,第0 組和第4 組用戶的工作日負荷波動較為規(guī)律,用電低谷時段均較長,但第4 組用戶在工作日內(nèi)的負荷波動伴有明顯的雙峰波動特性,周末負荷波動頻次較高,相較于工作日差別較大,而第0 組用戶的工作日和周末用電相似度較高,且有固定的波峰時段。第1 組和第3 組用戶均表現(xiàn)為周末用電雜亂、工作日負荷波動規(guī)律且伴有規(guī)律的波峰時段,用電低谷時段較長,但第3 組用戶用電時段的負荷波動頻次更高。第2 組和第5 組用戶的日內(nèi)負荷波動伴有較為明顯的雙峰波動特征,用電低谷時段較短,但第2 組的雙峰出現(xiàn)的時段較為隨機,負荷波動的規(guī)律性較差,而第5 組工作日的負荷規(guī)律性較強,工作日和周末的負荷波動存在一定的差別。第6 組和第7 組用戶的用電低谷時段長,第6 組用戶雖整體用電規(guī)律性較差,但偶爾會出現(xiàn)規(guī)律的雙峰時段,用電低谷時段長,第7 組用電整體規(guī)律性很差,負荷波動頻次不高,且出現(xiàn)的用電時段較為隨機。
從社會調(diào)查信息上看,采用本文方法的聚類結果呈現(xiàn)了承擔主要收入來源的家庭成員的職業(yè)分布差異化。其中,80%的雇員的電力消費情況大多分布在第1、2、3、4、5 組用戶中,而雇主在同樣的分布中的比例僅為40%左右;在采取節(jié)電措施的意愿調(diào)查中,第3 組用戶中約有79%的用戶表達出較強的節(jié)電意識,并在不同程度上已經(jīng)采取了相應的節(jié)電措施,從該類別的歸一化用戶負荷折線圖中也可以發(fā)現(xiàn),在較長周期內(nèi),該類別的大多數(shù)用戶用電規(guī)律,用電低谷時間相對較長,用電期間的用電量水平也較為平均。第7 組用戶則僅有25%的用戶表達出較強的節(jié)電意識,而在該類別的歸一化用戶負荷折線圖中可以看到,在較長周期內(nèi),該用戶類別的用電低谷表現(xiàn)較為雜亂,聚類結果與調(diào)查情況總體表現(xiàn)一致。
根據(jù)負荷波動態(tài)勢和社會屬性的分析,第0 組和第5 組負荷曲線出現(xiàn)波峰的時段都有一定的規(guī)律性,出現(xiàn)的時段相較于常規(guī)的波峰時段或超前或滯后,可以將其視作錯峰調(diào)節(jié)的輔助資源。第1 組用戶一周用電的規(guī)律性都較為統(tǒng)一,用電時間上的調(diào)控空間有限,但存在電價引導降低用電量的可能。第2 組用戶用電曲線雙峰出現(xiàn)的時間較為隨機,可通過價格引導實現(xiàn)錯峰調(diào)節(jié)資源。第3 組的多數(shù)用戶的節(jié)電意識較強,其用電波動頻繁可能是由于重復的開斷電器,可引導其在用電低谷時段的用電增加。第4 組在工作日用電規(guī)律性較強,可通過價格對其周末用電進行調(diào)節(jié)。第6 組用電規(guī)律性較差,一般不可調(diào)節(jié)。第7 組多數(shù)用戶節(jié)電意識弱,可調(diào)節(jié)空間有限。
本節(jié)同樣在CER 數(shù)據(jù)集中隨機選擇了100 個中小企業(yè)用戶的8 月第1 周的負荷曲線數(shù)據(jù)作為分析對象,圖5(a)為迭代過程中的部分J-S 距離矩陣熱力圖。圖5(b)相對熵折線圖中紅色標記所示的第94 次聚合相對熵值為全局最大值,因此將該次聚合情況作為最優(yōu)結果。本文方法將100 個中小企業(yè)用戶一周負荷曲線聚類分為4 個類別,其歸一化負荷波動圖見附錄A 圖A7。4 種方法下中小企業(yè)用戶的負荷波動聚類效果圖如附錄A 圖A8 所示。
圖5 中小企業(yè)用戶的J-S 距離熱力圖及相對熵折線圖Fig.5 J-S distance heat maps and relative entropy line chart of small- and medium-size enterprises
由于中小企業(yè)用戶的負荷曲線自身用電規(guī)律性很強,波動也比較頻繁,在保證一定的簇內(nèi)相似性情況下,簇間波動差異性指數(shù)越大,更易說明聚類效果的優(yōu)劣。除此之外,本文方法更加側重于對負荷波動特性的刻畫,可解釋性強的同時,在實現(xiàn)過程中無需調(diào)參,其他聚類方法不具備此種特征。因此,本文方法相較于其他聚類方法依然具有較強的優(yōu)勢。
從負荷波動態(tài)勢上來看,第0、1、2、3 組用戶的波動周期性都比較明顯,第1 組用戶的用電低谷時段較短,用電波動頻次大;第0 組和第3 組用戶的波動頻次較大,且用電峰谷差大,但是第3 組用戶的用電時間更長;第2 組的用電峰谷差最大,但是整體波動頻次不高。
從社會調(diào)查信息來看,第0 組用戶中有82%的用戶具有強烈的節(jié)電意識且均有自備的發(fā)電裝置,企業(yè)性質大多為技術服務開發(fā)和咨詢公司;第1 組用戶中89%均來自服務行業(yè),其中,企業(yè)運營時間低于5 年的均為零售商或者無雇員的自營店,而在用電相關的意愿調(diào)查部分,該類別中有92%的用戶有較強的意愿想要了解企業(yè)在不同時段的電費情況;第2 組用戶的電費在整個企業(yè)的預算中具有較高水平,大都超過10%,企業(yè)性質主要為工業(yè)、電力交通行業(yè)等,用電需求量較大;第3 組用戶營業(yè)額均為中等及以下,對企業(yè)自身的電力消費情況的關注度不高,均來自服務業(yè)。
根據(jù)負荷波動態(tài)勢和社會屬性的分析,第0 組可通過簽訂用戶用電時段協(xié)議等措施將其視為一種可中斷負荷。第1 組用戶的日用電規(guī)律性較強,但是鑒于其中的多數(shù)用戶對電費的關注度較高,可通過電價引導其有序用電。第2 組用戶用電規(guī)律性強且大多為高耗能企業(yè),可調(diào)度性不強。第3 組用戶用電高峰時段較為超前,可作為一種錯峰調(diào)節(jié)資源。
本文通過分析配電網(wǎng)末梢負荷曲線聚類與網(wǎng)絡結構冗余問題在科學內(nèi)涵上的一致性,借鑒網(wǎng)絡結構約簡理念,提出了一種多日負荷曲線高效、精準聚類的新思路。同時,在依據(jù)行業(yè)性質的宏觀分類基礎上,考慮配電網(wǎng)末梢負荷日間波動的差異性,對多日負荷曲線進行聚類,實現(xiàn)負荷波動相似性的挖掘。算例結果表明,本文所采用的HVG 方法能根據(jù)負荷曲線本身的波動特性自動建立網(wǎng)絡中節(jié)點間的聯(lián)系,進而保留時間序列的固有波動特征;基于網(wǎng)絡信息熵的結構冗余度評估,能自適應實現(xiàn)多層網(wǎng)絡結構約簡過程且避免復雜的參數(shù)設置;所得到的多日負荷曲線聚類結果能有效反映用戶電力消費特征與社會標簽,具有可解釋性。在未來的研究中,將考慮分層分區(qū)聚類以進一步提升聚類效率,同時擴展負荷時序特征的分析維度以進一步剖析負荷波動態(tài)勢與需求側響應潛力的關聯(lián)機理。
附錄見本刊網(wǎng)絡版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡全文。