張浩,汪德義
(國網(wǎng)黃山供電公司,安徽 屯溪 245000 )
智能電網(wǎng)調(diào)度控制系統(tǒng)是智能電網(wǎng)的中樞結(jié)構(gòu),系統(tǒng)將調(diào)度中心的各項功能模塊化和集成化,形成實時監(jiān)控預(yù)警、調(diào)度計劃以及調(diào)度管理等作用,保障了電網(wǎng)的正常運行,滿足了電網(wǎng)高效、經(jīng)濟(jì)和環(huán)保的運行方式[1-4]。雖然在普遍認(rèn)知中,調(diào)度控制系統(tǒng)可以高效可靠地運行,但其服務(wù)的體系過于龐大,且所受到的外部不可控影響因素眾多,在運行過程中難免會出現(xiàn)異常狀態(tài)。因此,對智能電網(wǎng)調(diào)度控制系統(tǒng)進(jìn)行健康度評價,獲取系統(tǒng)的異常信息是很有必要的。
智能電網(wǎng)調(diào)度控制系統(tǒng)可以使調(diào)度人員實時掌握電網(wǎng)的各項運行信息,其健康度評價主要是針對智能電網(wǎng)多個因素或者指標(biāo),選擇合適的評價方法,將其轉(zhuǎn)化為可以反映電網(wǎng)健康程度的信息。在現(xiàn)有研究中,智能電網(wǎng)的健康度評價大多采用基于專家經(jīng)驗的評價方法[5-8]?;趯<医?jīng)驗的評價方法是一種將定性描述定量化的評價方法,主要有加法評價、層次分析法、連積評價和加權(quán)評價等。文獻(xiàn)[9-10]分別采用層次分析法對火電廠和電力系統(tǒng)進(jìn)行健康度評價。文獻(xiàn)[11]通過組合上述方法對智能電網(wǎng)控制系統(tǒng)進(jìn)行評價。雖然專家經(jīng)驗評價方法的評價過程簡單,且結(jié)果直觀性強,但其過于依賴專家的知識和經(jīng)驗等主觀因素,因此評價結(jié)果可能會有一定的誤差。
近年來機器學(xué)習(xí)中的多分類方法被廣泛應(yīng)用于智能電網(wǎng)調(diào)度控制系統(tǒng)的健康度評價。機器學(xué)習(xí)方法根據(jù)所需要的數(shù)據(jù)是否含有標(biāo)簽可以分為無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)[12-15]。無監(jiān)督學(xué)習(xí)包括K-means算法等,雖然算法要求的初始狀態(tài)簡單,但計算效果較差。有監(jiān)督學(xué)習(xí)在計算過程中依賴大量的有標(biāo)簽的信息。文獻(xiàn)[16]構(gòu)建了基于隨機森林算法的評價模型,針對某河流流域進(jìn)行了健康度評價。雖然有監(jiān)督學(xué)習(xí)的結(jié)果可靠性更高,但其過于依賴有標(biāo)簽的信息,算法整體適用性不高。因此將半監(jiān)督學(xué)習(xí)算法應(yīng)用于智能電網(wǎng)調(diào)度控制系統(tǒng)的健康度評價顯得尤為重要。
本文針對智能電網(wǎng)調(diào)度控制系統(tǒng)的健康度評價,引入半監(jiān)督學(xué)習(xí)Linked Cop K-means (LCop K-means)算法[17]。首先介紹了智能電網(wǎng)調(diào)度控制系統(tǒng)的組成和主要功能,以及傳統(tǒng)健康度評價的方法。針對無監(jiān)督學(xué)習(xí)K-means算法計算結(jié)果誤差較大的情況,引入LCop K-means算法。算例分析采用試驗數(shù)據(jù)和實測數(shù)據(jù)對比了上述兩種算法,驗證了LCop K-means算法的計算結(jié)果準(zhǔn)確率更高。
智能電網(wǎng)調(diào)度控制系統(tǒng)是我國特大電網(wǎng)的中心骨干,通過對各層級電網(wǎng)進(jìn)行協(xié)調(diào),保證整個電網(wǎng)高效有序地運行。通常智能電網(wǎng)調(diào)度控制系統(tǒng)包括三個部分:① 數(shù)據(jù)資源層,這一層級提供了整個電網(wǎng)的運行數(shù)據(jù),數(shù)據(jù)反映了電網(wǎng)的運行情況;② 指揮協(xié)調(diào)層,將數(shù)據(jù)資源層收集得到的電網(wǎng)運行數(shù)據(jù)傳導(dǎo)到網(wǎng)絡(luò)分析層,同時該層級還承擔(dān)著指揮電網(wǎng)的功能;③ 網(wǎng)絡(luò)分析層,將指揮協(xié)調(diào)層傳導(dǎo)而來的電網(wǎng)運行數(shù)據(jù)進(jìn)行分析,從而對整個電網(wǎng)實時監(jiān)控,保證電網(wǎng)的正常運行。
電網(wǎng)中的運行數(shù)據(jù)龐大且繁雜,調(diào)度工作者很難在短時間內(nèi)找到需要的運行數(shù)據(jù),因此需要利用智能電網(wǎng)調(diào)度控制系統(tǒng)對上述數(shù)據(jù)進(jìn)行采集并整理,為調(diào)度決策者提供參考依據(jù)。智能電網(wǎng)調(diào)度控制系統(tǒng)主要有以下幾種功能。
(1) 實時監(jiān)測是調(diào)度控制系統(tǒng)最主要的功能,當(dāng)電網(wǎng)中某一設(shè)備故障時會被第一時間發(fā)現(xiàn),從而縮小故障范圍,提高故障解決效率。
(2) 通過分析電網(wǎng)的運行狀態(tài),調(diào)整各發(fā)電機組的出力情況,保證電網(wǎng)的正常運行。
(3) 及時了解故障設(shè)備的原因并解決故障。
(4) 為電網(wǎng)提供機電保護(hù)功能。
智能電網(wǎng)調(diào)度控制系統(tǒng)健康狀態(tài)可以從以下幾個方面進(jìn)行分析:首先,智能電網(wǎng)調(diào)度控制系統(tǒng)的主要構(gòu)成部件是服務(wù)器,因此服務(wù)器的健康狀態(tài)影響了系統(tǒng)的正常運行;其次,該系統(tǒng)所涉及到的業(yè)務(wù)眾多,包括scada應(yīng)用、data-server應(yīng)用、public應(yīng)用、數(shù)據(jù)庫、服務(wù)總線和公共服務(wù)等,因此所涉及到業(yè)務(wù)的健康程度是系統(tǒng)健康程度的重要組成部分;最后,調(diào)度控制系統(tǒng)的重要功能就是傳輸相應(yīng)的數(shù)據(jù),包括智能電網(wǎng)的各項運行數(shù)據(jù)等,因此,傳輸數(shù)據(jù)質(zhì)量的健康度也是影響系統(tǒng)健康的因素之一。綜上所述,影響智能電網(wǎng)調(diào)度控制系統(tǒng)健康狀態(tài)的主要因素為服務(wù)器健康狀態(tài)、業(yè)務(wù)健康狀態(tài)和數(shù)據(jù)質(zhì)量健康狀態(tài)。系統(tǒng)健康度評價模型如圖1所示。
圖1 智能電網(wǎng)調(diào)度控制系 統(tǒng)健康度評價模型
智能電網(wǎng)調(diào)度控制系統(tǒng)的健康度評價受到各個層級之間關(guān)系的影響,評價指標(biāo)體系一般可以分為3層:通過檢測智能電網(wǎng)中各個設(shè)備的運行數(shù)據(jù)組成了該指標(biāo)體系的底層。通過檢測得到的數(shù)據(jù),進(jìn)行相應(yīng)地計算得到數(shù)據(jù)指標(biāo),例如進(jìn)程健康度和節(jié)點健康度等。最頂層的數(shù)據(jù)可以對調(diào)度控制系統(tǒng)健康度構(gòu)成直接影響,例如公共服務(wù)健康度等。3個層級之間存在耦合關(guān)系,且評價指標(biāo)的優(yōu)先級也有所不同,上層評價指標(biāo)受到下層評價指標(biāo)的影響,通過聯(lián)合所有層級的評價指標(biāo),得到了整個調(diào)度控制系統(tǒng)的健康度。
K-means算法屬于一種無監(jiān)督的聚類算法,即在對數(shù)據(jù)集進(jìn)行訓(xùn)練的過程中,K-means算法不需要指定數(shù)據(jù)屬于哪個類別,從而將數(shù)據(jù)進(jìn)行分類。K-means算法通過不斷地訓(xùn)練,使得數(shù)據(jù)在N維空間中逐漸趨于K類,K的大小可以由用戶自行設(shè)定,也可以通過一些方法獲得,例如elbow方法。
給定樣本集X=[x1,x2,x3, …,xm],其中單個數(shù)據(jù)x的維度為N,假設(shè)需要將這群樣本劃分為K類。K-means算法的具體步驟如下。
(1) 從數(shù)據(jù)集內(nèi)隨機選擇K個數(shù)據(jù)(u1,u2,u3, …,uK)作為初始質(zhì)心,計算樣本集X中其余數(shù)據(jù)與所有初始質(zhì)心之間的距離。距離可以采用多種計算公式計算,例如歐式距離和曼哈頓距離,如式(1)和式(2)所示。
(1)
(2)
式中:xi為樣本集中k個數(shù)據(jù)的位置。
(2) 對于單個數(shù)據(jù),無論采用哪種距離計算方法,選擇與其距離最短的質(zhì)心作為自己的類別,因此樣本集X中的數(shù)據(jù)可以劃分為K個互不相擁的簇之中(C1,C2,C3, …,CK)。
(3) 計算每個簇中數(shù)據(jù)的平均中心,即為該簇數(shù)據(jù)新的質(zhì)心,如式(3)所示。
(3)
式中:m1為該簇中數(shù)據(jù)的個數(shù)。新計算出的質(zhì)心可以是原數(shù)據(jù)集中的樣本點,也可以是一個新的質(zhì)點。
(4) 按照步驟(1)中計算距離的辦法重新劃分樣本集X中的所有數(shù)據(jù)。
(5) 重復(fù)上述步驟,直至滿足迭代計算要求。這里既可以設(shè)定一個確定的迭代數(shù)目,當(dāng)?shù)鷶?shù)滿足后即停止計算,也可以通過計算所選質(zhì)心與簇內(nèi)所有數(shù)據(jù)之間的最小化平方誤差,如式(4)所示。當(dāng)平方誤差小于預(yù)先設(shè)定值時,停止迭代計算。
(4)
無監(jiān)督學(xué)習(xí)方法在計算過程中不需要原有數(shù)據(jù)中含有標(biāo)簽,計算過程簡單,但學(xué)習(xí)效果較差,難以直接用于智能電網(wǎng)調(diào)度控制系統(tǒng)的健康度評價中,因此需要引入改進(jìn)后的聚類算法。LCop K-means算法是近年來提出的一種改進(jìn)型半監(jiān)督聚類算法,針對傳統(tǒng)Cop K-means算法在計算過程中可能存在分類失敗的情況,LCop K-means算法在分配過程中采用廣度優(yōu)先的策略,解決了約束違反的問題。
傳統(tǒng)Cop K-means算法從數(shù)據(jù)集X中隨機選擇K個數(shù)據(jù)作為初始中心點,再從剩余的數(shù)據(jù)中隨機選擇部分?jǐn)?shù)據(jù)與K個中心點形成Must-Link或者Cannot-Link約束。對于任意待分配的數(shù)據(jù),首先觀察其與所有初始中心點是否具有Must-Link或者Cannot-Link約束,若有Must-Link約束,則將該數(shù)據(jù)分配到相應(yīng)的簇中,若有Cannot-Link約束,則分配到其他的數(shù)據(jù)集合中,若該數(shù)據(jù)與所有中心點均沒有約束,則通過距離計算,加入距離最近的數(shù)據(jù)簇之中。通過多次迭代滿足條件后,生成分類后的數(shù)據(jù)簇。
上述傳統(tǒng)的Cop K-means算法雖然加強了聚類性能,但在實際計算過程中容易出現(xiàn)部分錯誤情況。如圖2(a)所示,x1和x2已經(jīng)被分配到C1和C2數(shù)據(jù)簇的數(shù)據(jù)集合。當(dāng)待分配的數(shù)據(jù)x3與x1和x2均有Must-Link約束,則x3的分配過程會出現(xiàn)錯誤。另一種情況如圖2(b)所示,x1和x2是已被分配的數(shù)據(jù)集合,且二者均被分配至C1數(shù)據(jù)簇之中,待分配數(shù)據(jù)x3與x1和x2分別具有Must-Link和Cannot-Link約束,則x3的分配同樣會出現(xiàn)錯誤。
圖2 Cop K-means算法可能出現(xiàn)的錯誤情況
為了解決上述問題,文獻(xiàn)[11]提出了LCop K-means算法,其在分配過程中將數(shù)據(jù)的分配順序設(shè)為隨機,這樣可以優(yōu)先分配具有約束關(guān)系的數(shù)據(jù)。算例的具體步驟如下:
(1) 對于數(shù)據(jù)集合X,隨機選擇K個數(shù)據(jù)作為初始中心點,形成K個數(shù)據(jù)簇C1至CK。
(2) 從剩余數(shù)據(jù)中隨機選擇部分?jǐn)?shù)據(jù)分別生成Must-Link約束和Cannot-Link約束,通過傳遞性進(jìn)行擴(kuò)展。
(3) 對于任意待分配的數(shù)據(jù)xi,計算其到各質(zhì)點的距離,將其并入最近距離的簇中。
(4) 對于與xi具有Must-Link約束的數(shù)據(jù),全部分配至相同的簇之中,并標(biāo)記為已分配,在后續(xù)分配過程中,不再對這部分?jǐn)?shù)據(jù)進(jìn)行分配。
(5)對于與xi具有Cannot-Link約束的數(shù)據(jù),則按照負(fù)關(guān)聯(lián)約束規(guī)則將數(shù)據(jù)分配到相應(yīng)的簇之中。
(6) 通過多次迭代直至滿足迭代終止條件。
為了驗證本研究所引入的LCop K-means算法的有效性,通過公開數(shù)據(jù)和智能電網(wǎng)調(diào)度控制系統(tǒng)實測數(shù)據(jù)對K-means和LCop K-means算法進(jìn)行驗證。算法的最大迭代數(shù)為100,誤差設(shè)定值為10-4。通過聚類質(zhì)量判定算法的有效性,聚類質(zhì)量F為:
(5)
式中:hi為正確分到第Ci簇的數(shù)據(jù)數(shù)量。
公開數(shù)據(jù)采用Iris數(shù)據(jù)、Wine數(shù)據(jù)和Glass數(shù)據(jù),其中:Iris數(shù)據(jù)由Fisher在1936年收集整理,是一類多重變量分析的數(shù)據(jù)集;Wine葡萄酒數(shù)據(jù)集是來自UCI上面的公開數(shù)據(jù)集;Glass數(shù)據(jù)也是使用極為廣泛的數(shù)據(jù)集。三種數(shù)據(jù)的屬性如表1所示。采用K-means和LCop K-means算法對數(shù)據(jù)進(jìn)行分類,分類后的結(jié)果如表2所示。可以看出,本文所引入的LCop K-means算法更加高效地利用了監(jiān)督信息提升聚類準(zhǔn)確度,最大程度發(fā)揮了監(jiān)督信息的作用。
表1 試驗數(shù)據(jù)集
表2 基于試驗數(shù)據(jù)的準(zhǔn)確率計算結(jié)果
除了試驗數(shù)據(jù)之外,還利用某智能電網(wǎng)調(diào)度控制系統(tǒng)的實測數(shù)據(jù)驗證上述兩種算法,考慮到實測數(shù)據(jù)中標(biāo)簽難以獲得,設(shè)定含有標(biāo)簽的數(shù)據(jù)為200個,具有成對約束的數(shù)據(jù)數(shù)量為1 000。兩種算法計算相應(yīng)數(shù)據(jù)的結(jié)果如表3所示。與試驗數(shù)據(jù)結(jié)果相似,采用LCop K-means算法準(zhǔn)確率更高,且更能發(fā)揮監(jiān)督信息的作用。
表3 基于實測數(shù)據(jù)的準(zhǔn)確率計算結(jié)果
本文針對智能電網(wǎng)調(diào)度控制系統(tǒng)的健康度評價,引入半監(jiān)督的LCop K-means算法進(jìn)行求解。首先介紹了智能電網(wǎng)調(diào)度控制系統(tǒng)的結(jié)構(gòu)與主要功能,以及健康度評價系統(tǒng)的計算方法。之后介紹了無監(jiān)督K-means算法的計算步驟,為了提高整體計算效果,引入LCop K-means算法。算例分析基于試驗數(shù)據(jù)和智能電網(wǎng)的實測數(shù)據(jù),驗證了所引入的LCop K-means算法具有更高的計算效率。在后續(xù)的研究中,可以在算法中加入擾動程序,對未分配數(shù)據(jù)的Must-Link和Cannot-Link屬性進(jìn)行改變,降低數(shù)據(jù)集合出現(xiàn)分配錯誤的概率。