國網(wǎng)婁底供電公司 羅林波 羅嵐波 伍 娟
基于粒子群的K-均值算法在電網(wǎng)企業(yè)對標中應用
國網(wǎng)婁底供電公司 羅林波 羅嵐波 伍 娟
在電網(wǎng)企業(yè)對標體系中,結合我國電力行業(yè)實際情況與國外已有的對標體系,構建一個多因素,多層次的指標體系。利用聚類分析技術在電網(wǎng)企業(yè)對標中的應用,采用了粒子群算法和K-means相結合的聚類算法,同時考慮多種對標。電網(wǎng)企業(yè)通過對標指標體系評價,及時發(fā)現(xiàn)企業(yè)與企業(yè)的差距,并制定相應的改進措施。
指標體系;聚類分析;粒子群算法;K-means算法
我國電力體制的改革逐步深化,電力市場逐步成為一個買方市場。為了提高和完善電網(wǎng)企業(yè),電網(wǎng)企業(yè)與標桿企業(yè)的各項指標進行對比勢在必行,不斷尋找差距并持續(xù)改進,文獻[1-3]電力行業(yè)開展了同業(yè)對標管理工作,選出標桿企業(yè)且向其學習,不斷改善管理方式和提高經(jīng)營效益,實現(xiàn)企業(yè)的突破性發(fā)展,文獻[4]通過使用層次從電網(wǎng)公司同業(yè)對標綜合評價,確定相關指標的權重,多維距離方法來區(qū)分相關指標的優(yōu)劣,與實際相比較,以驗證該方法的可行性和平衡。文獻[5]使用個人優(yōu)勢識別指標選擇電力行業(yè)與標桿企業(yè)的過程中的行業(yè)標準,并通過實例演示了選擇科學合理的商業(yè)模式的方法。文獻[6]通過對電力企業(yè)的標準指標灰的特點,分別選取標桿企業(yè),及分類和企業(yè)指標綜合評價方法,建立相應的二模型,并通過實例說明灰色模型的有效性和實用性。同時數(shù)據(jù)信息能夠給企業(yè)提供真實的發(fā)展狀況,數(shù)據(jù)挖掘在電網(wǎng)同業(yè)中的應用,從供電質量,規(guī)范服務,咨詢服務,電費繳納,服務管理建立新型電網(wǎng)企業(yè)滿意度對標指標體系,通過數(shù)據(jù)挖掘中的聚類分析,為電網(wǎng)企業(yè)的決策提供新的思路,能夠為電網(wǎng)企業(yè)結合自身發(fā)展戰(zhàn)略制定更為科學,平衡,合理的工作計劃。
聚類分析是統(tǒng)計學中研究物以類聚問題的多元統(tǒng)計方法,它能夠將個體(個案或變量)數(shù)據(jù)根據(jù)其諸多特征,按照在性質上的相似性進行自動分類,產(chǎn)生多個分類結果。在聚類之前,個體類劃分的數(shù)量與類型均是未知的,分類后,類內部的個體特征差異性較大。聚類分析是在大量數(shù)據(jù)中發(fā)現(xiàn)有價值信息的重要手段。聚類在圖像處理、系統(tǒng)建模、數(shù)據(jù)挖掘、模式識別等領域都發(fā)揮著非常重要的作用,聚類分析有系統(tǒng)聚類和逐步聚類兩種方法,
首先隨機選擇K個聚類中心,根據(jù)最近的原則將其他類別分配到各個類中,然后分別計算k個聚類與每一類中心的平均值,迭代進行個體的再分配,直到?jīng)]有變化為止,從而得到最終的K個類,K-means算法太過于依賴于初始聚類中心的選擇,且得出結果波動性較大。
輸入:聚類個數(shù)K數(shù)據(jù)集,輸出:K個簇的集合。
步驟1:隨機選擇k個對象在數(shù)據(jù)集里。
步驟2:將余下的數(shù)據(jù)劃分到和數(shù)據(jù)本身相距最近的簇心得簇中。
步驟3:在完成個體的分配之后,針對每一個類,計算其所有個體的平均值,作為該類新的中心,
步驟4:如果得到的結果收斂,則輸出聚類結果;如果不收斂,則返回步驟2,進行重新類聚。
由于k-means算法對初始聚類中心的選取容易陷入局部最優(yōu)解具有波動性,本文基于改進粒子群優(yōu)化算法的k-means聚類算法,利用粒子群算法全局尋優(yōu)能力來優(yōu)化k-means算法的初始聚類中心。消除K-means對聚類中心初值的依賴性。聚類中心用粒子位置表示,每個粒子的位置包含K個聚類中心,通過調整聚類中心獲得最優(yōu)劃分,利用粒子群算法給聚類中心加擾動,以增強跳出局部極值和尋找最優(yōu)聚類的能力,如果多次擾動下聚類劃分不變,則認為當前的聚類為最優(yōu)聚類。
如果達到結束條件(足夠好的位置或最大迭代次數(shù)),則結束,否則轉步驟(2)。其流程圖如圖1所示。
圖1 粒子群算法流程圖Fig 1 particle swarm algorithm flowchart
在利用粒子群優(yōu)化算法對k-means算法的初始中心點進行優(yōu)化之前。假設待聚類數(shù)據(jù)集中的數(shù)據(jù)對象是d維向量,聚類個數(shù)為則粒子的位置為k×d維向量,粒子的速度也是k×d維向量。若粒子群數(shù)目大小為m,則每個粒子i所對應的適應度值為設Zj為第j個類的中心cj,則粒子可以釆用以下的編碼方案:
粒子的適應度函數(shù)f(x)是用來評價粒子位置X性能好壞的評價函數(shù),因此可將評價k-means算法聚類效果的準則函數(shù)作為粒子群優(yōu)化算法中評價粒子位置性能的適應度函數(shù)f(x)則粒子群的適應度函數(shù)可定義為:
其模型必須與電力用戶實際情況相結合,因此把電力客戶滿意度評價模型分為三個層次,第3層直接反應電力客戶滿意度的基本特征,如供電質量,供電安全性等19個因素。及選取規(guī)范服務等5個因素作為二級指標,具體模型如圖2所示。
圖2 電力客戶滿意度測評模型Fig.2Measurement Model of Customer Satisfaction
基于上文提出的粒子群和K-means相結合的算法,首先通過粒子群算法找到初始聚類中心,然后通過K-means算法進行聚類,本節(jié)采用基于粒子群的k均值算法,對某省十個地級市的供電公司的相關指標進行實際對標。對標分為3個等級。
首先選取10個地級市的原始數(shù)據(jù),每個地級市選取的問卷份數(shù)500份,利用基于主成分回歸的熵權值對數(shù)據(jù)進行處理,最后分別得出不同地級市電力公司在供電質量,規(guī)范服務,咨詢服務,電費繳納,服務管理五類指標的,各地級市的滿意度如表3。
表3 各地級市電力公司滿意度Tab 3power companies around the city level satisfaction
初始粒子群大小設定50迭代300次c1=1.2,c2=1.2,wmax=0.9,wmin=0.4可以得到最好值(Best),最壞值(Worst)平均值(Average),標準誤差(Std)和達到最優(yōu)解總的迭代次數(shù)(N)還有適應度f(x)。
從表4得知,就輸出結果的標準差而言,混合算法優(yōu)于K-means,K-means容易陷入局部最優(yōu)解,且每次聚類分析其結果具有較大的波動性,當適應度越小時,粒子性能越好。
表4輸出結果看出混合算法比K-means算法分類更加合理,而且混合算法標準誤差遠小于K-means,K-means易于陷入局部最優(yōu)解。在供電質量專項指標上,采用混合算法時,G、E市表現(xiàn)欠佳,F(xiàn)、I表現(xiàn)最好,其他六個市次之,F(xiàn)、I作為標桿企業(yè),其他企業(yè)應該改善電網(wǎng)結構,提高運行靈活性,改善電網(wǎng)設備,采用新技術。在規(guī)范服務專項指標上A、D、F、I最為標桿企業(yè),其他市表現(xiàn)次之的企業(yè)在營銷與管理制度的不斷完善,職場素質提高,市場化意識增強。就咨詢服務而言,D公司表現(xiàn)最差,要從企業(yè)的本身尋找原因,客戶管理方式的改進,對客戶需求的全面重視,不斷改善對客戶的服務水平。電費繳納而言,十個市相對平穩(wěn)。但就C市而言,要借鑒其他供電企業(yè)經(jīng)驗及時準確抄表,同時要使信息透明化,提高企業(yè)文化與形象,方便客戶了解自身消費水平,增強客戶對企業(yè)的信賴。服務管理方面,A、B、J市建立了完善的客戶投訴機制,加強了客戶反饋信息的管理,及時了解自身的不足。
表4 聚類算法性能比較Tab 4 clustering algorithm performance comparison
論述企業(yè)同業(yè)對標管理的作用,并選取了聚類分析中的K-means算法與粒子群算法相結合的方法作為本文章的電力企業(yè)同業(yè)對標管理的運行方法。第一,在同一類別的供電企業(yè)具有差不多的條件與企業(yè)規(guī)模。其結果具有可比性。在實際情況中,應重視同類供電企業(yè)之間對標,有效且及時知道企業(yè)服務中的薄弱環(huán)節(jié),和存在的服務問題。有針對的提出改進措施。第二,K-means算法與粒子群算法的相互比較,結合兩者的優(yōu)勢。提出了基于粒子群的K-means算法,不僅消除算法對聚類中心初值的依賴性,改進算法的聚類能,還能有效的降低迭代次數(shù)。
[1]Aoife Brophy Haney,Michael G Pollitt. International bench marking of electricity transmission by regulators: A contrast between theory and practice[J].Energy Policy,2013,62: 267-281.
[2]Aoife Brophy Haney,Michael G Pollitt.Exploring the determinants of“best practice”bench marking in electricity network regulation[J].Energy Policy,2011,39(12):7739-7746.
[3]TJamasb,M Pollitt.Benchmarking and regulation:international electricity experience[J].Utilities Policy,2000,9(03): 107-130.
[4]楊靜,張宣江,盛慧慧,等.電力企業(yè)對標指標評價方法研究[J].華北電力技術,2009 (05):10-13.
[5]William Chung. Review of building energy-use performance bench marking methodologies[J].Applied Energy,2011,88:1470-147936(10): 55-57.
[6]王邦林.基于個性優(yōu)勢識別的標桿選評方法及其在同業(yè)對標中的應用研究[D].沈陽:東北大學,2007.
羅林波(1989-),男,湖南婁底新化人,本科,助理工程師,研究方向:電力運行維護,檢修,電網(wǎng)規(guī)劃。