馮建偉,王聯(lián)智,謝 敏,吳海杰,孟 超
(南方電網(wǎng)海南數(shù)字電網(wǎng)研究院有限公司,海南 ???570100)
隨著我國社會主義建設步伐的加快,各行各業(yè)的發(fā)展都需要電力的支持[1-3]。 為了滿足電力需求,配電網(wǎng)的規(guī)模日益壯大,其日常運行維護所需的人力、物力以及資金都不斷增加。 傳統(tǒng)的配電網(wǎng)運維檢測方式已經(jīng)難以支持配電網(wǎng)運維所需。 近幾年越來越火熱的人工智能則為配電網(wǎng)的檢測提供了解決方案[4-6]。
本研究提出將人工智能與雷達圖相結(jié)合的解決方案,并將其應用于配電網(wǎng)的運維分析。 該研究為我國配電網(wǎng)運維問題的解決及后續(xù)發(fā)展提供參考。
K-means 聚類分析法計算方法簡單、運行速度較快,在大數(shù)據(jù)中被廣泛使用。 但是K-means 算法同樣存在十分明顯的缺陷[7-8]。 K-means 聚類分析法的結(jié)果很不穩(wěn)定,容易陷入局部最佳的結(jié)果。 K-means 聚類分析法使用隨機選定法對初始聚類中心進行選擇,并通過不斷迭代以達到算法收斂的目的,所以初始聚類中心點的選擇對聚類分析法的最終結(jié)果有很大程度的影響。 在進行聚類分析之前,需要確定K值。 在使用K-means 聚類分析法前,必須充分了解所研究的數(shù)據(jù)。 然而,在一般情況下,使用者對于數(shù)據(jù)可能沒有足夠的了解,因此對于K值的選擇具有一定的困難。
本文在數(shù)據(jù)密度思想的基礎上,對K-means 聚類分析法進行初始點選擇。 選擇過程如下。 首先,對數(shù)據(jù)之間的平均密度進行計算,并將其中密度最大的1個點作為首個初始聚類中心點。 隨后,將數(shù)據(jù)中距離首個初始聚類中心點最遠且密度大于n的點作為第二個聚類中心點。 最后,對其余數(shù)據(jù)進行選擇:將距離上文中2 個點最大的最小距離選作第三個聚類中心點,直到選擇出K個聚類中心點。 對于數(shù)據(jù)集中的數(shù)據(jù)距離以及數(shù)據(jù)密度,可通過式(1)和式(2)進行計算。
式中:fden(xi)為數(shù)據(jù)對象xi與數(shù)據(jù)對象xj間的密度;M(D)為數(shù)據(jù)間的歐式距離;距離u( )是一個定義的函數(shù),當自變量大于等于0 時u( )= 1,否則u( )= 0。
對聚類分析法中的聚類個數(shù)K值進行選擇的方法有多種。 本文主要采用了輪廓系數(shù)和誤差平方的方法,即手肘法。 手肘法的核心為誤差平方和(sum of the squared errors,SSE),計算如式(3)所示。
式中:ci為劃分聚類i;p為ci中的一個樣本點;mi為ci的質(zhì)心。
式中:b(p)為不同簇之間的梳理程度;a(p)為簇內(nèi)不同個體間的緊密程度;s(p)為對象p的輪廓系數(shù),處于[-1,1]之間,與1 越接近則聚類分析效果越好。
SSE-K 折線圖夾角計算如圖1 所示。
圖1 SSE-K 折線圖夾角計算示意圖Fig.1 Schematic diagram of angle calculationof SSE-K line chart
聚類分析法用于大量數(shù)據(jù)以及多維度數(shù)據(jù)處理時,其強大的運算能力可以為配電網(wǎng)中的共性問題解決起到強有力的輔助作用。 然而,該方法在配電網(wǎng)運維指標評價問題中,也存在諸多不足。 例如在對各個地方的配電網(wǎng)運維情況進行評價時,因為聚類分析法不能進行定量化的分析,從而無法對各地的配電網(wǎng)運維水平進行優(yōu)劣排序。 其次,聚類分析法不能直觀展示聚類的結(jié)果,致使聚類的結(jié)果不便于理解。
為彌補聚類分析法在定量分析以及可視化這2 個方面的不足,本文在聚類算法的基礎上結(jié)合了雷達圖,能夠進行大量數(shù)據(jù)挖掘,具有定量評價及可視化的能力。 本文所采用的綜合評價法流程如圖2 所示。
圖2 綜合評價法流程圖Fig.2 Flowchart of comprehensive evaluation method
雷達圖可以將需要評價的對象用一個二維平面圖表示。 該二維圖像與雷達極為相似,因而得名雷達圖[9-10]。 雷達圖法是一種廣泛應用于多個領域的綜合性評價方法,尤其適用于多屬性對象全局與整體的評價。 在使用雷達圖對對象進行評價時,可根據(jù)所需要評價對象的指標將一個單位圓劃分為m份。 在劃分好的單位圓中,將每個區(qū)域劃分線作為軸線,并標示出代表該區(qū)域的指標,隨后將各個點沿順(逆)時針的順序進行連接,可得到如圖3 所示的雷達圖。
圖3 雷達圖示意圖Fig.3 Radar chart diagram
繪制雷達圖后,需要提取雷達圖的特征量。 將周長與面積作為雷達圖的特征量,并分別使用Lj與Sj對2 項特征量進行表示。 雷達圖的相對面積大小為:
式中:Smax為所有雷達圖中的面積最大值。
設vj2為各項指標的均衡程度,若雷達圖與圓越接近,那么所對應的系數(shù)則越大,其代表的研究對象發(fā)展也就越均衡。vj2的表達式如式(6)所示。
本文構(gòu)造了評價函數(shù),對該系統(tǒng)進行評價,并可根據(jù)評價的結(jié)果進行優(yōu)劣排序。 評價函數(shù)如式(7)所示。
雷達圖具有使用簡單、形象直觀等優(yōu)點,但依舊存在一些不足。 首先,雷達圖的評分結(jié)果并不唯一。 這是因為雷達圖的相鄰軸之間使用的是直線連接,所以當軸線的排列順序發(fā)生變化時,其雷達圖結(jié)果也會隨之發(fā)生變化,進而影響到最終的評價結(jié)果。 由此可見,雷達圖的軸線排列順序會影響到雷達圖的均衡度與面積,不具有唯一性。 其次,雷達圖評價不能直接使用。本文中的配電網(wǎng)運維指標為負向指標,而雷達圖默認為正向指標,因此需要對雷達圖進行改進。
改進雷達圖如圖4 所示。
圖4 改進雷達圖示意圖Fig.4 Schematic diagram of improved radar chart
經(jīng)過式(8)的處理之后,所有運維指標都變成了逆向指標。 逆向指標相對面積大小提取方法如式(9)所示。
式中:Sj為評級對象j雷達圖的面積;vj1為雷達圖相對面積的大小;Smin為全部雷達圖面積的最小值。
由于式(9)所得到的vj1與vj2變化趨勢相同,都是越接近1 評分越高,而評價函數(shù)維持不變,依舊采用式(7)作為評價函數(shù)。 計算vj1、vj2時,Smin選取非零的最小面積。
為了驗證本方法對配電網(wǎng)運維情況分析的有效性,選取了某地區(qū)的115 個配電網(wǎng)運維數(shù)據(jù),并根據(jù)9種評價指標進行了綜合評價。 對配電網(wǎng)運維數(shù)據(jù)的SSE 進行計算,繪制SSE-K 折線圖,如圖5 所示。 當K為5 時,其夾角為152°,是所有夾角中最小的,因此確定此次聚類個數(shù)應為5。
圖5 SSE-K 折線圖Fig.5 SSE-K line chart
利用聚類中心選擇法,對選擇的配電網(wǎng)指標進行計算,如表1 所示。 將聚類中心分為9 種評價指標,聚類編號1、2、3、4、5 分別對應個數(shù)為47、3、35、17、13,所占比例分別為40. 87%、2. 61%、30. 43%、14. 78%、11.30%。 隨后將基于密度的隨機選擇初始聚類中心點法與初始聚類中心點選擇法進行對比,并對2 種方法分別進行50 次聚類分析,對比其在不同K值下的輪廓系數(shù)平均值。 K-means 與本文算法的平均輪廓系數(shù)對比如圖6 所示。 由圖6 可以看出,基于數(shù)據(jù)密度的初始聚類中心點選擇方法的聚類效果更好。
表1 配電網(wǎng)運維數(shù)據(jù)聚類分布表Tab.1 Cluster distribution table of operation and maintenance data of distribution network %
圖6 K-means 算法與本文算法的平均輪廓系數(shù)對比圖Fig.6 Comparison of average contour coefficient between K-means algorithm and the algorithm in this study
將聚類分析法與雷達圖評價結(jié)果進行整合后,分析配電網(wǎng)運維評價散點,如圖7 所示。
以1 分為滿分。 通過圖7 可以看到:5 種聚類中的聚類3 的評分最好,其評分大部分位于0.5 分之上;聚類2 的評分則最差,集中在0.2 分左右;其余3 種聚類的評價較為相似。 相同的評分結(jié)果出現(xiàn)在了不同的聚類結(jié)果當中。 這種聚類分析結(jié)果與雷達圖結(jié)果相交叉的現(xiàn)象說明了綜合考慮的重要性以及必要性,2 種方法可以起到相互彌補的作用。
圖7 配電網(wǎng)運維評價散點圖Fig.7 Scatter diagram of distribution network operation and maintenance evaluation
5 種聚類堆疊雷達圖如圖8 所示。
圖8 5 種聚類堆疊雷達圖Fig.8 Five kinds of cluster stacked radar charts
為了便于比較,將不用分數(shù)段的供電公司進行了堆疊雷達圖展示。
圖8(a)為聚類1 堆疊雷達圖。 該地區(qū)的9 種評價指標中,遙信錯誤率是最高的,因此該地區(qū)需要對配電網(wǎng)自動化方面的工作進行嚴格檢查,從而降低其遙信錯誤率。
圖8(b)為聚類2 堆疊雷達圖。 該地區(qū)的9 種評價指標中,過電壓占比、低電壓占比、故障停電以及客戶投訴四項指標均較高,說明了該區(qū)域的電壓運行水平較差,存在配電網(wǎng)配變儲備容量不足以及發(fā)生故障后檢修不及時等情況,因此可以認為該區(qū)域配電網(wǎng)運維水平較差。
圖8(c)為聚類3 堆疊雷達圖。 該地區(qū)的9 種評價指標都較小,說明了該區(qū)域的配電網(wǎng)運維水平整體較好。 9 種指標中的配變重過載指標相對其他指標較大,說明了該區(qū)域的配變過載問題還需進一步優(yōu)化。
圖8(d)為聚類4 堆疊雷達圖。 該地區(qū)的9 種評價指標中僅有客戶投訴、配變重過載、過電壓占比以及低電壓占比指標較小,其余指標均較大,說明了該區(qū)域配電網(wǎng)故障較多、運維水平較差。
圖8(e)為聚類5 堆疊雷達圖。 該地區(qū)的9 種評價指標中,僅有低電壓占比、配變輕空載以及客戶投訴指標較小,其余指標較大,說明了該區(qū)域配電網(wǎng)故障多、配變儲備容量不足、遙信情況較差,運維水平較差。
綜上所述,本文所提出的改進K-means 聚類分析法與雷達圖的綜合評價法可以對配電網(wǎng)中的共性問題進行檢測,同時還可以客觀地對配電網(wǎng)運維情況進行定量以及可視化的分析。
配電網(wǎng)信息數(shù)據(jù)量的逐年增大,使得傳統(tǒng)方法不能及時檢出配電網(wǎng)運維中的問題。 為了解決這一問題,本文提出K-means 聚類分析法與雷達圖結(jié)合的方法,實現(xiàn)配電網(wǎng)運維情況的快速檢測。 對配電網(wǎng)的9 種評價指標進行檢測評價,并以K-means 聚類分析法與雷達圖進行檢測,最后通過試驗進行驗證。 驗證結(jié)果表明,綜合評價法可以對配電網(wǎng)的運維水平進行客觀、定量以及可視化的檢測。 但是本研究仍存在一些不足,研究選取的數(shù)據(jù)規(guī)模還應進一步擴大,以提高研究的泛用性。