柴利達(dá),田行健,趙筑雨,吳顯鋒,陳華彬
(1.貴州電網(wǎng)有限責(zé)任公司,貴州貴陽 550002;2.貴州電網(wǎng)物資有限公司,貴州貴陽 550002;3.貴州黔馳信息股份有限公司,貴州貴陽 550002)
在配電系統(tǒng)中,配電網(wǎng)的可靠性能夠反映整個(gè)電力系統(tǒng)的結(jié)構(gòu)與運(yùn)行特性。因此可以通過篩選、歸類、挖掘和分析日常監(jiān)測設(shè)備數(shù)據(jù)的有效信息,以此獲得外部因素對配電網(wǎng)參數(shù)的影響,進(jìn)而指導(dǎo)配電網(wǎng)的規(guī)劃。
現(xiàn)階段的研究因素可分為電網(wǎng)內(nèi)部因素與外部因素。由于配電網(wǎng)涉及到各種電氣設(shè)備和元器件,所以不同設(shè)備及元器件的工作性能與工況對配電網(wǎng)的可靠性均存在影響,如元器件類型、老化程度[1]、負(fù)荷與電壓分布[2]及配電線路損耗[3]等。此外,外部環(huán)境對配電網(wǎng)設(shè)備的可靠性也會(huì)有影響,而電網(wǎng)的外部因素主要包括氣候[4]、電價(jià)[5]等。目前,大多數(shù)學(xué)者研究的是配電網(wǎng)內(nèi)部因素對其可靠性的影響,而較少分析外部環(huán)境對配電網(wǎng)設(shè)備可靠性所造成的影響。
配網(wǎng)設(shè)備的監(jiān)測數(shù)據(jù)較多,若采用回歸方法進(jìn)行篩選,不僅計(jì)算量大,結(jié)果也不穩(wěn)定。因此,該文采用貝葉斯模型(Bayesian model)來建立不同設(shè)備在各種影響因素下的概率模型。并對配網(wǎng)設(shè)備的相關(guān)數(shù)據(jù)加以挖掘分析,且利用混合高斯模型(Gaussian Mixture Model,GMM)對數(shù)據(jù)進(jìn)行聚類。通過數(shù)據(jù)采集與處理,對配網(wǎng)設(shè)備數(shù)據(jù)進(jìn)行挖掘分析,在此過程中建立設(shè)備運(yùn)維成本與設(shè)備類型、投用地區(qū)、不同時(shí)間月份、設(shè)備送檢報(bào)告、設(shè)備價(jià)值等特征因素間的關(guān)系模型,進(jìn)而分析出設(shè)備的性能分布情況。
貝葉斯決策理論是統(tǒng)計(jì)分類方法[6-7]的基礎(chǔ),其為統(tǒng)計(jì)、判別及分析等分類程序提供了基本的概率模型。考慮一個(gè)一般的M群分類問題,其中每個(gè)對象均有一個(gè)聚類的維數(shù)屬性向量。設(shè)w為隸屬度變量,若對象屬于j組,其值wj為隸屬度變量,f(x|wj)為該組的先驗(yàn)概率。根據(jù)貝葉斯分類規(guī)則有:
式中,P(wj|x)是j組的后驗(yàn)概率,f(x)為概率密度函數(shù),可表示為:
若提出的是最小化總分類誤差率(誤分類率)的概率,則有以下廣泛使用的貝葉斯分類規(guī)則:
若上式成立,則有wk=x。
然而,在應(yīng)用簡單的貝葉斯決策規(guī)則時(shí)存在兩個(gè)問題:首先,在大多數(shù)實(shí)際情況下密度函數(shù)是未知的或不能假設(shè)為正態(tài)的,故無法直接確定后驗(yàn)概率;其次,通過使用式(3),決策的目標(biāo)是使新對象誤分類的概率最小化。因此,該文便不再關(guān)心分類錯(cuò)誤的后果,即假設(shè)不同群體的錯(cuò)誤分類成本是相等的。但這可能并不符合諸多應(yīng)用程序的實(shí)際情況,且在此類應(yīng)用程序中,錯(cuò)誤分配的代價(jià)對于不同組而言是各不相同的。為克服這些缺點(diǎn),基于神經(jīng)網(wǎng)絡(luò)后驗(yàn)概率的直接估計(jì),該文為分類錯(cuò)誤指定了一個(gè)代價(jià),以改進(jìn)此次決策。在該研究中,采用特征函數(shù)法(Characteristic Function)估計(jì)各數(shù)據(jù)的α-穩(wěn)定分布參數(shù),然后利用特征參數(shù)作為貝葉斯網(wǎng)絡(luò)(Bayesian network)的輸入及訓(xùn)練參數(shù)。貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示[8-11]。每個(gè)數(shù)據(jù)均有S1-S4 共四個(gè)參數(shù),O1-O5 則代表了五種故障。
圖1 貝葉斯網(wǎng)絡(luò)診斷結(jié)構(gòu)
聚類在數(shù)據(jù)工程、模式識(shí)別及圖像分析等領(lǐng)域中具有基礎(chǔ)性的作用。其中,最重要的聚類方法之一便是高斯混合模型法(GMM)[12-16],其基于期望最大化(Expectation Maximiz-ation,EM)的方式對數(shù)據(jù)進(jìn)行聚類。此外,該模型還可通過覆蓋多個(gè)簇(如橢圓簇)來逼近不同類型的數(shù)據(jù)。
總體而言,EM 的目標(biāo)是找到數(shù)學(xué)期望最大的聚類規(guī)則,設(shè)存在概率數(shù)組:
對于f1,…,fk∈F而言,F(xiàn)就是一個(gè)固定的(通常是高斯分布的)密度簇,其滿足:
最佳近似的散射數(shù)據(jù)考慮X={x1,…,xn}。該優(yōu)化是針對一個(gè)基于最大最小二乘的代價(jià)函數(shù)進(jìn)行的:
式中,|X|表示集合X的基數(shù)。
EM 中的優(yōu)化分為期望步與最大化步。其中,期望步驟相對簡單,而最大化通常需要一個(gè)復(fù)雜的數(shù)值優(yōu)化。假設(shè)Pi(c)與Pj(c)表示高斯混合模型中的兩個(gè)分布,則二者間的KL 散度可定義為:
對于對稱方程,通常用式(8)來度量分布Pi(c)和Pj(c)間的相似度:
式中,Pi(c)表示P(c|xi),根據(jù)EM 似然估計(jì)的優(yōu)化結(jié)果,可得到高斯混合模型的三個(gè)參數(shù):Φk、μk與協(xié)方差Σk。
式中,λ為正則化參數(shù),φ是比較系數(shù)。根據(jù)式(9)-(11)導(dǎo)出的公式,重新估計(jì)目標(biāo)函數(shù)中的參數(shù)Φk、μk和Σk,然后使E 步和M 步交替進(jìn)行,直至滿足終止條件。
10 kV 配網(wǎng)設(shè)備的種類繁多且運(yùn)行環(huán)境復(fù)雜,導(dǎo)致了故障頻發(fā),使其成為電力系統(tǒng)的薄弱環(huán)節(jié)。此外,由于其直接與用戶相連,若未能及時(shí)處理設(shè)備的缺陷,將導(dǎo)致電網(wǎng)故障,影響電網(wǎng)的安全運(yùn)行。配電網(wǎng)主要設(shè)備包括配電變壓器、開關(guān)柜、架空線路和電纜等。在長期運(yùn)行過程中,通過檢驗(yàn)與試驗(yàn),記錄并積累了大量的缺陷數(shù)據(jù)。因此,對數(shù)據(jù)進(jìn)行深度挖掘不僅可提高分析缺陷數(shù)據(jù)的效率和推測缺陷的類型,還能為維修人員識(shí)別配電設(shè)備的薄弱環(huán)節(jié)并制定檢驗(yàn)計(jì)劃提供支持。
缺陷管理是電力生產(chǎn)管理的重要內(nèi)容之一。為了保證電力系統(tǒng)設(shè)備的健康水平,維護(hù)人員需在日常巡檢過程中對設(shè)備缺陷進(jìn)行記錄與報(bào)告。目前,缺陷管理系統(tǒng)中存儲(chǔ)了海量的配電網(wǎng)設(shè)備歷史缺陷數(shù)據(jù),這些數(shù)據(jù)為設(shè)備的聚類分析提供了基礎(chǔ)。
缺陷記錄通常包括設(shè)備、變電站和缺陷的基本信息以及缺陷處理信息這四類,且每一類均包含多個(gè)屬性。該文根據(jù)數(shù)據(jù)質(zhì)量與實(shí)際應(yīng)用情況,選取缺陷記錄數(shù)據(jù)中的缺陷等級(jí)、狀況、類型及設(shè)備生產(chǎn)廠家、使用壽命共同構(gòu)成缺陷數(shù)據(jù)集,并用于配電設(shè)備的聚類分析。以配電變壓器的缺陷記錄數(shù)據(jù)為例,表1 給出了缺陷數(shù)據(jù)集中各屬性記錄的詳細(xì)信息。其中缺陷情況與供應(yīng)廠商數(shù)量較多,故僅顯示部分內(nèi)容。
表1 設(shè)備記錄數(shù)據(jù)集
根據(jù)缺陷的嚴(yán)重程度,可將其級(jí)別分為“一般”、“重大”、“緊急”與“其他”共四個(gè)等級(jí)。而缺陷情況是根據(jù)維護(hù)人員填寫的記錄對設(shè)備進(jìn)行簡化后的缺陷描述,缺陷類型則是對設(shè)備缺陷的總結(jié)。設(shè)備供應(yīng)商從設(shè)備出廠信息中獲取,由于數(shù)據(jù)保密,該文將設(shè)備生產(chǎn)廠家分為廠商1、廠商2 等。設(shè)備使用壽命的計(jì)算為缺陷發(fā)生時(shí)間與設(shè)備運(yùn)行時(shí)間相減。此外,運(yùn)行30 年以上的設(shè)備按規(guī)定確定為舊設(shè)備。
根據(jù)上文對數(shù)據(jù)分析模型的討論,可知數(shù)據(jù)挖掘的目標(biāo)是獲取強(qiáng)聚類規(guī)則。建立概率模型需先根據(jù)給定的數(shù)據(jù)庫獲取所有的聚類;然后挖掘聚類規(guī)則,并刪除不滿足最小置信閾值的規(guī)則,剩下的即為用戶所需的強(qiáng)聚類規(guī)則;隨后,便可建立聚類規(guī)則的概率模型。查找聚類及概率的過程可看作是一個(gè)全局搜索問題,所以將高斯聚類算法與貝葉斯概率模型相結(jié)合,可有效提高配電網(wǎng)設(shè)備缺陷聚類規(guī)則挖掘的效率。
首先,對缺陷數(shù)據(jù)集進(jìn)行實(shí)數(shù)編碼,之后,定義高斯聚類算法的期望目標(biāo)函數(shù),再根據(jù)EM 似然估計(jì)優(yōu)化聚類結(jié)果。然后,依據(jù)貝葉斯概率模型給定的交叉概率,對當(dāng)前聚類規(guī)則進(jìn)行設(shè)定。當(dāng)?shù)螖?shù)達(dá)到用戶給定的最大次數(shù)時(shí),算法停止,由此,便可得到理想的聚類概率模型。圖2 所示為該文概率模型建立的具體流程。
圖2 概率模型建立流程
該文以兩個(gè)典型縣級(jí)供電局的配網(wǎng)設(shè)備為對象,進(jìn)行設(shè)備缺陷聚類分析。配電網(wǎng)的關(guān)鍵設(shè)備包括四種類型:配電變壓器、開關(guān)設(shè)備、電纜線路與架空線路。執(zhí)行數(shù)據(jù)預(yù)處理的原始缺陷記錄數(shù)據(jù),刪除明顯錯(cuò)誤或存在缺失數(shù)據(jù)的缺陷記錄,并選擇缺陷級(jí)別。缺陷條件、缺陷類型、設(shè)備制造商和設(shè)備操作構(gòu)成了缺陷數(shù)據(jù)集的聚類分析配電設(shè)備,對其進(jìn)行實(shí)數(shù)編碼,便可作為分析挖掘的輸入數(shù)據(jù)集。
使用上文中描述的高斯混合聚類分析,來挖掘缺陷數(shù)據(jù)集的聚類規(guī)則。針對篩選出的配網(wǎng)設(shè)備項(xiàng)目做進(jìn)一步的研究分析,同時(shí)采集相關(guān)設(shè)備中更詳細(xì)的數(shù)據(jù)信息,主要包括設(shè)備的投招標(biāo)歷史數(shù)據(jù)、設(shè)備運(yùn)維歷史數(shù)據(jù)、在線監(jiān)測物資歷史運(yùn)行數(shù)據(jù)、物資送檢測量數(shù)據(jù)以及設(shè)備投用地的相關(guān)數(shù)據(jù)等。由于選擇了五種缺陷記錄屬性進(jìn)行聚類分析,因此聚類規(guī)則的最大長度為五種。根據(jù)不同的聚類規(guī)則長度對缺陷數(shù)據(jù)集進(jìn)行概率分析,上文所述的四種關(guān)鍵配電網(wǎng)設(shè)備的聚類規(guī)則如表2 所示,其中每種設(shè)備以兩個(gè)聚類規(guī)則為例。
表2 部分聚類規(guī)則
通過分析表中的配電設(shè)備缺陷關(guān)聯(lián)規(guī)則,能夠得到以下結(jié)果:根據(jù)貝葉斯聚類概率分析的結(jié)果可推測缺陷類型與缺陷條件。通過設(shè)備數(shù)據(jù)分析模型,在缺陷維修過程中,運(yùn)維人員即可根據(jù)已知的設(shè)備缺陷狀況、設(shè)備廠家等條件,判斷出缺陷設(shè)備可能存在的缺陷類型或缺陷狀況,從而提高操作維修的效率與準(zhǔn)確性。同時(shí),配網(wǎng)設(shè)備數(shù)據(jù)分析模型能夠發(fā)現(xiàn)配電設(shè)備制造商的共性缺陷,便于準(zhǔn)確判斷設(shè)備是否存在家族缺陷。
隨機(jī)選取數(shù)據(jù)庫中的1 000、2 000、3 000、5 000和10 000 個(gè)配電網(wǎng)設(shè)備故障數(shù)據(jù)集作為該算法模型時(shí)間復(fù)雜度的比較樣本,并進(jìn)行故障診斷分析,且采用傳統(tǒng)故障處理時(shí)間作為對比。計(jì)算機(jī)配置為Intel Core i7-6300HQ CPU @2.30 GHz,內(nèi)存12 GB。不同算法的運(yùn)行時(shí)間如圖3 所示。
圖3 運(yùn)行時(shí)間對比
從圖中可以看出,在數(shù)據(jù)集長度相同的情況下,該文使用的基于貝葉斯網(wǎng)絡(luò)與高斯混合聚類的配電網(wǎng)常用設(shè)備數(shù)據(jù)分析模型算法的運(yùn)行時(shí)間要明顯優(yōu)于傳統(tǒng)算法。尤其是隨著設(shè)備故障數(shù)據(jù)集長度的增加,該文算法的運(yùn)行時(shí)間優(yōu)勢更為明顯。
文中主要開展了設(shè)備影響度分析,以配網(wǎng)中對于電力安全影響較大的設(shè)備為研究對象,通過對設(shè)備數(shù)據(jù)的分析、挖掘及建模,以不同類型設(shè)備的模型數(shù)據(jù)計(jì)算其的性能分布,建立了設(shè)備運(yùn)維成本概率模型。該模型能夠解決配網(wǎng)中的設(shè)備品質(zhì)監(jiān)控問題,并精確分析出所造成的影響,在有限的投入下,提高品控效率,進(jìn)而減少電力設(shè)備的資源浪費(fèi)。