楊世海,戴太文,盧樹峰,李 濤,徐銳敏
(1.國(guó)網(wǎng)江蘇省電力公司電力科學(xué)研究院 江蘇 南京 210019;2.福建億榕信息技術(shù)有限公司 福建 福州 350003)
基于數(shù)據(jù)挖掘的計(jì)量裝置在線監(jiān)測(cè)與故障診斷系統(tǒng)設(shè)計(jì)
楊世海1,戴太文2,盧樹峰1,李 濤2,徐銳敏1
(1.國(guó)網(wǎng)江蘇省電力公司電力科學(xué)研究院 江蘇 南京 210019;2.福建億榕信息技術(shù)有限公司 福建 福州 350003)
為實(shí)現(xiàn)計(jì)量裝置運(yùn)行狀況的在線監(jiān)測(cè)和故障診斷,文中研究電能計(jì)量裝置在線監(jiān)測(cè)與故障系統(tǒng)的設(shè)計(jì)問(wèn)題。首先分析了故障信息序列中必有或特有的信息,提出了基于特征挖掘的關(guān)聯(lián)規(guī)則挖掘改進(jìn)算法。進(jìn)一步介紹了在線監(jiān)測(cè)系統(tǒng)架構(gòu)及軟件設(shè)計(jì)方案及相關(guān)功能介紹。通過(guò)電能計(jì)量裝置在線監(jiān)測(cè)與故障系統(tǒng)的實(shí)地應(yīng)用,驗(yàn)證了改進(jìn)算法可減少無(wú)效挖掘,提高計(jì)算速率,適用于在線診斷。通過(guò)實(shí)地應(yīng)用,證明了該系統(tǒng)異常分析準(zhǔn)確度高、實(shí)時(shí)性強(qiáng)、適用范圍廣泛,是實(shí)現(xiàn)我國(guó)智能電網(wǎng)建設(shè)的有力工具。
計(jì)量裝置;數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;在線監(jiān)測(cè);故障診斷
隨著智能電網(wǎng)的建設(shè),網(wǎng)絡(luò)化、數(shù)字化、智能化將是針對(duì)智能電網(wǎng)智能量測(cè)系統(tǒng)的計(jì)量裝置的電能計(jì)量在線監(jiān)測(cè)系統(tǒng)的發(fā)展趨勢(shì)[1]。目前存在的問(wèn)題是電能表、采集終端等分布廣泛、數(shù)量巨大,故障頻發(fā)率高。故如何降低故障現(xiàn)場(chǎng)檢修工作量、實(shí)現(xiàn)計(jì)量相關(guān)設(shè)備的在線監(jiān)測(cè),對(duì)建設(shè)堅(jiān)強(qiáng)智能電網(wǎng)具有實(shí)際的工程意義,有必要設(shè)計(jì)一套多功能集成的計(jì)量裝置在線監(jiān)測(cè)與故障診斷系統(tǒng)。
目前國(guó)內(nèi)在該系統(tǒng)方面的實(shí)現(xiàn)技術(shù)仍處于探索階段,運(yùn)行維護(hù)項(xiàng)目和流程也沿用傳統(tǒng)變電站運(yùn)行管理要求[2]。為此,諸多學(xué)者將數(shù)據(jù)挖掘技術(shù)應(yīng)用到了計(jì)量數(shù)據(jù)處理和系統(tǒng)設(shè)計(jì)中[3-6],如文獻(xiàn)[7]將決策樹用到變電站故障診斷領(lǐng)域,實(shí)現(xiàn)了故障診斷知識(shí)的自動(dòng)獲取與表示,且所獲得的以決策樹形式表示的知識(shí)具有較高的推理速度;文獻(xiàn)[8]將基于事件序列的數(shù)據(jù)挖掘原理故障診斷模型用于高壓輸電線系統(tǒng)故障診斷領(lǐng)域,依據(jù)輸電系統(tǒng)故障事件序列在時(shí)空特性上的關(guān)聯(lián)性,用動(dòng)態(tài)規(guī)劃算法的優(yōu)化相似性原理挖掘事件序列之間的關(guān)聯(lián)性和蘊(yùn)涵的知識(shí),以實(shí)現(xiàn)對(duì)異常事件序列模式中畸變事件的“復(fù)原”和糾錯(cuò),從而保證故障診斷系統(tǒng)的高容錯(cuò)性。文獻(xiàn)[9]將模糊聚類方法應(yīng)用于而電廠和電力系統(tǒng)的實(shí)測(cè)數(shù)據(jù),并將其連續(xù)屬性離散化,后采用粗糙集理論對(duì)離散數(shù)據(jù)進(jìn)行處理,挖掘故障診斷與運(yùn)行決策的規(guī)則知識(shí)。
故為實(shí)現(xiàn)對(duì)現(xiàn)場(chǎng)運(yùn)行的電能表、采集終端、計(jì)量回路及相關(guān)設(shè)備進(jìn)行在線監(jiān)測(cè)、故障監(jiān)測(cè)和狀態(tài)評(píng)估判斷的準(zhǔn)確性。本文首先分析了故障信息序列中必有或特有的信息,提出了基于特征挖掘的關(guān)聯(lián)規(guī)則挖掘改進(jìn)算法。進(jìn)一步介紹了在線監(jiān)測(cè)系統(tǒng)架構(gòu)及軟件設(shè)計(jì)方案及相關(guān)功能介紹。通過(guò)電能計(jì)量裝置在線監(jiān)測(cè)與故障系統(tǒng)的實(shí)地應(yīng)用,驗(yàn)證了改進(jìn)算法可減少無(wú)效挖掘,提高計(jì)算速率,適用于在線診斷。
電能計(jì)量裝置的檢測(cè)與故障診斷主要按照終端和計(jì)量表的事件邏輯順序進(jìn)行診斷,故障信息序列間具有時(shí)序關(guān)聯(lián)關(guān)系,設(shè)備間具有拓?fù)溥B接關(guān)系,因此,關(guān)聯(lián)規(guī)則挖掘方法適合用于電能計(jì)量裝置故障信息[10]。而該方法的缺點(diǎn)為:計(jì)算量呈冪律的增長(zhǎng)趨勢(shì)、易忽略離群數(shù)據(jù)。為便于獲取故障的特征、提高計(jì)算效率[11],需對(duì)該方法進(jìn)行改進(jìn)。
設(shè)給定事務(wù)數(shù)據(jù)庫(kù)D={T1,T2,T3,…,Tn}、其中各事務(wù)T是項(xiàng)集I的子集,即T?I;|D|為D中的總事務(wù)數(shù)。X、Y都是T中的項(xiàng)或項(xiàng)集,X∩Y=Φ。若如果事務(wù)T同時(shí)包含X、Y,則就可得到關(guān)聯(lián)規(guī)則:
式中,S%為支持度,表示滿足條件的事務(wù)T在D中所占比例;C%為可信度,表示D同時(shí)包含X和Y的比例;I%為興趣度,表示X、Y的相關(guān)程度。
通常的挖掘算法使用頻繁集生成關(guān)聯(lián)規(guī)則[12],算法起始需多次掃描事務(wù)數(shù)據(jù)庫(kù),故制約了挖掘的執(zhí)行效率。所用到的頻繁模式算法首先將數(shù)據(jù)庫(kù)壓縮成一棵頻繁模式樹,相當(dāng)于將數(shù)據(jù)庫(kù)分組,能夠減少數(shù)據(jù)庫(kù)掃描的次數(shù),而關(guān)聯(lián)信息仍然保存在樹的節(jié)點(diǎn)中。為防止對(duì)誤差有所遺漏,此處對(duì)該算法進(jìn)行改進(jìn),提出基于故障特征的關(guān)聯(lián)規(guī)則挖掘算法。
1)總結(jié)電網(wǎng)故障特征的頻繁集,以得到關(guān)聯(lián)規(guī)則,也可通過(guò)挖掘來(lái)補(bǔ)充和細(xì)化特征;
2)進(jìn)行故障分解為故障征兆類和故障性質(zhì)類,診斷規(guī)則左項(xiàng)為故障征兆,右項(xiàng)為故障性質(zhì);
3)對(duì)故障記錄樣本按故障性質(zhì)分組,不考慮不同故障性質(zhì)的故障間的關(guān)聯(lián)關(guān)系,減少無(wú)效挖掘;
4)調(diào)整可信度閾值調(diào)整各故障統(tǒng)計(jì)數(shù)間的關(guān)系,保證至少挖掘出一種規(guī)則,以防遺漏稀有故障相關(guān)規(guī)則;
5)采用深度優(yōu)先搜索算法,修剪非頻繁集時(shí)保留包含葉子節(jié)點(diǎn)的數(shù)據(jù)集,即保證任何一種故障性質(zhì)都不會(huì)被修剪。
2.1 系統(tǒng)研制目標(biāo)
基于數(shù)據(jù)挖掘的計(jì)量裝置在線監(jiān)測(cè)系統(tǒng)針對(duì)電能計(jì)量裝置管理工作而開(kāi)發(fā)設(shè)計(jì)的自動(dòng)化管理系統(tǒng);通過(guò)對(duì)運(yùn)行中計(jì)量設(shè)備的信號(hào)采集、數(shù)據(jù)處理、邏輯判斷來(lái)實(shí)現(xiàn)實(shí)時(shí)對(duì)電能表進(jìn)行在線遠(yuǎn)程校驗(yàn)、TV、TA特性參數(shù)監(jiān)測(cè),并且在主站可以將所有數(shù)據(jù)進(jìn)行集中管理[13-14]。通過(guò)將原在線監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)與各相關(guān)因素的數(shù)據(jù)相組合,并選擇和運(yùn)用數(shù)據(jù)挖掘算法進(jìn)行剖析,得到各相關(guān)因素對(duì)設(shè)備狀態(tài)影響的定量表示,該系統(tǒng)在監(jiān)測(cè)與故障診斷方面應(yīng)設(shè)計(jì)具有互感器可靠性評(píng)價(jià)、開(kāi)關(guān)可靠性評(píng)價(jià)、故障過(guò)程全維度回放等能力。即在故障辨識(shí)結(jié)束后,可使調(diào)度運(yùn)行人員對(duì)某故障按照故障時(shí)間先后順序?qū)收先^(guò)程進(jìn)行清晰的全維度回放,為故障性質(zhì)的確定、故障后的系統(tǒng)恢復(fù)、設(shè)備維修提供可信的依據(jù)。
2.2 總體系統(tǒng)及軟件架構(gòu)
計(jì)量裝置在線監(jiān)測(cè)系統(tǒng)由故障數(shù)據(jù)庫(kù)、分布式云存儲(chǔ)單元、互聯(lián)網(wǎng)應(yīng)用服務(wù)、調(diào)試接口、后臺(tái)分析等模塊組成。為滿足于多系統(tǒng)間的信息交互,該系統(tǒng)采用SOA(Service-Oriented Architecture)架構(gòu)設(shè)計(jì)[8],通過(guò) ESB服務(wù)總線(ESB,Enerprise Service Bus)約定與外部系統(tǒng)信息交互規(guī)則。
該系統(tǒng)以用電信息采集系統(tǒng)為基礎(chǔ),從用電信息采集系統(tǒng)、營(yíng)銷系統(tǒng)、計(jì)量生產(chǎn)調(diào)度平臺(tái)中通過(guò)數(shù)據(jù)抽取工具獲取的各類數(shù)據(jù),之后進(jìn)行在線統(tǒng)計(jì)和離線分析,以此為判斷、分析現(xiàn)場(chǎng)故障狀態(tài)分析提供依據(jù)。其軟件技術(shù)架構(gòu)如圖1所示,在線監(jiān)測(cè)與診斷功能由業(yè)務(wù)應(yīng)用、支撐平臺(tái)組成,各部分功能如下:
1)支撐平臺(tái)從采集系統(tǒng)的電能、電量示值、事件、負(fù)荷、參數(shù)閾值等數(shù)據(jù),根據(jù)入庫(kù)規(guī)則存放在數(shù)據(jù)庫(kù)和分布式數(shù)據(jù)存儲(chǔ)系統(tǒng)中。
2)后臺(tái)服務(wù)實(shí)現(xiàn)從不同維度對(duì)各類數(shù)據(jù)進(jìn)行分類統(tǒng)計(jì)和計(jì)算,實(shí)現(xiàn)異常分析流程化和智能化。
3)業(yè)務(wù)應(yīng)用包括在線警告、流程管理、信道檢測(cè)、裝置評(píng)價(jià)、定位服務(wù)等功能,并實(shí)現(xiàn)分區(qū)域、分異常嚴(yán)重等級(jí)和類別進(jìn)行展示。
圖1 在線監(jiān)測(cè)系統(tǒng)軟件功能總體架構(gòu)
對(duì)計(jì)量裝置故障的關(guān)聯(lián)規(guī)則挖掘首先要進(jìn)行故障數(shù)據(jù)的預(yù)處理,采用監(jiān)視控制系統(tǒng)對(duì)故障事件進(jìn)行記錄,將分解后的結(jié)果保存到數(shù)據(jù)倉(cāng)庫(kù);之后對(duì)故障元事件進(jìn)行排序、分類,以減少遍歷集合的次數(shù);判斷故障事件中的量測(cè)信息是否超過(guò)約定的閾值,從而完成對(duì)故障元事件邏輯轉(zhuǎn)換;最后對(duì)故障事件按類別編號(hào),以增強(qiáng)挖掘軟件的通用性[15]。
在數(shù)據(jù)預(yù)處理之后,應(yīng)建立挖掘模型,將包含閾值信息的頻繁項(xiàng)集構(gòu)建成頻繁模式樹。該模型包含故障征兆與故障性質(zhì)之間的關(guān)聯(lián)關(guān)系,離線運(yùn)行時(shí)用于故障特征的自學(xué)習(xí)和故障規(guī)則的提取,在線運(yùn)行時(shí)用于故障診斷[16]。該關(guān)聯(lián)規(guī)則挖掘功能的主要算法流程如圖2所示,后臺(tái)故障在線診斷流程如圖3所示。
4.1 算法改進(jìn)性能驗(yàn)證
在進(jìn)行系統(tǒng)性能實(shí)測(cè)之前,需建立故障數(shù)據(jù)挖掘庫(kù),并驗(yàn)證改進(jìn)算法的優(yōu)越性。以X省供電公司近3年內(nèi)的收集200余次故障記錄數(shù)據(jù)為基礎(chǔ),建立容量為200項(xiàng)的數(shù)據(jù)挖掘庫(kù),容量為20項(xiàng)的無(wú)故障測(cè)試數(shù)據(jù)庫(kù),并在某服務(wù)器上進(jìn)行挖掘算法測(cè)試,其測(cè)試內(nèi)容為在挖掘庫(kù)中增加50項(xiàng)不良記錄,用于模擬故障事件中的丟失信息、錯(cuò)誤信息和冗余信息,檢驗(yàn)程序的健壯性。分3次測(cè)試,第1次測(cè)試為只挖掘200項(xiàng)正常的故障記錄;第2次為在增加30項(xiàng)有缺失信息和20項(xiàng)有冗余信息的挖掘測(cè)試;第3次為10項(xiàng)有缺失信息和40項(xiàng)有冗余信息的挖掘測(cè)試。測(cè)試結(jié)果列于表1,從中可看出,利用改進(jìn)算法產(chǎn)生的規(guī)則對(duì)測(cè)試庫(kù)中20項(xiàng)故障記錄進(jìn)行診斷,規(guī)則匹配度全部達(dá)到0.8以上,且效率大為提高。在有缺失信息的情況下,適當(dāng)降低可信度仍然可以挖掘出有效的規(guī)則;冗余信息對(duì)挖掘的影響較小,說(shuō)明該算法可把握重要關(guān)聯(lián)規(guī)則,濾除干擾。
圖2 關(guān)聯(lián)規(guī)則挖掘改進(jìn)算法流程圖
圖3 后臺(tái)故障在線診斷分析流程圖
表1 不良數(shù)據(jù)記錄的挖掘測(cè)試結(jié)果
4.2 系統(tǒng)實(shí)地應(yīng)用性能分析
以X省供電公司2015年6月某次變電站運(yùn)行數(shù)據(jù)為例(如表2所示),對(duì)系統(tǒng)的實(shí)地應(yīng)用性能進(jìn)行描述分析。
2015年6月19日凌晨4點(diǎn)前后,某區(qū)TV二次回路壓降發(fā)生突變。初步初步推斷為由于線路老化,TV二次回路中的某接點(diǎn)或線路松動(dòng)接觸不良或受損,引起 TV二次回路壓降突然增大,超出規(guī)定范圍。因此首先對(duì)被監(jiān)測(cè)TV二次回路的各個(gè)接點(diǎn)及線路進(jìn)行排查,同時(shí)在早上9點(diǎn)后進(jìn)行加固處理;經(jīng)過(guò)對(duì)該TV二次回路所有接點(diǎn)進(jìn)行加固處理后,監(jiān)測(cè)TV二次回路壓降回復(fù)正常值,現(xiàn)場(chǎng)處理后線路回復(fù)正常。
表2 變電站實(shí)測(cè)數(shù)據(jù)
文中研究電能計(jì)量裝置在線監(jiān)測(cè)與故障系統(tǒng)的設(shè)計(jì)問(wèn)題。該系統(tǒng)的實(shí)現(xiàn)核心為基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘算法,同時(shí)考慮到傳統(tǒng)關(guān)聯(lián)規(guī)則計(jì)算速率慢、易忽略離群數(shù)據(jù)等缺陷,對(duì)其進(jìn)行了算法改進(jìn)。之后,給出了在線監(jiān)測(cè)系統(tǒng)架構(gòu)及軟件設(shè)計(jì)方案及相關(guān)功能介紹。該系統(tǒng)異常分析準(zhǔn)確度高、實(shí)時(shí)性強(qiáng)、適用范圍廣泛,已在國(guó)網(wǎng)X省電力公司運(yùn)行半年有余,發(fā)現(xiàn)多起嚴(yán)重等級(jí)的計(jì)量異常和用電異常事件、現(xiàn)場(chǎng)錯(cuò)誤接線、計(jì)量裝置質(zhì)量缺陷等問(wèn)題,通過(guò)及時(shí)排查問(wèn)題和現(xiàn)場(chǎng)消缺,為公司挽回了大量的經(jīng)濟(jì)損失,取得很好的效果。
[1]行明濤,吳華芹,于仲華.電能計(jì)量帶電核查儀系統(tǒng)的設(shè)計(jì)[J].電子設(shè)計(jì)工程,2013,21(23):163-166.
[2]王春慶,趙玉富,周 琪,等.電能計(jì)量裝置運(yùn)行現(xiàn)狀淺析[J].電測(cè)與儀表,2010,47(7):26-28.
[3]彭小圣,鄧迪元,程時(shí)杰,等.面向智能電網(wǎng)應(yīng)用的電力大數(shù)據(jù)關(guān)鍵技術(shù)[J].中國(guó)電機(jī)工程學(xué)報(bào),2015,35(3):503-511.
[4]桂強(qiáng).數(shù)據(jù)挖掘及信息融合技術(shù)在電網(wǎng)故障信息系統(tǒng)中的應(yīng)用 [D].上海:上海交通大學(xué),2007.
[5]黃彥浩,于之虹,謝昶,等.電力大數(shù)據(jù)技術(shù)與電力系統(tǒng)仿真計(jì)算結(jié)合問(wèn)題研究[J].中國(guó)電機(jī)工程學(xué)報(bào),2015,35(1):13-22.
[6]劉巍,黃曌,李鵬,等.面向智能配電網(wǎng)的大數(shù)據(jù)統(tǒng)一支撐平臺(tái)體系與構(gòu)架[J].電工技術(shù)學(xué)報(bào),2014,29(1):486-491.
[7]白建社,樊 波,黃文華.基于決策樹的變電站故障診斷知識(shí)表示與獲取[J].電力系統(tǒng)自動(dòng)化學(xué)報(bào),2004,16(2):5-8.
[8]孫雅明,廖志偉.基于事件序列數(shù)據(jù)挖掘原理的高壓輸電線系統(tǒng)故障診斷 [J].電力系統(tǒng)自動(dòng)化,2004,28(5):20-24.
[9]于達(dá)任,胡清華,鮑文.融合粗糙集和模糊聚類的連續(xù)數(shù)據(jù)知識(shí)發(fā)現(xiàn)[J].中國(guó)電機(jī)工程學(xué)報(bào),2004,24(6):205-210.
[10]Muller E,Gunnemann S,Assent L,et al.Evaluating clustering in subspace projections of high dimensional data[J]. ProceedingsoftheVLDBEndowment,2009,2(1):1270-1281.
[11]Witten I H,F(xiàn)rank E.Data Mining:Practical machine learning tools and techniques[M].Morgan Kaufmann:2005.
[12]Peng H,Long F,Ding C.Feature selection based on mutual information criteria of max-dependency,max-relevance,and min-redundancy [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(8):1226-1238.
[13]趙山,許卓,陳銳民.基于10kV高壓電能表的變損和線損測(cè)試[J].電子設(shè)計(jì)工程,2012,20(20):113-118.
[14]黃俐萍,朱 錚,李 蕊.高級(jí)計(jì)量在線監(jiān)測(cè)技術(shù)研究[J].華東電力,2010,38(4):0552-0556.
[15]李再華,白曉民,周子冠,等.基于特征挖掘的電網(wǎng)故障診斷方法[J].中國(guó)電機(jī)工程學(xué)報(bào),2010,30(10):16-22.
[16]包曉暉.基于數(shù)據(jù)挖掘技術(shù)的電氣設(shè)備在線監(jiān)測(cè)系統(tǒng)開(kāi)發(fā)[J].華北水利水電學(xué)院學(xué)報(bào),2008,29(5):52-54.
Design of online monitoring and fault diagnosis system for metering devices based on data mining
YANG Shi-hai1,DAI Tai-wen2,LU Shu-feng1,LI Tao2,XU Rui-min1
(1.State Grid Jiangsu Electric Power Research Institute,Nanjing 210019,China;2.Fujian Yirong Information Technology co.,LTD.,F(xiàn)uzhou 350003,China)
In order to realize online monitoring and fault diagnosis of metering device during its running state,this paper designed the online monitoring and fault diagnosis system of electric energy metering device.At first,the information there must be or specific in fault information sequence was analyzed and a improved method of association rule mining based on feature mining was proposing.Then,the frame of online monitoring system and software design scheme which including function were introduced.Through applying the online monitoring and fault diagnosis system in the field,we verified that the improved method can reduce ineffective mining,having a higher computing rate,and is suitable for online diagnosis.The application approved that this system had high accuracy of anomaly analyzing,strong real-time and wide application range which would be a powerful tool for accomplishing the construction of smart grids in our country.
metering device;data mining;association rule;online monitoring;fault diagnosis
TN87
A
1674-6236(2016)23-0108-04
2015-11-22稿件編號(hào):201511205
楊世海(1976—),男,安徽合肥人,碩士研究生,高級(jí)工程師。研究方向:電力系統(tǒng)自動(dòng)化與電能計(jì)量技術(shù)。