文/袁丹 黃繼明
隨著社會(huì)經(jīng)濟(jì)發(fā)展對(duì)電力需求的日益增大,社會(huì)各界對(duì)供電可靠性的要求越來(lái)越高,用戶對(duì)故障停電的容忍程度不斷降低,配網(wǎng)搶修管理現(xiàn)狀與用戶日益增長(zhǎng)的服務(wù)需求之間的矛盾日益突出。
傳統(tǒng)配電網(wǎng)搶修模式主要依賴于用戶電話報(bào)修,故障描述不清晰,故障報(bào)修不及時(shí),同一故障點(diǎn)多個(gè)工單難以合并,影響搶修效率。隨著經(jīng)濟(jì)社會(huì)發(fā)展,“被動(dòng)式搶修”越來(lái)越難以適應(yīng)技術(shù)進(jìn)步和服務(wù)提升的需要,配電網(wǎng)搶修系統(tǒng)信息集成不足、模塊化技術(shù)支撐不足、統(tǒng)調(diào)能力不足等問(wèn)題日益凸顯。
為此,從配電網(wǎng)專用和公用線路停電信號(hào)數(shù)量出發(fā),運(yùn)用大數(shù)據(jù)在線挖掘技術(shù),能有效識(shí)別配電網(wǎng)線路的真實(shí)故障,建立一個(gè)能快速識(shí)別有效故障的研判模型,提升配電線路故障識(shí)別的及時(shí)性和準(zhǔn)確性,為配網(wǎng)搶修指揮和故障報(bào)備提供實(shí)時(shí)數(shù)據(jù)支持,提高故障報(bào)備和用戶通知工作的效率。
以2016年1月1日至2017年12月31日用電信息采集系統(tǒng)中配電變壓器的停電信號(hào)數(shù)據(jù)為基礎(chǔ),登錄用電信息采集系統(tǒng),分別查詢并且導(dǎo)出2016年1月1日至2017年12月31日的專用和公用配電變壓器有效停電數(shù)據(jù),所提取的字段信息包括:線路、戶號(hào)、戶名、終端停電時(shí)間、終端復(fù)電時(shí)間等。
表1:決策樹訓(xùn)練結(jié)果表
表2:決策樹模型測(cè)試結(jié)果表
從電網(wǎng)用電信息采集系統(tǒng)中導(dǎo)出2016年以來(lái)的專用和公用配電變壓器有效停電數(shù)據(jù),所提取的字段信息包括:線路、戶號(hào)、戶名、終端停電時(shí)間、終端復(fù)電時(shí)間等,對(duì)其中停電時(shí)長(zhǎng)小于15分鐘的信號(hào)進(jìn)行剔除,并以5分鐘為時(shí)間間隔分別整理出專、公配電停電信號(hào)數(shù)量作為自變量數(shù)據(jù);
從PMS系統(tǒng)查中導(dǎo)出2016以來(lái)的配網(wǎng)檢修計(jì)劃信息,所提取的字段信息包括:工作日期、主線路名稱、實(shí)際工作開始時(shí)間、實(shí)際工作結(jié)束時(shí)間、執(zhí)行情況描述、電壓等級(jí)等,根據(jù)PMS系統(tǒng)中相同時(shí)段的停電檢修計(jì)劃對(duì)自變量數(shù)據(jù)進(jìn)行匹配和剔除;再次對(duì)95598工單中的故障和供電企業(yè)平時(shí)運(yùn)行記錄中的故障進(jìn)行信息整理和合并作為故障因變量數(shù)據(jù)。
以2016年的公、專變停電信號(hào)數(shù)及故障記錄作為訓(xùn)練數(shù)據(jù),以2017年數(shù)據(jù)作為測(cè)試數(shù)據(jù)。數(shù)據(jù)處理后,2016年共有26898條數(shù)據(jù),其中關(guān)聯(lián)為故障的為1155條,而未關(guān)聯(lián)為故障記錄為25743條,從數(shù)據(jù)上看,樣本的兩類數(shù)據(jù)分布極為不平衡,這會(huì)導(dǎo)致類型分布的不平衡會(huì)嚴(yán)重影響模型的訓(xùn)練效果,本文采用上采樣方法,復(fù)制稀有類的樣本,將故障記錄復(fù)制20次作為訓(xùn)練數(shù)據(jù),最終訓(xùn)練數(shù)據(jù)中共有49998條記錄,其中故障記錄為24255,非故障記錄為25743。
我們借助SPSS Modeler數(shù)據(jù)挖掘軟件,運(yùn)用決策樹與BP神經(jīng)網(wǎng)絡(luò)分別對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練及測(cè)試,以公變和專變的停電信號(hào)數(shù)量為輸入變量,是否故障為輸出變量。
表3:神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練結(jié)果表
表4:神經(jīng)網(wǎng)絡(luò)模型測(cè)試結(jié)果表
在SPSS Modeler軟件中選用C4.5算法建模,使用誤分類損失矩陣,其中把非故障識(shí)別成故障的懲罰系數(shù)為3,把故障識(shí)別成非故障懲罰系數(shù)為1,這是由于系統(tǒng)對(duì)識(shí)別為故障的事件會(huì)委派維修員去現(xiàn)場(chǎng),如果判斷錯(cuò)誤,成本較高。接著再對(duì)模型進(jìn)行剪枝,剪掉小于170的節(jié)點(diǎn),最后得到模型含有11個(gè)節(jié)點(diǎn),21個(gè)枝。該模型的訓(xùn)練和測(cè)試結(jié)果如表1所示。
Total表示總共識(shí)別出的總數(shù)據(jù)量,1表示故障,0表示非故障,i-j表示把i識(shí)別成j的數(shù)量(i=0,1,j=0,1),Correct rate 表示識(shí)別準(zhǔn)確率,Hit Rate表示故障命中率。由于在主動(dòng)搶修中,把非故障識(shí)別成故障成本較高,因此故障命中率是一個(gè)比較重要的指標(biāo),它指的是識(shí)別為故障的事件中,真實(shí)故障所占的比例。
從2017年數(shù)據(jù)中,隨機(jī)篩選10%數(shù)據(jù),進(jìn)行模型測(cè)試。如表2所示。
該模型的訓(xùn)練故障命中率為90.99%,測(cè)試命中率為72.94%。
在SPSS Modeler軟件中選用神經(jīng)網(wǎng)絡(luò)算法建模,設(shè)置最多訓(xùn)練500次,選用三層網(wǎng)絡(luò)進(jìn)行建模。該模型的訓(xùn)練和測(cè)試結(jié)果如表3、4所示。
該模型的訓(xùn)練故障命中率為76.66%,測(cè)試的故障命中率為72.94%。
比較兩個(gè)模型所得到的結(jié)果,決策樹得到的結(jié)果更精確,總共有498個(gè)真實(shí)故障,模型識(shí)別出321個(gè)故障,其中正確的有254個(gè)故障,準(zhǔn)確率達(dá)到72.94%。 故障識(shí)別準(zhǔn)確率得到了極大提升,為主動(dòng)搶修的實(shí)施提供了數(shù)據(jù)支持。
本文通過(guò)數(shù)據(jù)挖掘中的決策樹與神經(jīng)網(wǎng)絡(luò)模型,建立一種基于配電器停電信號(hào)的線路故障識(shí)別模型,準(zhǔn)確度較高,使得在不增加硬件投入的前提下,利用已有的設(shè)備和數(shù)據(jù)資源大幅提高對(duì)配電線路的可靠感知能力。加快了局部性配電線路的停電故障的識(shí)別能力,使配網(wǎng)搶修指揮人員在收到故障、投訴工單或調(diào)控部門發(fā)出預(yù)警前感知配網(wǎng)的疑似故障信息,并開展主動(dòng)搶修。