周 凱,喻 鑫,嚴(yán)利雄,畢如玉,鄧 科,李煜磊
(1.國網(wǎng)湖北省電力有限公司檢修公司,湖北 武漢430072;2.武漢大學(xué)電氣與自動化學(xué)院,湖北 武漢430072)
二次設(shè)備的穩(wěn)定可靠運(yùn)行對整個電力系統(tǒng)而言至關(guān)重要[1]。近年來,電力系統(tǒng)中二次設(shè)備的數(shù)量在經(jīng)濟(jì)高速高質(zhì)量發(fā)展、電網(wǎng)規(guī)模擴(kuò)大的背景下迅速增長,變電站運(yùn)維檢修人員面臨著二次設(shè)備數(shù)量激增的現(xiàn)狀,同時由于二次設(shè)備種類的多樣性、結(jié)構(gòu)的復(fù)雜性,使得二次檢修的工作量大大提高[2-3],故有必要提高二次設(shè)備的運(yùn)維和管控水平以降低運(yùn)檢人員的工作負(fù)擔(dān),保證系統(tǒng)的正常穩(wěn)定運(yùn)行。設(shè)備缺陷可通過運(yùn)檢人員現(xiàn)場發(fā)現(xiàn)手工錄入,也可通過調(diào)控員在OMS(Operations Management System,調(diào)度管理系統(tǒng))調(diào)度日志中記錄,同時IEC61850主動上送服務(wù)的應(yīng)用信息和光纖傳輸通信的發(fā)展為變電站二次設(shè)備缺陷數(shù)據(jù)的傳輸提供了良好的途徑[4],將這些缺陷數(shù)據(jù)匯總整理后進(jìn)行挖掘分析有助于提升二次設(shè)備的運(yùn)維和管控水平[5]。但目前僅使用簡單的分類統(tǒng)計(jì)分析二次缺陷設(shè)備,一方面缺乏理論性和系統(tǒng)性,方法過于簡單導(dǎo)致無法充分挖掘出缺陷數(shù)據(jù)的價值,另一方面缺乏整體綜合分析和數(shù)據(jù)的關(guān)聯(lián)性分析,而數(shù)據(jù)之間的關(guān)聯(lián)性可得出有助于提升二次設(shè)備運(yùn)維和管控水平的結(jié)論[6]。
目前,針對電力領(lǐng)域中的一些問題,已有研究人員使用數(shù)據(jù)挖掘技術(shù)來解決[7-9]。文獻(xiàn)[7]建立了基于云-Petri網(wǎng)的變壓器狀態(tài)分析模型,使用Apriori算法挖掘變壓器狀態(tài)參量和狀態(tài)之間的關(guān)聯(lián)規(guī)則以及各狀態(tài)之間的關(guān)聯(lián)規(guī)則。然而,當(dāng)前在二次設(shè)備領(lǐng)域,使用數(shù)據(jù)挖掘?qū)Χ卧O(shè)備進(jìn)行故障診斷或狀態(tài)評估的較多。在二次設(shè)備缺陷分析方面,所使用的技術(shù)方法比較簡單且文獻(xiàn)較少,難以充分發(fā)揮缺陷數(shù)據(jù)的價值,深度挖掘出缺陷數(shù)據(jù)所蘊(yùn)含的信息。文獻(xiàn)[8]通過Apriori算法尋找到二次設(shè)備的薄弱環(huán)節(jié)和缺陷原因,并對二次設(shè)備缺陷數(shù)據(jù)進(jìn)行關(guān)聯(lián)性分析;文獻(xiàn)[9]使用改進(jìn)Apriori算法,通過添加項(xiàng)目識別碼,減少不必要的頻繁項(xiàng)集篩選,對二次設(shè)備缺陷數(shù)據(jù)進(jìn)行關(guān)聯(lián)性分析,起到了降低算法時間復(fù)雜度的效果,但該方法對于運(yùn)維檢修人員更加關(guān)心但出現(xiàn)頻次低的缺陷難以得到良好的挖掘結(jié)果,挖掘出的關(guān)聯(lián)性仍有限??傮w而言,現(xiàn)有變電站二次設(shè)備缺陷分析方法缺少理論性和系統(tǒng)性,導(dǎo)致監(jiān)控和調(diào)度人員對缺陷信息缺乏研判能力,難以有效提取缺陷數(shù)據(jù)的價值。
為此,本文提出了基于層次分析法(AHP)和分類加權(quán)關(guān)聯(lián)規(guī)則的分析方法。在闡述關(guān)聯(lián)規(guī)則的基礎(chǔ)上引入分類加權(quán)關(guān)聯(lián)規(guī)則及其Apriori算法實(shí)現(xiàn),考慮二次設(shè)備的生產(chǎn)廠家、設(shè)備類型、缺陷發(fā)現(xiàn)時間、缺陷部位、缺陷原因、缺陷等級6個重要屬性,建立了基于加權(quán)關(guān)聯(lián)規(guī)則的二次設(shè)備缺陷數(shù)據(jù)模型。并以某市變電站的二次設(shè)備缺陷數(shù)據(jù)構(gòu)造缺陷樣本,利用AHP計(jì)算缺陷項(xiàng)目的初始權(quán)重,使用加權(quán)的Apriori算法挖掘二次設(shè)備缺陷數(shù)據(jù)各屬性的加權(quán)關(guān)聯(lián)規(guī)則,并對挖掘結(jié)果進(jìn)行了分析。
在關(guān)聯(lián)規(guī)則[10]中,其包含的單個事物被稱為項(xiàng)目(Item),k個項(xiàng)目構(gòu)成的集合稱為k-項(xiàng)集(k-Itemset),k為項(xiàng)集的長度。假設(shè)I={I1,I2,…Im}是項(xiàng)的集合。給定一個事務(wù)數(shù)據(jù)集D={t1,t2,…tn},其中每個事務(wù)與唯一標(biāo)識符TID(Transaction ID)相對應(yīng),每個事務(wù)t是I的非空子集,滿足t?I。
形如X?Y的蘊(yùn)含式被稱為關(guān)聯(lián)規(guī)則,其中X,Y?I且X∩Y=Φ,關(guān)聯(lián)規(guī)則R可以表示為:
式(1)中,X為關(guān)聯(lián)規(guī)則的先導(dǎo)(Left-Hand-Side,LHS),Y為后繼(Right-Hand-Side,RHS)。
支持度(Support)表示某關(guān)聯(lián)規(guī)則發(fā)生的可能性,支持度越高則可能性越大,而置信度(Confidence)則表示該關(guān)聯(lián)規(guī)則的可靠程度,置信度越高,則該關(guān)聯(lián)規(guī)則越可靠,兩者是關(guān)聯(lián)規(guī)則的評價指標(biāo)。
項(xiàng)集X在D中的支持度為:
式(2)中,count(X)表示數(shù)據(jù)集D中包含X的事務(wù)數(shù)量。項(xiàng)集X在D中的支持度即為概率P(X),同理可得項(xiàng)集Y的支持度。
關(guān)聯(lián)規(guī)則R的支持度為:
式(3)中,count(X∪Y)表示數(shù)據(jù)集D中同時包含X、Y的事務(wù)數(shù)量。該支持度表示X、Y兩個項(xiàng)集同時發(fā)生在一個事務(wù)中的可能性。關(guān)聯(lián)規(guī)則需要滿足的支持度的最小閾值記為Smin,稱作最小支持度,滿足Smin的項(xiàng)集稱為頻繁項(xiàng)集。
關(guān)聯(lián)規(guī)則R的置信度為:
置信度表示項(xiàng)集X發(fā)生的事務(wù)中項(xiàng)集Y同時發(fā)生的條件概率。最小置信度記為Cmin,是關(guān)聯(lián)規(guī)則需要滿足的置信度的最小閾值。
強(qiáng)關(guān)聯(lián)規(guī)則滿足Smin和Cmin的要求,對于指導(dǎo)實(shí)際決策具有建設(shè)性意義[11]。最小支持度Smin是關(guān)聯(lián)規(guī)則需要滿足的最低要求,而最小置信度Cmin是關(guān)聯(lián)規(guī)則所需滿足的最低可靠性。
傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘算法通常認(rèn)為數(shù)據(jù)集中每個項(xiàng)目有著相同的重要性,但在實(shí)際情況中用戶對每個項(xiàng)目的關(guān)心程度不一樣,這導(dǎo)致傳統(tǒng)挖掘算法難以得出符合用戶實(shí)際關(guān)切的結(jié)論,用戶更關(guān)心的項(xiàng)目可能因?yàn)槟承┰蜓蜎]在數(shù)據(jù)集中無法被挖掘到,采用分類加權(quán)關(guān)聯(lián)規(guī)則挖掘算法可以有效解決該問題[12]。通過對項(xiàng)集中不同項(xiàng)目進(jìn)行分類,不同的項(xiàng)目根據(jù)用戶的實(shí)際關(guān)心和重要程度等賦予不同的權(quán)值,在此基礎(chǔ)上定義項(xiàng)集和關(guān)聯(lián)規(guī)則的加權(quán)支持度,置信度仍沿用公式(4)。
由1.1節(jié)可知假設(shè)數(shù)據(jù)集D中有n個事務(wù),m個項(xiàng)目,這些項(xiàng)目分為p類,設(shè)為項(xiàng)目全集,其中項(xiàng)目上標(biāo)為類別,每個項(xiàng)目都有一個權(quán)值與之對應(yīng),設(shè)為{h1,h2,…h(huán)m}(hi∈[0,1]),對權(quán)值進(jìn)行歸一化得:式(5)中,maxj(I)為第j個類的最大權(quán)值。則對于項(xiàng)集X,假設(shè)其有r個類,則X的權(quán)值h(X)應(yīng)當(dāng)為其所包含的r個類對應(yīng)的h'i之和。
對權(quán)值進(jìn)行歸一化后,可定義加權(quán)支持度為:
結(jié)合最小支持度定義,令最小加權(quán)支持度為Swmin,若Sw(X)>Swmin,則稱X是加權(quán)頻繁的,從加權(quán)頻繁項(xiàng)集中挖掘出的關(guān)聯(lián)規(guī)則稱為加權(quán)關(guān)聯(lián)規(guī)則。
本文采用Apriori算法[10]進(jìn)行加權(quán)頻繁項(xiàng)集的挖掘,由支持度滿足閾值的k-項(xiàng)集組成k頻繁項(xiàng)集Lk,其中,每個k-項(xiàng)集為k頻繁項(xiàng)集的元素,連接Lk-1形成k候選集,檢測候選集尋找頻繁項(xiàng)集Lk,逐層搜索迭代,由k-1項(xiàng)集搜索k項(xiàng)集。連接指當(dāng)k-1頻繁項(xiàng)集Lk-1的 兩 個 元 素Lk-1,1={I1,I2,…,Ik-2,Ik-1}和Lk-1,2={I1,I2,…,Ik-2,Ik}(Ik-1≠Ik)只 有 一 項(xiàng) 不 同時,能夠?qū)k-1,1和Lk-1,2連接形成k候選集的一個元素Ck,1={I1,I2,…,Ik-2,Ik-1,Ik},若Ck,1滿 足Smin和Cmin,則Ck,1成為k頻繁項(xiàng)集Lk中一個元素。
Apriori算法流程如圖1所示。Apriori算法流程的基本步驟如下:
圖1 Apriori算法流程圖Fig.1 Apriori algorithm flow diagram
1)輸入最小加權(quán)支持度Swmin和最小置信度Cmin;
2)第一次掃描數(shù)據(jù)庫,搜索出所有1頻繁項(xiàng)集,記為L1;
3)通過Lk-1“連接”形成候選k項(xiàng)集Ck,遍歷計(jì)算Ck中每個元素的支持度,刪除Ck中支持度小于Swmin的元素得到k頻繁項(xiàng)集Lk;
4)若Lk非空,則令K=K+1并跳轉(zhuǎn)步驟3),若Lk為空則跳轉(zhuǎn)步驟5);
5)計(jì)算所有頻繁項(xiàng)集的加權(quán)支持度,刪除Lk中加權(quán)支持度小于Swmin的頻繁項(xiàng)集,剩余的即為加權(quán)頻繁項(xiàng)集,計(jì)算置信度;
6)刪除Lk中置信度小于Cmin的加權(quán)關(guān)聯(lián)規(guī)則,剩余的加權(quán)關(guān)聯(lián)規(guī)則即為強(qiáng)加權(quán)關(guān)聯(lián)規(guī)則。
變電站生產(chǎn)管理系統(tǒng)存儲著大量二次設(shè)備的歷史缺陷數(shù)據(jù),為變電站二次設(shè)備缺陷的關(guān)聯(lián)性分析提供了數(shù)據(jù)基礎(chǔ)[13-14]。目前大部分的缺陷記錄都包含著多個類別的信息,這些信息主要可以分為以下3類。
1)出現(xiàn)缺陷的二次設(shè)備本身相關(guān)的信息,如設(shè)備名稱、編號、類別、所屬變電站、投運(yùn)時間、生產(chǎn)廠家等。
2)二次設(shè)備出現(xiàn)的缺陷相關(guān)信息,如缺陷類別、缺陷等級、缺陷部位、缺陷原因、缺陷責(zé)任等。
3)針對缺陷事件本身的發(fā)現(xiàn)、處理等流程性的信息,如缺陷發(fā)現(xiàn)時間、消缺狀態(tài)等。
其中,第3)類信息常用作缺陷的管理,對缺陷分析用處不大,從第1)類信息中提取出二次設(shè)備的生產(chǎn)廠家、設(shè)備類型,從第2)類信息中提取出缺陷發(fā)現(xiàn)時間、缺陷部位、缺陷原因、缺陷等級共6個屬性的信息作為關(guān)聯(lián)性挖掘和分析的對象[15]。
考慮二次設(shè)備的生產(chǎn)廠家和設(shè)備類型,通過分類加權(quán)對不同廠家和不同設(shè)備類型賦予權(quán)值,將有助于分析運(yùn)維檢修人員更加關(guān)注的設(shè)備類型和廠家的缺陷設(shè)備??紤]缺陷發(fā)現(xiàn)時間將有助于從時間維度分析缺陷的重要性,時間久遠(yuǎn)的缺陷已被消缺,故參考價值降低,而近期發(fā)現(xiàn)的缺陷可能并非個例,對之后的運(yùn)維檢修仍具有積極的參考意義??紤]二次設(shè)備的缺陷部位和缺陷原因并賦予不同的權(quán)值,將有助于分析運(yùn)維檢修人員更加關(guān)注的缺陷部位,發(fā)現(xiàn)設(shè)備的薄弱環(huán)節(jié)及其原因??紤]缺陷等級并對其賦予權(quán)值,有助于分析運(yùn)維檢修人員更加關(guān)注的部分重要或緊急缺陷。
二次設(shè)備的缺陷部位包括CPU板、電源板、測控裝置、液晶顯示屏等[16]。二次設(shè)備的缺陷原因包括制造不良、程序異常、接觸不良、施工不合理、產(chǎn)品設(shè)計(jì)不合理、超期服役等。二次設(shè)備的缺陷等級包括一般、重大和緊急[17]。
根據(jù)選擇的6種屬性的信息構(gòu)建項(xiàng)集H,用于表示二次設(shè)備的缺陷集,如式(7)所示。
式(7)中,F(xiàn)表示生產(chǎn)廠家,N表示設(shè)備類型,T表示缺陷發(fā)現(xiàn)時間,P表示缺陷部位,R表示缺陷原因,L表示缺陷等級。易知通過分類加權(quán)關(guān)聯(lián)規(guī)則挖掘最多可能獲得頻繁6項(xiàng)集。缺陷等級有3個,并統(tǒng)計(jì)剩余5個屬性在二次設(shè)備中的個數(shù)取和用a表示,則初始候選1項(xiàng)集共包含a項(xiàng),以此為基礎(chǔ)通過考慮加權(quán)的Apriori算法篩選加權(quán)頻繁項(xiàng)集并進(jìn)行加權(quán)關(guān)聯(lián)規(guī)則的挖掘。
層次分析法(AHP)[18]將問題根據(jù)性質(zhì)和目標(biāo)按層次分成各組成因素,再按支配關(guān)系分組成有序的遞階層次結(jié)構(gòu)。對于同一層次內(nèi)的因素,兩兩比較確定諸因素之間的相對重要性權(quán)重。AHP法的主要步驟為:1)建立層次結(jié)構(gòu);2)構(gòu)造判斷矩陣;3)權(quán)重計(jì)算;4)進(jìn)行一致性檢驗(yàn);5)確定權(quán)重。
2.2.1 建立層次結(jié)構(gòu)
根據(jù)缺陷項(xiàng)目的屬性特點(diǎn)建立缺陷項(xiàng)目層次結(jié)構(gòu)模型,目標(biāo)層即為缺陷項(xiàng)目權(quán)重,準(zhǔn)則層即為2.1節(jié)建立的二次設(shè)備缺陷數(shù)據(jù)集的6個屬性維度,指標(biāo)層即為各屬性維度對應(yīng)的各缺陷項(xiàng)目,本文主要應(yīng)用AHP法計(jì)算初始權(quán)重,因此無需考慮方案層。
2.2.2 構(gòu)造判斷矩陣
通過標(biāo)度來表示兩個因素間的重要性程度,從而構(gòu)造出判斷矩陣,已知的標(biāo)度法有1-9標(biāo)度、9/9-9/1標(biāo)度等,1-9標(biāo)度在均勻性、可記憶性、可感知性上都表現(xiàn)良好,故本文采用1-9標(biāo)度法。
針對二次設(shè)備缺陷項(xiàng)目,構(gòu)造準(zhǔn)則層各因素的比較判斷矩陣A,其元素aij表示第i個因素相對于第j個因素的比較結(jié)果,1-9標(biāo)度法和aij的含義及取值如表1所示。
表1 判斷矩陣的1-9標(biāo)度法Table 1 1-9 scale method of judgment matrix
2.2.3 權(quán)重計(jì)算
判斷矩陣A的特征向量W即為權(quán)重向量。計(jì)算步驟如下:
1)計(jì)算判斷矩陣A的每一行元素的積Mi
式(8)中,n為矩陣階數(shù)。
式(10)中,Wi即為所求的各指標(biāo)的權(quán)重。
2.2.4 一致性檢驗(yàn)
一致性通過如下步驟檢驗(yàn):
1)計(jì)算判斷矩陣A的最大特征根λmax
式(11)中,(AW)i表示向量AW的第i個分量。
2)計(jì)算一致性指標(biāo)CI(Consistency Index)
3)計(jì)算一致性比率CR(Consistency Ratio)
對于多階判斷矩陣,引入平均隨機(jī)一致性指標(biāo)RI(Random Index),RI是同階隨機(jī)判斷矩陣的一致性指標(biāo)的平均值,如表2所示。
表2 平均隨機(jī)一致性指標(biāo)RITable 2 Average random consistency index RI
一致性比率CR定義如下:
當(dāng)CR<0.10時,判斷矩陣具有可接受一致性,且一般來說,在構(gòu)造判斷矩陣時若未出現(xiàn)較大矛盾,最后的權(quán)重計(jì)算結(jié)果基本上能夠滿足一致性要求。
以某市的275條變電站二次設(shè)備缺陷數(shù)據(jù)構(gòu)造缺陷數(shù)據(jù)庫樣本,基于第2.1節(jié)中設(shè)計(jì)的二次設(shè)備缺陷模型,使用Apriori算法進(jìn)行加權(quán)頻繁項(xiàng)集發(fā)現(xiàn)以及加權(quán)關(guān)聯(lián)規(guī)則挖掘,并針對所獲得的加權(quán)關(guān)聯(lián)規(guī)則進(jìn)一步分析,以得出對實(shí)際生產(chǎn)有指導(dǎo)意義的結(jié)果。
經(jīng)統(tǒng)計(jì),在該缺陷數(shù)據(jù)庫樣本中,設(shè)備的生產(chǎn)廠家共有15家,設(shè)備類型有“母線保護(hù)”、“線路保護(hù)”、“故障錄波裝置”等共6種[19],設(shè)備的缺陷時間有“2016年”、“2017年”、“2018年”等共5年份,設(shè)備的缺陷部位有“CPU板”、“二次回路”、“充電模塊”、“電源板”、“蓄電池組”、“監(jiān)控器”等共13個,設(shè)備的缺陷原因有“插件損壞”、“接觸不良”、“施工不達(dá)標(biāo)”、“軟故障”、“自然老化”等共12種[20-22],設(shè)備的缺陷等級有一般、重大、緊急3種。
運(yùn)維檢修人員對不同類型的設(shè)備、缺陷部位等關(guān)注的程度不一樣,若對所有二次設(shè)備不區(qū)分類別和重要程度進(jìn)行維護(hù)和檢修,則會由于二次設(shè)備的復(fù)雜性帶來工作量龐大、運(yùn)檢效率低等問題,采用分類加權(quán)關(guān)聯(lián)規(guī)則挖掘可提高對與一次設(shè)備穩(wěn)定運(yùn)行息息相關(guān)的二次保護(hù)設(shè)備的關(guān)注,有助于制訂出更精確高效的運(yùn)維檢修計(jì)劃。
由2.1節(jié)所述缺陷數(shù)據(jù)樣本集包含6個屬性,每個屬性下包含有不同的缺陷項(xiàng)目,根據(jù)實(shí)際運(yùn)維檢修中的關(guān)注程度和二次設(shè)備性能評估指標(biāo)所得重要性[23-24],將各屬性下的缺陷項(xiàng)目分為3、5、6類,分別構(gòu)造判斷矩陣A,計(jì)算初始權(quán)重并進(jìn)行一致性檢驗(yàn)。
若將某屬性(如缺陷等級)下缺陷項(xiàng)目分為3類,可構(gòu)造判斷矩陣A為
經(jīng)計(jì)算和一致性檢驗(yàn)可得權(quán)重值依次為0.50、0.34、0.16,結(jié)合實(shí)際運(yùn)維檢修中的關(guān)注程度和二次設(shè)備性能狀態(tài)評估指標(biāo)對該屬性下的缺陷項(xiàng)目進(jìn)行計(jì)算賦權(quán)。
經(jīng)計(jì)算,部分缺陷項(xiàng)目的權(quán)值h如表3所示。
表3 部分缺陷項(xiàng)目權(quán)值表Table 3 Weight table of some defective items
各缺陷項(xiàng)目的權(quán)值h按照1.2節(jié)公式(5)進(jìn)行歸一化后用于計(jì)算經(jīng)Apriori算法挖掘出的頻繁項(xiàng)集的加權(quán)支持度Sw,進(jìn)而篩選出滿足Swmin的加權(quán)頻繁項(xiàng)集并尋找加權(quán)關(guān)聯(lián)規(guī)則。
在缺陷數(shù)據(jù)樣本集中,各類缺陷所占比例較小,某一種缺陷可能只有3~5條記錄,若最小支持度Smin設(shè)置過高,將導(dǎo)致丟失部分頻繁項(xiàng)集,同時若最小置信度Cmin設(shè)置過高,容易失去部分強(qiáng)關(guān)聯(lián)規(guī)則。因此,本文設(shè)置Apriori算法計(jì)算的最小支持度Smin=3.2%,Cmin=60%??紤]到權(quán)值歸一化并累加后小于1,即Swmin<Smin。一般來說,Swmin太小可能導(dǎo)致加權(quán)頻繁項(xiàng)集過多,提高挖掘的復(fù)雜度,若Swmin太大則過于接近Smin,可能導(dǎo)致丟失用戶真正關(guān)心的部分加權(quán)頻繁項(xiàng)集。當(dāng)Swmin介于(0.4~0.6)Smin之間時,分析效果較好[12]。本文設(shè)置最小加權(quán)支持度Swmin=1.7%,樣本經(jīng)過Apriori算法挖掘后得到的頻繁1項(xiàng)集為54項(xiàng),頻繁2項(xiàng)集為482項(xiàng),頻繁3項(xiàng)的為571項(xiàng),頻繁4項(xiàng)集為289項(xiàng),頻繁5項(xiàng)集為31項(xiàng),頻繁6項(xiàng)集為2項(xiàng),共挖掘出980條滿足最小置信度的強(qiáng)關(guān)聯(lián)規(guī)則。經(jīng)篩選,部分對分析二次設(shè)備缺陷比較有參考意義的加權(quán)頻繁項(xiàng)集和強(qiáng)關(guān)聯(lián)規(guī)則如表4所示。
表4 部分加權(quán)關(guān)聯(lián)規(guī)則及其加權(quán)支持度、置信度Table 4 Partially weighted association rules and their weighted support and confidence
對表4所示的部分加權(quán)關(guān)聯(lián)規(guī)則的分析如下:
1)加權(quán)關(guān)聯(lián)規(guī)則可挖掘出運(yùn)維檢修人員更加關(guān)注的設(shè)備類型、缺陷部位、缺陷原因等。由加權(quán)關(guān)聯(lián)規(guī)則1可得,當(dāng)條件為廠家A,設(shè)備類型為變壓器保護(hù)時,結(jié)論為缺陷原因是接觸不良的置信度為75%,其加權(quán)支持度略小于支持度為7.82%,而在加權(quán)關(guān)聯(lián)規(guī)則5中,當(dāng)條件為廠家C,設(shè)備類型為直流設(shè)備時,結(jié)論為缺陷原因是自然老化的置信度為66.67%,其加權(quán)支持度3.51%顯著低于支持度9.32%。原因是在實(shí)際運(yùn)維與檢修中,變壓器保護(hù)相關(guān)的二次設(shè)備更可能出現(xiàn)重大缺陷,甚至引發(fā)事故,而直流設(shè)備在變電站中常用作后備電源、照明電源、蓄電池組等,故運(yùn)維和檢修人員更關(guān)注的應(yīng)當(dāng)是跟一次設(shè)備直接相關(guān)的二次設(shè)備。通過采用加權(quán)關(guān)聯(lián)規(guī)則,在不明顯減小前者加權(quán)支持度的前提下有效縮減了后者的加權(quán)支持度,使得挖掘結(jié)果更多地呈現(xiàn)出運(yùn)維檢修人員更加關(guān)注并且對運(yùn)維檢修計(jì)劃制訂更有參考價值的部分。
2)加權(quán)關(guān)聯(lián)規(guī)則可挖掘出傳統(tǒng)關(guān)聯(lián)規(guī)則算法易忽略但對二次檢修有著重要參考意義的缺陷信息。由加權(quán)關(guān)聯(lián)規(guī)則6可得,當(dāng)條件為廠家B,缺陷部位為CPU板,缺陷等級為重大,結(jié)論為缺陷原因是插件損壞的置信度為61.54%,其支持度為3.16%。在傳統(tǒng)關(guān)聯(lián)規(guī)則挖掘中,由于支持度小于最小支持度Smin,該項(xiàng)集會被篩選掉,然而關(guān)聯(lián)規(guī)則6提供了一種重大缺陷及其缺陷部位、缺陷原因、生產(chǎn)廠家等信息,對于檢修計(jì)劃的制訂有著相當(dāng)高的參考價值。通過采用加權(quán)關(guān)聯(lián)規(guī)則,其加權(quán)支持度為2.78%,滿足最小加權(quán)支持度要求成為加權(quán)頻繁項(xiàng)集;同理在加權(quán)關(guān)聯(lián)規(guī)則8中,當(dāng)條件為線路保護(hù),通信設(shè)備,缺陷等級為重大時,結(jié)論為缺陷原因是通道異常的置信度高達(dá)100%,而其支持度為2.55%明顯小于最小支持度,在傳統(tǒng)關(guān)聯(lián)規(guī)則挖掘中會被篩選掉,而考慮加權(quán)關(guān)聯(lián)規(guī)則挖掘后其加權(quán)支持度為1.92%,該項(xiàng)集成為加權(quán)頻繁項(xiàng)集得到保留。加權(quán)關(guān)聯(lián)規(guī)則6、8表明加權(quán)關(guān)聯(lián)規(guī)則可挖掘出傳統(tǒng)關(guān)聯(lián)規(guī)則易忽略但是運(yùn)維檢修人員卻相當(dāng)關(guān)心的缺陷信息,這類重大缺陷的信息由于其出現(xiàn)的次數(shù)少易被大量缺陷數(shù)據(jù)淹沒,但其對運(yùn)維和檢修有著極高的參考價值。
3)加權(quán)關(guān)聯(lián)規(guī)則可考慮時間維度對二次設(shè)備缺陷的影響。由加權(quán)關(guān)聯(lián)規(guī)則4可知,當(dāng)條件為缺陷部位是二次回路,缺陷原因是軟故障時,結(jié)論為缺陷發(fā)現(xiàn)的時間是2020年的置信度85.71%,支持度為4.36%,加權(quán)支持度是3.82%。由加權(quán)關(guān)聯(lián)規(guī)則7可知,當(dāng)條件為缺陷部位是二次回路,缺陷原因是軟故障時,結(jié)論為缺陷發(fā)現(xiàn)時間為2016年的置信度是80%,支持度為6.84%,加權(quán)支持度為2.20%。兩者對比可知,盡管2016年二次回路由軟故障引發(fā)的缺陷支持度比2020年更高,但是由于發(fā)現(xiàn)的時間較早,運(yùn)維和檢修人員很可能已經(jīng)做出了反應(yīng),而2020年發(fā)現(xiàn)的缺陷雖然支持度低于2016年,但是其加權(quán)支持度明顯更高。這表明采用加權(quán)關(guān)聯(lián)規(guī)則挖掘,考慮時間維度的影響,通過對較近的缺陷發(fā)現(xiàn)時間賦予較高的權(quán)值,更容易挖掘出近期發(fā)現(xiàn)的缺陷,相對來說對將來的運(yùn)維和檢修任務(wù)參考價值更大。
4)加權(quán)關(guān)聯(lián)規(guī)則可根據(jù)已知條件推測出缺陷所在部位、設(shè)備發(fā)生缺陷的原因以及發(fā)現(xiàn)二次設(shè)備的家族性缺陷等。由加權(quán)關(guān)聯(lián)規(guī)則3可得,當(dāng)條件為廠家D,設(shè)備類型是故障錄波器,缺陷等級為緊急時,結(jié)論為缺陷部位是管理板的置信度高達(dá)87.50%,支持度為7.62%,加權(quán)支持度為4.04%,說明廠家D生產(chǎn)的故障錄波器的管理板易出現(xiàn)缺陷。由加權(quán)關(guān)聯(lián)規(guī)則9可得,當(dāng)條件為廠家E,設(shè)備類型為直流設(shè)備,缺陷部位是充電模塊時,結(jié)論為缺陷原因是超期服役的置信度72.49%,支持度為5.80%,加權(quán)支持度為1.78%,說明廠家E生產(chǎn)的直流設(shè)備的充電模塊已過服役年限,應(yīng)當(dāng)及時完成該類設(shè)備的更新。由加權(quán)關(guān)聯(lián)規(guī)則2可得,當(dāng)條件為廠家A,缺陷部位為電源板時,結(jié)論為缺陷原因是制造不良的置信度高達(dá)92.18%,說明廠家A生產(chǎn)的二次設(shè)備的電源板存在家族性缺陷,原因是制造不良,應(yīng)當(dāng)告知廠家A提高其電源板的生產(chǎn)工藝。
本文所提方法與傳統(tǒng)關(guān)聯(lián)規(guī)則挖掘?qū)Ρ热绫?所示。
表5 與傳統(tǒng)關(guān)聯(lián)規(guī)則挖掘的比較Table 5 Comparison with traditional association rule mining
本文使用基于AHP的分類加權(quán)關(guān)聯(lián)規(guī)則對二次設(shè)備的缺陷進(jìn)行數(shù)據(jù)挖掘與分析,以某市的二次設(shè)備缺陷數(shù)據(jù)為樣本,將該方法應(yīng)用到缺陷數(shù)據(jù)挖掘和分析中,通過算例分析得到如下結(jié)論:
1)分類加權(quán)關(guān)聯(lián)規(guī)則可從缺陷數(shù)據(jù)中挖掘出運(yùn)維檢修人員更加關(guān)注的設(shè)備類型、缺陷部位、缺陷原因等信息。
2)分類加權(quán)關(guān)聯(lián)規(guī)則可從缺陷數(shù)據(jù)中挖掘出傳統(tǒng)關(guān)聯(lián)規(guī)則算法易忽略但對二次檢修有重要參考意義的缺陷信息。
3)分類加權(quán)關(guān)聯(lián)規(guī)則可考慮時間維度對二次設(shè)備缺陷的影響,幫助工作人員制訂更加精確和高效的運(yùn)維和檢修計(jì)劃。
4)分類加權(quán)關(guān)聯(lián)規(guī)則可根據(jù)已知條件推測出二次設(shè)備缺陷所在的部位、設(shè)備發(fā)生缺陷的原因以及發(fā)現(xiàn)二次設(shè)備的家族性缺陷等。
盡管在權(quán)重計(jì)算中考慮到了二次設(shè)備的性能和狀態(tài)評估等指標(biāo),仍然無法避免AHP法在主客觀結(jié)合時產(chǎn)生誤差的可能,后續(xù)研究重點(diǎn)將放在對缺陷項(xiàng)目權(quán)重的計(jì)算上,以期能夠挖掘出更加精確的對提高二次設(shè)備運(yùn)維和管控水平更具參考價值的結(jié)論。