徐嚴(yán)軍,吳 蒙,白佳靈,丁熠輝,謝 智,盧 宏,肖先勇
(1.國(guó)網(wǎng)四川省電力公司計(jì)量中心,四川 成都 610045; 2.四川大學(xué)電氣工程學(xué)院,四川 成都 610065)
關(guān)口計(jì)量裝置是購售電雙方進(jìn)行貿(mào)易決算的重要設(shè)備,計(jì)量的準(zhǔn)確性和可靠性直接影響著貿(mào)易決算的公平性。計(jì)量裝置的異常狀態(tài)會(huì)導(dǎo)致售電公司存在大量資產(chǎn)流失的風(fēng)險(xiǎn)[1-2]。目前對(duì)關(guān)口計(jì)量裝置運(yùn)行狀態(tài)的評(píng)價(jià)主要依靠檢修人員定期到現(xiàn)場(chǎng)對(duì)裝置進(jìn)行檢修,造成人力和物力的嚴(yán)重浪費(fèi)[3-4]。由于裝置的異常運(yùn)行狀態(tài)會(huì)與計(jì)量過程中出現(xiàn)的一系列異常事件有關(guān),這些異常事件的數(shù)據(jù)可以通過用戶用電采集系統(tǒng)獲得[5-7]。因此,基于用戶用電采集系統(tǒng)的數(shù)據(jù),研究關(guān)口計(jì)量裝置的異常事件識(shí)別方法,可以為異常運(yùn)行狀態(tài)的快速準(zhǔn)確診斷提供依據(jù),對(duì)保證貿(mào)易決算的公平性具有重要的意義。
針對(duì)目前對(duì)關(guān)口計(jì)量裝置進(jìn)行周期性校驗(yàn)存在的不足,國(guó)家電網(wǎng)公司[8]在2016年構(gòu)建了用于電能表狀態(tài)評(píng)價(jià)的狀態(tài)量,并利用層次分析法對(duì)各狀態(tài)量進(jìn)行了賦權(quán),但這種方法僅采用離線數(shù)據(jù)進(jìn)行驗(yàn)證,缺少時(shí)效性。文獻(xiàn)[9]利用在線監(jiān)測(cè)數(shù)據(jù)和現(xiàn)場(chǎng)校驗(yàn)數(shù)據(jù),采用多層次模糊評(píng)價(jià)法對(duì)指標(biāo)進(jìn)行賦權(quán),實(shí)現(xiàn)對(duì)計(jì)量裝置運(yùn)行狀態(tài)的評(píng)價(jià),同時(shí)還采用了云自適應(yīng)粒子群優(yōu)化算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型,對(duì)其未來運(yùn)行狀態(tài)進(jìn)行了預(yù)測(cè)。文獻(xiàn)[10]提出了灰色關(guān)聯(lián)度與熵權(quán)理論組合的智能電表綜合評(píng)價(jià)方法。文獻(xiàn)[11]將泛在電力物聯(lián)網(wǎng)運(yùn)用到智能電表的狀態(tài)評(píng)估中。文獻(xiàn)[12]提出了一種CRITIC法和理想點(diǎn)法相結(jié)合的計(jì)量設(shè)備運(yùn)行質(zhì)量評(píng)估方法。文獻(xiàn)[13]提出了一種基于信息融合的電能表運(yùn)行狀態(tài)評(píng)價(jià)方法,考慮了電能表可靠度和計(jì)量異常等因素,并采用熵值法對(duì)選擇的指標(biāo)進(jìn)行賦權(quán),最后結(jié)合地區(qū)影響因素實(shí)現(xiàn)了對(duì)電能表的動(dòng)態(tài)狀態(tài)評(píng)價(jià)。
但上述文獻(xiàn)中的方法大多以選擇與計(jì)量裝置運(yùn)行狀態(tài)有關(guān)的指標(biāo),并對(duì)選擇出的指標(biāo)進(jìn)行簡(jiǎn)單賦權(quán)為主,狀態(tài)評(píng)價(jià)結(jié)果的有效性主要依賴于所選指標(biāo)的準(zhǔn)確性,指標(biāo)權(quán)重選擇受人工干預(yù),指標(biāo)有效性和評(píng)價(jià)結(jié)果均難以有效驗(yàn)證。由于異常事件的監(jiān)測(cè)數(shù)據(jù)中含有大量與設(shè)備運(yùn)行狀態(tài)有關(guān)的信息,從監(jiān)測(cè)數(shù)據(jù)中可提取反映計(jì)量裝置狀態(tài)的相關(guān)特征,并構(gòu)建特征到運(yùn)行狀態(tài)的映射模型。因此,本文提出了一種多特征提取與深度學(xué)習(xí)相結(jié)合的關(guān)口計(jì)量裝置異常事件識(shí)別方法,利用深度學(xué)習(xí)方法構(gòu)建異常事件特征與設(shè)備狀態(tài)的映射關(guān)系,并對(duì)所提方法進(jìn)行了驗(yàn)證。
關(guān)口計(jì)量裝置主要由安裝在關(guān)口處的電能表、電流互感器、電壓互感器和二次回路組成,在計(jì)量過程中會(huì)出現(xiàn)不同類型的異常事件。異常事件的運(yùn)行數(shù)據(jù)包含了電網(wǎng)中的重要信息,如設(shè)備故障、負(fù)荷異常和人為竊電等情況,極大地影響計(jì)量的有效性和準(zhǔn)確性[14-16]。因此,有必要對(duì)關(guān)口計(jì)量裝置異常事件的類型和原因進(jìn)行分析。關(guān)口計(jì)量裝置異常事件的類型主要包括電量異常、電壓電流異常、時(shí)鐘異常和接線異常等,如圖1所示。
圖1 關(guān)口計(jì)量裝置常見異常事件類型
導(dǎo)致圖1中異常事件的原因眾多,主要可分為:
1)關(guān)口計(jì)量裝置故障
關(guān)口計(jì)量裝置組成元件眾多,由于裝置質(zhì)量和現(xiàn)場(chǎng)安裝工藝,裝置會(huì)存在一定的缺陷。在長(zhǎng)時(shí)間運(yùn)行后,可能出現(xiàn)故障,引起計(jì)量數(shù)據(jù)出現(xiàn)異常,隨著時(shí)間的增加,計(jì)量的誤差逐漸增大,影響計(jì)量準(zhǔn)確性和用戶滿意度。
2)人為竊電
人為竊電是造成計(jì)量數(shù)據(jù)異常的主要原因,用戶通過擅自篡改電能表接線方式,造成電能表慢走或停走,極大地?fù)p害了電網(wǎng)企業(yè)的利益。
3)終端故障
關(guān)口計(jì)量裝置的終端在長(zhǎng)時(shí)間運(yùn)行后可能會(huì)出現(xiàn)黑屏和軟件故障等問題,引起電能表的時(shí)鐘異常。若時(shí)鐘出現(xiàn)異常將導(dǎo)致計(jì)量的數(shù)據(jù)與當(dāng)前的時(shí)刻不匹配,會(huì)影響電網(wǎng)對(duì)當(dāng)前時(shí)刻用戶用電的評(píng)估。
異常事件的數(shù)據(jù)包含了關(guān)口計(jì)量裝置運(yùn)行狀態(tài)的重要信息,從監(jiān)測(cè)數(shù)據(jù)中提取相關(guān)特征是進(jìn)行計(jì)量裝置運(yùn)行狀態(tài)辨識(shí)的必要條件。通過第1節(jié)對(duì)計(jì)量異常事件的分析可知,這些異常事件的相關(guān)特征都會(huì)反映在監(jiān)測(cè)數(shù)據(jù)中,并呈現(xiàn)出不同的數(shù)據(jù)形式。如果關(guān)口計(jì)量裝置在一段時(shí)間內(nèi)重復(fù)發(fā)生這些異常中的一種或者幾種,會(huì)極大地影響裝置的壽命及計(jì)量準(zhǔn)確性。因此,有必要對(duì)用電采集系統(tǒng)中采集到的常見異常事件的運(yùn)行數(shù)據(jù)進(jìn)行分析。本文以異常事件的產(chǎn)生機(jī)理和數(shù)據(jù)呈現(xiàn)形式為基礎(chǔ),提取了不同異常事件的特征。
2.1.1 電量異常
電能表示值不平是指電能表的總電能示值與各費(fèi)率電能示值之和不等。采用日正向有功總電量與日峰、平和谷段各個(gè)費(fèi)率的總電能的差值來表征該異常事件的特征,計(jì)算公式為:
式中:P1——日正向-有功總電量;
A1、A2和A3——日峰、平和谷不同費(fèi)率段的電量。
電能表飛走是指電能表示值出現(xiàn)快速增加的情況。采用日正向有功總電量與對(duì)應(yīng)參考值的比值來判斷電能表示值是否快速增加,計(jì)算公式為:
其中P1_ref為日正向有功總電量參考值。
電能表倒走是指電能表示值出現(xiàn)下降的情況。采用連續(xù)兩日正向有功總電量的差值來判斷電能表示值是否出現(xiàn)了下降,計(jì)算公式為:
其中P1_bef為前一天記錄的日用戶正向有功總電量。
電能表停走是指非電廠用戶出現(xiàn)了電能表示值不變化的情況。此時(shí)可能是由于人為竊電引起的,在人為竊電時(shí)會(huì)出現(xiàn)反向有功電量,且每日的反向有功電量和日線損率都會(huì)逐漸增加,因此采用連續(xù)兩日反向有功電量的差值和連續(xù)兩日線損率差值來綜合表征該異常事件的特征,計(jì)算公式為:
式中:P2——日反向有功總電量;
P2_bef——前一天記錄的日用戶反向有功總電量;
ζ1和ζbef——當(dāng)日線損率和前一天的線損率。
電能表自動(dòng)核抄異常是指電能表的示值與主站保存的值不一致。采用日凍結(jié)的正向有功總電量與主站保存值的差值來表征該異常事件的特征,計(jì)算公式為:
其中P1_site為主站保存的日正向有功總電量。
2.1.2 電壓電流異常
電壓失壓是指出現(xiàn)某相電壓降低及電流增加的情況。采用某相電壓與正常運(yùn)行時(shí)電壓的差值,及該相電流與電能表啟動(dòng)電流的差值,綜合表征該異常事件的特征,計(jì)算公式為:
式中:uj——電壓(j=a,b,c);
ij——電流;
ist——電能表的啟動(dòng)電流;
unormal——正常運(yùn)行時(shí)的電壓值。
電壓斷相是指出現(xiàn)某相電壓明顯降低及電流下降的情況。由于電壓斷相與電壓失壓相比,電壓下降更明顯,因此采用某相電壓與電壓的下限閾值差值,及該相電流與電能表啟動(dòng)電流的差值,綜合表征該異常事件的特征,計(jì)算公式為:
其中ulower為電壓的下限閾值。
電壓越限是指電壓超過設(shè)置的上限或下限閾值。采用各相電壓與正常運(yùn)行時(shí)電壓值的差值來表征該異常事件的特征,計(jì)算公式為:
電壓不平衡是指排除電壓失壓和斷相情況下,三相電壓中出現(xiàn)不平衡的情況。采用三相中最大電壓和最小電壓的差值來表征該異常事件的特征,計(jì)算公式為:
其中ujmax和ujmin分別表示三相電壓的最大值和最小值。
電流失流指三相電流中任一相或兩相小于啟動(dòng)電流。采用三相電流與電能表啟動(dòng)電流的差值來表征該異常事件的特征,計(jì)算公式為:
電流不平衡是指排除電流失流情況下,三相電流出現(xiàn)不平衡的情況。采用最大電流與最小電流的差值來表征該異常事件的特征,計(jì)算公式為:
其中ijmax和ijmin分別表示三相電流的最大值和最小值。
2.1.3 時(shí)鐘異常
時(shí)鐘異常是指計(jì)量裝置的時(shí)鐘與標(biāo)準(zhǔn)時(shí)鐘的誤差過大。采用電能表時(shí)鐘與標(biāo)準(zhǔn)時(shí)鐘之間的差值來表征該異常事件的特征,如下式所示:
其中t1和tnormal分別表示電能表時(shí)鐘和標(biāo)準(zhǔn)時(shí)鐘的值。
2.1.4 接線異常
計(jì)量回路接線異常也可能引起反向電量異常。與電能表停走中由于人為竊電引起的反向電量異常相比較,此時(shí)的日線損率不會(huì)增加,因此采用日反向電量和連續(xù)兩日線損率差值來表征反向電量異常的特征,計(jì)算公式為:
潮流反向是指在計(jì)量過程中線路反接,造成采集到的值與真實(shí)值符號(hào)相反。采用三相電流來表征潮流反向的特征,計(jì)算公式為:
通過前面的分析,將不同的特征組合成向量的形式,可以得到關(guān)口計(jì)量裝置的初始特征向量X:
由于X中的數(shù)據(jù)可能出現(xiàn)量綱不統(tǒng)一的問題,會(huì)影響后續(xù)識(shí)別的準(zhǔn)確性,因此需要對(duì)X中的數(shù)據(jù)進(jìn)行歸一化處理。本文采用的方法是最大-最小值法,對(duì)應(yīng)公式如下:
式中:Xi_nor——特征Xi經(jīng)過歸一化的數(shù)據(jù);
Xi_max和Xi_min——特征Xi的最大值和最小值。
由于特征之間存在一定的冗余性,不利于準(zhǔn)確識(shí)別出異常事件,在特征內(nèi)部還可能存在一系列更能與異常事件的類型相對(duì)應(yīng)的隱藏特征。因此,需要從這些特征中進(jìn)一步提取出更深層的特征,提高識(shí)別的效率和準(zhǔn)確性??紤]關(guān)口計(jì)量裝置監(jiān)測(cè)數(shù)據(jù)量大的特點(diǎn),傳統(tǒng)數(shù)據(jù)挖掘方法不能有效地分析數(shù)據(jù)中隱藏的信息。深度學(xué)習(xí)方法是一種包含一個(gè)輸入層、多個(gè)隱藏層和一個(gè)輸出層的多層網(wǎng)絡(luò),它能夠自動(dòng)學(xué)習(xí)得到輸入數(shù)據(jù)中的非線性特征表達(dá),建立輸出層與輸入層的映射關(guān)系,從而實(shí)現(xiàn)對(duì)數(shù)據(jù)的準(zhǔn)確識(shí)別[17-18]。因此本文提出了基于多特征提取與深度學(xué)習(xí)的關(guān)口計(jì)量裝置異常事件識(shí)別方法,其中采用SAE作為深度學(xué)習(xí)模型,提取輸入數(shù)據(jù)的深層特征。
自動(dòng)編碼器(auto-encoder,AE)是組成SAE的基本單元,由一個(gè)輸入層、一個(gè)隱藏層和一個(gè)輸出層組成,如圖2所示。AE的訓(xùn)練結(jié)果由編碼和解碼獲得,對(duì)應(yīng)的公式如下所示:
圖2 自動(dòng)編碼器模型
式中:X——輸入數(shù)據(jù),含有m個(gè)神經(jīng)元;
Y——經(jīng)過編碼獲得的特征表達(dá),含有n個(gè)神經(jīng)元;
Z——經(jīng)過解碼過程獲得的數(shù)據(jù),與X一樣具有m個(gè)神經(jīng)元;
f1和f2——激活函數(shù);
W1和W2——編碼和解碼矩陣;
b1和b2——偏置向量。
AE的訓(xùn)練目標(biāo)是使解碼后的數(shù)據(jù)Z近可能與輸入數(shù)據(jù)X相近,即隱藏層的特征Y就可以代表X的特征,實(shí)現(xiàn)對(duì)輸入數(shù)據(jù)特征的自動(dòng)提取。但由于單個(gè)AE不能充分地挖掘出異常事件數(shù)據(jù)中的隱藏特征,因此需要通過堆疊多個(gè)AE形成SAE模型。利用SAE強(qiáng)大的特征提取能力,對(duì)關(guān)口計(jì)量裝置不同異常事件的數(shù)據(jù)進(jìn)行學(xué)習(xí),逐層提取輸入數(shù)據(jù)的隱藏特征,提取的隱藏特征更能代表輸入數(shù)據(jù)的類型,最終得到能夠準(zhǔn)確識(shí)別不同異常事件的網(wǎng)絡(luò)模型。
本文提出了基于多特征提取和SAE的異常事件識(shí)別方法,流程如圖3所示。通過對(duì)在線監(jiān)測(cè)數(shù)據(jù)的分析與處理,實(shí)現(xiàn)對(duì)關(guān)口計(jì)量裝置異常事件的識(shí)別,包括電量異常、電壓電流異常、時(shí)鐘異常、接線異常和正常情況。詳細(xì)步驟如下:
圖3 所提方法的流程圖
1)基于用電采集系統(tǒng)記錄到的三相電壓、電流和功率等數(shù)據(jù),分析關(guān)口計(jì)量裝置常見的異常事件,并對(duì)異常事件的特征進(jìn)行提取。然后將提取到的特征集利用式(16)進(jìn)行歸一化處理,并將不同異常事件的數(shù)據(jù)標(biāo)簽化。
2)將歸一化的數(shù)據(jù)按照3∶1的比例分為訓(xùn)練集和測(cè)試集。其中訓(xùn)練集作為SAE的輸入,通過SAE強(qiáng)大的特征提取能力,挖掘輸入數(shù)據(jù)中的隱藏特征,構(gòu)建異常事件識(shí)別模型,從而提高異常事件識(shí)別的準(zhǔn)確性。
本文構(gòu)建的SAE模型由一個(gè)輸入層、多個(gè)隱藏層和一個(gè)輸出層構(gòu)成。SAE將第一個(gè)AE的隱藏層作為整個(gè)網(wǎng)絡(luò)的第一個(gè)隱藏層,第二個(gè)AE的隱藏層作為第二個(gè)隱藏層,依次類推,最后獲得整個(gè)SAE模型[19]。圖4表示由兩個(gè)AE堆疊形成的SAE結(jié)構(gòu)圖。
圖4 堆疊自動(dòng)編碼器模型
SAE首先通過無監(jiān)督學(xué)習(xí)預(yù)訓(xùn)練整個(gè)網(wǎng)絡(luò),然后通過有監(jiān)督學(xué)習(xí)微調(diào)網(wǎng)絡(luò)參數(shù),實(shí)現(xiàn)對(duì)深層特征的提取。通常采用均方誤差來構(gòu)造代價(jià)函數(shù)L(W,b),采用最小化代價(jià)函數(shù)使構(gòu)建的模型能夠最大化提取輸入數(shù)據(jù)的特征,減小訓(xùn)練誤差,提高模型的準(zhǔn)確性。
式中:λ——稀疏懲罰性參數(shù);
KL(·)——KL 散度;
ρ——設(shè)置的一個(gè)接近為0的量;
通過調(diào)整網(wǎng)絡(luò)參數(shù)W和b來最小化代價(jià)函數(shù),減少模型的訓(xùn)練誤差[20]。對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)更新公式如下所示:
式中:β——參數(shù)更新時(shí)的學(xué)習(xí)率;
Wij(l+1)和Wij(l)——第l+1、l層的權(quán)重參數(shù);
bij(l+1)和bij(l)——第l+1、l層的偏置參數(shù)。
3)將測(cè)試數(shù)據(jù)輸入到訓(xùn)練完成的異常事件識(shí)別模型中,得到異常事件識(shí)別結(jié)果,最后采用4.2節(jié)所示的評(píng)估指標(biāo)對(duì)所提方法的識(shí)別性能進(jìn)行評(píng)估。
本文分析的數(shù)據(jù)來自于某地區(qū)電網(wǎng)8個(gè)關(guān)口計(jì)量裝置終端的采集數(shù)據(jù),數(shù)據(jù)包括正常計(jì)量裝置和異常計(jì)量裝置記錄的數(shù)據(jù)。監(jiān)測(cè)數(shù)據(jù)的時(shí)間尺度為1年,每15 min采集1個(gè)點(diǎn)。數(shù)據(jù)類型包括三相電流、電壓、正反向有功和無功電能、峰平谷相加的總電能等。
其中每個(gè)關(guān)口計(jì)量裝置分別選擇了240個(gè)故障樣本,包含了電量異常、電壓電流異常、時(shí)鐘異常和接線異常,每種故障類型的樣本為60個(gè)。為了將不同的故障類型樣本與正常運(yùn)行的樣本進(jìn)行區(qū)分,還選擇了每個(gè)關(guān)口計(jì)量裝置的60個(gè)正常運(yùn)行樣本。最后每種類型一共480個(gè)樣本,合計(jì)2 400個(gè)樣本。每種類型中的360個(gè)樣本用于訓(xùn)練構(gòu)造SAE模型,剩下的120個(gè)樣本用于測(cè)試模型的識(shí)別性能。詳細(xì)的樣本信息如表1所示。
表1 樣本信息
為了評(píng)估本文所提方法的性能,采用的評(píng)估指標(biāo)包括準(zhǔn)確率(Acc)、F1值和馬修斯相關(guān)系數(shù)(Matthews correlation coefficient,MCC)。其中 Acc為所提方法識(shí)別異常事件的準(zhǔn)確率,表示識(shí)別正確樣本占總體樣本的比例。由于單一的指標(biāo)并不能準(zhǔn)確評(píng)估所提方法的性能,為了全面評(píng)估所提方法的性能,還采用了分類性能評(píng)估中常用的指標(biāo)F1值和MCC值。F1值表示識(shí)別精確率和召回率的調(diào)和平均值,MCC值綜合考慮了樣本數(shù)據(jù)可能出現(xiàn)不平衡的情況,實(shí)現(xiàn)對(duì)每種類別識(shí)別結(jié)果的詳細(xì)統(tǒng)計(jì)分析,MCC值越靠近1,證明識(shí)別效果越好,能夠準(zhǔn)確衡量所提方法的識(shí)別穩(wěn)健性,相關(guān)的計(jì)算公式見參考文獻(xiàn)[21]和[22]。
將提取的特征進(jìn)行歸一化處理后輸入到SAE中,并按照3∶1的比例將歸一化后的數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)。首先分析異常事件與正常運(yùn)行情況的識(shí)別結(jié)果,詳細(xì)的結(jié)果如表2所示。其中,以異常事件為正類,正常情況為負(fù)類。則TP表示將正類識(shí)別為正類的樣本總數(shù)量,TN表示將負(fù)類識(shí)別為負(fù)類的樣本總數(shù)量,F(xiàn)P表示將負(fù)類識(shí)別為正類的樣本總數(shù)量,F(xiàn)N表示將正類識(shí)別為負(fù)類的樣本總數(shù)量。
表2 異常事件與正常情況的識(shí)別結(jié)果
可以看出,本文方法的Acc、F1值和MCC值分別為97.17%、98.20%和91.80%,能夠從多種正常運(yùn)行情況和異常事件中準(zhǔn)確識(shí)別出異常事件,為檢修人員對(duì)關(guān)口計(jì)量裝置的異常事件及時(shí)處理提供了決策支持,提高了計(jì)量的經(jīng)濟(jì)性與準(zhǔn)確性。
為了進(jìn)一步分析所提方法的詳細(xì)識(shí)別結(jié)果,還對(duì)每一類異常事件的識(shí)別情況進(jìn)行了分析,獲得的結(jié)果如表3所示。由表可知,本文所提方法不僅能夠從在線監(jiān)測(cè)數(shù)據(jù)中準(zhǔn)確識(shí)別出異常事件,同時(shí)還能識(shí)別出異常事件的類型。識(shí)別電量異常的評(píng)估指標(biāo):Acc、F1值和 MCC值分別為 95.83%、96.64%和98.80%;識(shí)別接線異常的評(píng)估指標(biāo),有5個(gè)樣本被錯(cuò)誤分類為接線異常情況,證明了這兩種異常事件的數(shù)據(jù)可能出現(xiàn)混淆的情況,后續(xù)可以通過進(jìn)一步增加對(duì)應(yīng)的判據(jù),實(shí)現(xiàn)對(duì)這兩種類型的準(zhǔn)確區(qū)分。同時(shí),識(shí)別正常情況的評(píng)估指標(biāo):Acc、F1值和MCC值分別為99.17%、99.58%和99.48%,僅有1個(gè)樣本被錯(cuò)誤分類為電量異常,防止了在實(shí)際情況中出現(xiàn)錯(cuò)誤識(shí)別的問題,提高了識(shí)別的準(zhǔn)確性。
表3 不同異常事件的識(shí)別結(jié)果
在識(shí)別出異常事件的類型后,檢修人員可有針對(duì)性地對(duì)出現(xiàn)異常的計(jì)量裝置做進(jìn)一步的校驗(yàn),提高了工作的效率和準(zhǔn)確性,更有利于構(gòu)建關(guān)口計(jì)量裝置的智慧評(píng)價(jià)體系。
將本文所提方法與K近鄰(K-nearest neighbor,KNN)、決策樹(decision tree,DT)、支持向量機(jī)(support vector machine,SVM)、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)進(jìn)行比較,分析的數(shù)據(jù)都為經(jīng)過多特征提取并進(jìn)行歸一化的數(shù)據(jù),并將歸一化后的數(shù)據(jù)輸入到不同分類方法的模型中,得到不同方法的識(shí)別結(jié)果,如表4所示。
表4 與其他方法的識(shí)別結(jié)果比較
由表可知,本文所提方法的評(píng)估指標(biāo)比其他4種方法都更高。其中SVM相比KNN和DT方法的識(shí)別性能更好,Acc、F1值和 MCC值分別為91.83%、95.07%和83.08%,KNN的識(shí)別性能最差,Acc、F1值和 MCC值分別為 70.00%、79.64%和65.26%。而KNN和DT法相比于其他方法識(shí)別性能指標(biāo)的值更低,主要原因是因?yàn)镵NN僅利用常見的距離計(jì)算公式來衡量不同異常事件的類別界限,對(duì)于異常事件中存在大量相似數(shù)據(jù)的情況下,就會(huì)造成識(shí)別性能低。DT在訓(xùn)練過程中會(huì)出現(xiàn)過擬合問題,同樣會(huì)造成識(shí)別性能劣于其他方法。CNN相比其他3種傳統(tǒng)的分類方法的性能更好,主要原因是CNN也能逐層提取輸入數(shù)據(jù)的特征,其特征識(shí)別性更強(qiáng),但Acc、F1值和MCC值分別比所提方法低2.67%、1.72%和7.31%。主要原因是CNN多適用于對(duì)二維圖像的處理,在處理異常事件的特征時(shí),可能出現(xiàn)過擬合的問題,降低識(shí)別性能。
本文所提方法采用深度學(xué)習(xí)中的SAE模型,相比于基于KNN、DT、SVM和CNN的分類方法,SAE模型不僅能夠逐層提取輸入數(shù)據(jù)的特征表達(dá),實(shí)現(xiàn)對(duì)數(shù)據(jù)與標(biāo)簽之間非線性映射關(guān)系的提取,得到數(shù)據(jù)中隱藏的特征,而且訓(xùn)練過程中添加的稀疏懲罰性參數(shù)能夠防止模型出現(xiàn)過擬合,提高模型的魯棒性。通過SAE模型自動(dòng)學(xué)習(xí)得到的不同異常事件類別的隱藏特征聚集度更高、識(shí)別性更強(qiáng),更有利于從多種事件中準(zhǔn)確識(shí)別出異常事件,證明了本文方法的準(zhǔn)確性和可行性。
針對(duì)目前對(duì)關(guān)口計(jì)量裝置進(jìn)行定期檢修和通過對(duì)狀態(tài)評(píng)估指標(biāo)進(jìn)行賦權(quán)的不足,本文提出了一種基于多特征提取與深度學(xué)習(xí)的關(guān)口計(jì)量裝置異常事件識(shí)別方法,獲得的主要結(jié)論有:
1)通過分析不同異常事件的產(chǎn)生機(jī)理,并基于不同異常事件的數(shù)據(jù)呈現(xiàn)形式,提取了對(duì)應(yīng)的特征,這些特征與異常事件的類型有關(guān),有利于后續(xù)構(gòu)建準(zhǔn)確的識(shí)別模型。
2)在提取不同異常事件的特征后,采用深度學(xué)習(xí)方法中的SAE模型,利用該模型強(qiáng)大的特征提取能力,獲得能夠準(zhǔn)確識(shí)別異常事件類型的智能模型。結(jié)果表明,所提方法的性能評(píng)估指標(biāo)比KNN、DT、SVM和CNN更優(yōu),魯棒性更好。
本文提出的計(jì)量裝置異常事件識(shí)別模型在每個(gè)事件單獨(dú)出現(xiàn)時(shí),識(shí)別準(zhǔn)確率高。但在實(shí)際情況中可能有多類型異常事件同時(shí)出現(xiàn)的情況,此時(shí)就需要研究復(fù)合異常事件下的數(shù)據(jù)表現(xiàn)形式,并提出對(duì)應(yīng)的識(shí)別方法,后續(xù)將會(huì)做進(jìn)一步的研究。