張英,徐龍舞,*,王明偉,劉喆,張倩,潘云
(1.貴州電網(wǎng)有限責任公司電力科學(xué)研究院,貴州 貴陽 550002;2.貴州大學(xué),貴州 貴陽 550025;3.貴州電網(wǎng)有限責任公司凱里供電局,貴州 凱里 556000)
油浸式變壓器在電力系統(tǒng)中擔任著重要的輸配電功能,其安全穩(wěn)定運行關(guān)乎著電力系統(tǒng)的安全穩(wěn)定。然而,系統(tǒng)中運行的變壓器難免存在各種潛伏性故障,主要分為過熱故障及放電故障[1-2]。油浸式變壓器在過熱及放電下,變壓器油及變壓器內(nèi)部絕緣物質(zhì)發(fā)生分解,釋放出表征設(shè)備運行狀況的特征氣體。針對變壓器故障狀態(tài)不同,其特征氣體的產(chǎn)氣速率、組分以及含量信息也有區(qū)別,研究其氣體信息可實現(xiàn)變壓器的故障診斷。然而,從大量油中溶解氣體組分(DGA)數(shù)據(jù)分析可知,特征氣體信息與變壓器故障類型,故障程度間為復(fù)雜的關(guān)聯(lián)關(guān)系,從而給基于變壓器油中溶解氣體的變壓器故障判斷工作帶來了困難,本文將對經(jīng)典方法、智能算法等進行簡要分析,從而為DGA數(shù)據(jù)分析方向提供一些建議。
利用變壓器油中溶解氣體分析變壓器故障的工作起始于19世紀60年代,隨著大量研究的開展,變壓器油中溶解氣體分析變壓器故障的工作取得了一系列的成效。國際電工委員會在熱力動力學(xué)基礎(chǔ)及大量的實踐基礎(chǔ)上,相繼推薦IEC三比值法和改良三比值法分析充油變壓器內(nèi)部故障;德國發(fā)展的四比值法較三比值法而言,加入了C2H6與CH4氣體組分的比值,四比值法對過熱類的鐵芯接地故障判斷最有效;我國推薦的三比值法是基于我國的研究經(jīng)驗以及IEC標準所制定。在實踐中,這些方法的可行性都被有力地證實[3];然而在實踐中,該方法存在一定缺陷,三比值法存在編碼不足問題,使得超出編碼邊界的故障無法判斷,從而影響其判斷的準確性[4]?;谥悄芩惴ǖ淖儔浩鞴收显\斷研究應(yīng)需而生。
19世紀90年代以來,為克服傳統(tǒng)方法的缺陷,以新方法新思路解決問題。典型的方法有專家系統(tǒng)[5],模糊理論[6],機器學(xué)習(xí)[7]等。
專家系統(tǒng)模擬了專家基于自身知識進行推理的過程,國外應(yīng)用專家系統(tǒng)大多只針對色譜分析數(shù)據(jù)的單項診斷,而我國的專家系統(tǒng)充分整合了變壓器的色譜分析數(shù)據(jù)以及預(yù)防性試驗所得的歷史性數(shù)據(jù)。知識庫和推理機是專家系統(tǒng)的主要部分。知識庫獲取是專家系統(tǒng)中的重點難點問題,研究者在該方面做了大量研究,常規(guī)表示知識的方式有產(chǎn)生式規(guī)則、框架式表示方法、面向?qū)ο蟮谋硎痉椒ǖ取4送?,知識庫的模塊化形式設(shè)計有利于整合變壓器內(nèi)外部的特征,嵌入其他故障診斷方法,建立多指標判斷方法[8]。而推理機則基于豐富的知識庫信息進行正向或方向鏈推理。
由于變壓器故障原因與故障現(xiàn)象之間的映射關(guān)系復(fù)雜,各故障原因之間又存在模糊不確定性,而傳統(tǒng)的三比值法采用的比值區(qū)間過于絕對,導(dǎo)致使用三比值等傳統(tǒng)方法診斷時,對處于區(qū)間邊界的數(shù)據(jù)易發(fā)生誤判。利用模糊理論對變壓器油中溶解氣體數(shù)據(jù)進行模糊化處理,將故障現(xiàn)象作為模糊輸入,故障原因作為模糊輸出,建立變壓器故障診斷模糊系統(tǒng),能夠有效提高診斷效果。
正是由于故障現(xiàn)象與故障原因之間的不確定性,模糊理論作為解決不確定性問題的有力工具,可用于變壓器的故障診斷。文獻[9]利用模糊理論處理了DGA,電氣試驗及絕緣油特性試驗組成的多源參數(shù),但在隸屬度的選擇存在主觀性,導(dǎo)致實現(xiàn)結(jié)果存在一定局限。在模糊理論中,隸屬函數(shù)的選擇直接影響著模糊模型的準確度,而隸屬度的選擇仍是困擾研究者的關(guān)鍵問題。近年來,研究者在這方面也做了大量工作,然而所選擇的隸屬函數(shù)都存在一定的局限。因此,隸屬函數(shù)的選擇將仍然是近幾年的研究熱點之一。
隨著人工智能的興起,機器學(xué)習(xí)在故障診斷,行為預(yù)測,智能識別等領(lǐng)域發(fā)揮著巨大的作用。機器學(xué)習(xí)在變壓器故障診斷中的應(yīng)用較早,且占據(jù)了一定比重。機器學(xué)習(xí)按照監(jiān)督方式可分為監(jiān)督學(xué)習(xí),無監(jiān)督學(xué)習(xí),半監(jiān)督學(xué)習(xí)。傳統(tǒng)采用監(jiān)督學(xué)習(xí)機制診斷變壓器故障的有神經(jīng)網(wǎng)絡(luò),決策樹,支持向量機等,無監(jiān)督學(xué)習(xí)有聚類和主成分分析(PCA),以及半監(jiān)督學(xué)習(xí)有協(xié)同學(xué)習(xí)(Co-Training),三訓(xùn)練算法(Tri-Training)。
早些年的機器學(xué)習(xí)模型診斷變壓器故障研究雖然較多,但未取得突破性進展。關(guān)鍵原因在于機器學(xué)習(xí)模型對訓(xùn)練樣本集的數(shù)據(jù),網(wǎng)絡(luò)結(jié)構(gòu)以及訓(xùn)練方案有著嚴格要求[10-11]。而早些年研究者又未對數(shù)據(jù),網(wǎng)絡(luò)結(jié)構(gòu)以及訓(xùn)練方法進行充分的探討。近年來,數(shù)據(jù)處理,智能優(yōu)化計算,以及機器學(xué)習(xí)等技術(shù)的迅猛發(fā)展,使得研究者開始在數(shù)據(jù)、結(jié)構(gòu)、訓(xùn)練方法上做大量的研究。
2.3.1 集成學(xué)習(xí)與深度學(xué)習(xí)
近年來,機器學(xué)習(xí)迅猛發(fā)展,更多的機器學(xué)習(xí)模型:極限學(xué)習(xí)機[12]、雙向長短時記憶(Bi-LSTM)網(wǎng)絡(luò)[13]、集成學(xué)習(xí)、深度學(xué)習(xí)等應(yīng)用于變壓器故障診斷中。其中,集成學(xué)習(xí)和深度學(xué)習(xí)由于獨到的優(yōu)勢成為近幾年來廣受研究的熱點模型。集成學(xué)習(xí)[14-15]由于組合了多種學(xué)習(xí)器的結(jié)果而獲得比個體學(xué)習(xí)器更優(yōu)的性能;深度學(xué)習(xí)模型在傳統(tǒng)的淺層網(wǎng)絡(luò)上改進,它模擬人腦的深層結(jié)構(gòu),對故障信息逐層抽象,逐次迭代,深度挖掘故障的潛在規(guī)則。分類回歸樹CART為基分類器的XGBoost模型在損失函數(shù)中增加正則化項,提高了模型的泛化能力。此外,為克服交叉驗證以及網(wǎng)格搜索參數(shù)尋優(yōu)等傳統(tǒng)優(yōu)化方法的缺點,使用GA遺傳算法訓(xùn)練模型參數(shù)。深度學(xué)習(xí)最具代表的模型有卷積神經(jīng)網(wǎng)絡(luò)(CNN)[16],深度信念網(wǎng)絡(luò)(DBN)[17],堆疊自編碼器(SAE)[18-19]等。卷積神經(jīng)網(wǎng)絡(luò)由于加入了卷積層而實現(xiàn)了高層次特征提取。卷積操作實質(zhì)是對原始特征的轉(zhuǎn)換,從低層次的特征經(jīng)卷積操作后不斷獲得高層次的特征,通過訓(xùn)練得到的卷積神經(jīng)網(wǎng)絡(luò)內(nèi)部蘊含了反應(yīng)故障的高層次特征。
2.3.2 樣本集數(shù)據(jù)的處理
作為診斷模型的輸入量,特征量的性質(zhì)決定性地影響著診斷模型的精度。早些年的研究未取得突破性的進展,關(guān)鍵原因之一在于未考慮模型輸入數(shù)據(jù)中存在的冗余信息,輸入信息與模型的匹配度,以及DGA數(shù)據(jù)作為單一指標數(shù)據(jù)的局限性等。近年來,研究者在樣本數(shù)據(jù)問題的研究上取得了一系列進展。文獻[20]利用數(shù)據(jù)處理工具,挑選出與故障類型最相關(guān)的輸入變量。文獻[21]對特征氣體進行關(guān)聯(lián)分析,在原始的DGA數(shù)據(jù)中得到一組新的特征量,基于此特征量能有效提高變壓器的故障診斷率。文獻[22]針對變壓器不同故障類別發(fā)生概率不平衡及不同故障識別效果迥然不同等問題,利用層次分類和集成學(xué)習(xí)建立了一種多級層次變壓器故障診斷模型。文獻[23]以及文獻[24]將DGA與電氣試驗數(shù)據(jù)等多信息融合作為診斷模型的樣本數(shù)據(jù),解決了DGA單指標難以完整表達故障信息的問題。
2.3.3 智能優(yōu)化算法與診斷算法融合
診斷模型的訓(xùn)練問題是非線性函數(shù)求最優(yōu)解解問題,訓(xùn)練方法的好壞直接影響著網(wǎng)絡(luò)模型的診斷速度和精度。由于傳統(tǒng)訓(xùn)練方法存在的固有缺陷,近年來,研究者們開始將智能計算方法引入到模型的訓(xùn)練中,力求獲得用時少,占用內(nèi)存少,精度高的智能診斷模型。GA、ACS-SA、帝國殖民競爭算法等進化計算和粒子群算法(PSO)、蝙蝠算法、天牛須算法等群智能算法[25-29]被廣泛用于訓(xùn)練模型中,表1給出了智能優(yōu)化算法與診斷算法融合建立的模型案例。
表1 智能優(yōu)化算法與診斷算法融合案例Tab.1 Fusion case of intelligent optimization algorithm and diagnosis algorithm
這些智能優(yōu)化算法雖能在一定程度上改進模型,然而,其模型在診斷速度以及準確率上仍未取得重大突破,需要進一步研究。
本文在綜述了相關(guān)智能算法在變壓器故障診斷的基礎(chǔ)上,應(yīng)用決策樹算法對變壓器的故障進行了預(yù)測工作。
決策樹是一種典型的監(jiān)督學(xué)習(xí)方式,結(jié)構(gòu)呈樹狀。決策時,從根結(jié)點出發(fā)依次遞歸到中間結(jié)點,葉子節(jié)點。根結(jié)點和中間結(jié)點為每個屬性的測試,決策樹分支表示測試的輸出,葉子結(jié)點表示最終的測試類別。
對于給定的屬性集合,可以訓(xùn)練出的決策樹模型數(shù)量可以達到指數(shù)級別,其中的模型準確率不盡相同,如何建立出分類性能優(yōu)越的決策樹模型是關(guān)鍵問題,解決此問題的關(guān)鍵在于如何分裂訓(xùn)練數(shù)據(jù)以及如何結(jié)束樹的分裂行為。
3.2.1 選擇屬性測試條件
決策樹的好壞以劃分前后的類分布定義,劃分后的結(jié)點不純度的高低反映了類分布的傾斜程度。Gini指標是衡量劃分后的子女結(jié)點不純度的度量方式之一。
(1)
其中,c為記錄的類別,p表示某一類別占據(jù)總記錄的比重。
Gini值越低反應(yīng)劃分后的子女結(jié)點純度越高。Gini的取值范圍在0到1之間。
進一步,增益G反映了劃分前后的決策樹效果。增益Z的定義為:
(2)
其中,Gini(parent)是給定父節(jié)點下的Gini不純度度量,N為父節(jié)點上的記錄總數(shù),N(vj)為與子女結(jié)點vj相關(guān)聯(lián)的記錄數(shù)。Gini(parent)為定值,因此獲得最佳決策樹的劃分方法等價于最小化子女結(jié)點的Gini加權(quán)平均值。
3.2.2 決策樹剪枝
選取何種策略結(jié)束決策樹的劃分是關(guān)鍵問題之一。欠生長的決策樹難以形成較為完備的分類規(guī)則,分類準確率欠佳;過分生長的決策樹雖在訓(xùn)練樣本上具有較低的分類誤差,但同時會面臨著過擬合的風(fēng)險。先剪枝和后剪枝是終止決策樹增長的主要策略。先剪枝是在完全擬合全部訓(xùn)練數(shù)據(jù)的決策樹之前停止決策樹的進一步增長。而后剪枝是預(yù)先讓樹充分增長,直到完全擬合訓(xùn)練數(shù)據(jù),再通過自下而上地剔除子樹。后剪枝是在完全生長的決策樹上進行的剪枝操作,因此可避免先剪枝過早地停止樹的增長的缺陷。
3.3.1 實驗設(shè)計
本實驗選取IEC TC10故障數(shù)據(jù),共118條數(shù)據(jù),包含低能放電,高能放電、中低溫過熱、高溫過熱以及正常數(shù)據(jù)。選取其中93條數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),25條數(shù)據(jù)用于測試,訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)的具體分布如表2。
表2 訓(xùn)練數(shù)據(jù)、測試數(shù)據(jù)分布Tab.2 Distribution of training data and test data
1)特征量選擇
本文使用三比值法提供的三對比值乙炔含量與乙烯含量之比(C2H2/C2H4)、甲烷含量與氫氣含量比(CH4/H2)以及乙烯含量與乙烯含量比(C2H4/C2H6)作為特征量。
2)建立基于決策樹的變壓器故障診斷模型
將93條訓(xùn)練數(shù)據(jù)訓(xùn)練生成完全生長的決策樹,再利用后剪枝對決策樹進行修剪。
3.3.2 結(jié)果分析
利用93條訓(xùn)練數(shù)據(jù)訓(xùn)練出來的完全生長的決策樹以及修剪后的決策樹分別如圖1、2所示。
圖1 完全生長的決策樹Fig.1 Fully grown decision tree
圖2 剪枝后的決策樹Fig.2 Decision tree after pruning
訓(xùn)練及經(jīng)過后剪枝處理的決策樹模型預(yù)測結(jié)果如圖3所示。
圖3 基于DGA數(shù)據(jù)的變壓器故障診斷決策樹Fig.3 Transformer fault diagnosis decision tree based on DGA data
在25條測試數(shù)據(jù)中,8條數(shù)據(jù)預(yù)測錯誤,其中低能放電共5條數(shù)據(jù),預(yù)測成功3條;高能放電數(shù)據(jù)10條預(yù)測成功8條;中低溫過熱數(shù)據(jù)3條成功預(yù)測1條;高溫過熱3條數(shù)據(jù)成功預(yù)測2條;正常數(shù)據(jù)共4條成功預(yù)測3條,該模型的準確率在68%。提供的三比值法預(yù)測結(jié)果(準確率60%)相比提高了8%。
從數(shù)據(jù)的分析可知,本文提出的基于決策樹的變壓器故障診斷相比三比值法而言,預(yù)測故障準確率有一定程度的提高,是一種積極有效的診斷方法,但準確率仍有較大的提升空間。本文在通過綜述智能算法在變壓器故障診斷上的應(yīng)用研究以及該決策樹算法預(yù)測驗證的基礎(chǔ)上,對進一步提高各種基于DGA數(shù)據(jù)的變壓器故障診斷提出相關(guān)建議。
未來應(yīng)充分借助數(shù)據(jù)挖掘技術(shù)等數(shù)據(jù)處理技術(shù)處理數(shù)據(jù)缺失,數(shù)據(jù)不平衡,數(shù)據(jù)冗余,數(shù)據(jù)含噪等問題,并深入挖掘數(shù)據(jù)的潛在價值。卷積神經(jīng)網(wǎng)絡(luò)應(yīng)考慮如何最大效率地發(fā)揮卷積操作的價值,提取有用的特征。此外,未來還應(yīng)將DGA數(shù)據(jù),電氣試驗數(shù)據(jù)等多指標信息整合,實現(xiàn)數(shù)據(jù)深度融合應(yīng)用于變壓器故障診斷。在應(yīng)用多指標信息診斷時,結(jié)合變壓器故障案例,充分考慮不同指標對故障診斷的權(quán)重問題。
模型的結(jié)構(gòu)對診斷的效果有著直接影響:(1)深度學(xué)習(xí)應(yīng)充分考慮模型深度,模型參數(shù)等信息。(2)集成學(xué)習(xí)除選擇同類基分類器外,還應(yīng)組合不同基分類器,充分綜合各模型的優(yōu)點。(3)結(jié)合各智能算法的優(yōu)勢。專家系統(tǒng),模糊理論,神經(jīng)網(wǎng)絡(luò),智能優(yōu)化計算等多種智能方法應(yīng)相輔相成,揚長避短,從而發(fā)展出性能優(yōu)越的模型。(4)模型的選擇和訓(xùn)練方法應(yīng)當考慮數(shù)據(jù)的特點。將數(shù)據(jù)的不平衡,數(shù)據(jù)冗余等問題采用合適的模型及訓(xùn)練方法來解決,將更有利于提高DGA診斷變壓器故障的準確率,指導(dǎo)生產(chǎn)運行。