朱克東鄭建勇梅 軍梅 飛
(東南大學電氣工程學院,江蘇南京 210096)
基于LSSVM概率輸出與證據(jù)理論融合的變壓器故障診斷
朱克東,鄭建勇,梅 軍,梅 飛
(東南大學電氣工程學院,江蘇南京 210096)
為了利用相對較少的故障數(shù)據(jù)樣本對變壓器主要故障類型進行較準確的判斷,基于智能互補和數(shù)據(jù)融合的思想,提出基于最小二乘支持向量機LSSVM(least square support vector machine)概率輸出與證據(jù)理論融合的故障診斷方法。該診斷方法具有以下特點:可融合蘊含變壓器運行狀態(tài)的多種特征信息,輸出變壓器各種故障的概率,為變壓器檢修提供更多的可用信息;充分發(fā)揮了LSSVM在小樣本情況下具有較強泛化能力的優(yōu)勢。算例結(jié)果表明,該診斷方法的故障診斷準確率達到91.1%,優(yōu)于傳統(tǒng)的IEC三比值法(故障診斷準確率75.6%)及LSSVM分類法(故障診斷準確率82.2%),有效降低了診斷誤判的風險。
變壓器故障診斷;證據(jù)理論;最小二乘支持向量機;概率輸出;油中溶解氣體分析
油浸式電力變壓器是電網(wǎng)中重要的一次設(shè)備,其運行狀態(tài)直接影響電網(wǎng)的安全。在長期運行過程中,由于熱、電等影響因子會引發(fā)變壓器絕緣性能下降,產(chǎn)生各種故障。因此,需采取措施對其進行故障診斷,以保證變壓器可靠運行。
近年來,利用油中溶解氣體進行變壓器故障診斷的研究[1-3]取得了一定效果,但這些方法主要依據(jù)溶解氣體的單項特征信息,很難對故障做出準確判斷,并且部分故障診斷方法需要大樣本數(shù)據(jù)。然而,具有小樣本特性的故障診斷更滿足工程需求。證據(jù)理論作為不確定性推理方法,近期也被引入到故障診斷領(lǐng)域。證據(jù)理論的特點是以概率的形式輸出結(jié)果,便于分析問題的不確定性,實現(xiàn)多特征信息的數(shù)據(jù)融合。文獻[4]利用專家系統(tǒng)和模糊推理等技術(shù)完成基于多特征向量組合的故障診斷,但其證據(jù)體數(shù)量眾多,使其不確定性問題分析的能力下降,同時也增加基本概率分配函數(shù)(basic probability assignment function,BPA)確定的困難。文獻[5-7]在神經(jīng)網(wǎng)絡(luò)與證據(jù)理論結(jié)合的基礎(chǔ)上進行探索,但是無論神經(jīng)網(wǎng)絡(luò)模型是否改進,不能避免其自身泛化能力較弱、結(jié)構(gòu)構(gòu)建復雜等缺陷。倘若證據(jù)體通過訓練機器處理得到,可以有效減少證據(jù)體的數(shù)量,有利于診斷方法對不確定性問題的分析;其次可以針對其他智能算法進行研究,探索一種全新的BPA賦值方式,通過其他智能算法的優(yōu)點來保證BPA的客觀化、準確性。
LSSVM是支持向量機(support vector machine,SVM)[8]的擴展,它保留SVM泛化能力強、小樣本特性、全局最優(yōu)等優(yōu)點,而且訓練時間短,結(jié)果更具確定性,目前在電氣工程中[9-12]得到廣泛應(yīng)用。而LSSVM概率輸出把LSSVM的確定性分類轉(zhuǎn)化為非確定性分類,在保留原有LSSVM優(yōu)勢的基礎(chǔ)上為證據(jù)體提供BPA?;谏鲜隹紤],筆者提出基于LSSVM概率輸出與證據(jù)理論融合的故障診斷方法,通過構(gòu)建多個LSSVM概率輸出模塊,結(jié)合數(shù)據(jù)融合原理進行識別,期望達到更加準確并全面地反映變壓器的運行狀態(tài)、提高其故障診斷精確度與可靠性的目的。
1.1 LSSVM
LSSVM優(yōu)化指標采用平方項,并用等式約束代替SVM的不等式約束,將二次規(guī)劃問題轉(zhuǎn)化為線性方程求解,降低了計算的復雜性,加快了求解速度。LSSVM的分類決策函數(shù)為
式中:y——目標輸出;SV——支持向量機集合;αi——拉格朗日乘子;xi、xj——輸入;Φ(*)——非線性變換;b——偏置常數(shù)。
定義K(xi,xj)=ΦT(xi)Φ(xj)為核函數(shù),LSSVM算法選擇徑向基函數(shù)(radial basis function,RBF)為核函數(shù),即K(xi,xj)=exp(-‖xi-xj‖/2σ2),其中σ為RBF的參數(shù)。
1.2 LSSVM改進
LSSVM是一種強有力的機器學習方法。但對于某些問題,樣本不能明確地歸為某類,只能以一定概率或隸屬度屬于某類。因此,用yi∈{-1,1}不能恰當?shù)乇硎绢悇e信息。為了讓LSSVM表達樣本的不確定性,就需要LSSVM具有軟輸出性能。
參數(shù)A、B根據(jù)訓練機通過解式(3)所示的最大似然問題來解決。
式中:l——訓練集樣本數(shù);pi——樣本xi的概率估計值;N+、N-——正類和負類樣本數(shù)。
1.3 Dempster/Shafer證據(jù)理論
Dempster/Shafer證據(jù)理論(以下簡稱DS證據(jù)理論)的本質(zhì)是在同一識別框架下將不同的證據(jù)體通過其證據(jù)組合規(guī)則合成一個新的證據(jù)體的過程。給定一個識別框架Θ,Θ的冪集2Θ上的一個映射m:2Θ→[0, 1],滿足m(φ)=0且m(A)=1,稱m(A)為框架Θ上的BPA函數(shù),它表示了對A的直接支持程度。在本文中A代表變壓器狀態(tài)類型,m(*)代表LSSVM訓練模型。證據(jù)合成規(guī)則的一般形式是:設(shè)論域U上存在t個獨立證據(jù)體,其相應(yīng)的BPA函數(shù)分別為m1,m2,…,mt,相應(yīng)的焦元分別為A1,A2,…,An,則融合后的可信度分配為
2.1 故障類型的確定
設(shè)Ω(Θ)={f1,f2,…,fn}為變壓器故障類型的集合,實踐表明:變壓器內(nèi)部故障按性質(zhì)可分為過熱故障和放電故障。文獻[15]對充油電氣設(shè)備故障類型的統(tǒng)計結(jié)果如表1所示。由此,本文對變壓器故障的定義為Ω(Θ)={f0,f1,f2,f3,f4,f5,f6,f7,f8,f9}。f0為無故障模式,f1為低溫過熱(<300℃),f2為中溫過熱(300~700℃),f3為高溫過熱(>700℃),f4為局部放電,f5為低能放電,f6為低能放電兼過熱,f7為電弧放電,f8為電弧放電兼過熱,f9為其他類型故障(如受潮等)。
2.2 診斷模型
診斷模型結(jié)構(gòu)如圖1所示。
模型診斷流程如下:由數(shù)據(jù)預處理模塊對測試樣本數(shù)據(jù)進行預處理,并將預處理后的數(shù)據(jù)根據(jù)參數(shù)集定義分別輸入各個參數(shù)集;各個LSSVM診斷模塊聯(lián)立參數(shù)集中數(shù)據(jù)樣本進行診斷,并將診斷結(jié)果輸入各個故障集;3個故障集的診斷結(jié)果通過DS證據(jù)理論融合模塊進行數(shù)據(jù)融合,最終得出診斷結(jié)論。
2.3 數(shù)據(jù)樣本選擇
研究證明,在熱電作用下變壓器油和絕緣材料將逐漸老化分解,產(chǎn)生少量的各種低分子烴類及二氧化碳、一氧化碳等氣體;當存在潛伏性的熱或放電性故障時,氣體產(chǎn)生的速度加快。隨著故障發(fā)生,大量氣體溶解于油中。由于這些氣體組分含量與故障類型及故障嚴重程度密切相關(guān),筆者選用總烴(C2H2、H2、CH4、C2H6、C2H4)以及CO、CO2進行測試。
2.4 數(shù)據(jù)預處理
測試樣本數(shù)據(jù)的量值通常存在較大的差別。若將原始數(shù)據(jù)直接輸入,訓練機器對較小的量值不敏感,會忽視一些重要特征信息。為充分挖掘原始數(shù)據(jù)中的信息,需對總烴樣本數(shù)據(jù)進行預處理,CO、CO2數(shù)據(jù)在后文以其他方式進行處理。處理過程如下:φ(C2H2)=C2H2/(C1+C2),φ(H2)=H2/(C1+C2+H2),φ(C2H4)=C2H4/(C1+C2),φ(CH4)=CH4/(C1+C2),φ(C2H6)=C2H6/(C1+C2)。其中C1+C2代表總烴含量(體積比,下同)、,C1+C2+H2代表氫烴含量(C2H2、H2、C2H6、CH4、C2H4含量之和),φ(*)代表各種氣體的體積比。
總烴的相對大小采用模糊隸屬度進行處理。隸屬函數(shù)選擇常見而重要的嶺形分布來描述,參考總烴數(shù)據(jù),隸屬函數(shù)構(gòu)造如下:
式中:u0——總烴的相對體積;z——總烴的實際體積。
2.5 參數(shù)集定義
在變壓器故障診斷領(lǐng)域中,一些基于油中氣體溶解分析(dissolved gas analysis,DGA)的診斷方法往往各有其優(yōu)點和不足,若能綜合多種方法取長補短,無疑將有助于診斷準確率的提高。參數(shù)集1選取特征氣體的體積比φ(CH4)、φ(H2)、φ(C2H6)、φ(C2H4)、φ(C2H2);參數(shù)集2采用勞杰士(Roger)四比值法選取φ(CH4)/φ(H2)、φ(C2H2)/φ(C2H4)、φ(C2H4)/φ(C2H6)、φ(C2H6)/φ(CH4);參數(shù)集3選取CO2/CO以及u0。
2.6 基于LSSVM概率輸出的初步診斷
在LSSVM概率估計中,本文采用1.2節(jié)內(nèi)容完成兩兩配對概率到多類概率的轉(zhuǎn)化,輸出各證據(jù)體(亦即故障集)的各類故障的BPA,保證BPA賦值的客觀化。本文中,共有10類故障由3個LSSVM證據(jù)體進行診斷融合,其識別框架為Θ={f0,f1,…,f9}。該模塊診斷流程如下:(a)第i類和第j類數(shù)據(jù)樣本經(jīng)過數(shù)據(jù)預處理后輸入相應(yīng)的參數(shù)集;(b)各參數(shù)集聯(lián)立式(2)和式(3)求出相應(yīng)的LSSVM概率輸出,亦即二分類LSSVM概率輸出; (c)通過所有的二分類概率輸出迭代求解多分類下的概率輸出矢量,亦即該證據(jù)體下各類故障的BPA。
2.7 基于數(shù)據(jù)融合的故障診斷
根據(jù)證據(jù)融合理論,結(jié)合3個基于LSSVM概率輸出的證據(jù)體下各類故障的BPA,聯(lián)立式(4),計算多證據(jù)體聯(lián)合作用下對各類故障的融合結(jié)果,最后根據(jù)決策規(guī)則進行判斷并得出結(jié)論。本文采用以下決策規(guī)則:目標的信任度是所有信任度中的最大值;目標的信任度與其他狀態(tài)的信任度之差應(yīng)大于某一閾值(經(jīng)大量調(diào)試后設(shè)為0.15)。前者說明所有狀態(tài)類型中只有信任度最大的狀態(tài)類型符合目標,后者說明唯有目標與其他狀態(tài)類型的信任度之差足夠大時才能確認目標類型的合理性。倘若以上規(guī)則不滿足,原因可能是證據(jù)選擇不合理,需要重新選擇并進行融合計算。
在大量110 kV變壓器油色譜檢測記錄和相應(yīng)的實際故障結(jié)果基礎(chǔ)上,對每類故障選出10組典型的樣本,共有100臺次樣本作為訓練樣本(數(shù)據(jù)來源于江蘇省電力公司相關(guān)檢修部門)。對常見的變壓器故障現(xiàn)場數(shù)據(jù)進行分析,結(jié)果表明本方法與三比值法診斷結(jié)果基本相符。下面重點針對改良三比值法誤判的2次故障,采用本方法進行診斷,診斷過程中單個LSSVM概率輸出模塊的診斷結(jié)果也遵循2.7節(jié)的決策規(guī)則。
實例太湖變110 kV#2主變額定容量為31 500 kV·A,額定電壓為110 kV/38 kV/11 kV,型號為SFSLZB-31500/110,1997年12月投入運行,2009年2月26日對其進行周期性油樣采集工作。通過油色譜分析,發(fā)現(xiàn)主變本體油樣化驗數(shù)據(jù)異常,乙炔含量有較大增長,其他氣體含量也有不同程度的增加。油中氣體的體積比如下:φ(H2)=308 μL/L,φ(CO)=326 μL/L,φ(CO2)=1 401 μL/L,φ(CH4)=159 μL/L,φ(C2H6)=326.2 μL/L,φ(C2H4)=23.2 μL/L,φ(C2H2)=592.2 μL/L。
三比值編碼為022,初步診斷為高溫過熱(>700℃)。采用本文方法進行診斷,結(jié)果見表2。最后融合結(jié)果為高能放電兼過熱類型。通過該變壓器的歷史數(shù)據(jù)分析及現(xiàn)場的停電檢查,表明該變壓器因為鐵芯多點接地,在運行中處于強電場中的鐵芯在接地點形成閉合回路、產(chǎn)生環(huán)流,該電流引起鐵芯局部發(fā)熱,而且長期發(fā)熱使變壓器鐵芯的某一點被燒壞,產(chǎn)生電弧,從而導致絕緣油分析中多種氣體含量不斷增加。診斷結(jié)果與現(xiàn)場勘查結(jié)果一致。表2結(jié)果表明:故障類型屬于復合性故障,LSSVM1、LSSVM2、LSSVM3獨立證據(jù)體由規(guī)則所限無法確定故障類型;當2個證據(jù)體融合作用時,3個診斷僅有LSSVM1-3診斷結(jié)果給出正確結(jié)論f7;當3個證據(jù)體融合作用時才徹底確定f7。由此可見,當進行復合性故障診斷時,基于單項特征量的證據(jù)體對故障進行診斷的不確定性較高、可信度很低,有時無法準確判斷狀態(tài)類型。多特征量的數(shù)據(jù)融合可以改善上述情況,有助于準確識別故障。
為評估模型的精度和可靠性,按本文方法對其他45臺具有明確結(jié)論的變壓器故障數(shù)據(jù)進行診斷,并將診斷結(jié)果與改良三比值法和LSSVM分類法的診斷結(jié)果進行比較,結(jié)果如下:基于改良三比值診斷的正判數(shù)為34,總識別率為75.6%;基于LSSVM分類診斷的正判數(shù)為38,總識別率為82.2%;基于本文診斷系統(tǒng)的正判數(shù)為41,總識別率達到91.1%,識別率明顯提高。通過比較可以看出,基于LSSVM概率性輸出的診斷方法,其診斷結(jié)果比基于LSSVM確定性輸出的診斷方法及改良三比值法強,說明本文診斷模型在保留LSSVM的優(yōu)點上有了進一步的提高,同樣也體現(xiàn)了該模型的有效性。
a.筆者提出的LSSVM概率輸出不但保留了LSSVM小樣本、泛化能力強的特點,保證在有限的故障樣本情況下也能建立較強推廣能力的模型,克服了LSSVM硬判決的缺點,能提供故障類型的概率輸出,保證了后續(xù)BPA賦值的客觀性。
b.在提供證據(jù)體需要的BPA時采用LSSVM概率輸出模塊提供的近似真值概率輸出,滿足證據(jù)理論中不確定性信息輸入的特點,使LSSVM與證據(jù)理論之間形成優(yōu)勢互補。
c.3個LSSVM訓練模型的概率輸出通過證據(jù)理論進行融合,更加準確、全面地反映設(shè)備的狀態(tài)。通過實例分析,驗證了該模型的精確度、可靠性和有效性,為變壓器故障診斷提供新的思路。
[1]蔡金錠,王少芳.粗糙集理論在IEC-60599三比值故障診斷決策規(guī)則中的應(yīng)用[J].中國電機工程學報,2005,25(11): 134-139.(CAI Jinding,WANG Shaofang.Application of decision rules for IEC-60599 three-ratio fault diagnosis based on rough set theory[J].Proceeding of the CSEE,2005,25(11):134-139.(in Chinese))
[2]莫娟,王雪,董明,等.基于粗糙集理論的電力變壓器故障診斷方法[J].中國電機工程學報,2004,24(7):162-167.(MO Juan,WANG Xue,DONG Ming,et al.Diagnostic model of insulation faults in power equipment based on rough set theory[J].Proceeding of the CSEE,2004,24(7):162-167.(in Chinese))
[3]呂干云,程浩忠,翟海保,等.基于改進灰色關(guān)聯(lián)分析的變壓器故障識別[J].中國電機工程學報,2004,24(10):121-126.(LYU Ganyun,CHENG Haozhong,ZHAI Haibao,et al.Fault diagnosis of power transformer based on improved grey relation analysis[J].Proceeding of the CSEE,2004,24(10):121-126.(in Chinese))
[4]彭劍,羅安,周柯,等.變壓器故障診斷中信息融合技術(shù)的應(yīng)用[J].高電壓技術(shù),2007,33(3):144-146.(PENG Jian,LUO An,ZHOU Ke,et al.Application of information fusion technique to transformer fault diagnosis[J].High Voltage Engineering, 2007,33(3):144-146.(in Chinese))
[5]尚勇,閆春江,嚴璋,等.基于信息融合的大型油浸電力變壓器故障診斷[J].中國電機工程學報,2002,22(7):115-118.(SHANG Yong,YAN Chunjiang,YAN Zhang,et al.Synthetic insulation fault diagnostic model of oil-immersed power transformers utilizing information fusion[J].Proceeding of the CSEE,2002,22(7):115-118.(in Chinese))
[6]廖瑞金,廖玉祥,楊麗君,等.多神經(jīng)網(wǎng)絡(luò)與證據(jù)理論融合的變壓器故障綜合診斷方法研究[J].中國電機工程學報, 2006,26(3):119-124.(LIAO Ruijin,LIAO Yuxiang,YANG Lijun,et al.Study on synthetic diagnosis method of transformer fault using multi-neural network and evidence theory[J].Proceeding of the CSEE,2006,26(3):119-124.(in Chinese))
[7]魏星,舒乃秋,崔鵬程,等.基于改進PSO-BP神經(jīng)網(wǎng)絡(luò)和D-S證據(jù)理論的大型變壓器故障綜合診斷[J].電力系統(tǒng)自動化,2006,30(7):46-50.(WEI Xing,SHU Naiqiu,CUI Pengcheng,et al.Power transformer fault integrated diagnosis based on improved PSO-BP neural networks and DS evidential reasoning[J].Automation of electric power systems,2006,30(7):46-50.(in Chinese))
[8]VAPNIK V N.The nature of statistical learning theory[M].New York,USA:Springer-Veerlag,1999:138-145.
[9]顧燕萍,趙文杰,吳占松.基于最小二乘支持向量機的電站鍋爐燃燒優(yōu)化[J].中國電機工程學報,2010,30(17):91-97.(GU Yanping,ZHAO Wenjie,WU Zhansong.Combustion optimization for utility boiler based on least square-support vector machine[J].Proceeding of the CSEE,2010,30(17):91-97.(in Chinese))
[10]秦業(yè),袁海文,袁海斌,等.基于優(yōu)化最小二乘支持向量機的電能質(zhì)量擾動分類[J].電工技術(shù)學報,2012,27(8):209-214.(Qin Ye,Yuan Haiwen,Yuan Haibin,et al.Classification of power quality disturbances based on optimized least squares support vector machine[J].Transaction of China Electrotechnical Society,2012,27(8):209-214.(in Chinese))
[11]劉劍,劉開培,周仕杰,等.基于LSSVM的變壓器最優(yōu)維護周期研究[J].中國電機工程學報,2012,32(22):94-103.(LIU Jian,LIU Kaipei,ZHOU Shijie,et al.Research on optimal transformer maintenance scheme based on LS-SVM[J].Proceeding of the CSEE,2012,32(22):94-103.(in Chinese))
[12]曾鳴,呂春泉,田廓,等.基于細菌群落趨藥性優(yōu)化的最小二乘支持向量機短期負荷預測方法[J].中國電機工程學報, 2011,31(34):93-99.(ZENG Ming,LYU Chunquan,TIAN Kou,et al.Least squares-support vector machine load forecasting approach optimized by bacterial colony chemotaxis method[J].Proceeding of the CSEE,2011,31(34):93-99.(in Chinese))
[13]HSUAN-TIEN L,CHIH-JEN L,RUBY C W.A note on platt's probabilistic outputs for support vector machines[J].Machine Learning,2007,68(3):267-276.
[14]WU Tingfan,LIN Chijen,RUBY C W.Probability Estimates for multi-class classification by pairwise coupling[J].Journal of Machine Learning Research,2004,5(4):975-l005.
[15]孫才新.電氣設(shè)備油中氣體在線監(jiān)測與故障診斷技術(shù)[M].北京:科學出版社,2003:1-89.
Transformer fault diagnosis based on probability output of LSSVM and DS evidence theory
ZHU Kedong,ZHENG Jianyong,MEI Jun,MEI Fei
(College of Electrical Engineering,Southeast University,Nanjing 210096,China)
For accurate estimation of the main types of transformer faults with relatively fewer fault information samples,this paper presents an approach to transformer fault diagnosis based on the probability output of the least squares support vector machine(LSSVM) and DS evidence theory according to the ideas of intelligence complementarity and information fusion.This diagnosis method has the following features:it integrates multiple feature information of the operating state of the power transformer,outputs the probabilities of various transformer faults,and provides more available information for the maintenance and repair of the power transformer.This gives full play to the strong generalization ability of the LSSVM in the case of small samples.In case studies,the diagnosis accuracy of the proposed method reached 91.1%,which was higher than that of the three-ratio method (with an accuracy of 75.6%)and that of the LSSVM method(with an accuracy of 82.2%).The proposed method effectively reduces the risk of misdiagnosis of transformer faults.
transformer fault diagnosis;DS evidence theory;LSSVM;probability output;dissolved gas analysis
TM41
:A
:1000-1980(2014)05-0465-06
10.3876/j.issn.1000-1980.2014.05.017
2014-05 09
江蘇省工業(yè)支撐項目(BE2013833)
朱克東(1989—),男,江蘇建湖人,博士研究生,主要從事電氣設(shè)備的故障診斷研究。E-mail:hhuzkd@sina.com