翟旭,屈寶存
(遼寧石油化工大學(xué)信息與控制工程學(xué)院,遼寧撫順113001)
變壓器是電力系統(tǒng)中常見的設(shè)備之一,對系統(tǒng)的安全性有很大程度的影響。因此,研究變壓器的故障診斷技術(shù)具有極其重要的意義。溶解氣體分析(DGA)技術(shù)是對油浸式變壓器早期潛伏性故障診斷的重要手段,變壓器故障類型與其油中特征氣體H2、CH4、C2H6、C2H4和C2H2的體積分?jǐn)?shù)及其比值有著密切關(guān)系,通過對這幾種特征氣體體積分?jǐn)?shù)或其比值關(guān)系的分析,就能找出變壓器內(nèi)部存在的潛伏性故障[1]。
近年來不少智能算法應(yīng)用到了變壓器的故障診斷中,如文獻(xiàn)[2]將基于DGA的BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于電力變壓器故障診斷中,但人工神經(jīng)網(wǎng)絡(luò)存在收斂速度慢、易陷入局部極值等問題,這些問題對其實用性造成影響。文獻(xiàn)[3]提出了基于貝葉斯理論和DGA結(jié)合的變壓器智能故障診斷方法,而貝葉斯網(wǎng)絡(luò)需要大量樣本數(shù)據(jù),這對應(yīng)用造成一些不必要的麻煩。文獻(xiàn)[4]利用支持向量機(jī)對變壓器進(jìn)行故障診斷,實例驗證表明,該方法能達(dá)到較高的變壓器故障診斷準(zhǔn)確率,支持向量機(jī)能有效的解決小樣本、過擬合、非線性及高維模式識別問題等優(yōu)點(diǎn),因此在眾多算法中此方法對故障的診斷結(jié)果更為顯著。
然而對SVM分類器性能起關(guān)鍵作用的參數(shù)選擇卻沒有統(tǒng)一的標(biāo)準(zhǔn)。文獻(xiàn)[5]采用遺傳算法優(yōu)化SVM參數(shù),但遺傳算法選擇策略缺乏多樣性保護(hù)機(jī)制,無法保證能搜索出問題的所有最優(yōu)解。在遺傳算法基礎(chǔ)上發(fā)展而來的小生境遺傳算法有發(fā)現(xiàn)多個最優(yōu)解的能力,改善了遺傳算法的全局搜索能力。在此將小生境遺傳算法優(yōu)化的支持向量機(jī)應(yīng)用到電力變壓器的故障診斷中,以提高變壓器故障診斷的正判率。
SVM分類器進(jìn)行數(shù)據(jù)分類的主要思想是:通過非線性映射函數(shù)Φ(·)把數(shù)據(jù)樣本映射到高維特征空間,再在高維特征空間中求得最優(yōu)分類面來分離訓(xùn)練樣本點(diǎn),使得訓(xùn)練樣本點(diǎn)與最優(yōu)分離面距離最大化。SVM進(jìn)行分類的基本步驟如下[6]:
Stype1:首先確定訓(xùn)練樣本:
其中:xi∈Rn,yi∈{-1,1},i=1,2,...,l,n為樣本空間維數(shù)。
Stype2:選取懲罰參數(shù)C>0和合適的核函數(shù),并構(gòu)造最優(yōu)超平面對應(yīng)的規(guī)劃問題
求得解為:
Stype3:選取α*的一個正分量0<α*<C,并由此計算閾值:
Stype4:構(gòu)造決策函數(shù)
其中:K(x·xi)=Φ(x)·Φ(xi)為滿足Mercer核定理的核函數(shù)。
核函數(shù)是支持向量機(jī)的重要組成部分,支持向量機(jī)常用的四種核函數(shù)有:線性核函數(shù)、多項式核函數(shù)、高斯徑向基核函數(shù)和兩層感知器核函數(shù)[7]。
高斯徑向基(RBF)核函數(shù)表達(dá)式如下:
其中,‖xi-xj‖表示兩個向量的距離。
懲罰參數(shù)C和核函數(shù)參數(shù)σ的選擇影響著支持向量分類器的診斷準(zhǔn)確率和系統(tǒng)的泛化能力。特征空間中的經(jīng)驗風(fēng)險比例和學(xué)習(xí)機(jī)置信范圍受到懲罰參數(shù)C的影響;高維特征空間中樣本數(shù)據(jù)分布情況受核函數(shù)參數(shù)σ的影響。圖1為根據(jù)UCI數(shù)據(jù)庫的wine數(shù)據(jù)得到的測試結(jié)果。如圖所示,不同的參數(shù)C、σ所對應(yīng)的分類精度是不同的。由此可見,只有正確選擇參數(shù),才可以得到性能良好的SVM分類器。
圖1 SVM參數(shù)選擇與分類精度關(guān)系曲線Fig.1 Curve of parameter selection and classification accuracy
標(biāo)準(zhǔn)遺傳算法是模擬自然界中種群進(jìn)化過程的一種隨機(jī)優(yōu)化方法。研究表明,標(biāo)準(zhǔn)遺傳算法存在早熟收斂、局部搜索能力不足、遺傳算子無方向性等缺點(diǎn)[8],導(dǎo)致簡單遺傳算法通常只收斂于解空間中的某一點(diǎn),不利于保持解的多樣性,容易發(fā)生非全局性收斂等問題。為此,有學(xué)者在標(biāo)準(zhǔn)遺傳算法中引入小生境的理念,產(chǎn)生了小生境遺傳算法。常見的模擬小生境的方法有基于共享機(jī)制的選擇策略、基于排擠機(jī)制的選擇策略和基于預(yù)選擇機(jī)制的選擇策略[9]。
基于排擠機(jī)制選擇策略的基本思想如下:首先分別比較群體中每兩個個體之間的海明距離,若這個距離小于預(yù)先指定的距離L,再比較兩者的適應(yīng)度,并對其中適應(yīng)度較差的個體施以一個較強(qiáng)的罰函數(shù),大幅度降低此個體的適應(yīng)度。此時,在距離L范圍內(nèi)的兩個個體,適應(yīng)度差的個體經(jīng)過處理后,在此后的進(jìn)化過程中更容易被淘汰。即在距離L范圍內(nèi)只存在一個優(yōu)良個體,使得個體能在約束空間中盡量分散,從而構(gòu)成了小生境進(jìn)化環(huán)境,又維護(hù)了群體的多樣性。
其中,個體xi與個體xj之間的海明距離的定義如下:
對小生境遺傳算法做了如下改進(jìn):引入最優(yōu)保存策略,遺傳操作中的交叉變異過程會把優(yōu)良個體破壞掉,這樣就沒有達(dá)到累積優(yōu)良個體的目的,導(dǎo)致收斂周期的延長;小生境算法雖然增大了搜索空間,提高了收斂到最優(yōu)解的概率,卻延長了進(jìn)化過程。最優(yōu)保存策略可以彌補(bǔ)以上問題,它將群體在進(jìn)化過程中迄今出現(xiàn)的最好個體不進(jìn)行配對交叉而直接復(fù)制到下一代中,并用它來取代新種群中適應(yīng)度低的個體。
改進(jìn)算法具體實現(xiàn)步驟如下:
1)初始化種群:初始化形成含n個個體的種群P。
2)適應(yīng)度計算:根據(jù)K折交叉驗證法來評價SVM的分類性能,適應(yīng)度函數(shù)取K次迭代平均誤差的倒數(shù):
3)適應(yīng)度排序:對種群P中的個體依據(jù)其適應(yīng)度大小按降序排列,記憶前m各個個體。
4)遺傳操作:首先由輪盤賭選擇,再進(jìn)行最優(yōu)保存策略;按一定比率進(jìn)行交叉變異操作生成子代種群;用保存下來的優(yōu)良個體替代新種群中的劣質(zhì)個體,生成子代種群P′,并計算相應(yīng)的適應(yīng)度F′。
5)小生境操作:根據(jù)步驟3,4得到一個含n+m個個體的種群。計算種群個體pi,pj間的海明距離‖pi-pj‖,當(dāng)其小于指定距離L時,比較兩個體的適應(yīng)度大小,對適應(yīng)度小的個體加以懲罰。依據(jù)個體的新適應(yīng)度進(jìn)行降序排列,記憶前m個個體。
6)終止條件判斷:若滿足終止條件,則終止運(yùn)行并輸出最優(yōu)解。否則以步驟5)排列中的前n個個體作為新一代種群Pnew重新執(zhí)行步驟3)。
變壓器故障一般以單一故障為主,也會出現(xiàn)多重故障的現(xiàn)象。根據(jù)IEC60599規(guī)定,變壓器單一故障可分為:低溫過熱(T1)、中溫過熱(T2)、高溫過熱(T3)、低能放電(D1)、高能放電(D2)、局部放電(PD)[10]。文中僅針對變壓器單一故障進(jìn)行診斷,加之無故障狀態(tài)(NC),共考慮7類診斷狀態(tài)。
選取5種特征氣體H2、CH4、C2H6、C2H4、C2H2所占?xì)怏w體積分?jǐn)?shù)總和的百分比作為SVM的訓(xùn)練樣本和測試樣本。為了更好的進(jìn)行訓(xùn)練和識別,將樣本數(shù)據(jù)按如下公式進(jìn)行歸一化處理:
最初研究SVM算法是針對二值分類的問題,但出現(xiàn)在實際應(yīng)用中的多分類問題需要構(gòu)建適宜的多類分類器來解決。到目前為止,已提出了許多解決多分類問題的方法,如“一對一”分類法、“一對多”分類法、有向無環(huán)圖法、二叉樹分類方法等。
采用“一對一”的分類方法,其基本思想如下:在每兩類訓(xùn)練樣本之間設(shè)計一個SVM分類器,即對k個類別的樣本共構(gòu)造k(k-1)/2個分類器。當(dāng)對一個預(yù)測樣本進(jìn)行分類時,綜合這些兩類分類器判別結(jié)果采用投票的方法,得票最多的類別即為該預(yù)測樣本的類別。
基于INGA優(yōu)化SVM的變壓器故障診斷步驟如下:
1)將選定的訓(xùn)練集和測試集中各樣本數(shù)據(jù)進(jìn)行歸一化處理,產(chǎn)生新的訓(xùn)練集和測試集;
2)采用改進(jìn)的小生境遺傳算法對SVM相關(guān)參數(shù)進(jìn)行優(yōu)化,得到適宜的參數(shù)C和σ;
3)將以上得出的參數(shù)C和σ代入支持向量機(jī)的多分類算法中,利用訓(xùn)練集得到相應(yīng)的分類模型;
4)通過建立好的分類模型,對待測試的樣本進(jìn)行診斷分析。
變壓器故障數(shù)據(jù)來源于搜集各資料上有明確結(jié)論的142個樣本,選擇其中的92個作為訓(xùn)練樣本集,其余的50個作為測試樣本集。采用C-支持向量分類機(jī),RBF核函數(shù),一對一分類策略,NGA和GA的參數(shù)設(shè)置如下:C的范圍[1,100],g=2σ2的范圍是[0.1,100],初始種群數(shù)量M=20,進(jìn)化最大代數(shù)為100,交叉概率pc=0.8,變異概率pm=0.02。
圖2、3、4分別為3種方法對SVM參數(shù)進(jìn)行優(yōu)化的種群適應(yīng)度進(jìn)化曲線,分別對GA進(jìn)行參數(shù)優(yōu)化、NGA進(jìn)行參數(shù)優(yōu)化和INGA進(jìn)行參數(shù)優(yōu)化的個體適應(yīng)度進(jìn)化情況作了比較。從對比圖中可以看出,GA的收斂速度比NGA和INGA要快,但適應(yīng)度值較低;INGA的尋優(yōu)能力最高,相比NGA最佳適應(yīng)度值有明顯提高。證實了INGA的全局尋優(yōu)能力更好。
圖2 GA參數(shù)優(yōu)化性能曲線圖Fig.2 GA performance optimizations
圖3 NGA參數(shù)優(yōu)化性能曲線Fig.3 NGA performance optimizations
圖4 INGA參數(shù)優(yōu)化性能曲線Fig.4 INGA performance optimizations
為了驗證所提方法的診斷效果,分別與文獻(xiàn)[11]的傳統(tǒng)遺傳算法以及小生境遺傳算法的診斷結(jié)果進(jìn)行比較,診斷結(jié)果的對比如表1所示。根據(jù)表1的診斷結(jié)果可以看出本文方法相對傳統(tǒng)遺傳算法優(yōu)化SVM的診斷結(jié)果,訓(xùn)練時間稍有延長,但診斷精度有所提高;相對改進(jìn)前的診斷結(jié)果,訓(xùn)練時間縮短,診斷精度有所提高。因此,該方法在合理的訓(xùn)練時間內(nèi)能獲得更高的診斷精度,有利于變壓器的故障診斷。
文中提出了一種由小生境遺傳算法優(yōu)化SVM參數(shù)的方法,以此來解決SVM參數(shù)對電力變壓器故障診斷精度影響很大的問題。在使用小生境遺傳算法對SVM參數(shù)進(jìn)行優(yōu)化的基礎(chǔ)上引入最優(yōu)保存策略,最優(yōu)保存操作充分利用小生境遺傳操進(jìn)化過程的歷史信息指導(dǎo)搜索行為,有利于參數(shù)的尋優(yōu),提高了診斷精度。通過仿真實驗的綜合比較結(jié)果表明,該方法對電力變壓器單一故障的診斷有較好的診斷效果。
表1 診斷結(jié)果對比Tab.1 The comparison of diagnosis results
[1] 郭創(chuàng)新,朱承治,張琳,等.應(yīng)用多分類多核學(xué)習(xí)支持向量機(jī)的變壓器故障診斷[J].中國電機(jī)工程學(xué)報,2010,30(13):128-132.GUO Cuang-xin,ZHU Cheng-zhi,ZHNG Lin,et al.A fault diagnosis method for power transformer based on multiclass multiple-kernel learning support vector machine[J].Proceedings of the CSEE,2010,30(31):128-132.
[2] 李霜,王朗珠,張為,等.基于DGA的改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的變壓器故障診斷方法[J].變壓器,2010,47(12):61-65.LI Shuang,WANG Lang-zhu,ZHANG Wei,et al.Fault diagnosis method of transformer based on improve BP neural network of DGA[J].Transformer,2010,47(12):61-65.
[3] 趙文清.基于選擇性貝葉斯分類器的變壓器故障診斷[J].電力自動化設(shè)備,2011,31(2):44-47.ZHAO Wen-qing.Transformer fault diagnosis on selective bayes classifier[J].Electric Power Automation Equipment,2011,31(2):44-47.
[4] 杜文霞,呂峰,楊俊華.支持向量機(jī)在變壓器故障診斷中的應(yīng)用研究[J].自動化儀表,2011,32(6):29-31.DU Wen-xia,LU Feng,YANG Jun-hua.Research on application of support vector machine in fault diagnosis of transformer[J].Automation Instrumentation,2011,32(6):29-31.
[5] 秦慶強(qiáng),張曉安,李艾華.基于GA-SVM的數(shù)?;旌想娐饭收显\斷研究[J].計算機(jī)工程與設(shè)計,2012,10(33):3984-3989.QIN Qing-qiang,ZHANG Xiao-an,LI Ai-hua.Research on mixed circuit fault diagnoses bases on GA-SVM[J].Computer Engineering and Design,2012,10(33):3984-3989.
[6] 鄧乃揚(yáng),田英杰.數(shù)據(jù)挖掘中的新方法-支持向量機(jī)[M].北京:科學(xué)出版社,2004.
[7] 尹金良,朱永利.支持向量機(jī)參數(shù)優(yōu)化及其在變壓器故障診斷中的應(yīng)用[J].電測與儀表,2012,49(5):11-16.YIN Jin-liang,ZHU Yong-li.Parameter optimization for support vector machine and its application to fault diagnosis of power transformers[J].Electrical Measurement&Instrumentation,2012,49(5):11-16.
[8] 陳超.自適應(yīng)遺傳算法的改進(jìn)研究及應(yīng)用[D].廣州:華南理工大學(xué),2011.
[9] Sherni B,Klahenbuhl L.Fitness sharing and niching methods revisited[J].IEEE Transactions on Evolutionary Computation,1988,2(3):97-106.
[10] 孫才新,陳偉根,李檢,等.電氣設(shè)備油中氣體在線監(jiān)測與故障診斷技術(shù)[M].北京:科學(xué)出版社,2003.
[11] 肖燕彩,陳秀海,朱衡君.遺傳支持向量機(jī)在電力變壓器故障診斷中的應(yīng)用[J].上海交通大學(xué)學(xué)報,2007,41(11):1878-1886.XIAO Yan-cai,CHEN Xiu-hai,ZHU Heng-jun.The application of genetic support vector machine in power transformer fault diagnosis[J].Journal of Shanghai Jiaotong University,2007,41(11):1878-1886.