諶倫作, 干樹川, 胡 駿
(四川理工學(xué)院自動化與信息工程學(xué)院, 四川 自貢 643000)
絕緣氣體組合開關(guān)(Gas Insulated Switchgear,GIS)是變電站重要設(shè)備,它的絕緣特性直接關(guān)系到電力系統(tǒng)的可靠性[1-3]。與局部放電故障缺陷分類檢測相關(guān)的研究在上世紀(jì)九十年代開始逐漸發(fā)展起來[4-7],模式識別技術(shù)也逐漸開始被引入GIS局部放電故障檢測[1,8]。不過模式識別在GIS局部放電故障檢測中的應(yīng)用還不成熟,目前正處于初級階段。神經(jīng)網(wǎng)絡(luò)主要是基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原理而提出的,其相關(guān)的研究已經(jīng)較深入[9-10]。以結(jié)構(gòu)最小化理論為基礎(chǔ)的支持向量機(jī)(Support Vector Machine, SVM),與神經(jīng)網(wǎng)絡(luò)相比,其結(jié)構(gòu)更簡單,泛化能力更強(qiáng)。SVM基于統(tǒng)計(jì)理論,能夠在有限樣本中尋得最優(yōu)解,對小樣本數(shù)據(jù)的分析與處理非常合適,適用于模式識別等多領(lǐng)域的研究工作,是繼神經(jīng)網(wǎng)絡(luò)之后的又一優(yōu)秀算法[11]。對GIS局部放電(Partial Discharge,PD)故障的分類檢測模式識別還處于起步階段,目前以BP神經(jīng)網(wǎng)絡(luò)算法為主,其運(yùn)行速度慢且參數(shù)調(diào)節(jié)麻煩,并不適合在線檢測。有研究提出將基于LIBSVM工具包的SVM用在GIS局部放電故障分類模式識別中,雖然解決了神經(jīng)網(wǎng)絡(luò)運(yùn)行時(shí)間長的問題,但也需要人為手動不斷調(diào)節(jié)參數(shù)朝著更高識別率的參數(shù)對方向調(diào)整,不利于在線檢測的工程實(shí)際應(yīng)用[12-14]。特此提出將網(wǎng)格尋優(yōu)算法優(yōu)化的SVM應(yīng)用于GIS局部放電故障分類檢測模式識別中,與無網(wǎng)格尋優(yōu)〗的SVM和BP神經(jīng)網(wǎng)絡(luò)相比,網(wǎng)格尋優(yōu)SVM具有速度快、參數(shù)自動尋優(yōu)的特點(diǎn),可對GIS局部放電故障進(jìn)行分類檢測,為GIS局部放電故障在線檢測提供很好的研究基礎(chǔ)。
六類典型GIS局部放電故障缺陷:高壓導(dǎo)體突起(High Voltage Conductor Protuberance,HVCP)尖刺缺陷、地電極尖刺(Ground Electrode Spines,GES)缺陷、自由金屬顆粒(Free Metal Particles,F(xiàn)MP)缺陷、懸浮金屬顆粒(Suspended Metal Particles,SMP )缺陷、絕緣子表面固定金屬顆粒(Immobilization Metal Particles,IMP )缺陷、絕緣內(nèi)部氣泡(Internal Bubble,IB)缺陷。對六類故障缺陷局部放電產(chǎn)生的超聲信號進(jìn)行特性提取時(shí),選擇時(shí)域和頻域分析相結(jié)合的方法來進(jìn)行,分別在時(shí)域和頻域上選取5個(gè)和3個(gè)特征參數(shù)。時(shí)域上選取特征參數(shù)有:均方根(RMS)、方差(VAR)、絕對積分平均值(AVA)、峰度(BK)、偏度(BS);頻域上選取特征參數(shù)有:功率譜最大值(MPS)、中值頻率(MF)、平均功率頻率(MPF)。對每類故障缺陷提取特征參數(shù)500組,特征參數(shù)分布如圖1所示,橫坐標(biāo)表示各類故障類型的分組編號,縱坐標(biāo)表示每類故障對應(yīng)各特征參數(shù)的幅值大小。其中1~500是高壓導(dǎo)體突起(HVCP)放電特征參數(shù),501~1000是地電極尖刺(GES)放電特征參數(shù),1001~1500是懸浮金屬顆粒(SMP)放電特征參數(shù),1501~2000是自由金屬顆粒(FMP)放電特征參數(shù),2001~2500是絕緣子表面固定金屬顆粒(IMP)放電特征參數(shù),2501~3000是絕緣內(nèi)部氣泡(IB)放電特征參數(shù)。
圖1 特征參數(shù)分布圖
從圖1可知,不同特征參數(shù)對不同局部放電缺陷故障類型產(chǎn)生超聲波信號的區(qū)分度是不一樣的。比如AVA和RMS對絕緣內(nèi)部氣泡(IB)放電的區(qū)分度比較大,而VAR和MF對懸浮金屬顆粒(SMP)放電的區(qū)分度比較大。這些特征參數(shù)只能初步反應(yīng)不同類型的GIS局部放電超聲特性,利用這些特征參數(shù)結(jié)合分類算法可實(shí)現(xiàn)對GIS局部放電進(jìn)行準(zhǔn)確分類檢測。
從5000組超聲信號總體特征參數(shù)樣本庫中任意抽取1968組樣本做模式識別分類,每個(gè)缺陷類型各328組樣本,取訓(xùn)練樣本300組、測試樣本28組。輸出閾值設(shè)為0.5,權(quán)值取為(-1~1)之間隨機(jī)數(shù)值。
評價(jià)一個(gè)BP網(wǎng)絡(luò)設(shè)計(jì)的好壞,主要依據(jù)它的精度、訓(xùn)練時(shí)間以及迭代次數(shù)。BP神經(jīng)網(wǎng)絡(luò)性能受參數(shù)選擇的影響,現(xiàn)對學(xué)習(xí)速率、隱含層、目標(biāo)精度進(jìn)行參數(shù)調(diào)整,對比其識別效果。
(1) 設(shè)定目標(biāo)精度goal值為0.001,調(diào)整學(xué)習(xí)速率和隱含層
迭代次數(shù)越大,訓(xùn)練時(shí)間越短,網(wǎng)絡(luò)越優(yōu)秀,以此參考經(jīng)驗(yàn)標(biāo)準(zhǔn)對學(xué)習(xí)速率和隱含層參數(shù)進(jìn)行調(diào)整。取目標(biāo)精度goal為0.001,對隱含層分3種情況,分別采用相同學(xué)習(xí)速率進(jìn)行分析:
(a)隱含層結(jié)點(diǎn)數(shù)取23,分別取學(xué)習(xí)速率lr=0.1,lr=0.4,lr=0.8;(b)隱含層結(jié)點(diǎn)數(shù)取19,分別取學(xué)習(xí)速率lr=0.1,lr=0.4,lr=0.8;(c)隱含層結(jié)點(diǎn)數(shù)取16,分別取學(xué)習(xí)速率lr=0.1,lr=0.4,lr=0.8。對BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果統(tǒng)計(jì)見表1。
從表1可知,學(xué)習(xí)速率較小時(shí),訓(xùn)練時(shí)間通常較長,可以達(dá)到不錯(cuò)的訓(xùn)練識別效果。取隱含層結(jié)點(diǎn)數(shù)23和學(xué)習(xí)速率0.1時(shí),訓(xùn)練時(shí)間太長,不容易達(dá)到誤差精度要求、檢測識別率較低。識別率較好通常迭代次數(shù)也較大,訓(xùn)練時(shí)間通常也不會太短。
表1 目標(biāo)精度取0.001時(shí)BP訓(xùn)練結(jié)果統(tǒng)計(jì)表
(2)學(xué)習(xí)速率取0.4、隱含層結(jié)點(diǎn)數(shù)取19時(shí),將訓(xùn)練精度goal分別設(shè)為0.01、0.1與精度取0.001時(shí)的訓(xùn)練效果做對比。
訓(xùn)練精度為0.001時(shí),訓(xùn)練結(jié)果如圖2所示;訓(xùn)練精度為0.01時(shí),訓(xùn)練結(jié)果如圖3所示;訓(xùn)練精度為0.1時(shí),訓(xùn)練結(jié)果如圖4所示。效果對比統(tǒng)計(jì)見表2。
圖2 精度為0.001時(shí)訓(xùn)練結(jié)果分析圖
圖3 精度為0.01時(shí)訓(xùn)練結(jié)果分析圖
圖4 精度為0.1時(shí)訓(xùn)練結(jié)果分析圖
表2 不同精度的訓(xùn)練效果對比表
從圖2可以看出,當(dāng)目標(biāo)精度goal=0.001時(shí),均方誤差(Mean Squared Error,MSE)下降較快、也比較平穩(wěn),如圖2(b)所示,Regression線性回歸圖中R=0.998 31,接近于1,如圖2(d)所示,表示訓(xùn)練網(wǎng)絡(luò)輸出值和目標(biāo)值之間的線性度好,說明該網(wǎng)絡(luò)參數(shù)選取比較理想,檢測識別率較好。在圖3和圖4中,目標(biāo)精度goal分別取0.01和0.1時(shí),梯度變化不穩(wěn)定,Regression圖中,訓(xùn)練網(wǎng)絡(luò)輸出值和目標(biāo)值之間的線性度不理想,如圖3(d)和圖4(d)所示,有的數(shù)據(jù)訓(xùn)練錯(cuò)誤,主要是精度較低造成的,網(wǎng)絡(luò)性能較差,檢測識別率低。
從表2可知,其他參數(shù)不變時(shí),精度下降以后,訓(xùn)練時(shí)間大幅度縮短,迭代次數(shù)也大大降低,檢測成功率也降低。
綜合對比表1和表2,分析不同目標(biāo)精度、不同學(xué)習(xí)速率、不同隱含層訓(xùn)練結(jié)果統(tǒng)計(jì)可知,設(shè)置目標(biāo)精度0.001,學(xué)習(xí)速率取適中值0.4,隱含層結(jié)點(diǎn)數(shù)取19時(shí),檢測識別率92.2619%,實(shí)現(xiàn)了較為理想的效果,但是參數(shù)調(diào)節(jié)麻煩、運(yùn)行速度慢時(shí)間長不利于GIS局部放電在線檢測。
MATLAB內(nèi)部自帶的SVM函數(shù)包只可以完成二分類樣本測試,對于多分類的情況,需將二分類程序重新組合編寫,非常不方便,使六類GIS故障缺陷的分類檢測模式識別難以實(shí)現(xiàn),因此需要借助LIBSVM工具箱。LIBSVM工具箱操作簡單,可以有效而且快速地實(shí)現(xiàn)SVM回歸預(yù)測與模式識別。該工具箱提供了許多默認(rèn)參數(shù)可以使用戶使用SVM更舒適,使用時(shí)只需對很少的參數(shù)進(jìn)行調(diào)節(jié)。
為了跟BP神經(jīng)網(wǎng)絡(luò)識別效果做對比,訓(xùn)練與測試樣本數(shù)據(jù)的選擇、歸一化處理都與BP神經(jīng)網(wǎng)絡(luò)一樣,使用addpath函數(shù)調(diào)用LIBSVM工具箱。
(1) 無網(wǎng)格尋優(yōu)的SVM分類檢測識別效果
核函數(shù)優(yōu)先選擇徑向基核函數(shù)(RBF),對主要參數(shù)c、g進(jìn)行調(diào)整,以此做訓(xùn)練識別。分別取參數(shù):c=0.051,g=0.061;c=8.051,g=0.061;c=0.051,g=8.061;c=0.034,g=0.045;c=0.001,g=0.001;c=0.00001,g=0.00001。從系統(tǒng)運(yùn)行開始到結(jié)束運(yùn)行時(shí)間均約2秒(秒表計(jì)時(shí)),如圖5所示,每類缺陷測試樣本28組依次標(biāo)簽是ABCDEF分別代表高壓凸起、絕緣子表面固體金屬顆粒、懸浮電位、地電極尖刺、絕緣子內(nèi)部氣泡、自由金屬顆粒缺陷,其結(jié)果統(tǒng)計(jì)見表3。
圖5 無網(wǎng)格尋優(yōu)不同參數(shù)時(shí)的檢測識別效果圖
表3 SVM不同參數(shù)訓(xùn)練測試識別率統(tǒng)計(jì)表
從圖5可以看出,c=0.051,g=0.061及更小時(shí),A類高壓導(dǎo)體凸起缺陷幾乎無法正確識別,其識別率幾乎為零;c=8.051、g=0.061時(shí),c=0.051、g=8.061時(shí),F(xiàn)類自由金屬顆粒缺陷識別率都是最低的。
從表3可知,當(dāng)參數(shù)c取值不變,g一定幅度增大時(shí),識別率明顯提高;當(dāng)參數(shù)g取值不變,c增大時(shí),識別率也明顯提高;當(dāng)參數(shù)c、g取值低于某一值時(shí)識別率不再變化,因?yàn)閏值越小,算法對經(jīng)驗(yàn)誤差的懲罰越小,g值過小出現(xiàn)過擬合,影響樣本測試。在不使用網(wǎng)格參數(shù)尋優(yōu)時(shí),不能保證首次參數(shù)設(shè)置就能得到最佳的參數(shù)對、達(dá)到最好的識別效果,即需要不斷地重新調(diào)整參數(shù)對進(jìn)行對比修正向好的方向調(diào)整,這不利于GIS局部放電在線檢測。
(2) 網(wǎng)格尋優(yōu)SVM分類檢測識別效果
LIBSVM中提供交叉驗(yàn)證算法(k-Cross Validation)。訓(xùn)練集分為k份相等的子數(shù)據(jù)集,每一次將其中的k-1份數(shù)據(jù)用來訓(xùn)練,將另外一份數(shù)據(jù)用來測試,如此重復(fù)k次?;趉次迭代后所得MSE平均值來估計(jì)期望泛化誤差,最后選擇最優(yōu)的一組參數(shù)。留一法是k-交叉驗(yàn)證的一個(gè)特例,每次使用n-1個(gè)數(shù)據(jù)(n是訓(xùn)練集大小)作訓(xùn)練,用剩余一個(gè)數(shù)據(jù)作測試。
網(wǎng)格參數(shù)尋優(yōu)是嘗試可能出現(xiàn)的(c,g)參數(shù)值,進(jìn)行交叉驗(yàn)證,找出交叉驗(yàn)證中精確度最高的(c,g)參數(shù)對。網(wǎng)格參數(shù)尋優(yōu)看似愚蠢但是直接,利用網(wǎng)格尋優(yōu)有三個(gè)優(yōu)點(diǎn):(a)常見的逼近與啟發(fā)式方法,因其不是窮盡搜索而顯得不是很保險(xiǎn);(b)采用網(wǎng)格尋優(yōu)算法搜索得到好的參數(shù)對所需的時(shí)間短;(c)網(wǎng)格尋優(yōu)算法可進(jìn)行平行計(jì)算,也節(jié)約了時(shí)間。
網(wǎng)格參數(shù)尋優(yōu)(Grid Search)需要調(diào)用LIBSVM工具箱中的SVMcgForClass函數(shù),調(diào)用后,網(wǎng)絡(luò)會自動選擇最佳的(c,g)參數(shù)值,核函數(shù)優(yōu)先選擇徑向基核函數(shù)(RBF)。在程序中設(shè)置“ind=1”,即表示選擇使用網(wǎng)格參數(shù)尋優(yōu),用秒表測得運(yùn)行時(shí)間為8秒,測試識別準(zhǔn)確率高達(dá)99.4048%,有利于GIS局部放電在線檢測,識別效果如圖6所示。
圖6 網(wǎng)格尋優(yōu)SVM的檢測識別效果圖
通過不同算法的研究,可以得出基于超聲特性的GIS局部放電故障缺陷分類檢測效果。分別使用有、無網(wǎng)格尋優(yōu)算法的SVM與使用BP神經(jīng)網(wǎng)絡(luò)對GIS局部放電故障分類進(jìn)行檢測,效果對比見表4。對超聲信號特征總體樣本庫中剩余樣本分別用前文所述的BP神經(jīng)網(wǎng)絡(luò)與支持向量機(jī)做測試,結(jié)論與表4一致,這里不再贅述。
表4 有、無網(wǎng)格尋優(yōu)SVM與BP網(wǎng)絡(luò)效果對比表
從表4可知,在GIS局部放電缺陷故分類障檢測中,從參數(shù)調(diào)整、運(yùn)行速度、分類檢測準(zhǔn)確識別率綜合來看,基于網(wǎng)格尋優(yōu)算法結(jié)合LIBSVM工具包的支持向量機(jī)(SVM)比使用BP神經(jīng)網(wǎng)絡(luò)和無網(wǎng)格尋優(yōu)SVM更優(yōu)越,更適用于在線檢測。
以對六類GIS局部放電故障放電生成的超聲信號提取的特征參數(shù)為樣本,采用不同算法進(jìn)行檢測,得出以下結(jié)論:
(1) 基于BP神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)分類器實(shí)現(xiàn)了對六類GIS典型局部放電缺陷模型放電超聲特征的分類檢測模式識別,調(diào)整BP神經(jīng)網(wǎng)絡(luò)不同參數(shù)進(jìn)行了對比,說明不同BP網(wǎng)絡(luò)的參數(shù)設(shè)置對GIS局部放電故障缺陷分類檢測識別效果有影響,在參數(shù)選取合適的條件下可以得到較好識別效果,但參數(shù)調(diào)節(jié)麻煩、運(yùn)行時(shí)間長,該法不適合在線檢測。
(2) 引入基于網(wǎng)格尋優(yōu)算法結(jié)合LIBSVM工具包的支持向量機(jī)(SVM)對GIS局部放電故障分類檢測。對比有網(wǎng)格參數(shù)尋優(yōu)和無參數(shù)尋優(yōu)條件下SVM的分類效果,說明加入網(wǎng)格尋優(yōu)算法的SVM識別效果明顯更好、更便捷。
(3) 有、無網(wǎng)格尋優(yōu)SVM與BP神經(jīng)網(wǎng)絡(luò)相比,在GIS局部放電故障缺陷分類檢測中,從參數(shù)調(diào)整、網(wǎng)絡(luò)訓(xùn)練測試運(yùn)行速度、時(shí)間成本和檢測識別率綜合對比看,網(wǎng)格法參數(shù)尋優(yōu)結(jié)合LIBSVM工具包的支持向量機(jī)(SVM)更具有優(yōu)勢,在GIS局部放電故障在線檢測中更適用。由于該方法結(jié)合超聲波法檢測局部放電具有靈敏度高、不受電磁場影響、可實(shí)現(xiàn)在線定位的特點(diǎn),這將更有利于GIS局部放電故障在線檢測的工程實(shí)際應(yīng)用。