李永征 宗起振 包素麗
摘? ?要:針對(duì)目前變壓器油中溶解氣體分離后得到的色譜曲線(xiàn)基線(xiàn)存在抖動(dòng)、漂移、有異常點(diǎn),特別是在低濃度曲線(xiàn)干擾大、波形不規(guī)則,易出現(xiàn)對(duì)氣體色譜峰的誤判和漏判,導(dǎo)致氣體濃度值檢測(cè)偏差大,嚴(yán)重影響了故障診斷的準(zhǔn)確性等一系列問(wèn)題。采用了差分閾值濾波法、粗糙懲罰法以及粒子群優(yōu)化支持向量機(jī)等算法,對(duì)油氣分離后的色譜曲線(xiàn)序列數(shù)據(jù)中的一系列色譜峰進(jìn)行干擾峰識(shí)別、分類(lèi),并采用優(yōu)化半峰寬法計(jì)算出氣體濃度值。有效降低了色譜峰的漏判和誤判率,極大提高檢測(cè)氣體濃度值的穩(wěn)定性、準(zhǔn)確性和精確性。
關(guān)鍵詞:油中溶解氣體色譜峰; 支持向量機(jī); 粗糙懲罰法; 閾值濾波
中圖分類(lèi)號(hào):TP274? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1003—6199(2020)02—0078—04
Abstract:In view of the separation of dissolved gas in transformer oil chromatographic curve of jitter,baseline drift,have abnormal points,especially in low concentration curve interference,waveform is irregular,the misjudgement of gas chromatographic peak occurring and false negative,leads to the gas density detection deviation is big,seriously affected the accuracy of fault diagnosis and so on a series of problems. Differential threshold filtering method,rough penalty method,particle swarm optimization support vector machine and other algorithms are used to identify and classify a series of chromatographic peaks in the chromatographic curve sequence data after oil and gas separation,and the optimized half-peak width method is used to calculate the gas concentration value. It can effectively reduce the misjudgment and misjudgment rate of chromatographic peak,and greatly improve the stability,accuracy and accuracy of detection gas concentration value.
Key words:oil dissolved gas chromatographic peak;SVM;Roughness penalty method;threshold filtering
變壓器是電力系統(tǒng)中的核心設(shè)備,在變壓器本體中的絕緣油除了起到絕緣和冷卻作用外,油中的溶解氣體的濃度和組合比例還能實(shí)時(shí)反映出變壓器內(nèi)部是否存在缺陷、故障以及絕緣狀態(tài)等。因此,油中的溶解氣體的濃度和組合比例成為了變壓器實(shí)時(shí)監(jiān)測(cè)的最有效、最靈敏的手段,油中的溶解氣體在線(xiàn)監(jiān)測(cè)系統(tǒng)在變電站、發(fā)電廠、煤炭、鋼廠、石油化工等領(lǐng)域得到了日益廣泛的應(yīng)用[1-2]。但目前變壓器在線(xiàn)監(jiān)測(cè)系統(tǒng)中對(duì)油中溶解氣體分離后氣體的識(shí)別、分類(lèi)和計(jì)算過(guò)程中普遍存在偏差大、精度低和重復(fù)性比較差等一系列問(wèn)題,嚴(yán)重阻礙了油色譜在線(xiàn)監(jiān)測(cè)的推廣。同時(shí)用戶(hù)對(duì)變壓器在線(xiàn)監(jiān)測(cè)系統(tǒng)的性能、穩(wěn)定性和實(shí)用性提出了更高的要求,比如C2H2的精度由0.5 PPm提高到0.1 PPm,同一油樣數(shù)據(jù)的誤差由30%降低到10%,究其原因,除了裝置自身傳感器的原因外,更多的是在色譜峰識(shí)別過(guò)程中受色譜基線(xiàn)漂移大、雜波多以及所采用的色譜峰識(shí)別技術(shù)等因素有關(guān),目前對(duì)色譜峰的識(shí)別和分類(lèi)技術(shù)一般采用單一參數(shù)、模糊隸屬度以及灰色關(guān)聯(lián)度等方法[3-5],但在強(qiáng)干擾、高低溫、濕度大等環(huán)節(jié)惡劣的情況下容易出現(xiàn)對(duì)色譜峰的誤判和漏判,而采用多參數(shù)權(quán)重分析[6]雖在一定程度上提高了對(duì)色譜峰的誤判和漏判準(zhǔn)確性,但對(duì)色譜峰識(shí)別和分類(lèi)缺乏自適應(yīng)和自我學(xué)習(xí)能力,從而影響氣體濃度測(cè)量值的準(zhǔn)確性,因此如何降低色譜峰的漏判和誤判率以及提高色譜峰計(jì)算精度是至關(guān)重要的。
1? ?色譜曲線(xiàn)預(yù)處理
色譜曲線(xiàn)在強(qiáng)干擾、高溫、濕度大等環(huán)節(jié)惡劣的情況下易出現(xiàn)異常點(diǎn),所以先去掉異常點(diǎn),為后面數(shù)據(jù)處理打下基礎(chǔ)。
1.1? ?閾值濾波法
由于可以把色譜峰近似看成正態(tài)分布,基于數(shù)理統(tǒng)計(jì)中的3σ原則[7],數(shù)值分布在(μ-2σ,μ+2σ)中的置信度為0.9545,其中μ為均值,σ為標(biāo)準(zhǔn)差,由于標(biāo)準(zhǔn)差sd能反映一個(gè)數(shù)據(jù)集的離散程度,當(dāng)一個(gè)數(shù)據(jù)集中某個(gè)點(diǎn)的數(shù)值不在(μ-3σ,μ+3σ)中的概率為:1-0.9973=0.003,因此我們可以認(rèn)為此點(diǎn)為異常點(diǎn),在本文中對(duì)色譜曲線(xiàn)序列數(shù)據(jù)采用每5個(gè)數(shù)據(jù)為一個(gè)數(shù)據(jù)集,即n=5,如式(1)式所示,對(duì)每個(gè)數(shù)據(jù)集計(jì)算標(biāo)準(zhǔn)差?墜,如果數(shù)據(jù)集中數(shù)據(jù)點(diǎn)的標(biāo)準(zhǔn)差sd大于三倍標(biāo)準(zhǔn)差?墜的點(diǎn)即認(rèn)為是異常點(diǎn)ci,把ci替換為(ci - 1 + ci + 1)/2,依循查找出所有異常點(diǎn),得到無(wú)異常點(diǎn)新的色譜曲線(xiàn)序列.
1.2? ?粗糙懲罰平滑算法[8-9]
油中溶解氣體濃度越低時(shí),基線(xiàn)漂移大、干擾越大,雜波越多,越容易出現(xiàn)對(duì)色譜峰漏判和誤判,因此在數(shù)據(jù)處理前,需要采取相關(guān)措施對(duì)色譜數(shù)據(jù)進(jìn)行平滑濾波,提高色譜數(shù)據(jù)質(zhì)量,以便能更好的對(duì)干擾峰識(shí)別和分類(lèi)。所采用粗糙懲罰平滑算法,可以克服最小二乘法平滑時(shí)具有不穩(wěn)健性,具體就是在最小二乘目標(biāo)函數(shù)函數(shù)后面加上一個(gè)懲罰項(xiàng)如式(2)所示:
經(jīng)過(guò)變化可以得到,當(dāng):y* = (8)時(shí),S可以求得最小值,從而得到了平滑函數(shù)表達(dá)式。
上述(8)式中,y*為平滑后的數(shù)據(jù),λ通過(guò)去一法交互檢驗(yàn)可得到,這樣就可求得平滑后的色譜曲線(xiàn)。
1.3? ?色譜峰提取
油色譜的氣體峰型近似看成正態(tài)分布,因此一個(gè)完整峰特征點(diǎn)具有:局部最大值、局部左最小值、局部右最小值、左半峰為上升沿和右半峰為下降沿,根據(jù)這一特征,采用一階導(dǎo)數(shù)[10]特征的峰識(shí)別算法,具體步驟如下:
a、對(duì)平滑后的曲線(xiàn)數(shù)據(jù)設(shè)為y = f(x)其一階導(dǎo)數(shù)為,定義三種一階導(dǎo)數(shù)特征點(diǎn):局部最大值點(diǎn)、局部最小值和零點(diǎn)。
b、設(shè)x=x0,ε>0,在x0的鄰域d=(x0-ε,x0+ε)中有:f |(x0)≥f |(x),且x|d,則記為x0|dTMax,dTMax記為所有一階導(dǎo)數(shù)局部最大值點(diǎn)的集合,依次求出所有屬于dTMax集合的最大值點(diǎn)。
c、設(shè)x=x0,ε>0,在x0的鄰域d=(x0-ε,x0+ε)中有:f |(x0)≤f |(x0),且x|d,則記為x0|dTMin,dTMin記為所有一階導(dǎo)數(shù)局部最小值點(diǎn)的集合,依次求出所有屬于dTMin集合的最小值點(diǎn)。
d、設(shè)x=x0,有f |(x0)=0,則記為x0|dTZero,dTMin記為所有一階導(dǎo)數(shù)局部零點(diǎn)的集合,依次求出所有屬于dTZero集合的零點(diǎn)。
e、在所有一階導(dǎo)數(shù)特征點(diǎn)中搜索具有峰特征的峰:設(shè)ci為一階導(dǎo)數(shù)特征點(diǎn),i|(i,n),n為特征點(diǎn)個(gè)數(shù)。若ci-1|dTMax,ci|dTZero,ci+1|dTMin,則ci點(diǎn)為峰的最高點(diǎn),當(dāng)cj=max(m),cj|(dTmin | dTZero),且m < i-1,則cj為峰的起始點(diǎn).當(dāng)ck=min(m),cm|(dTmin | dTZero),且m>i+1,則ck為峰的結(jié)束點(diǎn),依次檢索出具有峰特征數(shù)據(jù)點(diǎn)的集合,記為Peaks集合。
2? ?色譜峰識(shí)別
在強(qiáng)干擾、高溫、濕度大等環(huán)節(jié)惡劣環(huán)境中,色譜容易出現(xiàn)基線(xiàn)抖動(dòng)、漂移、干擾大,在識(shí)別色譜峰過(guò)程中,容易造成色譜峰的誤判和漏判,同時(shí)對(duì)色譜峰的識(shí)別也缺乏自適應(yīng)和自我學(xué)習(xí)能力,從而造成氣體組分?jǐn)?shù)據(jù)測(cè)量失真,進(jìn)一步影響了故障診斷的準(zhǔn)確性,因此采取粒子群優(yōu)化支持向量機(jī)算法(PSO-SVM)[11-14]對(duì)色譜峰進(jìn)行識(shí)別,首先獲得油中溶解氣體分離后的氣體組分在不同溫度下主要是對(duì)低、中、高濃度的色譜峰特征量如幅度值、峰位(包括峰起點(diǎn)和峰終點(diǎn))、峰面積、峰寬等參數(shù)組成五維特征向量樣本組合,對(duì)每種氣體組分在不同溫度的低、中、高濃度分別選取250、130、76共456個(gè)樣本。把色譜峰分為H2、CH4、C2H2、C2H4、C2H6共五類(lèi)氣體組分,將樣本集設(shè)置為五種標(biāo)簽,如下表1所示:
將樣本集分成兩組:訓(xùn)練集和驗(yàn)證集,為提高SVM分類(lèi)器分類(lèi)性能和優(yōu)化計(jì)算,先對(duì)樣本進(jìn)行歸一化處理。其次,將樣本組合分成訓(xùn)練集和驗(yàn)證集,訓(xùn)練集有334個(gè)樣本,驗(yàn)證集有105個(gè)樣本。訓(xùn)練集和驗(yàn)證集中樣本分類(lèi)見(jiàn)表2。
采用帶慣性權(quán)重ω的粒子群優(yōu)化算法對(duì)支持向量機(jī)的核函數(shù)參數(shù)g和懲罰參數(shù)c進(jìn)行優(yōu)化,其中,選擇粒子群算法的主要參數(shù):群體規(guī)模m=20,慣性權(quán)重ω=0.95,加速常數(shù)c1=1.23,c2=1.41,Vmax= Gmax=0.1。通過(guò)訓(xùn)練,核函數(shù)參數(shù)g的最佳數(shù)據(jù)為0.62745,懲罰因子C的最佳數(shù)據(jù)為2.4962,然后對(duì)訓(xùn)練集樣本中的每個(gè)樣本進(jìn)行訓(xùn)練,得到訓(xùn)練模型,經(jīng)PSO-SVM分類(lèi)器的分類(lèi)準(zhǔn)確率高達(dá)98.6749%,最后采用訓(xùn)練良好的SVM 分類(lèi)器對(duì)122個(gè)驗(yàn)證集進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如表3所示。
在125個(gè)測(cè)試樣本中,有120個(gè)樣本的SVM分類(lèi)結(jié)果與其實(shí)際的色譜峰氣體組分情況相符合,即驗(yàn)證集分類(lèi)準(zhǔn)確率達(dá)到96.32%。因此采用訓(xùn)練良好的SVM 分類(lèi)器對(duì)上文所述色譜峰Peaks集合依次進(jìn)行預(yù)測(cè),就可以較高準(zhǔn)確的判斷出色譜峰屬于哪種氣體組分,同時(shí)計(jì)算出本次預(yù)測(cè)的置信度,如果本次置信度高,就把本次分類(lèi)結(jié)果存入訓(xùn)練集數(shù)據(jù)庫(kù)中。使訓(xùn)練集不斷得到矯正,使SVM 分類(lèi)器的分類(lèi)性能得到進(jìn)一步提高,從而也進(jìn)一步提高了色譜峰分類(lèi)和識(shí)別的準(zhǔn)確性。
3? ?色譜峰面積的計(jì)算[15]
由于色譜曲線(xiàn)在工程現(xiàn)場(chǎng)環(huán)境相對(duì)惡劣,而導(dǎo)致色譜基線(xiàn)存在漂移較大,峰寬較大以及重峰等現(xiàn)象,如下圖1所示,對(duì)峰面積的計(jì)算采用積分法,但嵌入式系統(tǒng)存在計(jì)算速度慢的問(wèn)題,特別是B點(diǎn)每次上下位置波動(dòng)很大時(shí),采用半高峰寬法誤差較大,計(jì)算誤差較大。因此為提高計(jì)算色譜峰氣體組分濃度的精度,采用優(yōu)化半峰寬法如圖1所示,計(jì)算相對(duì)簡(jiǎn)單且有效,由峰頂點(diǎn)C作時(shí)間坐標(biāo)(t)的垂直線(xiàn),交于AB與D,則CD為峰高(h),取CB中位點(diǎn),作AB的平行線(xiàn),與色譜峰兩邊相交于F和E,由F和E兩點(diǎn)作時(shí)間坐標(biāo)(t)的垂直線(xiàn),交時(shí)間坐標(biāo)(t)于G、H兩點(diǎn),此時(shí)GH為半高峰寬(b),色譜峰的峰面積為 w=h*b= CD*GH;通過(guò)建立氣體組分的峰面積-氣體濃度的校準(zhǔn)關(guān)系,即可求得氣體濃度值。
4? ?算法驗(yàn)證
本算法是在嵌入式Vxworks操作系統(tǒng)下實(shí)現(xiàn)的,Vxworks操作系統(tǒng)具有高實(shí)時(shí)性、可剪裁性、高可靠性,不僅可實(shí)現(xiàn)對(duì)多種監(jiān)測(cè)特征量的接入和轉(zhuǎn)出,而且易于軟件更新和功能擴(kuò)展。同時(shí)為驗(yàn)證本算法的性能和效果,為排除傳感器的干擾,測(cè)試數(shù)據(jù)采用在中國(guó)電力科學(xué)研究院測(cè)試用的原數(shù)據(jù)和測(cè)試結(jié)果,采用本色譜峰識(shí)別算法和優(yōu)化半峰寬面積算法,計(jì)算出氣體組分濃度范圍對(duì)比如表4所示,結(jié)果表明本算法在色譜峰識(shí)別率有不同程度上的提高,同時(shí)氣體濃度測(cè)量值在真實(shí)值上下波動(dòng),測(cè)量數(shù)據(jù)離散程度低,明顯減小了偏差范圍,從而使測(cè)量值更接近于真實(shí)值。對(duì)C2H2的檢測(cè)下限由0.5 PPm提高為0.2 PPm,提高了對(duì)C2H2檢測(cè)的靈敏度。
5? ?結(jié)? ?論
采用差分閾值濾波法、粗糙懲罰法以及粒子群優(yōu)化支持向量機(jī)、優(yōu)化半峰寬等算法對(duì)色譜曲線(xiàn)序列數(shù)據(jù)通過(guò)去噪、平滑、色譜峰識(shí)別、計(jì)算氣體濃度值等一系列流程,有效降低了對(duì)色譜峰的漏判和誤判率,極大提高了油中溶解氣體在線(xiàn)監(jiān)測(cè)裝置的實(shí)用性、穩(wěn)定性、準(zhǔn)確性和精確度,為變壓器內(nèi)部故障診斷奠定了基礎(chǔ),具有廣闊的推廣和使用價(jià)值。
參考文獻(xiàn)
[1]? ? 仲元昌,萬(wàn)能飛,夏艷,等.? 基于油氣參數(shù)分析的電力變壓器故障分步式診斷算法[J]. 高電壓技術(shù),2014,40(8):2279-2284.
[2]? ? 操敦奎. 變壓器油色譜分析與缺陷診斷[M]. 北京:中國(guó)電力出版社,2010.
[3]? ? 羅榮模,王泳濤. 色譜工作站中譜峰識(shí)別的設(shè)計(jì)與實(shí)現(xiàn)[J]. 中國(guó)計(jì)量學(xué)院學(xué)報(bào) 2003,14(1):24-28.
[4]? ? 胡勁松,周方潔,鮑吉龍,等. 基于模糊隸屬函數(shù)的變壓器色譜峰定性算法[J]. 電力系統(tǒng)自動(dòng)化 2005,29(18):70-72.
[5]? ? 曹建,范競(jìng)敏,安晨光. 灰色關(guān)聯(lián)度在變壓器油色譜峰辨識(shí)中的應(yīng)用[J]. 電網(wǎng)技術(shù) 2010,34(7):206-210.
[6]? ? 張煒,林,吳秋莉,等. 基于多參數(shù)權(quán)重分析的油中溶解氣體色譜峰識(shí)別[J]. 電力建設(shè) 2014,35(10):43-46.
[7]? ? 盛驟、謝式千、潘承毅. 概率論與數(shù)理統(tǒng)計(jì)[M].3版 北京:高等教育出版社,2001.
[8]? ? 徐海坤,曹創(chuàng)華,柳建新,等. 粗糙懲罰法在CSAMT數(shù)據(jù)處理中的應(yīng)用[J]. 工程地球物理學(xué)報(bào) 201512(3):304-310.
[9]? ? Oliveira Dinis、Larsson Ann I、Granhag Lena.Effect of ship hull form on the resistance penalty from biofouling [J]. Biofouling,2018,1-11.
[10]? 張萬(wàn)國(guó). 高等數(shù)學(xué)[M]. 北京:高等教育出版社,2011.
[11]? 鄭蕊蕊,趙繼印,趙婷婷,等. 基于遺傳支持向量機(jī)和灰色人工免疫算法的電力變壓器故障診斷[J]. 中國(guó)電機(jī)工程學(xué)報(bào),201l,31(7):56-63
[12]? 毛耀宗,陳珂,江弋,等. 基于粒子群算法與圖形處理器加速的支持向量機(jī)參數(shù)優(yōu)化方法[J]. 廈門(mén)大學(xué)學(xué)報(bào),2013,52(5):609-612.
[13]? 陳晉音,熊暉,鄭海斌. 基于粒子群算法的支持向量機(jī)的參數(shù)優(yōu)化 [J]. 計(jì)算機(jī)科學(xué),2018,45(6):609-612.
[14]? 袁海滿(mǎn),雷帆,陳宇,等. 基于DGA的粒子群相關(guān)向量機(jī)變壓器故障診斷 [J]. 高壓電器,2017,53(2):108-113.
[15]? 陳晉音,熊暉,鄭海斌. 基于粒子群算法的支持向量機(jī)的參數(shù)優(yōu)化 [J]. 計(jì)算機(jī)科學(xué),2018,45(6):609-612.
計(jì)算技術(shù)與自動(dòng)化2020年2期