常振磊,崔永建,荊 琳,王婷婷,王 平,楊青霄
中國(guó)石油華北油田公司,河北任丘 062552
隨著社會(huì)經(jīng)濟(jì)的發(fā)展,我國(guó)對(duì)石油和天然氣等一次能源的戰(zhàn)略需求不斷提升,管道作為油氣資源的主要運(yùn)輸方式近年來(lái)發(fā)展迅猛。在管道服役的同時(shí),因腐蝕、人員誤操作、第三方破壞、材料失效/斷裂、地質(zhì)災(zāi)害等造成的管道事故頻繁發(fā)生,引發(fā)環(huán)境污染,并給國(guó)家和人民造成巨大損失[1-2]。因此,對(duì)油氣管道的泄漏信息及運(yùn)行狀態(tài)進(jìn)行定量識(shí)別,提高檢測(cè)系統(tǒng)的準(zhǔn)確率顯得尤為重要。
目前,管道泄漏檢測(cè)的方法已逐步發(fā)展成熟,但尚沒(méi)有一種檢測(cè)方法適用于所有介質(zhì)和工況[3]。負(fù)壓波法對(duì)流體介質(zhì)無(wú)要求,適用于液體和氣體管道,只需在管道兩端增加壓力變送器即可,是油氣田應(yīng)用最為廣泛的泄漏檢測(cè)技術(shù),但基于油氣管道運(yùn)行工況的復(fù)雜性,負(fù)壓波采集到的有效信號(hào)會(huì)淹沒(méi)在噪聲中,因此如何對(duì)檢測(cè)信號(hào)進(jìn)行預(yù)處理、特征提取和工況識(shí)別是負(fù)壓波法應(yīng)用的難點(diǎn)[4]。為此,已有研究人員將經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)[5]、總體經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD)[6]、小波閾值去噪(WT)[7]、局部均值分解(LMD)[8]、快速傅里葉變換(FFT)[9]等方法應(yīng)用在信號(hào)預(yù)處理上,但這些算法均存在一定不足,EMD算法存在模態(tài)混疊和端點(diǎn)效應(yīng)的缺陷,EEMD算法分解時(shí)添加的高斯白噪聲信號(hào)無(wú)法完全消除,WT算法對(duì)小波基函數(shù)的選取和分解層數(shù)要求較高,LMD算法在信號(hào)解調(diào)的過(guò)程中易出現(xiàn)信號(hào)突增或突減現(xiàn)象,F(xiàn)FT算法在時(shí)頻域轉(zhuǎn)換的過(guò)程中對(duì)于高頻信號(hào)無(wú)法屏蔽,導(dǎo)致頻域特征無(wú)法識(shí)別。變分模態(tài)分解(VMD)算法由Dragomiretskiy在2014年提出[10],屬于自適應(yīng)分解算法,通過(guò)迭代計(jì)算不斷搜索中心頻率和帶寬,從而獲得模態(tài)分量,可有效抑制模態(tài)混疊?;诖?,采用VMD算法對(duì)負(fù)壓波信號(hào)進(jìn)行去噪處理,采用最小巴氏距離法確定分解層數(shù),并通過(guò)計(jì)算各固有模態(tài)分量(IMF)與原始信號(hào)概率密度函數(shù)間的歐氏距離確定有效信號(hào)數(shù)量,提取重構(gòu)信號(hào)的云模型熵值作為特征參數(shù),并輸入支持向量機(jī)(SVM)進(jìn)行工況識(shí)別,從而形成基于VMD-ED-云模型熵的管道運(yùn)行狀態(tài)定量識(shí)別技術(shù)。
VMD是一種自適應(yīng)、完全非遞歸的分解算法,可通過(guò)控制帶寬避免模態(tài)混疊,每個(gè)分解模態(tài)在解調(diào)成基帶信號(hào)后是平穩(wěn)的,因此算法在采樣和噪聲處理方面具有更強(qiáng)的魯棒性[11]。將原始信號(hào)分解為多個(gè)IMF分量之和,需滿足IMF的估計(jì)信號(hào)帶寬和最小,約束變分公式如下:
式中:?t為函數(shù)對(duì)時(shí)間的導(dǎo)數(shù);δ(t)為單位時(shí)間脈沖函數(shù);vk(t)={v1,…,vK},為分解得到的K個(gè)IMF分量;ωk為每個(gè)模態(tài)分量的頻率中心點(diǎn);*為卷積運(yùn)算;f為原始信號(hào);j為虛部;min為最小化函數(shù);s.t.為約束條件。
引入拉格朗日算子λ和二次懲罰因子a對(duì)式(1)進(jìn)行求解,將約束變分問(wèn)題轉(zhuǎn)化為非約束變分問(wèn)題,引入增廣Lagrangian函數(shù)F。
利用交替方向乘子算法不斷更新vk(t)、wk和λ,求解非約束變分問(wèn)題,并進(jìn)行中心頻率更新。
式中:n為迭代次數(shù);為第n+1次迭代的vk統(tǒng)計(jì)學(xué)估計(jì)量。
在迭代計(jì)算的過(guò)程中,當(dāng)收斂閾值滿足終止條件時(shí),停止更新模態(tài)分量的帶寬和中心頻率,循環(huán)結(jié)束。根據(jù)實(shí)際頻域特征得到IMF分量,但在去噪的過(guò)程中,分解數(shù)K值的設(shè)置和分解后有效模態(tài)的選取將直接影響去噪效果。
K值過(guò)大,VMD分解后同一頻率的信號(hào)易分解到不同的IMF分量中,出現(xiàn)模態(tài)混疊;K值過(guò)小,同一IMF分量中易出現(xiàn)不同頻率信號(hào),出現(xiàn)有用信號(hào)缺失。最佳K值應(yīng)保證IMF分量與頻率信號(hào)一一對(duì)應(yīng)。在此,通過(guò)循環(huán)計(jì)算不同K值下各IMF分量的最小巴氏距離(BD)確定最優(yōu)K值[12]。
對(duì)于同一時(shí)域信號(hào)中的兩個(gè)序列樣本M和N,BD的計(jì)算公式為:
式中:BC(M,N)為兩樣本間的巴氏系數(shù)。
BD值越小,說(shuō)明兩個(gè)模態(tài)之間越相似,當(dāng)BD小于閾值時(shí),認(rèn)為存在過(guò)分解和模態(tài)混疊現(xiàn)象。
確定K值后,每個(gè)IMF分量中包含的原始信號(hào)信息有所不同,通常認(rèn)為與原始信號(hào)相關(guān)性較大的IMF分量為有效分量,反之為無(wú)效分量。管道泄漏信號(hào)屬連續(xù)隨機(jī)變量,其概率密度函數(shù)(pdf)可用于描述信號(hào)分解后的完全特征。通過(guò)計(jì)算歐氏距離(ED)對(duì)比不同IMF分量與原始信號(hào)pdf間的相似程度,從而確定有效信號(hào)數(shù)量,相似函數(shù)L:
式中:ED為歐氏距離函數(shù);pdf(f(t))為原始信號(hào)的概率密度函數(shù);pdf(IMFk(t))為第k個(gè)IMF分量的概率密度函數(shù)。
通過(guò)定義公式(5)的最大增量θ確定有效分量和無(wú)效分量的分界點(diǎn):
特征選擇和提取是影響管道運(yùn)行狀態(tài)識(shí)別的主要因素,在此采用云模型熵值進(jìn)行特征提取,通過(guò)逆向云發(fā)生器將定向數(shù)據(jù)轉(zhuǎn)化為定性語(yǔ)言[13],根據(jù)采樣頻率和截取的負(fù)壓波信號(hào),計(jì)算采樣時(shí)間內(nèi)的期望,隨后計(jì)算特征熵值,公式如下:
式中:p為采樣點(diǎn)個(gè)數(shù);yi為信號(hào)幅值;Ex為數(shù)學(xué)期望;En為特征熵值。
SVM分類算法屬于有監(jiān)督學(xué)習(xí),通過(guò)在特征空間上定義間隔最大的線性分類器實(shí)現(xiàn)求解凸二次規(guī)劃問(wèn)題。由于SVM算法本質(zhì)是一個(gè)二值分類器,在此采用一對(duì)一法實(shí)現(xiàn)多分類,g個(gè)類別對(duì)應(yīng)g(g-1)/2個(gè)分類器,通過(guò)投票器獲得不同樣本的類別。其算法原理參照文獻(xiàn)[14-15]。
根據(jù)對(duì)VMD、最小巴氏距離、歐氏距離、云模型特征熵和SVM算法的研究,提出了基于VMDED-云模型熵模型的管道運(yùn)行狀態(tài)識(shí)別方法,流程見(jiàn)圖1,步驟分為四個(gè)。
圖1 模型流程
(1)在現(xiàn)場(chǎng)采氣井和集氣站分別安裝負(fù)壓波傳感器、北斗定位系統(tǒng)和采集器進(jìn)行信號(hào)采集,在中間測(cè)試點(diǎn)安裝不同孔徑的放空管件模擬管道泄漏,在測(cè)試點(diǎn)用管鉗擊打管道外壁模擬敲擊,獲得管道不同運(yùn)行狀態(tài)下的負(fù)壓波信號(hào)。
(2)通過(guò)計(jì)算最小巴氏距離確定VMD算法模態(tài)分解的K值。
(3)計(jì)算各pdf之間的歐氏距離獲得有效信號(hào)與無(wú)效信號(hào)的分界點(diǎn),并提取有效信號(hào)進(jìn)行重構(gòu)。
(4)提取重構(gòu)信號(hào)的En值作為信號(hào)的特征變量,將樣本特征變量輸入SVM分類器中實(shí)現(xiàn)運(yùn)行狀態(tài)的有效識(shí)別。
選擇某區(qū)塊采氣井為上游,集氣站為下游,管徑60 mm,壁厚5~6 mm,采集器采樣頻率為1 000 Hz,井口壓力0.2~0.5 MPa,采集器將負(fù)壓波信號(hào)攜帶北斗時(shí)間標(biāo)簽上傳至監(jiān)測(cè)中心,監(jiān)測(cè)中心負(fù)責(zé)收集采氣井和集氣站的聲波信號(hào),并進(jìn)行綜合分析和診斷。實(shí)驗(yàn)共獲得正常、敲擊、小孔泄漏、大孔泄漏4種信號(hào),定義泄漏孔徑/管徑≤0.2為小孔泄漏,小孔泄漏取10 mm,大孔泄漏取管徑的80%為50 mm,每種信號(hào)類型獲得50組實(shí)驗(yàn)數(shù)據(jù),其中一組的時(shí)域波形及頻譜圖見(jiàn)圖2~圖5,圖中顯示的為上游波形信號(hào)。其中敲擊信號(hào)表現(xiàn)為幅值突變,但持續(xù)時(shí)間較短;泄漏信號(hào)中小孔泄漏呈緩慢下降趨勢(shì),壓力突變點(diǎn)較難識(shí)別,大孔泄漏先快速下降隨后又上升至較之前較小的幅值,兩者的頻譜圖中除低頻段信息較豐富外,還存在一定的高頻噪聲信息。
圖2 正常信號(hào)
圖3 敲擊信號(hào)
圖4 小孔泄漏信號(hào)
圖5 大孔泄漏信號(hào)
以大孔泄漏信號(hào)為例,設(shè)置初始K=2,二次懲罰因子a=2 000,依次取K=K+1進(jìn)行VMD算法分解,并計(jì)算不同K值下各IMF分量的最小BD距離,見(jiàn)圖6。設(shè)置閾值為0.001,當(dāng)K值取9、10、11時(shí),最小BD距離趨于0,說(shuō)明有部分IMF分量存在相似情況,VMD分解出現(xiàn)了過(guò)分解,故最佳K值取8。
圖6 不同K值下的最小BD距離
計(jì)算原始信號(hào)與IMF1~I(xiàn)MF8之間pdf的歐氏距離,見(jiàn)圖7。根據(jù)式(6),IMF4和IMF5之間的增量最大,故選擇IMF4為有效分量和無(wú)效分量的分界點(diǎn),IMF1~I(xiàn)MF3作為有效分量,IMF4~I(xiàn)MF8作為噪聲分量。
圖7 不同IMF的歐氏距離
對(duì)IMF1~I(xiàn)MF3進(jìn)行信號(hào)重構(gòu),得到濾波信號(hào),時(shí)域波形及頻譜圖見(jiàn)圖8。濾波后的信號(hào)完好保存了低頻信息,有效信息集中在50 Hz以內(nèi),高頻信號(hào)明顯被平滑去除。
圖8 濾波后的大孔泄漏信號(hào)
采用逆向云發(fā)生器求解濾波后采樣周期內(nèi)正常、敲擊、小孔泄漏、大孔泄漏信號(hào)的云模型特征熵值En,見(jiàn)圖9。其中每種工況下的云模型特征熵值均不同,且差異較大,大泄漏信號(hào)的En值最大且波動(dòng)較大,正常和敲擊信號(hào)的En值較小且較平穩(wěn),正常信號(hào)與小孔泄漏的En值不足敲擊信號(hào)的一半且差異較小,但兩者尚無(wú)交叉現(xiàn)象。
圖9 不同工況下的云模型特征熵值
采用Matlab R2021a中的libsvm工具箱進(jìn)行運(yùn)行狀態(tài)識(shí)別,每種狀態(tài)取40組作為訓(xùn)練集,10組作為測(cè)試集,將正常、敲擊、小孔泄漏、大孔泄漏信號(hào)分別設(shè)置為0、1、2、3的標(biāo)簽,將云模型特征熵值輸入到SVM模型中,SVM的核函數(shù)選擇RBF徑向基核函數(shù),采用網(wǎng)格搜索法對(duì)SVM超參數(shù)的范圍進(jìn)行初始設(shè)定,核函數(shù)寬度范圍為[0,10],懲罰因子范圍為[0,5],對(duì)預(yù)估超參數(shù)的組合通過(guò)5折交叉驗(yàn)證確定得分平均值,確定最優(yōu)參數(shù),最大迭代次數(shù)200,迭代軌跡過(guò)程見(jiàn)圖10。最終得到核函數(shù)寬度為6.72,懲罰因子為1.04,測(cè)試集的分類結(jié)果見(jiàn)圖11。敲擊和大孔泄漏信號(hào)的分類準(zhǔn)確率為100%,而正常和小孔泄漏信號(hào)分別有一個(gè)分類錯(cuò)誤,其中一個(gè)正常信號(hào)錯(cuò)分為小孔泄漏信號(hào),一個(gè)小孔泄漏信號(hào)錯(cuò)分為正常信號(hào),小孔泄漏屬緩慢泄漏,其信號(hào)幅值的下降緩慢,當(dāng)外界存在較多噪聲時(shí),有效信號(hào)會(huì)直接淹沒(méi)在背景噪聲中,故辨認(rèn)效果有限。
圖10 SVM模型超參數(shù)迭代過(guò)程
圖11 測(cè)試集樣本分類結(jié)果
本文模型主要將VMD、ED和SVM算法相結(jié)合,為驗(yàn)證本文組合模型的優(yōu)勢(shì),從信號(hào)預(yù)處理、特征提取和工況識(shí)別等三個(gè)方面進(jìn)行對(duì)比驗(yàn)證。首先,固定ED和SVM算法,在信號(hào)預(yù)處理上選取原始信號(hào)和EEMD算法進(jìn)行對(duì)比;其次,固定VMD和SVM算法,在特征提取上選取信息熵(IE)、排列熵(PE)、樣本熵(SE)進(jìn)行對(duì)比,其中每組信號(hào)的尺度因子取20,取樣本熵值的平均值計(jì)算;最后,固定VMD和ED算法,選擇廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)、極限學(xué)習(xí)機(jī)(ELM)進(jìn)行對(duì)比,GRNN和ELM算法的隱含層節(jié)點(diǎn)數(shù)采用試湊法,確定GRNN算法的網(wǎng)絡(luò)結(jié)構(gòu)為1-5-4型,ELM算法的網(wǎng)絡(luò)結(jié)構(gòu)為1-7-4型,模型超參數(shù)采用窮舉法確定。不同模型的對(duì)比結(jié)果見(jiàn)表1。
表1 不同模型在數(shù)據(jù)集上的分類結(jié)果
當(dāng)信號(hào)不進(jìn)行降噪預(yù)處理時(shí),分類效果最差,且訓(xùn)練集和測(cè)試集上的分類準(zhǔn)確率相差較多;采用EEMD算法的降噪效果不及VMD算法,說(shuō)明采用VMD算法進(jìn)行信號(hào)預(yù)處理的必要性。對(duì)比不同特征提取方式,本文方法與IE、PE、SE相比,分類準(zhǔn)確度均有所提升,其中IE在計(jì)算過(guò)程中過(guò)度依賴數(shù)據(jù)長(zhǎng)度,PE未考慮不同頻段信號(hào)幅值之間的關(guān)系,SE易受突變點(diǎn)信號(hào)的影響,出現(xiàn)計(jì)算偏差,而云模型特征熵?zé)o需設(shè)置尺度因子、嵌入維數(shù)和相似容限等參數(shù),避免了參數(shù)不確定性帶來(lái)的計(jì)算偏差,其熵值中包含重要的運(yùn)行狀態(tài)信息,且信息不重疊、不交叉。對(duì)比工況識(shí)別方法,SVM算法較GRNN和ELM算法的分類準(zhǔn)確度有所提升,這可能與神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)結(jié)構(gòu)有關(guān),而SVM算法只需將數(shù)據(jù)映射到超平面即可實(shí)現(xiàn)分類,其實(shí)現(xiàn)方法較為簡(jiǎn)單,魯棒性較好。綜上所述,本文提出的組合模型可對(duì)不同運(yùn)行狀態(tài)進(jìn)行定量識(shí)別,該方法具有可行性和合理性。
(1)針對(duì)管道運(yùn)行狀態(tài)在檢測(cè)過(guò)程中識(shí)別困難的問(wèn)題,提出一種新的負(fù)壓波信號(hào)處理方法,分別采用VMD、ED和SVM模型進(jìn)行信號(hào)預(yù)處理、特征提取和工況識(shí)別,其中VMD算法在信號(hào)去噪上具有明顯的優(yōu)越性,可獲得平滑度更高、失真度更小的低頻有效信號(hào),有利于提高后續(xù)工況識(shí)別的準(zhǔn)確性。
(2)基于VMD-ED-云模型熵模型的管道運(yùn)行狀態(tài)識(shí)別方法在訓(xùn)練集上的分類準(zhǔn)確率為100%,測(cè)試集上的分類準(zhǔn)確率為95%,明顯高于其余對(duì)比模型,說(shuō)明了組合模型具有可行性和合理性。
(3)在實(shí)際運(yùn)行中,多孔泄漏也是常見(jiàn)的工況條件,下一步應(yīng)針對(duì)不同泄漏孔徑下多孔泄漏進(jìn)行信號(hào)處理,提高模型對(duì)復(fù)雜工況的適用性。