朱宗玖, 王寧
(安徽理工大學(xué)電氣與信息工程學(xué)院, 淮南 232001)
相位敏感光時(shí)域反射儀具有分布式測(cè)量、抗干擾能力強(qiáng)、靈敏度高等優(yōu)點(diǎn)[1-2],被廣泛應(yīng)用于能源輸送管道安全預(yù)警[3]、輸電線狀態(tài)監(jiān)測(cè)[4]、工程結(jié)構(gòu)安全監(jiān)測(cè)[5]、周界安防[6]等領(lǐng)域。然而,在實(shí)際的相位敏感光時(shí)域反射儀(phase sensitive optical time domain reflectometer, Φ-OTDR)系統(tǒng)中,傳感光纖所處的環(huán)境復(fù)雜多變,天氣變化、動(dòng)物活動(dòng)及行人誤碰等因素的影響而產(chǎn)生的干擾可能會(huì)引起假報(bào)警,從而導(dǎo)致系統(tǒng)具有較高的誤報(bào)率[7]。目前有兩種方法用于降低Φ-OTDR系統(tǒng)的誤報(bào)率,一是改進(jìn)硬件結(jié)構(gòu),如采用Φ-OTDR與馬赫-曾德爾干涉儀或邁克爾遜干涉儀相結(jié)合的方式,但該方法成本高且硬件結(jié)構(gòu)復(fù)雜[8]。二是選優(yōu)化模式識(shí)別算法,提高振動(dòng)事件識(shí)別的準(zhǔn)確率,進(jìn)而降低系統(tǒng)誤報(bào)率[9]。
為了在降低Φ-OTDR系統(tǒng)誤報(bào)率的同時(shí)避免增加系統(tǒng)成本和復(fù)雜性,通常采用第二種方法。Wang等[10]提出了一種基于深度雙路徑網(wǎng)絡(luò)的模式識(shí)別方法,對(duì)鐵路周邊的7種擾動(dòng)事件進(jìn)行分類,準(zhǔn)確率達(dá)到97%,但更深的網(wǎng)絡(luò)結(jié)構(gòu)導(dǎo)致振動(dòng)信號(hào)分類時(shí)間變得更長(zhǎng)。Saleh等[11]采用變分模態(tài)分解(variational mode decomposition,VMD)和線性支持向量機(jī)(linear support vector machine,LSVM)對(duì)擾動(dòng)信號(hào)進(jìn)行分類,在信噪比為-4~-8 dB和-8~-16 dB的情況下分類精度分別達(dá)到79.5%和75.2%,識(shí)別的準(zhǔn)確率較低。Zhou等[12]提出了一種YOLO(you only look once)與光纖振動(dòng)傳感系統(tǒng)相結(jié)合的方法對(duì)振動(dòng)信號(hào)進(jìn)行分類,但該方法只能識(shí)別單一類型的事件。
為了降低Φ-OTDR系統(tǒng)的誤報(bào)率,縮短振動(dòng)事件識(shí)別時(shí)間,提出一種多域特征提取與PSO-SVM相結(jié)合的模式識(shí)別算法。在特征提取階段,對(duì)振動(dòng)信號(hào)進(jìn)行差分處理后通過(guò)小波包分解得到信號(hào)的能量特征,并與差分信號(hào)的時(shí)域特征相結(jié)合構(gòu)成特征向量。在信號(hào)分類階段,利用粒子群算法優(yōu)化SVM分類器參數(shù),并借助Ф-OTDR事件數(shù)據(jù)集進(jìn)行驗(yàn)證。該方法突破了單一特征參量目標(biāo)識(shí)別易受到干擾的問(wèn)題,提高了多種擾動(dòng)事件識(shí)別的準(zhǔn)確性。
Φ-OTDR系統(tǒng)通過(guò)檢測(cè)傳感光纖中后向瑞利散射光的相位變化獲取外界擾動(dòng)信息[13]。傳感光纖不受外界擾動(dòng)影響時(shí),系統(tǒng)產(chǎn)生的后向瑞利散射光相位近似保持穩(wěn)定;當(dāng)外界擾動(dòng)作用在傳感光纖上的某一段時(shí),該位置后向瑞利散射光的相位發(fā)生相應(yīng)變化,且變化幅度與擾動(dòng)事件種類相關(guān),通過(guò)對(duì)后向瑞利散射光強(qiáng)度進(jìn)行解調(diào),即可得到擾動(dòng)信息。
在Φ-OTDR系統(tǒng)中,函數(shù)發(fā)生器(function generator,FG)產(chǎn)生脈沖,激光器發(fā)出的連續(xù)光經(jīng)聲光調(diào)制器(atoracousto-optical modulators,AOM)后轉(zhuǎn)換為光脈沖信號(hào),該光脈沖信號(hào)被輸入到摻鉺光纖放大器(erbium-doped fiber amplifier,EDFA)以提高輸入功率,然后經(jīng)環(huán)行器進(jìn)入到傳感光纖中,產(chǎn)生的瑞利散射光通過(guò)環(huán)行器反射回光電探測(cè)器(photoelectric detector,PD),接收到的信號(hào)由數(shù)據(jù)采集卡(data acquisition card,DAQ)采集,最后將數(shù)字信號(hào)存儲(chǔ)在計(jì)算機(jī)上以用于后續(xù)分析。Φ-OTDR系統(tǒng)結(jié)構(gòu)如圖1所示。
圖1 Φ-OTDR系統(tǒng)結(jié)構(gòu)Fig.1 Φ-OTDR system structure
當(dāng)Φ-OTDR系統(tǒng)受到外界擾動(dòng)事件影響時(shí),光纖振動(dòng)信號(hào)的某些特征會(huì)發(fā)生相應(yīng)變化,利用這些特征可以有效識(shí)別擾動(dòng)事件種類。特征量較少會(huì)導(dǎo)致系統(tǒng)魯棒性差、誤報(bào)率高,因此采用多域特征提取來(lái)提高系統(tǒng)對(duì)擾動(dòng)事件識(shí)別的準(zhǔn)確率,增強(qiáng)系統(tǒng)的穩(wěn)定性。
2.1.1 時(shí)域特征提取
時(shí)域特征值是衡量信號(hào)特征的重要指標(biāo)。根據(jù)光纖振動(dòng)信號(hào)時(shí)域波形中隱含的信息,如最大值、峰峰值、方差等,可以對(duì)擾動(dòng)事件的種類進(jìn)行識(shí)別。在提取光纖振動(dòng)信號(hào)的時(shí)域特征時(shí),為了消除數(shù)據(jù)本身的影響,首先對(duì)數(shù)據(jù)進(jìn)行差分處理,然后再進(jìn)行特征提取。從時(shí)域差分信號(hào)中提取的15個(gè)時(shí)域特征分別為:最大值、最小值、峰峰值、均值、方差、整流平均值、標(biāo)準(zhǔn)差、方根幅值、均方根、峰值因子、波形因子、峭度因子、脈沖因子、裕度因子、偏度因子。
2.1.2 小波包能量特征提取
光纖振動(dòng)信號(hào)的統(tǒng)計(jì)特性隨時(shí)間變化,即為非平穩(wěn)信號(hào)。小波變換保留了傅里葉變換對(duì)信號(hào)頻率的分析,同時(shí)又引入了時(shí)間分辨率的概念,對(duì)于復(fù)雜多變的非平穩(wěn)信號(hào),可以進(jìn)行有效特征提取[14]。由于其固有性質(zhì),小波變換主要是對(duì)信號(hào)的低頻成分進(jìn)行處理,而對(duì)于光纖振動(dòng)信號(hào),需同時(shí)知曉它的低頻與高頻信息,以便全面的獲取信號(hào)信息。小波包變換解彌補(bǔ)了小波變換對(duì)光纖振動(dòng)信號(hào)高頻部分分解的不足,可以對(duì)信號(hào)的全頻分量進(jìn)行分解,避免了信號(hào)特征的缺失。小波包分解原理如圖2所示。
圖2 小波包分解原理圖Fig.2 Principle diagram of wavelet packet decomposition
通過(guò)小波變換對(duì)信號(hào)S0,0做N層分解,則信號(hào)S0,0可表示為
S0,0=SN,0+SN,1+…+SN,2N-1
(1)
式(1)中:SN,0,SN,1,…,SN,2N-1為信號(hào)S0,0經(jīng)N層小波包分解后的子頻帶,則有
(2)
式(2)中:t為時(shí)間;i=0,1,…,2N-1;EN,i為子頻帶SN,i的能量。
由此提取光纖振動(dòng)信號(hào)的小波包能量作為特征值,并結(jié)合時(shí)域特征組成特征向量。
2.2.1 支持向量機(jī)
支持向量機(jī)(SVM)是一種從統(tǒng)計(jì)學(xué)習(xí)理論中衍生出來(lái)的二分類算法,已被廣泛應(yīng)用于模式識(shí)別[15-16]。其基本原理是對(duì)于非線性可分的數(shù)據(jù),通過(guò)非線性映射函數(shù)轉(zhuǎn)換到高維空間實(shí)現(xiàn)分類。
假設(shè)光纖振動(dòng)信號(hào)的數(shù)據(jù)集T={(x1,y1),(x2,y2),…(xn,yn)},yi∈{-1,1},其中,i=1,2,…,n;xi為振動(dòng)信號(hào)的特征向量集合;yi為振動(dòng)信號(hào)種類的標(biāo)簽,其分類超平面可表示為
f(x)=ωTx+b
(3)
式(3)中:ω為權(quán)系數(shù)向量;x為樣本空間內(nèi)任意一點(diǎn);b為偏置。
在SVM分類器中引入松弛變量ξi≥0,以容忍異常數(shù)據(jù), 此時(shí)超平面求解問(wèn)題變?yōu)榧s束條件下的凸函數(shù)優(yōu)化問(wèn)題,可表示為
(4)
式(4)中:c為懲罰系數(shù),用于控制不滿足最小區(qū)間的數(shù)據(jù)樣本的貢獻(xiàn),當(dāng)樣本分類錯(cuò)誤時(shí),c越大,代表懲罰程度越重。
采用擬采用高斯核函數(shù)將x映射到高維空間φ(x)上,使樣本空間線性可分,其中φ為映射函數(shù)。高斯核函數(shù)k(xi,xj)的表達(dá)式為
(5)
因此,可通過(guò)對(duì)參數(shù)c和g進(jìn)行優(yōu)化以提高SVM分類器的分類精度。
2.2.2 粒子群算法
粒子群算法(particle swarm optimization,PSO)是一種能夠在全局范圍內(nèi)進(jìn)行參數(shù)尋優(yōu)的群體智能優(yōu)化算法[17-18]。PSO算法將待優(yōu)化問(wèn)題的每種解轉(zhuǎn)化為D維空間中包含N個(gè)粒子的粒子群,在每次迭代期間,粒子的速度和位置保持不變,在下一次迭代中,每個(gè)粒子根據(jù)當(dāng)前個(gè)體最優(yōu)位置與群體最優(yōu)位置運(yùn)動(dòng),最終獲得最優(yōu)解。粒子的速度和位置分別由式(6)、式(7)確定。
(6)
(7)
懲罰因子c和核函數(shù)參數(shù)g對(duì)SVM分類器的性能起著決定性的作用,利用粒子群算法對(duì)SVM的參數(shù)c和g的選擇進(jìn)行優(yōu)化。
基于PSO-SVM的光纖振動(dòng)信號(hào)識(shí)別流程如圖3所示。該算法的主要步驟如下。
圖3 光纖振動(dòng)信號(hào)識(shí)別流程圖Fig.3 Optical fiber vibration signal recognition flow chart
步驟1數(shù)據(jù)預(yù)處理。提取光纖振動(dòng)信號(hào)的時(shí)域特征和小波包能量特征,并對(duì)特征向量進(jìn)行歸一化處理。
步驟2SVM分類器模型構(gòu)建。選擇高斯核函數(shù)作為SVM分類器的核函數(shù),初始化懲罰因子c和核函數(shù)參數(shù)g。
步驟3參數(shù)優(yōu)化。初始化粒子群后對(duì)參數(shù)c和g編碼,利用數(shù)據(jù)集對(duì)c和g的選擇進(jìn)行優(yōu)化,構(gòu)建最優(yōu)SVM分類器模型。
步驟4振動(dòng)事件識(shí)別。利用優(yōu)化后的SVM分類器對(duì)光纖振動(dòng)信號(hào)進(jìn)行識(shí)別。
為了驗(yàn)證本文算法的有效性,利用北京交通大學(xué)Ф-OTDR事件數(shù)據(jù)集[19]進(jìn)行研究,該數(shù)據(jù)集包含背景噪聲、挖掘、敲擊、澆水、搖晃和行走6類典型事件,每個(gè)事件的時(shí)空信號(hào)樣本在時(shí)域上由10 000個(gè)點(diǎn)組成,在空域上由12個(gè)相鄰的空間點(diǎn)組成。數(shù)據(jù)集中每種事件對(duì)應(yīng)的樣本數(shù)量如表1所示。
表1 6種事件對(duì)應(yīng)的樣本數(shù)量Table 1 Number of samples corresponding to the six events
對(duì)6種事件進(jìn)行差分處理后的結(jié)果如圖4所示。從圖中可以看出,背景噪聲在時(shí)域和空域中分布均勻且強(qiáng)度低;挖掘和敲擊事件都有一個(gè)明顯的峰值,由于泥沙的回流作用,挖掘事件具有較長(zhǎng)的時(shí)間分布;澆水和搖晃事件在時(shí)域中都為連續(xù)信號(hào);根據(jù)人走路的步頻,行走事件在單個(gè)樣本中具有多個(gè)不同的峰值。
特征的類間距離與類內(nèi)距離之比可以表征其識(shí)別能力,提取的特征要盡可能使不同模式的信號(hào)具有較大的類間距離,相同模式的信號(hào)特征具有較小的類內(nèi)距離,且需要考慮減少數(shù)據(jù)量以方便后續(xù)運(yùn)算。因此,在對(duì)振動(dòng)信號(hào)進(jìn)行時(shí)域特征提取時(shí)選擇8個(gè)類間距離大、類內(nèi)距離小的特征,分別為最大值、最小值、峰峰值、方差、整流平均值、均方根、峰值因子和裕度因子。根據(jù)8個(gè)特征的類間距離,從中隨機(jī)選取20個(gè)樣本第六空間采樣點(diǎn)中區(qū)別較為明顯的兩個(gè)特征,如圖5所示。
圖5 6種擾動(dòng)事件的兩個(gè)時(shí)域特征Fig.5 Two time-domain characteristics of six disturbance events
光纖振動(dòng)信號(hào)經(jīng)過(guò)小波包分解成不同分布的子頻段,隨分解層數(shù)的增多,信號(hào)頻帶劃分的越精細(xì),提取到的信號(hào)信息越豐富,但分解信號(hào)所需時(shí)間將大大延長(zhǎng),且提取的特征向量維度將呈指數(shù)級(jí)增加,延長(zhǎng)分類算法的計(jì)算時(shí)間,因此分解層數(shù)并不能越多越好。為了確定小波包分解的最佳層數(shù),對(duì)數(shù)據(jù)集中的樣本采用db3小波基進(jìn)行不同層數(shù)的分解,與時(shí)域特征結(jié)合,組成相應(yīng)分解層數(shù)的特征向量,使用PSO-SVM分類器觀察平均分類準(zhǔn)確率的變化,結(jié)果如圖6所示。
圖6 不同小波包分解層數(shù)的平均分類準(zhǔn)確率Fig.6 The average classification accuracy of different wavelet packet decomposition levels
從圖6可以看出,分解層數(shù)低于6層時(shí),平均分類準(zhǔn)確率隨分解層數(shù)的增加而增加,在分解層數(shù)為6時(shí)達(dá)到最大值,當(dāng)分解層數(shù)大于6時(shí),平均分類準(zhǔn)確率呈下降趨勢(shì)。在綜合分類精度與計(jì)算時(shí)間的考慮下,選擇6層小波包分解提取光纖振動(dòng)信號(hào)的特征。
由于不同特征的幅值數(shù)量級(jí)相差較大,為了防止幅值較小的特征在分類時(shí)失去作用,采用Max-Min歸一化對(duì)特征向量x=(x1,x2,…,xn)進(jìn)行處理。
(8)
式(8)中,x′i為歸一化后的結(jié)果;xi為原始數(shù)據(jù);xmax、xmin分別為所對(duì)應(yīng)參數(shù)的最大值和最小值。
采用的數(shù)據(jù)集共包含15 612個(gè)樣本,將其中的70%(10 928個(gè)樣本)劃分為訓(xùn)練樣本,另外的30%(4 684個(gè)樣本)劃分為測(cè)試樣本,采用提出的模式識(shí)別算法進(jìn)行分類,將分類過(guò)程重復(fù)多次以獲得平均結(jié)果,為了分析本文算法的分類性能,分別給出6種事件的混淆矩陣和入侵事件(包括挖掘、敲擊、搖晃)與非入侵事件(包括背景噪聲、澆水、行走)的混淆矩陣,分別如圖7、圖8所示。
混淆矩陣對(duì)角線上的值表示正確的分類結(jié)果
混淆矩陣對(duì)角線上的值表示正確的分類結(jié)果
從圖7中可以看出,本文算法對(duì)6種事件分類的準(zhǔn)確率均超過(guò)了90%,平均分類準(zhǔn)確率達(dá)到95.6%,其中,挖掘、澆水和搖晃事件在識(shí)別時(shí)有一些偏差,4.0%的挖掘事件被識(shí)別為敲擊事件,6.0%的澆水事件被識(shí)別為搖晃事件,5.3%的搖晃事件被識(shí)別為澆水事件,這與它們的時(shí)域特征相似有關(guān)。入侵事件識(shí)別的準(zhǔn)確率達(dá)到96.9%,非入侵事件識(shí)別的準(zhǔn)確率為96.4%。為了進(jìn)一步分析分類器性能,表2給出6種事件的精確率、召回率和F1值。
表2 算法評(píng)價(jià)指標(biāo)Table 2 Algorithm evaluation index
在樣本數(shù)據(jù)一致和特征向量提取方法相同的情況下,使用SVM、GA-SVM等常用分類算法對(duì)6種事件進(jìn)行識(shí)別,結(jié)果如表3所示??梢钥闯?SVM、GA-SVM的平均分類準(zhǔn)確率分別為90.7%、93.6%,PSO-SVM的平均分類準(zhǔn)確率最高,為95.6%,說(shuō)明PSO-SVM能夠更有效地識(shí)別光纖振動(dòng)信號(hào)。
表3 不同分類算法的平均分類準(zhǔn)確率Table 3 Average classification accuracy of different classification algorithms
(1)針對(duì)Φ-OTDR系統(tǒng)中誤報(bào)率高的問(wèn)題,提出了一種多域特征提取與PSO-SVM算法相結(jié)合的模式識(shí)別方法。該方法突破了單一特征參量事件識(shí)別準(zhǔn)確率低的問(wèn)題,提高了系統(tǒng)的可靠性。
(2)通過(guò)對(duì)數(shù)據(jù)集中的樣本進(jìn)行不同層數(shù)的小波包分解以確定最優(yōu)分解層數(shù),提取相應(yīng)分級(jí)層數(shù)的小波包能量后與時(shí)域特征相結(jié)合組成特征向量,并將其放入分類器中訓(xùn)練,對(duì)6種事件(背景噪聲、挖掘、敲擊、澆水、搖晃、行走)分類的準(zhǔn)確率分別為100%、92.0%、99.3%、92.7%、94.3%、95.0%,平均分類準(zhǔn)確率達(dá)到了95.6%。
(3)在樣本數(shù)據(jù)一致和特征向量提取方法相同的情況下與SVM、GA-SVM進(jìn)行對(duì)比,結(jié)果表明:所提出的模式識(shí)別方法能夠較好地識(shí)別不同類型的擾動(dòng)事件,可為Φ-OTDR系統(tǒng)性能的進(jìn)一步提高提供有益參考。