卜澤華,毛邦寧,司召鵬,龔華平,徐賁,康娟,李裔,趙春柳
(中國計(jì)量大學(xué) 光學(xué)與電子科技學(xué)院,杭州 310018)
隨著物聯(lián)網(wǎng)時(shí)代的高速發(fā)展,對(duì)外界各種信息的感知和獲取日益重要。與傳統(tǒng)方法相比,相位敏感光時(shí)域反射計(jì)(phase-Sensitive Optical Time Domain Reflectometry,φ-OTDR)以較低的成本實(shí)現(xiàn)了大規(guī)模、長(zhǎng)距離的測(cè)量[1],具有靈敏度高[2-3]、分辨率高[4]、并且結(jié)構(gòu)簡(jiǎn)單[5]的優(yōu)點(diǎn),能夠同時(shí)對(duì)擾動(dòng)信號(hào)進(jìn)行多點(diǎn)檢測(cè)[6]。φ-OTDR在空間域定位擾動(dòng)的位置,在時(shí)間域獲取擾動(dòng)的振動(dòng)信息。目前,φ-OTDR正在許多應(yīng)用中發(fā)揮著重要作用,例如結(jié)構(gòu)裂縫檢測(cè)[7]、鐵路監(jiān)測(cè)[8]、交通流檢測(cè)[9]、車輛檢測(cè)等[10]。
隨著實(shí)際應(yīng)用場(chǎng)景的多樣化和復(fù)雜化,對(duì)外界不同模式的信號(hào)識(shí)別成為近些年研究的重點(diǎn)。模式識(shí)別可以自動(dòng)將檢測(cè)到的振動(dòng)信號(hào)根據(jù)其信號(hào)特征分為感興趣的擾動(dòng)信號(hào)和不需要的環(huán)境噪聲信號(hào),從而顯著提高報(bào)警精度,降低系統(tǒng)的誤報(bào)率。2016年,VILLAMIZAR DELGADO S等[11]通過經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)減小光譜信號(hào)頻率信息的特征離散度并采用神經(jīng)網(wǎng)絡(luò)對(duì)振動(dòng)信號(hào)進(jìn)行分類;神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)間長(zhǎng),且隨著振動(dòng)信號(hào)種類的提升,處理效果局限性較大。2017年,AKTAS M等[12]通過直接探測(cè)型φ-OTDR系統(tǒng),采用五層神經(jīng)網(wǎng)絡(luò)并結(jié)合短時(shí)傅里葉變換(Short-time Fourier transform,STFT)系數(shù)實(shí)現(xiàn)對(duì)鎬挖、鏟挖、強(qiáng)風(fēng)、發(fā)電機(jī)噪音等六種典型觀察到的事件實(shí)現(xiàn)93%以上的威脅分類準(zhǔn)確度;但STFT在對(duì)信號(hào)進(jìn)行分析時(shí),時(shí)間分辨率和頻率分辨率為互斥的關(guān)系,兩者無法兼顧。2018年,XU Chengjin等[13]提出一種基于時(shí)頻分析和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的方法,該方法對(duì)挖掘、行走、車輛通過和破壞四種不同振動(dòng)事件的信號(hào)樣本處理后,振動(dòng)事件的識(shí)別率達(dá)到90%,但CNN處理圖像時(shí)間較長(zhǎng)。2019年,WU Jun等[14]通過多尺度一維CNN提取信號(hào)的時(shí)域和頻域特征,并利用全連接層和Softmax層進(jìn)行識(shí)別,識(shí)別準(zhǔn)確率達(dá)到96.59%并減少了計(jì)算時(shí)間,但該方法需要大量樣本;同年,WANG Zhaoyong[15]等采用深度雙路徑網(wǎng)絡(luò)(Deep Dual-Path Network,Deep DPN)對(duì)干擾事件進(jìn)行分類,準(zhǔn)確率達(dá)到97%,然而更深的網(wǎng)絡(luò)結(jié)構(gòu)帶來了更長(zhǎng)的訓(xùn)練時(shí)間,增加了訓(xùn)練負(fù)擔(dān),導(dǎo)致對(duì)信號(hào)進(jìn)行分類所需的計(jì)算時(shí)間是采集時(shí)間的數(shù)倍。2020年,ABUFANA S A等[16]采用變分模態(tài)分解(Variational Mode Decomposition,VMD)技術(shù)從擾動(dòng)信號(hào)中提取高階統(tǒng)計(jì)量(Higher Order Statistical,HOS),包括偏度、峰度和方差作為樣本特征,并在不同信噪比下采用線性支持向量機(jī)(Linear Support Vector Machine,LSVM)進(jìn)行擾動(dòng)信號(hào)識(shí)別。當(dāng)信噪比從-8 dB~-18 dB提高到-4 dB~-8 dB時(shí),識(shí)別準(zhǔn)確率從75.2%上升到79.5%,識(shí)別的綜合準(zhǔn)確率較低。2021年,SHA Zhou等[17]提出將分布式光纖傳感器和YOLO(You Only Look Once)算法相結(jié)合的方法,可以在網(wǎng)絡(luò)中同時(shí)確定邊界框和對(duì)事件進(jìn)行分類;然而,該方法只能檢測(cè)到單一類型的事件。
小波包變換具有良好的時(shí)頻局部化特性,能有效處理非平穩(wěn)信號(hào);支持向量機(jī)(Support Vector Machine,SVM)是從統(tǒng)計(jì)學(xué)習(xí)理論中衍生出的一種學(xué)習(xí)方法,與傳統(tǒng)的機(jī)器學(xué)習(xí)相比性能更好。將小波包變換與SVM結(jié)合的目標(biāo)檢測(cè)方法已經(jīng)在許多領(lǐng)域廣泛應(yīng)用,如氣閥故障診斷[18],局部放電識(shí)別[19]等。
本文在基于相干探測(cè)型φ-OTDR系統(tǒng)的基礎(chǔ)上,提出一種將小波包分解和SVM結(jié)合的信號(hào)識(shí)別方法。對(duì)實(shí)際應(yīng)用中的敲擊(模擬應(yīng)力破壞)、晃動(dòng)(模擬攀爬)、人員行走以及環(huán)境噪聲四種不同事件的信號(hào)進(jìn)行分析,通過小波包分解得到信號(hào)的能量特征向量作為輸入樣本并結(jié)合SVM進(jìn)行不同事件的信號(hào)識(shí)別,提高了φ-OTDR系統(tǒng)信號(hào)識(shí)別的準(zhǔn)確性。
如圖1所示,窄線寬光源(Narrow Linewidth Laser,NLL)線寬為3 kHz,輸出功率為25 mW;光源發(fā)出的連續(xù)光經(jīng)過90∶10的耦合器被分成兩路,其中一路90%的信號(hào)光經(jīng)過聲光調(diào)制器(Acousto-Optic Modulator,AOM)調(diào)制為脈沖光并產(chǎn)生一個(gè)移頻量,移頻量大小為AOM的中心頻率80 MHz,脈沖寬度為100 ns。脈沖光經(jīng)過摻鉺光纖放大器(Erbium-Doped Fiber Amplifier,EDFA)進(jìn)一步放大功率,補(bǔ)償插入損耗和傳輸損耗。放大后的脈沖光經(jīng)過環(huán)形器的1端口并從2端口入射到傳感光纖中,返回的后向瑞利散射光經(jīng)過環(huán)形器的3端口與另外一路10%的本振光通過3 dB耦合器發(fā)生干涉并產(chǎn)生拍頻信號(hào)。拍頻信號(hào)由平衡探測(cè)器(Photoelectric Balance Detector,BPD)接收并完成光信號(hào)到電信號(hào)的轉(zhuǎn)換;BPD最大頻率響應(yīng)100 MHz。最后,數(shù)據(jù)采集卡(Data Acquisition Card,DAQ)以200 MSa/s的采樣頻率記錄數(shù)據(jù)。
圖1 基于相干探測(cè)的φ-OTDR系統(tǒng)Fig.1 φ-OTDR system based on coherent detection
返回的后向瑞利散射光表示為
式中,ERO是后向瑞利散射光的幅度;ω是窄線寬光源角頻率;Δω是AOM的移頻量;φR(t)是散射光的相位。本振光表示為
式中,ELO是本振光的幅度;φL(t)是本振光的相位。拍頻信號(hào)表示為
式中,φ(t)=φR(t)-φL(t)。
DAQ采集到的數(shù)字信號(hào)可以通過正交(I/Q)解調(diào)算法[20]得到信號(hào)的幅值。
φ-OTDR系統(tǒng)在實(shí)際應(yīng)用中采集的信號(hào)往往具有沖擊性和突變性,信號(hào)在時(shí)域上的波形變化劇烈,信號(hào)中的頻率成分復(fù)雜,呈現(xiàn)出非平穩(wěn)性的特點(diǎn)。小波包變換可以對(duì)信號(hào)按照頻率特性逐層分解,從而充分表征不同信號(hào)的特性[21-22]。信號(hào)的三層小波包分解如圖2所示,信號(hào)S0,0分解為S1,0和S1,1,S1,0和S1,1分別進(jìn)一步分解為S2,0和S2,1,S2,2和S2,3,以此類推,逐級(jí)分解。
圖2 三層小波包分解Fig.2 Three-layer wavelet packet decomposition
信號(hào)S0,0經(jīng)過N層小波包分解之后可以表示為
式中,SN,0,SN,1,SN,2,…,SN,2N-2,SN,2N-1表示S0,0經(jīng)過N層小波包分解后的子頻帶,當(dāng)信號(hào)的采樣率為f,則第j個(gè)頻帶的頻率范圍為(j+1),j=0,1,…,2N-1。各子頻帶的能量計(jì)算公式為
式中,dNj是第N層第j個(gè)頻帶內(nèi)的小波包分解系數(shù)。將各子頻帶的能量進(jìn)行歸一化,得到特征向量[λ1,λ1,…,λ2N]為
SVM在處理小樣本、非線性問題分類時(shí)具有極好的性能;其核函數(shù)構(gòu)造簡(jiǎn)單,泛化能力強(qiáng),且計(jì)算速度較快。對(duì)于一個(gè)給定的樣本集T={(xi,yi),i=1,2,…,N},xi∈Rn,yi∈{-1,1},分類決策函數(shù)為[23]
SVM是一種有監(jiān)督學(xué)習(xí)模型,信號(hào)識(shí)別的結(jié)果可以用混淆矩陣描述。圖3是二分類的混淆矩陣示意圖,主對(duì)角線是正確的分類結(jié)果。本文采用準(zhǔn)確率、精確率、召回率和F1值四種性能評(píng)估指標(biāo)對(duì)分類效果進(jìn)行評(píng)價(jià)。
圖3 二分類混淆矩陣Fig.3 Binary confusion matrix
準(zhǔn)確率(Accuracy)是所有樣本中正確分類的個(gè)數(shù)占總樣本的比例,計(jì)算公式為
精確率(Precision)是某種模式中預(yù)測(cè)正確的樣本占所有預(yù)測(cè)為該模式樣本的比例,召回率(Recall)表示某種模式預(yù)測(cè)正確的樣本占所有實(shí)際為該模式樣本的比例,兩者的計(jì)算公式為
由于精確率和召回率之間往往呈負(fù)相關(guān)關(guān)系,因此可以通過F1值讓兩者達(dá)到一個(gè)平衡的關(guān)系,F(xiàn)1值的計(jì)算公式為
實(shí)驗(yàn)分別采集敲擊、晃動(dòng)、行走情況下的擾動(dòng)信號(hào)和環(huán)境中的噪聲信號(hào),共采集800組實(shí)驗(yàn)數(shù)據(jù),每種信號(hào)各200組。其中敲擊信號(hào)是在光纜上鋪一塊木板,并使用一個(gè)直徑約為3 cm的鐵棒對(duì)木板進(jìn)行敲擊來模擬應(yīng)力破壞,木板覆蓋的光纜長(zhǎng)度為1 m;晃動(dòng)信號(hào)是將一段3 m長(zhǎng)的光纜懸掛起來晃動(dòng)來模擬攀爬;行走信號(hào)由一個(gè)人以一定頻率在光纜上踩踏,作用長(zhǎng)度為0.5 m;噪聲信號(hào)則是在光纖沒有外界干擾的情況下采集普通環(huán)境下的信號(hào)。每個(gè)事件樣本信號(hào)時(shí)長(zhǎng)為0.5 s,系統(tǒng)監(jiān)測(cè)光纜距離為2.3 km。實(shí)驗(yàn)環(huán)境如圖4所示。
圖4 實(shí)驗(yàn)環(huán)境Fig.4 Experimental environment
振動(dòng)事件多存在于低頻帶,對(duì)采集的信號(hào)進(jìn)行頻譜分析發(fā)現(xiàn),擾動(dòng)信號(hào)的頻譜能量主要集中在800 Hz以內(nèi),因此,脈沖重復(fù)頻率設(shè)為2 kHz;DAQ每次采集1000條拍頻信號(hào)曲線。通過移動(dòng)差分法定位擾動(dòng)信號(hào)位置,三種擾動(dòng)事件的定位結(jié)果如圖5所示。敲擊、晃動(dòng)、行走事件的擾動(dòng)信號(hào)峰值幅度分別在2200 m,2230 m,2170 m。
圖5 三種擾動(dòng)信號(hào)的定位結(jié)果Fig.5 Location results of three disturbance signals
由于不同信號(hào)的幅值數(shù)量級(jí)相差較大,為了增強(qiáng)不同信號(hào)之間的對(duì)比性,本文采用Max-Min歸一化對(duì)數(shù)據(jù)進(jìn)行處理,Max-Min歸一化公式為
式中,xmax表示信號(hào)的最大值,xmin表示信號(hào)的最小值。
四種信號(hào)歸一化后的典型時(shí)域波形如圖6所示,分別是敲擊、晃動(dòng)、行走和噪聲。不同事件的信號(hào)波形有明顯不同,其中,敲擊信號(hào)的持續(xù)時(shí)間最短而晃動(dòng)信號(hào)的持續(xù)時(shí)間較長(zhǎng);兩種信號(hào)的幅值均隨著時(shí)間推移呈現(xiàn)衰減的趨勢(shì);與敲擊信號(hào)相比,晃動(dòng)信號(hào)的幅值的衰減趨勢(shì)更均勻。行走信號(hào)的幅值與敲擊和晃動(dòng)信號(hào)的幅值相比略低一些,并且在中間0.25 ms~0.3 ms內(nèi)的一小段時(shí)間幅值降低后又升高;三種擾動(dòng)事件的信號(hào)幅值均變化較大。與擾動(dòng)事件信號(hào)相比,噪聲信號(hào)歸一化后的幅值較小且強(qiáng)度分布均勻,沒有產(chǎn)生明顯的變化。
圖6 四種不同信號(hào)的典型時(shí)域波形Fig.6 Typical time domain waveforms of four different signals
小波基函數(shù)具有多樣性,不同的小波基函數(shù)對(duì)信號(hào)的處理結(jié)果差異較大。本文采用Dmeyer小波基。Dmeyer小波具有良好的正交性和緊支撐性,保證了信號(hào)的時(shí)間特性且各頻帶信號(hào)之間不會(huì)相互影響產(chǎn)生混疊,并且收斂速度較快。在對(duì)信號(hào)進(jìn)行小波包分解時(shí),分解層數(shù)越大,頻帶分辨率越高,但過大的分解層數(shù)會(huì)造成誤差,計(jì)算復(fù)雜度也會(huì)越高;因?yàn)樾〔ò纸獾挠?jì)算復(fù)雜度O(n)由分解步長(zhǎng)n決定,n與小波包分解層數(shù)正相關(guān)。本文在綜合計(jì)算復(fù)雜度和準(zhǔn)確性的基礎(chǔ)上,根據(jù)對(duì)實(shí)驗(yàn)數(shù)據(jù)的驗(yàn)證結(jié)果,最終選擇Dmeyer小波基對(duì)信號(hào)進(jìn)行三層小波包分解,可以充分反映不同事件的信號(hào)特征。四種信號(hào)的典型小波包能量譜如圖7所示。
圖7 三層小波包分解典型能量譜Fig.7 Typical energy spectrum of three-layer wavelet packet decomposition
從圖7可以看到,三種擾動(dòng)事件信號(hào)中,敲擊信號(hào)和行走信號(hào),頻譜能量主要集中在第一頻帶,遠(yuǎn)高于晃動(dòng)信號(hào)在第一頻帶內(nèi)的能量占比,但兩者在中高頻帶的能量分布有明顯差異;敲擊信號(hào)在中高頻帶內(nèi)的能量分布呈現(xiàn)一種平穩(wěn)的趨勢(shì),從第二頻帶到第八頻帶內(nèi)的能量占比相差較??;行走信號(hào)則在中高頻帶內(nèi)的能量分布整體呈現(xiàn)下降趨勢(shì),且衰減速度較快。晃動(dòng)信號(hào)雖然在第一頻帶內(nèi)的能量占比最高,但在中頻和高頻帶內(nèi)也均有較高的能量分布,在中高頻帶內(nèi)的整體能量分布較均勻。噪聲信號(hào)的能量主要集中在第六頻帶,這是因?yàn)樵肼曅盘?hào)通常都是高頻信號(hào)。
對(duì)800組信號(hào)進(jìn)行三層小波包分解并將同一事件信號(hào)的能量特征向量進(jìn)行算術(shù)平均,不同信號(hào)的小波包平均能量分布如圖8所示。從圖8中可以看到,噪聲信號(hào)的平均能量分布與其余三種擾動(dòng)信號(hào)的平均能量分布有明顯不同;噪聲信號(hào)的能量主要集中在第六頻帶,敲擊信號(hào)、晃動(dòng)信號(hào)和行走信號(hào)的能量則均集中在第一頻帶,這是因?yàn)閿_動(dòng)信號(hào)多為低頻信號(hào);但行走信號(hào)在第一頻帶的能量占比要高與敲擊和晃動(dòng)信號(hào),這是因?yàn)樾凶邥r(shí)的頻率較低。其中,敲擊信號(hào)和晃動(dòng)信號(hào)在高頻帶內(nèi)的能量占比有些相似。由于不同信號(hào)的平均能量分布存在差異,因此小波包能量譜可以有效用于信號(hào)識(shí)別。
圖8 四種不同事件的信號(hào)平均能量分布Fig.8 Average energy distribution of four differrent events
對(duì)采集的800組信號(hào)進(jìn)行數(shù)據(jù)集劃分,其中,每種事件隨機(jī)選取150組,共600組信號(hào)作為訓(xùn)練集,剩余200組信號(hào)作為預(yù)測(cè)集。輸入樣本是信號(hào)經(jīng)過三層小波包分解后的8維能量特征向量,SVM的分類結(jié)果如圖9所示。其中,敲擊和晃動(dòng)兩個(gè)信號(hào)的識(shí)別有一些偏差,2個(gè)敲擊信號(hào)被識(shí)別為晃動(dòng)信號(hào),3個(gè)晃動(dòng)信號(hào)被識(shí)別為敲擊信號(hào),這與它們?cè)诟哳l帶內(nèi)的能量分布相似有關(guān)。敲擊信號(hào)的識(shí)別精確率、召回率和F1值分別為94.12%、96%和95.05%;晃動(dòng)信號(hào)的識(shí)別精確率、召回率和F1值分別為95.92%、94%和94.95%;行走信號(hào)和噪聲信號(hào)的識(shí)別精確率、召回率和F1值均為100%;識(shí)別總體準(zhǔn)確率在97%以上,對(duì)擾動(dòng)信號(hào)的識(shí)別準(zhǔn)確率優(yōu)于基于STFT的CNN[12]和基于HOS的LSVM[15]。實(shí)驗(yàn)結(jié)果顯示,基于小波包分解和SVM的樣本訓(xùn)練時(shí)間和測(cè)試時(shí)間分別為7 ms和3 ms,信號(hào)識(shí)別實(shí)時(shí)性較好。
圖9 SVM信號(hào)識(shí)別結(jié)果Fig.9 Signal recognition results of SVM
本文針對(duì)φ-OTDR系統(tǒng)的信號(hào)識(shí)別問題,提出一種基于小波包分解和SVM算法的信號(hào)識(shí)別方法。通過對(duì)不同事件的信號(hào)進(jìn)行小波包分解獲得能量特征向量作為SVM的輸入樣本;對(duì)現(xiàn)場(chǎng)采集的800組實(shí)驗(yàn)數(shù)據(jù)進(jìn)行訓(xùn)練和預(yù)測(cè),并通過多種性能評(píng)估指標(biāo)對(duì)識(shí)別效果進(jìn)行評(píng)價(jià)。實(shí)驗(yàn)結(jié)果表明,小波包能量譜能夠表征不同信號(hào)的特征,可以有效應(yīng)用于φ-OTDR系統(tǒng)的信號(hào)識(shí)別。其中,敲擊信號(hào)和晃動(dòng)信號(hào)的識(shí)別精確率、召回率和F1值分別為94.12%、96%、95.05%;95.92%、94%、94.95%;行走信號(hào)和噪聲信號(hào)的識(shí)別精確率、召回率和F1值均為100%;總體識(shí)別準(zhǔn)確率在97%以上。該方法能夠較好地識(shí)別不同類型的事件信號(hào),具有較高的實(shí)時(shí)性和準(zhǔn)確率,為φ-OTDR系統(tǒng)的推廣應(yīng)用提供了有益的參考。