徐方辰,邢煒寧
(1國家石油天然氣管網(wǎng)集團有限公司西氣東輸分公司,上海200126;2中國石油天然氣管道通信電力工程有限公司,河北 廊坊065000)
目前,DAS已被廣泛用于管道泄露監(jiān)測、圍欄入侵、周界安防等諸多領(lǐng)域[1-4]。DAS具有不同的實現(xiàn)原理,其中使用Φ-OTDR原理構(gòu)建的DAS系統(tǒng)具有檢測信號的信噪比高、檢測范圍廣、成本相對較低、可實現(xiàn)遠程入侵檢測等優(yōu)點,具有很強的發(fā)展?jié)摿?。目前使用DAS系統(tǒng)對入侵事件的識別過程可分為4個步驟,即:先對入侵振動信號進行預(yù)處理,然后進行特征提取,再進行數(shù)據(jù)集的制作,最后搭建識別模型,對數(shù)據(jù)進行分類。在此過程中,對數(shù)據(jù)的預(yù)處理主要包含對數(shù)據(jù)去噪,進行端點檢測[5]等。端點檢測的目的在于減小一段信號中存在的噪音,將只包含振動的振動片段提取出來,減小噪音對模型的影響,雙門限端點檢測就是時下常用的VAD算法。而在研究中常常見到的特征提取方式則有提取振動信號的傅里葉變換特征[6]、梅爾倒頻系數(shù)[7]等,或者使用EMD[8]、VMD[9]將信號分解后提取相關(guān)的統(tǒng)計學特征。典型的分類算法主要有:支持向量機(SVM)[10]、隨機森林樹[11]等。上述分類算法雖然已經(jīng)在DAS振動信號的分類識別中取得了很好的效果,但是由于需要進行人為的特征提取,加大了DAS模式識別的實現(xiàn)難度。隨著深度學習的發(fā)展以及大范圍的應(yīng)用,深度學習也已開始更多地應(yīng)用在DAS系統(tǒng)的模式識別上,例如使用BP神經(jīng)網(wǎng)絡(luò)[12]、徑向基神經(jīng)網(wǎng)絡(luò)[13]等神經(jīng)網(wǎng)絡(luò)算法對振動信號進行識別,在文獻[14]中即提出使用一維卷積神經(jīng)網(wǎng)絡(luò)對油氣管道入侵事件進行識別,該次研究直接將經(jīng)過預(yù)處理的振動信號輸入一維卷積神經(jīng)網(wǎng)絡(luò),達到了與二維卷積神經(jīng)網(wǎng)絡(luò)相近的準確率,降低了識別時間。
基于此,本文提出使用基于譜質(zhì)心與短時能量的端點檢測算法提取出振動信號中包含的振動片段,并對振動片段進行信號的重組,形成新的振動信號后,再使用一個多尺度的卷積神經(jīng)網(wǎng)絡(luò)結(jié)合隨機森林樹的模型對振動信號進行識別。
基于Φ-OTDR的DAS系統(tǒng)原理如圖1所示。其中,激光源為超窄線寬激光。φ-OTDR的工作原理為:超窄線寬激光源發(fā)出連續(xù)光,該連續(xù)光經(jīng)過聲光調(diào)制器(AOM)后被調(diào)制為脈沖光,由于脈沖光的強度偏弱,因此再讓該脈沖光通過摻鉺光纖放大器(EDFA)進行放大,被放大后的脈沖光經(jīng)過帶通濾波器濾波(BPF)后由光循環(huán)器(OC)的1端口進入,從OC的2端口射入傳感光纖內(nèi)。在傳感光纖中,產(chǎn)生的后向瑞利散射光反向傳播到OC的2端口,由OC的3端口射出。由于后向瑞利散射光強度較低,因此使用EDFA進行放大,放大后使用帶通濾波器濾除自發(fā)輻射噪(AES),稍后使用光電探測器將脈沖光轉(zhuǎn)換為電信號,再使用DAQ去采集電信號。由于不同類型的振動信號所包含的頻率、持續(xù)時間等不盡相同,所以通過DAS采集的信號的波型也不同,因此可以對信號進行直接識別。
圖1 φ-OTDR結(jié)構(gòu)Fig.1 The construction of φ-OTDR
基于短時能量與譜質(zhì)心的端點檢測算法可以有效地提取出一段振動信號中的振動片段。短時能量能反映出信號時域的特征,譜質(zhì)心能反映出信號頻域的特征,結(jié)合兩種特征可以很好地提取出信號中的振動部分?;诙虝r能量與譜質(zhì)心的端點檢測算法的原理為:首先對信號進行分幀處理,并且對每幀信號進行加窗,這樣可以減小信號在分幀后的能量泄露,然后計算出每幀信號的短時能量,短時能量的計算公式為:
其中,s為幀信號,i為第i幀。再計算出每幀信號的譜質(zhì)心,譜質(zhì)心計算公式為:
其中,f為幀信號經(jīng)過傅里葉變換后的頻率值。
設(shè)置一個短時能量的閾值與一個譜質(zhì)心的閾值。此后進行判斷。如果幀信號的短時能量與譜質(zhì)心都小于設(shè)置的閾值,認為該段信號沒有振動;如果大于設(shè)置的閾值,認為存在振動,保留此時的幀數(shù),根據(jù)幀與幀移的關(guān)系得出該段幀在原信號中的位置。
通常單個的神經(jīng)網(wǎng)絡(luò)只能提取出信號中部分的信息,不能提取到信號不同尺度的信息,所以通過使用多個不同尺度的卷積神經(jīng)網(wǎng)絡(luò)來更加全面的提取振動信號的特征。多尺度卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖2所示。
圖2 多尺度卷積神經(jīng)網(wǎng)絡(luò)Fig.2 Multi-scale convolutional neural networks
由圖2可知,在多尺度卷積神經(jīng)網(wǎng)絡(luò)中使用了三層卷積神經(jīng)網(wǎng)絡(luò),每個卷積層后都是使用了有一個最大池化層。通過對圖2中的3個卷積神經(jīng)網(wǎng)絡(luò)層使用不同的卷積核大小,從而使3個卷積神經(jīng)網(wǎng)絡(luò)能提取到信號不同尺度的特征。
構(gòu)建隨機森林樹實際就是同時構(gòu)建出多個決策樹,所使用的特征是隨機選擇的,從不同的特征組合中選擇出最佳的特征組合。在隨機森林樹中設(shè)置的主要參數(shù)有:用于判斷節(jié)點不純度指標的計算方式、gini系數(shù)與entropy系數(shù);用于設(shè)置最大決策樹棵樹的參數(shù),一般情況下該參數(shù)設(shè)置得越大,判斷效果越好;用于決定樹最大深度的參數(shù),多數(shù)情況下設(shè)置為5層,越大則擬合效果越好,但也越耗時;以及一些剪枝參數(shù),主要是用于降低模型的過擬合現(xiàn)象。使用隨機森林樹進行分類可以有效降低計算時間,因為相較于支持向量機來說,隨機森林樹中不存在復(fù)雜的計算。
研究中使用的Φ-OTDR的實驗裝置參如圖1所示。圖1中,激光器為輸出功率10 mW、線寬為3 KHz的分布式反饋激光器(DFB_LD),AOM的帶寬為100 MHz,EDFA的放大增益為27 dB,PD的帶寬為200 MHz,DAQ的采樣速率為200 MHz/s、采樣位數(shù)為12位。實驗裝置的傳感光纖部分被埋設(shè)在中國上海市的文翔東路和滬松路的施工現(xiàn)場來采集振動信號。擬有針對性地采集如下振動信號:汽車通過路面或者井蓋時引發(fā)的振動、施工機械工作時引發(fā)的振動、手觸碰光纖時引發(fā)的振動以及背景噪聲。采集的信號主要是單個事件工作時的振動信號,目前對混合型振動信號的識別依舊是一個難點。汽車通過、機械挖掘、觸碰光纖、背景噪音的振動信號如圖3所示。
圖3 振動信號Fig.3 Vibration signal
考慮到是在實際的施工現(xiàn)場來采集振動信號,所以采集的振動信號中存在有大量的噪音。如果不去除信號中存在的噪音,就會對信號的識別造成嚴重的影響,因此需對信號進行小波閾值去噪處理。未去噪與去噪后的振動信號如圖4所示。由圖4(a)可以看出,原始未去噪的振動信號中存在有大量的噪音;由圖4(b)中可以看出,使用了小波閾值去噪后,明顯減小了噪音,振動部分的信號變得清晰可見。
圖4 未去噪與去噪后的振動信號Fig.4 Undenoising and denoising signal
一段振動信號通常包括振動部分信號與噪音段信號。為了提取出振動信號中的振動部分,需要對振動信號使用VAD算法以提取出信號中的振動部分,從而排除非振動部分對識別模型的影響。使用基于短時能量與譜質(zhì)心的VAD算法所提取的振動部分信號如圖5所示。圖5(a)中的紅色部分就是通過VAD算法提取出來的振動部分信號,通過對比圖5(b)中的原始信號后可以看出,基于短時能量與譜質(zhì)心的VAD算法很好地提取出了信號中的振動部分。
圖5 振動信號的檢測Fig.5 Detection of the vibration signal
使用VAD算法提取出信號中的振動段后,就要對振動段進行重組,這是因為,每種振動的持續(xù)時間不同,導致提取出的振動段長度不同,為了使各種振動信號的振動段長度相同,需要對振動段進行信號的重組,所使用的方式為對所提取出的振動信號段進行重復(fù),以此來重組出一個只包含振動片段的信號。重組信號如圖6所示。
圖6 振動片段的重組Fig.6 Recombination of the vibration fragments
為驗證本次研究提出的模型能準確識別出汽車通過、機械工作、觸碰、噪音這4種振動事件,接著又進行了對比實驗。研究中,為對比使用重組信號進行識別的效果,使用重組信號與原始信號進行對比,使用LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)作為識別模型。兩種信號的識別準確率如圖7所示。
從圖7中可以看出,通過使用重組信號,模型的識別率明顯上升,這主要是因為使用VAD算法排除了信號中噪音的干擾。
圖7 原始信號與重組信號識別率Fig.7 Original signal and recombinant signal recognition rate
通過多尺度卷積神經(jīng)網(wǎng)絡(luò)提取重組信號的特征,再使用隨機森林樹對所提取特征進行識別,為了得到最優(yōu)的隨機森林樹參數(shù),設(shè)置不同的參數(shù),根據(jù)學習率曲線來得出最優(yōu)參數(shù)。N_estimators的學習率曲線如圖8所示。由圖8中可以看出,當N_estimators設(shè)為13時,識別準確率最高,可以達到97.4%。此時使用的判斷不純度指標為entropy系數(shù),最大深度為5。
圖8 N_estimators學習曲線Fig.8 N_estimators learning curve
通過上述實驗得出隨機森林樹最優(yōu)參數(shù)后,開展模型的對比實驗。數(shù)據(jù)集使用重組信號,模型則分別使用多尺度卷積神經(jīng)網(wǎng)絡(luò)結(jié)合隨機森林樹與LeNet-5模型進行識別。兩種模型的識別準確率如圖9所示。
圖9 LeNet-5與多尺度卷積神經(jīng)網(wǎng)絡(luò)結(jié)合隨機森林樹的識別準確率Fig.9 LeNet-5 Recognition accuracy of random forest trees combined with multiscale convolutional neural networks
由圖9中可以看出,使用多尺度卷積神經(jīng)網(wǎng)絡(luò)對重組信號進行識別的準確率明顯高于LeNet-5模型的識別準確率。
本文使用端點檢測算法和信號重組算法來對信號進行提取與重組,又進一步地使用了多尺度卷積神經(jīng)網(wǎng)絡(luò)結(jié)合隨機森林樹對信號進行識別,不僅降低了識別時間,還提高了對振動事件的識別準確率,對4種振動事件的識別準確率達到了97.4%。