李 彥,梁正桃,李立京,林文臺,姜 漫
(北京航空航天大學(xué)儀器科學(xué)與光電工程學(xué)院,北京100191)
隨著光纖技術(shù)的不斷發(fā)展,光纖微振動(dòng)傳感器在周界安防、石油和天然氣管道以及通信線路監(jiān)測等系統(tǒng)中越來越多地得到應(yīng)用。光纖微振動(dòng)傳感器是利用光纖作為傳感介質(zhì)的一種分布式光纖傳感系統(tǒng),其中,光纖既作為傳感介質(zhì),又作為光傳輸介質(zhì)。其可在傳感光纖布設(shè)長度內(nèi),對一定準(zhǔn)確度范圍內(nèi)的突發(fā)事件進(jìn)行遠(yuǎn)程和實(shí)時(shí)的監(jiān)測。目前,主流的分布式光纖微振動(dòng)傳感器方案是基于雙M-Z型干涉儀的方案。國內(nèi)科研單位先后開展了對于光纖微振動(dòng)傳感器的相關(guān)研究工作,取得了一定的成果[1,2],實(shí)現(xiàn)了對振動(dòng)進(jìn)行定位并報(bào)警,但還存在誤報(bào)警的問題。對振動(dòng)信號進(jìn)行模式識別是一種降低誤報(bào)警率的方法。本文針對雙M-Z型微振動(dòng)傳感器提出了一種基于小波分解各頻段能量信息熵和SVM的模式識別方法。
小波分析方法是一種時(shí)間和頻率窗口大小固定,但其形狀可改變的時(shí)頻局域化分析方法,即在低頻部分具有較高的頻率分辨率和較低的時(shí)間分辨率,在高頻部分具有較高的時(shí)間分辨率和較低的頻率分辨率。
小波變換[3]是把基本小波函數(shù)ψ(t)作位移之后,在不同的尺度a下與待分析信號f(t)作內(nèi)積。信號f(t)的連續(xù)小波變換(continuous wavelet transform,CWT)定義為
在實(shí)際應(yīng)用中,采用離散小波變換(discrete wavelet transform,DWT)。而多分辨分析(multi-resolution analysis,MRA)是小波分析中最重要的概念之一,其將一個(gè)函數(shù)表示為一個(gè)低頻成分與不同分辨率下的高頻成分。它能提供一種構(gòu)造小波的統(tǒng)一框架,并且能夠提供函數(shù)分解與重構(gòu)的快速算法。根據(jù)多分辨率分析,Mallat給出了小波分解和重構(gòu)的快速算法,稱為Mallat算法[4],公式如下
信息熵值是對信號不確定度的度量,可以用來估計(jì)信號的復(fù)雜性,越不確定、越復(fù)雜的信號其熵值越大。小波能量信息熵是小波分析和信息熵原理相結(jié)合的產(chǎn)物,其基本思想是將小波系數(shù)矩陣處理成一個(gè)概率分布序列,用該序列的熵值來反映這個(gè)系數(shù)矩陣的稀疏程度,即被分析信號概率分布的有序程度。
把小波分解得到的各頻帶信號作為獨(dú)立的信號,分別對每頻段信號進(jìn)行小波分解,求解此次小波分解各頻段的能量 Ejk,令 pjk(i)=Ejk/E,則 ∑kpjk=1,參考小波包香農(nóng)熵的定義[5]把信息小波能量熵(wavelet energy entropy,WEE)定義為
則每個(gè)樣本信號有小波能量信息熵向量[E0,E1,…,En],取樣本向量中每列E的最大值和最小值,歸一化處理:e=(E-Emax)/(Emax-Emin),得到的特征向量[e0,e1,…,en]作為SVM的輸入特征向量。
對于給定的數(shù)據(jù)集{xi,yi},i=1,…,N,yi∈{-1,+1},xi∈Rd,若訓(xùn)練樣本線性可分,分類的目的就是尋求最優(yōu)超平面wgx+b,使兩類樣本之間的分類距離最大[6]。分界面wgx+b的分類間隔等于2/|w|,要使分類間隔最大,等價(jià)于使‖w‖2/2最小。在線性不可分的情況下,可增加一個(gè)松弛項(xiàng)ζ≥0,于是問題轉(zhuǎn)化為求解如下二次規(guī)劃問題
其中,第一個(gè)式子體現(xiàn)了結(jié)構(gòu)化風(fēng)險(xiǎn)最小化原則。C為懲罰因子,它實(shí)際上控制對錯(cuò)分樣本懲罰的程度,C越大對錯(cuò)誤的懲罰越重。
對非線性問題,通過在最優(yōu)分類面選用合適的核函數(shù)K(xi,yi)就可使某一非線性經(jīng)映射后能夠?qū)崿F(xiàn)線性分類。經(jīng)核函數(shù)映射后,引入拉格朗日泛函形式,上述超平面的二次規(guī)劃問題通常轉(zhuǎn)化為其對偶問題的計(jì)算,目標(biāo)函數(shù)為
得到在高維特征空間建立的分類決策函數(shù)為
SVM本質(zhì)上是2類分類器,需對其進(jìn)行推廣以滿足多值分類的需要。常用方法有:1)一對多方法(one-againstthe-rest);2)一對一方法(one-against-one);3)多值分類SVM(multi-class objection function);4)二叉樹分類決策法。本文選用的方式是一對一方法,通過每兩類之間建立SVM模型,在測試過程中以每個(gè)SVM模型的結(jié)果來投票確定最后的分類識別結(jié)果。
④水庫涵洞與市政、石油等其他管道相比有其特點(diǎn)和復(fù)雜性,建議對管道機(jī)器人的爬行裝置進(jìn)一步改進(jìn),以提高機(jī)器人越障能力,更好地滿足水庫涵洞檢測需求。
目前,SVM軟件使用較多的是Libsvm和SVMLight等,本文采用Libsvm[7]對SVM模型進(jìn)行訓(xùn)練,并基于訓(xùn)練出來的模型測試樣品分類結(jié)果。Libsvm是臺灣大學(xué)林智仁等人開發(fā)設(shè)計(jì)的一個(gè)簡單、易用,且快速有效的SVM模式識別與回歸的軟件。該軟件可以解決C-SVM,ν-SVM,ε-SVR和ν-SVR等問題,包括基于一對一算法的多類模式識別問題,為SVM算法的離線仿真提供了一個(gè)高效的解決方案。
Libsvm程序中使用的數(shù)據(jù)有嚴(yán)格的要求,在使用Libsvm之前需按照指定格式對數(shù)據(jù)進(jìn)行轉(zhuǎn)化。本文采用Libsvm軟件[8]按下列步驟進(jìn)行分類器建模:
1)把提取到的特征向量及其對應(yīng)的分類數(shù)據(jù),按照Libsvm的格式要求進(jìn)行保存??衫没ヂ?lián)網(wǎng)上工程技術(shù)人員編寫的電子表格FormatDataLibsvm.xsl當(dāng)中的宏進(jìn)行轉(zhuǎn)換;
2)對數(shù)據(jù)進(jìn)行歸一化處理;
3)選取RBF作為核函數(shù),在svm-train.exe使用時(shí),可以通過命令參數(shù)指定核函數(shù),默認(rèn)情況下是使用RBF核函數(shù);
4)使用訓(xùn)練模型的包含多個(gè)分類的數(shù)據(jù)進(jìn)行Cross-Validation尋找最佳的參數(shù)C和γ,C是懲罰因數(shù),γ為RBF核函數(shù)的參數(shù),采用tools文件夾下面的grid.py程序查找最佳的參數(shù);
5)根據(jù)上個(gè)步驟得到的最佳參數(shù),用svm-train.exe程序?qū)Π鄠€(gè)分類的數(shù)據(jù)進(jìn)行模型訓(xùn)練,將得到分類器的模型;
6)依據(jù)步驟(5)中得到的SVM模型,把待測試的樣本通過svm-predict.exe進(jìn)行測試。
本文考慮現(xiàn)場導(dǎo)致光纖微振動(dòng)傳感器系統(tǒng)報(bào)警的主要信號,選取如下幾類信號作為模式識別算法的研究載體:敲擊光纜、攀爬、大風(fēng)和未去噪的環(huán)境噪聲。在外場采集了這幾種信號的數(shù)據(jù),采樣頻率為1 MHz,每段信號長度為50000個(gè)采樣點(diǎn)。敲擊光纜的信號為105段,攀爬光纜的信號有76段,大風(fēng)的信號有73段,環(huán)境噪聲有114段。依據(jù)下面的步驟對信號進(jìn)行特征提取和SVM建模和測試:
1)采集4種選定的信號類型:敲光纜、爬光纜、大風(fēng)和環(huán)境噪聲;
2)在Matlab中對各信號的所有樣本進(jìn)行小波分解,得到各頻段的系數(shù);
3)在Matlab中對各頻段系數(shù)求解能量和,得到小波能量特征向量;
4)同時(shí)在Matlab中分別對步驟(2)中得到的各頻段系數(shù)進(jìn)行小波分解,求這次小波分解得到的各頻段系數(shù)的能量,然后求解其信息熵,得到小波能量信息熵特征向量;
5)對得到的能量和能量信息熵進(jìn)行歸一化,得到最終的特征向量;
6)把每一類的特征向量分開兩部分,一部分用來建模,另一部分用來測試模型識別率的準(zhǔn)確性,求解SVM的最優(yōu)參數(shù)C和γ;
7)采用Libsvm程序?qū)Φ玫降奶卣飨蛄窟M(jìn)行建模和測試。
本文的特征向量基于小波分解的能量信息熵,4種信號的典型特征向量如圖1所示。
小波能熵歸一化特征向量尋找SVM最優(yōu)參數(shù)的圖表如圖2所示。
本文提出的基于小波能量信息熵作為特征向量,采用SVM進(jìn)行分類,并比較了小波能量和SVM的分類結(jié)果,結(jié)果如表1所示。
基于小波分解各頻段能熵的特征向量結(jié)合SVM方法,能有效地識別信號的類型,識別率均超過80%(敲光纜:100%,爬光纜:82.76%,大風(fēng):87.5%,環(huán)境噪聲:100%),且其結(jié)果略優(yōu)于小波分解各頻段能量作為特征向量對應(yīng)的識別結(jié)果。
而直接以能量值和能量信息熵值為特征向量的識別率結(jié)果很低,其主要原因是特征向量內(nèi)部特征值之間的數(shù)值差距過大,某個(gè)值掩蓋了其他值的作用。
圖1 典型信號小波能熵特征向量Fig 1 WEE feature vector of typical signal
本文提出的以小波分解的各頻段系數(shù)能量信息熵作為特征向量,采用SVM分類器算法的模式識別方法,對雙MZ型光纖傳感器的信號進(jìn)行模式識別,可以得到較高的識別率,能有效地區(qū)分光纖傳感器的信號類型。在現(xiàn)有微振動(dòng)傳感系統(tǒng)閾值檢測的報(bào)警方法基礎(chǔ)上,采用本文提出的模式識別方法將有助于降低系統(tǒng)的誤報(bào)警率,改善系統(tǒng)性能指標(biāo)和推廣系統(tǒng)的使用。
圖2 SVM參數(shù)尋優(yōu)圖Fig 2 Parameter optimizing of SVM
表1 基于SVM的分類器識別結(jié)果Tab 1 Result of classifier recognition based on SVM
[1]羅光明.分布式光纖周界安防系統(tǒng)的信號檢測和定位技術(shù)研究[D].北京:北京航空航天大學(xué),2009.
[2]Sun Qizhen,Liu Deming,Wang Jianmin.A novel distributed sensor using long-distance Mach-Zehnder interferometer[J].Optics Communication,2008,281:1538-1544.
[3]程正興.小波分析算法與應(yīng)用[M].西安:西安交通大學(xué)出版社,1998.
[4]張賢達(dá),保 錚.非平穩(wěn)信號分析與處理[M].北京:國防工業(yè)出版社,2001.
[5]Avic E,Akpolat Z H.Speech recognition using a wavelet packet adaptive network based fuzzy inference system[J].Export Systems with Applications,2006,31(3):495-503.
[6]支持向量機(jī)導(dǎo)論[M].李國正,譯.北京:電子工業(yè)出版社,2004.
[7]Chang Chih-chung,Lin Chih-jen.LIBSVM—A library for support vector machine.[EB/OL].[2012—04—01].http:∥www.csie.ntu.edu.tw/~cjlin/libsvm.
[8]Hsu Chih-wei,Chang Chih-chung,Lin Chih-jen.A practical guide to support vector classificaiton[EB/OL].[2008—10—02].http:∥www.csie.ntu.edu.tw/~cjlin/libsvm/.html.