周 卓, 梁 紅, 楊長(zhǎng)生, 趙國(guó)貴
基于海豚聽覺系統(tǒng)模型的水下目標(biāo)識(shí)別
周 卓, 梁 紅, 楊長(zhǎng)生, 趙國(guó)貴
(西北工業(yè)大學(xué) 航海學(xué)院, 陜西 西安, 710072)
從目標(biāo)的主動(dòng)聲吶回波中提取其特征信息是實(shí)現(xiàn)水下目標(biāo)分類識(shí)別的有效手段。動(dòng)物聲吶在水下目標(biāo)識(shí)別中表現(xiàn)出的優(yōu)異性能為人工聲吶提供了解決方法。文中以寬吻海豚喀啦信號(hào)作為主動(dòng)聲吶的發(fā)射信號(hào),分別利用小波變換和海豚聽覺系統(tǒng)模型2種方法提取了目標(biāo)回波特征并作為支持向量機(jī)的輸入進(jìn)行分類。將通過海豚聽覺系統(tǒng)模型得到的時(shí)譜圖作為卷積神經(jīng)網(wǎng)絡(luò)的輸入, 對(duì)目標(biāo)進(jìn)行分類識(shí)別。研究表明, 相比于小波變換方法, 利用基于海豚聽覺系統(tǒng)模型的特征提取方法進(jìn)行目標(biāo)分類識(shí)別的效果更好; 結(jié)合卷積神經(jīng)網(wǎng)絡(luò), 采用海豚喀啦信號(hào)結(jié)合海豚聽覺系統(tǒng)模型在水下目標(biāo)識(shí)別中可以獲得更好的結(jié)果。
海豚喀啦信號(hào); 海豚聽覺系統(tǒng); 目標(biāo)分類識(shí)別
很多動(dòng)物的體內(nèi)都有天然的回聲定位系統(tǒng), 例如蝙蝠、鯨魚和海豚等。研究表明, 具有回聲定位能力的動(dòng)物有很高的目標(biāo)分辨能力, 例如寬吻海豚能夠發(fā)現(xiàn)幾百米外的魚群, 還能識(shí)別出不同的魚群種類, 甚至可以分辨出黃銅、鋁及塑料等不同的物質(zhì)材料, 因此可以將海豚聲吶的良好特性應(yīng)用到人工聲吶中, 為當(dāng)前的目標(biāo)分類識(shí)別方法提供新的思路。
1947年, Arthur McBride首次提出大西洋寬吻海豚可以通過回聲定位水下物體, 之后多位科學(xué)家對(duì)海豚聲吶系統(tǒng)展開了研究, 最終得出海豚可由頭部發(fā)出聲音, 然后接收回來的信號(hào)并對(duì)其進(jìn)行處理的結(jié)論[1]。進(jìn)一步研究發(fā)現(xiàn), 海豚不僅能夠檢測(cè)到目標(biāo), 甚至可分辨出獵物的形狀及大小等。20世紀(jì)60年代之后, 有關(guān)學(xué)者利用寬吻海豚做了多組實(shí)驗(yàn), 結(jié)果表明, 海豚能夠準(zhǔn)確地區(qū)分生物目標(biāo)與人工目標(biāo), 對(duì)于相似的人工目標(biāo), 海豚甚至能夠分辨出材料和厚度不同的金屬盤及空心圓柱體等[2-3]。2007年, Branstetter等[4]通過總結(jié)之前的實(shí)驗(yàn)數(shù)據(jù)和結(jié)果, 提出一種海豚聽覺系統(tǒng)模型, 來模擬海豚在回聲定位過程中對(duì)不同目標(biāo)之間的區(qū)分。國(guó)內(nèi)相關(guān)研究起步較晚, 牛富強(qiáng)等[5-7]研究了海豚的發(fā)聲信號(hào), 發(fā)現(xiàn)海豚會(huì)根據(jù)生活環(huán)境改變發(fā)射信號(hào), 并對(duì)不同環(huán)境下的海豚發(fā)聲信號(hào)進(jìn)行了研究。
目前, 基于海豚聽覺系統(tǒng)的回聲識(shí)別定位研究較少。基于水聲目標(biāo)特征的分類識(shí)別方法, 目前應(yīng)用較為廣泛的有統(tǒng)計(jì)分類方法和神經(jīng)網(wǎng)絡(luò)方法[8]。文中使用支持向量機(jī)對(duì)從目標(biāo)回波中提取的小波能量譜峰值特征進(jìn)行分類, 同時(shí)利用海豚聽覺系統(tǒng)模型得到目標(biāo)回波的強(qiáng)度特征以及“時(shí)譜圖”, 并結(jié)合支持向量機(jī)和卷積神經(jīng)網(wǎng)絡(luò)對(duì)其分類, 有效地提高了分類識(shí)別率。
一般將寬吻海豚的聲音分成喀啦聲(click)、哨聲(whistles)和突發(fā)脈沖(burst pulses)3種。其中, 在完成定位和探測(cè)任務(wù)時(shí)主要使用的是喀啦聲信號(hào)。文獻(xiàn)[9]提到了1個(gè)寬吻海豚喀啦信號(hào)模型, 該模型由2個(gè)高斯包絡(luò)的負(fù)調(diào)頻線性調(diào)頻(linear frequency modulation, LFM)信號(hào)疊加構(gòu)成, 信號(hào)的表達(dá)式為
表1給出了3種海豚喀啦(dolphin click, DC)信號(hào)的參數(shù)設(shè)置(DC1、DC2、DC6)[9], 其中信號(hào)時(shí)長(zhǎng)0.6 ms, 高頻分量相對(duì)于低頻分量延遲0.1 ms。
表1 DC信號(hào)參數(shù)
海豚聲吶的接收系統(tǒng)就是它的聽覺系統(tǒng), 包括外耳、中耳和內(nèi)耳。不同于其他的哺乳動(dòng)物, 海豚和一些鯨類沒有耳廓, 外耳道也不容易看見。在大多數(shù)海豚中, 外耳就像是1個(gè)針孔, 它的一部分由纖維組織組成, 這種具有狹窄橫截面和纖維結(jié)構(gòu)的外耳道幾乎不能通過鼓膜韌帶成為中耳和內(nèi)耳的聲學(xué)通路。目前通常認(rèn)為海豚的外耳道是非功能性的, 聲音通過下頜骨的后半部分進(jìn)入海豚的頭部, 然后經(jīng)過1個(gè)充滿脂肪的管道傳播到包含中耳和內(nèi)耳的鼓膜骨室中。
文獻(xiàn)[4]中提到了1種海豚聽覺系統(tǒng)模型, 描述海豚在回聲定位識(shí)別任務(wù)中如何表示和使用多種識(shí)別線索。該模型由一組Gammatone帶通濾波器、半波整流器和低通濾波器組成。
1)Gammatone濾波器
Gammatone濾波器的脈沖響應(yīng)可以表示為
2)半波整流器
半波整流的過程可以描述為
3)低通濾波器
低通濾波器脈沖響應(yīng)
低通濾波器的輸出
該輸出融合了海豚聽覺神經(jīng)元的低通濾波特性, 由于該輸出包含時(shí)間和頻率下的特征, 因此稱為“時(shí)譜圖”。與常規(guī)的頻譜圖相比, 該模型能夠更加真實(shí)地描述海豚接收到的聲音。
聲誘餌、無人水下航行器(unmanned undersea vehicle, UUV)和水下懸浮物等均為常見的水下小目標(biāo), 分別執(zhí)行水下干擾、探測(cè)及打擊等多項(xiàng)任務(wù)。這些水下小目標(biāo)對(duì)艦艇和海洋設(shè)施的威脅很大且難以分辨, 因此需要對(duì)其進(jìn)行精確識(shí)別。文中利用亮點(diǎn)模型仿真了聲誘餌、UUV和水下懸浮物等3種目標(biāo)的回波數(shù)據(jù), 并利用小波變換和海豚聽覺系統(tǒng)模型對(duì)回波完成了特征提取。
仿真時(shí)選取的發(fā)射信號(hào)為L(zhǎng)FM和DC信號(hào)。LFM是水下目標(biāo)識(shí)別中常用的發(fā)射信號(hào), DC信號(hào)模擬海豚發(fā)聲方式。其中: LFM信號(hào)的頻帶范圍為60~100 kHz, 信號(hào)脈沖長(zhǎng)度為0.6 ms; DC信號(hào)的頻帶范圍選取同表1, 脈沖長(zhǎng)度均為0.6 ms。
1)小波變換
小波變換的定義如下
式中:為內(nèi)積; 稱為母小波;為尺度因子, 由經(jīng)過伸縮平移運(yùn)算得到; 為位移因子。
信號(hào)的尺度-小波能量譜定義為
在特征提取過程中, 主要利用信號(hào)的尺度-小波能量譜峰值作為目標(biāo)的特征。
2) 海豚聽覺系統(tǒng)模型
上文介紹了海豚聽覺系統(tǒng)的構(gòu)造, 并給出了海豚聽覺系統(tǒng)模型?;夭ㄐ盘?hào)通過該模型后可以得到1個(gè)時(shí)譜圖, 從中可提取出海豚在分辨水下目標(biāo)時(shí)利用的感知特征。在目標(biāo)識(shí)別中, 比較有用的一種特征是從強(qiáng)度模型(intensity model, IM)中提取出的IM特征。其定義為
以發(fā)射信號(hào)為DC1信號(hào)為例, 發(fā)射信號(hào)時(shí)域、頻域圖如圖2所示。分別利用2種特征提取方法對(duì)3種目標(biāo)的仿真回波進(jìn)行特征提取, 結(jié)果如圖3所示。圖中的橫坐標(biāo)表示目標(biāo)與入射信號(hào)的夾角, 縱坐標(biāo)表示特征的幅值大小。
從圖3可知, 利用信號(hào)的尺度-小波能量譜峰值和強(qiáng)度模型都可以完成對(duì)目標(biāo)回波的特征提取, 目標(biāo)的區(qū)分度均較高, 因此可以利用這2種特征完成對(duì)目標(biāo)的分類識(shí)別。對(duì)比2幅圖還可以發(fā)現(xiàn): 2種方法下目標(biāo)回波特征提取結(jié)果均是UUV的特征幅度較大, 水下懸浮物次之, 聲誘餌最小; 利用強(qiáng)度模型提取到的特征幅值高于信號(hào)的尺度-小能量譜峰值特征, 由于發(fā)射信號(hào)為DC1信號(hào), 這也從側(cè)面驗(yàn)證了相比于小波變換方法, 海豚聽覺系統(tǒng)模型更適合于對(duì)DC信號(hào)進(jìn)行特征提取。
圖2 DC1信號(hào)時(shí)域圖和頻域圖
圖3 仿真回波特征提取結(jié)果曲線
設(shè)計(jì)支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)2種分類器, 其中支持向量機(jī)對(duì)從目標(biāo)提取的小波能量譜峰值特征和通過海豚聽覺系統(tǒng)模型得到的強(qiáng)度特征進(jìn)行分類; 卷積神經(jīng)網(wǎng)絡(luò)對(duì)由海豚聽覺系統(tǒng)模型得到的時(shí)譜圖進(jìn)行分類。
支持向量機(jī)是一種基于統(tǒng)計(jì)理論的機(jī)器學(xué)習(xí)方法, 可以利用有限的數(shù)據(jù)很好地平衡所需系統(tǒng)的復(fù)雜性和學(xué)習(xí)能力, 更好地運(yùn)用到實(shí)際中, 增強(qiáng)了分類系統(tǒng)的魯棒性, 在非線性樣本的分類問題方面表現(xiàn)出了良好的應(yīng)用價(jià)值[10]。
支持向量機(jī)利用非線性映射方法將輸入信號(hào)映射到另一個(gè)空間中, 該空間一般是高維度的特征空間, 然后在該空間中求解出最優(yōu)分類超平面。支持向量機(jī)中比較重要的概念是核函數(shù), 文中在仿真中選取的是高斯核函數(shù)。
表2 支持向量機(jī)分類器識(shí)別率
海豚在接收到回波信息之后, 大腦可能會(huì)利用一種類似于神經(jīng)網(wǎng)絡(luò)的方式對(duì)回波的時(shí)譜信息進(jìn)行分析, 并提取相應(yīng)的特征來完成對(duì)目標(biāo)的分類[11]。文中結(jié)合目前在水下目標(biāo)識(shí)別領(lǐng)域應(yīng)用較多的深度學(xué)習(xí)方法中[12], 選取卷積神經(jīng)網(wǎng)絡(luò)(con- volutional neurual network, CNN)來模擬海豚大腦對(duì)回波時(shí)譜信息的處理過程。CNN是深度學(xué)習(xí)的一種核心方法, 其構(gòu)成一般包括輸入層、卷積層、池化層和全連接層[13]。
圖4 聲誘餌模型亮點(diǎn)回波時(shí)譜圖
表3 CNN分類器識(shí)別率
為了驗(yàn)證DC信號(hào)及海豚聽覺系統(tǒng)模型的優(yōu)越性, 設(shè)計(jì)水池實(shí)驗(yàn), 對(duì)3種目標(biāo)模型的回波特征提取并進(jìn)行目標(biāo)識(shí)別。實(shí)驗(yàn)系統(tǒng)示意圖如圖5所示。實(shí)驗(yàn)所用目標(biāo)實(shí)物如圖6所示。
圖5 實(shí)驗(yàn)系統(tǒng)示意圖
圖6 實(shí)驗(yàn)?zāi)繕?biāo)實(shí)物圖
對(duì)比表2~表4的結(jié)果可知, 利用支持向量機(jī)和CNN分類器均可完成對(duì)目標(biāo)的分類識(shí)別。使用支持向量機(jī)對(duì)目標(biāo)進(jìn)行分類識(shí)別時(shí), 利用基于海豚聽覺系統(tǒng)的IM模型提取的特征更有利于目標(biāo)的分類識(shí)別, 相比于LFM信號(hào), 在利用CD信號(hào)作為發(fā)射信號(hào)時(shí), 目標(biāo)的仿真識(shí)別率均可達(dá)90%以上, 實(shí)驗(yàn)識(shí)別率也處于80%左右, 這也說明海豚聽覺系統(tǒng)模型在對(duì)CD信號(hào)產(chǎn)生的回波進(jìn)行特征提取時(shí)有更好的適應(yīng)性。
表4 實(shí)驗(yàn)處理結(jié)果中不同分類器的識(shí)別率
使用基于CNN的分類器對(duì)目標(biāo)進(jìn)行分類識(shí)別時(shí), 利用海豚聽覺系統(tǒng)模型得到的回波信號(hào)時(shí)譜圖作為分類器的輸入, 可以得到很好的結(jié)果: 目標(biāo)的平均分類仿真識(shí)別率達(dá)到93.24%, 實(shí)驗(yàn)識(shí)別率達(dá)到80%以上, 相比于LFM信號(hào), 在利用CD信號(hào)作為發(fā)射信號(hào)時(shí), 得到的回波信號(hào)時(shí)譜圖更有利于CNN分類器對(duì)目標(biāo)的分類識(shí)別。
在發(fā)射信號(hào)不變時(shí), 相比于支持向量機(jī)方法, 基于CNN的分類器目標(biāo)分類效果更優(yōu), 目標(biāo)的分類仿真識(shí)別率最高可達(dá)95.93%, 實(shí)驗(yàn)識(shí)別率達(dá)85.52%。但同時(shí)也要注意到, 由于CNN的參數(shù)相比支持向量機(jī)更多, 因此運(yùn)算速度相對(duì)也會(huì)較慢, 這在實(shí)際應(yīng)用中是需要考慮的因素。
文中基于海豚聲吶系統(tǒng)結(jié)合支持向量機(jī)和CNN方法完成了對(duì)水下目標(biāo)的分類識(shí)別??紤]到海豚在目標(biāo)回聲定位和分辨中的卓越能力, 利用CD信號(hào), 結(jié)合海豚聽覺系統(tǒng)模型提取了目標(biāo)回波中的IM特征, 并對(duì)比傳統(tǒng)的小波變換方法, 利用支持向量機(jī)完成了目標(biāo)的分類識(shí)別。隨后, 利用海豚聽覺系統(tǒng)模型得到目標(biāo)回波的時(shí)譜圖, 結(jié)合CNN完成了目標(biāo)的分類識(shí)別。最后, 進(jìn)行水池實(shí)驗(yàn)驗(yàn)證了仿真結(jié)果。仿真結(jié)果表明, 利用海豚聽覺系統(tǒng)模型得到的回波時(shí)譜圖可以有效提高水下目標(biāo)的分類識(shí)別率, 且當(dāng)發(fā)射信號(hào)為CD信號(hào)時(shí), 分類效果更好。未來將繼續(xù)研究海豚大腦中的回波處理模型, 以期獲得更好的目標(biāo)分類識(shí)別結(jié)果。
[1] Au W W L, Scheifele P M. The Sonar of Dolphins[J]. The Journal of the Acoustical Society of America, 1993, 95(1): 585-586.
[2] Au W W L, Hastings M C. Principles of Marine Bio- acoustics[M]. New York : Springer US, 2008.
[3] Au W W L, Pawloski D A. Cylinder Wall Thickness Difference Discrimination by an Echolocating Atlantic Bottlenose Dolphin[J]. Journal of Comparative Physiology. A: Neuroethology, Sensory, Neural and Behavioral Physiology, 1992, 170(1): 41-47.
[4] Branstetter B K, Mercado E, Au W W L. Representing Multiple Discrimination Cues in a Computational Model of the Bottlenose Dolphin Auditory System[J]. The Jour- nal of the Acoustical Society of America, 2007, 122(4): 2459.
[5] 牛富強(qiáng), 楊燕明, 文洪濤, 等. 瓶鼻海豚的Click聲信號(hào)特性[J]. 聲學(xué)技術(shù), 2011, 30(2): 148-152.
[6] 牛富強(qiáng), 薛睿超, 周在明, 等. 印太瓶鼻海豚(Tursiops aduncus)通訊聲信號(hào)分類及特征參數(shù)的環(huán)境差異性分析[J]. 聲學(xué)學(xué)報(bào), 2020, 45(2): 189-195.Niu Fu-qiang, Xue Rui-chao, Zhou Zai-ming, et al. Analysis of Differences on Whistle Classification and Characteristics of Indo-Pacific Bottlenose Dolphins(Tursiops ad- uncus) in Different Environment[J]. Acta Acustica, 2020, 45(2): 189-195.
[7] 陳晟, 牛富強(qiáng), 林長(zhǎng)倫, 等. 不同環(huán)境下瓶鼻海豚click信號(hào)及仿真分析[J]. 聲學(xué)技術(shù), 2019, 38(4): 452-458.
[8] 景志宏, 林鈞清, 錢建立, 等. 水下目標(biāo)識(shí)別技術(shù)的研究[J]. 艦船科學(xué)技術(shù), 1999, 21(4): 38-44.
[9] Capus C, Pailhas Y, Brown K, et al. Bio-inspired Wideband Sonar Signals Based on Observations of the Bottlenose Dolphin(Tursiops Truncatus)[J]. The Journal of the Acoustical Society of America, 2007, 121(1): 594-604.
[10] 任超. 基于支持向量機(jī)的水下目標(biāo)識(shí)別技術(shù)[D]. 西安: 西北工業(yè)大學(xué), 2016.
[11] Au W W L, Andersen L N, René Rasmussen A, et al. Ne- ural Network Modeling of a Dolphin’s Sonar Discrimination Capabilities[J]. The Journal of the Acoustical Society of America, 1995, 98(1): 43-50.
[12] Lecun Y, Bengio Y, Hinton G. Deep Learning[J]. Nature, 2015, 521(7553): 436.
[13] Lecun Y, Bottou L. Gradient-based Learning Applied to Document Recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.
[14] Simonyan K, Zisserman A. Very Deep Convolutional Net- works for Large-Scale Image Recognition[EB/OL]. ArXiv, (2014-09-04)[2020-07-14]. https://arxiv.org/abs/1409. 1556.
Underwater Target Identification Based on Dolphin Auditory System Model
ZHOU Zhuo, LIANG Hong, YANG Chang-sheng, ZHAO Guo-gui
(School of Marine Science and Technology, Northwestern Polytechnical University, Xi’an 710072, China)
Extracting feature information from the active sonar echo of target is an effective method to realize underwater target classification and identification. The excellent performance of animal sonar in underwater target identification provides a solution for artificial sonar. In this study, the click signal of bottlenose dolphin is used as the transmitting signal of active sonar. The echo characteristics of the target are extracted by wavelet transform and model of dolphin auditory system, and are classified as the input of support vector machine. In addition, this paper proposes an idea that the time spectrum obtained by the model based on dolphin auditory system is used as the input of convolution neural network to classify and identify the target. The results show that compared with that of the wavelet transform method, the feature extraction method based on the computer model of dolphin auditory system is better for target classification and identification. Combining with convolution neural network, using dolphin click signal and model of dolphin auditory system can obtain better results in underwater target identification.
dolphin click signal; dolphin auditory system; target classification and identification
TJ630; TN911.72; Q811.211
A
2096-3920(2021)02-0147-06
10.11993/j.issn.2096-3920.2021.02.003
周卓, 梁紅, 楊長(zhǎng)生, 等. 基于海豚聽覺系統(tǒng)模型的水下目標(biāo)識(shí)別[J]. 水下無人系統(tǒng)學(xué)報(bào), 2021, 29(2): 147-152.
2020-07-14;
2020-07-24.
國(guó)家自然基金項(xiàng)目資助(61971354, 61771398).
周 卓(1996-), 男, 在讀碩士, 主要研究方向?yàn)樗滦盘?hào)處理.
(責(zé)任編輯: 楊力軍)