曾騰, 任露露,3, 王宇杰, 王朋, 黃海寧
(1.中國科學(xué)院 先進(jìn)水下信息技術(shù)重點(diǎn)實(shí)驗(yàn)室, 北京 100190;2.中國科學(xué)院 聲學(xué)研究所, 北京 100190;3.中國科學(xué)院大學(xué), 北京 100049)
水下成像聲吶對水下環(huán)境認(rèn)知具有重要的作用,除對水下環(huán)境進(jìn)行成圖外,還能對水下目標(biāo)實(shí)現(xiàn)檢測、跟蹤等[1]。三維成像聲吶相比于二維成像聲吶信息更加豐富,但是由于水下環(huán)境的特殊性,聲吶圖像的分辨率較低、容易出現(xiàn)信息缺失等問題,為三維成像聲吶的目標(biāo)檢測與跟蹤帶來了巨大挑戰(zhàn)。
對于水下二維目標(biāo)的檢測,國內(nèi)外主要圍繞基于形狀的檢測算法進(jìn)行研究。聲學(xué)成像由于受水深和光照的影響不大,需要利用灰度特征[2]和幾何特征來實(shí)現(xiàn)水下環(huán)境的目標(biāo)檢測?;趫D像的運(yùn)動目標(biāo)檢測技術(shù)主要有幀差法、背景消減法和光流法[3-4]。幀差法是對前后兩幀間的像素進(jìn)行逐個(gè)對比來突出目標(biāo)的位置和形狀變化狀態(tài),但在目標(biāo)運(yùn)動緩慢的情況下無法較好地檢測到目標(biāo)[5]。背景消減法將背景信息作為目標(biāo)提取的參考,原理與幀差法類似,適用于水下環(huán)境和發(fā)射聲強(qiáng)較為穩(wěn)定的情況。光流法利用運(yùn)動場來區(qū)分背景和目標(biāo),根據(jù)像素點(diǎn)的速度矢量特征能夠?qū)崿F(xiàn)對圖像的動態(tài)分析[6-7],在水下這種信噪比低、遮擋等情況下并不適用。
對于水下二維目標(biāo)的跟蹤方法,主要有基于濾波理論的跟蹤方法、基于MeanShift的跟蹤方法和基于偏微分方程的跟蹤方法[8]?;跒V波理論的方法利用數(shù)學(xué)統(tǒng)計(jì)方法來挖掘信號估計(jì)值,常見的有卡爾曼濾波方法、擴(kuò)展卡爾曼濾波方法和粒子濾波方法。基于MeanShift的方法利用目標(biāo)特征和空間信息相結(jié)合的方式來描述目標(biāo),但其對噪聲非常敏感,不適用于水聲圖像。基于偏微分方程的方法主要進(jìn)行輪廓跟蹤,一般分為基于邊緣的模型和基于區(qū)域的模型兩類輪廓模型,其中Li等提出的基于LBF(Local Binary Fitting)的水平集方法模型[9],利用圖像在局部區(qū)域的信息,使用核函數(shù)的局部邊緣適應(yīng)能量,獲取精確的局部圖像信息,從而實(shí)現(xiàn)強(qiáng)度不均的目標(biāo)提取。
三維成像聲吶獲取的圖像主要顯示形態(tài)為三維點(diǎn)云,其主要特征表現(xiàn)為高稀疏性、不規(guī)則性以及缺乏紋理屬性。三維目標(biāo)檢測在光學(xué)和雷達(dá)領(lǐng)域取得了顯著的進(jìn)展,相比于二維目標(biāo)檢測,三維目標(biāo)檢測利用幾何、形狀和比例等信息來檢測目標(biāo)。在光學(xué)和雷達(dá)領(lǐng)域,根據(jù)輸入數(shù)據(jù)的形態(tài),三維目標(biāo)檢測方法可以分為基于單目/立體圖像、基于點(diǎn)云和基于多模態(tài)融合的方法[10]。其中基于單目/立體圖像的方法中,通常采用基于模板匹配的方法、基于幾何特性的方法和基于圖像的偽激光雷達(dá)方法。但對于水下三維成像聲吶的目標(biāo)檢測和跟蹤處于剛剛起步的階段,研究成果較少。水下環(huán)境相比水上存在太多不確定的干擾因素,水下成像聲吶分辨能力也遠(yuǎn)遠(yuǎn)達(dá)不到光學(xué)成像系統(tǒng)的精度,同時(shí)三維聲吶目標(biāo)的稀疏性也與其他成熟系統(tǒng)圖像有著本質(zhì)區(qū)別[11],因此無法將雷達(dá)、光電圖像處理算法直接應(yīng)用到三維聲吶圖像處理中。
本文通過三維成像聲吶圖像的特性和二維、三維映射關(guān)系,在傳統(tǒng)的背景差分檢測方法和匹配濾波跟蹤方法基礎(chǔ)上,提出一種基于組合特征的水下三維目標(biāo)檢測跟蹤算法。該算法對三維聲吶獲取的成像數(shù)據(jù),首先經(jīng)過濾波和分割預(yù)處理,并將目標(biāo)的強(qiáng)度信息和距離信息映射到二維圖像上。在此基礎(chǔ)上,對多幀圖像進(jìn)行累積獲取背景圖像,利用二維水平集核函數(shù)的思想,通過背景消減的方式得到目標(biāo)核函數(shù),并通過聯(lián)合目標(biāo)的幾何特征進(jìn)行模板匹配跟蹤,在確保檢測率的同時(shí)提高目標(biāo)跟蹤效率。
假設(shè)三維成像聲吶接收平面陣的陣元數(shù)為64×64,陣元各向同性。發(fā)射聲波在傳播途中遇到聲阻抗變化,即聲波打到物體表面會發(fā)生反射和散射波。該過程示意圖見圖1,物體本身的特征信息會被調(diào)制到回波上。圖1中,Oxyz為笛卡爾坐標(biāo)系。
圖1 三維成像聲吶工作示意圖Fig.1 Working diagram of 3D imaging sonar work
三維成像聲吶的接收面陣中的每個(gè)接收單元,可以接收到不同距離和不同方向的回波疊加形成的混合信息。根據(jù)三維成像聲吶的成像原理,對接收到的信號進(jìn)行P×Q(P為俯仰角方向波束數(shù),Q為方位角方向波束數(shù))的波束形成,從而得到P×Q×S(S為生成的一系列距離切片的數(shù)量)大小的單幀數(shù)據(jù)[12],如圖2所示,其中S由聲吶探測距離L和距離分辨率RPr決定:
圖2 三維成像聲吶一幀波束能量結(jié)果Fig.2 Diagram of 3D imaging sonar beam energy per frame
(1)
圖2中,球面ABCD為其中一個(gè)距離切片,每個(gè)距離切片可以看作是距接收陣一定距離的二維能量分布圖,即切片包含P×Q個(gè)像素點(diǎn),是探測波束對目標(biāo)后向散射信號能量的體現(xiàn),每個(gè)像素點(diǎn)由聲吶方位角、俯仰角和距離共同作用的信號回波強(qiáng)度決定[11,13]。
當(dāng)成像范圍內(nèi)存在目標(biāo)時(shí),該距離切片上的相應(yīng)位置處會獲得較大的能量,反之則距離切片上各位置的能量很小。當(dāng)單幀數(shù)據(jù)經(jīng)由濾波和坐標(biāo)轉(zhuǎn)換操作后,能夠?qū)⑷S成像聲吶體數(shù)據(jù)的能量值一一映射到三維坐標(biāo)系中,形成一系列形式為(x,y,z,I)的數(shù)據(jù)點(diǎn)集合,即三維點(diǎn)云形式,其中I為該數(shù)據(jù)點(diǎn)能量值(散射強(qiáng)度)。
三維聲吶體數(shù)據(jù)的能量分布反映了目標(biāo)的外表形狀分布,而忽略了目標(biāo)表面后面的結(jié)構(gòu)。為了對三維結(jié)構(gòu)的聲吶圖像數(shù)據(jù)進(jìn)行分析研究,除直接作用于點(diǎn)云形式,還可以將三維體數(shù)據(jù)按照一定的規(guī)律,拆解成緊密關(guān)聯(lián)的二維圖像集合,即強(qiáng)度圖和距離圖[11,13]。
基于此,對于圖3中的波束,本文只關(guān)注兩個(gè)參數(shù),即到目標(biāo)表面(若存在目標(biāo))的距離和聲波響應(yīng)的幅值。通常通過尋找波束信號包絡(luò)的最大峰值位置來確定散射目標(biāo)的距離[14],如圖4所示。波束信號包絡(luò)bb(t,)指向方向=(θa,θe),并在t*時(shí)刻獲得包絡(luò)最大值s*,其中θa為聲吶方位角,θe為聲吶俯仰角。由此可以得到相應(yīng)的距離和相應(yīng)的聲波響應(yīng)幅值v*=bb(t*,),其中c=1 500 m/s 為水下聲波傳播速度。兩個(gè)參數(shù)的關(guān)聯(lián)性代表目標(biāo)在測量距離r*上目標(biāo)存在的聲波響應(yīng)幅值(可看作置信程度)為v*。
圖3 三維聲吶波束指向示意圖Fig.3 Diagram of 3D sonar beam direction
圖4 波束包絡(luò)bb(t,)Fig.4 Diagram of beam envelope bb(t,)
圖5 強(qiáng)度圖和距離圖示意圖Fig.5 Diagram of intensity and distance
背景消減法用當(dāng)前幀圖像減去背景圖像,得到信息量相對較小的差分圖像。對差分圖像的所有像素點(diǎn)與設(shè)定閾值做遍歷運(yùn)算,將大于閾值的像素點(diǎn)歸為目標(biāo)點(diǎn),將小于閾值的像素點(diǎn)歸為背景點(diǎn),從而實(shí)現(xiàn)運(yùn)動目標(biāo)的檢測[15]。其流程圖如圖6示。圖6中,Ik(x,y)為第k幀輸入圖像,Bk(x,y)為背景圖像,Dk為差分圖像,Ek(x,y)為差分圖像的二值化圖像。
圖6 基于背景消除法的目標(biāo)檢測流程Fig.6 Diagram of target detection based on background elimination method
則
Dk(x,y)=|Ik(x,y)-Bk(x,y)|
(2)
對差分圖像進(jìn)行二值化處理,即可得到對應(yīng)的二值化圖像Ek(x,y):
(3)
式中:T為二值化閾值。
匹配技術(shù)屬于基于決策理論方法的識別方法,可以用于目標(biāo)識別、目標(biāo)跟蹤、圖像拼接等方面。其原理是基于匹配的技術(shù)通過原型向量來表示每個(gè)類,并根據(jù)一種預(yù)先定義的測度,將一個(gè)未知模式賦予最接近的類[16]。
在三維聲吶的目標(biāo)匹配中,采用模板匹配的方式,其基本原理是利用樣本模板,與待匹配圖像進(jìn)行對比[17]。從待匹配圖像的左上角像素點(diǎn)開始,對比樣本模板和與其大小一樣的待匹配圖像范圍,按照一定的決策準(zhǔn)則計(jì)算匹配程度,直至樣本模板平移覆蓋整幅待匹配圖像,匹配程度最高的區(qū)域即目標(biāo)所在區(qū)域,原理如圖7所示。圖7中,W為二維檢測框?qū)挾?H為二維檢測框高度,I(i,j)為第(i,j)個(gè)點(diǎn)的強(qiáng)度值,Im為匹配模板圖像。
圖7 模板匹配原理示意圖Fig.7 Diagram of template matching principle
通過最小距離分類器[16]實(shí)現(xiàn)匹配跟蹤的決策,假設(shè)每個(gè)模式類的原型定義為該模式的平均向量:
(4)
式中:ωj為第j個(gè)模式類;Nj為來自類模式向量的數(shù)量;xj為第j個(gè)模式中的未知模式向量;Nω為類數(shù)。采用歐式距離求接近程度,將未知模式向量x賦給最接近的原型類,則問題簡化為計(jì)算距離測度:
Dj(x)=‖x-mj‖,j=1,2,…,Nω
(5)
式中:‖a‖=(aTa)1/2為歐幾里得范數(shù)。在Dj(x)獲得最小值時(shí),則將x賦類給ωj。
三維聲吶圖像的主要處理形式是點(diǎn)云形式。由于外界環(huán)境和目標(biāo)物理特性等影響,獲取的點(diǎn)云數(shù)據(jù)量大,且存在大量非目標(biāo)干擾點(diǎn),給后續(xù)的點(diǎn)云數(shù)據(jù)處理和應(yīng)用帶來很大的影響[11]。為了極大程度地壓縮數(shù)據(jù)量,并抑制干擾信息,需要對三維點(diǎn)云進(jìn)行圖像預(yù)處理。一般來說,三維成像聲吶單幀圖像中強(qiáng)度值越高,代表該點(diǎn)為目標(biāo)的可能性越大,同時(shí),目標(biāo)與周邊環(huán)境和干擾的強(qiáng)度值差異明顯,可以作為預(yù)處理方法的依據(jù)。因此,本文對三維圖像的預(yù)處理主要采用濾波和分割的方式,包括最大值濾波、閾值濾波和直通濾波。
首先采用固定閾值處理方法,將閾值固定在最大像素值的22%,即-3 dB最大旁瓣處,直接作用于波束信號進(jìn)行濾波。之后根據(jù)聲源位置和已知水深確定距離向的范圍,通過直通濾波過濾掉距離范圍之外的數(shù)據(jù)點(diǎn)。為了進(jìn)一步精簡點(diǎn)云,利用最大值濾波進(jìn)行數(shù)量壓縮[18]。根據(jù)圖2可知,單幀三維聲吶圖像是多個(gè)距離切片的形式,而切片上的像素點(diǎn)對應(yīng)波束的方位角和俯仰角。本文認(rèn)為,對于任意一個(gè)方向的波束,將能量看作是距離的分布直方圖,可以在所有的距離切片中找到一個(gè)最大值,且該點(diǎn)確定的方位角、俯仰角和距離認(rèn)為是目標(biāo)存在的位置,如圖8所示。因此,最大值濾波對所有波束進(jìn)行一系列距離切片的最大值檢索,可以得到最有可能出現(xiàn)目標(biāo)的位置集合。圖8中,nmax為當(dāng)前波束強(qiáng)度最大值對應(yīng)切片索引值,Imax為當(dāng)前波束強(qiáng)度最大值。
圖8 最大值濾波距離切片能量分布Fig.8 Slice energy distribution at the maximum filtering distance
強(qiáng)度圖是聲波響應(yīng)幅值v*與點(diǎn)對(x*,y*)關(guān)聯(lián)得到的(x*,y*,v*)形式,代表了目標(biāo)存在的置信程度。由于三維點(diǎn)云形式的相關(guān)卷積操作較為困難,對三維聲吶圖像的處理從強(qiáng)度圖和距離圖進(jìn)行展開,主要根據(jù)強(qiáng)度圖的信息實(shí)現(xiàn)目標(biāo)的檢測跟蹤。
傳統(tǒng)的跟蹤方法需要將目標(biāo)模板對每一幀圖像做匹配,跟蹤速度較慢。另外,三維聲吶目標(biāo)在不同幀圖像中的姿態(tài)和角度有所差異,給檢測跟蹤結(jié)果帶來較大影響。因此,本文在傳統(tǒng)的背景消除檢測和匹配跟蹤的基礎(chǔ)上,提出一種基于組合特征的水下三維目標(biāo)檢測跟蹤算法。
在進(jìn)行跟蹤之前,首先要對首幀圖像做初始化,其流程如圖9所示。首幀輸入包括背景圖像(可由聲吶在無目標(biāo)情況下采集得到)、首幀強(qiáng)度圖和距離圖。初始化階段的主要任務(wù)是實(shí)現(xiàn)目標(biāo)核函數(shù)和幾何特征的提取。其中核函數(shù)通過背景消減法的方式,對背景圖和首幀強(qiáng)度圖灰度化后進(jìn)行差分運(yùn)算,得到相應(yīng)的差分圖像,當(dāng)滿足差分圖像和強(qiáng)度灰度圖均為0時(shí),更新強(qiáng)度圖的相應(yīng)像素點(diǎn)位置為0,認(rèn)為該點(diǎn)是背景區(qū)域,另外設(shè)置閾值去除圖像中面積較小的區(qū)域塊,此時(shí)強(qiáng)度圖的非零位置視為目標(biāo)位置,從而得到目標(biāo)核函數(shù)。
圖9 首幀初始化流程圖Fig.9 Diagram of first frame initialization
經(jīng)過初始化得到檢測后的核函數(shù),利用該模板圖像對后續(xù)每幀強(qiáng)度圖進(jìn)行特征關(guān)聯(lián)和匹配跟蹤,其流程如圖10所示。從強(qiáng)度圖像流的第2幀開始,每一幀與上一幀進(jìn)行特征提取和特征關(guān)聯(lián),當(dāng)質(zhì)心特征在一定范圍內(nèi)時(shí),認(rèn)為目標(biāo)在三維成像聲吶視野范圍內(nèi)基本處于相對靜止的狀態(tài)或偏離距離很小,此時(shí)對上一幀檢測框進(jìn)行確認(rèn),判斷是否沿用上一幀的檢測框作為當(dāng)前幀的檢測框,否則對該幀圖像重新進(jìn)行模板匹配,更新檢測框信息,直至最后一幀完成檢測跟蹤操作。
圖10 基于組合特征的強(qiáng)度圖跟蹤流程圖Fig.10 Diagram of intensity image tracking based on combined features
為了描述聲吶圖像中人工目標(biāo)的特征,本文采用組合幾何特征的描述子,主要包含Hu不變矩、目標(biāo)質(zhì)心和目標(biāo)距離。對于同一目標(biāo)在轉(zhuǎn)動幅度不大的情況下,可以認(rèn)為質(zhì)心不會發(fā)生變化,通過質(zhì)心的位置能夠準(zhǔn)確定位目標(biāo)的位置。在聲吶強(qiáng)度圖中,將灰度值看作質(zhì)量可以求得連通區(qū)域的質(zhì)心。三維成像聲吶由于成像分辨率和水下環(huán)境干擾的影響,經(jīng)過最大值濾波的強(qiáng)度圖上的目標(biāo)會有所缺失,單個(gè)目標(biāo)會出現(xiàn)割裂的情況,導(dǎo)致在計(jì)算質(zhì)心時(shí)出現(xiàn)多個(gè)質(zhì)心或質(zhì)心偏移嚴(yán)重的問題。
根據(jù)每幀獲取的質(zhì)心和距離信息,假設(shè)第k幀強(qiáng)度圖按照區(qū)域大小獲得M個(gè)質(zhì)心Cm,對應(yīng)M個(gè)距離信息Dm,m=1,…,M和質(zhì)心相應(yīng)區(qū)塊面積Sm。首先根據(jù)Sm最大值對應(yīng)的距離信息,剔除距離差超過一定閾值的U個(gè)區(qū)塊,則當(dāng)前幀的質(zhì)心由加權(quán)可得
(6)
(7)
則第k幀和第k-1幀的質(zhì)心偏差表示為
dk=|Ck-Ck-1|=(Ck-Ck-1)(Ck-Ck-1)′
(8)
(9)
每幀M×N大小的強(qiáng)度圖函數(shù)f(x,y)的(p+q)階矩可定義為
(10)
對應(yīng)的(p+q)階中心距可由式(11)計(jì)算:
(11)
(12)
φ1=η20+η02
(13)
(14)
φ3=(η30-3η12)2+(3η21-η03)2
(15)
φ4=(η30+η12)2+(η21+η03)2
(16)
φ5=(η30-3η12)(η30+η12)[(η30+η12)2-3(η21+η03)2]+(3η21-η03)(η21+η03)[3(η30+η12)2-(η21+η03)2]
(17)
φ6=(η20-η02)[(η30+η12)2-(η21+η03)2]+4η11(η30+η12)(η21+η03)
(18)
φ7=(3η21-η03)(η30+η12)[(η30+η12)2-3(η21+η03)2]+(3η12-η03)(η21+η03)[3((η30+η12)2)-(η21+η03)2]
(19)
式中:φ1~φ7分別為2階矩和3階矩構(gòu)造的7個(gè)不變矩組。
由此可得,聲吶強(qiáng)度圖的組合幾何特征向量為α=[φ1,φ2,φ3,φ4,φ5,φ6,φ7,d,r],對前后幀的特征向量取標(biāo)準(zhǔn)歐式距離衡量兩幀目標(biāo)的相似程度:
(20)
式中:αk為第k幀的組合幾何特征向量;V為元素為S(j)2的K×K對角矩陣,S為標(biāo)準(zhǔn)偏差向量,K為組合幾何特征向量維度。
由圖5可知,強(qiáng)度圖和距離圖通過(x*,y*)信息緊密關(guān)聯(lián),另外根據(jù)三維點(diǎn)云映射到二維的規(guī)則,同樣可以將強(qiáng)度圖和距離圖反演映射至三維空間獲得點(diǎn)云。同樣,已知二維強(qiáng)度圖中的檢測框位置,可以根據(jù)一定規(guī)則映射到三維空間得到三維目標(biāo)檢測框,如圖11所示。
圖11 三維檢測框映射Fig.11 Diagram of 3D detection box mapping
圖12 試驗(yàn)?zāi)繕?biāo)及現(xiàn)場Fig.12 Test target and site
圖11中二維向三維的映射需結(jié)合三維聲吶成像的參數(shù)。假設(shè)三維聲吶成像的方位角范圍為θa=(-α,α,P),俯仰角范圍為θe=(-β,β,Q),與距離圖中的距離信息r可以得到(θa,θe,r)的數(shù)據(jù)形式。則三維坐標(biāo)系中的坐標(biāo)可以表示為
(21)
因此,由二維檢測框的起始點(diǎn)坐標(biāo)、寬度、高度和目標(biāo)的距離范圍可以得到三維檢測框,表示為(x+W,y+H,Δz)。
為了驗(yàn)證本文算法的有效性,對湖試數(shù)據(jù)進(jìn)行了算法處理。試驗(yàn)?zāi)繕?biāo)為1.5 m×1.5 m×1.5 m水下鋼框架結(jié)構(gòu)體目標(biāo),目標(biāo)入水深度3.67 m,成像距離為6 m。設(shè)備獲取的三維成像聲吶圖像參數(shù)為:方位角范圍θa=(-45°,45°),俯仰角范圍θe=(-45°,45°),陣元數(shù)48×48,512通道,波束數(shù) 128×128,工作頻率600 kHz,發(fā)射信號為CW脈沖,脈寬33 ms,聲吶作用距離120 m,測試數(shù)據(jù)設(shè)置N=70幀。
本文對三維聲吶接收回波信號分別做水平向和垂直向的波束形成,并對每幀三維聲吶圖像數(shù)據(jù)進(jìn)行預(yù)處理,包括最大值濾波、閾值濾波和直通濾波。預(yù)處理后并二維映射后得到一系列強(qiáng)度圖像流,圖13 為第1幀強(qiáng)度圖,可見經(jīng)過處理后的目標(biāo)輪廓較為清晰。
圖13 鋼框架結(jié)構(gòu)體目標(biāo)首幀聲吶強(qiáng)度圖Fig.13 Diagram of first frame sonar intensity of steel-frame target
跟蹤特征關(guān)聯(lián)的前后幀組合幾何特征距離F為0.05,質(zhì)心偏差閾值μ為8,利用目標(biāo)尺寸先驗(yàn)信息將前后幀最大距離偏差閾值為1.5??梢缘玫蕉S和三維跟蹤結(jié)果如圖14所示。從圖14中可以看出,二維圖像反演得到的點(diǎn)云結(jié)果真實(shí)地體現(xiàn)了實(shí)際目標(biāo)的幾何結(jié)構(gòu)和位置信息,無論是二維檢測框和三維檢測框,目標(biāo)都處于全覆蓋的狀態(tài),驗(yàn)證了同一個(gè)目標(biāo)在平移和小幅度旋轉(zhuǎn)的狀態(tài)下仍然能夠?qū)崿F(xiàn)較好的檢測跟蹤效果。
圖14 第2幀檢測跟蹤結(jié)果Fig.14 Second frame detection and tracking results
在本文提出的算法中,每一幀圖像都能實(shí)現(xiàn)較好的匹配結(jié)果,檢測框偏離程度處于可接受的范圍內(nèi)。為了評價(jià)算法的跟蹤性能,本文主要采用成功率[20]和計(jì)算開銷兩個(gè)性能指標(biāo)。其中跟蹤成功率通過計(jì)算邊界框的重疊率得到。
假設(shè)跟蹤的邊界框?yàn)棣胻,由人工標(biāo)注的準(zhǔn)確邊界框?yàn)棣胊,重疊率定義為
(24)
將多幀重疊率曲線下的面積作為評估標(biāo)準(zhǔn),面積越大,則跟蹤效果越好。
湖試數(shù)據(jù)算法驗(yàn)證的平臺為Windows10 x64操作系統(tǒng),處理器為Intel(R) Core(TM) i5-10210U CPU @1.60 GHz 2.11 GHz,內(nèi)存(RAM)為8.00 GB。在上述參數(shù)下,采用傳統(tǒng)檢測跟蹤算法和本文中的算法,對同批次數(shù)據(jù)得到的重疊率擬合后的曲線如圖15 所示。由圖15可以看出本文算法在跟蹤性能和時(shí)間開銷上均占優(yōu)勢:設(shè)定閾值F0=0.6,則重疊率大于閾值的成功幀所占總幀數(shù)比例為成功率,傳統(tǒng)算法為85.71%,本文算法為92.86%;傳統(tǒng)算法耗時(shí)147.346 090 s,幀均2.104 944 14 s,本文算法耗時(shí)58.945 753 s,幀均0.842 082 19 s,算法消耗時(shí)間相比傳統(tǒng)算法減少了約60%,大大提高了檢測跟蹤的效率。
圖15 跟蹤方法重疊率對比曲線Fig.15 Comparison of overlap rate of different tracking methods
本文算法的跟蹤性能主要受前后幀組合幾何特征距離F和質(zhì)心偏差閾值μ影響,為了分析該參數(shù)對算法性能的影響,本文首先分析質(zhì)心偏差閾值μ對算法的影像,取μ值分別為3、5、8、10、15、20來分析重疊率S和時(shí)間開銷t。隨著μ值的增加,時(shí)間開銷會隨之減少。另外,從圖16中可以看出,μ值越大,重疊率曲線下的面積越小,跟蹤效果越差,在μ值處于8時(shí),魯棒性和時(shí)間開銷處于算法性能最佳的平衡狀態(tài)。
圖16 不同μ值跟蹤重疊率對比Fig.16 Comparison of different μ vaules
表1 μ取值對時(shí)間開銷的影響
之后分析組合幾何特征距離F對算法的影響,主要分析對跟蹤重疊率的影響。取F值分別為0.05、0.1和0.2來分析重疊率。由圖17可以看出,F值越大,重疊率曲線下的面積越小,跟蹤效果越差,并在F值處于0.05時(shí)性能趨于平穩(wěn),跟蹤成功率最優(yōu)。
圖17 不同F(xiàn)值跟蹤重疊率對比Fig.17 Comparison of different F values
本文提出一種基于組合特征的水下三維目標(biāo)檢測跟蹤算法。該算法對三維聲吶獲取的圖像數(shù)據(jù)進(jìn)行圖像預(yù)處理,并映射到二維得到強(qiáng)度圖和距離圖,從二維的維度上進(jìn)行檢測和匹配跟蹤,并根據(jù)二維和三維的對應(yīng)關(guān)系反演到三維實(shí)現(xiàn)點(diǎn)云的跟蹤,最后利用Hu不變矩、質(zhì)心和距離等幾何特征,有效提高目標(biāo)跟蹤成功率,進(jìn)一步降低時(shí)間開銷,提高跟蹤效率。通過對湖試數(shù)據(jù)的分析,驗(yàn)證了算法的有效性。另外,本文還對影響算法性能的參數(shù)進(jìn)行了分析,發(fā)現(xiàn)質(zhì)心偏差μ值越大跟蹤效果越差,組合幾何特征距離F值越大跟蹤效果越差,為實(shí)際場景的應(yīng)用起到了參考意義。