趙 迪,行鴻彥,王海峰,閻 妍
(1.南京信息工程大學(xué)氣象災(zāi)害預(yù)報(bào)預(yù)警與評(píng)估協(xié)同創(chuàng)新中心,江蘇南京 210044;2.南京信息工程大學(xué)江蘇省氣象探測(cè)與信息處理重點(diǎn)實(shí)驗(yàn)室,江蘇南京 210044)
海雜波是海洋表面對(duì)雷達(dá)信號(hào)的后向散射回波,而對(duì)于海面漂浮小目標(biāo)[1]的檢測(cè)技術(shù),由于受到海面復(fù)雜情況影響,存在著較大的阻礙,一直是雷達(dá)探測(cè)領(lǐng)域研究的熱點(diǎn)。不同于輪船、軍艦等大型目標(biāo)可以利用回波能量進(jìn)行檢測(cè)[2],小船、浮標(biāo)、蛙人等尺寸小的海面目標(biāo)回波弱,小目標(biāo)的雷達(dá)截面積(Radar Cross Section,RCS)低,已不適用傳統(tǒng)的檢測(cè)方法進(jìn)行檢測(cè)。目前,對(duì)海面小目標(biāo)的檢測(cè)方法有時(shí)頻分析、分形特性、機(jī)器學(xué)習(xí)等方法,而利用機(jī)器學(xué)習(xí)算法對(duì)海雜波與目標(biāo)回波數(shù)據(jù)特征提取與評(píng)估分類(lèi)一直是近年來(lái)的研究熱點(diǎn)。
早在1993年,Haykin 等人對(duì)海雜波時(shí)間序列的分形特性進(jìn)行研究,發(fā)現(xiàn)可以利用海雜波分形維數(shù)這一特征來(lái)進(jìn)行目標(biāo)檢測(cè)。隨后,Lo 等[3]利用海雜波與目標(biāo)回波數(shù)據(jù)單尺度分形維數(shù)的差異性進(jìn)行了目標(biāo)檢測(cè)。Hu 等[4]利用海雜波與目標(biāo)回波的多尺度分形特性的差異性,提出了基于Hurst指數(shù)的檢測(cè)方法。邵夫馳等[5]結(jié)合分?jǐn)?shù)布朗運(yùn)動(dòng)理論,利用多重分形去勢(shì)波動(dòng)法確定多重分形參數(shù)。于曉涵等[6]從時(shí)頻分析的角度提出了基于短時(shí)稀疏分?jǐn)?shù)階變換和短時(shí)稀疏分?jǐn)?shù)階模糊函數(shù)的雷達(dá)機(jī)動(dòng)目標(biāo)檢測(cè)和估計(jì)方法。Shui 等[7]從多特征聯(lián)合的角度,選取一個(gè)時(shí)域幅度特征與兩個(gè)頻域多普勒幾何特征相結(jié)合,提出了基于三特征的檢測(cè)方法。此后,Shui等[8]又提出一種時(shí)頻三特征檢測(cè)方法,很大程度上改善了檢測(cè)方法性能。時(shí)艷玲等[9]利用經(jīng)驗(yàn)?zāi)B(tài)分解的方法,分離出高能量低階IMF 分量,計(jì)算分量在平均能量中的占比作為特征。以上檢測(cè)方法所采用的特征,都取得了較好的檢測(cè)效果。但上述算法所有的特征都需要單獨(dú)計(jì)算,加大了計(jì)算復(fù)雜度,同時(shí)隨著特征的維度的增加,分類(lèi)器設(shè)計(jì)難度進(jìn)一步加大。
本文將利用堆棧自編碼器自適應(yīng)地提取海雜波與目標(biāo)回波的深層次特征,使用時(shí)頻域特征結(jié)合的方法來(lái)提高特征的差異性,并對(duì)幾種不同的輸出特征維數(shù)進(jìn)行實(shí)驗(yàn),對(duì)比得出最優(yōu)特征維數(shù)。引入遺傳優(yōu)化算法(Genetic Algorithm,GA)對(duì)XGBoost 中的超參數(shù)組進(jìn)行尋優(yōu),利用選擇、交叉、變異算子迭代更新得到子代基因,快速找到最優(yōu)超參數(shù)組,訓(xùn)練并優(yōu)化模型。提出一種堆棧自編碼器(Stacked Autoencoder,SAE)與GA-XGBoost 算法結(jié)合(SAE-GA-XGBoost)的檢測(cè)方法,并利用IPIX 數(shù)據(jù)集來(lái)驗(yàn)證所提檢測(cè)方法的穩(wěn)定檢測(cè)性能。
基于堆棧自編碼器與遺傳算法優(yōu)化XGBoost算法(SAE-GA-XGBoost)的檢測(cè)方法利用了堆棧自編碼器(Stacked Autoencoder,SAE),XGBoost 算法以及遺傳算法(Genetic Algorithm,GA),分別用于提取深層次特征、對(duì)所提取特征進(jìn)行評(píng)估分類(lèi)和對(duì)XGBoost 網(wǎng)絡(luò)中超參數(shù)進(jìn)行尋優(yōu)更新。下面分別對(duì)3種算法進(jìn)行介紹。
自編碼器是一種由編碼器與解碼器兩部分構(gòu)成的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),包含輸入層、隱含層、輸出層三層結(jié)構(gòu)。其網(wǎng)絡(luò)結(jié)構(gòu)函數(shù)及損失函數(shù)[10-12]為
式中,x為輸入層,輸入為數(shù)據(jù)時(shí)間序列,x'為輸出層,h為隱含層,W、W'、b、b'分別為編碼與解碼過(guò)程中的權(quán)重與偏置。σ為sigmoid函數(shù),為
堆棧自編碼器是將多個(gè)自編碼器堆疊而成的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其優(yōu)勢(shì)在于能夠?qū)斎霐?shù)據(jù)進(jìn)行逐層編碼、解碼,將前一個(gè)編碼器的隱含層作為下一個(gè)編碼器的輸入層,從而獲得輸入數(shù)據(jù)的高階特征。在訓(xùn)練過(guò)程中,為解決模型退化、陷入局部最優(yōu)等問(wèn)題,網(wǎng)絡(luò)往往采用逐層貪婪算法,即一次只訓(xùn)練一個(gè)自編碼器。堆棧自編碼器的損失函數(shù)為
式中,m為輸入時(shí)間序列的單元個(gè)數(shù),nl為堆棧自編碼器網(wǎng)絡(luò)總共的層數(shù),sl為第一層的神經(jīng)單元數(shù),λ為權(quán)重衰減參數(shù)。損失函數(shù)的第一項(xiàng)為實(shí)際值與網(wǎng)絡(luò)輸出的最小均方差之和,||·||為l2范式。損失函數(shù)第二項(xiàng)為正則化項(xiàng),作用在于減小權(quán)重幅值以防止過(guò)擬合,具體表示為編碼、解碼權(quán)重矩陣每一項(xiàng)系數(shù)的平方和。堆棧自編碼器通過(guò)逐層反復(fù)迭代來(lái)更新參數(shù),最終使整體網(wǎng)絡(luò)的代價(jià)函數(shù)達(dá)到最小值。
XGBoost 算法是一種多分類(lèi)回歸樹(shù)集成(Classification and Regression Trees,CART)的算法,屬于Boosting 算法類(lèi)別。其基本思路是把多棵性能各異的樹(shù)模型組合成一個(gè)性能相對(duì)好的模型[13],模型可表示為
XGBoost算法的目標(biāo)函數(shù)為
式中,l為損失函數(shù),yi為真實(shí)樣本值,Ω(ft)為全部決策樹(shù)計(jì)算出的正則項(xiàng),C為常數(shù)。模型目標(biāo)函數(shù)由損失函數(shù)和正則項(xiàng)兩部分組成。對(duì)目標(biāo)函數(shù)進(jìn)行二階泰勒函數(shù)展開(kāi),得
式中,
將第j個(gè)葉子結(jié)點(diǎn)的所有樣本xi劃入到一個(gè)葉子結(jié)點(diǎn)的樣本集合中,定義為Ij={i|q(xi)=j},則式(6)可改寫(xiě)為
式中,γ為節(jié)點(diǎn)切分難度系數(shù),λ'為L(zhǎng)2正則化系數(shù),T為當(dāng)前樹(shù)的葉子節(jié)點(diǎn)個(gè)數(shù),wj為葉子節(jié)點(diǎn)值。令同時(shí)令目標(biāo)函數(shù)導(dǎo)數(shù)為0,得最優(yōu)權(quán)重為
得最終目標(biāo)函數(shù)為
在訓(xùn)練過(guò)程中,模型的性能受超參數(shù)的影響較大。超參數(shù)詳細(xì)信息如表1所示??梢钥闯?,眾多超參數(shù)的選取決定了XGBoost模型的訓(xùn)練效果,選取不當(dāng)會(huì)嚴(yán)重影響分類(lèi)結(jié)果,因此需要對(duì)XGBoost 網(wǎng)絡(luò)的超參數(shù)組進(jìn)行優(yōu)化,以獲取適應(yīng)訓(xùn)練樣本的模型,來(lái)提高最終檢測(cè)概率。
表1 XGBoost的超參數(shù)
引用遺傳算法[14]對(duì)XGBoost 模型中的超參數(shù)組進(jìn)行尋優(yōu)。遺傳算法是一種隨機(jī)自適應(yīng)全局搜索算法,通過(guò)二進(jìn)制編碼,經(jīng)過(guò)群體選擇、交叉、變異和消除等過(guò)程后得到子代基因。遺傳算法中3個(gè)算子如下:
1)選擇算子。通過(guò)輪盤(pán)賭方法,計(jì)算每個(gè)個(gè)體的適應(yīng)度值構(gòu)成輪盤(pán)比例進(jìn)行隨機(jī)選擇。
2)交叉算子。設(shè)立閾值k,在基因的第k個(gè)位置進(jìn)行交叉。
3)變異算子。根據(jù)突變概率選擇基因突變位置,進(jìn)行0-1轉(zhuǎn)換,防止局部尋優(yōu)。
通過(guò)遺傳算法多次迭代尋優(yōu)過(guò)后,設(shè)置算法迭代終止條件來(lái)決定遺傳算法是否終止。將XGBoost 網(wǎng)絡(luò)中的超參數(shù)組作為遺傳算法的個(gè)體種群,種群總體個(gè)數(shù)設(shè)置為50組,將雷達(dá)回波數(shù)據(jù)的檢測(cè)概率作為算法適應(yīng)度函數(shù),將最高適應(yīng)度值與最低適應(yīng)度值的差值是否小于10-5作為迭代終止條件,通過(guò)選擇、交叉變異等過(guò)程搜索出最優(yōu)參數(shù),以提高檢測(cè)方法性能。
為提升海面小目標(biāo)檢測(cè)概率,基于SAE-GAXGBoost 算法的檢測(cè)方法將分為訓(xùn)練與檢測(cè)兩部分來(lái)設(shè)計(jì),通過(guò)將訓(xùn)練部分獲得的堆棧自編碼器模型,最優(yōu)超參數(shù)組與判決門(mén)限輸入檢測(cè)部分模型中進(jìn)行實(shí)時(shí)更新,提升最終檢測(cè)效果。同時(shí)通過(guò)計(jì)算選取訓(xùn)練部分XGBoost 網(wǎng)絡(luò)輸出的預(yù)測(cè)值作為判決門(mén)限,實(shí)現(xiàn)檢測(cè)方法恒虛警特性。
SAE-GA-XGBoost 檢測(cè)方法的流程圖如圖1所示,分為訓(xùn)練部分與檢測(cè)部分。在訓(xùn)練部分過(guò)程中,為了更好地挖掘雷達(dá)回波數(shù)據(jù)的高維特征并適配堆棧自編碼器模型,首先對(duì)海雜波與目標(biāo)回波訓(xùn)練數(shù)據(jù)進(jìn)行歸一化預(yù)處理,構(gòu)建兩層堆棧自編碼器進(jìn)行特征提取。然后分別將海雜波與目標(biāo)回波數(shù)據(jù)打上“0”與“1”的標(biāo)簽,輸入到XGBoost網(wǎng)絡(luò)中進(jìn)行訓(xùn)練。接著利用遺傳算法對(duì)XGBoost 訓(xùn)練模型進(jìn)行尋優(yōu),得到最優(yōu)超參數(shù)組并對(duì)檢測(cè)部分XGBoost 網(wǎng)絡(luò)進(jìn)行超參數(shù)更新。同時(shí)結(jié)合虛警率Pfa計(jì)算,選取XGBoost網(wǎng)絡(luò)輸出的預(yù)測(cè)值ρ與判決門(mén)限ξ對(duì)比,更新判決門(mén)限。
在檢測(cè)部分過(guò)程中,通過(guò)引入訓(xùn)練部分中訓(xùn)練好的堆棧自編碼器網(wǎng)絡(luò)模型、最優(yōu)超參數(shù)組以及更新過(guò)的判決門(mén)限ξ,將待測(cè)數(shù)據(jù)訓(xùn)練得到的預(yù)測(cè)值ρ'與判決門(mén)限進(jìn)行比較,得到最終的分類(lèi)結(jié)果,當(dāng)ρ'>ξ時(shí),判斷為待測(cè)數(shù)據(jù)中有目標(biāo);當(dāng)ρ'<ξ時(shí),判斷待測(cè)數(shù)據(jù)為純海雜波。當(dāng)海況發(fā)生變化時(shí),訓(xùn)練部分能夠?qū)崟r(shí)根據(jù)新的回波數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)以及得到新的最優(yōu)超參數(shù)與判決門(mén)限,從而實(shí)現(xiàn)虛警可控并提高在線檢測(cè)概率。
在高維特征提取過(guò)程中,由于海雜波數(shù)據(jù)和目標(biāo)回波數(shù)據(jù)均經(jīng)過(guò)歸一化處理,且利用一個(gè)堆棧自編碼器提取特征時(shí)只能從單一域提取,提取的特征直觀上沒(méi)有較好的區(qū)分性。因此,提出一種時(shí)頻域特征結(jié)合的方法,通過(guò)兩個(gè)堆棧自編碼器分別訓(xùn)練得到時(shí)域與頻域的深層次特征,再將時(shí)頻域提取的特征連接組合成新的高維特征,如圖2所示。該方法可以增加海雜波與海面回波數(shù)據(jù)特征間的差異性,并穩(wěn)定后續(xù)檢測(cè)流程的檢測(cè)性能。
實(shí)現(xiàn)檢測(cè)方法虛警可控先要取得GA-XGBoost檢測(cè)方法評(píng)估分類(lèi)的實(shí)際為海雜波的n組預(yù)測(cè)值,并按從大到小排列,記為ρ1,ρ2,…,ρn。在已知虛警率的情況下,可得判決門(mén)限
具體判決門(mén)限改動(dòng)過(guò)程如圖3所示。共有1 134個(gè)實(shí)際標(biāo)簽為“0”的總樣本,如果將判決門(mén)限ξ=0.5,則有9 個(gè)虛警點(diǎn),虛警率Pfa=0.79%。為了達(dá)到10-3虛警率,則需要將判決門(mén)限上調(diào)至如圖所示位置。此時(shí)判決門(mén)限ξ=0.968 8,只有一個(gè)虛警點(diǎn)。因此通過(guò)改動(dòng)判決門(mén)限,滿(mǎn)足虛警率條件,從而達(dá)到分類(lèi)器的虛警可控,使其具有恒虛警特性。同時(shí),在改動(dòng)過(guò)后的判決門(mén)限非常高的情況下,檢測(cè)概率達(dá)到了94.30%,可見(jiàn)實(shí)際為有目標(biāo)的預(yù)測(cè)值普遍高于0.968 8,有較好的聚斂性。
圖3 判決門(mén)限改動(dòng)具體過(guò)程
由于特征參數(shù)對(duì)檢測(cè)結(jié)果的影響,本節(jié)將對(duì)高維特征進(jìn)行實(shí)驗(yàn)驗(yàn)證。利用數(shù)據(jù)對(duì)SAE-GAXGBoost 檢測(cè)方法進(jìn)行性能檢測(cè),并通過(guò)與其他多組檢測(cè)方法對(duì)比,驗(yàn)證所提檢測(cè)方法的穩(wěn)定高效性能。
本文所使用的數(shù)據(jù)來(lái)源于IPIX 雷達(dá)目標(biāo)數(shù)據(jù)庫(kù),由加拿大McMaster 大學(xué)的Haykin 教授在1993年的加拿大東海岸采集獲取。雷達(dá)工作在X波段,頻率為9.39 GHz。實(shí)驗(yàn)采取了其中的10 組數(shù)據(jù),每組數(shù)據(jù)由14 個(gè)相鄰距離單元組成,每個(gè)距離單元包含131 072 個(gè)脈沖數(shù),距離分辨率為30 m,目標(biāo)為用金屬絲網(wǎng)包裹的聚苯乙烯泡沫塑料球,直徑長(zhǎng)約1 m。根據(jù)數(shù)據(jù)發(fā)射和接收方式的不同得到4 種極化方式,分別為HH,HV,VH,VV。數(shù)據(jù)受海況影響,SCR 的起伏變化較大。表2為IPIX 雷達(dá)數(shù)據(jù)具體說(shuō)明。數(shù)據(jù)中#17 和#280兩組數(shù)據(jù)的浪高高于其他幾組數(shù)據(jù),屬于高海況數(shù)據(jù)。
表2 IPIX雷達(dá)數(shù)據(jù)具體說(shuō)明
不同域高維特征驗(yàn)證實(shí)驗(yàn)分別測(cè)試了使用時(shí)域、頻域與時(shí)頻域結(jié)合特征時(shí)SAE-GA-XGBoost 檢測(cè)方法的檢測(cè)性能,并將3種特征的檢測(cè)效果進(jìn)行了對(duì)比。實(shí)驗(yàn)選取了#54號(hào)數(shù)據(jù)HH極化下的時(shí)間序列,頻域數(shù)據(jù)是將原數(shù)據(jù)通過(guò)FFT 預(yù)處理后,再歸一化至[0,1]區(qū)間內(nèi)。歸一化函數(shù)使用的是sigmoid 函數(shù)。實(shí)驗(yàn)觀測(cè)樣本共有11 200 個(gè),訓(xùn)練過(guò)程中,訓(xùn)練集與測(cè)試集的劃分比例為8∶2。由于每個(gè)距離單元的數(shù)據(jù)都很長(zhǎng),且海雜波數(shù)據(jù)與目標(biāo)數(shù)據(jù)數(shù)量不匹配,目標(biāo)數(shù)據(jù)數(shù)量遠(yuǎn)少于海雜波數(shù)據(jù)數(shù)量。為了增加目標(biāo)數(shù)據(jù)的樣本量,實(shí)驗(yàn)中每段數(shù)據(jù)觀測(cè)長(zhǎng)度為N=1 024,且前后兩組相鄰數(shù)據(jù)的部分單元有所重疊,重疊單元數(shù)為P=924。數(shù)據(jù)選取如圖4所示。
圖4 數(shù)據(jù)選取示意圖
堆棧自編碼器構(gòu)建兩層,第一層隱含層的單元數(shù)設(shè)為256,時(shí)域、頻域輸出128 維特征,時(shí)頻域結(jié)合分別輸出64 維時(shí)域、頻域特征,結(jié)合為128 維特征。圖5為3 種不同特征在GA-XGBoost 檢測(cè)方法下的分類(lèi)器檢測(cè)性能圖。由圖可知,在虛警率Pfa=10-3時(shí),時(shí)域特征的檢測(cè)概率為56.60%,頻域特征的檢測(cè)概率為69.62%,時(shí)頻域結(jié)合特征的檢測(cè)概率為94.30%??梢?jiàn)時(shí)頻域特征結(jié)合方法提取的高維特征的檢測(cè)效果遠(yuǎn)高于單一域提取的高維特征的檢測(cè)效果,這是因?yàn)椴煌?xùn)練模型訓(xùn)練過(guò)程也有所不同,同時(shí)結(jié)合不同域特征,能有效地提高特征的整體差異性。
圖5 3種不同域特征的檢測(cè)性能圖
此外,特征維數(shù)的不同,也會(huì)影響最終檢測(cè)效果。為了探索特征在不同維數(shù)下對(duì)檢測(cè)性能的影響,選取#54 數(shù)據(jù),維數(shù)分別為32、64、128、192 及256 進(jìn)行實(shí)驗(yàn)。圖6為5 種不同維數(shù)特征的性能檢測(cè)圖。維數(shù)為32 的特征檢測(cè)概率最差,只有35.71%,維數(shù)為64 與256 的特征檢測(cè)概率分別為56.33%和60.13%,維數(shù)為192 的特征檢測(cè)概率為91.67%,維數(shù)為128 的特征檢測(cè)概率最高,達(dá)到了94.30%,因此確定高維特征的維數(shù)為128。
圖6 不同維數(shù)特征的檢測(cè)性能圖
對(duì)選取的10組數(shù)據(jù)進(jìn)行不同極化下的性能檢測(cè)。圖7為10 組數(shù)據(jù)在4 種極化下的平均信雜比對(duì)比圖。從圖中可以看出,兩種交叉極化方式下的平均信雜比普遍高于兩種共極化方式下的平均信雜比。同時(shí),由于VV 極化方式相比HH 極化方式產(chǎn)生了更大的布拉格散射,前者的平均信雜比會(huì)更低[13]。4 種極化下的平均信雜比不同,導(dǎo)致4種極化下的檢測(cè)概率也有所差異。HV、VH極化方式要更優(yōu)于HH、VV極化方式。
圖7 4種極化下10組數(shù)據(jù)的平均信雜比
由于XGBoost 網(wǎng)絡(luò)中超參數(shù)組對(duì)最終檢測(cè)性能產(chǎn)生影響,對(duì)應(yīng)的數(shù)據(jù)不同,檢測(cè)效果就會(huì)不同。遺傳優(yōu)化算法會(huì)根據(jù)不同數(shù)據(jù)進(jìn)行實(shí)時(shí)迭代更新。表3為HH 極化下部分?jǐn)?shù)據(jù)迭代后選取的超參數(shù)組以及檢測(cè)概率。
表3 GA-XGBoost選取的在HH極化下部分?jǐn)?shù)據(jù)的最優(yōu)超參數(shù)組
圖8為10 組數(shù)據(jù)在4 種極化下的檢測(cè)性能對(duì)比圖。圖8中設(shè)虛警率Pfa=10-3,累計(jì)脈沖數(shù)N=1 024,重疊度P=924。從圖中可以看出HH、HV、VH三種極化方式的檢測(cè)效果遠(yuǎn)高于VV極化方式,且本實(shí)驗(yàn)提出的檢測(cè)方法對(duì)HH極化方式的數(shù)據(jù)的檢測(cè)效果較好,甚至部分略?xún)?yōu)于HV、VH極化方式。
圖8 10組數(shù)據(jù)在4種極化下的SAE-GA-XGBoost檢測(cè)方法的檢測(cè)性能對(duì)比(Pfa=10-3)
將SAE-GA-XGBoost 檢測(cè)方法與其他檢測(cè)方法對(duì)比,做進(jìn)一步驗(yàn)證,如圖9所示。在HH 和HV兩種極化方式下將SAE-GA-XGBoost 檢測(cè)方法與FFT、Hurst 指數(shù)[3]與三特征檢測(cè)方法[6]進(jìn)行對(duì)比。從圖9(a)可以看出,基于FFT、Hurst指數(shù)和三特征的檢測(cè)方法的平均檢測(cè)率為19.17%、30.15%和51.33%,而SAE-GA-XGBoost 檢測(cè)方法的平均檢測(cè)概率最高,為64.27%,且10 組數(shù)據(jù)檢測(cè)率均高于其他檢測(cè)方法。圖9(b)中,雖然在HV極化下SAEGA-XGBoost 檢測(cè)方法對(duì)#54、#320 等幾組數(shù)據(jù)的檢測(cè)性能略低于三特征檢測(cè)方法,但是其平均檢測(cè)率為65.03%,而基于FFT、Hurst 指數(shù)和三特征檢測(cè)方法的平均檢測(cè)率分別為24.61%、46.88%和63.41%,可見(jiàn)SAE-GA-XGBoost 檢測(cè)方法在HV 極化下的檢測(cè)率較其他三種檢測(cè)方法仍有優(yōu)勢(shì)。
圖9 HH和HV極化下4種檢測(cè)方法的檢測(cè)結(jié)果對(duì)比(Pfa=10-3)
進(jìn)一步選取具體數(shù)據(jù)進(jìn)行分析。表4例舉了#17、#26、#30 和#280 數(shù)據(jù)的3 種檢測(cè)方法的檢測(cè)性能。由表4可知,SAE-GA-XGBoost 檢測(cè)方法在4種極化方式下均有明顯優(yōu)勢(shì),并對(duì)#26 和#30 這些平均信雜比較低的數(shù)據(jù)仍有較好的檢測(cè)效果。對(duì)#17 和#280 高海況數(shù)據(jù)的檢測(cè)效果較其他檢測(cè)方法有著顯著的提高,可見(jiàn)SAE-GA-XGBoost 檢測(cè)方法針對(duì)高海況下的海面回波數(shù)據(jù)有更加良好的檢測(cè)效果。
表4 #17,#26,#30和#280在4種極化下的4種檢測(cè)方法性能對(duì)比
本文使用了堆棧自編碼器自適應(yīng)地提取深層次特征,針對(duì)單一域中海雜波與目標(biāo)回波數(shù)據(jù)特征區(qū)分度較低的問(wèn)題,利用時(shí)頻域特征結(jié)合的方法,將時(shí)域、頻域分別提取的特征組合為高維特征,來(lái)提高特征的差異性,相較于單一域特征,時(shí)頻域結(jié)合特征檢測(cè)概率提高了24.68%。通過(guò)實(shí)驗(yàn)驗(yàn)證,選取特征維數(shù)為128時(shí),達(dá)到最佳檢測(cè)效果。同時(shí)對(duì)于XGBoost網(wǎng)絡(luò)超參數(shù)組尋優(yōu)問(wèn)題,引入遺傳優(yōu)化算法,初始化隨機(jī)生成50組染色體,設(shè)置迭代終止條件為最高適應(yīng)度值與最低適應(yīng)度值的差值小于10-5,利用選擇、交叉、變異算子迭代更新得到子代基因,快速找到最優(yōu)超參數(shù)組,訓(xùn)練并優(yōu)化模型。提出了一種基于SAE-GA-XGBoost 算法的海面小目標(biāo)檢測(cè)方法并進(jìn)行了實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,SAE-GA-XGBoost 檢測(cè)方法在HH 極化下檢測(cè)結(jié)果最佳,檢測(cè)概率提高了12.94%。#17和#280 高海況數(shù)據(jù)在HH 極化下的檢測(cè)概率分別為80.02%和82.73%,提升效果顯著,可見(jiàn)SAE-GAXGBoost 檢測(cè)方法對(duì)高海況數(shù)據(jù)的檢測(cè)效果更好。根據(jù)與其他三種檢測(cè)方法的對(duì)比顯示,SAE-GAXGBoost 檢測(cè)方法總體上有更加良好的檢測(cè)性能,可運(yùn)用于高海況下的海面小目標(biāo)檢測(cè)中。