盧建 索蓮 陳帥
(1.中國電子科技集團公司第十四研究所 江蘇省南京市 210013 2.南京國睿防務(wù)系統(tǒng)有限公司 江蘇省南京市 210039)
艦載監(jiān)視雷達被用于探測海面小目標(例如潛望鏡,小船和浮標)時,探測概率很低。這是因為,海雜波不僅受雷達自身參數(shù)的影響,同時還受到各種環(huán)境因素的影響,顯示出明顯的非平穩(wěn)性,時空相關(guān)性和非高斯特性[1,2,3]。海面小目標的RCS 小,回波微弱,運動速度慢,具有較低的信雜比(Signal Clutter Ratio,SCR)。因此,基于特征的檢測方法可有效的解決這類問題,該方法利用雜波和目標回波的一個或多個特征來實現(xiàn)海面小目標的檢測。
隨著雷達性能的不斷提高,在檢測海雜波背景下的小目標時,出現(xiàn)了越來越多的特征可以很好的區(qū)分海雜波與目標,并且這些特征之間的互補作用,使的基于特征聯(lián)合的海面目標檢測性能得到了很大的提高。通過利用雷達回波,水鵬朗[4]-[6]的團隊在時域和頻域提取了具有可分性的3 種特征——相對平均振幅(Relative Average Amplitude,RAA)、相對多普勒峰高(Relative doppler Peak Height,RPH)和相對多普勒譜熵(Relative Vector-Entropy,RVE)。又因為純雜波和含目標的回波在歸一化時頻分布上表現(xiàn)出了不同的特性。通過這些不同的特性可以提取3 個時頻特征:時頻脊能量(time-frequency ridge energy,RI),二進制連接區(qū)域的數(shù)量(the Number of binary connection areas,NR)和最大連通域尺寸(the largest pass Size,MS)?;跇O化目標分解理論,從極化域而提取了3 個極化特征,分別為相對體散射機制對應(yīng)能量(Relative Surface cattering Power,PRS)、相對二面角散射機制對應(yīng)能量(Relative Volume scattering Power,PRV)和相對面散射機制對應(yīng)能量(Relative Dihedral scattering Power,PRD)。對海雜波的時頻域特征進行分析,得出由時頻域所組成的三特征測器,相較于分別從時域和頻域所提取的三特征檢測器,海面小目標的檢測性能得到了一定的提高,然而并不能再所有數(shù)據(jù)上都有良好的檢測性能。這表明,提取對海雜波和目標可分性較好的特征對于聯(lián)合多特征檢測器性能的提升至關(guān)重要。在極化域利用多極化的方式所提出的檢測器與在單極化方式所提取檢測器相比,檢測器性能有了一定的提升。
但是三特征檢測器性能的主要限制因素是目標回波落到多普勒域的主雜波內(nèi),會被其淹沒,并且海面小目標的檢測可能會遇到各種各樣的目標,其目標的特征分布很難獲的,將更多的特征聯(lián)合起來,使其特征之間進行互補,可以有效的解決某一特征或者某幾個特征的目標淹沒問題。因此設(shè)計檢測器可歸結(jié)為在異常檢測中設(shè)計一類分類器。在上述的三個3-D 特征檢測器中,構(gòu)造了一個基于3-D凸包學習算法(CHLA)的異常檢測器,以找到3-D 特征空間中的決策區(qū)域。但是,CHLA 維度的約束限制了特征向量中變量的擴展。因此本文通過設(shè)計多特征聯(lián)合來設(shè)計特征檢測器,并利用異常檢測中孤立森林異常檢測算法來實現(xiàn)提高海面小目標檢測的性能。
本文其余內(nèi)容如下,首先介紹了雷達檢測問題的數(shù)學模型,并分析已有的八特征。其次,介紹孤立森林異常檢測算法,利用主成分分析對已有的八特征進行特征融合,并設(shè)計檢測器。然后,利用實測數(shù)據(jù)集來評估所提出方法的檢測性能。最后,得出結(jié)論。
從數(shù)學上,可以將雷達目標檢測問題看作如下的二元假設(shè)問題:
假設(shè)H0表示待估計單元內(nèi)不包含目標,假設(shè)H1表示待估計單元內(nèi)包含目標。當信噪比較高時可以忽略噪聲的影響。X(n),S(n),C(n)分別為雷達回波,目標回波和海雜波。
N 是接收到的回波序列長度。R 是待估計單元周圍的參考單元,假設(shè)海面的局部均勻的,參考單元內(nèi)的海雜波特性與待估計單元雜波特性基本一致,因此可以利用參考單元估計雜波特性。
在已有的研究中,有八個特征——相對平均振幅,相對多普勒峰高和多普勒振幅譜的相對熵,時頻脊能量,二進制連接區(qū)域的數(shù)量和最大連通域尺寸,相對平均功率(relative average power ,RAP)和相對多普勒譜熵(relative Doppler spectral entropy,RDE)[7],可以用來很好的區(qū)分目標和雜波,其特征分布如圖1 其所示。
圖1:特征分布
從圖1 中可以看出,這八個特征目標和雜波的分布圖存在明顯的差別,其中海雜波的特征分布范圍更廣,因此可以用來很好的區(qū)分目標和雜波。在已有文章中,已證明這八個特征均適合于海面小目標檢測。
由已有八特征[8]組成的數(shù)據(jù)矩陣如下:
其中f1(x),f2(x),f3(x),f4(x),f5(x),f6(x),f7(x),f8(x)分別表示對目標回波的RAA,RPH,RVE,RI,NR,MS,RAP 和RDE 的運算。令S0和S1分別為H0和H1假設(shè)下的特征矩陣:
其中fci和fti分別表示雜波單元和目標單元的回波特征向量。K是從一定范圍區(qū)間分割的向量的數(shù)量。
孤立森林[9]的算法原理是由兩部分組成,分別是孤立森林的構(gòu)建以及待測樣本平均深度的計算,如下所示:
(1)孤立森林的構(gòu)建是通過構(gòu)建n 個孤立二叉樹(isolation tree,簡稱iTree),將這些樹結(jié)合在一起共同組成了孤立森林。而孤立二叉樹是構(gòu)成孤立森林的基礎(chǔ),又因為該方法是以無監(jiān)督的方式進行的,因此構(gòu)造孤立二叉樹的過程可大大簡化為:①從由多特征共同構(gòu)成的樣本空間中,隨機選取φ 個樣本,構(gòu)成子樣本空間,并將這些樣本放入樹的根節(jié)點;②隨機選取一個樣本空間中的某一特征向量,并選取該特征數(shù)據(jù)集中的某一數(shù)據(jù)z,使該數(shù)據(jù)的大小剛好在該特征向量的最大值與最小值之間;③將數(shù)據(jù)z 作為節(jié)點進行劃分,將特征向量劃分成兩個新的特征子空間,并將該特征向量中小于z 的數(shù)據(jù)放在當前節(jié)點的左邊,把大于等于z 的數(shù)據(jù)放在當前節(jié)點的右邊;④不斷的遞歸步驟②、③,不斷構(gòu)造出新的子節(jié)點,當數(shù)據(jù)本身只包含一個樣本或者當樹的高度已經(jīng)達到log2φ 時,遞歸過程終止。
(2)待測樣本平均深度的計算。當n 棵孤立二叉樹構(gòu)建好以后,就形成了本文所需要的孤立森林。在孤立二叉樹的形成過程中,樣本的選擇,特征的選擇,切割點的選擇都是隨機選取的,所以,如果只用某棵單獨的孤立二叉樹進行測試,其測試結(jié)果的準確性無法保障。因此通過獲取待測數(shù)據(jù)樣本到達每棵孤立樹的葉子節(jié)點所位于層數(shù),來計算待測樣本在每棵樹的平均深度h(x),用平均深度來判斷待測樣本是否為異常樣本。
主成分分析算法(Principal Component Analysis,PCA)[10],通過對原始的數(shù)據(jù)矩陣做線性變化,將其投影到不同方向上,并根據(jù)投影后的數(shù)據(jù)所包含的信息量的多少,選取其中信息量最多的數(shù)據(jù)將其保留,作為新的待用數(shù)據(jù)矩陣。投影后的數(shù)據(jù)矩陣中的每個列向量都對應(yīng)包含了對應(yīng)原始信息的比例,因此本文將利用PCA 將已有的八特征進行線性變換。
首先,將S0中的K×R 個正常樣本中的90%的樣本和S1中的K 個異常樣本中的90%的樣本,組成一個新的數(shù)據(jù)集用于構(gòu)建孤立森林,由此可得新矩陣D 為:
D 是M×P 階矩陣,其中,P=8 是特征數(shù),M=a+b,a=floor(K×90%),b=floor(K×R×90%)。
待測樣本的數(shù)據(jù)矩陣為
其A =(K-a),B =(K×R-b)。
其次,利用PCA 來獲得特征融合向量,算法流程如下:
(1)對所有的樣本進行中心化Dn;
(2)計算樣本的協(xié)方差矩陣;
(3)對協(xié)方差矩陣進行特征值分解;
(4)以特征值大小進行排序,并根據(jù)該排序方式來對特征向量進行排序,可得到排序后的矩陣U0;
(5)得到新的樣本集Y=DnU0。
最后,利用Y,來計算主成分分析后所生成的新的特征的數(shù)據(jù)貢獻率向量S,公式如下:
利用向量S 與矩陣Y 可得到用于構(gòu)建孤立森林的樣本集T,待測樣本集TT。
基孤立森林的海面小目標檢測與以往的基于孤立森林的異常檢測不同,這是因為雷達目標檢測對虛警概率有非常嚴格的要求,因此本文在孤立森林異常檢測算法的基礎(chǔ)上,構(gòu)建了基于虛警概率的孤立森林異常檢測器。
構(gòu)建基孤立森林的海面小目標檢測器的流程可分為兩步,如下所示:
(1)在孤立森林生成階段:通過選取由RAA,RPH,RVE,RI,NR,MS,RAP,RDE 八個特征所組成的數(shù)據(jù)矩陣T 中樣本,隨機生成了所需的t 棵孤立樹,這些孤立樹共同組成了孤立森林。
(2)在檢測階段完成海面小目標的檢測器的設(shè)計:將本文八個特征所組成的數(shù)據(jù)矩陣TT,作為待測樣本集。每個待測樣本均需要遍歷所有的孤立樹,并計算待測樣本到達每棵孤立樹平均深度h(x),并對h(x)進行從小到大的排序,并以排序為A+B×PF 所在位置的高度Ht 作為檢測門限,判決公式如下
由此可得孤立森林的算法過程,如圖2所示。
圖2:孤立森林異常檢測算法流程
加拿大大學——McMaster 大學的Simon Haykin[11]教授于1993年和1998年分別進行了兩次雷達海雜波實測數(shù)據(jù)收集的實驗,并于2001年首次在網(wǎng)上公開發(fā)表,為世界各國學者經(jīng)行對海目標探測的研究提供了有利的數(shù)據(jù)基礎(chǔ)。該實測數(shù)據(jù)集數(shù)據(jù)收集所使用的雷達X 波段雷達,因此將該雷達稱為IPIX 雷達,將該數(shù)據(jù)集稱為IPIX 實測數(shù)據(jù)集。
本文所使用的10 份數(shù)據(jù)來自于1993年IPIX 數(shù)據(jù)集,IPIX 雷達的具體參數(shù)如表1所示。該實驗中待檢測目標是被鋁絲包裹直徑1m 的漂浮圓球。十份數(shù)據(jù)集的具體信息如表2所示,每份數(shù)據(jù)包含N=217個采樣數(shù)據(jù)。
表1:IPIX 雷達具體參數(shù)
表2:IPIX 雷達十份數(shù)據(jù)基本信息
圖3為虛警率為0.001,觀測時間為0.512 秒,本文所提出的方法與已有方法中的三特征檢器,時頻特征檢測器,極化特征檢測器,分形特征檢測器,在四種極化方式下檢測概率的比較。從圖中,我們可以看出本文中所提出的檢測器利率明顯高于已有的檢測,平均檢測概率為92.91%,其次是時頻特征探測器,其平均檢測概率為67.69%。因此可以得出本文所以出的檢測器相較于已有的檢測器,檢測性能提升了25.22%。
圖3:十組數(shù)據(jù)的檢測概率
圖4為觀測時間為0.512 秒,十分數(shù)據(jù)在四種極化方式下,采樣數(shù)目固定為32 時,檢測性能隨孤立樹的數(shù)目變化的直方圖。從圖中可以得出以下結(jié)論,交叉極化方式下的檢測性能明顯比同極化方式下的檢測性能好,并且隨著孤立樹數(shù)目的增加而不斷增加,海面小目標的檢測性能隨之增加,當孤立樹的數(shù)目達到100 棵時,檢測性能的提升達到最好。
圖4:采樣數(shù)目固定為32 時,檢測性能隨孤立樹的數(shù)目變化
圖5為觀測時間為0.512 秒,十分數(shù)據(jù)在四種極化方式下,固定孤立樹的數(shù)目為100 棵時,檢測性能隨采樣數(shù)目變化的直方圖。從圖中可以看出,隨著采樣個數(shù)的增加檢測性能的提升一開始增加的很快,當采樣數(shù)目到達32 以后,隨著采樣數(shù)目的增加,檢測性能逐漸下滑。
圖5:孤立樹的數(shù)目為100 時,檢測性能隨采樣數(shù)目的變化
綜上所述,基于孤立森林的海面小目標的檢測,孤立樹的數(shù)目選取為100 棵,采樣數(shù)目為32 時,檢測性能達到最好。
本文將海面小目標的檢測檢測問題看作異常檢測檢測問題,基于八特征融合,提出了一種基于孤立森林的海面小目標檢測方法。利用已有的八特征數(shù)據(jù)進行孤立森林的構(gòu)建,并利用虛警概率與待測目標在每棵樹的平均深度h(x),進行檢測。實驗結(jié)果表明,利用孤立森林異常檢測器,可以有效提高海面小目標的檢測性能。通過比較不同的孤立樹的數(shù)目,和不同采樣數(shù)目下的檢測概率,可以看出在孤立森林異常檢測的過程中,當孤立樹的數(shù)目達到100,采樣數(shù)目為32 時,檢測性能呈現(xiàn)最好的效果。