彭 威,林 強
(空軍預警學院,湖北 武漢 430019)
雷達在工作過程中,不可避免地會受到外部環(huán)境的影響,在實際的雷達回波中總是包含地物、云雨、海洋等雜波。常用的雜波抑制技術(shù)是在信號處理中采取相應的措施,如動目標顯示、動目標檢測、恒虛警率等,但受限于雜波自身的特性、雷達平臺的運動以及實際環(huán)境的復雜性等因素,無論采用哪種方法都仍難免會產(chǎn)生大量的剩余雜波[1-2]。這些剩余雜波經(jīng)過恒虛警檢測和點跡凝聚處理后,形成的虛假點跡會和真實目標點跡一起被雷達的目標提取器錄取。一方面,這些虛假點跡會影響航機關(guān)聯(lián),甚至會產(chǎn)生虛假航跡,嚴重影響雷達對真實目標的正常跟蹤;另一方面,虛假點跡過多會導致整個數(shù)據(jù)處理系統(tǒng)飽和,嚴重影響雷達正常的探測效能。因此,在目標檢測后區(qū)分目標點跡與剩余雜波點跡,以進一步濾除雜波剩余點跡是非常有必要的。
目前,針對此問題,一些國內(nèi)外的專家學者利用雷達回波特征參數(shù)做了一些相應的研究。文獻[3]提出了基于雜波特性和回波信號幅度等信息判別雜波點跡的方法,通過對雜波特性的分析和回波信息的積累來濾除剩余雜波點跡。但由于雜波特性較為復雜,在實際應用中效果有限。文獻[4]針對密集雜波干擾,提出了一種基于雜波圖的雜波抑制方法,通過對點跡在時域和空域的密度的分析,實時判別和標識不同等級的雜波區(qū)域,然后再采用不同的雜波抑制辦法進行航跡起始。以上2種算法在一定程度上濾除了剩余的雜波點跡,但都沒有充分地分析雜波點跡與目標點跡的差異性。文獻[1]通過對信號處理后的雜波剩余信號和目標信號提取適當?shù)奶卣鲄?shù),運用K近鄰算法對真實目標點跡和雜波剩余點跡進行真?zhèn)舞b別,經(jīng)過真?zhèn)文繕它c跡鑒別處理后雜波剩余點跡抑制率接近70%。用該方法提取特征參數(shù)過程復雜繁瑣,雜波點跡抑制率較低,而且在抑制雜波的同時也濾除掉了一定的目標。
本文針對目標檢測過后過多的雜波剩余點跡對雷達探測和跟蹤性能的影響,利用雷達點跡數(shù)據(jù)中的特征參數(shù),提出了一種基于PSO-MLP算法的雷達點跡真?zhèn)舞b別方法。本方法在研究雜波點跡和目標點跡差異性的基礎(chǔ)上,通過提取雷達點跡形成過程中所生成的特征參數(shù),先通過PSO算法對MLP算法的參數(shù)進行優(yōu)化選擇,再運用參數(shù)優(yōu)化后的MLP神經(jīng)網(wǎng)絡(luò)算法對點跡進行鑒別,進而濾除剩余雜波點跡,最后給出了雜波點跡濾除效果對比。
MLP(Multi-Layer Perceptron),即多層感知器,是一種趨向結(jié)構(gòu)的人工神經(jīng)網(wǎng)絡(luò),映射一組輸入向量到一組輸出向量。MLP有很多層,第1層是輸入層,最后一層是輸出層,中間稱為隱含層,每一層包括確定數(shù)目的神經(jīng)元。MLP的神經(jīng)元采用層內(nèi)無連接、層間全連接的連接方式。圖1是一個雙隱含層的MLP結(jié)構(gòu)示意圖,圖中輸入層共有n1個結(jié)點,隱含層1和隱含層2分別有n2和n3個神經(jīng)元,輸出層有n4個神經(jīng)元,除去輸出層,每一層均有一個偏置結(jié)點[5]。
圖1 雙隱藏層MLP結(jié)構(gòu)示意圖
MLP的前饋計算過程從輸入層依次計算到輸出層。前饋過程中每個節(jié)點的計算方法如下:
xij=f(WiXi-1+bi-1)
(1)
式中:xij為第i層第j個神經(jīng)元的值;Wi為第i-1層到第i層的第j個神經(jīng)元的權(quán)值向量;Xi-1為第i-1層所有神經(jīng)元的值組成的向量;bi-1為第i-1層的偏置;f為隱藏層激活函數(shù)[5-6]。
常用的激活函數(shù)有sigmoid函數(shù)(logistic函數(shù)),tanh函數(shù),ReLU函數(shù)。在本文中用到的激活函數(shù)是sigmoid函數(shù):
(2)
MLP算法是典型的有監(jiān)督學習算法,它的損失函數(shù)定義為:
(3)
式中:h為MLP算法的輸出值;y為實際值;‖…‖為任一種距離范數(shù),通常情況下取2范數(shù)。
一般通過權(quán)值優(yōu)化算法來使損失函數(shù)達到最小,本文中所采用的權(quán)重優(yōu)化算法是隨機梯度下降法(sgd)。計算方法如下:
(4)
另外,通過正則化方法來避免出現(xiàn)過擬合問題,提高模型的泛化能力。使用正則化之類的方法直接將權(quán)值的大小加入到誤差里,在訓練的時候限制權(quán)值變大。訓練過程需要降低整體的誤差,這時候,一方面能降低實際輸出與樣本之間的誤差,也能降低權(quán)值大小[7]。正則化方法包括L0正則、L1正則和L2正則,但在神經(jīng)網(wǎng)絡(luò)中一般使用L2正則,其原理公式如下:
(5)
式中:J0為普通的損失函數(shù);λ為一個超參數(shù),范圍是[0,1];w為神經(jīng)網(wǎng)絡(luò)中每一層的權(quán)重,這里進行的運算是對每一個權(quán)重矩陣進行了矩陣的2范數(shù)運算(即每個元素的平方然后求總和)。
由于正則化參數(shù)λ過于敏感,對鑒別精度影響較大,本文通過網(wǎng)格搜索法對正則化參數(shù)進行優(yōu)化選擇。
粒子群算法,也稱粒子群優(yōu)化算法或鳥群覓食算法,屬于進化算法的一種。鳥類等生物在尋找食物的過程中,一方面是依靠自身的探索,另一方面則是依靠伙伴相互之間的經(jīng)驗交流,從而能快速準確地找到在搜索區(qū)域中最好的食物源。PSO算法正是以上述生物現(xiàn)象作為模型而提出的一種進化優(yōu)化算法。每個尋優(yōu)的問題解都是搜索空間中的一只鳥,即“粒子”。每個粒子都包含有位置和速度2種信息,通過位置信息,可以計算出粒子的適應度值,從而確定粒子的優(yōu)劣;而速度信息決定它們飛行的方向和距離[8]。
假設(shè)D維空間中,有N個粒子[9]:
粒子i位置:Xi=(xi1,xi2,…,xiD),xid∈[Xmin,d,Xmax,d];
粒子i速度:Vi=(vi1,vi2,…,viD),vid∈[Vmin,d,Vmax,d];
個體最優(yōu)位置:pbesti=(pi1,pi2,…,piD);
全局最優(yōu)位置:gbest=(g1,g2,…,gD);
其中,1≤d≤D,1≤i≤N。
則粒子i的速度和位置迭代公式如下:
(6)
(7)
式中:ω為慣性權(quán)重;c1為局部學習因子;c2為全局學習因子;r1、r2為區(qū)間(0,1)內(nèi)的獨立隨機數(shù)。
本文提出的基于MLP神經(jīng)網(wǎng)絡(luò)的雷達點跡真?zhèn)舞b別算法主要分為3個步驟:點跡數(shù)據(jù)解析、構(gòu)建MLP神經(jīng)網(wǎng)絡(luò)算法模型、點跡真?zhèn)舞b別。
3.1.1 特征提取
在點跡形成的過程中,會生成很多可以區(qū)分目標和雜波的特征參數(shù),本文通過研究對比雜波點跡和目標點跡的某些差異性,從中篩選提取了多普勒速度、點跡個數(shù)、距離跨度、方位跨度、原始幅度、背景幅度、點跡等級、點跡質(zhì)量和方位向凝聚點跡個數(shù)等特征參數(shù)。
3.1.2 特征數(shù)據(jù)降維
本文篩選提取了9個相關(guān)的特征參數(shù),特征數(shù)量較多,數(shù)據(jù)維度較高,給算法模型學習和訓練帶來了一定的困難,增加了算法學習和訓練時間以及空間復雜度。因此,在對特征數(shù)據(jù)學習和訓練前,應預先對其進行降維處理,降低特征數(shù)據(jù)的維度[10-11]。本文運用的數(shù)據(jù)降維方法是核主成分分析法(PCA)降維。
核PCA降維方法的核心思想是,通過非線性映射函數(shù)將非線性數(shù)據(jù)轉(zhuǎn)換到一個更高維的特征空間L中,使數(shù)據(jù)在新的特征空間L上線性可分,再使用標準PCA降維方法將其映射到另外一個低維空間中[12]。
常用的非線性映射函數(shù),即核函數(shù),有多項式核函數(shù)(POLY)、高斯徑向核函數(shù)(RBF)和sigmoid核函數(shù)。本文所用到的核函數(shù)是多項式核函數(shù),其表達式如下:
K(x,xi)=[(x·xi)+1]p
(8)
圖2 點跡數(shù)據(jù)降維前后對比
由圖2可知,點跡數(shù)據(jù)降維后,目標點跡與雜波剩余點跡的區(qū)分度更加明顯,只有少部分混疊在一起,目標點跡與雜波剩余點跡區(qū)分度明顯;而且降維后數(shù)據(jù)維度只有二維,與原始的九維點跡數(shù)據(jù)相比運算量大大減少。
本文利用PSO-MLP算法對雷達點跡進行真?zhèn)舞b別。定義粒子由參數(shù)向量λ所決定,群體中每個粒子的優(yōu)劣通過適應度函數(shù)值的大小進行評價,適應度值由所選取的適應度函數(shù)和參數(shù)向量λ共同決定。本文選取雷達點跡真?zhèn)舞b別準確率作為適應度函數(shù)。
基于PSO-MLP算法的雷達點跡真?zhèn)舞b別具體步驟如下:
(1) 初始化PSO算法參數(shù)。粒子群粒子數(shù)量n,粒子維度(待尋優(yōu)參數(shù)個數(shù))m,局部學習因子c1,全局學習因子c2,慣性權(quán)重ω,算法最大迭代次數(shù)Tmax,算法收斂精度ξ,正則化參數(shù)的取值范圍[λmin,λmax]。
(2) 輸入訓練集,利用5折交叉驗證計算適應度函數(shù)值的平均值,記錄、比較每一個粒子遍歷過的最優(yōu)個體適應度函數(shù)值和全局最優(yōu)適應度函數(shù)值以及對應的參數(shù)[13]。
(3) 對粒子群中每個粒子計算后,判斷是否滿足迭代結(jié)束條件,若滿足條件,則輸出最優(yōu)參數(shù)組合;如不滿足條件,則利用式(6)和式(7)對粒子的速度和位置進行更新,再返回步驟(3)。
(4) 利用輸出的最優(yōu)參數(shù)下的MLP模型對測試集的點跡進行真?zhèn)舞b別,計算點跡鑒別準確率。
將采集好的雷達點跡數(shù)據(jù)先進行數(shù)據(jù)解析,然后通過PSO-MLP算法模型,判斷其為目標點跡和雜波剩余點跡,獲取鑒別準確率。本文所提的基于PSO-MLP的雷達檢測點跡真?zhèn)舞b別算法流程如圖3所示。
本次實驗中用到的數(shù)據(jù)均是從X型空管雷達上采集的點跡數(shù)據(jù)。在點跡數(shù)據(jù)中隨機選取訓練數(shù)據(jù)9 000個,其中目標點跡5 000個,雜波點跡4 000個;另選取4 500個測試數(shù)據(jù),其中目標點跡2 500個,雜波點跡2 000個。
實驗總共分為2個部分:實驗1,利用PSO算法對正則化參數(shù)λ進行優(yōu)化選擇,獲得最優(yōu)參數(shù)組合;實驗2,利用最優(yōu)參數(shù)下的MLP算法,對獲取的雷達點跡數(shù)據(jù)進行真?zhèn)舞b別,測試點跡鑒別準確率,對比點跡鑒別前后的效果。
本實驗利用PSO算法優(yōu)化選擇正則化參數(shù)λ。利用5折交叉驗證計算雷達點跡鑒別準確率的平均值,記錄、比較每一個粒子遍歷過的點跡鑒別準確率以及對應的參數(shù)組合,從中選取最優(yōu)參數(shù)組合。
在本次實驗中,MLP算法的參數(shù)設(shè)置為:正則化參數(shù)λ∈[0.000 001,1];PSO優(yōu)化算法的參數(shù)設(shè)置為:粒子種群數(shù)量N=20,粒子維度D=1,慣性權(quán)重ω=0.8,局部學習因子c1=2,全局學習因子c2=2,算法最大迭代次數(shù)Tmax=50,算法收斂精度ξ=0.001。
實驗結(jié)果如圖4所示。
圖4 點跡鑒別準確率圖
由圖4可知,雷達點跡鑒別準確率最終穩(wěn)定在0.857 5左右。其對應的最優(yōu)正則化參數(shù)λ=0.000 01。
本實驗利用最優(yōu)正則化參數(shù)下的MLP算法對雷達點跡進行真?zhèn)舞b別,計算所有點跡中鑒別出的目標點跡數(shù)、所有點跡中鑒別出的雜波點跡數(shù)、目標點跡中鑒別出的目標點跡數(shù)和雜波點跡中鑒別出的雜波點跡數(shù),對比點跡鑒別前后的效果。
其中,所有點跡中鑒別出的目標點跡數(shù)和雜波點跡數(shù)是指從4 500個點跡中分別鑒別出的目標點跡和雜波點跡的數(shù)量;目標點跡中鑒別出的目標點跡數(shù)是指從2 500個目標點跡鑒別出目標點跡的數(shù)量;雜波點跡中鑒別出的雜波點跡數(shù)是指從2 000個雜波點跡中鑒別出雜波點跡的數(shù)量。具體對比效果如表1和圖5~圖8所示。其中,“*”代表雜波點跡,“+”代表目標點跡。
表1 點跡真?zhèn)舞b別點數(shù)對比
圖5 原始點跡圖
圖6 鑒別后點跡圖
由圖5、圖6和表1可知,該算法較好地將目標點跡鑒別準確,但雜波點跡鑒別準確率略低,雜波點跡被鑒別為目標點跡的個數(shù)略多。盡管有一小部分的目標點跡和雜波點跡鑒別錯誤,但雷達在實際工作中每幀的點跡數(shù)目有限,所以在實際中并不會影響雷達正常的跟蹤效能。
由圖5、圖7和圖8可以看出,將原始點跡中鑒別出的雜波點跡濾除后,整個點跡界面干凈了許多,僅殘留一小部分的雜波點跡,而且目標點跡損失較少。由此可以看出,PSO-MLP算法在雷達點跡鑒別上具有一定的優(yōu)越性。
圖7 濾波后目標點跡圖
圖8 真實目標點跡圖
針對山區(qū)、海面和城市等復雜強雜波產(chǎn)生的雜波點跡對雷達跟蹤性能的影響,本文提出了一種基于PSO-MLP算法的雷達點跡真?zhèn)舞b別方法,該方法在充分研究雜波點跡和目標點跡某些差異性的基礎(chǔ)上,提取特征參數(shù),利用PSO-MLP算法對雷達點跡進行真?zhèn)舞b別。實驗結(jié)果表明,該算法點跡鑒別準確率達到了85.75%,剩余雜波濾除效果明顯。