孫晶明, 虞盛康, 孫 俊
(1. 南京電子技術(shù)研究所, 江蘇 南京 210039; 2. 中國電子科技集團(tuán)公司智能感知技術(shù)重點實驗室, 江蘇 南京 210039)
雷達(dá)自動目標(biāo)識別(radar automatic target recognition,RATR)是雷達(dá)研究與應(yīng)用的一個重要領(lǐng)域。高分辨距離像(high resolution range profile,HRRP)是實現(xiàn)實時目標(biāo)識別的重要雷達(dá)特征,提供了用寬帶雷達(dá)信號獲取目標(biāo)回波的距離維信息,反映了豐富的目標(biāo)結(jié)構(gòu)特征,如目標(biāo)尺寸、散射點分布等,且易于獲取和處理,因此成為國內(nèi)外備受關(guān)注的研究熱點。然而,使用HRRP進(jìn)行目標(biāo)識別仍然存在很多難點問題,其中姿態(tài)敏感性是影響HRRP-RATR性能的主要因素。
當(dāng)高分辨雷達(dá)發(fā)射帶寬足夠大的信號時,目標(biāo)回波在距離維上擴(kuò)展至多個單元。采用散射點模型簡化表示雷達(dá)目標(biāo),則HRRP中的尖峰是各距離單元內(nèi)所有散射點的矢量合成,若散射點沒有發(fā)生越距離單元變動,則各尖峰的相對位置關(guān)系不變;而散射點的后向散射性質(zhì)隨目標(biāo)相對于雷達(dá)姿態(tài)角的改變而改變,因此尖峰幅度是隨姿態(tài)快變的。這兩個原因造成了HRRP的姿態(tài)敏感性,進(jìn)而導(dǎo)致HRRP-RATR的關(guān)鍵步驟特征提取的性能很難得到保證。
針對HRRP識別的姿態(tài)敏感性問題,研究者們提出了三大類解決方法。第一類方法是提取姿態(tài)不敏感特征。這類方法是依據(jù)特定的準(zhǔn)則函數(shù)提取目標(biāo)的區(qū)分性特征。常用的有核主分量分析法等,能夠降低數(shù)據(jù)維度,但所提特征的信息損失較大,識別性能受限。第二類方法是分角域處理。文獻(xiàn)[12]從如何分角域的角度,研究了統(tǒng)計建模自適應(yīng)分角域的方法,將姿態(tài)角連續(xù)分布的HRRP樣本按不同角域切分為若干段分別處理,以緩解HRRP的姿態(tài)敏感性。文獻(xiàn)[13]從如何有效地提取出可代表各角域樣本中心的模板的角度,研究了HRRP平均模板或統(tǒng)計特征模板的生成方法,在一定程度上可提升目標(biāo)識別性能。第三類方法是設(shè)計性能優(yōu)良的分類器。文獻(xiàn)[15]采用多個分類器融合,得到最終的識別結(jié)果,具有較強(qiáng)的魯棒性。但這類方法設(shè)計難度較大,且并沒有解決姿態(tài)敏感性問題。除了算法方面的研究,還有文獻(xiàn)從理論上分析了姿態(tài)敏感性問題。文獻(xiàn)[17]通過分析表明,閃爍現(xiàn)象導(dǎo)致HRRP波形發(fā)生劇變,使得各角域內(nèi)的HRRP相似度下降,對傳統(tǒng)分角域處理的識別方法的性能產(chǎn)生嚴(yán)重影響。
鑒于傳統(tǒng)方法不能很好地解決HRRP的姿態(tài)敏感性問題,當(dāng)前在圖像識別領(lǐng)域大獲成功的深度學(xué)習(xí)技術(shù)開始被廣泛應(yīng)用于HRRP-RATR任務(wù)中,特別是卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)。深度網(wǎng)絡(luò)模型區(qū)別于傳統(tǒng)淺層機(jī)器學(xué)習(xí)模型的地方在于其深度網(wǎng)絡(luò)結(jié)構(gòu)、大規(guī)模的網(wǎng)絡(luò)模型參數(shù)和訓(xùn)練模型所需的大數(shù)據(jù)條件。深度CNN的卷積層的作用類似于特征提取器,可以學(xué)習(xí)從低層到高層的豐富的內(nèi)在結(jié)構(gòu)特征。圖像識別領(lǐng)域的大量成功案例顯示出CNN在特征提取和表示學(xué)習(xí)中的強(qiáng)大能力。
本文借鑒CNN在圖像識別中的應(yīng)用,建立了適用于HRRP-RATR基于CNN的識別框架。在將深度網(wǎng)絡(luò)模型應(yīng)用于HRRP-RATR時,通過預(yù)處理或網(wǎng)絡(luò)設(shè)計方式降低了幅度敏感性、平移敏感性、姿態(tài)敏感性。并針對實際應(yīng)用時的數(shù)據(jù)錄取需求,進(jìn)行了詳細(xì)的姿態(tài)角性能測試實驗和結(jié)果分析。實驗結(jié)果表明,CNN方法具有一定的抗姿態(tài)敏感性特性,可降低實際數(shù)據(jù)錄取工作對樣本姿態(tài)角覆蓋的要求。
CNN將多個卷積層進(jìn)行堆疊,不僅具有傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的優(yōu)勢,如良好的錯誤容忍度、自適應(yīng)性、自學(xué)習(xí)能力,而且具有自動特征提取的能力和權(quán)重共享的特性。
本文利用原始HRRP的幅度信息作為預(yù)處理的輸入。如無特別說明,后文中的HRRP均指原始HRRP的幅度信息的簡稱。
針對HRRP的平移敏感性問題,人為生成訓(xùn)練數(shù)據(jù)的平移讓CNN“看見”這種類型的變化。給定一個HRRP∈,生成的HRRP可寫為
(1)
式中:是循環(huán)平移量,可正可負(fù),意味著左循環(huán)平移或右循環(huán)平移;且′與有相同的尺寸。為了保證目標(biāo)信號不越界,可以設(shè)定平移窗范圍,這里選擇[-200,200]個距離單元。值得一提的是,這種解決平移敏感性問題的方式同時也起到了數(shù)據(jù)增廣的效果,增大了訓(xùn)練樣本量。
針對HRRP的幅度敏感性問題,將每個HRRP按極差變換方式進(jìn)行歸一化處理:
(2)
因為CNN擅長處理圖像,灰度圖像的動態(tài)范圍在[0,255]內(nèi),所以為了獲得用于HRRP-RATR的CNN的最優(yōu)性能,需要將所有HRRP的動態(tài)范圍統(tǒng)一到[0,255]內(nèi)。
針對HRRP的姿態(tài)敏感性問題,構(gòu)造一個用于HRRP-RATR的內(nèi)嵌了目標(biāo)姿態(tài)角處理的網(wǎng)絡(luò),可提取不敏感于目標(biāo)姿態(tài)的特征。
根據(jù)前面對預(yù)處理的描述可知,相比于傳統(tǒng)預(yù)處理方法,本文采用的預(yù)處理技術(shù)更簡單易用,但預(yù)處理對保證CNN的性能至關(guān)重要。
本文提出的CNN結(jié)構(gòu)如圖1所示。
圖1 提出的CNN結(jié)構(gòu)Fig.1 The proposed CNN structure
CNN包含10個卷積層,每層都后接一個非線性激活層,以及4個最大池化層,2個1 024單元的全連接層,1個全連接的softmax輸出層。輸入是預(yù)處理后的HRRP,且每個HRRP的維度是1×1 024。輸出是目標(biāo)類型的近似后驗概率分布,其顯著特點是采用不同于一般圖像識別的一維卷積核。
實際上,實驗中已經(jīng)嘗試過將HRRP整形為4×256和32×32兩種格式作為CNN的輸入,但識別性能較差,主要原因可能是這樣強(qiáng)行改變樣本維度會破壞HRRP的內(nèi)在結(jié)構(gòu)特性。因此,在接下來的實驗中,都采用1×1 024形式的HRRP作為CNN的輸入。
實驗數(shù)據(jù)采用某波段雷達(dá)錄取的6種飛機(jī)目標(biāo)P1~P6的寬帶數(shù)據(jù)。目標(biāo)姿態(tài)角范圍為0°~180°,信噪比分布范圍為10~50 dB。為了避免引入類間不平衡問題,將整個姿態(tài)角范圍以2°為間隔劃分為90個角域,每個角域隨機(jī)抽取200個HRRP樣本。這樣,數(shù)據(jù)集總共有108 000個樣本。
數(shù)據(jù)的預(yù)處理操作如第1.1節(jié)所述。主要訓(xùn)練參數(shù)如下:
(1) 迭代次數(shù):200 000;
(2) 批處理大小:256;
(3) 初始學(xué)習(xí)率:0.01;
(4) 優(yōu)化器:SGD;
(5) 正則化方式:L2。
實驗運(yùn)行環(huán)境為Caffe,GPU(GTX 1080),CPU(E5-2620 V4)。
當(dāng)訓(xùn)練集樣本的姿態(tài)角缺失時,導(dǎo)致訓(xùn)練過擬合,嚴(yán)重影響網(wǎng)絡(luò)的泛化性。實驗?zāi)康氖翘骄坑?xùn)練集樣本姿態(tài)角覆蓋與識別性能的關(guān)系,以指導(dǎo)實際應(yīng)用中的數(shù)據(jù)錄取工作。
2.2.1 散度角測試
將所有數(shù)據(jù)以10°為步長,每10°、20°、30°、40°、50°、60°只取2°數(shù)據(jù)訓(xùn)練,剩余數(shù)據(jù)測試,共分為6組。但這樣劃分?jǐn)?shù)據(jù)集會造成第2~6組的測試集樣本量明顯多于第1組(實際上,第2~6組的測試集都包含第1組),為了方便進(jìn)行各組實驗結(jié)果的對比分析,需統(tǒng)一測試集樣本量標(biāo)準(zhǔn),因此6組實驗中都以第1組的測試集作為標(biāo)準(zhǔn)測試集。具體數(shù)據(jù)量設(shè)置如表1所示。
表1 實驗數(shù)據(jù)設(shè)置
由于姿態(tài)角測試不可避免地與樣本量因素耦合在一起,因此需結(jié)合全姿態(tài)角的樣本量性能曲線進(jìn)行分析,得到平均識別率曲線隨訓(xùn)練集樣本量的變化趨勢如圖2所示。平均識別率計算公式為
(3)
式中:表示第類正確識別的測試集樣本量;表示第類總的測試集樣本量;表示目標(biāo)類型數(shù)。
圖2 識別性能與訓(xùn)練集樣本量的變化關(guān)系Fig.2 Relationship between recognition performance and sample size of training set
通過對比可以看出,在保持訓(xùn)練集樣本量相同的前提下,隨著訓(xùn)練集樣本姿態(tài)角間隔逐漸增大,缺姿態(tài)條件下的CNN性能相比于全姿態(tài)條件下的CNN性能惡化越來越嚴(yán)重。當(dāng)訓(xùn)練集樣本量為10 800且訓(xùn)練集樣本姿態(tài)角間隔為20°時,CNN平均識別率達(dá)到80%;當(dāng)訓(xùn)練集樣本量為6 000且訓(xùn)練集樣本姿態(tài)角間隔為40°時,CNN平均識別率達(dá)到72%。
為了進(jìn)一步分析散度角情況下各目標(biāo)姿態(tài)角域的識別性能,按姿態(tài)角域統(tǒng)計平均識別率的分布情況,如圖3所示??梢钥闯?當(dāng)訓(xùn)練集樣本姿態(tài)角間隔為40°時,迎頭方向仍能保持較好的識別性能,尾后次之,側(cè)向較差。
圖3 訓(xùn)練集樣本姿態(tài)角間隔為40°時的識別性能統(tǒng)計Fig.3 Recognition performance statistics of training set samples with 40° pose angle interval
采用t分布隨機(jī)鄰域嵌入(t-distributed stochastic neighbor embedding, t-SNE)方法將CNN提取的識別特征投影到二維平面上的分布,如圖4所示。通過對比可以看出,隨著訓(xùn)練集樣本姿態(tài)角間隔變大,不同類型目標(biāo)之間的分類界限逐漸模糊,識別性能逐漸下降。
圖4 特征二維投影分布對比Fig.4 Comparison of two dimensional projection distribution of features
2.2.2 跨角域測試
將所有數(shù)據(jù)按20°一個角域進(jìn)行劃分,只取0°~20°或80°~100°或160°~180°數(shù)據(jù)訓(xùn)練,剩余數(shù)據(jù)分角域測試,共分為3組。具體數(shù)據(jù)量設(shè)置如表2所示。
表2 實驗數(shù)據(jù)設(shè)置
為了分析跨角域情況下各姿態(tài)角域的識別性能,按姿態(tài)角域統(tǒng)計平均識別率的分布情況,如圖5所示。
圖5 只取特定角域數(shù)據(jù)訓(xùn)練時的識別性能統(tǒng)計Fig.5 Statistics of recognition performance when training with only specific angle domain data
通過對比可以看出,測試集樣本中與訓(xùn)練集樣本姿態(tài)角鄰近的角域識別性能優(yōu)于遠(yuǎn)離的角域識別性能??紤]到實際存在姿態(tài)角估計誤差,因此當(dāng)前采用的CNN模型不具備跨角域識別的能力。
2.2.3 姿態(tài)角標(biāo)簽測試
將所有數(shù)據(jù)按30°一個角域進(jìn)行劃分,但不是用機(jī)型作為標(biāo)簽,而是用姿態(tài)角域作為標(biāo)簽,分為6類。按9∶1比例均勻分成訓(xùn)練集和測試集,即訓(xùn)練集樣本量為97 200,測試集樣本量為10 800。
用姿態(tài)角域作為標(biāo)簽的識別混淆矩陣如圖6所示,平均識別率為80%。從識別混淆矩陣上看,迎頭和尾后方向的鄰近角域的相關(guān)性較強(qiáng),識別混淆性較大;而側(cè)向的鄰近角域的相關(guān)性較弱,識別混淆性較小。這也間接說明,在實測數(shù)據(jù)錄取時,可以適當(dāng)放寬迎頭和尾后方向的訓(xùn)練集樣本姿態(tài)角間隔(樣本相關(guān)性強(qiáng)),而對于側(cè)向仍需要較密集地錄取數(shù)據(jù)(樣本相關(guān)性弱)。
圖6 用姿態(tài)角域作為標(biāo)簽的識別混淆矩陣Fig.6 Recognition confusion matrix using pose angle domain as label
采用t-SNE方法將CNN提取的識別特征投影到二維平面上的分布如圖7所示。可以看出,各姿態(tài)角域的點集呈現(xiàn)較明顯的簇分布,鄰近角域的點集交疊區(qū)域較大,這也印證了識別混淆矩陣的結(jié)果。
圖7 特征二維投影分布Fig.7 Two dimensional projection distribution of features
根據(jù)實驗結(jié)果,形成如下基本結(jié)論。
(1) 對于信噪比大于10 dB的寬帶HRRP數(shù)據(jù),在不考慮拒判的前提下,當(dāng)訓(xùn)練集樣本姿態(tài)角間隔為20°且訓(xùn)練集樣本量在10 000以上時,可滿足6類飛機(jī)的識別率大于80%的要求。
(2) 考慮對飛機(jī)目標(biāo)姿態(tài)角估計誤差約為10°,在訓(xùn)練集樣本姿態(tài)角間隔30°以內(nèi),通過增大訓(xùn)練集樣本量,可以提升識別性能。
(3) 當(dāng)訓(xùn)練集樣本姿態(tài)角間隔為40°時,迎頭方向仍能保持較好的識別性能,尾后次之,側(cè)向較差。
(4) 在實測數(shù)據(jù)錄取工作中,當(dāng)全姿態(tài)數(shù)據(jù)的錄取條件不具備時,可以適當(dāng)放寬迎頭和尾后方向的訓(xùn)練集樣本姿態(tài)角間隔的限制到30°,而對于側(cè)向仍需要較密集地錄取數(shù)據(jù)(10°以內(nèi)),并在可錄取的姿態(tài)角域內(nèi)盡可能地增大訓(xùn)練集樣本量到10 000以上。
本文提出了一種新穎的基于CNN的HRRP-RATR方法,并針對實際應(yīng)用時的數(shù)據(jù)錄取需求,在實測HRRP數(shù)據(jù)上進(jìn)行了詳細(xì)的姿態(tài)角性能測試實驗和結(jié)果分析。實驗結(jié)果表明,精巧設(shè)計的CNN方法具有一定的抗姿態(tài)敏感性特性,可降低實際數(shù)據(jù)錄取工作對樣本姿態(tài)角覆蓋的要求。并通過分析獲得了4條具有實用價值的結(jié)論,可為工程化應(yīng)用提供指導(dǎo)。