楊敏佳 白雪茹* 劉士豪 曾 磊 周 峰
①(西安電子科技大學(xué)雷達(dá)信號(hào)處理國(guó)家重點(diǎn)實(shí)驗(yàn)室 西安 710071)
②(西安電子科技大學(xué)電子信息攻防對(duì)抗與仿真技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室 西安 710071)
由于逆合成孔徑雷達(dá)(Inverse Synthetic Aperture Radar,ISAR)具有全天時(shí)、全天候、遠(yuǎn)作用距離、高分辨率等獨(dú)特優(yōu)勢(shì),因此在太空態(tài)勢(shì)感知和防空反導(dǎo)中發(fā)揮著重要作用[1–4]。相較于1維高分辨距離像,目標(biāo)的高分辨ISAR像為其散射中心向未知成像平面的2維投影,并且蘊(yùn)含著重要的尺寸、結(jié)構(gòu)等形狀信息和姿態(tài)、朝向等運(yùn)動(dòng)信息,從而為雷達(dá)自動(dòng)目標(biāo)識(shí)別提供了豐富特征[5,6]。
傳統(tǒng)的ISAR目標(biāo)識(shí)別方法主要依據(jù)圖像特性進(jìn)行人工特征(如區(qū)域特征、邊緣輪廓特征、散射點(diǎn)特征等)提取及分類器設(shè)計(jì)。但是,該過(guò)程需要大量的先驗(yàn)知識(shí)或?qū)<医?jīng)驗(yàn),耗時(shí)較長(zhǎng)且難以推廣[7,8]。近年來(lái),深度學(xué)習(xí)廣泛應(yīng)用于ISAR目標(biāo)識(shí)別領(lǐng)域并獲得了優(yōu)良的性能[1,9,10]。該類方法可實(shí)現(xiàn)基于數(shù)據(jù)驅(qū)動(dòng)的自動(dòng)特征提取,具有較強(qiáng)的泛化能力。另外,由于ISAR目標(biāo)非合作,其姿態(tài)及轉(zhuǎn)臺(tái)參數(shù)未知。受觀測(cè)及成像條件限制,可獲取的高質(zhì)量ISAR像通常較少(1幅或幾幅),即存在小樣本問(wèn)題。在這種情況下,深度網(wǎng)絡(luò)會(huì)出現(xiàn)特征可分性不強(qiáng)、識(shí)別性能迅速下降等問(wèn)題,從而為穩(wěn)健的特征提取與識(shí)別帶來(lái)了極大挑戰(zhàn)[11,12]。
小樣本學(xué)習(xí)(small-data learning)為解決樣本匱乏時(shí)的ISAR目標(biāo)識(shí)別問(wèn)題提供了有效途徑[13]。該方法通過(guò)借助具有充足樣本的常見(jiàn)目標(biāo)類別對(duì)模型進(jìn)行訓(xùn)練,進(jìn)而將獲得的識(shí)別能力泛化到全新的小樣本目標(biāo)類別中。在給定訓(xùn)練集(包含具有充足樣本的常見(jiàn)目標(biāo)類別)和測(cè)試集(包含全新的小樣本目標(biāo)類別)后,嵌入學(xué)習(xí)(embedding learning)[14–16]等基于任務(wù)驅(qū)動(dòng)的小樣本學(xué)習(xí)方法首先通過(guò)重復(fù)隨機(jī)采樣來(lái)分別構(gòu)建訓(xùn)練任務(wù)集和測(cè)試任務(wù)集。具體而言,任務(wù)集中的每個(gè)任務(wù)均包含支撐集(由有標(biāo)簽樣本構(gòu)成)和查詢集(由無(wú)標(biāo)簽樣本構(gòu)成),任務(wù)目標(biāo)是依據(jù)支撐集對(duì)查詢集中的樣本類別進(jìn)行判定。此后,該類方法采用訓(xùn)練任務(wù)集進(jìn)行模型訓(xùn)練,使其在測(cè)試任務(wù)集中同樣獲得良好的識(shí)別效果。特別地,若每個(gè)任務(wù)包含C個(gè)不同目標(biāo)類別,每個(gè)目標(biāo)類別包含K個(gè)支撐樣本,則稱該任務(wù)為 C-way K-shot任務(wù)。作為嵌入學(xué)習(xí)的經(jīng)典結(jié)構(gòu),原型網(wǎng)絡(luò)[16](Prototypical Network, PN)首先將樣本從原始空間映射到更低維的嵌入空間;進(jìn)而通過(guò)計(jì)算嵌入空間中各類別的中心(即嵌入向量的均值)綜合同類信息并獲得各類別原型;最終通過(guò)比對(duì)查詢集樣本對(duì)應(yīng)嵌入向量和各類原型之間的歐氏距離實(shí)現(xiàn)類別預(yù)測(cè)。但是,該模型未考慮到支撐集樣本對(duì)識(shí)別貢獻(xiàn)度的差異。
研究[14–16]表明,支撐樣本的質(zhì)量(代表性)會(huì)對(duì)小樣本目標(biāo)識(shí)別的精度產(chǎn)生極大影響。由于不同雷達(dá)參數(shù)下目標(biāo)的ISAR像通常會(huì)產(chǎn)生較大形變,同時(shí)實(shí)測(cè)數(shù)據(jù)中存在遮擋效應(yīng)和強(qiáng)點(diǎn)閃爍現(xiàn)象,因此圖像質(zhì)量變化較大。在這種情況下,如何合理地為每個(gè)任務(wù)中不同的支撐樣本分配對(duì)應(yīng)的權(quán)重,并且有效地將其對(duì)識(shí)別貢獻(xiàn)度的差異引入模型已經(jīng)成為小樣本ISAR目標(biāo)識(shí)別領(lǐng)域的重點(diǎn)和難點(diǎn)。針對(duì)該問(wèn)題,本文提出基于高斯原型網(wǎng)絡(luò)(Gaussian Prototypical Network, GPN)的小樣本ISAR目標(biāo)識(shí)別方法。根據(jù)實(shí)際中多數(shù)目標(biāo)的特征呈高斯分布這一特性,GPN對(duì)嵌入空間特征進(jìn)行統(tǒng)計(jì)建模,將輸入樣本映射為嵌入空間中的高斯分布(由均值向量和精度矩陣描述),從而有效刻畫(huà)樣本特征的統(tǒng)計(jì)特性,并且能夠通過(guò)精度矩陣的學(xué)習(xí)引入不同樣本質(zhì)量對(duì)識(shí)別貢獻(xiàn)的差異,避免離群特征對(duì)識(shí)別的不利影響。在此基礎(chǔ)上,通過(guò)計(jì)算各查詢集樣本對(duì)應(yīng)嵌入向量與各類高斯原型的馬氏距離實(shí)現(xiàn)類別預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,本方法在飛機(jī)目標(biāo)實(shí)測(cè)數(shù)據(jù)集上可以獲得良好的小樣本識(shí)別結(jié)果。
基于GPN的小樣本ISAR目標(biāo)識(shí)別流程如圖1所示,其主要包括數(shù)據(jù)產(chǎn)生、模型訓(xùn)練和模型測(cè)試3個(gè)部分。在數(shù)據(jù)產(chǎn)生階段,隨機(jī)生成器通過(guò)對(duì)訓(xùn)練集和測(cè)試集進(jìn)行隨機(jī)采樣不斷生成支撐集和查詢集。對(duì)于C-wayK-shot任務(wù),首先從相應(yīng)數(shù)據(jù)集中隨機(jī)挑選出C個(gè)類別,每個(gè)類別再隨機(jī)挑選K個(gè)樣本作為支撐集,同時(shí)將C個(gè)類別中的剩余樣本作為查詢集。在模型訓(xùn)練的前向傳播階段,GPN通過(guò)嵌入網(wǎng)絡(luò)將支撐集樣本映射為嵌入向量及其精度矩陣,進(jìn)而計(jì)算各類別的高斯原型。之后,通過(guò)計(jì)算查詢集樣本對(duì)應(yīng)嵌入向量到各類別高斯原型的馬氏距離獲得預(yù)測(cè)標(biāo)簽。在反向傳播階段,根據(jù)預(yù)測(cè)標(biāo)簽與真實(shí)標(biāo)簽計(jì)算損失,從而指導(dǎo)模型參數(shù)的更新。在模型測(cè)試階段,模型參數(shù)固定,直接將支撐集和查詢集輸入模型并執(zhí)行與訓(xùn)練過(guò)程中相同的高斯原型計(jì)算與距離度量操作來(lái)獲得對(duì)未知類別目標(biāo)ISAR像的預(yù)測(cè)標(biāo)簽。接下來(lái),對(duì)網(wǎng)絡(luò)各模塊結(jié)構(gòu)及其功能進(jìn)行詳細(xì)介紹。
GPN通過(guò)softmax函數(shù)計(jì)算xi屬 于各類別的概率。特別地,xi屬于第k類的概率為
在訓(xùn)練過(guò)程中,本節(jié)采用5類飛機(jī)(F15C, F16,F18, F117和MiG29)的電磁仿真數(shù)據(jù)對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行迭代更新優(yōu)化。在測(cè)試過(guò)程中,采用與訓(xùn)練過(guò)程類別不同的3類飛機(jī)(安26、雅克42、獎(jiǎng)狀飛機(jī))的實(shí)測(cè)數(shù)據(jù)ISAR像進(jìn)行小樣本識(shí)別性能分析與對(duì)比。
電磁仿真數(shù)據(jù)所采用的5類飛機(jī)模型如圖3所示。在本地坐標(biāo)系中,雷達(dá)俯仰角為145°,方位角為0°~360°,載頻為17 GHz,成像帶寬為1 GHz,采用物理光學(xué)法進(jìn)行電磁計(jì)算[1],所得各目標(biāo)回波數(shù)均為10920。接著,將積累角設(shè)為3°, 4°, 5°并采用距離-多普勒方法進(jìn)行高分辨成像,可獲得3種不同分辨率的ISAR像。本節(jié)圖像縱向均表示距離單元、橫向均表示方位單元。同時(shí),每隔1°方位角成像1次,因此每種分辨率得到360幅ISAR像。在此基礎(chǔ)上,將每張圖像中的目標(biāo)居中并裁剪為128×128,并從中剔除特征描述性不強(qiáng)的圖像(如部分結(jié)構(gòu)反射太強(qiáng)導(dǎo)致輪廓特征丟失等),挑選其中200張作為實(shí)驗(yàn)所用數(shù)據(jù)集。最終,電磁仿真數(shù)據(jù)集共得到3000張圖像。在成像積累角4°時(shí),5類飛機(jī)的典型成像結(jié)果如圖3所示。同時(shí),圖4給出了F16飛機(jī)不同積累角下的成像結(jié)果對(duì)比??梢钥闯?,積累角變化會(huì)使ISAR像產(chǎn)生方位維的拉伸或壓縮。
實(shí)測(cè)數(shù)據(jù)對(duì)應(yīng)的3類飛機(jī)光學(xué)圖像和ISAR像如圖5所示。此時(shí)雷達(dá)工作于C波段,帶寬為400 MHz。每類飛機(jī)包含90張結(jié)構(gòu)清晰、聚焦良好的圖像,尺寸均為128×128。
圖6給出訓(xùn)練集中5類不同型號(hào)飛機(jī)(F15C, F16,F18, F117和MiG29)電磁仿真數(shù)據(jù)典型ISAR像的特征分布可視化結(jié)果與分布檢驗(yàn)結(jié)果。為便于高維特征可視化,本文使用t分布隨機(jī)領(lǐng)域嵌入[19](tdistributed Stochastic Neighbor Embedding, t-SNE)將嵌入空間中的高維特征降至2維,并分別繪制所有類別目標(biāo)特征分布的3維可視化及2維可視化結(jié)果,分別如圖6(a)和圖6(b)所示。其中,F(xiàn)16特征分布的2維可視化結(jié)果如圖6(c)所示。以分位數(shù)-分位數(shù)圖[20]的形式對(duì)F16特征在兩個(gè)維度上分別進(jìn)行分布檢驗(yàn),結(jié)果如圖6(d)所示,其中2種顏色表示2個(gè)維度的特征。若該圖中散點(diǎn)分布越接近線性,則輸入數(shù)據(jù)分布越接近高斯分布。其他4類目標(biāo)特征分布的2維可視化及分位數(shù)-分位數(shù)圖與F16類似。從可視化及分布檢驗(yàn)結(jié)果可以看出,每類目標(biāo)樣本特征的統(tǒng)計(jì)特性均近似于高斯分布,該結(jié)論與GPN的假設(shè)相同。
實(shí)驗(yàn)選擇成像積累角分別為3°, 4°和5°的電磁仿真數(shù)據(jù)ISAR像作為訓(xùn)練集,從而分析GPN對(duì)訓(xùn)練樣本形變的適應(yīng)性。同時(shí),分別進(jìn)行3-way 1-shot和3-way 5-shot兩組實(shí)驗(yàn),從而分析支撐集樣本數(shù)對(duì)識(shí)別性能的影響。在模型訓(xùn)練過(guò)程中,將學(xué)習(xí)率設(shè)置為10–3、迭代次數(shù)設(shè)置為1000,并采用Adam優(yōu)化方法[21]來(lái)搜索并更新模型參數(shù)。在測(cè)試過(guò)程中,由于1次實(shí)驗(yàn)具有隨機(jī)性和偶然性,不能準(zhǔn)確反映模型性能,因此用隨機(jī)生成器反復(fù)迭代生成1000組實(shí)驗(yàn)數(shù)據(jù)并進(jìn)行1000次獨(dú)立重復(fù)實(shí)驗(yàn)。最終,將實(shí)驗(yàn)結(jié)果繪制表格并列出識(shí)別準(zhǔn)確率的平均值、最大值、最小值和標(biāo)準(zhǔn)差。PN與GPN識(shí)別結(jié)果對(duì)比如表1所示??梢钥闯?,在3種成像積累角下,GPN較PN在1-shot和5-shot兩種任務(wù)下的平均識(shí)別正確率都有明顯提升。但是,測(cè)試準(zhǔn)確率的最小值也反映出依然存在部分低質(zhì)量帶標(biāo)簽樣本,從而使得對(duì)應(yīng)識(shí)別精度降低。
同時(shí),GPN所得嵌入向量的t-SNE可視化結(jié)果如圖7所示,統(tǒng)計(jì)直方圖如圖8所示。結(jié)合表1可以看出,3-way 5-shot的平均識(shí)別正確率均高于3-way 1-shot,并且各類目標(biāo)對(duì)應(yīng)嵌入向量的聚集性及識(shí)別穩(wěn)定性更好。因此,少量增加支撐樣本數(shù)量可以顯著改善小樣本ISAR目標(biāo)識(shí)別效果。
表1 PN與GPN識(shí)別結(jié)果對(duì)比
整體上,無(wú)論是3-way 1-shot還是3-way 5-shot任務(wù),當(dāng)訓(xùn)練集數(shù)據(jù)成像積累角為4°時(shí)識(shí)別性能達(dá)到最優(yōu),因此,訓(xùn)練集與測(cè)試集之間的不同差異會(huì)在一定程度上決定模型學(xué)習(xí)的效果,從而影響模型的泛化性能。針對(duì)目標(biāo)的實(shí)測(cè)ISAR圖像小樣本識(shí)別問(wèn)題,合理地構(gòu)建電磁仿真數(shù)據(jù)會(huì)對(duì)識(shí)別結(jié)果起到較好的促進(jìn)作用。
為了進(jìn)一步驗(yàn)證所提GPN在小樣本ISAR目標(biāo)識(shí)別問(wèn)題中的有效性,本節(jié)將其與傳統(tǒng)深度網(wǎng)絡(luò)進(jìn)行了對(duì)比實(shí)驗(yàn)。具體而言,選取包含6個(gè)卷積層的經(jīng)典DCNN模型,并分別構(gòu)建1-shot和5-shot實(shí)驗(yàn)場(chǎng)景。由于傳統(tǒng)ISAR目標(biāo)識(shí)別方法在訓(xùn)練過(guò)程中不納入其他類別樣本的信息,因此僅選擇實(shí)測(cè)數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)。當(dāng)實(shí)驗(yàn)場(chǎng)景為K-shot時(shí),從實(shí)測(cè)數(shù)據(jù)的每個(gè)類別中隨機(jī)選取K個(gè)樣本作為訓(xùn)練集,其余的樣本作為測(cè)試集。最后,將DCNN模型的實(shí)驗(yàn)結(jié)果與GPN的實(shí)驗(yàn)結(jié)果進(jìn)行了對(duì)比,如表2所示。
表2 小樣本條件下傳統(tǒng)DCNN與GPN識(shí)別結(jié)果對(duì)比(%)
由對(duì)比結(jié)果可以看出,在每類有標(biāo)簽樣本僅有1幅的情況下(1-shot),現(xiàn)有深度神經(jīng)網(wǎng)絡(luò)DCNN幾乎失效,而GPN平均識(shí)別準(zhǔn)確率比DCNN高出約28%;在每類有標(biāo)簽樣本僅有5幅的情況下(5-shot),DCNN的識(shí)別準(zhǔn)確率僅有68.24%,而GPN的平均識(shí)別率為92.44%,比DCNN高出約24%。因此,GPN能夠解決現(xiàn)有深度神經(jīng)網(wǎng)絡(luò)在處理小樣本ISAR目標(biāo)識(shí)別問(wèn)題時(shí)識(shí)別性能下降甚至失效等問(wèn)題,同時(shí)能夠?qū)崿F(xiàn)穩(wěn)健特征提取與識(shí)別。
針對(duì)現(xiàn)有基于深度卷積神經(jīng)網(wǎng)絡(luò)的ISAR目標(biāo)識(shí)別方法在訓(xùn)練樣本不足時(shí)性能下降甚至失效等問(wèn)題,研究了基于GPN的ISAR小樣本目標(biāo)識(shí)別方法。該方法首先通過(guò)嵌入網(wǎng)絡(luò)獲得輸入樣本的嵌入向量及精度矩陣,進(jìn)而通過(guò)支撐集構(gòu)建了各類別的高斯原型,最終通過(guò)計(jì)算查詢集樣本對(duì)應(yīng)的嵌入向量與各類別高斯原型的馬氏距離來(lái)實(shí)現(xiàn)類別預(yù)測(cè)。相比于PN,所提模型將嵌入向量建模為高斯分布,并且充分考慮了支撐集樣本對(duì)識(shí)別貢獻(xiàn)度的差異。實(shí)驗(yàn)結(jié)果表明,本方法在飛機(jī)目標(biāo)實(shí)測(cè)數(shù)據(jù)集上可以獲得更優(yōu)的識(shí)別結(jié)果。未來(lái)將研究基于樣本多特征融合及形變穩(wěn)健的ISAR小樣本識(shí)別方法。