陳 婕,廖志平
(桂林電子科技大學(xué)信息科技學(xué)院, 廣西 桂林 541004)
合成孔徑雷達(dá)(SAR)可實(shí)現(xiàn)距離向和方位向的二維高分辨率成像,為對(duì)地觀測(cè)提供了有力的工具。戰(zhàn)時(shí),通過對(duì)SAR圖像進(jìn)行有效解譯獲取戰(zhàn)場(chǎng)目標(biāo)信息具有巨大的情報(bào)價(jià)值。為此,研究SAR目標(biāo)識(shí)別技術(shù)具有廣闊的應(yīng)用前景[1-2]。從具體的分類識(shí)別算法角度,SAR目標(biāo)識(shí)別方法一般按照特征提取和分類決策兩個(gè)階段序慣進(jìn)行。特征提取實(shí)現(xiàn)對(duì)SAR圖像中目標(biāo)特性的描述,以剔除噪聲、背景雜波等帶來的干擾。主成分分析(PCA),線性鑒別分析(LDA)等投影變換特征被廣泛用于SAR圖像特征提取[3-5]。其他用于SAR目標(biāo)識(shí)別的特征還包括目標(biāo)輪廓[6]、目標(biāo)區(qū)域[7]、散射中心[8-9]等。分類決策階段,常用的分類器包括K近鄰(KNN)[3]、支持向量機(jī)(SVM)[10-11]、稀疏表示分類器(SRC)[11-12]以及卷積神經(jīng)網(wǎng)絡(luò)(CNN)[13-14]等。Mishra將PCA和LDA用于SAR圖像特征提取并采用KNN進(jìn)行分類對(duì)比了兩種特征在SAR目標(biāo)識(shí)別中的性能[3]。文獻(xiàn)[6]基于SAR目標(biāo)輪廓提取橢圓傅里葉系數(shù)進(jìn)而采用SVM分類器進(jìn)行目標(biāo)識(shí)別。文獻(xiàn)[7]基于目標(biāo)二值區(qū)域設(shè)計(jì)匹配算法并根據(jù)區(qū)域殘差進(jìn)行分類算法設(shè)計(jì)。文獻(xiàn)[12]首次將SRC引入SAR目標(biāo)識(shí)別并取得了良好的識(shí)別性能。文獻(xiàn)[13]等針對(duì)SAR目標(biāo)識(shí)別的特定應(yīng)用設(shè)計(jì)了全卷積神經(jīng)網(wǎng)絡(luò),相比傳統(tǒng)方法顯著提高了識(shí)別性能。文獻(xiàn)[8]以屬性散射中心為基本特征,提出了一種基于Hungarian算法的散射中心匹配方法并將其應(yīng)用于SAR目標(biāo)識(shí)別。
本文針對(duì)現(xiàn)有SAR目標(biāo)識(shí)別中分類決策中存在的不足,提出一種基于增強(qiáng)字典稀疏表示的SAR識(shí)別方法。首先通過添加噪聲、多分辨率表示的方法豐富訓(xùn)練樣本并以此構(gòu)建增強(qiáng)的字典。所構(gòu)建的增強(qiáng)字典涵蓋了部分?jǐn)U展操作條件(即噪聲污染、分辨率變化)并且字典中樣本規(guī)模的擴(kuò)大也有效提高了其基礎(chǔ)描述能力。因此,基于增強(qiáng)字典對(duì)待識(shí)別的樣本進(jìn)行分類,可以得到更可靠的識(shí)別結(jié)果。
基于壓縮感知的基本原理,稀疏表示通過線性表示和稀疏重構(gòu)的方式尋找測(cè)試樣本的最佳匹配類別,完成分類任務(wù)。記C類目標(biāo)的訓(xùn)練樣本構(gòu)建的全局字典為A=[A1,A2,…,AC]∈Rd×N,其中Ai∈Rd×Ni(i=1,2,…,C)為第i類的Ni個(gè)樣本?;谠撟值鋵?duì)測(cè)試樣本y進(jìn)行稀疏重構(gòu)如下:
(1)
(2)
從稀疏表示分類的基本原理和流程不難看出,目標(biāo)類別的判斷依賴于其對(duì)應(yīng)類別訓(xùn)練樣本的線性表示能力。若訓(xùn)練樣本規(guī)模較小,則線性表示的精度較低,難以可靠進(jìn)行識(shí)別。即使在訓(xùn)練樣本規(guī)模較大的情況下,其覆蓋條件應(yīng)當(dāng)貼近實(shí)際情況,考察到實(shí)際可能出現(xiàn)的各種干擾。因此,為提高稀疏表示分類的性能,有必要在已有的有限訓(xùn)練樣本基礎(chǔ)上進(jìn)行提升,提高最終構(gòu)建的字典的有效性。
如前文分析,字典的完備性是稀疏表示分類中一個(gè)關(guān)鍵的問題,決定字典能否可以有效重構(gòu)測(cè)試樣本以及適應(yīng)復(fù)雜多變的樣本變化(如噪聲添加、分辨率變化等)。因此,提高字典的描述能力及其對(duì)擴(kuò)展操作條件的適應(yīng)性具有重要的意義。傳統(tǒng)的基于稀疏表示分類的SAR目標(biāo)識(shí)別算法大多是針對(duì)稀疏系數(shù)的求解以及最終的判決規(guī)則等問題進(jìn)行優(yōu)化改進(jìn)。如文獻(xiàn)[16]根據(jù)稀疏表示系數(shù)的能量進(jìn)行決策而不是采用經(jīng)典的最小重構(gòu)誤差準(zhǔn)則。本文則是通過增強(qiáng)字典的完備性進(jìn)而提高稀疏表示分類器在SAR目標(biāo)識(shí)別上的性能。通過對(duì)原始訓(xùn)練樣本添加高斯噪聲以及進(jìn)行多分辨率表示達(dá)到增強(qiáng)原始字典的目的。
噪聲干擾是SAR目標(biāo)識(shí)別中一種常見的擴(kuò)展操作條件。用于分類器訓(xùn)練的樣本往往通過合作途徑獲取(如仿真計(jì)算),噪聲水平一般較低。此時(shí),利用這些樣本對(duì)低信噪比(SNR)SAR圖像進(jìn)行識(shí)別存在較大的困難。為此,本文采用添加高斯噪聲的方式模擬噪聲污染的訓(xùn)練樣本。定義信噪比如式(3)所示。
(3)
式(3)中,H和W分別為圖像的高和寬,r(i,l)表示SAR圖像的頻域數(shù)據(jù),σ2代表噪聲方差。
圖1給出了將SAR圖像變換到頻域數(shù)據(jù)的基本過程。經(jīng)過二維逆傅里葉變換、去除成像過程中的頻域補(bǔ)零以及加窗效應(yīng)從而獲得相應(yīng)頻域數(shù)據(jù),然后,對(duì)頻域數(shù)據(jù)添加噪聲獲得噪聲干擾圖像。通過改變添加噪聲的方差就可以得到不同信噪比的SAR圖像。圖2給出了同一目標(biāo)在不同信噪比下的SAR圖像。
圖1 SAR圖像的頻域變換Fig. 1 Procedure of transforming SAR images to the frequency domain
圖2 不同信噪比下的SAR圖像Fig.2 SAR images at different SNRs
由于傳感器的差異,待識(shí)別SAR圖像可能與訓(xùn)練樣本采集自不同分辨率。此時(shí),依托原始訓(xùn)練樣本往往難以對(duì)測(cè)試樣本進(jìn)行可靠分類。為此,本文通過對(duì)原始訓(xùn)練樣本進(jìn)行多分辨率表示豐富分辨率成分,為不同分辨率下的識(shí)別任務(wù)提供支撐。根據(jù)SAR成像機(jī)理,其距離和方位向的分辨率分別由雷達(dá)帶寬和合成孔徑大小決定。為此,通過對(duì)SAR圖像的原始回波數(shù)據(jù)進(jìn)行適當(dāng)分割,可以得到不同分辨率下的成像數(shù)據(jù)。圖3給出了實(shí)施多分辨率表示的基本流程。首先,根據(jù)預(yù)設(shè)的分辨率需求對(duì)SAR圖像頻域數(shù)據(jù)進(jìn)行部分分割。然后,按照一般的SAR成像流程進(jìn)行頻域補(bǔ)零并加窗,從而保證重建圖像與原始圖像具有相同的像素分辨率。最后,通過二維傅里葉變換將處理后的頻域數(shù)據(jù)變換到圖像域獲得相應(yīng)分辨率的SAR圖像。通過調(diào)整頻域分割的比例可以獲得目標(biāo)在不同分辨率下的表示。圖4顯示了同一目標(biāo)在不同分辨率的SAR圖像。多分辨的表示可以增強(qiáng)原始訓(xùn)練樣本的描述能力。一方面,多分辨率的訓(xùn)練樣本可以描述更多分辨率的SAR圖像;另一方面,即使對(duì)于某一固定分辨率的測(cè)試樣本,多分辨的訓(xùn)練樣本也可以提高對(duì)其重構(gòu)的精度。這些都有利于提高稀疏表示分類器的性能。
圖3 多分辨率表示的流程Fig. 3 Procedure of producing multi-resolution representations
圖4 SAR圖像在不同分辨率的表示Fig.4 SAR images at different resolutions
本文提出的基于增強(qiáng)字典稀疏表示的SAR目標(biāo)識(shí)別方法,通過對(duì)原始訓(xùn)練樣本的多信噪比、多分辨率表示,大大提高了字典的表述能力以及對(duì)于擴(kuò)展操作條件的適應(yīng)性。本文設(shè)計(jì)的基本識(shí)別流程如圖5所示,具體按照以下步驟實(shí)施:
步驟1 對(duì)原始訓(xùn)練樣本添加高斯噪聲構(gòu)造多信噪比的SAR圖像;
步驟2 對(duì)原始訓(xùn)練樣本進(jìn)行多分辨率表示,得到多分辨率的SAR圖像;
步驟3 利用原始訓(xùn)練樣本及構(gòu)造的多信噪比、多分辨率的SAR圖像共同構(gòu)建增強(qiáng)字典;
步驟4 基于增強(qiáng)字典采用稀疏表示分類器對(duì)測(cè)試樣本進(jìn)行識(shí)別。
圖5 基于增強(qiáng)字典稀疏表示的識(shí)別流程Fig.5 Recognition procedure of sparse representation-based classification based on augmented dictionary
實(shí)施中,為了降低原始SAR數(shù)據(jù)的維度,首先采用PCA對(duì)原始SAR圖像及其多信噪比、多分辨率表示進(jìn)行特征提取,獲得100維的特征矢量。然后,基于增強(qiáng)訓(xùn)練樣本的PCA特征矢量構(gòu)建全局進(jìn)而進(jìn)行稀疏表示分類。本文采用SparseLab開源工具包中的正交匹配追蹤算法(OMP)求解稀疏表示系數(shù),其中稀疏度和重構(gòu)誤差上限分別設(shè)置為60和10-4。圖6給出了一幅T72測(cè)試樣本在增強(qiáng)字典上的稀疏表示系數(shù)分布,其中,增強(qiáng)字典由BMP2、BTR70和T72 3類目標(biāo)的698個(gè)訓(xùn)練樣本構(gòu)成(詳見實(shí)驗(yàn)章節(jié))。采用本文方法增強(qiáng)后,字典規(guī)模達(dá)到6 980個(gè)原子,按照BMP2、BTR70和T72的順序依次排列。從圖6中可以看出測(cè)試樣本的稀疏表示系數(shù)在同類別的字典上的值相對(duì)較高并且具有較大系數(shù)的原子多集中與T72字典上。這說明T72類別中存在較多與測(cè)試樣本相似度較高的原子?;谠鰪?qiáng)字典中T72類別字典對(duì)測(cè)試樣本的重構(gòu)誤差顯著小于其他類別,因此可以獲得正確的識(shí)別結(jié)果。
圖6 基于增強(qiáng)字典的稀疏表示系數(shù)求解示意Fig.6 Illustration of solution of sparse coefficients based on augmented dictionary
MSTAR數(shù)據(jù)集是由美國(guó)DARPA/AFRL提供的地面靜止車輛目標(biāo)實(shí)測(cè)SAR數(shù)據(jù),采集了X波段HH極化下多類地面車輛目標(biāo)的SAR圖像,圖像大小128×128像素,分辨率0.3 m×0.3 m,是目前國(guó)際上用于SAR目標(biāo)識(shí)別算法驗(yàn)證的常用數(shù)據(jù)集。本文針對(duì)MSTAR數(shù)據(jù)集中的10類目標(biāo)(見圖7)進(jìn)行分類實(shí)驗(yàn),部分訓(xùn)練和測(cè)試樣本如表1所示,其中訓(xùn)練樣本來自17°俯仰角,待識(shí)別測(cè)試樣本來自15°俯仰角。實(shí)驗(yàn)實(shí)施中,選用現(xiàn)有幾類SAR目標(biāo)識(shí)別方法進(jìn)行同步對(duì)比實(shí)驗(yàn),包括SVM方法[10]、傳統(tǒng)SRC方法[12]以及CNN方法[13]。為保持與提出方法特征的一致性,SVM和SRC均對(duì)100維的PCA特征矢量進(jìn)行分類。CNN則是采用文獻(xiàn)[13]設(shè)計(jì)的全卷積神經(jīng)網(wǎng)絡(luò)(包含5個(gè)卷積層和3個(gè)最大值池化層直接基于原始SAR圖像進(jìn)行訓(xùn)練和分類。對(duì)比方法均不進(jìn)行訓(xùn)練本的增強(qiáng)。
1) 3類目標(biāo)識(shí)別問題
首先,基于表1中BMP2、BTR70和T72 3類目標(biāo)的訓(xùn)練和測(cè)試樣本開展實(shí)驗(yàn)。3類目標(biāo)識(shí)別問題是SAR目標(biāo)識(shí)別中的基本問題之一,能夠反映識(shí)別算法對(duì)于多類目標(biāo)的基本分類能力。對(duì)于BMP2和T72,兩者的測(cè)試集與訓(xùn)練集具有一定的型號(hào)差異。表2統(tǒng)計(jì)了本文方法對(duì)3類目標(biāo)的識(shí)別結(jié)果,各類目標(biāo)(型號(hào))的識(shí)別率均高于97%,平均識(shí)別率達(dá)到98.61%。表3比較了不同方法在當(dāng)前條件下的平均識(shí)別率。本文方法識(shí)別率最高,CNN方法與本文方法的識(shí)別率接近,體現(xiàn)了深度模型較強(qiáng)的分類能力。然而,由于訓(xùn)練樣本與測(cè)試樣本之間存在的一定型號(hào)差異,CNN的整體分類性能仍受到一定影響。與傳統(tǒng)SRC方法對(duì)比,本文通過字典增強(qiáng)有效提升了的整體識(shí)別性能,證明了增強(qiáng)字典的有效性。
圖7 十類目標(biāo)的光學(xué)圖像Fig.7 Optical images of the ten targets
表1 實(shí)驗(yàn)訓(xùn)練和測(cè)試集
表2 三類目標(biāo)的識(shí)別結(jié)果統(tǒng)計(jì)
表3 三類目標(biāo)識(shí)別問題性能對(duì)比
2) 10類目標(biāo)識(shí)別問題
為進(jìn)一步考察提出方法對(duì)于多類目標(biāo)的分類能力,基于表1中全部10類目標(biāo)的訓(xùn)練和測(cè)試樣本進(jìn)行測(cè)試,獲得本文方法的分類混淆矩陣如圖8所示。從對(duì)角線元素可以看出,本文方法對(duì)于各類目標(biāo)的正確識(shí)別率均可達(dá)到97%以上。經(jīng)過總體計(jì)算,10類目標(biāo)平均識(shí)別率為98.12%,表明其對(duì)于10類目標(biāo)識(shí)別問題的有效性。表4列舉了各類方法在當(dāng)前條件下的平均識(shí)別率。對(duì)比其他三類方法,本文方法性能更優(yōu)。同樣,與傳統(tǒng)SRC相比,本文方法的性能得到顯著提升。這表明在增強(qiáng)字典下多信噪比、分辨率表示的樣本有利于提高對(duì)測(cè)試樣本的表示能力,進(jìn)而根據(jù)重構(gòu)誤差進(jìn)行更為精確的目標(biāo)分類。
圖8 10類目標(biāo)識(shí)別的混淆矩陣Fig. 8 Confusion matrix on 10-class recognition
表4 10類目標(biāo)識(shí)別問題性能對(duì)比
3) 噪聲干擾
為測(cè)試增強(qiáng)字典下識(shí)別方法的噪聲穩(wěn)健性,本實(shí)驗(yàn)中首先按照2.1節(jié)中噪聲添加方法對(duì)表1中的10類測(cè)試樣本添加不同程度的噪聲。然后,采用各方法對(duì)不同信噪比的噪聲樣本進(jìn)行分類,得到它們的識(shí)別結(jié)果如圖9所示。隨著信噪比的不斷降低,各方法的性能均表現(xiàn)出不同程度的下降。本文方法在各個(gè)信噪比下都能保持優(yōu)勢(shì)性能,尤其在低信噪比下,增強(qiáng)字典的方法性能優(yōu)勢(shì)更為顯著。這一結(jié)果驗(yàn)證了本方法具有更為優(yōu)越的噪聲穩(wěn)健性。一方面,增強(qiáng)字典包含了多個(gè)信噪比的噪聲樣本,因而對(duì)于噪聲干擾樣本的描述能力大大增強(qiáng);另一方面,稀疏表示分類自身對(duì)于噪聲干擾具有一定的穩(wěn)健性[15](從圖中也可以看出傳統(tǒng)SRC的總體穩(wěn)健性優(yōu)于SVM和CNN)。因此,通過增強(qiáng)字典下的稀疏表示進(jìn)行識(shí)別,其抗噪聲干擾能力較強(qiáng)。
4) 分辨率變化
為測(cè)試增強(qiáng)字典下識(shí)別方法對(duì)于分辨率變化的穩(wěn)健性,本實(shí)驗(yàn)中首先按照2.2節(jié)中的多分辨率表示方法對(duì)表1中的10類測(cè)試樣本進(jìn)行多分辨率構(gòu)造。然后,基于不同分辨率的測(cè)試樣本對(duì)各方法進(jìn)行測(cè)試,得到它們的識(shí)別結(jié)果如圖10所示。通過多分辨率表示的引入,增強(qiáng)字典下的稀疏表示相比其他方法性能更優(yōu),在各個(gè)分辨率下均保持最高的識(shí)別率。通過對(duì)訓(xùn)練樣本進(jìn)行多分辨率重構(gòu),增強(qiáng)后的字典本身就具有了其所覆蓋的分辨率的描述能力。此外,由于包含較多的分辨率,通過稀疏表示的優(yōu)化求解,分類器也具有了一定的外推功能,對(duì)更多的分辨率具有適應(yīng)性。
圖9 各方法在噪聲干擾下的識(shí)別性能Fig.9 Recognition performance of different methods under noise corruption
圖10 各方法在分辨率變化下的識(shí)別性能Fig.10 Recognition performance of different methods under resolution variance
本文提出了基于增強(qiáng)字典稀疏表示的SAR目標(biāo)識(shí)別方法。該方法通過對(duì)原始訓(xùn)練樣本進(jìn)行多信噪比、多分辨率樣本構(gòu)造,進(jìn)而構(gòu)建描述能力更強(qiáng)、對(duì)于擴(kuò)展操作條件更穩(wěn)健的增強(qiáng)字典。采用基于增強(qiáng)字典的稀疏表示分類器可有效提高目標(biāo)識(shí)別的整體性能?;贛STAR數(shù)據(jù)集的實(shí)驗(yàn)表明,本文方法在對(duì)于3類和10類目標(biāo)的平均識(shí)別率可分別達(dá)到98.61%和98.12%,驗(yàn)證其區(qū)分多類目標(biāo)的能力;通過測(cè)試本文方法在不同信噪比、不同分辨率下的識(shí)別性能,驗(yàn)證了方法對(duì)于噪聲干擾、分辨率變化具有較強(qiáng)的穩(wěn)健性。后續(xù)研究中,將針對(duì)增強(qiáng)后的字典規(guī)模過大的問題進(jìn)行優(yōu)化,采用字典學(xué)習(xí)、去冗余等多種手段進(jìn)一步提升識(shí)別性能。