張 婷,蔡德饒
(1.江西警察學(xué)院,南昌 330031;2.上饒職業(yè)技術(shù)學(xué)院信息工程系,江西 上饒 334100)
合成孔徑雷達(SAR)通過主動式的微波遙感獲得高分辨的圖像[1],可以為對地觀測、戰(zhàn)場偵察等鄰域提供必要的信息支持。自動目標識別(ATR)是SAR 圖像解譯的重要環(huán)節(jié)之一[2-3],旨在獲得大場景SAR 圖像中感興趣區(qū)域所包含的目標信息,并判定其具體類別。一般的SAR 目標識別方法主要包含特征提取和分類器設(shè)計兩部分。特征提取階段獲得原始SAR 圖像的特征描述。常用的SAR 圖像目標特征包括幾何特征、投影特征以及散射中心特征。幾何特征主要描述目標的幾何外形,如目標區(qū)域[4]、目標輪廓[5]等。投影特征則是通過數(shù)學(xué)變換的形式將原始圖像的灰度分布投影到新的特征空間。常見的方法包括主成分分析(PCA)[6]、線性鑒別分析(LDA)[6]等。在高頻區(qū),雷達目標的后向散射可以等效為局部現(xiàn)象。這些局部特性也稱為散射中心。研究表明,散射中心同樣是SAR 目標識別的有力特征。文獻[7-8]就是采用屬性散射中心實現(xiàn)高性能的SAR 目標識別。分類器通過設(shè)計合理的決策機制判定目標類別。常用于SAR 目標識別的分類器包括K 近鄰分類器(KNN)[6,9],支持向量機(SVM)[4-5,10],稀疏表示分類器(SRC)[11-13]等。作為特征和分類器聯(lián)合作用的結(jié)果,SAR 目標識別的性能與提取的特征以及選取的分類器息息相關(guān)。
近年來,深度學(xué)習(xí)技術(shù)飛速發(fā)展[14-15]。卷積神經(jīng)網(wǎng)絡(luò)(CNN)作為深度學(xué)習(xí)技術(shù)在圖像解譯領(lǐng)域的代表,目前已在SAR 圖像目標識別中得以成功運用[15-17]。與傳統(tǒng)的分類方法不同,卷積神經(jīng)網(wǎng)絡(luò)將特征學(xué)習(xí)和分類決策融入統(tǒng)一的框架。具體而言,采用多種卷積核對原始SAR 圖像進行不同方面的特征分析。此外,通過多層次的網(wǎng)絡(luò)學(xué)習(xí)層次化的深度特征。因此,深度特征對于目標特性的描述能力更強,有利于提高識別性能。在深度網(wǎng)絡(luò)的最后一層,通常采用多類的回歸分類器(Softmax)對學(xué)習(xí)的深度特征進行分類,判定目標類別。
本文提出聯(lián)合多層次深度特征的SAR 目標識別方法,旨在充分發(fā)掘多層次深度特征對于目標識別的鑒別力以提高識別性能。首先根據(jù)以往的研究成果,設(shè)計了適應(yīng)于SAR 目標識別的卷積神經(jīng)網(wǎng)絡(luò)。對于網(wǎng)絡(luò)中每一個卷積層輸出的特征圖,通過矢量化串接以及降采樣的方式構(gòu)造一個特征矢量。由此,多個卷積層的特征矢量構(gòu)成多層次的深度特征。為了充分利用構(gòu)造的多層次深度特征,本文采用聯(lián)合稀疏表示(Joint Sparse Representation,JSR)[18-20]對它們進行聯(lián)合決策。聯(lián)合稀疏表示是壓縮感知理論在多任務(wù)學(xué)習(xí)領(lǐng)域的應(yīng)用,其在準確表征單個任務(wù)的同時發(fā)掘不同任務(wù)之間的內(nèi)在關(guān)聯(lián)。因此,聯(lián)合稀疏表示可以更好地對多層次深度特征進行分類,從而達到提高目標識別性能的效果。采用MSTAR數(shù)據(jù)集對提出的算法進行性能測試,實驗結(jié)果證明了方法的優(yōu)越性能。
卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)技術(shù)的一項重要工具,在圖像處理領(lǐng)域得以廣泛運用并取得了良好的效果。與傳統(tǒng)的分類方法不同,卷積神經(jīng)網(wǎng)絡(luò)將特征學(xué)習(xí)和分類集成到同一框架。具體而言,采用多個卷積層學(xué)習(xí)層次化的深度特征。最后,通過Softmax 完成分類任務(wù)。
為了提高網(wǎng)絡(luò)的穩(wěn)健性以及減小計算復(fù)雜度,往往在每一個卷積層后設(shè)置池化層。池化操作通過對特征圖上h×w 的局部窗口進行操作達到降低維度、增強穩(wěn)健性的目的。常見的池化操作有平均池化和最大值池化。以最大值池化為例,其具體操作方式如下:
通過多個卷積層和池化層的交替作用之后,最終輸出的特征通過一個多類回歸分類器(Softmax)判定測試樣本的目標類別。
為了充分利用卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的層次化深度特征,本文對卷積神經(jīng)網(wǎng)絡(luò)中每一個卷積層的輸出進行特征構(gòu)造,進而獲取多層次深度特征。針對SAR 目標識別的特定應(yīng)用,本文依據(jù)先前研究成果設(shè)計如下頁圖1 所示的卷積神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)包括3 個卷積層(Conv),3 個最大值池化層(Max Pooling),2 個全連接層(FC)。在網(wǎng)絡(luò)的訓(xùn)練過程中,通過卷積操作可以獲取原始SAR 圖像不同側(cè)面的特征。圖2 顯示了一幅MSTAR SAR 圖像在圖1 所示的網(wǎng)絡(luò)中不同卷積層輸出的特征圖。可以看出,不同卷積層的結(jié)果能夠體現(xiàn)原始圖像不同的特點,如區(qū)域、輪廓、點特征等。由此,多層次的深度特征可以有效繼承各個卷積層的特征,從而給予目標更為全面的描述,通過聯(lián)合多層次深度特征可以有效提升目標識別性能。
實際上,每一個卷積層輸出的特征圖數(shù)量較多,且每一個特征圖都是一個較高維度的圖像。此時,直接采用原始的特征圖會給后續(xù)的分類算法帶來較大的計算負擔(dān)。為此,本文采用對每一個卷積層輸出的所有特征圖統(tǒng)一進行降采樣,獲得統(tǒng)一的特征矢量。例如,對于圖2(b)所示的16 幅特征圖,分別對其中的任一特征圖按照逐行串接的方式進行矢量化,然而采用同一降采樣因子獲得低維度矢量。最后,將所有16 幅特征圖獲得的特征矢量按照設(shè)定的先后順序進行串接,得到第1 卷積層對應(yīng)的深度特征矢量。對其與兩個卷積層的輸出進行同樣操作,獲得相應(yīng)的深度特征矢量。
圖1 本文設(shè)計的卷積神經(jīng)網(wǎng)絡(luò)
圖2 一幅MSTAR SAR 圖像在不同卷積層輸出的特征圖
本文采用聯(lián)合稀疏表示對構(gòu)造的深度特征進行分類。具體流程如下頁圖3 所示,可以歸納為以下步驟:
步驟1:采用訓(xùn)練樣本訓(xùn)練圖1 所示的卷積神經(jīng)網(wǎng)絡(luò);
步驟2:基于訓(xùn)練的網(wǎng)絡(luò)對所有訓(xùn)練樣本提取多層次深度特征,構(gòu)建深度特征字典;
步驟3:基于訓(xùn)練的網(wǎng)絡(luò)對待識別的測試樣本構(gòu)造多層次深度特征;
步驟4:采用聯(lián)合稀疏表示對測試樣本的多層次深度特征進行分類;
步驟5:基于最小重構(gòu)誤差的原則判斷目標類別。
在具體的操作過程中,對于每一個訓(xùn)練樣本,分別基于訓(xùn)練得到的網(wǎng)絡(luò)獲取其各個卷積層輸出的特征圖。然而,采用1.2 節(jié)中的方法生成各個層次對應(yīng)的深度特征矢量,且每一卷積層的特征圖均通過合理的降采樣得到600 維的矢量。所有訓(xùn)練樣本對應(yīng)卷積層輸出的深度特征矢量則構(gòu)建成相應(yīng)的字典。在本文中,則形成3 個卷積層對應(yīng)的3 個字典,即K=3。最終,對測試樣本進行相應(yīng)的特征構(gòu)造,并基于聯(lián)合稀疏表示計算各個訓(xùn)練類別的重構(gòu)誤差進而判定目標類別。
圖3 本文識別方法的流程
為了驗證提出算法的有效性,基于MSTAR 數(shù)據(jù)集進行實驗分析。該數(shù)據(jù)集包含了10 類地面靜止車輛目標的SAR 圖像,分辨率0.3 m×0.3 m。10類目標常見訓(xùn)練和測試集設(shè)置如表1 所示。其中,訓(xùn)練集來自17°俯仰角,測試集來自15°俯仰角。對于任一目標,其SAR 圖像均包含了0~360°方位角。為了充分體現(xiàn)提出算法的性能,實驗中選用了幾類現(xiàn)有的SAR 目標識別算法進行對比實驗,包括基于SVM 的方法[10],基于SRC 的方法[11]以及基于CNN的方法[15]。
表1 10 類目標的訓(xùn)練和測試集
3.2.1 3 類目標測試
首先基于表1 中BMP2,BTR70 和T72 3 類目標的訓(xùn)練和測試樣本測試提出方法的識別性能。此實驗設(shè)置中,BMP2 和T72 兩類目標的測試樣本與對應(yīng)的訓(xùn)練樣本存在一定的型號差異。下頁表2 列出了本文方法對3 類目標具體的分類結(jié)果,3 類目標(含各個型號)的識別率均達到97%以上,平均識別率為98.47%。從表2 中還可以看出,對于訓(xùn)練集中未包含的型號,它們的識別率相對較低。這表明型號差異會一定程度帶來識別性能的下降。各類方法的平均識別率如表3 所示。本文方法的識別率高于對比算法,證明了該算法在此實驗條件下的高性能。對于CNN 方法,由于訓(xùn)練集和測試集中存在的型號差異,導(dǎo)致訓(xùn)練得到的網(wǎng)絡(luò)對于不同型號的樣本的適應(yīng)性較差。本文方法通過聯(lián)合多層次的深度特征,增強了對于樣本畸變(如型號變化帶來的局部變化)的穩(wěn)健性。因此,本文方法可以獲得更好的識別性能。
3.2.2 10 類目標測試
基于表1 中的測試集和訓(xùn)練集,測試了提出算法對10 類目標的識別性能,對于BMP2 和T72 兩類目標,其訓(xùn)練和測試樣本均保持同一型號(BMP2 的Sn_9563 和T72 的Sn_132)。此時,10 類目標的訓(xùn)練和測試樣本僅僅存在2°的俯仰角差異。本文方法對10 類目標的分類混淆矩陣如圖4 所示,其中橫坐標代表真實目標類別,縱坐標提出算法預(yù)測的目標類別,對角線上的元素代表正確識別率??梢钥闯觯?0類目標的識別率均達到98%以上,最終的平均識別率為99.38%。實驗結(jié)果充分證明了該方法高性能。
表2 3 類目標的識別結(jié)果
表3 各類方法對3 類目標的平均識別率
圖4 本文方法對10 類目標的混線矩陣
表4 對比了提出算法與其他算法對于10 類目標識別問題的平均識別率。與3 類目標的識別實驗結(jié)構(gòu)對比,此時各類方法對于10 類目標的平均識別率均有了一定的提高。這主要是因為本實驗中的訓(xùn)練和測試集之間不存在型號差異。得益于卷積神經(jīng)網(wǎng)絡(luò)的強分類性能,本文方法與文獻[16]中基于CNN 的方法的識別性能顯著高于SVM 和SRC 方法。對于本文方法和文獻[12]中的CNN 方法,本文方法的平均識別率有一定的提高,說明了聯(lián)合多層次深度特征有益于正確的識別。
表4 10 類目標識別問題上的性能對比
3.2.3 噪聲干擾
實際過程中,獲得的SAR 圖像往往受到來自于背景環(huán)境和雷達系統(tǒng)的噪聲干擾。為了測試提出算法對于噪聲干擾的穩(wěn)健性,本文首先對10 類目標實驗中的測試樣本添加不同程度的高斯白噪聲。然后,基于原始的訓(xùn)練集進行后續(xù)的目標識別。圖5顯示了各類方法在不同信噪比(Signal-to-noise Ratio,SNR)下的平均識別率??梢钥闯觯疚姆椒ㄔ诟鱾€信噪比下均保持最高的識別率,充分證明了其對于噪聲干擾的穩(wěn)健性。此外,SRC 方法在信噪比較低(低于0dB)時,識別性能優(yōu)于SVM 和文獻[16]中的CNN 方法。這主要得益于稀疏表示對于噪聲干擾的穩(wěn)健性[21]。該方法一方面通過多層次的深度特征獲得具有噪聲穩(wěn)健的特征描述;另一方面,聯(lián)合稀疏表示同樣繼承了稀疏表示對于噪聲干擾的穩(wěn)健性。由此,該方法對于噪聲干擾具有最強的穩(wěn)健性。
圖5 各類方法在噪聲干擾下的識別性能對比
本文提出了聯(lián)合多層次深度特征的SAR 目標識別方法。該方法首先對卷積神經(jīng)網(wǎng)絡(luò)中的每一個卷積層的輸出進行特征構(gòu)造,獲得統(tǒng)一的特征矢量。進而采用聯(lián)合稀疏表示對多層次的深度特征進行分類,判定目標類別。通過綜合多層次深度特征的優(yōu)勢,以及結(jié)合聯(lián)合稀疏表示的優(yōu)點實現(xiàn)高性能的SAR 目標識別。實驗中,基于MSTAR 數(shù)據(jù)集分別測試了提出算法對3 類目標、10 類目標的識別性能以及噪聲干擾下的穩(wěn)健性。實驗結(jié)果表明,本文算法對3 類目標和10 類目標的平均識別率分別可以達到98.31%和99.38%,且具有最強的噪聲穩(wěn)健性,因此,在實際的SAR 目標識別系統(tǒng)中具有很強的應(yīng)用潛力。