郝 巖,白艷萍,張校非
(中北大學(xué)理學(xué)院,太原 030051)
合成孔徑雷達(dá)(SAR)是一種高分辨率成像雷達(dá),成像具有全天時(shí)、全天候的特點(diǎn)。在信息高速發(fā)展的時(shí)代,信息的高效處理成為必然??焖俑咝У腟AR目標(biāo)識(shí)別方法也必不可少。目前,SAR目標(biāo)識(shí)別研究主要分為目標(biāo)特征提取和識(shí)別兩大部分。傳統(tǒng)的特征提取方法有主成分分析(PCA)[1]、非負(fù)矩陣分解[2]、灰度共生矩陣法[3]等;而識(shí)別方法主要有支持向量機(jī)(SVM)[4],自適應(yīng)集成分類器(AdaBoost)[5]以及深度學(xué)習(xí)方法[6-8]。
KNN(K 近鄰算法)最早是由 Cover和 Hart[9]提出的,現(xiàn)已成為一種非常有效的非參數(shù)分類算法。它是一種惰性學(xué)習(xí),學(xué)習(xí)過(guò)程只是簡(jiǎn)單地存儲(chǔ)已知的訓(xùn)練數(shù)據(jù);當(dāng)遇到新的測(cè)試樣本時(shí),一系列相似的樣本被取出,并用來(lái)分類新的測(cè)試樣本。它在模式識(shí)別、統(tǒng)計(jì)分類、計(jì)算機(jī)視覺(jué)、DNA測(cè)序以及剽竊偵查等方面應(yīng)用廣泛。
本文主要研究將KNN算法應(yīng)用于SAR目標(biāo)識(shí)別,并將其效果與經(jīng)典的SVM算法進(jìn)行比較。采用剪裁和去噪方法,包括高斯去噪、中值濾波、小波加噪去噪的方法對(duì)圖像的冗余信息進(jìn)行“剔除”,并將不同去噪方法與剪裁后的圖像結(jié)合,達(dá)到了比單獨(dú)剪裁或去噪實(shí)驗(yàn)更好的識(shí)別效果,進(jìn)一步證明了本文所提方法的有效性。
KNN算法[10]是一種統(tǒng)計(jì)分類器,屬于惰性學(xué)習(xí),對(duì)包容型數(shù)據(jù)的特征變量篩選尤其有效,是最簡(jiǎn)單的機(jī)器學(xué)習(xí)算法之一。它的基本思想是:輸入沒(méi)有標(biāo)簽及未經(jīng)分類的新數(shù)據(jù),首先提取新數(shù)據(jù)的特征并與測(cè)試集中每一個(gè)數(shù)據(jù)特征進(jìn)行比較;然后從樣本中提取k個(gè)最鄰近數(shù)據(jù)特征的分類標(biāo)簽,統(tǒng)計(jì)這k個(gè)最鄰近數(shù)據(jù)中出現(xiàn)次數(shù)最多的分類,將其作為新數(shù)據(jù)的類別[11-13]。
KNN的算法步驟如下:
1)計(jì)算待分類數(shù)據(jù)特征與訓(xùn)練數(shù)據(jù)特征之間的距離并排序;
2)取出距離最近的k個(gè)訓(xùn)練數(shù)據(jù)特征;
3)根據(jù)k個(gè)相近訓(xùn)練數(shù)據(jù)特征所屬的類別來(lái)判定新樣本的類別:如果它們都屬于同一類,那么新樣本也屬于這個(gè)類;否則,對(duì)每個(gè)候選類別進(jìn)行評(píng)分,按照某種規(guī)則確定新樣本的類別。
wi類的判決函數(shù)為:
1)歐氏距離
2)馬氏距離
3)曼哈頓距離
4)切比雪夫距離
判決規(guī)則為:
本文針對(duì)MSTAR的公開(kāi)數(shù)據(jù)集BMP2(裝甲車),BTR70(裝甲車)以及 T72(主戰(zhàn)坦克)進(jìn)行實(shí)驗(yàn),圖1是3類目標(biāo)的SAR圖像和光學(xué)圖像示例。數(shù)據(jù)庫(kù)中的SAR圖像分辨率為0.3 m×0.3 m,目標(biāo)圖像大小為128×128像素。實(shí)驗(yàn)選取SN_C21,SN_C71和SN_132 17°俯仰角下的圖像作為訓(xùn)練樣本,15°俯仰角下的圖像作為測(cè)試樣本。訓(xùn)練樣本個(gè)數(shù)為698,各類分別為233,233,232。測(cè)試樣本個(gè)數(shù)為588,各類分別有196個(gè)樣本。
本文將實(shí)驗(yàn)分為兩組,第1組分別對(duì)數(shù)據(jù)進(jìn)行了單一的剪裁,高斯去噪,中值濾波,小波加噪再去噪,然后分別用KNN和SVM分類,下面簡(jiǎn)稱實(shí)驗(yàn)1;第2組實(shí)驗(yàn)數(shù)據(jù)為在剪裁好的圖像基礎(chǔ)上再分別進(jìn)行高斯去噪,中值濾波,小波加噪再去噪,再用KNN和SVM分類,下面簡(jiǎn)稱實(shí)驗(yàn)2。
本文將未處理的圖像作為實(shí)驗(yàn)1的第1組數(shù)據(jù)。其次,根據(jù)MSTAR中SAR圖像目標(biāo)集中于圖像中間的特點(diǎn),將圖像剪裁成大小為64×64的新圖像,作為實(shí)驗(yàn)1的第2組數(shù)據(jù),然后對(duì)圖像分別進(jìn)行高斯去噪,中值濾波,小波加噪再去噪,把處理后的圖像讀為特征向量,作為實(shí)驗(yàn)1的3、4、5組數(shù)據(jù),以待分類。
為了實(shí)驗(yàn)更好地識(shí)別效果,將實(shí)驗(yàn)1中處理好的數(shù)據(jù)第2組數(shù)據(jù)分別與3、4、5組數(shù)據(jù)結(jié)合,分別作為實(shí)驗(yàn)2的第1、2、3組數(shù)據(jù),以待分類。
2.2.1 實(shí)驗(yàn)1結(jié)果
針對(duì)實(shí)驗(yàn)1的數(shù)據(jù),分別用KNN和SVM分類的結(jié)果如表1,由于KNN的初始聚類中心為[0,1]之間的隨機(jī)值,因此,本文取10次實(shí)驗(yàn)結(jié)果的平均值作為最終結(jié)果。
表1 實(shí)驗(yàn)1結(jié)果比較
從表1可以明顯看出,除了經(jīng)剪裁處理的數(shù)據(jù)SVM方法比KNN精確度高0.78%之外,其他方法KNN的分類效果都明顯優(yōu)于SVM。而且對(duì)于未處理數(shù)據(jù)而言,SVM的識(shí)別效果較差,正確率只達(dá)到86.73%,而KNN的識(shí)別效果可以達(dá)到94.31%。
2.2.2 實(shí)驗(yàn)2結(jié)果
實(shí)驗(yàn)2中除了實(shí)驗(yàn)數(shù)據(jù)與實(shí)驗(yàn)1的處理方法不同之外,其他設(shè)置均相同,實(shí)驗(yàn)結(jié)果如表2。
從表2可以看出,第1組數(shù)據(jù)SVM方法比KNN精確度高0.75%,后兩組數(shù)據(jù)的KNN方法均比SVM精度高。另外。前兩組數(shù)據(jù)相比于實(shí)驗(yàn)1的精度都有所提高,而第3組數(shù)據(jù)的實(shí)驗(yàn)結(jié)果比未經(jīng)剪裁的小波加噪去噪方法的精確度略低,說(shuō)明圖片大小的變化對(duì)此方法產(chǎn)生了負(fù)面影響,但其識(shí)別效果依然很可觀。
圖2是上述8組數(shù)據(jù)以0作為初始聚類中心的分類誤差圖,圖2(a)~圖2(h)分別對(duì)應(yīng)上述8組數(shù)據(jù)的誤差圖。從圖中可以看出,識(shí)別錯(cuò)誤率最大的均在第1類中。
本文采用逆向思維,通過(guò)剪裁和去噪方法提取圖像特征,并用KNN和SVM進(jìn)行識(shí)別。通過(guò)兩組實(shí)驗(yàn)發(fā)現(xiàn),KNN的識(shí)別準(zhǔn)確率均達(dá)到94%以上,且在多組數(shù)據(jù)上識(shí)別精確度高于SVM,充分證明了所提方法的有效性。但KNN也存在一些不足,當(dāng)樣本不平衡時(shí),如一個(gè)類的樣本容量很大,而其他類樣本容量很小時(shí),有可能導(dǎo)致當(dāng)輸入一個(gè)新樣本時(shí),該樣本的各“鄰居”中大容量類的樣本占多數(shù),這也將成為日后繼續(xù)研究的一個(gè)方面。