利用可分性指數(shù)的極化SAR圖像特征選擇與多層SVM分類

2018-03-20 00:43:03李平，徐新，董浩，鄧旭

計算機應用 2018年1期

李平，徐新，董浩，鄧旭

(武漢大學電子信息學院，武漢 430072)(*通信作者電子郵箱xinxu@whu.edu.cn)

0 引言

合成孔徑雷達(Synthetic Aperture Radar, SAR)是一種主動式高分辨率微波遙感器，并且具備全天候晝夜對地成像的能力[1]。極化信息提取能最大限度地將不同地物的散射特征以量的形式表現(xiàn)出來，揭示地物的散射差別，進而實現(xiàn)目標的分類與識別。目前，地物覆蓋類型和土地利用分類已經成為極化SAR最重要的應用之一[2]。

極化SAR可以通過極化分解得到大量的極化分解特征，然而，特征數(shù)量的增加并不能導致相應的分類精度提高，相反，有時可能會降低分類精度，同時增加計算時間和復雜度。目前，常用的方法有以支持向量個數(shù)作為評估準則，并輔助常用的搜尋策略進行特征尋優(yōu)[3-7]，但這種方法需要遍歷所有特征，在面對特征維數(shù)較多的情況下，該方法明顯比較繁瑣。文獻[8]通過特征線性判別分析(Linear Discriminant Analysis， LDA)來優(yōu)選特征，提出一種面向對象的極化SAR分類方法；文獻[9]分析了極化特征對不同地物類型的刻畫能力，選擇適合每類地物類型的特征，提出一種多層分類的方法；文獻[10-14]利用可分性指數(shù)來選擇特征，但其所用的特征維數(shù)都較少，并基本上是極化SAR中的紋理特征和相關的指數(shù)特征，缺少對極化SAR目標分解特征的分析與描述，并且該方法中構建的發(fā)展決策樹算法，通過閾值分析來進行分類對于大樣本數(shù)據(jù)分類具有一定的局限性。支持向量機(Support Vector Machine， SVM)在非線性分類、樣本數(shù)目有限和高維模式識別中具有諸多的優(yōu)勢[15]，并且適用于小樣本情況，具有良好的泛化性。

有鑒于此，本文提出一種新的基于可分性指數(shù)和順序后退法(Sequential Backward Selection, SBS)[16]選擇特征并利用多層SVM進行分類的方法。該方法包括3步：

第1步以可分性指數(shù)(Separability Index, SI)[10]確定各類地物的分類順序，初步篩選敏感特征；

第2步將SI所選出的敏感特征采用順序后退法搜索特征子集，得到結果特征集；

第3步利用SI確定的分類順序和SBS確定的敏感特征，利用多層SVM進行分類。

1 研究數(shù)據(jù)

第一景數(shù)據(jù)為舊金山San Francisco地區(qū)L波段的RadarSat- 2星載全極化SAR數(shù)據(jù)，數(shù)據(jù)大小為1 600像素×1 200像素，分辨率為10 m。主要地物類型為水域、建筑和林地。如圖1所示。

第二景數(shù)據(jù)為荷蘭Flevoland地區(qū)C波段RadarSat- 2星載全極化SAR圖像。分辨率為8 m×12 m，圖像大小為1 400像素×1 200像素。主要地物類型為水域、耕地、建筑和林地。如圖2所示。兩景數(shù)據(jù)中白色區(qū)域為未定義類別，不參與分類評估。

圖1 San Francisco實驗數(shù)據(jù)

圖2 Flevoland 實驗數(shù)據(jù)

2 基于可分性指數(shù)的特征選擇

2.1 極化特征提取

特征提取對極化SAR的分類十分重要。目標分解方法作為極化SAR數(shù)據(jù)特征提取的主要方法，它利用地物目標的不同散射機制，提取不同散射信息對地物目標進行分類。常用的極化目標分解特征如表1所示。

2.2 基于可分性指數(shù)和順序后退法特征選擇算法

對于多個極化特征，如何選擇最優(yōu)特征是比較關鍵的工作。在選擇特征時，其中最主要的原則就是該特征具有區(qū)分不同類別的能力。由此引入了特征可分性，當考慮兩類或更多類時，如果在該特征下的均值的距離大于該特征下標準差的距離，就認為該特征具有較好可分性[10]。可分性指數(shù)(SI)被定義為：

SIab=|μa-μb|/(Sa+Sb)

(1)

其中：μ和S分別表示a類和b類在某一特征下的均值和標準差。SIab值越大表明a類和b類之間的可分性越好，SIab的值在0.8和1.5之間說明該特征為有用特征，其值超過2表明該特征幾乎完全實現(xiàn)類類可分。

表1 極化分解特征

Flevoland數(shù)據(jù)地物類型較為豐富，故選擇該景數(shù)據(jù)進行實驗分析。特征分析實驗中每類地物選擇8 000個樣本點。首先，將SI指標應用于4類地物組成的對：1)水域和其他(林地、耕地和建筑)；2)耕地和其他(水域、林地和建筑)；3)林地和其他(水域、耕地和建筑)；4)建筑和其他(水域、林地和耕地)。4類地物組成的四對類類地物在所有特征下的可分性指數(shù)如圖3所示。

在特征為香農熵時，水域的可分性指數(shù)SI>2。與其他類相比水域的可分性指數(shù)較大，因此選擇水域作為第一個分類目標，其可分性特征為H、α、Ks、Kd、CSE、l3、CHmA、CmHA、YPs。其可分性指數(shù)結果如圖3(a)。在選擇水域作為第一個分類目標后，其余三類地物作為待分類目標(耕地、林地和建筑)，并需要將這三類地物組成對并求其可分性指數(shù)。剩余三類地物之間的分類過程按照以下方式完成：

1)耕地的可分性特征為FPs、α、Ks、Kd、CLUE、CPA、C1mH1mA、YPs、P1、P2，其可分性指數(shù)均在0.8

2)林地和建筑的可分性特征為FPv、A、CPH、CPF、CRVI、C1mHA、CHA、CH1mA、YPv、P3，其可分性指數(shù)也均在0.8

由于利用可分性指數(shù)在選擇具有可分性的特征時，沒有考慮特征之間存在冗余性。為進一步去掉特征之間的冗余，利用SVM的分類精度作為特征評估準則，采用順序后退法(SBS)作為搜索策略進行特征選擇。

圖3 各類地物在不同特征下的可分性指數(shù)

SBS作為常用的次優(yōu)搜索算法，能極大減少計算量，并保證結果特征集具有較好的分類性能[16]。其具體步驟為：

1)輸入由可分性指數(shù)初步得到的特征集F={fi,i=1,2,…,k}。

2)計算各個特征fi(i=1,2,…,k)的分類精度Acc。

3)按照Acc的降冪對F中所有特征排序，得到排序特征集F′={fi′,i=1,2,…,k}其中Acc(fi′)>Acc(fj′)(i

4)按照Acc的降冪逐個選擇特征集F′中的特征fi′，將其作為待剔除特征。

5)對于第n個待剔除特征fn′，若Acc(F′fn′)>Acc(F′)，則從F′中剔除fn′；否則保留。

6)令n=n+1，若n≤k，返回步驟4)；否則，特征選擇結束,得到新的特征集F″。

表2給出了利用可分性指數(shù)進行初步特征選擇后，再輔助以順序后退法所選的特征。

表2 基于可分性指數(shù)和順序后退法所選特征

2.3 多層SVM分類方法

統(tǒng)計區(qū)域合并(Statistical Region Merging， SRM)算法在處理噪聲干擾具有高效的性能，并且它不依賴于數(shù)據(jù)分布，而這些優(yōu)點使SRM適合于具有斑點噪聲的合成孔徑雷達圖像的分割。文獻[17]對其改進提出了廣義SRM算法，即GSRM(Generalized Statistical Region Merging)算法，使其可以適用于乘性噪聲，并能更好地應用于極化SAR數(shù)據(jù)的抗噪處理。其中，調節(jié)分割尺度的參數(shù)需要根據(jù)不同的應用需求來設置。本實驗中，數(shù)據(jù)1和數(shù)據(jù)2的尺度調節(jié)參數(shù)均為16。

在分類之前，采用GSRM分割對極化SAR圖像進行預處理，可以確定最小同質區(qū)域，方便后續(xù)的特征提取與分類，同時對噪聲具有一定的抑制作用。本文方法的流程如圖4所示。

圖4 多層SVM分類方法流程

在利用可分性指數(shù)和順序后退算法確定了各類地物的分類順序和可分性特征后，利用多層SVM對4類地物進行分類。該方法中SVM分類器的核函數(shù)為徑向基函數(shù)(Radial Basis Function, RBF)。RBF核函數(shù)在處理線性不可分的分類問題有較大優(yōu)勢，其SVM核參數(shù)為默認參數(shù)，具體實現(xiàn)的步驟如圖5所示。

圖5 多層SVM分類方法的具體步驟

3 實驗分析

本文通過分析兩景實驗數(shù)據(jù)中的各類地物的分類精度和總體的分類精度來評價本文算法及對比算法。實驗硬件平臺為PC配置為i7處理器/16 GB內存，64位操作系統(tǒng)，軟件平臺為Matlab 2014a。對比實驗1為經典的Wishart監(jiān)督分類；對比實驗2為多維特征+SVM；對比實驗3為利用可分性指數(shù)選擇特征和確定分類順序后直接進行分類；對比實驗4為在利用可分性指數(shù)和順序后退法選擇特征后，選擇隨機森林(Random forest)作為分類器，在后續(xù)描述中均用RT表示隨機森林算法。隨機森林算法實質是一個包含多個決策樹的分類器，這些決策樹的形成采用了隨機的方法，因此也叫作隨機決策樹，隨機森林中的樹之間是沒有關聯(lián)的。當測試數(shù)據(jù)進入隨機森林時，其實就是讓每一棵決策樹進行分類，最后取所有決策樹中分類結果最多的那類為最終結果。本實驗中，隨機森林中決策樹的個數(shù)ntree為10，迭代次數(shù)為200；對比實驗5為在利用可分性指數(shù)和順序后退法選擇特征后，將BP_AdaBoost作為分類器進行分類，在后續(xù)描述中均用Ada表示BP_AdaBoost方法。AdaBoost算法的分類的思想是合并多個弱分類器的輸出以產生有效分類。BP_AdaBoost模型即把BP神經網絡作為弱分類器，反復訓練BP神經網絡預測樣本輸出，通過AdaBoost算法得到多個BP神經網絡弱分類器組成的強分類器。該實驗中，構建的BP網絡數(shù)為6，最大訓練次數(shù)epochs為4，訓練要求精準度為0.000 04。訓練樣本為全數(shù)據(jù)的8%。San Francisco數(shù)據(jù)分類順序為先將水域從三類地物中分開，其所用特征為H、CSE、CmHA、ρHH-VV，再將建筑和林地分開，其所用特征為Kd、P3、CPH、ρRR-LL、A。其分類后的總體精度和分類結果如表3和圖6所示。表4中時間為各類算法的運行時間，單位為秒(s)，本文將該運行時間作為運算復雜度的判斷指標。

表3 舊金山地區(qū)各類地物分類精度和總體分類精度 %

表4各種算法在舊金山地區(qū)的運行時間s

Tab. 4 Running time of different algorithms for San Francisco data s

從整體結果分析：1)對比實驗1是經典的Wishart監(jiān)督分類，實驗結果表明其對水域的分類效果比較理想，且其運行時間最短，復雜度較低，但其總體分類的準確率比其余5種算法差。2)對比實驗2為多維特征進行分類，其對林地的分類精度只有83.54%。3)對比實驗3為利用可分性指數(shù)初步進行特征選擇后直接進行多層SVM分類，相較于多維特征下SVM分類方法，林地的分類精度提高了7%，并且整體分類精度也有所提高。4)對比實驗4和對比實驗5為在利用可分性指數(shù)和順序后退法選擇特征后，分別利用隨機森林和AdaBoost分類器進行分類，從實驗結果可以看出，在這兩種分類器條件下，總的分類精度相近，但它們對林地的分類效果稍差，林地的分類精度分別為89.78%和89.89%。5)利用本文方法總體分類精度為95.81%，每類地物的精確度均高于90%。

由于San Francisco地區(qū)的地物較少，且地物之間的可分性也比較好，各種方法的總體分類精度相差約為1%，故選擇從運行時間，即各個算法的復雜度來分析。對比實驗3即SVM+SI的運行時間約為53 min，約為實驗4、5和6運行時間的3倍。San Francisco數(shù)據(jù)由可分性指數(shù)得到水域的可分特征數(shù)共有17個，為所用特征數(shù)目的1/2；林地和建筑由可分性指數(shù)得到的特征數(shù)共有13個。從實驗結果也可以看出，多維的特征并沒有取得理想中較高的分類準確率，并帶來了運行時間加長的厄運。在利用順序后退法對特征再次進行選擇后，實驗4、實驗5的運行時間分別為18 min和20 min,實驗6的運行時間約為15 min，復雜度降低。在SVM+SI+SBS算法下，時間相對最短，故而認為該算法的復雜度相對較小。

圖6 San Francisco數(shù)據(jù)分類結果

San Francisco數(shù)據(jù)只有水域、建筑和林地這三類地物，地物類別較少，為充分說明可分性指數(shù)在多層分類方法中的適用性，選擇具有水域、林地、耕地和建筑四類地物的Flevoland地區(qū)作驗證實驗。Flevoland數(shù)據(jù)分類后各地物的分類精度和分類結果分別如表5和圖7所示。表6為各種算法在Flevoland數(shù)據(jù)中的運行時間對比。

表5 Flevoland數(shù)據(jù)分類精度對比 %

從整體結果分析：1)對比實驗1對水域的分類效果依然比較理想，且運行時間最短。2)對比實驗2對建筑的分類結果較差，分類精度只有76.70%，但相比實驗1其總體分類精度有所提高。其運行時間為該幾種算法中最長的，約為1.68 h。3)對比實驗3和4的分類精度相接近，其中SVM+SI算法下，耕地的分類精度只有84.55%，而RT+SI+SBS算法下，建筑的分類精度只有82.51%。SVM+SI算法時間約為RT+SI+SBS的兩倍。4)在利用可分性指數(shù)和順序后退法選擇特征后，BP_AdaBoost和SVM兩種分類器下，總體分類精度相接近，但BP_AdaBoost算法的情況下，建筑的分類精度只有84.63%。同時，本文發(fā)現(xiàn)，在SVM作分類器進行分類時，每類地物的分類精度均在86%以上，且運行時間也比較短。

表6各種算法在Flevoland數(shù)據(jù)中的運行時間s

Tab. 6 Running time of different algorithms for Flevoland data s

綜上，對于各類地物之間的可分性較好的極化SAR數(shù)據(jù)，僅由可分性指數(shù)選出的特征進行多層分類，沒有提高分類的準確率，且?guī)砹诉\算量大幅增加。在利用可分性指數(shù)和順序后退法選擇特征后進行多層分類，在SVM分類器的情況下，運行時間大幅度減少，且分類精度提高2%；在不同分類器的情況下，SVM分類器的分類效果相對較好，這也說明了支持向量機適用于小樣本情況，具有良好的泛化性。

圖7 Flevoland數(shù)據(jù)分類結果

4 結語

本文提出一種基于可分性指數(shù)的多層SVM的極化SAR特征分析與分類方法，該方法解決了在面對高維特征情況下利用可分性指數(shù)初步篩選特征時特征之間依然會出現(xiàn)冗余的問題。可分性指數(shù)先將高維特征作第一步篩選，剔除了一部分特征，降低了特征的維數(shù)；然后利用順序后退選擇算法進行第二次特征選擇，進一步去除特征之間的冗余性。通過實驗證明了該方法的可行性和有效性。

下一步的研究方向主要是面向更豐富的地物目標類型，提出更多的可利用的特征，研究出各類地物的通用的敏感特征，用于極化SAR圖像的分類，以期在減災、土地利用等重要領域發(fā)揮積極作用。

References)

[1] 李仲森.極化雷達成像基礎與應用[M].北京：電子工業(yè)出版社,2013:2.(LI Z S. Polarization Radar Imaging Foundation and Application [M]. Beijing: Publishing House of Electronics Industry, 2013: 2.)

[2] 王超,張紅,陳曦.全極化合成孔徑雷達圖像處理[M].北京：科學出版社,2008:107.(WANG C, ZHANG H, CHEN X. Full Polarimetric Synthetic Aperture Radar Image Processing [M]. Beijing: Science Press, 2008: 107.)

[3] 吳永輝,計科峰,郁文賢.SVM全極化SAR圖像分類中的特征選擇[J].信號處理,2007,23(6):877-881.(WU Y H, JI K F, YU W X. Feature selection in SVM full polarimetric SAR image classification [J]. Signal Processing, 2007, 23(6): 877-881.)

[4] 吳永輝,計科峰,李禹,等.利用SVM的極化SAR圖像特征選擇與分類[J].電子與信息學報,2008,30(10):2347-2351.(WU Y H, JI K F, LI Y, et al. Characteristic selection and classification of polarimetric SAR images using SVM [J]. Journal of Electronics & Information Technology, 2008, 30(10): 2347-2351.)

[5] 巫兆聰,歐陽群東,李芳芳.顧及特征優(yōu)化的全極化SAR圖像SVM分類[J].測繪科學,2013,38(3):115-117.(WU Z C, OUYANG Q D, LI F F. SVM classification of fully polarimetric SAR images with feature optimization [J]. Surveying Science, 2013, 38(3): 115-117.)

[6] 代琨,于宏毅,馬學剛,等.基于支持向量機的特征選擇算法綜述[J].信息工程大學學報,2014,15(1):85-91.(DAI K, YU H Y, MA X G, et al. Research on feature selection algorithm based on support vector machine [J]. Journal of Information Engineering University, 2014, 15(1): 85-91.)

[7] 袁春琦,徐佳,程圓娥,等.顧及分類器參數(shù)的全極化SAR圖像特征選擇與分類[J].測繪科學技術學報,2016,33(5):507-512.(YU C Q, XU J, CHENG Y E, et al. Design and classification of full polarized SAR image based on classifier parameters [J]. Journal of Surveying and Mapping Science and Technology, 2016, 33(5): 507-512.)

[8] 李雪薇,郭藝友,方濤.基于對象的合成孔徑雷達影像極化分解方法[J].計算機應用,2014,34(5):1473-1476.(LI X W, GUO Y Y, FANG T. Based on the object-based synthetic aperture radar image polarization decomposition method [J]. Journal of Computer Applications, 2014, 34(5): 1473-1476.)

[9] 宋超,徐新,桂容,等.基于多層支持向量機的極化合成孔徑雷達特征分析與分類[J].計算機應用,2017,37(1):244-250.(SONG C, XU X, GUI R, et al. Analysis and classification of polarized synthetic aperture radar based on multi-layer support vector machine [J]. Journal of Computer Applications, 2017, 37(1): 244-250.)

[10] CUMNLING I G, ZYL J J V. Feature utility in polarimetric radar image classification [C]// IGARSS’89: Proceedings of the 1989 International Canadian Symposium on Remote Sensing. Piscataway, NJ: IEEE, 2002: 1841-1846.

[11] MISHRA P, SINGH D. A statistical-measure-based adaptive land cover classification algorithm by efficient utilization of polarimetric SAR observables [J]. IEEE Transactions on Geoscience & Remote Sensing, 2014, 52(5): 2889-2900.

[12] WU F, WANG C, ZHANG H, et al. Rice crop monitoring in south China with RADARSAT- 2 quad-polarization SAR data [J]. IEEE Geoscience & Remote Sensing Letters, 2011, 8(2): 196-200.

[13] GUPTA S, SINGH D, KUMAR S. An approach based on texture measures to classify the fully polarimetric SAR image [C]// Proceedings of the 2015 International Conference on Industrial and Information Systems. Piscataway, NJ: IEEE, 2015: 1-6.

[14] JAIN A, SINGH D. Decision tree approach to classify the fully polarimetric RADARSAT- 2 data [C]// Proceedings of 2015 National Conference on Recent Advances in Electronics & Computer Engineering (RAECE). Piscataway, NJ: IEEE, 2015: 318-323.

[15] VAPNIK V N. An overview of statistical learning theory [J]. IEEE Transactions on Neural Networks, 1999, 10(5): 988-99.

[16] PUDIL P, NOVOVICOVJ, KITTLER J. Floating search methods in feature selection [J]. Pattern Recognition Letters, 1994, 15(11): 1119-1125.

[17] LANG F, YANG J, LI D, et al. Polarimetric SAR image segmentation using statistical region merging [J]. IEEE Geoscience & Remote Sensing Letters, 2014, 11(2): 509-513.

This work is partially supported by the Technology Research and Development Major Project of High-Resolution Earth Observation System (03-Y20A10- 9001- 15/16), the Comprehensive Disaster Demonstration Project of Spatial Information Services.

LIPing, born in 1992, M. S. candidate. Her research interests include synthetic aperture radar image interpretation.

XUXin, born in 1967, Ph. D., professor. His research interests include signal and information processing.

DONGHao, born in 1990, Ph. D. candidate. His research interests include synthetic aperture radar image interpretation.

DENGXu, born in 1993, M. S. candidate. Her research interests include synthetic aperture radar image interpretation.