林 鵬,阮仁宗,陳 遠,柴 穎,陶 婷
(1. 河海大學 地球科學與工程學院,江蘇 南京 211100;2. 南京金智視訊科技有限公司,江蘇 南京 211100)
面向對象的城鎮(zhèn)土地覆蓋信息自動提取方法
林 鵬1,阮仁宗1,陳 遠2,柴 穎1,陶 婷1
(1. 河海大學 地球科學與工程學院,江蘇 南京 211100;2. 南京金智視訊科技有限公司,江蘇 南京 211100)
以安徽省滁州市城區(qū)為研究對象,采用面向對象的分類思想,在建立誤分割指數(shù)進行多尺度分割評價的基礎上,提出了一種首先利用遺傳算法對光譜特征、幾何特征、空間特征等進行最優(yōu)特征集提取,再結合支持向量機算法進行自動提取的分類方法,并對分類結果進行了精度評價。結果表明,該方法的精度達到了90.43%,證明了其可行性。
土地覆蓋;面向對象;誤分割;支持向量機
土地覆蓋反映了人與自然相互影響、交叉作用最直接與最親密的關系,對區(qū)域生態(tài)和環(huán)境的研究有巨大影響[1-2],是評價生態(tài)環(huán)境的重要指標之一[3]。隨著國民經(jīng)濟的快速發(fā)展,土地覆蓋狀況變化速度與程度的加劇,尋求一種適合國情的能快速準確地獲取土地覆蓋信息的方法就顯得尤為重要[4]。隨著遙感平臺的多樣化和遙感圖像分辨率的提高,遙感技術已成為土地覆蓋信息提取的重要手段[5]。目前,土地覆蓋的信息提取主要有基于像元和面向對象兩種方法[6]。隨著高光譜影像的采用,圖像中所包含的地物信息更加豐富。基于像元的分類方法僅利用光譜信息而忽略了空間位置、幾何形狀等其他特征;面向對象的分類方法根據(jù)像元間的異質性,通過定義一定的閾值將像元組合成相對同質的對象,并以對象作為基本的分類單元;其綜合利用了影像的光譜特征、幾何特征,避免了對象破碎,提高了影像的分類精度。但是,面向對象的分類方法中,參與分類的特征閾值多使用經(jīng)驗方法進行選取,對目視判別要求較高且容易對后續(xù)分類造成誤差累積;而對于地物表面相似的不同地物來說,人工特征閾值分類結果往往并不理想[7-10]。
研究區(qū)選取位于滁州市的武店鎮(zhèn),總面積為10.44 km2(圖1)。采用數(shù)據(jù)的是ZY-3衛(wèi)星高分辨率遙感影像,成像時間為2014-03-24,有4個多光譜波段和1個全色波段。其中,多光譜影像空間分辨率為5.8 m,全色影像空間分辨率為2.1 m。
通過選取地面控制點對遙感影像進行幾何校正,誤差小于1個像元;采用Gram-Schmidt Pan Sharpen算法,利用全色波段數(shù)據(jù)對多光譜數(shù)據(jù)進行增強。此外,本文引入了野外實測樣點,共測點211個,采集時間為2014-03-29。所有的樣本點均利用GPS獲得,精度約為1 m,記錄樣本的種類、覆蓋度和位置等屬性。
圖1 研究區(qū)的地理位置圖(審圖號:GS(2014)3416)
本文在建立誤分割指數(shù)進行多尺度分割評價的基礎上,提出了一種先利用遺傳算法在多重特征中進行最優(yōu)特征集提取,再結合支持向量機(SVM)算法進行自動提取的分類方法。
2.1 地物類別的確定
根據(jù)對遙感影像的目視判讀、野外實地調查數(shù)據(jù)和研究區(qū)內地物分布情況,結合現(xiàn)行的分類體系,將研究區(qū)內地物劃分為道路、建筑、植被、水體、裸地和其他,其中植被主要以種植作物的耕地為主。
2.2 多尺度分割
多尺度分割算法是一種區(qū)域生長算法。它基于影像對象的特征,針對不同土地覆蓋類型的尺度效應,解決產(chǎn)生斑塊與真實地物邊界擬合問題。分割對象的平均異質性最小化與像素的平均異質性最小化是影像分割的標準[11]。當異質性大于等于給定的尺度時,區(qū)域就會停止生長,區(qū)域內像元將合并形成對象。異質性的計算公式為:
式中,wcolor為光譜異質性權重;wc為數(shù)據(jù)層權重;σc為數(shù)據(jù)層上光譜標準差;wcpt為緊致度異質性;l為對象長度;b為目標多邊形最短邊;n為像元個數(shù)。
對于多尺度分割,分割尺度的確定至關重要,是后續(xù)分類精度的重要保證[12]。本文為確定分割尺度,選擇以10為單位遞增從10~100共10個尺度進行分割。在研究區(qū)中選擇樣本,利用目視解譯的方式在分割結果圖像上進行判別,并計算樣本區(qū)內誤分圖斑的數(shù)目和面積,見表1。
表1 誤分割圖斑面積和個數(shù)統(tǒng)計
由表1可知,分割尺度越大,誤分割圖斑的數(shù)量會減少,但誤分割的總面積會增大。為綜合考慮兩種因素,對誤分割圖斑個數(shù)和誤分割圖斑面積進行歸一化處理,建立誤分割指數(shù)模型,以期得到最佳分割尺度使得誤分割指數(shù)達到最小值。
式中,n為歸一化后誤分割圖斑數(shù);r為歸一化后誤分割圖斑面積;ESI為誤分割指數(shù)。通過表1數(shù)據(jù),最后得到結果如圖2所示。因此,本文選擇20為最佳分割尺度,并根據(jù)類似方法,最終確定形狀因子為0.4,緊致度因子為0.5。
2.3 特征選擇
圖2 ESI曲線圖
經(jīng)過多尺度分割后的影像對象產(chǎn)生了新的特征信息,相較于單個像元無疑含有更多的信息量。面向對象方法可以利用的特征除影像光譜特征外,還有紋理特征、幾何特征、上下文特征等[7-8]。根據(jù)已有研究成果,結合研究區(qū)實際,初步選擇以下特征:四波段光譜均值、亮度、標準差、比率、同質性、對比度、角二階性、熵、方差、面積、長寬比、密度、形狀指數(shù)、NDVI、NDWI、SAVI和RVI等。若運用上述全部特征進行分類會導致維數(shù)過于龐大。同時,對于不同地物來講,部分特征在分類中的貢獻并不高。所以,最佳特征集的構建就顯得尤為重要[13]。本文采用遺傳算法來選擇合適特征完成最佳特征集的構建。
遺傳算法是一種典型的隨機搜索算法[14]。該算法將“適者生存”理念創(chuàng)新性地引入到搜索算法當中,并通過遺傳操作使優(yōu)秀成分不斷保留下來,直至最后達到最優(yōu)解[15]。遺傳算法提取最優(yōu)特征的過程如圖3所示。
圖3 遺傳算法流程圖
本文將所有選擇特征作為其長度值,代表某一組合。編碼方式采用二值串“0”“1”進行染色體表達,以表征是否選用對應特征(圖4)。本研究運用隨機函數(shù)產(chǎn)生40個染色體組成初始種群,最大繁殖代數(shù)為100,交叉繁殖率為0.7,變異率為0.1。當?shù)揭欢ù鷶?shù)后,若最佳個體始終未發(fā)生改變,則停止運算。
圖4 染色體編碼
當?shù)霈F(xiàn)新一代后,去除基因為“0”的特征項,樣本內數(shù)據(jù)以類內類間距離為可分性判據(jù)計算適應值,并保存染色體,繼續(xù)迭代,直至滿足停止條件。通過計算,在繁殖51代時最后得到12個特征的最佳特征組合,分別為:四波段光譜均值、亮度、NDWI、NDVI、熵、對比度、同質性、密度和長寬比。
2.4 SVM
SVM基于結構風險最小化的原則,通過泛化性理論控制超平面的間隔度量抑制過合,用最優(yōu)化理論提供的數(shù)學技術找到優(yōu)化這些度量的超平面,從而建立一個超平面。其過程是通過適當?shù)膬确e核函數(shù)決定的[16]。實際求解最優(yōu)化問題和計算分類平面時,只需計算核函數(shù)k(x, y)。在目前眾多較為理想的核函數(shù)中,徑向基函數(shù)是使用最為廣泛的一種。徑向基核函數(shù)通過參數(shù)控制,可近似取得線性核函數(shù)以及Sigmoid函數(shù)的性質,具有相當廣泛的適用性[17-18]。本文選用徑向基核函數(shù),結合研究區(qū)影像,在基于分割結果的基礎上選擇訓練區(qū)進行對分類器訓練。首先在訓練區(qū)中,基于對象對6類地物每類選擇6~9個訓練樣本;然后將遺傳算法的特征選擇結果作為地物分類時所需計算的屬性;最后選用SVM方法進行分類,classifier kernel type 選擇RBF,即徑向基核函數(shù)。
2.5 基于像元的地物分類
為了對本文提出方法的精度和效果進行評價,利用基于像元的最大似然分類法進行地物提取,將研究區(qū)分為道路、建筑、植被、水體、裸地和其他6類,每類選取200~300個樣本作為訓練樣本,并將分類結果同面向對象的分類結果進行對比分析。
將分類結果與原圖(圖5)進行對比,不難看出面向對象的分類結果中,地物分布較連續(xù)且基本保證了完整性。而基于像元的分類結果中,雖然大部分地物分類正確,但整體地物連貫性較差,且存在椒鹽現(xiàn)象。為對結果進行定量分析,采用混淆矩陣的方法對分類結果進行精度評價。根據(jù)200個實地考查點數(shù)據(jù),結合滁州市鳳陽縣2014年土地利用規(guī)劃圖,通過目視解譯隨機撒點的方法,在遙感圖像上隨機選取600個樣本點,即樣本總數(shù)達到800個。利用驗證點數(shù)據(jù)對分類結果進行了精度評價。通過建立混淆矩陣,分別用生產(chǎn)者精度、用戶精度、總體精度和Kappa系數(shù)等指標評價其精度(表2)。
圖5 分類結果圖
表2 面向對象的分類精度評價
采用相同的檢驗樣本對基于像元的分類結果進行評價,并將相同地物的分類結果總體精度與Kappa系數(shù)進行對比,如表3所示。
表3 不同分類方法精度比較
從表3數(shù)據(jù)可以看出,本文提出的分類方法總體精度達到了90.43%,Kappa系數(shù)為0.87,明顯高于基于像元分類結果的75.21%。從單個類別分類情況來看,兩種分類方法對植被、裸地、水體都有較為精確的分類。但在道路、建筑和其他類的提取中,基于像元的分類精度明顯低于面向對象的分類。分類提取結果中,植被、水體以及裸地的分類精度都達到了85%以上;道路與建筑的分類精度較低。在面向對象的分類方法中,道路、建筑兩類中有較多誤分情況,主要是因為城區(qū)內建筑物密集且縱橫交錯,在影像特征上與道路相似,不論從光譜特征還是幾何特征上來都很容易將二者誤分。在農村居民點附近,由于道路由高速路變?yōu)榘赜吐?,導致道路影像的亮度值變低而難以與周圍地物區(qū)分。在植被區(qū)中,道路類型變?yōu)檗r村土路,部分道路被誤分為植被。建筑物因其同道路光譜特征相
似且與道路交錯,發(fā)生了較多誤分;同時城區(qū)內地物眾多,建筑密集復雜,光譜特征豐富,導致誤分較為嚴重。但是,基于像元的分類方法中,單一使用光譜特征更加難以區(qū)分道路和建筑,二者在分類結果上混分更加嚴重。與基于像元的分類方法相比,本文提出的分類方法精度更高,分類結果更加精確。
本文旨在尋找一種可以自動提取土地覆蓋信息的方法。通過對結果進行的分析,可以得到以下結論:①面向對象的分類方法和基于像元的分類方法對植被、水體的提取有相似的精度,但在道路與建筑分類中,面向對象的分類方法精度明顯高于基于像元的分類方法。②引入誤分割指數(shù)模型,綜合考慮對象分割問題,有效避免了因為誤分割而導致的分類精度問題。③利用SVM的自動分類方法,在很大程度上減少了因人工閾值選取不當而導致的誤差問題,并綜合利用特征信息提高了分類精度。④在特征選取上使用遺傳算法,根據(jù)優(yōu)勝劣汰的原則使輸出結果最優(yōu)化,不但減少了因人工參與導致的誤差,而且有效避免了維數(shù)災難的問題。
但本文仍存在一些不足:在對影像的尺度選擇上,缺少對單類地物最佳尺度的選擇;對于誤分割尺度模型的建立缺乏科學的評判依據(jù);整個過程難以實現(xiàn)自動化;在SVM分類時,對于核函數(shù)的選擇沒有深入探究;對參與分類的樣本數(shù)及樣本點個數(shù)對分類精度的影響沒有作進一步討論,這些都是今后待解決的問題。
[1] Voltersen M, Berger C, Hese S, et al. Object-based Land Cover Mapping and Comprehensive Feature Calculation for an Automated Derivation of Urban Structure Types at Block Level[J].Remote Sensing of Environment,2014,154:192-201
[2] XUN L,WANG L. An Object-based SVM Method Incorporating Optimal Segmentation Scale Estimation Using Bhattacharyya Distance for Mapping Salt Cedar (Tamarisk spp.) with QuickBird Imagery[J]. GIScience & Remote Sensing,2015,52(3):257-273
[3] Pielke R A, Dalu G A, Snook J S, et al. Nonlinear Influence of Mesoscale Land Use on Weather and Climate[J]. Journal of Climate,1991,4(11):1 053-1 069
[4] 趙庚星,李玉環(huán),徐春達.遙感和GIS支持的土地利用動態(tài)監(jiān)測研究:以黃河三角洲墾利縣為例[J].應用生態(tài)學報,2000,11(4):573-576
[5] Rogan J, CHEN D. Remote Sensing Technology for Mapping and Monitoring Land-cover and Land-use Change[J]. Progress in Planning,2004,61(4):301-325
[6] Frohn R C, Reif M, Lane C, et al. Satellite Remote Sensing of Isolated Wetlands Using Object-oriented Classification of Landsat-7 Data[J]. Wetlands,2009,29(3):931-941
[7] QIU X, WU S S, MIAO X. Incorporating Road and Parcel Data for Object-based Classification of Detailed Urban Land Covers from NAIP Images[J].GIScience & Remote Sensing,2014,51(5):498-520
[8] OUYANG Z T, ZHANG M Q, XIE X,et al. A Comparison of Pixel-based and Object-oriented Approaches to VHR Imagery for Mapping Saltmarsh Plants[J].Ecological Informatics,2011,6(2):136-146
[9] YUE A, ZHANG C,YANG J,et al. Texture Extraction for Object-oriented Classification of High Spatial Resolution Remotely Sensed Images Using a Semivariogram [J].International Journal of Remote Sensing,2013,34(11):3 736-3 759
[10] Baatz M, Schape A. Object-oriented and Multi-scale Image Analysis in Semantic Networks[A]//In:Pro of 2nd International Symposium on Operationalization of Remote Sensing[C]// Enschede, Netherland, 1999:16-20
[11] Baatz M, Benz U, Dehghani S. eCognition Developer 8.0.1-User Guide[Z]. Germany:Trimble,2010
[12] 黃亮,左小清,馮沖,等.基于Canny算法的面向對象影像分割[J].國土資源遙感,2011,23(4):26-30
[13] 李利紅,張華國,厲冬玲,等. 基于多尺度紋理和光譜信息的海島土地利用遙感分類方法研究[J].海洋學研究,2013,31(2):35-44
[14] 馮莉,李滿春,李飛雪.基于遺傳算法的遙感圖像紋理特征選擇[J].南京大學學報(自然科學版),2008,44(3):310-319
[15] 吳健生,林倩,李衛(wèi)峰,等.基于特征選擇的土地整理地物識別規(guī)則的動態(tài)提取[J].遙感技術與應用,2013,28(5):799-805
[16] 張峰,薛艷麗,李英成,等.基于SVM的多源遙感影像面向對象建筑物提取方法[J].國土資源遙感,2008,20(2):27-29
[17] Keerthi S S, LIN C J. Asymptotic Behaviors of Support Vector Machines with Gaussian Kernel[J].Neural Comput,2003,15(7): 1 667-1 689
[18] LIN H T, LIN C J. A Study on Sigmoid Kernels for SVM and the Training of Non-PSD Kernels by SMO-type Methods, Technical Report[R].Department of Computer Science, National Taiwan University,2003
P237
B
1672-4623(2017)01-0098-04
10.3969/j.issn.1672-4623.2017.01.030
林鵬,碩士研究生,主要從事地理信息和遙感技術應用研究。
2015-06-01。
項目來源:中國科學院戰(zhàn)略性先導科技專項資助項目(XDA05050106)。