趙 詣,蔣 彌
河海大學地球科學與工程學院,江蘇 南京 211100
土地覆蓋分類作為遙感領域最重要的應用分支之一[1],分類結果從宏觀角度提供了地物的基本信息,在環(huán)境監(jiān)測、農業(yè)管理、城市規(guī)劃等應用中不可或缺[2-4]。遙感技術為大范圍掌握土地覆蓋情況提供了契機[5],傳統的光學遙感受天氣等環(huán)境因素制約無法在多云雨地區(qū)作業(yè)[6]。合成孔徑雷達(synthetic aperture radar,SAR)能夠全天時、全天候工作,利用SAR數據進行土地覆蓋分類逐漸成為研究熱點[7]。自20紀90年代開始,已有學者就SAR分類能力展開研究[8],隨后大量研究表明,不同的雷達參數能夠提高分類精度[9-11]。此外,當獲取多時相、多極化數據時,不同的地物屬性得以更加完整的描述,地物識別能力得到加強[12-14]。還有許多學者使用多源數據融合光學和SAR遙感影像更加準確地分析地物屬性[15-17]。
以上研究已經較好地利用雷達數據的優(yōu)點進行地物分類,但仍存在不足之處。第一,上述成果主要通過增加特征數量達到提高分類精度的目的,鮮有文獻考慮提取特征對地物的識別能力及其估計的準確性。文獻[18]表明較分類器而言,輸入特征對分類精度影響更加顯著;文獻[19]使用不同濾波算法抑制噪聲,研究表明濾波后影像分類精度提高約5%;文獻[20]通過檢驗假設更加準確地估計相干性,分類結果保持良好的幾何特征,總體精度提高10%。以上研究均表明優(yōu)化特征參數能獲取精度更高的分類結果。第二,常用的基于像素分類方法難以保持地物幾何特征,椒鹽現象嚴重,部分研究考慮分割雷達影像[21-22],然而SAR影像中大量噪聲導致分割結果不可靠。最后,隨著新一代Sentinel系列衛(wèi)星發(fā)射,已有學者驗證其分類能力[23-25],但Sentinel-1雙極化特性相關研究仍不成熟。
針對上述問題,本文對輸入特征與分類方法分別進行優(yōu)化以期提高分類精度。首先,改進極化參數提取方法,利用光學影像良好的波譜特性指導SAR影像選取同質點,取代原有正方形窗口選點,估計極化參數;其次,使用面向對象的分類器,將光學影像分割結果應用于極化SAR分類;最后,評估Sentinel-1/2融合地表分類精度,并與現行基于像元的分類方法進行對比,論證本文方法的可行性。
(1)
(2)
(3)
為了抑制噪聲,目標分解通常使用正方形滑動窗口平均鄰域像素。假設中心像素和鄰域像素屬于同一地物,然而實際應用中滑動窗口內包含了大量異質點,直接平均影響地物統計特性,導致極化參數估計存在誤差且易出現分辨率損失,地物邊緣模糊等現象,在紋理豐富區(qū)域如城市、農田區(qū)域這一問題更加嚴重。就如何選取同質點,國內外學者從像素相似性和統計意義等不同角度提出大量算法[32-33]。這些方法計算了像素分布特性,通過假設檢驗從SAR影像中直接選取同質點。相比SAR影像,地物在光學影像中幾何特征和紋理信息更加顯著,因此本文從光學影像選取同質點指導極化參數估計。
不同地物在灰度直方圖中具有不同的峰值,文獻[34]首先提出一種基于灰度直方圖的圖像分割方法,通過迭代計算閾值區(qū)分地物,隨后不同學者提出了大量的改進方法[35-36]。然而閾值分割僅通過灰度直方圖將像素分為不同類型,不能直接用于中心像素的同質點選擇。由于同質像素各類屬性相似,因此本文使用歐氏距離作為判別標準。首先計算中心像素與鄰域像素的距離,將同質點選擇問題轉換為閾值分割問題。為了避免“同譜異物”和“同物異譜”現象的干擾[37],試驗選擇小尺寸滑動窗口,在小窗口內地物種類較少,通過閾值能夠準確區(qū)分。
(1) 首先在光學和SAR影像相同位置選擇同樣大小滑動窗口,計算中心像素與窗口內各像素間的歐氏距離
(4)
式中,dp,c表示像素p與中心像素c的距離;xpi、xci分別表示像素p和中心像素c的第i個波段觀測值;N為影像總波段數量。
(2) 假設初始閾值T=T0為窗口內所有像素距離均值。
(4) 重復迭代步驟(3)直至T不再變化,最終所有距離小于T的像素被選為同質點。
圖1為同質點選擇(a)和直方圖閾值分割結果(b),其中符號*和?分別代表中心像素與選中的同質點,多次模擬試驗表明迭代閾值同質點誤選率低于0.1。
圖1 同質點選擇與直方圖分割結果Fig.1 Results of homogeneous pixels selection and threshold segmentation
雖然上述理論分析能夠更加準確地提取極化參數,但噪聲影響、分辨率損失依然存在,若直接作為輸入變量參與分類,特別是基于像素的分類方法,分類精度會因此衰減[38]。使用面向對象的分類方法能夠抑制噪聲影響,分類結果能夠保持良好的幾何特征[39]。在眾多分割方法中,多尺度分割[40]根據影像灰度、紋理特征及像素間背景關系計算異質性參數f,將性質相同的像素合并為對象參與分類,分割效果優(yōu)越,如式(5)、式(6)所示
f=ωcol×Δhcol+ωsha×Δhsha
(5)
Δhsha=ωcom×Δhcom+ωsmo×Δhsmo
(6)
式中,Δhcol、Δhsha、Δhcom、Δhsmo分別表示灰度、形狀、精致度、光滑度的特征參數值;ωcol、ωsha、ωcom、ωsmo分別表示具體描述對應特征的權重值,且ωcol+ωsha=1,ωcom+ωsmo=1。相比SAR影像,光學影像灰度和紋理特征更加清晰,因此,本文僅將光學影像作為分割輸入特征以避免污染紋理,SAR影像采用相同分割,避免相干斑引起的分割錯誤。
本文選擇Bakersfield作為研究區(qū)域,該區(qū)域(35°15′N-35°42′N,118°29′W-119°20′W)位于美國加州南部沙漠,是加州主要城市之一。該地區(qū)地物類型多樣,以城市建筑用地與農業(yè)用地為主,紋理復雜,適合用于檢驗本文方法的分類能力。試驗區(qū)域地理位置如圖2所示,其中紅色陰影為研究區(qū)域的范圍,紅色線框為影像覆蓋范圍。
雷達數據采用Sentinel-1B干涉寬軌模式單視復數雙極化影像,極化方式為VH+VV組合,獲取于2017年7月13日,影像方位向和距離向分辨率分別為5 m和20 m。為了避免影像獲取時間不同對分類結果的影響,光學數據選取成像于2017年7月7日的Sentinel-2A1C級別影像。本文試驗僅使用4個10 m分辨率波段(B2(藍)、B3(綠)、B4(紅)、B8(近紅外))。
在數據驗證方面,本文采用2011年美國地質勘測局(USGS)發(fā)布的30 m分辨率全美土地覆蓋類型數據集(National Land Cover Database,NLCD)作為真實地物類型的參考[41]。考慮到NLCD數據與試驗數據時間間隔長達6年,與真實地物分布情況仍有差異,所以在訓練樣本和驗證樣本選擇過程中還參考了高分辨率GoogleEarth光學影像,以確保樣本獲取的質量。
地物類型的定義根據美國2011年NLCD數據[41],共劃分為7類:水體、濕地、灌木、草地、農田、高密度人工建筑及中低密度人工建筑。參照光學影像和NLCD數據隨機層析抽樣,每類地物各選取15個樣方作為訓練樣本(圖3(a)),檢驗樣本由每類10個樣本構成(圖3(b))。
本文使用IDAN濾波算法抑制噪聲[42-43],圖4(b)中仍存在大量噪聲,圖4(c)、(d)比較了使用正方形窗口和利用光學影像選取同質點兩種方法的平滑效果,窗口大小均為11×11。本文提出的方法能夠有效減少邊界模糊現象,部分地物邊緣得到加強。
圖2 研究區(qū)域地理位置Fig.2 Geographic location of study area and data set
圖3 訓練樣本和檢驗樣本(底圖為Sentinel-2A光學影像R、G、B:B4、B3、B2)Fig.3 Training sample and validation data(base map: Sentinel-2A optical image R,G,B:B4,B3,B2)
圖4 兩種方法平滑影像效果對比(VV)Fig.4 Comparison of images averaged using two methods (VV)
進一步分析本文方法對解譯地物屬性的影響。圖5為兩種不同方法所得極化參數。傳統方法所得結果無法保持地物邊緣,白色窗口內線狀地物甚至無法識別,本文提出的方法能夠有效避免這一現象。在保持地物邊界同時,由于減弱了異質點的影響,散射機制逐漸統一,隨機性得到抑制,因此極化參數H顯著降低。優(yōu)化輸入參數對分類結果的影響,將結合分類精度定量分析。
圖5 兩種方法提取極化參數對比Fig.5 Comparison of parameters extracted using two methods
由于試驗區(qū)范圍較大且地物形狀較為規(guī)則,經過多次試驗比較最終確定分割尺度參數為300,形狀因子和緊致度參數分別設為0.6和0.5。原始影像中含有1120萬個像素,經過影像分割后僅剩3853個對象,運算量大幅減少。局部分割結果如圖6所示,農田、人工建筑等地物均能被準確分割。
圖6 影像分割局部結果Fig.6 The results of segmentation at local scale
為確保各類要素在試驗數據中可分,對各類地物觀測值進行特征統計,其光譜特征與極化參數統計如圖7(a)—(d)所示??梢钥闯?,在光學影像中農作物、草地、灌木及濕地幾類自然植被波譜特征相近,與人工建筑和水體差異顯著;相反,幾類自然地物由于物理結構差異顯著因此通過后向散射系數與極化參數特征能夠輕易區(qū)分,而部分人工建筑與草地、濕地散射機制相似,以二次散射為主,僅通過SAR參數不易區(qū)分。這種光譜特征和散射機制差異說明單個傳感器不能將所有特征進行區(qū)分,而將兩者相結合,能夠增加特征對比度,進而提高分類精度。
為了獲取穩(wěn)定的分類結果,避免“維數災難”,本文選擇支持向量機分類器(support vector machine,SVM)[44-45],使用交叉檢驗優(yōu)化RBF核函數,懲罰因子C與核參數g分別為1和0.125,優(yōu)化精度為91%(圖8)。在分類之前采用Z轉換將所有特征進行歸一化處理,減小不同特征層數值范圍差異對分類精度的影響。
圖7 樣本觀測值特征統計Fig.7 Statistics of all classes samples
圖8 SVM參數優(yōu)化結果Fig.8 SVM parameter optimization
本文試驗結果分辨率為10 m,相比30 m分辨率NLCD數據,地物細節(jié)特征更加豐富,能夠準確識別尺寸較小及不連續(xù)分布的地物。NLCD數據與試驗影像獲取時間相隔6年,城市范圍擴張、植被面積減少等變化對比光學影像能夠明顯辨別。為強調本文分類方法的優(yōu)勢,選取紋理豐富的城市區(qū)域(圖9(a))和濕地區(qū)域(圖9(b))為測試區(qū)。
定性分析,在兩個子區(qū)域,面向對象的分類結果更加接近地物在光學影像中的分布,相比基于像素的分類結果,地物幾何特征更加規(guī)則。考慮輸入參數對分類結果的影響,從圖9中可以看出,兩種數據源所得結果并無明顯差異,僅有部分中低密度人工建筑和濕地分類存在分歧。對比光學影像,改進參數所得結果更加合理。這一現象可以歸因于影像分割時,已將同質像素合并作為整體分析,噪聲得到抑制,因此未能體現參數質量的重要性。對極化參數改進的優(yōu)勢在基于像素分類時得以展現,高密度人工建筑范圍估計更加準確;濕地區(qū)域內,草地和人工建筑誤分顯著降低,不規(guī)則形狀的灌木和濕地紋理信息得以保持。
定量分析,本文選擇制圖精度、用戶精度及Kappa系數作為評價指標,基于對象和像素的分類結果評定分別如表1、表2所示。
使用改進輸入參數的面向對象分類方法獲得最高總體精度92.6%。就分類方法而言:使用面向對象分類方法時,兩種輸入參數所得結果總體精度均提高8%左右。在各類地物中人工建筑和灌木紋理復雜,基于像素分類受異質性影響嚴重,因此兩類地物精度最低。影像分割后,減少了異質點的影響,對地物散射特性分析更加準確,因此分類精度在人工建筑和灌木區(qū)域精度提高更加顯著,這一趨勢與目視解譯結果相吻合,也體現了面向對象分類方法的優(yōu)勢。就數據源而言,如前分析,優(yōu)化輸入參數對面向對象分類精度沒有明顯改變,使用基于像素分類方法時,各地物分類精度均有所提高,在紋理豐富的城市和濕地區(qū)域,精度提高達到8%。
表1 基于對象分類方法精度評估
Tab.1 Assessment of classification accuracy obtained with two kinds of parameters using object-based classifier
類別傳統方法提取參數本文方法優(yōu)化參數制圖精度/(%)用戶精度/(%)制圖精度/(%)用戶精度/(%)高密度人工建筑10059.110069.1中低密度人工建筑84.710085.7100水體81.066.282.784.3農田10091.710093.6草地90.190.110090.8灌木88.010089.1100濕地79.210072.9100總體精度/(%)90.192.6Kappa系數0.890.91
表2 基于像素分類方法精度評估
Tab.2 Assessment of classification accuracy obtained with two kinds of parameters using pixel-based classifier
類別傳統方法提取參數本文方法優(yōu)化參數制圖精度/(%)用戶精度/(%)制圖精度/(%)用戶精度/(%)高密度人工建筑60.265.285.386.2中低密度人工建筑85.353.480.591.3水體64.367.585.270.0農田50.471.196.371.6草地90.790.386.196.4灌木50.280.950.690.7濕地70.410088.690.8總體精度/(%)79.886.6Kappa系數0.740.84
綜合各數據的分類結果及精度評價,可以看出,使用本文方法提取的輸入參數在紋理豐富區(qū)域優(yōu)勢顯著;面向對象SVM分類方法能夠有效區(qū)分離散分布的地物,提高分類的精度,保持地物幾何特性。利用此法,繪制的研究區(qū)整體土地覆蓋類型分布如圖10所示。
相干斑噪聲和有限的空間分辨率制約了合成孔徑雷達獲得可靠的地物分類結果。本文提出了一種利用光學影像優(yōu)化極化參數的面向對象分類方法,同時結合兩種數據源優(yōu)點改善分類效果。本文方法的優(yōu)勢在于:
圖9 不同輸入特征和不同分類方法組合的分類結果比較Fig.9 Land cover classification maps obtained with different input variables
圖10 使用改進參數的面向對象分類結果Fig.10 Object-based classification result using refined parameters
(1) 利用光學影像較高的光譜分辨率指導SAR影像選取同質像素,避免了噪聲的干擾,較傳統的正方形窗口,剔除異質點后極化參數估計更加準確,提高了對地物特性的分析能力。
(2) 結合極化特征和光譜信息,相似地物得以區(qū)分,彌補了光學和SAR影像各自的不足。同時利用光學影像分割結果,地物幾何特征得以保留,在紋理復雜的城市和濕地區(qū)域分類表現卓越。
使用Sentinel 1/2數據進行驗證,分類精度提高約10%,試驗結果展現出了Sentinel-1 SAR和Sentinel-2光學影像在大尺度范圍內土地覆蓋分類方面的巨大潛力。雖然本文方法能夠有效提高分類精度,保持地物邊緣信息,但僅使用了一個時相的數據,未結合時變的物候信息,因而造成部分農作物與其他地物誤分現象。結合多時相數據和多源數據,揭示地物在不同季節(jié)下的特性將成為今后的研究主題。
致謝:歐洲空間局通過哥白尼計劃提供Sentinel系列衛(wèi)星數據;美國地質調查局USGS提供全美土地類型數據