王 歡 張 超,2 鄖文聚 呂雅慧 尤淑撐 魏 海
(1.中國農(nóng)業(yè)大學(xué)土地科學(xué)與技術(shù)學(xué)院,北京 100083;2.自然資源部農(nóng)用地質(zhì)量與監(jiān)控重點實驗室,北京 100035;3.自然資源部國土整治中心,北京 100035;4.中國國土勘測規(guī)劃院,北京 100035)
快速、準(zhǔn)確地監(jiān)測濕地的狀況,探究不同類型濕地的空間分布與特征,對區(qū)域濕地資源管理、濕地資源保護以及國家生態(tài)文明建設(shè)具有重要意義[1-2]。2009年,原國家林業(yè)局組織了全國第二次濕地資源調(diào)查,但是缺少對濕地的類別屬性、空間分布情況的統(tǒng)計。相比野外實地調(diào)查,衛(wèi)星遙感技術(shù)具有大面積重復(fù)性觀測的特點,在濕地分類方面有獨特的優(yōu)勢,已廣泛應(yīng)用于濕地資源識別、調(diào)查監(jiān)測等研究中[3-5]。
利用多時相光學(xué)遙感數(shù)據(jù)獲取濕地信息是濕地遙感分類的重要方式[6-7]。文獻(xiàn)[8]利用時序MODIS數(shù)據(jù)提取洞庭湖大范圍濕地信息,表明多時相數(shù)據(jù)能更好地反映濕地等地物特征;文獻(xiàn)[9]基于多時相HJ-1衛(wèi)星數(shù)據(jù),利用多種屬性特征,較好地識別了界限模糊的濕地景觀;文獻(xiàn)[10]基于多時相SPOT-5衛(wèi)星數(shù)據(jù)重點對濕地植被類型進(jìn)行區(qū)分,取得了較好的效果。但利用多時相光學(xué)數(shù)據(jù)難以有效區(qū)分不同結(jié)構(gòu)植被覆蓋的濕地類型。合成孔徑雷達(dá)(Synthetic aperture radar, SAR)具有全天時、全天候工作和穿透性強的特點,利用極化SAR數(shù)據(jù)進(jìn)行濕地植被分類,能夠補充提高光學(xué)數(shù)據(jù)對植被冠層結(jié)構(gòu)識別的精度。文獻(xiàn)[11]利用光學(xué)和SAR數(shù)據(jù)在剛果盆地進(jìn)行濕地測繪;文獻(xiàn)[12]探索了不同數(shù)據(jù)對濕地分類準(zhǔn)確性的影響,表明C波段SAR數(shù)據(jù)對濕地分類有積極作用。另有研究表明,C波段SAR數(shù)據(jù)對低矮植被的穿透作用較強,尤其對高度1 m左右的草本植被識別比L波段SAR數(shù)據(jù)更合適[13-14]。
本文結(jié)合多時相光學(xué)數(shù)據(jù)與SAR數(shù)據(jù)的優(yōu)勢,基于不同濕地類型在光學(xué)特征、SAR極化特征上的差異,探索基于RF的時序優(yōu)選光學(xué)特征集和SAR數(shù)據(jù)極化特性分析相結(jié)合的濕地分類方法,以實現(xiàn)快速、準(zhǔn)確地獲取濕地的分布和面積,為濕地資源調(diào)查提供技術(shù)支撐。
以吉林省大安市的濕地分布區(qū)為研究區(qū),如圖1所示。大安市地處松嫩平原腹地,屬中溫帶季風(fēng)氣候,四季分明,位于44°57′~45°46′N,123°8′~124°22′E。擁有豐富的濕地資源,其中“一江兩河”(嫩江、洮兒河、霍林河)等水域占地面積約726 km2,還擁有嫩江灣國家濕地公園、牛心套保濕地公園、月亮湖、五間房水庫和查干湖等濕地聚集區(qū)。
圖1 研究區(qū)濕地分布
大安市的平水期在4月中下旬到5月下旬,豐水期在6月上旬到8月下旬,為充分體現(xiàn)大安市濕地復(fù)雜的生物環(huán)境及物候信息,本文選取2018年4—8月Level-1A級別的多時相GF1-WFV數(shù)據(jù),空間分辨率16 m,幅寬800 km;由于云層和植被結(jié)構(gòu)變化等因素對濕地分類的影響,且每年6月是蒲科、禾本科等濕地植被生長速度最快、株高等植被結(jié)構(gòu)變化最明顯的時期,選取6月的GF3-FSⅡ數(shù)據(jù),空間分辨率為10 m,幅寬100 km,包括HH和HV兩種極化方式。選用遙感數(shù)據(jù)參數(shù)如表1所示。
表1 遙感數(shù)據(jù)參數(shù)
由于GF1-WFV影像在成像過程中存在輻射失真、輻射誤差和幾何畸變,每期影像都需要進(jìn)行輻射校正、大氣校正和幾何校正處理。
強度和幅度特征是SAR影像最主要的特征,本文將GF3-FSⅡ數(shù)據(jù)經(jīng)復(fù)數(shù)據(jù)轉(zhuǎn)換為強度和幅度特征[15-16];相干斑噪聲會干擾SAR圖像的解譯,本文采用Forest濾波[15-16]進(jìn)一步抑制噪聲;SAR圖像中后向散射系數(shù)σdB的獲取,需根據(jù)預(yù)處理后的像元值計算獲得
σdB=10lgDN
(1)
式中DN——影像像元值
于2018年5月到研究區(qū)進(jìn)行實地調(diào)查,后期通過Google Earth平臺目視解譯,最終確定研究區(qū)內(nèi)典型濕地樣本。選擇283個訓(xùn)練樣本,其中內(nèi)陸灘涂17個、沼澤草地39個、湖泊水面14個、灌叢沼澤27個、河流水面11個、沼澤地62個、坑塘/水庫水面82個和水田31個。按照7∶3的比例隨機確定分類訓(xùn)練樣本和驗證樣本。
研究方法如圖2所示,首先將多時相GF1-WFV影像的光譜特征、植被指數(shù)和水體指數(shù)特征優(yōu)選后,采用RF方法進(jìn)行濕地分類,得到初步的濕地分類結(jié)果。以GF3-FSⅡ極化特征對沼澤草地、灌叢沼澤和沼澤地等濕地類型進(jìn)行進(jìn)一步識別。最后綜合兩者分類結(jié)果,得到最終的濕地分類結(jié)果。
圖2 研究方法框圖
根據(jù)《濕地公約》和其他相關(guān)資料[18-19],結(jié)合研究區(qū)的實際情況,建立表2所示的濕地分類體系。大安市濕地類型以天然濕地為主,具體分為河流水面、湖泊水面、內(nèi)陸灘涂、沼澤草地、灌叢沼澤和沼澤地,人工濕地主要為水田和坑塘/水庫水面。
表2 大安市濕地分類體系
內(nèi)陸灘涂和水面(湖泊、河流、坑塘/水庫),主要利用平水期和豐水期二者水位的差異進(jìn)行精確的劃分;坑塘水面和湖泊(河流)水面,藍(lán)波段反射強,區(qū)別明顯;水田主要種植水稻,在影像上表現(xiàn)為清晰的方塊狀,與其他濕地植被相比較容易區(qū)分。這幾類濕地采用多時相的GF1-WFV數(shù)據(jù),即可得到較好的分類效果。
沼澤草地和灌叢沼澤以禾本(莎草科)和蒲科植被等低矮植被為主,草科植被和蒲科植被在冠層結(jié)構(gòu)、群落組成上區(qū)別明顯;沼澤地和沼澤草地主要表現(xiàn)為生物量的差異。直接利用光學(xué)遙感數(shù)據(jù)的特征對上述濕地分離相對困難,C波段SAR數(shù)據(jù)更適合濕地草本、禾本植被分類[20]。極化SAR數(shù)據(jù)能夠更好地表征濕地景觀,特別是不同極化方式的雷達(dá)后向散射特征對濕地植被冠層結(jié)構(gòu)和生物量等植被的生理信息較為敏感[21]。因此,采用雙極化GF3數(shù)據(jù)對沼澤草地、灌叢沼澤和沼澤地進(jìn)行分類。
選取多時相GF1-WFV影像的4個波段反射率光譜特征、植被指數(shù)和水體指數(shù)構(gòu)建特征集。其中植被指數(shù)包括NDVI、EVI、RVI、DVI、GNDVI、TVI、SAVI、WDRVI;水體指數(shù)包括NDWI。
后向散射幅度特征(σFD)、后向散射強度特征(σQD)對不同植被的敏感性不同,在不同濕地植被類型分類上的性能也會略有差異。σFD對葉綠素濃度信息敏感性高[22],σQD對濕地植被冠層結(jié)構(gòu)和生物量信息敏感性高[23]。C波段HH極化較HV極化對土壤濕度更敏感、對水上植被的穿透性更強;而HV極化更適合地表比較粗糙(如樹木、農(nóng)作物等)區(qū)域的分類[24]。
極化比值圖像和極化差值圖像對植被分類有重要作用,本文在不同極化方式σFD-HH、σFD-HV、σQD-HH、σQD-HV基礎(chǔ)上,加入幅度和強度極化比值圖像(σFD-ratio=σFD-HH/σFD-HV、σQD-ratio=σQD-HH/σQD-HV)、極化差值圖像(σFD-diff=σFD-HH-σFD-HV、σQD-diff=σQD-HH-σQD-HV),探究不同極化特征對沼澤地、沼澤草地、灌叢沼澤的可分離程度。
選取RF算法進(jìn)行濕地分類,該方法對多類問題有明顯優(yōu)勢且分類結(jié)果相對穩(wěn)定,可有效應(yīng)對訓(xùn)練集中非平衡樣本的情況[25-26]。RF使用Boost strapping的方法來增強分類樹的多樣性,在建立每一棵決策樹的過程中,采樣與分裂規(guī)則判斷是兩個關(guān)鍵環(huán)節(jié),分裂規(guī)則遵守自上而下的遞歸分裂,每次分裂時,根據(jù)信息增益、基尼系數(shù)選擇最好的特征進(jìn)行分裂。決策樹的數(shù)量是RF分類的重要參數(shù),理論上決策樹的數(shù)量越多,分類準(zhǔn)確率越高,但時間成本也越高。
RF算法在特征選擇和降維方面也有很好的效果[27]。在RF的每棵樹中,大約有33%的樣本沒有參與決策樹的生成,這部分?jǐn)?shù)據(jù)被稱為這個樹的OOB(Out-of-bag)樣本。通過OOB樣本產(chǎn)生的袋外錯誤率(Out-of-bag error)不僅可以計算分類精度,還可以計算不同特征變量的重要性,通過依次對每個特征賦予一個隨機數(shù),觀察RF算法性能的變化度進(jìn)行特征賦分,分?jǐn)?shù)越大,特征重要性越高。因此,根據(jù)特征重要性排序優(yōu)選最佳特征組合。
選取用戶精度(UA)、制圖精度(PA)、總體精度及Kappa系數(shù)進(jìn)行精度評價。用戶精度是指從分類結(jié)果中任取一個隨機樣本,其所具有的類型與地面實際類型相同的條件概率;制圖精度是指相對于檢驗數(shù)據(jù)中的任意一個隨機樣本,分類圖上同一地點的分類結(jié)果與其相一致的條件概率。
選取研究區(qū)平水期和豐水期13期多時相GF-1 WFV影像,利用RF的OOB樣本對光譜特征、植被指數(shù)、水體指數(shù)等13個特征組成169個特征值集合進(jìn)行了重要性評分。特征值個數(shù)與總體精度和Kappa系數(shù)的關(guān)系如圖3所示,當(dāng)特征值個數(shù)達(dá)到50個時,分類精度和Kappa系數(shù)均達(dá)到最大值,因此將前50個特征值作為最佳特征參與分類。特征值重要性得分如圖4所示,其中標(biāo)簽名稱的含義為“指數(shù)名稱_影像日期”,如“B2_0519”代表2018年5月19日影像中提取到的B2波段信息;“NDVI_0425”代表2018年4月25日影像中提取到的NDVI信息。
圖3 特征值個數(shù)與總體精度和Kappa系數(shù)的關(guān)系
圖4 特征值重要性得分分布
大量實驗發(fā)現(xiàn),決策樹數(shù)量N≥150時,制圖精度和用戶精度趨于穩(wěn)定,因此選擇N=150作為后期實驗中RF分類器的決策樹個數(shù)。將優(yōu)選后的50個高重要性特征值輸入RF分類器進(jìn)行濕地分類,分類結(jié)果如圖5所示。經(jīng)驗證,總體分類精度為78.12%,Kappa系數(shù)為0.66,精度評價結(jié)果如表3所示。其中,湖泊水面、水田、內(nèi)陸灘涂的制圖精度和用戶精度均達(dá)到85%以上,分類效果較好;但沼澤地、沼澤草地、灌叢沼澤的制圖精度和用戶精度不足60%,表明多光譜影像不能很好地區(qū)分濕地植被。
圖5 特征優(yōu)選后多時相光學(xué)濕地分類結(jié)果
在多時相GF1-WFV分類的基礎(chǔ)上,加入濕地植被生長旺盛期的GF3-FSⅡ影像,進(jìn)一步對沼澤地、沼澤草地、灌叢沼澤進(jìn)行識別。對研究區(qū)這3類濕地的HH、HV、HH/HV和HH-HV極化方式的后向散射強度和幅度圖像進(jìn)行統(tǒng)計分析。如圖6所示,研究區(qū)主要濕地的后向散射幅度和強度特性在HH、HV極化下,都表現(xiàn)出明顯的差異性,而在HH/HV和HH-HV極化下差異不明顯。在HH極化下,灌叢沼澤和其他兩類(沼澤地、沼澤草地)的可分離度較好,在HV極化下,沼澤草地和沼澤地的可分離度好于HH極化,而灌叢沼澤和其他兩類的可分離度比HH極化差。
表3 特征優(yōu)選后多時相光譜混淆矩陣
圖6 雙極化SAR影像地類后向散射系數(shù)及頻數(shù)分布
因此,選取σFD-HH、σFD-HV、σQD-HH、σQD-HV4種極化特征對沼澤草地、灌叢沼澤和沼澤地進(jìn)行識別。
4種極化特征影像分別與原始C波段雙極化數(shù)據(jù),形成4個3波段的數(shù)據(jù),作為后向散射特征輸入RF分類器中,對比4種分類結(jié)果的總體精度與Kappa系數(shù)(圖7),得到HH極化特征精度最高,更適合植被覆蓋較多的濕地分類。
圖7 不同極化特征與分類精度和Kappa系數(shù)的關(guān)系
綜合3.2節(jié)中對湖泊水面、河流水面、內(nèi)陸灘涂、水田、坑塘/水庫水面的分類結(jié)果和對沼澤草地、灌叢沼澤、沼澤地的分類結(jié)果,得到最終濕地分類結(jié)果,如圖8所示。內(nèi)陸灘涂和灌叢沼澤分別分布于東北部和東部;沼澤地和沼澤草地分布較廣,以東南部為主;水田分布于整個研究區(qū)。
圖8 濕地分類圖
比較僅利用多時相GF1-WFV光學(xué)特征(簡稱“光學(xué)”)和利用光學(xué)特征結(jié)合GF3-FSⅡ極化特征(簡稱“光學(xué)+極化”)進(jìn)行沼澤草地、灌叢沼澤和沼澤地分類的兩種方法,如表4所示,得到以下結(jié)論:①“光學(xué)+極化”總體精度為86.23%,Kappa系數(shù)為0.82,比“光學(xué)”總體精度提高了8.11個百分點,Kappa系數(shù)提高了0.16。②加入GF3-FSⅡ極化特征后,所有地類的制圖和用戶精度均達(dá)到60%以上,特別是沼澤草地、灌叢沼澤和沼澤地的制圖精度提高了34.81、38.23和45.66個百分點,用戶精度提高了19.39、71.25和21.08個百分點,錯分和漏分現(xiàn)象得到很大改善。③“光學(xué)+極化”是在“光學(xué)”基礎(chǔ)上,通過對分類精度不理想的沼澤草地、灌叢沼澤和沼澤地重新分類對識別結(jié)果的進(jìn)一步優(yōu)化。
表4 濕地分類混淆矩陣
(1)針對濕地的植被覆蓋和時間變化特點,綜合利用多時相GF1-WFV光學(xué)遙感影像和GF3-FSⅡ雙極化SAR影像,研究了有效的濕地分類方法。利用平水期、豐水期4—8月的多時相GF1-WFV影像,利用RF的OOB樣本,通過特征重要性分析,從光譜特征、植被指數(shù)、水體指數(shù)3個維度,優(yōu)選50個特征值,構(gòu)建了多時相、多指數(shù)數(shù)據(jù)集,采用RF方法實現(xiàn)濕地的初步分類。
(2)在多時相GF1-WFV影像分類的基礎(chǔ)上,對分類精度不高的沼澤草地、沼澤地、灌叢沼澤等濕地,利用GF3-FSⅡ雙極化SAR影像進(jìn)行再分類,從強度和幅度進(jìn)行后向散射特性分析,選取σFD-HH特征采用RF進(jìn)行濕地類型識別。濕地分類的總體精度達(dá)86.23%,Kappa系數(shù)為0.82。
(3)綜合利用光學(xué)特征和SAR特征,可充分利用其互補性,研究光學(xué)特征和SAR特征的融合方法,最大化地保留光學(xué)影像豐富的地物信息、SAR影像的幾何形狀和結(jié)構(gòu)信息,可進(jìn)一步提高濕地分類精度。