陽(yáng)馳軼, 官海翔, 吳瑋, 劉美玉, 李穎, 蘇偉
( 1. 中國(guó)農(nóng)業(yè)大學(xué)土地科學(xué)與技術(shù)學(xué)院,北京 100083; 2. 農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)災(zāi)害遙感重點(diǎn)實(shí)驗(yàn)室,北京 100083; 3. 應(yīng)急管理部國(guó)家減災(zāi)中心,北京 100124; 4. 中國(guó)氣象局河南省農(nóng)業(yè)氣象保障與應(yīng)用技術(shù)重點(diǎn)開(kāi)放實(shí)驗(yàn)室,鄭州 450003; 5. 河南省氣象科學(xué)研究所,鄭州 450003)
洪澇災(zāi)害是最常見(jiàn)和最具毀滅性的自然災(zāi)害之一,往往造成嚴(yán)重的經(jīng)濟(jì)損失,威脅人類(lèi)生命安全,近年來(lái),洪澇更加頻繁地威脅著世界上許多地區(qū)[1]。在全球氣候變化背景下,極端氣候引發(fā)的自然災(zāi)害對(duì)我國(guó)農(nóng)業(yè)生產(chǎn)影響巨大[2]。洪澇災(zāi)害對(duì)農(nóng)作物產(chǎn)量影響較大,會(huì)造成土壤肥力流失、農(nóng)作物減產(chǎn),甚至死亡等一系列問(wèn)題。得益于遙感和計(jì)算機(jī)技術(shù)的快速發(fā)展,基于遙感影像的洪澇災(zāi)害監(jiān)測(cè)方法能夠克服傳統(tǒng)實(shí)地調(diào)查的不足,已成為快速、大范圍監(jiān)測(cè)洪澇災(zāi)害的重要手段[3]。
由于水體在近紅外波段的強(qiáng)烈吸收,以及植被的強(qiáng)烈反射,光學(xué)遙感數(shù)據(jù)被廣泛用于洪澇監(jiān)測(cè)。王國(guó)杰等[4]基于高分一號(hào)衛(wèi)星數(shù)據(jù),采用ResNet,VGG,DenseNet,HRNet這4種卷積神經(jīng)網(wǎng)絡(luò)方法提取地表水體信息,結(jié)果表明DenseNet在遙感水體識(shí)別領(lǐng)域有很好的應(yīng)用前景。劉宇晨等[5]利用哨兵二號(hào)(Sentinel-2)年內(nèi)長(zhǎng)時(shí)序影像,提出了一個(gè)結(jié)合像元時(shí)間特征的大尺度、長(zhǎng)時(shí)序的多指數(shù)組合的水體提取方法,完成了長(zhǎng)江流域的地表水體遙感提取。Shao等[6]基于風(fēng)云四號(hào)衛(wèi)星數(shù)據(jù)多時(shí)相合成影像,結(jié)合歸一化植被指數(shù)法和近紅外波段信息,對(duì)南亞?wèn)|北部流域的洪澇災(zāi)害進(jìn)行監(jiān)測(cè)。然而傳統(tǒng)的光學(xué)影像易受云霧、降水等天氣因素的強(qiáng)烈干擾,合成孔徑雷達(dá)(synthetic aperture radar,SAR)技術(shù)具有較強(qiáng)的穿透能力,不受云雨的干擾。開(kāi)闊水域的主要散射機(jī)制是鏡面散射,水的介電常數(shù)相對(duì)恒定,由此產(chǎn)生的能量很少能夠傳回傳感器,因此開(kāi)闊水域的后向散射系數(shù)通常很低,利用目視解譯或閾值法即可將其與非淹沒(méi)區(qū)區(qū)分開(kāi)來(lái)[7]; 然而,當(dāng)水淹沒(méi)在農(nóng)作物冠層以下時(shí),由于雙彈散射機(jī)制的影響,反射回衛(wèi)星的信號(hào)強(qiáng)度會(huì)增強(qiáng)[8]。在平靜的開(kāi)闊水域中,共極化(HH/HV)是被使用最廣泛的,因?yàn)樗芴峁┳罡叩膶?duì)比度[9]; 盡管交叉極化受作物莖葉的影響存在較強(qiáng)的去極化效應(yīng),但由于對(duì)體積散射敏感,因此對(duì)于監(jiān)測(cè)部分被淹沒(méi)的農(nóng)作物具有較高潛力。與單極化相比,使用雙極化來(lái)監(jiān)測(cè)洪澇農(nóng)田可以提高分類(lèi)精度[10]。高分三號(hào)衛(wèi)星(GF-3)是我國(guó)首顆有高分辨率、多成像模式、大成像幅寬的C頻段、多極化SAR衛(wèi)星,能夠全天候、全天時(shí)監(jiān)測(cè)全球海洋和陸地信息[11]。
目前基于SAR影像進(jìn)行農(nóng)田洪澇淹沒(méi)區(qū)提取的方法主要有閾值分割法、機(jī)器學(xué)習(xí)法、深度學(xué)習(xí)法等。郭山川等[12]在時(shí)序哨兵一號(hào)(Sentinel-1)A數(shù)據(jù)和GEE(Google Earth Engine)平臺(tái)支持下,結(jié)合閾值分割法,提出一種洪水動(dòng)態(tài)監(jiān)測(cè)方法以實(shí)現(xiàn)廣域尺度的洪水事件自動(dòng)檢測(cè)和淹沒(méi)過(guò)程動(dòng)態(tài)監(jiān)測(cè)。郁宗橋等[13]利用隨機(jī)森林(random forest,RF)指標(biāo)重要性評(píng)估功能,在提取的138個(gè)紋理特征中篩選出得分較高的紋理特征來(lái)提取水體。Nemni等[14]基于卷積神經(jīng)網(wǎng)絡(luò)方法,利用Sentinel-1 SAR影像數(shù)據(jù),使用半自動(dòng)技術(shù)和目視解譯訓(xùn)練模型,實(shí)現(xiàn)進(jìn)一步自動(dòng)化和提高洪水監(jiān)測(cè)速度。在這些方法中,閾值分割法利用了圖像的灰度特征,計(jì)算簡(jiǎn)單、效率高,但受作物生長(zhǎng)和洪水分布的空間異質(zhì)性影響,監(jiān)測(cè)結(jié)果往往會(huì)存在嚴(yán)重的“椒鹽”現(xiàn)象,對(duì)于圖像灰度差異較小的區(qū)域分割精度較低; 機(jī)器學(xué)習(xí)法具有較高的魯棒性,能夠捕捉到洪澇區(qū)域的時(shí)空差異和變化特征,但是需要依據(jù)先驗(yàn)知識(shí)預(yù)先選取分類(lèi)樣本,對(duì)樣本需求量大[15],可能出現(xiàn)過(guò)度擬合、迭代次數(shù)過(guò)多等問(wèn)題; 深度學(xué)習(xí)的基礎(chǔ)是神經(jīng)網(wǎng)絡(luò),能夠應(yīng)對(duì)具體場(chǎng)景建立模型,學(xué)習(xí)能力強(qiáng),適用范圍廣,但深度學(xué)習(xí)建立模型時(shí)也需有大量數(shù)據(jù)支撐、建立過(guò)程復(fù)雜,對(duì)硬件的要求較高,在數(shù)據(jù)不平衡、算法偏差的情況下可能出現(xiàn)“歧視”現(xiàn)象。
GMM基于高斯混合分布的假設(shè),能夠?qū)Σ煌?lèi)別地物間的復(fù)雜混合進(jìn)行概率估計(jì),適用于具有高空間異質(zhì)性的農(nóng)田環(huán)境; 其次GMM的計(jì)算復(fù)雜度相對(duì)較低,可在區(qū)域尺度上實(shí)現(xiàn)作物動(dòng)態(tài)快速監(jiān)測(cè)。然而,目前還沒(méi)有學(xué)者探討GMM在作物洪澇監(jiān)測(cè)中的適用性。針對(duì)閾值分割法可能出現(xiàn)的精度不高問(wèn)題,傳統(tǒng)的機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)法所需樣本標(biāo)記量大的問(wèn)題,本文基于雙極化GF-3雷達(dá)影像,構(gòu)建了一種弱監(jiān)督GMM的洪澇監(jiān)測(cè)方法來(lái)提取研究區(qū)農(nóng)田洪澇淹沒(méi)范圍。
本研究基于GMM的弱監(jiān)督分類(lèi)和RF、支持向量機(jī)(support vector machine,SVM)、K最近鄰(k-nearest neighbor,KNN)分類(lèi)、平行六面體分類(lèi)(parallelepiped classification,PC)的監(jiān)督分類(lèi)共5種機(jī)器學(xué)習(xí)方法,在“7·20”河南暴雨事件的背景下,應(yīng)用Sentinel-2影像目視解譯選取樣本集作為輸入,利用國(guó)產(chǎn)GF-3 SAR的HH,HV這2種極化方式的影像對(duì)豫北地區(qū)進(jìn)行農(nóng)田洪澇提取,對(duì)比農(nóng)田洪澇中2種極化方式的后向散射特征,分析評(píng)估不同方法的水體提取精度,為洪澇災(zāi)害的農(nóng)田水體提取提供參考,結(jié)果表明,構(gòu)建的GMM弱監(jiān)督分類(lèi)模型可以在少樣本的情況下提高農(nóng)田水體監(jiān)測(cè)精度。
研究區(qū)位于河南省北部,見(jiàn)圖1,地理坐標(biāo)E113°
(a) 研究區(qū)區(qū)位 (b) 研究區(qū)高程 (c) Sentine1-2影像
38′~114°43′,N35°36′~36°22′,覆蓋安陽(yáng)市、鶴壁市、新鄉(xiāng)市3個(gè)地級(jí)市,共包括18個(gè)市區(qū)縣,鄰近太行山,總體地勢(shì)西高東低,總面積為7 610 km2,溫帶大陸性季風(fēng)氣候,雨熱同期,全年10 ℃以上活動(dòng)積溫在4 000~5 000 ℃左右,年均降雨量580 mm,降水量在季節(jié)分配上極不均勻,與冬、夏季風(fēng)的進(jìn)退大致相同。研究區(qū)種植的主要農(nóng)作物是玉米、小麥,東部種植了很多花生,玉米和花生在五月左右播種,九月底左右收獲,小麥在十月中旬播種,次年五月底六月初收獲。
臺(tái)風(fēng)“煙花”于2021年7月中旬開(kāi)始影響中國(guó)的東部和中部地區(qū),7月21日開(kāi)始,強(qiáng)降雨北移,河南省北部洪澇災(zāi)害嚴(yán)重,其中受洪澇影響最嚴(yán)重的4個(gè)城市是鄭州市、洛陽(yáng)市、新鄉(xiāng)市和鶴壁市[16]。
本研究使用了基于Sentinel-2假彩色合成影像進(jìn)行人工目視解譯后得到的樣本點(diǎn)來(lái)訓(xùn)練和驗(yàn)證農(nóng)田洪澇淹沒(méi)范圍和未淹沒(méi)范圍。根據(jù)2021年8月對(duì)研究區(qū)進(jìn)行野外調(diào)查獲得的實(shí)測(cè)樣本點(diǎn),在 Sentinel-2假彩色合成影像中,可以看出水體呈現(xiàn)黑色,植被呈現(xiàn)紅色。水體呈現(xiàn)黑色是因?yàn)樗w在電磁波譜的近紅外波段有強(qiáng)烈吸收作用,植被呈現(xiàn)紅色是因?yàn)槠湓诮t外波段反射強(qiáng)烈[17]。根據(jù)此原理在Sentinel-2假彩色合成影像中選擇研究所需樣本點(diǎn),其中被淹農(nóng)田樣本來(lái)自完全和不完全淹沒(méi)的農(nóng)田區(qū)域,最終獲得被淹農(nóng)田樣本點(diǎn)和未被淹農(nóng)田樣本點(diǎn)各110個(gè),采用隨機(jī)抽樣方法選擇被淹農(nóng)田樣本點(diǎn)和未被淹農(nóng)田樣本點(diǎn)各40個(gè)作為驗(yàn)證樣本,剩余為訓(xùn)練樣本。
根據(jù)2021年7月15日—31日20時(shí)安陽(yáng)市、新鄉(xiāng)市、鶴壁市3個(gè)地級(jí)市和??h、淇縣2個(gè)縣的氣象站點(diǎn)監(jiān)測(cè)的降水量,見(jiàn)圖2。從圖2可以看出,總體上5地17和18日出現(xiàn)小規(guī)模降雨,大暴雨、特大暴雨從19日持續(xù)到23日,后逐漸消退,21日降雨量達(dá)到頂峰,5個(gè)觀測(cè)站中淇縣21日降雨量最大,超過(guò)350 mm。
(a) 安陽(yáng)市 (b) 新鄉(xiāng)市 (c) 鶴壁市 (d) ??h (e) 淇縣
1.2.1 數(shù)據(jù)源
本研究采用的研究數(shù)據(jù)包括國(guó)產(chǎn)GF-3 SAR數(shù)據(jù)、土地覆被類(lèi)型數(shù)據(jù)、Sentinel-2數(shù)據(jù)、降水?dāng)?shù)據(jù)。GF-3 SAR數(shù)據(jù)下載自中國(guó)資源衛(wèi)星應(yīng)用中心(https: //data.cresda.cn/#/2dMap),成像時(shí)間為洪澇發(fā)生后(2021年7月27日),10 m分辨率,條帶成像模式為精細(xì)條帶(FSII),L1A級(jí)產(chǎn)品,極化方式為雙極化的HH和HV?;赟entinel-1和Sentinel-2數(shù)據(jù)的10 m分辨率的2021年土地覆被類(lèi)型數(shù)據(jù)來(lái)源于歐空局(https: //developers.google.cn/earth-engine/datasets/catalog/ESA_WorldCover_v100)。Sentinel-2-Level-1C級(jí)產(chǎn)品數(shù)據(jù)獲取于歐空局,成像時(shí)間為2021年7月27日。降水?dāng)?shù)據(jù)來(lái)自氣象站點(diǎn)的監(jiān)測(cè)數(shù)據(jù),包括安陽(yáng)市、鶴壁市、新鄉(xiāng)市、??h、淇縣共5個(gè)觀測(cè)站,采集時(shí)間為2021年7月15日—31日的20時(shí)。
1.2.2 數(shù)據(jù)預(yù)處理
在PIE-SAR軟件中對(duì)GF-3影像進(jìn)行預(yù)處理,依次進(jìn)行復(fù)數(shù)據(jù)轉(zhuǎn)換、多視處理、濾波操作、地理編碼、DB轉(zhuǎn)換的操作。PIE-SAR軟件內(nèi)已做輻射定標(biāo)處理。幅度特征是SAR影像反映不同后向散射強(qiáng)弱的特征,幅度計(jì)算公式為:
,
(1)
式中:A為SAR影像中像點(diǎn)的幅度;r為SAR影像中像點(diǎn)復(fù)數(shù)中的實(shí)數(shù);i為虛數(shù)。
在本研究中,GF-3 SAR影像在方位向和距離向視數(shù)為3×3時(shí)被重采樣為10 m分辨率的規(guī)則網(wǎng)格。首先,基于3 m×3 m的濾波窗口,采用增強(qiáng)型Lee濾波(EnLee濾波)降低影像噪聲; 然后,利用外部的數(shù)字高程模型(digital elevation model,DEM)數(shù)據(jù)對(duì)GF-3 SAR影像的L1級(jí)產(chǎn)品數(shù)據(jù)進(jìn)行地形輻射校正,生成L2級(jí)地理編碼產(chǎn)品; 再進(jìn)行DB轉(zhuǎn)換輸出雷達(dá)后向散射系數(shù),獲得對(duì)應(yīng)地物絕對(duì)的后向散射值; 最后,利用土地覆被類(lèi)型數(shù)據(jù)作為掩模來(lái)剔除研究區(qū)內(nèi)非農(nóng)田的地物類(lèi)型,以獲得研究區(qū)范圍內(nèi)預(yù)處理完的SAR影像數(shù)據(jù)。
本研究首先將HH,HV極化的GF-3影像數(shù)據(jù)進(jìn)行預(yù)處理,獲得HH和HV通道的后向散射系數(shù); 然后,將訓(xùn)練樣本連同HH和HV極化的后向散射作為輸入,通過(guò)GMM的弱監(jiān)督分類(lèi)和RF,SVM,KNN,PC分類(lèi)的監(jiān)督分類(lèi)共5種分類(lèi)方法來(lái)提取研究區(qū)的農(nóng)田洪澇淹沒(méi)范圍; 最后基于驗(yàn)證樣本評(píng)價(jià)上述5種分類(lèi)方法的精度。技術(shù)流程見(jiàn)圖3。
圖3 技術(shù)流程
GMM采用若干個(gè)高斯分布的線性疊加來(lái)表示,將一個(gè)事物分解為若干個(gè)基于高斯概率密度函數(shù)形成的模型[18]。GMM在遙感領(lǐng)域主要應(yīng)用于遙感影像分割、遙感時(shí)序擬合等。樣本數(shù)據(jù)X為一維數(shù)據(jù)的高斯模型稱(chēng)為單高斯模型,遵從以下概率密度函數(shù):
(2)
式中:μ為數(shù)據(jù)的期望;σ為數(shù)據(jù)標(biāo)準(zhǔn)差。
GMM可以看作S個(gè)單高斯混合模型組合而成的模型,它的概率密度函數(shù)也可看成是S個(gè)服從均值為μi、方差為Σi的子成分的高斯分布的加權(quán)平均和,此時(shí)的樣本數(shù)據(jù)X= [X1,X2,…,Xm]T是m維數(shù)據(jù),x= [x1,x2,…,xm]T是X的一個(gè)實(shí)例,表達(dá)式如下:
,
(3)
式中:αi為各成分屬于第i個(gè)子模型的概率,滿足:
,
(4)
參數(shù)θ為每個(gè)子模型的期望、方差(或協(xié)方差)、在混合模型中發(fā)生的概率,公式為:
。
(5)
在本實(shí)驗(yàn)中需要分離被淹農(nóng)田與未被淹農(nóng)田,S設(shè)置為2,x是選取的訓(xùn)練樣本,子模型被分為屬于被淹農(nóng)田和未被淹農(nóng)田2類(lèi),所以GMM模型可以簡(jiǎn)化如下:
p(x|θ)=α1φ(x|θ1)+α2φ(x|θ2)
,
(6)
式中涉及到的參數(shù)α1,α2,μ1,μ2,Σ1,Σ2分別為訓(xùn)練樣本屬于子模型的概率、訓(xùn)練樣本的均值和方差。本研究采用EM算法迭代GMM參數(shù),每次迭代分為2步: E步,求期望E(Qji|X,θ),計(jì)算每一個(gè)數(shù)據(jù)j來(lái)自子模型i的概率,公式為:
,
(7)
式中:j= 1,2,…,140;i= 1,2。M步,求極大,計(jì)算新一輪迭代的模型參數(shù)αi,μi和Σi,公式為:
,
(8)
,
(9)
,
(10)
式中:i= 1,2,…,140,且在計(jì)算Σi時(shí),μi應(yīng)用此輪迭代更新后的值。重復(fù)計(jì)算E步和M步直至收斂,即滿足||θi+1-θi|| <ε,ε為一很小的正數(shù),可以任意小,此時(shí)認(rèn)為取到比較合理的模型參數(shù)。
1)RF。RF的基本原理是利用自助法(bootstrap)重采樣技術(shù),本研究中從原始訓(xùn)練樣本集R= {R(1),R(2),…,R(140)}中有放回的重復(fù)隨機(jī)抽取q個(gè)樣本R1,R2,…,Rq,再對(duì)這q個(gè)樣本分別建立決策樹(shù),這些決策樹(shù)構(gòu)成的集合組成RF,通過(guò)每棵決策樹(shù)對(duì)樣本的預(yù)測(cè)結(jié)果投票輸出最終農(nóng)田分類(lèi)結(jié)果。
2)SVM。SVM最早是由Vapnik[19]提出的一種二分類(lèi)模型,是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)方法,是在高維特征空間上間隔最大的線性分類(lèi)器,基本原理是求解能夠正確劃分訓(xùn)練數(shù)據(jù)集且集合間隔最大的分離超平面[20],得到最優(yōu)的分類(lèi)結(jié)果,適合少量樣本時(shí)進(jìn)行分類(lèi)。
3)KNN分類(lèi)。KNN最初是由Cover[21]提出的一種經(jīng)典的簡(jiǎn)易惰性學(xué)習(xí)方法,是最近鄰分類(lèi)的擴(kuò)展,在特征空間中的所有訓(xùn)練樣本N中尋找待分類(lèi)樣本附近的K個(gè)最近的樣本,再按照投票法等分類(lèi)決策規(guī)則把農(nóng)田分為被淹與未被淹的2類(lèi)。
4)PC。PC是一種傳統(tǒng)的監(jiān)督分類(lèi)方法[22],根據(jù)訓(xùn)練樣本的亮度值不同劃分成n維的平行六面體數(shù)據(jù)空間,規(guī)則由標(biāo)準(zhǔn)差閾值決定,待分類(lèi)波段像元的光譜值屬于任一訓(xùn)練樣本的范圍,則被劃分到對(duì)應(yīng)類(lèi)別。
為對(duì)比不同方法的精度,基于提取的農(nóng)田洪澇淹沒(méi)結(jié)果及驗(yàn)證樣本建立混淆矩陣,計(jì)算4種精度評(píng)價(jià)指標(biāo),包括總體精度(overall accuracy,OA)、Kappa系數(shù)、生產(chǎn)者精度(producer accuracy,PA)、用戶精度(user accuracy,UA),計(jì)算公式為:
,
(11)
,
(12)
,
(13)
,
(14)
式中:n為類(lèi)別,此研究中n=2;N為類(lèi)別個(gè)數(shù)的總和即總驗(yàn)證樣本個(gè)數(shù);xii為混淆矩陣對(duì)角線元素;xi+為類(lèi)別的列總和;x+i為類(lèi)別的行總和;x11為驗(yàn)證樣本中被標(biāo)記為被淹的農(nóng)田且結(jié)果中被提取為被淹的農(nóng)田的樣本;x12為驗(yàn)證樣本中被標(biāo)記為被淹的農(nóng)田且結(jié)果中被提取為未被淹的農(nóng)田的樣本;x21為驗(yàn)證樣本中被標(biāo)記為未被淹的農(nóng)田且結(jié)果中被提取為被淹的農(nóng)田的樣本;x22為驗(yàn)證樣本中被標(biāo)記為未被淹的農(nóng)田且結(jié)果中被提取為未被淹的農(nóng)田的樣本。
分別統(tǒng)計(jì)被淹農(nóng)田未被淹農(nóng)田樣本在HH和HV極化的后向散射特征,見(jiàn)圖4。從圖中可以看出,HV極化中被淹農(nóng)田與未被淹農(nóng)田的可分性高于HH極化,因?yàn)镠H極化對(duì)二次散射敏感,在洪澇場(chǎng)景下,僅有水位較高,且植被保持垂直結(jié)構(gòu)時(shí)才會(huì)構(gòu)成此類(lèi)散射機(jī)制。研究區(qū)農(nóng)田農(nóng)作物主要為玉米,由于此次洪澇較為嚴(yán)重,玉米大多被完全淹沒(méi),因此上述類(lèi)別的被淹玉米在研究區(qū)內(nèi)并不占據(jù)主導(dǎo); 而HV對(duì)于體積散射較為敏感,雖然被淹沒(méi)玉米區(qū)域以鏡面反射為主,但未被淹玉米的體積散射貢獻(xiàn)仍可作為區(qū)分其與被淹玉米的有效機(jī)制,這導(dǎo)致HV比HH具有更高的敏感性。
圖4 被淹農(nóng)田與未被淹農(nóng)田在HH、HV極化的后向散射系數(shù)
為對(duì)比機(jī)器學(xué)習(xí)方法的性能,選取4種場(chǎng)景,分別為建筑物稀疏區(qū)域的被淹農(nóng)田、建筑物密集區(qū)域的被淹農(nóng)田、以未被淹農(nóng)田為主的農(nóng)田區(qū)域、有河流存在的山區(qū),見(jiàn)圖5。對(duì)于完全被淹的農(nóng)田,其表面被鏡面反射主導(dǎo),導(dǎo)致低后向散射系數(shù),而建筑物密集區(qū)內(nèi)建筑物與開(kāi)闊水域之間的相互作用會(huì)產(chǎn)生二次散射,導(dǎo)致該地區(qū)SAR影像的后向散射系數(shù)上升。因此,影像中農(nóng)田與建筑物邊緣存在的亮斑,可能會(huì)干擾農(nóng)田洪澇識(shí)別; 此外,山區(qū)地形起伏較大,會(huì)使SAR影像產(chǎn)生幾何位移、頂?shù)椎怪煤途植啃巫兊仁д娆F(xiàn)象,因此通常需要額外的輔助數(shù)據(jù)或處理步驟消除。
圖5 Sentinel-2光學(xué)影像和分類(lèi)結(jié)果的局部圖
圖6為5種機(jī)器學(xué)習(xí)方法結(jié)果精度驗(yàn)證,根據(jù)圖6,GMM的OA為0.95,Kappa系數(shù)為0.90,OA和Kappa系數(shù)均最高。GMM(圖5(b))方法所得結(jié)果的斑點(diǎn)噪聲少于其他4種方法,被淹農(nóng)田空間分布連貫。GF-3影像中存在著很多小面積的被淹農(nóng)
圖6 5種機(jī)器學(xué)習(xí)方法結(jié)果精度驗(yàn)證
田像元與未被淹農(nóng)田像元亮度值接近的情況,這部分地物在分類(lèi)時(shí)容易被混淆,所以PC(圖5(d))分類(lèi)結(jié)果存在大量零星的斑點(diǎn)噪聲。RF(圖5(e))、SVM(圖5(f)) 把部分未被淹農(nóng)田、山體陰影誤分為被淹農(nóng)田,也有一些遺漏的被淹農(nóng)田,這類(lèi)農(nóng)田為輕度淹沒(méi),淹沒(méi)水位較低,絕大部分已下滲為地下水。在SVM分類(lèi)中,不同訓(xùn)練樣本被映射到不同的特征空間并用于構(gòu)建分類(lèi)超平面,然而,在某些情況下,SVM可能無(wú)法發(fā)現(xiàn)相應(yīng)的決策邊界,例如,部分未被淹農(nóng)田、山體陰影的特征與被淹農(nóng)田的反射特征區(qū)分度較小,這可能導(dǎo)致將其誤分為被淹農(nóng)田; KNN(圖5(c))、PC錯(cuò)分、漏分現(xiàn)象多且明顯,各類(lèi)精度指標(biāo)都較低(圖6),這些錯(cuò)分、漏分現(xiàn)象多與KNN、PC算法本身原理簡(jiǎn)單有關(guān)。其中KNN存在大量、小面積的錯(cuò)分現(xiàn)象和許多漏分現(xiàn)象,在非洪澇區(qū)把許多農(nóng)田誤分為被淹農(nóng)田,因?yàn)镵NN算法對(duì)樣本的依賴性高,往往需要大量訓(xùn)練樣本以保證運(yùn)行分類(lèi)算法時(shí)結(jié)果收斂,注重考慮像元領(lǐng)域間的空間關(guān)系,對(duì)于小面積、破碎的洪澇區(qū)域敏感度低。
圖7為Sentinel-2光學(xué)影像和5種機(jī)器學(xué)習(xí)方法的農(nóng)田洪澇淹沒(méi)全局圖,總體來(lái)看,研究區(qū)西北部山地較多,被淹沒(méi)相對(duì)較少,被淹農(nóng)田主要集中在研究區(qū)的中部和北部,大部分在蓄滯洪區(qū),此次河南省暴雨的國(guó)家蓄滯洪區(qū)共有9處,涉及安陽(yáng)市、鶴壁市、新鄉(xiāng)市的湯陰縣、內(nèi)黃縣、安陽(yáng)縣、??h、淇縣、衛(wèi)輝市等6個(gè)市區(qū)縣。河流距離對(duì)洪澇發(fā)生有顯著影響,距離河流越近,越容易發(fā)生洪澇,尤其是大江大河沿岸地區(qū)[23],研究區(qū)屬于衛(wèi)河流域,是此次暴雨事件重災(zāi)區(qū),衛(wèi)河流經(jīng)研究區(qū)的新鄉(xiāng)縣、淇縣、浚縣、湯陰縣,河流很多地方流水湍急,洪澇發(fā)生時(shí)淹沒(méi)影響較大,中下游洼地多,部分被擴(kuò)建為正式行洪、滯洪區(qū),安陽(yáng)地區(qū)和湯陰縣有大型水庫(kù)可一定程度上減緩洪澇影響。安陽(yáng)市南部有鄭莊山,北部有靈壽山,山地較多,相比鶴壁市和新鄉(xiāng)市,高程值較大,因此洪澇淹沒(méi)情況也較輕。
(a) Sentinel-2光學(xué)影像 (b) GMM(c) KNN
GMM估計(jì)的各市區(qū)縣的被淹農(nóng)田面積見(jiàn)表1,被淹農(nóng)田總面積為398 km2,占研究區(qū)農(nóng)田總面積的9.44%,農(nóng)田淹沒(méi)最嚴(yán)重的3個(gè)地區(qū)是牧野區(qū)、鳳泉區(qū)和衛(wèi)輝市,3個(gè)地區(qū)都地處新鄉(xiāng)市內(nèi),其中衛(wèi)輝市農(nóng)田洪澇淹沒(méi)面積最大,有100.13 km2,而安陽(yáng)市總體淹沒(méi)水平相比其他2市較低,GMM分類(lèi)結(jié)果與實(shí)際農(nóng)田受災(zāi)情況基本相符。
表1 各市區(qū)縣農(nóng)田洪澇淹沒(méi)面積
對(duì)于不同場(chǎng)景,SAR影像提取洪澇作物的能力可能會(huì)受到不同因素的影響。在以農(nóng)作物為主的耕作區(qū),建筑物與開(kāi)闊水域之間的二次散射和影像中的亮斑都會(huì)影響洪澇的提取; 此外,建筑物產(chǎn)生的陰影可能會(huì)被誤認(rèn)為是水體,從而導(dǎo)致洪澇范圍的過(guò)度監(jiān)測(cè)。
由于SAR傳感器的側(cè)式幾何結(jié)構(gòu),地物可能會(huì)因?yàn)槌鞘薪ㄖ洼^高大的植被等自然特征的相對(duì)位置而被錯(cuò)分。而雷達(dá)陰影的產(chǎn)生是由于相鄰建筑物的位置和SAR傳感器的側(cè)式幾何結(jié)構(gòu),雷達(dá)波束無(wú)法照射到表面,導(dǎo)致這些區(qū)域在影像上看起來(lái)很暗,在干燥的情況下卻被誤分類(lèi)為洪澇區(qū),造成洪澇的過(guò)度監(jiān)測(cè)。
與平原地區(qū)相比,山地和丘陵地區(qū)的地形更加復(fù)雜,地勢(shì)凹凸不平。這使得洪澇覆蓋的地表形態(tài)更加多樣和復(fù)雜,雷達(dá)回波對(duì)不同斜率和高程的地形反射效果不同,導(dǎo)致SAR影像中洪澇區(qū)的后向散射信號(hào)強(qiáng)度的高度空間異質(zhì)性[24]。
在實(shí)際應(yīng)用中,需要結(jié)合多種數(shù)據(jù)和方法,如遙感影像、地理信息系統(tǒng)、氣象數(shù)據(jù)等進(jìn)行不同場(chǎng)景的數(shù)據(jù)處理和分析,消除干擾因素,提高農(nóng)田洪澇識(shí)別的精度和可靠性。
4.2.1 監(jiān)督分類(lèi)方法在農(nóng)田洪澇提取上的優(yōu)缺點(diǎn)
本研究利用GF-3 SAR影像HH和HV 2種極化方式的數(shù)據(jù),建立弱監(jiān)督GMM分類(lèi),與其他4種機(jī)器學(xué)習(xí)方法(RF,SVM,KNN,PC)對(duì)比,結(jié)果表明GMM分類(lèi)結(jié)果的精度最高,對(duì)比其余4種機(jī)器學(xué)習(xí)方法在農(nóng)田洪澇提取的優(yōu)缺點(diǎn)如下:
1)RF能夠有效緩解決策樹(shù)模型的過(guò)擬合問(wèn)題,能輸出特征重要程度,減少冗余信息對(duì)分類(lèi)結(jié)果的影響。但是它的訓(xùn)練速度比較慢,對(duì)于非線性結(jié)果計(jì)算量會(huì)增大,且容易受到SAR斑點(diǎn)噪聲的影響。
2)SVM在處理小樣本數(shù)據(jù)時(shí)具有較好的適應(yīng)性和泛化性,處理高維度數(shù)據(jù)時(shí)表現(xiàn)較好,因而適用于處理多維遙感數(shù)據(jù)。由于SVM需要進(jìn)行數(shù)據(jù)預(yù)處理和特征選擇,并且隨著范圍的增大,計(jì)算量也增大,因而不適用于實(shí)時(shí)提取被淹農(nóng)田。
3)KNN可以處理非線性特征,對(duì)于決策邊界分布不規(guī)則的情況有較好的適應(yīng)性,且不需要預(yù)先訓(xùn)練模型,可直接應(yīng)用于實(shí)際的農(nóng)田洪澇場(chǎng)景。然而KNN對(duì)于噪聲和異常值較為敏感,需要對(duì)K值合理設(shè)定,增加了人工干預(yù)過(guò)程。
4)PC使用閾值分類(lèi),是一種基于閾值分割的方法,閾值選擇影響分類(lèi)結(jié)果的準(zhǔn)確性,分類(lèi)精度相對(duì)復(fù)雜模型較低,對(duì)于特征較少的數(shù)據(jù)分類(lèi)不佳,在使用多光譜遙感數(shù)據(jù)進(jìn)行被淹農(nóng)田提取時(shí),PC可能會(huì)受到植被遮擋和陰影的影響。
4.2.2 GMM在農(nóng)田洪澇提取上的優(yōu)缺點(diǎn)
GMM方法可以有效解決其他機(jī)器學(xué)習(xí)方法遇到的樣本量小、樣本分布不均、斑點(diǎn)噪聲等問(wèn)題,它在農(nóng)田洪澇提取的優(yōu)點(diǎn)如下:
1)GMM屬于軟分類(lèi)模型的范疇,可以給出每個(gè)像素被分類(lèi)為被淹農(nóng)田的概率,因此可以估計(jì)混合像素中淹沒(méi)作物的比例。
2)GMM處理偏態(tài)數(shù)據(jù)能力強(qiáng),在實(shí)際中,被淹農(nóng)田的分布并不均勻,所以可能出現(xiàn)數(shù)據(jù)偏態(tài)分布情況,GMM可以擬合各種分布可能,從而更好地適應(yīng)這些數(shù)據(jù)。GMM使用不同的協(xié)方差矩陣來(lái)表示不同方向上的方差,可更好地適應(yīng)各向異性的數(shù)據(jù)的形狀差異。
3)GMM支持多模態(tài)特征識(shí)別,可以對(duì)SAR影像中的幾何、紋理和強(qiáng)度等多模態(tài)特征進(jìn)行檢測(cè)和分類(lèi),提高分類(lèi)精度。
但是在本研究中仍然發(fā)現(xiàn)了一些GMM的不足:
1)GMM對(duì)初始值很敏感,如果訓(xùn)練樣本選取不當(dāng),可能使EM算法求出的解收斂到局部最優(yōu),而不是全局最優(yōu)。
2)本研究采用的GMM模型需要預(yù)先確定混合高斯子分量個(gè)數(shù),并且隨著高斯成分個(gè)數(shù)的增加,算法擬合數(shù)據(jù)能力增強(qiáng),模型變復(fù)雜,可能出現(xiàn)大量冗余參數(shù)。未來(lái)可以采用適當(dāng)?shù)脑u(píng)價(jià)準(zhǔn)則來(lái)輔助判斷選取的混合高斯子分量的數(shù)目。
本文運(yùn)用國(guó)產(chǎn)GF-3 SAR衛(wèi)星數(shù)據(jù),對(duì)比分析GMM,RF,SVM,KNN,PC共5種機(jī)器學(xué)習(xí)方法,對(duì)研究區(qū)農(nóng)田洪澇災(zāi)害進(jìn)行監(jiān)測(cè),得到結(jié)論如下:
1)在農(nóng)田洪澇災(zāi)害場(chǎng)景中,基于鏡面反射的主導(dǎo)機(jī)制,HV極化比HH極化敏感,更適用于提取被淹農(nóng)田。
2)有高分辨率和敏感性能的國(guó)產(chǎn)GF-3 SAR衛(wèi)星在暴雨天農(nóng)田洪澇實(shí)時(shí)提取中體現(xiàn)較大優(yōu)勢(shì),準(zhǔn)確性和魯棒性得到了保障。
3)在相同的少量訓(xùn)練樣本前提下,對(duì)比其他機(jī)器學(xué)習(xí)方法(RF,SVM,KNN,PC),本研究使用的GMM弱監(jiān)督分類(lèi)來(lái)提取農(nóng)田洪澇淹沒(méi)范圍時(shí)表現(xiàn)最優(yōu),OA為0.95,Kappa系數(shù)為0.90。
在未來(lái)的研究中,可以考慮以下方面的改進(jìn):
1)結(jié)合高分辨率的SAR影像數(shù)據(jù)和地理信息系統(tǒng)數(shù)據(jù),提供更準(zhǔn)確全面的農(nóng)田洪澇災(zāi)害監(jiān)測(cè)信息,進(jìn)一步提高分類(lèi)精度和穩(wěn)定性。建立統(tǒng)一的數(shù)據(jù)采集和處理流程標(biāo)準(zhǔn),提高數(shù)據(jù)質(zhì)量和結(jié)果的可靠性。
2)改善模型參數(shù)的選擇和調(diào)整方式,自動(dòng)選取最優(yōu)的模型參數(shù),保證在簡(jiǎn)化人為干擾模型的前提下進(jìn)一步提高被淹農(nóng)田提取精度。
3)深入研究基于低洼田、山地田和平原田等不同場(chǎng)景的農(nóng)田洪澇淹沒(méi)提取,增強(qiáng)模型在具體實(shí)際中的適應(yīng)性。