沈吉寶
(甘肅省測(cè)繪工程院,甘肅 蘭州 730050)
水體分布信息的準(zhǔn)確獲取在水資源調(diào)查、流域綜合治理、水利規(guī)劃、洪水監(jiān)測(cè)與災(zāi)害評(píng)估等領(lǐng)域具有重要意義[1]。遙感影像具有直觀明了、宏觀性強(qiáng)的特點(diǎn),能清楚地反映出區(qū)域或者整個(gè)流域的水體空間分布情況,利用遙感技術(shù)提取水體信息已成為一種趨勢(shì)。
現(xiàn)有的遙感影像水體提取方法通常采用基于監(jiān)督分類的方法,該類方法依據(jù)水陸對(duì)近/中紅外波段敏感,采用統(tǒng)計(jì)閾值的方法來(lái)提取水體信息,原理簡(jiǎn)單容易實(shí)現(xiàn),但漏提狹小的水體且對(duì)陰影區(qū)域敏感?;蚴抢枚嗖ǘ斡跋裥畔?,通過(guò)計(jì)算各個(gè)波段影像間的綜合關(guān)系提取水體,可以分為水體指數(shù)法和譜間關(guān)系法。駱劍承等以Landsat為數(shù)據(jù)源,在歸一化差異水體指數(shù)法基礎(chǔ)上,采用分步迭代的空間轉(zhuǎn)換機(jī)制可初步實(shí)現(xiàn)湖泊水體信息的自動(dòng)提取[2]。楊樹(shù)文等基于TM影像多波段特性,對(duì)多波段譜間關(guān)系法進(jìn)行改進(jìn),用于提取山區(qū)細(xì)小水體[3]。沈金祥等采用面向?qū)ο蟮膱D像分析方法提取出山區(qū)湖泊TM圖像的水體信息[4]。胡衛(wèi)國(guó)等利用歸一化差異水體指數(shù)和歸一化差分植被指數(shù)對(duì)資源一號(hào)02C星影像進(jìn)行適用性研究,提出了更適合資源一號(hào)02C星影像的決策樹(shù)水體信息提取方法[5]。隨著影像空間分辨率的不斷提高,水體空間分布情況、衛(wèi)星影像分辨率及波段對(duì)水體提取方法的選擇有不同的需求。城市內(nèi)的高層建筑、橋梁、樹(shù)木等的陰影現(xiàn)象較普遍,對(duì)水體信息提取造成干擾,并且城市河道水體一般較窄,從中、低分辨率衛(wèi)星遙感影像中較難識(shí)別[6]。陳愛(ài)軍等利用模糊C均值算法對(duì)影像進(jìn)行初始分類,然后通過(guò)最小鄰近聚類方法對(duì)分類結(jié)果進(jìn)行優(yōu)化,剔除虛假水體信息,實(shí)現(xiàn)水體信息的快速提取,但該方法提取水體邊界不清楚[7]。于曉升等利用機(jī)器學(xué)習(xí)與測(cè)地線活動(dòng)輪廓結(jié)合的方法提取水體邊界信息,能有效地避免水體邊界提取不清晰問(wèn)題,但算法的粗提取效果依然存在一定的問(wèn)題[8]。隨著近年來(lái)機(jī)器學(xué)習(xí)分類器算法不斷提出,分類準(zhǔn)確率得到提高[9],但分類精度還存在提升空間。
為此,針對(duì)高分辨率遙感影像河流識(shí)別率較低問(wèn)題,為了充分挖掘多種特征融合的優(yōu)勢(shì),本文提出利用水體指數(shù)、陰影水體指數(shù)、LBP局部紋理特征以及顏色特征融合的遙感影像水體提取方法。對(duì)提取的影像特征利用機(jī)器學(xué)習(xí)分類器進(jìn)行學(xué)習(xí)與識(shí)別,針對(duì)粗分類結(jié)果存在一定誤檢問(wèn)題,提出多判據(jù)軟投票方法剔除錯(cuò)誤檢測(cè),提高遙感影像水體提取的召回率、精確率和準(zhǔn)確率。
水體對(duì)入射能量具有強(qiáng)吸收性,在大部分遙感傳感器的波長(zhǎng)范圍內(nèi),總體上呈現(xiàn)較弱的反射率,并具有隨著波長(zhǎng)的增加進(jìn)一步減弱的趨勢(shì)。具體表現(xiàn)為在可見(jiàn)光的波長(zhǎng)范圍里(480~580 nm),其反射率約為4%~5%,但到了580 nm處,則下降為2%~3%;當(dāng)波長(zhǎng)大于740 nm時(shí),幾乎所有入射純水體的能量均被吸收。由于水體在近紅外及隨后的中紅外波段范圍內(nèi)(740~2 500 nm)所具有的強(qiáng)吸收特點(diǎn),導(dǎo)致清澈水在這一波長(zhǎng)范圍內(nèi)幾乎無(wú)反射率。因此,這一波長(zhǎng)范圍常被用來(lái)研究水陸分界、圈定水體范圍。但是隨著水體渾濁度(各種有機(jī)、無(wú)機(jī)物質(zhì)濃度)的增加,水體的反射率會(huì)有所變化。如水體泥沙含量的增加會(huì)導(dǎo)致反射率的提高,并使光譜曲線的反射峰往長(zhǎng)波方向移動(dòng)。在遙感多光譜影像上水體的紋理一般比較均勻、平滑,并在一定空間范圍內(nèi)趨于平緩;水體形狀不一,但與周邊地表覆蓋類型光譜差異較大。城市中的湖泊、河流如果為正常水體,其在真彩色影像中展示的色彩為墨綠和綠色,在彩紅外影像中展示為黑色或藍(lán)黑色,通過(guò)目視判別,較易與其它地物進(jìn)行區(qū)分。
歸一化差異水體指數(shù)(NDWI)是依據(jù)水體信息在綠光波段及近紅外波段具有較強(qiáng)反射和吸收的特性,將二者的差及和做比值運(yùn)算,從而達(dá)到增強(qiáng)水體信息、抑制背景地物的效果,有效提取水體信息?;诙喙庾V影像數(shù)據(jù)的水體提取模型如下:
NDWI=(b2-b4)/(b2+b4)
(1)
式中,b2和b4分別為遙感影像的綠波段及近紅外波段的輻射亮度值。理論上可選取NDWI閾值為0,將水體信息與其它地物區(qū)分開(kāi)來(lái),但實(shí)際中應(yīng)根據(jù)采用的具體影像及研究區(qū)域選取合適的閾值。
基于上述水體指數(shù)提取出的水體信息結(jié)果往往摻雜城市建筑物、樹(shù)木等陰影,因此需要將陰影從提取出的暗區(qū)中分離出來(lái)。根據(jù)4個(gè)多波段光譜特征,構(gòu)建陰影水體指數(shù)(Shadow Water Index,SWI):
SWI=b1+b2-b4
(2)
式中,SWI為陰影水體指數(shù);b1、b2、b4分別為遙感影像的綠、藍(lán)和近紅外波段。
遙感影像上水體區(qū)域的紋理比較單一、變化較小,具有一定的旋轉(zhuǎn)不變性,并具有較強(qiáng)的噪聲抵抗能力。而非水體地物影像變化較大,局部表面紋理信息比較豐富。采用紋理特征能有效地表達(dá)水體信息,由于LBP紋理具有良好的方向選擇性與空間局部特性,可以對(duì)遙感影像進(jìn)行不同尺度上局部特征提取,同時(shí)LBP局部紋理特征對(duì)光照強(qiáng)弱變換不敏感[10],對(duì)影像變形與旋轉(zhuǎn)具有一定的不變性[11]。因此,本文采用LBP算法提取影像的紋理特征。原始LBP算子以局部3×3窗口中心像素值為局部閾值,將相鄰區(qū)域的像素值與中心像素值比較,若中心像素值大于相鄰像素值,則將該位置標(biāo)記為0,否則為1。最終獲取一個(gè)8位的二進(jìn)制數(shù),將二進(jìn)制數(shù)轉(zhuǎn)10位即為該中心像素的LBP局部紋理值,該值可以有效地表達(dá)該區(qū)域的紋理信息,用于提取影像的LBP紋理特征,如圖1所示。
圖1 LBP紋理特征計(jì)算示意圖
遙感影像的顏色信息包含大量的穩(wěn)健性強(qiáng)的特征,在同一軌道高度空間獲取的遙感影像水體區(qū)域的顏色一般呈現(xiàn)偏黃或偏綠的現(xiàn)象。因此,在顏色空間存在較強(qiáng)的規(guī)律,可以提取顏色空間的顏色方差與均值作為顏色空間的特征值。假設(shè)n為待檢測(cè)區(qū)域的像素個(gè)數(shù),i為影像的波段號(hào)(藍(lán)、綠、紅、近紅外波段),p(i,j)為待提取影像區(qū)域中第i波段第j個(gè)像素的像素值。因此,第i波段的像素均值表示為:
(3)
(4)
遙感影像數(shù)據(jù)中無(wú)論是水體指數(shù)、陰影水體指數(shù)、LBP局部紋理還是顏色等單一特征都不能有效地區(qū)分水體與非水體地物,給水體提取帶來(lái)困難。鑒于此,本文通過(guò)對(duì)遙感影像的水體指數(shù)、陰影水體指數(shù)、LBP紋理特征以及顏色特征進(jìn)行學(xué)習(xí),提取多種特征進(jìn)行融合充分挖掘遙感影像信息,進(jìn)而提高遙感影像水體提取方法的性能。
利用上述方法提取多種特征的數(shù)據(jù)分別具有不同的數(shù)據(jù)級(jí),避免某一類特征在分類過(guò)程影響其他特征有效表達(dá),對(duì)不同的特征數(shù)據(jù)進(jìn)行歸一化處理。將所有的特征數(shù)據(jù)變換到同一尺度下,首先提取該特征的最大、最小值并將數(shù)據(jù)映射到0~1之間。假設(shè)x為某一特征的特征向量,xi為某一特征的特征值,max(x)表示特征向量x的最大值,min(x)表示特征向量x的最小值,yi為歸一化后的特征值,則:
yi=(xi-min(x))/(max(x)-min(x))
(5)
用于提取水體的特征由水體指數(shù)、陰影水體指數(shù)、LBP局部紋理和顏色特征組成,采用特征值串聯(lián)的方式將多種不同類型的特征進(jìn)行特征融合。則每張遙感影像生成特征影像具有的總維數(shù)為:1+1+1+2=5。
水體邊界提取可以歸屬于影像二分類問(wèn)題,目前常用的分類器為支持向量機(jī)(support SVM)分類器、隨機(jī)森林(RF)分類器、AdaBoost集成分類器以及極限學(xué)習(xí)機(jī)等常用的分類器等。文章從提取多種不同特征出發(fā),采用多種分類器進(jìn)行實(shí)驗(yàn)對(duì)比分析,最終選擇分類效果最佳的極限學(xué)習(xí)機(jī)作為分類器。實(shí)驗(yàn)環(huán)境為Windows 7 CoreTM i7-7820X,顯卡為麗臺(tái)Quadro P5000(NVID公司,美國(guó))。利用MATLAB環(huán)境運(yùn)行,SVM分類器選用LibSVM庫(kù)提供的CSVM模型,核函數(shù)參數(shù)Gamma取值為0.07,懲罰因子c取值為2。隨機(jī)森林分類器選用MATLAB機(jī)器學(xué)習(xí)庫(kù),其中樹(shù)的結(jié)構(gòu)數(shù)選用100。
文中提取水體指數(shù)、陰影水體指數(shù)、LBP局部紋理特征以及顏色特征,為了充分挖掘多特征組合的優(yōu)勢(shì),探討適合融合特征的分類器,分別采用SVM、RF、AdaBoost以及極限學(xué)習(xí)機(jī)分類器對(duì)提取的融合特征進(jìn)行訓(xùn)練與分類實(shí)驗(yàn),不同分類器水體粗檢測(cè)結(jié)果如表1所示。從表1可以看出,極限學(xué)習(xí)機(jī)分類方法對(duì)本文選取的多種特征的適應(yīng)性優(yōu)于其他分類器。
表1 不同分類器水體提取精度驗(yàn)證
利用機(jī)器學(xué)習(xí)機(jī)分類器對(duì)整幅遙感影像上的每個(gè)對(duì)象進(jìn)行檢測(cè),判斷影像對(duì)象是否屬于水體區(qū)域。初始檢測(cè)的結(jié)果存在一定的誤檢測(cè)的結(jié)果,包括非水體區(qū)域的誤檢測(cè)對(duì)象、水體區(qū)域的誤檢測(cè)對(duì)象。因此,需要對(duì)初始檢測(cè)結(jié)果進(jìn)行優(yōu)化處理,剔除錯(cuò)誤的檢測(cè)結(jié)果,提高整體檢測(cè)正確率。本文利用非水體對(duì)象與水體對(duì)象的RGB顏色空間距離、LBP紋理相似程度以及角點(diǎn)分布差異剔除誤匹配對(duì)象。
(1)顏色空間判斷依據(jù)
(6)
表示待檢測(cè)對(duì)象與水體區(qū)域顏色空間的歐式距離。若該對(duì)象為非水體對(duì)象,則其在顏色空間與水體對(duì)象的距離較大,因此采用指數(shù)函數(shù)PRGB作為判斷水體的依據(jù):
PRGB=10DRGB,q
(7)
(2)LBP紋理相似程度
依據(jù)文章1.3部分介紹的LBP紋理提取方法,計(jì)算該對(duì)象各個(gè)波段的紋理特征值向量mLBP,q,為避免噪聲影響對(duì)于大區(qū)域的對(duì)象采用同顏色空間處理一致的策略,計(jì)算紋理均值mLBP, 在紋理特征空間中計(jì)算待檢測(cè)對(duì)象與水體對(duì)象間的距離DLBP,q=|mLBP,q-mLBP|,從而可以計(jì)算待檢測(cè)對(duì)象與水體對(duì)象在紋理特征空間的相似程度:PLBP=10DLBP,q。
(3)角點(diǎn)分布差異依據(jù)
在遙感影像上水體區(qū)域相對(duì)比較平坦,復(fù)雜物體的邊緣以及角點(diǎn)特征數(shù)量都比較少,而非水體區(qū)域存在大量的角點(diǎn)與邊緣線。本文利用MinEigen算子提取遙感影像上角點(diǎn)特征,并計(jì)算影像對(duì)象上對(duì)應(yīng)角點(diǎn)數(shù)量。利用影像對(duì)象上存在的角點(diǎn)總數(shù)N與像素總數(shù)S的比值作為判斷角點(diǎn)分布差異性指標(biāo),即mcorner,q=N/S,在面積較大的水體對(duì)象上同樣取5個(gè)面積相同的子區(qū)域計(jì)算均值mcorner,計(jì)算角點(diǎn)分布差異Dc,q和相應(yīng)角點(diǎn)分布判斷依據(jù)Pc為:
Dc,q=|mcorner,q-mcorner|
(8)
Pc=10Dc,q
(9)
若Pc (4)投票決策 綜合上述判斷準(zhǔn)則,依據(jù)軟投票的思想決策待檢測(cè)對(duì)象是否為水體區(qū)域,待定對(duì)象的最終決策函數(shù)為: P=PLBP+PRGB (10) 將投票值C 實(shí)驗(yàn)采用的訓(xùn)練數(shù)據(jù)集為武漢大學(xué)發(fā)布的Gaofen Image Dataset(GID),該數(shù)據(jù)集包含150景高質(zhì)量的高分二號(hào)影像,影像空間分辨率為1 m全色影像和4 m的多光譜影像,影像大小為6 908×7 300像元,多光譜提供藍(lán)色、綠色、紅色、近紅外等四個(gè)波段影像。選取6塊數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行旋轉(zhuǎn)、平移處理便可以產(chǎn)生更多的樣本數(shù)據(jù),選取訓(xùn)練樣本數(shù)據(jù)包括山川、城市、田野、河流和森林等不同目標(biāo)。為了定量評(píng)價(jià)本文提出水體檢測(cè)方法的性能,采用測(cè)試數(shù)據(jù)進(jìn)行實(shí)驗(yàn),利用水體提取結(jié)果的召回率R、精確率P以及準(zhǔn)確率A等指標(biāo)進(jìn)行評(píng)價(jià)。采用Tp表示檢測(cè)為水體對(duì)象中正確的數(shù)量,F(xiàn)p表示檢測(cè)為水體對(duì)象中錯(cuò)誤的數(shù)量,Tn表示檢測(cè)為非水體對(duì)象中正確的數(shù)量,F(xiàn)n表示檢測(cè)為非水體對(duì)象中錯(cuò)誤的數(shù)量。則R、P以及A的計(jì)算表達(dá)式為: R=Tp/(Tp+FN) (11) P=Tp/(Tp+Fp) (12) A=(Tp+TN)/(Tp+FN+Fp+TN) (13) 通過(guò)實(shí)驗(yàn)統(tǒng)計(jì)選取6塊樣本數(shù)據(jù)結(jié)果的平均值得到極限學(xué)習(xí)機(jī)檢測(cè)粗水體與優(yōu)化后結(jié)果的正確率對(duì)比如表2所示。從表2中可知,初始檢測(cè)結(jié)果的正確率為91.35%,但其召回率與精確率相對(duì)較低,因?yàn)樗w檢測(cè)結(jié)果存在大量的漏檢與誤檢結(jié)果。通過(guò)利用多判據(jù)軟投票法優(yōu)化粗分類結(jié)果,剔除誤檢與漏檢結(jié)果后,召回率與準(zhǔn)確率均有所提升,精確率為95.86%,召回率與準(zhǔn)確率分別提高到91.85%與92.33%,證明該方法的有效性。 表2 水體粗檢測(cè)結(jié)果優(yōu)化前后對(duì)比結(jié)果/(%) 采用極限學(xué)習(xí)機(jī)分類器訓(xùn)練樣本數(shù)據(jù)時(shí),依次提取影像對(duì)象的水體指數(shù)、陰影水體指數(shù)、LBP局部紋理以及顏色特征信息,構(gòu)建5維的特征空間向量,利用極限學(xué)習(xí)機(jī)分類器分類后得到模型。選取兩組高分二號(hào)數(shù)據(jù)的遙感影像如圖2(a)所示,利用極限學(xué)習(xí)機(jī)分類器獲得檢測(cè)結(jié)果如圖2(b)所示,利用多判據(jù)軟投票優(yōu)化的結(jié)果如圖2(c)所示。 圖2 提取結(jié)果對(duì)比 由圖2可知,利用極限學(xué)習(xí)機(jī)分類器提取水體信息時(shí),由于水體與陰影在近紅外波段有交叉部分,提取結(jié)果中包含大量建筑物的陰影信息與小面積的陰影信息。通過(guò)后期的多判據(jù)軟投票法去除陰影與建筑區(qū)域的干擾,提取出的水體信息較好,基本與目視解譯結(jié)果一致。 本文提出的多特征融合的遙感影像水體提取方法選取兩組高分二號(hào)的影像數(shù)據(jù)為研究區(qū)域,分別提取影像的水體指數(shù)、陰影水體指數(shù)、LBP局部紋理特征以及顏色特征等多種特征,并將多種特征融合,利用多種學(xué)習(xí)機(jī)分類器提取研究區(qū)域的水體信息。實(shí)驗(yàn)結(jié)果表明,通過(guò)引用多判據(jù)軟投票方法能有效剔除抑制陰影信息的干擾,快速提取城市河道水體信息,總體準(zhǔn)確率在94%以上,為高分辨率衛(wèi)星遙感影像提取城市寬度較窄的河道信息提供一定的輔助和參考。但是文中缺少水體的水質(zhì)變化情況對(duì)檢測(cè)結(jié)果的影響分析,這將是下一步的研究方向。3 實(shí)驗(yàn)結(jié)果分析
4 結(jié) 論