王國杰,胡一凡,張森,茹易,陳開南,吳夢娟
1.南京信息工程大學(xué) 地理科學(xué)學(xué)院,南京 210044;
2.南京信息工程大學(xué) 遙感與測繪工程學(xué)院,南京 210044
水資源是地球生態(tài)系統(tǒng)中不可或缺的重要資源,是氣候變化和生態(tài)系統(tǒng)演化的重要影響因素(朱長明等,2013)??焖倬珳?zhǔn)地識別水體,對水資源調(diào)查、洪水監(jiān)測及防災(zāi)減災(zāi)等有重要意義(張兵等,2021;盛永偉等,1994;王治華等,1992)。隨著遙感技術(shù)的發(fā)展,高分辨率遙感成為目前水體監(jiān)測的重要手段(殷亞秋等,2015)。傳統(tǒng)遙感方法利用水體在不同波段的反射率差異來區(qū)分水體與非水體。McFeeters(1996)提出的歸一化差異水體指數(shù)NDWI (Normalized Difference Water Index),能夠較好地區(qū)分陸地、植被和水體,但在區(qū)分水體與建筑物方面較為薄弱;徐涵秋(2005) 提出了改進(jìn)的歸一化水體指數(shù)MNDWI(Modified Normalized Difference Water Index),針對NDWI的不足進(jìn)行了改進(jìn),增強(qiáng)了對水體和建筑物的區(qū)分能力,但在區(qū)分水、雪以及山影時效果較差(Xu,2006);此外,F(xiàn)eyisa等(2014)提出了自動提取水體指數(shù)AWEI(Automated Water Extraction Index),顯著地提升了水體識別效率。然而,由于水體指數(shù)法對于水體與非水體的閾值確定具有很強(qiáng)的主觀性,這對水體提取結(jié)果的準(zhǔn)確性和可靠性有很大影響。
除了傳統(tǒng)水體指數(shù),學(xué)者們也結(jié)合遙感影像的光譜、空間和紋理特征展開了相關(guān)研究。Yue等(2010)基于圖像光譜、形狀、紋理等特征,使用機(jī)器學(xué)習(xí)方法提取水體,但沒有充分利用空間信息特征。也有研究利用面向?qū)ο蠓椒ㄌ崛∷w(畢海蕓 等,2012);機(jī)器學(xué)習(xí)方法也被應(yīng)用到水體識別工作中,如基于反向傳播BP (Back Propagation)神經(jīng)網(wǎng)絡(luò)的水體自動提取方法(楊文亮等,2012)。此類方法可以避免閾值選擇帶來的不確定性,但其特征選擇也是一大挑戰(zhàn)。
自從Hinton 等(2006)提出深度學(xué)習(xí)概念,基于深度學(xué)習(xí)的遙感識別方法獲得廣泛重視和迅速發(fā)展(王雪等,2018)。與傳統(tǒng)方法不同,深度學(xué)習(xí)能夠適應(yīng)大樣本學(xué)習(xí),具有更高的靈活性和普適性(Liu 等,2017)。卷積神經(jīng)網(wǎng)絡(luò)CNN(Convolutional Neural Network)是深度學(xué)習(xí)的重要分支,近幾年若干經(jīng)典CNN 模型獲得廣泛應(yīng)用,例如,Krizhevsky 等(2012)提出的AlexNet 網(wǎng)絡(luò)模型,Simonyan 和Zisserman(2015)提出的VGG網(wǎng)絡(luò)模型,He 等(2016)提出的ResNet 網(wǎng)絡(luò)模型;最近Wang 等(2020b)提出的創(chuàng)新性HRNet網(wǎng)絡(luò)模型。深度學(xué)習(xí)憑借其高精度、高適用性、高效率的優(yōu)勢,與傳統(tǒng)遙感處理方法相比具有更高的可行性(尹寶才等,2015),因此在遙感領(lǐng)域得到了廣泛應(yīng)用。Saito 等(2015)提出一種卷積神經(jīng)網(wǎng)絡(luò),對衛(wèi)星遙感影像中的建筑物進(jìn)行自動檢測與提??;曲景影等(2016)提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的光學(xué)遙感影像目標(biāo)識別方法,該方法基于傳統(tǒng)的LetNet?5 網(wǎng)絡(luò)結(jié)構(gòu),利用卷積擴(kuò)展技術(shù)將卷積運算轉(zhuǎn)換為矩陣乘法,提高了目標(biāo)識別的準(zhǔn)確性和效率。以上這些方法在很大程度上促進(jìn)了深度學(xué)習(xí)在遙感領(lǐng)域的應(yīng)用,但目前在遙感水體提取方面的應(yīng)用還較少。Wang 等(2020a)使用深度學(xué)習(xí)方法提取鄱陽湖流域水體,識別精度較高,表明深度學(xué)習(xí)在水體提取方面具有極大應(yīng)用潛力。
基于高分一號衛(wèi)星數(shù)據(jù),本研究采用ResNet、VGG、DenseNet、HRNet 這4 種卷積神經(jīng)網(wǎng)絡(luò)提取地表水體信息,涵蓋當(dāng)前主流的圖像分類網(wǎng)絡(luò)結(jié)構(gòu)。本研究所采用的DenseNet 網(wǎng)絡(luò)結(jié)構(gòu),通過反卷積的方法來構(gòu)建全卷積神經(jīng)網(wǎng)絡(luò),并通過增加不同尺度的特征融合來增加特征利用效率,顯著提高模型識別效果。本研究基于谷歌第二代機(jī)器學(xué)習(xí)系統(tǒng)TensorFlow構(gòu)建ResNet、VGG、DenseNet、HRNet神經(jīng)網(wǎng)絡(luò),并將其水體識別結(jié)果與NDWI水體指數(shù)法進(jìn)行對比分析。
洪澤湖(33°06'—33°40'N,118°10'—118°52'E)位于江蘇省西部、淮河流域的下游,是中國最大的平原水庫型湖泊。洪澤湖流域?qū)儆诘湫偷膩啛釒Ъ撅L(fēng)氣候;受到季風(fēng)影響,降水時空分布不均,集中于6—9 月份。洪澤湖是淺水湖,湖泊面積受水位影響很大(伏蝶和岳建平,2019),平水期水位約為11.3 m,汛期水位約為12.5 m;總面積超過1000 km2,不同季節(jié)和年份有較大波動。
本研究選用高分一號衛(wèi)星WFV 多光譜相機(jī)的16 m分辨率影像。HRNet、DenseNet、VGG與ResNet的輸入通道包括WFV 獲取的藍(lán)光、綠光、紅光和近紅外4個波段;NDWI方法則選擇WFV傳感器所獲取的綠光與近紅外兩個波段。為使網(wǎng)絡(luò)的數(shù)據(jù)標(biāo)簽具有普適性,選用不同月份的影像制作數(shù)據(jù)樣本,用于訓(xùn)練模型。所采用高分一號遙感影像的成像時間為2016 年1 月26 日—11 月11 日;數(shù)據(jù)由中國資源衛(wèi)星中心提供(http://www.cresda.com/CN/[2020?06?17])。
為制作水體訓(xùn)練樣本,對不同月份遙感影像中的目標(biāo)水體進(jìn)行人工目視解譯。解譯時,不同透明度與渾濁度的自然湖體均認(rèn)為是水體,而湖岸邊緣圍網(wǎng)養(yǎng)殖與蘆葦覆蓋區(qū)域則不認(rèn)為是水體。為增加神經(jīng)網(wǎng)絡(luò)訓(xùn)練效率及準(zhǔn)確率,對圖像進(jìn)行批量切割,生成大小為224×224的圖像;對裁切后的樣本進(jìn)行篩選,刪除無效樣本,最終獲得水體樣本5574個。
2.3.1 歸一化差異水體指數(shù)
歸一化差異水體指數(shù)(NDWI)是一種基于綠光波段和近紅外波段反射率的水體識別方法(McFeeters,1996)。NDWI的計算公式如下:
式中,Green表示綠光波段的反射率,NIR表示近紅外波段的反射率。在理想情況下,若NDWI 為正值,則表示水、雨或者雪;若為負(fù)值則表示植被;若為零則表示巖石或裸土。由于水體信息在綠波段的反射率較高,在近紅外波段的反射率較低,因此,對這兩個波段進(jìn)行歸一化運算,增強(qiáng)二者之間的差距,可以使水體信息更為突出(McFeeters,1996)。由于地表植被等因素的影響,分割水體與非水體的閾值一般不為0,本文采用OSTU 法來確定最優(yōu)閾值(Otsu,1979)。OSTU 法也稱最大類間方差法,是基于最小二乘法原理的一種自適應(yīng)圖像分割閾值確定算法。按照影像直方圖計算各灰度級發(fā)生概率,選擇一個灰度級記為T,將圖像按灰度級分為兩部分,即0?T 以及T?255,分別記為目標(biāo)與背景,并計算目標(biāo)和背景類間方差的最大值,以找到最優(yōu)閾值。類間方差g的公式如下:
式中,圖像總平均灰度值記為μ,μ0和μ1分別為目標(biāo)和背景的平均灰度值,ω0和ω1為目標(biāo)和背景的灰度比例。當(dāng)g取到最大值時,所選擇的T 即為最優(yōu)閾值。本文中,當(dāng)?shù)玫较袼丶壍腘DWI值時,將其拉伸為0 到255 之間的灰度值,然后計算最優(yōu)閾值,從背景中分割水體。
2.3.2 卷積神經(jīng)網(wǎng)絡(luò)(CNN)
卷積神經(jīng)網(wǎng)絡(luò)是一種包含卷積層的神經(jīng)網(wǎng)絡(luò)模型(周飛燕等,2017),與普通淺層機(jī)器學(xué)習(xí)模型SVM(Cortes 和Vapnik,1995)相比,卷積神經(jīng)網(wǎng)絡(luò)具有更深的網(wǎng)絡(luò)結(jié)構(gòu)和更強(qiáng)的非線性特征擬合能力(盧宏濤和張秦川,2016)。在卷積神經(jīng)網(wǎng)絡(luò)中,圖像作為結(jié)構(gòu)中最低層的輸入,信息依次進(jìn)行傳遞,通過多層的學(xué)習(xí)自動挖掘數(shù)據(jù)中的信息。卷積神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的自動學(xué)習(xí)和特征表達(dá)能力,以VGG(Simonyan 和Zisserman,2015)、ResNet(He等,2016)、HRNet(Wang等,2020b)為代表的網(wǎng)絡(luò)結(jié)構(gòu)已被應(yīng)用于圖像處理領(lǐng)域。在強(qiáng)大的應(yīng)用需求驅(qū)動下,這些模型的復(fù)雜度也越來越高。VGG 網(wǎng)絡(luò)模型采用連續(xù)的3×3 卷積核;這種堆積的小卷積核對應(yīng)著更多的非線性層,可以有效地增加神經(jīng)網(wǎng)絡(luò)的深度,從而提高分類精度;但是它不能無限加深網(wǎng)絡(luò),否則會因梯度消失或梯度爆炸而使網(wǎng)絡(luò)退化(Simonyan 和Zisserman,2015)。為解決此問題,ResNet 網(wǎng)絡(luò)模型使用快捷連接(Shortcut Connections),以一定方式將低級別特征映射到高層,在網(wǎng)絡(luò)中增加了直連通道,允許原始輸入信息直接傳到后面的層中,使當(dāng)前網(wǎng)絡(luò)只需要學(xué)習(xí)上一個網(wǎng)絡(luò)輸出的殘差,簡化了學(xué)習(xí)目標(biāo)和難度(He 等,2016)。但是,ResNet 網(wǎng)絡(luò)模型每一層都有自己的權(quán)重,因此它具有更多的參數(shù)。
Huang等(2017)設(shè)計的DenseNet網(wǎng)絡(luò)結(jié)構(gòu)在ResNet 基礎(chǔ)上做出改進(jìn),將其網(wǎng)絡(luò)的每一層直接連接到前一層,實現(xiàn)了特征的重復(fù)利用,可以防止較小數(shù)據(jù)集的過度擬合;同時,它每一層生成的特征映射較少,與ResNet 模型相比在一定程度上減少了參數(shù)數(shù)量,這使得網(wǎng)絡(luò)更容易訓(xùn)練。本文通過增加上采樣結(jié)構(gòu),將DenseNet 構(gòu)建為全卷積神經(jīng)網(wǎng)絡(luò)FCN (Fully Convolutional Networks),與普通的CNN 網(wǎng)絡(luò)對特征向量進(jìn)行的分類不同;FCN 將CNN 末尾的全連接層轉(zhuǎn)化成了卷積層(寇大磊等,2019)。FCN 采用反卷積層對最后一個卷積層的特征圖進(jìn)行上采樣(Upsampling),使它恢復(fù)到與輸入圖像相同的尺寸,從而可以對每個像素進(jìn)行預(yù)測,同時也保留了原始輸入圖像中的空間信息,最后在上采樣的特征圖上進(jìn)行逐像素分類(周飛燕等,2017)。
HRNet(Wang 等,2020b)將上述網(wǎng)絡(luò)結(jié)構(gòu)中的串行連接高分辨率與低分辨率網(wǎng)絡(luò)的方式,改為并行連接,在整個訓(xùn)練過程中保持特征圖的高分辨率,通過在高分辨率特征圖主網(wǎng)絡(luò)逐漸并行加入低分辨率特征圖子網(wǎng)絡(luò),實現(xiàn)不同網(wǎng)絡(luò)多尺度融合。
2.3.3 DenseNet網(wǎng)絡(luò)模型
密集塊DB(Dense Block)是DenseNet 網(wǎng)絡(luò)的基本組成單元,其結(jié)構(gòu)如圖1 所示。DB 中間層為歸一化—線性校正—卷積層(BN?ReLU?Conv),其作用為在卷積之前對圖像執(zhí)行批量歸一化BN(Batch Normalization)和線性校正(ReLU),從而達(dá)到合并特征圖時大小統(tǒng)一的目的(Huang 等,2017)。DB 中每一層的輸入來自前面所有層的輸出,即:
圖1 Dense Block結(jié)構(gòu)示意圖Fig.1 Dense Block structure
式中,[X0,X1,…,XI?1]表示從第0層到第I?1 層的輸出特征圖的通道的合并(Concatenation),HI表示歸一化—線性校正—卷積層。這種連接方式可以改善DenseNet網(wǎng)絡(luò)中的信息流和梯度流。
圖2所示為用于圖像識別的基礎(chǔ)DenseNet結(jié)構(gòu)(Huang等,2017)。基于DenseNet的全卷積深度神經(jīng)網(wǎng)絡(luò),是一種端到端的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),可以實現(xiàn)高質(zhì)量的圖像語義分割(鄭遠(yuǎn)攀等,2019)。本文采用的全卷積DenseNet網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示,其由下采樣部分(圖左半部分)、跳層連接(圖中虛線部分)、上采樣部分(圖右半部分)組成??梢钥闯觯c圖2 所示經(jīng)典DenseNet 網(wǎng)絡(luò)結(jié)構(gòu)模型相比,本文使用的網(wǎng)絡(luò)結(jié)構(gòu)增加了由反卷積構(gòu)成的上采樣過程,在保留圖像空間信息的同時,使輸出圖像恢復(fù)到與輸入相同的尺寸;并且,我們還增加了跳層連接,該結(jié)構(gòu)可以把下采樣部分中獲得的特征信息引入上采樣部分,一方面可以緩解梯度消失問題;另一方面可以解決網(wǎng)絡(luò)退化問題;同時還可以對特征進(jìn)行重復(fù)學(xué)習(xí),提高特征利用效率。網(wǎng)絡(luò)使用交叉熵?fù)p失函數(shù)(Cross?entropy Loss Function)作為損失函數(shù),采用隨機(jī)梯度下降法SGD (Stochastic Gradient Descent) 進(jìn)行訓(xùn)練;對訓(xùn)練樣本分60 組,每組訓(xùn)練1000 次。網(wǎng)絡(luò)模型訓(xùn)練分階段進(jìn)行,初始學(xué)習(xí)率采用0.0001,訓(xùn)練30組時學(xué)習(xí)率縮小10倍,訓(xùn)練到50組時再縮小10 倍,從而降低網(wǎng)絡(luò)訓(xùn)練誤差。網(wǎng)絡(luò)的增長率設(shè)為32,權(quán)重衰減設(shè)為10?4,內(nèi)斯特洛夫動量設(shè)為0.9。
圖2 基于圖像識別的經(jīng)典DenseNet結(jié)構(gòu)示意圖(Huang 等,2017)Fig.2 Classic DenseNet Structure for image recognition(Huang et al.,2017)
圖3 本研究采用的DenseNet網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Modified DenseNet structure used in this study
2.3.4 評價指標(biāo)
基于混淆矩陣(Confusion matrix)(Stehman,1997),本研究選擇精確度P(Precision)、召回率R(Recall)、F1分?jǐn)?shù)和誤判率MRate(Misclassification Rate)來定量評價ResNet、VGG、DenseNet、HRNet網(wǎng)絡(luò)和NDWI的水體識別性能?;煜仃嚳蓪永鶕?jù)真實類別與預(yù)測類別的組合劃分為真正例TP(True Positive)、假正例FP(False Positive)、真反例TN(True Negative)和假反例FN(False Negative)。
精確度(Precision)為正確預(yù)測的正樣本數(shù)與預(yù)測的所有正樣本數(shù)之比:
可以看出,F(xiàn)值是基于正確率和召回率的調(diào)和平均定義。β為權(quán)重系數(shù);當(dāng)β=1 時,表示正確率與召回率同等重要,標(biāo)記為F1值,即
3.1.1 網(wǎng)絡(luò)訓(xùn)練參數(shù)選擇
神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置會影響實驗結(jié)果。在神經(jīng)網(wǎng)絡(luò)的各項參數(shù)中,學(xué)習(xí)率是一個影響網(wǎng)絡(luò)識別效率與識別效果的重要指標(biāo)。學(xué)習(xí)率過大會導(dǎo)致過擬合,使網(wǎng)絡(luò)無法收斂;學(xué)習(xí)率過小會使收斂速度過慢,雖然能夠收斂,但容易陷入局部最小值中,無法達(dá)到全局最小。同時,訓(xùn)練集與測試集的比例TTP(Train?Test Proportion)也會對模型訓(xùn)練效率與網(wǎng)絡(luò)精度產(chǎn)生影響。一般情況下,學(xué)習(xí)率通常選用0.001 或0.0001,訓(xùn)練集與測試集的比例通常設(shè)置為7∶3 或8∶2(Bengio,2012)(表1)。為確定適用于本研究的最佳網(wǎng)絡(luò)參數(shù),本文基于相同訓(xùn)練樣本,分別采用不同學(xué)習(xí)率與不同訓(xùn)練比例對4種網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,分別確定其最佳網(wǎng)絡(luò)參數(shù)。以DenseNet 網(wǎng)絡(luò)為例,說明不同參數(shù)選擇對訓(xùn)練結(jié)果的影響。
表1 DenseNet在不同參數(shù)組合情況下的識別精度指標(biāo)及訓(xùn)練時間指標(biāo)Table 1 Identification accuracy and training time of DenseNet with different parameter combinations
在神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練過程中,用損失(Loss)函數(shù)來評估模型的預(yù)測值與真實值之間的差異程度,Loss 值的下降情況表示模型的識別效率及其準(zhǔn)確性。圖4 是4 種不同參數(shù)設(shè)置的DenseNet 神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中的Loss 函數(shù)下降曲線。在初始時刻,4條Loss曲線值較為相近,且在訓(xùn)練前期其下降趨勢都較為一致。但隨著迭代次數(shù)的增加,學(xué)習(xí)率為0.001 的兩條曲線下降趨勢更為明顯,最終穩(wěn)定在0.11 左右,表明學(xué)習(xí)率為0.001 的網(wǎng)絡(luò)其性能表現(xiàn)更優(yōu);同時,對比相同學(xué)習(xí)率下不同TTP的Loss 曲線,發(fā)現(xiàn)TTP 為8∶2 時曲線下降程度更為明顯。表1列舉DenseNet不同參數(shù)組合情況下的精度評價指標(biāo)??梢耘卸?,設(shè)置學(xué)習(xí)率為0.001、TTP 為7∶3 時的網(wǎng)絡(luò)性能最優(yōu)。就TTP 參數(shù)來說,表1 中得出的結(jié)論與Loss 曲線得出的結(jié)論恰好相反。為進(jìn)一步確定更為合適的TTP,我們在不同學(xué)習(xí)率下,分別設(shè)定TTP 為7∶3 與8∶2 進(jìn)行水體識別,其識別結(jié)果見圖5。
圖4 DenseNet網(wǎng)絡(luò)模型采用不同參數(shù)組合時訓(xùn)練過程中損失函數(shù)變化曲線(每個epoch包括1000次迭代過程)Fig.4 Loss function of DenseNet in the training process of different parameter combinations(each epoch includes 1000 iterations)
圖5 DenseNet模型在不同參數(shù)組合下的水體識別結(jié)果(圖中藍(lán)色實線為人工提取岸線,紅色矩形框為對比區(qū)域)Fig.5 Water recognition results of the DenseNet model under different parameter combinations;The blue solid line is the manually identified shoreline,and the red rectangular frames are the areas for comparisons
圖5 所示,當(dāng)學(xué)習(xí)率設(shè)置為0.001 時,無論TTP 為7∶3 還是8∶2,所識別的水體邊界都存在與實際邊界明顯不符的情況,屬于較為嚴(yán)重的判斷失誤。這說明,DenseNet 模型在學(xué)習(xí)率為0.001時訓(xùn)練效果更好,但在實際識別過程中卻會出現(xiàn)重大誤判,這是由于神經(jīng)網(wǎng)絡(luò)的過擬合現(xiàn)象造成的。因此,在選擇參數(shù)時需要綜合考慮其實際識別效果。當(dāng)DenseNet 學(xué)習(xí)率為0.0001 時,其識別效果顯然更優(yōu)(圖5(c)和5(d)),其水體邊界更加符合實際情況。結(jié)合表1,TTP 為7∶3時的召回率、F1 值和誤判率指標(biāo)都優(yōu)于8∶2,且訓(xùn)練時間更短,因此本研究選擇學(xué)習(xí)率為0.0001、TTP 為7∶3的參數(shù)組合訓(xùn)練DenseNet網(wǎng)絡(luò)。
3.1.2 不同閾值法NDWI水體識別結(jié)果比較
本文選用OSTU 自適應(yīng)閾值法確定NDWI 的閾值。為驗證OSTU 方法的優(yōu)越性,本文將OSTU 自適應(yīng)閾值與經(jīng)驗閾值(反復(fù)進(jìn)行多次試驗,與人工提取結(jié)果對比,確定閾值為0.35)提取的水體結(jié)果進(jìn)行比較分析,如圖6所示。圖6(b)和6(c)中白色部分表示水體,黑色部分表示非水體;紅色矩形框表示需要對比的局部區(qū)域??傮w而言,兩種方法都能對洪澤湖湖區(qū)的水體輪廓進(jìn)行比較完整的提??;但經(jīng)驗閾值法在湖泊內(nèi)部出現(xiàn)大量的線狀與點狀噪聲,對比原始遙感影像判斷,噪聲位置均為湖泊水體。就湖泊完整性來看,OSTU閾值提取方法要優(yōu)于經(jīng)驗閾值法。同時,經(jīng)驗閾值法會受到人為主觀因素的影響,而OSTU 提取方法的閾值不會受到人為因素的影響??傮w而言,OSTU 自適應(yīng)閾值法的提取效果比經(jīng)驗閾值提取效果更好。因此,本文后續(xù)所使用到的NDWI水體提取結(jié)果,均采用OSTU自適應(yīng)閾值法得出。
圖6 NDWI提取結(jié)果圖Fig.6 The NDWI result
3.2.1 圖像識別效果
為了直觀地對比分析不同網(wǎng)絡(luò)的提取結(jié)果,圖7(a)顯示了2016 年1 月26 日高分一號衛(wèi)星獲取的洪澤湖水體區(qū)域遙感真彩色合成圖像;圖7 (b)—7 (f) 分 別 是NDWI、HRNet、VGG、ResNet、DenseNet 模型的識別結(jié)果。需要說明的是,后文所用遙感圖像均采用真彩色合成圖像,即R、G、B 通道分別采用高分一號衛(wèi)星WFV 傳感器獲取的第三、二、一波段進(jìn)行合成。
圖7 不同方法水體識別效果對比圖(紅色實線為人工提取岸線)Fig.7 Water identification results by different methods(The red line is the manually extracted shoreline)
圖7 顯示,4 種神經(jīng)網(wǎng)絡(luò)方法識別水體區(qū)域的效果均明顯優(yōu)于傳統(tǒng)的NDWI 水體指數(shù)方法。其中,NDWI識別的水體區(qū)域面積比真實水體面積大很多,其原因是NDWI方法將湖泊沿岸部分農(nóng)田及城市區(qū)域誤判為水體區(qū)域,導(dǎo)致NDWI在城鎮(zhèn)地區(qū)及水陸交界線處識別效果較差,產(chǎn)生了非常明顯的大面積噪聲和誤判斑塊。ResNet 識別結(jié)果在邊界存在較明顯的噪聲,且對細(xì)小河流的識別不夠敏感。DenseNet、VGG 與HRNet 都可以較準(zhǔn)確地識別水體區(qū)域,甚至可以把較為細(xì)小的河道分辨出來,其水陸界線較平滑,但同時也存在一定的誤判現(xiàn)象;其中,VGG 識別的水體邊界噪聲點較多,且誤判情況比DenseNet 與HRNet 更為明顯;DenseNet 與HRNet 的提取結(jié)果較為接近,但DenseNet 在細(xì)小河流處存在一定的斷線情況,而HRNet 識別結(jié)果在水體邊界處存在一定的點狀噪聲??傮w而言,DenseNet、VGG 與HRNet 的水體識別結(jié)果與實際情況較為一致,ResNet 較差;傳統(tǒng)NDWI識別結(jié)果最差,誤判情況非常明顯,且水體邊緣不清晰。這是因為NDWI水體指數(shù)法只利用綠光與近紅外波段的信息,所利用的信息較少;而神經(jīng)網(wǎng)絡(luò)則充分利用了高分一號數(shù)據(jù)的紅光、綠光、藍(lán)光及近紅外4個波段中的所有信息。因此神經(jīng)網(wǎng)絡(luò)方法的提取效果要顯著優(yōu)于NDWI水體指數(shù)法。
3.2.2 模型訓(xùn)練效率
ResNet、VGG、DenseNet 和HRNet 這4 種網(wǎng)絡(luò)訓(xùn)練過程中的損失(Loss)函數(shù)曲線如圖8所示。
圖8 4種神經(jīng)網(wǎng)絡(luò)模型(VGG、ResNet、DenseNet、HRNet)訓(xùn)練過程中損失函數(shù)的變化曲線(每個epoch包括1000次迭代過程)Fig.8 Loss functions during training processes of neural network models of VGG、ResNet、DenseNet and HRNet(Each epoch includes 1000 iterations)
由以上4 種神經(jīng)網(wǎng)絡(luò)的損失函數(shù)曲線可以看出,VGG 的初始Loss值最高,雖然下降速度最快,但是收斂最慢,最終逐漸穩(wěn)定于0.15 左右;ResNet 的初始Loss 值最低,但是訓(xùn)練效率也最低,下降非常緩慢,最終也穩(wěn)定于0.15 左右;HRNet初始值居中,下降速度略低于DenseNet,收斂速度適中,最終穩(wěn)定在0.15 左右;而DenseNet 初始Loss 值較低,但訓(xùn)練過程中收斂速度最快,且最終穩(wěn)定于0.13 左右,低于以上3 種網(wǎng)絡(luò)。DenseNet網(wǎng)絡(luò)訓(xùn)練效率最高,收斂性最好。這是因為DenseNet 在ResNet 和VGG 的基礎(chǔ)上進(jìn)行了優(yōu)化,降低了網(wǎng)絡(luò)冗余度,從而加快了訓(xùn)練效率,有效地緩解了梯度消失和過擬合問題,提高了識別精度;并且,本文DenseNet 網(wǎng)絡(luò)的跳層結(jié)構(gòu)加強(qiáng)了特征傳播,能夠更有效地利用地物特征。在實際應(yīng)用中,網(wǎng)絡(luò)的訓(xùn)練時間也是需要考慮的重要因素。4 種網(wǎng)絡(luò)的訓(xùn)練時間如表2 所示。HRNet 的訓(xùn)練時間略長于DenseNet,DenseNet 所花費的訓(xùn)練時間要遠(yuǎn)遠(yuǎn)小于ResNet及VGG網(wǎng)絡(luò)。
表2 4種網(wǎng)絡(luò)訓(xùn)練時間指標(biāo)Table 2 The training time of four networks
基于相同樣本數(shù)據(jù),得出4種神經(jīng)網(wǎng)絡(luò)模型及NDWI 的識別精度指標(biāo),表3 列舉了各方法識別結(jié)果參數(shù)。在精確度(P)方面,DenseNet最高,達(dá)到0.960;最差為NDWI,僅為0.779,表明DenseNet識別水體區(qū)域的正確率最高,尤其顯著高于傳統(tǒng)的NDWI水體指數(shù)法。在召回率(R)方面,NDWI水體指數(shù)法的R值最高,達(dá)到0.981,表明它成功地識別了數(shù)據(jù)集中的大部分水體樣本,但這并不說明其識別效果最好,因為NDWI提取的水體范圍事實上超過了真實的水體范圍,甚至包含了一些農(nóng)田,導(dǎo)致其識別水體在真實水體中占比較大。DenseNet的R值最低,僅0.890。由于P值和R值是對抗性指標(biāo),無法準(zhǔn)確地表明這幾種方法的優(yōu)劣,因而需進(jìn)一步考慮綜合指標(biāo)F1 值。HRNet 的F1 值最高,為0.930;DenseNet 略低,為0.928;ResNet與VGG 的相近;NDWI 最低,僅為0.868。就誤判率MRate 而言,DenseNet 誤判率最低,僅為0.041;VGG 誤判率最高,達(dá)到了0.048;NDWI 誤判率略低于ResNet。
表3 4種網(wǎng)絡(luò)及NDWI識別精度指標(biāo)Table 3 Water identification results of four networks and NDWI
綜上所述,神經(jīng)網(wǎng)絡(luò)的水體提取效果要顯著優(yōu)于傳統(tǒng)的NDWI 水體指數(shù)方法;所采用的4 種神經(jīng)網(wǎng)絡(luò)模型中,DenseNet 綜合表現(xiàn)最好,誤判率最低,精確度最高,甚至優(yōu)于最新提出的HRNet結(jié)構(gòu)。所以,我們將僅分析DenseNet 網(wǎng)絡(luò)的水體識別結(jié)果。
對遙感地物識別而言,細(xì)節(jié)識別效果是非常重要的衡量標(biāo)準(zhǔn)。在3.3 節(jié)中已經(jīng)表明,DenseNet網(wǎng)絡(luò)對水體的識別結(jié)果最優(yōu),其局部結(jié)果見圖9,通過9組局部圖像并結(jié)合人工提取岸線,可以看出DenseNet 的水體提取效果總體來說與岸線的吻合度較高,對于陸地、河岸、大部分河道及湖泊的細(xì)部識別較為準(zhǔn)確,能夠較好地識別細(xì)小的河道,對于水田等有一定混淆性的地物也可以進(jìn)行很好地區(qū)分;但是對于湖心島嶼、江心洲等的識別會出現(xiàn)誤判的現(xiàn)象,可能是由于訓(xùn)練樣本中此類地物數(shù)量較少,因此不能很好地分離水體與島嶼;此外,由于水體中泥沙、葉綠素等懸浮物的含量及河流流速等原因而導(dǎo)致水體顏色顯著差異,如河流激流處水體呈現(xiàn)白色,流速較緩或靜止的水體呈現(xiàn)藍(lán)色或深藍(lán)色,泥沙含量高的部分呈現(xiàn)黃色或褐色等,DenseNet都可以準(zhǔn)確地識別。
圖9 DenseNet網(wǎng)絡(luò)水體局部識別結(jié)果(紅色實線為人工提取岸線)Fig.9 Detailed water identification results by DenseNet(The red solid line is manually identified shoreline)
本文選用2016 年多個月份的遙感影像制作標(biāo)簽,訓(xùn)練出的網(wǎng)絡(luò)可以對各個季節(jié)的水體進(jìn)行識別。為說明DenseNet 對不同季節(jié)水體的識別效果,選擇冬季和夏季各一幅圖像進(jìn)行水體識別,結(jié)果見圖10。冬季湖泊形態(tài)較為清晰,而夏季水陸邊界較為模糊,部分區(qū)域受到云的影響。DenseNet網(wǎng)絡(luò)識別結(jié)果顯示,洪澤湖湖面面積在冬季與夏季有明顯的不同,冬季湖泊面積要大于夏季,夏季湖泊的輪廓發(fā)生了一定程度的收縮。2016 年1 月26 日 水體面積為1331.31 km2,而2016 年8 月31 日水體面積為1140.90 km2。由于洪澤湖水域面積隨水位變化而變化,根據(jù)梅海鵬等(2021)的研究,可以得知洪澤湖年內(nèi)水位變化呈單谷型,由于春季灌溉用水量大,同時為增強(qiáng)防洪能力在汛期到來前開閘放水,從而導(dǎo)致洪澤湖最低水位在5月底或6月初出現(xiàn)。6月至8月,降水量迅速增加,使水位快速上漲,從而使得湖泊面積擴(kuò)大;但2016 年5 月16日水體面積為1236.24 km2,8 月湖泊面積比5 月16 日水體面積更小,這是因為2016 年夏季蒸發(fā)旺盛,蒸發(fā)量遠(yuǎn)高于降水量所致。根據(jù)江蘇省氣象信息中心提供的數(shù)據(jù),該地區(qū)1月份蒸發(fā)量與降水量分別為29.9 mm與31.6 mm,降水量略大于蒸發(fā)量;而8 月份蒸發(fā)量與降水量分別為127.85 mm與73.53 mm,蒸發(fā)量遠(yuǎn)大于降水量,導(dǎo)致8月降水對湖泊的補給不足,湖泊面積縮減。
圖10 DenseNet網(wǎng)絡(luò)對冬季與夏季洪澤湖區(qū)域水體提取效果(紅色實線為人工提取岸線)Fig.10 Water identification results by DenseNet in Hongze Lake area in winter and summer respectively(The red solid line is manually identified shoreline)
圖11 能夠更加清晰地顯示夏季與冬季洪澤湖湖泊發(fā)生變化的區(qū)域。為進(jìn)一步說明DenseNet 識別不同季節(jié)洪澤湖水體的準(zhǔn)確性,對1 月份和8 月份水體變化明顯的局部區(qū)域的遙感圖像及其識別結(jié)果進(jìn)行局部放大,見圖12,其中白色表示水體,黑色為非水體。從局部區(qū)域來看,獲取的影像中夏季湖岸邊田塊非常明顯,且夏季作物生長旺盛,圖中表現(xiàn)為深淺不同的綠色;相比冬季,能夠比較明顯地看出夏季田塊的擴(kuò)張以及湖岸向湖中央推移,從而使得湖泊沿岸線模糊不易辨別。對于這種現(xiàn)象,DenseNet 網(wǎng)絡(luò)可以準(zhǔn)確地將迫近湖岸的綠植與真正的湖泊水體進(jìn)行區(qū)分,清晰地識別出水體邊緣。而當(dāng)影像在冬季表現(xiàn)出明顯的水體特征,而在夏季則完全沒有田塊特征的情況下,DenseNet網(wǎng)絡(luò)也能較好地識別出水體。
圖11 岸線變化圖Fig.11 Manually identified shorelines in summer(red line)and winter(blue line)respectively
圖12 DenseNet對夏季與冬季洪澤湖區(qū)域的水體識別局部效果對比圖Fig.12 Detailed water identification results in Hongze Lake area by DenseNet in summer and winter
本實驗提出了基于DenseNet 深度神經(jīng)網(wǎng)絡(luò)的水體提取模型,通過與經(jīng)典的ResNet、VGG 神經(jīng)網(wǎng)絡(luò),及新提出的HRNet 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和水體指數(shù)法NDWI進(jìn)行對比,得出了以下結(jié)論:
(1)卷積神經(jīng)網(wǎng)絡(luò)如HRNet、ResNet、VGG和DenseNet,在遙感水體識別方面遠(yuǎn)優(yōu)于傳統(tǒng)的水體指數(shù)方法。雖然水體指數(shù)法具有使用簡單、過程迅速的優(yōu)點,但識別精度相對較低,不能滿足當(dāng)前高精度遙感制圖的需求;并且,水體指數(shù)閾值的選取受人為主觀影響較大,難以確定最佳閾值,直接影響著識別精度。相較于水體指數(shù)法,基于卷積神經(jīng)網(wǎng)絡(luò)的水體識別雖然訓(xùn)練網(wǎng)絡(luò)需要花費較長時間,但訓(xùn)練好的模型也可以快速識別出水體,且識別結(jié)果更加準(zhǔn)確。因此,與傳統(tǒng)水體指數(shù)方法相比,卷積神經(jīng)網(wǎng)絡(luò)展示了更優(yōu)的應(yīng)用前景。
(2)本文對經(jīng)典DenseNet 網(wǎng)絡(luò)結(jié)構(gòu)加以改進(jìn),增加了上采樣過程和全卷積網(wǎng)絡(luò)內(nèi)的跳層連接,緩解梯度消失和網(wǎng)絡(luò)退化問題,并可進(jìn)行特征重復(fù)學(xué)習(xí)。相較于經(jīng)典的VGG 和ResNet 網(wǎng)絡(luò),DenseNet 網(wǎng)絡(luò)在水體識別方面精確度P與F1 分?jǐn)?shù)更高,誤判率最低,本研究中分別達(dá)到了0.960、0.928與0.041,且對細(xì)部特征也有良好的識別能力;其識別效果甚至優(yōu)于最新提出的HRNet 網(wǎng)絡(luò)結(jié)構(gòu)。同時,修改后的DenseNet 模型損失函數(shù)最低,且訓(xùn)練時間僅為3 h 41 m 22 s,遠(yuǎn)低于其他網(wǎng)絡(luò)。
本文研究表明,DenseNet 在遙感水體識別領(lǐng)域有很好的應(yīng)用前景;結(jié)合高時間、高空間分辨率遙感數(shù)據(jù),可以實現(xiàn)高精度水體制圖、河流湖泊面積變化和洪澇災(zāi)害監(jiān)測等。但基于DenseNet網(wǎng)絡(luò)的水體識別仍然存在一些無法避免的瑕疵,如識別結(jié)果偶爾會出現(xiàn)點狀噪音,以及細(xì)小水道出現(xiàn)“斷線”情況等;可能原因是樣本總量還不夠充足,樣本數(shù)字標(biāo)簽準(zhǔn)確度不足,以及遙感影像本身的一些局限性等。DenseNet 網(wǎng)絡(luò)進(jìn)行水體識別還有許多工作需要進(jìn)一步完善:
(1) 本文使用的DenseNet 網(wǎng)絡(luò)是在基礎(chǔ)DenseNet 網(wǎng)絡(luò)上進(jìn)行結(jié)構(gòu)優(yōu)化,但此網(wǎng)絡(luò)還可以進(jìn)一步改進(jìn),提高該網(wǎng)絡(luò)結(jié)構(gòu)的識別效率。
(2)訓(xùn)練數(shù)據(jù)樣本集不夠豐富。若能夠增加更大尺度的水體遙感影像資料作為樣本集,如全國范圍的水體影像,同時提高人工目視解譯制作標(biāo)簽的精度,該網(wǎng)絡(luò)的水體提取效果會更加準(zhǔn)確,普適性更強(qiáng)。
總之,本文的研究表明,利用DenseNet 深度神經(jīng)網(wǎng)絡(luò)進(jìn)行遙感水體識別具有較高的精度,顯著優(yōu)于傳統(tǒng)的水體指數(shù)法。深度神經(jīng)網(wǎng)絡(luò)因其識別精度方面的優(yōu)勢,在水體遙感等領(lǐng)域具有廣闊的應(yīng)用前景。