吳瑞姣
(福建省地質(zhì)測繪院,福建 福州 350011)
準確的耕地面積和空間分布信息是權(quán)衡農(nóng)業(yè)生產(chǎn)效益與生態(tài)環(huán)境保護的重要依據(jù)[1],也是解決產(chǎn)量估算[2]、土地利用規(guī)劃和農(nóng)業(yè)生產(chǎn)管理等問題的關(guān)鍵[3]。衛(wèi)星和高分辨率影像的迅速發(fā)展和快速獲取,為大范圍、精確有效的耕地信息監(jiān)測提供了可能[4]。高分辨率遙感影像解譯是遙感信息處理領域的研究熱點之一[5]。隨著多源高分遙感影像數(shù)據(jù)的爆炸式增長,基于深度學習的智能圖像處理技術(shù)成為推動大數(shù)據(jù)時代遙感信息服務水平提升的重要力量[6]?;谙袼胤诸惖纳疃葘W習語義分割能快速解析圖像深層次語義信息,成為當前圖像分割領域最先進的應用技術(shù)[7],如全卷積神經(jīng)網(wǎng)絡[8]、 U-Net[9]、 U-Net++[10]、殘差網(wǎng)絡ResNet[11]等,在自然場景圖像和醫(yī)學影像分割領域取得了顯著成效[6]。文獻[3-4,12-13]基于深度學習技術(shù)提取中高分辨率衛(wèi)星遙感影像耕地開展了相關(guān)研究。然而以上研究,多數(shù)是基于高分、資源系列(0.65~2.5 m)或更低分辨率的衛(wèi)星遙感影像,對于耕地地塊小、形狀不規(guī)則、農(nóng)業(yè)景觀破碎的區(qū)域,混合像元影響大大增加了耕地遙感提取的難度,難以獲取準確的耕地提取結(jié)果[14]。而基于更高分辨率衛(wèi)星遙感影像的耕地識別研究鮮有報道。越高分辨率衛(wèi)星遙感影像,其光譜和空間紋理信息越復雜,地表細節(jié)特征越豐富,自動提取的難度也越大[6]。
因此,針對南方丘陵地區(qū)耕地零散、破碎、不規(guī)則導致的山垅田識別難度大、準確率低等問題,本文擬在 U-Net語義分割網(wǎng)絡基礎上,引入高效通道注意力(efficient channel attention,ECA)和注意力門(attention gate,AG)雙注意力模塊,構(gòu)建一種混合U-Net模型,以福建省南安市2021年WorldView-2衛(wèi)星影像為數(shù)據(jù)源,并對比不同網(wǎng)絡模型下耕地預測分類結(jié)果的精度,驗證本文方法的有效性,為糧食產(chǎn)量估算、耕地種植用途監(jiān)測、耕地非糧化等提供準確可靠的技術(shù)支持。
研究區(qū)為福建省南安市,位于福建省東南沿海,地處晉江中游、戴云山脈東南麓,境內(nèi)以山地丘陵為主。南安市作為全國百強縣,經(jīng)濟發(fā)展迅速,建設用地緊張、耕地保護壓力大,快速獲取該區(qū)域的耕地空間分布信息具有較強的實際需求。如圖1所示。
圖1 南安市研究區(qū)
本文所使用的影像數(shù)據(jù)源為WorldView-2衛(wèi)星影像18景,空間分辨率為0.5 m,成像時間是2021年1月15日-2月15日,含藍、綠、紅和近紅4個波段。利用PIE Orth軟件,根據(jù)影像自帶的RPC信息,基于基礎底圖和高精度DEM分別對全色和多光譜數(shù)據(jù)進行正射校正、配準、融合、重采樣和裁切等預處理。
模型訓練和驗證數(shù)據(jù)使用WorldView-2影像標注耕地標簽,數(shù)據(jù)標簽的標記通過ArcGIS矢量化工具對采樣區(qū)域耕地矢量輪廓的勾畫,并轉(zhuǎn)化為柵格數(shù)據(jù),生成二值化的掩膜標簽圖(即耕地與非耕地)。
首先通過目視檢查,剔除含耕地信息小于40%及明顯標注錯誤的圖片,再以4∶1的比例,將樣本劃分為訓練集和驗證集。然后通過縮放、翻轉(zhuǎn)(水平、垂直、對角線)、旋轉(zhuǎn)、隨機擴增策略進行數(shù)據(jù)增強,提升模型泛化能力。最后,分別得到512×512的訓練和驗證影像171 34張和4285張。
耕地精度驗證數(shù)據(jù)是2021年4月在南安外業(yè)實地調(diào)查時獲取的,共有1384個(如圖1所示)。其中,耕地981個,非耕地403個。
本文采用 U-Net深度學習網(wǎng)絡框架[9],即編碼器-解碼器結(jié)構(gòu)。編碼器用于提取原始影像的特征,解碼器則將編碼器所提取的特征進行解碼重建,從而獲取像素級的分類結(jié)果。針對高分辨率遙感影像上山垅田識別難度大、準確率低等問題,在 U-Net模型基礎上引入ECA模塊[15]和AG模塊[16],構(gòu)建一種基于 U-Net改進的雙注意力模塊混合U-Net模型進行高分辨率衛(wèi)星遙感影像耕地信息提取。如圖2所示。
圖2 基于雙注意力模塊的混合U-Net模型
2.1.1 ECA模塊
通道注意力機制可以有效提高 U-Net的語義分割性能,但不可避免增加了模型的復雜度。ECA通過恰當?shù)目缤ǖ澜换タ梢栽诮档湍P蛷碗s度的情況下提升語義分割性能。因此,本文在 U-Net中加入ECA模塊。該模塊使用一維卷積快速實現(xiàn)一種無降維的局部跨通道交互策略,在付出少量的參數(shù)代價的情況下,提高模型對不同波段的影像學習能力,增強對多尺度上下文信息的提取和利用,并抑制高分辨率遙感影像中冗余、無關(guān)信息的影響,提高耕地有效特征的提取精度。
ECA模塊如圖3所示。首先使用全局均值池化在空間維度對特征進行壓縮,獲取通道維度的全局特征;然后使用具有自適應卷積核的一維卷積構(gòu)建局部特征通道間的相關(guān)性;最后使用一個Sigmoid函數(shù)獲得0~1之間歸一化的權(quán)重,并將其加權(quán)到每個通道的特征中。
圖3 嵌入bottleneck block中的ECA模塊
2.1.2 AG模塊
AG模塊中的注意力權(quán)重是由編解碼中兩部分的信息共同確定的,編碼部分淺層的神經(jīng)網(wǎng)絡更善于提取局部的細節(jié)特征,而解碼部分深層的神經(jīng)網(wǎng)絡更善于提取全局的語義特征。因此,AG模塊則是添加在 U-Net模型的編解碼器之間,同編解碼器之間的跳連接和上一層神經(jīng)網(wǎng)絡相連,由編解碼信息共同構(gòu)建的AG模塊可在把握耕地目標全局特征的情況下,將更多注意力集中于耕地目標的細節(jié)特征,從而使模型更多地關(guān)注耕地目標在形狀和大小上的變化,提升小塊耕地提取精度。如圖4所示。
圖4 AG模塊
g和xl分別為注意力模塊的輸入,其中g(shù)來自模型的編碼部分,具有低層次的語義信息,xl來自解碼部分,具有高層次的語義信息。AG模塊的具體實現(xiàn)過程為:首先將g和xl通過1×1的卷積后相加,突出編解碼均有的特征;然后經(jīng)過ReLU激活函數(shù),增加非線性操作;最后經(jīng)過1×1卷積和Sigmoid函數(shù),得到歸一化后的注意力權(quán)重α,并將其與xl相乘得到具有不同特征權(quán)重的新xl。
為了更好地驗證所構(gòu)建的模型,設置了兩個不同模型的對比試驗。第1個是基于編碼-解碼架構(gòu)的 U-Net模型;第2個是在 U-Net模型基礎上添加了單一注意力機制,即在 U-Net編碼模塊中引入了殘差結(jié)構(gòu)和ECA注意力機制,形成了ECA U-Net模型。通過對比分析3個模型的耕地預測提取結(jié)果,探究所提出的混合U-Net模型對于南方丘陵地區(qū)山垅田及零散獨立小地塊的空間特征提取效果。
考慮Adam優(yōu)化器在模型訓練過程相較其他優(yōu)化器收斂得更快[17],在TensorFlow框架下選擇Adam優(yōu)化器,使用3塊GPU NVIDIA GeForce RTX 2080 Ti(11 GB)顯卡進行模型參數(shù)訓練,其中batch_size設置為4,初始學習率設置為1×10-4,在訓練中,學習率產(chǎn)生4次遞減,每次遞減為原學習率的0.2倍,模型在第150個epoch時結(jié)束。
當神經(jīng)網(wǎng)絡模型訓練完成后,可以通過前向傳播過程得到影像的預測結(jié)果。使用處理后的遙感影像和訓練后的模型進行耕地信息結(jié)果預測,獲得耕地的空間分布圖。
為了驗證混合U-Net模型在0.5 m高分辨率衛(wèi)星遙感影像上提取耕地的精度和有效性,采用基于實際外業(yè)點,通過構(gòu)建混淆矩陣計算用戶精度和生產(chǎn)者精度來定量化描述模型對南安市耕地提取的總體精度。
此外,另外選取了3個測試區(qū)域,選取的辦法是將南安市按照3072 m×3072 m劃分網(wǎng)格,共有278幅,扣除處于縣級行政界限邊緣未滿圖幅87幅,在剩余圖幅中按照10%的比例隨機挑選20幅作為候選測試區(qū)域。在此基礎上,按照耕地破碎程度、形狀規(guī)則程度,以及所處的坡度等級,人工選擇了3個代表性圖幅(山區(qū)、半山區(qū)半丘陵、平原)作為測試區(qū)域。采用深度學習語義分割常用的F1分數(shù)和交并比(IoU)作為評價指標,計算公式分別為
(1)
(2)
式中,TP為預測正確的正樣本;FP為預測錯誤的正樣本;TN為預測正確的負樣本;FN為預測錯誤的負樣本。
基于調(diào)查的實地外業(yè)點,通過構(gòu)建混淆矩陣計算用戶精度和生產(chǎn)者精度來定量化描述模型對南安市耕地提取的總體精度(見表1)。試驗結(jié)果表明,添加雙注意力機制的結(jié)果均優(yōu)于添加單一注意力機制和不添加注意力機制的結(jié)果?;诨旌蟄-Net分類結(jié)果總體精度達到了93.42%,較ECA U-Net模型和 U-Net模型分別提升了9.75%和19%,總體精度較好。從3種網(wǎng)絡模型得出的生產(chǎn)者和用戶精度中發(fā)現(xiàn):耕地的生產(chǎn)者和用戶精度均比非耕地的生產(chǎn)者和用戶精度高;ECA U-Net模型和 U-Net模型耕地的用戶精度大于生產(chǎn)者精度,漏分現(xiàn)象大于錯分現(xiàn)象;混合U-Net模型生產(chǎn)者精度大于用戶精度,錯分現(xiàn)象大于漏分現(xiàn)象。
表1 耕地提取精度 (%)
在3個測試區(qū)域內(nèi),將不同模型測試結(jié)果與通過三調(diào)耕地結(jié)合人工目視解譯獲得的耕地真實值進行比對(見表2)。結(jié)果表明,混合U-Net模型、ECA U-Net模型和 U-Net模型的3個區(qū)域耕地F1分數(shù)平均值分別為0.918 6、0.810 1和0.631 5,IoU平均值分別為59.37%、72.53%和76.97%?;旌蟄-Net模型優(yōu)于ECA U-Net模型和 U-Net模型的結(jié)果,尤其是在測試區(qū)域1(山區(qū))和測試區(qū)域2(半山區(qū)、半丘陵)結(jié)果提升明顯。3個測試區(qū)域內(nèi),不同模型測試結(jié)果對比如圖5所示。
表2 測試區(qū)域耕地提取精度
圖5 3個測試區(qū)域不同方法提取耕地的驗證結(jié)果
測試區(qū)域1,位于南安市北部的向陽鄉(xiāng),地處群山環(huán)抱的內(nèi)陸山區(qū),梯田和坡地類型耕地占區(qū)域1耕地總面積的94.54%。 U-Net模型提取的耕地與真實耕地一致性低的主要原因是漏提比較嚴重,如西側(cè)大片耕地的光譜特征因與林、園地相似而被錯分為非耕地,東側(cè)被四周林地包圍的獨立耕地遺漏,從而大大降低了提取耕地的精度。ECA U-Net模型在西側(cè)耕地與林園地光譜特征相似的情況下漏錯分現(xiàn)象得到改善,但并不能提升村莊周邊的小塊耕地及被林地包圍的獨立耕地提取精度。而混合U-Net模型,從圖5中可以明顯看到,東側(cè)數(shù)個被林地包圍的獨立耕地部分得到了提取,同時,在梯狀耕地地塊末端邊界精度也得到了部分改善。
測試區(qū)域2,位于南安市西部的碼頭鎮(zhèn)及詩山鎮(zhèn),屬半山區(qū)、半丘陵地貌。村莊內(nèi)部及周邊耕地為平地,占區(qū)域2耕地總面積的37.35%;梯田和坡地類型耕地則分布在村莊較遠的地區(qū),占62.65%。 U-Net模型在村莊內(nèi)部及周邊的平地耕地提取精度較好,但在村莊較遠的梯田和坡地上耕地提取精度偏低,特別是在西側(cè)村莊邊緣的山區(qū)耕地無法準確識別,出現(xiàn)了較大面積的漏分,也存在少量耕地光譜特征與林園相似錯分。ECA U-Net模型與真實耕地相比較,明顯改善了村莊邊緣的山區(qū) U-Net模型無法識別的耕地,但對小塊耕地及被林地包圍的獨立耕地提取效果不佳?;旌蟄-Net模型相較ECA U-Net模型,對于村莊周邊小塊耕地及被林地包圍的小塊獨立耕地的識別得到了進一步提升,但仍有少部分圖斑會與村莊周邊的陰影、剛栽種的果園及水庫周邊的灘涂存在錯分現(xiàn)象。
測試區(qū)域3,主要為南安市南部的水頭鎮(zhèn),屬平原地區(qū),建設用地密集,地物之間異質(zhì)性大。區(qū)域內(nèi)耕地以平原耕地為主,占90.27%。本文設計的3種深度學習網(wǎng)絡模型預測的耕地結(jié)果在測試區(qū)域3的F1分數(shù)均在0.8以上,較測試區(qū)域1和測試區(qū)域2以梯田和坡地為主的識別能力更高。但由于地物之間異質(zhì)性大,特別是 U-Net模型在被城鎮(zhèn)內(nèi)部房屋包圍的小塊耕地、與平整地特征相類似的休耕地及房屋陰影遮蓋處的耕地容易出現(xiàn)漏分,而部分林園、荒草地、操場內(nèi)部、養(yǎng)殖場等光譜特征與耕地相類似出現(xiàn)了錯分,提取的耕地邊界較真實耕地邊界,因耕地邊上荒草地錯納入耕地邊界,耕地內(nèi)部非常小的林地、設施農(nóng)用地未剔除。ECA U-Net模型相較U-Net模型,平整地特征相類似的休耕地漏分現(xiàn)象得到緩解,荒草地、操場內(nèi)部、養(yǎng)殖場等光譜特征與耕地相類似錯分比例有所下降,但受房屋陰影遮蓋下的耕地及被城鎮(zhèn)內(nèi)部房屋包圍的小塊耕地漏分仍然存在。混合U-Net模型針對被城鎮(zhèn)內(nèi)部房屋包圍的小塊耕地部分得到了提取,進一步提高了耕地提取精度。
南安市預測的耕地(如圖6所示),面積為26 219.32 hm2。從耕地立地條件看,位于坡度≤2°的耕地為10 240.84 hm2,占全市耕地的39.06%;坡度位于(2°,6°]的耕地為6 248.41 hm2,占23.83%;位于(6°,15°]的耕地為5927.57 hm2,占22.61%;位于(15°,25°]的耕地為3 113.35 hm2,占11.87%;坡度>25°的耕地為689.25 hm2,占2.63%。從地理空間分布來看,平原、平原邊緣以上的坡麓、臺地及山地丘陵均有分布。耕地集中連片分布較少,零散農(nóng)田較多,地塊較小,較多呈階梯狀和魚鱗狀分布。只有南部溪谷、河谷沖積平原和濱海平原處耕地比較集中、地塊較規(guī)則。
圖6 南安市耕地空間分布及坡度分級
本文提出了混合U-Net模型,在福建省南安市2021年WorldView-2衛(wèi)星影像數(shù)據(jù)的耕地提取中取得了較好精度,優(yōu)于單一注意力機制模型ECA U-Net和 U-Net模型,特別是在山區(qū)和半丘陵區(qū),F1分數(shù)達到了0.921 2和0.902 5。 U-Net在平原地區(qū)耕地提取精度較好,但對山垅田的識別容易與耕地光譜特征相近的林地、荒草地、園地、平整地等混淆及受陰影影響導致分類精度降低,尤其是小塊耕地及被其他復雜地物包圍的獨立耕地的識別程度不高。ECA U-Net通過引入ECA注意力機制優(yōu)化 U-Net的編碼器增強特征提取以提升性能,對于與耕地光譜特征相近的地物錯漏分現(xiàn)象明顯下降,整體分類效果提升明顯。但由于耕地的形狀和大小在南方丘陵山區(qū)差異較大,ECA U-Net只是單純地把同層的下采樣層的特征直接concate到上采樣層中,分類效果不如混合U-Net?;旌蟄-Net在編解碼器之間使用了AG注意力模塊,用于學習不同形狀和大小耕地目標,而使得一些較小的耕地及被其他復雜地物包圍的獨立耕地得到關(guān)注,具有較好的普適性。
盡管構(gòu)建的混合U-Net模型在耕地提取上取得了較好的精度,本文仍然存在以下問題可以改進:①本文所需的精確樣本依靠人工制作,費時費力,樣本制作方面可利用聚類方法或active learning方法快速提取,因此如何快速制作精確樣本是需要進一步解決的問題;②高分辨率遙感影像耕地地塊的自動化提取算法依然是國內(nèi)外遙感領域共同面臨的科學問題,傳統(tǒng)耕地地塊提取技術(shù)的效率已無法滿足當前精細化農(nóng)業(yè)應用快速響應的需求,因此在本文基礎上,可以進一步研究耕地地塊的提取算法。