馬永建,汪傳建,趙慶展,任媛媛,田文忠
(石河子大學(xué)信息科學(xué)與技術(shù)學(xué)院/兵團(tuán)空間信息工程技術(shù)研究中心,新疆 石河子 832003)
耕地作為我國(guó)不可或缺的自然資源,為國(guó)家的糧食安全提供了物質(zhì)保障[1]。近年來(lái),快速推進(jìn)的工業(yè)化和城鎮(zhèn)化進(jìn)程導(dǎo)致我國(guó)的耕地資源不斷流失,為確保農(nóng)業(yè)的可持續(xù)發(fā)展,政府部門(mén)推行了嚴(yán)格的耕地保護(hù)制度[2]。通過(guò)測(cè)繪方式獲取耕地面積與空間分布,實(shí)現(xiàn)耕地信息動(dòng)態(tài)監(jiān)管,是判斷耕地類(lèi)型變化及基本農(nóng)田有效性的主要依據(jù),更是制定農(nóng)業(yè)政策、確保糧食安全的科學(xué)支撐[3]。
新疆南部地區(qū)面積遼闊,以荒漠為主,在河流沿岸有綠洲性耕地,田塊較大,形態(tài)不一,人工測(cè)繪將面臨耗時(shí)長(zhǎng)、投資大、數(shù)據(jù)更新緩慢等問(wèn)題。隨著衛(wèi)星成像技術(shù)的不斷發(fā)展,遙感影像覆蓋范圍廣、探測(cè)周期短、空間分辨率高等優(yōu)勢(shì)更加明顯[5],將其用于耕地測(cè)繪,可有效彌補(bǔ)傳統(tǒng)人工測(cè)繪方法的不足,使高效、準(zhǔn)確的大區(qū)域農(nóng)田信息獲取和監(jiān)測(cè)成為可能。目前,利用遙感影像進(jìn)行農(nóng)田提取的方式主要分為人工目視解譯和基于像素或面向?qū)ο蠓椒ǖ霓r(nóng)田信息提取[6-8]二種方式,前一種方式識(shí)別結(jié)果精度高,但過(guò)程速度慢、成本支出較大,后一種方式提取速度快、成本低,但精度較差,易受影像中噪聲影響。根據(jù)研究區(qū)特征不同,許多學(xué)者提出了相應(yīng)的改進(jìn)措施,陳杰等[9]針對(duì)丘陵地區(qū)農(nóng)田特點(diǎn)提出了一種基于最優(yōu)尺度選擇的農(nóng)田提取方法,在丘陵地區(qū)的農(nóng)田識(shí)別準(zhǔn)確度可達(dá)73.06%;魯恒等[10]借助無(wú)人機(jī)遙感空間分辨率高的優(yōu)勢(shì),對(duì)小面積耕地采用遷移學(xué)習(xí)方法進(jìn)行提取,其識(shí)別準(zhǔn)確度可達(dá)91.9%;OZDARICI A與TURKER M[11]研究了不同遙感數(shù)據(jù)源下通過(guò)濾波方式獲取農(nóng)田信息的效果,其中QuickBird PS影像整體準(zhǔn)確度超過(guò)83%。這些改進(jìn)的提取算法在一定程度上提高了結(jié)果精度,但多采取單一時(shí)期遙感影像進(jìn)行信息提取,重點(diǎn)關(guān)注含農(nóng)作物覆蓋的田塊識(shí)別,對(duì)農(nóng)田光譜、形狀特征依賴(lài)性較大,無(wú)法有效挖掘遙感影像中的深層次特征信息,因此難以區(qū)分與裸土較為相似的未耕種地塊,在紋理特征復(fù)雜的套種耕地信息提取及類(lèi)別劃分方面更是少有涉及。深度學(xué)習(xí)因具有啟發(fā)式學(xué)習(xí)策略與訓(xùn)練機(jī)制,能實(shí)現(xiàn)更強(qiáng)的特征學(xué)習(xí)和特征表達(dá)能力,已成為當(dāng)前遙感領(lǐng)域目標(biāo)提取的先進(jìn)方法[12-13]。其中,U-Net作為FCN的改進(jìn)型網(wǎng)絡(luò),兼具反卷積網(wǎng)絡(luò)與跳躍網(wǎng)絡(luò)的特點(diǎn),對(duì)處理類(lèi)間差異小、樣本數(shù)據(jù)分布不均衡等問(wèn)題具有良好表現(xiàn)[14],憑借其識(shí)別精度高和數(shù)據(jù)挖掘能力強(qiáng)的優(yōu)勢(shì),在城區(qū)建筑物識(shí)別[15]、農(nóng)田渠系提取[16]、林帶冠層監(jiān)測(cè)[17]等方面均取得較優(yōu)效果,被越來(lái)越多應(yīng)用于遙感影像分類(lèi)識(shí)別研究。
針對(duì)當(dāng)前基于像素或面向?qū)ο蟮倪b感影像農(nóng)田提取易導(dǎo)致“椒鹽噪聲”[17]、需多次人工選取分割參數(shù)[18]、對(duì)套種地塊提取結(jié)果不明確、難以提取未耕種地塊信息等問(wèn)題,本文根據(jù)荒漠區(qū)耕地的耕作特點(diǎn),引入以U-Net網(wǎng)絡(luò)結(jié)構(gòu)為基礎(chǔ)的深度學(xué)習(xí)目標(biāo)提取機(jī)制,以新疆省尉犁縣為研究區(qū),選取耕地信息提取關(guān)鍵時(shí)期GF-1遙感影像,充分利用研究區(qū)物候特征、植被指數(shù)及紋理特征,建立一種基于深度學(xué)習(xí)的耕地區(qū)域識(shí)別方法,同時(shí)將區(qū)域內(nèi)耕地以未耕作耕地、果林和農(nóng)田三種類(lèi)型進(jìn)行呈現(xiàn),從而為實(shí)現(xiàn)荒漠區(qū)耕地信息提取,地塊耕種狀態(tài)判別及基本農(nóng)田有效性監(jiān)測(cè)提供數(shù)據(jù)參考。
研究區(qū)位于新疆省尉犁縣,地理坐標(biāo)介于86°47′E~87°07′E,40°47′N(xiāo)~40°58′N(xiāo)之間,海拔范圍為856.48~940.31 m,地勢(shì)西高東低,西部為塔克拉瑪干沙漠,東部為庫(kù)木塔格沙漠,該區(qū)域中兩大沙漠相距最短距離僅5 km,屬典型的溫帶大陸性干旱氣候,冷熱差異懸殊,年均氣溫10.1 ℃,年降水量30~150 mm。研究區(qū)光熱資源充沛,憑借良好的地理氣候條件,已成為享譽(yù)全疆的優(yōu)質(zhì)棉生產(chǎn)基地,同時(shí),為提高土地利用效率,部分耕地區(qū)域?qū)嵭凶魑锾追N方式。
高分一號(hào)衛(wèi)星(GF-1)是我國(guó)第一顆高分辨率對(duì)地觀測(cè)衛(wèi)星,目前已在國(guó)土資源、環(huán)境保護(hù)、地理信息測(cè)繪等領(lǐng)域發(fā)揮重要作用。GF-1主要波段參數(shù)如表1所示。
表1 GF-1遙感數(shù)據(jù)參數(shù)
根據(jù)研究區(qū)主要地物物候特征,選取2017年8月以及2018年2月同區(qū)域兩期GF-1遙感影像。為獲取地物真實(shí)反射率,消除圖像的空間和幾何畸變,對(duì)兩期影像進(jìn)行輻射定標(biāo)、大氣校正、正射校正等預(yù)處理操作。正射校正后的多光譜和全色影像經(jīng)圖像融合操作可獲取研究區(qū)2 m分辨率多光譜數(shù)據(jù)。數(shù)據(jù)預(yù)處理過(guò)程如圖1所示。
圖1 遙感數(shù)據(jù)預(yù)處理流程
對(duì)研究區(qū)地物類(lèi)型進(jìn)行野外調(diào)查,時(shí)間為2019年8月5—15日,根據(jù)數(shù)據(jù)采集時(shí)間及研究區(qū)范圍,共分5個(gè)樣區(qū)進(jìn)行實(shí)地?cái)?shù)據(jù)采集,采用地圖打點(diǎn)的方式標(biāo)記樣區(qū)地塊,記錄地塊位置、覆被、周邊地物特征等信息。
本實(shí)驗(yàn)獲取荒地、胡楊、棗林、香梨、棉花共580處地塊信息,其中耕地屬性4類(lèi),包含96塊荒地、97塊棗林地、105塊香梨地以及235塊棉花地,林地屬性1類(lèi),為47塊胡楊林地。
研究區(qū)內(nèi)主要地物物候信息及地塊覆被變化如圖2所示,具體表現(xiàn)為棉花播種時(shí)間較晚,開(kāi)春4月左右進(jìn)行播種,棗林、香梨、胡楊林2月均處于休眠期,3月下旬進(jìn)入萌芽期,荒地或輪休期地塊因未有明顯植被覆蓋,均體現(xiàn)為裸地特征。
圖2 研究區(qū)典型地塊物候圖
研究區(qū)位于塔克拉瑪干沙漠與庫(kù)木塔格沙漠之間,年降水量極少,冬季基本無(wú)雪。耕地覆被以棉花、香梨、棗樹(shù)為主,部分耕地周邊及荒漠邊緣分布有人工種植的胡楊林作為防護(hù)林。夏季期間,光照充足,依靠滴灌的方式,棉花長(zhǎng)勢(shì)良好,具有典型的植被特征;8月期間,棉花處于花鈴期,葉面積比例較大,對(duì)耕地覆蓋完整,且與種植果樹(shù)的耕地相比具有更大的密度。冬季期間,種植有棉花的地塊經(jīng)過(guò)采摘與翻地工作,與裸地表現(xiàn)相似。果林與胡楊林均已進(jìn)入越冬期,此類(lèi)區(qū)域在遙感影像中表現(xiàn)為枝干與裸地混合,具有較為明顯的紋理特征。因此,結(jié)合研究區(qū)氣候類(lèi)型及物候規(guī)律,選取夏季(8月)及冬季(2月)兩期GF-1遙感影像作為數(shù)據(jù)源。
植被指數(shù)作為衡量作物生長(zhǎng)狀態(tài)的定量因子,在遙感領(lǐng)域得到了廣泛應(yīng)用,其中歸一化植被指數(shù)(NDVI)可有效削弱大氣反射等不利影響,增強(qiáng)遙感影像中的植被影響力,精確反應(yīng)植被信息,是當(dāng)前最常用的指標(biāo)之一[19],NDVI計(jì)算公式如式(1)
式(1)中ρNIR為近紅外波段反射率,ρR為紅波段反射率。
對(duì)8月GF-1遙感影像進(jìn)行NDVI運(yùn)算,去除計(jì)算結(jié)果異常值并進(jìn)行線(xiàn)性拉伸操作,增強(qiáng)植被區(qū)特征。根據(jù)拉伸后的圖像制作第1類(lèi)耕地訓(xùn)練集,設(shè)置閾值為250,將取值范圍在250~255的區(qū)域定義為覆被類(lèi)型為棉花的耕地,初步生成掩膜文件。
除覆被類(lèi)型為棉花的耕地外,覆被類(lèi)型為棗樹(shù)或梨樹(shù)的耕地在夏季影像中的特征不如棉花明顯,易與胡楊林產(chǎn)生混淆,且部分耕地為未耕作類(lèi)型,無(wú)植被覆蓋,8月遙感影像無(wú)法提供足夠的裸地樣本。在2月的遙感影像中,先前覆被類(lèi)型為棉花的耕地表現(xiàn)為裸地特征,覆被類(lèi)型為棗樹(shù)或梨樹(shù)的耕地區(qū)域表現(xiàn)為裸地與枝干混合特征,顏色較淺,由于套種耕作方式,在夏季區(qū)域中表現(xiàn)為棉田區(qū)域的耕地,此時(shí)剩余的果樹(shù)同樣表現(xiàn)為冬季果林特征。胡楊林區(qū)域表現(xiàn)為裸地與枝干混合特征,但顏色較深。
在紋理特征方面,裸地區(qū)域表現(xiàn)較為平滑,裸地與枝干混合的果林受植被特性及種植結(jié)構(gòu)影響,有細(xì)小紋理,胡楊林地根據(jù)種植密度不同呈現(xiàn)不同的紋理分布,但其紋理較粗與果林及裸地特征相比差異明顯。使用目視解譯的方法對(duì)2月遙感影像中的裸地及果林耕地進(jìn)行標(biāo)注,獲取二、三類(lèi)耕地訓(xùn)練集,同時(shí)采用灰度共生矩陣(GLCM)的方式對(duì)冬季遙感影像進(jìn)行紋理信息提取。作為典型的基于統(tǒng)計(jì)的紋理特征提取方法,灰度共生矩陣具有較強(qiáng)的適應(yīng)性與魯棒性[20],其中對(duì)比度、相關(guān)、能量、同質(zhì)性作為互不相關(guān)的4種特征參數(shù),具有計(jì)算簡(jiǎn)便以及分類(lèi)效果良好的特點(diǎn)。對(duì)比度反映圖像的紋理溝紋深淺,能量體現(xiàn)圖像灰度分布均勻程度和紋理粗細(xì)程度,相關(guān)是度量圖像的灰度級(jí)在行或列方向上的相似程度,同質(zhì)性是衡量圖像紋理局部變化的大小。根據(jù)研究區(qū)遙感影像特征,選取能量作為紋理特征提取參數(shù),計(jì)算公式為
式(2)中i取值為灰度共生矩陣的所有行,j取值為灰度共生矩陣的所有列,P(i,j)為矩陣中相應(yīng)位置的值。
在8月遙感影像加入NDVI波段,在2月遙感影像中加入紋理波段,共同構(gòu)成深度學(xué)習(xí)模型輸入數(shù)據(jù)。
U-Net網(wǎng)絡(luò)模型由RONNEBERGER O等于2015年提出[14],因其結(jié)構(gòu)清晰明了,呈現(xiàn)為U型而得名。作為一種改進(jìn)的FCN結(jié)構(gòu)網(wǎng)絡(luò),它沿用了FCN語(yǔ)義分割思想的同時(shí)兼具編碼-解碼結(jié)構(gòu)和跳躍網(wǎng)絡(luò)的特點(diǎn),使模型能夠充分利用高層與低層特征圖,結(jié)合上下文信息與細(xì)節(jié)信息得到更加精確的輸出特征[21]。
本文使用的模型借鑒傳統(tǒng)U-Net網(wǎng)絡(luò)結(jié)構(gòu)并加以改進(jìn),如圖3所示。
圖3 U-Net模型結(jié)構(gòu)
模型輸入均為5通道遙感影像。輸入數(shù)據(jù)像素尺寸設(shè)置為256×256(約為0.5 km×0.5 km),根據(jù)觀察,此類(lèi)尺寸擁有足夠的上下文信息,即使通過(guò)目視解譯的方式也可以正確判斷像素類(lèi)別。通過(guò)對(duì)圖像塊隨機(jī)應(yīng)用翻轉(zhuǎn)、旋轉(zhuǎn)以及顏色抖動(dòng)等方法增加批次中的圖像數(shù)量,以得到充足的樣本數(shù)據(jù),避免訓(xùn)練過(guò)程總網(wǎng)絡(luò)產(chǎn)生過(guò)擬合現(xiàn)象,增強(qiáng)模型的泛化能力[22]。本文共獲取樣本數(shù)據(jù)13 000個(gè),同時(shí)以訓(xùn)練樣本與驗(yàn)證樣本比例為4∶1進(jìn)行調(diào)整。
在典型的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,通常經(jīng)最大池化操作處理后特征圖譜數(shù)量會(huì)增加,以保證信息的完善程度??紤]到本實(shí)驗(yàn)訓(xùn)練過(guò)程上采樣操作已獲取相關(guān)低級(jí)特征,允許下采樣操作丟失部分信息,且實(shí)驗(yàn)數(shù)據(jù)均為衛(wèi)星遙感影像,無(wú)需識(shí)別高層次3D物體概念[21],因此,本模型不同層級(jí)特征圖譜均保持為32個(gè)。
模型左側(cè)為壓縮通道,用于逐層提取影像特征,降低噪聲對(duì)圖像的影像。為了避免隨著網(wǎng)絡(luò)的加深,訓(xùn)練過(guò)程收斂越來(lái)越慢的問(wèn)題,本模型選用ReLu激活函數(shù),無(wú)論是在正向還是反向傳播過(guò)程,其收斂速度要優(yōu)于Sigmod和Tanh函數(shù)[22],同時(shí)在部分層級(jí)加入BN(BatchNorm)處理過(guò)程,通過(guò)規(guī)范化手段保證每一層神經(jīng)網(wǎng)絡(luò)的輸入保持相同分布,減少梯度消失的影響;模型右側(cè)為擴(kuò)展通道,包括反卷積與拼接等處理過(guò)程;模型最后一層結(jié)構(gòu)為1×1×1的卷積操作,得到單個(gè)特征圖層,使用SIGMOID函數(shù)將特征圖像素類(lèi)別映射為0~1之間的概率值,獲取分類(lèi)結(jié)果。
針對(duì)待分類(lèi)的三類(lèi)耕地,根據(jù)數(shù)據(jù)量及數(shù)據(jù)特征分別訓(xùn)練特定的模型,從而更好地對(duì)每一類(lèi)網(wǎng)絡(luò)進(jìn)行微調(diào),訓(xùn)練過(guò)程設(shè)置批次大小為2,學(xué)習(xí)率0.001,以最小化交叉熵?fù)p失函數(shù)為目標(biāo)。將訓(xùn)練完成的模型應(yīng)用于不同時(shí)期遙感影像進(jìn)行耕地信息提取,結(jié)合判別流程,共同確定耕地類(lèi)型。判別方法流程如圖4所示。
圖4 耕地信息輔助判別方法流程圖
我國(guó)對(duì)于基本農(nóng)田有著明確的保護(hù)條例,在劃定為基本農(nóng)田的區(qū)域內(nèi)只允許種植棉、糧、油等作物,禁止發(fā)展林果業(yè)或作其他用途。本文根據(jù)條例規(guī)定并結(jié)合研究區(qū)種植特點(diǎn),設(shè)計(jì)耕地類(lèi)型信息輔助判別條件如下:
(1)農(nóng)田。野外實(shí)地調(diào)查結(jié)果顯示,研究區(qū)內(nèi)除棉田外,其余耕地類(lèi)型均不屬農(nóng)田范疇,但由于部分棉田區(qū)域采用果棉套種耕作方式,農(nóng)田最終分類(lèi)結(jié)果中應(yīng)剔除此類(lèi)耕地區(qū)域,在判別流程圖中表現(xiàn)為首先采用棉田訓(xùn)練模型對(duì)夏季數(shù)據(jù)進(jìn)行識(shí)別,初步篩選出具有棉田特征的耕地區(qū)域,隨后使用果林訓(xùn)練模型對(duì)冬季數(shù)據(jù)中果林區(qū)域進(jìn)行提取,通過(guò)比較兩種模型的識(shí)別結(jié)果,若同一區(qū)域在夏季數(shù)據(jù)中的識(shí)別結(jié)果為棉花,而在冬季數(shù)據(jù)中的識(shí)別結(jié)果為果林,則將此類(lèi)區(qū)域在棉田的識(shí)別結(jié)果去除,劃分為果林耕地,同時(shí)把剩余棉田耕地區(qū)域以農(nóng)田的形式在提取結(jié)果中呈現(xiàn)。
(2)果林耕地。研究區(qū)中的果林耕地區(qū)域在冬季數(shù)據(jù)中的特征最為明顯,即使部分區(qū)域采用果棉套種的耕作方式,依據(jù)我國(guó)的耕地劃分標(biāo)準(zhǔn),此類(lèi)區(qū)域應(yīng)劃分為果林耕地,在判別流程圖中表現(xiàn)為將果林訓(xùn)練模型在冬季數(shù)據(jù)中的識(shí)別結(jié)果即劃定為果林耕地。
(3)未耕種耕地。研究區(qū)冬夏兩期數(shù)據(jù)中均包含無(wú)植被覆蓋耕地,且特征較為相似,為保證模型訓(xùn)練樣本的充分性,同時(shí)利用冬夏兩期無(wú)植被覆蓋區(qū)域進(jìn)行模型訓(xùn)練識(shí)別,并以夏季無(wú)植被覆蓋區(qū)域?yàn)橹?劃定未耕作耕地區(qū)域。
為驗(yàn)證U-Net模型農(nóng)田信息提取的有效性及適用性,分別使用棉田訓(xùn)練模型、果林訓(xùn)練模型以及未耕作耕地訓(xùn)練模型對(duì)典型區(qū)域進(jìn)行地塊識(shí)別,每類(lèi)模型識(shí)別結(jié)果均為二值化分類(lèi)圖,并采用機(jī)器學(xué)習(xí)常用評(píng)判指標(biāo)準(zhǔn)確度A(Accuracy)、精確度P(Precision)和召回率R(Recall)進(jìn)行量化評(píng)價(jià),以棉田耕地為例,各指標(biāo)計(jì)算方法與定義如下:
式(3)至(5)中TP為正確識(shí)別的棉田田塊數(shù)量,FP為其他田塊識(shí)別為棉田田塊的數(shù)量,FN棉田田塊識(shí)別為其他田塊的數(shù)量,TN為正確識(shí)別的其他田塊數(shù)量。
通過(guò)本文方法對(duì)3處典型地塊進(jìn)行耕地信息提取,為保證地物多樣性,數(shù)據(jù)時(shí)相均為夏季遙感數(shù)據(jù),每處區(qū)域尺寸為4 000×4 000像素,覆蓋面積為16 km2,第1處區(qū)域包含棉花、果林和其他地物,第2處區(qū)域由棉花、裸地及其他地物構(gòu)成,第3處區(qū)域?yàn)楣?、裸地和其他地?區(qū)域中部分標(biāo)簽及提取結(jié)果如圖5所示,提取結(jié)果評(píng)價(jià)參數(shù)準(zhǔn)確度、精確度和召回率如表2所示。
圖5 測(cè)試區(qū)部分標(biāo)簽及分類(lèi)結(jié)果圖
表2 測(cè)試區(qū)提取精度統(tǒng)計(jì)
提取結(jié)果(表2)表明:
(1)3處測(cè)試區(qū)域均取得了較好的分類(lèi)效果,其中對(duì)于棉花覆蓋的地塊識(shí)別準(zhǔn)確度最高,可達(dá)93.85%。對(duì)果林耕地進(jìn)行提取時(shí),部分區(qū)域在冬季數(shù)據(jù)中的識(shí)別結(jié)果為果林,在夏季數(shù)據(jù)中則識(shí)別為棉花,這是由于研究區(qū)部分田地存在棉花與棗林的套種現(xiàn)象,冬季數(shù)據(jù)中不包含棉花特征,而夏季數(shù)據(jù)中棉花的特征反映較為明顯,導(dǎo)致冬夏數(shù)據(jù)中識(shí)別結(jié)果不一致。根據(jù)農(nóng)田使用分類(lèi)標(biāo)準(zhǔn),將此類(lèi)地塊在結(jié)果成劃分為果林耕地。
(2)未耕作地塊類(lèi)型主要為拋荒耕地,在模型提取過(guò)程中存在部分拋荒耕地未識(shí)別出的情況。原因在于本文選取的研究區(qū)位于沙漠邊緣,根據(jù)當(dāng)?shù)貧夂蛱攸c(diǎn),夏季種植有棉花的農(nóng)田收獲后會(huì)進(jìn)行大規(guī)模秋翻,在標(biāo)記的冬季樣本數(shù)據(jù)中,大多數(shù)是屬于翻整后的耕地,其紋理特征與拋荒的耕地有區(qū)別,且被拋荒耕地多有雜草等其他野生植被覆蓋,光譜特征不一,因此存在未識(shí)別出拋荒耕地。
本文方法可以較好滿(mǎn)足荒漠區(qū)農(nóng)田信息提取要求,為進(jìn)一步探索其優(yōu)劣所在,本文選取目前常用的SVM和隨機(jī)森林分類(lèi)器進(jìn)行識(shí)別效果比較。根據(jù)研究區(qū)待分類(lèi)目標(biāo)數(shù)量,采用一對(duì)一法逐步構(gòu)建SVM分類(lèi)器,選取徑向基函數(shù)作為分類(lèi)器核函數(shù),同時(shí)為了避免重要參數(shù)懲罰因子C和核函數(shù)參數(shù)γ選取不當(dāng)帶來(lái)的過(guò)擬合或欠擬合問(wèn)題,選用基于交叉驗(yàn)證的網(wǎng)格搜尋法確定參數(shù)取值。隨機(jī)森林作作為一個(gè)結(jié)合bagging集成學(xué)習(xí)理論與隨機(jī)空間理論的新型機(jī)器學(xué)習(xí)方法,其實(shí)質(zhì)是利用多個(gè)決策分類(lèi)器投票確定最終分類(lèi)結(jié)果。本文通過(guò)研究區(qū)子樣本集構(gòu)建決策樹(shù),生成包含n棵決策樹(shù)的隨機(jī)森林分類(lèi)器,從子樣本的分類(lèi)特征集中選出m個(gè)最優(yōu)分類(lèi)特征用于該決策樹(shù)分類(lèi),同時(shí)將子樣本以外數(shù)據(jù)作為袋外數(shù)據(jù),計(jì)算泛化誤差,逐步優(yōu)化分類(lèi)器決策樹(shù)個(gè)數(shù)n和分類(lèi)特征m,完成隨機(jī)森林分類(lèi)器的構(gòu)建。
本文使用3種方法對(duì)研究區(qū)中典型區(qū)域進(jìn)行提取測(cè)試,3種方法提取效果的準(zhǔn)確度、完整度與精度統(tǒng)計(jì)如圖6所示。由圖6可以看出:
圖6 三種分類(lèi)方法精度比較
(1)測(cè)試區(qū)域中3種分類(lèi)方法對(duì)于棉花覆蓋耕地的提取效果都相對(duì)較好,其中U-Net模型提取準(zhǔn)確度為90.83%,隨機(jī)森林次之為87.06%,支持向量機(jī)準(zhǔn)確度為86.13%。研究區(qū)內(nèi)棉田分布范圍最廣,可提供的樣本數(shù)量與特征同樣最多,這對(duì)于同屬于監(jiān)督學(xué)習(xí)算法的3種分類(lèi)方法有著數(shù)據(jù)上的優(yōu)勢(shì),因此也獲得了良好的分類(lèi)效果。
(2)針對(duì)環(huán)境復(fù)雜、像素特征交錯(cuò)的果林耕地區(qū)域,SVM和隨機(jī)森林分類(lèi)模型均產(chǎn)生了“椒鹽噪聲”現(xiàn)象,提取結(jié)果中果林與耕地像元混合嚴(yán)重,準(zhǔn)確度分別為83.72%、84.62%,使用U-Net模型結(jié)合耕地類(lèi)型判別方法則可以較好的對(duì)果林耕地區(qū)域進(jìn)行提取,減少“椒鹽噪聲”的影響,識(shí)別準(zhǔn)確度可達(dá)88.39%。
(3)由于未耕作耕地與裸土的光譜及紋理差異性較小,3種分類(lèi)方法的提取效果均不如棉田與果林區(qū)域,SVM分類(lèi)器出現(xiàn)大量將荒漠裸土識(shí)別為未耕作耕地的錯(cuò)分現(xiàn)象,識(shí)別準(zhǔn)確度僅為73.40%,UNet模型結(jié)合判別方法的提取結(jié)果中雖存在未識(shí)別的輪休期及拋荒耕地,但沒(méi)有出現(xiàn)嚴(yán)重的錯(cuò)分現(xiàn)象,將荒漠區(qū)域識(shí)別為耕地,整體提取效果優(yōu)于其他2種分類(lèi)方法,識(shí)別準(zhǔn)確度為79.51%。
按本文方法提取研究區(qū)耕地類(lèi)型,獲取識(shí)別結(jié)果,再結(jié)合野外調(diào)查數(shù)據(jù),驗(yàn)證其分類(lèi)效果,結(jié)果表明:總體來(lái)看,研究區(qū)內(nèi)耕地識(shí)別效果良好,各類(lèi)型耕地空間分布特征與實(shí)際情況相一致,棉田覆蓋面積最廣,荒漠邊緣河流沿岸均有棉田分布,果林耕地?cái)?shù)量較少,且多分布于荒漠區(qū)綠洲耕地的中央?yún)^(qū)域,荒漠邊緣未出現(xiàn)果林耕地,未耕作耕地分布零散,在荒漠邊緣及大塊棉田周邊均存在未耕作耕地。
本文選取GF-1遙感影像,通過(guò)深度學(xué)習(xí)的方法對(duì)荒漠區(qū)耕地類(lèi)型進(jìn)行提取,利用冬夏不同物候期耕地光譜及紋理類(lèi)型的差異性,將夏季數(shù)據(jù)NDVI值和冬季數(shù)據(jù)灰度共生矩陣能量值作為特征波段加入原始影像,進(jìn)行訓(xùn)練,分別獲取棉田、果林耕地、未耕作耕地的U-Net提取模型,綜合判別條件確定最終耕地提取結(jié)果,同時(shí)與傳統(tǒng)的遙感影像分類(lèi)方法進(jìn)行比較分析,得出結(jié)論如下:
(1)采用U-Net模型對(duì)研究區(qū)耕地類(lèi)型進(jìn)行判別,棉田區(qū)域的識(shí)別準(zhǔn)確度最高,可達(dá)90.83%,果林耕地與未耕種耕地的提取效果同樣優(yōu)于傳統(tǒng)分類(lèi)方法。表明借助深度學(xué)習(xí)的方法可有效挖掘高分辨率遙感影像地塊特征,能實(shí)現(xiàn)荒漠區(qū)綠洲性耕地提取和狀態(tài)監(jiān)測(cè)。
(2)充分利用冬夏兩季不同時(shí)期的物候特征,根據(jù)當(dāng)?shù)剞r(nóng)業(yè)耕種類(lèi)別和不同模型識(shí)別結(jié)果,設(shè)計(jì)合理的地塊類(lèi)型判別方法,可一定程度上提升對(duì)研究區(qū)套種耕地的判別準(zhǔn)確度,減少由于像元混合帶來(lái)的錯(cuò)分效果。
(3)將荒漠區(qū)綠洲性耕地劃分為農(nóng)田、果林耕地及未耕作耕地三類(lèi)地塊進(jìn)行分類(lèi),可充分反映該地區(qū)永久性基本農(nóng)田的保護(hù)情況、新開(kāi)墾和傳統(tǒng)耕地的利用情況,這對(duì)于及時(shí)掌握可用耕地面積及類(lèi)型的變化和維護(hù)荒漠區(qū)的生態(tài)環(huán)境穩(wěn)定具有重要意義。