徐曉臣,李昺星
(中水北方勘測(cè)設(shè)計(jì)研究有限責(zé)任公司,天津 300222)
耕地是糧食生產(chǎn)的重要載體,耕地資源的變化嚴(yán)重影響著國(guó)家糧食安全。根據(jù)聯(lián)合國(guó)糧食及農(nóng)業(yè)組織(FAO)預(yù)測(cè),截至2050年,全球作物產(chǎn)量需要比2005年增加70%才能滿足全球93 億人的糧食需求[1]。此外,人口數(shù)量不斷增長(zhǎng),城市面積不斷擴(kuò)張,使得現(xiàn)有的耕地資源持續(xù)被破壞,因此及時(shí)了解耕地資源的空間分布至關(guān)重要。
傳統(tǒng)的耕地信息獲取多來(lái)源于人工實(shí)地考察,費(fèi)時(shí)費(fèi)力,并且容易出現(xiàn)錯(cuò)誤。遙感技術(shù)的快速發(fā)展,使得遙感圖像在農(nóng)業(yè)領(lǐng)域的應(yīng)用越來(lái)越多[2]。耕地是LULC 重要的一部分,雖然目前可用的全球土地利用/土地覆蓋(LULC)產(chǎn)品眾多,如MODIS 土地覆蓋數(shù)據(jù)產(chǎn)品MCD12Q1(空間分辨率為500 m)、全球30 m 地表覆蓋遙感數(shù)據(jù)產(chǎn)品Globe Land30、清華大學(xué)宮鵬團(tuán)隊(duì)土地覆蓋數(shù)據(jù)FROM-GLC 等,但在南方丘陵地區(qū)精度難以滿足現(xiàn)有研究需求。歐洲航天局(ESA)發(fā)射的Sentinel-2(S2),使得10 m 空間分辨率耕地信息獲取成為可能。農(nóng)業(yè)種植的復(fù)雜性、地物類型間的光譜相似性以及光學(xué)影像受天氣影響的限制,導(dǎo)致目前部分南方地區(qū)耕地信息的提取精度不高[3]。Sentinel-1(S1)合成孔徑雷達(dá)(SAR)數(shù)據(jù)具有穿云透霧的優(yōu)勢(shì),可在一定程度上彌補(bǔ)光學(xué)數(shù)據(jù)缺失帶來(lái)的負(fù)面影響。
遙感云計(jì)算平臺(tái)——谷歌地球引擎(Google Earth Engine,GEE)的出現(xiàn),使得多云多雨地區(qū)遙感圖像預(yù)處理及分類變得更加便捷[4]。目前,GEE 平臺(tái)已集成多種分類器方法,如支持向量機(jī)(SVM)、隨機(jī)森林(RF)、Cart 決策樹(shù)等,利用構(gòu)建的特征數(shù)據(jù)集進(jìn)行機(jī)器學(xué)習(xí),能夠快速準(zhǔn)確地獲取地物分類結(jié)果。目前,有關(guān)結(jié)合使用S1 與S2 進(jìn)行耕地信息提取的研究較多,但卻沒(méi)有對(duì)南方多云多雨復(fù)雜地形地區(qū)進(jìn)行分析,同時(shí)未對(duì)S1 極化指數(shù)進(jìn)行進(jìn)一步的分析。有鑒于此,本文基于GEE 云計(jì)算平臺(tái),結(jié)合Sentinel-1和Sentinel-2 數(shù)據(jù)構(gòu)建多種特征組合,探究不同組合對(duì)福州市耕地提取的影響。
福州市位于北緯25° 15′~26° 39′、東經(jīng)118°08′~120°31′。其地貌為典型的河口盆地,丘陵地區(qū)占土地總面積的72.68%,四面環(huán)山,海拔多為600~1 000 m,地勢(shì)自西向東傾斜。受東亞季風(fēng)影響,福州屬亞熱帶濕潤(rùn)氣候,日照長(zhǎng),雨量充足。
本文利用GEE 平臺(tái)通過(guò)加載“COPERNICUS/S1_GRD”數(shù)據(jù)集,即可獲得預(yù)處理后的Sentinel-1 GRD 數(shù)據(jù)集,該數(shù)據(jù)集中的數(shù)據(jù)均經(jīng)過(guò)Sentinel-1 Toolbox 工具箱的預(yù)處理,生成可直接調(diào)用的數(shù)據(jù)。其預(yù)處理過(guò)程包括軌道校正、邊界噪聲去除、熱噪聲去除、輻射校正、地形校正。為了減少散斑噪聲,分別設(shè)置不同窗口大?。?×3 或5×5)和不同類型的散斑濾波器進(jìn)行初步測(cè)試,經(jīng)過(guò)對(duì)比分析,最終選擇5×5 窗口大小的Refined Lee 濾波。
Sentinel-2 數(shù)據(jù)共有13 個(gè)波段信息,通過(guò)GEE 平臺(tái)加載“COPERNICUS/S2_SR”數(shù)據(jù)集,便可獲得預(yù)處理后的圖像,預(yù)處理包括幾何校正、輻射定標(biāo)和大氣校正??紤]到福州市的耕地種植情況,為提高耕地分類精度,選擇2020年4—10月、云量小于40%的Sentinel-2 影像,對(duì)篩選后的數(shù)據(jù)集進(jìn)行云掩膜和中值合成等處理,進(jìn)而生成福州市無(wú)云影像。
根據(jù)國(guó)土資源修訂的國(guó)家標(biāo)準(zhǔn)《土地利用現(xiàn)狀分類》(GB/T 21010—2017)分類標(biāo)準(zhǔn),結(jié)合福州市實(shí)際土地利用情況,將福州市土地分為5 大類:耕地、林地、水體、建設(shè)用地和未利用地。本文中的樣本數(shù)據(jù)主要來(lái)源于2020年谷歌歷史影像數(shù)據(jù)及野外考察數(shù)據(jù),樣本總數(shù)為645 個(gè),其中訓(xùn)練樣本占70%(451 個(gè)),驗(yàn)證樣本占30%(194 個(gè))。
輔助數(shù)據(jù)主要為SRTM 的數(shù)字高程模型(DEM)數(shù)據(jù),利用GEE 平臺(tái)中的ee.Algorithms.Terrain 函數(shù)對(duì)該數(shù)據(jù)進(jìn)行計(jì)算便可得到研究區(qū)高程、坡度和坡向數(shù)據(jù)。
聯(lián)合S1、S2 以及地形數(shù)據(jù)派生出5 種特征類型,共計(jì)31 個(gè)特征變量,包括S2 10 個(gè)光譜波段特征和光譜指數(shù)特征,S1 2 個(gè)極化波段特征和極化指數(shù)特征,以及3 個(gè)SRTM 數(shù)據(jù)派生的地形特征。光譜指數(shù)、極化指數(shù)和地形特征均由GEE平臺(tái)計(jì)算得出,指數(shù)包括歸一化植被指數(shù)(NDVI)、歸一化紅邊植被指數(shù)(NDVIre)、增強(qiáng)歸一化水體指數(shù)(MNDWI)、歸一化土壤水分指數(shù)(NSWI)、歸一化建筑指數(shù)(NDBI)、歸一化水體指數(shù)(NDWI)、增強(qiáng)植被指數(shù)(EVI)、地表水指數(shù)(LSWI)、土壤調(diào)節(jié)植被指數(shù)(SAVI)、修改型土壤調(diào)整植被指數(shù)(MSAVI)、歸一化燃燒指數(shù)(NBR2)、裸土指數(shù)(BSI)、歸一化差極化指數(shù)(NDPI)、歸一化VH指數(shù)(NVHI)、歸一化VV指數(shù)(NVVI)、偏光比(VHrVV),地形特征包括高程、坡度和坡向。
為了分析不同特征組合對(duì)土地利用分類的影響,設(shè)計(jì)7組特征組合對(duì)比實(shí)驗(yàn),如表1所示,實(shí)驗(yàn)1~3 均包含S2數(shù)據(jù)特征組合,實(shí)驗(yàn)4~6 均包含S1 數(shù)據(jù)特征組合,實(shí)驗(yàn)7 則包含S2 和S1 特征組合。
表1 分類特征組合
隨機(jī)森林是Breiman 提出的一種機(jī)器學(xué)習(xí)方法,它是一種基于決策樹(shù)的分類器,其中每棵樹(shù)貢獻(xiàn)一票,通過(guò)投票獲得最終的分類或預(yù)測(cè)結(jié)果[5]。大量研究表明,隨機(jī)森林在LULC 分類中產(chǎn)生了相對(duì)較高的分類精度。同時(shí),RF 方法具有參數(shù)容易設(shè)置的優(yōu)點(diǎn),同時(shí)具有管理共線特征和高維數(shù)據(jù)的能力,并且對(duì)過(guò)擬合和異常值具有較高的魯棒性。設(shè)置兩個(gè)參數(shù)mtry 和ntree,前人的研究表明,ntree 設(shè)置為100,mtry 默認(rèn)為輸入特征總數(shù)的平方根,能有效提高模型的穩(wěn)定性。
采用混淆矩陣方法,計(jì)算不同特征組合分類精度。如表2所示,實(shí)驗(yàn)1 的分類精度最低(OA 為47.06%,Kappa系數(shù)為0.30),引入極化指數(shù)后,土地利用分類精度并未得到較大提升,耕地生產(chǎn)者精度和用戶精度提升1%以上,說(shuō)明極化信息對(duì)耕地信息提取具有一定的影響。而引入高程信息后(實(shí)驗(yàn)6),土地利用分類的總體精度顯著提高(達(dá)到79.74%),Kappa 系數(shù)達(dá)到0.73,耕地生產(chǎn)者精度和用戶者精度均超過(guò)75%。而單獨(dú)使用S2 光譜波段特征時(shí)(實(shí)驗(yàn)1),土地利用分類精度達(dá)到84.31%,相較于S1 極化波段特征組合精度提高了37.25%。引入S2 指數(shù)特征后,總體精度并未發(fā)生明顯變化,但耕地生產(chǎn)者精度和用戶精度均明顯提高,尤其是用戶者精度提高了14.93%,說(shuō)明S2 植被指數(shù)對(duì)耕地信息提取具有較大的貢獻(xiàn)。S2 組合引入地形特征后,其總體精度提高2.72%,用戶者精度進(jìn)一步提高,生產(chǎn)者精度有所下降。
表2 不同特征組合土地利用分類精度
從表中可以看出,光譜波段信息的引入顯著提升了耕地信息的提取效果,地形特征的引入對(duì)土地利用分類精度的提升也做出了較大的貢獻(xiàn)。而S2 及衍生特征數(shù)據(jù)在分類精度上明顯優(yōu)于S1。精度最高的為實(shí)驗(yàn)7,將所有特征引入后,總體精度達(dá)到90.17%,kappa 系數(shù)為0.87,其中耕地生產(chǎn)者精度和用戶者精度均達(dá)到最大值,分別為87.88%和93.55%。從整體來(lái)看,S1 極化與極化指數(shù)特征對(duì)耕地信息的提取也發(fā)揮了一定的作用。實(shí)驗(yàn)4 和實(shí)驗(yàn)5 的OA 和PA精度最低,主要是因?yàn)镾1 特殊的成像機(jī)制導(dǎo)致其分類精度較低,但S1 與S2 結(jié)合能進(jìn)一步提高S2 耕地信息提取的精度。
通過(guò)4.1 小節(jié)分析得出,實(shí)驗(yàn)7 特征組合土地利用分類精度最高,但是由于不同分類特征間存在多重共線關(guān)系,造成數(shù)據(jù)冗余降低分類精度。本文利用GEE 平臺(tái)中的explain 函數(shù)對(duì)全特征組合進(jìn)行特征重要性分析,重要性得分越高,說(shuō)明變量對(duì)分類結(jié)果的貢獻(xiàn)越大。通過(guò)對(duì)特征進(jìn)行重要性排序,剔除排名后20%的特征,直至分類精度趨于穩(wěn)定。最終選擇20 個(gè)最優(yōu)特征組合,結(jié)果如圖1所示。從圖2中可以看出,NBR2 對(duì)土地利用分類精度的貢獻(xiàn)率最大,與前人的研究較為一致。坡度對(duì)土地利用分類的貢獻(xiàn)率也較大,主要是由于福州市土地利用類型受地形因素影響較大,其中坡度較大的區(qū)域多為林地,地勢(shì)平坦的區(qū)域多為耕地和建設(shè)用地。整體來(lái)看,波段光譜信息和極化波段信息對(duì)土地利用的貢獻(xiàn)率相對(duì)較小,僅VV 極化、B2、B3、B12 和B4 沒(méi)有被篩選掉,其中VV 極化特征的重要性較高。
圖1 特征優(yōu)選后特征重要性排序
基于最優(yōu)特征組合隨機(jī)森林方法得到了福州市土地利用分類結(jié)果圖,如圖2所示,其總體精度為92.37%,Kappa 系數(shù)為0.89。從圖中可以看出,2020年福州市主要的土地利用類型為林地和耕地,其中,林地占研究區(qū)總面積的50%以上,耕地面積為1 685.73 km2,僅占研究區(qū)總面積的12.33%。耕地主要集中分布在地勢(shì)相對(duì)平坦的中部及東部沿海地區(qū),而西部山區(qū)耕地分布則較為分散。
圖2 2020年福州市土地利用分類結(jié)果
本文基于GEE 云計(jì)算平臺(tái),綜合利用Sentinel-1 和Sentinel-2 數(shù)據(jù)構(gòu)建不同特征組合,通過(guò)隨機(jī)森林分類方法獲得了福州市耕地信息。結(jié)果表明,單獨(dú)使用Sentinel-2 數(shù)據(jù)集比單獨(dú)使用Sentinel-1 數(shù)據(jù)集分類精度高,通過(guò)使用全特征組合數(shù)據(jù)集獲得最佳精度(總體精度為90.17%,kappa 系數(shù)為0.87)。在特征重要性選擇中,發(fā)現(xiàn)NBR2 指數(shù)、坡度和VV極化對(duì)于土地利用分類較為重要,Sentinel-2 指標(biāo)指數(shù)和地形特征的引入使得耕地生產(chǎn)者精度和用戶者精度得到顯著提升。通過(guò)特征優(yōu)選后的隨機(jī)森林方法得到福州市土地利用分類結(jié)果,總體精度為92.37%,其中耕地UA 和PA 均大于85%。
雖然本文耕地信息提取中獲得較高的精度,但由于福州市地形復(fù)雜,閩清縣和永泰縣與福清市和長(zhǎng)樂(lè)區(qū)地形差異較大,因此模型的預(yù)測(cè)結(jié)果存在一定的差異性,但整體精度均大于90%。目前,Google cloud platform(GCP)平臺(tái)能夠與GEE 結(jié)合進(jìn)行遙感圖像深度學(xué)習(xí)分類,借助公開(kāi)數(shù)據(jù)集和成熟的深度學(xué)習(xí)框架進(jìn)行大尺度的耕地信息提取。在今后的研究工作中,將引入GEE 深度學(xué)習(xí),更加充分地利用該平臺(tái)海量數(shù)據(jù)源與算力。