郭 濤,王 思,劉泳伶,黃 平,李 疆
(四川省農業(yè)科學院遙感與數字農業(yè)研究所,成都610066)
我國自然資源缺乏,2017年中央全面深化改革領導小組正式審議通過《領導干部自然資源資產離任審計規(guī)定(試行)》,明確提出領導干部離任將對自然資源資產進行審計。2020年國家出臺了《陸地生態(tài)系統(tǒng)生產總值(GEP)核算技術指南》為陸地生態(tài)系統(tǒng)資產化管理、生態(tài)功能區(qū)劃、生態(tài)補償決策等提供工作指南。其中陸地生態(tài)系統(tǒng)資產化評估主要涉及農田、森林、草地等自然資源生態(tài)系統(tǒng)的供給、調節(jié)、支持和美學等生態(tài)價值,當前,上述自然資源數據收集手段落后、要素不全、數據斷檔、數更新頻率不一致、無空間信息等問題,要在一系列空間尺度上實現(xiàn)自然資源管理的績效評估存在長時間滯后。因此,開發(fā)一個自動化、業(yè)務化運行的自然資源動態(tài)監(jiān)測系統(tǒng)迫在眉睫。
隨著地理大數據、云計算的不斷發(fā)展,基于云地理空間信息分析平臺越來越成為國內外學者重要研究內容之一,谷歌地球引擎(Google Earth Engine,GEE)借助于Google強大的云計算和存儲能力,可以大幅度減少數據獲取和處理的工作量,已經成為海量遙感大數據科學研究的重要工具[1]。憑借云計算優(yōu)勢可實現(xiàn)對不同尺度的遙感大數據進行快速處理、挖掘和分析,提升了遙感產品的生產效率和大范圍遙感影像處理提供了新的機遇[2]。
目前,應用GEE云平臺,國內外學者已經開展了大量的科學研究工作,在全球森林分布和變化監(jiān)測、土地覆蓋/土地利用、農作物結構等方面進行了大量的研究探索,并形成了較多成果[3-5]。Xiong等[6]利用Landsat、Sentinel-2、SRTDEM等數據,基于9791個樣本點,提取了非洲30 m的耕地數據,耕地總體精度達到了94%。Chen等[7]使用Landsat 7/8、Sentinel-1 A影像和DEM數據對中國紅樹林進行了識別,制作了紅樹林分布圖。Dong等[8]應用GEE云平臺對亞洲北部的水稻種植范圍進行提取,并通過Google Earth和2萬張實地拍攝照片進行精度對比驗證,其精度高達90%以上。Dong等[9]采用深度學習和樣本遷移技術等算法,生產了3 m分辨率地圖覆蓋制圖產品,總體解譯精度達到86%。柴旭榮等[10]基于GEE云平臺利用隨機森林監(jiān)督學習算法對山西省1990年、2000年、2010年和2017年土地覆蓋進行了快速分類,分類結果與CNLUCC、GlobalLand30和FROM-GCL等現(xiàn)有的產品相比,總體精度提升了5%~10%,達到了86%~94%。何昭欣等[11]基于GEE,計算了遙感指數、紋理特征和地形特征,使用了樸素貝葉斯、支持向量機、分類回歸樹和隨機森林4種分類器,并比較了各分類器的分類精度,提取了小麥與油菜的空間分布信息。何麗[12]基于GEE對湄公河流域資源環(huán)境關鍵要素進行了自動提取與動態(tài)監(jiān)測,并進行了時空分析研究。董欣等[13]基于GEE云平臺隨機森林算法對2017—2019年京津冀地區(qū)影像進行地物分類,并對其生態(tài)服務價值進行了定量估算。
文章基于GEE提供的JavaScript API,高效構建自然資源遙感云計算監(jiān)測服務平臺,并利用計算得出的植被指數、水體指數等指標提取、識別和記錄了地物輪廓以及特征,同時運用機器學習算法對其進行訓練,根據形成的樣本庫進而對遙感影像進行高精度解譯,最終通過Earth Engine Apps發(fā)布成果。該文構建的自然資源遙感云計算監(jiān)測服務平臺采用系統(tǒng)自動化方法,可以極大提高平臺的運行效率,以期為西南地區(qū)甚至全國尺度的自然資源地物類別識別、提取自然資源資產動態(tài)監(jiān)測以及績效評估等業(yè)務化工作提供了技術路線參考。
GEE是構建在云計算平臺基礎之上的地理空間數據挖掘和計算綜合性分析平臺。通過結合海量地理空間信息數據,采取所寫即所見的交互編程模式,幫助用戶可以基于平臺任意構建自己的模型算法和思想。該平臺提供豐富的計算、處理和分析的API接口,技術人員可以根據實際需求快速完成對地物特征識別和變化趨勢分析等模塊的開發(fā)工作。該文以自然資源遙感動態(tài)變化監(jiān)測作為場景,開發(fā)自然資源遙感云計算監(jiān)測服務平臺,可以為國內外后續(xù)相關研究思路提供參考和借鑒。
GEE作為在線遙感云計算平臺,其平臺架構設計主要包含4部分[14]。
(1)數據存儲服務:這是GEE特色,GEE集成了PB級公共遙感影像產品,并對其進行了預處理,用戶只需要在線調用已有的API接口即可快速完成地理空間數據分析且可以上傳自己本地的數據和代碼進行相關分析。GEE提供了數據存儲服務和瓦片服務,可在線調用相關數據和GIS服務。
(2)計算服務:主要提供了實時計算服務和異步計算服務。本研究涉及的數據是四川省理縣近20年的遙感影像,數據量較大,GEE可以提供強大的底層算力作為快速機器學習的基礎,這也是其特色和優(yōu)勢。
(3)API接口:GEE分別提供了Javascript版本和Python版本的API庫,這些接口庫可以給用戶開展數據分析工作提供強大的技術支持,進一步提高了分析和可視化地理空間大數據的便利性,即無需用戶自己配備超級計算機設備,就可以完成任務。
(4)前臺調用,采用GEE自帶的編輯器Code Editor以及第三方的Web Apps,實現(xiàn)所寫即所得,框架結構如圖1所示。
圖1 GEE遙感平臺框架Fig.1 Remotesensing platform for GEE
該文主要采用Landsat OLI,MODIS和Sentinel-2等多源遙感數據,用于自然資源指標提取,具體情況可見表1。
表1 GEE共享數據集Table1 GEE shared data setsused in thestudy
通過時相、位置以及去云等預處理,通過GEE計算歸一化差異植被指數(NDVI)、增強型植被指數(EVI)、比值植被指數(RVI)、反射率之差計算(DVI)以及土壤調節(jié)植被指數(SAVI)[15-16],具體公式見表2所示。基于MODIS數據,分別基于250 m、500 m分辨率提取2000—2019年四川省理縣周、月和年NDVI、EVI、RVI、DVI和SAVI等植被指數數據產品。
表2 植被指數表達式Table2 Vegetation index expression
該文利用Landsat數據,采用歸一化差異水體指數(NDWI)、歸一化差異水體指數(MNDWI)、NDWIGao等對水體進行提取以及采用歸一化建筑指數(NDBI),具體表3所示[17-19]。
表3 水體指數表達式Table3 Water body index expression
該文采用3種不同分類器進行分類和訓練,分別是決策樹、隨機森林和支持向量機對自然資源地物地類進行提取。
(1)決策樹。決策樹方法是Breiman在1984年提出的一種決策樹學習分類器[20]?;驹碇饕峭ㄟ^一種遞歸策略分割數據空間并在每個分區(qū)內擬合一個預測模型來預測連續(xù)空間變量(回歸)和目標變量(分類),以達到從訓練數據構建模型的預測方法[21]。這種以二叉樹形式的決策模型結構簡單、運行速度快,準確率高,能夠有效處理大量數據和高維數據等優(yōu)點。
(2)隨機森林。隨機森林是通過構建每顆分類樹的集合,也是隨機森林算法的核心關鍵[22]。隨機選擇即從原始數據中以bootstrap抽樣策略選取訓練樣本,并生成決策樹。剩下的樣本作為Out-of-bag數據用于交叉驗證,用于評估隨機森林算法分類精度,使用Gini系數確定決策樹的分裂條件,集合每顆決策樹,構建成隨機森林。隨機森林可以處理海量的遙感圖像數據,處理速度快,適用于多類別和多特征等復雜場景[11,23-24]。在算法設計過程中,重點對決策樹的數量和節(jié)點生長時的特征參數的數量進行了重點研究,主要目的是提高算法的泛化能力,避免過擬合。
(3)支持向量機。支持向量機是基于統(tǒng)計學理論尋求高維特征空間中最優(yōu)的分類超平面,對復雜數據具有卓越的處理性能[25]。其主要是尋求數據間內在關系,可以很好地處理非線性決策邊界,通過選擇核函數將線性學習器拓展成非線性學習器。支持向量機基本原理如下:①對于非線性可分數據,通過提升數據維度,把數據映射到高維空間,把非線性問題轉換為線性可分問題;②對于樣本特征空間通過核函數來實現(xiàn)超平面的劃分,實現(xiàn)樣本中不同類型距離最大化。支持向量機適合具有一定樣本數量的數據,其泛化能力強,適用于遙感圖像的分類[26-27]。
該文構建的自然資源遙感云計算監(jiān)測服務平臺,主要借助GEE平臺集成的海量地理空間數據、機器學習算法、可視化和分析計算能力。以四川省理縣為例,利用MODIS、Landsat和Sentinel-2等近20年植被指數、水體指數、建筑指數、干旱指數和自然資源地物分類數據產品計算。
該文使用決策樹、隨機森林和支持向量機3類分類器,在GEE中實現(xiàn)四川省理縣自然資源地物分類提取,驗證精度采取交叉驗證策略。具體流程:(1)在1 722個樣本點中獨立隨機生成10次,確保每次生成的樣本不重復,具有隨機性;(2)將所有樣本劃分,按照7∶3比例作為訓練樣本和測試,并對其精度驗證;(3)將3個算法分類結果與歐空局2020年10 m分辨率的全球土地覆蓋產品進行對比分,該文3個算法總體驗證精度在82%~87%,研究結果如圖2所示,在理縣受地形影像,在河谷平坦地帶裸露/稀疏植被、建筑區(qū)和灌木叢錯綜交叉,存在錯分漏分現(xiàn)象。
圖2 不同算法的自然資源遙感影像分類結果:a.決策樹,b.隨機森立,c.支持向量機,d.歐空局Fig.2 Classification resultsof remotesensing imagesof natural resourcesbased on different algorithms
結合理縣生態(tài)系統(tǒng)特點和專家經驗,構建了理縣生態(tài)系統(tǒng)價值當量,將分類體系劃分為農田(耕地)、森林(植被、灌木叢)、草地、城市用地(建筑區(qū))、水域(水體)、濕地(苔蘚)、裸地裸巖(裸露/稀疏植被)和其他類型(冰雪)。并與土地利用現(xiàn)狀調查數據生態(tài)系統(tǒng)類型統(tǒng)計面積結果比較(表4),決策樹、隨機森林和支持向量機與歐空局2020數據表現(xiàn)出較好的一致性,其中森林、草地和其他類型相對誤差在1%~7%,城市用地、水域相對誤差在12%~20%,農田系統(tǒng)在不同分類算法下呈現(xiàn)出一定差異;決策樹、隨機森林、支持向量機、歐空局2020數據與土地利用現(xiàn)狀調查數據相比,森林分類相對誤差為6.5%、6.9%、6.6%、4.9%,草地分類相對誤差為29.2%、27.92%、29.1%、25.8%,整體上一致性較好。農田生態(tài)系統(tǒng)中決策樹、歐空局數據產品相對誤差為11.6%、13.7%;但城市、水域和其他類型數據精度較低,可能由于選擇影像季節(jié)性差異和兩套數據所采用的分類體系不一致造成的。
表4 不同分類體系下生態(tài)系統(tǒng)類型統(tǒng)計面積Table4 Statistical area of ecosystem typesunder different classification systems hm2
基于GEE平臺開發(fā)的自然資源遙感云計算監(jiān)測服務平實現(xiàn)了“系統(tǒng)簡介”“自然資源遙感動態(tài)變化監(jiān)測計算”“夜光城市變化監(jiān)測”“地表溫度變化監(jiān)測”“建筑信息提取”、“水體信息提取”“生態(tài)服務價值評估”“遙感地物分類”以及“2000—2019年NDVI變化趨勢”等功能。主界面如圖3所示,2000—2019年NDVI變化趨勢圖4所示。
圖3 自然資源遙感云平臺監(jiān)測服務平臺主界面Fig.3 Main interface of remotesensing cloud platform monitoring serviceplatform of natural resources
圖4 2000—2019年NDVI變化趨勢Fig.4 NDVIvariation tendency from 2000 to 2019
該文基于GEE開發(fā)了一套自然資源動態(tài)變化快速評估技術,定量分析確定四川省理縣自然資源變化和演變,提取了植被、草地、耕地和灌木叢等關鍵地物類別,為進一步開展研究區(qū)生態(tài)服務價值演變、自然資源資產管理績效評估以及資產負債等自動化、業(yè)務化系統(tǒng)奠定了基礎,同時對區(qū)域生態(tài)系統(tǒng)服務功能價值空間變異和年內時間動態(tài)變化分析,可為研究區(qū)生態(tài)環(huán)境與自然資源資產管理提供數據依據。此外,該文在GEE上最大限度地利用某一段時間內的所有Landsat和Sentinel-2影像,通過決策樹、隨機森林和支持向量機算法識別與提取自然資源地物類別,具有較好的分類結果,但是仍存在一些客觀因素影像分類結果精度。在接下來的研究中,還可結合多源數據和多種模型(例如概率圖模型、圖深度學習等[28])探索更智能的提取算法以提升分類結果精度,進一步提供自然資源地物分類精度,為生態(tài)系統(tǒng)服務價值量核算提供參考。