劉雪萍 周小成 崔雅君 肖祥希
摘要:本文基于谷歌地球引擎(google earth engine,GEE)平臺中2020年Sentinel-2數(shù)據(jù)和數(shù)字高程模型(digital elevation model,DEM)數(shù)據(jù),在遞歸特征消除的隨機森林(random forest-recursive feature elimination,RF-RFE)特征選擇算法基礎上結合隨機森林(random forest,RF)分類算法,實現(xiàn)了平和縣蜜柚園的空間分布制圖。根據(jù)蜜柚園擴張的先驗知識,使用2020年蜜柚園的提取結果對歷史Landsat數(shù)據(jù)進行掩膜,依次獲得1990、2000、2010年平和縣蜜柚園的空間分布,在此基礎上對30年以來平和縣蜜柚園的變化進行分析。結果表明:基于GEE平臺,使用RF-RFE特征選擇后的多特征分類方法可以快速、準確地提取平和縣蜜柚園的空間分布。蜜柚園的生產(chǎn)精度和用戶精度分別為89.83%和90.59%;平和縣蜜柚園面積從1990年的10.5 km2增加到2020年632 km,增加的蜜柚園主要來源于有林地,其次為耕地和香蕉園。本研究可為平和縣蜜柚產(chǎn)業(yè)的健康發(fā)展提供決策支持,同時可為南方地區(qū)的果園提取提供技術參考。
關鍵詞:蜜柚園;Sentinel-2;隨機森林算法;RF-RFE;平和縣
中圖分類號:S127;TP79 文獻標志碼:A
琯溪蜜柚原產(chǎn)于福建省平和縣,三十年來發(fā)展迅速,已成為平和縣農(nóng)業(yè)增效、農(nóng)民增收的一個經(jīng)濟增長點[1]。然而,粗獷的開發(fā)方式及不合理的管理手段,不僅導致蜜柚品質(zhì)下降,還造成了嚴重的環(huán)境破壞[2]。開展蜜柚園種植面積和分布的遙感監(jiān)測,可對平和縣蜜柚產(chǎn)業(yè)規(guī)劃、生態(tài)環(huán)境評價以及制定退果還林的政策提供重要的決策支持。
遙感方法在數(shù)據(jù)收集和制圖方面優(yōu)于傳統(tǒng)的實地調(diào)查法,被廣泛應用于空間分布制圖。決策樹模型具有清晰、直觀、靈活、運算效率高等特點,在遙感分類方面具有很大的優(yōu)勢,被廣泛應用于各種遙感影像信息提取[3-6]。于新洋等[7]選用決策樹分類方法,綜合歸一化差值植被指數(shù)(normalization difference vegetable index,NDVI)、地形地貌和纓帽變換等多種輔助信息進行果園信息提取。然而,該方法在閾值選擇方面往往更多的依賴專家經(jīng)驗,主觀性強,具有一定的不確定性。隨后,機器學習方法越來越多的被應用到果園遙感識別中,例如最大似然分類(maximumlikelihood classification,MLC)[8]、支持向量機(support vector machine, SVM)[9-10]和隨機森林(random forest,RF)[11]等。與當前各類遙感影像分類算法相比,RF分類器具有顯著的優(yōu)勢。如候蒙京等[12]使用RF算法對高寒濕地地區(qū)的土地覆蓋進行分類,宋榮杰等[13]利用RF算法有效地提取了獼猴桃園的種植面積。隨著更高分辨率遙感影像的出現(xiàn),為了解決分類結果中存在的混合像元問題,衍生出了一種全新的面向對象分類方法。任傳帥等[14]基于SPOT-6數(shù)據(jù),利用面向對象分類方法對芒果林地信息進行提取,提取精度達到了90%以上。近年來,卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)在圖像分類處理領域取得了巨大的成功,比較成熟的CNN模型包括AlexNet、VGG、GoogleNet、ResNet等[15-16]。例如CSILLIK等[17]使用簡單的CNN算法從多光譜無人機圖像中檢測柑橘樹,總體精度達到96.24%。
在特征提取方面,越來越多的特征被用到果園識別中,除光譜波段和植被指數(shù)外,還有紋理[9,18-19]、地形[20]、多時相[21]和其他的空間關系特征[22]。然而,不同特征對果園提取的貢獻度卻很少有研究估計。此外,在訓練樣本數(shù)量有限的情況下,特征冗余可能會對分類結果產(chǎn)生不利的影響。因此,為了更好地理解不同特征對蜜柚園提取的貢獻,制定更具有判別性的特征子集尤為關鍵。遞歸特征消除的隨機森林算法(random forest-recursive feature elimination,RF-RFE)是一種常見的特征選擇算法,將遞歸消除的思想與隨機森林分類器結合在一起,實現(xiàn)特征的優(yōu)選。例如CHENG等[23]使用 Sentinel-2 數(shù)據(jù)進行秦嶺山脈主要林分類型分類識別時,利用RF-RFE算法篩選出了最有利于林分類型分類的特征,提高了分類精度和效率。GEE可以支持并行云端計算[24],結合特征優(yōu)選方法可以更加快速有效地提取較大范圍內(nèi)的類別信息。
由于本研究分類區(qū)域同時涉及蜜柚園、茶園和耕地幾個易混淆類型,而目前已有文獻的分類類型較為單一,Sentinel-2數(shù)據(jù)具有較高空間分辨率和豐富的光譜信息,可以幫助區(qū)分易混淆類型[25-26];此外,利用衛(wèi)星遙感進行蜜柚園的時空分布監(jiān)測研究還是空白,Landsat數(shù)據(jù)具有最長時間序列的遙感數(shù)據(jù),為開展蜜柚園的動態(tài)監(jiān)測提供數(shù)據(jù)支撐。由于深度學習往往需要各地類足夠多的樣本,結合研究區(qū)影像特征發(fā)現(xiàn)茶園、耕地等樣本不足,深度學習在評估蜜柚園和茶園、耕地的區(qū)分方面難以發(fā)揮優(yōu)勢。本文設置4組不同的特征組合方案結合隨機森林分類器進行對比試驗,以更好的提取蜜柚園信息,并分析蜜柚園的時空演變規(guī)律,為平和縣蜜柚產(chǎn)業(yè)的健康發(fā)展提供決策支持。
1 數(shù)據(jù)
1.1 研究區(qū)概況
平和縣位于中國福建省漳州市的西南部(圖1),介于北緯24°02′—24°35′,東經(jīng)116°54′—117°31′之間,面積2 328 km。該地區(qū)地形起伏,多為低山丘陵??h域處于亞熱帶季風氣候,氣候濕潤,光照充足,降水豐沛,春秋冬溫差小,夏季較長,適宜蜜柚生長。平和縣2019年的抽樣統(tǒng)計顯示,平和蜜柚面積保守估計有460 km,出現(xiàn)了盲目擴張的態(tài)勢。
1.2 數(shù)據(jù)收集及預處理
本研究使用的數(shù)據(jù)包括1990、2000、2010年Landsat-TM數(shù)據(jù)、2020年Sentinel-2數(shù)據(jù)、航天飛機雷達地形測繪使命(shuttle radar topography mission,SRTM)30 m的DEM數(shù)據(jù)及實測數(shù)據(jù)等。對于每一期數(shù)據(jù),都選擇兩個時相影像用于更好的區(qū)分地物間的微小差異。GEE是一個基于云平臺的地球觀測數(shù)據(jù)檢索和處理平臺,云端存儲大量歷史免費數(shù)據(jù)(如Landsat系列、Sentinel系列、MODIS系列等部分數(shù)據(jù)),并具有支持并行云端運算的特點[27]。本文使用的數(shù)據(jù)均通過GEE平臺獲取,避免了大量的數(shù)據(jù)預處理工作。其中,Sentinel-2數(shù)據(jù)為經(jīng)過Sen2Cor(Sentinel-2 Level-2A atmospheric correction processor)工具進行過大氣校正的S2A產(chǎn)品,Landsat-TM數(shù)據(jù)為經(jīng)過輻射定標的LITP產(chǎn)品。
從GEE平臺上獲取SRTM 30 m的DEM數(shù)據(jù),該產(chǎn)品由美國國家航空航天局(national aeronautics and space administration,NASA)實驗室提供,分辨率為30 m。由DEM數(shù)據(jù)獲得的高程(Elevation)、坡度(Slope)、坡向(Aspect)和地形陰影(Hillshade)數(shù)據(jù)作為地形特征數(shù)據(jù),輔助用于蜜柚園的分類制圖。本研究所用的數(shù)據(jù)源見表1。
1.3 樣本數(shù)據(jù)集
根據(jù)蜜柚園在高分辨率衛(wèi)星影像上呈現(xiàn)的特征,利用地面調(diào)查數(shù)據(jù)、谷歌影像作為參考數(shù)據(jù)建立樣本庫,2020年影像上可采集有林地、蜜柚園、人工地表、水體、茶園、耕地、香蕉園7類,1990、2000、2010年各期只能采集到有林地、蜜柚園、耕地和香蕉園樣本。選擇有代表性且純凈的地類像元,并保證樣本在空間上均勻分布。其中70%用于訓練,其余30%用于驗證,樣本點數(shù)量見表2。
2 研究方法
本文主要分為影像數(shù)據(jù)獲取、特征選擇與分類、平和縣蜜柚園的變化分析三部分。主要的步驟包括:(1)基于GEE平臺,使用最小云量影像合成方法獲得平和縣1990、2000、2010年的Landsat-TM數(shù)據(jù)和2020年Sentinel-2A數(shù)據(jù);(2)使用Sentinel-2數(shù)據(jù)和DEM數(shù)據(jù),分別獲取影像的光譜特征、紋理特征和地形特征,并作為特征變量,利用RF-RFE選擇最優(yōu)分類子集;(3)利用野外考察數(shù)據(jù)以及高分辨率的谷歌影像輔助分類樣本選擇,利用隨機森林分類器進行分類并進行分類后處理,在最終分類結果基礎上隨機選擇驗證樣本對分類結果進行精度評價;(4)在2020年蜜柚園的提取結果上掩膜1990—2010年早期影像,進一步采用相同的方法對早期Landsat-TM影像分類;(5)最后,對平和縣蜜柚園的時空分布進行分析。詳細的技術流程見圖2。
2.1 特征提取
2.1.1 光譜特征
Landsat-TM數(shù)據(jù)和Sentinel-2數(shù)據(jù)都具有豐富的光譜信息,除此之外,Sentinel-2數(shù)據(jù)還有用于監(jiān)測植被生長狀態(tài)的紅邊波段。由于季相特征可以在一定程度上影響蜜柚園的提取精度,因此,本文分別選擇春夏季和秋冬季的兩個時相的影像,進行蜜柚園信息提取。
植被指數(shù)廣泛用于植被長勢、植被覆蓋變化監(jiān)測,可以有效提取植被信息。植被指數(shù)可以突出波段間的差異,有效區(qū)分不同地類。本文選取歸一化植被指數(shù)I、差異歸一化植被指數(shù)I、綠色葉綠素指數(shù)I 、土壤調(diào)節(jié)植被指數(shù)I、紅邊拐點I、MERIS陸地葉綠素指數(shù)I、歸一化差異濕度指數(shù)I以及歸一化燃燒比2 I,共計8個指數(shù)(表3)。
2.1.2 紋理特征
紋理可以反映物體空間結構特征,蜜柚園由于其特有的行列結構,與有林地、耕地的紋理特征存在明顯的差異,因此,將這些特征加入到蜜柚園提取,可以彌補光譜特征空間信息的不足,提高分類精度?;叶裙采仃嚕╣ray level co-occurrence matrix,GLCM)是提取紋理特征的一種經(jīng)典算法[36]。原始波段之間存在一定的相關性,導致提取的紋理特征間存在冗余,不利于信息的提取,因此,使用主要成分分析(principal component analysis,PCA)變換后的第二主成分進行紋理特征提取。同時利用植被指數(shù)的紋理特征,更好地突出蜜柚園的空間信息。
2.1.3 地形特征
據(jù)實地考察發(fā)現(xiàn),蜜柚園主要分布在海拔低于600 m,坡度小于25°的低山區(qū)和丘陵區(qū),耕地主要分布在地勢比較平坦地區(qū),往往距離河流和居民區(qū)較近,因此,海拔、坡度等地形條件直接影響了蜜柚園的空間分布。本文選擇了高程(Elevation)、坡向(Aspect)、坡度(Slope)和陰影(Hillshade)4個地形特征參與蜜柚園分類特征選擇。
2.2 特征選擇
提取的52個特征對蜜柚園的提取貢獻大小不一,特征選擇可以在很多特征中找到最有利于蜜柚園提取的特征子集,提升模型的效率和分類精度。遞歸消除算法(recursive feature elimination,RFE)是種集成算法,與RF算法相結合在特征選擇方面可以達到較好的性能。把需要的特征子集初始化為整個特征子集,每次剔除一個排序準則分數(shù)最小的數(shù)據(jù),直到獲得最后的特征集,因此,RFE-RF是一個基于RF的最大間隔原理的序列后向選擇算法[37]。該過程將樣本等分為10份,每個特征集依次使用其中的9份作為訓練樣本,其余1份作為驗證樣本,以此類推,使用10次分類精度的平均值作為該特征的分類精度,最終對比不同特征子集的分類精度確定最佳的分類子集。
2.3 分類試驗方案
本文設計了4組分類試驗方案,如表4所示。
2.4 隨機森林算法
本文基于分類數(shù)據(jù)的多維性與研究區(qū)地形的復雜度,選擇RF分類方法,該方法已被證明在處理高維遙感數(shù)據(jù)方面優(yōu)于其他的監(jiān)督分類方法。RF分類器是Breiman提出的由多個決策樹或分類樹組成的集成學習算法。每棵樹都是通過一定數(shù)量的隨機樣本和隨機特征訓練構造的。RF分類器的基本流程如下:(1)采用bootstrapping抽樣方法,抽取三分之二的數(shù)據(jù)作為訓練樣本,其余三分之一作為驗證樣本,后者可以用來估計內(nèi)部誤差;(2)對每個訓練樣本構造一棵分類回歸樹,生成N棵樹組成的隨機森林。在每棵樹的成長過程中,從所有特征中隨機選擇m個特征;(3)組合N棵決策樹的分類結果,使用多數(shù)投票原則確定最終的分類結果[38]。
2.5 蜜柚園的動態(tài)變化監(jiān)測
分類后比較是研究土地利用變化最常見的方法之一,其中,最關鍵的一步是獲取各時相較高精度的分類結果。通過實地考察發(fā)現(xiàn),平和縣蜜柚園近30年來一直處于不斷擴張的狀態(tài),為了更好的研究蜜柚園的擴張動態(tài),本文利用獲取的2020年蜜柚園專題分類結果對更早期影像進行掩膜,在掩膜基礎上,進一步重復上述特征優(yōu)選的分類方法,依次獲得平和縣1990、2000、2010年的蜜柚園專題分類結果。
2.6 精度評價
采用混淆矩陣計算總體分類精度O、用戶精度U、生產(chǎn)者精度P和Kappa系數(shù)對2020年 的Sentinel-2衛(wèi)星遙感影像中的蜜柚園分類結果進行精度評估,其中O和Kappa系數(shù)用來比較整體分類精度,P和U用來衡量特定類別的分類精度。由于分類結果可能會出現(xiàn)某種類別的P高而U低或者相反的情況,不便于分類結果的統(tǒng)計。因此,本文引入綜合P和U的F統(tǒng)計量對分類結果中的某一類別進行精度評價[11]。其定義公式為:
F=2P U/P+U (1)
式中,P為類別m的生產(chǎn)者精度,U為類別m的用戶精度,F(xiàn)為F統(tǒng)計值。
本研究采用隨機抽樣的方法收集驗證樣本,使用總體樣本數(shù)量的30%用于精度驗證。
3 結果與分析
3.1 特征優(yōu)選結果
使用RF-RFE對52個特征進行選擇,共選擇出由紋理、地形和光譜共10個特征組成最優(yōu)特征子集。從圖3中可以看出,當參與分類的特征從1增加到10時,分類精度逐漸上升且在第10個特征處達到最高峰,當參與分類的特征數(shù)量繼續(xù)增加時,分類精度趨于平穩(wěn),因此選擇前10個特征作為優(yōu)選的特征子集。特征按重要性從大到小的順序為:Elevation、NBR2_savg(歸一化燃燒比2的和平均)、Slope、NBR2、PC2_var(第二主成分的方差)、GCVI、REIP、B11_1、PC2_contrast(第二主成分的對比度)、MTCI。
3.2 分類結果對比分析
本研究的分類方法本質(zhì)上屬于基于像元分類,因此分類結果中難免出現(xiàn)小斑塊,分析研究區(qū)的蜜柚分布,發(fā)現(xiàn)針對Sentinel-2影像,蜜柚園的最小可識別斑塊為0.005 3 km,為了減少小斑塊對分類結果的影響,依次使用Majority分析、聚類分析和過濾處理對分類結果中的小斑塊進行濾除,選擇77的卷積窗口對分類結果進行分類后處理(圖4),選擇不同的特征進行隨機森林分類,定量比較不同分類特征對分類結果的影響,不同分類方案分類結果精度統(tǒng)計見表5,最優(yōu)特征子集的分類混淆矩陣統(tǒng)計見表6。
本文使用光譜特征、光譜特征+紋理特征、光譜特征+紋理特征+地形特征以及經(jīng)過RF-RFE后的最優(yōu)特征子集分別進行分類,分類結果顯示,當僅使用光譜特征進行分類時,蜜柚園的生產(chǎn)精度和用戶精度分別為82.83%和81.28%,F(xiàn)統(tǒng)計值為82.05%,總體精度為86.61%,kappa系數(shù)為0.784 3,此時,茶園、耕地與蜜柚園的混淆較為嚴重;當引入紋理特征后,蜜柚園的生產(chǎn)精度和用戶精度都得到了明顯的提升,生產(chǎn)精度提升了5.09%,用戶精度提升了6.46%,F(xiàn)統(tǒng)計值提升了5.78%,此時的總體精度可以達到90.24%,kappa系數(shù)為0.842 6,分別提升了3.63%和0.06;經(jīng)過野外考察及經(jīng)驗知識,了解到蜜柚園主要分布在海拔低于600 m及坡度小于25°的區(qū)域,因此考慮引入地形因素可能進一步提升蜜柚園的分類精度。結果發(fā)現(xiàn),在光譜特征和紋理特征的基礎上再加入地形特征,可以進一步消除蜜柚園與茶園、耕地之間的混淆,蜜柚園的生產(chǎn)精度增加到89.61%,相比基于光譜和紋理特征的分類精度提升了1.69%,F(xiàn)統(tǒng)計值提升了0.66%,總體精度提高到91.34%,kappa系數(shù)為0.861 1。但是59個特征之間存在著冗余現(xiàn)象,分類特征數(shù)量過多導致分類效率下降。試驗發(fā)現(xiàn),當用RF-RFE進行特征選擇之后,利用前10個分類特征子集可以達到更好的分類精度,同時提升了分類效率,蜜柚園的生產(chǎn)精度和用戶精度分別達到89.83%和90.59%,F(xiàn)統(tǒng)計值達到90.21%,總體精度達到92.09%,kappa系數(shù)為0.872 2,分類精度和效率實現(xiàn)了最優(yōu)結果。但從最終結果的混淆矩陣來看,蜜柚園和有林地之間仍然存在著一定程度的混淆現(xiàn)象,進一步分析發(fā)現(xiàn),主要是部分類似園地的稀疏林地與蜜柚園仍存在混淆,此外,雖然蜜柚園和耕地、茶園在很大程度上得到了有效的區(qū)分,但仍存在互混淆的情況,這是由于Sentinel衛(wèi)星影像畢竟為10 m分辨率,受分辨率限制,地物在各類特征上的區(qū)分度有限,期望下一步使用更高分辨率影像解決這一問題。
3.3蜜柚園擴張動態(tài)
在2020年蜜柚園分類結果上使用掩膜方法對1990年的平和縣蜜柚園進行提取,發(fā)現(xiàn)采用掩膜的方式生產(chǎn)精度得到了大幅度提升(表7)。1990、2000、2010年蜜柚園分類精度如表8所示。由表9可以得出,平和縣蜜柚園近30年來面積持續(xù)增加,從1990年10.5 km增加到2020年632 km,增加了60倍,其中1990年到2000年蜜柚園面積增加了343.57 km,擴張速度最快,占近30年來新增蜜柚園面積的55.27%,這主要和80年代末政府積極鼓勵蜜柚種植的政策密切相關。2000—2010年蜜柚園面積持續(xù)增加,2010年以后蜜柚園擴張面積明顯減少,主要是由于蜜柚園不合理的擴張導致生態(tài)環(huán)境惡化,政府推行退果還林政策相關,同時也可能由于研究區(qū)可供蜜柚園擴張的土地有限。從空間上看,蜜柚園擴張主要集中分布于中部地區(qū),蜜柚園由1990年少量零星分布形成廣泛連片化的聚集分布特征。從各鄉(xiāng)鎮(zhèn)蜜柚園種植情況看,小溪鎮(zhèn)、坂仔鎮(zhèn)、山格鎮(zhèn)3縣為最早開始種植蜜柚的地區(qū),到2000年,小溪鎮(zhèn)、坂仔鎮(zhèn)、山格鎮(zhèn)、霞寨鎮(zhèn)蜜柚種植已初具規(guī)模,2010年以來,各縣蜜柚園種植面積呈現(xiàn)持續(xù)擴張的趨勢。結合表10進一步發(fā)現(xiàn),1990—2020年平和縣蜜柚園的擴張主要來自于有林地(64.99%),其次為耕地(31.45%)。同時可以發(fā)現(xiàn),從1990年到2010年,坂仔鎮(zhèn)也有部分耕地和有林地被開發(fā)為香蕉園,繼而轉變?yōu)槊坭謭@,查閱資料發(fā)現(xiàn),這可能和種植蜜柚帶來的經(jīng)濟效益更好有關。
4討論
本文基于Sentinel-2數(shù)據(jù),使用多特征優(yōu)選的方法獲得了2020年福建平和縣蜜柚園的空間分布,在此基礎上,根據(jù)蜜柚園擴張的先驗知識,使用2020年蜜柚園提取結果對早期Landsat影像掩膜,分類獲得1990、2000和2010年蜜柚園的空間分布。查閱已有文獻發(fā)現(xiàn),2019年徐澤晗宇等[27]直接使用特征參與分類的平均生產(chǎn)者精度和用戶精度分別為66.98%和85.61%,本文分類結果的最低生產(chǎn)精度和用戶精度分別為85.57%和85.56%,表明本文提出的方法可以有效提升分類精度。最終獲得1990、2000、2010、2020年蜜柚園種植的遙感提取面積為10.5、354、555、632 km,查閱歷史資料發(fā)現(xiàn),平和縣從80年代末陸續(xù)開始蜜柚種植,表明1990年蜜柚園提取面積較少較為合理。2000、2010、2020年蜜柚園抽樣統(tǒng)計面積為333、550.8、533 km,其中,蜜柚園遙感提取面積比統(tǒng)計面積大,可能原因有幾個方面:(1)影像分辨率較低會產(chǎn)生混合像元問題,會給蜜柚園分類結果造成客觀誤差;(2)抽樣統(tǒng)計數(shù)據(jù)在一定程度上低估了農(nóng)戶種植蜜柚園的面積。2020年蜜柚園提取面積和統(tǒng)計面積相比較多,主要是因為平和縣給出的統(tǒng)計數(shù)據(jù)是退果還林之后規(guī)劃的面積,而實際情況是存在蜜柚園盲目擴張的情況,除此之外,許多偏遠山區(qū)的農(nóng)戶將原來的耕地和有林地墾殖為蜜柚園,而這一部分可能未能及時納入官方統(tǒng)計。
5結論與展望
本文基于GEE平臺中的Sentinel-2和Landsat-TM數(shù)據(jù),使用RF-RFE特征優(yōu)選方法,實現(xiàn)了1990、2000、2010、2020年平和縣蜜柚園專題制圖和擴展分析,主要結論如下:
1)在光譜特征、紋理特征和地形特征的基礎上,使用RF-RFE構建最優(yōu)分類特征子集參與隨機森林分類,結果表明RF-RFE特征選擇算法可以在降低運算時間的同時可以保證較高的分類精度,優(yōu)選后的特征子集由光譜、紋理和地形特征組成,包括:Elevation、NBR2_savg、Slope、NBR2、PC2_var、GCVI、REIP、B11_1、PC2_contrast、MTCI,分類結果的生產(chǎn)精度和用戶精度分別可以達到89.83%和90.59%,總體精度和Kappa系數(shù)分別可以達到92.09%和0.872 2。
2)使用2020年平和縣蜜柚園提取結果對1990、2000、2010年Landsat-TM掩膜和分類,獲得1990、2000、2010年蜜柚園提取結果,蜜柚園的生產(chǎn)精度最低為81.81%,最高生產(chǎn)精度可達91.3%,用戶精度最低為85.56%,最高用戶精度可達92.64%。表明通過蜜柚園不斷擴張的先驗知識進行Landsat-TM影像的蜜柚園提取,可以有效改善早期低分辨率Landsat影像蜜柚園的準確獲取問題。
3)遙感監(jiān)測表明,福建平和縣蜜柚園面積從1990年的10.5 km迅速增加到2020年632 km,增加了60倍,蜜柚園分布由1990年零星分布逐漸形成規(guī)?;?、連片化的分布特征,蜜柚園的主要來源為有林地,其次為耕地和香蕉園。
由于部分稀疏林地、茶園同低齡的蜜柚園存在相似的光譜和紋理特征,比較容易發(fā)生混淆,而蜜柚園固有的紋理特征在高分辨率衛(wèi)星影像中更為明顯,因此,下一步將使用更高分辨率的遙感影像,以期更為準確地識別蜜柚園的空間分布。參考文獻:
[1]林旗華, 林燕金, 姜翠翠, 等. 1991—2013年平和縣蜜柚種植規(guī)模變化及新品種介紹[J]. 東南園藝, 2015, 3(4): 45-48.
[2] 黃美鳳. 淺析平和縣生態(tài)環(huán)境保護[J]. 海峽科學, 2014(7): 34-35.
[3] LI L, DONG J W, SIMON N T, et al. Mapping oil palm plantations in cameroon using palsar 50 m orthorectified mosaic images[J]. Remote Sensing, 2015, 7(2): 1206-1224.
[4] POORTINGA A, TENNESON K, SHAPIRO A, et al. Mapping plantations in myanmar by fusing landsat-8, sentinel-2 and sentinel-1 data along with systematic error quantification[J]. Remote Sensing, 2019, 11(7): 831.
[5] 王利軍, 郭燕, 賀佳, 等. 基于決策樹和SVM的Sentinel-2A影像作物提取方法[J]. 農(nóng)業(yè)機械學報, 2018, 49(9): 146-153.
[6] 徐偉燕, 孫睿, 金志鳳. 基于資源三號衛(wèi)星影像的茶樹種植區(qū)提取[J]. 農(nóng)業(yè)工程學報, 2016, 32(S1): 161-168.
[7] 于新洋, 趙庚星, 常春艷, 等. 隨機森林遙感信息提取研究進展及應用展望[J]. 遙感信息, 2019, 34(2): 8-14.
[8] CHENG Y Q, YU L, XU Y D, et al. Towards global oil palm plantation mapping using remote-sensing data[J]. International Journal of Remote Sensing, 2018, 39(18): 5891-5906.
[9] DIHKAN M, GUNEROGLU N, KARSLI F, et al. Remote sensing of tea plantations using an svm classifier and pattern-based accuracy assessment technique[J]. International Journal of Remote Sensing, 2013, 34(23): 8549-8565.
[10]WANG Y R, ZHU X L, WU B. Automatic detection of individual oil palm trees from uav images using hog features and an svm classifier[J]. International Journal of Remote Sensing, 2018, 40(19): 7356-7370.
[11]徐晗澤宇, 劉沖, 齊述華, 等. 基于隨機森林算法的贛南柑橘果園遙感信息提取[J]. 江西師范大學學報: 自然科學版, 2018, 42(4): 434-440.
[12]侯蒙京, 殷建鵬, 葛靜, 等. 基于隨機森林的高寒濕地地區(qū)土地覆蓋遙感分類方法[J]. 農(nóng)業(yè)機械學報, 2020, 51(7): 220-227.
[13]宋榮杰, 寧紀鋒, 常慶瑞, 等. 基于小波紋理和隨機森林的獼猴桃果園遙感提取[J]. 農(nóng)業(yè)機械學報, 2018, 49(4): 222-231.
[14]任傳帥, 葉回春, 崔貝, 等. 基于面向對象分類的芒果林遙感提取方法研究[J]. 資源科學, 2017, 39(8): 1584-1591.
[15]MASOUD M, BAHRAM S, MOHAMMAD R, et al. Very deep convolutional neural networks for complex land cover mapping using multispectral remote sensing imagery[J]. Remote Sensing, 2018, 10(7): 1119.
[16]LI W J, FU H H, YU L, et al. Deep learning based oil palm tree detection and counting for high-resolution remote sensing images[J]. Remote Sensing, 2016, 9(1): 22.
[17]CSILLIK O, CHERBINI J, JOHNSON R, et al. Identification of citrus trees from unmanned aerial vehicle imagery using convolutional neural networks[J]. Drones, 2018, 2(4): 39.
[18]AKAR O, GUNG R O. Integrating multiple texture methods and ndvi to the random forest classification algorithm to detect tea and hazelnut plantation areas in northeast turkey[J]. International Journal of Remote Sensing, 2015, 36(2): 442-464.
[19]宋榮杰, 寧紀鋒, 劉秀英, 等. 基于紋理特征和SVM的QuickBird影像蘋果園提取[J]. 農(nóng)業(yè)機械學報, 2017, 48(3): 188-197.
[20]LI G Y, CHENG Z L, LU D S, et al. Examining hickory plantation expansion and evaluating suitability for it using multitemporal satellite imagery and ancillary data[J]. Applied Geography, 2019, 109: 102035.
[21]ZHU Y H, YANG G J, YANG H, et al. Identification of apple orchard planting year based on spatiotemporally fused satellite images and clustering analysis of foliage phenophase[J]. Remote Sensing, 2020, 12(7): 1199.
[22]閆利, 江維薇. 一種利用結構特征的高分辨率遙感影像種植園自動提取方法[J]. 測繪學報, 2016, 45(9): 1065-1072.
[23]CHENG K, WANG J. Forest type classification based on integrated spectral-spatial-temporal features and random forest algorithm—a case study in the qinling mountains[J]. Forests, 2019, 10(7): 559.
[24]李宇宸, 張軍, 薛宇飛, 等. 基于Google Earth Engine的中老緬交界區(qū)橡膠林分布遙感提取[J]. 農(nóng)業(yè)工程學報, 2020, 36(8): 174-181.
[25]ZHU J, PAN Z, WANG H, et al. An improved multi-temporal and multi-feature tea plantation identification method using sentinel-2 imagery[J]. Sensors, 2019, 19(9): 2087.
[26]陳安旭, 李月臣. 基于Sentinel-2影像的西南山區(qū)不同生長期水稻識別[J]. 農(nóng)業(yè)工程學報, 2020, 36(7): 192-199.
[27]徐晗澤宇, 劉沖, 王軍邦, 等. Google Earth Engine平臺支持下的贛南柑橘果園遙感提取研究[J]. 地球信息科學學報, 2018, 20(3): 396-404.
[28]張磊, 宮兆寧, 王啟為, 等. Sentinel-2影像多特征優(yōu)選的黃河三角洲濕地信息提取[J]. 遙感學報, 2019, 23(2): 313-326.
[29]LONG T F, ZHANG Z M, HE G J, et al. 30 M resolution global annual burned area mapping based on landsat images and google earth engine[J]. Remote Sensing, 2019, 11(5): 489.
[30]任海娟, 董建軍, 李曉媛, 等. 利用多時相Landsat8圖像提取苜蓿人工草地信息[J]. 中國草地學報, 2015, 37(2): 81-87.
[31]HUETE R A. A soil-adjusted vegetation index (SAVI)[J]. Remote Sensing of Environment, 1988, 25(3): 295-309.
[32]方燦瑩, 王琳, 徐涵秋. 不同植被紅邊指數(shù)在城市草地健康判別中的對比研究[J]. 地球信息科學學報, 2017, 19(10): 1382-1392.
[33]譚深, 吳炳方, 張鑫. 基于Google Earth Engine與多源遙感數(shù)據(jù)的海南水稻分類研究[J]. 地球信息科學學報, 2019, 21(6): 937-947.
[34]DASH J, CURRAN P J. The MERIS terrestrial chlorophyll index[J]. International Journal of Remote Sensing, 2004, 25(23): 5403-5413.
[35]WILSON E H, SAGER S A. Detection of forest harvest type using multiple dates of landsat tm imagery[J]. Remote Sensing of Environment, 2002, 80(3): 385-396.
[36]裴歡, 孫天嬌, 王曉妍. 基于Landsat 8 OLI影像紋理特征的面向對象土地利用/覆蓋分類[J]. 農(nóng)業(yè)工程學報, 2018, 34(2): 248-255.
[37]張磊, 宮兆寧, 王啟為, 等. Sentinel-2影像多特征優(yōu)選的黃河三角洲濕地信息提取[J]. 遙感學報, 2019, 23(2): 313-326.
[38]呂杰, 郝寧燕, 李崇貴, 等. 利用隨機森林和紋理特征的森林類型識別[J]. 遙感信息, 2017, 32(6): 109-114.
(責任編輯:于慧梅)
Spatio-temporal Change Analysis of Pomelo Orchards in
Pinghe County Based on Multi-feature Optimization
LIU Xueping ZHOU Xiaocheng CUI Yajun XIAO Xiangxi
(1.Key Laboratory of Spatial Data Mining and Information Sharing of Ministry of Education, National & Local Joint Engineering
Research Center of Satellite Geospatial Information Technology, Fuzhou University, Fuzhou 350108, China;
2. Fujian Academy of Forestry Sciences,F(xiàn)uzhou 350012, China)Abstract: Based on the Sentinel-2 data and digital elevation model data in google earth engine platform in 2020, and based on random forest-recursive feature elimination algorithm and random forest classification algorithm, the spatial distribution mapping of pomelo orchard in Pinghe County was achieved. According to the priori-knowledge of pomelo orchards expansion, the extraction results of pomelo orchards in 2020 were used to mask the data of Landsat in 1990, 2000 and 2010, and the spatial distribution of pomelo orchards in Pinghe County in 1990, 2000 and 2010 was obtained. On this basis, the dynamic changes of pomelo orchards in Pinghe County in the past 30 years were analyzed. The results show that the multi-feature classification method based on GEE platform using RF-RFE feature selection can quickly and accurately extract the spatial distribution of pomelo orchards in Pinghe County. The classification results for pomelo orchards showed that the overall accuracy and Kappa coefficient were 92.09% and 0.87, respectively, and the pomelo orchards producer's accuracy and user's accuracy were 89.83% and 90.59%, respectively. The area of pomelo orchards in Pinghe County increased from 10.5 km2 in 1990 to 632 km2 in 2020, the increase of pomelo orchards mainly came from forest land, followed by cultivated land and banana garden. This study can provide decision support for the healthy development of honey pomelo industry in Pinghe County. At the same time, it can provide method guidance for orchard extraction in southern region.
Key words: pomelo orchards; Sentinel-2; random forest algorithm; RF-RFE; Pinghe County