陳 印,剛成誠(chéng),劉歡歡,劉 悅,范蒙恩,陳 宇,張 曼,于子涵
(1.西北農(nóng)林科技大學(xué) 草業(yè)與草原學(xué)院,陜西 楊陵 712100;2.西北農(nóng)林科技大學(xué) 水土保持研究所,陜西 楊陵 712100;3.中國(guó)科學(xué)院水利部 水土保持研究所,陜西 楊陵 712100;4.西北農(nóng)林科技大學(xué) 資源環(huán)境學(xué)院,陜西 楊陵 712100)
蘋(píng)果(Maluspumila)屬于落葉喬木,富含礦物質(zhì)和維生素,是人們最常食用的水果之一。蘋(píng)果在全世界溫帶地區(qū)均有種植,我國(guó)是世界上蘋(píng)果種植總面積最大、總產(chǎn)量最高的國(guó)家[1]。蘋(píng)果種植區(qū)在我國(guó)多個(gè)省份均有分布。2020年我國(guó)蘋(píng)果種植面積為208.85萬(wàn)hm2,總產(chǎn)量高達(dá)4 406.61萬(wàn)t,占全球蘋(píng)果產(chǎn)量的54.07%[2],其中,陜西省的蘋(píng)果產(chǎn)量為1 185萬(wàn)t,是我國(guó)蘋(píng)果種植面積最大、產(chǎn)量最高的蘋(píng)果大省,產(chǎn)量和出口量均為全國(guó)第一。陜西省具有生產(chǎn)優(yōu)質(zhì)蘋(píng)果的自然條件,是全球最佳的蘋(píng)果生產(chǎn)區(qū),同時(shí)也是世界上連片種植蘋(píng)果最大的地區(qū)[3]。蘋(píng)果產(chǎn)業(yè)已經(jīng)成為陜西部分地區(qū)鄉(xiāng)村振興的經(jīng)濟(jì)支柱型產(chǎn)業(yè)[4],對(duì)于當(dāng)?shù)剞r(nóng)業(yè)的整體發(fā)展具有重要意義。
隨著退耕還林還草等生態(tài)工程的不斷深入以及“北擴(kuò)西進(jìn)”戰(zhàn)略的實(shí)施,陜西省蘋(píng)果種植面積和產(chǎn)量一直保持上升的趨勢(shì)[5-6]。因此,準(zhǔn)確掌握蘋(píng)果園分布格局及變化趨勢(shì)是蘋(píng)果產(chǎn)業(yè)發(fā)展和科學(xué)研究不可忽視的一環(huán)。傳統(tǒng)實(shí)地調(diào)研方法存在工作量大、成本高等問(wèn)題,難以掌握區(qū)域大面積果園空間信息[7]。遙感監(jiān)測(cè)技術(shù)由于具有快速、低成本、大面積、長(zhǎng)時(shí)間序列探測(cè)地表的特點(diǎn),已被廣泛運(yùn)用于農(nóng)業(yè)管理和作物監(jiān)測(cè)[8-9]。例如,根據(jù)作物的光譜特征和其他輔助信息,對(duì)飼草[10]、玉米[11]、花生[12]、冬小麥[13]等農(nóng)作物進(jìn)行空間信息提取,對(duì)農(nóng)業(yè)生產(chǎn)具有重要意義。同時(shí),經(jīng)濟(jì)林的遙感信息提取方面也取得了重要的研究進(jìn)展,如葡萄[14]、橡膠林[15]、竹林[16]和棕櫚[17]等。相比之下,針對(duì)果園遙感信息提取的研究相對(duì)薄弱。徐晗澤宇等[18]利用GEE平臺(tái)使用2 140景Landsat影像繪制了贛南柑橘果園的分布圖;宋榮杰等[19]構(gòu)建了一種結(jié)合高分影像光譜信息和紋理信息以及隨機(jī)森林算法的集成分類(lèi)模型,對(duì)高分影像中獼猴桃果園進(jìn)行了有效識(shí)別和自動(dòng)提取。目前,蘋(píng)果園地遙感信息提取的研究仍十分缺乏,僅局限于縣域或鄉(xiāng)鎮(zhèn)尺度[20-23],區(qū)域尺度蘋(píng)果園地空間分布特征亟待開(kāi)展深入的研究。
中高分辨率遙感影像,如SPOT-5[24]、GF-2[25]、Landsat[26]和Sentinel-2[27-29],已被廣泛應(yīng)用于作物分類(lèi)制圖中。其中,Sentinel-2具有更多的光譜波段和更短的重訪周期,在作物信息提取中被作為重要的遙感數(shù)據(jù)源[30]。在分類(lèi)方法方面,隨機(jī)森林(random forest,RF)算法和支持向量機(jī)(supporting vector machine,SVM)等機(jī)器學(xué)習(xí)算法已經(jīng)逐漸取代傳統(tǒng)的監(jiān)督分類(lèi)方法。隨機(jī)森林算法是由多個(gè)決策樹(shù)組成,可以解決決策樹(shù)算法過(guò)擬合的出現(xiàn),并能提高分類(lèi)精度,在地物分類(lèi)和識(shí)別領(lǐng)域具有良好的表現(xiàn)[31]。王德軍等[32]分析了隨機(jī)森林、支持向量機(jī)、最大似然分類(lèi)3種分類(lèi)方法對(duì)于農(nóng)耕土地提取效果,結(jié)果表明隨機(jī)森林算法的分類(lèi)精度最佳;馬戰(zhàn)林等[33]融合了多時(shí)相Sentinel-1SAR數(shù)據(jù)和Sentinel-2光學(xué)數(shù)據(jù),發(fā)現(xiàn)基于RF算法的總體精度和Kappa系數(shù)分別為95.78%和0.92;Blickensdorfer等[34]使用RF算法,基于Sentinel-1、Sentinel-2和Landsat 8繪制了德國(guó)2017-2019年農(nóng)業(yè)土地覆蓋圖。
Google Earth Engine(GEE)云計(jì)算平臺(tái)具有海量多源遙感數(shù)據(jù)、支持云端計(jì)算的特點(diǎn),極大地增強(qiáng)了遙感數(shù)據(jù)處理和數(shù)據(jù)挖掘能力,為大面積區(qū)域尺度遙感信息提取及空間格局動(dòng)態(tài)監(jiān)測(cè)提供了技術(shù)平臺(tái)[35]。本研究以陜西省蘋(píng)果主要種植區(qū)——渭北旱塬區(qū)為對(duì)象,基于GEE云平臺(tái)獲取2020年Sentinel-2影像數(shù)據(jù),構(gòu)建包含光譜特征、遙感植被指數(shù)、紋理特征和地形特征的多維分類(lèi)特征集,應(yīng)用RF算法提取研究區(qū)蘋(píng)果園空間格局信息,探究不同分類(lèi)特征組合下蘋(píng)果園地遙感提取效果。
渭北旱塬區(qū)包括千陽(yáng)縣、鳳翔縣、麟游縣、永壽縣、彬州市、長(zhǎng)武縣、旬邑縣、淳化縣、耀州區(qū)、印臺(tái)區(qū)、黃陵縣、宜君縣、白水縣、洛川縣,共計(jì)14個(gè)縣(區(qū))(圖1),地理位置34.35°N-36.07°N,106.94°E-109.77°E,海拔高度458~1 841 m,總面積約1.82萬(wàn)km2。該區(qū)屬于溫帶大陸性季風(fēng)型氣候,年均氣溫6~13 ℃,無(wú)霜期180~200 d,年降水量500~800 mm,降雨集中在6-9月,多為短時(shí)暴雨,冬春降水較少,屬于典型的半干旱區(qū),適宜蘋(píng)果生長(zhǎng)。
圖1 研究區(qū)概況
通過(guò)野外實(shí)地調(diào)查的方法,采集研究區(qū)461個(gè)蘋(píng)果園樣本點(diǎn)。根據(jù)研究區(qū)具體情況和分類(lèi)目標(biāo),將研究區(qū)內(nèi)的土地覆蓋類(lèi)型分為蘋(píng)果園、水域、城鎮(zhèn)用地和其他用地。利用谷歌衛(wèi)星地圖和Sentinel-2影像進(jìn)行目視法取樣,獲得2020年的樣本數(shù)據(jù),將樣本數(shù)據(jù)按照4∶1的比例進(jìn)行隨機(jī)分配,80%用于分類(lèi)器訓(xùn)練,20%用于精度評(píng)價(jià)(表1)。
表1 分類(lèi)樣本數(shù)量
哨兵系列衛(wèi)星(Sentinel)是歐洲航天局哥白尼計(jì)劃(GMES)中的地球觀測(cè)衛(wèi)星,GEE目前可以使用4個(gè)系列的哨兵影像數(shù)據(jù)集,其中,Sentinel-2是高分辨率多光譜成像衛(wèi)星,攜帶一枚多光譜成像儀(MSI),用于陸地監(jiān)測(cè),分為2A和2B 2顆衛(wèi)星,2A衛(wèi)星于2015年發(fā)射升空,2B衛(wèi)星于2017年發(fā)射升空,一顆衛(wèi)星的重訪周期為10 d,2顆互補(bǔ),重訪周期為5 d,本研究使用B2、B3、B4、B5、B6、B7、B8、B8A、B11和B12共計(jì)10個(gè)波段(表2)。
表2 波段詳細(xì)信息
Sentinel-2數(shù)據(jù)的Level-1C(L1C)級(jí)產(chǎn)品是經(jīng)過(guò)正射校正和亞像元級(jí)幾何精矯正后的大氣表觀反射率產(chǎn)品。本研究選擇的Level-2A(L2A)數(shù)據(jù)是在L1C級(jí)數(shù)據(jù)的基礎(chǔ)上經(jīng)過(guò)大氣校正后的產(chǎn)品,從GEE平臺(tái)獲取,影像時(shí)間2020年4-5月[36],共獲取了覆蓋研究區(qū)域的無(wú)云影像63景,影像分布及數(shù)量見(jiàn)圖2。
圖2 2020年4-5月使用的Sentinel-2影像數(shù)量
根據(jù)蘋(píng)果花期光譜特征與其他樹(shù)種差異最大的特性[21-23,36],在GEE平臺(tái)獲取2020年4-5月L2A級(jí)遙感影像數(shù)據(jù),篩選云量<20的影像,并進(jìn)行裁剪和融合處理。選取光譜特征(spectral features)、遙感植被指數(shù)(remote sensing vegetation index)、紋理特征(texture features)和地形特征(topographic features)作為分類(lèi)特征,通過(guò)隨機(jī)森林算法提取研究區(qū)蘋(píng)果園地空間格局。
紅邊波段和短紅外波段在地物分類(lèi)中具有重要的作用,因此,本研究提取了蘋(píng)果開(kāi)花期間蘋(píng)果園、水域、城鎮(zhèn)用地和其他用地的10個(gè)光譜波段反射率。由圖3可見(jiàn),水域在10個(gè)波段下均表現(xiàn)為較低的反射率,且較為平穩(wěn);城鎮(zhèn)用地的反射率均高于水域;蘋(píng)果園和其他用地在B7、B8、B8A波段下反射率幾乎一致,僅在部分波段下差異較大。因此,本研究加入遙感植被指數(shù)、紋理特征和地形特征作為蘋(píng)果園地的分類(lèi)特征,以提高蘋(píng)果園地分類(lèi)遙感信息提取精度。
圖3 2020年4-5月不同波段不同地物的平均反射光譜
遙感植被指數(shù)包括歸一化植被指數(shù)(normalized difference vegetation index,NDVI,式中記為NDVI)、土壤調(diào)整植被指數(shù)(soil-adjusted vegetation index,SAVI,式中記為SAVI)、裸土指數(shù)(bare soil index,BSI,式中記為BSI)、增強(qiáng)植被指數(shù)(enhanced vegetation index,EVI,式中記為EVI);紋理特征由通過(guò)灰度共生矩陣(gray level co-occurrence matrix,GLCM,式中記為GLCM)提取得到,紋理窗口大小為3×3,包括均值(Mean)、方差(variance,Var)、角二階矩(angular second moment,Asm)、熵(entropy,Ent)、對(duì)比度(constrast,Con)和相關(guān)性(correlation,Corr);地形特征使用高程(DEM)數(shù)據(jù)(表3)。
表3 特征說(shuō)明
本研究根據(jù)不同的分類(lèi)特征組合共涉及5種分類(lèi)方案(表4)。
表4 特征組合
RF通過(guò)隨機(jī)采樣并放回地抽取(Bootstrap)的方式對(duì)樣本進(jìn)行重采樣,其中約2/3的樣本數(shù)據(jù)作為袋內(nèi)數(shù)據(jù)創(chuàng)建決策樹(shù),約1/3的樣本數(shù)據(jù)作為袋外數(shù)據(jù)(out of bag,OOB)進(jìn)而驗(yàn)證模型[37-38]。與其他分類(lèi)算法相比,隨機(jī)森林具有更好的穩(wěn)定性[39]。本研究通過(guò)GEE平臺(tái)的隨機(jī)森林分類(lèi)器建立RF模型,進(jìn)而提取研究區(qū)蘋(píng)果園地遙感信息。
混淆矩陣是對(duì)經(jīng)過(guò)實(shí)地驗(yàn)證的像元位置與類(lèi)型與遙感影像分類(lèi)結(jié)果中相對(duì)應(yīng)的像元屬性進(jìn)行比較,得出該類(lèi)別的分類(lèi)精度,它可以有效反映分類(lèi)結(jié)果像元?dú)w類(lèi)的準(zhǔn)確性。采用混淆矩陣方法分別得到總體精度(overall accuracy,OA)和Kappa系數(shù)等,以此作為衡量標(biāo)準(zhǔn),評(píng)價(jià)研究區(qū)域蘋(píng)果園地提取的精度。計(jì)算公式如下
1)總體精度(OA,用pc表示)
(1)
式中:p為樣本總數(shù),pkk表示正確分類(lèi)的像元數(shù)目;n表示類(lèi)別的數(shù)量。
2)Kappa系數(shù)(Khat)
(2)
式中:r為誤差矩陣中總列數(shù)(即總的類(lèi)別數(shù));xii為混淆矩陣中第i行、第i列上像元數(shù)量(即正確分類(lèi)的數(shù)目);xi+和x+i分別為第i行和第i列的像元數(shù)量;N為用于精度評(píng)估的總像元數(shù)量。
特征重要性是指特征對(duì)于目標(biāo)變量的影響程度,能夠判斷輸入特征對(duì)于結(jié)果的貢獻(xiàn)。特征得分越高,表明對(duì)結(jié)果的貢獻(xiàn)值和重要性越大。本研究采用RF計(jì)算特征重要性,根據(jù)特征得分進(jìn)行重要性排序?;赗F計(jì)算特征重要性的優(yōu)勢(shì)在于其考慮特征之間的相互作用,而且可對(duì)不同分類(lèi)特征排序進(jìn)行可視化。
基于不同分類(lèi)特征組合的蘋(píng)果園地遙感信息提取結(jié)果見(jiàn)圖4。方案1的結(jié)果中多個(gè)地區(qū)蘋(píng)果園地面積與統(tǒng)計(jì)值差異較大,主要在鳳翔區(qū)、旬邑縣、宜君縣、永壽縣和長(zhǎng)武縣(圖4A)。方案2結(jié)果較優(yōu)于方案1,但蘋(píng)果園地提取效果仍較差(圖4B),說(shuō)明光譜特征和遙感植被指數(shù)組合并不能對(duì)蘋(píng)果園地遙感信息進(jìn)行有效提取。
A.方案1(S);B.方案2(S+R);C.方案3(S+T);D.方案4(S+D);E.方案5(S+R+T+D)
方案3與方案4分別增加了紋理特征和地形特征,顯示部分地區(qū)蘋(píng)果園地提取效果有一定程度的提高,但在其他地區(qū)表現(xiàn)更差。例如,方案3在彬州市、淳化縣、宜君縣和長(zhǎng)武縣蘋(píng)果園地提取結(jié)果與統(tǒng)計(jì)值更為接近,但黃陵縣和洛川縣蘋(píng)果園地提取效果較差(圖4C);方案4增強(qiáng)了淳化縣、鳳翔區(qū)和永壽縣蘋(píng)果園地提取效果,但對(duì)千陽(yáng)縣和耀州區(qū)的提取效果變差(圖4D)。由方案3和方案4分類(lèi)結(jié)果可知,不同源的分類(lèi)特征結(jié)合可以彌補(bǔ)單一分類(lèi)特征的缺陷,提高蘋(píng)果園信息提取的可靠性,但區(qū)域蘋(píng)果園地提取效果仍待進(jìn)一步加強(qiáng)。
方案5結(jié)合了光譜特征、遙感植被指數(shù)、紋理特征和地形特征,其提取的蘋(píng)果園地面積為23.03萬(wàn)hm2,與統(tǒng)計(jì)數(shù)據(jù)(23.25萬(wàn)hm2)最為接近(圖4E)。蘋(píng)果種植面積較大的縣(區(qū))主要為延安市洛川縣、渭南市白水縣、咸陽(yáng)市淳化縣和咸陽(yáng)市彬州市,種植蘋(píng)果面積分別為3.54、3.21、2.90萬(wàn)hm2和2.51萬(wàn)hm2??傮w而言,相比于前4個(gè)方案,方案5的蘋(píng)果園地遙感信息整體提取結(jié)果更接近于真實(shí)情況,說(shuō)明不同分類(lèi)特征結(jié)合可以彌補(bǔ)單一分類(lèi)特征的不足,能夠有效提高蘋(píng)果園地遙感信息提取的可靠性。
由表5可知,所有分類(lèi)特征組合的OA均>89%,Kappa系數(shù)均>0.78。分類(lèi)特征組合為方案1的總體精度最低,其分類(lèi)特征僅包含10個(gè)波段信息的光譜特征,OA和Kappa系數(shù)分別為89%和0.78;方案2~4分別在方案1的基礎(chǔ)上加入了遙感植被指數(shù)、紋理特征、地形特征,OA和Kappa均有一定程度的增加;OA和Kappa系數(shù)最高的為方案5,其加入了遙感植被指數(shù)、紋理特征和地形特征。相比于方案1,OA和Kappa系數(shù)分別提升了5%和0.08。
表5 基于不同分類(lèi)方案的蘋(píng)果園地提取精度評(píng)價(jià)
基于最優(yōu)分類(lèi)方案5,利用RF對(duì)其21個(gè)分類(lèi)特征計(jì)算特征重要性,并根據(jù)特征得分進(jìn)行排序,結(jié)果見(jiàn)圖5。光譜特征中短紅外波段B11和B12均具有較高得分,分別為1.82%和1.80%。由圖3可知,4類(lèi)地物在B11和B12波段的反射率差異較大,表明2個(gè)短紅外波段在蘋(píng)果園地識(shí)別中可以提供較
圖5 基于方案5的分類(lèi)特征重要性排序
大的貢獻(xiàn);可見(jiàn)光波段B2、B3和B4的重要性得分分別為1.90%、1.71%和1.49%,在蘋(píng)果園地信息提取中起到重要作用;紅邊波段B5、B6、B7、B8A和近紅外波段B8的重要性分別為1.51%、1.57%、1.60%、1.60%和1.59%。除B5外,其他4個(gè)波段的蘋(píng)果園地和其他用地光譜反射率較為相近。
在其他分類(lèi)特征中,地形特征對(duì)于蘋(píng)果園地信息提取的貢獻(xiàn)最大,為2.45%,說(shuō)明地形特征對(duì)蘋(píng)果園地識(shí)別具有較高價(jià)值。遙感植被指數(shù)中BSI、NDVI、EVI和SAVI的重要性分別為1.67%、1.59%、1.55%和1.43%,與大多數(shù)光譜波段的貢獻(xiàn)率相差不大;紋理特征Mean、Con、Var、Corr能夠有效增強(qiáng)蘋(píng)果園地識(shí)別能力,其重要性分別為1.79%、1.66%、1.66%和1.58%,而Asm和Ent的重要性分別為0.97%和0.87%,遠(yuǎn)低于其他分類(lèi)特征。
集合不同分類(lèi)特征可以有效排除單一分類(lèi)特征中的“同譜異物”現(xiàn)象,有效提高蘋(píng)果園地遙感信息提取效果。本研究結(jié)果顯示紋理特征對(duì)于蘋(píng)果園地信息提取的重要性差異較大,例如Mean、Con、Var和Corr與其他分類(lèi)特征的重要性差異不大,均>1.43%,Asm和Ent卻均<0.97%,遠(yuǎn)低于其他分類(lèi)特征,這說(shuō)明紋理特征的熵(Ent)和二階矩(Asm)不適宜用于蘋(píng)果園地遙感信息提取。劉羽[7]基于洛川縣蘋(píng)果園地信息提取的重要性排序,得到23個(gè)優(yōu)選特征中僅包含1個(gè)紋理特征(均值),其他紋理特征均表現(xiàn)較差;代佳佳[22]在寧縣對(duì)蘋(píng)果信息提取的研究結(jié)果顯示,紋理特征的均值貢獻(xiàn)最大,其次為相關(guān)性、熵和方差。表明紋理特征在不同情境下的效益可能相差較大,這可能與蘋(píng)果樹(shù)的品種及種植方式有關(guān)。因此,在提取目標(biāo)地物信息時(shí),應(yīng)對(duì)紋理特征進(jìn)一步篩選。
以往研究表明,花期是蘋(píng)果園地遙感信息提取的最佳時(shí)期[21-23,36]。董芳[21]對(duì)比了不同時(shí)期的蘋(píng)果園地提取精度,發(fā)現(xiàn)最佳的蘋(píng)果園地識(shí)別時(shí)間為蘋(píng)果花期,即4月底至5月底。然而,部分研究表明,花期并不是蘋(píng)果園地信息提取的最佳時(shí)期。劉佳岐[20]認(rèn)為在扶風(fēng)縣地區(qū)最佳的蘋(píng)果園地信息提取時(shí)期為夏玉米收割之后、冬小麥發(fā)芽之前(2014年10月25日的Landsat8影像),輔助影像可使用冬小麥返青期前的遙感影像(2014年3月15日的Landsat8影像);劉羽[7]證明了在果實(shí)膨大期蘋(píng)果園地信息提取效果最好,其次為開(kāi)花期。最佳影像選取時(shí)間不僅與目標(biāo)地物類(lèi)型有關(guān),而且受當(dāng)?shù)貧夂驐l件、地形特征及研究區(qū)耕種制度等因素的共同影響。由于本研究區(qū)包含14個(gè)縣(區(qū)),地形復(fù)雜,因此,在前期工作的基礎(chǔ)上,明確蘋(píng)果花期作為蘋(píng)果園地信息提取的時(shí)間范圍。
選擇了光譜特征、遙感植被指數(shù)、紋理特征和地形特征作為分類(lèi)特征,但冗余特征和無(wú)關(guān)特征在一定程度上會(huì)降低分類(lèi)精度,未來(lái)應(yīng)結(jié)合區(qū)域自然條件篩選更適宜蘋(píng)果園地分類(lèi)特征及特征變量數(shù)量,以提高蘋(píng)果園地空間信息提取精度。此外,在野外樣本點(diǎn)采集過(guò)程中僅收集了蘋(píng)果園的樣本信息,并未考慮其他果樹(shù),如梨樹(shù)、桃樹(shù)等。因此,可能會(huì)對(duì)蘋(píng)果園地的空間信息提取結(jié)果產(chǎn)生一定影響。未來(lái)研究中應(yīng)同時(shí)收集其他果樹(shù)的樣本信息,增加地物類(lèi)別,提高蘋(píng)果園的分類(lèi)精度。
基于GEE平臺(tái),篩選并融合了2020年4-5月Sentinel-2影像數(shù)據(jù),采用隨機(jī)森林算法提取了陜西省渭北旱塬區(qū)14個(gè)縣(區(qū))的蘋(píng)果園地空間分布信息,得出以下主要結(jié)論。
基于包含光譜特征、遙感植被指數(shù)、紋理特征和地形特征的分類(lèi)特征集提取的渭北旱塬區(qū)蘋(píng)果種植總面積為23.03萬(wàn)hm2,與年鑒統(tǒng)計(jì)值最為接近,且總體精度和Kappa系數(shù)最高。
地形特征、光譜特征中的藍(lán)波段、短波紅外波段,以及紋理特征均值對(duì)研究區(qū)內(nèi)蘋(píng)果園地遙感信息提取的貢獻(xiàn)值最大;而紋理特征的熵和二階矩的重要性最低。
單一分類(lèi)特征在蘋(píng)果園地遙感識(shí)別中均具有一定的局限性,集合多種分類(lèi)特征結(jié)合的方式可有效提高對(duì)蘋(píng)果園地的識(shí)別和提取效果,是有效提高蘋(píng)果園地遙感信息提取精度最佳方法。