陳彤羽 段良霞 謝紅霞 王瑩瑩 毛小蘭 周 清
(湖南農(nóng)業(yè)大學(xué)資源學(xué)院,湖南 長沙 410128)
莓茶是葡萄科蛇葡萄屬的木質(zhì)藤本,又被稱為藤茶、顯齒蛇葡萄,具有天然、綠色、富酮和回甘的特性,內(nèi)含豐富的天然活性成分黃酮、氨基酸和一些人體所需的微量元素,具有較高的飲用與藥用價值,被譽為植物“黃酮之王”[1-2]。湖南湘西土家族苗族自治州M 地是莓茶的主要種植區(qū)之一,莓茶產(chǎn)業(yè)是當?shù)氐奶厣r(nóng)作物產(chǎn)業(yè)之一。該地區(qū)莓茶主要種植在武陵山脈中段的旱坡地上。準確識別莓茶種植區(qū)域的空間分布情況,為莓茶產(chǎn)量與效益評估提供有效參考,對區(qū)域農(nóng)作物種植結(jié)構(gòu)調(diào)整升級、可持續(xù)發(fā)展具有重要意義。
相較于傳統(tǒng)的實地調(diào)查測量和統(tǒng)計匯總方法,遙感是一種新興的探測技術(shù),其具有大面積同步觀測、時效性強且不受地面條件制約的優(yōu)點,廣泛應(yīng)用于農(nóng)情調(diào)查檢測工作[3]。許多學(xué)者根據(jù)農(nóng)作物的光譜特征[4]進行識別分類,因其分類效果不夠理想,又有學(xué)者引入最大似然法[5]、支持向量機[6]、神經(jīng)網(wǎng)格[7]和隨機森林[8-9]等方法來提高分類精度。僅依靠農(nóng)作物的光譜信息進行識別分類,會導(dǎo)致地物間“同物異譜”和“同譜異物”的現(xiàn)象出現(xiàn)。針對這一問題,有學(xué)者在識別分類的過程中又加入了植被指數(shù)[10-11]、紋理特征[12]與地形特征[13]等其他特征,從而提高分類精度,獲得更好的分類結(jié)果。與單一時相進行分類提取的方法相比,多時相分類方法可以根據(jù)農(nóng)作物的物候信息,利用生長期內(nèi)不同時間的遙感影像,構(gòu)建時間序列曲線數(shù)據(jù),對不同地類、不同農(nóng)作物進行提取,使得分類結(jié)果更加精準。因此,可以從農(nóng)作物生長發(fā)育期的光譜變化特征與植被指數(shù)時間序列數(shù)據(jù)曲線入手進行農(nóng)作物種植面積的精準提取。張悅琦等[14]利用高分六號遙感影像,通過構(gòu)建歸一化植被指數(shù)(NDVI)、歸一化水體指數(shù)、比值植被指數(shù)和歸一化差一紅邊指數(shù),根據(jù)各地物類型進行時序分析,準確提取了遼寧盤錦水稻種植面積。喬樹亭等[15]利用Sentinel-1和Sentinel-2的遙感影像數(shù)據(jù)分別構(gòu)建歸一化植被指數(shù)、歸一化水體指數(shù)組成完整的水稻生長曲線,分析水稻各生長期不同的光譜差異,通過閾值分割與組合不同生長時期的數(shù)據(jù),來實現(xiàn)三江平原水稻在不同物候期種植面積的提取。闞志毅等[16]利用冬小麥物候期內(nèi)的Landsat 8 OLI和高分一號數(shù)據(jù),將研究區(qū)分為3 種不同類型的提取區(qū)域,根據(jù)空間分布特征的差異選取不同的方法進行冬小麥面積分類提取,為市域范圍提取冬小麥面積提供理論參考。
目前,農(nóng)作物分類提取方面的研究大多是利用中分辨率成像先譜儀(MODIS)植被指數(shù)時間序列數(shù)據(jù)。如鄧剛等[17]以MODIS 為數(shù)據(jù)源,獲取LWSI 與EVI 的時序數(shù)據(jù),并建立湖南水稻紙質(zhì)面積決策樹模型,對模型精度進行評價,但其分類精度受到MODIS 影像范圍廣、空間分辨率低等的限制。對此,王建興等[18]利用空間分辨率更高的Landsat 8 OLI 影像作為數(shù)據(jù)源,運用NDVI 閾值分割法,結(jié)合決策樹,分類提取了研究區(qū)冬小麥種植區(qū)域數(shù)據(jù),但仍存在混合像元。Sentinel-2 搭配具有13 個波段的高分辨率多光譜成像儀,其在同一軌道上有相距180° Sentile-2A 與Sentinel-2B 兩顆衛(wèi)星,重訪周期為5 d[19]。該衛(wèi)星影像較高的空間與時間分辨率可以更好地表現(xiàn)出農(nóng)作物的生長發(fā)育特征,為更準確地分類提取農(nóng)作物種植范圍提供幫助。因此,該研究有助于探究常年在植被茂盛條件下,高分辨率的Sentinel-2 影像結(jié)合植被指數(shù)時間序列特征在莓茶種植區(qū)域的提取。利用高空間分辨率、長時間序列遙感影像以及典型植被指數(shù)等數(shù)據(jù)開展農(nóng)作物識別提取成為研究的主要方向。
本文以湖南湘西土家族苗族自治州M地為研究區(qū),以Sentinel-2 遙感影像為主要數(shù)據(jù)源,通過構(gòu)建當?shù)氐湫偷匚飼r間序列影像數(shù)據(jù)集,依據(jù)莓茶與不同地物之間的物候特征,借助物候參數(shù)對莓茶進行分類提取,研究并探討植被指數(shù)特征結(jié)合決策樹分類方法在莓茶遙感識別中的應(yīng)用潛力。
本研究選取M 地(28°22′~29°12′ N,109°50′~109°57′ E)為研究區(qū),其是莓茶的重要產(chǎn)銷地之一,地處武陵山脈中段,南北狹長,東西短,地形以低山丘陵為主,海拔330~1 025 m,氣候類型為亞熱帶季風(fēng)氣候,年平均降水量1 360 mm以上,4—10月降水占全年80%以上,年積溫5 196 ℃,主要土壤類型為黃砂土,pH值范圍為4.0~7.5,土層深厚肥沃。該自然環(huán)境有利于天然活性黃酮、氨基酸及其他維生素等有效成分的積累,從而使研究區(qū)具有獨特性。
莓茶是研究區(qū)主要農(nóng)作物之一,在自然生長條件下,莓茶全年有3 次生長期與采摘期,即3 月上旬至4 月上旬第一次生長形成春梢,4月中旬至5月上旬第一次春茶采摘;6 月上中旬第二次生長形成夏梢,6月下旬至7月上旬第二次夏茶采摘;8月上中旬第三次生長形成秋梢,8 月下旬至10 月第三次秋茶采摘,11月果實成熟后進入休眠期。研究區(qū)主要農(nóng)作物生長周期如表1所示。
表1 莓茶在研究區(qū)的物候期
根據(jù)莓茶生長周期,選取了2022年3月至2023年1 月完全覆蓋研究區(qū)且質(zhì)量較好的Sentinel-2 影像用于農(nóng)作物識別(表2)。研究所需數(shù)據(jù)來源于某數(shù)據(jù)共享網(wǎng)站(https://scihub.copernicus.eu/)。數(shù)據(jù)預(yù)處理流程主要分為重采樣、波段融合以及柵格輸出。首先,在SNAP 軟件上對影像數(shù)據(jù)進行重采樣加工,得到10 m 分辨率的13 個波段;其次,將重采樣得到的B2、B3、B4、B5、B6、B7、B8、B8A、B11 和B12 波段進行融合;最后,利用研究區(qū)邊界數(shù)據(jù)對影像數(shù)據(jù)進行裁剪,獲取研究區(qū)影像。
表2 Sentinel-2波段信息
通過野外實地調(diào)查與Google 影像圖目視解譯選取研究樣本數(shù)據(jù),共獲得272 個樣本數(shù)據(jù)。其中,莓茶獲取了67 個樣本,水田獲取了55 個樣本,旱地獲取了50 個樣本,林地獲取了50 個樣本,水體獲取了25 個樣本,建筑用地獲取了25 個樣本。在研究中用于訓(xùn)練和驗證的樣本點按照8∶2 的比例隨機選取,分別用于農(nóng)作物識別分類及后期的精度驗證。
本研究通過對Sentinel-2 影像數(shù)據(jù)的光譜特征與植被指數(shù)特征進行分析,獲取應(yīng)用于莓茶分類提取的特征,分析其光譜曲線與植被系數(shù)的時間序列曲線,構(gòu)建決策樹分類模型,對莓茶進行提取[20],并與最大似然法和支持向量機進行分類精度對比。
1.3.1 分類指標本研究選擇藍(B)、綠(G)、紅(R)和近紅外(NIR)4 個光譜特征與歸一化植被指數(shù)[21-22]、增強型植被指數(shù)(EVI)[23]這兩個典型植被指數(shù)作為分類指標。地物的光譜反射值作為識別與分類的基礎(chǔ),廣泛應(yīng)用于遙感影像的分析工作中。基于野外調(diào)查與高空間分辨率的遙感影像獲取各地物的樣本點,進一步分析得到不同地物的光譜特征值,從而為各地物分類提供依據(jù)。植被指數(shù)是利用遙感影像不同波段組合而成的光譜特性,能夠反映不同植被類型的物候差異和光譜特征。研究區(qū)內(nèi)的農(nóng)作物有著不同的生長期,農(nóng)作物的植被指數(shù)會隨著季節(jié)的變化而變化。通過構(gòu)建不同地物的時間序列曲線,可以直接看出各地物在不同時期植被指數(shù)的變化,可以為劃分各類地物植被指數(shù)閾值提供參考,從而提高分類精度。NDVI 與EVI 兩種植被系數(shù)較為常見,其計算公式分別如下。
式中,ρNIR為近紅外波段反射率,ρRED為紅波段反射率,ρBLUE為藍波段反射率,L 為土壤調(diào)節(jié)系數(shù),取值為1。
1.3.2 分類方法遙感影像分類的常用方法主要有3 種,即最大似然法、支持向量機和決策樹分類法。最大似然法是在兩類或多類判決中,用統(tǒng)計方法根據(jù)最大似然比貝葉斯判決準則法建立非線性判別數(shù)據(jù),假定各類分布函數(shù)為正態(tài)分布,并選取感興趣區(qū),計算各地物分類樣本的歸屬概率;支持向量機是一種基于統(tǒng)計學(xué)習(xí)理論的機器學(xué)習(xí)算法,從原始數(shù)據(jù)中提取最佳分類的超平面,再根據(jù)支持向量的距離來判斷類別,使分類效果盡可能獲得較高精度;決策樹分類方法通過設(shè)定一些條件對原始數(shù)據(jù)進行分層細化,其每個分叉點代表一個決策判斷條件,分叉點下的兩個支點代表滿足于不滿足條件的子集,按照一定的分割原則將數(shù)據(jù)依次分為多個子集,直至所有子集僅包含同一類別或子集包含的樣本數(shù)小于某閾值[24]。
綜上,采用最大似然法、支持向量機與決策樹分類法3種分類方法分別進行試驗,并對3種分類方法的試驗結(jié)果進行比對分析,最后選出分類精度最高的分類方法。
1.3.3 精度評價本文基于光譜特征分析結(jié)果,根據(jù)實地采樣與目視解譯獲取的樣本點,提取研究區(qū)的建筑、林地、水體、水田、旱地和莓茶共6 種主要地物在時間序列影像上的NDVI 和EVI 平均值,分別構(gòu)建各時相的藍(B)、綠(G)、紅(R)和近紅外(NIR)4 個光譜特征曲線,以及NDVI 和EVI 兩種植被指數(shù)的時序曲線。通過反復(fù)測試,根據(jù)不同的地物類型選擇合適的光譜特征,選取分類閾值,構(gòu)建決策樹分類模型,對研究區(qū)多時相Sentinel-2 影像進行分類提取,得到莓茶種植區(qū)域的空間分布狀況。最后,利用混淆矩陣計算總體精度(OA)和Kappa 系數(shù),對分類結(jié)果進行評價。具體研究流程如圖1所示。
圖1 Sentinel-2影像研究流程
本研究參照Google Earth影像和野外調(diào)查數(shù)據(jù),選取研究區(qū)內(nèi)水田、旱地、莓茶、林地、建筑和水體共6 種典型地物樣本進行光譜特征分析。分別計算各地物樣本在藍(B)、綠(G)、紅(R)和近紅外(NIR)4個波段的光譜均值,并繪制光譜特征曲線圖。
研究區(qū)6 種典型地物光譜曲線如圖2 所示,其中,2022年3月11日(圖2A)、4月10日(圖2B)、6月14 日(圖2C)、9 月12 日(圖2D)、10 月12 日(圖2E)和2023年1月30日(圖2F)影像中,藍(B)、綠(G)和紅(R)3個波段差異較小,莓茶與水田的亮度值重疊度較高;莓茶、旱地、水田和林地的亮度值都在紅(R)波段后迅速上升,在近紅外(NIR)波段處達到頂峰隨后逐漸降低;在圖2(C)中,林地亮度值高于其他地物,因為在這一時期,其他農(nóng)作物還在生長期,而林地植被生長茂盛,因此可以通過該時期的近紅外(NIR)波段提取林地。
圖2 6時相各地物光譜特征曲線
圖3—4 分別為研究區(qū)6 種典型地物的NDVI 時間序列曲線和EVI 時間序列曲線。在莓茶生長期,建設(shè)用地和水體的NDVI和EVI指數(shù)變化較??;林地的NDVI 和EVI 指數(shù)一直高于其他地物且變化較為平緩;莓茶在3—4 月的NDVI 和EVI 系數(shù)因人工干預(yù)而有所下降,隨后在4—10月整體持續(xù)增長,最后在次年1月因處于休眠期而急劇下降;水田的NDVI和EVI 指數(shù)在3—4 月略有下降,在4—10 月整體呈上升趨勢,之后開始下降;旱地的NDVI 和EVI 指數(shù)在3—10月持續(xù)上升,之后開始下降。
圖3 主要地物類別NDVI時間序列特征曲線
圖4 主要地物類別EVI時間序列特征曲線
在整個莓茶的生長發(fā)育期,有些時間段的光譜特征與其他地類相似,分類時會受到干擾。如低矮灌木和荒地的光譜特征與莓茶休眠期的特征類似,而在莓茶與水田的生長旺盛期,一些常綠林地和灌木的光譜特征與之類似,會干擾對莓茶的分類提取,從而需要對莓茶生長發(fā)育期內(nèi)可能影響其分類提取地類的光譜特征進行分析。
從圖3—4 可知,建筑用地和水體的NDVI 值在整個時間序列中都處于較為穩(wěn)定的狀態(tài),且均小于0.25,尤其是在6 月、9 月和10 月這3 個時期與其他地物有明顯區(qū)別。經(jīng)試驗得知,9 月的影像分類效果最好,因此首先利用9 月22 日NDVI0922>0.22 將水體、建筑用地等非植被覆蓋區(qū)剔除。其次,研究區(qū)內(nèi)的農(nóng)作物在4—6月都處于幼苗期,莓茶在這一時期也受到除草、修剪和采摘等人工干預(yù),農(nóng)作物覆蓋率不高,而林地生長較為茂盛,與農(nóng)作物光譜特征具有明顯區(qū)別,因此,對6 月14 日NDVI0614>0.45 與近紅外(NIR)>5 000 進行農(nóng)作物和林地的提取分類,將林地與農(nóng)作物區(qū)分出來。
從圖5 可以看出,NDVI 與EVI 在農(nóng)作物主要生長發(fā)育時期差異較小。旱地作物在4月正處于生長期,EVI較高,此時莓茶與水田作物EVI較低,經(jīng)過反復(fù)測試,EVI0410<0.22,可以將旱地作物與莓茶和水田作物進行區(qū)分。水田作物在4 月正在灌水泡田,這種獨特的耕種方式使得該作物與莓茶呈現(xiàn)明顯差異,可以進行區(qū)分,以EVI0410>0.09區(qū)分莓茶與水田。利用上述規(guī)則,得出研究區(qū)莓茶種植區(qū)域。
圖5 決策樹分類模型
采用決策樹分類法對研究區(qū)莓茶種植區(qū)域進行分類提取,由結(jié)果可知,研究區(qū)莓茶種植較為破碎,主要沿南北方向狹長分布,且研究區(qū)均有種植。根據(jù)分類提取所得研究區(qū)莓茶分布面積如表3 所示。研究區(qū)莓茶種植面積為1 184.45 hm2,其中M地種植287.49 hm2,占總面積的24.27%;G地種植243.96 hm2,占總面積的20.60%;T地種植217.55 hm2,占總面積的18.37%;W 地種植189.21 hm2,占總面積的15.95%;D 地種植98.11 hm2,占總面積的8.25%;L 地種植90.82 hm2,占總面積的7.64%;Q 地種植58.41 hm2,占總面積的4.92%??芍璺N植面積最大的是M地,種植面積最小的是Q地。
表3 各地莓茶分布面積
本研究利用決策樹分類方法確定的驗證樣本點對分類結(jié)果進行精度驗證。利用分類后的結(jié)果與地面驗證樣本建立混淆矩陣,如表4所示。其中,莓茶的用戶精度達到了94.1%,非莓茶種植區(qū)域的75 個像元中只有1個是漏分的。
表4 莓茶分類結(jié)果混淆矩陣
最大似然法、支持向量機與決策樹分類法3 種方法的分類精度與Kappa 系數(shù)如表5 所示??芍? 種分類方法的分類精度均超過90%,其中,決策樹分類法效果最好,分類精度為97.2%,Kappa 系數(shù)為0.963;支持向量機分類效果次之,分類精度為92.9%,Kappa 系數(shù)為0.896;最大似然法分類效果最差,分類精度為91.7%,Kappa 系數(shù)為0.888。由于在分類過程中增加了對不同地類不同農(nóng)作物類型的光譜比對分析,不同地類分類特征的針對性增強,因此,根據(jù)構(gòu)建的分類規(guī)則,逐步進行分類識別提取,使得分類精度大幅提高。最大似然法與支持向量機只能根據(jù)訓(xùn)練樣本進行分類提取,對于較為破碎的地塊和農(nóng)作物混種的地塊很難進行劃分,從而導(dǎo)致這些方法的錯分概率較高,分類精度降低。
表5 3種方法分類精度和Kappa數(shù)
基于2022年3月至2023年1月涵蓋M地莓茶生長發(fā)育期的多時相Sentinel-2影像,通過對不同地物的典型植被指數(shù)NDVI和EVI進行時間序列分析,構(gòu)建決策樹模型,對莓茶種植范圍進行提取,并與最大似然法和支持向量機提取結(jié)果相對比,得到以下結(jié)論。(1)研究區(qū)莓茶種植較為分散,種植地塊較為破碎。主要分布于中部與北部的T地、M地和G地,研究區(qū)東部與南部的D地和Q地分布較少。(2)根據(jù)實地驗證點對M 地莓茶種植范圍提取結(jié)果進行驗證,結(jié)果顯示,最大似然法的分類精度為91.7%,支持向量機分類方法的分類精度為92.9%,構(gòu)建決策樹分類方法的分類精度為97.2%,對比可知,決策樹分類方法精度更高。
從分析地物的時間序列特征變化入手,利用地物自身的典型植被指數(shù)變化,從多時相Sentinel-2遙感影像數(shù)據(jù)提取莓茶種植信息,有助于了解農(nóng)作物的空間分布和生長狀況,同時為農(nóng)業(yè)監(jiān)測提供技術(shù)支持。本文采用的決策樹分類方法需要較長時間來建立模型,且閾值選取難度較大,需要反復(fù)測試,以確定預(yù)制區(qū)間,導(dǎo)致效率較低,后續(xù)可以考慮使用隨機森林或深度學(xué)習(xí)等方法開展相關(guān)研究。另外,本研究基于Sentinel-2 遙感影像數(shù)據(jù)進行莓茶提取,但10 m 分辨率對細小破碎、分布零散和混種現(xiàn)象嚴重的區(qū)域難以做到精確分類,混合像元仍是影響分類精度的主要原因之一。下一步可以將Sentinel-2 影像與其他高分辨率遙感影像相結(jié)合,以解決在精確提取農(nóng)作物種植數(shù)據(jù)時出現(xiàn)的分辨率較低的問題。