張悅琦,任鴻瑞
太原理工大學(xué) 礦業(yè)工程學(xué)院,太原 030024
中國是世界上最大的水稻生產(chǎn)國和消費國,其中,東北三?。ê邶埥?、吉林、遼寧)一直是水稻的重要產(chǎn)區(qū),種植面積約占全國的17%,為中國糧食生產(chǎn)和農(nóng)業(yè)經(jīng)濟(jì)的快速發(fā)展作出巨大貢獻(xiàn)(方福平和程式華,2018;陸娣 等,2020)。及時準(zhǔn)確獲取水稻種植分布信息,對估算水稻產(chǎn)量、制定農(nóng)業(yè)政策和保障國家糧食安全具有重要作用(李志鵬 等,2014)。
高分六號(GF-6)衛(wèi)星是中國首顆設(shè)置紅邊波段的光學(xué)遙感衛(wèi)星,于2018 年在酒泉衛(wèi)星中心成功發(fā)射,具有窄幅(PMS)和寬幅(WFV)2 種不同分辨率影像。其中,GF-6 WFV 影像在傳統(tǒng)藍(lán)、綠、紅、近紅外4個波段的基礎(chǔ)上新增紅邊Ⅰ、紅邊Ⅱ、紫邊和黃邊波段,具有更加豐富的波段信息。已有研究表明,紅邊波段對作物的微小變化敏感,在作物識別與分類方面發(fā)揮重要作用(Elvidge和Chen,1995;蘇偉 等,2019;李文杰 等,2020;孫敏軒 等,2020;Kim 和Yeom,2014;Mehdaoui 和Anane,2020)。李前景等(2021)提出一種適用于GF-6 WFV 影像紅邊波段的卷積神經(jīng)網(wǎng)絡(luò)模型算法,成功對作物種植區(qū)進(jìn)行分類識別并驗證了GF-6 WFV 紅邊波段對作物分類的敏感性;梁繼等(2020)基于GF-6 影像構(gòu)建紅邊植被指數(shù),組合多個影像波段后利用支持向量機框架對松嫩平原北部作物進(jìn)行分類,結(jié)果表明紅邊特征能夠顯著提高作物識別精度。
隨著計算機技術(shù)的快速發(fā)展,機器學(xué)習(xí)近年來廣泛應(yīng)用于水稻、玉米、大豆等作物種植分布提取研究,其主要包括支持向量機、神經(jīng)網(wǎng)絡(luò)、隨機森林等算法。神經(jīng)網(wǎng)絡(luò)具有較強的自適應(yīng)、自學(xué)習(xí)能力,但分類時間復(fù)雜度高、參數(shù)難以確定,且存在過擬合和局部極值問題;支持向量機較神經(jīng)網(wǎng)絡(luò)分類精度高、泛化能力強,但在核函數(shù)的選擇與參數(shù)設(shè)置方面缺乏理論依據(jù)(閆利和江維薇,2016;賈坤 等,2011)。因此,具有訓(xùn)練速度快、分類精度高、不易過擬合、可處理高維數(shù)據(jù)等優(yōu)點的隨機森林算法在作物種植提取研究中更受青睞(侯蒙京 等,2020;陳安旭和李月臣,2020;張鵬和胡守庚,2019;Immitzer 等,2016)。黃健熙等(2017)利用多時相GF-1 WFV數(shù)據(jù)并采用隨機森林算法成功提取嫩江縣玉米與大豆種植分布,結(jié)果表明隨機森林算法較支持向量機算法分類精度更高;王李娟等(2020)基于Sentinel-2 數(shù)據(jù)生成光譜特征、植被指數(shù)、紅邊指數(shù)和紋理特征,根據(jù)特征重要性排序構(gòu)建7種特征組合方案,分別采用隨機森林算法與支持向量機算法對農(nóng)耕區(qū)進(jìn)行土地覆被分類,結(jié)果表明,隨機森林分類精度優(yōu)于相同特征變量下的支持向量機算法,總體精度可達(dá)88.24%。
截止目前,利用GF-6 WFV 影像提取水稻種植分布的研究中,多注重于紅邊波段對分類精度影響的探討與分析,而紫邊與黃邊波段對水稻分類精度的影響尚未得知。此外,由于時序影像包含信息多,其分類精度通常要優(yōu)于單時相影像,但時序影像分類速度較慢、效率較低。因此,為尋找一種高效、高精度的水稻提取方法,探索GF-6 WFV 新增波段對水稻分類精度的影響,本研究以遼寧省盤錦市為研究區(qū),以GF-6 WFV 影像為數(shù)據(jù)源,利用6景覆蓋水稻關(guān)鍵物候期的單時相影像及其組合的時序影像,通過構(gòu)建光譜特征、植被指數(shù)、水體指數(shù)和紅邊指數(shù)4類特征變量,基于特征優(yōu)選的隨機森林模型開展水稻種植分布提取研究。根據(jù)驗證樣本和實地驗證點對提取結(jié)果進(jìn)行精度驗證,對比分析后獲得提取水稻信息的最優(yōu)特征和最佳時相,為國產(chǎn)GF-6 衛(wèi)星的推廣應(yīng)用提供更多理論方案。
盤錦市地處遼寧省西南部,介于40°39′N—41°27′N,121°25′E—122°30′E,下轄有盤山縣、雙臺子區(qū)、大洼區(qū)和興隆臺區(qū)(圖1),是中國重要的商品糧食生產(chǎn)基地和大米出口基地。研究區(qū)屬暖溫帶大陸性半濕潤季風(fēng)氣候,具有光照充足、晝夜溫差大、四季分明等特點,地勢平坦,平均海拔高度約4 m,且土壤略偏堿性。根據(jù)2019盤錦統(tǒng)計年鑒,該區(qū)年均氣溫8 ℃—11 ℃,年均降水618.62 mm。因其獨特的地理環(huán)境和氣候條件,盤錦市適宜農(nóng)作,土地覆蓋類型以耕地為主,其中約85%為灌溉水田,約14%為旱地,因此水稻在全市糧食生產(chǎn)中占有重要地位。結(jié)合2020 版30 m全球地表覆蓋數(shù)據(jù)GlobeLand30(Chen 等,2015),水稻、旱地等耕地占研究區(qū)總面積約70%,除耕地外的主要土地覆蓋類型有水體、建筑用地和天然濕地。水體與天然濕地分布較為集中,主要位于盤錦市南部與西南部;建筑用地遍布全市,呈破碎化分布,占研究區(qū)總面積約15%。
圖1 盤錦市地理位置和樣本點空間分布Fig.1 Geographical location schematic and spatial distribution of ground feature sample points in Panjin
結(jié)合Google Earth高分辨率影像進(jìn)行目視解譯,根據(jù)研究區(qū)土地覆蓋情況共獲取樣本點2000 個(圖1(b))。樣本點均勻分布于研究區(qū)內(nèi),包括1000 個水稻樣本點,250 個水體樣本點,300 個天然濕地樣本點,150 個旱地作物樣本點,300 個建筑用地樣本點。其中,70%用作訓(xùn)練樣本,30%用作驗證樣本。此外,通過實地調(diào)查獲得36 個水稻實地驗證點(圖1(b)),并于每個點上拍攝實地照片。
本研究選用GF-6 衛(wèi)星WFV 傳感器,獲取6 景2020 年5—8 月覆蓋盤錦市的L1A 級遙感影像,分別對應(yīng)三葉期、移栽期、返青期、孕穗期和抽穗期等水稻關(guān)鍵物候期,成像時間分別為2020年5月11日、5月25日、6月1日、6月6日、7月20日與8 月22 日,空間分辨率為16 m。其中,返青期由6月1日與6月6日2景影像共同覆蓋。為便于表述,以5.11、5.25、6.01、7.20、8.22 分別代表三葉期、移栽期、返青期、孕穗期和抽穗期影像。GF-6 WFV 影像具有藍(lán)波段(0.45—0.52 μm)、綠波段(0.52—0.59 μm)、紅波段(0.63—0.69 μm)、近紅外波段(0.77—0.89 μm)、紅邊Ⅰ波段(0.69—0.73 μm)、紅邊Ⅱ波段(0.73—0.77 μm)、紫邊波段(0.40—0.45 μm)和黃邊波段(0.59—0.63 μm)8個波段(陸春玲 等,2021)。
在ENVI 5.3 遙感圖像處理軟件中進(jìn)行影像預(yù)處理,包括輻射定標(biāo)、大氣校正、正射校正和影像裁剪。遙感影像、絕對輻射定標(biāo)系數(shù)和波譜響應(yīng)函數(shù)可從中國資源衛(wèi)星應(yīng)用中心(http://www.cresda.com/CN/[2021-05-31])下載。
本研究選取光譜特征、植被指數(shù)、水體指數(shù)和紅邊指數(shù)共20個特征變量(表1)。
表1 特征變量信息和遙感指數(shù)計算公式Table 1 Information of characteristic variables and formula for calculating remote sensing indicies
在影像預(yù)處理的基礎(chǔ)上,選取GF-6 WFV 影像的8 個波段作為光譜特征。反映土地覆蓋類型時,植被指數(shù)和水體指數(shù)比單波段信息更為穩(wěn)定,可在一定程度上提高分類精度(何云 等,2019),故選取具有代表性的7 種植被指數(shù)和1 種水體指數(shù)作為隨機森林識別的特征指數(shù)波段。紅邊波段多指植被反射率在近紅外波段與紅光波段之間快速變化的區(qū)域,是指示綠色植物生長狀況的敏感性波段(Horler 等,1983)。鑒于此,本研究將GF-6 WFV影像的2個紅邊波段分別代替歸一化植被指數(shù)NDVI(Normalized Difference Vegetation Index)中的近紅外波段,得到2個紅邊指數(shù)(梁繼 等,2020),即歸一化植被指數(shù)710 即NDVI710(Normalized Difference Vegetation Index 710)和歸一化植被指數(shù)750 即NDVI750(Normalized Difference Vegetation Index 750)。此外,借鑒了Sentinel-2衛(wèi)星的2種紅邊指數(shù)(Clevers和 Gitelson,2013;Dash和 Curran,2004),即歸一化差異紅邊1指數(shù)NDRE1(Normalized Difference Red Edge 1 Index)和地面葉綠素指數(shù)MTCI(Terrestrial Chlorophyll Index)。
隨機森林算法是由Breiman(2001)提出的以決策樹為基本分類器,結(jié)合Bagging 集成學(xué)習(xí)理論與隨機子空間方法的一種集成學(xué)習(xí)方法。隨機森林通過自助法(Bootstrap)從原始訓(xùn)練集中有放回地隨機選取N個樣本作為訓(xùn)練樣本,因此會有約37%的樣本未被抽取到,這些樣本被稱為袋外OOB(Out of Bag)數(shù)據(jù),可用于評估隨機森林模型性能(Breiman,1996)。經(jīng)Ntree次樣本抽取和訓(xùn)練可得到Ntree個決策樹模型,在每棵決策樹的每個節(jié)點處隨機選取Mtry(Mtry 隨機森林中決策樹構(gòu)建時采用基尼指數(shù)進(jìn)行節(jié)點分裂時的特征選擇?;嶂笖?shù)表示樣本集合中隨機樣本被錯分的概率,基尼指數(shù)越小則集合的純度越高,被錯分的概率越?。环粗?,集合越不純。集合D的基尼指數(shù)Gini(D)如式(1)所示: 式中,K為訓(xùn)練樣本中的種類數(shù);PK為集合D中隨機選取的樣本屬于類別K的概率。 若集合D根據(jù)特征A是否取某一值α被分為D1和D2兩部分,則在特征A的條件下,集合D的基尼指數(shù)Gini(D,A)如式(2)所示: 式中,|D|表示集合D中的樣本數(shù),|D1|表示集合D1中的樣本數(shù),|D2|表示集合D2中的樣本數(shù)。由此看出,隨機森林模型構(gòu)建時,若通過某特征劃分后的基尼指數(shù)減少的程度越大,則劃分后集合變純的程度越大,該特征在模型中越重要。因此,采用該方法即平均不純度減少的方法可評估特征重要性,其定義如式(3)所示: 式中,Ntree為隨機森林模型中決策樹個數(shù);Ginit(D)、Ginit(D,A)分別為第t棵決策樹經(jīng)特征A劃分前后集合D的基尼指數(shù)。 由于所有特征參與分類將導(dǎo)致信息冗余,從而降低分類精度和分類速度,因此本研究在Python平臺下通過調(diào)用Scikit-learn 庫建立隨機森林模型,采用平均不純度減少的方法計算模型中各特征重要性并按照從高到低的順序進(jìn)行排序。根據(jù)重要性排序,第1 次選擇首位特征,第2 次選擇前2 位特征,依次類推可得到單時相20個不同特征組合、時序影像100個不同特征組合的隨機森林模型,分別計算其OOB 誤差,對模型精度和模型復(fù)雜度綜合考慮后確定最優(yōu)特征組合,從而在保證分類精度的條件下降低模型復(fù)雜度。 利用驗證樣本獲得混淆矩陣,計算總體精度OA(Overall Accuracy)、Kappa 系數(shù)和F1 值(F1_score),從而對特征優(yōu)選的隨機森林分類結(jié)果進(jìn)行精度評價,計算公式如式(4)—式(6)所示。OA 為驗證樣本集上分類器預(yù)測正確的概率。Kappa系數(shù)是檢驗驗證樣本與預(yù)測結(jié)果吻合度的指標(biāo),取值范圍為[0,1],越接近1 表示模型吻合度越高(馮銳 等,2017)。F1 值是制圖精度和用戶精度的調(diào)和均值,可用于表征模型輸出的好壞,取值范圍為[0,1],越接近1 表示模型輸出效果越好(楊建宇 等,2019)。 式中,mi為第i類的分類正確樣本數(shù);Ci為第i類的分類像元總數(shù);Gi為第i類的真實像元總數(shù);N為分類像元總數(shù);n為分類數(shù);P和U分別為制圖精度PA(Producer Accuracy)和用戶精度UA(User Accuracy),計算公式如式(7)所示: 此外,實地驗證點均為水稻且未在研究區(qū)均勻分布,故僅計算總體精度進(jìn)行說明。 采用平均不純度減少的方法,分別基于單時相GF-6 WFV 影像和時序影像計算模型中各特征重要性(圖2)。由于基于時序影像的特征數(shù)多達(dá)100個,此處僅列出前20位。 圖2 特征重要性評估結(jié)果和不同特征組合模型OOB精度Fig.2 Feature importance assessment results and OOB accuracy of different feature combination models 從水稻三葉期至抽穗期,即2020 年5—8 月,水體指數(shù)和植被指數(shù)重要性排名逐漸降低,紅邊指數(shù)的重要性排名逐漸提高(圖2),表明紅邊指數(shù)對土地覆蓋分類貢獻(xiàn)度逐漸增大。2個紅邊波段中,B6 波段重要性相對較高;在NDRE1、MTCI、NDVI710 和NDVI750 等4 個紅邊指數(shù)中,NDRE1的重要性較高,在孕穗期和抽穗期影像中,重要性排名均為首位。究其原因,研究區(qū)水稻覆蓋范圍較大,且5—6 月稻田需進(jìn)行泡田和移栽,呈現(xiàn)出以水體為主的特點,與其他地物類型光譜特征差異較大,歸一化水體指數(shù)NDWI(Normalized Difference Water Index)對水體信息提取效果較好,故5—6 月NDWI 的重要性較高。NDRE1 用紅邊的峰和谷來代替NDVI 的紅光波段與近紅外波段,屬于窄帶綠度指數(shù),相比于寬帶綠度指數(shù)對葉綠素含量、葉冠層的微小變化等更加敏感,能夠提高對作物的識別能力(張沁雨 等,2019)。隨時間的推移,水稻、天然濕地和旱地作物逐漸生長,7—8 月體現(xiàn)出高覆蓋植被特點,故NDRE1 對土地覆蓋分類的貢獻(xiàn)度逐漸增大?;跁r序影像的重要性排名中,前20 位以孕穗期和抽穗期影像的特征量居多,其中光譜特征11個,紅邊指數(shù)4個,植被指數(shù)3 個,水體指數(shù)2 個,前2 位分別為抽穗期影像和孕穗期影像的紅邊指數(shù)NDRE1,即NDRE18.22和NDRE17.20。 對單時相影像20 個不同特征組合和時序影像100 個不同特征組合進(jìn)行OOB 估計,得到OOB 精度(圖2)。因時序影像特征數(shù)過多,圖2中僅顯示前20位。以三葉期影像為例,特征數(shù)從1增加到7,即特征從僅有NDWI到特征包含重要性排序前7位,OOB 精度逐漸增加;特征數(shù)為7 時,OOB 精度達(dá)到0.956;特征數(shù)從7 增加到20,OOB 精度整體上有微小的下降趨勢,但在特征數(shù)為19 時,OOB 精度達(dá)到最高,為0.957。由于特征個數(shù)過少會導(dǎo)致分類精度較低,特征個數(shù)過多會導(dǎo)致信息冗余且增加運行成本,故對模型精度和模型復(fù)雜度綜合考慮后選擇特征重要性排名前7的特征作為隨機森林模型的最優(yōu)輸入特征。根據(jù)相同特征選擇方法,對移栽期、返青期、孕穗期、抽穗期和時序影像進(jìn)行特征選擇,分別選取重要性排名前8、前5、前8、前8和前16的特征作為最優(yōu)輸入特征。 利用單時相影像和時序影像,基于特征優(yōu)選的隨機森林模型對2020 年盤錦市水稻種植分布進(jìn)行提取,獲得6 種水稻分布結(jié)果(圖3)。從目視效果來看,6 種結(jié)果較為一致,水稻主要分布于盤錦市北部、東部與中南部,以大洼區(qū)和盤山縣為主。較于單時相水稻分類結(jié)果,基于時序影像的水稻分類圖斑更為規(guī)整,一定程度緩解了“椒鹽現(xiàn)象”,分類效果最佳。三葉期、移栽期和返青期影像對應(yīng)的分類結(jié)果中,盤錦市西南部水體錯分現(xiàn)象明顯,原因為此時水稻需進(jìn)行泡田、移栽,稻田以水體為主,相似的光譜特征導(dǎo)致部分水體錯分為水稻。水稻孕穗期與抽穗期時稻田體現(xiàn)出植被特征,水體錯分為水稻現(xiàn)象明顯減少,但盤錦市西北與東北部旱地作物錯分為水稻現(xiàn)象有所增加,且“椒鹽現(xiàn)象”更加明顯。 圖3 基于不同物候期影像的2020年盤錦市水稻分布圖Fig.3 Paddy rice distributions based on different images of phenological phases in Panjin City in 2020 根據(jù)混淆矩陣分別計算總體精度、Kappa 系數(shù)和各土地覆蓋類型的F1 值,根據(jù)水稻實地驗證點計算實地驗證點精度(表2)。單時相影像分類結(jié)果中,移栽期影像分類結(jié)果精度最高,其總體精度、F1 值(水稻)、Kappa 系數(shù)和實地驗證點精度分別為97.67%、98.84%、0.97 與97.22%,較抽穗期影像分類結(jié)果分別高出1.00%、1.34%、0.02 和2.78%。綜合目視情況,單時相分類結(jié)果中,移栽期影像分類效果最佳,原因在于此時水稻與研究區(qū)內(nèi)天然濕地、旱地作物物候特征差異較大,易于識別。與單時相影像分類結(jié)果相比,基于時序影像的水稻分類精度顯著提高,水稻錯分與漏分現(xiàn)象有所減少,總體精度、F1值(水稻)、Kappa系數(shù)與實地驗證點精度高達(dá)99.33%、100.00%、0.99和97.22%,但其分類速度較慢、效率較低。因此,實際應(yīng)用中為減少運算時間和運行成本,達(dá)到高效、高精度的要求,可直接利用GF-6 WFV 水稻移栽期影像提取水稻種植信息。 表2 基于特征優(yōu)選隨機森林模型的2020年盤錦市水稻分類結(jié)果精度評價Table 2 Paddy rice classification accuracy based on feature-optimized random forest in Panjin City in 2020 GF-6 衛(wèi)星新增2 個紅邊波段,為直觀反映紅邊信息對土地覆蓋類型分類精度的影響,將紅邊波段B5、B6 和紅邊指數(shù)NDRE1、MTCI、NDVI710、NDVI750共6個特征去除,使用剩余14個特征并利用單時相影像和時序影像,基于特征優(yōu)選的隨機森林模型對2020年盤錦市水稻種植分布進(jìn)行提取,根據(jù)驗證樣本和水稻實地驗證點進(jìn)行精度驗證(表3)。 結(jié)果表明,三葉期和返青期影像的有紅邊信息與無紅邊信息提取結(jié)果精度較為一致;移栽期影像的無紅邊信息分類結(jié)果較有紅邊信息時精度有所下降,F(xiàn)1 值(水稻)與總體精度分別降低0.33%和0.84%;孕穗期和抽穗期影像的無紅邊信息分類結(jié)果精度顯著下降,F(xiàn)1 值(水稻)分別降低0.47%和0.82%,總體精度分別降低1.67%和1.84%;時序影像的無紅邊信息分類結(jié)果較有紅邊信息時總體精度下降0.33%。水稻實地驗證點較少且均在稻田旁的道路上獲取,因此僅能通過目視解譯對分類結(jié)果進(jìn)行判讀,由于有無紅邊信息分類結(jié)果為像元級差異,故實地驗證精度未發(fā)生變化。三葉期和返青期影像的無紅邊信息分類結(jié)果精度未降低的原因在于,在重要性排序中紅邊波段和紅邊指數(shù)的排名均靠后,對土地覆蓋分類貢獻(xiàn)度較??;移栽期影像的特征重要性排序中,紅邊波段B6 位列第3,故無紅邊信息分類結(jié)果精度有所下降;而孕穗期和抽穗期影像的特征重要性排序中,紅邊指數(shù)NDRE1 均位居首位且重要性較高,對土地覆蓋分類貢獻(xiàn)度較大,故精度下降較移栽期影像更為明顯。時序影像中紅邊指數(shù)特征重要性排名靠前,但無紅邊信息分類結(jié)果精度有所降低卻不明顯,t檢驗結(jié)果表明兩種分類結(jié)果在統(tǒng)計學(xué)上無顯著性差異(P=0.58>0.05)。分析其原因在于,水稻在全生育期內(nèi)與其他地物類型相比有著獨特的光譜特點,即生育期前期體現(xiàn)水體特征,后期體現(xiàn)植被特征,故時序影像中僅利用光譜特征、植被指數(shù)與水體指數(shù)對水稻種植分布進(jìn)行提取,也可獲得較好效果,這也表明時序信息可解決因缺少紅邊信息而分類精度下降的問題。 為反映GF-6 WFV新增紫邊(B7)和黃邊(B8)波段對提取作物種植分布的影響,將B7、B8 波段從20 個特征變量中剔除,使用剩余18 個特征并利用單時相影像及時序影像,基于特征優(yōu)選的隨機森林模型提取2020 年盤錦市水稻種植分布并進(jìn)行精度驗證(表4)。 表4 無B7、B8波段且基于特征優(yōu)選隨機森林模型的2020年盤錦市水稻分類結(jié)果精度評價Table 4 Paddy rice classification accuracy without bands B7 and B8 based on feature-optimized random forest in Panjin City in 2020 較全特征且基于特征優(yōu)選隨機森林模型的水稻分類精度(表2),三葉期、移栽期、孕穗期與抽穗期影像分類總體精度分別下降0.17%、0.67%、1.00%和1.34%,其中移栽期、孕穗期與抽穗期影像F1值(水稻)分別下降0.17%、0.32%和1.18%,分類精度有所降低的原因是這4期影像的紫邊、黃邊波段在重要性排序中排名較為靠前,對土地覆蓋分類貢獻(xiàn)度較大。較無紅邊信息水稻分類結(jié)果精度(表3),移栽期、孕穗期與抽穗期影像分類總體精度分別提高0.17%、0.67%和0.50%,Kappa系數(shù)均提高0.01。結(jié)果表明紫邊、黃邊波段能夠提高水稻分類精度,但紅邊信息較紫邊、黃邊波段分類結(jié)果精度提高效果更佳,原因在于紅邊波段或紅邊指數(shù)特征重要性排名較紫邊和黃邊波段更為靠前。時序影像分類精度與基于特征優(yōu)選隨機森林模型的水稻分類精度(表2)相一致,略高于無紅邊信息水稻分類結(jié)果精度(表3)且差異無統(tǒng)計學(xué)意義(P=0.47>0.05),結(jié)果表明,基于無紫邊、黃邊波段的時序影像可獲得較高分類精度,時序信息可解決缺少紫邊、黃邊波段而分類精度下降的問題。此外,因分類結(jié)果為像元級差異且水稻實地驗證點位于稻田旁的道路上,故經(jīng)目視解譯判讀后,水稻實地驗證點精度未發(fā)生變化。 本研究采用不同物候期的GF-6 WFV影像構(gòu)建光譜特征、植被指數(shù)、水體指數(shù)和紅邊指數(shù)等特征變量,基于特征優(yōu)選的隨機森林模型對2020 年盤錦市水稻種植分布進(jìn)行提取并得到以下結(jié)論: (1)不同物候期的單時相影像水稻分類結(jié)果表明,利用單時相GF-6 WFV 影像并基于特征優(yōu)選的隨機森林模型能夠較高精度地獲取水稻種植分布信息,總體精度、F1值(水稻)和實地驗證點精度均在90%以上。綜合目視解譯、驗證樣本精度評價與實地驗證點精度評價,處于水稻移栽期的影像分類結(jié)果最佳,總體精度、F1 值(水稻)、Kappa系數(shù)與實地驗證點精度分別為97.67%、98.84%、0.97和97.22%。 (2)與單時相影像分類結(jié)果相比,利用時序影像提取水稻種植分布,分類精度顯著提高,總體精度、F1值(水稻)與Kappa 系數(shù)分別為99.33%、100.00%和0.99,較移栽期影像分類結(jié)果分別提高1.66%、1.16%和0.02。利用時序影像基于隨機森林方法進(jìn)行分類時,較多的特征變量造成模型復(fù)雜度較高,分類速度較慢,因此,實際應(yīng)用中,有紅邊信息時利用水稻移栽期的單時相影像進(jìn)行水稻種植分布提取即可滿足精度要求且分類效率較高;無紅邊信息時可利用時序影像進(jìn)行水稻種植分布提取,從而解決無紅邊信息時分類精度較低的問題。 (3)紅邊波段和紅邊指數(shù)在特征重要性排名較高的影像中,特別是在孕穗期和抽穗期等植被覆蓋度較高的時期,引入紅邊波段和紅邊指數(shù)能夠提高分類精度,減少錯分、漏分現(xiàn)象,優(yōu)于相同分類方法下未引入紅邊波段和紅邊指數(shù)的分類結(jié)果。研究表明,紅邊波段和紅邊指數(shù)的引入能夠增強作物識別能力,在作物精細(xì)提取方面具有重要作用和廣闊前景,但可能由于盤錦市地物類型簡單、種植結(jié)構(gòu)單一,引入紅邊信息后分類精度提高效果不顯著。 (4)根據(jù)重要性排序可看出紫邊和黃邊波段在土地覆蓋分類中有較好表現(xiàn),但沒有紅邊信息貢獻(xiàn)度大,因此引入紫邊和黃邊波段的分類結(jié)果略優(yōu)于相同分類方法下未引入紫邊和黃邊波段的分類結(jié)果,但較于紅邊信息精度提高效果不顯著。 水稻因獨特的種植方式,與其他作物有著明顯的光譜差異,且GF-6 WFV 在傳統(tǒng)波段的基礎(chǔ)上新增紅邊(B5、B6)、紫邊(B7)和黃邊(B8)波段,能夠提高水稻信息提取精度,故在種植結(jié)構(gòu)簡單的地區(qū)(如地勢平坦且耕地連片的中國東北地區(qū)),本研究方法分類精度較高且適用性較好。而中國南方作物種植結(jié)構(gòu)復(fù)雜(如地勢起伏較大、地形較為復(fù)雜的四川丘陵地區(qū)、湖南省等),水稻田破碎化嚴(yán)重,且因氣候條件,南方多種植雙季稻,故本研究方法及結(jié)論需進(jìn)行下一步驗證與分析。此外,研究區(qū)內(nèi)不同土地覆蓋類型面積差異較大,本研究中樣本點的選取存在不同類別樣本數(shù)不平衡問題,下一步可對數(shù)據(jù)集進(jìn)行預(yù)處理,從而提高非平衡數(shù)據(jù)集的分類精度。3.3 精度分析
4 結(jié)果與分析
4.1 特征重要性評估
4.2 最優(yōu)特征組合
4.3 基于特征優(yōu)選的隨機森林結(jié)果
4.4 紅邊信息對分類精度的影響
4.5 紫邊、黃邊波段對分類精度的影響
5 結(jié)論