王利軍,郭 燕,王來剛,賀 佳,張紅利,劉 婷
(河南省農(nóng)業(yè)科學院 農(nóng)業(yè)經(jīng)濟與信息研究所,河南 鄭州 450002)
遙感影像對不同地物具有豐富的光譜、紋理等特征信息,為作物面積監(jiān)測、種植結構調(diào)整和優(yōu)化提供了重要依據(jù)[1-2]。春季作物是頭年播種次年初夏收獲作物的統(tǒng)稱[3],開封杞縣春季作物主要為冬小麥和大蒜,其種植面積占春季作物總面積的90%以上。隨著遙感技術在農(nóng)作物面積監(jiān)測、長勢監(jiān)測、病蟲害監(jiān)測和產(chǎn)量估算等領域的不斷深入應用,采用作物“關鍵物候期”的單期或少數(shù)幾期遙感影像,結合多特征參量和敏感波段的分類方法成為當前作物種植結構提取的主要方法,通過增加作物敏感波段,可以在客觀上增加單一時相影像所包含的有效信息量,有助于增強地類間可分性[4]。其中,紅邊是植被的反射率在近紅外線波段接近與紅光波段交界處快速變化的區(qū)域,波段范圍為690~730 nm。已有研究[4-9]表明,紅邊波段能有效反映作物特有的光譜特性,在作物類型識別、參數(shù)計算、病害或環(huán)境脅迫監(jiān)測等方面發(fā)揮著重要作用。
2018年6月2日,我國成功發(fā)射高分六號(GF6)低軌光學遙感衛(wèi)星,這是我國首顆用于精準農(nóng)業(yè)觀測的高分衛(wèi)星,重訪周期2 d,與高分一號衛(wèi)星類似,具有窄幅(PMS)和寬幅(WFV)2種不同空間分辨率影像,但GF6寬幅影像在原有4個波段基礎上新增了紅邊1、紅邊2、紫和黃4個波段,且具有更大的尺度范圍。近年來,將紅邊波段衛(wèi)星遙感影像在作物分類[5]、土地覆蓋[10]、林地分類[4]、植被生理參數(shù)反演[11]等方面均開展了研究應用,不同程度地說明了紅邊波段在遙感監(jiān)測分類精度中的作用。在紅邊波段參與的作物面積監(jiān)測方面,佘寶等[12]采用2期EO-1 Hyperion影像,通過分析并構建基于油菜花紅邊特征的決策樹實現(xiàn)作物分類提取,總體精度達到92.6%;劉佳等[5]利用單時相RapidEye影像,分析在有無紅邊參與條件下,玉米、大豆及其他3種作物類型的可分性測度、分類精度及景觀破碎度等指標,得出有紅邊波段參與時,作物面積提取總體精度由81.7%提高到88.4%。田富有等[13]利用Sentinel-2影像及其3個紅邊波段,得出大豆、玉米與其他作物在第2個紅邊波段的反射率有較為明顯的差異,多層神經(jīng)網(wǎng)絡分類總體精度為93.53%。同時,在紅邊波段參與下的作物參數(shù)遙感反演等研究[14-17]中,通過構建紅邊波段指數(shù)分別實現(xiàn)了葉面積指數(shù)估算、植被健康程度判斷以及植株氮素含量估測,均得出紅邊波段對作物生理參數(shù)的變化較為敏感,也都不同程度地提高了遙感技術在作物監(jiān)測應用中的精度。
為探索GF6衛(wèi)星遙感影像紅邊波段對主要春季作物分類提取精度的影響,以2019年3月25日冬小麥拔節(jié)期單時相WFV寬幅影像為數(shù)據(jù)源,選擇河南省杞縣為研究區(qū),從冬小麥、大蒜、其他作物(油菜和蔬菜等)分類著手,利用特征優(yōu)化空間算法(Feature space optimization,F(xiàn)SO)進行光譜特征分析,采用隨機森林(Random forest,RF)監(jiān)督分類方法,分析不同紅邊波段組合方案對春季作物種植結構識別精度、樣本可分性測度及其光譜反射率的影響,以及不同紅邊波段在作物分類中的重要性,為復雜作物種植結構提取和監(jiān)測提供方法參考。
杞縣位于河南省開封市,地處114°36′~114°56′E,34°13′~34°46′N,面積1 243 km2,屬溫帶大陸性季風氣候,常年平均氣溫14.1℃,年均降水量722 mm,無霜期210~214 d,年均日照2 529 h。該研究區(qū)耕地面積約8.87萬hm2,春季作物以冬小麥和大蒜為主,其他作物如油菜、蔬菜等少量種植。春季主要作物于每年10月初播種,次年5—6月達到成熟,生長發(fā)育期約230 d。圖1為杞縣在河南省的位置及其行政邊界示意圖。
圖1 研究區(qū)地理位置示意Fig.1 Location of study area
1.2.1 遙感影像獲取與處理 通過對已有關于作物生長關鍵生育時期及其分類提取研究成果[18-20]的分析,選取2019年3月25日作物覆蓋度高且清晰無云的1期GF6 WFV遙感影像作為數(shù)據(jù)源,其產(chǎn)品序列號為1119877603,衛(wèi)星波段信息見表1。GF6 WFV影像預處理流程與GF1影像類似,在ENVI 5.3中進行輻射定標、大氣校正、正射校正和幾何校正,輻射定標利用場地定標系數(shù)將GF6衛(wèi)星高分相機和寬幅相機圖像DN值轉換為輻射亮度圖像,其公式為:
LZ(λZ)=Gain·DN
(1)
式中,LZ(λZ)為轉換后衛(wèi)星相機譜段輻射亮度,單位為W/(m2·nm·sr),Gain為相機在軌輻射響應度,單位為W/(m2·nm·sr),DN為衛(wèi)星相機譜段輸出計數(shù)值。
在進行大氣校正去除大氣影響后,結合研究區(qū)當?shù)剡b感影像數(shù)據(jù)進行幾何校正,誤差在0.5個像元內(nèi),滿足遙感影像分類定位精度要求。
表1 GF6 WFV波段信息Tab.1 Band information of GF6 WFV image nm
1.2.2 地面數(shù)據(jù)獲取 地面調(diào)查數(shù)據(jù)遵循各鄉(xiāng)鎮(zhèn)隨機均勻分布的原則,采用亞米級差分GPS,主要采集不同地物地面影像解譯標志點、地面樣方數(shù)據(jù)和地面驗證點數(shù)據(jù)。同時,受遙感影像空間分辨率影響,地面調(diào)查數(shù)據(jù)盡量在地塊中間位置采集數(shù)據(jù)點,當冬小麥和大蒜地塊交叉種植情況復雜時,增加采集該區(qū)域樣本點數(shù)據(jù)。
(1)解譯標志點
影像地面解譯標志點共采集166個,包括冬小麥87個、大蒜55個、菜地11個、休閑耕地9個、大棚4個,用于春季作物監(jiān)督分類時訓練樣本的選取。
(2)地面樣方
共調(diào)查地面樣方7個,實測總面積為6.24 hm2,其中冬小麥、大蒜、裸地、其他作物分別占63.56%、33.80%、1.72%和0.92%。
(3)地面驗證點
地面驗證點共采集635個,其中冬小麥362個、大蒜253個、菜地12個、荒草地1個、裸地7個,并根據(jù)高分辨率遙感影像人工編輯成多邊形驗證圖斑,用于分類結果精度驗證。
1.3.1 技術思路 為實現(xiàn)對遙感影像不同紅邊波段在作物識別中的重要性評價,本研究只針對影像波段的光譜特征進行作物分類提取和精度驗證。采用隨機森林監(jiān)督分類方法,針對單一紅邊參與、全部紅邊參與和無紅邊參與條件下的4種波段組合方案,獲取冬小麥、大蒜以及其他作物的遙感分類精度,并通過計算4種波段方案下樣本數(shù)據(jù)的可分性測度指標,比較紅邊波段對作物識別能力的提升作用,以及對地物漏分錯分以及“椒鹽”效應的降低能力,借此分析不同紅邊波段對作物分類提取精度的影響及紅邊波段的重要性。其中,監(jiān)督分類的樣本除地面調(diào)查點外,根據(jù)影像光譜特征和紋理特征進行人工選取,分類結果精度驗證采用地面樣方和地面驗證點進行評價。作物可分性測度采用J-M(Jeffries-Matusita)距離計算,通過分析3種不同作物在各個波段的光譜反射率,以此實現(xiàn)影像各波段在作物識別中的重要性評價。
1.3.2 隨機森林 目前,作物遙感監(jiān)督分類方法中常用的主要有最大似然法、支持向量機法、決策樹法、隨機森林法、人工神經(jīng)網(wǎng)絡算法等[21-23]。其中,隨機森林分類方法是遙感信息自動提取領域中一種相對較新的機器學習模型,是分類器算法和決策樹分類算法的有效結合,實現(xiàn)過程主要分為訓練集的生成、單個決策樹的構建和算法運行3個步驟[24]。以往研究[23-26]表明,該方法能適用于多源遙感影像特征識別和信息提取,有較高的分類精度。
由于隨機森林分類方法由多個決策樹構成,采用基尼指數(shù)對分類過程中每棵決策樹的每一個節(jié)點進行不純度判斷并進行最優(yōu)屬性劃分,最終使得每個節(jié)點樣本盡可能屬于同一類別,隨著劃分過程的不斷進行,結點的類別純度越高,通過該方法還能計算出每個決策樹節(jié)點上特征子集中每個特征的重要性得分,以實現(xiàn)特征重要性度量和優(yōu)選[27]。本研究利用隨機森林方法提取研究區(qū)春季作物流程如下:首先,結合地面解譯標志點數(shù)據(jù)在遙感影像中選取研究區(qū)內(nèi)不同地物類型(冬小麥、大蒜、其他作物、水體、建筑與道路、休閑耕地和林地7種分類系統(tǒng))的樣本區(qū);其次,根據(jù)不同地物屬性選取若干識別特征,把不同樣本區(qū)數(shù)據(jù)匯總為訓練數(shù)據(jù)集;最后,采用隨機森林方法對研究區(qū)數(shù)據(jù)春季作物進行自動識別。由于樣本區(qū)數(shù)據(jù)集的質(zhì)量對算法性能和識別結果的精度均有較大影響,因此,地物樣本選擇要在研究區(qū)內(nèi)均勻覆蓋。為了使樣本更有代表性,選擇樣本時應考慮產(chǎn)生差異的不同原因,包括作物不同長勢的地塊,以及地塊邊緣混合像元光譜特征,保持樣本多樣性和全面性,提高訓練數(shù)據(jù)集的質(zhì)量和學習結果的準確性。
1.3.3 精度驗證 主要基于地面調(diào)查樣方和地面驗證點數(shù)據(jù),對不同紅邊條件下的研究結果,采用混淆矩陣、Kappa系數(shù)、總體分類精度、制圖精度和用戶精度5種方式進行分類精度評價,相關定義及詳細表述參照文獻[28-30]。
1.3.4 類別間光譜可分性測度 以主要作物的所有地面調(diào)查數(shù)據(jù)為基礎,利用特征優(yōu)化空間算法進行光譜特征優(yōu)選分析。通過計算不同特征空間組合中各類樣本間的最小J-M距離來確定最佳特征值,J-M距離越大說明分離度越大,最大分離度對應的即為最佳特征空間組合。J-M距離是基于條件概率理論的光譜可分性指標,用來度量類別間光譜的可分性,其波段指數(shù)是研究不同波段組合對不同地物特征識別提取能力的重要參數(shù)[5,31],公式如下:
(2)
對4種不同波段組合方案(表2),利用相同訓練樣本和隨機森林方法實現(xiàn)作物分類,結果如圖2所示,圖2a為表2中方案4監(jiān)督分類結果,圖2b從上至下依次為方案1—4局部結果,其中白色區(qū)域為7種分類系統(tǒng)中其余地物類型,方案1—4作物分類總面積(冬小麥、大蒜和其他作物)分別為89 978.29、90 823.32、89 370.62、89 979.44 hm2。隨機森林方法的決策樹數(shù)量設定為100,節(jié)點分裂時輸入的特征變量數(shù)設置為所有特征數(shù)量的平方根。
表2 不同紅邊波段參與條件下分類方案Tab.2 Classification schemes with different red-edge waveband conditions
利用研究區(qū)地面樣方和地面驗證點數(shù)據(jù)進行分類精度評價,方案1—4的分類精度分別如表3所示。從表3可以看出,單時相遙感影像引入全部紅邊波段后,作物分類的總體精度由81.56%提高到86.19%,提高了4.63個百分點,Kappa系數(shù)由0.72提高到0.79,冬小麥的分類面積比例從51.70%提高到57.00%,而大蒜分類面積比例則從48.25%降低至42.98%;而單一紅邊波段下,B6紅邊波段2較B5紅邊波段1的總體分類精度也提高了1.98個百分點。
a.方案4分類結果;b.方案1—4局部分類結果 a.Classification result of scheme 4;b.Local classification results of different schemes圖2 不同方案分類結果Fig.2 Classification results of different schemes
表3 不同方案下作物面積比例和分類精度Tab.3 Major crops area ratio and classification accuracy with different schemes
注:面積比例為各作物分類面積占作物分類總面積的百分比。
Note:Area proportion is the percentage of each crop classification area to the total crop classification area.
研究區(qū)大蒜種植面積主要集中在中部和東北部,而冬小麥主要在南部集中種植,作物種植面積分類結果與收獲期外業(yè)調(diào)查及當?shù)剞r(nóng)業(yè)部門提供的情況較為符合,這表明紅邊波段的信息確實提高了不同作物類型的總體識別精度。將不同波段組合方案分類精度與分類結果相結合,具體分析紅邊波段對不同作物分類結果的影響,從圖2不同方案局部結果可發(fā)現(xiàn),引入紅邊波段后,作物分類結果較方案1的誤判面積和漏分面積顯著降低,對冬小麥-大蒜的識別能力較強,分類結果圖斑具有更好的完整性,圖斑邊界連續(xù)性和平滑性效果較好,同時也有效降低了分類結果中的“椒鹽現(xiàn)象”。將方案2和方案3中引入不同單一紅邊波段分類結果相比,方案3不僅有更高的分類精度,同時冬小麥、大蒜的誤判面積更低,具有更好的分類效果,因此,B6紅邊波段2在作物識別中的重要性要高于B5紅邊波段1;方案3與方案4中大蒜用戶精度較為接近,但較方案2大蒜的用戶精度和制圖精度均有明顯提高,表明B6紅邊波段2對大蒜的識別能力較強,但對其他作物的分類能力和分類精度提升不大,可能的原因是由于其他作物種植分散且種植面積較小,加之遙感影像分辨率較低,最終導致分類精度的降低。
為了定量化分析有無紅邊等不同方案對3種作物可分性的影響,利用J-M距離算法計算3種作物的可分性,方案1—4可分性測度如表4所示。可以看出,與無紅邊波段方案相比,全部紅邊波段參與時,冬小麥-大蒜、冬小麥-其他作物、大蒜-其他作物的可分性都明顯增大,分別從1.893 0增加到1.978 6,1.912 5增加到1.988 6,1.928 2增加到1.953 3,分別增加0.085 6、0.076 1和0.025 1,表明紅邊波段信息可以使影像更精準地區(qū)分冬小麥、大蒜和其他作物;方案3和方案2引入不同紅邊波段相比,冬小麥-其他作物的可分性有較大提高,從1.936 8增加到1.980 9,表明B6紅邊波段2對于冬小麥-其他作物的分類貢獻較大,但大蒜-冬小麥的可分性則略有降低,結合作物分類精度結果,B6中紅邊波段2在作物分類結果中的重要性要大于B5中紅邊波段1;方案4引入全部紅邊波段和方案3引入B6紅邊波段2相比,3種作物間可分性雖有所提高,但提高幅度不大,因此也無法顯著提高作物間的分類精度。因此,3種作物間的可分性測度變化指標與表3中作物總體分類精度變化評價結果較為一致。
表4 不同方案下3種作物可分性測度結果Tab.4 The degrees of separation among three crops under different schemes
根據(jù)地面調(diào)查數(shù)據(jù)、地面樣方和地面驗證數(shù)據(jù),分別統(tǒng)計不同作物在影像8個波段的反射率平均值,繪制折線圖,如圖3所示。
圖3 不同作物在GF6 WFV影像各波段反射率均值變化Fig.3 GF6 WFV image mean reflectance curve of different crops
從圖3可以看出,在第1、2、3、5、7波段(分別對應藍、綠、紅、紅邊1和紫波段)3種作物的反射率都十分接近,而在第4、6波段則存在一定差異,B6紅邊波段2的光譜反射率差異要優(yōu)于B5紅邊波段1,這也與本研究分類精度統(tǒng)計中方案3高于方案2的結果相吻合。因此,結合已有地面調(diào)查數(shù)據(jù)在遙感影像不同波段的反射率均值可以得出,B6紅邊波段2在春季主要作物分類過程中的貢獻率要高于B5紅邊波段1。
通過對GF6 WFV影像在春季作物分類中的應用研究可以發(fā)現(xiàn),在衛(wèi)星傳感器中增加紅邊波段將有利于提高作物面積識別精度,在分析不同紅邊波段參與條件下作物分類精度、樣本可分性測度和地物光譜反射率均值后,得出以下結論。
GF6 WFV影像新增紅邊波段都能不同程度地提高作物識別能力。在僅利用影像光譜特征的基礎上,單一紅邊波段進行作物面積識別時,較無紅邊波段參與時作物總體分類精度分別提高1.74個百分點和3.72個百分點;而2種單一紅邊波段參與分類時總體分類精度也有較大差距,B6紅邊波段2較B5紅邊波段1的總體分類精度提高了1.98個百分點,因此,在作物分類時其特征重要性要優(yōu)于B5紅邊波段1;全部引入紅邊波段較無紅邊波段參與時作物總體分類精度由81.56%提高到86.19%,提高了4.63個百分點,Kappa系數(shù)由0.72提高到0.79。紅邊波段參與能有效提高不同作物間的可分性測度。全部紅邊波段參與和無紅邊波段參與相比,J-M距離下冬小麥-大蒜、冬小麥-其他作物、大蒜-其他作物的可分性測度分別增加0.085 6、0.076 1和0.025 1,且單一紅邊波段下,三者之間的可分性測度較無紅邊參與時也有明顯提高,這都表明紅邊波段使這3種作物間的區(qū)分能力增強,不同程度提高了作物的識別精度。同時,結合分類結果研究發(fā)現(xiàn),紅邊波段的引入不僅能有效降低作物誤分、漏分的情況,也在一定程度上降低了分類結果中的“椒鹽現(xiàn)象”,能得到更加科學合理的作物分布及面積提取結果。
本研究過程中也發(fā)現(xiàn)一些問題尚待解決。①本研究難以獲取研究區(qū)作物關鍵生育時期時序遙感影像數(shù)據(jù),由于研究區(qū)內(nèi)冬小麥和大蒜交叉種植地塊較多,且部分種植地塊面積較小,受遙感影像分辨率較低的影響,作物總體分類精度較低,下一步應將時序遙感影像和高分辨率遙感影像相結合進行作物種植面積分類提取,以提高作物識別精度;②本研究利用隨機森林算法實現(xiàn)了不同紅邊波段參與條件下的作物種植面積分類,但并未與其他監(jiān)督分類方法進行精度對比和分析,也未與空間分辨率相近的(如Landsat空間分辨率15 m)影像進行分類結果和分類精度對比,這將在下一步的研究中進行分析;③本研究利用遙感影像光譜特征和已有軟件中隨機森林分類方法進行冬小麥分類提取,在下一步研究中,需同時利用影像紋理特征和植被指數(shù)特征多特征參與分類,在進行波段重要性分析時,需進一步研究基于隨機森林不純度降低(基于隨機森林的重要性評價)和F檢驗(基于統(tǒng)計方法的單變量重要性評價)等方法的多特征重要性評價和分類提取。GF6 WFV衛(wèi)星具有覆蓋廣、波段多的優(yōu)勢,紅邊波段也與作物長勢等植被特征有一定關系,將有助于推廣國產(chǎn)衛(wèi)星影像在復雜作物種植結構提取、長勢監(jiān)測和病蟲害監(jiān)測等方面的應用研究。