東朝霞,王 迪※,周清波,陳仲新,劉 佳
(1.中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)資源與農(nóng)業(yè)區(qū)劃研究所,北京 100081; 2.農(nóng)業(yè)部農(nóng)業(yè)信息技術(shù)重點實驗室,北京 100081)
?
·技術(shù)方法·
基于SAR遙感的北方旱地秋收作物識別研究*
東朝霞1, 2,王迪1, 2※,周清波1, 2,陳仲新1, 2,劉佳1, 2
(1.中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)資源與農(nóng)業(yè)區(qū)劃研究所,北京100081; 2.農(nóng)業(yè)部農(nóng)業(yè)信息技術(shù)重點實驗室,北京100081)
在我國北方旱地秋收作物生長關(guān)鍵期,云雨天氣影響較大,無法及時、有效地獲取光學(xué)遙感數(shù)據(jù),因此利用雷達遙感進行旱地作物識別研究非常必要。文章以河北省衡水市為研究區(qū),選擇6期RADARAST-2全極化影像作為數(shù)據(jù)源,分類方法為隨機森林法。首先通過對比不同時相間的組合結(jié)果,優(yōu)選出了研究區(qū)典型秋收作物(玉米、棉花)的最佳識別時相及組合方式。其次,提取最優(yōu)識別時相的后向散射信息、紋理信息、極化分解等3部分信息,依據(jù)信息間相互組合的結(jié)果及隨機森林算法對變量的重要性評價,文中對上述3部分信息進行了重要性評估。結(jié)果表明:利用SAR識別旱地秋收作物時應(yīng)著重關(guān)注作物生長前期的時相,其中玉米在6月27日單一時相下就可獲得90%以上的高精度; 棉花面積小、地塊破碎,但通過6月3日與6月27日兩個時相的結(jié)合也得到了70%以上的精度。在玉米識別中極化信息具有較大的貢獻,極化變量的加入主要增加了玉米和建筑用地的可分離性,與單純利用后向散射信息分類相比精度提高了近7%; 同樣,紋理信息和極化分解信息的加入也使棉花的精度提高了3%。最后,利用隨機森林算法對變量的重要性評價機制,優(yōu)選出對玉米識別最為重要的5個變量,依次為:VH、Alpha、Yamaguchi4-Odd、Freeman-Vol和Mean(HV)。該研究利用雷達數(shù)據(jù)進行旱地作物識別,驗證了雷達影像對旱地秋收作物的識別能力,不僅保證了數(shù)據(jù)獲取與天氣狀況的獨立性,還憑借SAR獨有的數(shù)據(jù)獲取方式,為光學(xué)數(shù)據(jù)提供了補充。
合成孔徑雷達(SAR)旱地農(nóng)作物分類隨機森林變量優(yōu)選
農(nóng)作物識別是農(nóng)作物農(nóng)情監(jiān)測的初始階段和關(guān)鍵步驟,及時準(zhǔn)確的監(jiān)測農(nóng)作物種類的空間分布是農(nóng)情信息監(jiān)測的基礎(chǔ)。隨著遙感技術(shù)的發(fā)展和遙感數(shù)據(jù)的普及,衛(wèi)星遙感技術(shù)以其宏觀、動態(tài)、及時、準(zhǔn)確等優(yōu)點成為許多農(nóng)作物監(jiān)測的重要手段[1-3],尤其是應(yīng)用光學(xué)遙感數(shù)據(jù)進行作物識別已經(jīng)形成了一套成熟的技術(shù)方法,其作物識別精度已達到較高水平,理論和技術(shù)也已經(jīng)非常成熟,然而在實際應(yīng)用中發(fā)現(xiàn),在我國北方地區(qū),多云雨的氣候條件限制了光學(xué)遙感對作物的監(jiān)測,很難在作物生長期內(nèi)獲得完整、連續(xù)的觀測數(shù)據(jù),致使不能滿足農(nóng)作物類型、面積及其空間分布等監(jiān)測業(yè)務(wù)的需求。合成孔徑雷達(synthetic aperture radar,SAR)的出現(xiàn),使農(nóng)作物監(jiān)測不受云、霧、雨的影響,保證了數(shù)據(jù)獲取與當(dāng)?shù)靥鞖獾莫毩⑿?,并且微波遙感探測植被信息時,可獲得與光學(xué)傳感器完全不同的信息,鑒于以上優(yōu)點,SAR被廣泛地應(yīng)用于作物監(jiān)測與估產(chǎn)[4~9]。其中利用SAR監(jiān)測南方水稻的研究最多[10-13],原因是水稻生長的季節(jié)往往為多云雨天氣,很難獲得光學(xué)遙感數(shù)據(jù),并且由于水稻的介電常數(shù)較高,相對于其他共生植物,易將水稻和其他地物進行區(qū)分。當(dāng)前國內(nèi)外的相關(guān)研究主要集中在水稻長勢監(jiān)測和水稻制圖的研究[14~16],監(jiān)測的農(nóng)作物類型過于單一,對旱地作物(小麥、玉米、棉花等)的識別與面積監(jiān)測研究相對較少[17]。McNarin[18]使用機載C波段極化數(shù)據(jù)對苜蓿、玉米、大豆和小顆粒谷物(如小麥等)進行了識別研究。Hong Gang等[19]通過融合MODIS和RADARSAT-2遙感影像對草地和苜蓿進行區(qū)分,結(jié)果表明光學(xué)遙感影像和雷達遙感影像的聯(lián)合應(yīng)用可有效地提高作物識別精度。華國強等[20]利用Radarsat-2全極化影像數(shù)據(jù),著重分析了玉米后向散射特征,并利用不同地物后向散射特征的差異提取玉米種植分布情況,精度達到84%。Jia Kun等[21]利用ENVISAT-ASAR和Terra-SAR數(shù)據(jù),對我國北方旱地作物冬小麥和棉花進行識別和分類,結(jié)果表明雷達數(shù)據(jù)可作為旱地作物識別的有效遙感數(shù)據(jù)源。這些研究都表明了雷達遙感數(shù)據(jù)在旱地作物識別方面的可行性和潛力,然而旱地作物在其全生長期內(nèi)沒有水層覆蓋,其介電常數(shù)與周圍共生植被差異不明顯,再加上復(fù)雜的種植結(jié)構(gòu),雷達遙感在旱地作物識別中具有一定的挑戰(zhàn)性。旱地作物在我國分布極廣,及時準(zhǔn)確地掌握旱地作物的長勢狀況和種植面積信息是保障國家糧食安全的基礎(chǔ)。文章通過系統(tǒng)的分析雷達對旱地秋收作物(玉米、棉花)的識別能力,掌握了玉米和棉花的最優(yōu)識別時相及特征變量組合,為數(shù)據(jù)的獲取和信息的利用情況給予了參考,為光學(xué)數(shù)據(jù)提供了補充。
針對我國北方旱地作物在關(guān)鍵生長期內(nèi)受云雨天氣影響,進而無法及時、有效獲取光學(xué)數(shù)據(jù)的現(xiàn)狀,該文使用覆蓋作物全生育期的6期Radarsat-2全極化數(shù)據(jù)探究雷達數(shù)據(jù)在北方旱地秋收作物(玉米和棉花)識別中的適用性。該文主要包括3部分:(1)通過對研究區(qū)內(nèi)5類典型地物后向散射系數(shù)進行統(tǒng)計,分析玉米、棉花與其他地類間的混淆程度; (2)通過對單極化、單時相及時相間的不同組合進行分析,探究玉米、棉花的最佳識別時相及組合方式; (3)對比分析后向散射信息、紋理信息和極化分解信息,探究不同信息組合對結(jié)果的貢獻,并通過變量的優(yōu)選改善了分類效率。
1.1研究區(qū)概況
研究區(qū)位于河北省衡水市(圖1),地處河北平原中部,介于東經(jīng)115°21′~115°50′,北緯37°42′~38°11′之間,是中國北方典型的旱地作物種植區(qū)。地屬北溫帶季風(fēng)氣候,全年大于或等于0 ℃的積溫為4863 ℃,無霜期200 d左右,日照時數(shù)2563 h,年平均氣溫12.8 ℃,年降水量在500 mm左右,降雨主要集中在6~8月份。研究區(qū)面積為25 km×25 km,主要土地利用類型為農(nóng)業(yè)用地,作物熟制為一年一熟或一年兩熟制,秋收作物主要是玉米和棉花。玉米于6月初種植, 10月初收獲,棉花為4月份種植, 10月下旬收獲,玉米占絕大部分,棉花的比例較少。研究區(qū)主要覆蓋地物類型共5類,分別是玉米、棉花、樹林、水體和建筑用地。
1.2數(shù)據(jù)準(zhǔn)備
結(jié)合玉米和棉花的物候特征,選取了2014年6月3日至2014年10月1日共6期精細(xì)全極化(Fine-Quad polarization,F(xiàn)Q)模式Radarsat-2數(shù)據(jù),覆蓋了研究區(qū)內(nèi)玉米和棉花的整個生育期。該模式數(shù)據(jù)標(biāo)稱幅寬為25 km,重訪周期24 d,分辨率為5.2 m×7.6 m(距離向×方位向),入射角約為18°~49°, 4種極化方式即HH、HV、VH和VV。表1為雷達數(shù)據(jù)的具體參數(shù)。為全面分析玉米、棉花與研究區(qū)其它地類的關(guān)系,將研究區(qū)的土地覆蓋類型歸結(jié)為5類:玉米、棉花、建筑用地、樹林和水體,并于2014年6月利用差分GPS實地采集了玉米、棉花、水體的樣方邊界和地理位置坐標(biāo)數(shù)據(jù)并詳細(xì)記錄了其覆蓋類型。與此同時,記錄了30個地面控制點,用于影像精矯正,其均勻分布在研究區(qū)內(nèi)。為減少工作量且考慮到建筑物和樹林隨時間變動較小,研究獲取了2013年5月份的GF-1號光學(xué)數(shù)據(jù),通過多光譜和全色圖像的融合得到了2 m分辨率的影像,建筑用地和樹林樣方的選取利用GF-1號光學(xué)數(shù)據(jù)作為輔助。研究共選擇了225個典型地物樣本,其中164個為訓(xùn)練樣本, 61個為驗證樣本。
1.3數(shù)據(jù)處理
1.3.1數(shù)據(jù)預(yù)處理
GF-1號光學(xué)數(shù)據(jù)的處理過程包括圖像拼接、感興趣裁剪、投影轉(zhuǎn)換和幾何精矯正等。其中幾何精矯正利用地面實測的30個控制點進行,保證誤差控制在一個像元之內(nèi),滿足后續(xù)研究的需要。
表1 研究區(qū)雷達遙感數(shù)據(jù)主要參數(shù)
獲取時間入射角(°)極化分辨率(m)產(chǎn)品級別玉米生育期棉花生育期標(biāo)注時間2014-06-0338.51全極化5.2×7.6SLC—苗期6/032014-06-2738.51全極化5.2×7.6SLC拔節(jié)前期蕾期前期6/272014-07-2138.51全極化5.2×7.6SLC抽穗前期蕾期后期7/212014-08-1438.51全極化5.2×7.6SLC抽穗后期花鈴前期8/142014-09-0738.51全極化5.2×7.6SLC乳熟期花鈴后期9/072014-10-0138.51全極化5.2×7.6SLC成熟期吐絮期10/01
圖1 研究區(qū)位置
圖2 3種極化分解
SAR數(shù)據(jù)預(yù)處理過程包括輻射定標(biāo)、幾何校正、影像配準(zhǔn)、噪聲濾波(LEE自適應(yīng)濾波算法,窗口大小為5×5)等,雷達數(shù)據(jù)的預(yù)處理過程主要在NEST中進行。影像間相互配準(zhǔn)是多時相SAR圖像應(yīng)用中必不可少的處理步驟之一,該研究中影像配準(zhǔn)以GF-1光學(xué)數(shù)據(jù)作為基準(zhǔn)影像,將SAR數(shù)據(jù)匹配到光學(xué)數(shù)據(jù)中,因光學(xué)影像參與了房屋和樹林地面樣方數(shù)據(jù)的選取,所以需要將其與雷達數(shù)據(jù)進行配準(zhǔn)和坐標(biāo)系的統(tǒng)一。雷達數(shù)據(jù)經(jīng)處理后,空間分辨率為8m。
1.3.2紋理信息
紋理是遙感圖像上的重要信息和基本特征,是進行圖像分析和圖像理解的重要信息源[22]。分類過程中紋理信息的加入已經(jīng)成為一種重要的提高遙感影像分類精度的手段,因為紋理信息可以幫助抑制異物同譜和同物異譜現(xiàn)象的發(fā)生。許多研究也表明了紋理信息可以提高圖像識別的精確性[23-24]。文中紋理信息的提取利用了Haralick提出的灰度共生矩陣(GLCM),它是一種最常見和廣泛應(yīng)用的紋理統(tǒng)計分析方法[25]。紋理提取過程中窗口大小設(shè)置為3×3,灰度量化級別為64,共有8個基于二階矩陣的紋理濾波,這些濾波包括:均值(Mean)、方差(Variance)、協(xié)同性(Homogeneity)、對比度(Contrast)、相異性(Dissimilarity)、信息熵(Entropy)、二階矩(Second Moment)和相關(guān)性(Correlation)。
1.3.3極化信息
全極化合成孔徑雷達可測量觀測目標(biāo)的全散射矩陣,全散射矩陣包含著所觀測目標(biāo)的重要信息。利用目標(biāo)分解理論對全極化數(shù)據(jù)進行目標(biāo)散射機制的解譯,可進一步分析物體的物理和幾何特征[26-28]。首先將地物回波的復(fù)雜散射過程分解為幾種互不相關(guān)的單一的散射分量,由于這些單一的散射分量都對應(yīng)于具有不同物理和幾何特征以及分布特征的地物,從而提供了更加豐富的地表覆蓋信息,這樣就很大程度地改善了地物信息的分類精度[29]。
將散射矢量矩陣k與其共軛轉(zhuǎn)置矢量矩陣k*求外積,可得到三維極化相干矩陣T3,如式(1)所示:
(1)
式中,SX=SHV=SHV;SHH、SVV為同極化分量;SHV、SVH為交叉極化分量。
在PolSARPro-v4.2.0軟件中利用T3矩陣進行分解,分解方法選擇了Cloude-Pottier分解[30],F(xiàn)reeman分解(FM)[31]以及Yamaguchi分解(YG)[32]。圖2給出了不同分解方式下的圖像表達。
1.3.4分類方法
隨機森林法(RandomForest,RF)是由美國科學(xué)家LeoBreimanHo[33]于2001年聯(lián)合發(fā)表的一種新的機器學(xué)習(xí)算法。該算法以K個決策樹為基本分類器,隨機森林輸出的分類結(jié)果由每個決策樹的分類結(jié)果簡單投票決定[34]。其已被成功的應(yīng)用到土地覆蓋制圖中[35]。隨機森林算法有很多優(yōu)點: 1)對于很多種資料,它是可以產(chǎn)生高準(zhǔn)確度的分類器; 2)它可以處理大量的輸入變量; 3)它可以在決定類別時,評估變量的重要性; 4)在大的、高維數(shù)據(jù)訓(xùn)練時,不容易出現(xiàn)過擬合而且速度較快。RF分類過程在EnMAPBox軟件[36]中實現(xiàn),該軟件包含多個內(nèi)置分類算法,其中就包括隨機森林算法。
圖3 研究區(qū)典型地物不同極化雷達后向散射特征(a:HH b:HV c:VH d:VV)
J-M距離6/277/218/149/0710/01玉米玉米玉米玉米玉米棉花1.440.851.191.041.30樹林1.840.600.520.500.85建筑物1.590.530.510.530.79水體1.921.821.881.801.81制圖精度(%)87.1146.2645.8450.0163.39用戶精度(%)95.6451.9948.4447.7258.48
表3單時相條件下棉花的識別結(jié)果
J-M距離6/36/277/218/149/0710/01棉花棉花棉花棉花棉花棉花玉米0.991.440.851.191.051.30樹林1.660.510.370.410.260.21房屋1.170.790.961.050.830.87水體1.992.01.991.961.921.95制圖精度(%)35.1416.899.4622.6410.143.72用戶精度(%)45.0216.8911.4315.999.975.26
2.1玉米、棉花與其他典型地物間的混淆性分析
圖4 單極化對玉米識別精度的影響
利用獲取的訓(xùn)練樣方數(shù)據(jù),從多時相全極化SAR數(shù)據(jù)中提取了玉米、棉花、水體、建筑用地和樹林的后向散射系數(shù),如圖3所示。6月3日至10月1日分別對應(yīng)棉花的苗期至吐絮期,棉花的后向散射系數(shù)先后經(jīng)歷了先上升后穩(wěn)定的過程, 6月3日棉花處于出苗期,被地膜覆蓋,裸露地表所占比重較大,表面散射強,此時其后向散射強度最小,與其他地物差異最大,隨著棉花進入生長盛期,冠層體散射占據(jù)主要的后向散射部分,導(dǎo)致后向散射系數(shù)增加。玉米在6月27日交叉極化方式下與其他地物的差異最明顯,除水體外,玉米與其他地物的差異達到5.7dB,易與其它地物進行區(qū)分,經(jīng)過拔節(jié)期莖葉的迅速生長, 7月21日玉米的后向散射強度基本達到最大。從圖4可以看出,玉米和棉花的后向散射系數(shù)均在7月21日左右達到最大,其后,除水體外的四類地物后向散射系數(shù)集中在3.4dB范圍之內(nèi),互相混淆。研究區(qū)的城區(qū)高大建筑物因其獨特的建筑結(jié)構(gòu)和堅硬的水泥表面會形成二面角反射形成高亮區(qū)域,易與作物區(qū)分,但在農(nóng)村地區(qū)情況卻不同,部分村莊建筑物分布稀疏且較多為磚土結(jié)構(gòu)的房屋,二面角反射不明顯,加上周圍常會有蔬菜或樹林的影響,降低了整體建筑物后向散射系數(shù)的均值,對玉米的識別形成阻礙。樹林的組成包括樹苗、果樹和樹林,成分復(fù)雜,其與棉花的后向散射系數(shù)接近,在棉花的識別中會產(chǎn)生影響。
2.2玉米、棉花最佳識別時相的優(yōu)選
首先利用單一時相進行玉米和棉花的識別,目的是探究單時相雷達數(shù)據(jù)對旱地秋收作物的識別能力及對特定地物的識別時相進行優(yōu)劣排序。統(tǒng)計了玉米、棉花與研究區(qū)典型地物間的J-M距離,Jeffries-Matusita距離[37](J-M)用于確定2個類別間的差異性程度,這是一種定量的方式來衡量訓(xùn)練樣本(ROI)的可分離性,它不需要假定地物的正態(tài)分布,具有較好的通用性[38]。這個參數(shù)的值在0~2.0之間,越接近1.8說明樣本之間可分離性越好。結(jié)果見表2和表3。如表2所示,在玉米的整個生育期中6月27日獲取了最高的識別精度,并且在該時相條件下玉米與其它四類地物的J-M距離均為最大,說明在玉米的整個生長期中6月27日即玉米的拔節(jié)前期為識別的最優(yōu)時相。原因是在該時期玉米處于苗期和拔節(jié)期之間,植株普遍偏小,且玉米播種時行距與株距本身就較大,土壤裸露比例高,地表結(jié)構(gòu)簡單,在這種情況下,造成交叉極化方式表現(xiàn)出明顯異于其它地物的特性,從圖3可以明顯地發(fā)現(xiàn),在6月27日交叉極化條件下,除水體外,玉米與其它地物的差異達到了5.7dB。7月21日后玉米識別精度大幅降低,原因是樹林、建筑物對玉米的影響增大,其J-M距離在0.5左右,其中8月14日玉米識別效果最差,該時期玉米與樹林、建筑物的可分離度降到最低。因此,以制圖精度作為標(biāo)準(zhǔn),識別玉米的優(yōu)勢時相依次為: 6月27日、10月1日、9月7日、7月21日、8月14日。從表3可以看出,在覆蓋棉花全生育期的6個時相中, 6月3日即棉花的苗期取得了最高的識別精度,該時期玉米尚未播種,取代玉米的為處于收獲期的小麥,此時棉花植株小、覆蓋率低,大部分土壤被地膜覆蓋,由統(tǒng)計的J-M距離可以看出,該時期棉花與其它地物的差異性基本達到最大,說明棉花的苗期為識別的最佳時相。以分類后的制圖精度作為標(biāo)準(zhǔn),識別棉花的優(yōu)勢時相依次為: 6月3日、8月14日、6月27日、9月7日、7月21日、10月1日。通過表2、表3的對比可以發(fā)現(xiàn),利用單時相進行玉米和棉花識別時,玉米的精度要優(yōu)于棉花,原因可能是由于玉米為研究區(qū)的主要作物類型,棉花所占的比例很小,給識別帶來了困難。
表4 時相組合對玉米識別的影響
J-M距離6/276/27+10/016/27+9/0710/01+9/076/27+10/01+9/07玉米玉米玉米玉米玉米棉花1.441.761.671.551.84樹林1.841.891.861.051.90房屋1.591.771.750.971.83水體1.921.971.971.881.98制圖精度(%)87.1189.8788.8267.3889.46用戶精度(%)95.6495.7195.9762.3396.09
表5 時相組合對棉花識別的影響
J-M距離6/036/03+8/146/03+6/278/14+6/276/03+8/14+6/27棉花棉花棉花棉花棉花玉米0.991.521.731.721.85樹林1.661.771.740.861.82房屋1.171.771.601.381.845水體1.192.02.02.02.0制圖精度(%)35.1447.9768.9227.0363.85用戶精度(%)45.0245.0864.7627.4977.78
接著,選取玉米識別的前3個優(yōu)勢時相,即6月27日、10月1日和9月7日; 棉花識別的前3個優(yōu)勢時相,即6月3日、8月14日和6月27日。將時相間進行組合,以優(yōu)選出合適的時相組合。結(jié)果見表4、表5。表4為針對玉米識別進行的組合分析,從表中可以看出6月27日單一時相條件下玉米的識別精度達到了87.11%,識別精度最好的為6月27日與10月1日兩個時相的結(jié)合,識別精度提高了約2.7%,發(fā)現(xiàn)通過6月27日與其他時相的結(jié)合精度并沒有太大的提升,考慮到該識別精度只利用了后向散射信息,還未充分的利用極化信息和紋理信息,因此后期只選擇了6月27日單一時相進行玉米的識別。從表5可以看出, 6月3日與6月27日兩個時相的組合使棉花獲取了最優(yōu)的識別精度,與最優(yōu)時相6月3日的分類結(jié)果相比精度提高了近34%,在該條件下棉花與其他地物的J-M距離均在1.6以上,說明6月3日與6月27日為棉花識別的最優(yōu)組合方式。
最后,為比較極化貢獻的差異性,對所有時相的單極化進行了分類,由于研究區(qū)棉花面積小,地塊破碎,對結(jié)果的影響因素多,該過程只對玉米進行。結(jié)果見圖4。從圖中可以看出在玉米整個生育期中,交叉極化對精度的貢獻浮動最大,同極化變化平穩(wěn)。在玉米播種前期交叉極化對精度的貢獻要遠優(yōu)于同極化,隨著生育期的推進,交叉極化的優(yōu)勢迅速減小, 7月21日后同極化略高于交叉極化。同極化間進行比較發(fā)現(xiàn),HH極化優(yōu)于VV極化,且在生育期的初始期和結(jié)束期優(yōu)勢明顯。
表6 不同信息組合對玉米、棉花識別精度的影響
玉米不同組合(6/27)棉花不同組合(6/03+6/27)12341234后向散射系數(shù)****后向散射系數(shù)****紋理信息**紋理信息**極化信息**極化信息**制圖精度(%)87.1189.1893.9893.68制圖精度(%)68.9269.9367.2371.96用戶精度(%)95.6498.2999.0699.19用戶精度(%)64.7684.8482.2385.89
圖5 玉米變量重要性評價 圖6 棉花變量 重要性評價(0603為6月3日;0627為6月27日)
建筑物棉花樹林水體玉米建筑物713120014671592棉花8456100042樹林983323805水體00091023玉米19271074829玉米制圖精度87.11% 用戶精度95.64%
表8組合3(玉米)精度
建筑物棉花樹林水體玉米建筑物7302738850213棉花691371340116樹林948079300水體0009187玉米406305155玉米制圖精度93.98% 用戶精度99.19%
2.3紋理和極化信息的重要性分析
根據(jù)上述分析,選擇6月27日單一時相進行玉米的識別,棉花的識別時相確定為6月3日與6月27日2個時相的結(jié)合。以上分類過程只利用了后向散射信息,下面將在后向散射信息的基礎(chǔ)上添加紋理和極化信息,探究二者的加入對分類精度的影響,結(jié)果見表6。從表6可以看出,紋理信息與極化信息的加入使玉米的識別精度有了較明顯的提升,其中紋理信息的加入使精度由原來的87.11%增加到89.18%,增幅為2.07%,極化信息的加入使精度由87.11%增加到93.98%,增幅達6.87%,說明紋理信息和極化信息都在一定程度上提高了玉米的識別精度,相比之下,在玉米識別過程中極化信息的重要性要優(yōu)于紋理信息。表7、表8分別為組合1和組合3的具體精度,通過二者的比較發(fā)現(xiàn),在玉米識別過程中建筑用地對其影響最大,而極化信息的加入主要減少了玉米和建筑用地的混淆,進而提升了玉米的識別精度。組合4將后向散射系數(shù)、紋理信息和極化信息進行結(jié)合后分類,其分類效果與組合3類似,表明在玉米識別過程中后向散射信息與極化信息結(jié)合就能獲得理想的結(jié)果。對于棉花,從表中可以看出紋理信息和極化信息的加入均起到了積極的作用,制圖精度沒有明顯改善,用戶精度提高了近20%。通過組合2和組合3的比較可知在棉花的識別過程中紋理信息的作用略優(yōu)于極化信息,組合2相較于組合3而言制圖精度和用戶精度均有2.6%以上的提升,組合4為3部分?jǐn)?shù)據(jù)的結(jié)合,其獲取了最高了識別精度,說明在棉花的識別中,紋理信息和極化信息對于精度的提升都起到了積極的促進作用。圖5、圖6分別為對玉米、棉花識別過程中所有變量的重要性評價結(jié)果,二者趨勢一致,從圖中可以看出,后向散射信息和極化信息的重要性都要遠優(yōu)于紋理信息,除均值信息外所有的紋理信息對結(jié)果的貢獻均較小,在玉米識別過程中貢獻度最大的3個變量依次為α、FM-Vol、HV-Mean; 棉花識別過程中最優(yōu)的3個變量依次為0627-HV、0603-FM-Vol、0627-HV-Mean。將玉米識別的組合3與棉花識別的組合4相互結(jié)合,得到最終分類結(jié)果,見圖7。
圖7 研究區(qū)玉米、棉花分布
圖8 玉米變量優(yōu)選
玉米的識別利用了6月27日單一時相,加上紋理信息和極化信息,特征數(shù)為38個(圖5是對不同變量重要性的評價結(jié)果); 棉花的識別利用了兩個時相的結(jié)合,其特征數(shù)共76個。理想情況下,每個變量都可提供額外的信息以提高分類精度,然而在機器學(xué)習(xí)的實際應(yīng)用中,特征數(shù)量往往較多,其中可能存在不相關(guān)的特征,特征之間也可能存在相互依賴,特征個數(shù)的增加,會導(dǎo)致分析特征、訓(xùn)練模型所需的時間長,且容易引起“維度災(zāi)難”; 除此之外,多源數(shù)據(jù)的加入必然會引起因配準(zhǔn)誤差而產(chǎn)生的噪聲。因此,該文將探究在玉米識別的多特征基礎(chǔ)上,通過特征選擇剔除不相關(guān)和冗余信息,以提高計算效率。由于研究區(qū)棉花面積小,地塊破碎,受配準(zhǔn)誤差的影響要遠大于玉米,特征的優(yōu)選只針對玉米進行。為進行變量的優(yōu)選,研究主要利用隨機森林算法對變量的重要性評價機制,通過迭代依次除去重要性最小的變量,再對剩余的變量進行分類并進行精度評價,以此類推。結(jié)果見圖8。在移除33個變量之前,玉米的識別精度浮動微小,剩余5個變量時精度迅速降低,這5個變量分別為:VH、Alpha、Yamaguchi4-Odd、Freeman-Vol、Mean(HV)。
該文以河北省衡水市為研究區(qū),獲取了覆蓋旱地秋收作物(玉米和棉花)全生育期的6期影像,系統(tǒng)分析了玉米、棉花在各個生長時期的后向散射系數(shù),并結(jié)合隨機森林算法對玉米和棉花進行了識別,驗證了雷達數(shù)據(jù)在旱地作物識別中的可行性,并為光學(xué)數(shù)據(jù)的獲取提供了補充。結(jié)論如下:
(1)研究利用全生育期的單極化數(shù)據(jù)對玉米進行識別,結(jié)果發(fā)現(xiàn)在不同生育期4種極化方式對結(jié)果的影響存在差異。拔節(jié)期之前,交叉極化方式在玉米的識別中貢獻最為突出; 全生育期內(nèi)HH極化優(yōu)于VV極化,且在生育期的初始和結(jié)束期優(yōu)勢明顯。
(2)研究利用單一時相及時相間的組合對玉米和棉花進行了識別,結(jié)果表明6月27日即玉米的拔節(jié)前期為玉米識別的最優(yōu)時相, 6月3日與6月27日為棉花識別的最優(yōu)時相組合。由于作物本身物候期的差異,導(dǎo)致在作物耕作的交替期往往會表現(xiàn)出極大的差異性,因此利用雷達數(shù)據(jù)識別旱地秋收作物時應(yīng)著重關(guān)注作物生長前期的時相。
(3)研究對后向散射信息、紋理信息、極化分解信息等3部分信息進行了不同方式的組合,并針對玉米進行了變量優(yōu)選,結(jié)果表明在北方地區(qū)玉米識別過程中,極化信息貢獻度較大,其在后向散射信息分類結(jié)果的基礎(chǔ)上精度提高了近7%,極化信息的加入主要增加了玉米和建筑用地的可分離性。紋理信息和極化信息的加入也使棉花的精度提高了3%。通過針對玉米的變量優(yōu)選,其中5個變量的組合可使玉米獲得較高的精度,然而所有信息結(jié)合獲取的結(jié)果仍為最優(yōu)。
該文利用雷達數(shù)據(jù)對華北平原地區(qū)的旱地作物進行識別研究可能還存在一定不足:研究區(qū)內(nèi)旱地作物品種單一(大多數(shù)農(nóng)田農(nóng)作物類型僅包括玉米、棉花兩類),且棉花面積小、地塊破碎,今后的研究將在作物類型復(fù)雜的地區(qū)進一步深入。
[1]Gonzalez-Sanpedro M C,Le Toan T,Moreno J,et al.Seasonal variations of leaf area index of agricultural fields retrieved from Landsat data.Remote Sensing of Environment,2008, 112: 810~824
[2]Wang Dan,lin Hiu,Chen Jinsong,et al.Application of muti-temporal ENVISAT ASAR data to agricultural area mapping in the Pearl River Delta.International Journal of Remote Sensing,2010, 31: 1555~1572
[3]李志鵬, 李正國,劉珍環(huán),等.基于中分辨TM數(shù)據(jù)的水稻提取方法對比研究.中國農(nóng)業(yè)資源與區(qū)劃, 2014, 35(1): 27~33
[4]Liu Chen,Shang Jiali,Vachon P W,et al.Multiyear crop monitoring using Polarimetric RADARSAT-2 Data.IEEE Transactions on Geoscience and Remote sensing,2013, 51(4): 2227~2240
[5]邵蕓, 郭華東,范湘濤,等.水稻時域散射特征分析及其應(yīng)用研究.遙感學(xué)報, 2001, 5(5): 340~345
[6]Le Toan T,Laur H,Mougin E,et al.Multitemporal and dual-polarization observations of agricultural vegetation covers by X-band SAR images.IEEE Transactions on Geoscience and Remote Sensing, 1989, 27(6): 709~718
[7]譚炳香, 李增元.SAR數(shù)據(jù)在我國南方水稻分布圖快速更新中的應(yīng)用研究.國土資源遙感, 2000, 43(20): 24~27
[8]李坤, 邵蕓,張風(fēng)麗.基于RadarSat-2全極化數(shù)據(jù)的水稻識別.遙感技術(shù)與應(yīng)用, 2012, 27(1): 86~93
[9]丁婭萍, 陳仲新.基于最小距離法的RADARSAT-2遙感數(shù)據(jù)旱地作物識別.中國農(nóng)業(yè)資源與區(qū)劃, 2014, 35(6): 79~84
[10]董彥芳, 孫國清,龐勇.基于ENVISAT ASAR數(shù)據(jù)的水稻監(jiān)測.中國科學(xué)D輯, 2005, 35(7): 682~689
[11]凌飛龍, 汪小欽,史曉明.多時相SAR圖像水稻分布信息提取方法研究.福建師范大學(xué)學(xué)報(自然科學(xué)版), 2007, 23(3): 15~19
[12]汪小欽, 王欽敏,史曉明,等.基于主成分變換的ASAR數(shù)據(jù)水稻種植面積提取.農(nóng)業(yè)工程學(xué)報, 2008, 24(10): 122~126
[13]楊沈斌, 李秉柏,申雙和,等.基于多時相多極化差值圖的稻田識別研究.遙感學(xué)報, 2008, 12(4): 614~618
[14]張萍萍, 申雙和,李秉柏,等.水稻極化散射特征分析及稻田分類方法研究.江蘇農(nóng)業(yè)科學(xué), 2006,l: 148~151
[15]楊沈斌, 李秉柏,申雙和,等.基于ENVISAT ASAR數(shù)據(jù)的水稻遙感監(jiān)測.江蘇農(nóng)業(yè)學(xué)報, 2008, 24(1): 33~38
[16]Haldar D,Patnaik C.Synergistic use of Multi-temporal Radarsat SAr and AWiFS data for Rabi rice identification.J.Indian Soc.Remote Sens, 2010, 38: 153~160
[17]王迪, 周清波,陳仲新,等.基于合成孔徑雷達的農(nóng)作物識別研究進展.農(nóng)業(yè)工程學(xué)報, 2014, 30(16): 203~212
[18]McNairn H,Van der Sanden J J,Brown R J,et al.The potential of RADARSAT-2 for crop mapping and assessing crop condition//Proceedings of the Second International Conference on Geospatial Information in Agriculture and Forestry. Lake Buena Vista,F(xiàn)L,2000, 2: 81~88
[19]Gang Hong,Zhang Aining,Zhou Fuqun,et al.Integration of optical and synthetic aperture radar(SAR)images to differentiate grassland and alfalfa in prairie area.International Journal of Applied Earth Observation and Geoinformation, 2014, 28: 12~19
[20]化國強, 肖靖,黃曉軍,等.基于全極化SAR數(shù)據(jù)的玉米后向散射特征分析.江蘇農(nóng)業(yè)科學(xué), 2011, 39(3): 562~565
[21]Jia Kun,Li Qiangzi,Tian Yichen,et al.Crop classification using multi-configuration SAR data in the North China Plain.International Journal of Remote Sensing, 2012, 33(1/2): 170~183
[22]舒寧. 關(guān)于多光譜和高光譜影像的紋理問題.武漢大學(xué)學(xué)報(信息科學(xué)版), 2004, 29(4): 292~295
[23]張順謙, 楊秀榮.神經(jīng)網(wǎng)絡(luò)和分形紋理在夜間云霧分離中的應(yīng)用.遙感學(xué)報, 2006, 10(4): 497~502
[24]Shaban M A,Dikshit O.Improvement of classification in urban area by the use of textural features:The case study of lucknow city,Uttar Pradesh.International Journal of Remote Sensing.2001, 22: 565~593
[25]劉龍飛, 陳云浩,李京.遙感影像紋理分析方法綜述與展望.遙感技術(shù)與應(yīng)用, 2003, 18(6): 441~448
[26]Armando Marino,Irena Hajnsek.A change detector based on an optimization with polarimetric SAR imagery.IEEE Transactions on Geoscience and Remote Sensing, 2014, 52(8): 4781~4798
[27]V Alberga.A study of land cover classification using polarimetric SAR parameters.International Journal of Remote Sensing, 2007, 28(17): 3815~3870
[28]Stefan Uhlmann,Serkan Kiranyaz.Integration color features in polarimetric SAR image classification.IEEE Transactions on Geoscience and Remote Sensing, 2014, 52(4): 2197~2216
[29]陳勁松, 邵蕓,李震.基于目標(biāo)分解理論的全極化SAR圖像神經(jīng)網(wǎng)絡(luò)分類方法.中國圖象圖形學(xué)報, 2004, 9(5): 552~557
[30]Cloude S R,Pottier E.An entropy based classification scheme for land applications of polarimetric SAR.IEEE Transactions on Geoscience and Remote Sensing, 1997, 35(1): 68~78
[31]Freeman A,Durde S L.A three-component scattering model for polarimetric SAR data.IEEE Transactions on Geoscience and Remote Sensing, 1998, 36(3): 963~973
[32]Yamaguchi Y,Moriyama T,Ishido M,et al.Four-component scattering model for polarimetric SAR image decomposition.IEEE Transactions on Geoscience and Remote Sensing, 2005, 43(8): 1699~1706
[33]Breiman,L.Random forests.Machine Learning, 2001, 45, 5~32
[34]董師師, 黃哲學(xué).隨機森林理論淺析.集成技術(shù), 2013, 2(1): 1~7
[35]Gislason P O,Benediktsson J A,Sveinsson J R.Random Forests for land cover classification.Pattern Recognition Letters, 2006, 27, 294~300
[36]Jakimow B,Oldenburg C,Rabe A,et al.Manual for Application:image RF(1.1), 2012
[37]Richards,J.A.Remote Sensing Digital Image Analysis.Berlin:Springer-Verlag,1999
[38]凌飛龍, 汪小欽,史曉明.多時相SAR圖像水稻分布信息提取方法研究.福建師范大學(xué)學(xué)報(自然科學(xué)版), 2007, 23(3): 15~19
DRYlAND CROP IDENTIFICATION BASED ON SYNTHETIC APERTURE RADAR IN THE NORTH CHINA PLAIN*
Dong Zhaoxia1, 2,Wang Di1, 2※,Zhou Qingbo1, 2,Chen Zhongxin1, 2,Liu Jia1, 2
(1.Key Laboratory of Agri-informatics,Ministry of Agriculture,Beijing 100081,China;2.Institute of Agricultural Resources and Regional Planning,Chinese Academy of Agricultural Sciences,Beijing 100081,China)
Crop identification is the initial phase and key step of crops condition monitoring.Timely and accurately monitoring the spatial distribution of crop types is the basis of monitoring the information of farming condition.With the development of remote sensing technology and the popularization of remote sensing data, remote sensing has become an important means in agricultural monitoring. In particular, a complete set of technological method using optical remote sensing data for crop identification has already formed. However, during the key grow period of dryland crops in North China, since rainy or cloudy it is difficult to obtain timely and effective optical remote sensing data, it′s impossible to ensure the acquisition of the data during the key growth period of crops by using optical remote sensing technology, thus the continuous monitoring and research of crops are hindered. Therefore, it is necessary to conduct the study of dryland crops identification by the means of Synthetic aperture radar (SAR), which overcomes the above restrictions due to its all-weather, all-day imaging capability. In addition, when detecting vegetation information with microwave remote sensing technology, information different from that acquired through optical remote sensing can be acquired. Based on the SAR data, this paper chose Shenzhou, Hengshui city of Hebei Province as the study area and used the RADARSAT-2 images covering the area from June 3 to October 1, 2014 as the study data source. Classification method was the Random Forest (RF). First, by contrasting the combination of different time, the optimal phase and phase combination was selected for typical dryland crop (corn/cotton) in the study area. Second, we extracted backscattering coefficients, texture information and polarimetric decomposition from optimal phase, and combine the information in different ways. The contribution of different combination of input data to a random forest classifier was evaluated with map accuracy statistics and the evaluation of variables importance. The results showed that when identifying dryland crops, radar remote sensing should pay attention to the early phases during the growth period of crops. The accuracy can reach more than 90% for corn on condition of single phase, cotton areas were usually small and distributed sporadically, but it also reached more than 70% through the combination of June 3 and June 27.While using texture information and polarimetric decomposition it also increased3%. Finally, variable importance was estimated following by VH、Alpha、Yamaguchi4-Odd、Freeman-Vol and Mean(HV). The results demonstrated the capacity of SAR can identify the dryland crops and the independence of data. SAR with unique acquisition mode provided a complement to optical data.
synthetic aperture radar (SAR); dryland crop; classification; random forest (RF); variable selection
10.7621/cjarrp.1005-9121.20160804
2015-12-23
東朝霞(1989—),女,河北石家莊人,碩士研究生。研究方向:農(nóng)作物遙感監(jiān)測?!ㄐ抛髡撸和醯?1977—),男,遼寧鞍山人,副研究員。研究方向:農(nóng)業(yè)遙感基礎(chǔ)與應(yīng)用。Email:wangdicaas@126.com
S127
A
1005-9121[2016]08-0027-10
*資助項目:國家科技重大專項項目“高分農(nóng)業(yè)遙感監(jiān)測與評價示范系統(tǒng)”(09-Y30B03-9001-13/15)