萬叢 孫智虎 梁治華 張錦水
摘要 2019年11月3日發(fā)射的GF-7號衛(wèi)星是我國的第二顆亞米級、多角度民用商業(yè)衛(wèi)星,其在農(nóng)作物面積分布精細化識別方面潛力有待評估。依據(jù)2018年國家統(tǒng)計局數(shù)據(jù),全國冬小麥播種面積占糧食作物總播種面積的19.23%,通過遙感手段準確識別冬小麥分布情況,是作物長勢和作物估產(chǎn)等后續(xù)遙感產(chǎn)品準確評估的保證,對確保糧食安全具有極其重要的意義。通過支撐向量機和隨機森林2種機器學習算法,分析高分七號亞米級光譜特征及其紋理特征對冬小麥的精細化識別能力。結(jié)果表明,基于影像光譜特征,SVM分類器取得了最優(yōu)的分類精度,其中冬小麥識別精度為93.96%,總體精度為91.01%,Kappa系數(shù)為0.763 2,面積精度為91.46%。
關(guān)鍵詞 GF-7;遙感;冬小麥;隨機森林;支撐向量機
中圖分類號 S-127? 文獻標識碼 A
文章編號 0517-6611(2021)12-0244-04
doi:10.3969/j.issn.0517-6611.2021.12.064
開放科學(資源服務(wù))標識碼(OSID):
Refined Identification of Winter Wheat Area Based on GF-7 Satellite Remote Sensing
WAN Cong1,SUN Zhi hu2,LIANG Zhi hua3? et al (1.Data Management Center,National Bureau of Statistics of the Peoples Republic of China,Beijing 100826;2.China University of Geosciences (Beijing),Beijing 100083;3.Institute of Remote Sensing Science and Engineering,F(xiàn)aculty of Geographical Science,Beijing Normal University,Beijing 100875)
Abstract GF 7 satellite launched on November 3,2019,is Chinas second sub meter multi angle commercial satellite. Its potential in fine identification of crop area distribution needs to be evaluated.According to the data of the National Bureau of Statistics in 2018,the sown area of winter wheat accounts for 19.23% of the total sown area of grain crops.Accurate identification of winter wheat distribution by remote sensing means is the guarantee for accurate evaluation of crop growth and crop yield estimation and other follow up remote sensing products,which is of great significance to ensure food security.In this research,support vector machine (SVM) and random forest machine learning algorithms were used to analyze the fine recognition ability of the spectral features and texture features of GF 7 images.The results showed that the SVM classifier achieves the optimal classification accuracy based on the spectral characteristics of the image.The recognition accuracy of winter wheat was 93.96%,the overall accuracy was 91.01%,the kappa coefficient was 0.763 2,and the area accuracy was 91.46%.
Key words GF 7;Remote sensing;Winter wheat;Random forest;SVM
近年來,國產(chǎn)高分辨率遙感衛(wèi)星的相繼發(fā)射,尤其是亞米級分辨率衛(wèi)星,使得影像上可以觀測到更為細致的地表覆蓋結(jié)構(gòu)。雖然中國農(nóng)業(yè)種植結(jié)構(gòu)在朝著規(guī)?;N植的趨勢發(fā)展,但在廣大農(nóng)村小農(nóng)經(jīng)濟下作物種植結(jié)構(gòu)比重仍不可忽視,其農(nóng)業(yè)生產(chǎn)具有超小規(guī)模化和農(nóng)地細碎化等特征[1]。中、低分辨率遙感影像難以準確識別農(nóng)作物種植破碎情況,新發(fā)射的GF-7亞米級衛(wèi)星影像為精細化識別農(nóng)地種植分布提供了可能。
由于遙感數(shù)據(jù)能反映真實的地物類型特點,越來越被廣泛用于農(nóng)業(yè)調(diào)查,尤其是第三次農(nóng)業(yè)普查首次采用遙感數(shù)據(jù)應(yīng)用于農(nóng)作物面積普查中[2],通過遙感進行地物測量替代了大量的人工實地測量工作。相對于人工識別具有邊界不準確、地物屬性目視判斷錯誤、地物屬性填報錯誤等誤差影響,遙感影像則反映了真實的地物情況,通過研究分析高分辨率遙感影像高精度的作物識別方法,可快速識別大范圍的農(nóng)作物精細化分布結(jié)果。
國產(chǎn)高分光學遙感衛(wèi)星中,相對于GF-6號和GF-7號衛(wèi)星,GF-1號和GF-2號由于發(fā)射較早,已被廣泛應(yīng)用于農(nóng)作物分布識別。王利民等[3]利用GF-1 WFV時序數(shù)據(jù)構(gòu)建決策樹,提取順義區(qū)冬小麥分布,冬小麥制圖精度和用戶精度分別為90%、74.4%。郭文茜等[4]使用GF-1 WFV數(shù)據(jù),基于統(tǒng)計數(shù)據(jù)總量約束提取冬小麥分布。覃澤林等[5]基于GF-1 PMS時序影像,結(jié)合NDVI和紋理特征對大宗作物識別精度達到了 90.08%。王東等[6]通過光譜特征和顏色特征進行油菜的提取,基于GF-1 WFV數(shù)據(jù)的面積相對誤差為-14.14%,基于GF-2 PMS數(shù)據(jù)的面積相對誤差為-8.33%。作為新發(fā)射衛(wèi)星,GF-7號衛(wèi)星在遙感作物面積分布精細化識別方面的潛力有待評估,尤其是遙感識別與人工識別在作物面積上的差異有待分析,從而用于分析遙感識別替代人工識別的可行性。該研究基于GF-7 0.7 m分辨率融合影像及其與紋理特征的組合,分析2種機器學習算法隨機森林(Random Forest,RF)和支撐向量機(Support Vector Machine,SVM)對冬小麥分類識別精度的差異,評估GF-7號遙感影像識別出的冬小麥面積與人工識別面積的差異。
1 研究區(qū)概述
1.1 研究區(qū)概況
景縣位于河北省衡水市東部,屬暖溫帶季風氣候,地處糧食作物的主要生產(chǎn)基地黃淮海平原,緊鄰山東省德州市。景縣地勢較為平緩,適宜農(nóng)作物集中種植,其耕地面積約為834 km2,占縣域面積的70.2%。
野外調(diào)查發(fā)現(xiàn),景縣種植農(nóng)作物多樣,其中糧食作物主要包括冬小麥和夏玉米,其種植類型為一年兩熟輪作制,即夏玉米種植在冬小麥收獲之后的耕地上。棉花、油菜和向日葵是景縣主要種植的經(jīng)濟作物,此外還種植蔬菜辣椒。
景縣冬小麥通常在10月份種植,12月中旬開始停止生長,次年3月下旬至4月上旬為返青期,4月下旬至5月上旬進入乳熟期,6月上旬收獲。在冬小麥乳熟期,冬小麥生長最為旺盛,其近紅外反射率處于冬小麥生長過程中的高值[7],是冬小麥遙感識別的最佳時間段。
1.2 影像介紹及預(yù)處理
GF-7號衛(wèi)星是我國首顆民用亞米級高分辨率、1∶10 000比例尺立體測繪衛(wèi)星。研究區(qū)獲取的GF-7影像為4月27日,包括前視全色影像(0.66 m×0.65 m)、后視全色影像(0.73 m×0.82 m)和后視多光譜影像(2.63 m×2.61 m)。
GF-7衛(wèi)星影像標準化預(yù)處理包括正射校正、幾何精糾正、影像拼接與裁剪、影像融合和特征提取等步驟。影像正射校正使用影像自帶的RPC校正,隨后依據(jù)景縣歷史GF-1號2 m分辨率的參考影像圖進行地理精校準,全色影像輸出分辨率均為0.7 m×0.7 m,多光譜影像輸出分辨率為2.6 m×2.6 m,地理坐標系設(shè)置為CGCS200,投影坐標系設(shè)置為Albers。影像融合使用envi軟件的Gram-Schmidt Spectral Sharpening方法,可保真地物的光譜信息和地物的紋理特征[8]。為減少紋理特征的提取時間,通過主成分分析的正向主成分旋轉(zhuǎn)獲取了融合影像第一主成分波段,其第一主成分的信息量占影像全部信息的77.69%。該研究依據(jù)灰度共生矩陣[9],提取第一主成分8種紋理特征:均值(Mean)、對比度(contrast)、方差(variance)、差異性(dissimilarity)、信息熵(entropy)、相關(guān)性(correlation)、協(xié)同性(homogeneity)、二階矩(second moment),提取窗口為3×3。
1.3 野外數(shù)據(jù)及數(shù)字化
2020年5月22日,使用北京師范大學開發(fā)的野外信息采集系統(tǒng)“AW拍”,進行了景縣地面信息的采集,采集信息及分布情況如圖1。
野外調(diào)查共采集131個地表覆蓋點位信息,調(diào)查了小麥、林地、草地、裸地、油菜、大棚蔬菜、地膜蔬菜和向日葵等地物類型。林地、草地、建筑、裸地、水域等土地覆蓋類型在遙感影像上特征較明顯、易區(qū)分,可通過目視識別,因此僅采集了少許點位信息。由于調(diào)查時間遲于影像時間,實際在4月27日影像上,地膜蔬菜和向日葵等地物類型呈現(xiàn)類似裸地的光譜信息;油菜呈現(xiàn)高亮紅色的光譜信息,易與冬小麥混淆;草地呈現(xiàn)淡紅色的光譜信息,且伴有一定的紋理特征。
結(jié)合野外調(diào)查采集的冬小麥點位信息和GF-7號影像信息得出,冬小麥在景縣廣泛種植,但由于小農(nóng)經(jīng)濟下冬小麥的種植存在種植結(jié)構(gòu)形式的不統(tǒng)一,即冬小麥種植存在時間相對不一致和冬小麥的種植間距不一致情況。在圖1的GF-7遙感影像中,冬小麥種植區(qū)域光譜總體呈現(xiàn)紅色,其中長勢好、種植密集的區(qū)域為亮紅色,而長勢較差、種植間隔較大的區(qū)域偏暗紅色,此外不同品種的冬小麥在影像上也存在一定的光譜差異。
為獲取大面積地表覆蓋的真值分布情況用于精度評估,依據(jù)野外數(shù)據(jù)和高分融合影像,在研究區(qū)耕地范圍內(nèi),進行了為期3 d的冬小麥專家目視解譯工作,解譯結(jié)果如圖1所示。圖中冬小麥的分布區(qū)域為黃色矢量多邊形內(nèi),其他地物類型(主要為林地、草地、裸地、油菜)的分布區(qū)域為藍色矢量多邊形內(nèi)。
2 研究方法
2.1 分類體系構(gòu)建
樣本庫是進行遙感影像解譯和作物識別生產(chǎn)的基礎(chǔ),結(jié)合景縣冬小麥物候特征和野外調(diào)查數(shù)據(jù),以GF-7融合數(shù)據(jù)為基礎(chǔ),根據(jù)遙感影像上的光譜特征、形狀和紋理特征,構(gòu)建分類體系。
在分類識別中,樣本的選擇是分類的關(guān)鍵,同一區(qū)域標記樣本數(shù)量選取過少不足以代表地物覆蓋的局部差異,識別范圍內(nèi)選取區(qū)域過少或區(qū)域分布不均衡不足以代表土地覆蓋的區(qū)域差異。因此依據(jù)當?shù)赝恋馗采w情況復(fù)雜程度,構(gòu)建13 m×13 m的方格,全圖均勻選取多個樣本區(qū)域,影像分辨率為0.7 m,單個方格像元數(shù)量約345個像元。
在高分辨率影像識別中,樣本選取過多會造成機器學習運行緩慢。由于本次冬小麥識別所選取的樣本數(shù)量和區(qū)域較多,故隨機抽取0.2倍初始訓練數(shù)據(jù)作為訓練集。共選取冬小麥10 225個、其他作物2 594個、林地4 093個、草地4 550個、水體2 450個、建筑6 112個、裸地2 758個等地物類型樣本,用于分類訓練。
2.2 機器學習方法
RF和SVM作為近年來主流分類器,被廣泛應(yīng)用于土地覆蓋識別。RF基于Bagging集成學習原理[10],通過樣本隨機和變量隨機構(gòu)建多棵獨立的Cart決策樹,具有不宜過擬合、需設(shè)置參數(shù)較少等優(yōu)點。SVM是基于核函數(shù)進行非線性變換(常用RBF核函數(shù)),將數(shù)據(jù)投影在高維空間,求解出能正確劃分訓練集的幾何間隔最大的分離超平面[11]。
該研究分類算法基于python實現(xiàn),針對僅用光譜特征和光譜特征+紋理特征2種特征集,RF參數(shù)樹的數(shù)量(ntree)均設(shè)置為300,SVM則通過LIBSVM工具[12]得到優(yōu)選參數(shù)C和Gamma,分別為 32 768,8.0 和32 768,0.5。2種分類器所需設(shè)置的其余參數(shù)保持默認。
2.3 精度評價方法
精度評估是依冬小麥的數(shù)字化結(jié)果為依據(jù),對機器學習識別出的冬小麥分布結(jié)果構(gòu)建誤差矩陣,評價冬小麥的制圖精度(production accuracy,Pr)和用戶精度(user accuracy,Ur),通過F1-SCORE綜合評估冬小麥識別精度??傮w精度(Overall accuracy,Oa)、Kappa系數(shù)(分類一致性精度)被用于評估遙感識別的整體精度。
F1-SCORE=2×(Pr-Ur)/(Pr+Ur)(1)
此外,面積識別精度是定量表達GF-7號衛(wèi)星影像識別出的冬小麥區(qū)域面積與人工解譯的冬小麥面積的差異,見公式(2)、(3):
bias=(Srs-Sg)/Sg(2)
SA=(1-|bias|)×100%(3)
式中,Srs代表遙感識別出的區(qū)域冬小麥面積,Sg代表人工解譯的冬小麥結(jié)果,bias代表遙感識別面積與人工識別面積的偏差,SA代表總體的遙感識別面積精度。
3 結(jié)果與分析
3.1 分類結(jié)果分析
使用機器學習算法,基于GF-7衛(wèi)星影像的2020年景縣冬小麥識別結(jié)果如圖2所示,左側(cè)大圖為基于光譜數(shù)據(jù)的SVM識別結(jié)果,A為近紅外、紅、綠波段顯示的融合影像,B為真值結(jié)果,C、D分別為RF、SVM分類結(jié)果,1、2分別為基于光譜特征和光譜特征+紋理特征進行分類。
目視整體分析顯示,冬小麥種植分布在景縣幾乎整個東部耕地范圍內(nèi),未見有明顯的漏分。在研究區(qū)南部和中西部區(qū)域存在密集整片的休耕地,而在研究區(qū)東北部存在大量的破碎休耕地地塊,這些休耕地地塊均被正確識別。在冬小麥的精細化識別方面,通過GF-7遙感影像識別冬小麥分布,可以識別到地塊內(nèi)部的田壟信息、土包凸起信息以及地塊間的鄉(xiāng)間道路信息,并且能準確識別到小農(nóng)經(jīng)濟下種植面積較小的冬小麥種植分布。
野外調(diào)查發(fā)現(xiàn),研究區(qū)主要冬播農(nóng)作物為冬小麥和油菜(油菜光譜特征顯示如圖2區(qū)域1中A);此外在研究區(qū)中東部區(qū)域存在小部分林地-冬小麥混種模式(光譜特征如圖2區(qū)域2中A),這種混種模式使得其光譜特征與冬小麥相似,其紋理又與林地相似,為識別帶來了一定困難。
在區(qū)域1中,C2識別結(jié)果將部分油菜錯分為了冬小麥,而C1、D2沒有明顯誤分。這可能是由于冬小麥與油菜紋理特征較相似,而隨機森林在劃分該地物類型時過多考慮了紋理特征所造成。4種分類器結(jié)果均正確識別了林地與冬小麥,說明從光譜特征就可明顯區(qū)分林地與冬小麥。
在區(qū)域2中,4種分類器均難以準確識別林地-冬小麥混種模式。盡管在研究區(qū)僅存在少量這種混種模式,但該模式的錯誤劃分,作為冬小麥分布識別誤差來源之一,在作物精細化識別方面需被考慮。4種分類器均準確識別農(nóng)田地塊之間的鄉(xiāng)村道路,而人工識別考慮到時效問題忽略劃分寬度較小的鄉(xiāng)村道路,顯然在純冬小麥種植區(qū)域,遙感識別的冬小麥分布比人工識別結(jié)果更為準確。
安徽農(nóng)業(yè)科學2021年
3.2 分類精度分析
依據(jù)研究區(qū)數(shù)字化結(jié)果,評價分類器識別精度(表2)。從特征角度分析,無論是RF還是SVM分類器,加入紋理特征都沒有帶來明顯的精度提升,在高分辨率影像上,地物之間的紋理特征可能有較大相似,通過紋理特征難以區(qū)分此時的冬小麥與其他地物。
從分類器角度分析,SVM與RF 2種分類器總體精度、冬小麥識別精度相差不大,雖然SVM分類器取得了更高的冬小麥識別精度和分類總體精度,但SVM分類相對隨機森林分類更加費時,帶來了一定的時間成本。2種分類器都取得了略低的Kappa系數(shù),即人工識別結(jié)果與遙感識別結(jié)果仍然有較大差異。從人工識別分析,基于高分辨率影像的人工數(shù)字化識別,會忽略部分窄的道路,地物邊界處也會存在少許誤差,此外人工識別不可避免會存在一些屬性誤差。從遙感影像分析,遙感影像獲取時期是冬小麥的關(guān)鍵生長期,此時冬小麥的作物光譜與林地較為相似,這為識別帶來了一定的誤差。此外,冬小麥種植時間、種植結(jié)構(gòu)、種植品種間的較大差異也為冬小麥的精準識別帶來一定的難度。
統(tǒng)計人工數(shù)字化識別的冬小麥面積為36 512 hm2,基于GF-7光譜數(shù)據(jù)的SVM分類器取得了最高的面積精度,其識別冬小麥面積為33 394 hm2,略少于人工識別面積,通過面積精度指標公式,計算得到冬小麥識別面積偏差bias等于-0.085 4,區(qū)域面積精度SA為91.46%。遙感識別與人工識別冬小麥面積仍然存在一定的偏差,這些偏差部分是由遙感識別誤差所造成的,即錯誤地將冬小麥地塊劃分為其他,此外人工矢量化結(jié)果的不夠精細也對面積偏差產(chǎn)生了一定影像。
4 結(jié)論與討論
該研究利用GF-7號衛(wèi)星通過集成學習的方法進行景縣的冬小麥分布識別,基于GF-7光譜數(shù)據(jù)和SVM分類器取得了最高的分類精度,其中冬小麥識別精度為93.96%,總體精度為91.01%,Kappa系數(shù)為0.763 2,面積精度為91.46%。SVM分類結(jié)果統(tǒng)計顯示,在研究區(qū)內(nèi)冬小麥種植面積約占總耕地面積的71.14%?;贕F-7高分辨率衛(wèi)星影像識別
的冬小麥結(jié)果具有高制圖精度和用戶精度,可保證其識別結(jié)果比中高分辨率更準確和可靠。
雖然通過遙感識別冬小麥分布比人工識別存在一定的模型誤差,即訓練數(shù)據(jù)、遙感影像獲取時間、遙感影像獲取質(zhì)量、分類器的不同,以及影像中混合像元和陰影的存在會對冬小麥識別結(jié)果造成一定影響。而該研究構(gòu)建了均勻足量的訓練數(shù)據(jù),選取近年來表現(xiàn)出色的強分類器RF和SVM,盡可能降低了模型誤差。冬小麥分類結(jié)果目視分析顯示,研究區(qū)冬小麥種植區(qū)域除林地-冬小麥混種類型外,其他均被準確識別。相對于人工識別忽略地塊之間的鄉(xiāng)村道路,地塊內(nèi)部的土包、田壟等地物類型均被遙感準確識別,從該角度分析,基于GF-7遙感識別的冬小麥分布結(jié)果在精細化程度上可能比人工識別結(jié)果更準確。
參考文獻
[1]
錢文榮,鄭黎義.勞動力外出務(wù)工對農(nóng)戶農(nóng)業(yè)生產(chǎn)的影響——研究現(xiàn)狀與展望[J].中國農(nóng)村觀察,2011(1):31-38.
[2] 高園園,孫暢,袁如金.地理國情普查成果在第三次農(nóng)業(yè)普查中的應(yīng)用研究[J].測繪與空間地理信息,2019,42(1):102-105.
[3] 王利民,劉佳,楊福剛,等.基于GF-1衛(wèi)星遙感的冬小麥面積早期識別[J].農(nóng)業(yè)工程學報,2015,31(11):194-201.
[4] 郭文茜,任建強,劉杏認,等.統(tǒng)計數(shù)據(jù)總量約束下全局優(yōu)化閾值的冬小麥分布制圖[J].遙感學報,2018,22(6):1023-1041.
[5] 覃澤林,謝國雪,李宇翔,等.多時相高分一號影像在丘陵地區(qū)大宗農(nóng)作物提取中的應(yīng)用[J].南方農(nóng)業(yè)學報,2017,48(1):181-188.
[6] 王東,方圣輝,王政.基于光譜特征和顏色特征的油菜提取研究[J].農(nóng)業(yè)機械學報,2018,49(3):158-165.
[7] 劉劍鋒,賈玉秋,張喜旺.基于時間序列MODIS-NDVI的冬小麥遙感識別[J].湖北農(nóng)業(yè)科學,2017,56(8):1560-1563.
[8] 李霖,佘夢媛,羅恒.ZY-3衛(wèi)星全色與多光譜影像融合方法比較[J].農(nóng)業(yè)工程學報,2014,30(16):157-165.
[9] HARALICK R M.Statistical and structural approaches to texture[J].Proceedings of the IEEE,1979,67(5):786-804.
[10] BREIMAN L.Random forests[J].Machine learning,2001,45(1):5-32.
[11] 王芳,楊武年,鄧曉宇,等.高分二號數(shù)據(jù)的城市生態(tài)用地分類方法探討[J].測繪科學,2018,43(3):71-76.
[12] CHANG C C,LIN C J.LIBSVM:A library for support vector machines(Article)[J].ACM transactions on intelligent systems and technology,2011,2(3):1-27.