• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于隨機(jī)森林算法的多作物同步識(shí)別

      2019-08-03 07:16:06許淇李啟亮MathildeDeVroey張吳平范錦龍
      山東農(nóng)業(yè)科學(xué) 2019年3期
      關(guān)鍵詞:隨機(jī)森林時(shí)間序列

      許淇 李啟亮 Mathilde De Vroey 張吳平 范錦龍

      摘要:作物類型遙感識(shí)別是農(nóng)業(yè)遙感的重要組成部分,為獲取作物種植面積、長(zhǎng)勢(shì)信息并進(jìn)行產(chǎn)量估算提供了手段。目前,對(duì)玉米、水稻和小麥等大宗農(nóng)作物進(jìn)行單一識(shí)別或兩類間分類識(shí)別的技術(shù)研究較多,對(duì)研究區(qū)多種農(nóng)作物同步分類識(shí)別的研究較少。本研究基于隨機(jī)森林分類器利用Landsat 8數(shù)據(jù)開展寧夏農(nóng)作物分類,對(duì)八種主要農(nóng)作物春小麥、玉米、水稻、苜蓿、蔬菜、葡萄、枸杞和瓜類進(jìn)行同步分類試驗(yàn)。結(jié)果表明:隨機(jī)森林方法可以滿足研究區(qū)內(nèi)多類作物同步監(jiān)測(cè)的需求,精度可達(dá)80%以上。單時(shí)相分類精度可達(dá)到81.8%,后分類處理精度可達(dá)到82.8%,時(shí)間序列分類精度可達(dá)到85.1%,時(shí)間序列分類和后分類處理可以有效提高分類精度。隨機(jī)森林分類精度隨著樹數(shù)量的增加而增大,當(dāng)樹的數(shù)量足夠多時(shí),模型趨于穩(wěn)定,特征變量對(duì)精度的影響被控制在一定范圍內(nèi),當(dāng)特征變量設(shè)置為總特征變量的平方根或?qū)?shù)時(shí),精度達(dá)到最佳。因此,基于對(duì)分類實(shí)驗(yàn)時(shí)效性的考慮,將參數(shù)分別設(shè)置為Ntree= 100,Mtry=總特征變量的平方根或?qū)?shù)。

      關(guān)鍵詞:隨機(jī)森林;多作物識(shí)別;分類后處理;單時(shí)相;時(shí)間序列

      Multi - Crop Synchronization Identification Based on Random ForestXu Qjl,2 , Li Qjliang1,2 , Mathilde De Vroey3 , Zhang Wupingl , Fan Jinlong2

      Abstract Identifying crop type with remotely sensed image is the fundamental step for calculating croparea and monitoring crop growth as well as estimating crop yield in the context of agricultural remote sensing.At present, there were many studies on single recognition or inter - classification recognition among the majorstaple crops, such as corn, rice and wheat, however, less researches have been done on simultaneous classifi-cation and recognition of multiple crops in the study area. Based on the random forest classifier and Landsat 8data, this study carried out the crop classification in Ningxia, the crops including rice, corn, wheat, clover,grapes, alfalfa, vegetables and melons. The results showed that it was feasible to use the random forest methodto simultaneously identify multiple crops in Ningxia, and the accuracy could reach more than 80%. Thesingle - phase classification accuracy could reach 81.8% , after classification post - processing accuracy couldbe up t0 82.8% . The time series classification accuracy could reach 85.1% . Time series classification andpost - classification processing could effectively improve classification accuracy. The accuracy of random forestclassification increased with the increase of the number of trees. The model tended to be stable when the num-ber of trees was sufficient, and the influence of characteristic variables on the accuracv was controlled within acertain range. The precision was optimal when the feature variable was set to the square root or logarithm ofthe total feature variable. Therefore, based on the consideration of the timeliness of the classification experi-ment, the parameters were respectively set to Ntree = 100, and Mtry = the square root or logarithm of the totalcharacteristic variable.

      Keywords Random forest; Multi - crop classification; Post - classification; Single - phase; Time series

      掌握農(nóng)作物種植的空間分布狀況,對(duì)于宏觀指導(dǎo)農(nóng)業(yè)生產(chǎn)、合理采取作物管理措施具有重要的現(xiàn)實(shí)意義[1-3]。傳統(tǒng)的農(nóng)業(yè)統(tǒng)計(jì)報(bào)表和抽樣調(diào)查,通常需耗費(fèi)大量人力物力且持續(xù)時(shí)間長(zhǎng)[4],對(duì)當(dāng)季農(nóng)業(yè)生產(chǎn)的指導(dǎo)作用有限。遙感技術(shù)具有觀測(cè)面積大、觀測(cè)周期短、數(shù)據(jù)的綜合性和可比性較強(qiáng)等特點(diǎn),為及時(shí)、準(zhǔn)確、客觀地獲得作物種植面積提供了技術(shù)手段和重要基礎(chǔ)數(shù)據(jù)[5,6]。近年來較主流的作物分類方法包括支持向量機(jī)(SVM)、隨機(jī)森林(RF)、神經(jīng)網(wǎng)絡(luò)(ANN)、K近鄰法( KNN)、決策樹(DT)、最大似然法(MLC),其中支持向量機(jī)與隨機(jī)森林應(yīng)用最為廣泛[7]。

      隨機(jī)森林算法是由多棵CART決策樹組合而成的一種監(jiān)督分類方法,構(gòu)成決策樹模型的數(shù)據(jù)是通過Bootstrap方法隨機(jī)抽取的,抽取剩余的數(shù)據(jù)即袋外數(shù)據(jù)則用于誤差測(cè)試,最終分類結(jié)果由多棵決策樹投票決定。隨機(jī)森林分類器具有對(duì)參數(shù)不敏感,不易過擬合,訓(xùn)練速度快的特點(diǎn)[8]。眾多研究者已基于隨機(jī)森林算法在作物分類領(lǐng)域進(jìn)行了研究并取得了較好的精度[4.9-11]。但現(xiàn)有的研究大多針對(duì)大宗農(nóng)作物進(jìn)行單一提取或兩類間進(jìn)行分類識(shí)別,并未進(jìn)行研究區(qū)全部主要作物的同步提取試驗(yàn),無法滿足我國地塊破碎、作物種類繁多的現(xiàn)實(shí)性需求。

      本研究以寧夏青銅峽灌區(qū)為研究區(qū),采用隨機(jī)森林分類器對(duì)研究區(qū)種植的八種主要農(nóng)作物——春小麥、玉米、水稻、苜蓿、蔬菜、葡萄、枸杞和瓜類進(jìn)行同步分類試驗(yàn),分析Ntree和Mtry對(duì)隨機(jī)森林模型精度的影響,單時(shí)相與時(shí)間序列、后分類處理對(duì)分類結(jié)果的影響,最后評(píng)估了隨機(jī)森林算法在多作物同步提取中的實(shí)用性,為實(shí)現(xiàn)我國多作物同步監(jiān)測(cè)提供依據(jù)。

      1 數(shù)據(jù)來源與研究方法

      1.1 研究區(qū)概況

      研究區(qū)位于寧夏回族自治區(qū)內(nèi)的青銅峽灌區(qū)(石嘴山市、銀川市和吳忠市),地理位置東經(jīng)105. 39°~107.00°、北緯37.49°~39.27°。位于中溫帶干旱區(qū),日照充足,溫差大,熱量豐富,無霜期較長(zhǎng)。年均氣溫8—9℃,4-9月作物生長(zhǎng)季累計(jì)積溫3200—3400℃,大于等于10℃積溫的初日及終日與無霜期吻合,再加上太陽輻射達(dá)619.68J/(c㎡·a),有利于作物生長(zhǎng)。灌區(qū)主要作物有春小麥、玉米、水稻、苜蓿、蔬菜、葡萄、枸杞和瓜類。

      1.2 數(shù)據(jù)源

      1.2.1 影像數(shù)據(jù)本研究所用的主要數(shù)據(jù)源為30M分辨率的Landsat 8衛(wèi)星數(shù)據(jù),包括9個(gè)波段,分別是海岸/氣溶膠、藍(lán)、綠、紅、近紅、短波紅外1、短波紅外2、熱紅外1和熱紅外2。對(duì)影像進(jìn)行預(yù)處理操作后的計(jì)算又增加了歸一化植被指數(shù)(NDVI)、歸一化水體指數(shù)(NDWI)、歸一化建筑指數(shù)( NDBI)信息數(shù)據(jù),共12個(gè)波段。

      共獲取了13期Landsat 8衛(wèi)星影像數(shù)據(jù),時(shí)間分別為2018-05-04、2018-05-11、2018-05-20、2018-05-27、2018-06-05、2018-06-12、2018-06-21、2018-06-28、2018-07-14、2018-07-30、2018-08-08、2018-08-15、2018-08-24。但只有2018-06-05、2018-06-21及2018-08-24三幅完整覆蓋研究區(qū),而由于小麥生長(zhǎng)期只持續(xù)到7月,故選用2018-06-05及2018-06- 21影像進(jìn)行分類,其他時(shí)間的影像用于輔助樣本點(diǎn)的擴(kuò)充。

      本研究還用到了10 m分辨率的Sentinel-2數(shù)據(jù)[12-14],主要用于工作者B選取驗(yàn)證樣本及結(jié)合哨兵農(nóng)業(yè)系統(tǒng)(Sen2-Agri)。[15-17]生成研究區(qū)作物分區(qū)圖。

      1.2.2 地面調(diào)查數(shù)據(jù) 于2018年6月7-8日及6月28日-7月3日分別進(jìn)行實(shí)地樣方采集工作。采用野外沿途拍照采樣與室內(nèi)解譯相結(jié)合的方法,在研究區(qū)內(nèi)選取11個(gè)10 kmxlo km的采樣框,在采樣框中進(jìn)行密集型采樣,采樣框之間則采取跟隨車的行進(jìn)路線進(jìn)行隨機(jī)拍照采樣的方式來增加樣本的采集。在采樣過程中分左右兩個(gè)方向進(jìn)行拍照采樣,采集了7950多個(gè)左側(cè)地面樣方照片數(shù)據(jù),5330多個(gè)右側(cè)地面樣方照片數(shù)據(jù)。

      訓(xùn)練樣本采用背對(duì)背選取方式,左邊工作者A實(shí)地樣本用來在Landsat 8數(shù)據(jù)上采集擴(kuò)充訓(xùn)練樣本,右邊工作者B實(shí)地樣本用來在Sentinel -2數(shù)據(jù)上采集驗(yàn)證樣本以及借助哨兵農(nóng)業(yè)系統(tǒng)(Sen2 - Agri)生成研究區(qū)作物分區(qū)圖。訓(xùn)練樣本及驗(yàn)證樣本量如表1。

      1.3 研究方法

      1.3.1 隨機(jī)森林算法 隨機(jī)森林算法(RFC)是Breiman[18]2001年提出的一種多決策樹分類方法,是監(jiān)督分類方法的一種。隨機(jī)森林算法的分類結(jié)果由構(gòu)成模型的所有CART決策樹投票決定,而構(gòu)成每個(gè)決策樹模型的樣本數(shù)據(jù)和特征變量都是隨機(jī)抽取的結(jié)果,同時(shí)會(huì)將剩余的數(shù)據(jù)組成袋外數(shù)據(jù)進(jìn)行誤差測(cè)試。由于每次構(gòu)建模型時(shí)的數(shù)據(jù)與特征變量都是隨機(jī)選取,故每次構(gòu)建的模型和分類結(jié)果不完全一樣,會(huì)存在一定的誤差值。隨機(jī)森林方法對(duì)于遙感影像分類具有很好的抗噪聲性能,分類精度較高[9]。

      隨機(jī)森林算法通過IDL語言實(shí)現(xiàn),有兩個(gè)重要參數(shù)需要設(shè)定,分別為決策樹的數(shù)量(Ntree)和特征變量的數(shù)量(Mtry)。為找出最佳分類參數(shù),本研究分別將樹數(shù)量設(shè)置為10、50、100、300、500、1000,特征變量以1為步長(zhǎng),分別對(duì)12個(gè)波段進(jìn)行分類驗(yàn)證,結(jié)果發(fā)現(xiàn)分類精度隨著決策樹數(shù)量的增加而增大,當(dāng)樹的數(shù)量達(dá)到100時(shí)分類精度趨于平穩(wěn)狀態(tài),誤差保持在一個(gè)精度的范圍內(nèi);當(dāng)樹的數(shù)量足夠多時(shí)(達(dá)到100),特征變量對(duì)分類精度的影響被控制在一定范圍內(nèi),當(dāng)特征變量設(shè)置為總特征變量的平方根或?qū)?shù)時(shí),精度達(dá)到最佳。因此,基于對(duì)分類實(shí)驗(yàn)時(shí)效性的考慮,本研究將參數(shù)分別設(shè)置為Ntree=100,Mtrv=3。

      根據(jù)隨機(jī)森林算法參數(shù)調(diào)試結(jié)果對(duì)分類器進(jìn)行設(shè)定,采用訓(xùn)練樣本數(shù)據(jù)分別對(duì)影像分三種情景進(jìn)行討論:①2018-06-05單時(shí)相影像;②后分類處理,對(duì)2018-06-05分類結(jié)果中蔬菜及水稻兩類進(jìn)行3x3窗口的Majority和Clump分類后處理;③時(shí)間序列影像。最終得到研究區(qū)作物分類圖。圖1為三種情景討論結(jié)果的部分細(xì)節(jié)展示。

      1.3.2 精度驗(yàn)證采用工作者B根據(jù)實(shí)地采樣照片基于10 m空間分辨率哨兵影像得到的樣本點(diǎn)作為研究結(jié)果精度驗(yàn)證的數(shù)據(jù),共計(jì)19027個(gè)驗(yàn)證點(diǎn)(表1)。采用混淆矩陣、Kappa系數(shù)、總體分類精度、用戶者精度、制圖者精度[19]和F1Score 6種方式描述和比較分類精度。

      2 結(jié)果與分析

      2.1 分類后處理

      對(duì)2018年6月5日的單日影像分類結(jié)果先后進(jìn)行Majority和Clump方式的分類后處理。由于研究區(qū)北部地塊破碎,主要以種植玉米和小麥為主,枸杞和葡萄也存在相鄰小塊種植的現(xiàn)象,故為了避免分類后處理給分類結(jié)果帶來失真影響,只對(duì)大面積種植的水稻和蔬菜進(jìn)行分類后處理,Majority和Clump的處理窗口分別為3x3和2×2,表2展示了處理前后影像及混淆矩陣。經(jīng)分類后處理,總體精度、Kappa系數(shù)、F1 Score分別較處理前提高了約1個(gè)精度范圍;每種作物的F1Score都略有提高,蔬菜最為明顯,提高了約4個(gè)精度值。

      2.2 單時(shí)相與時(shí)間序列影像分類對(duì)比

      2018年6月5日單時(shí)相影像分類結(jié)果總體精度81.8%,Kappa系數(shù)0.76,F(xiàn)1 Score 68.58%。采用2018年6月5日與6月21日時(shí)間序列影像的分類結(jié)果總體精度可達(dá)85.1%,Kappa系數(shù)為0.81,F(xiàn)1 Score為74.09%(表3)。兩種影像分類結(jié)果中枸杞的精度都較低,F(xiàn)1 Score只有20%左右,可能是由于訓(xùn)練樣本較少以及枸杞種植區(qū)分散且多與葡萄相鄰造成混淆。相較于單時(shí)相影像分類結(jié)果,總體精度提高了3.3個(gè)百分點(diǎn),苜蓿、玉米、葡萄、枸杞、瓜類、水稻、蔬菜的F1 Score分別提高了2.1、5.5、9.3、6.O、18.4、1.1、2.6個(gè)百分點(diǎn),小麥的F1 Score降低了1.1個(gè)百分點(diǎn)。總體來看,時(shí)間序列影像分類可有效提高作物分類精度。從細(xì)節(jié)圖(圖1)來看,時(shí)間序列影像分類較單時(shí)相分類可以較好地處理地塊邊界問題,并有效避免因地塊短期管理問題造成的地塊內(nèi)部個(gè)別像素錯(cuò)分誤分的現(xiàn)象。

      3 討論與結(jié)論

      基于隨機(jī)森林方法對(duì)寧夏種植的多種作物進(jìn)行同步分類提取,總體精度達(dá)到81%以上,且分類結(jié)果與灌區(qū)北部地塊破碎、中北部地塊較大、南部地塊適中、葡萄主要分布于西部的實(shí)地作物空間分布一致,滿足了多類作物同步監(jiān)測(cè)的需求。主要研究結(jié)果及存在問題如下:

      (1)分類精度隨決策樹數(shù)量的增加而增大,當(dāng)樹的數(shù)量達(dá)到100時(shí)分類精度趨于平穩(wěn)狀態(tài)。當(dāng)樹的數(shù)量足夠多(達(dá)到100)時(shí),特征變量對(duì)分類精度的影響被控制在一定范圍內(nèi),當(dāng)特征變量設(shè)置為總特征變量的平方根或?qū)?shù)時(shí),精度達(dá)到最佳。因此,基于對(duì)分類實(shí)驗(yàn)時(shí)效性的考慮,建議將參數(shù)分別設(shè)置為Ntree=100,Mtrv=總特征變量的平方根或?qū)?shù)。

      (2)時(shí)間序列影像可以有效提高分類精度,與單時(shí)相影像分類相比,可以較好地處理地塊邊界問題,并有效避免因地塊短期管理問題造成的地塊內(nèi)部個(gè)別像素錯(cuò)分誤分現(xiàn)象。由于本研究區(qū)有效數(shù)據(jù)較少,分類精度與有效數(shù)據(jù)數(shù)量是否存在正相關(guān)關(guān)系還需進(jìn)一步探索。

      (3)由于苜蓿、蔬菜在生長(zhǎng)季內(nèi)存在收割一生長(zhǎng)多次反復(fù)的現(xiàn)象,故可能與玉米產(chǎn)生一定的混淆;而葡萄因種植模式導(dǎo)致植被覆蓋度低,易與生長(zhǎng)初期的玉米產(chǎn)生一定混淆。故在今后的研究中應(yīng)嘗試分層提職來改善作物的混淆問題。

      (3)對(duì)大地塊地物進(jìn)行適當(dāng)窗口大小的Ma-jority和Clump分類后處理,可以有效解決地塊內(nèi)部個(gè)別像元的錯(cuò)分誤分問題,從而小程度地提高分類精度。部分地區(qū)由于地塊破碎程度嚴(yán)重,分類結(jié)果呈現(xiàn)麻點(diǎn)分布,對(duì)整個(gè)研究區(qū)的主要作物同時(shí)進(jìn)行分類處理會(huì)導(dǎo)致失真現(xiàn)象,今后應(yīng)尋求更便捷的分類處理方法以避免此類問題。

      參考文獻(xiàn):

      [1] Wessels K J, Reyers B, Jaarsveld A s V, et al. Identification ofpotential conflict areas between land transformation and biocliversi-ty conservation in north - eastem South Africa [J] . AgTiculture,Ecosystems & Environment . 2003 . 95 (1) : 157 - 178.

      [2] Fry J, Xian G Z. Jin S, et al. Completion of the 2006 NationalLand Cover Database for the contermious United States [ JlPhotogramm. Eng. Remote Sens. . 2011 . 77 :858 - 864.

      [3] Guidici D. Clark M L. One - dimensional convolutional neuralnetwork land - cover classification of multiseasonal hyperspec-tral imagery in the San Francisco Bav Area. Califomia [Jl.Remote Sens., 2017.9(6):629.

      [4] 黃健熙,侯矞焯,蘇偉,等.基于GF -1 WFV數(shù)據(jù)的玉米與大豆種植面積提取方法[J].農(nóng)業(yè)工程學(xué)報(bào),2017,33(7):164 -170.

      [5] Topalo g R H, Sertel E. Musao g N.Assessment of classifica-tion accuracies of Sentinel -2 and Landsat -8 data for landcover/use mapping[J]. DOI: 10. 5194/isprs - archives -XLI - B8 - 1055 - 2016.

      [6] Khatami R. Mountrakis G,Stelunan S V.A meta - analvsis ofremote sensing research on supervised pixel - based Iand - cov-er image classification processes: general guidelines for practi-tioners and future research[J]. Remote Sensing of Environ-merit, 2016, 177: 89 - 100.

      [7] Than T N,Kappas M. Comparison of random forest,k- nearestneighbor, and support vector machine classifiers for land coverclassification using Sentinel -2 imagery[J].Sensors. 2018,18(1):18.

      [8] 崔小芳,劉正軍.基于隨機(jī)森林分類方法和多源遙感數(shù)據(jù)的濕地植被精細(xì)分類[J].測(cè)繪與空間地理信息,2018,41(8):113 -116.

      [9] 王利民,劉佳,楊玲波,等.隨機(jī)森林方法在玉米一大豆精細(xì)識(shí)別中的應(yīng)用[J].作物學(xué)報(bào),2018, 44(4):569 -580.

      [10]王娜,李強(qiáng)子,杜鑫,等.單變量特征選擇的蘇北地區(qū)主要農(nóng)作物遙感識(shí)別[J].遙感學(xué)報(bào),2017, 21(4):519 -530.

      [11] 高夢(mèng)婕,姜群鷗,趙一陽,等.基于(F-2遙感影像的塑料大棚提取方法對(duì)比[J].中國農(nóng)業(yè)大學(xué)學(xué)報(bào),2018,23(8):125 -134.

      [12] ESA. Sentinel -2 User Handbooks[M].ESA, 2015.[13] US(.S (2017) Landsat Missions[K/OL]. United States Geo-logical Survey. 2017.

      [14] Martins V S,Barbosa C C F,De Carvalho L A S,et al.As-sessment of atmospheric correction methods for Sentinel -2 MSIimages applied to Amazon Floodplain Lakes[J].Remote Sens-ing,2017,9(4):322.

      [15] Grizonnet M. Michel J,Poughon V,et al.Orfeo TooIBox:open source processing of remote sensing images [J]. OpenGeospatial Data. Software and Standards. 2017(2): 15.

      [16] ESA Sentinel Online. Sentinel -2:Operations Ramp - UpPhase[K/OL]. https://sentinel. esa. int/web/sentinel/mis-sions/sentinel - 2/operations - ramp - up - phase. 2015 -08 - 21.

      [17] Sentinel -2 for Agriculture. The SEN2 - AGRI System: toserve the exploitation of Sentinel -2 for local to national opera-tional agriculture monitoring [K/OL].http://www. esa -sen2agri. org/. 2015 - 09 - 18.

      [18] Breiman L.Random forests[J].Machine Learning, 2001,45:5-32.

      [19] Congalton R G.A review of assessing the accuracv of classifica-tions of remotelv sensed data[J].Remote Sensing of Environ-ment. 1991, 37(1):35 -46.

      猜你喜歡
      隨機(jī)森林時(shí)間序列
      隨機(jī)森林在棉蚜蟲害等級(jí)預(yù)測(cè)中的應(yīng)用
      基于二次隨機(jī)森林的不平衡數(shù)據(jù)分類算法
      軟件(2016年7期)2017-02-07 15:54:01
      拱壩變形監(jiān)測(cè)預(yù)報(bào)的隨機(jī)森林模型及應(yīng)用
      上證綜指收益率的影響因素分析
      基于指數(shù)平滑的電站設(shè)備故障時(shí)間序列預(yù)測(cè)研究
      基于時(shí)間序列的我國人均GDP分析與預(yù)測(cè)
      商(2016年32期)2016-11-24 16:20:57
      基于隨機(jī)森林算法的飛機(jī)發(fā)動(dòng)機(jī)故障診斷方法的研究
      基于線性散列索引的時(shí)間序列查詢方法研究
      軟件工程(2016年8期)2016-10-25 15:43:57
      基于組合模型的能源需求預(yù)測(cè)
      公眾預(yù)期與不良貸款
      商情(2016年11期)2016-04-15 20:25:31
      长武县| 石嘴山市| 华容县| 花垣县| 新河县| 陆川县| 牟定县| 台东县| 盐山县| 凤山市| 元阳县| 定日县| 金阳县| 海阳市| 金山区| 汶川县| 揭西县| 探索| 综艺| 囊谦县| 白玉县| 虎林市| 长丰县| 双江| 泸定县| 瑞金市| 嘉黎县| 临夏市| 天津市| 贺州市| 屏南县| 北流市| 天门市| 博罗县| 汝州市| 长宁县| 巍山| 博白县| 清镇市| 景宁| 鄂尔多斯市|