劉煥軍,張美薇,楊昊軒,張新樂,孟祥添,李厚萱,唐海濤
多光譜遙感結(jié)合隨機(jī)森林算法反演耕作土壤有機(jī)質(zhì)含量
劉煥軍,張美薇,楊昊軒,張新樂※,孟祥添,李厚萱,唐海濤
(東北農(nóng)業(yè)大學(xué)公共管理與法學(xué)院,哈爾濱 150030)
土壤有機(jī)質(zhì)(Soil Organic Matter,SOM)遙感反演一般以單期影像作為輸入量,為研究多時(shí)相影像遙感結(jié)合隨機(jī)森林提高SOM遙感反演精度的可能性,該研究以黑龍江省農(nóng)墾總局勝利農(nóng)場(chǎng)耕地范圍為研究區(qū),以Sentinel-2A和Landsat 8影像作為數(shù)據(jù)源,獲取兩期裸土遙感影像,構(gòu)建光譜指數(shù),以隨機(jī)森林算法篩選波段和光譜指數(shù)作為輸入量,構(gòu)建SOM反演模型。結(jié)果表明:1)兩期影像的SOM反射光譜響應(yīng)波段包括二者共有的中心波長:約560、660、850 nm,以及Sentinel-2A特有的中心波長740 nm 4個(gè)波段;2)基于單期影像最佳波段和光譜指數(shù),Sentinel-2A影像SOM最優(yōu)反演模型2為0.913,均方根誤差為0.860 g/kg,精度高于Landsat 8影像反演模型;3)單期影像最佳波段引入光譜指數(shù),相比以最佳波段作為輸入量,使SOM最優(yōu)反演模型的均方根誤差分別提高了28.867%和8.722%;4)引入時(shí)相信息,基于單期和兩期影像波段和光譜指數(shù),SOM最優(yōu)反演模型精度由高到低為兩期影像(2為0.938,均方根誤差1.329 g/kg)、Sentinel-2A影像(2為0.935,均方根誤差為1.944g/kg)、Landsat 8影像(2為0.922,均方根誤差2.022g/kg),兩期影像SOM最優(yōu)反演模型的穩(wěn)定性和精度略高于單期影像。研究結(jié)果證明了Sentinel-2A影像數(shù)據(jù)以及多時(shí)相裸土影像反演SOM的優(yōu)勢(shì)。
土壤;有機(jī)質(zhì);光譜;隨機(jī)森林;時(shí)相信息;Sentinel-2A;反演精度
土壤有機(jī)質(zhì)(Soil Organic Matter,SOM)是土壤肥力和質(zhì)量的主要決定因素和指標(biāo),與土壤生產(chǎn)力密切相關(guān),因此探測(cè)SOM含量是了解土壤肥力的重要途徑[1-3]。由于土壤光譜反射率與SOM含量呈顯著負(fù)相關(guān)[4-6],因此可以由土壤反射光譜特征的差異來反映SOM含量,并且利用土壤樣點(diǎn)的地表反射率及其數(shù)學(xué)變化,構(gòu)建多種光譜指數(shù),為SOM含量的快速預(yù)測(cè)提供了有效的途徑[7-9]。
地統(tǒng)計(jì)分析法是傳統(tǒng)的SOM空間預(yù)測(cè)與制圖的方法。地統(tǒng)計(jì)學(xué)是基于區(qū)域化變量理論和變異函數(shù)模型,以具有空間相關(guān)性和依賴性在空間分布上既有隨機(jī)性又有結(jié)構(gòu)性的自然現(xiàn)象為研究對(duì)象的科學(xué)[6]。但是其反演精度往往受到樣本密度和樣本變異程度的限制,只有具有足夠數(shù)量和密集的樣本才能獲得準(zhǔn)確的SOM空間分布圖。近年來隨著遙感技術(shù)水平的不斷提高與成熟,由于土壤光譜學(xué)證明了SOM對(duì)反射率光譜具有獨(dú)特的光譜響應(yīng)區(qū)域,這為SOM遙感反演的發(fā)展奠定了基礎(chǔ)。其方法是在研究土壤光譜反射特征的基礎(chǔ)上,通過地面實(shí)測(cè)數(shù)據(jù),分析采樣點(diǎn)的遙感影像光譜反射率的變化,建立SOM反演模型,實(shí)現(xiàn)研究區(qū)域SOM空間預(yù)測(cè)與制圖。而現(xiàn)有的SOM遙感反演研究也多結(jié)合景觀環(huán)境因子作為輔助變量以提高SOM的反演精度。目前,已有很多研究運(yùn)用普通克里格模型[10]、混合克里格模型[11]、多元線性回歸模型[12]、偏最小二乘回歸模型[13-14]、人工神經(jīng)網(wǎng)絡(luò)模型[15-16]等方法進(jìn)行SOM空間預(yù)測(cè)分析與制圖。此外,隨機(jī)森林(Random Forest,RF)算法,它是通過集成學(xué)習(xí)的思想將多棵樹集成的一種算法。RF模型具有較高的預(yù)測(cè)精度,隨機(jī)性的引入,使得RF不容易陷入過擬合,并且具有很好的抗噪聲能力。
目前,將RF算法運(yùn)用到SOM空間預(yù)測(cè)的研究仍在不斷的探索中[17-18],但是已有的相關(guān)研究多基于較大空間分辨率的遙感影像、單期或者未使用影像來探究SOM的預(yù)測(cè)精度。Yang等[19]分別以RF模型和回歸樹模型對(duì)高山生態(tài)系統(tǒng)的SOM進(jìn)行了反演。王茵茵等[20]以榆陽區(qū)的不同地貌區(qū)為例,利用不同空間分辨率Modis遙感影像數(shù)據(jù),運(yùn)用RF算法對(duì)表層SOM進(jìn)行了模擬預(yù)測(cè)。韓杏杏等[21]以河南省輝縣市耕地資源管理單元圖斑中心點(diǎn)為基礎(chǔ)數(shù)據(jù),以土壤類型作為輔助定性變量,利用RF模型預(yù)測(cè)SOM的含量。此外,基于衛(wèi)星遙感的SOM反演研究也多以單幅影像作為輸入量,屈冉等[22]以富川縣為研究區(qū),運(yùn)用單幅Landsat TM影像,分析了光譜亮度值(Digital Number,DN)與SOM之間的回歸關(guān)系。王銳等[23]以Landsat 8遙感影像和SOM實(shí)測(cè)樣本為數(shù)據(jù)源,以重慶市江津區(qū)為研究對(duì)象,采用多元回歸分析的方法,建立SOM反演模型。顧曉鶴等[24]以環(huán)境小衛(wèi)星超光譜影像和SOM實(shí)測(cè)樣本為數(shù)據(jù)源,篩選SOM響應(yīng)的敏感波段與特征組合算法,建立基于HSI影像的SOM反演模型。
現(xiàn)有SOM遙感反演模型研究一般利用單期影像,結(jié)合不同景觀環(huán)境因子作為輸入量,探究其對(duì)SOM反演精度的影響,以及精度的變化。但是由于單期影像可能受降水、秸稈覆蓋、表面形態(tài)等因素影響,影像特征反映的是部分地區(qū)的異常狀況,導(dǎo)致遙感影像部分地區(qū)地物反射率異常,降低SOM反演模型的穩(wěn)定性與精度。為了更好地探究耕地SOM的反演精度,以勝利農(nóng)場(chǎng)裸土?xí)r期耕地為研究對(duì)象,利用遙感衛(wèi)星周期性、動(dòng)態(tài)性地對(duì)地表信息進(jìn)行監(jiān)測(cè),有效地避免單時(shí)相影像所反映地物信息的局限性,采用了較高空間分辨率的Sentinel-2A和Landsat 8衛(wèi)星遙感影像作為數(shù)據(jù)源,基于RF算法,引入多時(shí)相數(shù)據(jù)結(jié)合,構(gòu)建光譜指數(shù),逐步篩選最佳輸入量,建立考慮時(shí)相信息的SOM遙感反演模型,并實(shí)現(xiàn)SOM空間預(yù)測(cè)與制圖。
勝利農(nóng)場(chǎng)是黑龍江省國營農(nóng)場(chǎng),位于饒河縣境內(nèi),地處饒力河下游的沖積平原地帶,中東部山丘起伏。地理坐標(biāo)為:133°34′~134°09′E,47°13′~47°32′N,地勢(shì)整體相對(duì)平坦。研究區(qū)耕地范圍面積約為456.838 hm2,此區(qū)域土壤肥沃,物理結(jié)構(gòu)良好,黑土層在20 cm以上,土壤有機(jī)含量高。年有效積溫2 400 ℃,年降水量590 mm,適宜各類農(nóng)作物生長,以種植水稻、小麥、玉米、大豆為主,作物一年一季。研究區(qū)10月末-11月中旬(未降雪)為裸土期,為遙感提取地表信息提供了有利條件。
本研究所使用的耕地土壤樣本點(diǎn)于2017年11月4日進(jìn)行野外采集,在研究區(qū)范圍內(nèi)進(jìn)行GPS定位,樣本點(diǎn)位置的確定同時(shí)兼顧了地形特征等信息,共計(jì)獲得162個(gè)野外實(shí)測(cè)樣本,并記錄其坐標(biāo)和地形等相關(guān)信息,其空間分布如圖1所示。室內(nèi)將土壤稱量后研磨、風(fēng)干,過2 mm篩,用重鉻酸鉀容量法測(cè)定SOM含量。分析162個(gè)采樣點(diǎn)SOM含量數(shù)據(jù),結(jié)果表明,最小值為27.6 g/kg、最大值為44.4 g/kg、極差為16.8 g/kg、均值為35.73 g/kg、標(biāo)準(zhǔn)差為3.00 g/kg。
分別獲取裸土?xí)r期(2018年11月6日)Sentinel-2A影像(https://code.earthengine.google.com/)和(2017年11月9日)Landsat 8影像(http://ids.ceode.ac.cn/query.html)進(jìn)行SOM反演研究。Sentinel-2A影像為經(jīng)過幾何校正和大氣處理的地表反射率數(shù)據(jù),其中波段1為氣溶膠波段,波段10為反映大氣波段,故在運(yùn)算過程中去除這2個(gè)波段;Landsat 8影像使用ENVI5.1進(jìn)行輻射定標(biāo)、大氣校正(大氣校正后的結(jié)果為擴(kuò)大了10 000倍的地表反射率數(shù)據(jù)),然后將多光譜影像的波段1~7和波段8(15 m分辨率全色波段)融合成分辨率為15 m的影像[25]。又將Sentinel-2A和Landsat 8影像空間重采樣為10 m分辨率(Sentinel-2A通過SNAP完成,Landsat 8通過ENVI完成)。Sentinel-2A 影像的波段2、3、4、8、11、12分別與Landsat 8影像的波段2~7相對(duì)應(yīng),如表1所示,其中Sentinel-2A波段5、6、7為Landsat 8不具有的波段。
圖1 研究區(qū)土壤采樣點(diǎn)分布圖
表1 Sentinel-2A與Landsat 8波段參數(shù)信息
單期影像光譜指數(shù)的構(gòu)建:定義波段反射率為ρ,對(duì)Sentinel-2A和Landsat 8影像數(shù)據(jù)波段反射率進(jìn)行數(shù)學(xué)變換,得到反射率差D(即ρ?ρ),反射率比R(即ρ/ρ),其中,、均為波段的代號(hào)。
多期影像光譜指數(shù)的構(gòu)建方法:不同時(shí)期的相同波段差為D_ρ,不同時(shí)期的相同波段比為R_ρ,不同時(shí)期的某一波段差與另一波段差的差D_ρ,不同時(shí)期的某一波段差與另一波段差的比R_ρ,各光譜指數(shù)具體計(jì)算方法如下:
D-Tn_ρ=D_ρ?D_ρ(1)
R-Tn_ρ=R_ρ/R_ρ(2)
D-Tn_ρ=D_ρ?D_ρ(3)
R-Tn_ρ=D_ρ/D_ρ(4)
式中ρ表示波段反射率;ρ表示波段反射率;表示Sentinel-2A影像的日期;為Landsat 8影像的日期。
RF是由多棵相互沒有關(guān)聯(lián)的決策樹組成的集成決策樹。RF建模通過R語言中的Random Forest包實(shí)現(xiàn)。RF模型涉及的3個(gè)關(guān)鍵參數(shù):決策樹的數(shù)量(ntree),分割節(jié)點(diǎn)的隨機(jī)變量的數(shù)量(mtry),自變量對(duì)SOM影響的重要性(importance)。Random Forest包在運(yùn)算過程中對(duì)影響SOM的自變量重要性進(jìn)行排序,其數(shù)值越大,代表自變量對(duì)SOM影響越大,相關(guān)性越強(qiáng)。RF的預(yù)測(cè)結(jié)果是多棵決策樹集成的結(jié)果,每棵樹在構(gòu)建的過程隨機(jī)且有放回地從訓(xùn)練樣本中抽取2/3的樣本作為訓(xùn)練樣本集(數(shù)量為),基于隨機(jī)樣本構(gòu)建相應(yīng)的決策樹。未被抽取的數(shù)據(jù)構(gòu)成袋外樣本,作為測(cè)試集,然后由袋外樣本做為測(cè)試集計(jì)算袋外誤差,其計(jì)算方法與交叉驗(yàn)證類似,因此,RF模型不需要單獨(dú)再做交叉驗(yàn)證[26-27]。在決策樹的每個(gè)節(jié)點(diǎn)上,隨機(jī)地從總特征維度中抽取個(gè)特征子集作為預(yù)測(cè)變量,每次樹進(jìn)行分裂時(shí),從個(gè)特征中選擇最優(yōu)的,最后匯總所有決策樹的結(jié)果。RF算法可以有效地避免特征之間的多元共線性問題,支持高維度特征,此外,其對(duì)缺失的或非平衡的數(shù)據(jù)也表現(xiàn)出較好的穩(wěn)定性[27-28]?;诔醪降脑囼?yàn)結(jié)果,本研究在RF實(shí)際建模操作中,設(shè)定ntree為800,mtry設(shè)置為輸入量個(gè)數(shù)的1/3,此時(shí)不僅可以產(chǎn)生較穩(wěn)定的袋外誤差率,且數(shù)值也較小,模型較為穩(wěn)定。
本研究SOM預(yù)測(cè)模型最佳輸入量的篩選與精度計(jì)算流程為:1)以單期影像波段反射率作為輸入量,構(gòu)建SOM反演模型。2)采用RF方法得到單期影像波段的重要性排序,分別篩選2期影像的最佳波段,確定最佳波段組合,構(gòu)建SOM反演模型。3)分別以單期影像的最佳波段組合構(gòu)建光譜指數(shù),以最佳波段和光譜指數(shù)作為輸入量,建立SOM反演模型。4)得到單期影像的最佳波段和光譜指數(shù)的重要性排序,為分析引入光譜指數(shù),SOM反演精度的變化,選擇的最終輸入量中應(yīng)包含3種最佳波段組合的波段,故選取前6個(gè)自變量作為最終輸入量,建立SOM反演模型。5)引入時(shí)相信息,為分析兩期影像SOM反演的優(yōu)勢(shì),分別以單期和兩期影像的波段反射率構(gòu)建光譜指數(shù),篩選最佳輸入量,建立SOM反演模型。6)確定最優(yōu)模型,反演SOM。
本研究采用RF算法模型,分別用Sentinel-2A和Landsat 8影像數(shù)據(jù)逐步篩選波段與光譜指數(shù)作為輸入量,進(jìn)行SOM反演建模,其中隨機(jī)選取建模樣本121個(gè),驗(yàn)證樣本41個(gè)。決定系數(shù)(2)[29]用于檢驗(yàn)?zāi)P头€(wěn)定性,2越大,表明模型越穩(wěn)定。均方根誤差(Root Mean Square Error,RMSE)用于衡量模型的精度,RMSE越小,表明模型精度越高。建模集和驗(yàn)證集RMSE分別為RMSEcal和RMSEval[30],其中RMSEval表征模型的預(yù)測(cè)適應(yīng)性,RMSEval越小,模型適應(yīng)性越好。
圖2a為同一時(shí)期不同SOM含量土壤反射光譜特征,圖2b為不同時(shí)期土壤光譜曲線圖。如圖2a所示,當(dāng)SOM含量逐漸上升,光譜曲線整體大致呈下降趨勢(shì),光譜曲線遵循反射率隨SOM增大而降低這一規(guī)律。SOM含量變化時(shí),其中波段3~5(8)差異明顯,差異明顯的波段可以作為SOM響應(yīng)波段。如圖2b所示,光譜曲線在波段5~7(12)差異也較明顯,因此,兩期影像表征的土壤信息更加豐富。
注:橫坐標(biāo)刻度值為Landsat 8波段,刻度值2、3、4、5、6、7對(duì)應(yīng)Sentinel-2A波段為2、3、4、8、11、12。
2.2.1 篩選單期影像最佳波段
以單期影像波段反射率作為輸入量,采用RF方法得到各波段的SOM預(yù)測(cè)重要性排序,如表2所示,Sentinel-2A重要性相對(duì)較高的波段為波段3、8、6、4,Landsat 8為波段4、3、5、6。因此,分別以Sentinel-2A(波段3、6、8)、Sentinel-2A(波段3、4、6、8)、Landsat 8(波段3、4、5)作為用于SOM反演的單期影像最佳波段。
表2 單期影像SOM預(yù)測(cè)模型波段輸入量的重要性
2.2.2 篩選單期影像最終輸入量
以單期影像最佳波段和光譜指數(shù)作為輸入量,得到最佳波段和光譜指數(shù)的SOM預(yù)測(cè)重要性排序,分別選取前6個(gè)自變量作為最終輸入量,Sentinel-2A(波段3,6,8)選?。翰ǘ?、6、8、83、83、86;Sentinel-2A(波段3,4,6,8)選?。翰ǘ?、4、6、8、43、43;Landsat8(波段3,4,5)選?。翰ǘ?、4、5、53、54、43,如表3所示。
表3 單期最佳波段與光譜指數(shù)的重要性排序
2.2.3 篩選引入時(shí)相信息的單雙期影像最佳輸入量
分別以單期和雙期影像的波段反射率構(gòu)建光譜指數(shù),以其作為輸入量,得到各波段與光譜指數(shù)的SOM預(yù)測(cè)重要性排序,篩選最佳輸入量,如表4所示。
表4 單期和雙期影像波段與光譜指數(shù)的重要性
2.3.1 單期影像SOM預(yù)測(cè)結(jié)果
分別基于單期影像波段反射率、最佳波段、最佳波段和光譜指數(shù)、最終輸入量4種不同情況輸入量進(jìn)行運(yùn)算,逐步篩選Sentinel-2A與Landsat 8影像最優(yōu)SOM反演模型(如表5所示)。由表5可知,以波段反射率作為輸入量,Sentinel-2A影像的多波段信息,其SOM反演模型的穩(wěn)定性與精度高于Landsat 8影像。分別以Sentinel-2A(波段3、6、8)、Sentinel-2A(波段3、4、6、8)和Landsat 8(波段3、4、5)最佳波段組合作為輸入量,建立模型的穩(wěn)定性與精度由大到小為Sentinel-2A(波段3、4、6、8)、Landsat 8(波段3、4、5)。表明Sentinel-2A影像數(shù)據(jù)的波段6對(duì)SOM反演精度的提高起到了促進(jìn)作用。并且基于Sentinel-2A(波段3、6、8)篩選最終輸入量所得到的SOM最優(yōu)反演模型的穩(wěn)定性和精度也高于Landsat 8影像。此外,單期影像引入光譜指數(shù)相比只選取最佳波段作為輸入量,使兩期影像的SOM最優(yōu)反演模型的RMSEval分別提高了28.867%和8.722%。
表5 基于不同時(shí)期Sentinel-2A和Landsat 8影像的SOM最優(yōu)反演模型對(duì)比
注:為比值;為差值。下角標(biāo)為波段。
Note:is the ratio;is the difference. The subscript represents the band value.
2.3.2 引入時(shí)相信息的單雙期影像SOM預(yù)測(cè)結(jié)果
由表5可知,引入時(shí)相信息,基于兩期影像的SOM反演最優(yōu)模型2=0.938,RMSEval=1.329 g/kg;Sentinel-2A影像SOM反演最優(yōu)模型2=0.935,RMSEval=1.944 g/kg;Landsat 8影像為2=0.922,RMSEval=2.022 g/kg。兩期影像SOM反演最優(yōu)模型的穩(wěn)定性和精度高于單期影像。
選擇兩期影像的反演模型作為最優(yōu)模型反演SOM(R=0.938,RMSEval=1.329 g/kg)。由于選取的采樣點(diǎn)均為耕地土壤樣本,因此利用耕地邊界范圍對(duì)影像進(jìn)行裁剪,并反演SOM空間分布圖。從SOM遙感反演圖(圖3)可以看出,SOM含量分布差異性較大,勝利農(nóng)場(chǎng)中東部漫川漫崗山丘起伏,SOM含量相比于其他地區(qū)變化較大;西北部地區(qū)旱田SOM含量較水田含量高;西南部與北部地區(qū)地勢(shì)相似,SOM變化相對(duì)較小。
圖3 研究區(qū)SOM遙感反演結(jié)果
本研究采用較高空間分辨率的Sentinel-2A和Landsat 8遙感影像作為數(shù)據(jù)源,引入時(shí)相信息,運(yùn)用RF算法,采用了不同的計(jì)算方式,逐步建立和篩選SOM最優(yōu)反演模型,并且實(shí)現(xiàn)了研究區(qū)SOM的空間制圖。根據(jù)已有的相關(guān)研究表明:SOM在整個(gè)可見光近紅外波段-短波紅外波段(400~2 500 nm)區(qū)光譜比較敏感[31],特別在可見光和近紅外光譜區(qū)有獨(dú)特的光譜反射率響應(yīng)波段,因此能夠利用區(qū)域光譜特征預(yù)測(cè)SOM含量。Liu等[32]認(rèn)為在350~800和1 900 nm附近是估測(cè)SOM的重要波段。盧艷麗等[33-34]發(fā)現(xiàn)東北黑土在545~830 nm光譜范圍內(nèi)SOM含量與原始光譜反射率呈現(xiàn)出顯著的負(fù)相關(guān),并且在580~738 nm光譜范圍內(nèi)達(dá)到了極顯著負(fù)相關(guān)。沙晉明等[35]發(fā)現(xiàn) 8種不同環(huán)境條件下形成的土壤剖面樣品,其 SOM含量與376、676及724 nm波段附近有較高的負(fù)相關(guān)性。綜上,Sentinel-2A與Landsat 8影像篩選的最佳波段的中心波長約為560(波段3)、660(波段4)、850 nm(波段5或8),以及Sentinel-2A特有的中心波長740 nm (波段6)4個(gè)波段,與已有研究SOM的反射光譜響應(yīng)波段相吻合[32-35]。
引入時(shí)相信息,利用研究區(qū)裸土期的兩期影像,建立SOM反演模型。兩期影像SOM最優(yōu)反演模型的穩(wěn)定性和精度要略高于單期影像,原因在于:1)遙感數(shù)據(jù)具有瞬時(shí)性的特點(diǎn),即遙感信息是瞬時(shí)記錄。單期影像體現(xiàn)的是單一時(shí)間地表的特征狀況。2)時(shí)相信息屬于遙感研究對(duì)象的地學(xué)屬性范疇,在遙感的應(yīng)用研究中,要正確的判斷地物及現(xiàn)象,就必須對(duì)研究對(duì)象的地學(xué)屬性以及光譜特性、空間效應(yīng)進(jìn)行深入研究,才能對(duì)遙感數(shù)據(jù)進(jìn)行有效的解譯。因此,單時(shí)相由于受到各種影響因子的作用,此時(shí)遙感數(shù)據(jù)解譯的信息缺乏代表性,從而降低了SOM反演模型的穩(wěn)定性與精度。而引入時(shí)相信息的優(yōu)勢(shì)在于彌補(bǔ)單時(shí)相影像信息表達(dá)的不足,更為全面地提取到影像中地物的共性信息。例如,裸土條件好的影像可以與地塊間影響因子作用不顯著的影像結(jié)合,起到限制影響因子的影響,充分表達(dá)SOM信息的作用;兩期影像也可以通過所構(gòu)建的多期光譜指數(shù)來表征影響因子的作用性,作為模型的考慮因素,達(dá)到削弱影響因子影響的目的,從而提高SOM的反演精度。
選擇雙時(shí)相影像SOM反演模型作為最優(yōu)模型,RMSEcal(1.372 g/kg)與RMSEval(1.329 g/kg)差異相對(duì)較小,RMSEval更小,說明模型得穩(wěn)定性與適應(yīng)性較好,也表明采樣點(diǎn)的選取較為有代表性,可達(dá)到SOM快速檢測(cè)的要求。相比單時(shí)相,雙時(shí)相影像數(shù)據(jù)建立SOM反演模型的RMSEcal與RMSEval更為接近,建模的穩(wěn)定性與適應(yīng)性更好。因此,進(jìn)一步證明了多時(shí)相SOM反演的優(yōu)勢(shì)性。
本研究基于Sentinel-2A和Landsat 8影像數(shù)據(jù),運(yùn)用RF算法,引入兩期影像信息,逐步篩選最佳輸入量,對(duì)區(qū)域SOM含量進(jìn)行預(yù)測(cè),分析SOM反演精度的差異,得到如下結(jié)論:
1)Sentinel-2A影像的多波段,并且最佳波段包含波段6,其中心波長為740 nm,為SOM反射光譜響應(yīng)波段信息,有利于提高SOM預(yù)測(cè)精度,故Sentinel-2A影像數(shù)據(jù)建立的SOM遙感反演模型穩(wěn)定性與精度高于Landsat 8影像數(shù)據(jù)。
2)通過構(gòu)建光譜指數(shù)作為輸入量,使單期影像的SOM反演精度有所提高,為運(yùn)用RF算法進(jìn)行SOM反演提供了更有效的輸入量。
3)引入時(shí)相信息,可以彌補(bǔ)單時(shí)相影像信息的不足,表征的土壤信息更加豐富,充分的表達(dá)SOM信息,從而提高SOM的反演精度?;趦善谟跋駱?gòu)建光譜指數(shù),篩選最佳輸入量,建立的SOM反演最優(yōu)模型,穩(wěn)定性和精度高于單期影像。
研究成果為提高SOM等土壤理化參數(shù)遙感反演模型精度提供參考。
[1]Lal R. Soil organic dynamics in cropland and rangeland[J]. Environmental Pollution, 2002, 116(30): 353-362.
[2]Zong Zhengliang, Chen Songchao, Yang Yuanyuan, et al. National digital soil map of organic matter in topsoil and its associated uncertainty in 1980's China[J]. Geoderma, 2019, 335: 47-56.
[3]劉煥軍,趙春江,王紀(jì)華,等. 黑土典型區(qū)土壤有機(jī)質(zhì)遙感反演[J]. 農(nóng)業(yè)工程學(xué)報(bào),2011,27(8):211-215.
Liu Huanjun, Zhao Chunjiang, Wang Jihua, et al. Technologies of predictive mapping for soil organic matter[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2011, 27(8): 211-215. (in Chinese with English abstract)
[4]McCarty G W, Reeves J B, Reeves V B, et al. Mid-infrared and Near-infrared diffuse reflectance spectroscopy for soil carbon measurement[J]. Soil Science Society of America Journal, 2002, 66(2): 640-646.
[5]Behrens T, Schmidt K, Ramirez-Lopez L, et al. Hyper-scale digital soil mapping and soil formation analysis[J]. Geoderma, 2014, 213: 578-588.
[6]Sullivan D G, Shaw J N, Rickman D. IKONOS imagery to estimate surface soil property variability in two Alabama Physiographies[J]. Soil Science Society of America Journal, 2005, 29: 1789-1798.
[7]劉煥軍,張柏,趙軍,等. 黑土有機(jī)質(zhì)含量高光譜模型研究[J]. 土壤學(xué)報(bào),2007,44(1):27-32.
Liu Huanjun, Zhang Bai, Zhao Jun, et al. Spectral modelfor prediction of organic matter in black soil[J]. Acta Pedologica Sinica, 2007, 44(1): 27-32. (in Chinese with English abstract)
[8]Volkan Bilgili A, Van Es H M, Akbas F, et al. Visible-near infrared reflectance spectroscopy for assessment of soil properties in a semi-arid area of Turkey[J]. Journal of Arid Environments, 2010, 74(2):229-238.
[9]Summers D, Lewis M, Ostendorf B, et al. Visible near-infrared reflectance spectroscopy as a predictive indicator of soil properties[J]. Ecological Indicators, 2011, 11(1): 123-131.
[10]吳才武,張?jiān)聟?,夏建? 基于地統(tǒng)計(jì)與遙感反演相結(jié)合的有機(jī)質(zhì)預(yù)測(cè)制圖研究[J]. 土壤學(xué)報(bào),2016,53(6):1568-1575.
Wu Caiwu, Zhang Yuecong, Xia Jianxin. Prediction and mapping of soil organic matter based on geostatistics andremote sensing inversion[J]. Acta Pedologica Sinica, 2016, 53(6): 1568-1575. (in Chinese with English abstract)
[11]劉煥軍,謝雅慧,潘越,等. 黑土區(qū)田塊土壤有機(jī)質(zhì)空間分異及分布研究[J]. 土壤通報(bào),2018,49(6):1445-1451.
Liu Huanjun, Xie Yahui, Pan Yue, et al. Spatial variability and distribution of soil organic matter in black soil areaat the field scale[J]. Chinese Journal of Soil Science, 2018, 49(6): 1445-1451. (in Chinese with English abstract)
[12]張新樂,竇欣,謝雅慧,等. 引入時(shí)相信息的耕地土壤有機(jī)質(zhì)遙感反演模型[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2018, 34(4): 143-150.
Zhang Xinle, Dou Xin, Xie Yahui, et al. Remote sensing inversion model of soil organic matter in farmland by introducing temporal information[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(4): 143-150. (in Chinese with English abstract)
[13]張征立,第丹丹,蕭王文,等. 應(yīng)用微型近紅外光譜儀快速檢測(cè)桑園土壤有機(jī)質(zhì)含量的方法[J]. 蠶業(yè)科學(xué),2018,44(6):923-928.
Zhang Zhengli, Di Dandan, Xiao Wangwen, et al. Rapid determination of soil organic matter in mulberry field by micro near infrared spectrometer[J]. Science of Sericulture, 2018, 44(6): 923-928. (in Chinese with English abstract)
[14]武彥清,張柏,宋開山,等. 松嫩平原土壤有機(jī)質(zhì)含量高光譜反演研究[J]. 中國科學(xué)院研究生院學(xué)報(bào),2011,28(2):187-194.
Wu Yanqing,Zhang Bai,Song Kaishan,et al. Retrieval of soil organic matter content from hyper-spectra in Songnen Plain[J]. Journal of the Graduate School of the Chinese Academy of Sciences, 2011, 28(2): 187-194. (in Chinese with English abstract)
[15]Ayoubi S, Shahri A P, Karchegani P M, et al. Application of Artificial Neural Network (ANN) to predict soil organic matter using remote sensing data in two ecosystems[M]// Biomass and Remote Sensing of Biomass. Philippines: InTech, 2011: 181-196.
[16]沈潤平,丁國香,魏國栓,等. 基于人工神經(jīng)網(wǎng)絡(luò)的土壤有機(jī)質(zhì)含量高光譜反演[J]. 土壤學(xué)報(bào),2009,46(3):391-397.
Shen Runping, Ding Guoxiang, Wei Guoshuan, et al. Retrieval of soil organic matter content from hyper-spectrum based on ANN[J]. Acta Pedologica Sinica, 2009, 46(3): 391-397. (in Chinese with English abstract)
[17]Guo P T, Li M F, Luo W, et al. Digital mapping of soil organic matter for rubber plantation at regional scale: An application of random forest plus residuals kriging approach[J]. Geoderma, 2015, 237/238: 49-59.
[18]郭澎濤,李茂芬,羅微,等. 基于多源環(huán)境變量和隨機(jī)森林的橡膠園土壤全氮含量預(yù)測(cè)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2015,31(5):194-202.
Guo Pengtao, Li Maofen, Luo Wei, et al. Prediction of soil total nitrogen for rubber plantation at regional scale based on environmental variables and random forest approach[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(5): 194-202. (in Chinese with English abstract)
[19]Yang R M, Zhang G L, Liu F, et al. Comparison of boosted regression tree and random forest models for mapping top soil organic carbon concentration in an alpine ecosystem[J]. Ecological Indicators, 2016, 60: 870-878.
[20]王茵茵,齊雁冰,陳洋,等. 基于多分辨率遙感數(shù)據(jù)與隨機(jī)森林算法的土壤有機(jī)質(zhì)預(yù)測(cè)研究[J]. 土壤學(xué)報(bào),2016,53(2):342-354.
Wang Yinyin, Qi Yanbing, Chen Yang, et al. Prediction of soil organic matter based on multi-resolution remote sensing data and random forest algorithm[J]. Acta Pedologica Sinica,2016, 53(2): 342-354. (in Chinese with English abstract)
[21]韓杏杏,陳杰,王海洋,等. 基于隨機(jī)森林模型的耕地表層土壤有機(jī)質(zhì)含量空間預(yù)測(cè):以河南省輝縣市為例[J]. 土壤,2019,5(1):152-159.
Han Xingxing, Chen Jie, Wang Haiyang, et al. Spatial prediction of SOM content in topsoil based on random forest algorithm: A case study of huixian city, henan province: taking huixian City, Henan Province as anexample[J]. Soils, 2019, 51(1): 152-159. (in Chinese with English abstract)
[22]屈冉,張雅瓊,聶憶黃,等. 基于多光譜遙感影像的富川縣表層土壤有機(jī)質(zhì)含量反演[J]. 環(huán)境與可持續(xù)發(fā)展,2019,44(1):154-157.
Qu Ran, Zhang Yaqiong, Nie Yihuang, et al. Inversionsurface soil organic matter content in Fuchuan county based on multi-spectral remote sensing image[J]. Environment and Sustainable Development,2019, 44(1): 154-157. (in Chinese with English abstract)
[23]王銳,蔡朕. 基于多光譜遙感的耕地土壤有機(jī)質(zhì)定量反演[J]. 農(nóng)業(yè)工程,2018,8(11):85-89.
Wang Rui, Cai Lian. Quantitative inversion of soil organic matter in cultivated land based on multi spectral remote sensing[J]. Agricultural Engineering, 2018, 8(11): 85-89. (in Chinese with English abstract)
[24]顧曉鶴,王堃,潘瑜春,等. 基于HJ1A-HSI超光譜影像的耕地有機(jī)質(zhì)遙感定量反演[J]. 地理與地理信息科學(xué),2011,27(6):69-73.
Gu Xiaohe, Wang Kun, Pan Yuchun, et al. Remote sensing quantitative inversion of farmland organic matter based on HJ1A-HSI hyperspectral image[J]. Geography and Geo-Information Science, 2011, 27(6): 69-73. (in Chinese with English abstract)
[25]翁永玲,田慶久. 遙感數(shù)據(jù)融合方法分析與評(píng)價(jià)綜述[J]. 遙感信息,2003(3):49-54.
Weng Yongling, Tian Qingjiu. Analysis and evaluation of method on remote sensing data fusion[J]. Remote Sensing Information, 2003(3): 49-54. (in Chinese with English abstract)
[26]張海陽,齊俊傳,毛健. 基于R語言的數(shù)據(jù)挖掘算法研究[J]. 電腦知識(shí)與技術(shù),2016,12(28):16-19.
Zhang Haiyang, Qi Junchuan, Mao Jian. Research on data mining algorithm based on R language[J]. Computer Knowledge and Technology, 2016, 12(28): 16-19. (in Chinese with English abstract)
[27]李欣海. 隨機(jī)森林模型在分類與回歸分析中的應(yīng)用[J]. 應(yīng)用昆蟲學(xué)報(bào),2013,50(4):1190-1197.
Li Xinhai.Usingrandom forestfor classification and regression[J]. Journal of Applied Entomology, 2013, 50(4): 1190-1197. (in Chinese with English abstract)
[28]張雷,王琳琳,張旭東,等. 隨機(jī)森林算法基本思想及其在生態(tài)學(xué)中的應(yīng)用:以云南松分布模擬為例[J]. 生態(tài)學(xué)報(bào),2014,34(3):650-659.
Zhang Lei, Wang Linlin, Zhang Xudong et al. The basic principle of random forest and its applications in ecology: A casestudy of Pinus yunnanensis[J]. Acta Ecologica Sinica, 2014, 34(3): 650-659. (in Chinese with English abstract)
[29]Bin Wang, Cathy Waters, Susan Orgill, et al. High resolution mapping of soil organic carbon stocks using remote sensing variables in the semi-arid rangelands of eastern Australia[J].Science of the Total Environment, 2018, 630: 367-378.
[30]Rudiyanto, Budiman Minasny, Budi Indra Setiawan, et al. Open digital mapping as acost-effective method for mapping peat thickness and assessing the carbon stock of tropical peatlands[J]. Geoderma, 2018, 313:25-40.
[31]Zhang G, Ryu D, Jiao C, et al. Estimation of organic matter content in coastal soil using reflectance spectroscopy[J].Pedosphere, 2016, 26(1):130-136.
[32]Liu Y, Jiang Q, Fei T, et al. Transferability of a visible and near-infrared model for soil organic matter estimation in riparian landscapes[J]. Remote Sensing, 2014, 6(5): 4305-4322.
[33]盧艷麗,白由路,楊俐蘋,等. 東北平原不同類型土壤有機(jī)質(zhì)含量高光譜反演模型同質(zhì)性研究[J]. 植物營養(yǎng)與肥料學(xué)報(bào),2011,17(2):456-463.
Lu Yanli, Bai Youlu, Yang Liping, et al. Homogeneity of retrieval models for soil organic matter of different soil types in Northeast Plain using hyperspctral data[J]. Journal of Plant Nutrition and Fertilizer, 2011, 17(2): 456-463. (in Chinese with English abstract)
[34]劉煥軍,張柏,王宗明,等. 基于反射光譜特征的土壤鹽堿化評(píng)價(jià)[J]. 紅外與毫米波學(xué)報(bào),2008,27(2):138-142.
Liu Huanjun, Zhang Bai, Wang Zongming, et al. Soil salinization evaluation based on spectral reflectance characteristics[J]. Journal of Infrared and Millimeter Waves, 2008, 27(2): 138-142. (in Chinese with English abstract)
[35]沙晉明,陳鵬程,陳松林. 土壤有機(jī)質(zhì)光譜響應(yīng)特性研究[J].水土保持研究,2003,10(2):21-24.
Sha Jinming, Chen Pengcheng, Chen Songlin, et al. Characteristics analysis of soil spectrum response resulted from organic material[J]. Research of Soil and Water Conservation, 2003, 10(2): 21-24. (in Chinese with English abstract)
Invertion of cultivated soil organic matter content combining multi-spectral remote sensing and random forest algorithm
Liu Huanjun, Zhang Meiwei, Yang Haoxuan, Zhang Xinle※, Meng Xiangtian, Li Houxuan, Tang Haitao
(,150030,)
Soil organic matter (SOM) inversion based on remote sensing generally uses single-date images as input. In order to explore the possibility of multi-spectral remote sensing with random forest to improve the accuracy of SOM inversion, this study was carried out in the cultivated land of Shengli Farm in Heilongjiang Province (133°34′-134°09′E, 47°13′-47°32′N). The Sentinel-2A and Landsat 8 images from the bare soil period were chosen as the main data sources, and were used for calculating spectral index. Random forest algorithm was used to select spectral bands and spectral index as the input variables and thus to build SOM inversion model. Results showed that: 1) the SOM spectral response band for both Sentinel-2A and Landsat 8 included the central wavelength: about 560, 660, 850 nm, and additional 740 nm of Sentinel-2A; 2) the performance of the optimal SOM inversion model, using predictors of the optimal band and spectral index in the single date from Sentinel-2A image, was well with the2of 0.913 and RMSEval (root mean square error for validation data) of 0.860 kg/kg, which presented better results on accuracy and stability than that of Landsat 8 image; 3) the SOM inversion accuracies using the spectral indices from Sentinel-2A and Landsat 8 images were increased by 28.87% and 8.72%, respectively compared to that using the optimal bands as input; 4) the accuracies of the inversion model based on single and double-dates bands and the spectral indices were as following: double-date images (2was 0.938, RMSEval was 1.329 kg/kg), Sentinel-2A image (2was 0.935, RMSEval was 1.944 kg/kg), Landsat 8 image (2was 0.922, RMSEval was 2.022 kg/kg). The stability and accuracy of the SOM optimal inversion model for double-date images was higher than that for single-date image. Red-edge band of Sentinel-2A image provided the optimal band information for the SOM inversion because its wavelength range was within the spectral response wavelength range of SOM, which was beneficial to enhance inversion accuracy. In conclusion, by applying random forest algorithm and remote sensing data and introducing spectral indices into the input, the SOM inversion accuracy could be improved and the predicted SOM map could better characterize the spatial distribution of SOM content. The results of this study proved the advantages of Sentinel-2A images and multi-temporal images in the bare soil period for SOM inversion, andcan provide effective methods for improving the precision of remote sensing inversion model of soil physical and chemical parameters such as SOM.
soils; organic matter; spectra; random forest; temporal information; Sentinel-2A; inversion accuracy
劉煥軍,張美薇,楊昊軒,等. 多光譜遙感結(jié)合隨機(jī)森林算法反演耕作土壤有機(jī)質(zhì)含量[J]. 農(nóng)業(yè)工程學(xué)報(bào),2020,36(10):134-140.doi:10.11975/j.issn.1002-6819.2020.10.016 http://www.tcsae.org
Liu Huanjun, Zhang Meiwei, Yang Haoxuan, et al. Invertion of cultivated soil organic matter content combining multi-spectral remote sensing and random forest algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(10): 134-140. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2020.10.016 http://www.tcsae.org
2020-01-03
2020-05-10
國家重點(diǎn)研發(fā)計(jì)劃(2017YFD0201803);黑龍江省自然基金(D2017001)
劉煥軍,博士,教授、研究員,主要研究方向?yàn)檗r(nóng)業(yè)遙感。Email:liuhuanjun@neigae.ac.com
張新樂,博士,副教授,主要研究方向?yàn)樯鷳B(tài)遙感。Email:xinlezhang@yeah.net
10.11975/j.issn.1002-6819.2020.10.016
S153.6+21; S127
A
1002-6819(2020)-10-0134-07