牛芳鵬,李新國*,靳萬貴,趙 慧,麥麥提吐爾遜·艾則孜
(1.新疆師范大學(xué)地理科學(xué)與旅游學(xué)院,新疆 烏魯木齊 830054;2.新疆干旱區(qū)湖泊環(huán)境與資源重點實驗室,新疆 烏魯木齊 830054)
土壤有機質(zhì)(SOM)是衡量干旱區(qū)綠洲農(nóng)林業(yè)與土壤生態(tài)系統(tǒng)平衡的關(guān)鍵參數(shù),是改善區(qū)域土地荒漠化、土壤鹽堿化和草場退化等環(huán)境問題的關(guān)鍵因子[1-2]。高光譜遙感的出現(xiàn)在土壤有機質(zhì)含量的估算以及土壤環(huán)境的檢測方面提供了強有力的技術(shù)手段,可以低成本、高效率的快速掌握該區(qū)域土壤理化性質(zhì)及其動態(tài)變化過程[3-4]。在土壤有機質(zhì)含量與光譜反射率反演模型上國內(nèi)外眾多學(xué)者進行了大量研究[5-8]。Liu等[9]選用混合土地利用類型的土壤樣本進行土壤有機質(zhì)預(yù)測,發(fā)現(xiàn)在350~800和1900 nm附近的波長對土壤有機質(zhì)估算有重要意義,且在350~1000 nm波段土壤光譜反射率在每個波長上都不是線性相關(guān)的。王延倉等[10]發(fā)現(xiàn)采用光譜變換方法與連續(xù)小波耦合可提升土壤光譜反射率對土壤有機質(zhì)的敏感性;Chen等[1]研究香格里拉森林土壤有機質(zhì)含量的最優(yōu)高光譜估算模型,結(jié)果表明土壤粒徑與光譜反射率呈負相關(guān)關(guān)系,土壤粒徑越小光譜反射率越明顯,且一階微分變換可顯著增強土壤有機質(zhì)的光譜信息。于雷等[11]以江漢平原公安縣為研究區(qū),通過對多種模型精度的比較發(fā)現(xiàn)原始光譜反射率經(jīng)連續(xù)統(tǒng)去除后建立的土壤有機質(zhì)高光譜偏最小二乘回歸(PLSR)預(yù)測模型效果最優(yōu),驗證集決定系數(shù)(R2)達0.84。石樸杰等[12]探討農(nóng)田土壤有機質(zhì)含量時發(fā)現(xiàn)光譜數(shù)據(jù)經(jīng)矢量歸一化校正和一階微分變換后,構(gòu)建的PLSR模型預(yù)測效果顯著,決定系數(shù)為0.91。林鵬達等[13]運用多元逐步回歸(MSR)與PLSR方法構(gòu)建黑土土壤有機質(zhì)高光譜估算模型,建模效果均顯著,R2≥0.75,均方根誤差(RMSE)≤0.25。土壤光譜反射率與土壤理化性質(zhì)有著緊密的聯(lián)系。呂雄杰等[14]對自然條件下不同水分含量黃棕壤光譜特征進行了研究,試驗結(jié)果表明在可見光部分(460~710 nm),土壤含水量與光譜反射率相關(guān)性差,而在紅外部分(760~1650 nm)土壤含水量與光譜反射率達到極顯著負相關(guān)。沙晉明等[15]對8種不同環(huán)境條件下形成的土壤剖面進行光譜測量,發(fā)現(xiàn)土壤有機質(zhì)與376、676及724 nm波段附近有較強的負相關(guān)性。國內(nèi)關(guān)于荒漠[16-17]、平原[18-19]、煤礦區(qū)[20-21]等研究較多,干旱區(qū)湖濱綠洲土壤有機質(zhì)含量高光譜估算模型的研究鮮有報道。以博斯騰湖西岸湖濱綠洲為研究區(qū),對采集的115個土樣進行土壤有機質(zhì)含量的試驗測量,并通過對光譜反射率進行5種不同形式的變換和預(yù)處理優(yōu)化方法選取特征光譜波段,對比分析MSR與PLSR兩種方法,構(gòu)建土壤有機質(zhì)含量的高光譜估算模型,以期為干旱區(qū)湖濱綠洲土壤有機質(zhì)含量快速估算提供一種方法。
博斯騰湖西岸湖濱綠洲行政規(guī)劃上屬于新疆博湖縣,位于焉耆盆地東南面,開都河下游,是典型的山前湖泊綠洲,地勢由西北向東南傾斜;研究區(qū)夏季干旱少雨,蒸發(fā)強烈;冬季寒冷干燥,年均降水量83.55 mm,年均溫8.0~8.6℃,季節(jié)過渡快,屬于大陸性荒漠氣候;主要土壤類型有綠洲潮土、扇緣典型鹽土、山地棕色荒漠等;區(qū)域土壤有機質(zhì)含量較低,主要分布在10.00~20.00 g·kg-1之間,耕地土壤有機質(zhì)含量平均為17.70 g·kg-1[22]。根據(jù)研究區(qū)的主要土地利用類型、植被覆蓋類型和微地形等因素,采樣區(qū)的范圍為200 m×200 m。
土樣采集按照蛇形法線路隨機布點,采樣時間為2019年5月3日,在每個樣區(qū)采用GPS記錄每一樣點經(jīng)緯度坐標與高程數(shù)據(jù);在樣區(qū)布設(shè)23個土壤剖面,并進一步分成不同深度(0~10、10~20、20~30、30~40與40~50 cm)取樣,每一層分三點取樣混勻后采用四分法取0.5 kg土壤,共計115個樣品。將土樣帶回實驗室經(jīng)自然風(fēng)干后進行物理碾磨過0.25 mm篩,分為兩份,其中一份用重鉻酸鉀容量法-外加熱法測定土壤有機質(zhì)含量,單位為g·kg-1;另一份用作測試室外土壤高光譜數(shù)據(jù)[23]。
土壤光譜數(shù)據(jù)測量通過ASD FieldSpec 3地物光譜儀于室外晴朗天氣下測定,光譜波長為350~2500 nm,采集時間為12:00~14:00;光纖探頭視場角為25°,垂直于土樣表面約15 cm處,對每個土樣重復(fù)測試15次光譜曲線并記錄存檔;去除光譜反射率大于1的異常值后作均值化處理,得到該土壤樣品的實際光譜反射率數(shù)據(jù)。為減少采集過程中高頻噪音對光譜信息的隱藏,提升光譜數(shù)據(jù)信噪比,運用Origin軟件對光譜曲線進行Savitzky-Golay平滑處理[24];由于環(huán)境不可控因素,所有光譜曲線統(tǒng)一去除噪聲較大的尾部波段(2451~2500 nm)以及受環(huán)境水汽影響較大的1300~1450和1800~1950 nm波 段[25];并 對去除后原始光譜曲線分別進行一階微分(R′)、倒數(shù)的一階微分(1/R)′、連續(xù)統(tǒng)去除(Rcr)、對數(shù)的一階微分(lgR) ′、倒數(shù)的對數(shù)一階微分(lg1/R)′5種光譜變換。
采用Kennard-Stone(K-S)算法選擇80個土樣作為建模樣本集,剩余的35個樣本作為驗證樣本集[26]。以變換后的5種光譜敏感波段為自變量,實測的土壤有機質(zhì)含量數(shù)據(jù)為因變量,運用Matlab軟件完成MSR模型與PLSR模型的建立。模型精度的檢驗選用決定系數(shù)、均方根誤差、驗證集相對分析誤差(RPD)和統(tǒng)計量F進行,其中決定系數(shù)的取值范圍為0.00~1.00,當(dāng)決定系數(shù)越大、均方根誤差越小、統(tǒng)計量F>Fα?xí)r模型的擬合程度越高,估算方程越顯著;當(dāng)RPD≥2.00時,模型非常成功;當(dāng)1.40≤RPD≤2.00時,模型較為成功;當(dāng)RPD<1.40時,模型不可靠[27]。
由表1可知,研究區(qū)土壤有機質(zhì)含量變化范圍為5.09~44.00 g·kg-1,平均值為16.87 g·kg-1;樣本總集變異系數(shù)為44.69%,說明研究區(qū)土壤有機質(zhì)含量呈中等變異,樣本的離散程度較高。訓(xùn)練樣本變異系數(shù)為47.02%,驗證樣本變異系數(shù)為37.61%,與樣本總集相近,用于模型的構(gòu)建具有一定的普適性和代表性。由表2可知,在0~10 cm土壤中有機質(zhì)含量平均值最高,為19.84 g·kg-1,變異系數(shù)為39.69%;40~50 cm土壤中有機質(zhì)含量平均值最低,為14.40 g·kg-1,變異系數(shù)最高,為57.53%;20~30 cm土壤中有機質(zhì)含量變異系數(shù)最低,為36.10%;0~50 cm土層中土壤有機質(zhì)含量隨著土壤深度的增加而逐漸減小,土壤有機質(zhì)含量平均值最大相差5.44 g·kg-1。
表1 土壤有機質(zhì)含量統(tǒng)計特征
表2 研究區(qū)剖面土壤中有機質(zhì)的含量
由圖2a可知,在0~50 cm土層中,隨著土層深度的增加土壤有機質(zhì)含量的反射率逐漸升高,40~50 cm土層土壤有機質(zhì)反射率最高,0~10 cm土層土壤有機質(zhì)反射率最低,在775、1150、2240 nm波段存在較明顯的吸收谷。根據(jù)研究區(qū)土壤有機質(zhì)含量的狀況,結(jié)合前人研究成果,采用K-means聚類分析方法將土壤有機質(zhì)含量劃分為<11.49、12.03~17.66、17.88~26.66、>29.04 g·kg-14類,獲得4種不同土壤有機質(zhì)含量的平均光譜曲線[28]。從圖2b可知,4類光譜曲線形狀變化基本一致,在400~2135 nm波段反射率與波長呈正相關(guān),光譜反射率隨波長升高而增強,在2135 nm波段之后反射率逐漸減弱,與波長呈負相關(guān)關(guān)系;在可見光波段(400~780 nm)波譜曲線上升速度加快,在短波近紅外及部分長波近紅外波段(780~1300 nm)上升相對緩慢。有機質(zhì)含量越高,光譜反射率越低,在400~1750 nm波段變化較明顯[29]。當(dāng)有機質(zhì)含量<11.49 g·kg-1時,其反射率均值為0.36;當(dāng)有機質(zhì)含量在12.03~17.66 g·kg-1時,其反射率均值為0.34;有機質(zhì)含量在17.88~26.66 g·kg-1時,其反射率均值為0.33;當(dāng)有機質(zhì)含量>29.04 g·kg-1時,其反射率均值為0.30。
將土壤有機質(zhì)含量分別與變換后的5種光譜數(shù)據(jù)進行相關(guān)性分析,并選擇通過顯著性檢驗(P<0.01)的波段作為敏感波段用于模型構(gòu)建。由圖3可知,土壤有機質(zhì)含量與原始光譜反射率R表現(xiàn)為單一負相關(guān)性,通過極顯著性檢驗(P<0.01)的波段數(shù)有658個,主要集中在448~1300與1489~1614 nm波段,相 關(guān) 系 數(shù)0.09<|r|<0.42,在760 nm波段相關(guān)性最高;通過微分變換后反射率曲線呈正負波動,放大了原始光譜曲線的細微變化,反射率一階微分R′與土壤有機質(zhì)含量在400~504、664~891和1025~1092 nm波段相關(guān)性較高,相關(guān)系數(shù)r最大為0.46,通過極顯著性檢驗(P<0.01)的波段數(shù)有423個;連續(xù)統(tǒng)去除(Rcr)通過極顯著性檢驗(P<0.01)的波段數(shù)明顯減少,僅有242個,且相關(guān)性的連續(xù)性較差,呈極顯著相關(guān)性(P<0.01)的波段主要在404~440、458~551、601~687和758~813 nm;反射率倒數(shù)一階微分(1/R)′與土壤有機質(zhì)含 量 在444~906、1003~1093、1171~1297和1541~1646 nm波段范圍內(nèi)相關(guān)性較高,相關(guān)系數(shù)|r|最大為0.50,相關(guān)性比原始反射率R提高了19.05%,通過極顯著性檢驗(P<0.01)的波段數(shù)有745個;光譜反射率(lgR)′和(lg1/R)′與土壤有機質(zhì)含量通過極顯著性檢驗(P<0.01)的波段數(shù)分別有556、657個,且都主要集中在590~756、770~892、1003~1092與1223~1291 nm波段,相關(guān)系數(shù)|r|最大值均為0.49,且都主要集中在676 nm左右。綜合分析,不同光譜變換下的最佳顯著性波段主要集中在590~687、758~892、1003~1092和1171~1297 nm波段。
2.4.1 多元逐步回歸模型
由表3可知,基于5種變換形式建模的決定系數(shù)在0.41~0.68之間,均方根誤差在6.55~8.77 g·kg-1之間,建模精度較差。其中以(lgR)′建模決定系數(shù)最高,Rcr模型次之,決定系數(shù)分別為0.68、0.65;(1/R)′建模效果最差,決定系數(shù)為0.41。從圖4可知,(lgR)′模型驗證集決定系數(shù)為0.66,預(yù)測效果最好,均方根誤差為4.65 g·kg-1,統(tǒng)計量F達56.19,其次為Rcr、R′模型,驗證集決定系數(shù)依次為0.63、0.61,均方根誤差依次為3.06、3.55 g·kg-1。R′模型驗證集決定系數(shù)大于建模集決定系數(shù),存在不穩(wěn)定性,總體來說,在MSR模型中經(jīng)(lgR)′、Rcr變換下的土壤有機質(zhì)含量估算模型精度較好。
表3 土壤有機質(zhì)含量多元逐步回歸模型構(gòu)建
2.4.2 偏最小二乘回歸模型
由表4可知,5種變換光譜建立的PLSE模型較MSR模型的決定系數(shù)均有所提高,分別增長了15.52%、26.15%、65.85%、22.06%、48.84%,均方根誤差分別降低了32.70%、24.43%、35.76%、47.99%、32.84%;5種光譜變換形式的PLSE模型預(yù)測能力排序為(lgR)′>Rcr>(1/R)′>R′>(lg1/R)′,其中(lgR)′模型的建模集決定系數(shù)最高,均方根誤差最小,分別為0.83和4.01 g·kg-1;(lg1/R)′的建模決定系數(shù)最低,為0.64,均方根誤差最大,為5.89 g·kg-1。由圖5可知,(lg1/R)′、R′的驗證樣品分布較散,偏離1∶1線程度較大,均方根誤差分別為4.12、3.86 g·kg-1;Rcr、(1/R)′與(lgR)′模型驗證樣品在1∶1線偏離程度較低,決定系數(shù)均大于0.75,相對分析誤差均大于1.40,其中以(lgR)′模型驗證效果最好,誤差最小,決定系數(shù)為0.82,均方根誤差為2.64 g·kg-1,相對分析誤差為2.30,統(tǒng)計值F為116.41。
對比采用MSR、PLSR兩種方法建立的10個數(shù)學(xué)模型,可知對數(shù)一階微分(lgR)′變化下模型效果均高于其它變換形式,且基于(lgR)′變換下PLSE模型建模集與驗證集決定系數(shù)分別高于MSR模型22.06%、24.24%,建模集與驗證集的均方根誤差分別低于MSR模型47.99%、43.23%,表明選用(lgR)′變換下的特征波段所建立的PLSR模型可以更好地實現(xiàn)研究區(qū)土壤有機質(zhì)含量的估算。
表4 土壤有機質(zhì)含量偏最小二乘回歸模型構(gòu)建
研究表明,隨著土層深度的增加土壤有機質(zhì)含量的反射率逐漸升高,且土壤有機質(zhì)含量越高光譜反射率越低,在不同深度、不同有機質(zhì)含量下土壤有機質(zhì)光譜曲線變化趨勢一致[30]。本研究通過樣區(qū)采集剖面土樣115個,主要分析了湖濱綠洲土壤有機質(zhì)含量的高光譜曲線特征,并構(gòu)建湖濱綠洲土壤有機質(zhì)含量的高光譜估算模型,結(jié)果表明,最優(yōu)模型決定系數(shù)為0.83,比林鵬達等[13]、南鋒等[21]、方少文等[31]最優(yōu)模型決定系數(shù)分別低0.14、0.12、0.07,高于喬娟峰等[32]模型決定系數(shù)0.04,表明選用PLSE方法建模效果較一致。土壤光譜反射率能夠綜合反映土壤內(nèi)在理化性質(zhì),不同區(qū)域土壤因其理化特性的差異,土壤有機質(zhì)光譜的響應(yīng)波段也不同[33-34]。有機物、含水量和土壤質(zhì)地是影響土壤光譜反射率的主要因素[35]。土壤水分的存在會改變光的折射率而影響光的散射,司海青等[36]的研究結(jié)果表明,去除土樣水分可以提高有機質(zhì)高光譜估算精度。宋金紅等[37]發(fā)現(xiàn)土壤光譜特性在很大程度上依賴于成土母質(zhì)。方少文等[31]選取紅壤地區(qū)土壤有機質(zhì)的敏感波段560~710 nm進行建模,最優(yōu)模型為(lg1/R)′光譜變換下PLSR模型;林鵬達等[13]研究表明光譜數(shù)據(jù)利用連續(xù)小波變換方法預(yù)處理后結(jié)合R′變換,選取400、486、712、821、1770和2416 nm波段建立黑土有機質(zhì)含量高光譜反演模型精度最高;南鋒等[21]選取(lg1/R)′變換下的400~1830、1860~2400 nm波段建立黃土區(qū)農(nóng)田土壤有機質(zhì)高光譜模型最優(yōu);喬娟峰等[32]通過對光譜數(shù)據(jù)去包絡(luò)線后選取800~960、1050~1110與2000~2100 nm波段建立荒地土壤有機質(zhì)高光譜模型最優(yōu);本研究土壤有機質(zhì)高光譜敏感波段主要集中在590~756、770~892、1003~1092和1223~1291 nm,經(jīng)(lgR)′變換后建模精度最高,這與上述研究在敏感波段的選擇上基本一致,但在光譜響應(yīng)的具體位置存在較小差異,可能與對光譜反射率的預(yù)處理方法有關(guān)[38-39]。萬洪秀等[40]、吳成永等[41]對博斯騰湖流域植被覆蓋變化的研究表明,2001~2016年間博斯騰湖流域植被覆蓋度指數(shù)多年平均值為2.85,植被覆蓋度較低,建立植被指數(shù)與土壤有機質(zhì)含量的模型效果不明顯。由于不同綠洲土壤有機質(zhì)組成的差異,土壤水分、土壤母質(zhì)等因素對綠洲土壤有機質(zhì)含量的高光譜估算影響有待于進一步研究。
研究區(qū)土壤有機質(zhì)含量變化范圍為5.09~44.00 g·kg-1,平均值為16.87 g·kg-1,變異系數(shù)為44.69%,呈中等變異;不同土壤有機質(zhì)含量等級的光譜曲線形狀較為一致,土壤光譜反射率在400~2135 nm波段隨波長的增加而升高,呈正相關(guān),在2135 nm波段之后呈負相關(guān),且在400~1750 nm波段土壤有機質(zhì)含量越高反射率越低。
反射率(1/R)′與土壤有機質(zhì)含量的相關(guān)性最高,相關(guān)系數(shù)|r|最大為0.50,比原始反射率R提高了19.05%;土壤有機質(zhì)的顯著性波段(P<0.01)主要集中在590~687、758~892、1003~1092和1171~1297 nm 4個波段。
研究區(qū)土壤有機質(zhì)含量高光譜估算模型為:Y=30428.37X677+12738.78X775+2894.02X865+11589.35X885+5.56,建模集和驗證集決定系數(shù)R2分別為0.83和0.82,均方根誤差RMSE分別為4.01和2.64 g·kg-1,驗證集統(tǒng)計量F=116.41(P<0.01),RPD=2.30預(yù)測能力較好。