郄 欣,齊雁冰,劉姣姣,王 珂,陳敏輝
(西北農(nóng)林科技大學(xué)資源環(huán)境學(xué)院,陜西 楊凌 712100)
土壤有機(jī)質(zhì)作為土壤固相的重要組成部分,不僅是土壤肥力的保證,也是維持大氣碳平衡的重要指標(biāo)[1]??焖贉?zhǔn)確地獲取田間土壤理化信息是實現(xiàn)現(xiàn)代精細(xì)農(nóng)業(yè)的基本需求,對于充分發(fā)揮土壤生產(chǎn)潛力,實現(xiàn)農(nóng)業(yè)高產(chǎn)、優(yōu)質(zhì)、高效協(xié)調(diào)發(fā)展以及保障農(nóng)業(yè)生態(tài)安全都具有重要意義。傳統(tǒng)室內(nèi)測定土壤有機(jī)質(zhì)含量的化學(xué)方法程序繁瑣、耗時耗力,處理不當(dāng)還會造成一定的環(huán)境污染[2]。相比傳統(tǒng)的研究方法,高光譜技術(shù)則具有省時省力、無污染、無破壞等優(yōu)點[3],在預(yù)測有機(jī)質(zhì)方面極具優(yōu)勢和潛力。高光譜數(shù)據(jù)具有光譜分辨率高、波段連續(xù)性強(qiáng)、空間分辨率低等特點,可以直接在野外或田間進(jìn)行光譜數(shù)據(jù)采集,不僅節(jié)省了大量的人力和物力,還能與大尺度遙感影像或航攝相片相結(jié)合,實現(xiàn)成像光譜土壤屬性填圖,為大面積、簡便采集土壤屬性數(shù)據(jù)提供了可行性,成為目前獲取土壤屬性信息的重要手段,已被廣泛應(yīng)用于土壤資源調(diào)查、分類、評價、制圖等方面[4]。
基于高光譜的土壤有機(jī)質(zhì)(碳)估算已經(jīng)成為近年來土壤遙感的重要研究內(nèi)容,而所構(gòu)建的估算模型的精度取決于光譜變換[5]和敏感波段提取[6]兩個方面。為較好地消除土壤光譜曲線噪音、背景等影響,變非線性關(guān)系為線性關(guān)系,常對原始光譜進(jìn)行數(shù)學(xué)變換,目前主要變換形式有平滑處理、導(dǎo)數(shù)變換、歸一化處理、多元散射校正、標(biāo)準(zhǔn)正態(tài)化、包絡(luò)線去除等[7-9]。不同的土壤類型和土壤有機(jī)質(zhì)含量會在可見光至近紅外區(qū)域內(nèi)產(chǎn)生不同的響應(yīng)波段。近年來,國內(nèi)外學(xué)者通過研究不同類型土壤有機(jī)質(zhì)含量與光譜反射率的相關(guān)性,發(fā)現(xiàn)他們具有顯著負(fù)相關(guān)關(guān)系,但對于土壤有機(jī)質(zhì)響應(yīng)波段的提取并不一致。Galvao等[10]在室內(nèi)研究證實了土壤反射光譜在550~700 nm處的吸收峰主要是由有機(jī)質(zhì)引起,而且是非線性關(guān)系;史舟等[7]研究發(fā)現(xiàn),土壤有機(jī)質(zhì)含量與一階微分光譜曲線相關(guān)系數(shù)較高的波段為580、820、1 400 nm和 2200 nm;彭杰等[11]在通過室內(nèi)土壤有機(jī)質(zhì)人工處理條件下發(fā)現(xiàn)土壤有機(jī)質(zhì)含量與可見光波段的反射率具有較強(qiáng)的相關(guān)性,決定系數(shù)(R2)最大為0.7902;Gunsaulis等[12]研究表明,土壤有機(jī)質(zhì)含量與紅光波段的反射率具有較強(qiáng)的相關(guān)性,決定系數(shù)(R2)可達(dá)0.609;紀(jì)文君等[13]研究了浙江、河南、四川、黑龍江4個地區(qū)不同類型的土壤樣品,對比得出600~800 nm波段可作為研究區(qū)域內(nèi)不同土壤共同的有機(jī)質(zhì)光譜響應(yīng)波段。
隨著高光譜技術(shù)的推廣應(yīng)用,國內(nèi)外基于高光譜數(shù)據(jù)建立的土壤有機(jī)質(zhì)估算模型均取得了較為顯著的預(yù)測效果,但在建立模型上存在差異,多以多元逐步回歸(SMLR)和偏最小二乘回歸(PLSR)等統(tǒng)計方法為主。如Conforti等[14]采集了215個不同土壤類型和侵蝕條件的土壤樣品,建立了土壤有機(jī)質(zhì)PLSR估算模型,結(jié)果顯示該模型的判斷系數(shù)(R2)為0.84,RPD為2.53;王超等[15]利用SMLR方法構(gòu)建了不同光譜處理方式的褐土有機(jī)質(zhì)光譜,基于一階微分預(yù)處理構(gòu)建的模型R2都在0.92以上;劉磊等[16]采用SMLR和PLSR方法建立了江西省紅壤的有機(jī)質(zhì)含量估算模型,R2分別為0.78、0.99。由于土壤反射光譜數(shù)據(jù)的復(fù)雜性,向量機(jī)回歸(SVR)、隨機(jī)森林(RF)、人工神經(jīng)網(wǎng)絡(luò)(ANN)和BP神經(jīng)網(wǎng)絡(luò)(Back propagation neural network)等非線性回歸方法越來越多地被應(yīng)用到土壤有機(jī)質(zhì)含量估算的研究中。紀(jì)文君等[17]采用SVR和RF方法建立土壤有機(jī)質(zhì)含量反演模型,R2分別為0.927和0.915;Daniel等[18]采用400~1 100 nm的可見光-近紅外光譜結(jié)合人工神經(jīng)網(wǎng)絡(luò)(ANN)方法建立了土壤有機(jī)質(zhì)的估算模型,決定系數(shù)(R2)達(dá)到0.86;葉勤等[19]利用BP神經(jīng)網(wǎng)絡(luò)法建立了陜西省橫山縣的土壤有機(jī)質(zhì)含量估算模型,模型決定系數(shù)(R2)達(dá)到0.8930。與傳統(tǒng)統(tǒng)計方法相比,機(jī)器算法能夠較好地處理土壤有機(jī)質(zhì)含量反演的非線性問題,建模效果較優(yōu),在估算土壤有機(jī)質(zhì)含量方面具有較大的潛力。
多種多樣的光譜變換方式及建模方法使得不同區(qū)域及不同學(xué)者所構(gòu)建的土壤有機(jī)質(zhì)估算模型難以通用。陜西省成土因素差異巨大,土壤類型眾多,有機(jī)質(zhì)差異明顯,有利于從多土壤類型及寬土壤有機(jī)質(zhì)含量的角度構(gòu)建陜西省通用的土壤有機(jī)質(zhì)估算模型。基于此,本文以陜西省9種主要土壤類型的土樣室內(nèi)光譜反射曲線與土壤有機(jī)質(zhì)含量為數(shù)據(jù)基礎(chǔ),對光譜反射曲線進(jìn)行多種變換,結(jié)合SLR、PLSR、SVR 3種建模方法構(gòu)建不同的土壤有機(jī)質(zhì)含量預(yù)測模型,對比分析其效果,篩選出最優(yōu)的土壤有機(jī)質(zhì)估算模型。
陜西省地處我國大陸腹地,處于105°29′~111°15′E和31°42′~39°35′ N,南北長約880 km,東西寬約160~490 km,土地總面積20.56萬km2。全省縱跨黃河、長江兩大流域,地形地貌復(fù)雜,總特點是南北高,中部低,海拔主要分布在500~2 000 m。境內(nèi)氣候差異顯著,由北向南為溫帶、暖溫帶和北亞熱帶。年降水量由南向北遞減,受山地地形影響比較顯著,年平均降水量576.9 mm,年平均氣溫13.0℃,無霜期218 d左右,不同季節(jié)的水分干濕狀況和氣溫狀況差異顯著。復(fù)雜的成土因素致使陜西省土壤類型眾多,據(jù)全國第二次土壤普查全省共有22個土類,其中主要土壤類型包括塿土、水稻土、黃棕壤、黃褐土、黃綿土、黑壚土、風(fēng)沙土、褐土及潮土等9種,土地利用方式包括旱地、林地、水田、園地、草地等。
根據(jù)陜西省土壤空間分布特征,2016年6—8月選取了51個具有代表性的土壤剖面,共計216個土壤樣品,采樣點分布如圖1所示。野外挖掘標(biāo)準(zhǔn)土壤剖面(剖面深度120 cm以上),記錄成土因素信息,根據(jù)顏色、質(zhì)地、結(jié)構(gòu)等的差異劃分發(fā)生學(xué)層次,每個剖面劃分3~6層,觀察形態(tài)特征,并逐層采集土樣。包括塿土、水稻土、黃棕壤、黃褐土、黃綿土、黑壚土、風(fēng)沙土、褐土及潮土等9種土壤類型(表1)。樣品經(jīng)風(fēng)干除雜處理、過1 mm孔篩,采用四分法分為兩份,一份用于室內(nèi)土壤光譜反射率的測定,另一份運用重鉻酸鉀容量法—外加熱法[20]來測定土壤有機(jī)質(zhì)含量。
圖1 采樣點空間分布Fig.1 The spatial distribution of sampling locations
表1 土樣基本信息
土壤光譜反射率采用美國Spectra Vista公司生產(chǎn)的SVC HR-1024 i便攜式光譜儀測定,光譜采集范圍為350~2 500 nm,光譜分辨率為≤3.5 nm(350~1 000 nm)、≤9.5 nm(1 000~1 850 nm)和≤6.5 nm(1 850~2 500 nm)。土樣光譜采集工作在室內(nèi)進(jìn)行,將處理后的土樣裝進(jìn)直徑10 cm、深2 cm的玻璃器皿中,用直尺將土壤表面刮平,測定前需進(jìn)行暗校正和白板校正,光源是功率為50 W的鹵素?zé)?,距離土壤表面30 cm,天頂角為15°,采用的探頭視場角為8°,探頭位于土壤表面垂直正上方15 cm處。每個土樣測量4個方向,剔除異常波段的曲線,共采集12條光譜曲線,算術(shù)平均后作為該樣品的光譜反射數(shù)據(jù)。
數(shù)據(jù)分析之前,每份土樣去除噪聲較大的350~399 nm和2 401~2 500 nm兩個邊緣波段,并采用小波包去噪法對光譜反射數(shù)據(jù)進(jìn)行去噪處理[21],得到重采樣間隔為10 nm的原始光譜反射率曲線。光譜變換可以很大程度上消除土壤背景的影響,剔除無效光譜信息,進(jìn)一步提高光譜信噪比,突出光譜的吸收和反射特征[22]。本文在建模之前,對原始光譜R進(jìn)行一階微分d(R)、倒數(shù)對數(shù)log(1/R)、倒數(shù)對數(shù)一階微分d[log(1/R)]和去包絡(luò)N(R)的變換,并采用Savitzky-Golay平滑(SG平滑)[23]及Norris平滑濾波[24]對原始光譜及其變換形式進(jìn)行平滑處理,消除光譜噪音誤差,提高模型估算精度,但應(yīng)注意采用SG平滑時移動窗口寬度及多項式的優(yōu)化選擇。
采用相關(guān)分析法來確定土壤有機(jī)質(zhì)含量與光譜反射率及其變換形式的敏感波段,相關(guān)性越高,波段響應(yīng)越敏感。將土壤有機(jī)質(zhì)含量與原始光譜及其變換形式的光譜反射率進(jìn)行相關(guān)性分析,并對相關(guān)系數(shù)在0.01水平上進(jìn)行顯著性檢驗,通過顯著性檢驗的即為敏感波段[25-26]。利用400~2 400 nm波段的光譜反射率,系統(tǒng)構(gòu)造原始光譜及其變換形式光譜兩波段組合的差值指數(shù)DI(DI=Ri-Rj)、比值指數(shù)RI(RI=Ri/Rj)和歸一化指數(shù)NDI(NDI=(Ri-Rj)/(Ri+Rj),分析3類指數(shù)與土壤有機(jī)質(zhì)含量之間的相關(guān)關(guān)系,篩選出最優(yōu)的土壤有機(jī)質(zhì)含量估算的光譜參數(shù)。相關(guān)分析和光譜參數(shù)計算分別在SPSS軟件和Matlab 2018a中實現(xiàn)。
研究中反演模型的構(gòu)建采用線性模型SLR和PLSR以及非線性數(shù)據(jù)挖掘技術(shù)SVR 3種方法。SLR法是以土壤有機(jī)質(zhì)含量為因變量,土壤光譜反射率及其變換形式與有機(jī)質(zhì)含量的相關(guān)系數(shù)屬于0.01水平上顯著相關(guān)且絕對值最大的波段作為自變量,建立一元線性回歸模型[27];PLSR方法能夠消除波長變量共線性,解決因土壤各組分的吸收波段相互重疊干擾土壤有機(jī)質(zhì)含量估算精度的問題,避免模型過度擬合[28];SVR是支持向量機(jī)函數(shù)在回歸領(lǐng)域的應(yīng)用,通過事先確定的非線性映射將輸入向量映射到一個高維特征空間(Hilbert空間)中,然后在此高維空間中再進(jìn)行線性回歸,從而取得在原空間非線性回歸的效果[29]。PLSR方法的建模和驗證是在Unscrambler 9.7中完成,SVR法的建模和驗證是在R軟件中完成。
土壤有機(jī)質(zhì)模型估算精度的驗證采用決定系數(shù)(R2),并結(jié)合均方根誤差(RMSE)以及校正集的相對預(yù)測偏差(Relative percent deviation,RPD)等參數(shù)來進(jìn)行模型對比評價[30]。建模集和驗證集的交叉驗證結(jié)果R2越大,RMSE越小,說明模型穩(wěn)定性越強(qiáng),估算精度越高。另外,RPD表示模型的預(yù)測能力,一般分為3類,當(dāng)RPD≤1.4時,模型不可靠,無法對土樣進(jìn)行預(yù)測;當(dāng)1.4 將所有土壤樣品按有機(jī)質(zhì)含量從低到高的順序,以2∶1的比例分為建模集和驗證集,得到144個建模樣本和72個驗證樣本,見圖2。所采集的土壤樣本中,有機(jī)質(zhì)含量分布范圍為0.66~35.43 g·kg-1,平均值為10.32 g·kg-1。建模樣本和驗證樣本與總體樣本的各統(tǒng)計量基本都在同一水平,標(biāo)準(zhǔn)差較小,說明樣本數(shù)據(jù)的選取較為合理,代表性較強(qiáng)。 圖2 不同類型土壤有機(jī)質(zhì)含量的統(tǒng)計描述Fig.2 Statistical description of organic matter content in different soil types 圖3為不同類型土壤的光譜反射曲線,可以看出,不同類型土壤光譜曲線形態(tài)基本相似,土壤光譜反射率隨波長的增大而增大,在可見光波段范圍反射率呈明顯的上升趨勢,而近紅外波段反射率增加緩慢,且出現(xiàn)波折,在1 400、1 900 nm和2 200 nm等波段附近具有強(qiáng)烈的水分吸收谷,常認(rèn)為與OH、H2O、Al-OH和Mg-OH譜帶有關(guān)[11,32]。結(jié)合表1,水稻土與塿土的有機(jī)質(zhì)含量較高,光譜反射曲線處于較低位置;風(fēng)沙土的有機(jī)質(zhì)含量均值最小,光譜反射率最高;黃褐土的光譜曲線在1 400 nm以后表現(xiàn)出較低的反射率,這可能與黃褐土的土壤含水量相關(guān)。 圖3 不同類型土壤的高光譜反射特征Fig.3 Hyperspectral reflection characteristicsof different soil types 圖4為土壤有機(jī)質(zhì)含量與R、d(R)、log(1/R)、d[log(1/R)]和N(R)之間的相關(guān)性分析結(jié)果。可以看出,在全波段范圍內(nèi),R與有機(jī)質(zhì)含量呈負(fù)相關(guān),在540~1 050 nm附近有較強(qiáng)烈的低谷;而log(1/R)與有機(jī)質(zhì)含量呈正相關(guān),與R的相關(guān)性變化規(guī)律正好相反;d(R)、d[log(1/R)]和N(R)的相關(guān)系數(shù)呈現(xiàn)較強(qiáng)的正負(fù)交替變化,與R的相關(guān)性變化相比均有所增強(qiáng),這說明經(jīng)過變換處理的光譜可以進(jìn)一步增強(qiáng)光譜數(shù)據(jù)與土壤有機(jī)質(zhì)含量之間的反射率,提高模型估算精度。其中微分變換能夠較好地消除噪音、背景等影響,進(jìn)一步挖掘土壤隱含信息,提高土壤有機(jī)質(zhì)含量與光譜的相關(guān)性。 圖4 土壤有機(jī)質(zhì)與原始及變換光譜反射率的相關(guān)系數(shù)Fig.4 Correlation coefficient between soil organic matter and the original and transformed spectral reflectance 不同地區(qū)不同類型土壤的有機(jī)質(zhì)高光譜響應(yīng)波段并不一致,將土壤有機(jī)質(zhì)含量與5種不同形式光譜反射率進(jìn)行相關(guān)性分析,并對相關(guān)系數(shù)在0.01水平上進(jìn)行顯著性檢驗,共有R的540~1 050 nm、1 720~1 740 nm、1 780 nm、2 080~2 190 nm、2 270~2 280 nm,d(R)的540~610 nm、790~910 nm、1 390~1 540 nm、1 650~1 710 nm、1 860~2 130 nm、2 180~2 210 nm、2 260~2 330 nm,log(1/R)的540~1 030 nm、1 700~1 790 nm、2 080~2 180 nm,d[log(1/R)]的550~580 nm、750~950 nm、1 040~1 060 nm、1 390~1 570 nm、1 650~1 710 nm、1 870 nm、1 930~1 950 nm、2 010~2 130 nm、2 180~2 190 nm、2 310~2 330 nm,N(R)的820~1 270 nm、1 350 nm、1 400~1 430 nm、1 810~1 910 nm、2 010~2 050 nm、2 230~2 250 nm等70個波段通過檢驗,可以應(yīng)用于土壤有機(jī)質(zhì)含量高光譜模型的估算。 在構(gòu)建SLR反演模型時,單波段的光譜反射率容易受外部環(huán)境的影響,難以精確估算土壤有機(jī)質(zhì)含量。解憲麗等[33]提出利用波段組合方法構(gòu)建的反演模型精度要優(yōu)于單波段預(yù)測方法,且模型可靠性較強(qiáng)。本文運用R、d(R)、log(1/R)、d[log(1/R)]和N(R)兩波段的DI、RI、NDI光譜指數(shù),研究它們與土壤有機(jī)質(zhì)含量之間的相關(guān)關(guān)系,并以光譜反射率兩波段組合的3類指數(shù)得到的最高相關(guān)系數(shù)入選的波段為自變量,土樣有機(jī)質(zhì)含量實測值作為因變量,建立土壤有機(jī)質(zhì)含量SLR模型,并對估算模型進(jìn)行檢驗。由表2可知,SLR模型精度整體較差,最高決定系數(shù)僅為0.50左右,其中d(R)光譜和d[log(1/R)]光譜建立的模型效果優(yōu)于其他形式光譜,以d(R)光譜的RI(R1970nm-R2050nm)結(jié)果最好,決定系數(shù)(R2)分別為0.5174和0.5481,RMSE分別為4.0078和4.3737,驗證RPD僅為1.4462,只能對土壤有機(jī)質(zhì)含量進(jìn)行粗略估算,說明SLR方法并不適用于陜西省土壤有機(jī)質(zhì)含量估算模型的建立。 表2 基于光譜特征指數(shù)的土壤有機(jī)質(zhì)SLR模型檢驗結(jié)果 將土樣的有機(jī)質(zhì)含量實測值作為因變量,通過相關(guān)分析入選的相關(guān)系數(shù)較高的70個波段為自變量,建立土壤有機(jī)質(zhì)含量PLSR模型,建模過程對70個敏感波段進(jìn)行主成分提取,結(jié)果見表3。可以看出,所有光譜數(shù)據(jù)建模決定系數(shù)均在0.72以上,與SLR模型相似,以d(R)和d[log(1/R)]光譜建模效果最優(yōu),說明對R進(jìn)行微分變換后,可以增強(qiáng)光譜對土壤有機(jī)質(zhì)的敏感性,提高模型精度。利用獨立樣本對5種光譜進(jìn)行檢驗,驗證集最優(yōu)為d[log(1/R)]光譜反演的PLSR模型,R2、RMSE和RPD分別為0.7190、3.3480和1.8890。這一估算效果較SLR模型中d(R)光譜的RI(R1970 nm-R2050 nm)效果有所提高,但PLSR模型的RPD均未達(dá)到2.0,模型效果一般,只能對土壤有機(jī)質(zhì)含量進(jìn)行粗略估算。但采用PLSR方法建立的土壤有機(jī)質(zhì)含量模型整體精度較SLR模型有了顯著提高,原因可能是土壤有機(jī)質(zhì)組成復(fù)雜,與光譜之間不是簡單的線性關(guān)系,PLSR可以運用主成分提取到對土壤有機(jī)質(zhì)含量相關(guān)性最大的波段范圍,從而減少光譜維數(shù)。 表3 基于光譜特征參數(shù)的土壤有機(jī)質(zhì)PLSR模型估算結(jié)果 支持向量機(jī)回歸法是一種較好地實現(xiàn)了結(jié)構(gòu)風(fēng)險最小化思想的方法,具有機(jī)器學(xué)習(xí)理論和技術(shù),將神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法納入了核技巧范疇[34-35]。利用SVR方法,基于土壤光譜反射率及其4種變換處理,建立土壤有機(jī)質(zhì)含量SVR模型。由表4可以看出,d(R)、d[log(1/R)]和N(R)驗證集R2均達(dá)到了0.80以上,RMSE均小于3.00,RPD均在2.20以上,具有較好的估算土壤有機(jī)質(zhì)含量的能力。與PLSR模型相同,d[log(1/R)]建模表現(xiàn)效果最好,建模集和驗證集R2最高,分別為0.9210和0.8874,RMSE分別為1.8494和2.1843,RPD達(dá)到2.8751。圖5為使用d[log(1/R)]光譜建立的SVR模型的檢驗結(jié)果,通過有機(jī)質(zhì)含量實測值與預(yù)測值的對比可以看出,建模樣本和驗證樣本都趨于1∶1直線附近,估算精度較高。結(jié)合表3,基于d[log(1/R)]光譜基礎(chǔ)上,SVR模型的建模和驗證R2分別比PLSR高了0.152和0.1684,RMSE分別低了1.2366和1.1637,估算精度明顯優(yōu)于PLSR模型。因此,d[log(1/R)]光譜建立的SVR模型是3種建模方法中的最優(yōu)估算模型。 表4 基于光譜特征參數(shù)的土壤有機(jī)質(zhì)SVR模型估算結(jié)果 圖5 d[log(1/R)]光譜建立的SVR模型的檢驗結(jié)果Fig.5 Test results of SVR model establishedby d[log(1/R)] spectrum 土壤有機(jī)質(zhì)是動植物殘體在微生物礦化作用下形成的有機(jī)物質(zhì)的總稱,因其主要組成部分腐殖質(zhì)呈現(xiàn)黑色而表現(xiàn)出吸收光譜的特征,且有機(jī)質(zhì)在土壤中的質(zhì)量分?jǐn)?shù)較大,吸收特征明顯。通過對土壤有機(jī)質(zhì)含量與土壤光譜之間的相關(guān)性分析,發(fā)現(xiàn)土壤有機(jī)質(zhì)含量與土壤光譜在400~2 400 nm整個波段范圍內(nèi)呈負(fù)相關(guān)關(guān)系,這與前人研究結(jié)果基本一致[36]。土壤有機(jī)質(zhì)含量與原始光譜的相關(guān)性較低,且光譜數(shù)據(jù)的采集容易受土壤本身及外界環(huán)境的影響,因此,對原始光譜R進(jìn)行不同形式的變換處理可以有效提高反演模型的精度。通過4種形式的光譜變換處理,發(fā)現(xiàn)d(R)、d[log(1/R)]和N(R)變換后光譜反射率與土壤有機(jī)質(zhì)含量間的相關(guān)性有了顯著提高,相關(guān)系數(shù)最高分別達(dá)到了0.556、0.523和0.527,說明進(jìn)行微分變換能夠有效地突出光譜之間的差異特征、濾掉光譜近線性背景噪聲干擾,進(jìn)而提高土壤有機(jī)質(zhì)含量的預(yù)測精度[37];N(R)變換后可以有效地突出光譜曲線的反射和吸收特征,并將其歸一化到一致(0~1)的背景上,有利于不同光譜曲線之間進(jìn)行特征數(shù)值的比較分析[38],兩種變換方式對于提高估算模型精度發(fā)揮了重要作用。經(jīng)過log(1/R)變換后的建模效果不及d(R)和d[log(1/R)]光譜,說明log(1/R)變換不適用于陜西省土壤有機(jī)質(zhì)含量的估算建模。 本研究綜合對比SLR、PLSR和SVR 3種建模方法在陜西省土壤有機(jī)質(zhì)含量高光譜反演模型的應(yīng)用,發(fā)現(xiàn)3種方法的建模效果是不相同的。利用SLR方法建模反演時,系統(tǒng)構(gòu)造了400~2 400 nm光譜的兩波段的DI、RI和NDI指數(shù)與土壤有機(jī)質(zhì)含量的關(guān)系,發(fā)現(xiàn)d(R)光譜的RI(R1970 nm-R2050 nm)結(jié)果最好,RPD最高為1.4462,只能夠?qū)τ袡C(jī)質(zhì)進(jìn)行粗略估算?;赗、d(R)、log(1/R)、d[log(1/R)]和N(R)5種光譜在顯著性波段基礎(chǔ)上的建模結(jié)果,SVR模型的建模R2比PLSR模型分別增加了0.0704、0.0878、0.0400、0.1520和0.1797,RMSE分別減小了0.1420、0.6051、0.1181、1.2366和1.5284,RPD除R外分別增加了0.4223、0.0936、0.9861和1.0509,說明SVR法的建模精度要高于PLSR法,且能對土壤有機(jī)質(zhì)進(jìn)行較好估算,這與前人研究結(jié)果基本一致[17]。3種方法比較而言,SLR法處理非線性的能力較差,極易產(chǎn)生隨機(jī)性[28];PLSR法可以滿足土壤有機(jī)質(zhì)含量光譜反演的基本需要,建立的模型比較簡單;SVR法能夠在高維空間里處理非線性問題,具有強(qiáng)大的泛化能力,但需要對原始光譜進(jìn)行不同形式的變換。d [log(1/R)]光譜建立的SVR模型是本文效果最優(yōu)的土壤有機(jī)質(zhì)含量估算模型,建模和驗證R2分別為0.9210和0.8874,RMSE分別為1.8494和2.1843,RPD為2.8751,基于此模型反演土壤有機(jī)質(zhì)含量具有較高的精度,可以有效、精準(zhǔn)地監(jiān)測陜西省土壤有機(jī)質(zhì)含量,是估算陜西省土壤有機(jī)質(zhì)的最優(yōu)反演模型,適用性較強(qiáng),在未來的研究中可以得到更加廣泛運用。 本文基于陜西省9種不同類型土壤樣品的室內(nèi)高光譜和土壤有機(jī)質(zhì)數(shù)據(jù),基于4種光譜變換和SLR、PLSR、SVR 3種建模方法建立了陜西省土壤有機(jī)質(zhì)含量高光譜反演模型,比較了不同光譜數(shù)據(jù)變換處理和不同建模方法下建模集和驗證集估算模型精度的差異。d[log(1/R)]和d(R)變換明顯提高了土壤有機(jī)質(zhì)含量與光譜反射率的相關(guān)性,SVR模型估算土壤有機(jī)質(zhì)含量的精度較SLR模型和PLSR模型有顯著提高,通過敏感波段建立的SVRd[log(1/R)]回歸模型是估算土壤有機(jī)質(zhì)含量的最優(yōu)模型。2 結(jié)果與分析
2.1 不同類型土壤有機(jī)質(zhì)含量統(tǒng)計及光譜特征
2.2 土壤有機(jī)質(zhì)含量與土壤光譜的相關(guān)性分析
2.3 土壤有機(jī)質(zhì)含量的一元線性回歸(SLR)估算模型
2.4 基于偏最小二乘回歸(PLSR)的土壤有機(jī)質(zhì)估算模型
2.5 基于支持向量機(jī)回歸(SVR)的土壤有機(jī)質(zhì)估算模型
3 討 論
4 結(jié) 論