張昊丹,孫孝林, 2*,王曉晴,王會(huì)利
1. 中山大學(xué)地理科學(xué)與規(guī)劃學(xué)院,廣東省城市化與地理環(huán)境空間模擬重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510275 2. 土壤與農(nóng)業(yè)可持續(xù)發(fā)展國家重點(diǎn)實(shí)驗(yàn)室(中國科學(xué)院南京土壤研究所),江蘇 南京 210008 3. 廣西壯族自治區(qū)林業(yè)科學(xué)研究院,廣西 南寧 530002
土壤是一種復(fù)雜綜合體,其反射光譜是由其組成成分及結(jié)構(gòu)等多種內(nèi)在性質(zhì)共同決定的結(jié)果[1-3]。因此,土壤光譜作為土壤理化性狀的綜合指標(biāo),在研究中常用于估測(cè)土壤屬性,特別是可見-近紅外(visible-near infrared, Vis-NIR)光譜。與傳統(tǒng)化學(xué)分析土壤屬性相比,室內(nèi)測(cè)定土壤光譜雖已大大提高了效率,但仍需對(duì)樣品進(jìn)行預(yù)處理(如風(fēng)干、研磨、過篩等)。相較之下,原位測(cè)定土壤光譜的效率更高,還具有快速、無損、可多次重復(fù)等優(yōu)點(diǎn)。因此,越來越多的研究致力于發(fā)展原位土壤光譜估測(cè)土壤屬性的技術(shù),并取得了一定進(jìn)展。例如,Viscarra Rossel等[4]、Li等[5]使用原位土壤Vis-NIR光譜估測(cè)土壤顏色、礦物組成、粘粒含量和有機(jī)碳。
這些研究也指出,利用原位土壤光譜估測(cè)土壤屬性的準(zhǔn)確性受諸多因素影響,包括兩方面。一是土壤方面,主要是土壤非均質(zhì)性所導(dǎo)致的水分條件、粒徑差異、質(zhì)地條件等;二是光譜測(cè)定方面,主要有光譜分辨率、測(cè)量時(shí)的外部環(huán)境、幾何條件、土樣表面處理方法、光譜處理技術(shù)等。前一方面的影響因素與室內(nèi)測(cè)定土壤光譜影響因素的研究結(jié)果都較一致。史舟等[1]已對(duì)此做了比較全面、系統(tǒng)的總結(jié)。后一方面的因素在很多光譜估測(cè)土壤屬性的研究中得到了深入分析。例如,劉煥軍等研究了光譜分辨率對(duì)黑土有機(jī)質(zhì)預(yù)測(cè)模型的影響, 結(jié)果表明:黑土有機(jī)質(zhì)含量高,土壤有機(jī)質(zhì)的光譜范圍寬(445~1 380 nm),且光譜預(yù)測(cè)模型精度隨光譜分辨率降低呈先增后減的趨勢(shì),最優(yōu)模型的光譜分辨率為50 nm;侯燕平等[7]研究了土樣表面處理方法對(duì)光譜測(cè)定的影響,具體表現(xiàn)為表面刮平處理方式優(yōu)于壓平與搖平處理方式;Stenberg[8]研究了實(shí)驗(yàn)室內(nèi)土壤樣品預(yù)處理和標(biāo)準(zhǔn)化復(fù)濕對(duì)Vis-NIR光譜預(yù)測(cè)粘粒和土壤有機(jī)碳的影響,發(fā)現(xiàn)將土壤樣品重新潤濕到體積標(biāo)準(zhǔn)化水平可顯著提高土壤有機(jī)碳的估測(cè)效果,粘粒含量估測(cè)效果也有改進(jìn)但不如前者明顯。
為了削弱土壤的非均質(zhì)性對(duì)原位土壤光譜估測(cè)土壤屬性的準(zhǔn)確性的影響,原位土壤光譜的測(cè)定一般是多點(diǎn)測(cè)定后取平均值,再用于土壤屬性估測(cè)。如Morgan等[9]在土芯上每隔2.5 cm各測(cè)定4個(gè)位置的光譜,并取平均值用于估測(cè)有機(jī)碳和無機(jī)碳;Lobsey和Viscarra Rossel[10]測(cè)定了每個(gè)環(huán)刀土樣兩面各5個(gè)位置的光譜并取平均值用于土壤水分估測(cè);Li等[5]測(cè)定了環(huán)刀樣品上5個(gè)隨機(jī)位置的光譜后取平均值,用于土壤有機(jī)碳分析。此外,廣泛的土壤學(xué)研究中,一般對(duì)同一層的土壤,如土壤發(fā)生層或同一深度層,選取多個(gè)位置的樣品充分混合。因此,同一層的不同采樣位置也會(huì)影響原位土壤光譜估測(cè)土壤屬性的準(zhǔn)確性。然而,迄今的大量研究主要集中在數(shù)據(jù)預(yù)處理與預(yù)測(cè)模型方面[11],鮮有研究分析原位土壤光譜測(cè)試點(diǎn)位置以及同一土層不同采樣位置對(duì)土壤屬性估測(cè)的影響。因此,這兩個(gè)因素導(dǎo)致的光譜差異及土壤屬性估測(cè)誤差還不清楚。
為此,以我國南方典型丘陵區(qū)林地上的土壤樣品為例,首先分析同一原狀土樣品不同測(cè)試點(diǎn)位置上以及同一土層不同采樣位置上的光譜差異,再按照原位土壤光譜估測(cè)土壤屬性的一般模式,用偏最小二乘回歸(partial least square regression, PLSR)方法建立樣品的平均光譜與有機(jī)質(zhì)含量之間的模型,接著使用該模型估測(cè)不同光譜測(cè)試點(diǎn)位置和采樣位置上的有機(jī)質(zhì)含量,從而評(píng)價(jià)測(cè)試點(diǎn)和采樣點(diǎn)位置不同導(dǎo)致的有機(jī)質(zhì)含量估測(cè)誤差。研究目的在于定量揭示光譜測(cè)試點(diǎn)位置、土壤采樣點(diǎn)位置的不同導(dǎo)致的土壤屬性估測(cè)誤差,為后續(xù)進(jìn)一步研究如何降低這些誤差指明方向,有助于未來更好地開展原位土壤光譜估測(cè)土壤屬性的研究和應(yīng)用。
研究區(qū)選在廣西壯族自治區(qū)南寧市北郊丘陵地帶的高峰林場(chǎng)(108°20′57″—108°21′54″E ,22°57′8″N—22°58′41″N),面積約3.03 km2,高程約120~300 m。該研究區(qū)位于南亞熱帶濕潤季風(fēng)氣候區(qū),年均溫為21.6 ℃,年降雨量1 304.2 mm;土壤母質(zhì)主要為泥巖、泥質(zhì)頁巖、砂質(zhì)頁巖等沉積巖系,均風(fēng)化發(fā)育為赤紅壤;植被以人工桉樹林為主,林下灌草植物以木姜(Litseapungens)、毛桐(Mallotusbarbatus)、鹽膚木(Rhuschinenesis)、半邊旗(Pterissemipinnata)、五節(jié)芒(Miscanthusfloridulus)、鐵芒箕(Dicranopterisdichotoma)等為優(yōu)勢(shì)樹種。該研究區(qū)歷史上一直為林地,21世紀(jì)初開始種植桉樹[12]。
從研究區(qū)的數(shù)字高程模型中提取出高程、坡向、坡度、剖面曲率、平面曲率和地形濕度指數(shù),并在這些地形參數(shù)的基礎(chǔ)上,采用條件拉丁超立方方法選取了20個(gè)不同地形特征的采樣點(diǎn)。在這些采樣點(diǎn)位置上,挖掘土壤剖面,深至母質(zhì)層,當(dāng)母質(zhì)層深度超過140 cm時(shí)深至140 cm。每個(gè)剖面劃分發(fā)生層后,用環(huán)刀在每層的不同位置重復(fù)采樣2個(gè),共采集160個(gè)環(huán)刀樣品。另外,在該研究區(qū)內(nèi)用網(wǎng)格法選取38個(gè)樣點(diǎn),每個(gè)樣點(diǎn)重復(fù)采集表層不同位置上的環(huán)刀樣2個(gè),共采集76個(gè)環(huán)刀樣品。因此,共采集236個(gè)環(huán)刀樣品。
圖1 研究區(qū)內(nèi)采樣點(diǎn)分布Fig.1 Distribution of sampling points in the study area
原狀土壤光譜由美國ASD公司生產(chǎn)的FieldSpec4型便攜式高分辨率地物光譜儀在室內(nèi)測(cè)得,測(cè)量光源為杯狀光源,內(nèi)置12°天頂角的鹵素?zé)簦溆薪佑|式光纖探頭。該儀器波長(zhǎng)范圍是350~2 500 nm,350~1 000 nm內(nèi)采樣間隔為1.4 nm,1 001~2 500 nm內(nèi)采樣間隔為1.1 nm,光譜分辨率為3 nm@700 nm,6 nm@1 400/2 100nm,輸出總波段數(shù)是2 151。測(cè)量時(shí),將杯狀光源置于環(huán)刀土壤樣品上方,光纖探頭直接接觸樣品。每個(gè)樣品的上、下兩面分別均勻選取9個(gè)點(diǎn)進(jìn)行測(cè)量,每個(gè)點(diǎn)測(cè)得10條光譜。由于光譜在起始波段(350~400 nm)和長(zhǎng)波近紅外波段(2 451~2 500 nm)受雜散光、樣品背景、測(cè)量?jī)x器系統(tǒng)等因素的影響而混有噪聲,故本文用401~2 450 nm波段范圍的光譜數(shù)據(jù)進(jìn)行下一步分析[5]。同時(shí),為避免因數(shù)據(jù)冗余出現(xiàn)過度擬合現(xiàn)象,參考Shepherd[13]和Stenberg[8]的研究,分別以5和10 nm采樣間隔對(duì)401~1 000和1 001~2 450 nm兩個(gè)波段進(jìn)行重采樣,共輸出265個(gè)波段。
光譜測(cè)定后的環(huán)刀樣品經(jīng)過風(fēng)干、研磨等一系列處理后,用重鉻酸鉀容量法測(cè)得有機(jī)質(zhì)含量。
不同的光譜曲線具有不同的形狀和幅度。本文用光譜角度θ[1]來評(píng)價(jià)它們之間的差異性,計(jì)算公式如式(1)
(1)
式(1)中,xi和yi分別為兩個(gè)光譜曲線x和y在波段i處對(duì)應(yīng)的反射率值,n表示波段數(shù)。θ值越小,表明曲線x和y之間的差異越小,反之則差異越大。
為消除儀器因素引起的誤差,以每個(gè)測(cè)試點(diǎn)10條光譜的平均作為該測(cè)試點(diǎn)的光譜,并稱為測(cè)試點(diǎn)光譜(共4 248條),以便區(qū)分其他光譜。進(jìn)一步地,計(jì)算每個(gè)環(huán)刀樣品上、下兩面共18個(gè)測(cè)試點(diǎn)光譜的平均值,稱為環(huán)刀樣光譜(共236條);計(jì)算每個(gè)土層兩個(gè)環(huán)刀樣品共36個(gè)測(cè)試點(diǎn)光譜的平均值,稱為土層光譜(共118條)。然后,計(jì)算每個(gè)環(huán)刀樣品18個(gè)測(cè)試點(diǎn)光譜與對(duì)應(yīng)環(huán)刀樣光譜之間的光譜角度,以評(píng)價(jià)光譜測(cè)試點(diǎn)位置不同引起的光譜測(cè)定差異。相似地,計(jì)算每個(gè)土層2個(gè)環(huán)刀樣光譜與對(duì)應(yīng)土層光譜之間的光譜角度,以評(píng)價(jià)采樣位置不同引起的光譜測(cè)定差異。
使用PLSR建立土壤光譜與土壤屬性之間的模型。PLSR在土壤近地傳感研究中應(yīng)用最廣泛,應(yīng)用效果良好[3-5]。為避免過度擬合PLSR模型,使用留一交叉驗(yàn)證法(leave-one-out cross validation,LOOCV)選擇最合適的潛變量(latent variable, LV)個(gè)數(shù)來建立PLSR模型。然后,再采用隨機(jī)獨(dú)立樣本對(duì)模型進(jìn)行驗(yàn)證:全部樣本(236個(gè))被隨機(jī)分為建模集和驗(yàn)證集。為避免樣本數(shù)不同給驗(yàn)證結(jié)果帶來的影響,驗(yàn)證集的樣本數(shù)取值為1~40,取剩后的樣本全部用于建模。同時(shí),為了降低隨機(jī)采樣的不均勻性對(duì)驗(yàn)證結(jié)果的影響,對(duì)每個(gè)驗(yàn)證集樣本數(shù)重復(fù)進(jìn)行了100次,并取100次的平均結(jié)果為該模型的驗(yàn)證結(jié)果。驗(yàn)證指標(biāo)包括:平均偏差(mean error,ME)、均方根誤差(root mean square error,RMSE)、決定系數(shù)R2和相對(duì)分析誤差(residual prediction deviation,RPD),計(jì)算公式如式(2)—式(5)
(2)
(3)
(4)
(5)
將每個(gè)環(huán)刀樣品的18條測(cè)試點(diǎn)光譜輸入到PLSR模型中,得到18個(gè)有機(jī)質(zhì)含量估測(cè)值。在此基礎(chǔ)上,計(jì)算這些估測(cè)值的平均值、標(biāo)準(zhǔn)偏差和變異系數(shù)。用其中的標(biāo)準(zhǔn)偏差表示因測(cè)試點(diǎn)位置不同導(dǎo)致的光譜估測(cè)土壤有機(jī)質(zhì)的誤差。
同樣的,將每個(gè)土層的2條環(huán)刀樣光譜輸入到PLSR模型中,得到2個(gè)有機(jī)質(zhì)含量估測(cè)值,接著計(jì)算這些估測(cè)值的平均值、標(biāo)準(zhǔn)偏差和變異系數(shù),并用其中的標(biāo)準(zhǔn)偏差表示因采樣位置不同而導(dǎo)致的光譜估測(cè)土壤有機(jī)質(zhì)的誤差。
表1列出了采樣獲得的土壤有機(jī)質(zhì)含量的統(tǒng)計(jì)特征。所有236個(gè)環(huán)刀樣的土壤有機(jī)質(zhì)含量的變異性較大,變異系數(shù)達(dá)61%,屬中等變異。偏度與峰度值說明樣品有機(jī)質(zhì)含量呈向右偏離正態(tài)分布,且峰態(tài)平緩。
表1同時(shí)還列出了每個(gè)土層2個(gè)重復(fù)樣的土壤有機(jī)質(zhì)含量統(tǒng)計(jì)特征;圖2展示了它們之間的對(duì)比。表1中的結(jié)果表明,重復(fù)樣本之間的統(tǒng)計(jì)特征差別很小,且都接近所有環(huán)刀樣的統(tǒng)計(jì)特征。例如,兩次重復(fù)的均值分別為20.68和19.81 g·kg-1,標(biāo)準(zhǔn)偏差分別為12.23和12.51 g·kg-1,與所有環(huán)刀樣本的均值20.25 g·kg-1和標(biāo)準(zhǔn)差12.36 g·kg-1都很接近。由圖2可見,當(dāng)有機(jī)質(zhì)含量低于25 g·kg-1時(shí),每個(gè)土層的兩次重復(fù)實(shí)測(cè)有機(jī)質(zhì)含量接近1∶1線,而當(dāng)有機(jī)質(zhì)含量高于25 g·kg-1時(shí),兩次重復(fù)與1∶1線有一定程度的偏離。這種偏離說明,高有機(jī)質(zhì)含量的土層中,土壤有機(jī)質(zhì)在層內(nèi)分布不均勻,例如有機(jī)質(zhì)含量豐富的土壤表層過渡到有機(jī)質(zhì)含量較低的下層時(shí),有機(jī)質(zhì)含量并不均勻,而是快速或慢速降低。這一結(jié)果說明研究土壤采樣位置不同導(dǎo)致的誤差具有重要意義。
圖2 兩次重復(fù)環(huán)刀樣的土壤有機(jī)質(zhì)含量測(cè)量值對(duì)比Fig.2 Comparison of soil organic matter contents of two duplicate sets of samples
表1 土壤有機(jī)質(zhì)含量(g·kg-1)的統(tǒng)計(jì)特征Table 1 Statistics of soil organic matter content(g·kg-1)
此外,表1還列出了每個(gè)土層的有機(jī)質(zhì)含量,即該土層2個(gè)重復(fù)樣的平均值的統(tǒng)計(jì)特征??梢姡翆拥挠袡C(jī)質(zhì)含量統(tǒng)計(jì)特征與上述所有環(huán)刀樣及2個(gè)重復(fù)樣中有機(jī)質(zhì)含量的統(tǒng)計(jì)特征基本一致。
本文以所有樣品中有機(jī)質(zhì)含量最低(1.20 g·kg-1)、最高(48.64 g·kg-1)和最接近平均值(20.57 g·kg-1)所對(duì)應(yīng)土層的樣品為例,展示本研究測(cè)得的光譜,如圖3所示。由于有機(jī)質(zhì)含量的較大差異,圖3(a),(b)和(c)中的光譜反射率差異較大,表現(xiàn)為有機(jī)質(zhì)含量越高的土壤,其反射率低[6]。不同環(huán)刀樣品的光譜在700~1 000 nm范圍內(nèi)有明顯的波形差異,尤其是圖3(a)中900 nm附近可見明顯吸收谷。因690~930 nm波段為鐵的氧化礦物對(duì)光譜的主要吸收區(qū)[16],故該波段反射光譜主要受土壤有機(jī)質(zhì)和氧化鐵的共同影響。本研究采集的土壤類型為赤紅壤,含豐富的氧化鐵,尤其是有機(jī)質(zhì)含量少的下層土壤中。因此,在圖3(a)中表現(xiàn)出了900 nm附近的明顯吸收谷。
在圖3中,灰色和淺綠色分別表示同一土層2個(gè)環(huán)刀樣品各18條測(cè)試點(diǎn)光譜(共36條);藍(lán)色表示2個(gè)環(huán)刀樣光譜;紅色表示土層光譜??梢钥吹剑画h(huán)刀樣品上不同測(cè)試點(diǎn)位置處的測(cè)試點(diǎn)光譜(圖3中灰色和淺綠色曲線)在形態(tài)上大體一致,但在不同的波段上,反射率值存在著不同程度的差異。較大的差異發(fā)生在600~1 350,1 400~1 850和1 900~2 500 nm三個(gè)波段范圍內(nèi)。在1 400,1 900和2 200 nm三個(gè)波段附近光譜曲線差異較小,分別對(duì)應(yīng)于水分吸收特征明顯的波段[3, 15]。
圖3還反映出同一土層不同取樣位置之間,即環(huán)刀樣光譜(圖3中藍(lán)色曲線)之間,也存在著一定程度的光譜差異,并與土層光譜(圖3中紅色曲線)有一定差異。這些差異與上述測(cè)試點(diǎn)光譜之間的差異相比非常小。
表2列出了測(cè)試點(diǎn)光譜與環(huán)刀樣光譜之間、環(huán)刀樣光譜與土層光譜之間角度的統(tǒng)計(jì)特征。偏度值和峰度值說明兩組角度的分布比較相近,均向右偏離正態(tài)分布,峰態(tài)陡峭。前者的均值、最大值、中值都大于后者,說明測(cè)試點(diǎn)光譜與環(huán)刀樣光譜之間的差異大于后者。這一結(jié)果表明,土壤光譜測(cè)試點(diǎn)不同導(dǎo)致的光譜差異遠(yuǎn)遠(yuǎn)大于采樣位置不同導(dǎo)致的光譜差異。前者比后者大約76%。這可能是因?yàn)槊恳粋€(gè)土壤樣品的18個(gè)光譜測(cè)試點(diǎn)分布在環(huán)刀樣品的上、下兩面(每個(gè)面各9個(gè)點(diǎn),而環(huán)刀深度為5 cm,即上下兩面相距5 cm),因而測(cè)試點(diǎn)位置實(shí)際上已包含了采樣位置不同引起的差異。同時(shí),環(huán)刀樣光譜是測(cè)試點(diǎn)光譜的平均值,因而已消除了部分差異,使得環(huán)刀樣光譜之間差異縮小。另外,環(huán)刀樣光譜之間的差異較小也可能與樣本數(shù)有關(guān),本文中每個(gè)土層僅有2個(gè)環(huán)刀樣光譜。
表2 光譜曲線與參考譜線之間的角度差異統(tǒng)計(jì)特征(單位:度)Table 2 Statistics of differences in degree between the sample spectrum and reference spectrum
圖4列出了土壤光譜之間的角度與環(huán)刀樣有機(jī)質(zhì)含量之間的對(duì)比關(guān)系。該圖反映出,光譜之間的角度與有機(jī)質(zhì)含量無明顯的相關(guān)關(guān)系。進(jìn)一步的相關(guān)性分析表明,測(cè)試點(diǎn)光譜與環(huán)刀樣光譜之間的角度與有機(jī)質(zhì)含量的最大負(fù)相關(guān)和正相關(guān)分別為-0.061和0.079,最小負(fù)相關(guān)和最小正相關(guān)分別為-0.028和0.008。環(huán)刀樣光譜與土層光譜之間的角度與有機(jī)質(zhì)含量之間的相關(guān)性系數(shù)為-0.02??梢?,這些相關(guān)性并未達(dá)到統(tǒng)計(jì)學(xué)上的顯著性水平,說明它們之間的相關(guān)性不明顯。
圖4 土壤有機(jī)質(zhì)含量與土壤光譜差異(a):測(cè)試點(diǎn)光譜與環(huán)刀樣光譜間的角度;(b):環(huán)刀樣光譜與土層光譜間的角度Fig.4 Soil organic matter content and the differences between soil spectra
用所有(236個(gè))環(huán)刀樣光譜和有機(jī)質(zhì)含量建立PLSR模型。圖5顯示了這些光譜與有機(jī)質(zhì)含量之間的相關(guān)性。可見,在大部分波段上,光譜反射率與土壤有機(jī)質(zhì)含量之間呈現(xiàn)負(fù)相關(guān),最大負(fù)相關(guān)系數(shù)為-0.918,對(duì)應(yīng)波長(zhǎng)為1 215.5 nm;只在極小波段范圍內(nèi)(2 196~2 226,2 326~2 406 nm)呈正相關(guān),最大正相關(guān)系數(shù)為0.163,對(duì)應(yīng)波長(zhǎng)為2 205.5 nm。這一結(jié)果與Shepherd[13]的研究結(jié)果相似,說明可以合理地利用光譜建立估測(cè)有機(jī)質(zhì)含量的PLSR模型。
圖5 土壤有機(jī)質(zhì)含量與環(huán)刀樣光譜反射率的相關(guān)性分析Fig.5 Correlogram of soil organic matter content to spectral reflectance of each sample
使用一系列不同潛變量個(gè)數(shù)的PLSR建模和LOOCV驗(yàn)證的結(jié)果(圖6)表明:當(dāng)潛變量個(gè)數(shù)小于23時(shí),估測(cè)值的誤差平方和呈現(xiàn)總體下降趨勢(shì),僅在個(gè)別潛變量個(gè)數(shù)上略有微小增加的趨勢(shì);當(dāng)潛變量個(gè)數(shù)為23時(shí),估測(cè)值的誤差平方和達(dá)到最低;當(dāng)潛變量個(gè)數(shù)大于23時(shí),估測(cè)值的誤差平方和有微小增加,但并沒有太大改變,趨于平穩(wěn)。因此,使用潛變量個(gè)數(shù)為23來建立PLSR模型。LOOCV的結(jié)果表明,該模型的ME是-0.002 6 g·kg-1,RMSE是3.57 g·kg-1,分別占表1中所有樣本有機(jī)質(zhì)含量平均值的-0.013%和18%。其中,RMSE的結(jié)果說明該模型具有一定誤差。該模型的決定系數(shù)R2是0.92,RPD是3.46,與其他研究中的R2和RPD接近[3, 5]。尤其是RPD的結(jié)果,說明該模型的預(yù)測(cè)能力極佳。
圖6 PLSR模擬結(jié)果
接著用隨機(jī)抽取的1~40個(gè)樣本對(duì)該模型進(jìn)行了驗(yàn)證,每個(gè)隨機(jī)抽取樣本數(shù)重復(fù)100次并取其平均值作為驗(yàn)證結(jié)果。如圖7所示,當(dāng)隨機(jī)抽取的樣本數(shù)大于3時(shí),驗(yàn)證指標(biāo)值趨于穩(wěn)定。而且,由于樣本數(shù)較小時(shí)很可能出現(xiàn)較大偏差而使得評(píng)價(jià)結(jié)果失真,例如圖7(c)中R2值在樣本數(shù)為1時(shí)其值為1,顯然是因?yàn)闃颖緮?shù)僅為1造成的。因此,以隨機(jī)抽取的樣本數(shù)大于3時(shí)的結(jié)果來評(píng)價(jià)模型的準(zhǔn)確性。ME在-0.52~0.34 g·kg-1之間,占表1中所有樣本平均值的-2.57%~1.68%,可見總體誤差非常小。然而,這可能是因?yàn)檎?、?fù)誤差相互抵消的原因。相對(duì)應(yīng)地,圖7(b)中的RMSE相對(duì)較高,在3.15~3.70 g·kg-1之間,占表1中所有樣本平均值的16%~18%。這一結(jié)果說明該模型具有一定的誤差。圖7(c)中的決定系數(shù)R2在0.91~0.93之間,高于Li等統(tǒng)計(jì)文獻(xiàn)中曾報(bào)道的0.68~0.92之間。同時(shí),RPD在3.38~4.38之間。這些結(jié)果說明,該模型具有較高的準(zhǔn)確性。
圖7 PLSR預(yù)測(cè)模型的獨(dú)立隨機(jī)樣本驗(yàn)證結(jié)果統(tǒng)計(jì)分析
圖8展示了光譜估測(cè)的有機(jī)質(zhì)含量及其平均值、標(biāo)準(zhǔn)偏差與實(shí)測(cè)有機(jī)質(zhì)含量的對(duì)比關(guān)系。從圖8(a)中可以看到,不同的測(cè)試點(diǎn)位置,估測(cè)值有較大的變異,說明測(cè)試點(diǎn)位置不同導(dǎo)致的誤差比較大。用標(biāo)準(zhǔn)偏差表示該誤差的結(jié)果也展示在圖8(a)中,即藍(lán)色點(diǎn)。進(jìn)一步分析表明,該標(biāo)準(zhǔn)偏差與有機(jī)質(zhì)含量實(shí)測(cè)值的相關(guān)系數(shù)為0.23,達(dá)到了0.01水平上的顯著性。這說明,實(shí)測(cè)值越大,標(biāo)準(zhǔn)偏差越大。同時(shí),表4列出了該標(biāo)準(zhǔn)偏差的統(tǒng)計(jì)數(shù)據(jù)??梢钥吹?,該標(biāo)準(zhǔn)偏差的平均值、最小值和最大值分別占表1中所有樣品有機(jī)質(zhì)含量平均值的17.98%,4.54%和72.40%。可見,測(cè)試點(diǎn)位置不同導(dǎo)致的誤差并不小。鑒于前述標(biāo)準(zhǔn)偏差與實(shí)測(cè)有機(jī)質(zhì)含量有顯著的相關(guān)性,進(jìn)一步分析了標(biāo)準(zhǔn)偏差占對(duì)應(yīng)有機(jī)質(zhì)含量實(shí)測(cè)值的百分?jǐn)?shù),統(tǒng)計(jì)結(jié)果也列于表4中??梢钥吹?,測(cè)試點(diǎn)位置不同導(dǎo)致的標(biāo)準(zhǔn)偏差占實(shí)測(cè)值的百分?jǐn)?shù)平均可達(dá)31%,最小值為3.8%,而最大值可達(dá)428%??梢?,該標(biāo)準(zhǔn)偏差比2.3節(jié)中模型的誤差還要大(在2.3節(jié)中,模型的RMSE占樣品有機(jī)質(zhì)含量平均值的16~18%)。
在分析采樣位置導(dǎo)致的誤差中,取每個(gè)土層兩個(gè)環(huán)刀樣實(shí)測(cè)有機(jī)質(zhì)含量的平均值作為該土層有機(jī)質(zhì)含量的實(shí)測(cè)值。圖8(b)表明,同一土層上環(huán)刀采樣位置的不同也會(huì)導(dǎo)致明顯不同的估測(cè)值,說明采樣位置不同導(dǎo)致的誤差比較明顯[圖8(b)中的藍(lán)色點(diǎn)]。進(jìn)一步的相關(guān)性分析表明,用標(biāo)準(zhǔn)偏差表示的該誤差與土層有機(jī)質(zhì)實(shí)測(cè)值的相關(guān)系數(shù)為0.30,達(dá)到了0.01水平上的顯著性。因此,采樣位置不同產(chǎn)生的標(biāo)準(zhǔn)偏差也會(huì)隨著實(shí)測(cè)值的增大而增加。表4列出了該標(biāo)準(zhǔn)偏差的統(tǒng)計(jì)特征??梢?,該標(biāo)準(zhǔn)偏差的平均值、最小值和最大值分別占表1中所有土層實(shí)測(cè)有機(jī)質(zhì)含量平均值的11%,0.03%和57%。因此,由于采樣位置不同導(dǎo)致的估測(cè)標(biāo)準(zhǔn)偏差也較大。進(jìn)一步分析了該標(biāo)準(zhǔn)偏差占對(duì)應(yīng)實(shí)測(cè)值的百分?jǐn)?shù),并將結(jié)果列于表4中。該結(jié)果表明,該標(biāo)準(zhǔn)偏差占實(shí)測(cè)值的百分?jǐn)?shù)平均值為15%。可見,該標(biāo)準(zhǔn)偏差比2.3節(jié)中模型的誤差要小(在2.3節(jié)中,模型的RMSE占樣品有機(jī)質(zhì)含量平均值的16%~18%)。
圖8和表4的結(jié)果都表明,因測(cè)試點(diǎn)位置不同導(dǎo)致的標(biāo)準(zhǔn)偏差明顯大于因采樣位置不同導(dǎo)致的標(biāo)準(zhǔn)偏差。以表4中兩者的平均值來看,前者比后者大約60%。這與前述土壤光譜差異有關(guān)。如前所述,測(cè)試點(diǎn)不同導(dǎo)致的光譜差異比采樣位置不同導(dǎo)致的光譜差異大約76%。因此,在原位光譜估測(cè)土壤屬性的研究中,更應(yīng)該注意測(cè)試點(diǎn)位置不同導(dǎo)致的誤差。迄今為止的文獻(xiàn)大多采用多點(diǎn)測(cè)定和多樣本采樣取平均值來應(yīng)對(duì)這兩種誤差,并未定量分析它們的大小。然而,盡管本文指明了這兩種誤差的大小,但仍然未能提出有效地降低它們的方法。未來,除了研究利用不同的模型來降低誤差外,還需要研究更有效的方法來降低這些誤差。
圖8 測(cè)試點(diǎn)光譜(a)和環(huán)刀樣光譜(b)估測(cè)的有機(jī)質(zhì)含量(黑色)、平均值(綠色)及標(biāo)準(zhǔn)偏差(藍(lán)色)與實(shí)測(cè)有機(jī)質(zhì)含量的對(duì)比;在(b)中,光譜估測(cè)值與實(shí)測(cè)有機(jī)質(zhì)含量進(jìn)行對(duì)比,而其他值都與每個(gè)土層的兩個(gè)環(huán)刀樣的平均值進(jìn)行對(duì)比
表4 原位土壤光譜估測(cè)有機(jī)質(zhì)含量的誤差(用標(biāo)準(zhǔn)偏差表示)的統(tǒng)計(jì)特征Table 4 Statistics of the error of soil organic matter content estimated by in situ soil spectra (by standard deviation)
以我國南方典型丘陵區(qū)林地中的土壤樣品為例,定量分析了光譜測(cè)試點(diǎn)和采樣位置不同導(dǎo)致原位土壤光譜估測(cè)有機(jī)質(zhì)含量中的誤差。結(jié)果表明,光譜測(cè)試點(diǎn)不同導(dǎo)致的土壤光譜差異平均為1.55°,而采樣位置不同導(dǎo)致的土壤光譜差異則相對(duì)較小,平均為0.88°。兩種差異導(dǎo)致光譜估測(cè)土壤有機(jī)質(zhì)的誤差平均值分別為3.64和2.27 g·kg-1,分別占對(duì)應(yīng)實(shí)測(cè)值的31%和15%。并且,前者大于 PLSR模型導(dǎo)致的誤差。結(jié)果表明,測(cè)試點(diǎn)和采樣位置不同導(dǎo)致原位光譜估測(cè)土壤屬性的誤差較大,在今后的研究中應(yīng)當(dāng)注意它們的影響。未來研究還需要探討如何降低這些誤差,提高原位光譜估測(cè)土壤屬性的準(zhǔn)確性。