沈佳麗,陳頌超,胡碧峰,李碩*
(1.華中師范大學(xué)地理過程分析與模擬湖北省重點(diǎn)實(shí)驗(yàn)室,武漢 430079;2.浙江大學(xué)杭州國(guó)際科創(chuàng)中心,杭州 311200;3.江西財(cái)經(jīng)大學(xué)旅游與城市管理學(xué)院,南昌 330013)
土壤有機(jī)碳(Soil Organic Carbon,SOC)作為陸地碳庫(kù)的主體,是農(nóng)田生態(tài)系統(tǒng)可持續(xù)發(fā)展的重要基石。SOC 的巨大存量及長(zhǎng)期流轉(zhuǎn)在陸地碳庫(kù)的源匯平衡和糧食生產(chǎn)等一系列生態(tài)系統(tǒng)服務(wù)中發(fā)揮著重要作用[1?2]。因此,厘清SOC 空間分異并準(zhǔn)確估算SOC 儲(chǔ)量,對(duì)于保障國(guó)家農(nóng)業(yè)可持續(xù)發(fā)展和生態(tài)文明建設(shè)至關(guān)重要。受植物根系和農(nóng)業(yè)土地利用方式的影響,富含SOC 的土體表層(0~30 cm)得到廣泛關(guān)注。然而深層土壤(>30 cm)的SOC 儲(chǔ)量約占1 m 深度的45%~55%[3?4],也是碳循環(huán)的活躍部分。數(shù)字土壤制圖是以土壤?景觀模型為理論基礎(chǔ),以空間分析和數(shù)學(xué)方法為技術(shù)手段的土壤調(diào)查與制圖方法,相較于傳統(tǒng)手工土壤制圖更加高效和可信。地統(tǒng)計(jì)、確定性插值、數(shù)理統(tǒng)計(jì)和模糊推理方法在中小尺度上取得了較高的精度,而在大尺度下機(jī)器學(xué)習(xí)方法的優(yōu)勢(shì)更明顯[5]。這是因?yàn)橐环矫嬖诖蟪叨取⒍喹h(huán)境因子交互作用下,土壤屬性與環(huán)境因子呈現(xiàn)非線性關(guān)系;另一方面,目前的采樣密度往往過于稀疏,不足以使樣點(diǎn)在大尺度范圍內(nèi)表現(xiàn)出空間自相關(guān)性[6]。機(jī)器學(xué)習(xí)模型通過提取土壤屬性與環(huán)境變量之間的關(guān)系預(yù)測(cè)土壤屬性的空間分布,可以克服土壤屬性與環(huán)境變量的非線性問題[7]。江漢平原作為長(zhǎng)江經(jīng)濟(jì)帶的重要構(gòu)成區(qū),其SOC 含量或儲(chǔ)量估算的研究大多局限于利用地統(tǒng)計(jì)插值的方法,且研究深度多集中于表土(0~20 cm)[8?10]。在對(duì)最新土壤信息的需求愈發(fā)增強(qiáng)的背景下,準(zhǔn)確表征SOC 水平和垂直空間變化對(duì)推進(jìn)“雙碳”目標(biāo)的決策支持具有重要的現(xiàn)實(shí)意義。本研究利用歷史土壤剖面數(shù)據(jù)結(jié)合機(jī)器學(xué)習(xí)算法,繪制高精度SOC 含量數(shù)字土壤圖并預(yù)測(cè)江漢平原1 m 深度的SOC 儲(chǔ)量。
江漢平原屬亞熱帶濕潤(rùn)季風(fēng)氣候。其南抵長(zhǎng)江,北沿漢江,西經(jīng)沙市,東達(dá)武漢,平均海拔27 m,面積2×104km2。研究區(qū)內(nèi)河湖眾多,耕作歷史悠久,主要種植作物有水稻、棉花、油菜等。本研究使用2017 年版《中國(guó)土系志·湖北卷》中2009—2012 年的土壤調(diào)查數(shù)據(jù)[11],共計(jì)66個(gè)土壤剖面(圖1)。
圖1 研究位置和樣點(diǎn)分布圖Figure 1 The location of the study region and soil sampling sites
依據(jù)《土壤調(diào)查實(shí)驗(yàn)室分析方法》[12],土壤容重依據(jù)環(huán)刀法測(cè)定,土壤有機(jī)質(zhì)分析采用重鉻酸鉀?硫酸消化法測(cè)定,SOC 含量由有機(jī)質(zhì)含量經(jīng)Blemmelen 系數(shù)(0.58)換算而得。本研究在軟件Spline Tool V2.0中采用等面積二次樣條函數(shù)(λ=0.000 1)將不同發(fā)生層采樣深度的SOC 含量統(tǒng)一轉(zhuǎn)換至0~30、>30~60 cm和>60~100 cm 三個(gè)土層深度,即每層66 個(gè)樣點(diǎn)。各深度SOC 含量的分布特征如表1 所示,SOC 平均含量整體隨深度增加而降低。
基于SCORPAN 土壤景觀模型[13?14],本研究選擇2009—2012 年可獲取的地形、氣候、生物、土壤質(zhì)地等數(shù)據(jù)作為表征SOC 空間變異的環(huán)境協(xié)變量(表2),不同分辨率的環(huán)境協(xié)變量經(jīng)最鄰近插值法統(tǒng)一至30 m 空間分辨率,用于空間預(yù)測(cè)模型和制圖。所有環(huán)境協(xié)變量空間分布如圖2所示。
表1 研究區(qū)土壤有機(jī)碳含量的統(tǒng)計(jì)結(jié)果Table 1 Statistical results of SOC contents
表2 環(huán)境協(xié)變量及來源Table 2 Environmental covariates and sources
圖2 環(huán)境協(xié)變量空間分布Figure 2 Spatial distribution of environmental covariates
續(xù)圖2 環(huán)境協(xié)變量空間分布Continued figure 2 Spatial distribution of environmental covariates
本研究使用隨機(jī)森林(Random Forest,RF)算法構(gòu)建基于環(huán)境協(xié)變量的SOC含量預(yù)測(cè)模型。RF是機(jī)器學(xué)習(xí)方法的一種,是基于樹的集合模型,將生成的大量獨(dú)立的樹的預(yù)測(cè)值進(jìn)行平均得到因變量的預(yù)測(cè)值。該模型可在不增加偏差的情況下減少總體方差,具有較好的泛化能力,還可評(píng)估自變量在模型中的重要性[15]。RF模型有兩個(gè)關(guān)鍵參數(shù):Mtry(樹分支的變量個(gè)數(shù))和Ntree(森林中樹的個(gè)數(shù)),通過TuneGrid 優(yōu)化為1 和500。使用caret軟件包的“varImp”函數(shù)來確定變量的重要性[16]。使用決定系數(shù)(Coefficients of Determina?tion,R2)、均方根誤差(Root Mean Squared Error,RMSE)、平均誤差(Mean Error,ME)來綜合評(píng)估模型精度,公式如下:
式中:n代表樣點(diǎn)數(shù)量;yi和分別為觀測(cè)值和預(yù)測(cè)值;為觀測(cè)值均值。
由于研究區(qū)總樣本數(shù)較少,為避免建模驗(yàn)證集合劃分策略對(duì)各精度指標(biāo)計(jì)算的影響,本研究分別對(duì)各土層深度的全部樣本進(jìn)行建模,并采用二十折交叉檢驗(yàn)的精度來驗(yàn)證模型精度。所有的數(shù)據(jù)處理和建模預(yù)測(cè)均在軟件R和ArcGIS中實(shí)現(xiàn)。
有機(jī)碳密度(SOCD)的計(jì)算公式為[17]:
式中:SOCD為有機(jī)碳密度,kg·m?2;BD為土壤容重,g·cm?3;SOC為土壤有機(jī)碳含量,g·kg?1;H為土層厚度,cm;G為石礫體積分?jǐn)?shù),%。
運(yùn)用公式(4)計(jì)算有機(jī)碳儲(chǔ)量(SOCS):
式中:SOCS為土壤有機(jī)碳儲(chǔ)量,g;i為柵格序號(hào);A為每個(gè)柵格的面積,m2。
RF 模型交叉驗(yàn)證的精度如表3 所示。其中,0~30 cm 的模型精度在三個(gè)土層深度中最優(yōu),其RMSE和ME最小。盡管>60~100 cm 土層的R2略高于>30~60 cm 土層深度,但前者的RMSE和ME也均高于后者,說明>30~60 cm 土層預(yù)測(cè)模型相較于>60~100 cm土層誤差更小。綜上,三個(gè)評(píng)價(jià)指標(biāo)值均呈現(xiàn)出隨深度增加而增加的趨勢(shì)。
表3 不同土層深度的土壤有機(jī)碳含量預(yù)測(cè)精度Table 3 Average prediction accuracy of SOC contents at three different soil depths
圖3 為RF 模型預(yù)測(cè)江漢平原0~30、>30~60 cm和>60~100 cm 三種不同土層深度SOC 含量的空間分布圖。江漢平原SOC 含量呈現(xiàn)從表層向深層遞減的趨勢(shì),中東部及南部地區(qū)的SOC 含量較高,主要集中在荊州監(jiān)利市、荊州洪湖市以及仙桃市三地交壤之處。在表層0~30 cm,潛江市與江陵縣SOC 含量較低,江漢平原東部及南部地區(qū)SOC含量整體比西部和北部地區(qū)高。而在中間層以及深層中,江漢平原除了中部地區(qū)SOC 含量較高之外,東部及西北部地區(qū)的SOC含量普遍較低。
圖3 江漢平原各土層深度的SOC含量分布Figure 3 Distribution of SOC contents at different soil depth in Jianghan Plain
圖4為0~30 cm的SOC預(yù)測(cè)模型中的變量相對(duì)重要性,其中,F(xiàn)eature 代表用于建模的所有特征變量(即本研究的環(huán)境協(xié)變量);Inc Node Purity 代表節(jié)點(diǎn)純度,值越大說明特征變量的重要性越強(qiáng)。氣候因子是模型最重要的環(huán)境協(xié)變量,溫度和降水分別排在第一和第三;土壤因子中的黏粒含量排第二。同為生物因子,排第四的凈初級(jí)生產(chǎn)力(NPP)在模型中的重要性明顯高于排第八的歸一化植被指數(shù)(NDVI)。而高程(DEM)作為地形因子,該環(huán)境協(xié)變量對(duì)模型的重要性最低。綜上,研究區(qū)內(nèi)SOC含量的分布受氣候因子、土壤因子以及生物因子的顯著影響,而受地形因子影響最小。
圖4 表層土壤的隨機(jī)森林模型中各環(huán)境因子的相對(duì)重要性Figure 4 Relative importance of environmental covariates from RF model in topsoil
經(jīng)計(jì)算,江漢平原0~30、>30~60 cm 和>60~100 cm 的SOCS 分別為74.98、55.59 Tg 和53.18 Tg,1 m 深度總儲(chǔ)量為183.75 Tg。SOCS 隨土壤深度的增加而減少,但>30~60 cm 和>60~100 cm 的SOCS 約占總儲(chǔ)量的59%,表明江漢平原表層以下土壤有機(jī)碳儲(chǔ)量很豐富。
按照體積對(duì)等方式(面積×深度)將本研究結(jié)果與張濤[10]對(duì)江漢平原0~20 cm 土層的SOCS 估算結(jié)果進(jìn)行了對(duì)比(表4),后者通過地統(tǒng)計(jì)空間插值的方法,由3 071個(gè)第二次全國(guó)土壤普查(20世紀(jì)80年代)和測(cè)土配方施肥數(shù)據(jù)(2012 年)估算得到,SOCS 為70.56 Tg,與本研究的74.98 Tg 相近但略低。此外,筆者還基于SoilGrids250m 數(shù)據(jù)對(duì)相同區(qū)域0~30 cm 土層SOCS 進(jìn)行了估算,對(duì)比后發(fā)現(xiàn)該結(jié)果(125.25 Tg)遠(yuǎn)高于本研究。
表4 不同數(shù)據(jù)來源的江漢平原表層土壤有機(jī)碳儲(chǔ)量估測(cè)結(jié)果對(duì)比Table 4 Comparison of SOCS estimations in the Jianghan Plain from various data sources
建模方法的選取、模型參數(shù)的設(shè)置、建模驗(yàn)證集合的劃分都會(huì)影響模型的精度指標(biāo)計(jì)算。Chen 等[5]在綜述大尺度(>10 000 km2)的數(shù)字土壤制圖工作中指出,均方根誤差是最常用的性能指標(biāo),其次為決定系數(shù)。通常,深層土壤(>30 cm)的SOC預(yù)測(cè)模型精度不及表層(0~30 cm)[18?19],本研究也得到該結(jié)果。這是由于本研究所選用的環(huán)境協(xié)變量大部分都基于表層獲取,如降水、溫度、DEM 等,對(duì)于深層土壤輻射不夠。此外,本研究通過等面積二次樣條函數(shù)對(duì)不同深度間隔的SOC數(shù)據(jù)進(jìn)行了轉(zhuǎn)換,這在一定程度上會(huì)加劇深層SOC預(yù)測(cè)的不確定性。
表層SOC 含量較高的區(qū)域位于江漢平原腹地的仙桃東部、洪湖市和監(jiān)利市,該區(qū)域是湖北省重要的糧食主產(chǎn)區(qū),也是優(yōu)質(zhì)水稻、水產(chǎn)、畜禽集中生產(chǎn)基地。該地區(qū)水田資源豐富,總體農(nóng)業(yè)生產(chǎn)空間分布聚集程度高[20],一定程度上有利于SOC 的積累。此外,水田在水稻生長(zhǎng)季被約5 cm 深的水層淹沒而形成一個(gè)水飽和區(qū),土壤中的水飽和度減緩了SOC 分解,進(jìn)而導(dǎo)致該地區(qū)SOC含量較高[21]。
氣候因子(降水、溫度)對(duì)于SOC等土壤屬性的預(yù)測(cè)非常重要,這與以往的研究是相符的[5]。中部地區(qū)具有適宜微生物生長(zhǎng)的溫度,利于SOC 的積累[22]。研究區(qū)內(nèi)SOC 含量(尤其在0~30 cm 土層深度)呈西北向東南方向遞增趨勢(shì),與區(qū)內(nèi)的氣候因子特別是降水的地帶性變化吻合。SOC 含量在降水豐富的地區(qū)明顯增加,這是由于降水與溫度的綜合作用為SOC的儲(chǔ)存與積累提供了適宜的氣候條件。此外,在降雨量豐富的地區(qū),雨季地表徑流導(dǎo)致土壤中的部分含碳物質(zhì)發(fā)生遷移,造成SOC流失。而在中東部地區(qū)有大量湖泊、河流等水域,被帶走的SOC 在東部地勢(shì)更低平的地區(qū)沉積,并且這種碳質(zhì)的沉淀會(huì)隨著距離增大而逐漸減小[23],最終形成SOC 含量在水域周邊較高的現(xiàn)象。降水豐富有助于增加土壤中的含水量,深層土壤中的含水量處于相對(duì)穩(wěn)定的水平,導(dǎo)致降水對(duì)深層土壤中SOC積累的影響隨深度的增加而降低[21]。
土壤因子是影響SOC 積累的重要因素之一[24?26]。在本研究中,黏粒含量對(duì)SOC 的影響最大,其次為粉砂。這是由于黏粒和粉砂的顆粒較砂粒更小,黏性更大,有利于吸附有機(jī)物和減少SOC的分解。三個(gè)土層深度SOC 含量分布也與其對(duì)應(yīng)深度的黏粒含量變化吻合。江漢平原西北部地區(qū)的砂粒含量較高,一定程度上不利于SOC 的積累,從而導(dǎo)致該地區(qū)SOC 含量更低。結(jié)合圖2 和圖3 可知,江漢平原的SOC 含量尤其是表層SOC含量隨黏粒含量升高而增加。
江漢平原地勢(shì)低平,除邊緣分布有海拔約50 m的平緩崗地和百余米的低丘外,平均海拔在27 m。常用的地形因子有時(shí)難以有效刻畫平原或地形平緩地區(qū)土壤的空間變化[27?28]。本研究先前考察過90 m空間分辨率高程數(shù)據(jù),發(fā)現(xiàn)其不足以精細(xì)表征土壤空間變異,因此選用更精細(xì)的30 m 高程數(shù)據(jù)。雖然在低緩的東部地區(qū)SOC含量有所增加,但在中西部地區(qū)并未隨地形起伏而呈現(xiàn)出較大的變化。這說明在本研究中地形對(duì)SOC 含量變化沒有顯著影響,這與圖4中變量重要性結(jié)果相吻合。
相較于張濤[10]的研究,筆者不僅估算了表層的SOCS,還估算了30 cm 以下至1 m 深的SOC 總儲(chǔ)量。而基于SoilGrids250m 估算的SOCS 遠(yuǎn)高于本研究,是因其結(jié)果是由全球尺度的數(shù)據(jù)估算而得,在研究區(qū)內(nèi)僅5 個(gè)實(shí)測(cè)樣點(diǎn)數(shù)據(jù)。Liang 等[29]在利用第二次全國(guó)土壤普查數(shù)據(jù)繪制中國(guó)有機(jī)質(zhì)基線圖時(shí)也發(fā)現(xiàn),SoilGrids250m存在普遍高估現(xiàn)象。此外,本研究估算結(jié)果的空間分辨率為30 m,較SoilGrids250m 能提供更精細(xì)的土壤空間信息。
本研究利用66個(gè)歷史剖面樣點(diǎn)數(shù)據(jù),基于9個(gè)環(huán)境協(xié)變量和機(jī)器學(xué)習(xí)模型預(yù)測(cè)了江漢平原地區(qū)1 m土層深度的SOC 含量及儲(chǔ)量,并繪制了30 m 高精度SOC分布圖,得到如下結(jié)論:
(1)隨機(jī)森林模型預(yù)測(cè)SOC 含量表現(xiàn)出較好性能,尤其在表層最佳。在選取的9 個(gè)環(huán)境協(xié)變量中,溫度、黏粒含量和降水在SOC預(yù)測(cè)模型中相對(duì)重要性較高。研究區(qū)內(nèi)SOC 含量呈現(xiàn)出隨黏粒含量升高而增加的趨勢(shì)。
(2)江漢平原1 m 深土層的有機(jī)碳總儲(chǔ)量為183.75 Tg,>30~100 cm 土層有機(jī)碳儲(chǔ)量約占1 m 深度總儲(chǔ)量的59%。因此,深層土壤含有豐富的有機(jī)碳儲(chǔ)量,在估算土壤碳庫(kù)等相關(guān)土壤調(diào)查工作時(shí)深層土壤信息不容忽視。
農(nóng)業(yè)資源與環(huán)境學(xué)報(bào)2023年3期