黃趙麟,丁 懿,王君櫹①,賈振毅,曾菁菁,周生路
(1.南京大學地理與海洋科學學院,江蘇 南京 210023;2.同濟大學軟件學院,上海 201800)
隨著城市化和工業(yè)化進程的快速發(fā)展,土壤重金屬的積累越來越明顯,重金屬污染問題日益嚴峻[1-5]。2014年《全國土壤污染狀況調查公報》顯示,我國土壤點位超標率達到16.1%,其中由重金屬導致的超標點位數(shù)占超標點位總數(shù)的82.8%[6],這一調查結果受到社會各界的廣泛關注。掌握區(qū)域土壤重金屬含量的空間信息與變化特征,是實現(xiàn)土壤資源優(yōu)化利用以及土壤環(huán)境保護和防治的重要手段[7]。因此,拓展土壤重金屬含量空間預測理論,探索和改進空間預測技術手段,具有重要的科學與現(xiàn)實意義。
近年來,人工神經(jīng)網(wǎng)絡(artificial neural network,ANN)方法開始逐漸應用于土壤重金屬污染領域[8]。ANN可通過大量訓練方式完成模型構建和變量預測等工作[9-10],特別適合處理多條件、內部機制不明確和物理過程不清晰的非線性問題[11]。國內外學者選取了不同的建模要素,嘗試優(yōu)化提高模型預測精度,獲得更準確的重金屬空間分布特征。ANAGU等[12]優(yōu)選了13種土壤屬性作為人工神經(jīng)網(wǎng)絡輸入數(shù)據(jù),對德國9種土壤重金屬含量進行預測,發(fā)現(xiàn)其預測精度較線性回歸模型有較大提高;胡大偉等[13]、張紅等[14]選取經(jīng)緯度作為人工神經(jīng)網(wǎng)絡建模要素,預測重金屬污染空間分布特征;郭云開等[15]以高光譜影像中一階微分光譜數(shù)據(jù)作為輸入部分,預測了長沙縣重金屬Cu含量的空間分布特征。目前研究多采用樣點地理坐標、土壤屬性或人類活動等單一因子作為利用神經(jīng)網(wǎng)絡方法預測土壤重金屬含量的建模因素,并且多將單一預測模型應用于多元素與研究區(qū)全境,忽略了空間區(qū)域和重金屬元素間的差異性,缺少對模型適宜性的對比與優(yōu)選研究,這大大削弱了該方法在土壤重金屬污染風險預測、管控和治理等方面的有效性。
基于GIS技術和反向傳播網(wǎng)絡(back-propagation network,簡稱BP神經(jīng)網(wǎng)絡),將影響土壤重金屬分布的“源”因子、土壤屬性的“匯”因子以及空間分異因素納入土壤重金屬空間分布預測模型構建中,進一步對比不同模型在區(qū)位間、重金屬元素間的預測精度,篩選出預測區(qū)域重金屬空間分布的最優(yōu)化方案,以期為區(qū)域土壤重金屬污染評價和管控提供方法和技術支撐。
研究區(qū)為常州金壇區(qū)(31°33′42″ N~31°53′22″ N,119°17′45″ E~119°44′59″ E),位于江蘇省南部地區(qū),面積約為975 km2(圖1)。
金壇屬北亞熱帶季風氣候區(qū),年平均氣溫為15.3 ℃,降水量為1 063.6 mm,主要土壤類型為黃棕壤和水稻土。境內地形自西向東逐漸降低,同時該區(qū)地處長江三角洲腹地,資源豐富,經(jīng)濟發(fā)展迅速,工業(yè)發(fā)展頗具規(guī)模。根據(jù)研究區(qū)的地形和經(jīng)濟差異特征,將研究區(qū)劃分為西部丘陵山地區(qū)、中部平原城鄉(xiāng)區(qū)和東部平原農(nóng)業(yè)區(qū)3大空間區(qū)域。伴隨著經(jīng)濟發(fā)展的同時,區(qū)內土壤也受到了不同程度的重金屬污染。
將研究區(qū)劃分為2 km×2 km網(wǎng)格,每個網(wǎng)格作為1個采樣點,對于區(qū)域邊界上的破碎網(wǎng)格按照四舍五入規(guī)則處理,共選取180個樣點。按照5點混合采樣法采集0~20 cm表層土壤樣品,采用四分法取分析樣品約1.5 kg。樣品經(jīng)自然風干,剔除石礫和植物殘體,研磨后過2 mm孔徑篩,充分混勻后用聚乙烯袋保存?zhèn)溆茫糠滞寥罉悠愤M一步研磨后過0.15 mm孔徑篩以保存?zhèn)溆?。對Cd、Pb、Cr、Cu、Zn元素含量以及pH,有機質(OM)、全碳(TC)、有機碳(Corg)、全氮(TN)、全磷(TP)和全鉀(TK)含量進行測試分析。為確保分析的準確性,對空白和標準樣品(GBW08303,國家標準物質研究中心)同時進行消解,計算得到回收率為96.7%,滿足分析質量控制要求。重金屬含量及土壤理化性質測定所用儀器、方法和檢驗精度按照DD 2005—01《多目標區(qū)域地球化學調查規(guī)范(1∶250 000)》執(zhí)行。
在土壤污染研究中,“源”指以人類活動為代表的重金屬污染物的來源。選取土地利用方式[16]、交通道路[17]、工業(yè)污染源[18]、城市人口密度[19]和水系分布[20-21]作為土壤重金屬“源”指標。相對于土壤重金屬污染的源,“匯”指可以吸納重金屬的土壤理化性質。由于土壤理化性質對重金屬的吸附、遷移和累積能力有較大影響[22-24],故選取pH、OM、TC、Corg、TN、TP和TK作為土壤重金屬“匯”指標。其中,土地利用數(shù)據(jù)、道路交通數(shù)據(jù)和水系分布來源于江蘇省2014年土地變更調查數(shù)據(jù)。人口密度數(shù)據(jù)采用中國公里網(wǎng)格人口分布數(shù)據(jù)集(2010,1 km×1 km)。工業(yè)污染源僅包含研究區(qū)內國家重點監(jiān)控污染企業(yè),其基本信息下載自生態(tài)環(huán)境部網(wǎng)站(http:∥www.mee.gov.cn/)。高程、坡度數(shù)據(jù)來源于地理空間數(shù)據(jù)云平臺(http:∥www.gscloud.cn/)。
BP神經(jīng)網(wǎng)絡是神經(jīng)網(wǎng)絡模型中的一種基于誤差反傳遞算法訓練的多層前饋網(wǎng)絡,它包含神經(jīng)網(wǎng)絡理論中的精華部分,現(xiàn)已成為影響最大、應用最廣的機器學習算法之一[10,25]。BP神經(jīng)網(wǎng)絡的模型訓練主要分為網(wǎng)絡輸入信號正向傳輸和誤差信號反向傳輸2個部分,逐層修正模型連接權值,2個階段反復交替進行,直到網(wǎng)絡輸出與期望輸出一致為止[26]。
1.4.1模型構建
將基于源-匯因子的模型簡稱為BP-S模型,將基于空間分異的模型簡稱為BP-K模型,同時將考慮多種建模因素并加以改進的模型稱為BP-SK模型。利用MATLAB R2012a軟件中的神經(jīng)網(wǎng)絡構建功能包nntool完成模型構建。模型需要設計的內容包括神經(jīng)網(wǎng)絡層數(shù)、輸入層節(jié)點數(shù)、隱含層節(jié)點數(shù)、輸出層節(jié)點數(shù)、傳輸函數(shù)、訓練方法和訓練步長等參數(shù)。根據(jù)影響重金屬分布的空間分異與源-匯因素,選取30個指標作為輸入層因子(表1)。其中,樣點坐標、工業(yè)污染源距離、土壤屬性因子、人口密度和高程等均以監(jiān)測值表征,不涉及緩沖區(qū)分析。針對土地利用(5種地類)和道路交通,進行500、1 000 和2 000 m 3個半徑系列緩沖區(qū)分析后共得到18(3×6)個影響因子。
表1 BP神經(jīng)網(wǎng)絡輸入因子
Table 1 Input factors of BP neural network
變量因子/單位變量因子/單位變量因子/單位X1500 m緩沖區(qū)內農(nóng)用地面積/hm2X111 000 m緩沖區(qū)內水體面積/hm2X21pH值X21 000 m緩沖區(qū)內農(nóng)用地面積/hm2X122 000 m緩沖區(qū)內水體面積/hm2X22w(OM)/%X32 000 m緩沖區(qū)內農(nóng)用地面積/hm2X13500 m緩沖區(qū)內交通用地面積/hm2X23w(TC)/%X4500 m緩沖區(qū)內農(nóng)村建設用地面積/hm2X141 000 m緩沖區(qū)內交通用地面積/hm2X24w(Corg)/%X51 000 m緩沖區(qū)內農(nóng)村建設用地面積/hm2X152 000 m緩沖區(qū)內交通用地面積/hm2X25w(TN)/(mg·kg-1)X62 000 m緩沖區(qū)內農(nóng)村建設用地面積/hm2X16500 m緩沖區(qū)內道路總長度/kmX26w(TP)/(mg·kg-1)X7500 m緩沖區(qū)內城市建設用地面積/hm2X171 000 m緩沖區(qū)內道路總長度/kmX27w(TK)/%X81 000 m緩沖區(qū)內城市建設用地面積/hm2X182 000 m緩沖區(qū)內道路總長度/kmX28高程/mX92 000 m緩沖區(qū)內城市建設用地面積/hm2X19到污染企業(yè)平均距離/kmX29坡度/(°)X10500 m緩沖區(qū)內水體面積/hm2X20人口密度/(萬人·km-2)X30樣點經(jīng)緯度坐標
OM為有機質,TC為全碳,Corg為有機碳,TN為全氮,TP為全磷,TK為全鉀。
BP-S模型包含所有樣點的27個源-匯影響因子(X1~X27),BP-K模型輸入層包含所有經(jīng)過標準化的樣點的高程、坡度和經(jīng)緯度坐標(X28~X30),隱含層通過多次訓練選取可使模型決定系數(shù)(R2)最大的值,訓練方法選用對于中等規(guī)模神經(jīng)網(wǎng)絡收斂速度最快的Levenberg-Marquart法,學習步長設置為5.0×10-10,學習步數(shù)設置為105,模型達到訓練誤差目標值后自動停止訓練,上述模型均需通過有效性檢查(validation check)。使用采三留一驗證法對模型精度進行評估[27],將180個樣點隨機分為建模點位(135個)和驗證點位(45個)2個部分。
1.4.2模型改進
BP-K模型僅考慮空間分異和自相關性,忽視人類活動和土壤自身屬性,而BP-S模型缺少對經(jīng)緯度坐標、高程和坡度的考慮,重金屬空間分布預測精度可能偏低。因此,根據(jù)BP-K和BP-S模型進行綜合考量,構建基于源、匯和空間分異多種考量因素下的BP-SK模型??紤]到將30個因子作為變量直接構建綜合模型,可能產(chǎn)生共線性問題,且難以揭示變量之間的重要程度,故采用逐步擬合方法對模型進行改進。建模主要過程是首先構建BP-S模型,然后以BP-S模型模擬出的模擬值與真實值之間的殘差為因變量,以經(jīng)緯度為自變量,再次運用BP神經(jīng)網(wǎng)絡建模,利用殘差的空間自相關性對原模型進行修正。模型改進具體過程如下:
(1)輸入源、匯影響因子數(shù)據(jù)及建模點位重金屬含量,構建BP-S模型。
(2)獲得BP-S模型在各建模點位上的模擬值,對比BP-S模型模擬值與建模點位實測值,得到各驗證點位上的殘差值Δy。
(3)將殘差值Δy與建模點位的經(jīng)緯度進行匹配并對數(shù)據(jù)進行標準化。
(4)以Δy為因變量,以建模點位經(jīng)緯度為自變量,構建模擬殘差分布的BP-Δ神經(jīng)網(wǎng)絡模型。
(5)輸入經(jīng)緯度數(shù)據(jù),獲得BP-Δ模型在各建模點位上的殘差模擬值以及在各驗證點位上的殘差預測值。
(6)將BP-S模型的模擬值與BP-Δ模型對應的殘差模擬值相加,得到BP-SK模型模擬值;同理,將BP-S模型的預測值與BP-Δ模型對應的殘差模擬值相加,得到BP-SK模型預測值。
選取R2和赤池信息量(AIC)作為評價模型擬合優(yōu)度的指標[28]:R2越大,表明擬合優(yōu)度越高;若改進的模型AIC值減少3個單位以上,則表明模型得到顯著改善[29]。此外,選取R2、平均誤差(ME)、平均絕對誤差(MAE)、均方根誤差(RMSE)和相對提高度(RI)作為模型預測精度評價指標。R2越大,ME、MAE和RMSE值越小,模型精度則越高;用RI相對百分比表示2個模型預測精度的差異。
研究區(qū)180個樣點土壤重金屬含量與理化性質測定結果的描述性統(tǒng)計結果見表2。
表2 研究區(qū)土壤重金屬含量及理化性質描述性統(tǒng)計
Table 2 Statistical characteristics for heavy metal concentrations and physical characteristics in the study area
指標平均值±標準差最小值最大值峰度偏度變異系數(shù)/%背景值w(Cd)/(mg·kg-1)0.192±0.217 0.081 2.53477.0868.415112.50.09w(Pb)/(mg·kg-1)30.70±28.9720.50422.12140.83711.36687.822.3w(Cr)/(mg·kg-1)78.98±6.5362.50109.562.9790.9228.376.2w(Cu)/(mg·kg-1)26.38±5.4218.2946.802.9790.92220.623.9w(Zn)/(mg·kg-1)69.55±17.3244.52198.1619.4553.11224.965.6pH6.64±0.724.378.160.024-0.31110.8—w(OM)/%2.20±0.551.263.550.3400.25824.9—w(TC)/%1.38±0.320.792.170.1010.22422.70.76w(Corg)/%1.28±0.320.742.06-0.0160.13224.90.27w(TN)/(mg·kg-1)1 393±3147952 2370.3360.03122.6460w(TP)/(mg·kg-1)667±1873361 1572.4401.10528.0525w(TK)/%1.57±0.151.492.36-0.684-0.1650.11.86
OM為有機質,TC為全碳,Corg為有機碳,TN為全氮,TP為全磷,TK為全鉀。
表2顯示,5種重金屬含量普遍超過江蘇省土壤背景值[30],Cd、Pb、Cr、Cu和Zn平均含量分別為土壤背景值的2.13、1.38、1.04、1.10和1.06倍,表明研究區(qū)土壤可能受到不同程度的污染。變異系數(shù)(CV)可以反映數(shù)據(jù)的離散程度,CV越大,說明受人類活動干擾越強烈[31]。5種重金屬CV由大到小依次為Cd、Pb、Zn、Cu和Cr,其中Cd和Pb的CV分別為112.5%和87.8%,屬于高度變異(>36%),說明這2種元素受外界干擾較大;Zn和Cu的CV分別為24.9%和20.6%,屬于中度變異程度(16% 由訓練完畢的BP-S、BP-K和BP-SK模型分別得到各建模點位的重金屬含量模擬值,將模擬值和樣點實測值進行對比計算,并將驗證點位的經(jīng)緯度數(shù)據(jù)輸入訓練完畢的3種模型,獲得驗證點位重金屬含量預測值,對比預測值與驗證點位實測值,獲取不同模型對于不同重金屬的擬合優(yōu)度參數(shù)與預測精度參數(shù)(表3)以及預測值與實測值散點圖(略)。 表3 3種模型擬合優(yōu)度參數(shù)與預測精度參數(shù) Table 3 Goodness-of-fit parameters and predictive precision parameters of three models 元素模型 擬合R2AIC預測R2MEMAERMSECdBP-S0.532-714.3540.4500.0150.0380.071BP-K0.683-887.6440.3200.0070.0470.076BP-SK0.665-745.8780.673-0.0270.0490.066PbBP-S0.702360.8110.4361.4903.7496.795BP-K0.535372.2020.422-0.3134.6166.536BP-SK0.665366.2630.1850.7844.9817.733CrBP-S0.748357.2460.4570.7743.6834.740BP-K0.638398.9080.509-0.0973.4304.139BP-SK0.839310.2150.562-1.2983.9234.538CuBP-S0.751259.8810.508-0.9112.5193.407BP-K0.600254.6840.524-0.5672.3603.128BP-SK0.817217.2940.661-0.5251.8932.682ZnBP-S0.784607.6570.698-4.6796.3298.227BP-K0.605585.1250.454-2.0777.0648.622BP-SK0.906466.6290.7581.3984.0656.123 AIC為赤池信息量,ME為平均誤差,MAE為平均絕對誤差,RMSE為均方根誤差。 在擬合效果方面,除Pb外,BP-K模型對其他重金屬元素的擬合R2均≥0.6,各重金屬的散點圖也基本符合散點聚集于1∶1線周圍的規(guī)律,散點的線性回歸方程系數(shù)均低于0.6,說明模型對于低值的預測偏高,而對于高值的預測偏低,預測值變化幅度?。怀鼵d外,BP-S模型對其他重金屬元素的擬合R2均高于0.7,2個模型擬合效果均較好。經(jīng)改進的BP-SK模型模擬值與實測值散點基本集中在1∶1線附近,說明模型擬合誤差小,對Cd和Pb的擬合R2大于0.6,對Cr和Cu的擬合R2均大于0.8,而對Zn的擬合R2則達到0.906,且BP-SK模型中Cr、Cu和Zn的AIC值較BP-K、BP-S模型均減少3個單位以上,因此,BP-SK模型對Cr、Cu和Zn的擬合優(yōu)度明顯高于其他2個模型。 綜合各模型的預測精度參數(shù)(表3),以R2為判定模型預測精度的主要參數(shù),同時考慮不同模型間ME、MAE和RMSE的差異。在對Cd的預測中,各模型的預測結果差異較大,BP-SK模型預測精度最高,R2達到0.673,BP-S模型次之,R2為0.450,而BP-K模型最低,R2為0.320;在對Pb的預測中,各模型預測結果差異適中,BP-S模型預測精度最高,R2為0.436,而BP-SK模型最低,R2僅為0.185;在對Cr的預測中,各模型預測結果差異較小,BP-SK模型的預測精度最高,BP-K模型次之,BP-S模型最低,R2依次為0.562、0.509和0.457;在對Cu的預測中,各模型預測結果差異較小,BP-SK模型預測精度最高,R2達到0.661,而BP-S模型最低,R2為0.508;在對Zn的預測中,各模型預測結果差異顯著,BP-SK模型預測精度最高,R2為0.758,而BP-K模型最低,R2僅為0.454。綜上所述,BP-SK模型在預測Cd、Cr、Cu和Zn含量時預測精度較高,其R2比BP-S與BP-K模型分別提高0.223、0.105、0.153、0.060與0.353、0.053、0.137、0.304,而BP-S模型對Pb含量的預測效果較好,其R2比BP-K和BP-SK模型分別高0.014和0.251。 根據(jù)研究區(qū)的地形和經(jīng)濟差異特征,將研究區(qū)劃分為西部丘陵山地區(qū)、中部平原城鄉(xiāng)區(qū)和東部平原農(nóng)業(yè)區(qū),得到3種模型在不同空間域的重金屬預測精度參數(shù)(表4),根據(jù)各模型預測精度參數(shù),選取各元素在不同區(qū)域的最優(yōu)模型。在對Cd的預測中,在中部平原城鄉(xiāng)區(qū)BP-SK模型的MAE值和RMSE值分別為0.045和0.082,MAE值比BP-S和BP-K模型分別降低0.004和0.012,RMSE值則分別降低0.012和0.003;在西部丘陵山地區(qū)BP-SK模型MAE和RMSE值分別為0.036和0.057,MAE值比BP-S和BP-K模型分別降低0.017和0.015,RMSE值則分別降低0.012和0.017;而在東部平原農(nóng)業(yè)區(qū),BP-K模型ME、MAE和RMSE值均最低,ME值比BP-S和BP-SK模型分別降低0.006和0.019,MAE值分別降低0.006和0.005,RMSE值則分別降低0.006和0.004。因此,中部平原城鄉(xiāng)區(qū)和西部丘陵山地區(qū)選取預測精度最高的BP-SK模型,東部平原農(nóng)業(yè)區(qū)則選取BP-K模型。同理,在對Pb的預測中,東、中部選取預測精度最高的BP-S模型,西部選取BP-K模型;在對Cr的預測中,東、中部選取預測精度最高的BP-SK模型,西部選取BP-K模型;在對Cu的預測中,中、西部選取預測精度最高的BP-K模型,而東部選取BP-SK模型;在對Zn的預測中,中、西部選取預測精度最高的BP-SK模型,而東部選取BP-S模型。 采用ArcGIS 10.2軟件生成網(wǎng)格,并通過構建緩沖區(qū)、克里格插值等方式獲得所有樣點的經(jīng)緯度、高程、坡度以及27個源匯影響因子數(shù)據(jù),將公里網(wǎng)格數(shù)據(jù)分別輸入BP-K、BP-S和BP-SK模型并得到各模型在相應點位上的預測值,并通過普通克里格(ordinary Kriging)插值后,得到各模型在研究區(qū)全域上的土壤重金屬含量空間預測分布(圖2)??傮w來看,區(qū)域中心城鎮(zhèn)及東北部的經(jīng)濟開發(fā)區(qū)土壤Cd、Pb、Cr、Cu和Zn含量均較高,研究區(qū)西部丘陵山地區(qū)Cd和Pb含量較高,而東部平原農(nóng)業(yè)區(qū)Cu含量較高。Cd高值區(qū)主要分布在中心城鎮(zhèn)與西部丘陵,BP-SK模型對其預測效果較好,但對東部Cd含量的預測精度偏低,而BP-K模型較好地反映了東部Cd含量高值區(qū)與低值區(qū)的區(qū)別;Pb高值區(qū)則集中分布在中心城鎮(zhèn)地區(qū),BP-S模型能較好地區(qū)別Pb在中、東部的高值區(qū)與低值區(qū),而BP-K模型在西部丘陵山地區(qū)的預測效果最好;在對Cr的預測中,3個模型都出現(xiàn)了類似條帶狀的分布特征,BP-SK模型在東、中部的預測精度最高,而BP-K模型能夠反映Cr在西部丘陵區(qū)存在高值;Cu主要分布在城鎮(zhèn)中心,BP-K模型預測效果較好,而BP-SK模型更好地劃分了東部平原農(nóng)業(yè)區(qū)Cu的高值區(qū)與低值區(qū);Zn則集中分布在研究區(qū)中心城鎮(zhèn)與農(nóng)業(yè)區(qū)主要交通干道,BP-SK模型對中、西部的預測效果較好,而對東部地區(qū)預測效果最好的是BP-S模型。 表4 3種模型對5種重金屬的分區(qū)預測精度 Table 4 Predictive precision of different zones among three models 元素模型 西部丘陵山地區(qū)中部平原城鄉(xiāng)區(qū)東部平原農(nóng)業(yè)區(qū)MEMAERMSEMEMAERMSEMEMAERMSECdBP-S-0.0350.0530.069-0.0090.0490.0940.0110.0310.036BP-K-0.0140.0510.0740.0230.0570.0850.0050.0250.030BP-SK0.0320.0360.057-0.0080.0450.0820.0240.0300.034PbBP-S0.0983.8926.219-2.4186.0848.3402.5772.2942.692BP-K-0.5433.0555.132-0.5675.0618.446-1.3642.8834.126BP-SK0.7414.2517.337-2.1776.6039.377-0.7242.9373.418CrBP-S1.1813.7574.3360.8633.8154.4122.4394.4655.131BP-K0.2063.5434.5870.6234.0474.963-1.2173.1824.537BP-SK0.3604.1495.024-1.3963.4073.860-1.6052.1182.555CuBP-S0.3401.6323.9910.1402.6913.5633.6173.0353.490BP-K0.8531.5563.3230.2762.1362.9963.0354.8805.450BP-SK-0.4141.6993.9520.2202.5013.3610.5491.2471.587ZnBP-S6.1637.1617.8025.0608.41510.5100.6723.8164.639BP-K1.8047.2689.0144.0106.3258.573-1.5924.3435.077BP-SK-2.7134.4187.5120.6463.4904.521-3.2024.6095.969 ME為平均誤差,MAE為平均絕對誤差,RMSE為均方根誤差。 根據(jù)各重金屬元素在不同區(qū)域的最優(yōu)預測參數(shù)(表4),選取RMSE衡量優(yōu)選前后模型預測精度變化,根據(jù)優(yōu)選前后模型R2驗證模型預測精度變化,利用RMSE計算優(yōu)選組合后模型空間預測精度較原單一模型(即不考慮空間差異的模型)的相對提高度RI(表5),并得到優(yōu)選后模型預測值與實測值散點圖(圖3)。優(yōu)選組合后模型RMSE值通過加權平均東、中、西部最優(yōu)模型的RMSE值得到,優(yōu)選前模型RMSE值選用各重金屬元素單一最優(yōu)模型RMSE值。結合表3可知,Cd、Cr、Cu和Zn的單一最優(yōu)模型是BP-SK,Pb的單一最優(yōu)模型是BP-S。優(yōu)選組合后模型對Pb和Cr的整體區(qū)域空間預測精度有較大提高,較原單一最優(yōu)模型分別提高20.71%和19.19%,R2分別提高0.059和0.046,Pb的線性回歸方程系數(shù)低于0.6,說明對高值區(qū)的預測值偏低;對Cd和Zn的整體空間預測精度也有顯著提高,精度分別提高15.15%和9.24%,R2分別提高0.028和0.010;Cu的整體空間預測精度提升較小,較原單一最優(yōu)模型精度僅提高1.75%,R2提高0.026,Cr、Cu和Zn模擬值和實測值基本集中在1∶1線附近,說明離散程度較小(圖3)。 圖2 優(yōu)選后土壤重金屬含量預測空間分布結果 表5 優(yōu)選組合前后模型預測精度比較 Table 5 Comparison of predictive precision of model before and after optimization 元素優(yōu)選后各區(qū)域RMSE西部丘陵山地區(qū)中部平原城鄉(xiāng)區(qū)東部平原農(nóng)業(yè)區(qū)優(yōu)選組合后RMSE優(yōu)選組合前RMSE相對提高度RI/%優(yōu)選組合后R2優(yōu)選組合前R2Cd0.0570.0820.0300.0560.06615.150.7010.673Pb5.1328.3402.6925.3886.79520.710.4950.436Cr4.5873.8602.5553.6674.53819.190.6080.562Cu3.3232.9961.5872.6352.6821.750.6870.661Zn7.5124.5214.6395.5576.1239.240.7680.758 RMSE為均方根誤差。 為探究重金屬元素與源-匯、空間分異之間的影響關系,對研究區(qū)重金屬含量與30個變量進行雙變量分析。在源影響因子中,5種重金屬元素與500、1 000和2 000 m緩沖區(qū)城市建設用地面積得到的15個相關系數(shù)中,大部分存在不同程度的相關性,其中存在極顯著相關性(P<0.01)的有8個,存在顯著相關性(P<0.05)的有5個,說明5種重金屬含量的空間分布與城市建設有較強相關性;Cd、Pb、Cu、Zn和Cr與1 000 m緩沖區(qū)內道路總長度間存在顯著相關性,Pb、Cr、Cu和Zn與到污染企業(yè)平均距離間存在極顯著負相關,說明離污染企業(yè)越遠,重金屬受其影響就越小。在匯影響因子中,5種重金屬元素與OM、TC、Corg和TN均存在極顯著相關性,說明土壤理化性質構成了重金屬元素賦存的環(huán)境要素,重金屬含量高低與土壤匯有著密不可分的關系。如土壤有機質對重金屬具有較強的吸附作用,pH環(huán)境的改變也可影響重金屬在土壤中的富集和遷移[32-33];而所選取的4個空間分異因子在解釋Cd、Cr、Cu和Zn含量時,均存在顯著相關因子,但在解釋Pb時,不存在顯著相關因子。相關研究表明Pb含量空間分布主要受到人類活動影響,諸如煤炭燃燒和汽車尾氣排放[31,34],工業(yè)和交通密集地區(qū)Pb含量相對較高[35],“源”因素主導了Pb的空間分布特征。 圖3 優(yōu)選后模型預測值與實測值散點圖 針對不同空間區(qū)位條件對土壤中多種重金屬元素進行差異化、精度最優(yōu)化空間預測是當前亟待解決的科學問題。筆者研究中,BP-SK模型對東部平原農(nóng)業(yè)區(qū)和中部平原城鄉(xiāng)區(qū)的預測精度整體上高于BP-S和BP-K模型。如在東部平原農(nóng)業(yè)區(qū),BP-SK模型對Cu含量的預測精度最高,通過對重金屬元素含量與影響因子的相關性進行分析發(fā)現(xiàn),解釋Cu存在顯著相關性的源匯和空間分異的指標分別占全部源匯和空間因子指標的66.7%和75.0%;在中部平原城鄉(xiāng)區(qū),BP-SK模型對Cd含量的預測精度最高,通過相關性分析發(fā)現(xiàn),解釋Cd存在顯著相關性的源匯和空間分異的指標分別占全部源匯和空間因子指標的70.4%和50.0%,表明其極大地受到源匯和空間分異雙重因素的影響。一方面,這可能是因為東、中部地區(qū)工農(nóng)業(yè)發(fā)達,受人為因素影響劇烈,從而導致重金屬在空間分布中更為復雜;另一方面,重金屬元素也受到空間分異的影響,而BP-SK模型恰好綜合了影響土壤重金屬分布的源匯和空間分異因素,能夠有效地解決這種復雜現(xiàn)象下內部機制不明確的空間非線性問題,更好地揭示土壤污染狀況。相比之下,在西部丘陵山地區(qū)BP-K模型預測效果卻更好。如針對西部丘陵山地區(qū)的Pb選用預測精度最高的BP-K模型,通過相關性分析可知,Pb與源匯因子呈顯著相關的因子數(shù)僅為9個,較東部和中部地區(qū)分別減少5和12個,但Pb與多數(shù)空間分異因子呈顯著相關,說明在該地區(qū)Pb更多地受到地形影響。究其原因,該地區(qū)地勢起伏比平原地區(qū)大,高程和坡度變化頻繁,且丘陵山地區(qū)人為干擾較小,更多地表現(xiàn)出重金屬含量隨自然空間變化而變化的規(guī)律,BP-SK和BP-S模型加入過多人為因素反而降低模型對該地區(qū)的預測精度,故僅考慮空間分異的BP-K模型能更準確地預測丘陵山地區(qū)重金屬分布。因此,在今后的研究中,應區(qū)分不同空間區(qū)域和各元素間的差異,避免模型及其參數(shù)選用的盲目性,科學優(yōu)選出最佳預測模型,可更準確地揭示區(qū)域重金屬含量空間分布。 但筆者研究仍存在不足,模型所選取的重金屬預測參數(shù)更多地側重于土地利用類型的影響,忽略了土壤母質可能對其的影響。另一方面,筆者研究是在區(qū)縣尺度下進行的重金屬含量空間分布預測,并未在其他區(qū)域對筆者研究結論進行驗證,故在涉及其他研究區(qū)域時,筆者研究所得結論有待進一步驗證。 (1)BP-SK模型在對Cd、Cr、Cu和Zn含量的空間預測中,其R2較BP-S和BP-K模型分別提高0.223、0.105、0.153、0.060與0.353、0.053、0.137、0.304;在對Pb的空間預測中,BP-S模型的R2比BP-K和BP-SK模型高0.014和0.251。BP-SK模型較其他模型更能突出局部特征,包含的信息更為豐富。 (2)優(yōu)選組合后模型對Pb和Cr的空間預測精度有較大提高,較原單一最優(yōu)模型分別提高20.71%和19.19%;對Cd和Zn的預測精度也有顯著提高,分別提高15.15%和9.24%;對Cu的預測精度提升較小,較原單一最優(yōu)模型僅提高1.75%。 (3)不同區(qū)域之間同一重金屬含量分布規(guī)律存在差異,BP-SK模型對人為干擾較大地區(qū)的重金屬空間分布預測的適用性較好,BP-K模型對自然要素影響較大的丘陵山地區(qū)土壤重金屬空間分布預測精度較高。2.2 基于不同建模因素的土壤重金屬含量預測精度分析與比較
2.3 不同區(qū)域土壤重金屬模型優(yōu)選組合
3 討論
4 結論