田安紅, 付承彪, 熊黑鋼, 趙俊三
(1.曲靖師范學(xué)院 信息工程學(xué)院, 云南 曲靖 655011 ; 2.北京聯(lián)合大學(xué) 應(yīng)用文理學(xué)院,北京 100083; 3.昆明理工大學(xué) 國(guó)土資源工程學(xué)院, 昆明 650093)
新疆作為典型的干旱半干旱農(nóng)業(yè)區(qū),擁有廣袤無(wú)垠的土地資源[1-2],但其鹽漬化現(xiàn)象嚴(yán)重,土壤貧瘠,鹽分含量高,養(yǎng)分含量低,實(shí)際中可用于耕地的面積很少。然而,土壤鹽漬化是全球的生態(tài)環(huán)境問(wèn)題,會(huì)嚴(yán)重限制農(nóng)業(yè)的可持續(xù)利用與發(fā)展,現(xiàn)已成為土壤退化過(guò)程的主要類(lèi)型[3]。近年來(lái),針對(duì)土壤元素的預(yù)測(cè)模型多數(shù)采用偏最小二乘和逐步多元回歸等線性模型來(lái)反演[4-5],但因土壤高光譜數(shù)據(jù)與土壤元素之間呈現(xiàn)為非線性關(guān)系,傳統(tǒng)線性模型的估測(cè)精度不理想。然而,BP 神經(jīng)網(wǎng)絡(luò)(Back propagation neural network,BPNN)理論上可以逼近任意的非線性函數(shù)[6-7],在定量反演非線性問(wèn)題時(shí)具有較大的優(yōu)勢(shì)。如刁萬(wàn)英等[8]以砂土和壤土為研究對(duì)象,利用人工神經(jīng)網(wǎng)絡(luò)模型結(jié)合室內(nèi)光譜數(shù)據(jù)預(yù)測(cè)土壤的含水量,仿真結(jié)果表明與指數(shù)、對(duì)數(shù)和線性模型相比較,人工神經(jīng)網(wǎng)絡(luò)模型對(duì)兩種類(lèi)型土壤含水量的預(yù)測(cè)精度最高,該模型更具有普適性。盧志宏等[9]采用70個(gè)特征波段和BP神經(jīng)網(wǎng)絡(luò)模型估算草原礦區(qū)的氮和磷含量,結(jié)果表明當(dāng)隱藏層的節(jié)點(diǎn)數(shù)為10,3,6時(shí),BP模型對(duì)氮和磷的預(yù)測(cè)精度最好,具有較大的擬合優(yōu)度和較小的均方根誤差。郭云開(kāi)等[10]以長(zhǎng)沙縣的土壤為研究對(duì)象,利用BP神經(jīng)網(wǎng)絡(luò)反演土壤重金屬元素Cu的含量,其擬合優(yōu)度為0.721,遠(yuǎn)大于線性回歸模型的擬合優(yōu)度值,且預(yù)測(cè)精度為0.823。
但已有文獻(xiàn)采用BPNN模型對(duì)土壤元素的估算主要是針對(duì)同一研究區(qū)域的土壤,且預(yù)測(cè)對(duì)象多為鹽分、水分、有機(jī)質(zhì)、氮、磷、鉀等土壤元素。然而,目前針對(duì)不同人為活動(dòng)區(qū)域的鹽漬土元素的高光譜反演鮮有報(bào)道,尤其是土壤鹽分的主要陽(yáng)離子研究報(bào)道則更少。但是,人為活動(dòng)對(duì)土壤的干擾在自然界中較為常見(jiàn),人為活動(dòng)的強(qiáng)度大小、方式類(lèi)型和持續(xù)作用時(shí)間,都會(huì)改變土壤的理化性質(zhì)[11],造成土壤元素在空間上的變異。同時(shí),新疆鹽漬土的主要類(lèi)型之一為易溶鹽,易溶鹽主要包含硫酸鈉和氯化鈉,土壤鹽分的陽(yáng)離子Na+在鹽漬土的形成過(guò)程中起著重要作用。因此,本研究以新疆沒(méi)有受到人為活動(dòng)影響的土壤和受到人為活動(dòng)影響的土壤為研究對(duì)象,利用BPNN模型、偏最小二乘模型和逐步多元回歸模型對(duì)比分析不同人為活動(dòng)區(qū)域的鹽漬土Na+離子的高光譜估算結(jié)果,并力圖解釋Na+離子在不同研究區(qū)域的反演精度的機(jī)理,為合理利用新疆的土地資源提供一定的理論依據(jù)。
以新疆維吾爾自治區(qū)阜康市的鹽漬土為研究區(qū),其坐標(biāo)為43°29′—45°45′N(xiāo),87°44′—88°46′E。根據(jù)野外考察情況,主要以人類(lèi)活動(dòng)對(duì)土壤的干擾程度進(jìn)行劃分,即A區(qū)(無(wú)人為活動(dòng)的區(qū)域)和B區(qū)(有人為活動(dòng)的區(qū)域)。由于A區(qū)和B區(qū)中間有一條水渠,其長(zhǎng)度為15.30 km,A區(qū)因被水渠相隔,基本沒(méi)有人類(lèi)活動(dòng),土壤表層維持住原有的生態(tài)風(fēng)貌,主要植被為紅柳、豬毛菜和梭梭等。而B(niǎo)區(qū)距離新疆102建設(shè)兵團(tuán)的距離很近,該區(qū)域經(jīng)常受到人類(lèi)日常活動(dòng)的影響,并且,近2 a內(nèi)有大部分土壤被人工種植開(kāi)發(fā)為育苗林地、榆樹(shù)林地等。
土壤樣本的采集時(shí)間為2017年5月9日到23日,在A區(qū)布設(shè)采樣線5條,B區(qū)布設(shè)采樣線6條,且在每條采樣上間隔400 m左右選擇5個(gè)代表性的采樣點(diǎn),A區(qū)共25個(gè)采樣點(diǎn),B區(qū)共30個(gè)采樣點(diǎn),一共為55個(gè)采樣點(diǎn),見(jiàn)圖1。采集土壤樣本0—20 cm,并密封帶回實(shí)驗(yàn)室經(jīng)過(guò)風(fēng)干、剔除碎石、研磨、孔篩等處理后,送到中科院新疆生態(tài)與地理研究所[12],由化驗(yàn)員測(cè)量土壤Na+離子含量。
圖1 土壤采樣點(diǎn)
采用ASD FieldSpec3光譜儀測(cè)量研究區(qū)的土壤室外高光譜,光譜儀的波長(zhǎng)范圍為350~2 500 nm。在室外測(cè)量時(shí),選擇天空晴朗且無(wú)風(fēng)的天氣,測(cè)量時(shí)間為新疆13:00—15:00之間。測(cè)量前進(jìn)行白板校正,且探頭垂直向下測(cè)量高光譜,每個(gè)采樣點(diǎn)重復(fù)測(cè)量10次,按梅花樁采樣方法,共計(jì)每個(gè)樣點(diǎn)測(cè)量得到50條高光譜數(shù)據(jù),取其平均值即為該樣本點(diǎn)的野外高光譜反射率曲線。同時(shí),采集的高光譜需要?jiǎng)h除邊緣波段(350~390 nm和2 401~2 500 nm)和水分吸收帶(1 355~1 410 nm和1 820~1 942 nm)附近的波段。
BPNN是一種處理非線性問(wèn)題的模型,一般由輸入層、隱藏層和輸出層構(gòu)成,其基本原理是將神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的結(jié)果情況反饋給隱藏層,并調(diào)整權(quán)值和閾值,使得總誤差達(dá)到最小,從而滿足預(yù)期的學(xué)習(xí)要求。
利用Matlab 2019年編程實(shí)現(xiàn)BPNN模型的訓(xùn)練過(guò)程,首先,選擇60%的樣本作為訓(xùn)練,40%的樣本作為測(cè)試,則A區(qū)的訓(xùn)練和測(cè)試樣本分別為15個(gè)和10個(gè),B區(qū)的訓(xùn)練和測(cè)試樣本分別為18個(gè)和12個(gè)。其次,對(duì)輸入?yún)?shù)和輸出參數(shù)進(jìn)行歸一化處理,易于網(wǎng)絡(luò)的收斂。最后,設(shè)置訓(xùn)練參數(shù),最大訓(xùn)練迭代次數(shù)為1 000,學(xué)習(xí)速率為0.001,隱藏層節(jié)點(diǎn)數(shù)為100,訓(xùn)練目標(biāo)的最小誤差為le-6,訓(xùn)練函數(shù)為trainscg。
本研究采用BPNN模型來(lái)建模預(yù)測(cè)Na+離子含量,并對(duì)比分析偏最小二乘(PLSR)和逐步多元回歸(SMLR)模型的預(yù)測(cè)效果。本研究采用決定系數(shù)(R2),均方根誤差(RMSE)和相對(duì)分析誤差(RPD)3個(gè)參數(shù)指標(biāo)來(lái)評(píng)估模型的精度[13]。R2代表模型的擬合程度,其值越接近于1,說(shuō)明擬合程度越好。RMSE代表樣本的真實(shí)值與模型的預(yù)測(cè)值的偏小。RPD代表模型的預(yù)測(cè)性能,一般RPD≥2.0代表該模型的預(yù)測(cè)性能很好,1.8≤RPD<2.0代表模型的預(yù)測(cè)性能較好,1.4≤RPD<1.8代表模型的預(yù)測(cè)性能一般,1.0≤RPD<1.4代表模型的預(yù)測(cè)性能很差,RPD<1.0代表模型不具有預(yù)測(cè)能力。
易溶鹽(硫酸鈉、氯化鈉)是新疆鹽漬土的主要類(lèi)型,Na+在鹽漬土的形成過(guò)程中起著重要的作用。研究區(qū)化驗(yàn)的4種陽(yáng)離子(Ca2+,Mg2+,K+,Na+)統(tǒng)計(jì)特征見(jiàn)表1。Na+在A區(qū)和B區(qū)中所占比例最高分別為48.4%和62.3%,其均值在4種陽(yáng)離子中也最大分別為1.590,2.148。
表1 研究區(qū)陽(yáng)離子含量統(tǒng)計(jì)特征
圖2A和圖2B為在A區(qū)和B區(qū)中選擇前7個(gè)土壤樣本的高光譜反射率曲線。由于土壤的高光譜是土壤中多種組分信息(鹽分、有機(jī)質(zhì)、氮磷鉀等)和周?chē)h(huán)境(土壤類(lèi)型、植被、氣象等)的綜合反映,F(xiàn)ieldSpec?3 Hi-Res光譜儀測(cè)量得到的高光譜反射率曲線與某一具體元素之間呈現(xiàn)為非線性關(guān)系,圖2說(shuō)明高光譜與Na+離子含量為非線性關(guān)系,而不是單調(diào)的遞增或遞減的線性關(guān)系。
圖2 土壤的高光譜反射率曲線
原始高光譜與Na+離子的相關(guān)系數(shù)如圖3所示。倒數(shù)變換后的高光譜與Na+離子的相關(guān)系數(shù)如圖4所示。圖3和圖4均表明A區(qū)和B區(qū)中的0階微分都沒(méi)有相關(guān)系數(shù)通過(guò)0.05顯著性檢驗(yàn),一階微分和二階微分有大量波段的相關(guān)系數(shù)通過(guò)0.05顯著性檢驗(yàn),統(tǒng)計(jì)結(jié)果為原始高光譜的一階微分和二階微分通過(guò)0.05檢驗(yàn)的波段數(shù)量,在A區(qū)分別92個(gè)和107個(gè),在B區(qū)分別為119個(gè)和57個(gè);倒數(shù)變換后高光譜的一階微分和二階微分通過(guò)0.05檢驗(yàn)的波段數(shù)量,在A區(qū)分別為248個(gè)和140個(gè),在B區(qū)分別為125個(gè)和75個(gè)。并且,一階微分和二階微分對(duì)應(yīng)的相關(guān)系數(shù)曲線中包含更多的吸收峰和吸收谷。本研究將A區(qū)和B區(qū)中通過(guò)0.05檢驗(yàn)的一階與二階微分對(duì)應(yīng)的波段選擇為特征波段,其對(duì)應(yīng)的高光譜反射率為BPNN模型的輸入變量。
圖3 原始高光譜與Na+離子的相關(guān)系數(shù)
圖4 倒數(shù)變換后的高光譜與Na+離子的相關(guān)系數(shù)
采用BPNN,PLSR和SMLR這3種模型估算Na+離子含量,兩種光譜變換下的模型結(jié)果見(jiàn)表2。在A區(qū),BPNN模型在兩種光譜變換中的RPD值均大于2.0,其預(yù)測(cè)能力很好,且最好的預(yù)測(cè)效果屬于1/R的二階微分,其RPD值為2.461 6,R2為0.860 9,RMSE為0.350 1。在B區(qū),BPNN模型在原始高光譜變換中,RPD值在1.8與2.0之間,表明其預(yù)測(cè)能力好;BPNN模型在倒數(shù)變換中,RPD值大于2.0,表明其預(yù)測(cè)能力很好,且最好的預(yù)測(cè)效果屬于1/R的二階微分,其RPD值為2.169 8,R2為0.800 6,RMSE為0.803 5。而在A區(qū)和B區(qū)中,PLSR模型在兩種光譜變換中的RPD值均在1.4~1.8之間,其預(yù)測(cè)能力一般;SMLR模型在兩種光譜變換中的RPD值均在1.0~1.4之間,其預(yù)測(cè)能力很差。表2顯示BPNN模型在A區(qū)對(duì)Na+離子的預(yù)測(cè)精度高于B區(qū),這是因?yàn)锳區(qū)基本沒(méi)有受到人類(lèi)日?;顒?dòng)的影響,其土壤基本維持著原有的生態(tài)風(fēng)貌;而B(niǎo)區(qū)受到人類(lèi)日?;顒?dòng)的影響較大,且土壤被人類(lèi)犁地、翻耕和種植育苗林地,破壞土壤表層的物理結(jié)皮和生物結(jié)皮,又因研究區(qū)域地處干旱區(qū),土壤的水分蒸發(fā)非常強(qiáng)烈,土壤中的鹽分隨著水分的蒸發(fā)被帶到土壤表層,呈現(xiàn)鹽分表聚的現(xiàn)象,B區(qū)土壤的變化更為復(fù)雜,其預(yù)測(cè)難度高于A區(qū),因此A區(qū)的預(yù)測(cè)精度高于B區(qū)。
1/R光譜變換在二階微分處的BPNN模型均是A區(qū)和B區(qū)的最佳預(yù)測(cè)模型,其真實(shí)值與預(yù)測(cè)值的散點(diǎn)圖如圖5所示,其BPNN模型的訓(xùn)練過(guò)程如圖6所示。圖5顯示,驗(yàn)證集中A區(qū)的R2為0.860 87,擬合方程為y=1.2453x+0.45153。驗(yàn)證集中B區(qū)的R2為0.800 6,擬合方程為y=1.0287x+0.3654。圖6顯示,A區(qū)BPNN模型的輸入變量為140個(gè)高光譜,隱藏層的節(jié)點(diǎn)個(gè)數(shù)為100,輸出層有1個(gè)變量,共迭代19次滿足精度要求。B區(qū)BPNN模型的輸入變量為75個(gè)高光譜,隱藏層的節(jié)點(diǎn)個(gè)數(shù)為100,輸出層有1個(gè)變量,共迭代9次滿足精度要求。
表2 驗(yàn)證集中不同建模方法的精度比較
圖5 BPNN模型的真實(shí)值與預(yù)測(cè)值的散點(diǎn)圖
圖6 BPNN模型的訓(xùn)練過(guò)程
(1) BPNN模型的預(yù)測(cè)精度高,訓(xùn)練時(shí)間短,迭代次數(shù)少,且1/R二階微分處理后的BPNN均是A區(qū)和B區(qū)的最佳反演模型。在驗(yàn)證集中,BPNN模型在A區(qū)RPD=2.4616,R2=0.8609,在B區(qū)RPD=2.1698,R2=0.8006。
(2) 兩種光譜變換在A區(qū)和B區(qū)中,PLSR模型的RPD值均在1.4~1.8之間,其預(yù)測(cè)能力一般;SMLR模型的RPD值均在1.0~1.4之間,其預(yù)測(cè)能力很差。說(shuō)明在不同研究區(qū)域中,BPNN模型均表現(xiàn)出最優(yōu)的預(yù)測(cè)結(jié)果。