陳睿華,孫 媛,尚天浩,張俊華
(1.寧夏大學地理科學與規(guī)劃學院,寧夏 銀川 750021;2.榆林市自然資源調(diào)查與規(guī)劃中心,陜西 榆林 719000;3.寧夏大學生態(tài)環(huán)境學院,寧夏 銀川 750021)
土壤鹽漬化是由自然或人類活動引起的一種主要的環(huán)境風險,全球大約有8.31億hm2的土壤受到鹽漬化的威脅,約占全球陸地面積的7%[1]。而次生鹽漬化的面積大約為7700萬hm2,其中58%發(fā)生在灌溉農(nóng)業(yè)區(qū),而且這個比例還在增加[2]。土壤鹽漬化已經(jīng)嚴重影響我國經(jīng)濟、生態(tài)的可持續(xù)發(fā)展,西北干旱半干旱地區(qū)尤為嚴重[3]。寧夏銀北地區(qū)降水量小且蒸發(fā)強烈是其土壤鹽漬化嚴重的源頭。土壤陰離子是土壤鹽分的重要組成部分,對土壤鹽漬化的形成有重要影響[4],對該地區(qū)土壤陰離子的準確反演是進行鹽堿地改良和鹽堿化信息監(jiān)測的前提。
國外從20世紀60~70年代開始便將遙感技術(shù)應(yīng)用于土壤學的研究之中[2]。研究發(fā)現(xiàn),有機質(zhì)、鐵的氧化物、土壤水分、土壤機械組成、鹽分離子等都對土壤光譜特性有重要影響[5-6]。在此基礎(chǔ)上大部分學者對鹽分、水分、有機質(zhì)、組成等進行了反演,并取得了較好的效果[7-10],少數(shù)學者將眼光聚焦在土壤陰離子上。土壤離子高光譜定量研究的理論依據(jù)在于土壤組成鹽分、礦物等對特征光譜的吸收或反射。大量的含Cl-可溶鹽在表土聚集析出使土壤變“白”,增高了土壤的反射率,1263~1495、1758~2014、2062~2299 nm區(qū)間附近波段有Cl-的吸收谷[11],而硫酸鹽礦物則會在1795 nm處附近存在對光譜的吸收[12]。同時,土壤含Na+、Cl-及SO42-較多時,NaCl為白色立方晶體或白色顆粒狀晶體,Na2SO4則屬于單斜晶系,集合體呈致密塊狀或皮殼狀,所以光譜反射率都較高[13];若土壤含Na+、CO32-和HCO3-較高,Na2CO3和NaHCO3與水結(jié)合后釋出CO2,土壤表面蓬松且有蜂窩狀外觀,表層相對較粗糙,故表層反射率相對Cl-及SO42-含量高的土壤低;若土壤含Cl-及Mg2+較高,且由于MgCl2具有吸濕性,則土壤表層多呈褐色或暗色,光譜反射率很低[14]。Srivastava等[15]對印度哈里亞納邦印度恒河平原地區(qū)研究表明,1390~2400 nm光譜波段所建立模型對Cl-、SO42-反演較佳,其決定系數(shù)(R2)分別為0.920、0.630;Peng等[16]指出利用線性與非線性模型可以準確預(yù)測HCO3-、SO42-、Cl-,其R2分別為0.870、0.810、0.650;田安紅等[17]對新疆不同人為干擾鹽漬化土壤的SO42-進行反演,指出基于logR一、二階微分對SO42-的反演較佳,R2分別為0.910、0.906;馬利芳等[18]利用相關(guān)性分析(PCC)篩選敏感波段對Cl-進行反演,最佳反演模型的驗證決定系數(shù)(Rp2)為0.800;張俊華等[19]利用一階微分、連續(xù)統(tǒng)去除等多種光譜變換建立了對不同土層鹽分離子的反演模型,結(jié)果發(fā)現(xiàn)經(jīng)過PCC優(yōu)選的R′變換為CO32-、Cl-、SO42-最佳反演變換??偟膩砜?,現(xiàn)有研究對土壤陰離子反演關(guān)注度較少,且研究方法局限于利用數(shù)學變換、PCC對陰離子光譜進行變換及敏感波段的篩選,繼而建立模型,而光譜變換與PCC之外的敏感波段篩選結(jié)合研究方法鮮少。
高光譜數(shù)據(jù)建模的關(guān)鍵是將光譜數(shù)據(jù)與實測數(shù)據(jù)進行有效對接,目前采用的建模方法有主成分回歸法(PCR)[20]、偏最小二乘回歸法(PLSR)[21]、多元逐步回歸法(MSR)[22]、支持向量機法(SVM)[23]、BP神經(jīng)網(wǎng)絡(luò)法(BPNN)[24]等。其中PLSR、PCR可以反映光譜數(shù)據(jù)之間的自相關(guān)問題,在進行土壤離子反演的研究中應(yīng)用最廣泛。另外,SVM通過統(tǒng)計學習中的VC維理論和尋求結(jié)構(gòu)風險最小化原理來提高泛化能力,并且能在保證數(shù)據(jù)精度的同時降低逼近函數(shù)的復(fù)雜度,在解決非線性問題時具有很多優(yōu)勢[23]。Guan等[25]建立了內(nèi)蒙古河套的土壤電導(dǎo)率動態(tài)預(yù)測模型,結(jié)果表明SVM模型最佳;賈萍萍等[26]通過SVM模型建立了對寧夏銀北地區(qū)土壤含鹽量等的反演模型;尚天浩等[27]利用光譜變換與SVM建立了土壤含水量的模型,R2達到了0.980;Weng等[7]建立的鹽分高光譜定量估測模型R2為0.89。
土壤性質(zhì)和環(huán)境條件的差異性導(dǎo)致相同光譜變換、特征波段篩選方法不同,基于高光譜的土壤鹽分及土壤離子反演精度也存在較大差異。寧夏平羅縣屬氯化物-硫酸鹽鹽漬土,因此,本文以野外實測土壤高光譜反射率和室內(nèi)測定土壤陰離子含量為基礎(chǔ)數(shù)據(jù),對光譜進行了6種數(shù)學變換,在利用PCC的基礎(chǔ)上增加逐步回歸(SR)篩選敏感特征波段進行比較,并利用PCR、PLSR和SVM 3種方法進行建模,以尋求一種適合銀北地區(qū)土壤各可溶性陰離子含量反演的最佳模型,為同類區(qū)域的土壤鹽漬化識別和監(jiān)測等提供理論依據(jù)。
寧夏北部平羅縣(38°26′60″~39°14′09″ N,105°57′40″~106°52′52″ E)地處賀蘭山東麓沖洪積扇平原,屬暖溫帶季風氣候,年平均氣溫9℃,平均日照時數(shù)約3008.6 h,利于農(nóng)作物生長。但由于該區(qū)域降水少(平均約173.2 mm)、蒸發(fā)強烈(平均約1755 mm)、地質(zhì)和水文等自然因素復(fù)雜加之不合理的農(nóng)業(yè)灌溉,使土壤鹽分在地表聚集,是典型的土壤鹽堿化地區(qū)。研究結(jié)果顯示,研究區(qū)表土平均含鹽量達到5.28 g/kg,平均pH值為9.17[26]。研究區(qū)土壤類型多為灰鈣土、鹽土、灌淤土等,土地利用類型有耕地、林地、草地、水域和未利用土地等。因此,研究區(qū)利用遙感技術(shù)反演土壤鹽漬化,對防止鹽漬化的進一步加劇及改善生態(tài)具有重要意義。
考慮研究區(qū)表土鹽分的分布特征及土地利用等因素,在研究區(qū)共設(shè)置9個樣點區(qū)(圖1)。在冬灌前使用Spectral evolution公司SR-3500地物光譜儀對土壤野外光譜進行測定,其光譜波段探測范圍為350~2500 nm。土壤野外光譜選取在天氣晴朗,日照充足,風力小的10:00~14:00,在預(yù)設(shè)樣點附近30 m范圍內(nèi)尋找平坦、未經(jīng)人為擾動的裸地進行光譜測定,在每次光譜測定前先進行白板校正,光譜儀探頭設(shè)定為距離土壤表面垂直高度80 cm,每個樣點光譜重復(fù)測定5次,取均值作為該樣點最終反射率。
圖1 研究區(qū)位置與采樣點分布
光譜測定后用手持GPS記錄經(jīng)緯度,在光譜測定原點利用土鉆采取土壤表層(0~20 cm)土壤,并同時記錄四周土地類型與地表覆蓋等信息,共采集樣本57個。對樣品進行實驗室室內(nèi)風干、過篩等預(yù)處理后測定各陰離子含量,其中CO32-和HCO3-采用雙指示劑滴定法測定;Cl-采用AgNO3滴定法測定;SO42-采用EDTA間接絡(luò)合滴定法測定。
噪聲對高光譜數(shù)據(jù)有一定影響,本文基于Sacitzky-Golay法,對原始高光譜反射率數(shù)據(jù)進行平滑去噪處理,對平滑去噪后的高光譜反射率數(shù)據(jù)(R)進行以下5種光譜變換:平滑倒數(shù)(1/R)、平滑對數(shù)(lgR)、平滑倒數(shù)的對數(shù)lg(1/R)、一階微分(R′)、二階微分(R″)。
1.4.1 相關(guān)性分析
PCC是指對2個或多個具備相關(guān)性的變量元素進行分析,從而衡量2個變量因素的相關(guān)密切程度[18]。相關(guān)系數(shù)絕對值的大小可以表征光譜對離子信息的響應(yīng),根據(jù)實測高光譜反射率劃分區(qū)間,將區(qū)間內(nèi)與各陰離子含量相關(guān)性最強波段作為敏感波段,根據(jù)相關(guān)性分析篩選出特征波段,且在P<0.05條件下顯著。
1.4.2 逐步回歸
SR是一種線性回歸模型自變量選擇方法,基本思想是將各個波段光譜信息逐步引入,每引入一個新的波段信息后都會對已入選的波段進行檢驗,將檢驗判定為不顯著的波段進行剔除,以保證引入的波段及其子集中每個波段都是顯著的,直至若干次循環(huán)后不能再引入新的波段[27]。
基于升序等差取樣,將57個樣品分為兩部分,其中選取38個樣品作為訓(xùn)練集,19個樣品作為驗證集?;赑CC和SR篩選到的敏感波段分別對CO32-、HCO3-、Cl-和SO42-4種陰離子構(gòu)建PCR、PLSR和SVM模 型。PCR、PLSR建 模 過程中利用訓(xùn)練集交叉驗證法選擇最佳主成分個數(shù);SVM中核函數(shù)類型使用徑向基函數(shù),使用網(wǎng)格搜索法(Grid search)進行參數(shù)尋優(yōu),按照均方差最小原則確定懲罰參數(shù)C和核參量g的值[17,19]。PCR、PLSR、SVM模型均在The Unscrambler X 10.4中進行。
模型精度通過建模決定系數(shù)(Rc2)、Rp2、均方根誤差(RMSE)和相對分析誤差(RPD)來綜合評價。RMSE越接近0,表示模型精度越高;當RPD<1.0時,表示模型預(yù)測能力極差;當1.0<RPD≤1.4時,表示模型預(yù)測很差;當1.4<RPD≤1.8時,表示模型具有定量預(yù)測的能力;當1.8<RPD≤2.0時,表示模型的預(yù)測能力較好;當2.0<RPD≤2.5時,表示模型具有很好的預(yù)測能力;當RPD>2.5時,表示模型具有極好的預(yù)測能力[28]。
不同的鹽分組成對土壤鹽堿化程度有重要影響。研究區(qū)實測土壤陰離子含量如表1所示,4種陰離子中Cl-含量最高,其對陰離子總量的貢獻度達到52.17%;SO42-含量次之,對陰離子總量的貢獻度為39.89%;HCO3-、CO32-的含量對陰離子總量的貢獻度僅分別為7.28%、6.60%。根據(jù)經(jīng)典鹽堿土分類[29],研究區(qū)土壤屬于氯化物-硫酸鹽鹽漬土。實測土壤陰離子中,CO32-與Cl-含量差異較大,屬于強度變異,HCO3-與SO42-含量差異較小,屬于中等程度變異。
表1 土壤樣品陰離子含量統(tǒng)計
根據(jù)土壤可溶性陰離子含量的差異,對樣本進行聚類分析,將土壤中主要陰離子Cl-和SO42-分為4檔,其光譜反射率曲線如圖2所示。在350~600 nm波段范圍內(nèi)反射率曲線上升趨勢明顯;601~1350 nm波段范圍內(nèi)反射率上升斜率變小;1351~1850 nm波段范圍內(nèi)反射率先不斷下降,之后反射率又呈上升趨勢;在1851~2160 nm波段范圍內(nèi)反射率劇烈波動;在2161~2500 nm波段范圍內(nèi)反射率呈現(xiàn)出緩慢下降趨勢。隨Cl-含量的增大,土壤光譜曲線反射率升高,Cl-含量171.71 mg/kg環(huán)境下土壤反射率較低,比大于2027.30 mg/kg含量降低了44%,這與馬利芳等[18]研究基本一致。不同SO42-含量光譜反射率變化趨勢與Cl-不同,含量大于688.20 mg/kg相比于378.60~688.20 mg/kg的反射率降低18%,說明不同SO42-含量與光譜反射率變化可能存在非線性關(guān)系[17]。
圖2 不同Cl-、SO42-含量光譜曲線特征
2.3.1 相關(guān)性分析
由圖3研究區(qū)土壤各陰離子與6種變換光譜反射率的相關(guān)性可知,Cl-與6種光譜變換相關(guān)性最強,HCO3-次之,CO32-與SO42-相關(guān)性較弱。Cl-與各變換方式相關(guān)性均較強,其中R、R″和R′效果最好;HCO3-相關(guān)性較強的光譜變換方式為R″與R′;與CO32-及SO42-相關(guān)性較強的光譜變換方式均為R″與R′。R′、R″、R、1/R4種光譜變換的土壤陰離子含量與光譜反射率的相關(guān)性較強,因此,PCC選取以上4種光譜變換進行特征波段的篩選與建模。
圖3 不同光譜變換方式陰離子相關(guān)性
戴昌達[30]將我國土壤光譜反射特征曲線劃分為平直、緩斜、陡坎、波浪4種類型。銀北地區(qū)光譜反射特征曲線屬于緩斜型。根據(jù)土壤光譜反射率曲線的斜率特征,將波段分為5個區(qū)間,區(qū)間內(nèi)剔除水分影響。基于4種光譜變換,對陰離子進行相關(guān)性分析,將各區(qū)間內(nèi)與陰離子含量相關(guān)性最大的波段作為敏感波段,并對其進行顯著性檢驗,在0.05水平上顯著時選取此波段作為特征波段。土壤陰離子、4種光譜變換與對應(yīng)波段區(qū)間內(nèi)光譜反射率相關(guān)性最大值如表2所示。土壤CO32-和SO42-在R′、R″變換下敏感波段均通過顯著性檢驗,且SO42-敏感波段均通過極顯著性檢驗,因此,對這2個離子的建模采用R′、R″變換下在0.05水平上顯著的波段作為特征波段。除HCO3-在1/R變換下2491、2500 nm波段通過顯著性檢驗外,其他敏感波段均通過極顯著性檢驗,Cl-在4種變換下均通過極顯著性檢驗。因此,R′、R″、R、1/R在0.05水平上顯著的波段作為特征波段對HCO3-與Cl-進行建模。
表2 不同變換方式下反射率與陰離子含量的相關(guān)系數(shù)
2.3.2 逐步回歸
將6種光譜變換與CO32-、HCO3-、Cl-、SO42-做SR,選取調(diào)整R2≥0.50及P<0.05作為特征光譜方程優(yōu)選閾值。CO32-、SO42-在R′、R″下可以得到特征光譜優(yōu)選方程,HCO3-、Cl-在R、R′、R″下得到特征光譜優(yōu)選方程,其結(jié)果如表3所示。4種離子的特征光譜篩選均通過顯著性檢驗,CO32-的R″變換、HCO3-的R′變換、Cl-的R、R″變換、SO42-的R′變換均為極顯著。SO42-的2種光譜變換均為9條,最少的為Cl-的R變換2條,但其調(diào)整R2也達到了0.771。R′變換對4種離子的特征光譜篩選均具有最佳調(diào)整R2,波段數(shù)量也最多。
表3 逐步回歸特征光譜篩選
對陰離子篩選后的光譜變換方法、特征波段分別利用PCR、PLSR和SVM進行建模,構(gòu)建CO32-、HCO3-、Cl-和SO42-的定量反演模型并進行精度驗證。陰離子反演建模結(jié)果如表4所示。SR篩選特征波段建模擬合度比PCC更高,其Rc2介于0.431~0.970之間,Rp2介 于0.179~0.940之 間,Rp2與Rc2較為接近,未出現(xiàn)過擬合現(xiàn)象;PCC建立模型的Rp2通常比Rc2值高。在模型預(yù)測方面,SR的預(yù)測能力更佳。
表4 土壤陰離子反演模型
PCC光譜變換為R′、R″、R、1/R,其中R′和R″的建模結(jié)果比R和1/R效果更好;SR光譜變換為R′、R″、R,其中R′和R″建模結(jié)果更佳,R對Cl-的建模具有定量預(yù)測能力,對HCO3-的預(yù)測能力有限。
3種模型中SVM的建模結(jié)果最佳,SR-SVM模型Rc2>0.512、Rp2>0.455;PLSR模型在結(jié)果上也較為接近SVM,其也可以在一定程度上保證對離子的反演精度;PCR相比于PLSR與SVM結(jié)果更差,在PCC下不具有定量反演能力。
本文建立的模型對Cl-和SO42-的反演精度更高,Cl-在R″變換下SR-PCR、SR-PLSR、SR-SVM都具有很好的反演能力,其Rc2、Rp2皆大于0.900,RPD大于3.5,具有極好的擬合和預(yù)測能力。SO42-的最佳模型為R″變換下SR-SVM模型,Rc2、Rp2和RPD分別為0.970、0.841和5.59。HCO3-的反演結(jié)果相比Cl-、SO42-次之,R′變換下的SR-SVM等模型也具有很好的反演能力。CO32-的反演結(jié)果最差,但SR-SVM模型仍具有一定的反演能力。
續(xù)表
為提高土壤陰離子反演精度,本研究對土壤高光譜反射率數(shù)據(jù)進行了平滑去噪。平滑去噪后不同的光譜變換可以放大光譜識別的概率,提高對土壤陰離子的反演精度,但不同的光譜變換其結(jié)果具有差異[19]??扇苄喳}基陰離子是土壤鹽分的重要組成部分,在本研究中R″、R′對4種離子的反演精度較高,這與張賢龍等[31]發(fā)現(xiàn)R′、R″等光譜變換對鹽分的反演具有較高的精度相一致。R對Cl-的建模也具有一定的定量預(yù)測能力;1/R對于可溶性鹽基陰離子的反演較差,僅對HCO3-和Cl-通過0.05水平上的顯著性檢驗,且反演精度較低;lgR與lg(1/R)在PCC下與Cl-達顯著相關(guān),但與CO32-、HCO3-和SO42-的相關(guān)性普遍未達顯著水平。代希君等[32]對新疆地區(qū)水溶性鹽基離子反演中HCO3-和SO42-的最佳光譜變換為lg(1/R)和lgR。研究結(jié)果不同主要是由于土壤鹽分組成差異造成的,新疆土壤中陰離子以SO42-為主,屬于硫酸鹽鹽漬土,而本研究區(qū)以Cl-為主,屬于氯化物鹽漬土。
選擇合適的特征光譜是提高土壤陰離子模型反演精度的關(guān)鍵環(huán)節(jié)。PCC對特征波段的篩選中,CO32-、SO42-2種離子僅有R′與R″變換篩選的敏感波段通過顯著性檢驗,而HCO3-、Cl-2種離子在4種變換下的顯著性更好。SR與PCC相對比建模效果更佳,這與張俊華等[19]和孫亞楠等[33]對于SO42-的研究結(jié)果一致。這可能是因為SR作為一種簡化的線性模型,不但對敏感波段進行了保留,還更多地考慮了變量間共線性的問題,通過調(diào)整入選、排除變量的顯著性閾值及迭代次數(shù),進而尋找到最優(yōu)的解釋變量,在保證精度的同時進行簡化[34]。
本研究發(fā)現(xiàn),在傳統(tǒng)的線性模型中,PLSR模型反演效果優(yōu)于PCR。一般來說PLSR與PCR主成分的意義可以用權(quán)重來解釋,但PCR模型可能對于與組分值無關(guān)的一些變量有很大的權(quán)重,使PLSR模型比PCR模型對組分值會有更好的預(yù)測結(jié)果[35]?;跈C器學習SVM的水溶性鹽基陰離子反演精度比起傳統(tǒng)的PCR與PLSR線性模型普遍較高,這與劉亞秋等[11]、孫亞楠等[33]在對離子的反演中,SVM的精度高于傳統(tǒng)線性模型相一致。這是因為SVM的原理是考慮到離子信息的光譜特征并在高維空間尋求最優(yōu)解。
本研究在土壤陰離子的反演中,發(fā)現(xiàn)光譜對Cl-、SO42-和HCO3-都有較好的反演結(jié)果。屈永華等[36]在對內(nèi)蒙古河套灌區(qū)的研究表明,SO42-的反演模型較高,而其他水溶性鹽基離子較難預(yù)測。而本文對Cl-的反演精度最高,SO42-次之?,F(xiàn)有研究中水溶性鹽基陰離子反演精度存在的差異性可能是由于土壤母質(zhì)、土壤成土過程的不同,從而導(dǎo)致土壤中主要離子含量組成的不同,高光譜反射特性機理是對土壤主要離子組成的響應(yīng)。而本研究區(qū)Cl-占水溶性鹽基陰離子的52.17%,其反演結(jié)果最佳,這與王海江等[37]論述一致。研究發(fā)現(xiàn)CO32-利用SR篩選特征光譜相比于PCC顯著提高了模型的擬合和預(yù)測精度。
本研究所在研究區(qū)土壤屬于氯化物-硫酸鹽鹽漬土,Cl-和SO42-含量較高,Cl-、CO32-的變異性較大。光譜數(shù)據(jù)經(jīng)過R″、R′、R和1/R光譜變換后與土壤陰離子的相關(guān)性普遍提高,其中R″效果最好,R′次之。與PCC相比,SR可以更好地剔除變量間共線性的問題,進而篩選特征光譜,SR模型反演結(jié)果比PCC模型精度更高。對比4種陰離子反演結(jié)果,3種建模方法的精度為SVM>PLSR>PCR。土壤Cl-、SO42-和HCO3-均獲得了極好的反演結(jié)果,Cl-、SO42-的最佳反演模型為R″-SR-SVM,HCO3-的最佳反演模型為R′-SR-SVM。