熱依拉·艾合買提,吾木提·艾山江,阿不都艾尼·阿不里,尼加提·卡斯木
(1.伊犁師范大學(xué)生物與地理科學(xué)學(xué)院,新疆伊寧 835000;2.浙江大學(xué)農(nóng)業(yè)遙感與信息技術(shù)應(yīng)用研究所,杭州 310058;3.浙江省農(nóng)業(yè)遙感與信息技術(shù)重點研究實驗室,浙江杭州 310058;4.新疆大學(xué)資源與環(huán)境科學(xué)學(xué)院,新疆烏魯木齊 830046)
水分對植物生長發(fā)育不可或缺。葉片水分含量(leaf water content,LWC)是反映作物生理動態(tài)的重要指標之一,可為作物長勢、旱情、抗病性等評估提供參考依據(jù)。因此,快速準確地提取作物葉片水分含量對干旱半干旱地區(qū)作物旱情診斷具有重要的指導(dǎo)意義。
隨著高光譜遙感技術(shù)的迅速發(fā)展,其因為快速、無損、高效等特點被廣泛用于地上生物量、葉片氮磷含量、LAI等作物重要參數(shù)的定量估算,并體現(xiàn)了明顯的優(yōu)勢。高光譜技術(shù)也被用于作物水分快速監(jiān)測。研究表明,小麥LWC對近紅外(NIR)波段光譜吸收特征參量存在一定的影響。作物水分的吸收光譜主要在970、1 200、1 450、1 940和2 500 nm周邊,利用光譜數(shù)據(jù)的一階導(dǎo)數(shù)變換能提升小麥葉片水分相對含量與吸收光譜的相關(guān)性。作物L(fēng)WC的估算通常采用植被指數(shù)的經(jīng)驗?zāi)P?。王延倉等結(jié)合野外高光譜數(shù)據(jù)進行連續(xù)小波變換預(yù)處理,并篩選特征敏感波段和光譜指數(shù)計算(NDVI、PWI、RVI等),基于偏最小二乘法(partial least squares regression,PLSR)構(gòu)建了冬小麥LWC定量反演模型;陳秀青等在冬小麥葉片和冠層兩種尺度下,將競爭自適應(yīng)重加權(quán)采樣方法與PLSR回歸方法相結(jié)合,采用兩波段植被指數(shù)如NDSI和RSI對LWC進行估算,且取得較好的估算效果。劉曉靜等對RVI、NDVI、R/ND、OSAVI、冠氣溫差等5種光譜參數(shù)與冬小麥不同生育時期LWC進行擬合分析,并得到較好的擬合效果。目前,作物L(fēng)WC的高光譜估算主要是基于高光譜數(shù)據(jù)不同預(yù)處理方式的單一波段反射率和傳統(tǒng)植被指數(shù)為數(shù)據(jù)源,結(jié)合多種回歸模型來構(gòu)建最佳監(jiān)測模型,而利用對高光譜數(shù)據(jù)構(gòu)建的植被指數(shù)進行組合并進行優(yōu)化有待研究,且在植被指數(shù)波段優(yōu)化模式下,對不同機器學(xué)習(xí)算法效果的對比分析研究較少。
由于環(huán)境因素的影響,作物水分狀況會發(fā)生變化,也表現(xiàn)出不同的冠層光譜反射特征。在不同環(huán)境條件下,作物冠層結(jié)構(gòu)會有所不同,從而引起單一波段或固定波長植被指數(shù)在不同區(qū)域?qū)ψ魑锶~片含水量的敏感程度存在一定的差異,使作物水分監(jiān)測模型的普適性和適應(yīng)性變差。因此,有必要對作物冠層高光譜反射率全波段信息進行自由組合,進而構(gòu)建適宜植被指數(shù),以增加模型參數(shù)的敏感性。因此,本研究選取春小麥抽穗期葉片水分數(shù)據(jù)及高光譜數(shù)據(jù),分析基于春小麥LWC與單一波段反射率、水分植被指數(shù)及兩波段組合植被指數(shù)之間的定量關(guān)系,比較其擬合效果,篩選最佳波段組合植被指數(shù),并比較三種機器學(xué)習(xí)算法(SVM、ANN和KNN)估算模型的預(yù)測精度,以期為干旱區(qū)域田間尺度春小麥水分狀況快速、準確評估提供參考依據(jù)。
研究區(qū)屬于科學(xué)實驗基地,位于新疆阜康市上戶溝鄉(xiāng)滋泥泉子鎮(zhèn)北部(88°22′~88°29′E,44°23′~44°22′N),占地面積為480 hm,周圍均為主要播種小麥、玉米等農(nóng)作物的大型農(nóng)場。該地區(qū)是典型的旱作農(nóng)業(yè)區(qū),也是新疆主要糧食基地。氣候類型屬于典型的中溫帶大陸性干旱氣候,其特點是四季分明,冬天冷夏天熱,春秋氣溫變化較劇烈,降水量少、季節(jié)分配不均勻且主要集中在春夏季,光熱條件充足。圖1為研究區(qū)春小麥播種區(qū)域和采樣部分,播種區(qū)域均勻鋪設(shè)滴灌設(shè)施,水肥管理參照當?shù)卮盒←準┓使喔确桨?;黃色部分為正方形采樣區(qū)(1 m×1 m),共154個。在小方框范圍內(nèi)進行春小麥冠層葉片光譜反射率測定和葉片取樣,每個小區(qū)光譜測定重復(fù)10次。
圖1 數(shù)據(jù)采樣區(qū)域
春小麥不同葉位中,頂部葉片含水量與反射光譜之間的定量關(guān)系較好。因此,2017年6月對春小麥頂一葉和頂二葉進行采樣,并立刻放于密封塑料袋中且做好標簽,保證其水分不受到損失,每個小區(qū)重復(fù)采樣10次。樣品采集和冠層高光譜數(shù)據(jù)同時進行。樣品先用電子天平(0.000 1 g)稱取鮮重(fresh weight,FW),再在105 ℃下殺青30 min后,放入烘干箱(溫度為80 ℃)烘干36 h,最后稱取干重(dry weight,DW),并計算葉片含水量[LWC=(FW-CW)/FW×100%]。
利用美國的ASD FieldSpec-3光譜儀(波段范圍為350~2 500 nm)采集小麥冠層高光譜數(shù)據(jù),數(shù)據(jù)在350~1 000 nm和1 000~2 500 nm范圍內(nèi)分別間隔為1.4 nm和2.0 nm重采樣后可達到1 nm。數(shù)據(jù)采集當日天氣晴朗無云,時間為12:00-14:00,每隔5 min進行白板校正。每個樣品重復(fù)采集10次光譜曲線,取其平均值作為樣品的冠層光譜數(shù)據(jù)。
兩波段植被指數(shù)包括兩波段組合植被指數(shù)和傳統(tǒng)水分植被指數(shù),通過對光譜全波段信息兩兩組合計算,并進行波段組合優(yōu)化獲得。本研究選取了3種兩波段組合植被指數(shù)(表1)。兩波段組合計算過程通過Java平臺上開發(fā)的軟件(two-band combination of optimized indices,V1.0.登記號:2018SR281300)實現(xiàn)。本研究通過文獻統(tǒng)計方法選取了12個傳統(tǒng)水分植被指數(shù)(表2)。
表1 兩波段組合植被指數(shù)
表2 傳統(tǒng)水分植被指數(shù)
本研究把154個點的采樣數(shù)據(jù)隨機分為建模集(123個,占總數(shù)據(jù)的80%)和驗證集(31個,占總數(shù)據(jù)的20%)。
利用人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)、K近鄰(K-nearest neighbors,KNN)和支持向量回歸(support vector regression,SVR)三種機器學(xué)習(xí)算法構(gòu)建模型。ANN是指由大量的處理單元(神經(jīng)元)互相連接而形成的復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu),是對人腦組織結(jié)構(gòu)和運行機制的某種抽象、簡化和模擬,以數(shù)學(xué)模型模擬神經(jīng)元活動,是基于模仿大腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能而建立的一種信息處理系統(tǒng)。KNN是一個理論上比較成熟的方法,也是最簡單的機器學(xué)習(xí)算法之一。該方法的思路非常簡單直觀:如果一個樣本在特征空間中的個最相似(即特征空間中最鄰近)的樣本中的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別。SVR是支持向量機(support vector machine,SVM)算法來計算出來的回歸方法,是輸入標簽是連續(xù)值時選取的模式。
利用決定系數(shù)()、均方根誤差(root mean square error,RMSE)和相對偏差百分比(relative percent deviation,RPD)對所建立的模型進行穩(wěn)定性和預(yù)測能力檢驗。越高,表明模型的線性關(guān)系越強。RMSE越小,表明測量數(shù)據(jù)和預(yù)測數(shù)據(jù)之間的誤差低。RPD是標準偏差(SD)與估計標準誤差(SEP)之間的比率。RPD的值超過 2.0,說明該模型具有較好的預(yù)測能力;RPD值在 1.4到 2.0之間,說明模型具有一般的預(yù)測能力;RPD值小于1.4,說明模型的預(yù)測能力較差。
RPD=SD/SEP
經(jīng)統(tǒng)計分析,總數(shù)據(jù)集、建模集和驗證集的LWC變化范圍分別為64.94%~91.54%、64.94%~85.26%、69.56%~91.34%,標準差分別為3.56%、3.15%和4.83%;變異系數(shù)分別為 4.58%、4.06%和6.15%,三個數(shù)據(jù)集的變異系數(shù)相近(圖2)。
圖2 春小麥葉片含水量(LWC)統(tǒng)計分析
Pearson相關(guān)性分析(圖3)發(fā)現(xiàn),春小麥冠層光譜反射率與LWC呈極顯著相關(guān)(<0.01),相關(guān)系數(shù)()為-0.2~0.23。其中,在400~720 nm波段范圍內(nèi)二者呈負相關(guān),在720~1 300 nm波段范圍內(nèi)則呈正相關(guān)。相關(guān)系數(shù)通過0.05顯著性檢驗的波段范圍分別為400~410 nm、760~980 nm和1 020~1 120 nm,而相關(guān)系數(shù)通過 0.01顯著性檢驗的波段主要集中在780~930 nm。從上分析可知,對春小麥LWC敏感的光譜波段區(qū)域主要為400~1 300 nm,單波段反射率信息雖然明顯存在敏感波段區(qū)域,但與春小麥葉片水分含量的相關(guān)程度較弱。因此,需要通過植被指數(shù)的波段優(yōu)化計算來進一步探討其對LWC之間的關(guān)聯(lián)程度。
圖3 小麥LWC與光譜反射率之間的相關(guān)性
對12種傳統(tǒng)植被指數(shù)與LWC進行相關(guān)性分析,結(jié)果(表3)表明,植被指數(shù)與LWC顯著相關(guān),均通過了0.05或0.01顯著性水平,相關(guān)系數(shù)為-0.22~0.30。其中,F(xiàn)WBI與LWC的相關(guān)系數(shù)最大,為0.30。這表明傳統(tǒng)光譜指數(shù)對LWC的敏感性較低。
表3 傳統(tǒng)植被指數(shù)與小麥LWC的相關(guān)性
在400~1 300 nm波段范圍內(nèi),通過對兩波段光譜植被指數(shù)(比值植被指數(shù)RVI、歸一化植被指數(shù)NDVI和差值植被指數(shù)RVI)進行組合運算,并借助MATLAB環(huán)境分別繪制了小麥LWC與DVI、NDVI和RVI之間的二維Pearson相關(guān)性可視化熱圖,結(jié)果(圖4)表明,三種光譜指數(shù)對小麥LWC的敏感波段區(qū)域比較相似,相關(guān)性大致在近紅外(800~1 000 nm)波段區(qū)域表現(xiàn)突出,相關(guān)系數(shù)的絕對值均達到了0.60(<0.01),相關(guān)程度較傳統(tǒng)的水分植被指數(shù)明顯提高,因此可通過兩波段光譜指數(shù)的運算尋找對小麥LWC更加敏感的波段組合。
a:DVI; b:NDVI; c:RVI.
從相關(guān)分析結(jié)果看,原始光譜、傳統(tǒng)水分植被指數(shù)和兩波段組合植被指數(shù)對LWC敏感性存在一定的差異,其中波段組合植被指數(shù)的敏感性最高,而原始光譜數(shù)據(jù)最低。但為了更全面反映相關(guān)信息,3種數(shù)據(jù)均參與建模過程,并對參與變量進行了篩選,數(shù)據(jù)分別包括波長769~924 nm對應(yīng)的154個原始光譜反射率信息、12種水分植被指數(shù)及最佳波段組合的植被指數(shù)(DVI、RVI、NDVI)。
從建模效果(表4)看,在同一種算法下,利用3種數(shù)據(jù)所建的模型的和RMSE存在明顯的差異,其中基于原始光譜數(shù)據(jù)敏感波段和12種傳統(tǒng)水分植被指數(shù)的較低,RMSE較高,建模效果較差,而基于兩波段組合植被指數(shù)的建模效果相對較好。對于同一類數(shù)據(jù)而言,三種算法中,KNN算法的建模效果最好。
表4 春小麥LWC估測建模與驗證
利用獨立數(shù)據(jù)對模型驗證的結(jié)果(表4和圖5)表明,三種數(shù)據(jù)所建模型的預(yù)測精度也存在差異,也是基于兩波段組合植被指數(shù)的預(yù)測效果好于其他兩類數(shù)據(jù),且以KNN算法較好,其= 0.64,RMSE=2.35%,RPD=2.01。
圖5 春小麥LWC的觀測值與預(yù)測值散點圖
抽穗期是小麥對水分需求的臨界期,也是決定小麥小花數(shù)量以及小花發(fā)育程度的重要時期,它對后期的麥穗和籽粒形成起著決定性作用。水分的調(diào)節(jié)狀況直接影響到春小麥品質(zhì)和產(chǎn)量,因此快速準確地監(jiān)測春小麥葉片含水量具有重要的理論和現(xiàn)實意義。目前為止,諸多研究通過數(shù)學(xué)的方法對高光譜數(shù)據(jù)進行不同的預(yù)處理,并進行多種植被指數(shù)的計算,采用統(tǒng)計學(xué)分析方法完成敏感波段和植被指數(shù)的篩選,結(jié)合不同的回歸算法構(gòu)建了冬小麥葉片含水量的估算模型。由于高光譜的數(shù)據(jù)量大,連續(xù)性強,而且不同植被指數(shù)具有各自不同的特點。因此,以往研究對高光譜植被指數(shù)的波段優(yōu)化計算和最為有效合理植被指數(shù)的篩選較少,尤其是基于波段優(yōu)化計算和機器學(xué)習(xí)算法的春小麥葉片含水量監(jiān)測模型研究方面少見。
本研究選取抽穗期春小麥葉片水分含量為研究對象,基于野外葉片冠層高光譜數(shù)據(jù),提取和篩選光譜特征波段和敏感水分植被指數(shù),對DVI、RVI、NDVI等植被指數(shù)進行波段組合優(yōu)化計算,采用SVM、ANN和KNN等機器學(xué)習(xí)算法,構(gòu)建了春小麥葉片水分含量高光譜定量估算模型。結(jié)果表明,春小麥抽穗期葉片含水量與冠層高光譜反射率()、12種傳統(tǒng)水分植被指數(shù)均顯著相關(guān)(<0.01),這與前人研究結(jié)果一致;與傳統(tǒng)水分植被指數(shù)相比,通過波段組合和有效優(yōu)化,在800~1 000 nm區(qū)間兩波段自由組合的光譜參數(shù)(RVI、NDVI、DVI)對葉片含水量的敏感性明顯提升;與原始光譜(,共154個反射率信息)、傳統(tǒng)12種水分植被指數(shù)相比,以RVI、NDVI、DVI為自變量,利用KNN算法構(gòu)建的春小麥葉片含水量估算模型的擬合效果最佳,決定系數(shù)為為 0.64,RMSE為2.35,RPD為2.01,說明兩波段光譜指數(shù)的有效計算和KNN算法在作物葉片水分高光譜遙感估算領(lǐng)域具有一定的優(yōu)勢。
雖然本研究以春小麥冠層高光譜數(shù)據(jù)為數(shù)據(jù)源,選取最佳波段組合的植被指數(shù),建立了基于機器學(xué)習(xí)算法的春小麥葉片水分含量估算模型,并取得了較好的預(yù)測效果,但研究中仍存在不足之處:基于1 nm分辨率的高光譜數(shù)據(jù),通過自由波段組合運算能夠有效地獲得最佳敏感植被指數(shù),而春小麥葉片含水量敏感指數(shù)在其他的生長階段也有所差異,構(gòu)建的最佳波段范圍可能會發(fā)生變化。本研究數(shù)據(jù)僅局限于春小麥抽穗期,需要進一步獲取其他生長階段的葉片水分和高光譜冠層數(shù)據(jù),進而對春小麥葉片含水量估算模型進一步驗證與修正,以提高估算模型的普適性與實用性。