劉嘯風
摘要 為進一步提高遙感估產(chǎn)精度,顯示國產(chǎn)影像在農(nóng)業(yè)估產(chǎn)中的應用效果,該研究以2010—2013年HJ-1A/1B影像為遙感數(shù)據(jù),分析了衛(wèi)星遙感變量與小麥實際單產(chǎn)的定量關(guān)系,運用偏最小二乘回歸算法構(gòu)建及驗證了以實際單產(chǎn)為目標的多變量遙感估產(chǎn)模型。研究表明:實際單產(chǎn)與所選用的大多數(shù)遙感變量間關(guān)系密切,且多數(shù)遙感變量兩兩間具有嚴重的多重相關(guān)關(guān)系;實際單產(chǎn)偏最小二乘回歸模型的最佳主成分為5,且植被衰減指數(shù)、綠色歸一化植被指數(shù)、調(diào)整土壤亮度的植被指數(shù)、比值植被指數(shù)和歸一化植被指數(shù)為實際單產(chǎn)遙感估測的敏感變量;建模集和驗證集實際單產(chǎn)估測模型的決定系數(shù)分別為0.74和0.70,均方根誤差分別為754.05、748.20 kg/hm2,相對誤差分別為11.5%和 8.88%,且估測精度比線性回歸算法分別提高20%以上和40%以上,比主成分分析算法分別提高18%以上和30%以上,說明偏最小二乘回歸算法模型估測區(qū)域?qū)嶋H單產(chǎn)的效果要明顯好于線性回歸和主成分分析算法,該模型應用結(jié)果與小麥實際單產(chǎn)區(qū)域分布情況相符合,為提高區(qū)域小麥實際單產(chǎn)的遙感估測精度提供了一種途徑。
關(guān)鍵詞 遙感;產(chǎn)量估測;偏最小二乘法;小麥
中圖分類號 TP79 文獻標識碼 A 文章編號 1007-5739(2015)18-0209-02
Estimation of the Actual Yield Per Unit Area of Wheat Based on PLS Algorithm and Remote Sensing Image
LIU Xiao-feng
(Seed Management Station of Bayinguoleng Mongolia Autonomous Prefecture of Xinjiang Uygur Autonomous Region,Korla Xinjiang 841000)
Abstract In order to further improve the accuracy of crop-yield assess by remote sensing,according to domestic imaging applications in agriculture yield estimation results,taking HJ-1A/1B from 2010 to 2013 as remote image sensing data,satellite remote sensing variable and real output of wheat was analyzed.The study used partial least squaress regression algorithm was built and verified by the actual yield as the target of multivariable remote sensing yield estimation model.The research showed that the actual yield had close relationship with remote sensing variables,and most remote sensing variables between the two had severe multiple correlation relationship;Actual yield of partial least-squares regression model best principal component was 5,and the attenuation of vegetation index,green normalized difference vegetation index,adjust the brightness of vegetation index,soil ratio vegetation index and normalized difference vegetation index were sensitive variables to the actual yield remote sensing estimation;Modeling set and validation set models for predicting the actual yield decision coefficient were 0.74 and 0.70,root mean square error were 754.05 kg/hm2,748.20 kg/hm2.relative error of 11.5% and 8.88% respectively,and the estimation accuracy than linear regression algorithm was increased by more than 20% and 40% respectively,higher than that of principal component analysis algorithm was respectively 18% and 30%,the effect of partial least-squares regression algorithm model to estimate the regional actual yield significantly better than that of linear regression and principal component analysis algorithm.The actual application results of the model was in accord with the wheat yield per unit area distribution.It also provided an approach to improve the accuracy of estimate precision of wheat yield by remote sensing.endprint
Key words remote sensing;yield estimation;partial least squares method;wheat
科學準確地估測作物產(chǎn)量,是農(nóng)業(yè)生產(chǎn)的重要環(huán)節(jié),對農(nóng)業(yè)生產(chǎn)具有重要的意義。準確估算糧食產(chǎn)量能夠保障國家糧食安全,能夠為農(nóng)業(yè)生產(chǎn)的后續(xù)安排提供參考,能夠為農(nóng)業(yè)生產(chǎn)結(jié)構(gòu)調(diào)整提供科學依據(jù)。隨著科技的不斷發(fā)展,遙感數(shù)據(jù)的準確性及分辨率不斷提高,價格不斷下降,為其應用于多種作物估產(chǎn)提供了便利。遙感技術(shù)應用于作物估產(chǎn)已經(jīng)成為遙感與農(nóng)業(yè)交叉的主要方面。
在生產(chǎn)中,對作物產(chǎn)量進行估計的方法有很多,如作物產(chǎn)量氣象預報、人工抽樣調(diào)查、統(tǒng)計模擬模型、遙感估產(chǎn)等[1-5]。其中,作物產(chǎn)量氣象預報比較適宜小范圍作物估產(chǎn),但對于大范圍作物因不同麥區(qū)田間氣象差異較大導致估產(chǎn)精度偏低;人工抽樣調(diào)查測產(chǎn)精度較高,但耗時耗力、成本高,不適于在大范圍內(nèi)進行;統(tǒng)計模擬模型是結(jié)合歷史資料構(gòu)建數(shù)學關(guān)系模型,能夠?qū)ξ磥淼淖兓厔葑龀龉罍y,是一種非主觀方法。該方法的缺點是如果出現(xiàn)氣候變化,估測結(jié)果的準確性大打折扣;應用遙感技術(shù)能夠大面積、快速、動態(tài)和多尺度地獲取農(nóng)田豐富信息,在大面積作物長勢監(jiān)測、作物估產(chǎn)、農(nóng)情監(jiān)測與預報、農(nóng)業(yè)資源調(diào)查等方面具有巨大的應用潛力[6]。國內(nèi)外有關(guān)作物遙感估產(chǎn)研究已做了大量工作,但所用的衛(wèi)星遙感資料時效較低,模型模擬效果的穩(wěn)定性有待檢驗,所使用的衛(wèi)星數(shù)據(jù)源主要是MODIS、NOAA/AVHRR、TM等國外低空間分辨率數(shù)據(jù),以及IRS、P6、ETM、Quickbird、SPOT、IKONOS、ALOS等國外高空間分辨率數(shù)據(jù),但后者數(shù)據(jù)源多價格高[7]。因此,農(nóng)情遙感中推廣應用國產(chǎn)衛(wèi)星影像數(shù)據(jù)意義重大。
中國于2008年9月6日成功發(fā)射具有自主知識產(chǎn)權(quán)的HJ-1A/1B 衛(wèi)星,該衛(wèi)星傳感器的空間分辨率為30 m,時間分辨率為2 d,成為農(nóng)情遙感業(yè)務化運行較為理想的數(shù)據(jù)源。
本研究以HJ-1A/1B影像為遙感數(shù)據(jù)源,結(jié)合偏最小二乘回歸(partial least squares regression,PLS)算法,研究田間采樣點獲取的實際單產(chǎn)與開花期遙感變量間的相關(guān)關(guān)系,得到小麥實際單產(chǎn)的敏感遙感變量,以利于后來構(gòu)建實際單產(chǎn)遙感估測模型,實現(xiàn)區(qū)域小麥實際單產(chǎn)遙感估測,以期為政府及其他有關(guān)部門及時了解不同生態(tài)區(qū)域小麥產(chǎn)量豐欠變化趨勢,制定小麥糧食貿(mào)易和宏觀調(diào)控政策提供參考。
1 材料與方法
1.1 試驗設計與數(shù)據(jù)獲取
本研究以新疆焉耆盆地為例,研究區(qū)各鄉(xiāng)鎮(zhèn)分散設置采樣點3~5個,共計93個隨機采樣點,每個采樣點位置均采用Juno ST手持式GPS定位獲取地理信息,于開花成熟期用GPS定位,以各縣農(nóng)技推廣中心提供單產(chǎn)作為實際單產(chǎn)。衛(wèi)星數(shù)據(jù)為HJ-1A/1B 5月26日(開花期)過境影像;2011年共82個采樣點,衛(wèi)星數(shù)據(jù)為HJ-1A/1B 5月28日(開花期)過境影像;2012 年共80個采樣點,衛(wèi)星數(shù)據(jù)為 HJ-1A/1B5月28日(開花期)過境影像;2013年共80個采樣點,衛(wèi)星數(shù)據(jù)為 HJ-1A/1B 6月2日(開花期)過境影像。經(jīng)田間調(diào)查,各時期小麥長勢無顯著差異。
1.2 影像預處理
HJ-1A/1B影像的預處理采用ENVI。首先利用研究區(qū)區(qū)1∶10萬地形圖對HJ-1A/1B 影像進行幾何粗校正,然后再利用地面實測的GPS 控制點對HJ-1A/1B 影像進行幾何精校正。采用經(jīng)驗線性法轉(zhuǎn)換進行大氣校正和反射率轉(zhuǎn)換。
1.3 影像定標
在研究區(qū)選擇代表性水體作為低反射定標物,空曠水泥路面作為高反射定標物,采用手工定標方法對HJ-1A/1B 影像進行定標,利用絕對定標系數(shù)將 DN值圖像轉(zhuǎn)換為輻亮度圖像的公式為:
L=DN/a +L0(1)
式中:L為輻亮度,單位為W/m2·sr·μm;a為絕對定標系數(shù)增益;L0為偏移量。
1.4 衛(wèi)星遙感變量
依據(jù)作物光譜特性和國內(nèi)外研究文獻,結(jié)合光譜指數(shù)的物理意義,本研究選用4個 HJ-1A/1B波段和9種常用光譜植被指數(shù)(表1)作為 PLS分析構(gòu)建遙感估產(chǎn)模型的入選自變量。利用ENVI和ArcGIS 提取對應 GPS定位采樣點光譜反射率,結(jié)合表1提供的遙感植被指數(shù)算法,在 Excel 中計算出衛(wèi)星遙感變量。
1.5 偏最小二乘回歸 PLS
PLS是一種適用性較廣的新型多元分析方法,能解決利用許多普通多元回歸算法無法解決的問題,尤其當變量多且具有多重相關(guān)關(guān)系時,可有效篩選對因變量解釋性最強的綜合變量,建立的模型比普通回歸模型更可靠。PLS法先提取稱之為成分的新變量作為自變量,然后建立自變量與因變量之間的線性關(guān)系,利用PLS計算出系數(shù),然后建立因變量回歸模型。
由PLS算法建立模型時,增加主成分數(shù)能提高模型精度,但主成分過多將產(chǎn)生“過擬合”現(xiàn)象,精度降低,因此,確定最佳主成分數(shù)是建立 PLS模型的關(guān)鍵。本研究利用交互驗證法計算出估測殘差平方和(predictive residual error sum of square,PRESS),PRESS值越小,表示模型的估測精度越高,因此,基于PRESS最小值確定最佳主成分數(shù)。
PLS和PRESS的原理和步驟可見相關(guān)文獻[8]。PLS和PRESS過程均由自編的MATLAB程序完成。
1.6 模型的評價
模型評價指標為決定系數(shù)(determination coefficient,R2)、均方根誤差(root mean square error,RMSE)和相對誤差(rel-ative error,RE),其中R2越大,表明模型越好,RMSE和RE越小,表明模型的估測精度越高。endprint
2 結(jié)果與分析
2.1 產(chǎn)量分布
整理試驗數(shù)據(jù),按實際單產(chǎn)數(shù)值的大小排序,為提高估測模型的穩(wěn)定性,在保證實際單產(chǎn)最大值和最小值置于建模樣本集的前提下,將335個實際單產(chǎn)數(shù)值樣本按3∶2的比例,隨機分成建模集和驗證集。由表2可知,實際單產(chǎn)建模集和驗證集樣本的變幅、平均值、標準差和標準誤差均相近,具有較好的一致性。
2.2 遙感變量與實際單產(chǎn)間的關(guān)系定量分析
建模集中201個樣本的實際單產(chǎn)與遙感變量間關(guān)系定量分析表明,實際單產(chǎn)與大多數(shù)遙感變量間具有顯著或極顯著關(guān)系,其中實際單產(chǎn)與PSRI關(guān)系最密切,其次與GNDVI,相關(guān)系數(shù)分別為0.73和0.68,大多數(shù)植被指數(shù)與實際單產(chǎn)間的相關(guān)性明顯好于單波段;多數(shù)遙感變量兩兩間具有嚴重的多重相關(guān)關(guān)系,其相關(guān)系數(shù)幾乎介于0.80與1.00之間,尤其B1~B4兩兩間相關(guān)系數(shù)介于0.95與0.99之間,且多數(shù)植被指數(shù)兩兩間相關(guān)系數(shù)在0.90以上,說明相對于傳統(tǒng)統(tǒng)計算法和普通最小二乘法,運用PLS算法建立模型的區(qū)域估測精度可能更高。
2.3 構(gòu)建PLS模型
2.3.1 最佳主成分數(shù)目確定。在計算過程中,起始時隨著主成分數(shù)增加,實際單產(chǎn)PRESS值都呈較大幅度地降低,由此表明由于主成分數(shù)目較少,模型擬合極其不充分,即出現(xiàn)缺失擬合現(xiàn)象,直至實際單產(chǎn)模型主成分數(shù)為5時,PRESS值達到最小,為24.17;之后,隨著主成分數(shù)逐漸增加,PRESS值陡然增加,直至趨于緩平飽和,說明因主成分數(shù)過多而出現(xiàn)“過擬合”現(xiàn)象。因此,選擇 PRESS值最小時對應的主成分數(shù)作為PLS模型的最佳主成分數(shù)是合理的,即該實際單產(chǎn) PLS模型的最佳主成分數(shù)為5。
2.3.2 PLS模型建立及評價。基于PLS算法,以主成分數(shù)為5的5個植被指數(shù),即PSRI、GNDVI、OSAVI、RVI和NDVI為自變量,以實際單產(chǎn)為因變量,使用 201個建模集樣本及(下轉(zhuǎn)第223頁)
(上接第210頁)
其對應的HJ-1A/1B 影像,構(gòu)建實際單產(chǎn)估測模型為:
y=1706.1GNDVI-1964.7PSRI+1764.45OSAVI+1478.1RVI+1374.75NDVI+2133.9
建好實際單產(chǎn)估測模型后,利用本模型估測實際單產(chǎn),將實際單產(chǎn)估測值與實測值繪成1∶1散點圖,統(tǒng)計出最優(yōu)直線回歸方程及其R2、RMSE和RE。由計算結(jié)果可知,建模集和驗證集中的實際單產(chǎn)估測值與實測值間的R2均大于0.7,RMSE分別為754.05、748.20 kg/hm2,RE分別為11.50%、8.88%,利用該PLS模型能較好地估測區(qū)域小麥實際單產(chǎn)。
2.3.3 與傳統(tǒng)算法比較。為了與傳統(tǒng)算法進行比較,采用線性回歸(linear regression,LR)和主成分分析(principle comp-onents analysis,PCA)算法,利用建模集樣本建立實際單產(chǎn)估測模型,依據(jù)實際單產(chǎn)估測值與實測值的相關(guān)系數(shù)、RMSE和RE評價模型。表3為PLS、LR和PCA算法模型估測結(jié)果,比較發(fā)現(xiàn):樣本數(shù)相同,實際單產(chǎn)PLS模型的估測值與實測值相關(guān)系數(shù)大于LR和PCA模型,RMSE和RE都小于LR和PCA模型,說明PLS模型估測區(qū)域?qū)嶋H單產(chǎn)的效果要好于LR和PCA模型,其中實際單產(chǎn)建模集和驗證集估測精度分別比LR算法提高22.46%和41.21%,分別比PCA 算法提高18.57%和32.56%。
3 討論與結(jié)論
3.1 討論
隨著HJ-1A/1B衛(wèi)星投入使用,所獲數(shù)據(jù)質(zhì)量不斷提高,且免費提供給用戶使用,為區(qū)域性作物遙感估產(chǎn)提供了便捷的數(shù)據(jù)平臺。本文所選用的HJ-1A/1B影像時間分辨率為2 d,單景影像幅寬為50 km,能滿足區(qū)域性小麥估產(chǎn)需求。雖然年度之間田間物候存在一定的差異,但能保證所選用遙感數(shù)據(jù)處于同一物候期。
本研究將遙感估測的實際單產(chǎn)進行不同等級空間分布,并賦予地理空間信息,以此表達小麥實際單產(chǎn)的空間實際分布狀況和趨勢,說明實時的作物遙感估產(chǎn),可以在空間上定性和定量地分析作物實際單產(chǎn)狀況,不但可以分級量化顯示作物實際單產(chǎn)分布狀況,而且可以分區(qū)域統(tǒng)計作物實際單產(chǎn)不同等級所占的比重,從而能夠向大田區(qū)域生產(chǎn)提供及時可靠的實際單產(chǎn)信息。
但本研究仍存在以下幾點不足:一是在建模思路上,僅選擇了一個生長期數(shù)據(jù),使得研究結(jié)果具有較大的局限性,比如開花期的數(shù)據(jù)不一定能獲得最好的預測效果,其他時期數(shù)據(jù)的預測效果可能會更好。另外,不同時期的數(shù)據(jù)可能最優(yōu)分析建模方法也不同,這方面將來非常有必要深入探究。二是本研究是基于 HJ-1A/1B影像進行的,由于其空間分辨率偏低,常常導致“同物異譜”“同譜異物”“過擬合”等狀況,從而降低遙感估產(chǎn)精度,以致遙感估產(chǎn)結(jié)果仍不能滿足精準農(nóng)業(yè)生產(chǎn)需求,以后將多源、多時相遙感數(shù)據(jù)與作物生長模型進行耦合,可能是解決這一問題的有效途徑。三是RVI理論上值域變幅較大,但在本研究中相對穩(wěn)定,可能原因是小麥該生長期長勢均勻、變化幅度小,對應的近紅外和紅光波段反射性能穩(wěn)定,至于建立的公式各參數(shù)的系數(shù)差異較小,尤其是 RVI,在此不能妄下結(jié)論,其原因是否與數(shù)據(jù)源有關(guān),還是其他原因,仍有待深入研究。四是本研究僅將PLS與LR和PCA進行對比,應該增加包括人工神經(jīng)網(wǎng)絡、支持向量機、蟻群、粒子群等算法,以確保結(jié)論的可靠性,此外,也未考慮小麥栽培因素影響,實際上,這些算法和因素對小麥遙感估產(chǎn)存在較大的影響,也有待進一步研究。
3.2 結(jié)論
利用PLS算法構(gòu)建了以 PSRI、GNDVI、OSAVI、RVI和NDVI 指數(shù)為自變量的實際單產(chǎn)遙感估測模型,經(jīng)建模集和驗證集評價,實際單產(chǎn)估測模型的 R2分別為0.74、0.70,RMSE分別為754.05、748.20 kg/hm2,RE 分別為11.50%和8.88%,且估測精度比線性回歸算法分別提高22.46%和41.21%,比主成分分析算法分別提高18.57%和32.56%,說明PLS模型區(qū)域估測效果明顯好于LR和PCA。
本模型應用結(jié)果與小麥區(qū)域生產(chǎn)實際相符合,為提高區(qū)域性小麥遙感估產(chǎn)精度提供了一種有效途徑。
4 參考文獻
[1] 楊武德,宋艷暾.基于3S和實測相結(jié)合的冬小麥估產(chǎn)研究[J].農(nóng)業(yè)工程學報,2009,25(2):131-135.
[2] 黃敬峰,楊忠恩,王人潮.基于 GIS 的水稻遙感估產(chǎn)模型研究[J].遙感技術(shù)與應用,2002,17(3):125-128.
[3] 吳炳方.全國農(nóng)情監(jiān)測與估產(chǎn)的運行化遙感方法[J].地理學報,2000,55(1):25-35.
[4] 李衛(wèi)國,王紀華,趙春江,等.基于遙感信息和產(chǎn)量形成過程的小麥估產(chǎn)模型[J].麥類作物學報,2007,27(5):904-907.
[5] 任建強,陳仲新,唐華俊.基于 MODIS—NDVI 的區(qū)域冬小麥遙感估產(chǎn):以山東省濟寧市為例[J].應用生態(tài)學報,2006,17(12):2371.
[6] 王長耀,林文鵬.基于 MODIS EVI 的冬小麥產(chǎn)量遙感預測研究[J].農(nóng)業(yè)工程學報,2005,21(10):90-94.
[7] 歐文浩,蘇偉,薛文振,等.基于HJ-1衛(wèi)星影像的三大農(nóng)作物估產(chǎn)最佳時相選擇[J].農(nóng)業(yè)工程學報,2010,26(11):176-182.
[8] 高惠璇.兩個多重相關(guān)變量組的統(tǒng)計分析(3):偏最小二乘回歸與PLS 過程[J].數(shù)理統(tǒng)計與管理,2002,21(2):58-64.endprint