田宸宇,魯逸飛,劉永建,簡思春,曾銀銳,楊興有,魯黎明*
(1.四川農(nóng)業(yè)大學 農(nóng)學院,成都 611130;2.成都淞幸科技有限責任公司,成都 610225;3.中國煙草總公司四川省公司,成都 610041)
農(nóng)業(yè)遙感輻射傳輸建模,其實質(zhì)就是通過建立一種定量的模型,用來描述遙感觀測信號與地表農(nóng)作物的特征與屬性之間的關系,是對地表農(nóng)作物的特征參量進行定量反演的前提[1]。
傳統(tǒng)檢測方法,例如野外實地采樣,或者實驗室分析測試,雖然測量精度高但存在較強的破壞性且難以實現(xiàn)大面積、高通量的動態(tài)監(jiān)測;而衛(wèi)星遙感影像受大氣等因素的影響較大,反演精度不理想。近年來,作為新型低空遙感平臺,無人機很好地彌補了衛(wèi)星遙感的不足,其體積小、重量輕、分辨率高且成本低,可以實現(xiàn)實時監(jiān)測,適合中小尺度范圍和高頻次的調(diào)查研究。所以,利用無人機遙感,開展農(nóng)作物的長勢與表型特征的高通量分析,就成為了當前農(nóng)業(yè)遙感應用的熱門領域[2]。隨著圖像識別技術的不斷進步及各類數(shù)學模型的開發(fā),農(nóng)作物多種特征參量反演模型的構建也越來越成熟。本文就常見的建模方法進行介紹,以期為高效、高精度建模方法的探索提供參考。
回歸分析,是揭示呈因果關系的相關變量間的聯(lián)系形式,建立變量之間的回歸方程,利用所建立的回歸方程,由自變量預測、控制因變量。一元回歸分析,是研究1個自變量與1個因變量的回歸分析;而多元回歸分析(MLR)則是研究多個自變量與1個因變量的回歸分析。在實際應用中,一般以光譜參數(shù)/植被參數(shù)/紋理參數(shù)/顏色參數(shù)為自變量x,某一個農(nóng)藝參數(shù)的實測值為因變量y,通過建立多元回歸分析模型來估測實測值y[3]。
陶惠林等[4]利用多元線性回歸,構建了冬小麥挑旗期、開花期與灌漿期3個不同生育期葉面積指數(shù)(LAI)的估測模型。在7種光譜參數(shù)中,與LAI相關性最高的參數(shù)分別是NDVI(r=0.738)、SR(r=0.819)、NDVI×SR(r=0.835),LAI-MLR為冬小麥LAI的最佳估測模型,其中,開花期擬合性最好,精度最高。
劉帥兵等[5]基于無人機圖像數(shù)據(jù),建立了能夠反演冬小麥氮素含量的多元線性回歸模型。通過決定系數(shù)(R2)、均方根誤差(RMSE)和歸一化的均方根誤差(nRMSE)3個指標,明確該模型是最佳模型,反演精度較高,能夠應用于冬小麥氮肥管理決策。
偏最小二乘回歸法(PLSR)在某種意義上結合了多元線性回歸分析、典型的相關分析及主成分分析等較為經(jīng)典的統(tǒng)計學方法,是通過用最小化誤差的平方和而篩選出能夠匹配特定函數(shù)的另外一組數(shù)據(jù)最佳數(shù)據(jù)。現(xiàn)階段的很多優(yōu)化問題,可用最小二乘法來加以解決。
朱婉雪等[6]及趙曉慶等[7]分別采用PLSR建立了不同植被指數(shù)與產(chǎn)量之間的回歸模型。模型的檢測結果表明,其對產(chǎn)量的反演精度均較高。
在利用高光譜數(shù)據(jù)反演冬小麥全蝕病病情指數(shù)的研究中,郭偉等[8]將3類光譜指數(shù)與DI構建偏最小二乘回歸模型,得到較為理想的結果。
值得注意的是,由于PLSR包含主成分分析,建模時要對數(shù)據(jù)進行降維,入選變量的物理意義較難理解,建立的模型相對復雜,不利于模型的推廣與應用。
逐步回歸分析,在建立回歸方程時,采用的是逐步引入自變量的方式。在所有可能的自變量中,按照自變量對因變量作用的顯著程度,從大到小依次逐個引入擬建立的回歸方程中。在所建立的最終回歸方程中,所有的自變量的偏回歸平方和經(jīng)過檢驗都是顯著的。
陳浩等[9]采用與實測葉綠素含量極顯著相關的9種植被指數(shù),構建了基于遙感光譜指數(shù)的夏玉米冠層葉綠素含量遙感監(jiān)測模型。結果表明,綠色歸一化植被指數(shù)與葉綠素含量的相關性系數(shù)最高,達到了0.892。采用逐步回歸分析方法建立的模型表現(xiàn)最優(yōu),決定系數(shù)為0.87,均方根誤差及相對誤差分別為0.15和2.68%。
田明璐等[10]和魏青等[11]也分別采用多元逐步回歸法,構建了棉花與冬小麥的植物相對葉綠素含量(Soil and Plant Analyzer Development,SPAD)反演模型,建模效果較好。
支持向量機,也叫支持向量網(wǎng)絡(support vector machines,SVM),于1964年提出,20世紀90年代后得到快速發(fā)展,并被逐步理論化而成為統(tǒng)計學習理論的一個分支。近年來,SVM在高光譜數(shù)據(jù)反演建模中得到了較為廣泛的應用。
王瑛[12]將NDVI、RVI、DVI、SAVI和TVI植被指數(shù)組合作為輸入量,葉面積指數(shù)為輸出量,進行支持向量機模型的構建,對小麥的葉面積指數(shù)進行反演,并對模型進行精度評價。結果表明,支持向量機模型效果較好,決定系數(shù)達0.828,均方根誤差為0.411。
田軍倉等[13]采用偏最小二乘、支持向量機及BP神經(jīng)網(wǎng)絡模型,進行了番茄冠層不同位置SPAD值的預測建模及驗證。結果表明,番茄冠層上層葉片SPAD值與植被指數(shù)相關性程度及線性敏感程度,優(yōu)于冠層中層和下層葉片;基于番茄冠層上、中、下層及整個冠層SPAD值建立的支持向量機預測模型的R2高于偏最小二乘和BP神經(jīng)網(wǎng)絡預測模型。
BP神經(jīng)網(wǎng)絡(back propagation neuron network,BPNN),是目前無人機高光譜遙感反演模型較為常見的建模方法之一。同時,也是應用范圍較為廣泛的神經(jīng)網(wǎng)絡模型。在農(nóng)業(yè)遙感建模實踐中,運用較多的是反向傳播神經(jīng)網(wǎng)絡。
紀偉帥等[14]在棉花冠層SPAD的遙感定量反演建模中,采用BP神經(jīng)網(wǎng)絡(BPNN)、多元逐步回歸(MSR)和支持向量機(SVM)方法構建棉花SPAD值定量分析模型。結果表明,基于BP神經(jīng)網(wǎng)絡模型進行棉花葉片SPAD的空間分布反演,反演值與實測值具有高度一致性,BPNN模型精度最高,擬合結果較好。
喬浪等[15]建立了能夠反演大田玉米葉綠素含量的BP神經(jīng)網(wǎng)絡模型。利用該模型,能夠反演出大田玉米冠層的葉綠素含量,并可以通過可視化技術,繪制出大田玉米葉綠素含量分布圖。通過分析田間玉米冠層葉綠素含量分布圖,可以直觀區(qū)分田間道路與冠層區(qū)域,顯示地塊葉綠素分布差異,可為田間作物長勢評價和精細化管理提供技術支持。
隨機森林(random forest,RF)也是一種算法模型,2001年由Breiman和Cutler提出,是優(yōu)于傳統(tǒng)機器學習,如BP神經(jīng)網(wǎng)絡的新一代模型算法。RF算法的基礎是分類樹或者叫決策樹。隨機森林模型的運算速度快、預測精度高,尤其在進行大數(shù)據(jù)運算時,其優(yōu)勢更為突出。同時,RF避免了多元共線性等問題,也不需要進行變量的選擇。因此,隨機森林在農(nóng)業(yè)遙感實踐中得到了較為廣泛的應用。
孔繁昌等[16]使用隨機森林算法,對高寒地區(qū)粳稻穗頸瘟的無人機高光譜遙感識別進行了分類建模具有可行性分析。在所有輸入?yún)?shù)中,使用多種植被指數(shù)構成的CVIs作為輸入?yún)⒘康慕r炞C精度最高為90%,建模結果可以用來識別大田穗頸瘟。
馬怡茹等[17]發(fā)現(xiàn),棉花冠層LAI敏感響應波段集中在可見光(400~780 nm)和近紅外(900 nm之后)波段;使用RFR建立的LAI監(jiān)測模型精度最高,穩(wěn)定性最好,其中以FDR-SFLA-RFR模型最佳。建模集的決定系數(shù)為0.74,均方根誤差為1.648 3,相對均方根誤差為26.39%;驗證集的決定系數(shù)、均方根誤差分別為0.67、1.622 0,相對均方根誤差為25.97%。
王玉娜等[18]發(fā)現(xiàn),任意冬小麥2波段光譜指數(shù)對氮素營養(yǎng)指數(shù)更為敏感,與氮素營養(yǎng)指數(shù)均達到了極顯著性相關;基于差值光譜指數(shù)和紅邊歸一化指數(shù)的單個光譜參數(shù)構建的模型,具有粗略估算氮素營養(yǎng)指數(shù)的能力,相對預測偏差分別為1.53和1.56;基于隨機森林回歸構建的多變量冬小麥氮素營養(yǎng)指數(shù)估算模型具有極好的預測能力,模型決定系數(shù)為0.79,均方根誤差為0.13,相對預測偏差為2.25。
目前,我國基于低空光譜成像技術獲取農(nóng)情信息還處于起步階段,低空光譜成像遙感機理性研究比較缺乏,特定信息遙感解析模型有待完善,不同因素對特定信息解析模型的影響規(guī)律有待深入研究。采用的反演方法均為傳統(tǒng)經(jīng)驗統(tǒng)計模型或機器學習回歸模型,模型的精度受數(shù)據(jù)集劃分的影響,且對不同地區(qū)和條件普適性有待研究。下一步,可以考慮物理模型或建立混合模型,同時,引入深度學習等模型,以提高模型的適用能力與穩(wěn)定性。
隨著農(nóng)業(yè)遙感技術水平的不斷進步,在智慧農(nóng)業(yè)應用場景中,利用無人機平臺對農(nóng)作物進行長勢監(jiān)控,獲取多元遙感數(shù)據(jù),將會成為常態(tài)化的趨勢。而對所獲取的海量的光譜數(shù)據(jù)進行處理與分析,將會對算法模型提出越來越高的要求??梢灶A見的是,在不久的將來,更加適合于農(nóng)情監(jiān)測的、速度更快、精度更高的新算法模型必將不斷涌現(xiàn),農(nóng)作物生長的實時監(jiān)測將會越來越普遍,并且將會越來越智能化、輕簡化。