舒 田,陳智虎,劉春艷,許元紅,趙澤英*
(1.貴州省農(nóng)業(yè)科技信息研究所,貴州 貴陽 550006;2.貴州師范大學(xué) 喀斯特研究院/國家喀斯特石漠化防治工程技術(shù)研究中心,貴州 貴陽 550001)
【研究意義】火龍果因其營養(yǎng)豐富、功能獨特,含有一般植物少有的植物性白蛋白和花青素,以及豐富的維生素和水溶性膳食纖維,具有減肥美容、降低膽固醇、預(yù)防便秘和大腸癌等功效而深受大眾青睞,已成為近年來我國種植面積增長最快的特色水果之一。截至2018年,貴州省火龍果種植面積達到5 867 hm2,產(chǎn)量達4.6萬t,位居全國第3位。作為我國特色優(yōu)勢農(nóng)產(chǎn)品,在農(nóng)業(yè)增效、農(nóng)民增收、產(chǎn)業(yè)扶貧等方面發(fā)揮了重要作用[1],已成為貧困地區(qū)富民興村的搖錢樹和致富果。高光譜具有光譜分辨率高、光譜連續(xù)性強、光譜信息量大等優(yōu)勢,可實時記錄植物器官生長發(fā)育中的細微變化[2]。基于高光譜分析植被植株冠層與葉片的光譜信息,可以進行作物種類識別和產(chǎn)量預(yù)測估算[3],還可以評估作物的生長狀況和受病害程度[4]。利用高光譜遙感技術(shù)對作物進行識別提取、產(chǎn)量預(yù)測、病蟲害監(jiān)測等已成為當前學(xué)術(shù)界的研究熱點?!厩叭搜芯窟M展】閆苗等[5]研究卷積神經(jīng)網(wǎng)絡(luò)模型在高光譜遙感地物多分類識別中可行性以及識別效果,證實卷積神經(jīng)網(wǎng)絡(luò)在高光譜遙感地物識別中具有較高的識別率。雷彤等[6]研究蘋果樹果期冠層反射光譜特性和敏感波段,篩選最佳光譜參數(shù)并構(gòu)建蘋果產(chǎn)量的最佳估測模型。劉穎等[2]利用Normalize預(yù)處理的高光譜數(shù)據(jù)的偏最小二乘法(PLS)模型對高紡錘形蘋果樹冠層單位面積花量的預(yù)測效果最優(yōu)。齊浩等[7]研究核桃、棗、香梨、蘋果、杏5種果樹,采用不同步長間隔的平滑濾值及5種數(shù)據(jù)變換方式處理,結(jié)果表明一階微分變換的樹種識別精度高達99.3%。劉建雄等[8]利用光譜特征參數(shù)與葉面積指數(shù)的相關(guān)性,建立茶尺蠖危害程度擬合模型,對于產(chǎn)業(yè)化和規(guī)?;蟮牟鑸@茶尺蠖危害進行監(jiān)測具有現(xiàn)實指導(dǎo)意義。張衡等[9]基于高光譜數(shù)據(jù)對馬尾松早期階段是否感染松萎蔫病進行良好監(jiān)測。周偉等[10]對三江源區(qū)毒雜草草種和優(yōu)良牧草種進行高光譜識別分析,并通過馬氏距離法提取其特征波段,為該地區(qū)植被群落生長監(jiān)測和畜牧業(yè)可持續(xù)發(fā)展提供了科學(xué)依據(jù)?!狙芯壳腥朦c】許元紅等[11-12]分別利用無人機高光譜和可見光波段對火龍果種植株數(shù)進行識別提取,目前對火龍果植株各部位的高光譜遙感識別鮮有研究,而高光譜對火龍果植株各部位的精準識別與分類對于監(jiān)測火龍果植株患病與否、病害分類、產(chǎn)量估測、理化參數(shù)含量估算以及肥水精準管理具有重要意義,同時也為果樹營養(yǎng)和果實品質(zhì)無損檢測等提供了可能[13-15]?!緮M解決的關(guān)鍵問題】充分利用高光譜優(yōu)勢實測火龍果植株冠層、果、枝、花的光譜數(shù)據(jù),通過原始光譜反射率、光譜不同變換形式、不同類型植被指數(shù)進行識別能力分析,然后利用主成分分析(PCA)并提取特征敏感波段(1 054~1 089 nm和812~825 nm)區(qū)域的光譜反射值作為神經(jīng)網(wǎng)絡(luò)輸入層,構(gòu)建三層BP神經(jīng)網(wǎng)絡(luò)模型開展火龍果植株各部位的識別分析,旨在為火龍果長勢監(jiān)測、估產(chǎn)、植株病害高光譜遙感診斷提供可靠依據(jù)。
1.1.1 數(shù)據(jù)采集地概況 高光譜數(shù)據(jù)采集于貴州省花江示范區(qū)火龍果種植基地,中心位置為E 105°39′50″,N25°40′32″,海拔430~500 m?;瘕埞N植行距為3 m,株距2 m。基地火龍果植株生長形態(tài)呈星狀,棱邊緣呈波浪狀或鋸齒狀,深綠色或綠色。枝條粗而長,長為30~150 cm,寬3~8 cm。花呈漏斗狀,花長25~30 cm,直徑15~25 cm。果呈長球形,深紅色或粉紅色。
1.1.2 采集方法 測量儀器采用美國ASD公司的地物光譜儀(Field Spec 3),波譜范圍為350~1 025 nm、350~2 500 nm,光譜采樣間隔分別為1.377 nm、1.377 nm@350~1 050 nm、2 nm@1 000~2 500 nm;其光譜分辨率分別為3nm@700nm、10 nm@1 400 nm、2 100 nm、30 nm@1 400 nm、2 100 nm。測定時間為2021年8月下旬,天空晴朗無云、無風(fēng)(或微風(fēng))、空氣濕度小,測定時段在12:00—13:00。測定時儀器探頭與作物冠層頂部相差0.5~1 m,垂直向下,每隔 0.5 h對儀器進行優(yōu)化和白板校正。一共采集測量35處,每處測量點分別采集火龍果植株冠層、果、枝和花的光譜3次。由于反射率受到大氣、水汽以及植物自身因素的影響,光譜曲線在首尾兩端存在較大噪聲,數(shù)據(jù)顯得異常。因此,剔除異樣光譜曲線,只保留400~1 350 nm波段的反射光譜數(shù)據(jù)進行分析處理,光譜反射率以ASCLL形式導(dǎo)出,便于后續(xù)處理分析。
1.2.1 原始光譜不同形式變換 原始反射光譜經(jīng)預(yù)處理后求導(dǎo),可以減弱土壤背景對目標光譜的影響,也可以消除部分大氣效應(yīng)噪音,提高信噪比,從而可靠地反映植被內(nèi)部生化組成及含量等信息[16]。因此,以原始光譜的一階微分(First order Differential,F(xiàn)D,波長間隔為3 nm、5 nm、7 nm、9nm、11 nm、13 nm、15 nm)、倒數(shù)的對數(shù)[lg(1/λ)]、倒數(shù)對數(shù)的一階微分[ FD(lg(1/λ))](波長間隔為3 nm、5 nm、7 nm、9 nm、11 nm、13 nm、15 nm)等不同變換形式進行分析。
1.2.2 植被指數(shù) 植被對太陽輻射的吸收與反射受到自身含水量和養(yǎng)分特征等因素的影響,而植被指數(shù)(Vegetation Index,VI)可結(jié)合不同波長范圍的地物反射率以增強植被的某一特征[17]。在紅光與近紅外波段植被具有較強的吸收和反射特性,不同波段組合在一定條件下定量表明植被的生長狀況。根據(jù)一般衛(wèi)星傳感器通道(近紅外、紅光、綠光)間波長即830 nm、660 nm、560 nm,相應(yīng)獲取其反射率數(shù)據(jù),選取DVI、RVI、NDVI、RDVI、SAVI、GNDVI、GRVI、VARI、NPCI、SIPI、WBI等11種常用植被指數(shù)對火龍果植株冠層、果、枝、花的光譜反射率進行識別能力分析,各指數(shù)的計算方法見表1。
表1 不同植被指數(shù)及計算公式 Table 1 Different vegetation indexes and calculation formulas
1.2.3 主成分分析 由于高光譜數(shù)據(jù)繁多冗雜,若將所有光譜數(shù)據(jù)輸入模型,則不利于BP網(wǎng)絡(luò)模型的構(gòu)建。不僅計算處理能力下降,還增加運算復(fù)雜性。因此,有效選取特征波段不僅可提高模型運算速度,還具有解析準確性。主成分分析(PCA)能在不丟失主要光譜信息前提下,將多個原始變量壓縮為幾個新變量的分析方法[18]。在主成分分析的基礎(chǔ)上獲取全波段(400~1 350 nm)中的敏感特征波段即最佳識別波段。載荷作為各個原始空間向量在各個新的向量空間(主成分)投影的單位向量,可用來表示這些原始向量分別在每個新的向量空間(主成分)上的相關(guān)性[19]。因此,將高光譜數(shù)據(jù)利用PCA降維后提取特征波段,將特征波段的反射值作為神經(jīng)網(wǎng)絡(luò)的輸入,然后構(gòu)建三層BP神經(jīng)網(wǎng)絡(luò)模型。為更好地構(gòu)建BP網(wǎng)絡(luò)模型,對采集的火龍果植株冠層、果、枝、花的光譜樣本數(shù)據(jù)按2∶1比例隨機抽取,分成建模集和預(yù)測集,即隨機抽樣選取70條實測的光譜樣本作為建模集,35條實測的光譜樣本作為預(yù)測集進行主成分分析。調(diào)節(jié)神經(jīng)元激勵的傳遞函數(shù)sigmoid為0.9,輸入層節(jié)點數(shù)為47,輸出層節(jié)點數(shù)為1,通過多次試驗計算確定隱含層節(jié)點數(shù)為35。允許誤差值為0.00001,最小訓(xùn)練速率為0.1,最大迭代次數(shù)為1000次。
采用The Unscrambler V9.1和DPS7.05(Data Processing System)進行數(shù)據(jù)分析處理。
通過ViewSpec Pro對火龍果植株冠層、果、枝、花原始反射光譜進行均值處理,獲得波長在400~1 350 nm反射光譜曲線。從圖1看出,整個光譜區(qū)間內(nèi),火龍果植株冠層、果、枝、花光譜反射率差異較大。可見光400~630 nm花的反射率明顯高于植株冠層、果和枝,果的反射率曲線與其他部位明顯不一致且無明顯綠峰值;在640~680 nm范圍內(nèi)果實反射率最高,然后為花、冠層和枝,且均有“紅谷”出現(xiàn)。在680~1 150 nm波長范圍內(nèi),反射率差異顯著,反射率大小依次是果>花>冠層>枝;大于1 150 nm的波長范圍,花與果實的反射率基本重疊并且最高,枝的反射率最低。由此可見,640~1 150 nm可作為識別火龍果植株不同部位的波長范圍。
圖1 火龍果植株不同部位平均光譜反射率曲線 Fig.1 Reflectance curves of mean spectrum for different parts of pitaya plant
從波長間隔3 nm的一階微分光譜曲線圖(圖2)可看出,在400~680 nm范圍火龍果花的一階微分光譜曲線存在2個正峰,其他部位則僅1個正峰;680~1 350 nm范圍,果、枝、花及植株冠層波譜曲線走向基本一致,存在1個正峰和2個負谷?;诠庾V差異最大且易區(qū)分原則,特選取6個不同波長處的一階微分(波長間隔為3 nm)的最佳識別光譜,最佳識別光譜波段位置為516 nm、525 nm、686 nm、702 nm、724 nm、736 nm。同理,其余光譜變換形式的光譜波長位置見表2,其中出現(xiàn)頻次最多的波長即為識別火龍果各部位的敏感波長(特征波長),分別為520 nm、642 nm、664 nm、726 nm、950 nm、1 000 nm、1 130 nm、1 330 nm和1 345 nm。
圖2 火龍果植株不同部位的一階微分光譜曲線(波長間隔為3 nm)Fig.2 First-order differential spectral curves of different parts of pitaya plant(with 3 nm wavelength interval)
表2 不同數(shù)據(jù)變換形式識別光譜的最佳波長位置 Table 2 Optimal wavelength of spectrum recognition with different data transformation forms
從表3看出,火龍果植株冠層、果、枝、花的RVI和GRVI的值均大于1,最大值分別為9.419和8.212,最小值分別為1.978和2.088,其余9種植被指數(shù)值均小于1。RVI和GRVI指數(shù)的方差與標準差均較大,遠大于1;其他植被指數(shù)方差與標準差均小于1。結(jié)合舒田等[20]的研究可以得出,RVI對于火龍果植株冠層、枝和花識別能力最強,GRVI對于果的識別能力最強。
表3 火龍果植株不同部位植被指數(shù)、方差及標準差Table 3 Vegetation index,variance and standard deviation of different parts of pitaya plant
2.4.1 主成分提取 表4反映火龍果植株各部位4個主成分分析的累積可信度,建模集的前2個主成分的累計可信度達94%,故選取前2個主成分作為特征敏感波段分析。
表4 火龍果各部位主成分分析的累計可信度Table 4 Accumulative credibility of different stems of pitaya plant by PCA
2.4.2 BP神經(jīng)網(wǎng)絡(luò)模型的輸入變量 從圖3可看出,主成分1與波長1 054~1 087 nm范圍的相關(guān)性較大,即主成分1與1 054~1 087 nm波段范圍的反射值的相關(guān)性最強,主成分2與波長812~825 nm波段范圍的反射值的相關(guān)性最強,故從400~1 350 nm范圍的950個光譜反射值中選出波長在1054~1087 nm和812~825 nm范圍的共計47個反射值作為BP神經(jīng)網(wǎng)絡(luò)的輸入變量建立鑒別模型。
圖3 波長與主成分相關(guān)性Fig.3 Correlation between wavelength and principal components
2.4.3 模型驗證 在建模設(shè)置條件下不斷通過調(diào)整隱含層的節(jié)點數(shù)來優(yōu)化網(wǎng)絡(luò)模型,最終確定網(wǎng)絡(luò)模型結(jié)構(gòu)為47(輸入層)-35(隱含層)-1(輸出)共3層的BP神經(jīng)網(wǎng)絡(luò)模型,所建模型對70個建模樣本的擬合殘差值為0.000 325。通過對35個樣本的反射率實測值與BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測值(表5)進行統(tǒng)計分析表明,所建模型識別準確率為82.8%。雖然模型對樣本預(yù)測值準確率不算太高,但將最佳識別波段縮小在近紅外的小區(qū)間內(nèi)。
表5 火龍果植株35個樣本的反射率實測值與BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測值 Table 5 Predicted value of BP neural network and actual value of 35 samples of pitaya plant
火龍果植株各部位(冠層、果、枝、花)的反射光譜存在較大差異,火龍果果實、花的光譜曲線在400~630 nm處與綠色植物葉片或冠層不太一致,沒有“綠峰”出現(xiàn);可見光區(qū)域植被原始光譜反射率較低,經(jīng)過導(dǎo)數(shù)變換后限制了低頻背景光譜對目標光譜的影響,經(jīng)過對數(shù)變換則可以增強可見光區(qū)域的光譜差異,還能減少因光照條件變換引起的乘性因素影響[21-22]。一階微分、倒數(shù)的對數(shù)和倒數(shù)對數(shù)的一階微分等數(shù)據(jù)變換形式對于增強作物在可見光區(qū)域的光譜信息、提升識別能力起到很大作用。植被指數(shù)是利用植被光譜數(shù)據(jù)線性和非線性組合構(gòu)建的光譜指數(shù),近紅外波段是作物葉片健康狀況最靈敏的區(qū)域,指示著植物光合作用是否正常運行,近紅外和紅光區(qū)域是構(gòu)建植被指數(shù)的最經(jīng)典波段,構(gòu)建不同植被指數(shù)可以間接反映作物生長狀況和提高不同作物的識別能力?;赑CA降維操作剔除了貢獻率相對較小的主成分從而達到降維的目的,同時利用PCA構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型提取了火龍果各部位識別的最佳特征波段。未來將利用高光譜遙感影像-高光譜反射率開展“圖-譜”的綜合判別分析,提升火龍果植株不同部位識別精度,同時針對病蟲害植株開展高光譜調(diào)查,從而為火龍果長勢監(jiān)測、產(chǎn)量估測、植株病蟲害高光譜診斷提供強有力的科學(xué)支撐。
采集田間火龍植株冠層、果、枝、花等各部位反射光譜,通過原始光譜反射率、光譜不同變換形式、不同類型植被指數(shù)進行識別能力分析,利用主成分分析法構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型并提取出火龍果植株各部位識別的最佳特征波段,得出以下結(jié)論:一是可見光400~630 nm范圍內(nèi),火龍果花的光譜反射率最高,冠層、枝、果差異不明顯,而640~1 140 nm光譜反射差異非常明顯;二是采用原始光譜不同變化形式得到區(qū)別火龍果冠層、果、枝、花最佳識別光譜波段位置為520 nm、642 nm、664 nm、726 nm、950 nm、1 000 nm、1 130 nm、1 330 nm和1 345 nm;三是通過不同植被指數(shù)計算,RVI對于火龍果植株冠層、枝和花識別能力最強,GRVI對于果識別能力最強,同時也驗證了RVI、GRVI植被指數(shù)對不同作物識別能力強的結(jié)論;四是利用高光譜主成分降維后提取出1 054~1 087 nm和812~825 nm為火龍果植株各部位識別的最佳特征波段,通過構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型,識別準確率達82.8%。