王 宇,汪 泓,*,肖玖軍,李可相,邢 丹,張永亮,陳 陽(yáng),張藍(lán)月
(1.貴州大學(xué) 礦業(yè)學(xué)院,貴州 貴陽(yáng) 550025; 2.貴州科學(xué)院 貴州省山地資源研究所,貴州 貴陽(yáng) 550001; 3.貴州省土地綠色整治工程研究中心,貴州 貴陽(yáng) 550001; 4.貴州省農(nóng)業(yè)科學(xué)院 辣椒研究所,貴州 貴陽(yáng) 550009)
葉綠素與植被的光合作用密切相關(guān),是直接影響植被生長(zhǎng)狀況和健康狀況的重要參數(shù)[1],實(shí)時(shí)、大面積地對(duì)其進(jìn)行監(jiān)測(cè)具有十分重要的意義。傳統(tǒng)葉綠素測(cè)量方法多費(fèi)時(shí)費(fèi)力,且提取過(guò)程中易造成色素?fù)p失[2]。便攜式葉綠素儀測(cè)量值(SPAD值)和葉綠素含量具有較好的相關(guān)性,作物SPAD值是反映葉片葉綠素含量的有效指標(biāo),SPAD值越大,表明葉片葉綠素含量越高[3],因此,便攜式葉綠素儀被廣泛運(yùn)用到作物葉片葉綠素估算中。高光譜遙感技術(shù)因其圖像分辨率高、波段連續(xù)性強(qiáng)、高效無(wú)損等特點(diǎn)成為了農(nóng)作物生長(zhǎng)狀況快速監(jiān)測(cè)的有效手段[4]。融合SPAD值與高光譜遙感技術(shù)可實(shí)現(xiàn)對(duì)作物葉片葉綠素快速、無(wú)損、高效反演[5],為開(kāi)展精準(zhǔn)農(nóng)業(yè)提供了重要的科學(xué)依據(jù)。
貴州是中國(guó)乃至世界重要的辣椒種植基地,其辣椒種植面積和年產(chǎn)量均占全國(guó)的1/6,全球的1/10,品種豐富多樣,但目前針對(duì)辣椒葉片葉綠素反演的研究還未見(jiàn)報(bào)道,因此有必要進(jìn)行相關(guān)研究。近年來(lái),葉綠素反演成為當(dāng)下研究熱點(diǎn),洪帥等[6]、王鑫梅等[7]對(duì)同一作物不同生育期的葉綠素進(jìn)行了反演研究;田軍倉(cāng)等[8]分析了同一植株不同層次的葉綠素含量差別;張東彥等[9]利用無(wú)人機(jī)對(duì)植株進(jìn)行多角度拍攝以研究多角度成像對(duì)葉綠素含量反演的影響。目前,對(duì)同一作物不同品種尋求最佳反演模型的研究較少。變換光譜是光譜研究中常用的改變光譜特性的方法之一,它能有效降低周?chē)肼暫头糯蠊庾V特征[10-12],利用變換光譜替換植被指數(shù)中的原始光譜,既可以有效降低周?chē)肼暫头糯蠊庾V特征,又可以減少算法流程和數(shù)據(jù)量。目前已有學(xué)者在其他領(lǐng)域應(yīng)用此方法并取得很好的效果,如張賢龍等[13]將高光譜數(shù)據(jù)進(jìn)行了15種變換,突出了光譜的混合信息,其研究結(jié)果表明,在log(1/R)′光譜變換下歸一化土壤指數(shù)(normalized differential soil index, NDSI)的土壤鹽分估算模型精度最高;段丹丹等[14]提出用對(duì)數(shù)光譜替換經(jīng)典植被指數(shù)的原始光譜擴(kuò)大了光譜差異,有效突出了光譜特征,其搭建的多元線性回歸模型是多生育期茶葉游離氨基酸含量估算的最佳模型。以上研究表明,光譜變換后的優(yōu)化植被指數(shù)不僅可以提高模型的精度,還具有較高的普適性。前人針對(duì)辣椒葉綠素反演的研究少且內(nèi)容單一[15-17],郭宏亮等[16]提出利用多元線性回歸模型反演辣椒葉綠素含量,但此模型存在諸多問(wèn)題:如變量間存在多重共線性問(wèn)題、數(shù)據(jù)容易“過(guò)擬合”,模型的穩(wěn)定性和普適性也都將受到影響[18]。機(jī)器學(xué)習(xí)算法可以有效處理多變量復(fù)雜的非線性模型,能有效地代表復(fù)雜的非線性關(guān)系,且光譜信息能被充分利用進(jìn)而提高模型精度。其中,隨機(jī)森林模型(random forest, RF)因建模結(jié)果較精確、不易對(duì)噪聲和異常情況發(fā)生反應(yīng)和出現(xiàn)“過(guò)擬合”現(xiàn)象,不需要檢驗(yàn)變量的正態(tài)性和獨(dú)立性等優(yōu)勢(shì)[19]被廣泛地應(yīng)用到農(nóng)業(yè)參數(shù)的反演中。如武旭梅等[20]研究表明,基于多個(gè)植被指數(shù)組合的水稻冠層葉綠素含量反演最佳模型為隨機(jī)森林模型。陳瀾等[5]研究表明,隨機(jī)森林模型具備可以平衡不同數(shù)據(jù)集之間的整體誤差、模型運(yùn)算性能高等優(yōu)點(diǎn)。王慶等[21]對(duì)比分析了偏最小二乘回歸和隨機(jī)森林回歸兩種回歸模型反演甜菜SPAD值、塊根鮮重等參數(shù)的差異性,提出隨機(jī)森林模型在精度上優(yōu)于偏最小二乘回歸。袁自然等[17]研究也表明,隨機(jī)森林模型為檢測(cè)辣椒葉片葉綠素含量的最佳模型。
本研究以貴州遵義地區(qū)主栽辣椒類型朝天椒(辣研101號(hào),紅全球)和線椒(黔椒8號(hào)和紅辣18號(hào))為研究對(duì)象,以辣椒SPAD值和高光譜數(shù)據(jù)為基礎(chǔ),利用變換光譜對(duì)經(jīng)典植被指數(shù)進(jìn)行優(yōu)化,篩選優(yōu)化植被指數(shù)組合,以隨機(jī)森林回歸算法為研究方法對(duì)辣椒SPAD值進(jìn)行估測(cè)研究,重點(diǎn)解決以下問(wèn)題:1)對(duì)比分析不同品種辣椒SPAD值和高光譜數(shù)據(jù)之間的關(guān)系;2)探究?jī)?yōu)化植被指數(shù)組合對(duì)辣椒SPAD值估測(cè)模型的影響;3)優(yōu)選高普適性模型,實(shí)現(xiàn)適用于多品種辣椒SPAD值的快速反演,從而為實(shí)時(shí)監(jiān)測(cè)辣椒生長(zhǎng)發(fā)育狀況提供理論基礎(chǔ)和技術(shù)支持。
試驗(yàn)區(qū)位于貴州省遵義市新蒲新區(qū)貴州省農(nóng)業(yè)科學(xué)院辣椒研究所官莊示范基地(104°18′20″E、25°19′44″N)。該試驗(yàn)區(qū)屬亞熱帶季風(fēng)氣候,年平均降水量為1 200 mm,日照充足,適宜種植辣椒。本實(shí)驗(yàn)于2021年9月在決定辣椒產(chǎn)量和品質(zhì)的盛果期[22]進(jìn)行樣本采集,每個(gè)品種各48個(gè),共采集192個(gè)樣本。
小區(qū)試驗(yàn)采用兩因素裂區(qū)設(shè)計(jì),以4個(gè)品種辣椒為主區(qū),分別是黔椒8號(hào)、紅辣18號(hào)、辣研101號(hào)、紅全球;以氮肥施用量為副區(qū),施用4種不同氮肥用量,分別為0、200、350、500 kg·hm-2,基追肥比例1∶1。試驗(yàn)共16個(gè)水平組合,重復(fù)3次,共計(jì)48個(gè)小區(qū),每小區(qū)面積28.8 m2。各處理磷肥、鉀肥施肥量一致,磷肥施用量為150 kg·hm-2(以P2O5計(jì),折純),作基肥一次性施入;鉀肥施用量為300 kg·hm-2(以K2O計(jì),折純),按基追肥1∶1進(jìn)行,追肥在初花期施用。有機(jī)肥按照每667 m2100 kg一次性基施。其中,氮肥為尿素(N質(zhì)量分?jǐn)?shù)46.4%),磷肥為過(guò)磷酸鈣(P2O5質(zhì)量分?jǐn)?shù)16%),鉀肥為硫酸鉀(K2O質(zhì)量分?jǐn)?shù)50%)。試驗(yàn)采用軟盤(pán)基質(zhì)育苗,于2021年4月9日播種,移栽前按照1.2 m廂寬起壟,在椒苗達(dá)到8片真葉時(shí)以株行距0.3 m×0.6 m進(jìn)行定植。四周設(shè)保護(hù)行,留0.3 m過(guò)道便于田間調(diào)查,田間管理同大田生產(chǎn)。
1.2.1 數(shù)據(jù)采集
采用美國(guó)ASD FieldSpec4 Standard-Res便攜式地物光譜儀采集辣椒冠層光譜,測(cè)量波長(zhǎng)為350~2 500 nm,取樣間距為1 nm。選擇天氣晴朗、無(wú)風(fēng)時(shí)測(cè)定冠層光譜,測(cè)定時(shí)間為當(dāng)?shù)貢r(shí)間10:00—15:00,傳感器探頭選用25°視場(chǎng)角的裸光纖,裸光纖垂直向下,距離辣椒冠層葉片高度約20 cm。每測(cè)定5株植株進(jìn)行一次白板優(yōu)化,每株植株重復(fù)測(cè)量5次,取平均值作為該樣本冠層光譜值。
采用日本生產(chǎn)的SPAD-502(soil plant analysis development)葉綠素儀測(cè)定樣本SPAD值,SPAD值能作為指示作物葉片葉綠素含量的相對(duì)值,SPAD值測(cè)定與光譜測(cè)量同步進(jìn)行。每株植株隨機(jī)選取15~20片代表性葉片進(jìn)行測(cè)量,每片葉片選取上、中、下部測(cè)定6~10次,測(cè)量時(shí)避開(kāi)葉脈位置,取代表性葉片的平均值作為辣椒SPAD值
1.2.2 光譜變換方法
由于葉綠素的光譜相應(yīng)波段位于可見(jiàn)光波段和紅外波段[23],故本研究選取400~1 800 nm波段進(jìn)行研究。為增強(qiáng)光譜反射率和葉綠素之間的相關(guān)性,消除周?chē)肼暫屯寥婪瓷渎实葘?duì)辣椒光譜的影響,用MATLAB軟件對(duì)辣椒光譜進(jìn)行Savitzky-Golay(SG)平滑處理作為原始光譜FR,將原始光譜進(jìn)行倒數(shù)、對(duì)數(shù)、倒數(shù)對(duì)數(shù)、一階微分和二階微分變換,其變換后光譜反射率分別記為F1/R、FlgR、Flg(1/R)、FR′、FR″。
在前人的基礎(chǔ)上,篩選與葉綠素相關(guān)性較高的8個(gè)植被指數(shù)(vegetation index, VI)(表1):歸一化植被指數(shù)(NDVI)[24]、修正型葉綠素吸收植被指數(shù)(MCARI)[25]、改進(jìn)型葉綠素吸收植被指數(shù)(TCARI)[26]、土壤調(diào)節(jié)植被指數(shù)(OSAVI)[27]、陸地植被指數(shù)(MTCI)[28]、葉綠素吸收率指數(shù)(CARI)[27]、TCARI/OSAVI(T/O)[26]、紅邊葉綠素指數(shù)(CIrededge)[29]。由這8個(gè)植被指數(shù)構(gòu)成反演辣椒SPAD值的經(jīng)典植被指數(shù)組合,再分別用光譜變換生成5種優(yōu)化植被指數(shù)組合,共6種植被指數(shù)組合,記為FR-VI、F1/R-VI、FlgR-VI、Flg(1/R)-VI、FR′-VI、FR″-VI。
表1 辣椒SPAD值統(tǒng)計(jì)性分析
INDV=(R800-R650)/(R800+R650);
(1)
IMCAR=[(R700-R670)-0.2(R700-R550)]/(R700/R670);
(2)
ITCAR=3[(R700-R670)-0.2(R700-R550)]/(R700/R670);
(3)
IOSAV=1.16(R800-R650)/(R800+R650+0.16);
(4)
IMTC=(R750-R710)/(R710-R680);
(5)
ITCARI/OSAVI={3[(R700-R670)-0.2(R700-R550)]/(R700/R670)}/1.16(R800-R650)/(R800+R650+0.16);
(6)
ICAR=(R700-R670)-0.2(R700+R670);
(7)
ICrededge=(R780-R800)/(R690-R720)-1。
(8)
式(1)~(8)中:IND表示NDVI的值,IMCAR表示MCARI的值,ITCAR表示TCARI的值,IOSAV表示OSAVI的值,IMTC表示MTCI的值,ITCARI/OSAVI表示TCARI/OSAVI的值,ICAR表示CARI的值,ICrededg表示CIrededge的值,R550表示波長(zhǎng)為550 nm的原始波段,R650表示波長(zhǎng)為650 nm的原始波段,R670表示波長(zhǎng)為670 nm的原始波段,R680表示波長(zhǎng)為680 nm的原始波段,R690表示波長(zhǎng)為690 nm的原始波段,R700表示波長(zhǎng)為700 nm的原始波段,R710表示波長(zhǎng)為710 nm的原始波段,R720表示波長(zhǎng)為720 nm的原始波段,R750表示波長(zhǎng)為750 nm的原始波段,R780表示波長(zhǎng)為780 nm的原始波段,R800表示波長(zhǎng)為800 nm的原始波段。
將植被指數(shù)組合中的8個(gè)指數(shù)作為自變量,實(shí)測(cè)SPAD值作為因變量,采用MATLAB軟件建立隨機(jī)森林模型,樣本集劃分采用SPXY法,其中75%的樣本作為建模集,25%的樣品作為驗(yàn)證集。
1.4.1 模型構(gòu)建方法
隨機(jī)森林模型是當(dāng)前最好的回歸模型之一,在數(shù)據(jù)集上表現(xiàn)良好,訓(xùn)練時(shí)速度快,較為容易實(shí)現(xiàn),是通過(guò)集成學(xué)習(xí)的思想將多棵樹(shù)集成的一種算法,主要用于高維數(shù)據(jù)分類和回歸,即隨機(jī)森林包含了多個(gè)CART決策樹(shù),決策樹(shù)是隨機(jī)森林的基本單位,每棵決策樹(shù)代表一個(gè)分類器,隨機(jī)森林將集成所有的分類投票結(jié)果,選取投票次數(shù)最多的結(jié)果進(jìn)行輸出,其本質(zhì)就是集成學(xué)習(xí)法[30]。本研究中最優(yōu)樹(shù)個(gè)數(shù)為100,最優(yōu)葉子節(jié)點(diǎn)個(gè)數(shù)為3。輸入的變量為由光譜數(shù)據(jù)組成的訓(xùn)練集轉(zhuǎn)變到主成分空間所得到的數(shù)據(jù),輸出的因變量為由葉綠素實(shí)測(cè)值組成的訓(xùn)練集。
1.4.2 精度評(píng)價(jià)
評(píng)價(jià)指標(biāo)選用決定系數(shù)(R2)和平均絕對(duì)誤差(MAD),通過(guò)對(duì)比2個(gè)評(píng)價(jià)指標(biāo)選出最佳模型。其中,預(yù)測(cè)模型分為3個(gè)等級(jí),當(dāng)決定系數(shù)R2≥0.75且MAD≥2.0時(shí),說(shuō)明模型預(yù)測(cè)效果非常好;當(dāng)0.5≤R2≤0.75且1.4≤MAD≤2.0時(shí),說(shuō)明模型預(yù)測(cè)效果一般,可對(duì)模型進(jìn)行改進(jìn);當(dāng)R2<0.5且MAD<1.4時(shí),說(shuō)明模型預(yù)測(cè)效果較差[31]。具體見(jiàn)式(9)~式(10)。
(9)
VMAD=VSD/VRMSE。
(10)
采用SPXY算法對(duì)樣本進(jìn)行劃分,其中辣研101號(hào)、紅全球、黔椒8號(hào)和紅辣18號(hào)4個(gè)品種建模集36個(gè),驗(yàn)證集12個(gè);全樣本建模集144個(gè),驗(yàn)證集48個(gè),劃分結(jié)果如表1所示:辣研101號(hào)的SPAD值最低(29.4),紅全球SPAD值居中,黔椒8號(hào)SPAD值的最大值和平均值均最高(79.9、60.65),變異系數(shù)最小的是紅辣18號(hào)(0.09)。4個(gè)品種辣椒的SPAD值存在明顯差異,不同品種和全樣本變異系數(shù)均小于30%,說(shuō)明樣本劃分合理。
由圖1可以看出,不同品種辣椒光譜反射率存在明顯差異。原始反射率大小表現(xiàn)為辣研101號(hào)>黔椒8號(hào)>紅辣18號(hào)>紅全球,一階微分、二階微分光譜反射率大小和原始光譜表現(xiàn)形式一致,且原始光譜和微分光譜反射率大小和不同品種辣椒的平均SPAD值表現(xiàn)一致;倒數(shù)光譜、對(duì)數(shù)光譜、倒數(shù)對(duì)數(shù)光譜反射率大小與原始光譜表現(xiàn)相反,表現(xiàn)均為紅全球>紅辣18號(hào)>辣研101號(hào)>黔椒8號(hào)。通過(guò)一階微分光譜反射率可得,紅邊位置在720 nm處,綠峰位置在521 nm處,由不同品種520~560 nm一階微分曲線位置變化規(guī)律可知,波長(zhǎng)向短波方向移動(dòng)[32],這一波段范圍出現(xiàn)“藍(lán)移”現(xiàn)象,且“藍(lán)移”的變化規(guī)律與4個(gè)品種辣椒平均SPAD值的表現(xiàn)一致。
A代表黔椒8號(hào);B代表紅辣18號(hào);C代表辣研101號(hào);D代表紅全球。FR表示原始光譜反射率,F1/R表示倒數(shù)光譜反射率,FlgR表示對(duì)數(shù)光譜反射率,Flg(1/R)表示倒數(shù)對(duì)數(shù)光譜反射率,FR′表示一階微分光譜反射率,FR″表示二階微分光譜反射率。A represents Qianjiao No.8, B represents Hongla 18, C represents Layan 101, D represents Red Global. FRrepresents the original spectral reflectance, F1/R represents the reciprocal spectral reflectance, FlgR represents the logarithmic spectral reflectance, Flg(1/R) represents the reciprocal logarithmic spectral reflectance, FR′ represents the first-order differential spectral reflectance, FR″ represents the second-order spectral reflectance.圖1 不同品種辣椒變換光譜反射率Fig.1 Spectral reflectance of different pepper varieties
為探究不同品種的優(yōu)化植被指數(shù)與SPAD值之間的相關(guān)性,將8個(gè)植被指數(shù)進(jìn)行光譜替換,結(jié)果如圖2所示。經(jīng)典植被指數(shù)中,辣研101號(hào)除CARI、MTCI、CIrededge外,其余4個(gè)植被指數(shù)均與SPAD值呈極顯著(P<0.01)相關(guān),其中,植被指數(shù)NDVI與SPAD值相關(guān)性最高,相關(guān)系數(shù)絕對(duì)值為0.417;紅全球的SPAD值和植被指數(shù)相關(guān)性較差,只與NDVI呈顯著相關(guān)(P<0.05),相關(guān)系數(shù)絕對(duì)值為0.303;黔椒8號(hào)的SPAD值與植被指數(shù)相關(guān)性最好,與CARI、MCARI、TCARI、T/O均呈極顯著(P<0.01)相關(guān),相關(guān)系數(shù)絕對(duì)值分別為0.520、0.542、0.542、0.279;紅辣18號(hào)中只有植被指數(shù)TCARI與SPAD值呈顯著(P<0.05)相關(guān)關(guān)系、T/O與SPAD值呈極顯著(P<0.01)相關(guān)關(guān)系,相關(guān)系數(shù)絕對(duì)值分別為0.288、0.364。優(yōu)化植被指數(shù)中,辣研101號(hào)微分光譜搭建的植被指數(shù)CARI、MCARI、MTCI、TCARI、CIrededge相關(guān)系數(shù)相比于經(jīng)典植被指數(shù)顯著提升,MCARI、TCARI的所有替換形式均呈極顯著(P<0.01)相關(guān),相關(guān)系數(shù)最高的是FR″-MTARI和FR″-TCARI,相關(guān)系數(shù)均為0.451。紅全球大部分優(yōu)化植被指數(shù)相關(guān)性不高,只有FR-NDVI、FlgR-NDVI、Flg1/R-NDVI與SPAD值呈現(xiàn)顯著(P<0.05)相關(guān),其中FlgR-NDVI相關(guān)系數(shù)最高,相關(guān)系數(shù)絕對(duì)值為0.28。黔椒8號(hào)中基于1/R、lgR、lg1/R優(yōu)化的植被指數(shù)與經(jīng)典植被指數(shù)相比相關(guān)系數(shù)無(wú)顯著變化,基于R、1/R、lgR、lg1/R搭建的CARI、MCARI、TCARI、T/O與SPAD值呈極顯著(P<0.01)相關(guān),其微分光譜優(yōu)化植被指數(shù)效果差。紅辣18號(hào)中基于R、lgR和lg1/R搭建的CARI、MCARI、TCARI和T/O與SPAD值呈顯著(P<0.05)相關(guān),其中FlgR-CARI、Flg1/R-CARI、FlgR-MCRAI和Flg1/R-MCRAI與SPAD值呈極顯著(P<0.01)相關(guān),相關(guān)系數(shù)最高的植被指數(shù)是FlgR-MCRAI和Flg1/R-MCRAI,其絕對(duì)值均為0.49。
CARI,葉綠素吸收率指數(shù);MCARI,修正型葉綠素吸收植被指數(shù);MTCI,陸地植被指數(shù);NDVI,歸一化植被指數(shù);TCARI,改進(jìn)型葉綠素吸收植被指數(shù);OSVAI,土壤調(diào)節(jié)植被指數(shù);CIrededge,紅邊葉綠素指數(shù)。CARI, Chlorophyll absorption ratio index; MCARI, Modified chlorophyll absorption ratio index; MTCI, MERIS terrestrial chlorophyll index; NDVI, Normalized difference vegetation index; TCARI, Transformed chlorophyll absorption in reflectance index; OSVAI, Optimized soil-adjusted vegetation index; CIrededge, Red edge chlorophyll index.圖2 SPAD值與植被指數(shù)相關(guān)性分析熱力圖Fig.2 Heat map of correlation analysis between SPAD and vegetation index
全樣本數(shù)據(jù)搭建的植被指數(shù)與SPAD值相關(guān)性如表2所示:經(jīng)典植被指數(shù)中,只有CIrededge與SPAD顯著相關(guān);而基于倒數(shù)對(duì)數(shù)優(yōu)化的植被指數(shù),除了CARI和CIrededge,其他5個(gè)植被指數(shù)均呈現(xiàn)顯著(P<0.05)相關(guān),相關(guān)系數(shù)絕對(duì)值取值范圍為0.14~0.22?;诘箶?shù)對(duì)數(shù)優(yōu)化的植被指數(shù)除CIrededge外,其余植被指數(shù)的相關(guān)系數(shù)均高于經(jīng)典植被指數(shù),表明對(duì)光譜數(shù)據(jù)進(jìn)行倒數(shù)對(duì)數(shù)變換能有效提高植被指數(shù)與SPAD值之間的相關(guān)性。
表2 全樣本優(yōu)化植被指數(shù)與SPAD值相關(guān)性分析
由表3分析可知,辣研101號(hào)中基于F1/R-VI和Flg1/R-VI搭建的模型精度相較于經(jīng)典植被指數(shù)有明顯提升,其中基于F1/R-VI搭建模型的建模集R2、MAD分別為0.90、2.42,R2>0.75且MAD>2,驗(yàn)證集R2、MAD分別為0.90、2.45,R2>0.75且MAD>2,模型預(yù)測(cè)效果最好。紅全球中基于Flg1/R-VI和FlgR-VI搭建的模型效果均較好,R2均大于0.75,MAD均大于1.4小于2,模型預(yù)測(cè)效果一般,其中基于Flg1/R-VI搭建的模型的驗(yàn)證集表現(xiàn)較優(yōu),R2、MAD分別為0.94、1.58,R2>0.75且2>MAD>1.4。黔椒8號(hào)中基于FlgR-VI和Flg1/R-VI搭建的模型精度高于經(jīng)典植被指數(shù),其中Flg1/R-VI搭建的模型的建模集R2、MAD分別為0.87、2.24,驗(yàn)證集的R2、MAD分別為0.83、2.07,建模集和驗(yàn)證集的R2均大于0.75,MAD值均大于2,模型預(yù)測(cè)效果好。紅辣18號(hào)中FR-VI和FlgR-VI搭建的模型精度均較高,其中FR-VI模型的建模集精度最高,R2、MAD分別為0.83、1.95,R2>0.75,MAD>2,模型效果好;驗(yàn)證集精度最高的是基于FlgR-VI搭建的模型,其R2、MAD分別為0.66、1.40,模型預(yù)測(cè)效果一般?;谌珮颖窘?jīng)典植被指數(shù)搭建的模型精度明顯低于4個(gè)樣本的模型精度,其中基于Flg1/R-VI搭建的模型精度最優(yōu),建模集的R2、MAD分別為0.83、1.90,驗(yàn)證集的R2、MAD分別為0.45、1.26,R2<0.5,MAD<1.4,建模集預(yù)測(cè)效果一般。微分光譜搭建的植被指數(shù)模型效果最差,不能對(duì)SPAD進(jìn)行預(yù)測(cè)。
表3 優(yōu)化植被指數(shù)組合估算SPAD值的RF模型結(jié)果
綜上所述,辣研101號(hào)的最佳預(yù)測(cè)模型為F1/R-VI-RF(倒數(shù)光譜優(yōu)化的植被指數(shù)組合搭建的隨機(jī)森林模型),其次是Flg1/R-VI-RF;紅全球的最佳預(yù)測(cè)模型為Flg1/R-VI-RF,其次為FlgR-VI-RF;黔椒8號(hào)的最佳預(yù)測(cè)模型為Flg1/R-VI-RF,其次為FR-VI-RF;紅辣18號(hào)的最佳預(yù)測(cè)模型為FlgR-VI-RF,其次為FR-VI-RF?;诳倶颖镜淖罴涯P蜑镕lg1/R-VI-RF。辣研101、紅全球、黔椒8號(hào)、紅辣18號(hào)和全樣本SPAD值最優(yōu)模型實(shí)測(cè)值和預(yù)測(cè)值關(guān)系如圖3所示。
圖3 不同品種辣椒的SPAD值最優(yōu)估算模型實(shí)測(cè)值與預(yù)測(cè)值關(guān)系Fig.3 Relationship between the measured value and the predicted value of SPAD optimal estimation model of different varieties of pepper
不同品種辣椒建模集SPAD值由大到小為黔椒8號(hào)、紅辣18號(hào)、紅全球、辣研101號(hào),驗(yàn)證集SPAD值由大到小為黔椒8號(hào)、紅辣18號(hào)、辣研101號(hào)、紅全球,不同品種辣椒SPAD值由大到小為黔椒8號(hào)、紅辣18號(hào)、辣研101號(hào)、紅全球。線椒SPAD值不論是建模集、驗(yàn)證集還是全樣本都高于朝天椒,這是由于不同品種的辣椒外形不同,導(dǎo)致冠層葉片分布存在差異,線椒呈長(zhǎng)線型,大多垂直懸掛于冠層葉片底部,而朝天椒果實(shí)較小且堅(jiān)實(shí),朝上生長(zhǎng)。辣椒果實(shí)顏色不同會(huì)直接影響葉片葉綠素對(duì)光能的捕獲特性,影響作物進(jìn)行光合作用等一系列生命活動(dòng),從而導(dǎo)致不同品種作物之間的SPAD值存在差異。
不同品種辣椒光譜曲線變化規(guī)律基本一致,但不同品種辣椒的冠層光譜特性存在差異。辣椒品種不同,其葉片組織結(jié)構(gòu)和冠形也會(huì)存在差異[33],導(dǎo)致辣椒的反射率大小存在差異,且光譜變換方式不同,這種差異的顯著程度也不同。由原始光譜曲線可知,葉綠素對(duì)綠光吸收較低,所以在可見(jiàn)光區(qū)域(400~760 nm)辣椒葉綠素反射率較低;由于光合作用對(duì)紅光的吸收作用,在670 nm處形成了吸收谷,在“紅邊位置”反射率陡然增加至反射率最高位置,即反射率達(dá)到45%左右,這是由于葉綠素在強(qiáng)烈吸收紅光波段;在760~1 350 nm區(qū)域由于近紅外波段葉片內(nèi)部進(jìn)行了多次散射,反射率呈現(xiàn)波浪形下降,其反射率在20%~45%。
基于倒數(shù)、對(duì)數(shù)與倒數(shù)對(duì)數(shù)光譜優(yōu)化的植被指數(shù)搭建的模型精度表現(xiàn)較好,這與文獻(xiàn)[14]結(jié)論一致,其中基于倒數(shù)對(duì)數(shù)變換波段優(yōu)化的植被指數(shù)在不同品種和全樣本搭建的模型具有較好的普適性,主要在于倒數(shù)對(duì)數(shù)光譜可以突出譜線波形變化特征,增強(qiáng)多組光譜數(shù)據(jù)之間的峰谷特征差異,從而有利于從多譜線間的分異表現(xiàn)中提取敏感波段,改善對(duì)光譜特征相近地物的識(shí)別精度[34],這與文獻(xiàn)[35]的結(jié)論一致。經(jīng)典的植被指數(shù)主要是為了放大紅外和近紅外光譜差異[36],倒數(shù)對(duì)數(shù)變換可進(jìn)一步放大光譜差異,降低周?chē)肼?突出敏感波段[37]。研究表明,基于對(duì)數(shù)、倒數(shù)對(duì)數(shù)光譜優(yōu)化的植被指數(shù)與SPAD值之間的相關(guān)性具有一致性;類似植被指數(shù)TCARI、MCARI、OSAVI和TCARI/OSAVI這樣的表達(dá)式與SPAD值之間具有較好的相關(guān)性,且它們的優(yōu)化植被指數(shù)普適性相比經(jīng)典植被指數(shù)有一定程度的提升,這可能與植被指數(shù)表達(dá)式構(gòu)建原理有關(guān)。
盡管使用隨機(jī)森林模型有效解決了線性模型帶來(lái)的一系列包括過(guò)擬合問(wèn)題,但過(guò)擬合現(xiàn)象是機(jī)器算法中常見(jiàn)的關(guān)鍵障礙,無(wú)法徹底避免。模型建模集和驗(yàn)證集精度差異較為明顯,存在過(guò)擬合現(xiàn)象,這是由于遵義屬于典型的喀斯特地區(qū),地形態(tài)勢(shì)起伏不定,峰叢錯(cuò)綜復(fù)雜[38],且采集光譜數(shù)據(jù)時(shí)對(duì)天氣要求高,測(cè)量時(shí)間有限,導(dǎo)致數(shù)據(jù)采集困難,樣本量采集過(guò)少,一定程度上影響了數(shù)據(jù)的泛化能力。
不同品種辣椒葉片光譜反射率變化趨勢(shì)基本一致,但不同品種辣椒冠層光譜特性存在差異。原始光譜和微分光譜反射率大小變化趨勢(shì)與不同品種辣椒平均SPAD值表現(xiàn)一致;對(duì)數(shù)、倒數(shù)和倒數(shù)對(duì)數(shù)光譜反射率大小變化趨勢(shì)和不同品種辣椒平均SPAD值表現(xiàn)相反。建模集和驗(yàn)證集SPAD值大小變化趨勢(shì)均是朝天椒小于線椒,線椒中黔椒8號(hào)的SPAD值不論建模集還是驗(yàn)證集都高于其他品種?;诘箶?shù)對(duì)數(shù)光譜優(yōu)化的植被指數(shù)除了CIrededge外,其余植被指數(shù)的相關(guān)系數(shù)均高于經(jīng)典植被指數(shù)。以Flg1/R優(yōu)化的植被指數(shù)組合建立的SPAD值預(yù)測(cè)模型,對(duì)不同品種和全樣本辣椒建模集和驗(yàn)證集都具有較好的精度,適用于貴州遵義辣椒SPAD值的預(yù)測(cè)。
上述結(jié)果僅針對(duì)不同品種辣椒盛果期SPAD值進(jìn)行研究,而不同生育期的冠層光譜和SPAD值都會(huì)存在差異,盛果期可能無(wú)法代替整個(gè)生育期的信息,該模型是否適用于其他生育期SPAD估算還有待進(jìn)一步探索。