董 瑞,唐莊生,花 蕊,蔡新成,包達(dá)爾罕,楚 彬,郝媛媛,花立民
甘肅農(nóng)業(yè)大學(xué)草業(yè)學(xué)院,草業(yè)生態(tài)系統(tǒng)教育部重點(diǎn)實(shí)驗(yàn)室,國(guó)家林業(yè)草原高寒草地鼠害防控工程技術(shù)研究中心,甘肅 蘭州 730070
草地是陸地生態(tài)系統(tǒng)重要組成部分,在調(diào)節(jié)氣候變化、維持生態(tài)系統(tǒng)平衡中具有重要作用[1]。 近年來(lái),在氣候變化和人類活動(dòng)等多重因素影響下,草地出現(xiàn)了沙化、鹽漬化和毒草化等退化情況,其中毒草型退化草地面積約占我國(guó)天然草地總面積的11.3%[2]。 草地毒草型退化導(dǎo)致物種多樣性減少、生產(chǎn)力下降、家畜中毒等問(wèn)題日益突出,草畜矛盾加劇[3]。 因此,了解毒草種類及其分布面積對(duì)維系草地生態(tài)系統(tǒng)安全和保護(hù)畜牧業(yè)健康發(fā)展具有重要意義。
目前,傳統(tǒng)毒草種類調(diào)查常采用人工實(shí)地分類計(jì)數(shù)的方法。 雖然毒草識(shí)別精度高,但是由于調(diào)查范圍小、速度慢、代表性差等,難以滿足大面積毒草動(dòng)態(tài)監(jiān)測(cè)的需求[4]。 與傳統(tǒng)調(diào)查相比,遙感調(diào)查覆蓋范圍廣、周期短,為實(shí)現(xiàn)毒草種類識(shí)別及分布面積調(diào)查提供了一種高效技術(shù)手段[5]。 遙感技術(shù)利用地物反射光譜信息,可以快速、準(zhǔn)確、大面積地獲取高寒草甸植物信息,實(shí)現(xiàn)從小面積監(jiān)測(cè)到大面積調(diào)查的飛躍[6]。 有學(xué)者已通過(guò)獲取多光譜影像對(duì)草地植物物種組成開(kāi)展了研究,如利用無(wú)人機(jī)對(duì)草地入侵植物進(jìn)行檢測(cè)[7]。 由于遙感平臺(tái)的多光譜傳感器波段范圍窄、分辨率低,再加上草地背景的復(fù)雜性以及植被光譜反射的相似特征,在空間遙感探測(cè)中容易出現(xiàn)“異物同譜”現(xiàn)象,降低了識(shí)別分類的精度與效率,無(wú)法滿足更高精度的植物種類識(shí)別。 而高光譜技術(shù)以高分辨率、波段連續(xù)、信息豐富等優(yōu)點(diǎn)彌補(bǔ)了多光譜遙感技術(shù)的不足。 目前已在森林、濕地和荒漠植物識(shí)別中得到了廣泛應(yīng)用。 如通過(guò)統(tǒng)計(jì)分析與分類算法相結(jié)合的方法,利用植物光譜特征變量[8]、光譜波段[9]實(shí)現(xiàn)植物識(shí)別與分類研究,這些研究為解讀植物光譜反射特征提供了非常有效的方法。
盡管高光譜數(shù)據(jù)具有波段多、信息量豐富等特點(diǎn),但是如何選擇用于定量分析的光譜特征變量,如最佳波段、植被指數(shù)以及光譜吸收特征參數(shù)等,是限制高光譜數(shù)據(jù)用于植物物種識(shí)別的主要障礙之一。 目前關(guān)于高寒草甸毒草光譜特征研究較少,尤其是如何篩選出有利于毒草分類的最佳特征變量研究更少。 本研究以高寒草甸主要毒草為研究對(duì)象,利用原始光譜值和一階微分導(dǎo)數(shù)法,選擇了位置參數(shù)、面積參數(shù)和植被指數(shù)作為光譜特征變量,采用典型判別分析得到各典型變量累計(jì)貢獻(xiàn)率,依據(jù)標(biāo)準(zhǔn)化得分系數(shù)絕對(duì)值對(duì)16個(gè)特征變量排序,最后應(yīng)用隨機(jī)森林、支持向量機(jī)-徑向核函數(shù)等5種模型篩選出高寒草甸主要毒草識(shí)別的最佳特征變量,解決高光譜數(shù)據(jù)在分類時(shí)有效信息的提取問(wèn)題,提高分類速度和精度。 研究結(jié)果以期為高寒草甸毒草分布及發(fā)生面積提供科學(xué)監(jiān)測(cè)依據(jù)。
基于主要毒草分布區(qū)域特征,本研究選擇甘肅省天祝藏族自治縣和甘南藏族自治州瑪曲縣為研究區(qū)。 天祝藏族自治縣(102°07′—103°46′E,36°31′—37°55′N),海拔2 878~3 425 m,年均溫-0.1 ℃,降水量416 mm。 植被類型為高寒草甸,以莎草科(Cyperus)、禾本科(Gramineae)植物為優(yōu)勢(shì)種,伴生種以闊葉類雜草與毒草為主,主要毒草有黃花棘豆、露蕊烏頭、瑞香狼毒、碎米蕨葉馬先蒿等。 瑪曲縣(104°45′—102°29′E,33°06′—34°30′N),海拔3 434 m,年均溫1.2 ℃,無(wú)霜期20 d,年均日照時(shí)數(shù)2 631.9 h。 以莎草科、禾本科植物為優(yōu)勢(shì)種,伴生種以闊葉類雜草與毒草為主,主要毒草有黃帚橐吾、長(zhǎng)毛風(fēng)毛菊、寬苞棘豆等。
研究區(qū)毒草選擇依據(jù)是征求當(dāng)?shù)夭菰炯夹g(shù)人員意見(jiàn),選擇分布面積較廣、毒害作用較強(qiáng)的主要毒草進(jìn)行光譜數(shù)據(jù)采集(表1)。 毒草種類劃定依據(jù)《中國(guó)西部天然草地毒害草的主要種類及分布》[10]。 獲取光譜數(shù)據(jù)中長(zhǎng)毛風(fēng)毛菊和黃帚橐吾來(lái)源于瑪曲縣,其余9種毒草數(shù)據(jù)采集于天??h。
表1 11種有毒草及其特征Table 1 11 poisonous plants and their characteristics
使用高光譜成像光譜儀SOC710VP(美國(guó)SOC公司)采集毒草光譜數(shù)據(jù)。 光譜范圍400~1 000 nm,分辨率4.68 nm,采樣間隔為1.4 nm,波段數(shù)為128。 野外采集時(shí)間為2020年7月10日至12日的11:00—14:00(太陽(yáng)高度角>45°)。 采集時(shí)晴朗無(wú)云、無(wú)風(fēng)或者少風(fēng)(風(fēng)力<4級(jí))。 每隔20 min進(jìn)行一次白板校正。 測(cè)量時(shí)鏡頭垂直向下,距離植物冠層垂直高度為0.5 m。 為保證采集植物數(shù)據(jù)的準(zhǔn)確性,每種植物采集不少于20幅影像,共獲取11種毒草光譜數(shù)據(jù)。
使用SRAnal710軟件進(jìn)行反射率轉(zhuǎn)換,從270張影像中分別提取2個(gè)植物純凈像元作為原始光譜數(shù)據(jù),每種毒草獲取50條光譜反射曲線,同時(shí)剔除同種植物光譜曲線差異較大的曲線,剩余的光譜數(shù)據(jù)求平均值作為該毒草的反射光譜值。
1.4.1 光譜數(shù)據(jù)平滑
由于光譜數(shù)據(jù)采集在野外完成,外界環(huán)境及儀器自身產(chǎn)生的噪聲對(duì)原始光譜數(shù)據(jù)會(huì)造成影響,采用式(1)對(duì)原始高光譜數(shù)據(jù)進(jìn)行Savitzky-Golay卷積平滑降噪處理,計(jì)算得到毒草的原始光譜數(shù)據(jù)。
(1)
1.4.2 光譜一階微分導(dǎo)數(shù)處理
一階微分導(dǎo)數(shù)可減弱土壤背景對(duì)植物光譜反射率的影響,可部分消除太陽(yáng)光照、大氣效應(yīng)的干擾,更有效地提取植物光譜信息。 一階微分導(dǎo)數(shù)公式如式(2)[11]
(2)
1.4.3 光譜特征變量選擇
為探討高寒草甸主要毒草的光譜響應(yīng)特征變量,依據(jù)已有研究常用的光譜特征變量[8],選用了16個(gè)光譜特征變量,其中位置變量10個(gè),面積變量2個(gè),植物植被指數(shù)變量4個(gè),各參數(shù)定義如表2所示。
表2 光譜特征變量的定義Table 2 Definition of spectral characteristic variables
利用典型判別分析(canonical discriminant analysis,CDA)的標(biāo)準(zhǔn)化得分系數(shù)絕對(duì)值,對(duì)16個(gè)光譜特征變量參與分類的重要程度進(jìn)行排序。
1.6.1 光譜特征變量分類測(cè)試
對(duì)16個(gè)光譜特征變量進(jìn)行典型判別分析選取前兩個(gè)典型數(shù)據(jù),其累計(jì)百分比大于75%,以標(biāo)準(zhǔn)化得分系數(shù)絕對(duì)值由大到小排序,依次輸入到分類算法進(jìn)行最佳變量篩選。 以特征變量為自變量,分類精度為因變量。 選擇5種統(tǒng)計(jì)分類方法隨機(jī)森林(random forest,RF)、支持向量機(jī)-徑向基核函數(shù)(support vector machine-radial basis function, SVM-RBF)、k最鄰近分類(k-nearest neighbor,KNN)、樸素貝葉斯(Naive Bayesian,NB)和決策樹(shù)(CART)進(jìn)行分類效果對(duì)比研究。
1.6.2 精度評(píng)價(jià)方法
使用混淆矩陣對(duì)分類精度計(jì)算,對(duì)角線上的元素值為正確分類數(shù),值越大表示分類結(jié)果的可靠性越高,反之則分類錯(cuò)誤的現(xiàn)象嚴(yán)重。 基于混淆矩陣構(gòu)建中的總體精度定義如式(3)[12]
(3)
式(3)中:n為總的預(yù)測(cè)數(shù)據(jù)個(gè)數(shù);xii為i類別正確分類物種個(gè)數(shù)。
研究區(qū)11種高寒草甸毒草光譜曲線變化趨勢(shì)相似,波峰、波谷出現(xiàn)的位置基本一致(圖1)。 在可見(jiàn)光波段400~700 nm范圍內(nèi),由于不同綠色植物對(duì)光吸收強(qiáng)度不同,反射值較小且表現(xiàn)不同高低。 其中,在500~530 nm間乳白香青光譜反射值快速上升,而其他10種毒草光譜反射曲線幾乎一致且平穩(wěn)變化,分析認(rèn)為乳白香青表面絨毛導(dǎo)致葉片吸收反射值快速增加。 在540 nm附近出現(xiàn)第一個(gè)波峰(綠峰),在490和670 nm附近葉綠素吸收大部分能量,出現(xiàn)兩個(gè)吸收波谷。 在680~760 nm波段之間,由于紅光波段和近紅外波段對(duì)于葉綠素強(qiáng)烈反射,反射曲線快速上升。 在780~1 000 nm波段之間,光譜反射值保持在較高水平,整體呈下降趨勢(shì)。
圖1 11種不同高寒草甸毒草的平均光譜曲線Fig.1 Average spectral curves of 11 differentalpine meadow poisonous plants
由圖2可知,11種高寒草地毒草平均一階微分導(dǎo)數(shù)在“藍(lán)邊”和“紅邊”位置均出現(xiàn)波峰,表現(xiàn)出“紅邊”范圍內(nèi)各個(gè)植物反射光譜一階導(dǎo)數(shù)值均比“藍(lán)邊”范圍內(nèi)大,且密花香薷遠(yuǎn)大于其他植物光譜反射值。 “紅邊”范圍內(nèi)11種植物光譜反射值較為接近,密花香薷在690 nm處達(dá)到最大值,露蕊烏頭和葵花大薊在710 nm處出現(xiàn)峰重合。 在可見(jiàn)光“黃邊”與近紅外波段780~950 nm波段間,光譜反射值基本趨近于0。 在400~490 nm波段之間,乳白香青出現(xiàn)第一個(gè)反射峰,而其他植物反射值基本一致且平穩(wěn)變化。
圖2 11種不同高寒草甸毒草的平均一階微分光譜曲線
由于光譜反射曲線之間差異較小,導(dǎo)致各植物光譜反射特征不易區(qū)分。 通過(guò)對(duì)16個(gè)光譜特征變量進(jìn)行相關(guān)性分析,得到16個(gè)特征變量之間存在較強(qiáng)的相關(guān)性。 其中,植被指數(shù)NDVI2與RVI2相關(guān)性達(dá)到了0.97,NDVI1與RVI1相關(guān)性為0.95,位置參數(shù)與面積參數(shù)中Ab與Mb相關(guān)性為0.94。
圖3 相關(guān)性矩陣
表3 基于典型判別分析的分類精度矩陣Table 3 Classification accuracy based on typical discriminant analysis
因此,需要采用特征變量對(duì)11種毒草分類的貢獻(xiàn)性進(jìn)行分析,剔除多余或者影響分類的特征變量。
采用16個(gè)光譜特征變量建立典型判別分析(表3),總分類精度達(dá)到92.34%,R2=0.89。 其中,多枝黃芪、瑞香狼毒和乳白香青識(shí)別精度達(dá)到了100%,黃花棘豆識(shí)別精度最低為70%。 其中,黃花棘豆中有13組數(shù)據(jù)誤分到寬苞棘豆中,原因?yàn)辄S花棘豆與寬苞棘豆屬于同屬植物,葉片形狀結(jié)構(gòu)及葉綠素含量差異性較小,導(dǎo)致光譜反射差異較小。
由圖4(a,b)可以看出,經(jīng)過(guò)典型判別分析,以累計(jì)貢獻(xiàn)率大于75%,選取了“典型1”與“典型2”兩個(gè)典型變量,從標(biāo)準(zhǔn)化得分系數(shù)圖4(b)中按照絕對(duì)值大小進(jìn)行排序。 得到16個(gè)光譜特征變量參在分類中的重要性為Mg>Ab>Mre>Are>Lre>NDVI2>RVI1>Lg>Mb>NDVI1>Lr>Mr>Ly>RVI2>Lb>My。 得分系數(shù)越大,它與分類變量的關(guān)聯(lián)越強(qiáng),然后依據(jù)光譜特征變量參與分類的重要性從大到小依次輸入分類算法中構(gòu)建模型及預(yù)測(cè),篩選出最佳分類光譜特征變量[13]。
圖4 16個(gè)光譜特征變量排序(a): 典型變量累計(jì)百分比;(b): 標(biāo)準(zhǔn)化得分系數(shù)Fig.4 Sorting of 16 spectral feature variables(a): The cumulative percentage of typical variables; (b): The standardized score coefficient
圖5顯示了11種毒草在不同模型中的分類精度,當(dāng)添加的建模光譜特征變量增加時(shí),SVM-RBF,CART,NB和KNN 4種模型分類精度整體呈現(xiàn)先上升后下降的趨勢(shì),而采用RF模型時(shí)分類精度與特征變量個(gè)數(shù)呈線性增長(zhǎng)關(guān)系,在使用16個(gè)光譜特征后分類精度達(dá)到最大。 光譜特征變量添加到第7個(gè)時(shí)SVM-RBF,CART和NB算法分類精度達(dá)到最大值,而后出現(xiàn)下降,最大分類精度SVM-RBF>CART>NB,SVM-RBF算法分類精度96.45%;KNN算法在光譜特征變量添加到第8個(gè)時(shí),分類精度達(dá)到最大。 有研究表明,利用紅谷位置、紅邊位置、紅谷幅值、藍(lán)邊面積、NDVI1、RVI1、RVI2光譜特征變量可識(shí)別分類4種荒漠植物[8],所以本文提出使用綠峰幅值(Mg)、藍(lán)邊面積(Ab)、紅邊幅值(Mre)、紅邊面積(Are)、紅邊位置(Lre)、NDVI2、RVI1光譜特征變量對(duì)11種毒草分類時(shí)分類效果最好,與前人的研究結(jié)果相符。
圖5 16種光譜變量在5種算法中的分類精度Fig.5 Classification accuracy of 16 spectralvariables in 5 algorithms
通過(guò)對(duì)研究區(qū)11種毒草光譜數(shù)據(jù)變換處理及分析,選取16個(gè)光譜特征變量,利用典型判別分析篩選出最佳分類光譜特征變量,最后分別使用隨機(jī)森林、支持向量機(jī)-徑向核函數(shù)、k最鄰近分類、樸素貝葉斯和決策樹(shù)算法對(duì)篩選的最佳特征構(gòu)建模型驗(yàn)證,得到如下結(jié)論:
(1)采用典型判別分析對(duì)16個(gè)光譜特征變量分類,得到總體精度達(dá)到92.34%,R2為0.89。
(2)依據(jù)“典型1”與“典型2”變量累計(jì)百分比大于75%,對(duì)16種光譜特征變量標(biāo)準(zhǔn)化得分系數(shù)絕對(duì)值排序,然后依次輸入到5種分類模型中建模驗(yàn)證,篩選出的綠峰幅值(Mg)、藍(lán)邊面積(Ab)、紅邊幅值(Mre)、紅邊面積(Are)、紅邊位置(Lre)、NDVI2、RVI1為高寒草甸主要毒草分類的光譜特征變量。
(3)以篩選出的7個(gè)光譜特征變量作為輸入變量,使用5種分類算法預(yù)測(cè)時(shí),支持向量機(jī)-徑向核函數(shù)(SVM-RBF)為最優(yōu)分類算法,分類精度達(dá)到96.45%。 相比于典型判別分類,支持向量機(jī)-徑向核函數(shù)算法使用7個(gè)光譜特征變量分類精度能夠達(dá)到最高。