西桂林, 黃曉君, 3*, 包玉海, 包 剛, 佟斯琴,Ganbat Dashzebegd, Tsagaantsooj Nanzadd, Altanchimeg Dorjsurene,Enkhnasan Davaadorj, Mungunkhuyag Ariunaad
1. 內(nèi)蒙古師范大學地理科學學院, 內(nèi)蒙古 呼和浩特 010022 2. 內(nèi)蒙古自治區(qū)遙感與地理信息系統(tǒng)重點實驗室, 內(nèi)蒙古 呼和浩特 010022 3. 內(nèi)蒙古自治區(qū)蒙古高原災害與生態(tài)安全重點實驗室, 內(nèi)蒙古 呼和浩特 010022 4. Institute of Geography and Geoecology, Mongolian Academy of Sciences, Ulan Bator, Mongolia 5. Institute of General and Experimental Biology, Mongolian Academy of Sciences, Ulan Bator, Mongolia
雅氏落葉松尺蠖(ErannisjacobsoniDjak.)害蟲只分布在蒙古高原北部森林, 是嚴重危害針葉松林的害蟲之一。 近年來, 在蒙古國杭愛山和肯特山落葉松林區(qū)雅氏落葉松尺蠖暴發(fā)頻繁且猖狂, 其幼蟲專食葉子和嫩枝, 已對針葉松林生態(tài)系統(tǒng)造成嚴重破壞[1]。 該蟲害造成針葉生理功能衰退, 使冠層狀態(tài)發(fā)生變化, 威脅落葉松林健康安全。 林木冠層狀態(tài)指標, 即冠層顏色和失葉率可作為森林蟲害嚴重程度監(jiān)測及森林健康評估的重要指標, 其中冠層顏色在蟲害中的變化顯得更為直觀[2], 如隨著雅氏落葉松尺蠖蟲害嚴重程度加劇, 林木冠層顏色由綠色向黃色紅色灰色變化。 因此雅氏落葉松尺蠖危害下, 展開受害過程林木冠層不同顏色高光譜判別, 可為森林蟲害嚴重程度監(jiān)測與評估提供重要參考依據(jù)。
綜上所述, 在林木失葉率、 生化組分和冠層顏色檢測中, 高光譜結(jié)合數(shù)據(jù)挖掘和機器學習算法具有很大潛力。 在蟲害林木失葉率和生化組分估測中, 計算光譜指數(shù)、 微分光譜反射率和光譜小波系數(shù), 通過偏最小二乘回歸(PLSR)、 支持向量機回歸(SVMR)算法獲得了較理想的估測精度。 在蟲害冠層顏色檢測中, 借助光譜特征, 利用隨機森林和支持向量機分類算法, 對蟲害某個階段的林木冠層顏色進行判別, 得到了很好的效果, 而對蟲害各階段的林木冠層不同顏色進行檢測的研究極少。 嘗試計算微分光譜反射率和光譜小波系數(shù)等光譜特征, 結(jié)合數(shù)據(jù)挖掘和機器學習算法, 實現(xiàn)蟲害全過程各階段的林木冠層不同顏色判別, 這將會更直觀的表征林木蟲害嚴重程度提供一種途徑。 基于此, 以蒙古國雅氏落葉松尺蠖發(fā)生典型區(qū)作為試驗區(qū), 通過受害過程林木冠層高光譜數(shù)據(jù), 計算一系列高光譜特征, 利用隨機森林分類(RF)和支持向量機分類(SVMC)模型, 判別雅氏落葉松尺蠖蟲害過程的落葉松冠層不同顏色, 以期為森林蟲害嚴重程度高光譜監(jiān)測提供重要參考。
以蒙古國后杭愛省的Ikhtamir, Battsengel和肯特省的binder作為試驗區(qū), 針對雅氏落葉松尺蠖災象, 開展了落葉松冠層不同顏色調(diào)查和高光譜測量試驗研究。
雅氏落葉松尺蠖蟲害過程中, 林木冠層不同顏色的變化能夠直接反映落葉松受害程度。 隨蟲害嚴重程度加重(健康→輕度→中度→重度), 冠層顏色變化為綠色→黃色→紅色→灰色。 通過野外目視判別和室內(nèi)照片識別(借助Adobe photoshop軟件吸管工具獲取林木照片RGB信息)相結(jié)合確定了樣本樹冠層顏色。 從Ikhtamir, Battsengel和Binder等試驗區(qū)分別選擇了20棵、 26棵和20棵樣本樹, 其中冠層為綠色、 黃色、 紅色和灰色的樣本樹分別為12棵、 20棵、 27棵和7棵。 為建模對冠層顏色進行了編號, 即綠、 黃、 紅和灰分別記為1, 2, 3和4, 如圖1所示。
圖1 冠層不同顏色
高光譜數(shù)據(jù)是采用美國的ASD FieldSpec4和SVC HR-1024地物光譜儀對蒙古國Ikhtamir, Battsengel和Binder等林區(qū)落葉松冠層進行高光譜測量而得。 兩個地物光譜儀光譜波段均為350~2 500 nm; 光譜分辨率分別為3和3.5 nm, 其他參數(shù)均相同。 于北京時間10:00—14:00期間, 選擇無云無風天氣, 地物光譜儀探頭距針葉高度約為20 cm, 并對每棵樣本樹分為上、 中、 下三個層次, 分別采集20次。 在這期間, 每測完一棵樣本樹需進行白板校正, 以此確保高光譜數(shù)據(jù)質(zhì)量[9]。
實地采集的落葉松冠層原始高光譜數(shù)據(jù)應需預處理。 首先通過高光譜數(shù)據(jù)處理軟件, 剔除每棵樣本樹異樣和重復光譜曲線, 并取其平均光譜曲線作為該樣本樹的光譜反射率曲線。 因?qū)嶒瀮x器和環(huán)境因素影響, 原始光譜尾部部分有明顯噪聲, 最終保留350~1800nm范圍的光譜。 其次在遙感圖像處理軟件ENVI平臺上, 利用Smooth(s1, 5)函數(shù)對光譜反射率進行平滑降噪處理, 獲得平滑光譜反射率(記為SSR)。 在此基礎上, 求SSR的一階導數(shù)來降低大氣效應, 得到微分光譜反射率(記為DSR)。 最后通過Matlab2016b平臺的小波基函數(shù), 對SSR進行1~10尺度上的連續(xù)小波變換, 獲得一系列平滑光譜連續(xù)小波系數(shù)(記為SSR-CWC), 其中有36個小波基, 即①Biorthogonal系: biorN(N=1.3, 1.5, 2.2, 2.4, 2.6, 2.8, 3.1, 3.3, 3.5, 3.7, 3.9, 4.4, 5.5, 6.8); ②Coiflets系: coifN(N=1~5); ③Daubechies系: dbN(N=1~10); ④Symlets系: symN(N=2~8)。 SSR-CWC的反射光譜與原始平滑反射光譜波段對應, 能有效捕捉冠層光譜波段吸收與反射特征的形狀及位置的可解釋信息。
雅氏落葉松尺蠖不同危害程度下林木冠層顏色判別模型建立過程如圖2所示。
圖2 判別模型建立技術(shù)路線示意圖
1.4.1 敏感高光譜特征提取
為提取落葉松冠層不同顏色的敏感光譜特征做了以下處理:
(1)光譜特征方差分析。 方差分析是通過計算方差統(tǒng)計量F值, 檢驗各總體的均值是否相等來判斷分類型自變量對數(shù)值型因變量是否有顯著影響[10]。 本研究分析SSR, DSR和SSR-CWC等光譜特征對冠層不同顏色的方差, 揭示了這些高光譜特征對蟲害林木冠層不同顏色的敏感性。 光譜特征的F值越大, 說明其對冠層不同顏色的敏感性越顯著。
(2)基于Findpeaks-SPA的敏感高光譜特征提取
首先利用Findpeaks函數(shù)[11]自動尋找方差統(tǒng)計量(F)的峰值并確定敏感光譜波段, 然后利用敏感波段位置, 提取初始敏感光譜特征。 如式(1)所示
[P,L]=Findpeaks(x, ‘minpeakheight’,
a, ‘minpeakdistance’,b)
(1)
式中x為F和波段組成的矩陣,P為F峰值,L為F峰值相應的波段位置,a為F峰值的最小高度,b為相鄰F峰值間的最小波段距離數(shù)。 其光譜特征SSR, DSR和SSR-CWC的F的a分別設置為: 3.64, 3.64和20,b分別設置為: 10, 10和10 nm。
其次在初始敏感光譜特征獲得的基礎上, 利用連續(xù)投影算法(SPA)提取最終敏感光譜特征[12]。 SPA算法能夠提取全波段的幾個特征波長, 進而消除原始光譜矩陣中冗余信息的矢量空間共線性最小化的前向量選擇算法。 該算法在文獻[1]中有具體解釋。
1.4.2 模型建立
從所有樣本樹數(shù)據(jù)中選46棵作為訓練樣本數(shù)據(jù), 其余20棵為驗證樣本數(shù)據(jù), 以基于Findpeaks函數(shù)和SPA算法結(jié)合模式(記為Findpeaks-SPA)提取的敏感光譜特征作為模型自變量, 冠層顏色編號作為因變量, 采用隨機森林分類[13](RF)和支持向量機分類[14](SVMC)算法, 建立了判別模型, 并與費歇爾判別[15](FD)模型進行了比較。 RF和SVMC均屬于機器學習算法。 RF是遵守獨立事件的概率法則, 以少數(shù)服從多數(shù)來預測的判別模型。 SVMC主要是處理線性可分或近似線性可分的問題, 是特征空間上的間隔最大的線性分類器。 目前在分類模型中, RF和SVMC受到很多學者的關(guān)注。 FD是以類間均值差異最大而類內(nèi)的離差平方和最小為原則的分類算法, 是具有統(tǒng)計學意義的傳統(tǒng)分類模型。
1.4.3 模型驗證
本研究利用總體精度和Kappa系數(shù)來驗證冠層不同顏色高光譜判別模型精度。 總體精度是指判別模型在所有樣本上預測之后, 預測正確的樣本與總樣本之間的比值, 其值范圍為0~1; 若總體精度越大, 冠層不同顏色判別精度也就越高。 Kappa系數(shù)是解決預測模型的結(jié)果與實際結(jié)果一致性問題, 其值介于0~1間。 若Kappa系數(shù)越大, 分類結(jié)果與真實參考之間差異越小, 則判別冠層不同顏色精度越高。 當0.60
2.1.1 高光譜特征對冠層不同顏色的響應
為分析高光譜特征對雅氏落葉松尺蠖危害下落葉松冠層不同顏色的響應, 繪制了冠層不同顏色的SSR、 DSR和SSR-CWC(基于25尺度的bior1.5, coif1, db9和sym4小波基連續(xù)小波系數(shù))高光譜特征曲線圖(圖3)。
由圖3可知, 高光譜特征對冠層不同顏色具有明顯的響應。 在高光譜特征曲線上形成很多波峰波谷, 且冠層顏色由綠色→黃色→紅色→灰色的變化時, 波峰附近的高光譜特征值呈下降趨勢, 而波谷附近的高光譜特征值呈上升態(tài)勢。 峰谷具體表現(xiàn)為: SSR的主要波峰分布在540~565和780~1 300 nm波段區(qū)間, 而波谷在650~685和1 435~1 480 nm波段范圍內(nèi)[圖3(a)]。 DSR的主要波峰分布在510~535和660~760 nm波段區(qū)間, 而波谷在560~580, 600~620和1 130~1 155 nm波段范圍內(nèi)[圖3(b)]。
bior1.5的主要波峰分布在556~585, 1 124~1 160和1 370~1 410 nm波段區(qū)間, 而波谷在505~545和683~760 nm波段范圍內(nèi)[圖3(c)]。 coif1的主要波峰分布在532~560, 723~755, 1 117~1 140, 1 285~1 320和1 360~1 385 nm波段區(qū)間, 而波谷在486~518, 670~716, 1 147~1 173和1 393~1 433 nm波段范圍內(nèi)[圖3(d)]。 db9的主要波峰分布在495~508, 470~490, 553~564, 612~627, 675~690, 725~755, 800~830, 887~900, 940~964, 1 143~1 161, 1 193~1 217, 1 380~1 400和1 444~1 465 nm波段區(qū)間, 而波谷在515~535, 542~553, 564~575, 585~605, 653~670, 692~725, 760~786, 970~994, 1 115~1 140, 1 166~1 187, 1 225~1 245, 1 355~1 376, 1 418~1 437和1 476~1 505 nm波段范圍內(nèi)[圖3(e)]。 sym4的主要波峰分布在525~540, 630~660, 707~748, 1 110~1 140, 1 352~1 385和1 423~1 446 nm波段區(qū)間, 而波谷在490~518, 566~590, 670~705, 948~975, 1 141~1 168, 1 322~1 352和1 390~1 420 nm波段范圍內(nèi)[圖3(f)]。 從上述可知, 盡管SSR, DSR和SSR-CWC的波峰波谷數(shù)量以及波峰高度和波谷深度有差異, 但隨冠層顏色變化, 高光譜特征值均有層次變化規(guī)律。 說明, SSR, DSR和SSR-CWC對冠層不同顏色具有明顯響應。 換言之, 它們對冠層不同顏色亦有敏感性。 因此, 利用這些高光譜特征的波峰波谷特征來判別冠層不同顏色是可能的。
圖3 冠層不同顏色的SSR(a)、 DSR(b)和SSR-CWC(c: bior1.5; d: coif1; e: db9; f: sym4)曲線
2.1.2 高光譜特征對冠層不同顏色的方差
為進一步揭示高光譜特征對雅氏落葉松尺蠖危害下落葉松冠層不同顏色的敏感性, 將SSR, DSR和SSR-CWC對冠層不同顏色進行方差分析, 獲得了冠層不同顏色的SSR和DSR的方差分布圖(圖4)和基于1~10尺度的SSR-CWC方差分布圖(圖5)。
圖4 冠層不同顏色的SSR和DSR的方差分布
由圖4可知, 當落葉松冠層不同顏色的SSR和DSR的方差F>F0.01(4, 61)時, 其p<0.01, 說明值大于3.64的SSR和DSR對冠層不同顏色具有敏感性。 SSR敏感波段主要分布在398~505, 529~555, 601~697, 711~1 360和1 386~1 800 nm波段范圍內(nèi), 其中在751 nm波段上F達到最大, 其值為42.09。 而DSR敏感波段主要分布在496~537, 551~676, 681~764, 1 119~1 213, 1 258~1 351, 1 468~1 625和1 717~1 782 nm波段范圍內(nèi), 其中566 nm波段F達到最大, 其值為102.97。 由圖5可知, 當SSR-CWC的F>F10-15(4,61)=37.17時, 其p<10-15, 表明F值大于37.17的SSR-CWC對落葉松冠層不同顏色的敏感性極其顯著。 SSR-CWC敏感波段主要分布在420~1 000, 1 416~1 500, 1 501~1 780 nm波段范圍內(nèi), 其中525~620 nm波段區(qū)間F達到最大, 其值為118.50。 上述可知, SSR, DSR和SSR-CWC等高光譜特征對雅氏落葉松尺蠖危害下落葉松冠層不同顏色均有敏感性, 但不同波段的敏感程度具有差異。 總體上這些高光譜特征中敏感性最顯著者為SSR-CWC, 其次為DSR, 最后為SSR。 可見, SSR-CWC對蟲害林木冠層不同顏色判別具有極大潛力。
總的來說, 在496~505, 529~537, 551~555, 601~676, 681~697, 711~760和1 416~1 625 nm等波段內(nèi)高光譜特征對冠層不同顏色有較高敏感性。 這是由于落葉松冠層顏色主要是葉色素(葉綠素、 胡蘿卜素、 花青素)和水分含量來控制。 497~505, 529~537和551~555 nm等波段主要反映胡蘿卜素、 花青素的吸收和葉綠素a和葉綠素b的反射特征, 而601~676, 681~697和711~760 nm等波段主要表明胡蘿卜素、 花青素的反射和葉綠素a、 b吸收特征。 還有波段1 416~1 625 nm主要表現(xiàn)針葉水分吸收特征。 當雅氏落葉松尺蠖危害下落葉松冠層顏色從綠色→黃色→紅色→灰色變化時, 林木葉色素含量和比例發(fā)生變化, 致使色素反射特征的波段反射率逐漸下降, 而色素吸收特征的波段反射率呈上升趨勢。 在這冠層顏色變化期間, 針葉水分含量逐漸減少, 光譜吸收水分特性減弱, 導致其反射率逐步上升。 表明, SSR, DSR和SSR-CWC等高光譜特征對冠層不同顏色具有顯著響應。 這使得這些高光譜特征判別冠層不同顏色成為可能。
圖6為基于Findpeaks和Findpeaks-SPA方法提取的落葉松冠層不同顏色敏感光譜特征(SSR, DSR和SSR-CWC)的波段分布結(jié)果, 表明了敏感高光譜特征數(shù)量。 采用Findpeaks函數(shù)提取的初始敏感光譜特征的波段數(shù)較多, 如SSR: 24個、 DSR: 63個、 SSR-CWC(36個小波基): 100~208個。 顯然, 敏感高光譜特征數(shù)最多者為SSR-CWC, 其次為DSR, 最后為SSR。 初始敏感光譜特征數(shù)量眾多, 將導致判別模型復雜、 計算量大和穩(wěn)健性差等問題, 進而利用Findpeaks-SPA模式提取了建模所用的最終敏感高光譜特征。 結(jié)果表明, SSR: 3個、 DSR: 3個、 SSR-CWC(Biorthogonal): 3~11個、 SSR-CWC(Coiflets): 4~9個、 SSR-CWC(Daubechies): 3~25個、 SSR-CWC(Symlets): 5~25個。 其對應波段分布為: ①SSR: 667, 751和1 456 nm; ②DSR: 506, 753和1 430 nm; ③SSR-CWC: 如bior1.5: 804, 857, 882, 941, 959, 1 495和1 607 nm, coif1: 939, 1 148, 1 266和1 589 nm, db9: 456, 548, 664, 726, 883, 1 439和1 561 nm, sym4: 445, 731, 823, 1 148和1 580 nm。 由此可知, 基于Findpeaks-SPA模式下, 很好的捕獲了葉綠素的反射特征(445, 456和548 nm)、 吸收特征(664, 726和731 nm)以及針葉細胞組織的強反射特征(804, 823, 857, 882, 883, 941和959 nm)和水分含量吸收特征(1 148, 1 266, 1 439, 1 495, 1 589, 1 561, 1 580和1 607 nm)。 顯然, Findpeaks-SPA模式能夠有效提取敏感高光譜特征, 并且大大壓縮敏感光譜特征數(shù)據(jù)冗余, 將能提高模型穩(wěn)健性和計算速度。
圖6 SSR, DSR和SSR-CWC敏感高光譜特征的波段分布
利用SSR, DSR和SSR-CWC(36個小波基)等敏感高光譜特征, 通過RF和SVMC算法構(gòu)建林木冠層不同顏色判別模型, 并與FD模型進行比較, 評價了模型判別精度。 從圖7可知, 利用SSR, DSR和SSR-CWC的敏感高光譜特征構(gòu)建RF和SVMC判別模型精度具有明顯差異。 如: 基于SSR的RF(SSR-RF)判別精度(總體精度和Kappa系數(shù)分別為0.650 0和0.596 5)優(yōu)于SSR-SVMC, 而基于DSR的SVMC(DSR-SVMC)判別精度(總體精度和Kappa系數(shù)分別為0.800 0和0.738 6)優(yōu)于DSR-RF; 對Daubechies與Biorthogonal系的SSR-CWC來說, RF和SVMC模型在最高判別精度的小波基中, 表現(xiàn)出相同的精度, 即db9-RF和db9-SVMC的總體精度均為0.900 0、 Kappa系數(shù)均為0.866 7, bior1.5-RF和bior1.5-SVMC的總體精度均為0.850 0、 Kappa系數(shù)分別為0.809 5和0.790 9; 而對Coiflets與Symlets系的SSR-CWC而言, 在最高判別精度的小波基中, SVMC比RF模型判別精度較好, 即coif1-SVMC模型判別總體精度(0.850 0)和Kappa系數(shù)(0.795 2)比coif1-RF模型分別提高了0.100 0和0.112 7, sym4-SVMC模型判別總體精度(0.750 0)和Kappa系數(shù)(0.672 1)比sym4-RF模型分別提高了0.050 0和0.037 9。 由此可見, 在三種高光譜特征中, 判別雅氏落葉松尺蠖蟲害林木冠層不同顏色最有潛力者為SSR-CWC, 尤其db9小波基的小波系數(shù)達到了最好的判別精度, 其次為DSR, 最后為SSR。 db9-RF(SVMC)模型總體精度比SSR-RF(SVMC)和DSR-RF(SVMC)模型分別提高了0.250 0(0.450 0)和0.250 0(0.100 0)。 因此, 基于db9的小波系數(shù)能夠最有效判別蟲害林木冠層不同顏色。 Cheng, Lausch, White, Abdel-Rahman和N?si等成果相比, db9小波系數(shù)的蟲害冠層顏色判別精度有一定提高[4-8]。
圖7 冠層不同顏色判別模型精度評定
RF和SVMC模型與FD模型精度進行比較得知(表1): 在SSR中RF和SVMC模型判別精度較差, 劣于FD模型; 而在DSR中SVMC模型判別精度優(yōu)于FD模型, 即其總體精度和Kappa系數(shù)分別提高了0.050 0和0.044 4。 對SSR-CWC來講, db9-RF(SVMC)和sym4-SVMC模型判別精度分別比db9-FD和sym4-FD模型較好, 即其總體精度分別提高了0.150 0(0.150 0)和0.050 0; bior1.5-RF(SVMC)和coif1-SVMC模型判別精度分別與bior1.5-FD和coif1-FD模型相同。 顯而易見, 在DSR和SSR-CWC中RF和SVMC模型表現(xiàn)出較好的判別效果, 對雅氏落葉松尺蠖蟲害的林木冠層不同顏色判別具有較高的可信度。 這可為蟲害森林冠層變化遙感監(jiān)測提供重要參考。
表1 RF和SVMC模型與FD模型的判別精度比較
分析了66棵不同危害程度下落葉松冠層顏色與高光譜特征之間的敏感性, 并通過Findpeaks-SPA模式提取敏感高光譜特征, 利用RF, SVMC和FD建立模型。 得出結(jié)論如下:
(1)在可見光波段范圍內(nèi)SSR-CWC對冠層不同顏色的方差比SSR和DSR更高, 且方差曲線波峰波谷較多。 說明, SSR-CWC在可見光的多個波段上均表現(xiàn)出了極為顯著的敏感性。
(2)Findpeaks-SPA結(jié)合模式下能夠有效提取敏感高光譜特征。 該模式不僅大大壓縮了高光譜特征冗余信息, 而且控制了多重共線性問題的發(fā)生。 從而達到模型計算量的減少和模型穩(wěn)健性的提高的目的。
(3)判別蟲害林木冠層不同顏色的最有潛力的高光譜特征為SSR-CWC, 其次為DSR。 對SSR-CWC而言, 其Daubechies系、 Biorthogonal系、 Coiflets系和Symlets系的最優(yōu)小波基分別為db9, bior1.5, coif1和sym4, 其中db9達到了最高的判別精度, 即db9-RF和db9-SVMC模型總體精度均為0.900 0。 這比SSR-RF(SVMC)和DSR-RF(SVMC)模型分別提高了0.250 0(0.450 0)和0.250 0(0.100 0)。 因此, SSR-CWC可作為蟲害林木冠層不同顏色判別重要光譜特征。
(4)在DSR和SSR-CWC中, RF和SVMC模型判別精度優(yōu)于FD模型, 尤其利用基于db9的SSR-CWC來判別冠層不同顏色時更為明顯, 即db9-RF(SVMC)模型判別總體精度和Kappa系數(shù)比db9-FD模型分別提高了0.150 0和0.167 0。 可見, RF和SVMC模型在蟲害林木冠層不同顏色判別中具有較好的實用價值。