周小成 鄭 磊 黃洪宇
(福州大學地理空間信息技術(shù)國家地方聯(lián)合工程研究中心 空間數(shù)據(jù)挖掘與信息共享教育部重點實驗室 福州 350116)
作為森林資源調(diào)查的關(guān)鍵參數(shù),林分類型信息的精準提取對林業(yè)資源清查、生態(tài)健康評估等意義重大(Crossetal.,2019;Fassnachtetal.,2016)。傳統(tǒng)的林分類型識別以實地調(diào)查為基礎(chǔ),不僅時間人力成本高,而且受空間范圍限制(Yuetal.,2017)。遙感手段可對森林資源進行大范圍內(nèi)的周期性、可重復性觀測(尹凌宇等,2016),其中,中等空間分辨率衛(wèi)星遙感影像因覆蓋范圍廣常用于大區(qū)域尺度的林分類型信息提取,如劉云鵬等(2017)基于多時相Landsat影像識別了江蘇全省的楊樹(Populus)信息;但由于影像分辨率較低,在各林分交界處存在一個像元包含多種林分類型的情況,難以滿足林分尺度森林資源調(diào)查以及林業(yè)生產(chǎn)的要求。高空間分辨率衛(wèi)星遙感影像上紋理與樹冠輪廓的差異明顯,可用于區(qū)分更精細的林分類型,如Xie等(2019)基于2.1 m分辨率的資源三號衛(wèi)星數(shù)據(jù)實現(xiàn)了內(nèi)蒙古喀喇沁旗旺業(yè)甸實驗林場7種樹種的分布制圖;Cross等(2019)以哥斯達黎加一個熱帶植物園為研究區(qū),利用WorldView-3影像實現(xiàn)了6種熱帶樹種的分類。雖然高空間分辨率衛(wèi)星遙感影像在林分類型分類識別中取得了良好效果,但是價格高,成像質(zhì)量受天氣影響,重返周期較長,難以及時獲取目標地區(qū)數(shù)據(jù)。隨著通信與計算機技術(shù)的蓬勃發(fā)展,無人機遙感系統(tǒng)性能逐漸提高,已成為小區(qū)域林業(yè)遙感數(shù)據(jù)獲取的新手段(范承嘯等,2009)。
在基于無人機遙感數(shù)據(jù)的林分類型分類識別中,常用特征包括光譜特征、植被指數(shù)和紋理特征等。Brovkina等(2018)利用含有近紅外波段的多光譜無人機數(shù)據(jù)結(jié)合植被指數(shù)進行多樹種分類,結(jié)果表明,植被指數(shù)對提高林分類型分類精度具有一定意義,但在地物結(jié)構(gòu)復雜區(qū)域,其帶來的精度提升有限,還需要輔助其他特征。Gini等(2018)提取多光譜無人機影像多個窗口的紋理特征并結(jié)合光譜特征,林分類型分類精度從58%提升至87%。Michez等(2016)將從攝影測量點云中獲取的冠層高度特征與多光譜影像相結(jié)合,構(gòu)建適用于河岸森林環(huán)境的林分類型分類模型,結(jié)果發(fā)現(xiàn),利用無人機數(shù)據(jù)生成的攝影測量點云可以提供地物高度信息,能夠區(qū)分出光譜紋理特征相似而高度上存在明顯差異的地物。Sothe等(2019)綜合運用高光譜無人機數(shù)據(jù)中的光譜、紋理、植被指數(shù)以及高度特征對12種闊葉樹種進行分類,總體精度達72.4%。除了光譜、植被指數(shù)、紋理和高度特征外,近年來表征空間特征的擴展的形態(tài)學多屬性剖面(EMAPs)也被廣泛用于高分辨率遙感信息提取(Samiappanetal.,2017;Zhangetal.,2019)。此外,分類方法也是影響林分類型分類精度的重要因素,常見的林分類型分類方法主要包括最小距離法、最大似然法等傳統(tǒng)算法以及決策樹、支持向量機、隨機森林等機器學習算法(任芯雨,2016;Ginietal.,2014;Xieetal.,2019),其中隨機森林算法和支持向量機應用最為普遍。隨機森林算法參數(shù)設(shè)置簡單,對高維數(shù)據(jù)和大數(shù)據(jù)量的影像處理效率高于支持向量機,在林分類型分類識別中被廣泛應用(郭玉寶等,2016;Maschleretal.,2018)。近年來興起的深度學習算法也被應用到林分類型分類中,如林志瑋等(2019)利用DenseNet網(wǎng)絡(luò)實現(xiàn)了無人機影像樹種分類識別,但該方法需要大量樣本數(shù)據(jù),復雜的模型參數(shù)調(diào)整以及長時間的模型訓練才能獲得較高的分類精度,而隨機森林算法僅需要較少的樣本訓練就能獲得高精度的分類結(jié)果(溫小樂等,2018)。
已有研究往往利用單一或少量特征組合進行林分類型識別,分類效果較差,而較多特征組合分類又會造成數(shù)據(jù)冗余和維度災難。王娜等(2017)研究指出,特征優(yōu)選可以降低特征維度,提升分類器的運行效率和分類精度。遞歸特征消除隨機森林算法(RF_RFE)是一種比較常見的特征優(yōu)選算法,如Cheng等(2019)基于Sentinel-2數(shù)據(jù)進行秦嶺山脈主要林分類型分類識別時,利用RF_RFE算法篩選出了最有利于林分類型分類的特征,提高了分類精度和效率。
目前,基于無人機遙感數(shù)據(jù)進行林分類型分類主要采用多光譜和高光譜數(shù)據(jù),這2類數(shù)據(jù)可以提供豐富的光譜特征,然而由于影像采集和加工難度較大,在實際林業(yè)生產(chǎn)和森林資源調(diào)查中使用最多的是僅包含紅、綠、藍3個波段的無人機可見光數(shù)據(jù)。該數(shù)據(jù)常用于估算株數(shù)、樹高等參數(shù),在林分類型分類識別方面的研究還很少,林業(yè)部門積累了大量無人機可見光影像,但沒有將其充分應用到森林資源調(diào)查上。鑒于此,本研究以無人機可見光遙感影像為數(shù)據(jù)源,綜合擴展的形態(tài)學多屬性剖面特征、光譜特征、植被指數(shù)、紋理特征、高度特征等構(gòu)建分類模型,結(jié)合遞歸特征消除隨機森林特征優(yōu)選算法,使用隨機森林分類器進行林分類型分類識別,以拓展無人機可見光遙感數(shù)據(jù)在森林資源調(diào)查中的應用范圍。
研究區(qū)位于福建省建甌市房道鎮(zhèn),總面積0.16 km2,屬中亞熱帶季風氣候,多年平均氣溫18.7 ℃,年降水量1 663.8 cm。樹種以天然生長的闊葉林和人工種植的毛竹(Phyllostachysedulis)、杉木(Cunninghamialanceolata)為主。研究區(qū)位置如圖1a、b所示。
圖1 研究區(qū)位置與樣本分布Fig.1 Location of the study area and distribution of samples
數(shù)據(jù)于2016年8月16日采集,使用小型固定翼eBee無人機,配備SONYWX220相機,相機的等效焦距為24 mm,像素為1 800萬。航拍時高度為500 m,旁向重疊率和航向重疊率分別設(shè)置為60%和80%,同時使用差分GPS獲取4個地面控制點。
將航拍影像、POS數(shù)據(jù)和地面控制點輸入到Pix4Dmapper軟件進行影像拼接,生成數(shù)字正射影像圖(DOM)和數(shù)字表面模型(DSM)。影像分辨率為0.1 m,均方根誤差為0.039 m,攝影測量點云密度為1.27 m-2。研究區(qū)影像大小為4 511行3 260列,總面積為0.16 km2,DOM和DSM如圖1c、d所示。
依據(jù)正射影像目視判讀情況結(jié)合《森林資源規(guī)劃設(shè)計調(diào)查主要技術(shù)規(guī)定》,建立研究區(qū)林分尺度森林分類系統(tǒng)。由于主要研究對象為林分類型,因此將其他非林地類如農(nóng)田、裸地、道路等統(tǒng)稱為其他類別,最終將研究區(qū)地物類別分為闊葉林、針葉林、竹林和其他類別4類。利用分類系統(tǒng)在影像上選取樣本,每個像素類別代表其所在位置屬于的林分類型,其中闊葉林樣本包含26 803個像素,針葉林樣本包含39 601個像素,竹林樣本包含30 039個像素,其他類別樣本包含42 486個像素。樣本總量占影像的0.9%。樣本分布如圖1c所示。
為充分挖掘無人機可見光遙感影像的潛在信息,本研究考慮使用6類特征:原始影像的光譜信息、利用攝影測量點云生成表征高度的DSM、擴充光譜信息的植被指數(shù)、HSV三個顏色分量及其提取的紋理特征,以及表征空間信息的擴展的形態(tài)學多屬性剖面。采用遞歸特征消除隨機森林算法優(yōu)選特征子集。根據(jù)不同類型特征和優(yōu)選特征子集設(shè)置8組試驗,使用隨機森林分類器進行林分類型分類,以獲得最佳分類方案。技術(shù)路線如圖2所示。
圖2 技術(shù)路線Fig.2 Technical flowchart
2.1.1 植被指數(shù)提取 可見光數(shù)據(jù)僅包含紅、綠、藍3個波段的光譜信息,通過波段間的相互運算生成植被指數(shù)(VIs),從而擴充光譜信息。選擇常見的8個可見光范圍內(nèi)的植被指數(shù)進行林分類型識別,8個植被指數(shù)在濕地水生植物識別(井然等,2016)以及農(nóng)作物分布制圖(Davidetal.,2016)中均取得了良好效果。計算公式如表1所示。
表1 可見光植被指數(shù)①Tab.1 Vegetation indices(VIs)derived from visible bands
2.1.2 紋理提取 紋理特征用于揭示影像上各地物灰度信息的分布規(guī)律,在結(jié)合光譜特征進行林分類型分類中具有良好表現(xiàn)?;叶裙采仃?gray level co-occurrence matrix,GLCM)是提取紋理特征的常見手段(裴歡等,2018)。使用原始可見光影像進行紋理特征提取時,紅、綠、藍3個波段間存在一定的相關(guān)性,導致提取的紋理特征間存在冗余,不利于信息提取,因此本研究通過HSV色彩空間轉(zhuǎn)換獲得的顏色分量進行紋理特征提取(戴建國等,2018)。H表示色相(hue)、S表示飽和度(saturation)、V表示亮度(value),3個分量的計算公式如下:
(1)
(2)
V=max。
(3)
式中:max和min分別表示3個波段的最大值和最小值。
GLCM提供了8種紋理特征(Haralicketal.,1973),提取紋理特征的關(guān)鍵參數(shù)有窗口大小、步長和方向,這3個參數(shù)對林分類型紋理信息提取具有較大影響(Sotheetal.,2019)。本研究提取窗口大小為3×3、5×5、7×7、…、25×25的12組紋理特征,使用平均J-M(Jeffries-Matusita)距離來表達樣本間的可分性,從而確定最佳紋理特征提取窗口(劉友山等,2012)。在確定最佳紋理特征提取窗口大小的前提下設(shè)置步長為1、2、3,方向為0°、45°、90°、135°,同時使用平均J-M距離確定最佳步長和方向,從而提取最佳紋理特征。平均J-M距離的定義公式如下:
(4)
式中:p(X/ωi)表示第i個像元屬于第ωi個類別的幾率。
J-M距離的取值范圍為0~2,且當值在0~1之間時表明紋理特征不能對樣本數(shù)據(jù)進行區(qū)分;當值在1~1.9之間時表明紋理特征可對部分樣本進行區(qū)分;當值在1.9~2之間時表明紋理特征可以很好區(qū)分各樣本(馬娜等,2010;裴歡等,2018)。
2.1.3 擴展的形態(tài)學多屬性剖面提取 擴展的形態(tài)學多屬性剖面(extended morphological multi-attribute profiles,EMAPs)可對灰度影像進行多尺度特征提取,有效保留地物的幾何特征,并削弱不重要的細節(jié)(Zhangetal.,2019;鮑蕊等,2016)。
選擇特定的屬性濾波器,根據(jù)設(shè)置的閾值集合{k1,k2,…,kn}對單個灰度影像I進行多次細化和粗化操作,獲得I的屬性剖面(AP)。計算公式如下:
AP(I)={φkn(I),…,φk1(I),I,γk1(I),…,γkn(I)}。
(5)
式中:φ和γ分別表示形態(tài)學中的細化和粗化操作;φkn(I)表示灰度影像I在形態(tài)學濾波器下根據(jù)閾值kn進行細化得到的特征影像;γkn(I)同理。
分別計算可見光影像3個波段的AP,將結(jié)果疊加得到擴展的屬性剖面(extended attribute profile,EAP),多個屬性的EAP疊加獲得EMAPs。目前,常用的屬性濾波有表征區(qū)域尺寸和形狀的面積a和對角線長度d、表征區(qū)域像素灰度同質(zhì)性的灰度值標準差s以及表示區(qū)域非緊致性的轉(zhuǎn)動慣量i(史忠奎等,2018)。
由式(5)可知,EMAPs提取的關(guān)鍵是閾值設(shè)置。屬性濾波a的閾值可通過目視確定;s的閾值計算公式詳見Marpu等(2013);屬性濾波i和d的閾值直接使用Mura等(2010)和Zhang等(2019)中的值,該閾值具有一定通用性。
提取的EMAP具有高維度特征,利用主成分分析選取每個EAP中包含信息量大于99%的前n個主分量來構(gòu)建EMAPs(Ghamisietal.,2014)。
2.2.1 分類方法 隨機森林(random forest,RF)是一種包含多株決策樹的機器學習算法(宋榮杰等,2018)。在每株決策樹生長過程中,分裂節(jié)點的最佳特征子集以基尼指數(shù)、信息增益為標準從原始特征集合中獲得,當節(jié)點分裂達到事先定義的深度或節(jié)點上的樣本無法再進行分類時停止節(jié)點分裂(馬慧娟等,2019)。每株決策樹單獨完成分類后,由投票得出最終分類結(jié)果(呂杰等,2017)。隨機森林算法需要設(shè)置決策樹的數(shù)目和分裂節(jié)點的特征數(shù)目2個關(guān)鍵參數(shù),本研究經(jīng)過試驗確定決策樹的數(shù)目為150,分裂節(jié)點的特征數(shù)目為參與分類總特征數(shù)目的平方根。
2.2.2 特征選擇 上述提取的眾多特征并非都對無人機可見光數(shù)據(jù)林分類型分類有意義,特征選擇可以在眾多特征中找到最有利于林分類型分類的特征子集,從而提升模型的效率和分類精度。RF算法在進行Bootstrap抽樣時,未被選擇到的樣本數(shù)據(jù)生成的袋外誤差可用來計算不同特征變量的重要性(張磊等,2019)。遞歸特征消除(recursive feature elimination,RFE)是一種集成方法,其與RF算法結(jié)合在特征選擇上可以達到較優(yōu)的性能?;具^程是在RF特征重要性基礎(chǔ)上對特征進行排序,每次從特征集中去掉重要性小的特征進行隨機森林分類,逐次迭代直到特征集為空時停止(楊珺雯等,2015)。在此過程中將樣本數(shù)據(jù)等分為10份,每個特征集分類時依次使用其中9份作為訓練數(shù)據(jù)、1份作為驗證數(shù)據(jù),10次分類精度均值作為該特征集的分類精度。最后對比不同特征集下的分類精度確定最佳特征子集。
為了探究無人機可見光數(shù)據(jù)林分類型分類的最佳方案,本研究設(shè)置8組試驗,如表2所示。
表2 試驗方案信息Tab.2 The information of experimental programs
為了評估各特征在林分類型分類識別中的作用以及無人機可見光數(shù)據(jù)在林分類型分類應用中的可行性,采用人工目視解譯方法,將研究區(qū)林分類型全部解譯出來,生成真實的林分分布圖建立混淆矩陣。混淆矩陣中總體精度(overall accuracy,OA)和Kappa系數(shù)用于評價整體的分類結(jié)果;生產(chǎn)者精度(production accuracy,PA)以及用戶精度(user accuracy,UA)用于評價單個林分類型的漏分和錯分情況。對于單個林分類型的分類精度評價,采用F統(tǒng)計值來表示(宋榮杰等,2017),計算公式如下:
(6)
式中:PAi表示類別i的生產(chǎn)者精度;UAi表示類別i的用戶精度。
3.1.1 高度特征分析 通常使用去除地形影響的冠層高度模型(CHM)表示林分自身冠層高度,CHM是通過DSM與數(shù)字高程模型(DEM)的差值計算獲得的,其精度受DSM和DEM的精度影響。本研究區(qū)由于林分郁閉度大,林間地面點被林冠遮擋,僅利用無人機可見光遙感影像無法生成高精度的DEM,因此無法獲得可用的CHM。DSM反映的高度特征除林分自身冠層高度外,還包含地形高度,在無法獲得可用CHM的情況下,可以使用DSM表示高度特征。
為了確保生成的DSM精度滿足林分類型分類精度要求,無人機可見光遙感數(shù)據(jù)采集時同步使用差分GPS獲取4個地面控制點,實測控制點的高度和對應DSM如表3所示,DSM和實測高度誤差均小于0.1 m,與各林分在高度分布上的差異相比可以忽略。統(tǒng)計樣本高度如圖3所示,可以發(fā)現(xiàn)闊葉林高度分布集中在304~336 m之間,平均高度326 m,最大值414 m,最小值295 m;針葉林高度分布集中在378~389 m之間,平均高度381 m,最大值403 m,最小值310 m;竹林高度分布集中在385~390 m之間,平均高度381 m,最大值409 m,最小值311 m;其他類別高度分布集中在289~324 m之間,平均高度315 m,最大值401 m,最小值280 m。由此可見,闊葉林和其他類別在高度分布上存在較大重疊部分,主要集中的高度區(qū)域遠低于針葉林和竹林。針葉林和竹林在高度分布上較為一致。
表3 DSM精度Tab.3 DSM precision
圖3 林分樣本高度分布Fig.3 Height distribution of forest stand samples
3.1.2 植被指數(shù)提取分析 本研究共提取8個可見光植被指數(shù),不同植被指數(shù)值的范圍相差很大,將其歸一化到0~1之間。統(tǒng)計各林分樣本植被指數(shù)均值得到圖4,可以看出不同植被指數(shù)對林分類型的區(qū)分程度不同,其中闊葉林區(qū)分度較高,針葉林和竹林難以區(qū)分。
圖4 各林分樣本植被指數(shù)均值Fig.4 Mean vegetation index of each forest stand samples
3.1.3 紋理特征提取分析 樣本平均J-M距離計算結(jié)果如圖5所示。從圖5a可以看出,當提取窗口大于19×19后,各林分類型的平均J-M距離均大于1.9,且趨于穩(wěn)定,具有較高可分性,因此選擇最佳紋理特征提取窗口為19×19。在窗口大小為19×19時,不同方向和步長下樣本平均J-M距離如圖5b所示,可以看出樣本平均J-M距離變化較小,且沒有哪些參數(shù)組合使得每個樣本的平均J-M距離都是最大的。當步長為1、方向為45°時,針葉林和竹林的平均J-M距離最大,闊葉林和其他類別的平均J-M距離適中,選擇窗口大小為19×19、步長為1、方向為45°作為最優(yōu)的紋理特征提取參數(shù)。
圖5 樣本平均可分性Fig.5 Mean separability of samplesa.樣本平均可分性隨紋理尺度的變化Mean separability of samples with different scales texture;b.不同步長和方向下樣本的平均可分離度Mean separability of samples with different distances and directions.
為了驗證HSV顏色分量提取紋理的有效性,另提取窗口大小為3×3~19×19的RGB紋理特征,并單獨利用這些特征進行隨機森林分類,采用OA和Kappa系數(shù)進行精度評估。由圖6可知,HSV紋理的分類精度優(yōu)于RGB紋理的分類精度。
圖6 不同窗口下HSV紋理與RGB紋理分類精度對比Fig.6 Comparison of classification accuracy between HSV texture and RGB texture under different window sizes
3.1.4 擴展的形態(tài)學多屬性剖面提取分析 本研究在進行形態(tài)學屬性剖面提取時使用4種濾波器,基于影像上各林分冠幅大小確定面積a的閾值集合為(5、9、61、115、171、325、1 027);標準差s閾值通過樣本自動生成;對角線長度d和轉(zhuǎn)動慣量i根據(jù)已有文獻分別設(shè)置為(10、20、30、40、50、60、70、80、90)和(0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9)。共獲得45個EAPa特征、15個EAPa特征、57個EAPd特征和57個EAPi特征。對每個EAP進行主成分分析,生成的EMAPs中分別包含EAPs前4個主成分、EAPs前5個主成分、EAPd前5個主成分和EAPi前13個主成分,維度為27。
3.1.5 特征選擇結(jié)果 共選擇66個特征用于林分類型分類,分別為3個原始光譜特征、DSM、8個植被指數(shù)、3個HSV顏色分量、24個HSV紋理特征和27個擴展的形態(tài)學多屬性剖面。采用RF_RFE的特征選擇結(jié)果如圖7所示,其中總體精度和Kappa系數(shù)均為十折交叉驗證的均值。
圖7 采用遞歸特征消除隨機森林算法的特征選擇結(jié)果Fig.7 Feature selection using random forest_recursive feature elimination(RF_RFE)
從圖7可以看出,當參與分類的特征數(shù)從1增加到11時,分類精度先上升后降低再上升,特征數(shù)為11時最高,繼續(xù)增加特征,分類精度并無改善,因此選擇前11個特征作為優(yōu)選的特征子集。選擇的特征按重要性從大到小的順序為DSM、Hue_GLCM_Mean(色相紋理均值)、Sat_GLCM_Mean(飽和度紋理均值)、EAPa_PCA3(EAPa的第3主成分)、Val_GLCM_Correlation(亮度紋理相關(guān)性)、WI、Hue、EAPd_PCA5(EAPd的第5主成分)、EAPs_PCA2(EAPs的第2主成分)、EAPi_PCA11(EAPi的第11主成分)、EAPd_PCA3(EAPd的第3主成分)。
本研究共設(shè)置8組對比試驗,分類結(jié)果如圖8所示。以人工目視解譯方法繪制出的林分類型真實地面分布圖為參考(圖8i),從目視效果上看,試驗1、3和4存在大量農(nóng)田與林分混淆的情況,小碎塊較多;試驗2農(nóng)田與林分區(qū)分較好,但是3種林分類型之間均混淆嚴重;試驗5相比試驗1農(nóng)田與林分混淆的情況得到改善,但針葉林和竹林存在混淆;試驗6、7、8在目視效果上較好,地塊較完整,與地面參考影像較為接近。
圖8 不同試驗分類結(jié)果Fig.8 Classification results of different experiments
采用OA、Kappa系數(shù)、PA、UA和F統(tǒng)計值對各試驗方案進行定量評價,如表4所示。從總體分類結(jié)果來看,試驗1以原始三波段光譜特征進行林分類型分類識別,總體精度為65.68%,Kappa系數(shù)為0.53,分類精度低。試驗2、3、4在試驗1的基礎(chǔ)上分別添加DSM、植被指數(shù)、HSV顏色分量,其中試驗3的總體精度和Kappa系數(shù)略有下降,試驗2和試驗4的總體精度和Kappa系數(shù)提升不明顯。試驗5在試驗1的基礎(chǔ)上添加HSV紋理特征,分類精度大幅度提升,總體精度提升9.49%,Kappa系數(shù)提高0.12。試驗6在試驗1的基礎(chǔ)上添加EMAPs,總體精度提升10.24%,Kappa系數(shù)提高0.13。試驗7利用所有特征進行分類,相比光譜與其他特征單獨結(jié)合使用分類精度要高,但是低于經(jīng)過特征選擇的試驗8的精度。經(jīng)過特征選擇后總體精度和Kappa系數(shù)達到最高,分別為81.05%和0.73。
表4 分類精度統(tǒng)計Tab.4 The statistics of classification accuracy
從單個林分類型的漏分和錯分以及分類精度來看,DSM在改善闊葉林漏分情況下加劇了錯分,總體來說對闊葉林的分類提取是有益的,精度增加1.23%。HSV紋理特征在減少闊葉林錯分時加劇了漏分,綜合錯分、漏分情況,精度提升5.7%。EMAPs對闊葉林的漏分和錯分均有改善,精度提升9.54%。HSV顏色特征對闊葉林的錯分和漏分沒有明顯影響。植被指數(shù)使闊葉林分類精度降低,錯分、漏分情況均加重。綜合所有特征和優(yōu)選特征子集均可改善闊葉林的錯分和漏分情況,使闊葉林的分類精度分別提升15.66%和15.89%。對針葉林來說,使用原始光譜信息錯分情況最少,其他特征引入均使針葉林錯分加劇,除DSM外,其他特征均可改善針葉林的漏分情況,光譜特征單獨結(jié)合其他特征并不能提高針葉林的分類精度。綜合所有特征進行分類時,雖然針葉林錯分較多,但漏分明顯改善,分類精度提升4.67%。特征優(yōu)選子集在針葉林分類時漏分明顯改善,分類精度提升2.14%。各特征均可改善竹林錯分情況,HSV紋理和EMAPs可同時改善竹林漏分和錯分情況,使竹林的分類精度分別提升15.16%和15.91%,其他特征雖然加劇了竹林的漏分情況,但總體上還是提高了分類精度。綜合所有特征和優(yōu)選特征子集均可以改善竹林的錯分和漏分情況,分類精度分別提升18.99%和20.31%。
采用常見的Majority分析對8組試驗結(jié)果進行分類后處理,以消除細小斑塊,提高分類精度。設(shè)置變化核尺寸為15×15(約1株針葉樹冠幅大小),中心像元權(quán)重為1。試驗1、3、4分類結(jié)果中噪聲較多,經(jīng)分類后處理的總體精度分別提升3.25%、3.01%和3.26%;試驗2、5、6分類結(jié)果中噪聲相對較少,總體精度分別提升1.24%、1.98%和1.45%;試驗7、8分類結(jié)果較為精確,小碎斑少,總體精度分別提升0.42%和0.38%。
研究區(qū)使用的影像分辨率為0.1 m,鑒于林業(yè)部門獲得的無人機可見光影像分辨率可能較粗,因此在較低分辨率影像上采用本研究方法進行試驗,以驗證方法的適用性。無人機可見光影像的分辨率基本上都優(yōu)于0.5 m,將原始影像分別重采樣成0.3 m和0.5 m分辨率,使用多特征優(yōu)選方法進行分類(圖9),均取得較好分類結(jié)果,總體精度均在80%以上,這說明本研究方法在較低分辨率影像上同樣適用。當分辨率為0.3 m時精度最高,總體精度達82.46%,Kappa系數(shù)為0.75;當分辨率為0.5 m時精度較低,總體精度為80.48%,Kappa系數(shù)為0.72。各林分類型的分類精度如圖10所示,分辨率為0.3 m時各林分類型分類精度均最高。當分辨率較高時(0.1 m),林分內(nèi)部差異明顯,同物異譜現(xiàn)象較嚴重,分類精度反而有所降低,當分辨率較低時(0.5 m),林分間的差異減小,出現(xiàn)異物同譜現(xiàn)象,也會使分類精度降低。同樣對0.3 m和0.5 m分辨率的分類結(jié)果進行分類后處理,總體精度分別提升0.30%和0.43%。
圖9 不同分辨率影像分類結(jié)果Fig.9 Classification results of different resolution image
本研究基于無人機獲取的可見光遙感數(shù)據(jù),充分發(fā)掘其潛在信息,對比不同特征對林分類型分類的影響,采用遞歸特征消除隨機森林算法進行特征篩選,實現(xiàn)了闊葉林、針葉林和竹林的分類識別。該研究方法對無人機可見光數(shù)據(jù)在林業(yè)資源調(diào)查中的應用具有參考意義。分析本研究林分類型分類識別的流程和結(jié)果,認為影響林分類型分類識別精度的因素主要有以下幾方面:
1)不同原始數(shù)據(jù)提取紋理特征影響林分類型分類結(jié)果。本研究在提取紋理特征時,考慮到原始光譜特征間存在一定相關(guān)性,提取的紋理特征間存在冗余,不利于林分類型分類識別,因此通過HSV色彩空間轉(zhuǎn)換獲得3個顏色分量進行紋理特征提取。經(jīng)過試驗對比發(fā)現(xiàn),HSV紋理特征在林分類型分類識別上優(yōu)于RGB紋理特征。
2)不同紋理提取窗口影響林分類型分類結(jié)果。不同窗口大小提取的紋理特征在林分類型分類識別時精度存在明顯變化,因此本研究使用樣本的平均J-M距離確定最佳紋理提取窗口,紋理窗口確定后,方向和步長設(shè)置對分類結(jié)果影響較小。
3)不同特征組合影響林分類型分類精度。以原始光譜特征為基礎(chǔ),單獨引入其他特征對林分類型分類精度影響不同。其他特征均可提高竹林的分類精度而使針葉林的分類精度降低,DSM、HSV紋理和EMAPs可提高闊葉林的分類精度。綜合所有特征和特征優(yōu)選子集均可提高所有林分類型的分類精度。
4)在不同分辨率影像上使用多特征優(yōu)選方法均可取得較好分類效果,但并不是影像分辨率越高分類精度就越高,分辨率較高或較粗均會降低分類精度。
5)利用分類后處理消除細小斑塊,可在一定程度上提高分類精度。
另外,本研究還存在一些待改進的地方。采用遞歸特征消除隨機森林算法優(yōu)選的特征子集進行分類時雖然獲得了最高分類精度,但還具有一定提升空間,未來可以考慮使用深度學習方法提高分類精度。
針對目前無人機可見光遙感數(shù)據(jù)林分類型分類識別研究較少的現(xiàn)狀,從原始數(shù)據(jù)中提取光譜、高度、植被指數(shù)、HSV顏色分量、HSV紋理以及擴展的形態(tài)學多屬性剖面特征,采用遞歸特征消除隨機森林算法篩選出最佳特征組合,使用隨機森林分類器實現(xiàn)了闊葉林、針葉林和竹林的分類識別。主要結(jié)論如下:
1)單獨使用無人機可見光遙感影像的光譜信息進行林分類型分類效果不理想,總體精度和各林分類型分類精度較低。以光譜特征為基礎(chǔ),單獨引入不同類型特征,除植被指數(shù)外,其他特征均可提高總體分類精度,其中EMAPs和HSV紋理特征提升效果明顯。
2)與單獨使用光譜特征相比,綜合所有特征進行分類,總體精度以及各林分類型分類精度均大幅提升,但高維的特征會使分類效率低,采用遞歸特征消除隨機森林算法可有效篩選出最佳分類特征,在降維的同時提高分類精度。
3)本研究的創(chuàng)新之處在于使用無人機可見光遙感影像作為數(shù)據(jù)源,充分挖掘多類型特征中的有用信息實現(xiàn)林分類型分類識別,擴展了無人機可見光數(shù)據(jù)在森林資源調(diào)查中的應用范圍。但本研究對象為闊葉林、針葉林和竹林3種類型,樹種組成較為單一且研究區(qū)面積較小,有待于對范圍更大、樹種組成更加復雜的區(qū)域進行研究。