徐志揚(yáng) 陳 巧 陳永富
(1.中國林業(yè)科學(xué)研究院資源信息研究所, 北京 100091; 2.國家林業(yè)和草原局華東調(diào)查規(guī)劃院, 杭州 310019;3.國家林業(yè)和草原局林業(yè)遙感與信息技術(shù)重點(diǎn)實(shí)驗(yàn)室, 北京 100091)
樹種分類識(shí)別是森林資源經(jīng)營管理、生物多樣性監(jiān)測評(píng)價(jià)的重要工作基礎(chǔ)。采用遙感手段進(jìn)行區(qū)域尺度的樹種分類與制圖一直是樹種分類識(shí)別的熱門研究內(nèi)容[1-2],它通常以航空或航天遙感獲得的多光譜、高光譜以及激光雷達(dá)(Light detection and ranging,LiDAR)為數(shù)據(jù)源,使用單一數(shù)據(jù)源或者他們的各種組合變量及紋理特征[3-5],再用機(jī)器學(xué)習(xí)方法如支持向量機(jī)(Support vector machine,SVM)、隨機(jī)森林(Random forest,RF)等建立分類模型以完成樹種分類識(shí)別[6-7],這為宏觀尺度的樹種信息獲取提供了重要方法,但是該類遙感數(shù)據(jù)易受氣溶膠等影響和數(shù)據(jù)獲取周期束縛,難以滿足森林經(jīng)營單位級(jí)的小范圍、高精度、高時(shí)效性森林信息獲取需求。無人機(jī)(Unmanned aerial vehicle,UAV)因其小巧靈活且能夠在云下低空飛行,為森林經(jīng)營單位級(jí)森林信息獲取提供了一個(gè)重要解決方案。通過在無人機(jī)上搭載多光譜設(shè)備、數(shù)碼相機(jī)或者激光雷達(dá)掃描儀,可以及時(shí)獲得超高分辨率遙感數(shù)據(jù),一些學(xué)者提取其光譜(或波段值)以及植被指數(shù)、紋理特征、樹冠三維結(jié)構(gòu)特征并結(jié)合機(jī)器學(xué)習(xí)方法進(jìn)行了樹種信息提取研究[8-9],特征變量提取過程復(fù)雜,提取精度也較為有限。
近年來,深度學(xué)習(xí)尤其是卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)因其優(yōu)秀的層次化特征自動(dòng)提取能力和較高的識(shí)別精度使得其在樹種分類識(shí)別中也得以應(yīng)用。卷積神經(jīng)網(wǎng)絡(luò)如VGG、GoogLeNet等隨著網(wǎng)絡(luò)層數(shù)加深易出現(xiàn)資源消耗大、模型過擬合、梯度消失與爆炸等問題,HE等[10]提出的殘差網(wǎng)絡(luò)(Residual network,ResNet)較好地解決了卷積神經(jīng)網(wǎng)絡(luò)模型梯度爆炸和網(wǎng)絡(luò)退化問題,研究表明它成為了一種分類效果較好的卷積神經(jīng)網(wǎng)絡(luò)模型[11-13]。ResNet50模型是殘差網(wǎng)絡(luò)中一個(gè)較為成功的模型,然而,小樣本數(shù)據(jù)集下單個(gè)網(wǎng)絡(luò)模型訓(xùn)練精度和泛化能力難以充分保障,而集成學(xué)習(xí)策略為模型精度和泛化能力改善提供了可能性[7,14-18],較多實(shí)踐證明了集成學(xué)習(xí)模型優(yōu)于單個(gè)分類模型。
為了有效提取卷積神經(jīng)網(wǎng)絡(luò)特征信息和充分發(fā)揮集成學(xué)習(xí)模型優(yōu)勢以提高分類精度,引入ResNet50卷積神經(jīng)網(wǎng)絡(luò)用于樹種分類識(shí)別,擬將有效通道注意力機(jī)制(Efficient channel attention,ECA)融入ResNet50網(wǎng)絡(luò)的瓶頸模塊,搭建改進(jìn)的ECA-ResNet50網(wǎng)絡(luò),同時(shí)以膨脹卷積代替ECA-ResNet50網(wǎng)絡(luò)瓶頸模塊3×3正常卷積,搭建改進(jìn)的ECA-ResNet50-Dialate網(wǎng)絡(luò),然后以ResNet50為主干架構(gòu),將ECA-ResNet50、ECA-ResNet50-Dialate的卷積模塊配置(3,4,6,3)修改為(3,3,3,3),搭建ECA-ResNet-mini、ECA-ResNet-mini-Dialate 2個(gè)網(wǎng)絡(luò),最后以ResNet50網(wǎng)絡(luò)和搭建的4個(gè)卷積神經(jīng)網(wǎng)絡(luò)為基分類器,采用相對(duì)多數(shù)投票法建立集成學(xué)習(xí)模型。
雖然一些學(xué)者進(jìn)行了無人機(jī)遙感數(shù)據(jù)樹種分類識(shí)別的相關(guān)研究[8-9,12],但大多存在研究對(duì)象相對(duì)簡單、分類精度不高的缺陷,或者僅停留在林分尺度,而截至目前應(yīng)用無人機(jī)遙感數(shù)據(jù)進(jìn)行高郁閉度林分內(nèi)單木樹種的高精度識(shí)別研究并不多見。為了研究高郁閉度條件下無人機(jī)多源遙感數(shù)據(jù)協(xié)同用于樹種分類識(shí)別能力,本文擬以亞熱帶喬木林為研究對(duì)象,基于同期獲取的無人機(jī)激光雷達(dá)數(shù)據(jù)和可見光圖像提取研究區(qū)單木樹冠,為便于卷積神經(jīng)網(wǎng)絡(luò)有效提取樹冠局部與全局特征,以略大于完整單株樹冠的窗口尺寸96像素×96像素提取研究區(qū)5類喬木林分主要樹種:杉木(Cunninghamialanceolata)、馬尾松(Pinusmassoniana)、榿木(Alnuscremastogyne)、鵝掌楸(Liriodendronchinense)、其他闊葉樹(other broad-leaves)的單木樹冠可見光影像集,利用提出的卷積神經(jīng)網(wǎng)絡(luò)和集成學(xué)習(xí)模型進(jìn)行樹種分類識(shí)別模型訓(xùn)練和獨(dú)立測試,以期為綜合利用無人機(jī)多源遙感進(jìn)行較為復(fù)雜的高郁閉度林分樹種識(shí)別提供參考。
1.1.1研究區(qū)概況
研究區(qū)位于江西省分宜縣內(nèi)中國林業(yè)科學(xué)研究院亞熱帶林業(yè)實(shí)驗(yàn)中心年珠實(shí)驗(yàn)林場(27°30′~27°45′N,114°30′~114°45′E),地貌屬低山丘陵,海拔220~1 092 m,土壤為黃紅壤,年均氣溫16.8℃,日最高氣溫39.9℃,最低氣溫-8.3℃,年降雨量為 1 950.9 mm,集中在3—6月,無霜期252 d。研究區(qū)內(nèi)喬木林郁閉度0.7以上,主要類型為杉木林(Cunninghamialanceolata)、馬尾松林(Pinusmassoniana)、榿木林(Alnuscremastogyne)、鵝掌楸林(Liriodendronchinense)、其他闊葉林(other broad-leaves)。闊葉林中主要樹種有:樟樹(Cinnamomumcamphora)、大葉錐栗(Castaneahenryi)、鉤錐(Castnopsistibetana)、甜櫧(Castanopsiseyrei)、苦櫧(Castanopsissclerophylla)、木荷(Schimasuperba)、刨花潤楠(Machiluspauhoi)等。
1.1.2數(shù)據(jù)來源
無人機(jī)搭載RIEGL VUX-1LR型激光雷達(dá)傳感器通過近紅外(波長1 550 nm)激光束和旋轉(zhuǎn)鏡330°視場角快速掃描實(shí)現(xiàn)激光雷達(dá)數(shù)據(jù)的高速獲取,搭載Sony ILCE-6000型微單相機(jī)采集可見光數(shù)據(jù),使用動(dòng)態(tài)后處理(Post processed kinematic,PPK)定位技術(shù)實(shí)現(xiàn)高定位精度15 mm,數(shù)據(jù)采集于2019年6月底,采用仿地飛行模式,以地形表面為基準(zhǔn)設(shè)置相對(duì)高度,在160 m高度上采集激光雷達(dá)數(shù)據(jù)和可見光圖像。
由于2019年開展生物量遙感估測調(diào)查的圓形樣地絕大部分為杉木林,為避免不均衡樣本模型訓(xùn)練時(shí)產(chǎn)生分類偏差,于2020年7月重新調(diào)查完成15個(gè)面積為0.04 hm2的喬木林圓形樣地,且各樹種數(shù)量相對(duì)均衡,采用實(shí)時(shí)動(dòng)態(tài)(Real-time kinematic,RTK)載波相位差分技術(shù)定位并記錄樣地中心點(diǎn)坐標(biāo),記載胸徑5 cm以上樹木的每木相對(duì)位置、樹種、胸徑、樹高、枝下高、林木分級(jí)、枯死原因、東西南北向冠幅等??紤]到研究區(qū)內(nèi)無明顯的森林經(jīng)營活動(dòng),也無速生樹種生長,而且按照亞熱帶常見針葉、闊葉樹種的生長速率來看,2019年6月底至2020年7月各樣木的位置、樹冠尺寸均無明顯差異,因此,2020年7月調(diào)查的單木樣本可以與2019年6月底的無人機(jī)遙感數(shù)據(jù)匹配用于樹種分類。
此外,收集2019年7月通過無人機(jī)冠層監(jiān)測到的野外RTK定位(精度小于1 m)的實(shí)測單木位置、樹種、胸徑、樹高、冠幅等數(shù)據(jù)。
1.2.1遙感數(shù)據(jù)預(yù)處理
利用數(shù)字綠土LiDAR360軟件進(jìn)行激光雷達(dá)點(diǎn)云數(shù)據(jù)預(yù)處理,首先去噪、分類,然后用Kriging法對(duì)地面點(diǎn)插值得到0.5 m的數(shù)字高程模型(DEM),將去噪分類后的點(diǎn)云高程減去對(duì)應(yīng)DEM像元值完成點(diǎn)云歸一化,利用LASTools開源工具對(duì)歸一化后的點(diǎn)云生成無孔洞的冠層高度模型(Pit-Free CHM)[19]。
可見光圖像處理使用數(shù)字綠土LiMapper軟件進(jìn)行。主要處理流程包括導(dǎo)入圖像、影像對(duì)齊、生成密集匹配點(diǎn)云、生成DEM/DSM和生成正射影像(空間分辨率0.05 m)。
以同期、相同航高下的激光雷達(dá)生成的冠層高度模型為參考基準(zhǔn),對(duì)可見光圖像進(jìn)行校正。
1.2.2深度學(xué)習(xí)樣本
1.2.2.1單木樹冠分割
單木樹冠分割是采用一定算法將點(diǎn)云或者遙感影像分割為多個(gè)部分,每個(gè)部分被認(rèn)為是一株樹木。相關(guān)研究表明,中低郁閉度林分能夠采用LiDAR點(diǎn)云數(shù)據(jù)有效提取單木樹冠[20-21],常用方法是利用CHM圖像進(jìn)行局部最大值法探測標(biāo)記樹頂再結(jié)合標(biāo)記控制分水嶺法分割單木,而在高郁閉林分條件下,因單木樹頂難以確定且樹冠重疊,直接進(jìn)行CHM單木分割容易導(dǎo)致樹木過分割或欠分割。本研究將CHM和可見光圖像二者結(jié)合,首先通過調(diào)試優(yōu)選CHM單木分割參數(shù),設(shè)置高斯平滑sigma參數(shù)為0.5,采用標(biāo)記控制分水嶺法提取探測的單木位置與樹冠矢量圖形;然后通過對(duì)可見光圖像進(jìn)行HSV變換與顏色閾值設(shè)置、形態(tài)學(xué)開閉運(yùn)算等提取樹冠區(qū)域;最后結(jié)合可見光圖像、CHM分割單株樹冠矢量圖形、樹冠區(qū)域,設(shè)置分割尺度、形狀因子、緊致度為80、0.8、0.9,利用eCognition軟件進(jìn)行多尺度分割[22],得到分割結(jié)果,并根據(jù)地面實(shí)測數(shù)據(jù)進(jìn)行單木分割結(jié)果檢驗(yàn)。為驗(yàn)證單木樹冠探測精度,利用地理信息系統(tǒng)(Geographic information system,GIS)將CHM和可見光圖像疊加顯示,對(duì)比LiDAR樹頂探測結(jié)果與地面樣地單木位置,參考相關(guān)研究采用探測率(r)、正確率(p)和總體精度(F)驗(yàn)證精度[23]。為滿足分類樣本數(shù)量需求,對(duì)過分割或欠分割樹冠進(jìn)行手動(dòng)調(diào)整。
1.2.2.2樣本庫構(gòu)建
深度學(xué)習(xí)需要大量帶標(biāo)簽的訓(xùn)練數(shù)據(jù)樣本支持,以避免因模型過于復(fù)雜而數(shù)據(jù)量太少出現(xiàn)過擬合的問題。以2020年調(diào)查的10個(gè)圓形樣地和2019年RTK實(shí)測定位的單木數(shù)據(jù)為訓(xùn)練集(總數(shù)1 550個(gè),其中杉木404個(gè),馬尾松344個(gè),榿木105個(gè),鵝掌楸319個(gè),其他闊葉樹378個(gè)),以2020年調(diào)查的其余5個(gè)圓形樣地為獨(dú)立測試集(總數(shù)132個(gè),其中杉木47個(gè),馬尾松17個(gè),榿木29個(gè),鵝掌楸17個(gè),其他闊葉樹22個(gè))。卷積神經(jīng)網(wǎng)絡(luò)需要輸入規(guī)則圖像,本文基于單木樹冠分割結(jié)果,以樹頂為中心、按照96像素×96像素制作正方形矢量框,裁切可見光圖像得到規(guī)則的單株樹冠影像塊,以樹種名稱和探測單木樹頂編號(hào)組合區(qū)別命名并制作單木樹冠影像數(shù)據(jù)集。
1.2.2.3數(shù)據(jù)集劃分與數(shù)據(jù)增廣
將訓(xùn)練集的1 550個(gè)單木樹冠影像塊分5個(gè)樹種按照7∶3隨機(jī)劃分為訓(xùn)練數(shù)據(jù)(總數(shù)1 082個(gè),其中杉木282個(gè),馬尾松240個(gè),榿木73個(gè),鵝掌楸223個(gè),其他闊葉樹264個(gè))和驗(yàn)證數(shù)據(jù)(總數(shù)468個(gè),其中杉木122個(gè),馬尾松104個(gè),榿木32個(gè),鵝掌楸96個(gè),其他闊葉樹114個(gè)),再對(duì)訓(xùn)練數(shù)據(jù)的單木樹種遙感影像進(jìn)行90°旋轉(zhuǎn)、180°旋轉(zhuǎn)、270°旋轉(zhuǎn)、上下翻轉(zhuǎn)、左右翻轉(zhuǎn)等操作使得各樹種樣本數(shù)量變?yōu)樵瓉淼?倍。
單木樹冠圖像生成與數(shù)據(jù)集劃分、數(shù)據(jù)增廣均通過編寫Python腳本實(shí)現(xiàn)批處理。
1.2.3卷積神經(jīng)網(wǎng)絡(luò)
1.2.3.1相關(guān)理論
(1)有效通道注意力機(jī)制
相關(guān)研究表明通道注意力機(jī)制在提升卷積神經(jīng)網(wǎng)絡(luò)性能方面具有較大潛力,它將特征提取時(shí)所有通道同等對(duì)待轉(zhuǎn)為分別賦予不同權(quán)重,大多數(shù)現(xiàn)有方法在致力于復(fù)雜注意力模塊以改善模型性能的同時(shí)也帶來了模型復(fù)雜性的增加,而有效通道注意力(Efficient channel attention,ECA)則在僅增加少量模型參數(shù)條件下還能夠提升模型性能,既避免了擠壓和激勵(lì)網(wǎng)絡(luò)(SENet)的維度縮減,又有效捕獲了跨通道交互[24]。有效通道注意力機(jī)制核心工作原理是在不降低維度情況下逐通道平均池化后ECA模塊利用權(quán)重共享、尺寸為k的一維卷積生成通道注意來學(xué)習(xí)特征,并考慮每個(gè)通道及其k個(gè)鄰近來捕獲本地跨通道交互。
(2)擴(kuò)張卷積
隨著卷積神經(jīng)網(wǎng)絡(luò)中網(wǎng)絡(luò)深度增加,下采樣會(huì)逐漸降低特征圖的空間分辨率造成信息丟失。為減少該不利影響,充分提取圖像全局信息,本文在網(wǎng)絡(luò)卷積層引入空洞卷積(Atrous convolutions)[25],嘗試以空洞卷積代替普通卷積,以實(shí)現(xiàn)在不增加算法復(fù)雜度的條件下增大卷積感受野,從而提高網(wǎng)絡(luò)捕捉特征信息的能力[26]。
(3)瓶頸殘差學(xué)習(xí)
瓶頸殘差學(xué)習(xí)模塊的基本單元如圖1所示,圖中⊕表示逐像素相加,基本單元由三次級(jí)聯(lián)的卷積批規(guī)范化、激活組成,它在原始卷積神經(jīng)網(wǎng)絡(luò)上增加近路連接,使原始輸入能夠傳輸?shù)骄W(wǎng)絡(luò)頂層,從而使φ(x)的網(wǎng)絡(luò)學(xué)習(xí)任務(wù)變?yōu)檩斎胼敵鲩g的F(x)殘差學(xué)習(xí)。而反向傳播時(shí),通過近路連接可直接將網(wǎng)絡(luò)頂層信息傳輸?shù)降讓?,能夠有效緩解梯度消失與網(wǎng)絡(luò)退化問題。
圖1 瓶頸殘差模塊基本單元Fig.1 Basic unit of bottleneck residual block
1.2.3.2網(wǎng)絡(luò)框架結(jié)構(gòu)
鑒于殘差神經(jīng)網(wǎng)絡(luò)具有改善梯度消失和網(wǎng)絡(luò)退化的能力,本研究引入采用瓶頸殘差單元搭建的ResNet50卷積神經(jīng)網(wǎng)絡(luò)模型,保留ReLU激活函數(shù)和softmax函數(shù)分類,并以ResNet50為主干網(wǎng)絡(luò),通過在瓶頸殘差模塊基本單元的第3個(gè)卷積批規(guī)范化后插入有效通道注意力模塊(圖2)搭建新的卷積神經(jīng)網(wǎng)絡(luò)ECA-ResNet50,再對(duì)瓶頸殘差模塊基本單元的第2個(gè)卷積操作(正常卷積)替換為膨脹率為2的擴(kuò)張卷積以搭建卷積神經(jīng)網(wǎng)絡(luò)ECA-ResNet50-Dialate,然后對(duì)ECA-ResNet50和ECA-ResNet50-Dialate的4個(gè)卷積模塊的瓶頸殘差單元數(shù)(3,4,6,3)分別調(diào)整為(3,3,3,3)以構(gòu)建ECA-ResNet-mini和ECA-ResNet-mini-Dilate卷積神經(jīng)網(wǎng)絡(luò)模型,ResNet50及搭建的4個(gè)卷積神經(jīng)網(wǎng)絡(luò)框架結(jié)構(gòu)配置見表1。為方便表述,將ResNet50、ECA-ResNet50、ECA-ResNet50-Dialate、ECA-ResNet-mini、ECA-ResNet-mini-Dilate依次稱為Model Ⅰ、Model Ⅱ、Model Ⅲ、Model Ⅳ和Model Ⅴ。
表1 卷積神經(jīng)網(wǎng)絡(luò)框架的結(jié)構(gòu)配置Tab.1 Parameters configuration of convolutional neural network frameworks
圖2 瓶頸殘差有效通道注意力基本單元Fig.2 Basic unit of bottleneck residual ECA block
1.2.4集成學(xué)習(xí)樹種識(shí)別框架
集成學(xué)習(xí)(Ensemble learning,EL)一般用某種策略將訓(xùn)練所得的“個(gè)體學(xué)習(xí)器”結(jié)合,如果個(gè)體學(xué)習(xí)器是同種類型,此時(shí)個(gè)體學(xué)習(xí)器可以稱為基學(xué)習(xí)器[15-16]。集成學(xué)習(xí)通過多個(gè)基分類器以集成方式完成學(xué)習(xí)任務(wù),能夠?qū)崿F(xiàn)分類器之間的優(yōu)勢互補(bǔ),從而獲得比單一分類器更為顯著優(yōu)越的泛化性能。本文提出的基于卷積神經(jīng)網(wǎng)絡(luò)的集成學(xué)習(xí)樹種識(shí)別框架如圖3所示,通過Model Ⅰ、Model Ⅱ、Model Ⅲ、Model Ⅳ和Model Ⅴ這5種CNN模型的訓(xùn)練學(xué)習(xí)提取樹冠圖像特征進(jìn)行樹種初分類,將它們作為基分類器,然后通過相對(duì)多數(shù)投票法建立集成學(xué)習(xí)模型。
圖3 集成學(xué)習(xí)框架結(jié)構(gòu)Fig.3 Structure of ensembled learning model
1.2.5卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練與測試
(1)預(yù)訓(xùn)練參數(shù):Model Ⅰ使用大型數(shù)據(jù)集ImageNet預(yù)訓(xùn)練的模型參數(shù),Model Ⅱ、Model Ⅲ、Model Ⅳ和Model Ⅴ通過重新訓(xùn)練大型數(shù)據(jù)集產(chǎn)生預(yù)訓(xùn)練模型參數(shù)。
(2)模型訓(xùn)練:基于Python編程語言和PyTorch深度學(xué)習(xí)框架,使用GPU加速模型訓(xùn)練。通過加載預(yù)訓(xùn)練參數(shù)作為網(wǎng)絡(luò)初始化參數(shù),設(shè)置批量大小為32,將擴(kuò)充后的本研究樹冠圖像訓(xùn)練數(shù)據(jù)分別輸入5個(gè)卷積神經(jīng)網(wǎng)絡(luò)模型,調(diào)整網(wǎng)絡(luò)輸出類別數(shù)為樹種類別數(shù)5,同時(shí)修改網(wǎng)絡(luò)輸入圖像為224,通過多次迭代循環(huán)訓(xùn)練模型參數(shù),每次迭代后向網(wǎng)絡(luò)模型輸入驗(yàn)證數(shù)據(jù)檢驗(yàn)?zāi)P蛿M合效果,當(dāng)驗(yàn)證數(shù)據(jù)連續(xù)多次迭代損失函數(shù)不再顯著降低且迭代50次以上時(shí),保存模型參數(shù)并中斷迭代訓(xùn)練。模型訓(xùn)練時(shí),使用交叉熵?fù)p失函數(shù)計(jì)算損失值(loss),嘗試不同學(xué)習(xí)率參數(shù)(0.01、0.001、0.000 1)分別調(diào)優(yōu)訓(xùn)練出5個(gè)不同最優(yōu)模型。
訓(xùn)練過程中,分別采用隨機(jī)梯度下降法(Stochastic gradient descent,SGD)和自適應(yīng)矩估計(jì)(Adaptive moment estimation,Adam)進(jìn)行模型訓(xùn)練,使用SGD優(yōu)化時(shí)設(shè)置動(dòng)量為0.9、學(xué)習(xí)率衰減值0.01以優(yōu)化性能,實(shí)驗(yàn)表明,雖然Adam優(yōu)化器收斂較快,但結(jié)果不如SGD優(yōu)化器理想,因此,使用SGD優(yōu)化算法更新網(wǎng)絡(luò)權(quán)重參數(shù)。
(3)模型測試:模型訓(xùn)練結(jié)束后,輸入獨(dú)立的測試集數(shù)據(jù)進(jìn)行測試,根據(jù)網(wǎng)絡(luò)模型預(yù)測識(shí)別結(jié)果,通過一定指標(biāo)進(jìn)行評(píng)估分析。
對(duì)2020年調(diào)查樣地的樣木和2019年高精度定位的樣木進(jìn)行單木樹冠分割。利用2020年調(diào)查的15個(gè)圓形樣地對(duì)單木分割結(jié)果進(jìn)行精度評(píng)價(jià)。15個(gè)圓形樣地共調(diào)查473株樣木,剔除掉瀕死木、枯死木和樹冠被大樹遮擋的小樹后共有399株樹木,共分割出樹冠391個(gè),1∶1正確分割的樹冠331個(gè),漏檢66株,過分割60株,單木探測率r達(dá)到82.96%,正確率p達(dá)到84.65%,總體精度F達(dá)到83.80%,總體來看分割精度能滿足樹種識(shí)別要求。
與皋廈等[23]采用點(diǎn)云距離判斷單木分割法進(jìn)行LiDAR單木分割(探測率85.7%,正確率96.0%,總體精度90.9%)相比,本文結(jié)果要低,這與研究對(duì)象林分特征直接相關(guān),皋廈等研究林分相對(duì)不太復(fù)雜,而本研究區(qū)內(nèi)亞熱帶闊葉樹樹冠彼此交叉相連、多株樹木相鄰且高度不一以及杉木多株簇生等對(duì)單木分割結(jié)果均會(huì)造成很大影響。
2.2.1卷積神經(jīng)網(wǎng)絡(luò)模型集成前后對(duì)比
使用Model Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ這5種卷積神經(jīng)網(wǎng)絡(luò)模型分別在單木樹冠影像數(shù)據(jù)集進(jìn)行模型訓(xùn)練,加載大型數(shù)據(jù)集上預(yù)訓(xùn)練的模型權(quán)重和偏置參數(shù)對(duì)卷積層參數(shù)初始化,采用不同初始學(xué)習(xí)率(0.01、0.001、0.000 1)進(jìn)行模型訓(xùn)練,訓(xùn)練結(jié)束后用獨(dú)立測試集對(duì)模型進(jìn)行測試檢驗(yàn)。實(shí)驗(yàn)表明初始學(xué)習(xí)率設(shè)置為0.001較為合理,結(jié)果如表2所示。由表2可知,5種網(wǎng)絡(luò)模型訓(xùn)練時(shí)均取得了理想效果,訓(xùn)練、驗(yàn)證正確率均達(dá)到95%以上。Model Ⅱ、Ⅲ、Ⅳ、Ⅴ較改進(jìn)前的Model Ⅰ均有一定提升,這表明了Model Ⅱ加入有效通道注意力模塊使得模型關(guān)注于各樹種最具辨別力特征的能力增強(qiáng),Model Ⅲ用擴(kuò)張卷積代替普通卷積使得卷積網(wǎng)絡(luò)特征圖分辨率不變而感受野擴(kuò)大,提取到了樹冠圖像深層次全局語義特征,Model Ⅳ、Ⅴ對(duì)Model Ⅱ、Ⅲ卷積模塊結(jié)構(gòu)進(jìn)行調(diào)整也取得了相當(dāng)?shù)男Ч?,顯示出該網(wǎng)絡(luò)層數(shù)配置適用于本研究樹冠圖像識(shí)別。
表2 卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練、驗(yàn)證與獨(dú)立測試結(jié)果Tab.2 Results of convolutional neural networks model training and validating and independent test
圖4、5表示模型訓(xùn)練過程中正確率、損失值的變化情況,損失值隨模型不斷迭代呈下降趨勢,直至驗(yàn)證數(shù)據(jù)損失值在隨后50輪迭代循環(huán)中收斂而不再下降后結(jié)束循環(huán)訓(xùn)練。由圖5模型訓(xùn)練損失值下降情況可以看出,Model Ⅰ經(jīng)典網(wǎng)絡(luò)模型訓(xùn)練能夠很快收斂,Model Ⅱ、Ⅲ收斂時(shí)間略長,Model Ⅳ、Ⅴ收斂時(shí)間更長,這與預(yù)訓(xùn)練模型參數(shù)有關(guān),經(jīng)典網(wǎng)絡(luò)模型的預(yù)訓(xùn)練模型參數(shù)更加通用,適用于各種數(shù)據(jù)集的加載訓(xùn)練,能夠快速收斂并保持穩(wěn)定。但是,Model Ⅱ、Ⅲ、Ⅳ、Ⅴ模型訓(xùn)練收斂后也較為穩(wěn)定。此外,從圖4亦可以看出,雖然Model Ⅱ、Ⅲ、Ⅳ、Ⅴ的模型訓(xùn)練耗費(fèi)了一些時(shí)間,但他們?nèi)〉昧藘?yōu)于Model Ⅰ經(jīng)典模型的正確率,這些都為集成學(xué)習(xí)模型奠定了前提。
圖4 不同卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練正確率曲線Fig.4 Training accuracy curves of different convolutional neural networks
圖5 不同卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練損失值曲線Fig.5 Training loss curves of different convolutional neural networks
以本文訓(xùn)練的5種卷積神經(jīng)網(wǎng)絡(luò)模型作為基分類器,在單木樹冠影像數(shù)據(jù)集上進(jìn)行預(yù)測,再采用相對(duì)多數(shù)投票法進(jìn)行集成學(xué)習(xí)輸出二次預(yù)測結(jié)果,集成學(xué)習(xí)正確率見表2。比較表2的集成學(xué)習(xí)與卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練和驗(yàn)證精度可發(fā)現(xiàn),集成分類器訓(xùn)練和驗(yàn)證精度分別達(dá)到99.15%和98.34%,優(yōu)于單獨(dú)的卷積神經(jīng)網(wǎng)絡(luò)模型,較其訓(xùn)練、驗(yàn)證平均正確率分別提高2.76、2.44個(gè)百分點(diǎn),較ResNet50網(wǎng)絡(luò)提高4.23、3.04個(gè)百分點(diǎn)。這表明了集成學(xué)習(xí)模型能夠一定程度提高模型訓(xùn)練正確率。
將獨(dú)立測試數(shù)據(jù)集代入卷積神經(jīng)網(wǎng)絡(luò)和集成學(xué)習(xí)框架進(jìn)行樹種識(shí)別,獨(dú)立測試結(jié)果見表2,可見集成后測試集正確率達(dá)到90.15%,較基分類器(單獨(dú)卷積神經(jīng)網(wǎng)絡(luò))的獨(dú)立測試正確率均有明顯改善,較測試正確率最高的Model Ⅱ還提升4.54個(gè)百分點(diǎn),較ResNet50網(wǎng)絡(luò)提高9.09個(gè)百分點(diǎn)。由此可見,采用集成策略對(duì)卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)測正確率有一定提升。
將集成學(xué)習(xí)識(shí)別結(jié)果與地面實(shí)測的真實(shí)樹種生成混淆矩陣,結(jié)果見表3。由表3可知,其他闊葉樹、馬尾松識(shí)別用戶精度低,誤識(shí)別較為嚴(yán)重,引起該現(xiàn)象可能原因主要有:一是研究區(qū)內(nèi)其他闊葉樹樹種多、樹冠形態(tài)、顏色與紋理復(fù)雜多樣引起卷積層提取的類內(nèi)高層次特征多樣造成誤識(shí)別;二是馬尾松林林層結(jié)構(gòu)復(fù)雜,垂直結(jié)構(gòu)上雖然馬尾松占優(yōu)勢但其與其他樹種交錯(cuò),且馬尾松樹冠稀疏,造成馬尾松樹冠影像與其他樹種相似,易造成誤識(shí)別。
表3 測試數(shù)據(jù)集混淆矩陣Tab.3 Confusion matrix of independent test dataset
將5個(gè)獨(dú)立測試圓形樣地的單木樹冠分割矢量結(jié)果與可見光影像疊加,結(jié)果見圖6a~6e,利用單木樹冠影像數(shù)據(jù)集訓(xùn)練出的最優(yōu)模型對(duì)測試集樣本進(jìn)行單木識(shí)別,5個(gè)樣地的識(shí)別結(jié)果見圖6f~6j,分別與圖6a~6e對(duì)應(yīng)。其中,圖6a~6e符號(hào)化的是實(shí)測的單木樹種及位置,圖6f~6j符號(hào)化的是預(yù)測單木樹種,用藍(lán)色方形框表示誤識(shí)別的單木樹冠塊。不難發(fā)現(xiàn),圖6f中3株杉木被誤識(shí)別為其他闊葉樹、1株其他闊葉樹被誤識(shí)別為鵝掌楸,這應(yīng)該與其他闊葉樹形態(tài)多樣、紋理復(fù)雜易與杉木等樹冠影像高層次特征相似有關(guān),由圖6h可知,2株榿木中1株被誤識(shí)別為其他闊葉樹、1株被誤識(shí)別為杉木,而圖6i中2株其他闊葉樹中1株被誤識(shí)別為榿木、1株被誤識(shí)別為杉木,2株馬尾松中1株被誤識(shí)別為其他闊葉樹、1株被誤識(shí)別為杉木,這與該樣地馬尾松林內(nèi)各樹種混交嚴(yán)重、樹冠交叉重疊、提取的樹冠影像高層次特征復(fù)雜多樣有關(guān),圖6j中3株榿木被誤識(shí)別為馬尾松,這可能為部分榿木樹冠影像與馬尾松單木樹冠影像樣本相似造成??傮w來看,除少量單木樹冠誤識(shí)別外,總體識(shí)別結(jié)果基本理想。
圖6 5個(gè)測試圓形樣地單木樹冠分割與樹種識(shí)別結(jié)果Fig.6 Results of single tree crown segmentation and single tree species recognition in five test circular samples
2.2.2與其他機(jī)器學(xué)習(xí)方法比較
基于單木樹冠分割結(jié)果提取訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)的可見光和激光雷達(dá)變量,可見光變量共提取25個(gè),包括單木樹冠的各波段均值、標(biāo)準(zhǔn)差、亮度以及GLCM、GLDV紋理特征、幾何特征。GLCM紋理特征包括均值、方差、信息熵、角二階矩、相關(guān)性、異質(zhì)性、對(duì)比度和同質(zhì)性8個(gè)參數(shù);GLDV紋理特征包括均值、角二階矩、相關(guān)性、信息熵4個(gè)參數(shù);幾何特征主要提取面積、長寬比、形狀指數(shù)、緊致度、密度和不對(duì)稱性等特征。激光雷達(dá)變量共提取98個(gè),包括首次回波和所有回波高度和強(qiáng)度的均值、最小值、最大值、標(biāo)準(zhǔn)差、方差、變異系數(shù)、峰度、偏度和分位數(shù)等。
為避免大量特征冗余引起的過擬合、低泛化問題,有必要對(duì)特征變量進(jìn)行特征選擇,篩選出貢獻(xiàn)度較大的特征變量以進(jìn)行樹種分類識(shí)別。特征選擇一般有過濾法、包裝法、嵌入法3種形式,本文以嵌入法利用隨機(jī)森林對(duì)特征重要性進(jìn)行評(píng)估排序,計(jì)算模型正確率,篩選出識(shí)別效果較優(yōu)的特征變量。特征篩選后,可見光保留藍(lán)光波段標(biāo)準(zhǔn)差、紅光波段均值、GLCM相關(guān)性等13個(gè)變量,激光雷達(dá)保留99%強(qiáng)度百分位數(shù)、75%強(qiáng)度百分位數(shù)、40%累積強(qiáng)度百分位數(shù)等30個(gè)變量,可見光和激光雷達(dá)變量結(jié)合共保留15個(gè)特征變量。
相關(guān)研究表明,利用優(yōu)選的特征進(jìn)行分類能夠有效提高精度[27]?;诤Y選后的特征變量,分別與不同數(shù)據(jù)源變量(可見光、LiDAR、可見光與LiDAR組合)、隨機(jī)森林(Random forest,RF)和支持向量機(jī)(Support vector machine,SVM)分類器進(jìn)行組合,以訓(xùn)練集訓(xùn)練模型,以獨(dú)立的測試集對(duì)模型進(jìn)行檢驗(yàn)。各組合方案及獨(dú)立測試集檢驗(yàn)結(jié)果見表4,可見光與激光雷達(dá)變量篩選后隨機(jī)森林分類的獨(dú)立測試最高精度為57.84%。通過與表2比較可以發(fā)現(xiàn),卷積神經(jīng)網(wǎng)絡(luò)模型和集成學(xué)習(xí)取得了較其他機(jī)器學(xué)習(xí)方法更為明顯的樹種識(shí)別效果,獨(dú)立測試集的總體精度高出32.31個(gè)百分點(diǎn)。由此可見,采用手動(dòng)提取圖像特征進(jìn)行分類識(shí)別的方法難以基于實(shí)際識(shí)別任務(wù)做自適應(yīng)調(diào)整,而基于卷積神經(jīng)網(wǎng)絡(luò)和集成學(xué)習(xí)的方法能夠自動(dòng)提取圖像高層次特征,有利于高郁閉度條件下無人機(jī)影像的樹種識(shí)別。
表4 其他模型訓(xùn)練組合方案與測試集檢驗(yàn)Tab.4 Different combinations of other model training and test results
(1)提出了基于卷積神經(jīng)網(wǎng)絡(luò)和集成學(xué)習(xí)策略來解決激光雷達(dá)單木分割輔助條件下的無人機(jī)影像單木樹種識(shí)別問題。利用無人機(jī)激光雷達(dá)數(shù)據(jù)和可見光數(shù)據(jù)二者結(jié)合進(jìn)行單木樹冠探測,按照96像素×96像素裁切單木樹冠制作單木樹冠影像數(shù)據(jù)集,引入ResNet50網(wǎng)絡(luò)并結(jié)合引入有效通道注意力、膨脹卷積、調(diào)整卷積模塊層數(shù)改進(jìn)搭建其他4個(gè)網(wǎng)絡(luò),以該5個(gè)卷積神經(jīng)網(wǎng)絡(luò)為基分類器采用相對(duì)多數(shù)投票法集成學(xué)習(xí)。結(jié)果表明,本文提出的方法相較于變量提取結(jié)合其他機(jī)器學(xué)習(xí)分類識(shí)別方法的正確率有較大提升,獨(dú)立測試集總體正確率高出32.31個(gè)百分點(diǎn),改進(jìn)搭建的4個(gè)卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練正確率和泛化效果均優(yōu)于ResNet50網(wǎng)絡(luò),采用集成策略進(jìn)一步提高了模型訓(xùn)練正確率,訓(xùn)練和驗(yàn)證正確率分別達(dá)到99.15%和98.34%,優(yōu)于單獨(dú)的卷積神經(jīng)網(wǎng)絡(luò)模型且較他們的訓(xùn)練、驗(yàn)證平均正確率分別提高2.76、2.44個(gè)百分點(diǎn),較ResNet50網(wǎng)絡(luò)提高4.23、3.04個(gè)百分點(diǎn),樹種識(shí)別泛化能力進(jìn)一步增強(qiáng),獨(dú)立測試集正確率達(dá)到90.15%,較最高的Model Ⅱ還提升4.54個(gè)百分點(diǎn),較ResNet50網(wǎng)絡(luò)提高9.09個(gè)百分點(diǎn),這些為今后無人機(jī)可見光圖像樹種識(shí)別研究提供了技術(shù)思路。
(2)使用5個(gè)卷積神經(jīng)網(wǎng)絡(luò)模型有效增強(qiáng)了特征提取能力,不可避免加大了計(jì)算量,降低了分類識(shí)別速度。使用相對(duì)多數(shù)投票法進(jìn)行集成學(xué)習(xí)相對(duì)簡單實(shí)用,但忽視了各卷積神經(jīng)網(wǎng)絡(luò)提取圖像特征的權(quán)重差異,圖像識(shí)別泛化能力有待提高。因此,應(yīng)合理篩選卷積神經(jīng)網(wǎng)絡(luò)特征,完善集成學(xué)習(xí)方法,進(jìn)一步提高模型運(yùn)行效能和泛化能力。
農(nóng)業(yè)機(jī)械學(xué)報(bào)2022年3期