• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    改進(jìn)分類回歸樹模型的青岡枝葉點(diǎn)云分類研究

    2024-09-12 00:00:00潘政尚馬開森龍依賴珍貴孫華
    關(guān)鍵詞:特征描述測試數(shù)據(jù)鄰域

    摘要:【目的】傳統(tǒng)的樹木枝葉點(diǎn)云分類模型結(jié)構(gòu)與特征過于復(fù)雜,存在穩(wěn)定性差、精度低、模型過擬合及計(jì)算成本高等問題。研究以闊葉樹青岡(Quercus glauca)地面激光點(diǎn)云數(shù)據(jù)為基礎(chǔ),提出一種改進(jìn)的分類回歸樹(classification and regression tree, CART)枝葉點(diǎn)云分類模型?!痉椒ā渴紫雀鶕?jù)點(diǎn)的鄰域特征構(gòu)造特征描述子,確定鄰域搜索參數(shù)的最佳取值。通過逐步引入變量和調(diào)整決策樹模型結(jié)構(gòu)實(shí)現(xiàn)對分類回歸樹模型的改進(jìn)。將改進(jìn)后模型的分類結(jié)果與Logistics回歸和K近鄰模型進(jìn)行對比?!窘Y(jié)果】特征描述子作為變量引入后,模型測試數(shù)據(jù)分類準(zhǔn)確率有所提升,比Logistics回歸和K近鄰模型分別高出13.1%和13.6%;改進(jìn)后的分類回歸樹模型準(zhǔn)確率有較大提升,穩(wěn)定性好且模型大小顯著降低,模型大小較改進(jìn)前減少了99.9%,數(shù)據(jù)訓(xùn)練時(shí)間僅為調(diào)整前的51.3%;改進(jìn)后的方法在樹干和樹葉上的綜合評價(jià)指標(biāo)均在0.9左右,差距小于0.001,無過擬合現(xiàn)象?!窘Y(jié)論】改進(jìn)的CART模型具有較高的精度,在小樣本上也能取得較好的分類效果,穩(wěn)定性好。研究結(jié)果可為地面激光雷達(dá)枝葉點(diǎn)云精準(zhǔn)快速分類提供參考。

    關(guān)鍵詞:地面激光雷達(dá);點(diǎn)云分類;點(diǎn)云特征;分類回歸樹

    中圖分類號:S758; TP391"""" 文獻(xiàn)標(biāo)志碼:A開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):

    文章編號:1000-2006(2024)04-0123-09

    An improved CART model for leaf and wood classification from LiDAR pointclouds of Quercus glauca individual trees

    PAN Zhengshang1, MA Kaisen1, LONG Yi1, LAI Zhengui2, SUN Hua1

    (1.Research Center of Forestry Remote Sensing amp; Information Engineering, Central South University of Forestry and Technology, Key Laboratory of Forestry Remote Sensing Based Big Data amp; Ecological Security for Hunan Province, Key Laboratory of National Forestry and Grassland Administration on Forest Resources Management and Monitoring in Southern China, Changsha 410004, China;2.Lutou Experimental Forest Farm, Central South University of Forestry and Technology, Yueyang" 414000, China)

    Abstract: 【Objective】Due to the complex structure and features, traditional classification models for tree branches and leaf point clouds typically face several problems, including poor stability, low accuracy, model overfitting, and high computational costs. In this study, we propose an improved CART (classification and regression tree) model for leaf and branch classification based on Quercus glauca individual tree point cloud data from terrestrial laser LiDAR. 【Method】First, the feature descriptor was constructed according to the neighborhood points, and the optimal value of the neighborhood search parameter was then determined. The CART model was improved by gradually introducing variables and adjusting the structure of the decision tree. The classification results of the improved CART model were compared with those of the Logistics regression and K-nearest neighbor (KNN) models. 【Result】 The accuracy of the improved CART model using the test data increased after introducing the feature descriptors as variables, exceeding that of the Logistics regression and KNN model by 13.1% and 13.6%, respectively. Moreover, the improved CART model exhibited higher accuracy, better stability, and marked reduced model size following the improvement. In particular, the model size was reduced by 99.9% compared with before the improvement, while the data training time was only 51.3% of that before the adjustment. The comprehensive evaluation index of the improved CART model was approximately 0.9 on both trunk and leaf data, with the difference between accuracy on train data and test data lower than 0.001, indicating no overfitting. 【Conclusion】The improved CART model has a high accuracy and stability, and achieves good classification results on small samples. This study provides a methodological reference for the accurate and rapid classification of trunk and leaf point clouds from terrestrial laser LiDAR.

    Keywords:terrestrial laser LiDAR; point cloud classification; point cloud features; classification and regression tree

    森林中樹木的樹干結(jié)構(gòu)包含了許多與樹木生長生態(tài)過程相關(guān)的信息,如胸徑、樹高、枝干傾角、枝下高等參數(shù)。傳統(tǒng)森林調(diào)查聚焦于樹木的主干信息,獲取數(shù)據(jù)不連續(xù)、效率低[1]。地面激光雷達(dá)是一種主動(dòng)遙感技術(shù),能夠以非接觸方式快速獲取高密度的樹木三維點(diǎn)云信息[2],在短時(shí)序小尺度地物觀測上具有優(yōu)勢。

    樹木結(jié)構(gòu)信息主要來源于樹木點(diǎn)云的樹干部分,樹葉點(diǎn)云會(huì)對樹干信息的定量分析帶來影響,因此需要進(jìn)行枝葉點(diǎn)云分離。枝葉分離的方法按照原理可以分為基于回波特征與基于幾何特征兩大類?;诨夭ㄌ卣鞯姆椒ㄖ饕眉す恻c(diǎn)云的回波強(qiáng)度實(shí)現(xiàn)分類[3],這種方法主要利用樹干與樹葉表面微觀物理特性帶來的反射率差異實(shí)現(xiàn)枝葉分離,通過開發(fā)輻射校正模型[4]進(jìn)行分類。但受森林復(fù)雜大氣環(huán)境與激光雷達(dá)傳感器性能差異的影響,基于回波特征的方法穩(wěn)定性差,難以大規(guī)模應(yīng)用[5]。而基于幾何特征的方法一般通過提取點(diǎn)或局部點(diǎn)構(gòu)成的集合特征進(jìn)行分類,利用分類模型實(shí)現(xiàn)枝葉點(diǎn)云的分離[6-7]。在模型方面,非監(jiān)督模型主要包括多尺度超體素分割算法[8]、最短路徑算法[9]等,這類模型需要針對不同類型的數(shù)據(jù)進(jìn)行調(diào)參,且對數(shù)據(jù)中的噪聲較為敏感,精度較低,穩(wěn)定性差[10]。監(jiān)督模型主要包括常規(guī)機(jī)器學(xué)習(xí)模型[11]和深度學(xué)習(xí)模型[12-14],這類方法不受森林類型和數(shù)據(jù)源的限制[15-17],但需要人工輸入大量的訓(xùn)練數(shù)據(jù)[18],且模型復(fù)雜度的提升會(huì)導(dǎo)致過擬合現(xiàn)象[19-20]。因此,本研究對基于幾何特征的監(jiān)督分類模型的技術(shù)流程進(jìn)行優(yōu)化,提出一種改進(jìn)的分類回歸樹(classification and regression trees,CART)模型[21],可有效解決目前地面激光雷達(dá)樹木點(diǎn)云分類存在的穩(wěn)定性差、精度低、模型過擬合等問題。

    為了實(shí)現(xiàn)精確快速穩(wěn)定的點(diǎn)云枝葉分類,本研究以次生林環(huán)境下的闊葉樹青岡(Quercus glauca)地面激光點(diǎn)云為研究對象,在對數(shù)據(jù)進(jìn)行濾波等預(yù)處理的基礎(chǔ)上,運(yùn)用K維樹(K-dimensional tree,KdTree)索引加速點(diǎn)云鄰域搜索[22],以主成分分析法計(jì)算每個(gè)點(diǎn)在其鄰域內(nèi)的特征向量和特征值,并計(jì)算對應(yīng)的特征描述子。通過引入特征描述子提高分類精度,調(diào)整模型結(jié)構(gòu)消除過擬合現(xiàn)象并對比邏輯斯蒂回歸(Logistics regression,LR)、K近鄰(K-nearest neighbor,KNN)和原始CART模型在訓(xùn)練和測試數(shù)據(jù)上的精度,分析模型的改進(jìn)效果。改進(jìn)CART模型能夠?qū)崿F(xiàn)高精度的枝葉點(diǎn)云分類,為進(jìn)一步定量分析森林樹木結(jié)構(gòu)信息提供支持。

    1 材料與方法

    1.1 研究區(qū)概況

    研究區(qū)為湖南省長沙市寧鄉(xiāng)市西部黃材鎮(zhèn)青羊湖國有林場(112°2′E,28°9′N)。林場年平均氣溫16.2 ℃,最高氣溫40 ℃,平均年降水量1 438.8 mm,相對濕度85%,無霜期273 d,屬中亞熱帶向北亞熱帶過渡的大陸季風(fēng)性濕潤氣候區(qū)。林場土地總面積為1 129.1 hm2,森林覆蓋率為98.7%。主要樹種包括馬尾松(Pinus massoniana)、南酸棗(Choerospondias axillaris)、青岡(Quercus glauca)等。林場所在區(qū)域的植被受人為活動(dòng)影響較大,多年的砍伐導(dǎo)致該區(qū)域的原生植被大部分被破壞,青岡櫟主要生長在采伐跡地自然化經(jīng)營形成的次生林區(qū)域。

    1.2 研究數(shù)據(jù)獲取

    對闊葉樹青岡的地面激光點(diǎn)云數(shù)據(jù)采集時(shí)間為2021年9月,使用FARO FOCUS 3D X330地面三維激光掃描儀進(jìn)行數(shù)據(jù)采集。為保證獲取較為完整的樹木點(diǎn)云,每棵樹架設(shè)3個(gè)掃描站,單站掃描數(shù)據(jù)深度圖片分辨率為10 240×4 267像素,經(jīng)過解算與濾波轉(zhuǎn)化為包含約4 253萬點(diǎn)的點(diǎn)云數(shù)據(jù)。依據(jù)樹齡、胸徑以及郁閉度等因子選擇有代表性的樣木,一共掃描了50株樣木。經(jīng)過數(shù)據(jù)預(yù)處理,最終得到50個(gè)樣本數(shù)據(jù),按照數(shù)據(jù)標(biāo)簽比例抽樣分離訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù),試驗(yàn)數(shù)據(jù)的基本信息如表1所示。

    完成掃描數(shù)據(jù)采集后,利用專用圍尺和測高器分別量測樣木的胸徑與樹高。在29株樣木中,胸徑的最小和最大值分別為7.12和33.05 cm,平均值18.75 cm,標(biāo)準(zhǔn)差5.8 cm;樹高的最小和最大值分別為7.09和16.19 m,平均值11.63 m,標(biāo)準(zhǔn)差2.26 m。

    1.3 點(diǎn)云數(shù)據(jù)預(yù)處理與樣本選取

    點(diǎn)云數(shù)據(jù)預(yù)處理包括:①點(diǎn)云去噪,利用基于鄰域標(biāo)準(zhǔn)差去噪算法刪除數(shù)據(jù)中的離群點(diǎn)[23],搜索參數(shù)設(shè)置為10,標(biāo)準(zhǔn)差倍數(shù)設(shè)置為5。②點(diǎn)云重采樣,使用基于最小點(diǎn)間距的重采樣算法消除由于掃描距離帶來的點(diǎn)云密度不均問題[24-25],距離閾值設(shè)置為1 mm。③樣本數(shù)據(jù)標(biāo)記,對點(diǎn)云數(shù)據(jù)進(jìn)行人工解譯,以手動(dòng)交互方式分離出完整的樹干點(diǎn)云數(shù)據(jù),使用KdTree加速K近鄰搜索算法構(gòu)建三維掩膜,利用掩膜提取點(diǎn)云數(shù)據(jù),實(shí)現(xiàn)枝葉點(diǎn)云數(shù)據(jù)集的標(biāo)記。

    1.4 點(diǎn)云特征描述子計(jì)算

    特征描述子可通過對點(diǎn)云鄰域集合構(gòu)成的矩陣進(jìn)行主成分分析計(jì)算得到。鄰域集合內(nèi)數(shù)據(jù)的特征質(zhì)量與搜索算法的效率會(huì)影響分類算法的精度和運(yùn)算成本。研究采用K近鄰算法進(jìn)行數(shù)據(jù)搜索,通過添加KdTree索引提升搜索效率,相較于其他方法,該方法的優(yōu)點(diǎn)在于計(jì)算量低,且在數(shù)據(jù)維度較低時(shí)搜索效率更高。為了獲取較為穩(wěn)定的分類結(jié)果,研究分別以法向量和特征值作為特征訓(xùn)練分類模型,尋找分類結(jié)果較為穩(wěn)定的鄰域搜索參數(shù)區(qū)間,確定最優(yōu)鄰域搜索參數(shù)后計(jì)算對應(yīng)的特征描述子。

    在獲取最優(yōu)鄰域搜索參數(shù)后,通過對點(diǎn)云數(shù)據(jù)中每個(gè)點(diǎn)在其對應(yīng)最優(yōu)鄰域范圍內(nèi)點(diǎn)構(gòu)成的矩陣進(jìn)行主成分分析,可解算得到對應(yīng)協(xié)方差矩陣的特征值和特征向量,并利用特征值計(jì)算對應(yīng)的特征描述子[26]。對于給定的三維坐標(biāo)點(diǎn)P選擇與其鄰域內(nèi)的點(diǎn)構(gòu)成的點(diǎn)集S={p1,p2,…,pk},通過式(1)可計(jì)算對應(yīng)的協(xié)方差矩陣A:

    A=∑ki=1(pi-p-)(pi-p-)T。(1)

    式中:pi為點(diǎn)集S中第i個(gè)點(diǎn)的坐標(biāo)構(gòu)成的矩陣,p-為點(diǎn)集S中所有點(diǎn)的坐標(biāo)平均值構(gòu)成的矩陣。

    對矩陣A進(jìn)行特征值分解可得特征向量V1、V2、V3,與對應(yīng)的特征根λ,其中λ1≥λ2≥λ3,最小特征根對應(yīng)的特征向量即為點(diǎn)P在該鄰域上的法向量。利用解算得到的特征值計(jì)算各特征描述子,計(jì)算公式如表2所示。

    1.5 改進(jìn)分類回歸樹模型

    CART模型是一種基于條件概率的監(jiān)督學(xué)習(xí)模型,通過GINI指數(shù)對訓(xùn)練數(shù)據(jù)特征的不純度進(jìn)行排序,優(yōu)先選擇不純度最低的變量進(jìn)行分割,一個(gè)決策節(jié)點(diǎn)選擇一個(gè)變量,循環(huán)二分最終形成二叉決策樹[27]。模型的主要步驟包括樹生成和樹剪枝兩部分,研究使用Python3社區(qū)提供的sklearn機(jī)器學(xué)習(xí)庫DecisionTreeClassifier接口實(shí)現(xiàn)分類回歸樹模型的構(gòu)建。

    CART模型在生成決策樹的過程中采用貪心策略,只考慮每個(gè)節(jié)點(diǎn)生成局部最優(yōu)解,這導(dǎo)致輸入變量維度較低時(shí)精度不高,引入外部變量可以改善這一問題,但模型復(fù)雜度的增加會(huì)導(dǎo)致過擬合,因此需要對決策樹結(jié)構(gòu)進(jìn)行調(diào)整,即決策樹修剪。因此本研究以逐步回歸的思路進(jìn)行變量引入,將特征描述子作為變量依次引入,計(jì)算變量引入前后分類模型在測試數(shù)據(jù)上的準(zhǔn)確率增益,選擇準(zhǔn)確率增益最高的變量,以盡可能少的外部變量實(shí)現(xiàn)最大的精度提升。為了解決模型消除復(fù)雜度帶來的數(shù)據(jù)過擬合問題,研究結(jié)合預(yù)修剪與后修剪的思想,采用調(diào)整決策節(jié)點(diǎn)計(jì)算方式與限制模型最大深度的方式對決策樹進(jìn)行調(diào)整。在生成決策樹時(shí)不對數(shù)據(jù)進(jìn)行采樣,以全局最優(yōu)解替代局部最優(yōu)解計(jì)算分支點(diǎn),使每個(gè)節(jié)點(diǎn)的精度貢獻(xiàn)最大化;同時(shí)將分類模型在不同數(shù)據(jù)上分類準(zhǔn)確率之差作為損失函數(shù)對決策樹進(jìn)行修剪,以損失函數(shù)較小時(shí)對應(yīng)的最大決策樹深度作為調(diào)整改進(jìn)CART模型的最大深度(圖1)。為了驗(yàn)證CART模型及其改進(jìn)策略帶來的準(zhǔn)確率提升,本研究選擇與LR和KNN模型進(jìn)行對比。

    1.6 精度評價(jià)指標(biāo)

    研究使用混淆矩陣與其衍生指標(biāo)對分類模型精度進(jìn)行定量評價(jià),混淆矩陣中各個(gè)數(shù)據(jù)類型的意義如表3所示。

    精度評價(jià)指標(biāo)包括準(zhǔn)確率(precision, Pa)、精確度(accuracy, Pi)、召回率(recall, Ri)和綜合評價(jià)指標(biāo)(F-score, Fi),計(jì)算公式如下[28]。

    Pa=Tl+TtTl+Fl+Tt+Ft;(2)

    Pi=TiTi+Fj;(3)

    Ri=TiTi+Fi;(4)

    Fi=2×Pi×RiPi+Ri。(5)

    式中:i代表當(dāng)前計(jì)算指標(biāo)對應(yīng)的數(shù)據(jù)類型,j代表與當(dāng)前計(jì)算指標(biāo)對應(yīng)數(shù)據(jù)不同的類型。

    2 結(jié)果與分析

    2.1 鄰域搜索參數(shù)的選擇

    研究以50個(gè)點(diǎn)為步長,從50到500共取10組,計(jì)算對應(yīng)鄰域搜索參數(shù)下的法向量與特征值。分別使用法向量和特征值作為特征變量訓(xùn)練LR、KNN和CART分類模型,計(jì)算不同鄰域搜索參數(shù)下各模型在訓(xùn)練與測試數(shù)據(jù)上的準(zhǔn)確率,通過尋找分類結(jié)果較為穩(wěn)定的鄰域搜索參數(shù)區(qū)間確定最優(yōu)鄰域搜索參數(shù)。隨著鄰域選擇參數(shù)增加,兩組特征訓(xùn)練模型的準(zhǔn)確率均有收斂的趨勢(圖2)。將法向量作為特征訓(xùn)練時(shí),3種模型在測試數(shù)據(jù)上的分類準(zhǔn)確率均呈下降趨勢,并在鄰域搜索參數(shù)達(dá)到300后逐漸收斂。將特征值作為特征訓(xùn)練時(shí),3種模型在測試數(shù)據(jù)上的分類準(zhǔn)確率均呈上升趨勢,其中CART模型鄰域搜索參數(shù)達(dá)到300后逐漸收斂。這一規(guī)律在平均準(zhǔn)確率上也適用。為了獲得盡可能穩(wěn)定的分類結(jié)果,選擇最優(yōu)鄰域搜索參數(shù)時(shí)應(yīng)保證兩組特征均已收斂,考慮到鄰域選擇參數(shù)與搜索需要消耗的系統(tǒng)資源呈正相關(guān),故研究采用300作為最優(yōu)鄰域選擇參數(shù)進(jìn)行特征計(jì)算與模型訓(xùn)練。

    2.2 CART模型優(yōu)化

    2.2.1 逐步引入特征變量

    使用法向量和特征值訓(xùn)練的原始CART模型計(jì)算所得的平均測試數(shù)據(jù)準(zhǔn)確率較低。在現(xiàn)有特征基礎(chǔ)上,研究逐步引入表2中的8個(gè)特征描述子提升分類準(zhǔn)確率。通過計(jì)算每個(gè)描述子帶來的精度增益,保留精度增益為正的特征變量。第1輪變量引入時(shí),除跡外的其他7個(gè)變量的準(zhǔn)確率增益均為正,其中平面性指數(shù)增益最大,增益量為0.081;第2輪變量引入時(shí),曲率增益最大,增益量為0.021,與其他增益為正的變量差異不大;第3輪變量引入時(shí),除線性指數(shù)外,其他變量均無準(zhǔn)確率增益,線性指數(shù)的增益小于0.1%,可忽略不計(jì);第4輪變量引入時(shí),所有變量均無準(zhǔn)確率增益。在引入平面性指數(shù)、曲率后模型精度不再提升,故將法向量與上述特征描述子集合作為改進(jìn)CART模型的特征變量。

    2.2.2 調(diào)整決策樹結(jié)構(gòu)

    適當(dāng)引入變量能夠提升模型精度,但變量增加會(huì)提升模型的復(fù)雜度,造成模型過擬合。研究結(jié)合預(yù)修剪與后修剪思想對決策樹結(jié)構(gòu)進(jìn)行改進(jìn),在計(jì)算分支點(diǎn)時(shí)以全局最優(yōu)解替代局部最優(yōu)解,同時(shí)限制決策樹最大深度。通過計(jì)算不同最大深度下測試與訓(xùn)練數(shù)據(jù)的分類精度對模型優(yōu)化效果進(jìn)行評價(jià),以全局最優(yōu)解作為分支點(diǎn)后,訓(xùn)練數(shù)據(jù)精度隨決策樹最大深度變化較改進(jìn)前更穩(wěn)定,整體精度水平更高(圖3)。當(dāng)最大深度取12時(shí),改進(jìn)CART模型測試數(shù)據(jù)準(zhǔn)確率達(dá)到最大,且訓(xùn)練與測試數(shù)據(jù)準(zhǔn)確率差距較小。生成決策樹時(shí)使用全局最優(yōu)解計(jì)算分支點(diǎn)會(huì)消耗更多計(jì)算資源,但限制決策樹最大深度能夠極大減少訓(xùn)練時(shí)間,通過提高淺層節(jié)點(diǎn)對模型準(zhǔn)確率的貢獻(xiàn)減少訓(xùn)練消耗的總資源。研究選擇最大深度為12,計(jì)算全局最優(yōu)分支點(diǎn)的模型作為調(diào)整改進(jìn)CART模型。

    2.2.3 模型輕量化

    研究使用sklearn機(jī)器學(xué)習(xí)庫的DecisionTreeClassifier接口進(jìn)行模型訓(xùn)練,在八核心AMD Ryzen 7 4800H 2.9GHz處理器、16 GB內(nèi)存的PC機(jī)上部署Python3環(huán)境下,使用Python3集成joblib模塊將改進(jìn)CART模型導(dǎo)出為pkl文件,計(jì)算改進(jìn)與調(diào)整前后CART模型決策樹所含的節(jié)點(diǎn)數(shù)、模型訓(xùn)練時(shí)間與模型大小。調(diào)整后的改進(jìn)CART模型性能有較大提升,測試數(shù)據(jù)準(zhǔn)確率為0.901,較調(diào)整前上升了9.3%,決策樹中包含節(jié)點(diǎn)7 591個(gè),為調(diào)整前的0.2%,訓(xùn)練時(shí)間為361.3 s,較調(diào)整前減少了48.7%(表4)。模型本身所占用的硬盤空間大小與訓(xùn)練所需時(shí)間決定其推廣能力,模型決策樹結(jié)構(gòu)會(huì)影響模型運(yùn)行計(jì)算量。研究在不降低分類精度的前提下,通過調(diào)整模型結(jié)構(gòu),降低了CART分類模型的時(shí)間成本和模型大小,調(diào)整改進(jìn)后模型大小較改進(jìn)前減少了99.9%,實(shí)現(xiàn)模型輕量化,提高了模型的可移植性,有利于模型的推廣應(yīng)用。

    2.2.4 模型穩(wěn)定性分析

    研究采用降低訓(xùn)練樣本比例的方法測試調(diào)整改進(jìn)CART模型的穩(wěn)定性,分別使用面向數(shù)據(jù)和面向?qū)ο蟮姆椒▽τ?xùn)練數(shù)據(jù)進(jìn)行抽樣,通過計(jì)算測試數(shù)據(jù)分類準(zhǔn)確率驗(yàn)證分類模型在小樣本下的分類精度。面向數(shù)據(jù)隨機(jī)抽樣時(shí),分類模型精度隨樣本比例的增大沒有顯著變化,具有較好的穩(wěn)定性,說明大部分樹干與樹葉點(diǎn)的鄰域特征間存在顯著差異;面向?qū)ο蟪闃訒r(shí),分類模型精度僅在樣本數(shù)小于30時(shí)存在一定波動(dòng),當(dāng)訓(xùn)練樣本數(shù)大于30時(shí),分類模型精度表現(xiàn)較為穩(wěn)定(圖4),說明訓(xùn)練數(shù)據(jù)中樣木的選取會(huì)影響分類結(jié)果,應(yīng)優(yōu)先選擇具有代表性的樣木數(shù)據(jù)進(jìn)行訓(xùn)練。以上結(jié)果說明調(diào)整改進(jìn)CART模型具有較高的穩(wěn)定性,結(jié)合具有代表性的訓(xùn)練數(shù)據(jù)時(shí),能夠?qū)崿F(xiàn)高精度的點(diǎn)云枝葉分類。

    2.3 模型分類結(jié)果比較

    通過計(jì)算整體與不同類別在訓(xùn)練與測試數(shù)據(jù)上的分類準(zhǔn)確率、精確度、召回率和綜合評價(jià)指標(biāo)來評價(jià)模型分類精度。對比調(diào)整改進(jìn)前后的CART與LR、KNN分類模型的精度評價(jià)指標(biāo)(表5),3種模型對樹葉的識別精度均高于樹干,在測試數(shù)據(jù)上,LR與KNN模型對樹葉點(diǎn)云的綜合評價(jià)指標(biāo)為0.809和0.810,而調(diào)整改進(jìn)CART模型的綜合評價(jià)指標(biāo)為0.916,分別高出LR與KNN模型13.2%和13.1%,調(diào)整改進(jìn)CART模型分類精度較高。而KNN與LR模型在測試和訓(xùn)練數(shù)據(jù)上的分類準(zhǔn)確率差距分別為0.071和0.05,調(diào)整改進(jìn)CART模型的差距為0.002,顯著低于前者。特征描述子作為變量引入后,模型測試數(shù)據(jù)分類準(zhǔn)確率提升了23.97%。調(diào)整改進(jìn)CART模型對樹葉與樹干均有較好的識別能力,在分類精度上優(yōu)于LR和KNN算法,且不存在數(shù)據(jù)過擬合現(xiàn)象,能夠?qū)崿F(xiàn)精準(zhǔn)快速的枝葉點(diǎn)云分類。

    調(diào)整改進(jìn)CART模型在測試數(shù)據(jù)上的分類結(jié)果見圖5,其中棕色表示樹干正確分類點(diǎn),綠色表示樹葉正確分類點(diǎn),藍(lán)色表示被錯(cuò)分的樹干點(diǎn),紅色表示被錯(cuò)分的樹葉點(diǎn)。研究提出的模型能夠正確分類大部分?jǐn)?shù)據(jù),包括冠層中的樹干點(diǎn)。但依然存在部分錯(cuò)分現(xiàn)象,例如部分垂直分布的葉片被錯(cuò)分為樹干,或部分細(xì)枝條被錯(cuò)分為樹葉,這是由于闊葉樹冠層相互遮擋,導(dǎo)致部分點(diǎn)云存在缺失。存在缺失的點(diǎn)云數(shù)據(jù)差異不顯著,造成了分類模型錯(cuò)分,但大部分?jǐn)?shù)據(jù)依然被正確分類,可根據(jù)實(shí)際需求對數(shù)據(jù)進(jìn)行后處理,減少錯(cuò)分點(diǎn)云帶來的問題。

    3 討 論

    研究提出了一種改進(jìn)的分類回歸樹模型算法,針對次生林環(huán)境下采集的青岡地面激光點(diǎn)云數(shù)據(jù),選用了合適的鄰域搜索參數(shù)計(jì)算特征描述子,并通過引入特征描述子與調(diào)整決策樹結(jié)構(gòu)的方式對模型進(jìn)行改進(jìn)。該方法對樹木的枝干部分具有較強(qiáng)的識別能力,在訓(xùn)練與測試數(shù)據(jù)上的分類準(zhǔn)確率均在0.9左右,優(yōu)于現(xiàn)有的監(jiān)督[29]與非監(jiān)督方法[9]。在引入平面性指數(shù)、曲率兩個(gè)特征變量后,CART分類模型的測試數(shù)據(jù)準(zhǔn)確率由0.726提升至0.830。與LR、KNN模型相比,調(diào)整改進(jìn)CART模型在測試數(shù)據(jù)上的準(zhǔn)確率比LR和KNN模型分別高13.1%、13.6%,且樹干與樹葉的綜合評價(jià)指標(biāo)均在0.9左右,訓(xùn)練與測試數(shù)據(jù)準(zhǔn)確率差距遠(yuǎn)低于LR和KNN模型。模型的訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)分類精度差距僅為0.001,無過擬合現(xiàn)象,分類模型結(jié)果在測試數(shù)據(jù)不同類型上的召回率相近,優(yōu)于汪獻(xiàn)義等[16]的研究結(jié)果(精度差距為0.036)。調(diào)整改進(jìn)CART模型決策節(jié)點(diǎn)數(shù)量僅有7 591個(gè),且訓(xùn)練時(shí)間減少了48.7%。在保證點(diǎn)云分類精度的基礎(chǔ)上,調(diào)整改進(jìn)CART模型降低了模型運(yùn)算量與內(nèi)存占用,實(shí)現(xiàn)模型輕量化,提高了模型的可移植性,有利于模型的推廣應(yīng)用。模型分類精度在小樣本上沒有出現(xiàn)明顯下降,說明該模型具有較好的穩(wěn)定性。

    高精度的枝葉點(diǎn)云分離,對于定量分析樹木的生長生態(tài)過程具有重要意義。此前的枝葉分離算法研究大部分僅在人工林或非林地環(huán)境下采集的樣本上取得了較好效果,如孫圓等[3]在城市林地環(huán)境下,對銀杏(Ginkgo biloba)和無患子(Sapindus saponaria)使用激光強(qiáng)度校正模型進(jìn)行枝葉分類,達(dá)到了約0.8的分類準(zhǔn)確率,邢艷秋等[30]對東北林業(yè)大學(xué)實(shí)驗(yàn)林場人工林環(huán)境下的蒙古櫟(Quercus mongolica)進(jìn)行枝葉分類,采樣9個(gè)特征描述子結(jié)合LightGBM分類模型進(jìn)行分類,分類準(zhǔn)確率約0.96。這些樣木的干形結(jié)構(gòu)相對簡單,缺少對復(fù)雜地形條件下的枝葉分離研究的討論。本研究的樣木采集自丘陵地區(qū)次生林環(huán)境下生長的青岡櫟單木,包含地形、林地環(huán)境、植物葉片遮擋等多種影響因素,其實(shí)驗(yàn)結(jié)果更接近實(shí)際的應(yīng)用場景,具有更好的普適性。

    改進(jìn)的分類回歸樹模型在樹木主干上能取得良好的分離效果,錯(cuò)誤分類點(diǎn)主要集中在少數(shù)遮擋較為嚴(yán)重的側(cè)枝或垂直分布的葉片上。此外,在面向數(shù)據(jù)和面向?qū)ο髢煞N抽樣方式下,調(diào)整改進(jìn)CART模型均表現(xiàn)出優(yōu)秀的穩(wěn)定性。面向數(shù)據(jù)隨機(jī)抽樣時(shí),分類模型精度隨樣本比例沒有顯著變化,大部分樹干與樹葉點(diǎn)的鄰域特征間存在顯著差異;而在面向?qū)ο蟪闃訒r(shí),分類模型精度僅在樣本數(shù)小于30時(shí)存在小幅度波動(dòng),訓(xùn)練數(shù)據(jù)中樣木的選取會(huì)影響分類結(jié)果,在訓(xùn)練模型時(shí)應(yīng)優(yōu)先選擇具有代表性的樣木數(shù)據(jù)。由于傳感器掃描角度等問題,調(diào)整改進(jìn)CART模型對一些局部特征相似的點(diǎn)云識別能力較低,且研究樣本僅來自次生林環(huán)境下的青岡櫟單木數(shù)據(jù)。因此在后續(xù)研究中,將繼續(xù)探索改進(jìn)CART模型分類結(jié)果的后處理方法以及該模型在其他樹種或林分環(huán)境條件下的適用性。

    參考文獻(xiàn)(reference):

    [1]TAO S L,GUO Q H,XU S W,et al.A geometric method for wood-leaf separation using terrestrial and simulated lidar data[J].Photogram Engng Rem Sens,2015,81(10):767-776.DOI: 10.14358/pers.81.10.767.

    [2]楊必勝,董震.點(diǎn)云智能研究進(jìn)展與趨勢[J].測繪學(xué)報(bào),2019,48(12):1575-1585.YANG B S,DONG Z.Progress and perspective of point cloud intelligence[J].Acta Geod Cartogr Sin,2019,48(12):1575-1585.DOI: 10.11947/j.AGCS.2019.20190465.

    [3]孫圓,林秀云,熊金鑫,等.基于地面激光強(qiáng)度校正數(shù)據(jù)的單木枝葉分離[J].中國激光,2021,48(1):0104001.SUN Y,LIN X Y,XIONG J X,et al.Separation of single wood branches and leaves based on corrected TLS intensity data[J].Chin J Lasers,2021,48(1):0104001.DOI: 10.3788/CJL202148.0104001.

    [4]CALDERS K,DISNEY M I,ARMSTON J,et al.Evaluation of the range accuracy and the radiometric calibration of multiple terrestrial laser scanning instruments for data interoperability[J].IEEE Trans Geosci Remote Sens,2017,55(5):2716-2724.DOI: 10.1109/TGRS.2017.2652721.

    [5]夏國芳,胡春梅,曹畢錚,等.激光入射角度對點(diǎn)云反射強(qiáng)度的影響研究[J].激光雜志,2016,37(4):11-13.XIA G F,HU C M,CAO B Z,et al.Study on the influence of laser incident angle on the reflection intensity of the point cloud[J].Laser J,2016,37(4):11-13.DOI: 10.14016/j.cnki.jgzz.2016.04.011.

    [6]曹偉,陳動(dòng),史玉峰,等.激光雷達(dá)點(diǎn)云樹木建模研究進(jìn)展與展望[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2021,46(2):203-220.CAO W,CHEN D,SHI Y F,et al.Progress and prospect of LiDAR point clouds to 3D tree models[J].Geomat Inf Sci Wuhan Univ,2021,46(2):203-220.DOI: 10.13203/j.whugis20190275.

    [7]黃亮,許文雅,譚帥.樹木三維點(diǎn)云的枝葉分割方法[J].北京測繪,2022,36(1):18-22.HUANG L,XU W Y,TAN S.3D point cloud segmentation method for branches and leaves of trees[J].Beijing Surv Mapp,2022,36(1):18-22.DOI: 10.19580/j.cnki.1007-3000.2022.01.004.

    [8]FARMAKIS I,BONNEAU D,HUTCHINSON D J,et al.Supervoxel-based multi-scale point cloud segmentation using fnea for object-oriented rock slope classification using TLS[J].Int Arch Photogramm Remote Sens Spatial Inf Sci,2020,43:1049-1056.DOI: 10.5194/isprs-archives-xliii-b2-2020-1049-2020.

    [9]林筱涵,李愛農(nóng),邊金虎,等.基于網(wǎng)絡(luò)圖的地基激光雷達(dá)復(fù)雜樹木點(diǎn)云枝葉分離方法[J].遙感技術(shù)與應(yīng)用,2022,37(1):161-172.LIN X H,LI A N,BIAN J H,et al.A method for separating leaf and wood components of complex tree point cloud data based on network graph with terrestrial laser scanning[J].Remote Sens Technol Appl,2022,37(1):161-172.DOI: 10.11873/j.issn.1004-0323.2022.1.0161.

    [10]WANG D,MOMO T" S,CASELLA E.LeWoS:a universal leaf-wood classification method to facilitate the 3D modelling of large tropical trees using terrestrial LiDAR[J].Me-thods Ecol Evol,2020,11(3):376-389.DOI: 10.1111/2041-210x.13342.

    [11]WANG D,HOLLAUS M,PFEIFER N.Feasibility of machine learning methods for separating wood and leaf points from terrestrial laser scanning data[J].ISPRS Ann Photogramm Remote Sens Spatial Inf Sci,2017,IV-2/W4:157-164.DOI: 10.5194/isprs-annals-iv-2-w4-157-2017.

    [12]VICARI M B,DISNEY M,WILKES P,et al.Leaf and wood classification framework for terrestrial LiDAR point clouds[J].Methods Ecol Evol,2019,10(5):680-694.DOI: 10.1111/2041-210x.13144.

    [13]QI C R,YI L,SU H,et al.PointNet++:deep hierarchical feature learning on point sets in a metric space[C]//Proceedings of the 31st International Conference on Neural Information Processing Systems.December,2017,Long Beach,California,USA: ACM,2017:5105-5114.DOI: 10.5555/3295222.3295263.

    [14]趙江洪,竇新銅,曹月娥,等.一種基于分割結(jié)果實(shí)現(xiàn)三維點(diǎn)云分類的方法[J].測繪科學(xué),2022,47(3):85-95.ZHAO J H,DOU X T,CAO Y E,et al.A method for 3D point cloud classification based on segmentation results[J].Sci Surv Mapp,2022,47(3):85-95.DOI: 10.16251/j.cnki.1009-2307.2022.03.012.

    [15]ZHOU J J,WEI H Q,ZHOU G Y,et al.Separating leaf and wood points in terrestrial laser scanning data using multiple optimal scales[J].Sensors,2019,19(8):1852.DOI: 10.3390/s19081852.

    [16]汪獻(xiàn)義,邢艷秋,尤號田,等.基于近鄰幾何特征的TLS林分點(diǎn)云分類研究[J].北京林業(yè)大學(xué)學(xué)報(bào),2019,41(6):138-146.WANG X Y,XING Y Q,YOU H T,et al.TLS point cloud classification of forest based on nearby geometric features[J].J Beijing For Univ,2019,41(6):138-146.DOI: 10.13332/j.1000-1522.20180308.

    [17]麻衛(wèi)峰,王金亮,張建鵬,等.一種改進(jìn)法向量估算的點(diǎn)云特征提取[J].測繪科學(xué),2021,46(11):84-90,146.MA W F,WANG J L,ZHANG J P,et al.Feature extraction from point cloud based on improved normal vector[J].Sci Surv Mapp,2021,46(11):84-90,146.DOI: 10.16251/j.cnki.1009-2307.2021.11.012.

    [18]梁沖. 面向樹木特征提取的室外場景點(diǎn)云數(shù)據(jù)語義分類 [D]. 南京:南京師范大學(xué), 2021.LIANG C. Semantic classification of outdoor scenic spot pointcloud data for tree feature extraction [D]. Nanjing: Nanjing Normal University, 2021.

    [19]ZHU X,SKIDMORE A K,DARVISHZADEH R,et al.Foliar and woody materials discriminated using terrestrial LiDAR in a mixed natural forest[J].Int J Appl Earth Obs Geoinf,2018,64:43-50.DOI: 10.1016/j.jag.2017.09.004.

    [20]盧曉藝,云挺,薛聯(lián)鳳,等.基于樹木激光點(diǎn)云的有效特征抽取與識別方法[J].中國激光,2019,46(5):411-422.LU X Y,YUN T,XUE L F,et al.Effective feature extraction and identification method based on tree laser point cloud[J].Chin J Lasers,2019,46(5):411-422.DOI: 10.3788/CJL201946.0510002.

    [21]PATEL H H,PRAJAPATI P.Study and analysis of decision tree based classification algorithms[J].Ijcse,2018,6(10):74-78.DOI: 10.26438/ijcse/v6i10.7478.

    [22]王艷秋,徐傳飛,于戈,等.一種面向不確定對象的可見k近鄰查詢算法[J].計(jì)算機(jī)學(xué)報(bào),2010,33(10):1943-1952.WANG Y Q,XU C F,YU G,et al.Visible k-nearest neighbor queries over uncertain data[J].Chin J Comput,2010,33(10):1943-1952.DOI: 10.3724/SP.J.1016.2010.01943.

    [23]劉剛,尹一涵,鄭智源,等.基于三維點(diǎn)云的群體櫻桃樹冠層去噪和配準(zhǔn)方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2022,53(S2):1-11.LIU G,YIN Y H,ZHENG Z Y,et al.Denoising and registration method of group cherry trees canopy based on 3D point cloud[J].Trans Chin Soc Agric Mach,2022,53(S2):1-11.DOI:10.6041/j.issn.1000-1298.2022.s2.021.

    [24]張卉冉, 董震, 楊必勝, 等. 點(diǎn)云壓縮研究進(jìn)展與趨勢 [J]. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2023,48(2):192-205.ZHANG H R, DONG Z, YANG B S, et al. Progress and perspectives of point cloud compression [J]. Geomatics and Information Science of Wuhan University,2023,48(2):192-205.DOI:10.13203/j.whugis20210103.

    [25]CHENG X,ZENG M,LIN J P,et al.Efficient L0 resampling of point sets[J].Comput Aided Geom Des,2019,75:101790.DOI: 10.1016/j.cagd.2019.101790.

    [26]DONG Z,YANG B S,LIANG F X,et al.Hierarchical registration of unordered TLS point clouds based on binary shape context descriptor[J].ISPRS J Photogramm Remote Sens,2018,144:61-79.DOI: 10.1016/j.isprsjprs.2018.06.018.

    [27]張繼超,劉寧,宋偉東,等.一種特征選擇的全極化雷達(dá)影像分類方法[J].測繪科學(xué),2022,47(6):127-134.ZHANG J C,LIU N,SONG W D,et al.A fully polarimetric radar image classification method based on feature selection[J].Sci Surv Mapp,2022,47(6):127-134.DOI: 10.16251/j.cnki.1009-2307.2022.06.016.

    [28]盧華清,伍吉倉,張子?。嫦虻鼗す恻c(diǎn)云的樹木枝葉分離[J].中國激光,2022,49(23):156-167.LU H Q,WU J C,ZHANG Z J.Tree branch and leaf separation facing TLS point cloud[J].Chin J Lasers,2022,49(23):156-167. DOI:10.3788/CJL.202249.2310001.

    [29]BECKER C,ROSINSKAYA E,HNI N,et al.Classification of aerial photogrammetric 3D point clouds[J].Photogramm Eng Remote Sensing,2018,84(5):287-295.DOI: 10.14358/pers.84.5.287.

    [30]邢艷秋,蔡碩,汪獻(xiàn)義.采用多尺度近鄰體素特征的TLS林分點(diǎn)云分類[J].遙感信息,2021,36(5):1-7.XING Y Q,CAI S,WANG X Y.TLS point cloud classification of forest by multi-scale neighbor voxel features[J].Remote Sens Inf,2021,36(5):1-7.DOI: 10.3969/j.issn.1000-3177.2021.05.001.

    (責(zé)任編輯 李燕文)

    收稿日期Received:2022-11-04""" 修回日期Accepted:2022-12-28

    基金項(xiàng)目:國家自然科學(xué)基金面上項(xiàng)目(31971578); 湖南省自然科學(xué)基金面上項(xiàng)目(2022JJ30078);湖南省科技創(chuàng)新計(jì)劃(2023RC1065)。

    第一作者:潘政尚(20201100030@csuft.edu.cn)。

    *通信作者:孫華(sunhua@csuft.edu.cn),教授。

    引文格式:潘政尚,馬開森,龍依,等.

    改進(jìn)分類回歸樹模型的青岡枝葉點(diǎn)云分類研究[J]. 南京林業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2024,48(4):123-131.

    PAN Z S, MA K S, LONG Y, et al.

    An improved CART model for leaf and wood classification from LiDAR point clouds of Quercus glauca individual trees[J]. Journal of Nanjing Forestry University (Natural Sciences Edition),2024,48(4):123-131.

    DOI:10.12302/j.issn.1000-2006.202211006.

    猜你喜歡
    特征描述測試數(shù)據(jù)鄰域
    In the Zoo
    船舶尾流圖像的數(shù)字化處理和特征描述技術(shù)
    稀疏圖平方圖的染色數(shù)上界
    測試數(shù)據(jù)管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
    基于鄰域競賽的多目標(biāo)優(yōu)化算法
    目標(biāo)魯棒識別的抗旋轉(zhuǎn)HDO 局部特征描述
    基于自適應(yīng)粒子群優(yōu)化算法的測試數(shù)據(jù)擴(kuò)增方法
    關(guān)于-型鄰域空間
    空間co-location挖掘模式在學(xué)生體能測試數(shù)據(jù)中的應(yīng)用
    體育科技(2016年2期)2016-02-28 17:06:21
    基于差異的圖像特征描述及其在絕緣子識別中的應(yīng)用
    電測與儀表(2015年3期)2015-04-09 11:37:56
    长宁区| 额济纳旗| 彩票| 盱眙县| 楚雄市| 新巴尔虎右旗| 渝中区| 柳州市| 木里| 台州市| 桃园县| 余干县| 稷山县| 平阳县| 安徽省| 平罗县| 靖远县| 乳山市| 阜阳市| 鹤岗市| 丰台区| 甘泉县| 金川县| 阳江市| 威海市| 丹寨县| 洞头县| 建平县| 田东县| 巴林左旗| 五指山市| 防城港市| 五大连池市| 肥乡县| 白山市| 南召县| 温泉县| 宁明县| 邛崃市| 平远县| 扎鲁特旗|