肖 斌, 何宏昌, 竇世卿*, 范冬林, 付波霖, 張 潔, 熊遠(yuǎn)康, 史今科
1. 桂林理工大學(xué)測繪地理信息學(xué)院, 廣西 桂林 541006 2. 珠江水利委員會珠江水利科學(xué)研究院, 廣東 廣州 510610
遙感技術(shù)的高速發(fā)展促進(jìn)農(nóng)業(yè)研究和生產(chǎn)管理愈發(fā)趨于精細(xì)化和定量化[1-2]。 傳統(tǒng)衛(wèi)星尺度遙感在農(nóng)作物精細(xì)分類方面難以實(shí)現(xiàn)同一物種不同品種的精準(zhǔn)識別與監(jiān)測, 無人機(jī)高光譜遙感技術(shù)的快速發(fā)展使之成為可能[3-4], 鑒于其在農(nóng)作物長勢精準(zhǔn)監(jiān)測、 種植結(jié)構(gòu)布局、 作物估產(chǎn)與精細(xì)化管理等方面的巨大優(yōu)勢及應(yīng)用潛力[5-6], 積極探索無人機(jī)高光譜技術(shù)的同一物種不同品種的精細(xì)分類具有重大意義[7-8]。
目前, 應(yīng)用于果樹作物[9]、 紅樹林[10]等較為復(fù)雜的三維結(jié)構(gòu)林木精細(xì)分類主要是基于對象的方法, 如徐凱健等[11]通過SVM對不同時(shí)相的高分影像進(jìn)行樹種分類, 結(jié)果表明, 除光譜差異較大的油松外, 基于同一時(shí)相且光譜特征相近的樹種分類精度較低; 張鵬等[12]以WorldView-2影像為數(shù)據(jù)源, 基于地塊尺度利用ReliefF算法進(jìn)行特征優(yōu)選, 并以RF對復(fù)雜種植區(qū)進(jìn)行精細(xì)分類, 結(jié)果顯示荷、 水稻及棉花等作物PA與UA均在80%以上, 但紋理和光譜較為接近的花生與其他作物的PA與UA均在65%之下; 由此看出低影像分辨率及低光譜分辨率在光譜及紋理差異較小的類似地物中變現(xiàn)不佳。 而在同物種不同品種的細(xì)微特征差異中如何獲得高精度分類結(jié)果是亟需解決的問題。 左萍萍等[13]以無人機(jī)多光譜影像為數(shù)據(jù)源, 利用遞歸特征消除(recursive feature elimination, RFE)算法進(jìn)行特征優(yōu)選, 以RF對沼澤植被進(jìn)行分類, 總體分類精度有所提高, 但在小葉章和塔頭苔草混合等區(qū)域, 其用戶精度分別為63.6%和47.1%; Schiefer等[14]結(jié)合無人機(jī)RGB圖像和減去數(shù)字地形模型(DSM)后的nDSM, 經(jīng)U-NET分割后, 以卷積神經(jīng)網(wǎng)絡(luò)CNN進(jìn)行分類, 結(jié)果顯示在樺木、 橡木和椴木等視覺較為接近的樹種中分類效果均在65%以下; 通過提高空間分辨率對于總體分類精度有一定的提升, 但在光譜與紋理較為接近的地物類別仍然存在難以區(qū)分的現(xiàn)象。 利用機(jī)載高光譜數(shù)據(jù)豐富的光譜及紋理信息構(gòu)造分類特征能夠有效進(jìn)行各種精細(xì)分類[15], 而在獲取高空間分辨率和高光譜分辨率的同時(shí), 隨之而來的“維度災(zāi)難”也會降低模型的效率, 帥爽等[16]以資源一號02D高光譜影像為數(shù)據(jù)源利用廣義正態(tài)分布優(yōu)化算法進(jìn)行特征優(yōu)選, 以RF對干旱植被進(jìn)行分類, 結(jié)果顯示特征較為突出的草地與梭梭林分類精度均在84%以上, 不同年份的枸杞林和楊樹林精度均在75%以下; Tian等[17]以航空高光譜影像為數(shù)據(jù)源, 通過小波變換增強(qiáng)各樹種間的光譜差異, 以RF特征重要選取最優(yōu)特征, 通過SVM進(jìn)行分類, 結(jié)果顯示分類效果有所提高, 但是在針葉樹杉木、 米老排人工林、 馬尾松和黑木相思等光譜差異較小的樹種分類效果依舊不佳。 提高空間分辨率的同時(shí)提高光譜分辨率能夠在一定程度上的區(qū)分不同地物的細(xì)微差別, 但仍然不能滿足精準(zhǔn)農(nóng)業(yè)在農(nóng)作物分類的精度要求。 在同一物種不同品種的分類中, 由于樹冠重疊、 光譜和紋理的特征發(fā)散性較小且信息熵較大等問題, 使用傳統(tǒng)的如主成分分析、 ReliefF、 RFE_svm和粒子群等特征優(yōu)選和分類算法時(shí)難以有效區(qū)分。 因此, 針對高維特征數(shù)據(jù)如何提升特征優(yōu)選結(jié)果是提高果樹精細(xì)分類精度和效率的關(guān)鍵問題[18-19]。 SULOV_XGBoost兼?zhèn)涮卣骱Y選和分類功能, 其在目標(biāo)函數(shù)中加入了L2正則化懲罰項(xiàng), 并對損失函數(shù)進(jìn)行二階的泰勒展開, 使損失函數(shù)更接近目標(biāo)函數(shù), 能夠不斷學(xué)習(xí)特征中的細(xì)微差別, 比其他常用機(jī)器學(xué)習(xí)分類算法(如RF和SVM)在同一物種不同品種的分類表現(xiàn)出更好的性能[20-21]。 目前為止, 尚未發(fā)現(xiàn)有利用該方法對果樹作物進(jìn)行精細(xì)分類的相關(guān)研究, 因此積極嘗試?yán)么朔ㄟM(jìn)行特征差距較小場景的果樹作物精細(xì)分類具有重大意義。
以桂林市六塘默科特柑橘試驗(yàn)基地為研究區(qū), 基于2020年11月獲取的無人機(jī)高光譜影像, 提出了一種SULOV_XGBoost進(jìn)行特征優(yōu)選和柑橘果樹不同品種的精細(xì)分類方法。 通過深度挖掘光譜特征, 融合構(gòu)建更加完善的特征集合實(shí)現(xiàn)精細(xì)分類, 并分析了不同類型特征對柑橘果樹精細(xì)分類的貢獻(xiàn), 進(jìn)一步尋找出適用于特征差異較小場景的優(yōu)勢特征。 所構(gòu)建的精細(xì)分類方法可為柑橘果樹農(nóng)情監(jiān)測、 種植結(jié)構(gòu)布局、 作物估產(chǎn)與精細(xì)化管理等方面提供技術(shù)支撐。
研究區(qū)位于廣西壯族自治區(qū)桂林市臨桂區(qū)六塘鎮(zhèn)(110°17′47″E, 25°2′3″N), 屬中亞熱帶季風(fēng)氣候, 日照較多, 雨量充沛, 年均氣溫19.1 ℃, 年均降雨量1 889 mm, 無霜期302 d。 該地適合默科特、 沃柑、 砂糖橘等果樹的生長。 區(qū)域內(nèi)主要以2014年種植的默科特、 沃柑、 砂糖橘為主, 少量2020年種植的沃柑與默科特, 為了防止柑橘被曬傷, 于當(dāng)年7月份在沿路的沃柑與部分默科特果樹中撒有石灰。 研究區(qū)如圖1所示。
圖1 研究區(qū)地理位置
影像數(shù)據(jù)獲取時(shí)間為2020年11月13日11:00—15:00, 高光譜數(shù)據(jù)采集是晴天、 無云、 風(fēng)速較小。 采用美國Resonon公司研發(fā)的Pika L高光譜成像儀, 光譜范圍在385~1 023 nm之間, 通道數(shù)為150, 分辨率為4 nm。 根據(jù)影像需求, 設(shè)定無人機(jī)飛行高度為110 m, 影像空間分辨率為0.05 m, 航向、 旁向重疊率均為80%, 飛行速度3 m·s-1。 采用Pix4D Mapper軟件和ENVI5.3軟件對無人機(jī)獲取的數(shù)據(jù)進(jìn)行影像拼接和波段融合及預(yù)處理。
在獲取無人機(jī)高光譜影像的同時(shí), 對研究區(qū)進(jìn)行實(shí)地調(diào)查, 獲取每棵樹的樹種及樹齡, 此次調(diào)查共獲取樣本點(diǎn)2 149個(gè)(如表1所示)。 利用便攜式ASD地物光譜儀(FieldSpec 4)采集樣本樹冠層光譜特征, 波長范圍為350~2 500 nm, 數(shù)據(jù)輸出間隔1 nm。 對樣本中的六種果樹每種隨機(jī)選取5棵, 由于垂直角度獲取冠層光譜較為困難, 選擇在果樹冠層水平在0°、 120°、 240°且與天頂角呈45°的三個(gè)方向各采集60條光譜曲線, 對所有方向光譜曲線取平均得到每棵果樹冠層光譜數(shù)據(jù), 以此作為無人機(jī)特征波段選取參考依據(jù)。
表1 各類柑橘樣本
研究區(qū)所識別地物類型劃分為2014年默科特a、 2014年沃柑、 2014年默科特b(石灰)、 2014年砂糖橘、 2020年默科特、 2020年沃柑、 草地、 裸地、 樹木以及陰影區(qū)域共10種。 為了減少無關(guān)要素(草地、 裸地、 樹木和陰影區(qū)域)對后期柑橘果樹精細(xì)分類的影響, 首先使用eCongition9.0軟件進(jìn)行多尺度分割, 設(shè)定分割尺度12, 形狀指數(shù)0.1, 緊湊度指數(shù)0.9, 對于分割的結(jié)果設(shè)定灰度值小于-0.1與改進(jìn)紅邊比值植被指數(shù)mSR705(modified red edge simple ratio index)大于0.31。
基于面向?qū)ο蟮姆诸愃枷? 在影像分割預(yù)處理的基礎(chǔ)上, 首先, 利用樣本的影像光譜、 實(shí)測光譜、 紋理、 幾何和植被指數(shù)等完成多特征集合的構(gòu)建; 然后, 采用SULOV結(jié)合XGBoost遞歸消除算法進(jìn)行特征優(yōu)選實(shí)現(xiàn)特征降維; 并以XGBoost分類算法進(jìn)行柑橘果樹的精細(xì)分類; 最后, 與常用機(jī)器學(xué)習(xí)算法RF和SVM的分類結(jié)果和精度進(jìn)行對比分析。 技術(shù)路線如圖2。
圖2 技術(shù)流程圖
機(jī)載高光譜數(shù)據(jù)具有非常高的光譜分辨率, 不同柑橘果樹間的細(xì)微差別可在光譜響應(yīng)曲線中有所表現(xiàn), 還可以通過對原始光譜求一階微分以進(jìn)一步擴(kuò)大其中的細(xì)微差異, 同時(shí)提取實(shí)測光譜曲線的特征波段, 植被指數(shù)、 紋理及幾何特征等各類信息, 構(gòu)建更加完善的特征集合。
1.4.1 影像光譜特征構(gòu)建
(1)一階微分
考慮到機(jī)載高光譜成像儀的缺陷, 剔除前15個(gè)波段與后5個(gè)波段, 保留第16—145(447~1 000 nm)波段的光譜信息, 以步長為2提取每個(gè)對象的光譜曲線和標(biāo)準(zhǔn)差。
利用一階微分能夠顯著加強(qiáng)植被間的光譜差異。 為深度挖掘不同柑橘果樹品種在影像表現(xiàn)和光譜響應(yīng)曲線中的細(xì)微差別, 通過18次多項(xiàng)式對訓(xùn)練樣本的離散光譜值進(jìn)行擬合, 決定系數(shù)R2為0.997, 擬合函數(shù)如式(1)
(1)
式(1)中:A為函數(shù)系數(shù)矩陣,x波長,b為常數(shù)。
對式(1)求一階微分, 六類柑橘果樹一階微分差異如圖3所示, 2020年沃柑與其他五類柑橘品種的光譜曲線差異較大, 其余五類果樹的一階微分曲線總體趨勢基本相似, 在非波谷或非波峰區(qū)間, 一階微分曲線幾乎重合, 但圖中出現(xiàn)多處波谷與波峰, 且在波峰724和866 nm、 波谷513、 626、 815、 925和992 nm處各類果樹峰值差異顯著, 由于品種與樹齡不一, 各類果樹對應(yīng)的波谷與波峰并非在同一個(gè)波段, 所以提取以每一處一階微分拐點(diǎn)為中心的左右共5個(gè)波段對應(yīng)的值共35個(gè)特征作為分類輸入特征。
圖3 一階微分拐點(diǎn)
圖4 依據(jù)實(shí)測光譜特征提取無人機(jī)影像特征波段
(2) 依據(jù)實(shí)測光譜特征構(gòu)建
為了進(jìn)一步增強(qiáng)光譜信息的差異, 獲取區(qū)分不同品種柑橘果樹的特征波段。 采用ASD便攜式地物光譜儀獲取每類柑橘果樹的光譜曲線作為無人機(jī)特征波段選取的參考。 通過對比ASD光譜數(shù)據(jù), 六類果樹在無人機(jī)影像中的紅邊波段(781 nm)、 近紅波段(911、 982 nm)處及附近波長的光譜響應(yīng)均存在較大差異, 與ASD光譜數(shù)據(jù)較為吻合, 所以選取這三處波長作為特征波段, 并提取552 nm處的反射峰光譜值與676 nm處的吸收峰光譜值共五個(gè)波段作為特征波段, 并計(jì)算影像中每個(gè)對象對應(yīng)的五個(gè)特征波段的比值或差值, 各種組合方式共182個(gè)特征作為分類輸入特征。
1.4.2 植被指數(shù)、 幾何及紋理特征提取
在影像分割的基礎(chǔ)上提取每個(gè)對象的植被指數(shù)、 幾何及紋理信息作為分類特征。 使用ENVI5.3計(jì)算研究區(qū)內(nèi)23種植被指數(shù); 幾何特征以對象像素的空間分布統(tǒng)計(jì)為理論基礎(chǔ), 基于像素坐標(biāo)的協(xié)方差矩陣提取對象的形狀、 面積和多邊形的各類特征[22]; 紋理特征以灰度共生矩陣(gray-level co-occurrence matrix, GLCM)第一主成分為底圖[23], 分別提取所有方向的8個(gè)紋理特征(協(xié)同性、 反差性、 非相似性、 均值、 方差、 角二階矩、 相關(guān)性、 熵), 共計(jì)55種作為分類輸入特征。
剔除無效特征后, 通過以上各類光譜與紋理、 幾何和植被指數(shù)等特征信息的提取構(gòu)建了包含384個(gè)特征的特征集合。
特征豐富容易提取出區(qū)分不同果樹類別的特征信息, 但特征過多易降低分類器性能, 造成模型精度和效率降低[24-25]。 多特征優(yōu)選可最大程度降低特征維數(shù), 使分類器具有較好的泛化能力。 采用SULOV算法篩選出特征和目標(biāo)相關(guān)性強(qiáng)、 特征之間冗余小且類間可分性強(qiáng)的特征, 結(jié)合XGBoost遞歸消除算法進(jìn)一步優(yōu)選權(quán)值最高的特征, 以此輸入XGBoost分類算法實(shí)現(xiàn)柑橘果樹的精細(xì)分類。
1.5.1 SULOV特征篩選算法
SULOV算法是類間相關(guān)性分析和變量與目標(biāo)間相關(guān)性分析的結(jié)合, 能夠有效減少特征篩選的計(jì)算量, 提高計(jì)算速率, 其核心思想是搜索不相關(guān)的變量列表, 算法核心步驟如下:
(1)找到特征變量中所有pearson系數(shù)超過相關(guān)閾值的高度相關(guān)變量對;
(2)計(jì)算特征變量關(guān)于目標(biāo)變量的互信息得分(mutual information score, MIS), 得到每個(gè)特征變量關(guān)于目標(biāo)變量的一個(gè)分?jǐn)?shù)。 MIS作為一種非參數(shù)評分方法, 是度量一個(gè)隨機(jī)變量中包含的關(guān)于另一個(gè)隨機(jī)變量的信息量的統(tǒng)計(jì)方法。 離散隨機(jī)變量X和Y的互信息I(X,Y)計(jì)算公式如式(2)
(2)
(3)取每一對超過閾值的相關(guān)變量對, 在二者中去除MIS較低的一個(gè)特征;
(4)提取MIS最高、 互相關(guān)性最低的特征。
SULOV算法通過python3.7版本編程實(shí)現(xiàn)。 對包含384個(gè)特征的集合進(jìn)行篩選, 設(shè)置相關(guān)性閾值為0.9, 共篩選出84個(gè)重要特征。 篩選結(jié)果如圖5所示。
圖5 SULOV算法特征篩選
1.5.2 XGBoost特征優(yōu)選與分類算法
XGBoost是陳天奇[26]基于梯度提升樹(gradient boosting decision tree, GBDT)改進(jìn)的一種boosting集成算法。 首先建立一棵樹, 每次迭代過程中都增加一棵CRAT決策樹, 通過不斷擬合上一棵樹的殘差建立新的樹, 逐漸形成眾多樹模型集成的強(qiáng)評估器, 最后將每棵樹對應(yīng)的分?jǐn)?shù)加起來得到該樣本的預(yù)測值見式(3)。
(3)
Blue circles represent the data selected by SULOV; The size of circle indicates the MIS score; The bigger the circle, the higher the MIS score
在XGBoost中, 單個(gè)決策樹中通過每個(gè)屬性分裂點(diǎn)改進(jìn)性能度量(Gini純度)的量來計(jì)算特征屬性重要性。 由節(jié)點(diǎn)負(fù)責(zé)加權(quán)和記錄次數(shù), 一個(gè)特征屬性對分裂點(diǎn)改進(jìn)性能度量越大即越靠近根節(jié)點(diǎn), 權(quán)值越大; 被越多提升樹所選擇, 特征屬性越重要。 基于這一特性可進(jìn)行多特征優(yōu)選。
通過SULOV算法篩選的84個(gè)特征極大地降低了特征間的冗余, 但未考慮該特征對目標(biāo)變量的貢獻(xiàn)度, 為提高模型運(yùn)行效率及可解釋性, 將該84個(gè)重要特征輸入XGBoost分類算法中, 每次迭代隨機(jī)挑選65%的總特征個(gè)數(shù), 提取每次訓(xùn)練中重要性得分最高的前10個(gè)特征, 并刪除重要性得分最低的5個(gè)。 隨著模型訓(xùn)練迭代次數(shù)增加, 在迭代7次后特征數(shù)量為40, 調(diào)整XGBoost列采樣參數(shù)colsample_bytree為1, 選取重要性得分大于0.02的特征18個(gè), 將其作為精細(xì)分類最終的輸入特征。
最后, 使用XGBoost算法分類器進(jìn)行柑橘果樹的精細(xì)分類, 并基于泛化誤差[27]的評價(jià)指標(biāo)確定模型參數(shù), 得出樹的最大深度(max_depth)為4, 樹的棵數(shù)(n_estimators)為580, 學(xué)習(xí)率(learning_rate)為0.049, gamma為0.2。
以用戶精度(UA)、 生產(chǎn)者精度(PA)、 Micro-F1得分和總體精度(OA)為評價(jià)指標(biāo), 其中Micro-F1得分則是對不同情況下UA與PA的約束, 本試驗(yàn)采用約束因子為1, 即UA與PA同等重要, OA為分類正確的樣本個(gè)數(shù)占所有樣本個(gè)數(shù)的比例。 具體計(jì)算公式參見文獻(xiàn)[28]。
為探究SULOV_XGBoost算法在同一物種不同品種間特征優(yōu)選及精細(xì)分類算法的有效性, 以廣泛使用的過濾式的ReliefF算法和包裹式的RFE結(jié)合svm的特征優(yōu)選方法進(jìn)行實(shí)驗(yàn)對比。 通過ReliefF和RFE_svm算法對包含384個(gè)特征集合進(jìn)行特征優(yōu)選, 首先篩選皮爾森相關(guān)性系數(shù)小于0.9的特征集合以初步剔除冗余度較高的特征, 然后設(shè)置ReliefF特征權(quán)重值大于0.02, 共優(yōu)選出33個(gè)重要特征; 同樣在剔除冗余度較高特征的基礎(chǔ)上, 選取RFE_svm最優(yōu)特征集合31個(gè)。
基于三種特征優(yōu)選結(jié)果基礎(chǔ)上采用RF[12]和SVM[29]與本方法作對比驗(yàn)證。 對RF設(shè)置樹的最大深度(max_depth)為9, 樹的棵數(shù)(n_estimators)為1 340; 對SVM采用徑向基核函數(shù)(RBF), 參數(shù)gamma為0.1, 懲罰系數(shù)C為1。
基于同一實(shí)地采樣數(shù)據(jù)的訓(xùn)練樣本和測試樣本, 分別以三種特征優(yōu)選的18種(SULOV_XGBoost)、 33種(ReliefF)和31種(RFE_svm)重要特征作為精細(xì)分類模型的輸入特征, 使用XGBoost[圖6(a, d, g)]、 RF[圖6(b, e, h)]和SVM[圖6(c, f, i)]算法進(jìn)行柑橘果樹精細(xì)分類, 并對其分類結(jié)果(圖6)和精度(表2)進(jìn)行對比分析。
表2 六類柑橘果樹分類精度
由表2可知, 從不同特征優(yōu)選算法來看, 基于SULOV_XGBoost特征優(yōu)選的三種分類算法的OA和F1最佳, 均在90%以上, 表明了結(jié)合SULOV_XGBoost的特征優(yōu)選算法, 對于柑橘果樹精細(xì)分類中特征提取的巨大優(yōu)勢。 20默科特的PA與UA最高精度是基于RFE_svm的SVM算法, 其余5類果樹的最高精度均是以SULOV_XGBoost作為特征優(yōu)選算法。 基于SULOV_XGBoost特征優(yōu)選的XGBoost分類算法的總體精度OA較ReliefF、 RFE_svm分別提高了1.02%、 2.25%, 較同特征優(yōu)選算法的RF分別提高了2.04%、 1.89%, SVM分別提高了2.03%、 0.34%。 體現(xiàn)本SULOV_XGBoost算法作為柑橘果樹特征提取的有效性, 即使存在外物干擾的情況下, 該特征優(yōu)選算法依然能夠發(fā)揮其優(yōu)越性。
從以SULOV_XGBoost作為特征優(yōu)選的不同分類算法的角度看, XGBoost算法的總體精度OA和FI得分度均高于RF與SVM, OA分別提高了1.89%和1.6%, F1得分提高了0.99%和0.6%。 而SVM總體精度OA較RF提高0.29%, F1得分提高0.39%。 從視覺上與光譜曲線中表現(xiàn)極為相似的14砂糖橘和14默科特a的精度結(jié)果來看, XGBoost分類精度最高, 顯著地提高了PA和UA, 驗(yàn)證了XGBoost算法對于對象差異不顯著的地物有較強(qiáng)的區(qū)分能力; 從20默科特的結(jié)果來看, RF分類精度最高; 從20沃柑、 14沃柑和14默科特b的結(jié)果來看, SVM的分類精度最高, 這三類果樹在影像表現(xiàn)具有較高辨識度, 其中沃柑樹的葉子較大、 亮度較高, 在光譜上差異顯著, 且由于白灰影響了部分14沃柑和14默科特b的光譜響應(yīng), 對樣本數(shù)據(jù)添加的干擾, 說明了SVM分類算法的抗干擾能力較強(qiáng)。 綜上, SVM分類算法對于差異顯著的地物類別區(qū)分度高且抗干擾能力強(qiáng); 在無外界干擾的同一樹齡情況下, 相較于RF和SVM, 基于不斷擬合殘差算法的XGBoost在同物種不同品種間的分類效果更優(yōu)。
從目視評估(圖6)來看, 基于SULOV_XGBoost特征優(yōu)選的20默科特和20沃柑的分類結(jié)果顯著較優(yōu), 且在六類不同果樹中, 其分類效果亦為最優(yōu), 在樹齡較小時(shí)期, 沃柑長勢相較于默科特好, 兩者可區(qū)分度高。 在部分撒有白灰的14沃柑與14默科特b的分類結(jié)果中, 基于SULOV_XGBoost特征優(yōu)選的三種分類算法錯(cuò)分現(xiàn)象相對較低, 其中SVM的分類效果最佳, 體現(xiàn)以超平面分割數(shù)據(jù)集尋找最佳分割點(diǎn)的原理抗干擾能力較強(qiáng)。 在影像表現(xiàn)與光譜曲線較為相似的14砂糖橘與14默科特a分類結(jié)果中, 不同特征優(yōu)選的XGBoost的分類效果均為最佳, 對于差異不顯著的情況下, 基于擬合殘差的分類模型能夠更好的學(xué)習(xí)兩者間的細(xì)微差別, 以此達(dá)到同一物種不同品種間精細(xì)分類的目的。
2.2.1 特征重要性評估
基于特征優(yōu)選的18個(gè)重要特征作為分類輸入特征進(jìn)行特征重要性評估, 特征權(quán)重值計(jì)算如圖7所示。
圖7 18個(gè)重要特征排序
由圖7可知, 最終優(yōu)選的18個(gè)重要特征中, 紋理特征、 形狀特征與標(biāo)準(zhǔn)差特征均未入選, 在傳統(tǒng)的面向?qū)ο筮b感分類中, 樣本的紋理特征與形狀特征權(quán)重占比較大, 但在柑橘果樹的精細(xì)分類中作用較小, 同一樹齡中每個(gè)樣本的紋理信息與標(biāo)準(zhǔn)差較為接近, 不能有效區(qū)分地物類別。 而光譜波段信息、 一階微分、 植被指數(shù)和特征波段比值或差值組合占比較大, 突出光譜信息在柑橘果樹的精細(xì)分類中的重要性極高, 且一階微分的拐點(diǎn)特征中有9個(gè)特征入選, 表明一階微分拐點(diǎn)值在光譜細(xì)微變化中可以明顯體現(xiàn)其中差異性。
第34波段對應(yīng)的一階微分拐點(diǎn)值的權(quán)值高達(dá)0.133排名第一, 由于研究區(qū)中六類果樹之間的樹齡和樹葉顏色不一, 所以在綠光波長的第34波段的一階微分與藍(lán)光波長的第16波段的原始光譜值可以突出表現(xiàn)出來。 由原始波段信息經(jīng)過差值或比值衍生的光譜特征596、 581、 516和550均入選重要特征, 且596與516分別排第七與第四, 說明尋找適用于柑橘果樹分類的特征波段在果樹精細(xì)分類中的必要性。 每類果樹間存在營養(yǎng)成分與三維結(jié)構(gòu)的差異引起其在光譜響應(yīng)中的異同, 而改正了葉片的鏡面反射效應(yīng)的紅邊比值植被指數(shù)與類胡蘿卜素指數(shù)均可體現(xiàn)出來。
d() represents the inflection point of the first derivative of each band; 550, 516, 581 and 596 represent the band combination methods of (b5-b2)/b4, b5/b1, (b3-b1)/b2, (b5-b1)/(b4-b2), respectively, where b1, b2, b3, b4 and b5 represent wavelengths of 553, 673, 762, 926 and 975 nm, respectively; 38 and 16 represent the spectral values at 538 and 447 nm of the initial spectrum respectively; Bri represents brightness; Mean3 and Mean12 represent the modified red-edge ratio vegetation index mSR705and the like-carotenoid reflectance index CRI2
2.2.2 特征重要性實(shí)驗(yàn)對比
為探究不同類型特征對精細(xì)分類做出的貢獻(xiàn)大小, 本試驗(yàn)基于高光譜的單一種類特征(3個(gè)光譜波段FC1、 2個(gè)植被指數(shù)FC2、 9個(gè)一階微分拐點(diǎn)FC3、 4個(gè)特征波段組合FC4)與融合特征(光譜波段+一階微分FC5、 植被指數(shù)+特征波段組合FC6)采用XGBoost算法分別進(jìn)行精細(xì)分類, 得出結(jié)果見圖8。 各類特征分類精度見表3。
表3 基于XGBoost算法的各類特征分類精度對比
圖8 基于XGBoost算法的各類特征分類結(jié)果
由表3可知, 單一特征中一階微分拐點(diǎn)與特征波段組合的OA均在75%以上, 其中一階微分拐點(diǎn)FC3圖8(c)的OA最高, 達(dá)到79.62%, 其次是特征波段組合FC4圖8(d)為75.84%; 基于兩種植被指數(shù)FC2的分類精度圖8(b)為66.81%, 高于基于原始波段FC1圖8(a)的66.38%。 從難以區(qū)分的14砂糖橘和14默科特a精度分析, FC4的PA最高, 分別為79.39%、 62.09%, 較FC3提高了1.78%、 1.68%, 而FC4的OA為75.84%較FC3降低了3.78%, 從二者區(qū)分度而言, 特征波段組合對于14砂糖橘和14默科特a區(qū)分貢獻(xiàn)度更大, 但整體而言, 一階微分效果更佳。
而融合光譜波段與一階微分拐點(diǎn)FC5圖8(e)的OA為88.65%, F1得分89.65%, 其中各類柑橘PA與UA均為最高, 較融合了植被指數(shù)與特征波段組合FC6圖8(f)OA分別提高了9.74%、 9.33%。 從14砂糖橘與14默科特a來看, FC5的PA與UA最高, 而添加了植被指數(shù)FC6的OA較FC4卻有所降低, 反映模型在中間特征提取不夠的情況下, 模型性能有所下降。 FC5的分類精度較融合了所有重要特征集合僅低3.49%, 說明了經(jīng)過一階微分變換的光譜曲線增強(qiáng)了果樹間細(xì)微的差別, 從而達(dá)到精細(xì)區(qū)分各類果樹的目的。
基于桂林市六塘默科特柑橘試驗(yàn)基地的無人機(jī)高光譜影像, 通過構(gòu)建融合影像光譜、 實(shí)測光譜、 植被指數(shù)、 紋理和幾何等信息的特征集合, 提出了一種利用SULOV_XGBoost算法進(jìn)行柑橘果樹不同品種精細(xì)分類的模型, 并與常用機(jī)器學(xué)習(xí)方法(RF和SVM)的分類結(jié)果進(jìn)行了對比分析。 主要結(jié)論如下:
(1)本文所提的SULOV_XGBoost柑橘果樹精細(xì)分類算法能夠有效進(jìn)行特征差距較小場景的果樹作物不同品種間的精細(xì)分類, 綜合比較總體分類精度OA與F1得分, 驗(yàn)證了該算法整體分類效果優(yōu)于傳統(tǒng)的常用機(jī)器學(xué)習(xí)方法。
(2)一階微分拐點(diǎn)處值與原始波段值的融合特征對精細(xì)分類具有極大作用, 傳統(tǒng)分類中常用的紋理、 幾何及標(biāo)準(zhǔn)差等特征未能有效區(qū)分差距細(xì)微的不同品種柑橘果樹; 改進(jìn)紅邊比值植被指數(shù)(mSR705)、 類胡蘿卜素反射指數(shù)(CRI2)與特征波段組合能夠顯著提高柑橘果樹精細(xì)分類結(jié)果。
(3)對比驗(yàn)證實(shí)驗(yàn)過程中發(fā)現(xiàn): 由于白灰影響了部分14沃柑和14默科特b的光譜響應(yīng), 對樣本數(shù)據(jù)添加的干擾, 驗(yàn)證了SVM分類算法的抗干擾能力較強(qiáng)。
本研究基于對象的分類方法提取果樹樹冠, 由于部分樹冠重疊和部分樹冠白灰對分類精度結(jié)果仍存在一定影響, 實(shí)驗(yàn)過程中反映出SVM算法在白灰果樹中的分類效果最佳。 下一步計(jì)劃將本方法與SVM算法進(jìn)行模型融合, 綜合兩種算法的優(yōu)勢進(jìn)一步提升柑橘果樹精細(xì)分類模型的性能和精細(xì)分類精度。