于慧伶,孫繩宇,朱伊楓,李羽昕,李新立
(東北林業(yè)大學(xué)a.信息與計(jì)算機(jī)工程學(xué)院;b.機(jī)電工程學(xué)院,哈爾濱 150040)
森林生物量是森林生態(tài)系統(tǒng)林分特征信息的重要體現(xiàn),與森林生物多樣性、蓄積量和碳儲(chǔ)量等屬性有著很強(qiáng)的相關(guān)性[1]。每木檢尺的單木森林調(diào)查是量化森林特征的主要途徑,通過(guò)測(cè)量單木胸徑和樹(shù)高并將其作為自變量建立相應(yīng)的異速方程獲得森林地上生物量,雖然這種野外測(cè)量方法準(zhǔn)確,但耗時(shí)費(fèi)力[2]。遙感作為有效的技術(shù)手段,解決了大區(qū)域林分特征定量估算問(wèn)題,減少了人力與時(shí)間耗費(fèi),在較高精度下保證獲得數(shù)據(jù)的空間完整性和時(shí)間一致性。激光雷達(dá)(Light Detection and Ranging,LiDAR)是一種新興的遙感技術(shù)手段,是通過(guò)測(cè)算傳感器到達(dá)目標(biāo)物之間的時(shí)間進(jìn)行距離換算的一種主動(dòng)遙感技術(shù),憑借其獲取植被垂直結(jié)構(gòu)信息的優(yōu)勢(shì)成功應(yīng)用于林業(yè)領(lǐng)域[3]。
近年來(lái),一些學(xué)者將非參數(shù)化機(jī)器學(xué)習(xí)算法應(yīng)用于森林生物量遙感估算研究中[4-6]。其中,支持向量機(jī)(Support Vector Machine,SVM)能夠極大地降低計(jì)算復(fù)雜性、加快求解速度,對(duì)于解決復(fù)雜的回歸問(wèn)題具有較好的預(yù)測(cè)性能[7]。董金金[8]應(yīng)用實(shí)測(cè)地上生物量和Landsat-8遙感數(shù)據(jù),對(duì)泰山景區(qū)的森林地上生物量進(jìn)行估測(cè),表明粒子群優(yōu)化算法(Particle Swarm Optimization,PSO),優(yōu)化SVM的估測(cè)性能最好。
果蠅優(yōu)化算法(Fruit Fly Optimization Algorithm,F(xiàn)OA)是一個(gè)較新的群智能優(yōu)化算法,其靈感來(lái)自真實(shí)果蠅的嗅覺(jué)與視覺(jué)覓食行為[9-10]。FOA以強(qiáng)大的全局尋優(yōu)能力,較小的計(jì)算量等優(yōu)點(diǎn)逐漸體現(xiàn)在各領(lǐng)域中。選取全局搜索能力強(qiáng)、計(jì)算效率高的FOA優(yōu)化最小二乘支持向量機(jī)(Least Squares Support Vector Machine,LSSVM)的懲罰因子和核函數(shù)參數(shù),以提升模型精度和計(jì)算效率,并將優(yōu)化模型應(yīng)用于森林地上生物量估測(cè),以提高估測(cè)模型的速度、穩(wěn)定性,提升機(jī)載LiDAR數(shù)據(jù)估測(cè)森林地上生物量的精度[11-13]。
LiDAR數(shù)據(jù)是2016年由某森林和森林、土地、自然資源運(yùn)營(yíng)和農(nóng)村發(fā)展部的海達(dá)瓜依區(qū)辦公室共同獲得。利用人工交互的方式進(jìn)行數(shù)據(jù)處理,借助點(diǎn)云處理軟件Terrasolid,通過(guò)搜索局部高程異常點(diǎn)去除LiDAR數(shù)據(jù)的噪點(diǎn),采用不規(guī)則三角網(wǎng)(Triangulated Irregular Network,TIN)濾波算法對(duì)離散點(diǎn)云數(shù)據(jù)進(jìn)行濾波分類,由數(shù)字表面模型(Digital Surface Model,DSM)與數(shù)字高程模型(Digital Elevation Model,DEM)柵格差值運(yùn)算,得到研究區(qū)域高程歸一化后的冠層高度模型(Canopy Height Model,CHM),通過(guò)坐標(biāo)對(duì)每塊樣地進(jìn)行裁切提取了84個(gè)樣地位置的歸一化點(diǎn)云數(shù)據(jù)[14-16]。
2015年某完成植被資源清查項(xiàng)目(Vegetation Resource Inventory,VRI),覆蓋海達(dá)瓜依的全部范圍,約106ha,其中有35塊永久監(jiān)測(cè)樣地(YSM),3塊變化監(jiān)測(cè)樣地(CMI)和46塊VRI樣地。在了解實(shí)際樣地級(jí)林分參數(shù)的基礎(chǔ)上,將VRI、YSM和CMI 3種樣地類型的共計(jì)84塊樣地?cái)?shù)據(jù)經(jīng)異常值去除以及林種分類等分析,采用其中62塊樣地作為構(gòu)建地上生物量模型的地面數(shù)據(jù)??紤]到樣地?cái)?shù)量的有限性,將樣地林型分為3種:崖柏型(C型24塊),鐵杉型(H型24塊)和云杉型(S型14塊)。匯總得到3個(gè)研究區(qū)域樣地級(jí)(plot-level)林分參數(shù)包括胸高斷面積Basal area(m2/ha),樹(shù)高Tree height /m(胸高斷面積加權(quán)高)和蓄積量Volume(m3/ha)。樣地級(jí)林分參數(shù)統(tǒng)計(jì)表見(jiàn)表1。
表1 樣地林分參數(shù)統(tǒng)計(jì)表
針對(duì)研究區(qū)域中的62塊樣地,采用森林植被蓄積量-生物量的轉(zhuǎn)化方法進(jìn)行地上生物量計(jì)算,并以此作為樣地森林生物量地面調(diào)查數(shù)據(jù)。
果蠅利用嗅覺(jué)聞到食物味道,而食物味道濃度與每個(gè)果蠅相對(duì)食物的距離呈負(fù)相關(guān)。飛近食物位置之后,利用敏銳的視覺(jué)找到同伴聚集和食物的位置,再靠近目標(biāo)。通過(guò)數(shù)次迭代探索,直至在搜索空間中找到食物對(duì)應(yīng)的位置為止。在此通過(guò)反向?qū)W習(xí)的群體初始化操作以及三維搜索與自適應(yīng)更新步長(zhǎng)策略,提高算法尋優(yōu)能力與收斂精度。對(duì)果蠅優(yōu)化算法改進(jìn)如下:
將FOA的搜索空間由二維平面擴(kuò)展到三維空間(X_axis,Y_axis,Z_axis),果蠅種群與原點(diǎn)的距離為:
式中:i為迭代次數(shù);R(i)為第i次搜索步長(zhǎng)。
在果蠅算法尋優(yōu)的過(guò)程中,果蠅群體總會(huì)向當(dāng)前迭代中具有最佳濃度(bestSmell)的果蠅個(gè)體靠攏聚集。如果,此果蠅個(gè)體并不具有全局的最優(yōu)位置,那么每次選定的最優(yōu)個(gè)體很容易帶來(lái)局部尋優(yōu)的缺陷。引入分散化尋優(yōu)機(jī)制更新果蠅群體的位置,基于反向?qū)W習(xí)策略啟發(fā)增加對(duì)每次迭代中具有最差濃度(worstSmell)果蠅個(gè)體的學(xué)習(xí),意味著在決定下一次迭代群體初始位置時(shí),應(yīng)綜合考慮當(dāng)前迭代中最佳果蠅個(gè)體與最差果蠅個(gè)體的位置
式中,bestSmell和bestindex分別為當(dāng)前迭代中濃度最佳果蠅個(gè)體的味道濃度和序號(hào)。
將下一次迭代群體初始位置設(shè)定為最差果蠅個(gè)體關(guān)于當(dāng)前群體位置的中心對(duì)稱坐標(biāo)與最優(yōu)果蠅個(gè)體位置的中點(diǎn)
將該坐標(biāo)作為下次迭代果蠅群體位置,實(shí)現(xiàn)基于反向?qū)W習(xí)的群體位置初始化。
利用自適應(yīng)更新步長(zhǎng)策略,步長(zhǎng)取值為果蠅個(gè)體的飛行方向距離由當(dāng)前迭代的最佳味道濃度值與上次迭代的最佳味道濃度值的比值決定,k(i)為權(quán)重因子。
當(dāng)i>1時(shí),果蠅的搜索步長(zhǎng)定義如下:
權(quán)重因子的取值由上一次的果蠅最佳味道濃度與當(dāng)前迭代的果蠅最佳味道濃度決定:
當(dāng)Smell′(i)< Smell′(i-1)時(shí),有
當(dāng)目前迭代的最佳味道濃度值優(yōu)于上一次迭代的最佳味道濃度時(shí),k(i)<1。
當(dāng)Smell′(i)≥Smell′(i-1)時(shí),有
即上一次迭代的最佳味道濃度值優(yōu)于目前迭代的最佳味道濃度,權(quán)重因子k(i)>1。為提高果蠅優(yōu)化算法的全局搜索能力,應(yīng)該通過(guò)增加下一次迭代搜索步長(zhǎng)來(lái)擴(kuò)大尋優(yōu)范圍,提高全局搜索能力。由式(10)可知,當(dāng)Smell′(i-1)與Smell′(i)的差值較小時(shí),意味著當(dāng)前搜索范圍內(nèi)此次迭代尋優(yōu)的最佳味道濃度值劣于上一次迭代的最佳味道濃度,當(dāng)前搜索范圍的尋優(yōu)效果一般,應(yīng)使搜索步長(zhǎng)R(i+1)以較快速度增加來(lái)更新搜索區(qū)域繼續(xù)尋找搜索空間最優(yōu)解;反之,當(dāng)Smell′(i-1)與Smell′(i)的差值較大時(shí),意味著果蠅群體已經(jīng)通過(guò)快速增大的步長(zhǎng)到達(dá)更新的搜索范圍,由于當(dāng)代尋優(yōu)結(jié)果仍差強(qiáng)人意,應(yīng)該讓搜索步長(zhǎng)R(i+1)增加較慢,來(lái)繼續(xù)擴(kuò)大尋優(yōu)范圍。
LSSVM模型中的可調(diào)節(jié)參數(shù)(懲罰因子γ和核函數(shù)參數(shù)σ)的選取對(duì)模型的學(xué)習(xí)性能有很大的影響,采用改進(jìn)的IFOA對(duì)LSSVM的兩個(gè)參數(shù)進(jìn)行優(yōu)化。
設(shè)置算法最大迭代次數(shù)(maxgen),種群規(guī)模(sizepop),隨機(jī)初始化果蠅群體的初始位置(X_axis,Y_axis,Z_axis),初始化果蠅個(gè)體的搜索步長(zhǎng)R(1)=3。將改進(jìn)果蠅算法應(yīng)用到優(yōu)化最小二乘支持向量機(jī)兩個(gè)參數(shù)(σ,γ)的具體算法流程圖如下:
圖1 IFOA-LSSVM算法流程圖
對(duì)于不同的機(jī)載激光掃描(Airborne Laser Scanning,ALS)系統(tǒng)的構(gòu)造和飛行高度,在大多數(shù)情況下植被冠層的第1回波更趨于穩(wěn)定,采用第1回波來(lái)提取森林參數(shù)。為排除灌木等低矮植被點(diǎn)的干擾,對(duì)高程歸一化后的激光雷達(dá)數(shù)據(jù)進(jìn)行變量提取時(shí),只提取高于2 m的植被點(diǎn)。選取以下LiDAR特征因子作為備選變量:最大高度(max)、最小高度(min)、平均高度(avg)、高度標(biāo)準(zhǔn)差(std)、高度偏斜度(ske)、高度峰度(kur)、高度絕對(duì)標(biāo)準(zhǔn)差(qav);點(diǎn)云百分位高度變量:p10、p20、p30、p40、p50、p60、p70、p80、p90、p95、p99;冠層返回點(diǎn)密度變量:b10、b20、b30、b40、b50、b60、b70、b80、b90、b95、b99;返回點(diǎn)數(shù)變量:c00、c01、c02、c03、c04、c05;返回點(diǎn)密度變量:d00、d01、d02、d03、d04、d05和冠層覆蓋度變量(cov)共41個(gè)變量。
以百分位高度p50,冠層覆蓋度變量cov為例,圖2為點(diǎn)云處理軟件TerraSolid中提取相關(guān)LiDAR變量三維示意圖。
圖2 提取百分位高度p50與冠層覆蓋度變量cov三維示意圖
為更好地?cái)M合地上生物量與LiDAR特征變量的關(guān)系,提高模型的估測(cè)精度,分析每個(gè)LiDAR變量與樣地生物量的Pearson相關(guān)系數(shù)和顯著性水平;考慮特征變量間的共線性來(lái)選取與生物量相關(guān)性較高(p≤0.05)且獨(dú)立性好的特征變量;利用主成分分析法對(duì)選取的特征變量進(jìn)行降維,去除冗余變量防止過(guò)擬合。
分別計(jì)算崖柏型(C型)、鐵杉型(H型)、云杉型(S型)和不分類(即不區(qū)分樣地林種N型)4種類型的Pearson相關(guān)系數(shù),分析結(jié)果如圖3所示。
圖3 不同林種類型點(diǎn)云特征變量與地上生物量的Pearson相關(guān)系數(shù)分析
由Pearson相關(guān)系數(shù)分析結(jié)果可知,平均高度(avg)、點(diǎn)云高度絕對(duì)標(biāo)準(zhǔn)差(qav)、百分位高度(p10~p99)及返回點(diǎn)云密度(d00,d02,d03)與生物量之間的相關(guān)性較高;各林型與不區(qū)分林種類型時(shí),各LiDAR變量與相應(yīng)樣地地上生物量之間的相關(guān)性大小大體趨于相同,為得到區(qū)別于不同林種的LiDAR特征變量還需要進(jìn)行相關(guān)性的顯著性檢驗(yàn)。
實(shí)驗(yàn)采用改進(jìn)的FOA分別對(duì)LSSVM的參數(shù)(σ,γ)尋優(yōu),將各林型的點(diǎn)云特征變量經(jīng)主成分分析后的主成分得分和森林地面生物量實(shí)測(cè)值作為估測(cè)模型作為實(shí)驗(yàn)數(shù)據(jù),2/3的數(shù)據(jù)用來(lái)訓(xùn)練,1/3的數(shù)據(jù)作為測(cè)試。采用留一法交叉驗(yàn)證對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行交叉驗(yàn)證。
通過(guò)FOA算法對(duì)(σ,γ)兩個(gè)參數(shù)進(jìn)行尋優(yōu),尋優(yōu)目標(biāo)為使?jié)舛扰卸ê瘮?shù)Smell(i)達(dá)到最小。果蠅種群規(guī)模為20,迭代次數(shù)為100,初始步長(zhǎng)設(shè)置為3,σ的尋優(yōu)范圍為[0,100],γ 的尋優(yōu)范圍為[0,200]。以未分類型樣地的迭代尋優(yōu)過(guò)程為例,迭代20步RMSE收斂,收斂最終值RMSE=0.012 5;經(jīng)IFOA尋優(yōu)計(jì)算后的未分類型森林地面生物量估測(cè)模型中:σ=2.393 0,γ =27.889 9。
圖4為FOA-LSSVM模型與IFOA-LSSVM模型的訓(xùn)練收斂圖,可以看出IFOA-LSSVM模型的收斂速度更快且曲線梯度更高,圖5為2種模型對(duì)測(cè)試集數(shù)據(jù)集的生物量估測(cè)結(jié)果與真實(shí)值的對(duì)比,可以看出IFOA-LSSVM模型的估測(cè)值更加接近真實(shí)值,達(dá)到了更好的估測(cè)準(zhǔn)確率。
圖4 FOA-LSSVM與IFOA-LSSVM訓(xùn)練收斂過(guò)程對(duì)比
圖5 FOA-LSSVM與IFOA-LSSVM估測(cè)結(jié)果與真實(shí)值對(duì)比圖(未分類)
為了驗(yàn)證IFOA-LSSVM模型的泛化能力和尋優(yōu)精度,利用所建模型與測(cè)試數(shù)據(jù)集對(duì)崖柏型(C型)、鐵杉型(H型)、云杉型(S型)和不分類(N型)4種類型的樣地的森林地面生物量進(jìn)行估測(cè),并將該模型的估測(cè)結(jié)果與FOA-LSSVM、GS-LSSVM、PSO-LSSVM 的估測(cè)結(jié)果進(jìn)行比較。采用均方根誤差(RMSE),平方相關(guān)系數(shù)(R2),作為評(píng)價(jià)指標(biāo),對(duì)比如表2所示。
表2 不同優(yōu)化算法的LSSVM模型尋優(yōu)參數(shù)和性能對(duì)比
對(duì)于未分類林型的森林地面生物量模型,IFOALSSVM模型估測(cè)生物量的均方根誤差值(RMSE)由FOA-LSSVM 的86.708 9 t/ha 下降到67.219 5 t/ha,誤差降低了28.99%。另外IFOA-LSSVM模型估測(cè)未分類林型生物量的值與實(shí)測(cè)值的相關(guān)系數(shù)(R2)由80.51%提升到89.44%,可見(jiàn)IFOA-LSSVM 模型的估測(cè)誤差更小擬合程度更好。對(duì)崖柏型、鐵杉型、云杉型,IFOA-LSSVM模型估測(cè)生物量的RMSE值分別由79.129 5、77.164 2、60.397 7 t/ha 下降到55.278 7、63.696 7、36.081 3 t/ha,誤差依次降低了30.14%、17.45%、40.26%;而且估測(cè)值與實(shí)測(cè)值的相關(guān)系數(shù)R2由93.99%、88.68%、84.06% 提升到96.68%、93.71%、91.28%。可見(jiàn)IFOA-LSSVM 模型對(duì)已分類的3種林型的生物量估測(cè)誤差和擬合程度均優(yōu)于GSLSSVM、PSO-LSSVM、FOA-LSSVM。綜上可以得出IFOA-LSSVM估測(cè)模型的泛化能力更強(qiáng)、收斂速度更快、尋優(yōu)精度更高。
本文以地面樣地獲取的林分特征為自變量,選用森林植被蓄積量-生物量轉(zhuǎn)化方法計(jì)算各林型樣地地上生物量。針對(duì)FOA容易陷入局部最優(yōu)的問(wèn)題,提出了一種改進(jìn)的FOA,將群體搜索范圍由二維擴(kuò)展到三維,并引入了基于反向?qū)W習(xí)的群體位置初始化操作,結(jié)合自適應(yīng)更新步長(zhǎng)的方法,提高了算法尋優(yōu)精度與速度。采用改進(jìn)的果蠅算法優(yōu)化最小二乘支持向量機(jī)的懲罰因子和核函數(shù)參數(shù),構(gòu)建了基于IFOA-LSSVM的森林生物量估測(cè)模型,實(shí)驗(yàn)表明在實(shí)驗(yàn)條件相同的情況下,IFOA-LSSVM估測(cè)模型具有泛化能力強(qiáng)、收斂速度快、尋優(yōu)精度高的特點(diǎn),適合于對(duì)研究區(qū)域各林型樣地森林地上生物量的估測(cè)。