趙穎慧,郭新龍,甄 貞*
(1. 東北林業(yè)大學(xué)林學(xué)院,黑龍江 哈爾濱 150040;2. 東北林業(yè)大學(xué)森林生態(tài)系統(tǒng)可持續(xù)經(jīng)營(yíng)教育部重點(diǎn)實(shí)驗(yàn)室,黑龍江 哈爾濱 150040)
森林是重要的陸地生態(tài)系統(tǒng),也是地球資源中最為重要的自然資源之一。近年來(lái),陸地植被生物量的監(jiān)測(cè)已成為一個(gè)重要的研究課題,它旨在減少與森林破壞、退化相關(guān)的溫室氣體排放[1],以及更好地量化全球碳循環(huán)[2]。干、枝和葉生物量合稱為森林地上生物量[3](aboveground biomass, AGB)。全球氣候變化研究迫切需要快速、高效的森林AGB制圖[4-5]。由于遙感技術(shù)具有宏觀、大面積、快速和可重復(fù)等特點(diǎn),遙感估算法已經(jīng)成為區(qū)域森林AGB估算的主要方法。
天然次生林占我國(guó)森林總面積的70%,是我國(guó)森林資源的主體和重要基地[6]。天然次生林一般在土層較深厚、陽(yáng)坡且處于下坡位時(shí)生物量較高[7],生物量空間分配特征因不同齡組也有所不同,一般成熟林生物量較高,而幼齡林生物量較低[8]。近年來(lái),有學(xué)者進(jìn)行天然次生林生物量遙感估算的研究,申鑫等[9]利用高光譜與高空間分辨率遙感數(shù)據(jù)對(duì)亞熱帶天然次生林的生物量進(jìn)行反演,結(jié)果表明,AGB模型的精度要高于地下生物量模型,而且綜合兩種數(shù)據(jù)的模型精度要高于僅使用高光譜數(shù)據(jù)模型,可以有效地估算亞熱帶天然次生林生物量。Li等[10]使用Sentinel-1A和Landsat 8數(shù)據(jù)對(duì)湖南省郴州天然次生林AGB進(jìn)行估算,研究表明極端梯度提升模型(extreme gradient boosting, XGBoost)結(jié)合Sentinel-1A和Landsat 8圖像作為預(yù)測(cè)變量,可以提供最佳的森林AGB估算,并且XGBoost模型可以減少高估和低估的問(wèn)題。由此可見(jiàn),采用多源遙感數(shù)據(jù)結(jié)合可有效地估算天然次生林AGB。
機(jī)載激光雷達(dá)(airborne laser radar, ALS)發(fā)射的激光脈沖可以穿透植被冠層獲得其三維結(jié)構(gòu)和能量信息,可用于估算森林參數(shù)。學(xué)者們利用激光雷達(dá)(light detection and ranging, LiDAR)衍生的森林結(jié)構(gòu)參數(shù)與統(tǒng)計(jì)建模估算北方森林[11-13]、軟木為主的溫帶混交林[14-16],以及熱帶、亞熱帶硬木林[17-19]的AGB。雖然ALS能夠表征森林垂直結(jié)構(gòu)參數(shù),但在時(shí)空分布上不具有優(yōu)勢(shì),也不能提供估算森林AGB所需要的光譜信息。Sentinel-2A衛(wèi)星對(duì)植被的監(jiān)測(cè)十分有效。因此,綜合利用多源遙感數(shù)據(jù)源是獲取森林AGB精確分析結(jié)果的有效途徑,Brovkina等[20]研究表明無(wú)論是單木尺度還是樣地尺度都是二者融合估算精度最高。Ediriweera等[21]研究表明單獨(dú)使用LiDAR數(shù)據(jù)可以較為準(zhǔn)確地估算桉樹林的生物量,但是加上Landsat 5 TM數(shù)據(jù)更能提高估算的精度。郭藝歌等[22]研究表明多光譜圖像HJ1B進(jìn)行混合像元分解后的組分圖像與雷達(dá)圖像ALOS/PALSAR進(jìn)行圖像融合建立的生物量回歸模型,其估算生物量與實(shí)測(cè)生物量一致性較好。雖然這些研究都是使用的多源遙感數(shù)據(jù),但大多是多源數(shù)據(jù)的協(xié)同,很少有將多源遙感數(shù)據(jù)提取的變量再組合之后用于估算生物量。因此,本研究采用ALS數(shù)據(jù)和Sentinel-2A數(shù)據(jù)提取特征變量,并進(jìn)行變量結(jié)合來(lái)估算森林AGB。
傳統(tǒng)的如多元線性逐步回歸(stepwise multiple linear regression, SMLR)[23-24]模型能很好地解釋自變量與因變量之間的線性關(guān)系,常用于建立森林參數(shù)和遙感預(yù)測(cè)因子的關(guān)系模型。近年來(lái),非參數(shù)模型的應(yīng)用更加普遍,與線性回歸相反,非參數(shù)模型能夠解釋復(fù)雜的非線性關(guān)系,從而被應(yīng)用到許多研究中,如K近鄰(K-nearest neighbor,K-NN)[25]、隨機(jī)森林(random forest, RF)[26]、支持向量回歸(support vector regression, SVR)[27]、堆疊稀疏自動(dòng)編碼器(stacked sparse auto-encoder, SSAE)模型[28]等。隨著非參數(shù)模型的發(fā)展,這些模型不僅應(yīng)用到目標(biāo)檢測(cè)和圖像分類中,很多研究[28-29]也表明非參數(shù)模型在估算森林植被參數(shù)方面十分有效。
本研究以東北林業(yè)大學(xué)帽兒山林場(chǎng)為研究區(qū)域,以ALS數(shù)據(jù)、Sentinel-2A數(shù)據(jù)和2016年森林資源連續(xù)清查固定樣地為數(shù)據(jù)源,分別以ALS和Sentinel-2A數(shù)據(jù)結(jié)合變量(combined optical and LiDAR index, COLI)結(jié)合成新的變量COLIs,構(gòu)建5種方法(SMLR、K-NN、SVR、RF和SSAE)的天然次生林AGB估算模型并對(duì)比分析,探討了COLIs對(duì)天然次生林AGB估算精度的影響,為大范圍森林AGB估算提供參考。
研究區(qū)為東北林業(yè)大學(xué)帽兒山實(shí)驗(yàn)林場(chǎng),位于黑龍江省尚志市西北部(127°29′~127°44′E,45°14′~45°29′N),總面積26 496 hm2,共10個(gè)施業(yè)區(qū)。地貌屬低山丘陵區(qū),地勢(shì)由南向北逐漸升高,平均海拔300 m,年平均氣溫2.8 ℃左右,年降水量為723 mm左右,土壤以暗棕壤為主。帽兒山地區(qū)的植被屬長(zhǎng)白植物區(qū)系,是典型的東北天然次生林區(qū),喬木樹種主要包括:白樺(Betulaphatyphylla)、山楊(Populusdavidiana)、五角槭(Acermono)、柞樹(Querusmongolica)、椴樹(Tiliaamurenisis)、榆樹(Ulmuspumila)、水曲柳(Fraxinusmandshurica)、胡桃楸(Juglansmandshurica)、黃菠蘿(Phellodendronamurense)、落葉松(Larixgmelinii)、紅松(Pinuskoraiensis)、樟子松(Pinussylvestris)、云杉(Piceakoraiensis)等。
1.2.1 ALS數(shù)據(jù)
數(shù)據(jù)于2015年9月由中國(guó)林業(yè)科學(xué)研究院設(shè)計(jì)的LiCHy系統(tǒng)搭載LiDAR傳感器(Riegl LMS-Q680i)獲取,傳感器波長(zhǎng)為1 550 nm,激光離散束角0.5 mrad,激光脈沖長(zhǎng)度3 ns,最大頻率400 kHz,掃描角±30°,采樣間隔1 ns,垂直精度0.15 m,平均點(diǎn)云密度3.6點(diǎn)/m2。
1.2.2 Sentinel-2A數(shù)據(jù)
Sentinel-2A數(shù)據(jù)是通過(guò)ESA共享網(wǎng)站(https://scihub.copernicus.eu/)獲取,成像時(shí)間為2016年8月9日,與外業(yè)調(diào)查時(shí)間一致。L1C級(jí)標(biāo)準(zhǔn)產(chǎn)品,共包含13個(gè)波段:波段2、3、4、8分別為藍(lán)、綠、紅、近紅外波段,分辨率均為10 m;波段5、6、7為3個(gè)紅邊波段,波段8a為窄近紅外波段,波段11、12為兩個(gè)短波紅外波段,分辨率為20 m;其余3個(gè)波段分辨率為60 m,分別是氣溶膠波段、水汽波段和卷云波段。
1.2.3 樣地?cái)?shù)據(jù)
樣地?cái)?shù)據(jù)為2016年森林資源連續(xù)清查的263塊固定樣地,面積為0.06 hm2,分布在1 km×1 km的網(wǎng)格上,其中有林地193塊,去掉一部分由于調(diào)查產(chǎn)生誤差較大的數(shù)據(jù),剩余161塊,對(duì)樣地內(nèi)樹木每木檢尺,起測(cè)徑階為5 cm,記錄胸徑(DBH)、樹種等,手持GPS記錄樣地中心點(diǎn)坐標(biāo),精度在5 m以內(nèi),樣地信息如表1所示。
表1 帽兒山固定樣地統(tǒng)計(jì)信息
ALS數(shù)據(jù)預(yù)處理包括:對(duì)點(diǎn)云數(shù)據(jù)按樣地邊界進(jìn)行裁剪;將樣地內(nèi)點(diǎn)云數(shù)據(jù)濾波分類,分成地面點(diǎn)和非地面點(diǎn);由地面點(diǎn)插值生成數(shù)字高程模型(digital elevation model, DEM);以DEM對(duì)植被回波點(diǎn)的高程進(jìn)行歸一化處理。
Sentinel-2A數(shù)據(jù)預(yù)處理包括:大氣校正、重采樣和幾何精校正。首先利用ESA提供的SNAP軟件中sen2cor插件對(duì)數(shù)據(jù)進(jìn)行大氣校正,得到各個(gè)波段的地表反射率;其次,將所需波段全部重采樣至10 m分辨率;最后,將各個(gè)波段融合后,以帽兒山數(shù)字正射影像圖(digital orthophoto map, DOM)為基準(zhǔn)影像,選取顯著標(biāo)志點(diǎn)進(jìn)行幾何精校正,誤差控制在0.2個(gè)像元內(nèi)。
利用東北林區(qū)主要樹種的生物量異速生長(zhǎng)方程[30]分別對(duì)樹干、樹枝和樹葉部分的生物量進(jìn)行估算,相加后得到AGB,公式如下:
W=a×Db。
(1)
式中:W為生物量;D為胸徑;a、b為異速生長(zhǎng)方程的模型參數(shù),依據(jù)各樹種參數(shù)值[30]。按樹種分別計(jì)算樣地內(nèi)每株樹的生物量,然后將樣地內(nèi)單木生物量求和,與樣地面積相除,得到單位面積生物量。
1.5.1 ALS數(shù)據(jù)特征變量的提取
以預(yù)處理后的ALS點(diǎn)云數(shù)據(jù)提取首回波高度的統(tǒng)計(jì)量:包括最大值(hmax)、最小值(hmin)、平均值(hmean)、偏斜度(hskew)、峰度(hkurt)、標(biāo)準(zhǔn)差(hstd)、方差(hvar)、變異系數(shù)(hcv)、眾數(shù)(hmode)和分位數(shù)(h10、h20、h30、h40、h50、h60、h70、h80、h90、h99)[31]。很多研究以10%為間隔提取高度分位數(shù)[32-35],表明分位數(shù)以10%為間隔與生物量高度相關(guān),因此本研究的高度分位數(shù)也是以10%為間隔提取。另外,為排除灌木層的影響,一般取歸一化處理后高于2 m的回波點(diǎn),因此設(shè)本研究提取密度變量為C,即為高于2 m的回波點(diǎn)在所有回波點(diǎn)中所占的比例。
1.5.2 Sentinel-2A數(shù)據(jù)特征變量的提取
Sentinel-2A數(shù)據(jù)包含了3個(gè)紅邊波段(5、6和7波段),對(duì)植被的監(jiān)測(cè)十分有效,因此本研究以Sentinel-2A數(shù)據(jù)提取植被指數(shù)為主要特征變量。有研究表明中心波長(zhǎng)在705 nm處的反射率與葉綠素含量的相關(guān)性優(yōu)于740和783 nm處的反射率[36]。因此,本研究選取中心波長(zhǎng)在705 nm處(即波段5)計(jì)算紅邊植被指數(shù)。Sentinel-2A提取的植被指數(shù)包括歸一化植被指數(shù)[37]、差值植被指數(shù)[38]、增強(qiáng)植被指數(shù)[39]、比值植被指數(shù)[40]、葉綠素指數(shù)[41]、最佳土壤調(diào)節(jié)植被指數(shù)[42]、紅邊歸一化植被指數(shù)[43]、紅邊比值植被指數(shù)[44]、紅邊葉綠素指數(shù)[41]。
由于光學(xué)數(shù)據(jù)可以提供植被冠層的光譜信息,而ALS數(shù)據(jù)可以獲得森林的垂直結(jié)構(gòu)信息,因此,ALS與光學(xué)遙感數(shù)據(jù)的協(xié)同對(duì)于估算森林AGB具有很高的價(jià)值。由Zhang等[29]研究發(fā)現(xiàn),以ALS數(shù)據(jù)和Landsat 8 OLI數(shù)據(jù)提取的特征變量為基礎(chǔ)計(jì)算光學(xué)-ALS的結(jié)合變量(combined optical and LiDAR index, COLI,即COLIs,式中記為ICOLs)在估算森林生物量方面取得了較高的精度。因此本研究也采用這種光學(xué)-ALS變量的結(jié)合方式,即以ALS數(shù)據(jù)提取的特征變量(AL)和Sentinel-2A數(shù)據(jù)提取的特征變量(AO)來(lái)計(jì)算ICOL1和ICOL2,公式為:
ICOL1=Isvi×BLV;
(2)
ICOL2=Isvi_BLV=(BLV-Isvi)/(BLV+Isvi)。
(3)
式中:BLV為與AGB擬合精度最高的ALS變量;Isvi為Sentinel-2A數(shù)據(jù)提取的各個(gè)植被指數(shù)。由于BLV和Isvi二者的量綱不同,不能直接進(jìn)行運(yùn)算,因此在運(yùn)算之前需要對(duì)BLV和Isvi進(jìn)行歸一化處理。
構(gòu)建6組特征變量組合,即AO+AL、ICOL1、ICOL2、ICOL1+AO+AL、ICOL2+AO+AL、ICOL1+ICOL2+AO+AL,進(jìn)行森林AGB估算。
1.7.1 多元線性逐步回歸
多元線性逐步回歸(stepwise multiple linear regression, SMLR)是比較傳統(tǒng)的回歸模型,主要是在考慮的全部自變量中按其對(duì)逐步回歸作用大小、顯著程度大小或貢獻(xiàn)大小,由大到小地逐個(gè)引入回歸方程,而對(duì)逐步回歸作用不顯著的變量可能始終不被引入回歸方程。本研究將非參數(shù)估算方法與該傳統(tǒng)的SMLR回歸模型進(jìn)行對(duì)比分析。
1.7.2K-最近鄰
K-最近鄰[45](K-nearest neighbor,K-NN)算法是較簡(jiǎn)單的機(jī)器學(xué)習(xí)算法之一,不僅可以用于分類還可以用于回歸。通過(guò)找出一個(gè)樣本的K個(gè)最近鄰樣本,將不同距離對(duì)樣本產(chǎn)生的影響給予樣本不同的權(quán)值,得到樣本的屬性。使用該方法需要設(shè)置:計(jì)算預(yù)測(cè)值時(shí)考慮的最近鄰個(gè)數(shù)K、選擇近鄰樣本的距離參數(shù)及計(jì)算預(yù)測(cè)值時(shí)對(duì)近鄰樣本的加權(quán)方案等幾個(gè)參數(shù)。本研究經(jīng)多次測(cè)試,最終選擇的近鄰個(gè)數(shù)K為10,距離參數(shù)為歐氏距離,加權(quán)方案為計(jì)算預(yù)測(cè)值時(shí)與所有的相鄰樣本權(quán)重相等。
1.7.3 支持向量回歸
支持向量回歸[46](support vector regression, SVR)對(duì)于低維輸入空間中非線性可分訓(xùn)練樣本,通過(guò)核函數(shù)將其映射到高維空間中使其線性可分,并保證良好的泛化能力。本研究經(jīng)多次測(cè)試獲得最優(yōu)參數(shù),即核函數(shù)為多項(xiàng)式核函數(shù),多項(xiàng)式的系數(shù)為1,誤差項(xiàng)的懲罰參數(shù)C=10,損失函數(shù)的值為0.5,使用Python的sklearn包來(lái)實(shí)現(xiàn)。
1.7.4 隨機(jī)森林
隨機(jī)森林(random forest, RF)[47]是建立在決策樹基礎(chǔ)上,通過(guò)多次bootstrap抽樣獲得多個(gè)隨機(jī)樣本,并以這些樣本分別建立相應(yīng)的決策樹,從而構(gòu)成RF。由于RF選取樣本的方法是放回隨機(jī)抽樣,因此,建立回歸樹時(shí)有一部分樣本數(shù)據(jù)不會(huì)被選中而作為檢驗(yàn)樣本出現(xiàn),起到了樣本內(nèi)部交叉驗(yàn)證的作用,兩個(gè)隨機(jī)性的引入,可減少過(guò)擬合情況的出現(xiàn)。同樣RF也需要設(shè)置幾個(gè)參數(shù),本研究經(jīng)測(cè)試,基礎(chǔ)決策樹的數(shù)量設(shè)置為500,每個(gè)基礎(chǔ)決策樹模型分裂所需最小樣本數(shù)為4,每個(gè)決策樹模型葉節(jié)點(diǎn)所包含的最小樣本數(shù)設(shè)為10。
1.7.5 堆疊稀疏自編碼器模型
堆疊稀疏自編碼器(stack sparse auto-encoder,SSAE)是一種深度學(xué)習(xí)模型,最早由Shao等[28]提出并用于估算森林AGB。一個(gè)簡(jiǎn)單的自編碼器(auto-encoder,AE)模型包含編碼器和解碼器兩部分,本質(zhì)上是對(duì)輸入信號(hào)經(jīng)過(guò)中間層的激活函數(shù)進(jìn)行變換后輸出,相當(dāng)于一個(gè)3層的神經(jīng)網(wǎng)絡(luò),而AE的目的是讓輸出信號(hào)盡可能地復(fù)現(xiàn)輸入信號(hào),從而使中間的編碼層獲得一定的學(xué)習(xí)能力,通常會(huì)對(duì)中間的編碼層進(jìn)行一定約束。從數(shù)據(jù)維度來(lái)看,當(dāng)中間編碼層的維度大于輸入數(shù)據(jù)的維度時(shí),編碼層的表達(dá)會(huì)變得稀疏,此時(shí)的自編碼器便是稀疏自編碼器(sparse auto-encoder,SAE)。SSAE就是包含了多個(gè)SAE的模型,其本質(zhì)就是將前一個(gè)SAE的輸出作為下一個(gè)SAE的輸入,建立深度神經(jīng)網(wǎng)絡(luò),進(jìn)行更深層次的學(xué)習(xí)以產(chǎn)生數(shù)據(jù)的深層特征,最后再通過(guò)解碼層輸出結(jié)果。本研究采用Python語(yǔ)言實(shí)現(xiàn)SSAE模型,并且使用4層編碼層進(jìn)行訓(xùn)練,再由4層解碼層將數(shù)據(jù)解碼成原來(lái)的維度,其中激活函數(shù)為relu。
采用十折交叉驗(yàn)證法進(jìn)行模型的精度驗(yàn)證,首先將數(shù)據(jù)集隨機(jī)分成10份,然后輪流將其中9份作為訓(xùn)練數(shù)據(jù),1份作為測(cè)試數(shù)據(jù)進(jìn)行試驗(yàn),最后取10次驗(yàn)證之后得到的評(píng)價(jià)指標(biāo)均值作為最終的評(píng)價(jià)指標(biāo)。將6組特征變量組合分別代入估算模型,得到估算值與森林AGB實(shí)測(cè)值的關(guān)系模型,使用驗(yàn)證數(shù)據(jù)集的決定系數(shù)(R2)[48]、均方根誤差[RMSE,式中記為σ(RMSE)]、相對(duì)均方根誤差[rRMSE,式中記為σ(rRMSE)]作為模型精度評(píng)價(jià)指標(biāo)。計(jì)算公式為:
R2=
(4)
(5)
(6)
用統(tǒng)計(jì)回歸分析方法建立了161塊樣地的ALS特征變量與AGB之間的關(guān)系模型,精度評(píng)價(jià)如表2所示。
表2 ALS特征變量與AGB擬合的精度
從表2中可以看出:首回波高度均值(hmean)與AGB的相關(guān)系數(shù)最高,因此使用hmean作為COLI中的ALS特征變量(BLV)。
以ALS提取的特征變量(AL)、Sentinel-2A數(shù)據(jù)提取的特征變量(AO)以及結(jié)合變量(ICOL1和ICOL2),構(gòu)建6組特征變量組合,即AO+AL、ICOL1、ICOL2、ICOL1+AO+AL、ICOL2+AO+AL、ICOL1+ICOL2+AO+AL,分別輸入SMLR、K-NN、SVR、RF和SSAE模型中估算森林AGB,各模型精度結(jié)果如表3所示。
表3 各個(gè)模型的精度結(jié)果
由表3可以看出:無(wú)論是哪一組特征變量輸入模型,SSAE模型的估算精度均最高(R2=0.83;RMSE為11.06 t/hm2; rRMSE為8.23%),其次是RF、SVM和K-NN模型,僅應(yīng)用ALS提取的特征變量(AL)和以Sentinel-2A數(shù)據(jù)提取特征變量(AO)的SMLR模型精度最低(R2=0.22; RMSE為39.67 t/hm2;rRMSE為29.52%)。隨著變量的增加,各模型的精度也有所提高。此外,結(jié)合變量ICOL1相比于ICOL2表現(xiàn)出更好的性能,無(wú)論是單獨(dú)使用ICOL1變量還是ICOL1與AL、AO的變量組合都比單獨(dú)應(yīng)用ICOL2變量和應(yīng)用ICOL2+AO+AL變量組合時(shí)的精度略高。
在光學(xué)遙感數(shù)據(jù)的可見(jiàn)光至紅外波段,植物的反射光譜曲線具有顯著的特征,但是不同類型植物之間反射光譜存在一定的差異,即使同一種植物,也會(huì)由于其生長(zhǎng)狀態(tài)的不同而發(fā)生變化,因此可以利用植被的光譜特征來(lái)監(jiān)測(cè)其生長(zhǎng)狀況。而Sentinel-2A數(shù)據(jù)的傳感器可捕獲紅光到近紅外區(qū)間的紅邊信息,因而更有利于反映植被變化情況。Astola等[49]研究Sentinel-2A估算森林參數(shù)的性能優(yōu)于Landsat 8數(shù)據(jù)。鄭陽(yáng)等[50]利用Sentinel-2A數(shù)據(jù)估算了冬小麥的地上生物量,結(jié)果表明所選的植被指數(shù)均與生物量顯著相關(guān)且紅邊葉綠素指數(shù)與生物量估算精度最高。因此,本研究選用Sentinel-2A數(shù)據(jù)作為光學(xué)遙感變量。由于本研究尚未考慮到Sentinel-2A數(shù)據(jù)地形校正,模型估算精度在一定程度上受到影響,因此對(duì)Sentinel-2A數(shù)據(jù)地形校正后的估算還需進(jìn)一步研究。
本研究中,將ALS數(shù)據(jù)提取的特征變量與AGB擬合后精度最高的首回波高度均值(hmean)及Sentinel-2A提取的特征變量重新結(jié)合成新的特征變量,ICOL1和ICOL2相較于僅使用ALS和Sentinel-2A數(shù)據(jù)提取的變量,在森林AGB估算中都具有較好的表現(xiàn),即加入ICOL1和ICOL2都取得了更高的精度,而且當(dāng)所有變量輸入模型時(shí)精度最高,這也與Zhang等[29]的研究結(jié)果一致。
本研究的變量ICOLs是根據(jù)植被指數(shù)的計(jì)算方式,將ALS數(shù)據(jù)的首回波高度參數(shù)和Sentinel-2A的植被指數(shù)相結(jié)合,使ICOLs既包含了ALS數(shù)據(jù)的高度信息,又包含了Sentinel-2A數(shù)據(jù)的光譜信息,明顯地提高了生物量模型的精度,ICOLs的表現(xiàn)可歸因于多光譜圖像提供的地表郁閉密度和覆蓋度信息的能力,以及ALS數(shù)據(jù)對(duì)于樹木枝干的森林信息的表達(dá)能力。與單獨(dú)的主被動(dòng)遙感特征變量(AO+AL)相比,ICOLs既包含了與AGB高度相關(guān)的高度變量,也包含了能夠反映植被光譜特性的植被指數(shù)變量,二者結(jié)合的ICOLs變量對(duì)森林AGB具有更強(qiáng)的解釋能力,因此,無(wú)論是單獨(dú)使用ICOLs還是加入ICOLs變量都使模型獲得了更高的精度。此外,雖然ICOL1擬合模型一般比ICOL2擬合模型能夠得到更小的RMSE和更高的R2,但是它們之間的模型精度相差不大,都可以對(duì)生物量進(jìn)行較準(zhǔn)確的估算??偟膩?lái)說(shuō),ICOLs可以提高估算生物量模型的精度,由于單一數(shù)據(jù)源的局限性可以通過(guò)另一種數(shù)據(jù)得到補(bǔ)償。另外,在廣泛應(yīng)用之前,ICOLs應(yīng)該需要進(jìn)一步的調(diào)查和驗(yàn)證。
鑒于提取的AO和AL變量以及ICOLs的計(jì)算方式,各個(gè)變量之間可能會(huì)存在共線性關(guān)系,在線性模型中,自變量的共線性會(huì)導(dǎo)致結(jié)果不準(zhǔn)確,影響模型的精度,但是在機(jī)器學(xué)習(xí)等非線性模型中,尤其是RF模型,受自變量的共線性影響較小[51]。而在本研究中用到的線性模型只有多元線性逐步回歸,該方法本身具有逐步回歸的過(guò)程,可以消除共線性的影響。因此在本研究中變量的共線性對(duì)整體預(yù)測(cè)結(jié)果影響不大。
本研究中深度學(xué)習(xí)模型SSAE的估算精度要高于其他4種模型(RF、SVR、K-NN和SMLR),這是由于SSAE模型隱含層的維度大于輸入數(shù)據(jù)的維度,通過(guò)給隱含層的神經(jīng)元加入稀疏性限制來(lái)發(fā)現(xiàn)輸入數(shù)據(jù)中的結(jié)構(gòu),因此SSAE模型能夠自動(dòng)逐層學(xué)習(xí)數(shù)據(jù)更深層次的空間稀疏特征。在SSAE模型中,輸入變量被映射到另一個(gè)特征空間中,在這個(gè)特征空間中AGB可以被準(zhǔn)確預(yù)測(cè)。由于隱含層的稀疏性,得到了更完備的稀疏特征,且SSAE模型具有多層次的結(jié)構(gòu),因此學(xué)習(xí)到的特征對(duì)AGB具有更強(qiáng)的解釋能力。模型中的編碼層也獲得了一定的學(xué)習(xí)能力,最后通過(guò)解碼層將數(shù)據(jù)輸出,從而得到更準(zhǔn)確的森林AGB估算結(jié)果。在今后的研究中,可以針對(duì)不同的森林類型分別應(yīng)用SSAE建立模型,以期提高森林AGB的估算精度。
此外,除了SSAE模型,RF模型的精度要高于其他模型(SVR、K-NN和SMLR),應(yīng)用RF模型估算森林參數(shù)也能夠得到較好的結(jié)果,如孫雪蓮[52]的研究表明RF模型的擬合效果較好。RF相對(duì)突出的性能取決于其獨(dú)特的回歸技術(shù)和算法設(shè)計(jì),這對(duì)于噪聲和異常值具有良好的穩(wěn)健性和靈活性。
在本研究中,SVR模型的估算精度較RF差,原因可能是由于噪聲變量對(duì)SVR的最優(yōu)超平面產(chǎn)生了偏差,從而降低了模型的精度。對(duì)于所有變量組合,SVR比K-NN的精度更高,說(shuō)明SVR在處理高維和非線性問(wèn)題上比K-NN更有優(yōu)勢(shì),這與Shao等[28]的研究結(jié)果一致。此外,K-NN模型的精度相對(duì)較低,可能是與K-NN模型在實(shí)現(xiàn)過(guò)程中缺少一種有效的方法確定相鄰樣本間的權(quán)重有關(guān)。一般情況下,SMLR模型的精度都是最低的[53],因?yàn)镾MLR只能夠較好地解釋變量之間的線性關(guān)系,然而研究中不是所有的變量都與AGB呈線性相關(guān),因此SMLR模型精度相對(duì)較低。
參考文獻(xiàn)(reference):
[1]GOETZ S, DUBAYAH R. Advances in remote sensing technology and implications for measuring and monitoring forest carbon stocks and change[J]. Carbon Manag, 2011, 2(3): 231-244. DOI:10.4155/cmt.11.18.
[2]ZOLKOS S G, GOETZ S J, DUBAYAH R. A meta-analysis of terrestrial aboveground biomass estimation using lidar remote sensing[J]. Remote Sens Environ, 2013, 128: 289-298. DOI:10.1016/j.rse.2012.10.017.
[3]婁雪婷, 曾源, 吳炳方. 森林地上生物量遙感估測(cè)研究進(jìn)展[J]. 國(guó)土資源遙感, 2011, 23(1): 1-8. LOU X T, ZENG Y, WU B F. Advances in the estimation of above-ground biomass of forest using remote sensing[J]. Remote Sens Land Resour, 2011, 23(1): 1-8. DOI:10.1016/j.ejphar.2011.07.001.
[4]TSUI O W, COOPS N C, WULDER M A, et al. Integrating airborne LiDAR and space-borne radar via multivariate Kriging to estimate above-ground biomass[J]. Remote Sens Environ, 2013, 139: 340-352. DOI:10.1016/j.rse.2013.08.012.
[5]LI W, NIU Z, LIANG X L, et al. Geostatistical modeling using LiDAR-derived prior knowledge with SPOT-6 data to estimate temperate forest canopy cover and above-ground biomass via strati-fied random sampling[J]. Int J Appl Earth Obs Geoinformation, 2015, 41: 88-98. DOI:10.1016/j.jag.2015.04.020.
[6]CHEN X W, LI B L, LIN Z S. The acceleration of succession for the restoration of the mixed-broadleaved Korean pine forests in Northeast China[J]. For Ecol Manag, 2003, 117(1/2/3): 503-514. DOI:10.1016/S0378-1127(02)00455-3.
[7]安利波, 畢會(huì)濤, 楊紅震, 等. 河南不同立地條件下栓皮櫟天然次生林群落生物量結(jié)構(gòu)特征[J]. 河南農(nóng)業(yè)大學(xué)學(xué)報(bào), 2016, 50(5): 624-628. AN L B, BI H T, YANG H Z, et al. Structure characteristics of community biomass ofQuercusvariabilis natural secondary forest under different site conditions in Henan Province[J]. J Henan Agric Univ, 2016, 50(5): 624-628. DOI: 10.16445/j.cnki.1000-2340.2016.05.008.
[8]趙金龍, 王濼鑫, 韓海榮, 等. 遼河源不同齡組油松天然次生林生物量及空間分配特征[J]. 生態(tài)學(xué)報(bào), 2014, 34(23): 7026-7037. ZHAO J L, WANG L X, HAN H R, et al. Biomass and spatial distribution characteristics ofPinustabulaeformisnatural secondary forest at different age groups in the Liaoheyuan Nature Reserve, Hebei Province[J]. Acta Ecol Sin, 2014, 34(23): 7026-7037. DOI:10.5846/stxb201303060357.
[9]申鑫, 曹林, 佘光輝. 高光譜與高空間分辨率遙感數(shù)據(jù)的亞熱帶森林生物量反演[J]. 遙感學(xué)報(bào), 2016, 20(6): 1446-1460. SHEN X, CAO L, SHE G H. Subtropical forest biomass estimation based on hyperspectral and high-resolution remotely sensed data[J]. J Remote Sens, 2016, 20(6): 1446-1460. DOI:10.11834/jrs.20165210.
[10]LI Y C, LI M Y, LI C, et al. Forest aboveground biomass estimation using Landsat 8 and Sentinel-1A data with machine learning algorithms[J].Sci Rep, 2020, 10: 9952. DOI:10.1038/s41598-020-67024-3.
[11]HUANG W L, SUN G Q, DUBAYAH R, et al. Mapping biomass change after forest disturbance: applying LiDAR footprint-derived models at key map scales[J]. Remote Sens Environ, 2013, 134: 319-332. DOI:10.1016/j.rse.2013.03.017.
[12]MONTESANO P M, NELSON R F, DUBAYAH R O, et al. The uncertainty of biomass estimates from LiDAR and SAR across a boreal forest structure gradient[J]. Remote Sens Environ, 2014, 154: 398-407. DOI:10.1016/j.rse.2014.01.027.
[13]NAESSET E, GOBAKKEN T, SOLBERG S, et al. Model-assisted regional forest biomass estimation using LiDAR and InSAR as auxiliary data: a case study from a boreal forest area[J]. Remote Sens Environ, 2011, 115(12): 3599-3614. DOI:10.1016/j.rse.2011.08.021.
[14]HUDAK A T, STRAND E K, VIERLING L A, et al. Quantifying aboveground forest carbon pools and fluxes from repeat LiDAR surveys[J]. Remote Sens Environ, 2012, 123: 25-40. DOI:10.1016/j.rse.2012.02.023.
[15]PFLUGMACHER D, COHEN W B, KENNEDY R E. Using Landsat-derived disturbance history (1972-2010) to predict current forest structure[J]. Remote Sens Environ, 2012, 122: 146-165. DOI:10.1016/j.rse.2011.09.025.
[16]ZHAO K G, POPESCU S, NELSON R. Lidar remote sensing of forest biomass: a scale-invariant estimation approach using airborne lasers[J]. Remote Sens Environ, 2009, 113(1): 182-196. DOI:10.1016/j.rse.2008.09.009.
[17]ASNER G P, POWELL G V, MASCARO J, et al. High-resolution forest carbon stocks and emissions in the Amazon[J]. PNAS, 2010, 107(38): 16738-16742. DOI:10.1073/pnas.1004875107.
[18]CAO L, COOPS N C, INNES J L, et al. Estimation of forest biomass dynamics in subtropical forests using multi-temporal airborne LiDAR data[J]. Remote Sens Environ, 2016, 178: 158-171. DOI:10.1016/j.rse.2016.03.012.
[19]FERRAZ A, SAATCHI S, MALLET C, et al. Airborne lidar estimation of aboveground forest biomass in the absence of field inventory[J]. Remote Sens, 2016, 8(8): 653. DOI:10.3390/rs8080653.
[20]BROVKINA O, NOVOTNY J, CIENCIALA E, et al. Mapping forest aboveground biomass using airborne hyperspectral and LiDAR data in the mountainous conditions of Central Europe[J]. Ecol Eng, 2017, 100: 219-230. DOI:10.1016/j.ecoleng.2016.12.004.
[21]EDIRIWEERA S, PATHIRANA S, DANAHER T, et al. Estimating above-ground biomass by fusion of LiDAR and multispectral data in subtropical woody plant communities in topographically complex terrain in north-eastern Australia[J]. J For Res, 2014, 25(4): 761-771. DOI:10.1007/s11676-014-0485-7.
[22]郭藝歌, 王新云, 何杰, 等. 基于多源遙感數(shù)據(jù)的森林生物量估算模型研究[J]. 人民長(zhǎng)江, 2016, 47(3): 17-22. GUO Y G, WANG X Y, HE J, et al. Study on forest biomass estimation model based on multisource remote sensing data[J]. Yangtze River, 2016, 47(3): 17-22. DOI:10.16232/j.cnki.1001-4179.2016.03.005.
[23]李明陽(yáng), 吳軍, 余超, 等. 福建武夷山自然保護(hù)區(qū)森林碳儲(chǔ)量遙感估測(cè)方法與空間分析[J]. 南京林業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版), 2014, 38(6): 6-10. LI M Y, WU J, YU C, et al. Estimation and spatial analysis of forest carbon stocks based on remote sensing technology in Wuyi Mountain National Reserve of Fujian Province[J]. J Nanjing For Univ (Nat Sci Ed), 2014, 38(6): 6-10. DOI:10.3969/j.issn.1000-2006.2014.06.002.
[24]潘磊, 孫玉軍, 王軼夫, 等. 基于Sentinel-1和Sentinel-2數(shù)據(jù)的杉木林地上生物量估算[J]. 南京林業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版), 2020, 44(3): 149-156. PAN L, SUN Y J, WANG Y F, et al. Estimation of aboveground biomass in a Chinese fir(Cunninghamialanceolata)forest combining data of Sentinel-1 and Sentinel-2[J]. J Nanjing For Univ (Nat Sci Ed), 2020, 44(3): 149-156. DOI:10.3969/j.issn.1000-2006.201811012.
[25]TIAN X, LI Z Y, SU Z B, et al. Estimating montane forest above-ground biomass in the upper reaches of the Heihe River Basin using Landsat-TM data[J]. Int J Remote Sens, 2014, 35(21): 7339-7362. DOI:10.1080/01431161.2014.967888.
[26]FASSNACHT F E, HARTIG F, LATIFI H, et al. Importance of sample size, data type and prediction method for remote sensing-based estimations of aboveground forest biomass[J]. Remote Sens Environ, 2014, 154: 102-114. DOI:10.1016/j.rse.2014.07.028.
[27]蒙詩(shī)櫟, 龐勇, 張鐘軍, 等. WorldView-2紋理的森林地上生物量反演[J]. 遙感學(xué)報(bào), 2017, 21(5): 812-824. MENG S L, PANG Y, ZHANG Z J, et al. Estimation of aboveground biomass in a temperate forest using texture information from WorldView-2[J]. J Remote Sens, 2017, 21(5): 812-824. DOI:10.11834/jrs.20176083.
[28]SHAO Z F, ZHANG L J, WANG L. Stacked sparse autoencoder modeling using the synergy of airborne LiDAR and satellite optical and SAR data to map forest above-ground biomass[J]. IEEE J Sel Top Appl Earth Obs Remote Sens, 2017, 10(12): 5569-5582. DOI:10.1109/JSTARS.2017.2748341.
[29]ZHANG L J, SHAO Z F, LIU J C, et al. Deep learning based retrieval of forest aboveground biomass from combined LiDAR and landsat 8 data[J]. Remote Sens, 2019, 11(12): 1459. DOI:10.3390/rs11121459.
[30]董利虎. 黑龍江省主要樹種相容性生物量模型研究[D]. 哈爾濱: 東北林業(yè)大學(xué), 2012. DONG L H. Compatible biomass models of main tree species in Heilongjiang Province[D]. Harbin: Northeast Forestry University, 2012.
[31]ANDERSEN H E, MCGAUGHEY R J, REUTEBUCH S E. Estimating forest canopy fuel parameters using LIDAR data[J]. Remote Sens Environ, 2005, 94(4): 441-449. DOI:10.1016/j.rse.2004.10.013.
[32]LU D S, CHEN Q, WANG G X, et al. Aboveground forest biomass estimation with landsat and LiDAR data and uncertainty analysis of the estimates[J]. Int J For Res, 2012(2):1-16. DOI:10.1155/2012/436537.
[33]CHEN Q, LAURIN G V, BATTLES J J, et al. Integration of airborne lidar and vegetation types derived from aerial photography for mapping aboveground live biomass[J]. Remote Sens Environ, 2012, 121: 108-117. DOI:10.1016/j.rse.2012.01.021.
[34]LUO S Z, WANG C, XI X H, et al. Fusion of airborne LiDAR data and hyperspectral imagery for aboveground and belowground forest biomass estimation[J]. Ecol Indic, 2017, 73: 378-387. DOI:10.1016/j.ecolind.2016.10.001.
[35]徐婷, 曹林, 申鑫, 等. 基于機(jī)載激光雷達(dá)與Landsat 8 OLI數(shù)據(jù)的亞熱帶森林生物量估算[J]. 植物生態(tài)學(xué)報(bào), 2015, 39(4): 309-321. XU T, CAO L, SHEN X, et al. Estimates of subtropical forest biomass based on airborne LiDAR and Landsat 8 OLI data[J]. Chin J Plant Ecol, 2015, 39(4): 309-321. DOI:10.17521/cjpe.2015.0030.
[36]曹霖, 彭道黎, 王雪軍, 等. 應(yīng)用Sentinel-2A衛(wèi)星光譜與紋理信息的森林蓄積量估算[J]. 東北林業(yè)大學(xué)學(xué)報(bào), 2018, 46(9): 54-58. CAO L, PENG D L, WANG X J, et al. Estimation of forest stock volume with spectral and textural information from the Sentinel-2A[J]. J Northeast For Univ, 2018, 46(9): 54-58. DOI:10.13759/j.cnki.dlxb.2018.09.012.
[37]ROUSE J W J, HAAS R H, SCHELL J A, et al. Monitoring ve-getation systems in the great plains with ERTS[EB/OL]. https://ntrs.nasa.gov/api/citations/19740022614/downloads/19740022614.pdf(accessedon 16 Apri 2021),1974.
[38]RICHARDSON A J, WIEGAND C L. Distinguishing vegetation from soil background information[J]. Photogramm Eng Remote Sens, 1977, 43(12): 1541-1552. DOI:10.1109/TGE.1977.294499.
[39]HUETE A, DIDAN K, MIURA T, et al. Overview of the radiometric and biophysical performance of the MODIS vegetation indices[J]. Remote Sens Environ, 2002, 83(1/2): 195-213. DOI:10.1016/S0034-4257(02)00096-2.
[40]JORDAN C F. Derivation of leaf-area index from quality of light on the forest floor[J]. Ecology, 1969, 50(4): 663-666. DOI:10.2307/1936256.
[42]RONDEAUX G, STEVEN M, BARET F. Optimization of soil-adjusted vegetation indices[J]. Remote Sens Environ, 1996, 55(2): 95-107. DOI:10.1016/0034-4257(95)00186-7.
[43]GITELSON A A, MERZLYAK M N. Remote estimation of chlorophyll content in higher plant leaves[J]. Int J Remote Sens, 1997, 18(12): 2691-2697. DOI:10.1080/014311697217558.
[44]GITELSON A A, GRITZ Y, MERZLYAK M N. Relationships between leaf chlorophyll content and spectral reflectance and algorithms for non-destructive chlorophyll assessment in higher plant leaves[J]. J Plant Physiol, 2003, 160(3): 271-282. DOI:10.1078/0176-1617-00887.
[45]謝福明, 舒清態(tài), 字李, 等. 基于K-NN非參數(shù)模型的高山松生物量遙感估測(cè)研究[J]. 江西農(nóng)業(yè)大學(xué)學(xué)報(bào), 2018, 40(4): 743-750. XIE F M, SHU Q T, ZI L, et al. Remote sensing estimation ofPinusdensataaboveground biomass based on K-NN nonparametric model[J]. Acta Agric Univ Jiangxiensis, 2018, 40(4): 743-750. DOI:10.13836/j.jjau.2018094.
[46]GLEASON C J, IM J. Forest biomass estimation from airborne LiDAR data using machine learning approaches[J]. Remote Sens Environ, 2012, 125: 80-91. DOI:10.1016/j.rse.2012.07.006.
[47]PANDIT S, TSUYUKI S, DUBE T. Estimating above-ground biomass in sub-tropical buffer zone community forests, Nepal, using Sentinel-2 data[J]. Remote Sens, 2018, 10(4): 601. DOI:10.3390/rs10040601.
[48]STEPHEN A B, PHILIP H Y. The trouble withR2[J]. Journal of Parametrics, 2006, 25(1):87-114. DOI: 10.1080/10157891.2006.10462273.
[50]鄭陽(yáng), 吳炳方, 張淼. Sentinel-2數(shù)據(jù)的冬小麥地上干生物量估算及評(píng)價(jià)[J]. 遙感學(xué)報(bào), 2017, 21(2): 318-328. ZHENG Y, WU B F, ZHANG M. Estimating the above ground biomass of winter wheat using the Sentinel-2 data[J]. J Remote Sens, 2017, 21(2): 318-328. DOI:10.11834/jrs.20176269.
[51]雷相東. 機(jī)器學(xué)習(xí)算法在森林生長(zhǎng)收獲預(yù)估中的應(yīng)用[J]. 北京林業(yè)大學(xué)學(xué)報(bào), 2019, 41(12): 23-36. LEI X D. Applications of machine learning algorithms in forest growth and yield prediction[J]. J Beijing For Univ, 2019, 41(12): 23-36. DOI:10.12171/j.1000-1522.20190356.
[52]孫雪蓮. 基于Landsat 8-OLI的香格里拉高山松林生物量遙感估測(cè)模型研究[D]. 昆明: 西南林業(yè)大學(xué),2016. SUN X L. Biomass estimation model ofPinusdensataforests in Shangri-La City based on Landsat 8-OLI by remote sensing[D]. Kunming: Southwest Forestry University, 2016.
[53]HAME T, RAUSTE Y, ANTROPOV O, et al. Improved mapping of tropical forests with optical and SAR imagery, part II: above ground biomass estimation[J]. IEEE J Sel Top Appl Earth Obs Remote Sens, 2013, 6(1): 92-101. DOI:10.1109/JSTARS.2013.2241020.