王媛, 王秀蘭*, 馮仲科, 孫素芬, 張浪, 劉培斌
(1.北京林業(yè)大學(xué),精準(zhǔn)林業(yè)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100083;2.北京市農(nóng)林科學(xué)院農(nóng)業(yè)信息與經(jīng)濟(jì)研究所,北京 100097;3.上海市園林科學(xué)規(guī)劃研究院, 上海 200232;4.上海城市困難立地綠化工程技術(shù)研究中心,上海 200232;5.北京市水利規(guī)劃設(shè)計(jì)研究院, 北京 100048)
森林資源調(diào)查是對(duì)森林中各種資源的特征、數(shù)量進(jìn)行測(cè)量或調(diào)查的過(guò)程,是森林經(jīng)營(yíng)與管理的基礎(chǔ)。其中最重要的任務(wù)之一是立木測(cè)量,它在評(píng)價(jià)森林資源質(zhì)量和林木生長(zhǎng)狀況方面具有重要的價(jià)值[1]。森林資源調(diào)查的因子包括胸徑(diameter at breast height,DBH)、樹(shù)高、冠幅、林地面積、蓄積量、年齡、優(yōu)勢(shì)樹(shù)種等[2]。樹(shù)高和胸徑是反映立木質(zhì)量和生長(zhǎng)量的最基本因子[3],也是計(jì)算森林蓄積量、生物量、碳儲(chǔ)量的基礎(chǔ)。樹(shù)冠是樹(shù)木進(jìn)行光合作用和蒸騰作用的重要場(chǎng)所,冠幅是樹(shù)冠結(jié)構(gòu)的重要特征因子之一,是預(yù)測(cè)樹(shù)木生物量、樹(shù)冠表面積、林分郁閉等的重要變量[4],因其相較于其他樹(shù)冠結(jié)構(gòu)因子直觀且較易觀測(cè),也是在樹(shù)冠中被研究最多的形態(tài)變量,在單木生長(zhǎng)模型中常作為協(xié)變量預(yù)測(cè)樹(shù)高和胸徑生長(zhǎng)量以及樹(shù)木枯損等[5-6]。對(duì)樹(shù)木冠幅的定量研究對(duì)林分密度調(diào)控、森林生態(tài)效益和生產(chǎn)能力的最優(yōu)化管理具有重要意義。
在傳統(tǒng)樹(shù)木測(cè)量中,林業(yè)工作一般使用胸徑尺測(cè)量胸徑,以測(cè)高器測(cè)樹(shù)高,并記錄數(shù)據(jù)。而冠幅相對(duì)難以用傳統(tǒng)工具測(cè)量且誤差較大,因此,林業(yè)工作者基于樹(shù)高、胸徑與冠幅之間的關(guān)系建立回歸模型,以容易測(cè)得的胸徑推算樹(shù)高和冠幅[7]。國(guó)內(nèi)外學(xué)者就胸徑、樹(shù)高和冠幅之間存在的密切聯(lián)系進(jìn)行了大量的研究。例如,S?nmez[8]通過(guò)研究遼東冷杉的胸徑和樹(shù)高,建立了7個(gè)胸徑樹(shù)高模型,其研究結(jié)果表明精度最高的是三次方程。Calama等[9]對(duì)西班牙石松建立了樹(shù)高-胸徑模型,對(duì)5個(gè)雙參數(shù)非線性方程進(jìn)行了擬合和評(píng)價(jià),建立了同一樹(shù)種不同地區(qū)的模型。雷相東等[10]建立了長(zhǎng)白落葉松等9個(gè)樹(shù)種的樹(shù)冠冠幅預(yù)測(cè)模型,結(jié)果證明樹(shù)木的胸徑對(duì)大多數(shù)樹(shù)種的冠幅都有顯著影響。符亞健等[11]對(duì)山西省龐泉溝自然保護(hù)區(qū)華北落葉松天然次生林單木冠幅預(yù)測(cè)模型展開(kāi)研究,得出三參數(shù)的邏輯斯蒂形式的冠幅-胸徑模型擬合精度較高,并且模型參數(shù)可解釋。上述研究證明大多數(shù)樹(shù)種胸徑與樹(shù)高、胸徑與冠幅之間都存在較強(qiáng)的相關(guān)關(guān)系。近年來(lái)隨著遙感技術(shù)的發(fā)展,運(yùn)用高分辨率影像與LiDAR數(shù)據(jù)結(jié)合,傳統(tǒng)手段難以獲取的冠幅數(shù)據(jù)可以在遙感影像中獲取,而利用胸徑、樹(shù)高與冠幅的相關(guān)關(guān)系,在大面積森林資源調(diào)查中可以利用冠幅數(shù)據(jù)推算胸徑和樹(shù)高數(shù)據(jù),提高工作效率。
北京市延慶松山國(guó)家自然保護(hù)區(qū)地處北京市延慶縣西北端,距離北京市區(qū)90 km。東部與延慶縣后河村相鄰,南部與佛峪口村和水峪村相鄰,西邊和河北省懷來(lái)縣接壤,北邊與河北省赤城縣相鄰,位于北京延慶縣海坨山南麓,坐標(biāo)為N40°29′9″~40°33′35″, E115°43′44″~115°50′22″,面積4 660 hm2。松山自然保護(hù)區(qū)地勢(shì)北高南低,地形復(fù)雜,地勢(shì)陡峭、地面起伏較大。本文基于松山自然保護(hù)區(qū)的實(shí)測(cè)數(shù)據(jù),對(duì)松山主要的14個(gè)樹(shù)種利用回歸方程分別建立胸徑-冠幅與樹(shù)高-冠幅模型,通過(guò)比較分析選取最優(yōu)模型,并進(jìn)行精度檢驗(yàn)。可為以后大面積開(kāi)展森林資源調(diào)查以及冠幅、胸徑、樹(shù)高的高效預(yù)測(cè)提供參考。
在松山國(guó)家自然保護(hù)區(qū)內(nèi)的唐子溝、石湖溝和大柳樹(shù)溝內(nèi)建立了40 hm2(1 000 m×400 m)的森林大樣地,劃分為1 000個(gè)20×20 m2的小樣地,使用全站儀[12](NTS 340,南方測(cè)繪儀器有限公司)對(duì)樹(shù)木進(jìn)行測(cè)量,可得到樹(shù)木的三維坐標(biāo)、樹(shù)高、胸徑、冠幅等基本數(shù)據(jù)。將全站儀架設(shè)于地形平坦處,激光點(diǎn)分別瞄準(zhǔn)待測(cè)位置,通過(guò)三角函數(shù)和距離公式自動(dòng)解算測(cè)量數(shù)據(jù),得到相應(yīng)樹(shù)高、胸徑、冠幅數(shù)據(jù)。為了建模更具代表性,本研究對(duì)每個(gè)小樣地內(nèi)胸徑大于1 cm的所有喬木的樹(shù)高、胸徑、冠幅(東西和南北兩個(gè)方向)進(jìn)行測(cè)量和記錄。
1.2.1建模方法 本文將實(shí)測(cè)獲取的各樣地?cái)?shù)據(jù)進(jìn)行匯總后,選取松山地區(qū)數(shù)量較多的油松(PinustabulaeformisCarr.)、胡桃楸(JuglansmandshuricaMaxim.)、椴樹(shù)(TiliatuanSzyszyl.)、榆樹(shù)(UlmuspumilaLinn.)、五角楓(AceroliverianumPax)、蒙古櫟(QuercusmongolicaFischerexLedebour)、白樺(BetulaplatyphyllaSuk.)、山槐(AlbiziakalkoraRoxb.Prain)、核桃(JuglansregiaLinn.)、柳樹(shù)(Salix)、小葉樸(CeltisbungeanaBl.)、棗樹(shù)(ZiziphusjujubaMill.)、椿樹(shù)(AilanthusaltissimaMill.Swingle)、黑樺(BetuladahuricaPall.)14個(gè)樹(shù)種的部分測(cè)量數(shù)據(jù),利用SPSS 22.0建模。
建立模型時(shí),樹(shù)高、胸徑數(shù)據(jù)直接使用測(cè)量值,因冠幅數(shù)據(jù)分別測(cè)量了東西、南北兩個(gè)方向,在計(jì)算中,使用兩個(gè)方向的測(cè)量值的平均值參與建模。將所有樣地的數(shù)據(jù)按照樹(shù)種匯總,去除異常數(shù)據(jù)后進(jìn)行后續(xù)分析。
以往的研究表明,經(jīng)驗(yàn)?zāi)P驮趩文旧L(zhǎng)預(yù)估中是一種常用方法,構(gòu)建的模型直觀明了[13]。由于各種函數(shù)回歸模型的精度存在一定差異,本文選取了6個(gè)回歸模型(表1)對(duì)松山地區(qū)樹(shù)種進(jìn)行擬合分析。
表1 候選模型Table 1 Candidate model
以冠幅數(shù)據(jù)D作為自變量,樹(shù)高H和胸徑d作為因變量,a、b、c、f分別為擬合模型的參數(shù)估計(jì)值。模型驗(yàn)證是建模的關(guān)鍵步驟,常用方法是數(shù)據(jù)分割(data splitting),即按照比例將數(shù)據(jù)分為建模數(shù)據(jù)和驗(yàn)證數(shù)據(jù)[14]。本文隨機(jī)選取各樹(shù)種80%左右的數(shù)據(jù)建立模型,剩余20%數(shù)據(jù)作為檢驗(yàn)數(shù)據(jù),在模型建立后對(duì)模型進(jìn)行精度驗(yàn)證[15]。
1.2.2精度評(píng)價(jià) 本文選用決定系數(shù)R2、均方誤差RMSE和F統(tǒng)計(jì)量三個(gè)指標(biāo)對(duì)對(duì)模型精度進(jìn)行評(píng)價(jià)。R2取值范圍為[0,1],R2越接近1,表明模型對(duì)數(shù)據(jù)的擬合越好。均方誤差RMSE是用擬合值與原始值之間的偏差來(lái)評(píng)價(jià)模型的回歸效果,值越小越好。對(duì)回歸方程進(jìn)行F檢驗(yàn),回歸方程的擬合度越高,F(xiàn)統(tǒng)計(jì)量值就越大。各指標(biāo)估計(jì)值檢驗(yàn)計(jì)算方法如下。
(1)
(2)
(3)
在計(jì)算上述指標(biāo)后,對(duì)比每個(gè)模型的決定系數(shù)R2,均方誤差RMSE和F統(tǒng)計(jì)量,按照R2、F最大以及RMSE最小的原則,選取出最優(yōu)模型。
2.1.1異常數(shù)據(jù)分析 將每種樹(shù)木的所有數(shù)據(jù)繪制散點(diǎn)圖,如圖1(以山槐為例)所示,因樹(shù)木本身或測(cè)量中較大問(wèn)題存在個(gè)別異常數(shù)據(jù),如記錄過(guò)程中出現(xiàn)小數(shù)點(diǎn)標(biāo)錯(cuò)位置以致明顯過(guò)大或過(guò)小的數(shù)據(jù),以及繪制散點(diǎn)圖之后與趨勢(shì)線和大多數(shù)數(shù)據(jù)距離過(guò)大的數(shù)據(jù)等,因此,需要去除后對(duì)剩余數(shù)據(jù)才能進(jìn)行后續(xù)分析。
圖1 山槐胸徑、樹(shù)高、冠幅數(shù)據(jù)散點(diǎn)圖Fig.1 Scatter plot of DBH, tree height and crown width of Albizia kalkora Roxb. Prain
2.1.2建模數(shù)據(jù)統(tǒng)計(jì)分析 匯總所有數(shù)據(jù),將枯死的樹(shù)木數(shù)據(jù),因測(cè)量、記錄等過(guò)程出現(xiàn)錯(cuò)誤的數(shù)據(jù)以及散點(diǎn)圖中異常值剔除,最終選定樣本量大于30的14個(gè)喬木樹(shù)種進(jìn)行研究,統(tǒng)計(jì)結(jié)果如表2所示。
從表2可以看出,選取的樹(shù)種中,油松和蒙古櫟的樣本量較大,達(dá)到18 201和6 724株;椿樹(shù)、核桃和柳樹(shù)的樣本量比較小,均為30余株。各樹(shù)種的樹(shù)高、胸徑、冠幅數(shù)據(jù)的最大值與最小值差距較大,標(biāo)準(zhǔn)差值較大,說(shuō)明使用的數(shù)據(jù)取值范圍較廣,具有代表性。
表2 建模數(shù)據(jù)統(tǒng)計(jì)Table 2 Statistics of model data
分別把各個(gè)樹(shù)種的胸徑、樹(shù)高、冠幅的建模數(shù)據(jù)代入公式中,每個(gè)樹(shù)種分別得到12個(gè)模型,包括6個(gè)胸徑-冠幅模型和6個(gè)樹(shù)高-冠幅模型,并求出其R2以及F值;使用檢驗(yàn)數(shù)據(jù)計(jì)算RMSE的值。以山槐為例,按照候選模型分別計(jì)算出各模型的參數(shù)(表3和4),并繪制出各模型的曲線圖(圖2)。
表3 山槐胸徑-冠幅模型Table 3 Albizia kalkora Roxb. Prain d-D model
圖2 山槐建模曲線Fig.2 Albizia kalkora Roxb. Prain modeling curve
從結(jié)果中可以看出所有模型的顯著性水平Sig.<0.001,說(shuō)明通過(guò)統(tǒng)計(jì)學(xué)檢驗(yàn)。從決定系數(shù)R2、F統(tǒng)計(jì)值來(lái)看,各模型的擬合效果存在差異,其中線性模型、二次多項(xiàng)式和三次多項(xiàng)式模型的擬合效果較好,對(duì)數(shù)模型擬合效果最差。根據(jù)決定系數(shù)R2和F統(tǒng)計(jì)值最大的標(biāo)準(zhǔn),選擇山槐的最優(yōu)胸徑-冠幅模型為二次多項(xiàng)式模型,樹(shù)高-冠幅模型為線性模型;計(jì)算得到對(duì)應(yīng)的RMSE的值也是所有模型中最小的,說(shuō)明選擇的模型優(yōu)于其他模型。
表4 山槐樹(shù)高-冠幅模型Table 4 Albizia kalkora Roxb. Prain H-D model
將所有樹(shù)種的胸徑、樹(shù)高、冠幅數(shù)據(jù)分別代入回歸方程,得到每個(gè)樹(shù)種的12個(gè)模型。建模過(guò)程中,一些樹(shù)種按指標(biāo)最優(yōu)的原則選取出的最優(yōu)模型為二次多項(xiàng)式模型或者三次多項(xiàng)式模型,但是結(jié)合模型圖像來(lái)看,二次多項(xiàng)式模型和三次多項(xiàng)式模型走勢(shì)存在下降現(xiàn)象,可能出現(xiàn)過(guò)擬合的情況(圖3),故應(yīng)在排除這些模型之后選擇最優(yōu)模型。為了評(píng)估選取的最優(yōu)模型的適用性和準(zhǔn)確性,使用預(yù)留的驗(yàn)證數(shù)據(jù)參照RMSE值做評(píng)估。
圖3 榆樹(shù)樹(shù)高-冠幅模型曲線Fig.3 H-D model curve of Ulmus pumila Linn.
從建模結(jié)果可以看出,所有模型Sig.<0.01,說(shuō)明極為顯著。同樣對(duì)每個(gè)樹(shù)種的模型依據(jù)R2最大、F最大、RMSE最小的的原則,選取出最優(yōu)模型,如表5、表6所示。在選取最優(yōu)模型時(shí),當(dāng) 3 個(gè)指標(biāo)相差不大時(shí),選擇系數(shù)較少、形式較簡(jiǎn)單的模型。在選取出的最優(yōu)模型中,沒(méi)有出現(xiàn)指數(shù)模型和三次多項(xiàng)式模型;三次多項(xiàng)式存在決定系數(shù)R2最大的情況,但同時(shí)存在過(guò)擬合,因此最優(yōu)模型也均未選擇三次多項(xiàng)式模型。線性模型和冪函數(shù)模型被較多樹(shù)種選為最優(yōu)模型。
表5 各樹(shù)種最優(yōu)胸徑-冠幅模型Table 5 Optimal d-D model
表6 各樹(shù)種最優(yōu)樹(shù)高-冠幅模型Table 6 Optimal H-D model
選取出模型中,樹(shù)高-冠幅模型的R2范圍為0.511~0.887,最小的是白樺,最大的是核桃;RMSE的值最小的是柳樹(shù),值為1.069,最大的是油松的4.128。胸徑-冠幅模型中,決定系數(shù)最大的是核桃,R2為0.951,榆樹(shù)的最小,R2為0.515;RMSE的值來(lái)看,最小的是柳樹(shù),為1.166,最大的白樺為7.353,榆樹(shù)為5.506,其余介于1.857~4.917之間。
從上述建模和驗(yàn)證結(jié)果可以看出,各樹(shù)種的具體模型和參數(shù)都有不同,選取出的最優(yōu)模型中冪函數(shù)模型和線性模型最多。并未出現(xiàn)指數(shù)模型,說(shuō)明指數(shù)模型比起其他模型來(lái)說(shuō),較為不適合本研究所選樹(shù)種。二次多項(xiàng)式模型和三次多項(xiàng)式模型在一些樹(shù)種中出現(xiàn)了過(guò)擬合的情況,因此并未選擇R2最高的二次多項(xiàng)式和三次多項(xiàng)式模型,說(shuō)明經(jīng)驗(yàn)?zāi)P筒皇窃綇?fù)雜越好。各樹(shù)種的冠幅預(yù)測(cè)模型的決定系數(shù)R2都在0.5以上,其中決定系數(shù)最高的是核桃,胸徑-冠幅模型R2高達(dá)0.951,樹(shù)高-冠幅模型R2為0.887;決定系數(shù)最小的是蒙古櫟,樹(shù)高-冠幅模型R2為0.506,胸徑-冠幅模型的R2為0.52,有一定的統(tǒng)計(jì)學(xué)意義。張樹(shù)森等[16]利用啞變量構(gòu)建了大興安嶺地區(qū)天然落葉松冠幅預(yù)測(cè)模型,模型的決定系數(shù)R2為0.717 4;韓艷剛等[17]用章古臺(tái)地區(qū)的樟子松人工林?jǐn)?shù)據(jù)構(gòu)建了冠幅-胸徑的基礎(chǔ)模型、廣義模型和基于混合效應(yīng)的基礎(chǔ)和廣義模型,決定系數(shù)R2在0.5~0.7之間,在關(guān)于胸徑和冠幅的研究中,決定系數(shù)很多在0.7左右,可以看出本研究精度較高。在大規(guī)模森林資源調(diào)查中,冠幅可通過(guò)遙感技術(shù)獲得,但是林冠下的條件因子立地條件可能難以獲取。這時(shí)直接使用冠幅數(shù)據(jù)估算樹(shù)高和胸徑值就有了實(shí)用價(jià)值。由此可以看出,對(duì)松山地區(qū)的數(shù)據(jù)進(jìn)行模型擬合是有意義的,且模型簡(jiǎn)單易懂,在獲取大量冠幅數(shù)據(jù)時(shí)可以作為以上樹(shù)種用冠幅預(yù)測(cè)樹(shù)高和胸徑的參考,模型有一定的實(shí)用性,便于后續(xù)的應(yīng)用。從精度驗(yàn)證來(lái)看,所有的模型顯著性水平(Sig.)都小于0.01,都通過(guò)了顯著性檢驗(yàn),且F較大,說(shuō)明回歸方程顯著。但是從各模型的RMSE指標(biāo)來(lái)看,還是存在不同程度的誤差,存在這些誤差可能有以下幾點(diǎn)原因:一方面由于樣本數(shù)量的限制,某些樹(shù)種樣本偏少,結(jié)論可能有誤差;另一方面冠幅生長(zhǎng)同樣受到海拔、林分密度等的影響,下一步應(yīng)在加大樣本量的基礎(chǔ)上加入一些容易獲取的環(huán)境、林分和單木因子,研究這些因子與冠幅之間的關(guān)系。
近年來(lái),隨著遙感技術(shù)的迅速發(fā)展和無(wú)人機(jī)在林業(yè)中的應(yīng)用,通過(guò)無(wú)人機(jī)攝影獲取影像提取冠幅的方法,可高效地進(jìn)行森林資源調(diào)查因子提取,提高了森林資源調(diào)查的效率,使森林資源管理實(shí)現(xiàn)信息化、精準(zhǔn)化。利用樹(shù)高、胸徑、冠幅間的相關(guān)關(guān)系,可以通過(guò)冠幅預(yù)測(cè)胸徑和樹(shù)高。目前通過(guò)影像提取冠幅的方法主要有面向?qū)ο蠓ā⒎炙畮X分割法、專家分類法等。王枚梅等[18]基于面向?qū)ο蠓椒?,提取四川貢嘎山某區(qū)域亞高山針葉林的樹(shù)冠,精度較高,自動(dòng)提取的東西冠幅和南北冠幅與真實(shí)冠幅的R2分別達(dá)0.765 1和 0.855 6,單元面積樹(shù)木數(shù)和郁閉度的提取精度分別達(dá)0.99和0.92。孫華[19]采用標(biāo)記分水嶺和均值漂移分割算法對(duì)樣地杉木冠幅信息進(jìn)行提取。其中標(biāo)記分水嶺分割方法提取冠幅的最佳效果正確率為77.1%;多尺度分割漂移算法的正確率為86.6%?;跓o(wú)人機(jī)和遙感影像的冠幅提取技術(shù)已經(jīng)相對(duì)成熟,為建立胸徑-冠幅和樹(shù)高-冠幅模型提供了前提條件。本文建立的模型可對(duì)松山地區(qū)大面積森林調(diào)查中胸徑、樹(shù)高的預(yù)測(cè)提供參考。