王鶴智,劉奇峰,朱萬(wàn)才*
(1.國(guó)家林業(yè)和草原局林草調(diào)查規(guī)劃院,北京 100714;2.黑龍江省林業(yè)科學(xué)研究所,哈爾濱 150080)
林分形高是衡量林分蓄積量的重要指標(biāo),即單位面積林分蓄積量和相應(yīng)的胸高總斷面積的比值[1]。在測(cè)算林分蓄積量時(shí),只需要測(cè)定林分的胸高總斷面積,并乘以相應(yīng)的形高值,就可以得到林分的蓄積量。因此,林分形高在森林資源的調(diào)查、監(jiān)測(cè),特別是森林資源規(guī)劃設(shè)計(jì)調(diào)查中具有重要作用。為了獲取林分形高的數(shù)值,通常使用林分形高模型。這種模型是通過(guò)林分平均高與林分形高之間的相關(guān)關(guān)系來(lái)建立的,根據(jù)調(diào)查得到的林分樹高可以推算得到相應(yīng)的林分形高。許多研究者已經(jīng)對(duì)林分形高進(jìn)行了廣泛的研究。劉小平等[2]人在對(duì)海南省的桉樹、木麻黃等樹種建立的模型中,預(yù)估精度高達(dá)98%以上。余松柏等[3]人擬合了廣東省的杉木、馬尾松等樹種的林分形高模型,證明了林分形高表在測(cè)算精度上優(yōu)于一元材積表; 不同林分起源和樹種組成需要采用不同的數(shù)學(xué)模型來(lái)推算林分形高。例如,自然對(duì)數(shù)函數(shù)可以精確解釋杉木地上生物量和蓄積量[4],而二次多項(xiàng)式模型適用于杉木、馬尾松、華山松、柏木和櫟類等樹種,冪函數(shù)模型[5]適用于闊葉林。使用總體平均模型來(lái)估算林分的蓄積量可能會(huì)產(chǎn)生較大的誤差。因此,可以利用樣地的平均胸徑和平均樹高數(shù)據(jù),調(diào)整和修訂樹高與胸徑之間的回歸模型,以減小估算誤差。這樣可以提高林分形高的估算精度??偠灾?林分形高是測(cè)算林分蓄積量的重要指標(biāo),其通過(guò)林分平均高與林分形高之間的相關(guān)關(guān)系模型來(lái)獲取。不同的起源和樹種組成需要采用適合的數(shù)學(xué)模型。修訂回歸模型可以減小估算誤差并提高估算精度[6],這些研究對(duì)于森林資源調(diào)查、監(jiān)測(cè)和規(guī)劃設(shè)計(jì)具有重要意義。
始林的森林資源,為主要林區(qū)的主要樹種編制了林分?jǐn)嗝娣e蓄積量標(biāo)準(zhǔn)表,然而,隨著時(shí)間的推移,我國(guó)的森林資源結(jié)構(gòu)發(fā)生了顯著的變化,現(xiàn)在主要以天然次生林、天然殘次林和人工林為主,占全國(guó)喬木林面積的79.62%,而未經(jīng)人為干擾的天然林分僅占4.76%[7]。例如,黑龍江重點(diǎn)國(guó)有林區(qū)的天然原始林僅2.4萬(wàn)hm2[8],占東北重點(diǎn)國(guó)有林區(qū)喬木林面積的0.28%,占全國(guó)喬木林面積的0.01%。因此,沿用傳統(tǒng)林分?jǐn)嗝娣e蓄積量標(biāo)準(zhǔn)表會(huì)導(dǎo)致估測(cè)精度偏低的問(wèn)題[3]。為了滿足當(dāng)前森林資源調(diào)查工作的要求,快速、有效地計(jì)算蓄積量,我們有必要結(jié)合現(xiàn)實(shí)林分狀況重新編制形高表。
研究利用吉林省重點(diǎn)國(guó)有林區(qū)不同林分類型地面實(shí)測(cè)樣地?cái)?shù)據(jù),探索林分形高建模與評(píng)價(jià)方法,旨在建立適用于不同林分類型的形高模型,為森林資源調(diào)查提供更科學(xué)、更精確的依據(jù)。這樣的研究將對(duì)我國(guó)的森林資源規(guī)劃和管理產(chǎn)生積極的影響。
研究區(qū)域位于吉林省重點(diǎn)國(guó)有林區(qū)(包含吉林森工與長(zhǎng)白山森工)經(jīng)營(yíng)區(qū),典型針葉樹種有紅松(Pinuskoraiensis)、落葉松(Larixgmelinii)、樟子松(Pinussylvestrisvar.Mongolica),闊葉樹種有胡桃楸(Juglansmandshurica)、水曲柳(Fraxinusmandshurica)、黃菠羅(phellodendronamurense)、楊樹(PopulusLina)、白樺(Betulaplatyphylla)、椴樹(Tiliatuan)。
本研究的數(shù)據(jù)來(lái)源主要由3部分組成:2018年在主要林分類型中設(shè)置臨時(shí)樣地的調(diào)查數(shù)據(jù)。這些臨時(shí)樣地的設(shè)置與調(diào)查方法都是按照《森林資源規(guī)劃設(shè)計(jì)調(diào)查技術(shù)規(guī)程》(LY/T 26424)的規(guī)定執(zhí)行的、2016年相關(guān)林業(yè)局開展森林資源規(guī)劃設(shè)計(jì)調(diào)查布設(shè)的總體控制樣地調(diào)查數(shù)據(jù)、近兩次國(guó)家森林資源連續(xù)調(diào)查固定樣地的數(shù)據(jù)??傆?jì)有27884個(gè)編表樣本數(shù)據(jù)用于本研究的分析。
根據(jù)樣地中林分的起源、優(yōu)勢(shì)樹種和樹種組成,對(duì)林分進(jìn)行了類型劃分。對(duì)于面積過(guò)小且樣本數(shù)量較少,不滿足編表要求的類型,將其歸并到生長(zhǎng)發(fā)育規(guī)律相近的林分類型中。通過(guò)這樣的劃分和歸并,共得出了18種林分類型。具體劃分情況見表1
表1 林分類型表
對(duì)于模型擬合的數(shù)據(jù),可能會(huì)存在一些異常樣本,它們的存在會(huì)影響模型的擬合精度,因此,在進(jìn)行數(shù)據(jù)建模之前,必須進(jìn)行異常樣本的剔除處理,以提高建模的準(zhǔn)確性和可靠性。異常樣本的剔除通常分為兩個(gè)步驟[9]。首先,針對(duì)每個(gè)林分類型,使用計(jì)算機(jī)繪制林分平均樹高與形高的散點(diǎn)圖,通過(guò)肉眼判斷明顯遠(yuǎn)離其他樣點(diǎn)的數(shù)據(jù)并刪除。這類樣本通常是由于記錄或計(jì)算錯(cuò)誤等引起的異常值。然后,使用建模樣本擬合某一林分形高表的數(shù)學(xué)模型,并繪制模型預(yù)估值與標(biāo)準(zhǔn)化殘差之間的殘差圖。根據(jù)拉依達(dá)準(zhǔn)則,將超出±3倍標(biāo)準(zhǔn)差以外的樣本視為異常樣本并予以剔除[10]。
在分析過(guò)程中發(fā)現(xiàn)異常樣本共有854個(gè),占樣本總數(shù)的3.05%。在剔除這些異常樣本(包括采伐、造林地、疏林地和樣地?cái)?shù)據(jù)異常等)后,實(shí)際用于編制的樣本數(shù)據(jù)共計(jì)27133個(gè)。將27133塊樣地按照之前劃分的18個(gè)林分類型進(jìn)行整理,得到了各林分類型主要調(diào)查因子的統(tǒng)計(jì)量統(tǒng)計(jì)表,詳細(xì)信息請(qǐng)參見表2。
表2 各林分類型主要調(diào)查因子統(tǒng)計(jì)量統(tǒng)計(jì)表
考慮到各樹種的林學(xué)特性和林分生長(zhǎng)過(guò)程,我們選擇了適用于描述平均樹高和林分形高關(guān)系的統(tǒng)計(jì)數(shù)學(xué)模型作為林分形高表數(shù)學(xué)模型。具體的模型形式如下:
fh=th×(a+b/(c+th))
(1)
fh=a×(1-exp(-b×th)
(2)
fh=a+exp(b+c/th)
(3)
fh=(th/a+b×th)^2
(4)
fh=a+b/th
(5)
fh=a×th/(th+b)
(6)
fh=a×(th^b)
(7)
fh=a+b×th
(8)
式中:fh為林分形高;th為林分平均高;a、b、c為估計(jì)參數(shù)。
回歸分析的最后一步即對(duì)所選模型進(jìn)行全面驗(yàn)證。很多學(xué)者認(rèn)為僅僅依靠建模樣本計(jì)算的擬合度或檢驗(yàn)指標(biāo)來(lái)評(píng)價(jià)模型的預(yù)測(cè)能力是不夠準(zhǔn)確的,因此建議利用獨(dú)立的檢驗(yàn)樣本(即未參與建模的樣本)來(lái)進(jìn)行模型適用性檢驗(yàn)。有些研究認(rèn)為將整個(gè)樣本分成建模樣本和檢驗(yàn)樣本進(jìn)行建模并不能提供額外的信息來(lái)評(píng)價(jià)回歸模型的好壞[11],因此建議使用整個(gè)樣本進(jìn)行模型建立[12]。然而,對(duì)于評(píng)價(jià)模型的預(yù)測(cè)能力,許多研究認(rèn)為"刀切法"(Jackknifing technique)是最適合的方法[13]。因此,在本研究中采用全部數(shù)據(jù)進(jìn)行模型擬合,并使用"刀切法"來(lái)評(píng)估模型的預(yù)測(cè)能力[14-16],并使用以下6個(gè)指標(biāo)來(lái)評(píng)估模型:調(diào)整后決定系數(shù)(Ra2)、均方根誤差(RMSE)、總相對(duì)誤差(TRE)、平均系統(tǒng)誤差(MSE)、平均預(yù)測(cè)誤差(MPE)和平均百分比標(biāo)準(zhǔn)誤差(MPSE)
吉林森工林區(qū)各林分類型林分形高表數(shù)學(xué)模型參數(shù)估計(jì)結(jié)果和模型的評(píng)價(jià)指標(biāo)值(擬合統(tǒng)計(jì)量)見表4-1。通過(guò)比較Ra2、RMSE以及參數(shù)的有效性,最終確定各林分類型的最優(yōu)林分形高模型,具體擬合結(jié)果見表3(僅列出擬合結(jié)果最優(yōu)的組合)。
圖1 各林分類型最優(yōu)林分形高表數(shù)學(xué)模型擬合曲線
表3 各林分形高模型擬合及參數(shù)估計(jì)
表4 各林分類型最優(yōu)林分形高模型的檢驗(yàn)結(jié)果
采用TRE、MSE、MPE和MPSE對(duì)最優(yōu)模型進(jìn)行評(píng)價(jià),評(píng)價(jià)結(jié)果如表6所示。各林分類型的TRE和MSE都在±0.1%以內(nèi),這表明模型的總體準(zhǔn)確率較高。MPE均小于3%,表明預(yù)測(cè)結(jié)果的個(gè)體準(zhǔn)確性較高。MPSE均小于12%,表明預(yù)測(cè)結(jié)果與實(shí)際觀測(cè)值之間的差異較小。綜上,構(gòu)建的模型具有較好的預(yù)測(cè)精度和適用性。
研究基于大量樣地實(shí)測(cè)數(shù)據(jù),旨在建立具有代表性的林分形高模型系統(tǒng),以填補(bǔ)吉林省重點(diǎn)國(guó)有林區(qū)在這方面的空白。首先,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,并剔除異常樣本。然后,通過(guò)比較不同模型的擬合精度,選出了擬合效果最佳的18個(gè)不同林分類型的最優(yōu)林分形高模型。接著,利用“刀切法”評(píng)估了這些模型的適用性。該模型系統(tǒng)可以用于編制吉林省重點(diǎn)國(guó)有林區(qū)林分形高表,表中樹高范圍可參考表2。在實(shí)際應(yīng)用中,如果林分平均高超過(guò)樹高最大值,則直接使用模型進(jìn)行推算。在過(guò)去的研究中,由于計(jì)算方法和計(jì)算工具的限制,為了便于計(jì)算,人們常常將樣本按徑階分類并以徑階平均值進(jìn)行模型擬合。此外,為了提高擬合度,還采用了以徑階樣本數(shù)量為權(quán)重進(jìn)行加權(quán)回歸,或?qū)σ蜃兞窟M(jìn)行轉(zhuǎn)換并使用轉(zhuǎn)換后的數(shù)值計(jì)算擬合度的方法。然而,這些方法都會(huì)影響擬合效果的真實(shí)性。在本研究中,直接使用全部樣本的原始數(shù)據(jù)進(jìn)行模型擬合,更符合實(shí)際情況。通過(guò)“刀切法”驗(yàn)證模型的準(zhǔn)確性,證明了采用全部數(shù)據(jù)擬合模型,并用“刀切法”驗(yàn)證模型的方法是可行的。傳統(tǒng)上,形高數(shù)學(xué)模型的擬合通常使用單一的數(shù)學(xué)模型。如果指標(biāo)符合要求,則認(rèn)為該數(shù)學(xué)模型適用于該類林分類型。然而,這種方法的局限性是明顯的。在研究中嘗試了不同的數(shù)學(xué)模型,包括指數(shù)、冪函數(shù)和二次多項(xiàng)式等,對(duì)不同類型的林分進(jìn)行擬合。這基本涵蓋了所有常見形高模型的種類。在多個(gè)數(shù)學(xué)模型都滿足要求的情況下,選擇最優(yōu)模型,從而增加了模型的預(yù)測(cè)精度和實(shí)用性。通常認(rèn)為回歸方程的相關(guān)性越高,擬合效果越好。對(duì)于數(shù)學(xué)模型來(lái)說(shuō),當(dāng)R2值在0.9以上時(shí),表示模型的因果關(guān)系較強(qiáng)。然而,在研究中,由于未考慮立地質(zhì)量等級(jí)對(duì)林分形高的影響以及數(shù)據(jù)的高離散程度,導(dǎo)致R2值偏低。為了更好地反映實(shí)際情況,隨著研究的進(jìn)展,我們有必要進(jìn)一步改進(jìn)林分形高模型。