潘明哲
( 黑龍江省自然資源權(quán)益調(diào)查監(jiān)測院,黑龍江 哈爾濱150000)
森林資源, 從廣義講是指林木、 竹類和林區(qū)范圍內(nèi)其他植物、動(dòng)物、微生物、林地資源和環(huán)境資源的總稱,從狹義講是指以喬木為主體的森林植物組成部分。 森林資源經(jīng)營是為取得森林多種效益,通過計(jì)劃、組織、指揮、協(xié)調(diào)和控制,對一地域內(nèi)的森林資源及相關(guān)因素進(jìn)行籌劃和控制的過程。 森林資源分布的地域性以及資源本身所具有的空間屬性決定了森林資源信息必須應(yīng)用數(shù)據(jù)挖掘技術(shù),才能更合理、直觀、及時(shí)和動(dòng)態(tài)地監(jiān)測和預(yù)測森林資源的動(dòng)態(tài)變化,取得更好的經(jīng)營效果和效益。
在當(dāng)前的大數(shù)據(jù)時(shí)代下, 數(shù)據(jù)挖掘技術(shù)在各個(gè)行業(yè)范圍內(nèi)都起到了重要作用。 該技術(shù)結(jié)合了現(xiàn)代尖端的人工智能、 數(shù)據(jù)分析、數(shù)據(jù)庫以及信息識別系統(tǒng)等多種技術(shù)手段,滿足市場變化范圍的各個(gè)領(lǐng)域的基本需求。 在當(dāng)前的發(fā)展情況下, 這種大數(shù)據(jù)模式對于數(shù)據(jù)發(fā)掘來說,不僅是一個(gè)快速發(fā)展的機(jī)會,也是一個(gè)挑戰(zhàn)。 在這種背景下,數(shù)據(jù)挖掘技術(shù)也在不斷的摸索,調(diào)整技術(shù)的運(yùn)轉(zhuǎn)體系,對數(shù)據(jù)進(jìn)行更準(zhǔn)確的分析,提高其準(zhǔn)確性與處理效率,不斷地進(jìn)行優(yōu)化,使其應(yīng)用的領(lǐng)域更加廣泛。
在一般情況下的數(shù)據(jù)挖掘分析當(dāng)中, 大致分為以下八個(gè)步驟: 第一步信息收集,在初步確定數(shù)據(jù)分析對象后,對其中的具體數(shù)據(jù)內(nèi)容信息進(jìn)行選定,再選擇適當(dāng)?shù)氖占绞剑瑢?shù)據(jù)進(jìn)行篩選儲存,將其準(zhǔn)確的輸入的數(shù)據(jù)庫當(dāng)中。 第二步數(shù)據(jù)集成,將不同類型、格式的數(shù)據(jù)進(jìn)行分類數(shù)據(jù)化處理,在分析時(shí),能夠?yàn)槠涮峁?shù)據(jù)共享的便利條件。 第三步數(shù)據(jù)規(guī)約, 這一步的目的實(shí)際上是提高數(shù)據(jù)的處理時(shí)間, 提高效率與準(zhǔn)確率。 通過技術(shù)的內(nèi)部運(yùn)轉(zhuǎn),進(jìn)行數(shù)據(jù)規(guī)約處理,在保證原數(shù)據(jù)的準(zhǔn)確性與完整性的同時(shí),精確了數(shù)據(jù)挖掘的結(jié)果。 第四步數(shù)據(jù)清理,在數(shù)據(jù)的收集輸入當(dāng)中,也會存在一些數(shù)據(jù)不準(zhǔn)確、部分缺失的問題,為了保證數(shù)據(jù)挖掘技術(shù)的準(zhǔn)確性,對于這部分?jǐn)?shù)據(jù)應(yīng)進(jìn)行數(shù)據(jù)清理,將準(zhǔn)確、完整、統(tǒng)一的數(shù)據(jù)錄入其中。 第五步數(shù)據(jù)變換,準(zhǔn)確來說是對數(shù)據(jù)的形式進(jìn)行變化,統(tǒng)一其形式,為數(shù)據(jù)發(fā)掘分析提供便利。 第六步數(shù)據(jù)挖掘的過程,根據(jù)數(shù)據(jù)庫中的信息,應(yīng)用適當(dāng)?shù)奶幚砉ぞ吲c方法,挖掘出重要的信息。第七步模式評估,對于數(shù)據(jù)挖掘的結(jié)果,有第三方專業(yè)人員介入進(jìn)行驗(yàn)證評估。 第八步知識表示,將數(shù)據(jù)挖掘評估后的結(jié)果,轉(zhuǎn)化為用戶可視化的信息模式,供其參考應(yīng)用。 數(shù)據(jù)挖掘的過程是比較漫長的,且環(huán)節(jié)步驟比較多,我們需要嚴(yán)格把控各個(gè)環(huán)節(jié),保證數(shù)據(jù)挖掘結(jié)果的準(zhǔn)確性。
隨著數(shù)據(jù)挖掘技術(shù)不斷優(yōu)化、內(nèi)容的不斷豐富,所適用范圍也越來越廣泛,涉及到的數(shù)據(jù)信息內(nèi)容不僅量大,種類也比較多。 隨著科技水平的不斷發(fā)展與提升,數(shù)據(jù)挖掘系統(tǒng)中分類、識別、預(yù)測、基礎(chǔ)預(yù)測等功能都有所提升,挖掘的對象內(nèi)容也在不斷的擴(kuò)大。 在大數(shù)據(jù)與互聯(lián)網(wǎng)+ 的大時(shí)代背景下,數(shù)據(jù)挖掘技術(shù)從這個(gè)角度上也順應(yīng)了時(shí)代的發(fā)展,再加上未來信息通信技術(shù)的結(jié)合,數(shù)據(jù)挖掘技術(shù)的發(fā)展是非??陀^的。
神經(jīng)網(wǎng)絡(luò)通常是與數(shù)學(xué)模型共同結(jié)合, 執(zhí)行功能計(jì)算處理的,該挖掘方法是在十九世紀(jì)五十年代由國外的物理學(xué)家與數(shù)學(xué)學(xué)家共同創(chuàng)建的。 這種數(shù)據(jù)挖掘方法自身的兼容性、適用性、組織能力以及數(shù)據(jù)處理等性能都比較好,可以識別、預(yù)測的數(shù)據(jù)類型也比較多。 通過網(wǎng)絡(luò)神經(jīng)單元的處理,進(jìn)行了非線性的新型計(jì)算處理,大幅度提升了數(shù)據(jù)的挖掘速率。 但是該方法也存在缺點(diǎn),就是對于用戶來說,這種神經(jīng)網(wǎng)絡(luò)比較空洞,對于挖掘的過程相對茫然。
隨著科技水平的不斷發(fā)展,決策樹法也逐漸在更新優(yōu)化,推出了不同類型的算法,例如:ID3、C4.5。 該方法適用于預(yù)測類的數(shù)據(jù)計(jì)算,能夠?qū)?shù)據(jù)進(jìn)行有效的分類,并從中快速獲取有價(jià)值的信息,進(jìn)行數(shù)據(jù)分類與基本描述,在數(shù)據(jù)挖掘當(dāng)中,更適合規(guī)模較大的數(shù)據(jù)處理。 并且分類算法之間的關(guān)聯(lián)性比較強(qiáng),在此基礎(chǔ)上,數(shù)據(jù)處理的限制屬性也比較弱,挖掘的結(jié)果也便于用戶的理解。
貝葉斯分類法是一種算法簡單且精準(zhǔn)度較高的分類算法,當(dāng)前可以分樸素貝葉斯算法與動(dòng)態(tài)貝葉斯算法等。 從分類的功能上來看,該方法與決策樹和神經(jīng)網(wǎng)絡(luò)法之間,有著緊密的聯(lián)系。 與其它方法不同的是,該方法不是獨(dú)立存在的,通常以模塊處理器組合的方式呈現(xiàn)出來。 在精準(zhǔn)度與數(shù)據(jù)處理上,都優(yōu)于其它方法,并且對于數(shù)據(jù)的處理更加全面,能夠通過信息處理、自動(dòng)控制和識別系統(tǒng)來進(jìn)行多范疇的共同運(yùn)作,更能體現(xiàn)挖掘技術(shù)的基本性質(zhì)。
森林資源經(jīng)營中,最重要的就是森林資源的質(zhì)量,這就需要對森林資源進(jìn)行實(shí)時(shí)監(jiān)測,了解其基本情況,這樣對森林的成長狀態(tài)和森林資源的經(jīng)營狀況也能有所了解。 森林資源范圍比較廣,在監(jiān)測上工作難度比較大,且需要調(diào)查統(tǒng)計(jì)的數(shù)據(jù)也比較多,傳統(tǒng)的數(shù)據(jù)調(diào)查模式,不僅費(fèi)時(shí)費(fèi)力,信息的準(zhǔn)確程度也相對較低。 但應(yīng)用數(shù)據(jù)挖掘技術(shù), 可以更好的實(shí)現(xiàn)對數(shù)據(jù)的統(tǒng)計(jì), 并且通過決策樹或是神經(jīng)網(wǎng)絡(luò)的方法不僅調(diào)查起來耗時(shí)短、準(zhǔn)確率高,數(shù)據(jù)的結(jié)果也更加清晰,為監(jiān)測工作提供了便利。
林木的生長在一般情況下,都是呈周期性規(guī)則變化的,通過數(shù)據(jù)挖掘技術(shù)可以將林木的生長情況進(jìn)行系統(tǒng)的數(shù)據(jù)分析,以數(shù)據(jù)的形式對林木未來的成長趨勢進(jìn)行預(yù)測,并針對其未來的成長趨勢做出相應(yīng)的培養(yǎng)方案,促使林木的生長更加健康。 并通過貝葉斯分類法,將林木的狀況進(jìn)行基本的分類,以此來實(shí)現(xiàn)森林資源經(jīng)營效益。
相應(yīng)促進(jìn)森林資源的健康發(fā)展, 就要了解林木容易出現(xiàn)的問題,并對此做出相應(yīng)的措施防護(hù)。 其中包括:森林的防火和防蟲害工作,森林火災(zāi)是一種常見的自然災(zāi)害,發(fā)生的頻率比較高,且一般呈現(xiàn)蔓延的趨勢,人們大多時(shí)候不能及時(shí)的發(fā)現(xiàn)。 但是通過數(shù)據(jù)發(fā)掘技術(shù),可以通過計(jì)算機(jī)對比數(shù)據(jù)的變化,并且在出現(xiàn)火災(zāi)情況后,也會及時(shí)預(yù)警。 而防蟲害則是通過對比林木的健康數(shù)據(jù)實(shí)現(xiàn)的,通過數(shù)據(jù)挖掘技術(shù)的及時(shí)反應(yīng),能夠?qū)ζ渥龀黾皶r(shí)的防護(hù),避免造成更大的經(jīng)濟(jì)損失,增強(qiáng)森林資源的經(jīng)營效益。
我國大部分森林資源的范圍都比較廣闊, 且資源內(nèi)容較為豐富,傳統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)不能滿足當(dāng)前的經(jīng)營需求,呈現(xiàn)出一種盲視感。 通過數(shù)據(jù)挖掘技術(shù)的實(shí)踐證明,對于數(shù)據(jù)的統(tǒng)計(jì),該技術(shù)手段的優(yōu)勢更大,結(jié)合GIS 和GPS 的雙定位技術(shù),數(shù)據(jù)信息的特征會更加明顯,數(shù)據(jù)的規(guī)律性也更強(qiáng),增強(qiáng)了森林資源的可視化,進(jìn)一步擴(kuò)大了森林資源的經(jīng)營優(yōu)勢。
總而言之,面對復(fù)雜的森林資源狀況,數(shù)據(jù)挖掘技術(shù)的應(yīng)用必不可少,想要該技術(shù)得到更全面的應(yīng)用,相關(guān)人員也該對技術(shù)的流程、內(nèi)容、系統(tǒng)以及處理模式進(jìn)一步分析,為森林資源的經(jīng)營提供更有價(jià)值的技術(shù)支持。