• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      土壤有機(jī)質(zhì)含量高光譜遙感中的數(shù)據(jù)挖掘

      2009-06-22 06:55:08
      中國(guó)集體經(jīng)濟(jì) 2009年4期
      關(guān)鍵詞:數(shù)據(jù)挖掘算法

      唐 琨 周 清 劉 靜

      摘要:文章分析了數(shù)據(jù)挖掘技術(shù)在土壤有機(jī)質(zhì)含量高光譜遙感數(shù)據(jù)分析中的發(fā)展歷程以及目前所面臨的問(wèn)題;探討了聚類(lèi)、模糊集、粗集、神經(jīng)網(wǎng)絡(luò)、決策樹(shù)等數(shù)據(jù)挖掘算法在高光譜數(shù)據(jù)分析中的應(yīng)用;展望了數(shù)據(jù)挖掘技術(shù)的應(yīng)用前景。

      關(guān)鍵詞:數(shù)據(jù)挖掘;高光譜遙感;算法

      數(shù)據(jù)是客觀世界性質(zhì)、特征和狀態(tài)的描述,但由于客觀世界的復(fù)雜性和在數(shù)據(jù)產(chǎn)生過(guò)程中攜帶了一些和客觀無(wú)關(guān)的因素的干擾,使得數(shù)據(jù)產(chǎn)生了與客觀世界不一致的狀況,人們通常把這些干擾稱(chēng)為“誤差”,在信息科學(xué)中則稱(chēng)之為“噪聲”。根據(jù)信息理論,數(shù)據(jù)是由信息和噪聲共同組成的,只有當(dāng)數(shù)據(jù)中排除了“噪聲”之后,才能稱(chēng)為信息:信息=(數(shù)據(jù))-(噪聲或誤差)。在日常應(yīng)用中,大量的數(shù)據(jù)未能充分利用這一現(xiàn)象常常被描述為“數(shù)據(jù)豐富,但信息貧乏”。為此,決策者迫切需要從海量數(shù)據(jù)庫(kù)中提取有價(jià)值知識(shí)的工具,數(shù)據(jù)挖掘技術(shù)正是為滿(mǎn)足上述要求而產(chǎn)生的。

      土壤高光譜遙感數(shù)據(jù)就是這樣一種情況,在室內(nèi)土壤高光譜測(cè)試過(guò)程中,由于可控條件和不可控條件的變化,使得所得結(jié)果有一定的差異,如土壤的粒徑差異、測(cè)試土樣表面處理方法的不同、測(cè)試時(shí)幾何條件的差異等都會(huì)引起土壤光譜反射系數(shù)的不確定。同時(shí),高光譜遙感數(shù)據(jù)波段眾多,數(shù)據(jù)量龐大,這些給處理和解譯都帶來(lái)了很大困難,而數(shù)據(jù)挖掘技術(shù)能夠很好的解決這種情況。

      一、數(shù)據(jù)挖掘技術(shù)的發(fā)展

      (一)數(shù)據(jù)挖掘的產(chǎn)生發(fā)展

      數(shù)據(jù)挖掘其實(shí)是一個(gè)逐漸演變的過(guò)程,其思想可以追溯到20世紀(jì)70年代。隨著數(shù)據(jù)庫(kù)存儲(chǔ)技術(shù)和計(jì)算速度提高,科學(xué)研究人員意識(shí)到,還可以利用機(jī)器學(xué)習(xí)的方式來(lái)分析數(shù)據(jù)。機(jī)器學(xué)習(xí)的過(guò)程就是將一些已知的并已被成功解決的問(wèn)題作為范例輸入計(jì)算機(jī),機(jī)器通過(guò)學(xué)習(xí)這些范例總結(jié)并生成相應(yīng)的規(guī)則,這些規(guī)則具有通用性,使用它們可以解決某一類(lèi)的問(wèn)題。隨后,伴隨著神經(jīng)網(wǎng)絡(luò)技術(shù)的形成和發(fā)展,人們的注意力轉(zhuǎn)向知識(shí)工程。知識(shí)工程不同于機(jī)器學(xué)習(xí)那樣給計(jì)算機(jī)輸入范例,讓它生成出規(guī)則,而是直接給計(jì)算機(jī)輸入已被代碼化的規(guī)則,而計(jì)算機(jī)是通過(guò)使用這些規(guī)則來(lái)解決某些問(wèn)題。80年代末在美國(guó)底特律召開(kāi)的第11屆國(guó)際人工智能聯(lián)合會(huì)議的專(zhuān)題討論會(huì)上首次出現(xiàn)KDD(Knowledge discovery in database)這個(gè)術(shù)語(yǔ),人們接受了這個(gè)術(shù)語(yǔ),并用KDD來(lái)描述整個(gè)數(shù)據(jù)發(fā)掘的過(guò)程。隨后的KDD國(guó)際學(xué)術(shù)大會(huì)研究重點(diǎn)逐漸從發(fā)現(xiàn)方法轉(zhuǎn)向系統(tǒng)應(yīng)用,并且注重多種發(fā)現(xiàn)策略和技術(shù)的集成,以及多種學(xué)科之間的相互滲透,數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)成為當(dāng)前計(jì)算機(jī)科學(xué)界的一大熱點(diǎn)。隨著支持?jǐn)?shù)據(jù)挖掘技術(shù)發(fā)展,數(shù)據(jù)挖掘漸漸成為成熟的技術(shù),并在實(shí)際應(yīng)用中取得了良好效果。

      (二)數(shù)據(jù)挖掘所面臨的問(wèn)題

      由于數(shù)據(jù)挖掘時(shí)遇到的數(shù)據(jù)庫(kù)種類(lèi)繁多,且各種數(shù)據(jù)挖掘方法作用范圍有限,因此采用單一方法難以得到?jīng)Q策所需的各種知識(shí),多方法融合將成為數(shù)據(jù)挖掘的發(fā)展趨勢(shì)。而數(shù)據(jù)挖掘技術(shù)當(dāng)前所面臨的問(wèn)題主要有:如何進(jìn)行降維操作、高維數(shù)據(jù)索引、典型特征提取等;挖掘算法的表達(dá)和改進(jìn)創(chuàng)新;如何對(duì)挖掘產(chǎn)生的規(guī)則和模式進(jìn)行解釋與表達(dá),使其與信息處理的要求相關(guān)聯(lián)以得到應(yīng)用,并對(duì)挖掘的知識(shí)進(jìn)行客觀、科學(xué)的評(píng)價(jià),控制知識(shí)可靠性和質(zhì)量,實(shí)施有效管理;針對(duì)高光譜遙感信息的特點(diǎn),對(duì)數(shù)據(jù)挖掘任務(wù)的描述、算法功能模塊組織都是其中的關(guān)鍵問(wèn)題。

      二、數(shù)據(jù)挖掘的主要算法

      數(shù)據(jù)挖掘算法很多,結(jié)合不同的應(yīng)用領(lǐng)域又發(fā)展了一些新的方法,進(jìn)一步豐富和發(fā)展了數(shù)據(jù)挖掘的算法體系。數(shù)據(jù)挖掘可以采用的方法主要包括聚類(lèi)、空間分析、模糊集、粗集、神經(jīng)網(wǎng)絡(luò)、決策樹(shù)等。這些方法都有局限性,但它們的有機(jī)組合具有互補(bǔ)性,多方法融合將成為數(shù)據(jù)挖掘的發(fā)展趨勢(shì)。目前一些具有較好應(yīng)用效果的方法主要包括:

      (一)聚類(lèi)

      聚類(lèi)是把一組個(gè)體按照相似性歸納成若干類(lèi)別,即“物以類(lèi)聚”。它的目的是使得屬于同一類(lèi)別的個(gè)體之間的距離盡可能的小,而不同類(lèi)別上的個(gè)體間的距離盡可能的大。在實(shí)現(xiàn)其他挖掘任務(wù)之前,應(yīng)用聚類(lèi)方法可使挖掘精度與效率大大提高。聚類(lèi)方法包括統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法和面向數(shù)據(jù)庫(kù)的方法。由于高光譜遙感信息的海量特點(diǎn),聚類(lèi)是一種有效的挖掘算法。通過(guò)將信息從光譜維和空間維進(jìn)行聚類(lèi),挖掘隱含在其中的規(guī)則和知識(shí),對(duì)于解決波段選擇、特征提取、純凈象元識(shí)別等問(wèn)題,具有明顯的優(yōu)越性。由于聚類(lèi)僅是實(shí)現(xiàn)對(duì)目標(biāo)的集群分析,而對(duì)不同集群的屬性和特征進(jìn)行挖掘才能取得更好的效果,因此聚類(lèi)一般要和其他算法結(jié)合進(jìn)行。

      (二)人工神經(jīng)網(wǎng)絡(luò)(ANN)

      神經(jīng)網(wǎng)絡(luò)是數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)非常重要的方法,包括前向神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)、反饋神經(jīng)網(wǎng)絡(luò)等已都得到了重視和應(yīng)用。另一方面,人工神經(jīng)網(wǎng)絡(luò)也在高光譜遙感信息中得到了一些應(yīng)用。神經(jīng)網(wǎng)絡(luò)常用于兩類(lèi)問(wèn)題:分類(lèi)和回歸。神經(jīng)網(wǎng)絡(luò)的參數(shù)可以比統(tǒng)計(jì)方法多很多。由于參數(shù)如此之多,參數(shù)通過(guò)各種各樣的組合方式來(lái)影響輸出結(jié)果,以至于很難對(duì)一個(gè)神經(jīng)網(wǎng)絡(luò)表示的模型做出直觀的解釋。實(shí)際上神經(jīng)網(wǎng)絡(luò)也正是當(dāng)作“黑盒”來(lái)用的,不用去管“盒子”里面是什么,只管用就行了。人工神經(jīng)網(wǎng)絡(luò)有望在高光譜遙感數(shù)據(jù)挖掘中得到廣泛應(yīng)用。

      (三)粗集理論和模糊理論

      在數(shù)據(jù)挖掘中,從實(shí)際系統(tǒng)采集到的數(shù)據(jù)可能包含各種噪聲,存在許多不確定因素和不完全信息有待處理。傳統(tǒng)的不確定信息處理方法因需要數(shù)據(jù)的附加信息或先驗(yàn)知識(shí)(難以得到),有時(shí)在處理大數(shù)據(jù)量的數(shù)據(jù)庫(kù)方面無(wú)能為力。粗集作為一種軟計(jì)算方法,可以克服傳統(tǒng)不確定處理方法的不足,并且和它們能有機(jī)結(jié)合,可望進(jìn)一步增強(qiáng)對(duì)不確定、不完全信息的處理能力。粗集理論中,知識(shí)被定義為對(duì)事物的分類(lèi)能力。這種能力由上近似集、下近似集、等價(jià)關(guān)系等概念體現(xiàn)。因?yàn)榇旨幚淼膶?duì)象是類(lèi)似二維關(guān)系表的信息表(決策表)。目前成熟的關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)和新發(fā)展起來(lái)的數(shù)據(jù)倉(cāng)庫(kù)管理系統(tǒng),為粗集的數(shù)據(jù)挖掘奠定了堅(jiān)實(shí)的基礎(chǔ)。

      (四)決策樹(shù)

      決策樹(shù)提供了一種展示類(lèi)似在什么條件下會(huì)得到什么值這類(lèi)規(guī)則的方法。決策樹(shù)的基本組成部分為決策節(jié)點(diǎn)、分支和葉子。決策樹(shù)中最上面的節(jié)點(diǎn)稱(chēng)為根節(jié)點(diǎn),是整個(gè)決策樹(shù)的開(kāi)始。決策樹(shù)的每個(gè)節(jié)點(diǎn)子節(jié)點(diǎn)的個(gè)數(shù)與決策樹(shù)所用的算法有關(guān)。每個(gè)分支要么是一個(gè)新的決策節(jié)點(diǎn),要么是樹(shù)的結(jié)尾,稱(chēng)為葉子。在沿著決策樹(shù)從上到下遍歷的過(guò)程中,在每個(gè)節(jié)點(diǎn)都會(huì)遇到一個(gè)問(wèn)題,對(duì)每個(gè)節(jié)點(diǎn)上問(wèn)題的不同回答導(dǎo)致不同的分支,最后會(huì)到達(dá)一個(gè)葉子節(jié)點(diǎn)。這個(gè)過(guò)程就是利用決策樹(shù)進(jìn)行分類(lèi)的過(guò)程,利用幾個(gè)變量(每個(gè)變量對(duì)應(yīng)一個(gè)問(wèn)題)來(lái)判斷所屬的類(lèi)別(最后每個(gè)葉子會(huì)對(duì)應(yīng)一個(gè)類(lèi)別)。數(shù)據(jù)挖掘中,決策樹(shù)是一種經(jīng)常要用到的技術(shù),可以用于分析數(shù)據(jù),同樣也可以用來(lái)作預(yù)測(cè)。決策樹(shù)在高光譜遙感信息分類(lèi)、典型信息提取等任務(wù)中都得到了應(yīng)用,在高光譜遙感數(shù)據(jù)挖掘中,決策樹(shù)學(xué)習(xí)可以建立對(duì)特定應(yīng)用敏感的知識(shí)集,以指導(dǎo)挖掘過(guò)程的進(jìn)行。

      三、發(fā)展前景

      從目前高光譜遙感信息處理與應(yīng)用情況來(lái)看,高光譜遙感數(shù)據(jù)挖掘?qū)⒃谥悄苄畔⑻幚砗透咚綉?yīng)用方面發(fā)揮重要作用,以下對(duì)其潛在應(yīng)用領(lǐng)域進(jìn)行分析。

      (一)典型信息提取與識(shí)別

      通過(guò)對(duì)標(biāo)準(zhǔn)地物波譜數(shù)據(jù)庫(kù)、典型高光譜信息源等的挖掘,建立和發(fā)現(xiàn)對(duì)特定信息、特征和現(xiàn)象提取有效的規(guī)則和知識(shí),以直接應(yīng)用于目標(biāo)信息的提取與識(shí)別。

      (二)定量遙感與遙感反演

      高光譜遙感信息是定量遙感如成因礦物學(xué)、作物養(yǎng)分監(jiān)測(cè)、植被監(jiān)測(cè)、生態(tài)遙感等的基礎(chǔ),其中隱含的規(guī)則和知識(shí)也是遙感反演如地面組分反演、陸面溫度反演等的基礎(chǔ)。數(shù)據(jù)挖掘發(fā)現(xiàn)的知識(shí)可以建立相應(yīng)的決策規(guī)則和專(zhuān)題知識(shí)。

      (三)高光譜分類(lèi)與亞像元分解

      分類(lèi)是遙感應(yīng)用的重要環(huán)節(jié),基于知識(shí)的自動(dòng)分類(lèi)目前是遙感分類(lèi)的熱點(diǎn)?;谥R(shí)的高光譜遙感分類(lèi)的基礎(chǔ)是領(lǐng)域知識(shí),而這正是數(shù)據(jù)挖掘的優(yōu)勢(shì)所在。亞像元分解與混合像元分類(lèi)是高光譜遙感信息處理的重要內(nèi)容,數(shù)據(jù)挖掘在純凈像元提取及分解知識(shí)與規(guī)則發(fā)現(xiàn)方面可以發(fā)揮作用。

      (四)特征提取與最優(yōu)特征組合選擇

      實(shí)現(xiàn)面向應(yīng)用的特征提取與最優(yōu)特征組合對(duì)于充分應(yīng)用高光譜信息、減少信息冗余、提高處理效率具有重要作用,也是目前高光譜應(yīng)用中的主要模式之一。隨著研究的深入,可以預(yù)言數(shù)據(jù)挖掘在高光譜遙感信息處理與應(yīng)用中將可以發(fā)揮更加深入和重要的作用,促進(jìn)高光譜遙感的快速發(fā)展和廣泛應(yīng)用。

      參考文獻(xiàn):

      1、Fu L M.Rule generation from neural networks[J].IEEE Trans onSystems,Man and Cybernetics,1994(8).

      2、Towell G,Shavlik.The extraction of refined rules from knowledgebased neural networks[J].Maching Learning,1993(1).

      3、袁曾任,盧振中.由神經(jīng)網(wǎng)絡(luò)提取規(guī)則的一種方法[J].信息與控制,1997(1).

      4、劉振凱,貴忠華,蔡青.基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)的知識(shí)求精方法[J].計(jì)算機(jī)研究與發(fā)展,1999(10).

      5、張朝輝.利用神經(jīng)網(wǎng)絡(luò)發(fā)現(xiàn)分類(lèi)規(guī)則[J].計(jì)算機(jī)學(xué)報(bào),1999(1).

      6、黃源,蕭嶸,張福炎.神經(jīng)網(wǎng)絡(luò)的規(guī)則提取研究[J].計(jì)算機(jī)研究與發(fā)展,1999(9).

      7、Tu Peilei,Chung Jenyao.A new decision2tree classification algorithm for machine learning[C]. In Proceedings of the 1992 IEEE International Conference on Tools for Artificial Intelligence. Arlington , VA ,Quinlan J R. Induction of Decision Trees[M].Machine Learning,1986.

      8、劉小虎,李生.決策樹(shù)的優(yōu)化算法[J].軟件學(xué)報(bào),1998(10).

      9、洪家榮,丁明峰,李星原等.一種新的決策樹(shù)歸納學(xué)習(xí)算法[J].計(jì)算機(jī)學(xué)報(bào),1995(6).

      10、Schlimmer J C, Fisher D. A case study of incremental concept induction [C].In Proceedings of AAAI286,1986.

      11、苗奪謙,王玨.基于粗糙集的多變量決策樹(shù)構(gòu)造方法[J].軟件學(xué)報(bào),1997(6).

      12、劉興華.數(shù)據(jù)挖掘技術(shù)及其應(yīng)用研究[J].遼寧師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2002(2).

      13、于金龍,李曉紅,孫立新.連續(xù)屬性的整體離散化[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2000(3).

      14、李永敏,朱善君,陳湘暉等.根據(jù)粗糙集理論進(jìn)行BP網(wǎng)絡(luò)設(shè)計(jì)的研究[J].系統(tǒng)工程理論與實(shí)踐,1999(4).

      (作者單位:湖南農(nóng)業(yè)大學(xué)資源環(huán)境學(xué)院土地資源利用與信息技術(shù)專(zhuān)業(yè))

      猜你喜歡
      數(shù)據(jù)挖掘算法
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      基于MapReduce的改進(jìn)Eclat算法
      Travellng thg World Full—time for Rree
      進(jìn)位加法的兩種算法
      算法初步兩點(diǎn)追蹤
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      基于增強(qiáng)隨機(jī)搜索的OECI-ELM算法
      數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
      一種改進(jìn)的整周模糊度去相關(guān)算法
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      阳西县| 化德县| 克拉玛依市| 泰顺县| 陆丰市| 伊春市| 禹城市| 瓮安县| 东阿县| 民和| 旺苍县| 文化| 嵩明县| 随州市| 大荔县| 乌拉特前旗| 迭部县| 大名县| 寿光市| 利津县| 衡阳市| 娱乐| 治县。| 林州市| 逊克县| 沈阳市| 化州市| 泰宁县| 张家港市| 株洲市| 都江堰市| 大渡口区| 界首市| 大英县| 淳安县| 江川县| 姜堰市| 青神县| 吴桥县| 龙里县| 喜德县|