姜峰
【摘要】隨著科學(xué)技術(shù)的進(jìn)步,信息技術(shù)逐漸地成為了推動(dòng)各行各業(yè)發(fā)展過程中的重要驅(qū)動(dòng)力。而數(shù)據(jù)挖掘技術(shù)就是屬于信息技術(shù)發(fā)展到一定階段的產(chǎn)物,并且數(shù)據(jù)挖掘技術(shù)也標(biāo)志著人類對(duì)于數(shù)據(jù)庫技術(shù)深入的研究和開發(fā)。從數(shù)據(jù)庫技術(shù)發(fā)展的歷程來看,在初期就是簡單地將各類信息數(shù)據(jù)儲(chǔ)存于數(shù)據(jù)庫中,而隨著數(shù)據(jù)挖掘技術(shù)的出現(xiàn)用戶就可以更好地通過這種技術(shù),查詢和篩選數(shù)據(jù)庫中的各類數(shù)據(jù),并且在此基礎(chǔ)上探究出各數(shù)據(jù)之間的關(guān)系。正因如此,數(shù)據(jù)挖掘技術(shù)也被逐漸應(yīng)用于地理信息系統(tǒng)中。同時(shí)通過數(shù)據(jù)挖掘技術(shù)的應(yīng)用,更好地在基于信息系統(tǒng)中挖掘出各數(shù)據(jù)之間的聯(lián)系,推動(dòng)地理信息系統(tǒng)的發(fā)展進(jìn)步。
【關(guān)鍵詞】數(shù)據(jù)挖掘技術(shù);地理信息系統(tǒng);應(yīng)用
【DOI】10.12334/j.issn.1002-8536.2022.08.017
引言:
隨著互聯(lián)網(wǎng)的發(fā)展和普及,當(dāng)前我國社會(huì)已經(jīng)邁入了信息化的時(shí)代。各類信息技術(shù)的應(yīng)用使得我國國民生產(chǎn)生活水平都得到了極大提升,并且各行各業(yè)也逐漸構(gòu)建起了信息化的發(fā)展模式。地理信息系統(tǒng)就是一種可以通過構(gòu)建地理信息數(shù)據(jù)庫的方式更加高效地進(jìn)行地理信息提供的技術(shù)類型,社會(huì)中各領(lǐng)域的發(fā)展都需要依托于地理信息系統(tǒng)。而在傳統(tǒng)的地理信息系統(tǒng)中,很難對(duì)各項(xiàng)數(shù)據(jù)背后的關(guān)系進(jìn)行自動(dòng)化分析,這也就使地理信息系統(tǒng)的發(fā)展受到了一定的限制。而當(dāng)前時(shí)期通過數(shù)據(jù)挖掘技術(shù)的應(yīng)用,就可以讓地理信息系統(tǒng)更加高效地挖掘數(shù)據(jù)蘊(yùn)含的關(guān)系和規(guī)則,從而預(yù)測(cè)未來發(fā)展的方向,充分發(fā)揮出地理數(shù)據(jù)的作用。
1、數(shù)據(jù)挖掘技術(shù)的概念和工作流程
1.1數(shù)據(jù)挖掘技術(shù)的概念
數(shù)據(jù)挖掘技術(shù)就是一種從大量復(fù)雜的數(shù)據(jù)中,提取出人類社會(huì)發(fā)展所需信息的一種信息技術(shù)類型,并且通過這一技術(shù)的應(yīng)用還可以預(yù)測(cè)出數(shù)據(jù)未來的發(fā)展方向。隨著科學(xué)技術(shù)的高速發(fā)展,當(dāng)前我國各領(lǐng)域都建立起了相應(yīng)的信息化數(shù)據(jù)庫管理系統(tǒng)。在這些數(shù)據(jù)庫中所蘊(yùn)含的信息數(shù)量也在不斷增長,其背后包含的信息都有著相應(yīng)的規(guī)律。當(dāng)前數(shù)據(jù)庫技術(shù)可以高效實(shí)現(xiàn)數(shù)據(jù)的錄入和查詢,但是難以準(zhǔn)確分析數(shù)據(jù)背后的規(guī)律,并且也無法對(duì)于這些數(shù)據(jù)未來的發(fā)展趨勢(shì)做出正確的判斷。在這一過程中以數(shù)據(jù)挖掘技術(shù)為基礎(chǔ),根據(jù)預(yù)設(shè)的目標(biāo)對(duì)于數(shù)據(jù)庫內(nèi)的有關(guān)數(shù)據(jù)進(jìn)行準(zhǔn)確分析和判斷,能夠挖掘出信息數(shù)據(jù)背后蘊(yùn)含的本質(zhì)。
1.2數(shù)據(jù)挖掘的工作流程
數(shù)據(jù)挖掘技術(shù)在工作過程中,主要就是包括在特定的數(shù)據(jù)庫中通過相應(yīng)的算法提取相關(guān)數(shù)據(jù),然后在此基礎(chǔ)之上處理挖掘出來的數(shù)據(jù)按照預(yù)測(cè)方案,以及進(jìn)行相應(yīng)的結(jié)果表達(dá)。在這一過程中,往往需要多次重復(fù)工作流程,在具體應(yīng)用過程中,主要可以劃分為以下幾個(gè)方面。第一,設(shè)定數(shù)據(jù)挖掘的目標(biāo)。在正式開展數(shù)據(jù)挖掘之前,工作人員必須定義數(shù)據(jù)挖掘的目標(biāo),并且這一目標(biāo)的定義是否科學(xué)合理,直接關(guān)系到數(shù)據(jù)挖掘工作的工作質(zhì)量。因此,在開展工作時(shí)必須有足夠數(shù)量專業(yè)技術(shù)人員,由專業(yè)技術(shù)人員和用戶之間進(jìn)行協(xié)同合作,以工作實(shí)際需求為基礎(chǔ),制定出科學(xué)合理的數(shù)據(jù)挖掘方案以及算法。第二,數(shù)據(jù)準(zhǔn)備。數(shù)據(jù)準(zhǔn)備是數(shù)據(jù)挖掘過程中最為重要的組成部分,在開展數(shù)據(jù)準(zhǔn)備工作時(shí),首先應(yīng)當(dāng)從已有的數(shù)據(jù)庫內(nèi)進(jìn)行數(shù)據(jù)提取,然后再初步處理這些提取的數(shù)據(jù),使之滿足數(shù)據(jù)挖掘技術(shù)工作的實(shí)際需求。最后就是對(duì)于這些數(shù)據(jù)進(jìn)行變換,讓這些數(shù)據(jù)可以擁有一定的特征,從而提高整體工作效率。第三,數(shù)據(jù)挖掘階段。在這一階段主要就是實(shí)際的數(shù)據(jù)挖掘工作,根據(jù)具體的需求出發(fā)選擇合適的數(shù)據(jù)挖掘算法,挖掘出相應(yīng)的數(shù)據(jù)。第四,對(duì)于結(jié)果的解釋和評(píng)估。在完成數(shù)據(jù)挖掘之后,就需要根據(jù)用戶預(yù)設(shè)的目標(biāo)詳細(xì)分析挖掘出的數(shù)據(jù)。并且在這一過程中,還應(yīng)當(dāng)盡量將分析的結(jié)果進(jìn)行簡單化處理,從而更好地方便用戶的實(shí)際使用需求,具體流程為圖1。
2、地理信息系統(tǒng)的概念和功能
地理信息系統(tǒng)又被稱之為地學(xué)信息系統(tǒng),屬于一種具有較強(qiáng)特點(diǎn)的空間信息系統(tǒng)。地理信息系統(tǒng)的運(yùn)行主要是在計(jì)算機(jī)硬件和軟件共同配合的基礎(chǔ)上,對(duì)于地球表面的地理信息進(jìn)行收集、存儲(chǔ)、運(yùn)算、分類、管理以及分析等功能的技術(shù)系統(tǒng)。所以地理信息系統(tǒng)對(duì)于地理空間數(shù)據(jù)的分析起到了非常重要的作用,當(dāng)前逐漸成為我國各地區(qū)開展地理工作時(shí)的重要工具。地理信息系統(tǒng)本質(zhì)上是多學(xué)科交叉產(chǎn)生的,以地理學(xué)為基礎(chǔ)采取地理模型的分析方法,并結(jié)合計(jì)算機(jī)技術(shù)進(jìn)行數(shù)據(jù)分析,從而更加廣泛地為不同領(lǐng)域提供實(shí)時(shí)地理信息,其組成主要為圖二所示。
地理信息系統(tǒng)作為近些年來發(fā)展十分迅速的一種信息分析技術(shù),在各領(lǐng)域中都有著非常廣泛的應(yīng)用。當(dāng)前,我國地理信息系統(tǒng)主要是應(yīng)用于資源與環(huán)境保護(hù)的領(lǐng)域中。通過地理信息系統(tǒng)的應(yīng)用,更好地做好對(duì)各類資源管理和使用的決策,還可以更好地對(duì)于不同時(shí)期同一區(qū)域的環(huán)境變化進(jìn)行監(jiān)測(cè)和分析比較,為解決當(dāng)前資源利用和環(huán)境保護(hù)問題提供了有力的支持。
3、地理信息系統(tǒng)中的數(shù)據(jù)挖掘技術(shù)
地理信息系統(tǒng)是地理空間數(shù)據(jù)庫發(fā)展的重要基礎(chǔ),在地理空間數(shù)據(jù)庫中包含了非常多的地理數(shù)據(jù)和空間數(shù)據(jù),因此地理空間數(shù)據(jù)庫的復(fù)雜程度也遠(yuǎn)超于其他數(shù)據(jù)庫。采取傳統(tǒng)的數(shù)據(jù)庫運(yùn)行模式,很難提取各類繁雜數(shù)據(jù)背后蘊(yùn)含的本質(zhì)信息。而通過數(shù)據(jù)挖掘技術(shù)的應(yīng)用,就可以使得地理信息系統(tǒng)自動(dòng)學(xué)習(xí)和獲取信息數(shù)據(jù),數(shù)據(jù)挖掘技術(shù)應(yīng)用如圖三所示。
正是由于地理信息系統(tǒng)中數(shù)據(jù)庫包含了大量以及復(fù)雜的數(shù)據(jù),因此在地理信息系統(tǒng)應(yīng)用過程中,如何將這些數(shù)據(jù)類蘊(yùn)含的重要信息進(jìn)行提取和識(shí)別,成為當(dāng)前發(fā)展的重點(diǎn)內(nèi)容。通過數(shù)據(jù)挖掘技術(shù)在地理信息系統(tǒng)數(shù)據(jù)處理環(huán)節(jié)中的應(yīng)用,就可以提高地理信息系統(tǒng)的數(shù)據(jù)處理的工作質(zhì)量,讓原有的查詢和數(shù)據(jù)分析的功能得到提升。在地理信息系統(tǒng)的數(shù)據(jù)庫中有著非常復(fù)雜的知識(shí)分布,通過人力往往只能在數(shù)據(jù)庫中獲取淺層知識(shí),但是數(shù)據(jù)庫中所蘊(yùn)含的深層知識(shí)就難以被提取,往往需要非常復(fù)雜的提煉過程才可以獲取各類深層知識(shí)。而在社會(huì)發(fā)展過程中地理信息系統(tǒng)蘊(yùn)含的深層知識(shí)才是最為重要的內(nèi)容,通過數(shù)據(jù)挖掘技術(shù)可以更好地探究出數(shù)據(jù)庫中蘊(yùn)含的深層知識(shí),利用地理信息系統(tǒng)為社會(huì)的發(fā)展服務(wù)。并且還可以從原有的數(shù)據(jù)中發(fā)現(xiàn)更多全新的知識(shí),將這些新知識(shí)拓展到原有的數(shù)據(jù)庫內(nèi),不斷拓展提升地理信息系統(tǒng)的數(shù)據(jù)庫,為地理信息系統(tǒng)的進(jìn)一步發(fā)展提供支持。
4、數(shù)據(jù)挖掘技術(shù)的挖掘方法
4.1以關(guān)聯(lián)規(guī)則為基礎(chǔ)進(jìn)行數(shù)據(jù)分析
從當(dāng)前我國數(shù)據(jù)挖掘技術(shù)應(yīng)用的實(shí)際情況來看,在大多數(shù)地理信息系統(tǒng)中進(jìn)行數(shù)據(jù)挖掘技術(shù)的應(yīng)用,都是以關(guān)聯(lián)規(guī)則為基礎(chǔ)進(jìn)行數(shù)據(jù)的挖掘和分析。在這一過程中,需要技術(shù)人員準(zhǔn)確探究出相應(yīng)的關(guān)聯(lián)規(guī)則,盡可能地將各類對(duì)實(shí)際結(jié)果影響較小的規(guī)則排除,從而確保挖掘出來的數(shù)據(jù)更加準(zhǔn)確。但是在開展實(shí)際數(shù)據(jù)挖掘分析過程中,仍然會(huì)產(chǎn)生一定數(shù)量的無關(guān)規(guī)則。如果產(chǎn)生的無關(guān)規(guī)則符合實(shí)際需求就可保留。通過關(guān)聯(lián)規(guī)則的方式開展數(shù)據(jù)挖掘分析,可以確保挖掘出來的數(shù)據(jù)符合用戶要求,并且還可以更好地探究出數(shù)據(jù)背后蘊(yùn)含的本質(zhì)。
4.2以屬性相關(guān)為基礎(chǔ)進(jìn)行分析
在地理信息系統(tǒng)中進(jìn)行數(shù)據(jù)的挖掘,以信息的屬性為基礎(chǔ)開展數(shù)據(jù)的分析工作,可以篩選出數(shù)據(jù)庫中本質(zhì)屬性相關(guān)的各類信息,提高整體工作效率。并且在通過數(shù)據(jù)挖掘技術(shù)進(jìn)行屬性分析時(shí),還需要通過一些特定的方式來實(shí)現(xiàn)。一般情況下,都是將數(shù)據(jù)的類別進(jìn)行劃分后探究出各數(shù)據(jù)之間存在的關(guān)聯(lián)關(guān)系,以此為基礎(chǔ)做好屬性的歸類實(shí)現(xiàn)數(shù)據(jù)的挖掘。
5、數(shù)據(jù)挖掘技術(shù)在地理信息系統(tǒng)中的實(shí)際應(yīng)用
5.1對(duì)于地理信息系統(tǒng)內(nèi)的數(shù)據(jù)進(jìn)行提煉
雖然在地理信息系統(tǒng)的數(shù)據(jù)庫中,包含了多類型的數(shù)據(jù),但并不是所有的數(shù)據(jù)都對(duì)于地理信息系統(tǒng)有重要的作用。只有少部分?jǐn)?shù)據(jù)是屬于系統(tǒng)運(yùn)行的必須數(shù)據(jù),而大多數(shù)數(shù)據(jù)則是屬于沒有實(shí)際作用的,這些數(shù)據(jù)在地理信息系統(tǒng)運(yùn)行的過程中往往會(huì)使得信息系統(tǒng)整體工作效率受到一定的影響。而通過數(shù)據(jù)挖掘技術(shù),就可以更加準(zhǔn)確地挖掘出各項(xiàng)重要數(shù)據(jù)之間的關(guān)系,挖掘分析具有關(guān)聯(lián)關(guān)系的重要數(shù)據(jù),將其他不重要的數(shù)據(jù)進(jìn)行清除處理,從而實(shí)現(xiàn)精煉地理信息系統(tǒng)數(shù)據(jù)庫的目標(biāo),極大提升地理信息系統(tǒng)在運(yùn)行過程中的整體工作效率。
5.2對(duì)于地理信息系統(tǒng)的數(shù)據(jù)進(jìn)行更新
在地理信息系統(tǒng)存儲(chǔ)的大量數(shù)據(jù)都是由過去積累而來,但是實(shí)際上地理數(shù)據(jù)隨著時(shí)間的變化也會(huì)發(fā)生一定的轉(zhuǎn)變,過去許多的地理數(shù)據(jù)已經(jīng)無法滿足當(dāng)前社會(huì)發(fā)展的實(shí)際需求,因此,當(dāng)前就必須針對(duì)這些過時(shí)的地理數(shù)據(jù)采取相應(yīng)的手段進(jìn)行處理。而數(shù)據(jù)挖掘技術(shù)就可有效提升數(shù)據(jù)的價(jià)值,將地理信息系統(tǒng)內(nèi)不同時(shí)期同一區(qū)域的地理數(shù)據(jù)進(jìn)行科學(xué)對(duì)比,分析出地理事物在不同情況下發(fā)生變化以及事物變化的規(guī)律,并且尋找到使得地理事物發(fā)生變化背后的真實(shí)因素。通過這樣的方式就可以在未來利用地理信息系統(tǒng)分析地理數(shù)據(jù)時(shí),只需要對(duì)影響地理信息變化的關(guān)鍵環(huán)節(jié)進(jìn)行測(cè)量即可完成數(shù)據(jù)更新,在分析出關(guān)鍵部分變化的情況下更新數(shù)據(jù),而如果對(duì)于數(shù)據(jù)產(chǎn)生影響的關(guān)鍵部分沒有發(fā)生變化,那么也不需要進(jìn)行數(shù)據(jù)庫的更新處理。
5.3對(duì)于地理信息系統(tǒng)的數(shù)據(jù)庫進(jìn)行擴(kuò)充和完善
雖然在地理信息系統(tǒng)內(nèi)蘊(yùn)含了許多數(shù)據(jù)信息,但是通過人工手段從這些數(shù)據(jù)信息中篩選特定數(shù)據(jù),整體工作效率會(huì)較低,并且也存在不完善的情況。而數(shù)據(jù)挖掘技術(shù)就可以更好地將其他有關(guān)聯(lián)的新知識(shí)和新數(shù)據(jù)輸入到數(shù)據(jù)庫中,然后對(duì)數(shù)據(jù)庫內(nèi)原有的數(shù)據(jù)進(jìn)行分析,以此推斷出其他全新的結(jié)果,充分完善和提升信息系統(tǒng)內(nèi)部的數(shù)據(jù)庫。同時(shí)在這一過程,不斷地探究分析數(shù)據(jù)挖掘系統(tǒng)對(duì)于各類數(shù)據(jù)背后蘊(yùn)含的價(jià)值,可以使得地理信息系統(tǒng)內(nèi)部蘊(yùn)含的各類數(shù)據(jù)解決社會(huì)發(fā)展過程中的實(shí)際問題,讓地理信息系統(tǒng)的實(shí)用性得到有效提高。
5.4推動(dòng)地理信息系統(tǒng)的智能化發(fā)展
在地理信息系統(tǒng)的數(shù)據(jù)庫中,蘊(yùn)含了非常大量的地理空間數(shù)據(jù)。這些地理空間數(shù)據(jù),對(duì)于我國社會(huì)的發(fā)展來說具有非常重要的意義。這些空間數(shù)據(jù)和地理信息系統(tǒng)的發(fā)展之間關(guān)系非常密切,在很多情況下可以成為推動(dòng)地理信息系統(tǒng)發(fā)展的重要推動(dòng)力。通過數(shù)據(jù)挖掘技術(shù)的應(yīng)用,就可以更好地挖掘出這些空間數(shù)據(jù)背后蘊(yùn)含的價(jià)值,并且技術(shù)人員就可以利用好挖掘出的技術(shù)不斷優(yōu)化升級(jí)完善地理信息系統(tǒng)中存在的不足,推動(dòng)地理信息系統(tǒng)朝著智能化方向發(fā)展,構(gòu)建起具有更強(qiáng)的自動(dòng)化地理信息系統(tǒng)。
結(jié)語:
地理信息系統(tǒng)是我國社會(huì)發(fā)展的重要組成部分,并且在地理信息系統(tǒng)的數(shù)據(jù)庫中,所蘊(yùn)含的有關(guān)數(shù)據(jù)也有著非常重要的價(jià)值。單純依靠人工很難挖掘出數(shù)據(jù)庫的核心知識(shí),在這樣的情況下就應(yīng)當(dāng)充分地利用數(shù)據(jù)挖掘技術(shù),充分挖掘地理信息系統(tǒng)數(shù)據(jù)庫內(nèi)蘊(yùn)含的深層知識(shí),從而發(fā)揮出地理信息系統(tǒng)的作用,為我國社會(huì)的發(fā)展提供有力的支持。
參考文獻(xiàn):
[1]李文萱,李文.數(shù)據(jù)挖掘技術(shù)在醫(yī)院信息系統(tǒng)中的應(yīng)用研究[J].中國管理信息化,2018,21(04):143-144.
[2] 杜江毅,邊馥苓.面向大數(shù)據(jù)的空間數(shù)據(jù)挖掘綜述[J].地理空間信息,2017(1):34-35.
[3]王戩.數(shù)據(jù)挖掘技術(shù)在管理信息系統(tǒng)中的應(yīng)用研究[J].信息系統(tǒng)工程,2017(05):54.
[4]張昕.數(shù)據(jù)挖掘技術(shù)在圖書館管理信息系統(tǒng)中的應(yīng)用[J].湖南城市學(xué)院學(xué)報(bào)(自然科學(xué)版),2016,25(05):63- 64.
[5]江建華.空間數(shù)據(jù)挖掘探討[J].江西測(cè)繪2016(2)58-59.
[6]李慶等.空間數(shù)據(jù)挖掘理論與應(yīng)用空間數(shù)據(jù)挖掘理論與應(yīng)用 [J].測(cè)繪地理信息,2015(3):25.
[7]馬宏斌,王柯,馬團(tuán)學(xué).大數(shù)據(jù)時(shí)代的空間數(shù)據(jù)挖掘綜述[J].測(cè)繪與空間地理信息,2014(7)35-36.