劉淑英
(咸陽師范學(xué)院 計算機(jī)學(xué)院,陜西咸陽712000)
淺談數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計中的應(yīng)用
劉淑英
(咸陽師范學(xué)院 計算機(jī)學(xué)院,陜西咸陽712000)
我國經(jīng)濟(jì)的高速發(fā)展使社會經(jīng)濟(jì)活動越來越復(fù)雜,加上各種外界與內(nèi)部的經(jīng)濟(jì)因素共同所用下,最終形成了一個經(jīng)濟(jì)復(fù)雜的關(guān)系整體。想要對如今的經(jīng)濟(jì)統(tǒng)計進(jìn)行一個系統(tǒng)的分析,單單靠人腦的理解分析能力已然不夠,需要借助更加先進(jìn)的現(xiàn)代統(tǒng)計與分析技術(shù)才能實現(xiàn)。近些年來,數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計領(lǐng)域應(yīng)用的較為廣泛,已經(jīng)逐漸成為了經(jīng)濟(jì)統(tǒng)計活動中的新生代主流,受到社會各界的廣泛關(guān)注。
數(shù)據(jù)挖掘;經(jīng)濟(jì)統(tǒng)計;應(yīng)用分析
我國經(jīng)濟(jì)在近幾十年來得到了空前速度的發(fā)展,并累積了大量的經(jīng)濟(jì)統(tǒng)計數(shù)據(jù)。經(jīng)濟(jì)統(tǒng)計數(shù)據(jù)由于其自身的特殊性,擁有著十分龐大且復(fù)雜的信息龐體性,統(tǒng)計數(shù)據(jù)在使用的過程中往往受限于資料難以發(fā)揮最大的作用,因此,數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。其特點(diǎn)是可以對數(shù)據(jù)進(jìn)行縱向的開發(fā)與深入,同時還會對數(shù)據(jù)的橫向進(jìn)行延伸與拓展,利用不斷的數(shù)據(jù)挖掘,可達(dá)到基礎(chǔ)數(shù)據(jù)利用率的最大提升,滿足統(tǒng)計數(shù)據(jù)使用的最大需求。
數(shù)據(jù)挖掘技術(shù)的原理并不復(fù)雜,不過是一種對數(shù)據(jù)信息進(jìn)行深層次挖掘的技術(shù)。具體而言,就是將原本復(fù)雜多變的數(shù)據(jù)庫進(jìn)行簡化,然后從經(jīng)過簡化的數(shù)據(jù)信息中提取出所需要的有用數(shù)據(jù),進(jìn)行進(jìn)一步的分析與整理,從而達(dá)到數(shù)據(jù)分析與充分利用的目的。如今我國的經(jīng)濟(jì)數(shù)據(jù)信息的基礎(chǔ)十分龐大,同時隨機(jī)性較強(qiáng),很多數(shù)據(jù)還存在著不完整的特性,以至于往往在使用常規(guī)普通的數(shù)據(jù)統(tǒng)計方式時,無法對這些經(jīng)濟(jì)數(shù)據(jù)進(jìn)行系統(tǒng)的分析,導(dǎo)致結(jié)論準(zhǔn)確度不高。而數(shù)據(jù)挖掘技術(shù)則可以有效地解決這一問題,其根據(jù)相應(yīng)的軟件與程序算法,對原本完整性不高、隨機(jī)性強(qiáng)的原始數(shù)據(jù)進(jìn)行系統(tǒng)的歸納與分析統(tǒng)計,最終形成一套簡便合理的統(tǒng)計數(shù)據(jù)形態(tài),讓數(shù)據(jù)的使用者可以更加直觀地對所需的數(shù)據(jù)進(jìn)行提取與使用。
數(shù)據(jù)挖掘的特點(diǎn)是可以自動捕捉到有意義、有價值的數(shù)據(jù),并將其進(jìn)行歸納與收集,不需要人為的操控,就可以自動將所收集歸納的數(shù)據(jù)進(jìn)行后續(xù)加工、處理,并與處理之前的數(shù)據(jù)進(jìn)行分析比對,從而實現(xiàn)所被挖掘到的數(shù)據(jù)的實用性與準(zhǔn)確性[1]。數(shù)據(jù)挖掘技術(shù)的自動化原理會將原本復(fù)雜混亂的原始數(shù)據(jù)進(jìn)行深度的分析與總結(jié),最終形成規(guī)范的數(shù)據(jù)形態(tài),以便使用者進(jìn)行應(yīng)用。數(shù)據(jù)挖掘技術(shù)會從層面上對一些基礎(chǔ)性數(shù)據(jù)進(jìn)行挖掘,從技術(shù)層面對原始數(shù)據(jù)進(jìn)行自主性的分析,從而實現(xiàn)更加高水平、高智能應(yīng)用的系統(tǒng)設(shè)計,并得到更多尖端技術(shù)的有力支持,其中包括模塊識別技術(shù)、模糊概念成像技術(shù)、數(shù)據(jù)庫系統(tǒng)篩選知識技術(shù)等。
數(shù)據(jù)挖掘技術(shù)會將長時間積累下來的經(jīng)濟(jì)統(tǒng)計數(shù)據(jù)深入到數(shù)據(jù)使用者所要求的條件之中,在實踐的過程中會涉及到數(shù)據(jù)挖掘技術(shù)的多個特性,按照這些特性來保證經(jīng)濟(jì)統(tǒng)計數(shù)據(jù)能夠以最大的限度發(fā)揮作用,服務(wù)于管理者的需求。
目前,在很多領(lǐng)域數(shù)據(jù)挖掘技術(shù)都已經(jīng)得到了廣泛的應(yīng)用與普及,在對數(shù)據(jù)的分析與歸納過程中,發(fā)揮著舉足輕重的作用。其中包括經(jīng)濟(jì)統(tǒng)計、物理分析、數(shù)學(xué)統(tǒng)計等各個方面。數(shù)據(jù)挖掘技術(shù)需要有著強(qiáng)大的統(tǒng)計能力、數(shù)據(jù)挖掘能力,同時還需要強(qiáng)大的后續(xù)數(shù)據(jù)自動分析與統(tǒng)計的功能,能夠協(xié)助數(shù)據(jù)的使用者對數(shù)據(jù)進(jìn)行完整的處理[2]。數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計的應(yīng)用中,起到了極大的作用,其對經(jīng)濟(jì)數(shù)據(jù)的開發(fā)、整理與分類帶來極大促進(jìn)作用,會給數(shù)據(jù)的使用者提供更加方便快捷的服務(wù)。
目前,我國在數(shù)據(jù)挖掘技術(shù)方面的應(yīng)用時間有限,技術(shù)層面并沒有達(dá)到很高的水平,不過就目前的數(shù)據(jù)挖掘技術(shù)而言,對我國的相關(guān)經(jīng)濟(jì)統(tǒng)計工作已經(jīng)起到了很大的效果應(yīng)用,使統(tǒng)計工作的性能得到了進(jìn)一步加強(qiáng),并且我國在經(jīng)濟(jì)數(shù)據(jù)領(lǐng)域的分析、統(tǒng)計與整理的能力進(jìn)行了強(qiáng)化,并會利用數(shù)據(jù)挖掘技術(shù)對更多有價值、有意義的信息進(jìn)行挖掘,并最終表現(xiàn)為數(shù)據(jù)的高效性與準(zhǔn)確性。
對于如今的宏觀型數(shù)據(jù)庫,數(shù)據(jù)挖掘技術(shù)也能有效應(yīng)用其中,并取得很好的效果。如今我國的經(jīng)濟(jì)數(shù)據(jù)統(tǒng)計分析所使用的方法絕大多數(shù)還受限于傳統(tǒng)的經(jīng)濟(jì)統(tǒng)計方式,很多對數(shù)據(jù)信息的歸納與收集的方式還相對落后,無法與所匹配的信息形成一個完整的整體[3]。很多數(shù)據(jù)的使用者在對數(shù)據(jù)進(jìn)行全方面管理與歸納時,會出現(xiàn)較多的問題,無法快速高效的達(dá)到數(shù)據(jù)分析與統(tǒng)計的目的。為此現(xiàn)象,就需要引入更加新式、高效的方法來提升對經(jīng)濟(jì)數(shù)據(jù)統(tǒng)計的效率。數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)數(shù)據(jù)宏觀數(shù)據(jù)庫中的適應(yīng)性極強(qiáng),宏觀經(jīng)濟(jì)統(tǒng)計數(shù)據(jù)庫可以為數(shù)據(jù)挖掘技術(shù)提供一個完全展示其功能的平臺,以便其發(fā)揮出自身的特性[4]。對經(jīng)濟(jì)統(tǒng)計領(lǐng)域而言,其數(shù)據(jù)分析的準(zhǔn)確性必須得到保證,其速度也需要進(jìn)行優(yōu)化處理,因此將數(shù)據(jù)挖掘技術(shù)引入數(shù)據(jù)宏觀經(jīng)濟(jì)統(tǒng)計,需要依靠大量可靠的數(shù)據(jù)資源,最終統(tǒng)計分析出更加有效的宏觀數(shù)據(jù)。
在使用數(shù)據(jù)挖掘技術(shù)的初始階段,需要相關(guān)領(lǐng)域的專家與學(xué)者對所需要挖掘的數(shù)據(jù)進(jìn)行目標(biāo)定義,目標(biāo)定義的效果將直接決定后續(xù)數(shù)據(jù)挖掘所產(chǎn)生的結(jié)果,因而,數(shù)據(jù)挖掘的初始定義有著重要的地位,需要一邊定義一邊進(jìn)行算法的演算,以確保定義效果的明確與準(zhǔn)確[5]。另一方面,定義的要求也需要與實際的工作需求相對應(yīng)。
作為整個數(shù)據(jù)挖掘技術(shù)過程中最為重要、時間消耗最長的階段,數(shù)據(jù)準(zhǔn)備階段一共分為三個步驟:數(shù)據(jù)的挑選、處理與變化分析。數(shù)據(jù)的挑選是將整個宏觀數(shù)據(jù)庫中的所有相關(guān)數(shù)據(jù)都進(jìn)行篩選與排列,按照數(shù)據(jù)定義為目標(biāo)區(qū)域數(shù)據(jù);接著利用數(shù)據(jù)處理功能對所排列的所有數(shù)據(jù)進(jìn)行初步的篩選處理,初步挑選出所需要的符合要求的數(shù)據(jù);最后利用數(shù)據(jù)變換的功能對所挑選的數(shù)據(jù)進(jìn)行簡化處理,也屬于更深層次的數(shù)據(jù)挑選,最終得到最符合目標(biāo)定義的數(shù)據(jù)信息。
數(shù)據(jù)挖掘階段的首要步驟是對算法的預(yù)定,需要設(shè)計出合適的算法來對所變換來的數(shù)據(jù)源進(jìn)行合理挑選,才能進(jìn)行深度挖掘[6]。算法的初步預(yù)定完成之后,就可以進(jìn)行下一步的數(shù)據(jù)模塊計算。這一過程需要有專門的專家與數(shù)據(jù)挖掘分析人員進(jìn)行操作,因此此步驟也是數(shù)據(jù)挖掘的關(guān)鍵點(diǎn)所在。
經(jīng)過上述的幾個步驟所得到的最終數(shù)據(jù)結(jié)果,數(shù)據(jù)的使用者需要對其進(jìn)行一個結(jié)果的分析,利用數(shù)據(jù)挖掘技術(shù)將分析得到的數(shù)據(jù)結(jié)果進(jìn)行全方面的顯示,并自動生成數(shù)據(jù)價值的評估,篩選后有用的信息進(jìn)行保留,對無意義或重復(fù)的數(shù)據(jù)要及時的刪除[7]。如果經(jīng)過一系列的操作與篩選所得到的數(shù)據(jù)并不符合最終的要求,則系統(tǒng)會自動執(zhí)行回上一步,重新進(jìn)行二次篩選,直到達(dá)到標(biāo)準(zhǔn)為止。
數(shù)據(jù)的使用者所需要得到的數(shù)據(jù)與目標(biāo)有著很大的差異性,因此數(shù)據(jù)挖掘技術(shù)所對應(yīng)的系統(tǒng)也要有多種的變化。如今數(shù)據(jù)挖掘技術(shù)尚沒有發(fā)展徹底,很多數(shù)據(jù)難題無法有相之匹配的功能型數(shù)據(jù)挖掘技術(shù),因此如今很多的設(shè)計者所面臨的任務(wù)是設(shè)計出更多的數(shù)據(jù)挖掘系統(tǒng),以解決層出不窮的數(shù)據(jù)統(tǒng)計難題。
數(shù)據(jù)挖掘技術(shù)可以對宏觀數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行篩選與歸納,具有很強(qiáng)的可表達(dá)性、有效性與確定性。利用一定的自動化原理對所表達(dá)出的數(shù)據(jù)進(jìn)行深度的挖掘,充分的顯示出數(shù)據(jù)庫中的主要內(nèi)容,并根據(jù)相應(yīng)的算法將數(shù)據(jù)應(yīng)用到實際當(dāng)中[8]。利用數(shù)據(jù)挖掘技術(shù)可以對一些有著明顯缺陷的數(shù)據(jù)進(jìn)行補(bǔ)充與處理,對一些缺陷并不明顯或數(shù)據(jù)較為相似的數(shù)據(jù)可按照一定的規(guī)律展現(xiàn)出來。
被挖掘出的統(tǒng)計數(shù)據(jù)并不一定是經(jīng)過最簡化得到的結(jié)果,主要取決于數(shù)據(jù)的使用者。如果數(shù)據(jù)的使用者是專業(yè)的專家或?qū)W者,則問題的簡化程度影響效果并不大;如果數(shù)據(jù)的使用者并非專業(yè)的學(xué)者,而是一般的使用者,那么就需要對數(shù)據(jù)進(jìn)行最簡化。
數(shù)據(jù)挖掘技術(shù)擁有一定的技術(shù)交互性,利用交互式的數(shù)據(jù)挖掘能夠?qū)λ枰幚?、分析與整理的數(shù)據(jù)進(jìn)行精確的深度挖掘,利用數(shù)據(jù)焦點(diǎn)的動態(tài)變化等特點(diǎn),從多個角度對數(shù)據(jù)進(jìn)行全方位的分析,采取抽象的層次變換屬性對所歸納的數(shù)據(jù)進(jìn)行挖掘、收集與歸納,并最終實現(xiàn)數(shù)據(jù)的交互。
經(jīng)濟(jì)數(shù)據(jù)都具有一定的保密性,需要有很高的安全性保障。數(shù)據(jù)挖掘技術(shù)會隨著科技與時代的發(fā)展,在安全保密性上面取得更快的發(fā)展,對所得到的挖掘結(jié)果與數(shù)據(jù)統(tǒng)計進(jìn)行強(qiáng)化的安全與保密,以防止數(shù)據(jù)泄露或丟失,強(qiáng)調(diào)對數(shù)據(jù)隱私的重視度。
在我國經(jīng)濟(jì)快速發(fā)展的大背景下,經(jīng)濟(jì)統(tǒng)計的效果高低將會直接決定經(jīng)濟(jì)長遠(yuǎn)發(fā)展的前景好壞。而隨著挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計領(lǐng)域內(nèi)大范圍的應(yīng)用,使得我國目前在數(shù)據(jù)統(tǒng)計分析領(lǐng)域有著更加優(yōu)異的表現(xiàn),可以更好實現(xiàn)數(shù)據(jù)分析的高質(zhì)量化與標(biāo)準(zhǔn)化。因此,數(shù)據(jù)挖掘技術(shù)更廣泛的應(yīng)用,使經(jīng)濟(jì)數(shù)據(jù)領(lǐng)域的統(tǒng)計工作的結(jié)果將變得更加可靠真實,從而為政府相關(guān)經(jīng)濟(jì)部門提供更加強(qiáng)有力的理論依據(jù),也會為一些工業(yè)企業(yè)提供更多的經(jīng)濟(jì)發(fā)展方向。數(shù)據(jù)挖掘技術(shù)在未來還會有著更廣泛的社會效益。
[1]謝湘寧.淺談數(shù)據(jù)挖掘技術(shù)在專利信息分析中的應(yīng)用[J].中國發(fā)明與專利,2015,(1):59-62.
[2]王思懿.數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計中的應(yīng)用管窺[J].商,2015,(18):216.
[3]楊楠.數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計中的應(yīng)用探索[J].商,2015,(26):194.
[4]楊梅冰,梁思思.關(guān)于數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計中的應(yīng)用[J].時代金融,2015,(24):179.
[5]董靜.試析數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計中的應(yīng)用[J].商,2015,(31):227-228.
[6]陳超,王哲.淺談數(shù)據(jù)挖掘技術(shù)在信息資源規(guī)劃中的應(yīng)用[J].信息通信,2015,(12):188-189.
[7]易立.數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計中的應(yīng)用分析[J].時代金融,2016,(5):136.
[8]張永生.數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計中的應(yīng)用[J].現(xiàn)代國企研究,2016,(14):135.
F22
A
1673-291X(2017)35-0176-02
2017-09-22
劉淑英(1982-),女,陜西咸陽人,副教授,碩士,從事軟件理論研究。
[責(zé)任編輯 杜 娟]