趙慧
摘 要:社會經(jīng)濟的迅猛發(fā)展,使得統(tǒng)計工作越來越重要。面臨龐大的統(tǒng)計數(shù)據(jù)量和提升數(shù)據(jù)質(zhì)量的要求,結(jié)合數(shù)據(jù)挖掘的功能、特點和優(yōu)勢,使得數(shù)據(jù)挖掘技術(shù)應(yīng)用到統(tǒng)計工作中將發(fā)揮更多潛在的功能價值,因此將數(shù)據(jù)挖掘技術(shù)應(yīng)用到統(tǒng)計工作中就顯得尤為必要。該文主要分析了數(shù)據(jù)挖掘與統(tǒng)計學(xué)的關(guān)系,闡述了統(tǒng)計工作中應(yīng)用數(shù)據(jù)挖掘技術(shù)的適應(yīng)性,對數(shù)據(jù)挖掘技術(shù)在統(tǒng)計工作中的應(yīng)用前景進行了相關(guān)研究。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù) 統(tǒng)計工作 應(yīng)用
中圖分類號:TP311.13 文獻標(biāo)識碼:A 文章編號:1672-3791(2017)05(b)-0007-02
隨著信息社會的高速發(fā)展,大數(shù)據(jù)、物聯(lián)網(wǎng)、云計算的興起與普及,信息產(chǎn)生和傳播的速度與數(shù)據(jù)量迅速增快,在政府統(tǒng)計工作中,能夠通過信息手段從龐大的數(shù)據(jù)量中獲取更多更有效的信息,成為一個國家提升國民競爭力與國民素質(zhì)的重要手段之一。
信息社會經(jīng)濟的迅猛發(fā)展離不開統(tǒng)計。在整個政府的體系結(jié)構(gòu)中,統(tǒng)計部門起著舉足輕重的作用,統(tǒng)計部門的數(shù)據(jù)將作為整個政府決策的一種依據(jù)。在當(dāng)前信息技術(shù)迅猛發(fā)展的變革中,將日趨完善的信息技術(shù)應(yīng)用到統(tǒng)計工作中,例如:數(shù)據(jù)挖掘技術(shù),可以使統(tǒng)計工作在信息社會的發(fā)展進程中,發(fā)揮出更強大的作用,為政府決策提供更為有利的依據(jù)。
1 數(shù)據(jù)挖掘與統(tǒng)計學(xué)
數(shù)據(jù)挖掘是一個年輕的領(lǐng)域。從技術(shù)上講,數(shù)據(jù)挖掘集人工智能、統(tǒng)計學(xué)、數(shù)據(jù)庫管理、數(shù)據(jù)倉庫、可視化、并行計算、決策支持為一體,利用數(shù)據(jù)庫、數(shù)據(jù)倉庫技術(shù)存儲和管理數(shù)據(jù),利用統(tǒng)計學(xué)方法和人工智能分析數(shù)據(jù)[1]。對數(shù)據(jù)挖掘技術(shù)在統(tǒng)計工作中應(yīng)用的研究,可以使統(tǒng)計學(xué)適應(yīng)大數(shù)據(jù)時代數(shù)據(jù)量的變化,挖掘出更多更有意義的數(shù)據(jù)信息。
1.1 數(shù)據(jù)挖掘是智能化統(tǒng)計
由于計算機技術(shù)的迅猛發(fā)展,數(shù)據(jù)存儲能力的無線增加及大數(shù)據(jù)的推廣應(yīng)用,統(tǒng)計學(xué)方法也得到了迅速發(fā)展和完善。與此同時,各行各業(yè)都面臨“數(shù)據(jù)爆炸”與“知識匱乏”并存的嚴峻形勢,數(shù)據(jù)挖掘技術(shù)使得統(tǒng)計學(xué)與計算機技術(shù)相結(jié)合,從而從數(shù)據(jù)海洋中獲取更多的信息。數(shù)據(jù)挖掘與統(tǒng)計學(xué)都是研究處理數(shù)據(jù)的藝術(shù),具有相通性。統(tǒng)計學(xué)通過建模等從數(shù)據(jù)的特征出發(fā)去研究和發(fā)現(xiàn)其中有用的信息,而數(shù)據(jù)挖掘也是挖掘數(shù)據(jù)的特性,以期挖掘出更多更有意義的數(shù)據(jù),因此,統(tǒng)計工作中應(yīng)用數(shù)據(jù)挖掘是十分有必要的,數(shù)據(jù)挖掘可以說是統(tǒng)計工作借助于信息技術(shù)的發(fā)展延伸[2]。
1.2 數(shù)據(jù)挖掘的新特征推動統(tǒng)計學(xué)進一步發(fā)展
在數(shù)據(jù)的基礎(chǔ)上建立模型并對模型分析是統(tǒng)計學(xué)家的主要工作,但是,對模型的闡述和分析并不深入,建立模型之后再進行數(shù)據(jù)分析是極為重要的。而數(shù)據(jù)挖掘的出現(xiàn),可以對數(shù)據(jù)集采用不同的數(shù)據(jù)挖掘技術(shù),可以是決策樹或者神經(jīng)網(wǎng)絡(luò)或者聚類分析,從而處理數(shù)據(jù)集達到更好地預(yù)測效果。數(shù)據(jù)挖掘處理數(shù)據(jù)有以下特征:數(shù)據(jù)量大且維數(shù)高、數(shù)據(jù)結(jié)構(gòu)復(fù)雜化、數(shù)據(jù)類型多樣化等,數(shù)據(jù)挖掘的各種特征推動統(tǒng)計工作結(jié)合計算機技術(shù)進一步發(fā)展。
2 統(tǒng)計工作中應(yīng)用數(shù)據(jù)挖掘技術(shù)的適應(yīng)性分析
(1)綜合應(yīng)用型強。數(shù)據(jù)挖掘技術(shù)是一種能滿足統(tǒng)計數(shù)據(jù)者特性數(shù)據(jù)需要的、綜合應(yīng)用型強的技術(shù)手段,不斷促進統(tǒng)計工作向應(yīng)用深度和范圍廣度上擴展。
(2)實際有效性高。數(shù)據(jù)挖掘具有穩(wěn)定的工作性能,是一種目的明確的數(shù)據(jù)深加工技術(shù),不僅能對統(tǒng)計工作的數(shù)據(jù)進行分析整理,更能通過聚類分析、神經(jīng)網(wǎng)絡(luò)等技術(shù)手段挖掘更深層次更有用的信息,在實際的統(tǒng)計工作應(yīng)用中展現(xiàn)出的實際有效性很高。
(3)技術(shù)適用性高。統(tǒng)計工作需要強大的數(shù)據(jù)庫,這為數(shù)據(jù)挖掘技術(shù)應(yīng)用在統(tǒng)計工作中提供了平臺,數(shù)據(jù)挖掘技術(shù)在此整合,保證統(tǒng)計工作信息的有效性、精確性,可以獲得更深層次的信息資源。
3 數(shù)據(jù)挖掘技術(shù)在統(tǒng)計工作中的應(yīng)用前景
數(shù)據(jù)挖掘的功能主要有自動預(yù)測趨勢和行為、關(guān)聯(lián)分析、粗糙集分析、聚類分析、概念描述、變化和偏差檢測(孤立點檢測)、回歸分析等[3]。所以,非常有必要將日趨完善的數(shù)據(jù)挖掘技術(shù)應(yīng)用到統(tǒng)計工作中,更深層次更合理地處理統(tǒng)計數(shù)據(jù)信息。數(shù)據(jù)挖掘技術(shù)在統(tǒng)計工作中的應(yīng)用主要有以下幾個方面。
3.1 開發(fā)數(shù)據(jù)挖掘系統(tǒng)
統(tǒng)計部門使用的數(shù)據(jù)格式多種多樣,各個數(shù)據(jù)挖掘系統(tǒng)不可能對各式各樣的數(shù)據(jù)庫都具有通用性。同時,統(tǒng)計工作涉及到社會的方方面面,指標(biāo)多、數(shù)據(jù)量大,沒有一種完美的數(shù)據(jù)挖掘系統(tǒng)可以適用各種統(tǒng)計工作的需求,因此,要根據(jù)統(tǒng)計工作的實際需要開發(fā)出適合的數(shù)據(jù)挖掘系統(tǒng),以適應(yīng)其工作需求??梢蚤_發(fā)多維數(shù)據(jù)挖掘系統(tǒng)、關(guān)系數(shù)據(jù)挖掘系統(tǒng)、空間數(shù)據(jù)庫挖掘等。例如:基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘系統(tǒng),其算法能夠解決在數(shù)據(jù)挖掘中對數(shù)據(jù)進行預(yù)處理耗時的缺點[4]。通過建立數(shù)據(jù)倉庫能夠避免每次對數(shù)據(jù)進行抽取、清洗、轉(zhuǎn)換和裝載的過程,按主題組織存放數(shù)據(jù)庫,為數(shù)據(jù)挖掘技術(shù)選擇恰當(dāng)?shù)臄?shù)據(jù)源提供了便利。
3.2 提升數(shù)據(jù)挖掘質(zhì)量
統(tǒng)計工作中,數(shù)據(jù)的質(zhì)量尤為重要。政府進行科學(xué)決策和現(xiàn)代化管理需要準(zhǔn)確的統(tǒng)計數(shù)據(jù)作為依據(jù)。在獲取數(shù)據(jù)來源的質(zhì)量問題上,國家統(tǒng)計部門極為重視,因此,統(tǒng)計部門的數(shù)據(jù)集的質(zhì)量問題就可以很好地保證,這就需要在數(shù)據(jù)挖掘技術(shù)上減少問題,提升數(shù)據(jù)挖掘效果,從而為決策者提供更為可靠的依據(jù)。數(shù)據(jù)挖掘技術(shù)的不斷改進可以提升挖掘信息的有效性和適用性。通過數(shù)據(jù)挖掘技術(shù)在統(tǒng)計工作中的應(yīng)用挖掘出來高質(zhì)量的信息,同時又能運用于實際的統(tǒng)計領(lǐng)域。例如:交互式數(shù)據(jù)挖掘能夠準(zhǔn)許用戶對數(shù)據(jù)進行精確挖掘,數(shù)據(jù)焦點具備動態(tài)改變的特點,從多個角度多個抽象的層次靈活的收集數(shù)據(jù)、挖掘數(shù)據(jù)[5]。
3.3 簡化數(shù)據(jù)挖掘結(jié)果
政府統(tǒng)計機構(gòu)是使用數(shù)據(jù)的關(guān)鍵部門,這也暗示著政府統(tǒng)計工作的新的發(fā)展方向,結(jié)合數(shù)據(jù)挖掘技術(shù)挖掘出更適合決策幫助的數(shù)據(jù)信息。數(shù)據(jù)挖掘出來的結(jié)果最終使用者并非是數(shù)據(jù)挖掘的專家,而是各統(tǒng)計部門的相關(guān)人員,因此數(shù)據(jù)挖掘結(jié)果要簡化易懂。
3.4 數(shù)據(jù)挖掘的保密性和安全性
在數(shù)據(jù)挖掘的引用中,世界上許多國家的官方統(tǒng)計機構(gòu)已有研究計劃。比如:由歐洲國家的政府機構(gòu)設(shè)計的SODAS,KESO和SPIN,這些計劃研究提供特定的軟件,開發(fā)出具體的數(shù)據(jù)挖掘工具應(yīng)用在官方統(tǒng)計中[6]。為充分發(fā)揮數(shù)據(jù)挖掘在政府統(tǒng)計工作中的潛在效益,我國政府統(tǒng)計部門也在研究數(shù)據(jù)挖掘技術(shù)的引入與結(jié)合。由于政府統(tǒng)計工作的特殊性,為避免數(shù)據(jù)泄露,要加強數(shù)據(jù)挖掘技術(shù)應(yīng)用過程和結(jié)果的安全性和保密性。
4 結(jié)語
在國家的經(jīng)濟發(fā)展中,統(tǒng)計工作至關(guān)重要,隨著數(shù)據(jù)挖掘技術(shù)在政府統(tǒng)計工作中應(yīng)用的不斷深入,對數(shù)據(jù)的統(tǒng)計分析也有更高的標(biāo)準(zhǔn)和更高的質(zhì)量要求。對此,在統(tǒng)計工作中,要提升數(shù)據(jù)挖掘技術(shù)的應(yīng)用效果,以獲得更高的統(tǒng)計質(zhì)量結(jié)果,進而為統(tǒng)計部門或者政府部門決策提供更為有力的決策依據(jù)。在統(tǒng)計工作中充分利用數(shù)據(jù)挖掘技術(shù),將帶來巨大的經(jīng)濟效益和社會效益。
參考文獻
[1] 徐雪琪.基于統(tǒng)計視角的數(shù)據(jù)挖掘研究[D].浙江工商大學(xué),2007.
[2] Pang-Ning Tan,Michale Steinbach,Vipin Kumar. Introduction to Data Mining[M].人民郵電出版社,2006.
[3] 董靜.試析數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應(yīng)用[J].商,2015(31):227-228.
[4] 王恂.基于數(shù)據(jù)挖掘技術(shù)的統(tǒng)計工作創(chuàng)新研究[J].無線互聯(lián)科技,2015(4):142-143.
[5] 岳悅.淺談數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應(yīng)用[J].經(jīng)營管理者,2015(30):198.
[6] 行智國.數(shù)據(jù)挖局及其在官方統(tǒng)計中的應(yīng)用前景[J].統(tǒng)計科學(xué)與實踐,2003(2):10-12.