王曉麗
摘 要 我國的社會經(jīng)濟(jì)正在快速發(fā)展,經(jīng)濟(jì)統(tǒng)計(jì)可以表現(xiàn)出整個(gè)經(jīng)濟(jì)的發(fā)展?fàn)顩r,為未來的發(fā)展和調(diào)控給予有效的數(shù)據(jù)支持。經(jīng)濟(jì)統(tǒng)計(jì)的數(shù)據(jù)通常都比較大,而且部分?jǐn)?shù)據(jù)可能存在問題,以前的統(tǒng)計(jì)只是進(jìn)行表面的計(jì)算,并沒有深入分析。而現(xiàn)代經(jīng)濟(jì)統(tǒng)計(jì)的發(fā)展是快速的,本文主要對經(jīng)濟(jì)統(tǒng)計(jì)方法中數(shù)據(jù)挖掘技術(shù)的優(yōu)勢進(jìn)行分析,并且概述了其應(yīng)用情況。
關(guān)鍵詞 經(jīng)濟(jì)統(tǒng)計(jì) 數(shù)據(jù)挖掘 統(tǒng)計(jì)方法
經(jīng)濟(jì)統(tǒng)計(jì)需要對龐大數(shù)據(jù)庫內(nèi)的信息進(jìn)行整理和分析,但是由于數(shù)據(jù)較多、比較復(fù)雜,簡單的統(tǒng)計(jì)方法沒有辦法實(shí)現(xiàn)全面的數(shù)據(jù)分析,無法將所有的數(shù)據(jù)進(jìn)行準(zhǔn)確的分析。數(shù)據(jù)挖掘技術(shù)可以對數(shù)據(jù)進(jìn)行深度的整理和分析,提高數(shù)據(jù)的真實(shí)性和質(zhì)量,還能更加輕易地找出實(shí)用性的信息,對相關(guān)單位有十分大的意義。
一、數(shù)據(jù)挖掘技術(shù)的概念及功能
數(shù)據(jù)挖掘(Data Mining),就是從大量復(fù)雜的數(shù)據(jù)信息中挖掘出有利用價(jià)值的信息。通常,這些大量的復(fù)雜的數(shù)據(jù)信息都被認(rèn)為是隨機(jī)的、模糊的、不完全的、有噪音的,完全沒有進(jìn)行處理的信息。然而經(jīng)過挖掘之后,這些原本看似沒有任何利用價(jià)值的信息,就會呈現(xiàn)出一種新穎、有效、潛在有用的狀態(tài),最終為人們的生活與生產(chǎn)提供便利。這種信息數(shù)據(jù)的處理變化過程,就常常被稱作數(shù)據(jù)挖掘。它也可以理解成是在一些觀察數(shù)據(jù)或事實(shí)的集合中找正確模式的決策支持過程。數(shù)據(jù)挖掘是一門涉及面極其廣的交叉學(xué)科,可以簡單地將它認(rèn)為是經(jīng)濟(jì)信息轉(zhuǎn)換的一個(gè)過程,同時(shí)它還包含了機(jī)器學(xué)習(xí)、模式識別、數(shù)據(jù)庫、數(shù)理統(tǒng)計(jì)、神經(jīng)網(wǎng)絡(luò)、模糊數(shù)學(xué)等相關(guān)技術(shù)。
數(shù)據(jù)挖掘主要功能有:預(yù)測模型、分類、數(shù)據(jù)聚類、數(shù)據(jù)總結(jié)、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、依賴關(guān)系或依賴模型發(fā)現(xiàn)、序列模式發(fā)現(xiàn)等。根據(jù)數(shù)據(jù)挖掘技術(shù)的作用和特點(diǎn)來看,它具備的優(yōu)點(diǎn)是:具有自動找出有價(jià)值的數(shù)據(jù)信息的功能;能夠處理大量的數(shù)據(jù)信息;反映數(shù)據(jù)信息快速有效;能夠有效地對數(shù)據(jù)信息進(jìn)行分析與評判,描繪過去和未來。
二、經(jīng)濟(jì)統(tǒng)計(jì)中數(shù)據(jù)挖掘技術(shù)的優(yōu)勢
(一)數(shù)據(jù)有效性高
數(shù)據(jù)挖掘技術(shù)可以實(shí)現(xiàn)對整體數(shù)據(jù)的深層次加工,而且使用者可以根據(jù)自身的要求和目的,在長期積累的數(shù)據(jù)庫中找到有用的數(shù)據(jù)信息。通常情況下表現(xiàn)為兩種形式,一種是對原有的數(shù)據(jù)庫進(jìn)行有效的管理,另外一種是對現(xiàn)有形成的數(shù)據(jù)進(jìn)行實(shí)際的分析。分析的方式也有所不同,可以從數(shù)據(jù)管理的形式出發(fā),在這個(gè)過程中對所有的數(shù)據(jù)進(jìn)行歸類,將原本復(fù)雜而又混亂的數(shù)據(jù)信息進(jìn)行正確的管理,保證數(shù)據(jù)統(tǒng)計(jì)的安全性和使用數(shù)據(jù)時(shí)的搜索便利性。
(二)較強(qiáng)的綜合應(yīng)用性
數(shù)據(jù)挖掘技術(shù)是一個(gè)系統(tǒng)化的工具,可以滿足人們對數(shù)據(jù)的各種需求,由于各個(gè)經(jīng)濟(jì)部門所管理的領(lǐng)域不同,方式和目的都存在較大的差異,所以對需求的數(shù)據(jù)形式和方式都會存在差異,需要進(jìn)行不同的數(shù)據(jù)處理,這也是數(shù)據(jù)挖掘技術(shù)的優(yōu)勢之一,不僅可以使不同的經(jīng)濟(jì)統(tǒng)計(jì)部門滿足自己的需求,得到自己所需要的信息,而且可以用不同的形式表達(dá)統(tǒng)計(jì)后的數(shù)據(jù),還可以通過對數(shù)據(jù)的來源和統(tǒng)計(jì)方式進(jìn)行評估,判斷是否有足夠的正確性。而且這些數(shù)據(jù)還可以自動進(jìn)行格式的轉(zhuǎn)換,滿足實(shí)際的格式要求,可以進(jìn)行正常的錄入,保證經(jīng)濟(jì)統(tǒng)計(jì)的正常進(jìn)行。
(三)較強(qiáng)的數(shù)據(jù)整合性
很多經(jīng)濟(jì)統(tǒng)計(jì)部門都還在使用傳統(tǒng)的方法,收集數(shù)據(jù)和分析數(shù)據(jù)都存在一定的局限,不能夠觸及數(shù)據(jù)的整體,可能會重復(fù)分析一些數(shù)據(jù),降低統(tǒng)計(jì)的質(zhì)量和效率。數(shù)據(jù)挖掘技術(shù)可以整合整個(gè)統(tǒng)計(jì)數(shù)據(jù)系統(tǒng),使所有的信息都可以被分析。特別是在一定的宏觀數(shù)據(jù)的基礎(chǔ)上,保證各數(shù)據(jù)的準(zhǔn)確性,在整合過后有更加充分的資源。
三、數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計(jì)中的應(yīng)用
(一)預(yù)處理技術(shù)
在實(shí)行經(jīng)濟(jì)數(shù)據(jù)的統(tǒng)計(jì)過程中,最初期的方法就是預(yù)處理技術(shù),對所有的數(shù)據(jù)進(jìn)行一定的初步處理。數(shù)據(jù)挖掘技術(shù)也是一種分析和整合基礎(chǔ)信息的技術(shù),會受到基礎(chǔ)信息本身很大的限制,不可能隨意對數(shù)據(jù)信息進(jìn)行處理。所以在進(jìn)行全面性的主要過程之前,必須首先對所有的數(shù)據(jù)信息進(jìn)行預(yù)處理,才能使數(shù)據(jù)挖掘技術(shù)實(shí)施得更加完美。具體的預(yù)處理應(yīng)該包括數(shù)據(jù)中的不準(zhǔn)確、不真實(shí)的數(shù)據(jù),以及不同的數(shù)據(jù)之間可能存在的較大差異等,這都會對數(shù)據(jù)分析產(chǎn)生影響。在預(yù)處理中實(shí)行數(shù)據(jù)清理就是對有問題的數(shù)據(jù)進(jìn)行處理,也包括不同的方法、不同的形式,要結(jié)合實(shí)際的情況和實(shí)際的數(shù)據(jù)需求選擇最合適的處理方法,分析出最高質(zhì)量的數(shù)據(jù)。
(二)決策樹技術(shù)
決策樹技術(shù)是數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計(jì)中一種十分常見的方法,通過對數(shù)據(jù)建立合適的決策樹,從而可以直接、迅速地反映整個(gè)數(shù)據(jù)的具體分布情況。完成一個(gè)全面的決策樹通常分兩步,首先要根據(jù)大致的信息建立一個(gè)簡單的決策樹,并配置一個(gè)模型,能夠?qū)崿F(xiàn)簡單的輸出分析。然后對構(gòu)建完成的決策樹進(jìn)行完善,對不同的數(shù)據(jù)進(jìn)行分類,根據(jù)不同數(shù)據(jù)的特點(diǎn)和狀態(tài),從樹的根部到枝干,依次輸入不同的數(shù)據(jù),直到輸完所有的數(shù)據(jù)完成分類后停止。當(dāng)出現(xiàn)所有的數(shù)據(jù)都屬于同一類或者沒有辦法進(jìn)行分類時(shí)就要立即停止分類,然后進(jìn)行下一步的工作。在建立和完善整個(gè)決策樹的模型后,就要根據(jù)使用者實(shí)際使用的數(shù)據(jù)信息和要求對數(shù)據(jù)進(jìn)行剪切,將不必要的數(shù)據(jù)或者無用的信息丟掉,從而再進(jìn)行數(shù)據(jù)分析時(shí)可以更加快速,可以更加準(zhǔn)確地得到所需要的信息,減少因?yàn)閿?shù)據(jù)過多而在數(shù)據(jù)輸出時(shí)出現(xiàn)問題的可能性,降低其產(chǎn)生的起伏影響。
(三)遺傳算法
它是一種根據(jù)生物遺傳機(jī)理和自然選擇的隨機(jī)搜索算法,其主要思路是依據(jù)特定的社會問題,然后在指定對象中去采集相關(guān)信息,最后通過歸整、分析隱含的信息,進(jìn)而得到結(jié)果。經(jīng)濟(jì)問題不是固定不變的,相反它是一個(gè)不斷發(fā)展變化的問題,內(nèi)部的聯(lián)系千絲萬縷,改變其中一項(xiàng)其他的也會相應(yīng)改變。按照遺傳算法的步驟,從源頭開始,一步步向下探索,去提取信息數(shù)據(jù),對整體進(jìn)行分析,這樣就能把經(jīng)濟(jì)問題目標(biāo)化、具體化、直接化,使得在研究問題時(shí)可以更加直觀,把隱性的信息表現(xiàn)出來,使得經(jīng)濟(jì)統(tǒng)計(jì)工作更加直白、簡單。
(四)神經(jīng)網(wǎng)絡(luò)法
神經(jīng)網(wǎng)絡(luò)法是一種高強(qiáng)度模擬人腦加工信息過程的智能現(xiàn)代信息技術(shù)。它和人的神經(jīng)運(yùn)動過程一樣,首先進(jìn)行數(shù)據(jù)的輸入,然后進(jìn)行精準(zhǔn)的分析,最后輸出。其在經(jīng)濟(jì)統(tǒng)計(jì)過程中得到了實(shí)際的應(yīng)用。神經(jīng)網(wǎng)絡(luò)法提供了一種準(zhǔn)確的、完整的處理經(jīng)濟(jì)統(tǒng)計(jì)的過程,使得經(jīng)濟(jì)運(yùn)行模式和人在處理信息的過程很相像,一樣實(shí)用化、形象化、具體化,使經(jīng)濟(jì)過程中各個(gè)部分之間能取得更好的聯(lián)系,從而獲得對經(jīng)濟(jì)統(tǒng)計(jì)問題的處理辦法。
四、結(jié)語
數(shù)據(jù)挖掘技術(shù)在現(xiàn)代經(jīng)濟(jì)統(tǒng)計(jì)中占有重要的地位,也是未來統(tǒng)計(jì)工作的一種趨勢。它可以實(shí)現(xiàn)對數(shù)據(jù)更深的分析處理,提升分析數(shù)據(jù)的質(zhì)量,可以幫助決策者做出更好、更穩(wěn)定的發(fā)展決策,帶來更大的效益。我們一定要及時(shí)更新傳統(tǒng)的經(jīng)濟(jì)統(tǒng)計(jì)方法,擴(kuò)大數(shù)據(jù)挖掘技術(shù)的使用范圍,從而提高統(tǒng)計(jì)的效率,減少統(tǒng)計(jì)時(shí)的成本支出。
(作者單位為汾西礦業(yè)集團(tuán)中興煤業(yè)公司)
參考文獻(xiàn)
[1] 王思懿.數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計(jì)中的應(yīng)用管窺[J].商,2015(18):216.
[2] 崔丹.數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計(jì)中的應(yīng)用探索[J].財(cái)經(jīng)界,2014(5):149.
[3] 張紅軍.談?wù)剶?shù)據(jù)挖掘技術(shù)及其應(yīng)用[J].廣西梧州師范高等??茖W(xué)校學(xué)報(bào),2013 (3):23-25.endprint