山東省菏澤市定陶區(qū)統(tǒng)計局 張麗麗
試析數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應(yīng)用
山東省菏澤市定陶區(qū)統(tǒng)計局 張麗麗
我國社會經(jīng)濟體制的變更推動著我國社會經(jīng)濟的快速發(fā)展,2016年我國國民生產(chǎn)總值已達74萬億,同時在社會經(jīng)濟活動當(dāng)中,因為不同類型經(jīng)濟發(fā)展因素的影響,逐漸形成了一種比較復(fù)雜的經(jīng)濟關(guān)系體制,經(jīng)濟的快速發(fā)展已經(jīng)開始超過了人類大腦可以分析和理解的范圍。因此我們需要對當(dāng)代先進的統(tǒng)計技術(shù)加以有效應(yīng)用,來對經(jīng)濟發(fā)展的趨勢進行分析。在我國最近幾年的統(tǒng)計學(xué)發(fā)展過程中,數(shù)據(jù)挖掘技術(shù)慢慢發(fā)展成為了經(jīng)濟統(tǒng)計和分析的全新形式,在社會的統(tǒng)計活動當(dāng)中得到廣泛應(yīng)用。
數(shù)據(jù)挖掘 經(jīng)濟統(tǒng)計 應(yīng)用分析
自我國改革開放之后,我國在社會經(jīng)濟的發(fā)展速度上不斷加快,我國在歷經(jīng)幾十年的經(jīng)濟發(fā)展建設(shè)活動之后,已經(jīng)積累下了大量的經(jīng)濟發(fā)展數(shù)據(jù)。因為經(jīng)濟數(shù)據(jù)本身都具備一定的發(fā)展性與信息量的龐大性,造成了對統(tǒng)計數(shù)據(jù)人員在對其中的數(shù)據(jù)信息進行使用的過程中,只是單純地局限于對其中樹據(jù)數(shù)字信息的分析和使用,并且對數(shù)據(jù)信息中的重要統(tǒng)計資料不進行更加深入的挖掘工作。對數(shù)據(jù)挖掘技術(shù)來講,它作為一種全新的統(tǒng)計方式,它的優(yōu)勢主要表現(xiàn)在對所有的信息數(shù)據(jù)實施橫向或者是縱向的開發(fā),在實際的研究范圍上都得到了相應(yīng)的延伸,并且可以通過對數(shù)據(jù)的挖掘,可以從基礎(chǔ)性的數(shù)據(jù)當(dāng)中獲得更多更有價值的數(shù)據(jù)信息,可以更好地為社會中的統(tǒng)計數(shù)據(jù)提出良好的需求。
數(shù)據(jù)挖掘技術(shù)主要是指通過比較深層次的開發(fā),從大量的數(shù)據(jù)當(dāng)中挖掘出比較有價值的信息,并且對所挖掘出來數(shù)據(jù)進行分析和整理,有效地實現(xiàn)對比較復(fù)雜和混亂的數(shù)據(jù)進行有效的整合。這其中我們所提到的大量數(shù)據(jù)具有比較強的模糊性、隨機性以及不完全性的特性,通過對數(shù)據(jù)挖掘技術(shù)可以將其變成比較有價值和新型的信息。數(shù)據(jù)挖掘不但是在經(jīng)濟信息中實現(xiàn)信息的變化,同時還是一種具有科學(xué)交換特性的數(shù)據(jù)技術(shù),其中重點涉及了學(xué)習(xí)、數(shù)據(jù)分析以及數(shù)據(jù)庫等方面的內(nèi)容,在統(tǒng)計行業(yè)當(dāng)中得到了非常廣泛的應(yīng)用。
在經(jīng)濟數(shù)據(jù)統(tǒng)計工作當(dāng)中,作為一種基礎(chǔ)性的數(shù)據(jù)處理形式,是實現(xiàn)經(jīng)濟數(shù)據(jù)實現(xiàn)預(yù)處理的主要方式,因為數(shù)據(jù)挖掘技術(shù)本身就屬于一種為基礎(chǔ)性信息提供準確分析的技術(shù),數(shù)據(jù)挖掘受到了基礎(chǔ)數(shù)據(jù)信息的限制性,它不可能用來代替經(jīng)濟數(shù)據(jù)中所具有的數(shù)據(jù)信息收集功能。因此作為數(shù)據(jù)挖掘系統(tǒng)中的基礎(chǔ)性的數(shù)據(jù)信息,都需要提前進行預(yù)處理技術(shù),所處理的內(nèi)容主要包含了對這些方面數(shù)據(jù)的不準確性、不真實性以及不同經(jīng)濟數(shù)據(jù)相互之間出現(xiàn)比較大的差異性[1]。
由于當(dāng)前我國在社會活動中,對經(jīng)濟數(shù)據(jù)的統(tǒng)計內(nèi)容比較龐大,其中對眾多的經(jīng)濟數(shù)據(jù)的統(tǒng)計工作,并不是來源于在官方統(tǒng)計局當(dāng)中,而是從社會中的一些統(tǒng)計組織或者是一些社會經(jīng)濟個體當(dāng)中所提供的數(shù)據(jù),在對數(shù)據(jù)信息實施挖掘的過程中,其中這些經(jīng)濟數(shù)據(jù)主要來源于多方面的數(shù)據(jù)模式的集合,通過經(jīng)濟數(shù)據(jù)的集成化來實現(xiàn)對實體經(jīng)濟數(shù)據(jù)信息的識別工作。
數(shù)據(jù)轉(zhuǎn)換的方式,主要是指在對其中某種方式的數(shù)據(jù)變化形式,可以充分滿足數(shù)據(jù)要求變化的方式,轉(zhuǎn)換的方式主要分成數(shù)據(jù)的泛化和數(shù)據(jù)的準確性。對于后者來講其中主要涵蓋了數(shù)據(jù)的最大規(guī)范化、最小規(guī)范化以及平均值的規(guī)范化,但是數(shù)據(jù)中的泛化主要是指對最高層次中的數(shù)據(jù)信息對低層次中的數(shù)據(jù)進行替換,其中主要包含了對數(shù)據(jù)連續(xù)性的處理,但是因為這種方式對實現(xiàn)數(shù)據(jù)的連續(xù)性的處理比較困難,所以說,通常只選擇離散的方式,也就是對數(shù)據(jù)進行區(qū)間形式的劃分[2]。
決策樹屬于一種預(yù)測性的模型,是對象價值和對象屬性相互之間形成的一種映射性的關(guān)系。其中每個葉片點對應(yīng)的從根部的節(jié)點到這個葉節(jié)點上,所經(jīng)歷的過程上所表現(xiàn)出的對象的數(shù)據(jù),同時還可以作為一種預(yù)測性分析。在經(jīng)過了這種環(huán)節(jié)之后就可以有效實現(xiàn)相關(guān)的管理決策人員對數(shù)據(jù)信息的使用。決策樹的方式首先需要建立決策樹:第一是通過對相關(guān)的數(shù)據(jù)信息進行大體的分析,通過測試集成來實施模型測試工作,并且進行簡單的處理工作,然后再建立起輸出模型[3];第二是通過建立起完成的決策樹系統(tǒng),來對數(shù)據(jù)信息實施簡單化的處理,這個過程有稱之為“遞歸”,在完成整個決策樹的建立之后,再對決策樹中的枝葉信息進行修剪,以此來避免在之后的調(diào)試工作中一些不相關(guān)數(shù)據(jù),對決策樹產(chǎn)生的影響。
數(shù)據(jù)的回歸分析,主要指的是通過兩種或者多種變量相互之間產(chǎn)生的依賴性,通過數(shù)據(jù)之間形成的一種定量的關(guān)系形成一種的統(tǒng)計學(xué)的分析方式。通過對數(shù)據(jù)回歸的分析可以有效的建立起變量相互之間的回歸方程,通過相關(guān)的因素分析和判斷,對其中的變量和次變量之間的關(guān)系進行分析,通過這種不同類型方式的實驗,實現(xiàn)測量誤差降到最低,通過回歸的數(shù)據(jù)分析方式,可以實現(xiàn)對社會市場的占有率、品牌的銷售量以及整體的經(jīng)濟發(fā)展趨勢等進行有效的解釋,將其中的兩個或者兩個以上的數(shù)據(jù)關(guān)系,通過函數(shù)的關(guān)系進行表達,以此方便與更有效的解決問題[4]。
數(shù)據(jù)挖掘技術(shù)作為一種對數(shù)據(jù)信息進行深層次加工的統(tǒng)計基礎(chǔ),它本身具備著比較明確的目的性,在實際的使用過程當(dāng)中,可以通過長時間的積累統(tǒng)計數(shù)據(jù),來對基礎(chǔ)性數(shù)據(jù)實施深層次的處理和加工。在實際的使用過程當(dāng)中,基于數(shù)據(jù)使用者的具體要求,從不同的分析角度上出發(fā)對數(shù)據(jù)在應(yīng)用過程中,對數(shù)據(jù)本身存在的數(shù)據(jù)信息實施統(tǒng)計和分類,將原本比較混亂的數(shù)據(jù)庫實施科學(xué)和系統(tǒng)的歸類整理,通過這種方式來保證數(shù)據(jù)信息管理的高效性和便利性。
對于數(shù)據(jù)挖掘技術(shù)來講,它屬于一種系統(tǒng)型的數(shù)據(jù)統(tǒng)計工具,并不屬于一種單一性的數(shù)據(jù)分析,可以有效地實現(xiàn)對使用者本身對各種不同類型的信息的需求性,伴隨當(dāng)前我國社會經(jīng)濟的快速發(fā)展,其中經(jīng)濟管理部門中需要對社會當(dāng)中大量的經(jīng)濟發(fā)展數(shù)據(jù)進行統(tǒng)計和分析,并且數(shù)據(jù)信息所表現(xiàn)出的管理和處理的權(quán)限各不相同,這就需要經(jīng)濟管理部門需要針對不同需求的經(jīng)濟管理內(nèi)容進行統(tǒng)計分析,將其中的數(shù)據(jù)轉(zhuǎn)換成不同的數(shù)據(jù)形式,并且可以依照信息的具體來源以及統(tǒng)計信息的計算形式對其可靠程度來進行評估,保證數(shù)據(jù)統(tǒng)計信息的準確性[5]。
在我國的經(jīng)濟管理部門當(dāng)中,對職權(quán)的管理工作上表現(xiàn)的比較分散,其中不同類型的經(jīng)濟管理部門中,對數(shù)據(jù)信息的需求量以及需求的類型也是不盡相同的。在很多地區(qū),很多的經(jīng)濟管理部門對其統(tǒng)計活動的傳統(tǒng)實施方式,具有比較明顯的局限性,很難通過經(jīng)濟管理活動來提供更加優(yōu)良的服務(wù),在實際的工作當(dāng)中經(jīng)常會出現(xiàn)一些重復(fù)性統(tǒng)計或者統(tǒng)計不完全的現(xiàn)象,嚴重影響到了經(jīng)濟數(shù)據(jù)分析的有效性,通過數(shù)據(jù)挖掘技術(shù)的應(yīng)用,有效地避免了這方面的問題,只要充分地保證所得數(shù)據(jù)的準確性,通過數(shù)據(jù)挖掘技術(shù)就可以對其實施有效地整合和處理,從而使數(shù)據(jù)資源變得更加豐富多樣。
本文通過對數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應(yīng)用分析,從中得出結(jié)論,在受到了不同類型經(jīng)濟發(fā)展因素的影響,經(jīng)濟的發(fā)展逐漸形成了一種比較復(fù)雜化的經(jīng)濟關(guān)系體制,經(jīng)濟的快速發(fā)展已經(jīng)開始超過了人類大腦可以分析和理解的范圍,我們就需要對當(dāng)代先進的統(tǒng)計技術(shù)加以有效的應(yīng)用,來對經(jīng)濟發(fā)展的趨勢進行分析,通過對數(shù)據(jù)挖掘技術(shù)的有效的應(yīng)用,有效實現(xiàn)了對比較復(fù)雜的經(jīng)濟數(shù)據(jù)的分析,對我國社會經(jīng)濟的發(fā)展起到了保障性的作用。
[1] 楊梅冰,梁思思.關(guān)于數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應(yīng)用[J].時代金融,2015(24).
[2] 董靜.試析數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應(yīng)用[J].商,2015(31).
[3] 柳楓.基于統(tǒng)計的數(shù)據(jù)挖掘技術(shù)在CRM系統(tǒng)中的應(yīng)用研究[D].大連理工大學(xué),2013.
[4] 楊杰,黃欣,呂永.數(shù)據(jù)挖掘技術(shù)在建模、優(yōu)化和故障診斷中的應(yīng)用[J].紅外與激光工程,2015(03).
[5] 楊振艦.可視化數(shù)據(jù)挖掘技術(shù)在城市地下空間GIS中的應(yīng)用研究[D].河北工業(yè)大學(xué),2014.
F222.3
A
2096-0298(2018)01(a)-013-02
張麗麗(1975-),女,漢族,山東省菏澤市人,本科,中級統(tǒng)計師,主要從事統(tǒng)計設(shè)計方面的研究。