楊軍平 王娟
摘要:經濟社會的發(fā)展離不開經濟研究與管理工作,數(shù)據(jù)可以準確反映整個社會的經濟運行情況,因此,經濟數(shù)據(jù)必須具備真實性、可信性和時效性,能夠為我國的經濟發(fā)展提供信息保障。數(shù)據(jù)挖掘技術正是為了統(tǒng)計經濟統(tǒng)計工作更好的開展而出現(xiàn)的。本文首先從統(tǒng)計數(shù)據(jù)挖掘與經濟研究的關系及其應用與發(fā)展兩個方面簡要分析,接著就這一新技術在經濟統(tǒng)計工作中的重要意義和應用范圍進行了探討,以供相關人士參考和交流。
關鍵詞:數(shù)據(jù)挖掘;經濟研究與管理;統(tǒng)計數(shù)據(jù)
分類號:F273.4
引言:
準確的提取數(shù)據(jù)信息,提高經濟工作效率是統(tǒng)計數(shù)據(jù)挖掘重要的研究課題,數(shù)據(jù)挖掘技術的最大優(yōu)勢就是能夠從大量的數(shù)據(jù)中發(fā)現(xiàn)有用的信息并利用多種算法和分析軟件對數(shù)據(jù)進行分析和處理,從而解決經濟管理中的實際問題,數(shù)據(jù)挖掘和經濟統(tǒng)計調查工作的結合對于促進經濟研究與管理工作的發(fā)展具有非常重要的作用。
一、淺析統(tǒng)計數(shù)據(jù)挖掘在經濟研究與管理中的作用
1.什么是數(shù)據(jù)挖掘?
數(shù)據(jù)挖掘(Data Mining)是采用數(shù)學的、統(tǒng)計的、人工智能和神經網絡等領域的科學方法,如記憶推理、聚類分析、關聯(lián)分析、決策樹、神經網絡、基因算法等技術,從大量數(shù)據(jù)中挖掘出隱含的、先前未知的、對決策有潛在價值的關系、模式和趨勢,并用這些知識和規(guī)則建立用于決策支持的模型,提供預測性決策支持的方法、工具和過程。當然除了以上所列出的還有時間序列分析等一些其他的功能,數(shù)據(jù)挖掘的各項功能不是獨立存在的,它們在數(shù)據(jù)挖掘中互相聯(lián)系,發(fā)揮作用。
2.統(tǒng)計數(shù)據(jù)挖掘與經濟研究和管理之間的關系
數(shù)據(jù)挖掘技術簡單來說指的就是一種可以從海量信息數(shù)據(jù)中,快速、精準鎖定所需有用信息數(shù)據(jù)的技術。在未進行數(shù)據(jù)挖掘之前,雖然信息數(shù)據(jù)量較為龐大,但其中有許多信息數(shù)據(jù)并不完整,甚至存在諸多錯誤信息數(shù)據(jù),而通過使用數(shù)據(jù)挖掘技術,則可以將其中新穎的、有價值的信息數(shù)據(jù)準確提取出來,通過對此類精心篩選出的信息數(shù)據(jù)進行深度處理,從而為經濟研究和管理工作提供真實可靠的數(shù)據(jù)支持。在經濟研究與管理的過程中運用數(shù)據(jù)挖掘技術,可以幫助統(tǒng)計人員快速從眾多未加工的經濟數(shù)據(jù)中篩選出有價值的統(tǒng)計數(shù)據(jù),并對其進行深入處理與再加工,為相關工作人員分析經濟形勢、判斷經濟走向、制定經濟決策決議等提供重要數(shù)據(jù)參考[1]。此外,由于數(shù)據(jù)挖掘技術并不只是一種簡單的數(shù)據(jù)分析工具,其可以深入結合信息使用者的實際需求,特別是在我國經濟不斷發(fā)展下,經濟數(shù)據(jù)信息量驟增,其對于經濟統(tǒng)計技術的要求也越來越高,將數(shù)據(jù)挖掘技術運用在經濟統(tǒng)計當中,能夠有效保障信息評估的可靠性,實現(xiàn)數(shù)據(jù)處理成效的進一步優(yōu)化。在運用數(shù)據(jù)挖掘技術完成對經濟數(shù)據(jù)的深入挖掘與分析處理下,建立起相應的數(shù)據(jù)庫,可以在更好地融合各種數(shù)據(jù)信息的基礎上,為經濟管理活動需求提供高質量服務,有效減輕統(tǒng)計人員的工作負荷。
二、統(tǒng)計數(shù)據(jù)挖掘在經濟研究與管理中的應用與發(fā)展
1.數(shù)據(jù)挖掘在經濟研究與管理中的應用
數(shù)據(jù)挖掘技術在經濟研究與管理中的應用可以大致的分為兩個方向,分別為描述方向和預測方向。描述方向主要包括聚類和描述變量或數(shù)據(jù)間相關關系的各種算法,聚類是將相關關系較大的變量或個體聚為一類,預測方向主要包括分類和回歸,分類的主要工作是“貼標簽”,具體算法有決策樹、人工神經網絡、遺傳算法、SVM、樸素貝葉斯模型等?;貧w不同于分類的是分類是對離散型數(shù)據(jù)做預測而回歸是對連續(xù)型數(shù)據(jù)做預測,回歸模型包括線性回歸、多項式回歸、Lasso回歸、嶺回歸等。聚類在經濟研究與管理中最為常見,為了提高調查精度,在抽樣調查中可以先將調查對象聚類,再從不同類中分別抽取樣本,抽樣調查中的分層抽樣和整群抽樣都可能用到聚類方法。降維方法也廣泛的應用于經濟研究與管理中,由于統(tǒng)計調查進行一次需要花費大量的人力和物力,所以在統(tǒng)計調查中指標一般較多且詳細復雜,這就需要數(shù)據(jù)挖掘中的降維技術將相關性大的變量合并在一起,從而使數(shù)據(jù)分析更為簡便清晰,主要的降維方法有主成分法、因子分析法等?,F(xiàn)階段降維算法與評價算法相結合已應用于經濟評價中,正是由于對數(shù)據(jù)的大量收集、數(shù)據(jù)算法的產生、經濟數(shù)據(jù)庫的出現(xiàn)、先進的計算機技術、對數(shù)據(jù)進行精深統(tǒng)計方法計算的能力、數(shù)據(jù)訪問速度的提升等一系列東西的出現(xiàn),使得數(shù)據(jù)挖掘技術的作用越來越廣泛[2]。由于經濟研究與管理中中數(shù)據(jù)的實用性和準確性的需要,數(shù)據(jù)挖掘技術也開始慢慢在經濟研究與管理中中大展身手。
(1)統(tǒng)計分析法
經濟數(shù)據(jù)庫字段項之間存在兩種關系,相關關系和函數(shù)關系。就是對于數(shù)據(jù)庫中的信息利用統(tǒng)計學原理來進行分析。
(2)決策樹
決策樹一般用于預測模型,通過對大量復雜無順序的數(shù)據(jù)有目的分類,找到有價值的信息。同時,正是因為描述簡單,分類速度快,特別適合運用于經濟運行過程中出現(xiàn)的大規(guī)模數(shù)據(jù)的處理。
(3)遺傳算法
它是一種根據(jù)生物遺傳機理和自然選擇的隨機搜索算法,其主要思路是依據(jù)特定的社會問題,然后在指定對象中去采集相關信息,最后通過對信息中隱含部分的歸整、分析,進而得到結果。經濟問題不是固定不變的,相反它是一個不斷發(fā)展變化的問題,內部的聯(lián)系千絲萬縷,改變其中一項其他的也會相應改變。按照遺傳算法的步驟,從源頭開始,我們就一步步向下探索,去提取信息數(shù)據(jù),對整體進行分析[3],這樣就能把經濟問題目標化、具體化、直接化,使得在研究問題時可以更加直觀,把隱性的表現(xiàn)出來,使得經濟研究與管理中工作更加直白、簡單。
(4)粗集理論法
這是一種探究不確定知識、不精確的數(shù)學的工具,它通過上下集比較而出來結果。它易于操作,算法簡單;簡化輸入信息的表達空間;不需要給出額外信息,特別適合分析那些不確定的經濟因素。同時正是因為粗集理論法的這種原則,才能使得其與制定經濟決策的需求更加接近。
(5)神經網絡法
神經網絡法是一種高強度模擬人腦加工信息過程的智能現(xiàn)代信息技術。它和人的神經運動過程一樣,首先進行數(shù)據(jù)的輸入,然后進行精準的分析,最后輸出。在經濟研究與管理中過程中得到了實際的應用。神經網絡法為我們提供了一種準確的、完整的處理經濟研究與管理中的過程,使得經濟運行模式和人在處理信息的過程很相像,一樣實用化、形象化、具體化。使經濟過程中各個部分之間能取得更好的聯(lián)系,從而獲得對經濟研究與管理中問題的處理辦法。
2.數(shù)據(jù)挖掘在經濟研究與管理中的發(fā)展
(1)能為經濟研究與管理中提供有效的服務
數(shù)據(jù)挖掘技術雖然經歷的時間不是很長,然而,它的研究與應用水平已達到了一種相對穩(wěn)定的狀態(tài)。隨著科學技術的不斷發(fā)展,數(shù)據(jù)挖掘技術在各國也普遍受到關注,特別是在經濟研究與管理中領域。數(shù)據(jù)挖掘技術能夠這樣的的迅速發(fā)展,在很大程度上也是依賴于它對經濟研究與管理中的有效服務。
(2)能夠為經濟研究與管理中的不同需要提供不同的服務
目前,最常見的數(shù)據(jù)挖掘工具主要有綜合工具、通用型工具、和面向特定應用的工具。綜合工具,不僅能夠為處于商業(yè)中的經濟體提供有效的管理報告,并且還能夠對普通經濟結構中的數(shù)據(jù)信息經行深入挖掘。通用型工具在市場上占最大比例,其也是在應用方面最為成熟的挖掘工具。面向特定應用工具,從字面來理解,這種工具就是針對特定領域來提供服務的,具有很強的特定性和針對性,它能夠有針對性的對經濟管理中需要的數(shù)據(jù)進行挖掘和分析。
(3)建立宏觀經濟數(shù)據(jù)庫,為數(shù)據(jù)挖掘的應用提供了良好的電子平臺
在目前,全國范圍內的大部分經濟研究與管理部門主要使用的還是應用統(tǒng)計系統(tǒng)。大部分經濟研究與管理中的數(shù)據(jù)信息都處于一種不相聚分散的狀態(tài),并沒有形成一套有效的管理系統(tǒng)。經濟研究與管理過程中一旦出現(xiàn)問題,容易導致經濟數(shù)據(jù)的有效性與準確性受到影響[4]。經濟研究與管理部門可以利用數(shù)據(jù)挖掘基礎建立其相關的經濟數(shù)據(jù)庫,當建立了宏觀經濟數(shù)據(jù)庫以后,以上問題就可以尋找到有效的解決辦法。宏觀經濟數(shù)據(jù)庫與數(shù)據(jù)挖掘技術的合理運用,保證經濟研究與管理部門挖掘到的信息的準確性和真實,這不僅滿足了現(xiàn)實中經濟發(fā)展的需要,同時也為經濟決策的制定提供了準確、重要的依據(jù)。
三、結束語
數(shù)據(jù)挖掘技術在現(xiàn)代經濟研究與管理中占有重要的地位,它是未來統(tǒng)計工作的一種重要技術,數(shù)據(jù)挖掘技術可以實現(xiàn)對數(shù)據(jù)進行更深層次的分析和處理,且能有效的提升數(shù)據(jù)分析的質量,以幫助決策者做出更好、更正確的決策。及時更新傳統(tǒng)的經濟統(tǒng)計方法,擴大數(shù)據(jù)挖掘技術的使用范圍,對提高統(tǒng)計的效率,減少統(tǒng)計時的成本支出具有重要意義。
參考文獻:
[1]劉淑英. 淺談數(shù)據(jù)挖掘技術在經濟統(tǒng)計中的應用[J]. 經濟研究導刊, 2017, 000(035):176-177.
[2]趙艦波. 數(shù)據(jù)挖掘技術在經濟統(tǒng)計中的應用探索[J]. 經濟研究導刊, 2018, No.362(12):193-194.
[3]徐婧婧. 基于數(shù)據(jù)挖掘技術的經濟統(tǒng)計研究[J]. 中國鄉(xiāng)鎮(zhèn)企業(yè)會計, 2019(03):298-299.
[3]邢靜. 數(shù)據(jù)挖掘技術在經濟統(tǒng)計調查中的應用研究[J]. 現(xiàn)代經濟信息, 2019, 000(010):132.
北斗(青島)導航位置服務有限公司? 山東省青島市? 266109
楊軍平,男,1987.02,本科,健康電子
王娟,女,1988.02.06,大學本科,學士學位,軟件開發(fā)