張澤雅
裝甲兵工程學院,北京 100072
基于數(shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng)及應(yīng)用探討
張澤雅
裝甲兵工程學院,北京 100072
文章介紹了數(shù)據(jù)挖掘技術(shù)的概念,分析了基于數(shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng),探析了基于數(shù)據(jù)挖掘技術(shù)決策支持系統(tǒng)的應(yīng)用,以供參考。
數(shù)據(jù)挖掘技術(shù);決策支持系統(tǒng);應(yīng)用
隨著數(shù)據(jù)庫技術(shù)的快速發(fā)展和廣泛應(yīng)用,人們對數(shù)據(jù)信息提出了更高層次的需求,但是傳統(tǒng)的決策支持系統(tǒng)并不能夠滿足人們在分析層次、決策層次的實際需求,基于數(shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng)應(yīng)運而生?;跀?shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng),利用數(shù)據(jù)挖掘技術(shù)強大的數(shù)據(jù)挖掘功能,能夠為決策支持系統(tǒng)提供有效、可靠、全面的數(shù)據(jù)信息,幫助決策人員快速、準確的做出決策,由此可見其重要性。
數(shù)據(jù)挖掘指的是從隨機的、模糊的、有噪聲的、不完全的、大量的數(shù)據(jù)信息中,提取隱含在其中的人們事先不知道,但是又有用、潛在的信息知識。數(shù)據(jù)挖掘涵蓋了高性能計算、數(shù)據(jù)可視化、機器學習、統(tǒng)計學、數(shù)據(jù)倉庫以及數(shù)據(jù)庫系統(tǒng)等眾多領(lǐng)域,廣泛涉及到歸納邏輯變成、信號處理、圖像數(shù)據(jù)庫、空間數(shù)據(jù)分析、模式識別以及人工神經(jīng)網(wǎng)絡(luò)等眾多學科。數(shù)據(jù)挖掘由三層體系結(jié)構(gòu)組成,其體系結(jié)構(gòu)如圖1所示。
圖1
基于數(shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng),能夠有效的解決傳統(tǒng)決策支持系統(tǒng)存在的問題,基于數(shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng)架構(gòu)構(gòu)建表現(xiàn)為以下幾個方面。
2.1 創(chuàng)建數(shù)據(jù)倉庫
為了滿足決策支持系統(tǒng)的實際要求,要求數(shù)據(jù)倉庫的數(shù)據(jù)具備以下特點:統(tǒng)一性、抽象性以及概括性,并且部門數(shù)據(jù)庫與數(shù)據(jù)倉庫中間還應(yīng)該設(shè)置一個虛擬層,該層的功能是對數(shù)據(jù)倉庫提取的數(shù)據(jù)進行清洗。結(jié)構(gòu)設(shè)計時數(shù)據(jù)倉庫設(shè)計的重點,包括物理設(shè)計與邏輯設(shè)計兩個方面。
1)數(shù)據(jù)庫物理設(shè)計。數(shù)據(jù)庫在物理設(shè)備上的存取、儲存結(jié)構(gòu)稱之為物理結(jié)構(gòu),良好的物理結(jié)構(gòu)設(shè)計能夠增大事務(wù)吞吐率、提高儲存空間利用率、縮短事務(wù)相應(yīng)時間、提高存取效率等,其中存取方法是物理設(shè)計的重點,常用的存取方法包括HASH存取方法、索引存取方法等。
2)數(shù)據(jù)庫邏輯設(shè)計。想要進行數(shù)據(jù)庫邏輯設(shè)計,首先應(yīng)該創(chuàng)建一個概念模型,該概念模型獨立于其他所有數(shù)據(jù)模型。數(shù)據(jù)庫邏輯設(shè)計的主要任務(wù)是將概念模型轉(zhuǎn)化成適應(yīng)數(shù)據(jù)庫系統(tǒng)支持的邏輯結(jié)構(gòu)。因為許多商用數(shù)據(jù)庫采用關(guān)系型數(shù)據(jù)庫,因此邏輯設(shè)計的主要任務(wù)是將實體和實體屬性的聯(lián)系轉(zhuǎn)變成關(guān)系模式。企業(yè)中存在眾多實體,例如市場部、財務(wù)部、生產(chǎn)部以及人力資源部等
2.2 數(shù)據(jù)庫挖掘方法
數(shù)據(jù)挖掘技術(shù)的本質(zhì)是商用信息的處理技術(shù),數(shù)據(jù)倉庫為數(shù)據(jù)挖掘提供了良好的活動空間,保證數(shù)據(jù)來源的完整性與廣泛性,數(shù)據(jù)庫挖掘方法主要包括以下兩個方面。
1)聯(lián)機處理分析。數(shù)據(jù)庫創(chuàng)建完成后,應(yīng)該對數(shù)據(jù)信息進行分析和處理,其中最常用的一種技術(shù)為聯(lián)機分析處理技術(shù)。數(shù)據(jù)倉庫重點對數(shù)據(jù)進行儲存,聯(lián)機處理分析的重點是對材料進行分析,進而為決策支持系統(tǒng)提供幫助?!熬S”與“度量”是聯(lián)機處理分析的兩個重要概念,在進行聯(lián)機處理分析時,通常把信息當作一個立方體,在對數(shù)據(jù)信息進行分析時,采用旋轉(zhuǎn)、鉆取、切塊、切片的方式進行處理,從各個角度進行數(shù)據(jù)的提取。以某產(chǎn)品的銷售信息為例,該產(chǎn)品的銷售信息包括倉庫、型號、日期等,每一個信息都指向不同的維表,倉庫號指向倉庫維表,包括倉庫名、庫存量、城市以及省等;產(chǎn)品型號指向產(chǎn)品維表,包括說明、商標、種類以及部門等;日期會指向日期維表,包括日、月、季以及年等。聯(lián)機處理分析的操作包括:其一,鉆取,鉆取包括下鉆與上卷,下鉆指的是向下一維的信息,例如,通過產(chǎn)品維表下鉆,能夠獲得倉庫名、庫存量等信息;上卷指的是從低維度的信息中獲得高維度的信息,例如,在日期維表上卷,能夠獲得產(chǎn)品銷售維表的信息;其二,切塊,切塊指的是在一定維度范圍內(nèi)切取信息的部分屬性,通過切塊處理后獲得的部分依然為立方體;其三,切片,切片指的是切取某一維度的某一或者某些屬性,獲得的部分為一個薄片。
2)數(shù)據(jù)挖掘。數(shù)據(jù)挖掘是聯(lián)機處理分析的高層階段,基于數(shù)據(jù)倉庫的支持,利用挖掘引擎能夠?qū)崿F(xiàn)對數(shù)據(jù)倉庫的信息進行多功能分析和處理。數(shù)據(jù)挖掘想要實現(xiàn)該種功能,應(yīng)該利用獨特的挖掘知識與算法,然后結(jié)合機器學習方法、模糊倫、統(tǒng)計分析、信息論以及人工智能技術(shù)等,在提取和分析的基礎(chǔ)上,對數(shù)據(jù)信息進行評價和處理。數(shù)據(jù)挖掘的過程包括準本數(shù)據(jù)集、建模分析、結(jié)果報告、策略應(yīng)用。
數(shù)據(jù)挖掘技術(shù)在決策支持系統(tǒng)中的應(yīng)用,是基于對深層數(shù)據(jù)的分析,以此揭示大量數(shù)據(jù)中有用的、潛在的以及隱含的信息,然后為決策支持提供可靠的幫助。數(shù)據(jù)挖掘技術(shù)在決策支持系統(tǒng)中的應(yīng)用,已經(jīng)被許多大企業(yè)、大公司應(yīng)用在決策控制中,決策支持系統(tǒng)中數(shù)據(jù)挖掘的步驟表現(xiàn)為:其一,根據(jù)行業(yè)背景,了解基本數(shù)據(jù);其二,確定數(shù)據(jù)挖掘的目標;其三,選定和數(shù)據(jù)庫相對應(yīng)的數(shù)據(jù)集合;其四,采用合適的挖掘算法進行實際數(shù)據(jù)挖掘;其五,對獲得的結(jié)果進行評價并輸出。目前,基于數(shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng)應(yīng)用的領(lǐng)域包括:氣象預(yù)報、金融風險分析、股票分析與預(yù)測、生產(chǎn)過程優(yōu)化、市場分析與預(yù)測等。雖然不同行業(yè)的給予數(shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng)的設(shè)計存在差異,但是可以采用一種簡單的模型來刻畫基本的框架,如圖2所示。在實際的決策支持系統(tǒng)中,首先應(yīng)該利用數(shù)據(jù)采集模塊、加工模塊對數(shù)據(jù)源中的所有數(shù)據(jù)載入數(shù)據(jù)倉庫中,然后采用數(shù)據(jù)挖掘、在線分析對數(shù)據(jù)倉庫中的所有數(shù)據(jù)進行分析,為實際決策提供可靠、有效的數(shù)據(jù)信息。
圖2
總而言之,基于數(shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng),很好的解決了傳統(tǒng)決策支持系統(tǒng)存在的問題,能夠?qū)崿F(xiàn)更高層次的系統(tǒng)整合,數(shù)據(jù)來源更加廣泛,集成度更高,挖掘目標更加抽象化與細化,為決策人員快速、準確的制定決策提供可靠、有效的參考。
[1]鄭得龍,李明明.基于數(shù)據(jù)挖掘的決策支持系統(tǒng)的應(yīng)用研究[J].工業(yè)控制計算機,2013,26(5):119-121.
[2]杜鵑.高級決策支持系統(tǒng)中的數(shù)據(jù)挖掘技術(shù)[J].現(xiàn)代計算機:下半月版,2011(16):20-23.
TP3
A
1674-6708(2015)148-0098-02