胡馗
【摘要】信息化管理已經(jīng)成為現(xiàn)代企業(yè)經(jīng)營管理的主要模式,且待分析和待計算的數(shù)據(jù)量不斷增長,面臨著數(shù)據(jù)種類多、業(yè)務(wù)關(guān)聯(lián)復雜、信息變化頻率大等問題的困擾。本文針對這種情況,提出采用數(shù)據(jù)倉庫技術(shù)來構(gòu)建企業(yè)信息化的管理系統(tǒng),以便對企業(yè)各部門的業(yè)務(wù)數(shù)據(jù)進行整合與分析,成為企業(yè)管理與投資決策客觀依據(jù)。
【關(guān)鍵詞】企業(yè)管理;數(shù)據(jù)倉庫;數(shù)據(jù)集市
1.引言
隨著市場競爭的不斷加劇,各個企業(yè)都在致力于采用信息化的管理方式來提高本企業(yè)的運行效率,從而增強核心競爭力,信息化管理系統(tǒng)的引入使得企業(yè)從以往粗放式的管理模式逐漸朝著精細化、快捷化方向發(fā)展,與此同時帶來的是信息處理需求的不斷上升;另一方面,由于各種商務(wù)行為無論從數(shù)量上還是從規(guī)模上都在日益增長,企業(yè)間的業(yè)務(wù)交流越來越廣泛,導致數(shù)據(jù)源和數(shù)據(jù)種類日益復雜,迫使企業(yè)必須尋求更高集成度的信息處理方案,幫助企業(yè)在海量的數(shù)據(jù)中迅速搜尋到有價值的信息。在這種需求下,數(shù)據(jù)倉庫技術(shù)得到了有利的推廣和使用,成為了各個企業(yè)決策支持系統(tǒng)運行的主要平臺,而其中最重要的應(yīng)用就是實現(xiàn)跨平臺聯(lián)機分析處理(Online Analytieal Proeessing,OLAP)。
2.數(shù)據(jù)倉庫技術(shù)特征
數(shù)據(jù)倉庫的特征可以歸納為以下三個方面[1]:
(1)面向主題組織:與面向?qū)嶓w間邏輯關(guān)系的傳統(tǒng)數(shù)據(jù)庫不同的是,數(shù)據(jù)倉庫是面向主題組織的。前者只能解決同一數(shù)據(jù)庫內(nèi)的不同數(shù)據(jù)之間的邏輯關(guān)系,并在有限的范圍內(nèi)完成數(shù)據(jù)分析、查詢等操作,在這種情況下想要得到精確且全面的分析結(jié)論是非常困難的;而數(shù)據(jù)倉庫面向主題組織,從根本上解決了這一問題,在對數(shù)據(jù)進行有效存儲的時候就已經(jīng)完成了數(shù)據(jù)分類的操作,并在多個數(shù)據(jù)庫內(nèi)形成了統(tǒng)一的分類索引,即不同的主題。通過對主題的操作,就可輕松的實現(xiàn)多個數(shù)據(jù)庫的聯(lián)立查詢和分析,其結(jié)論的全面性得到了良好的保障。
(2)集成性:數(shù)據(jù)倉庫以主題為數(shù)據(jù)存儲的單位,而每個主題內(nèi)的數(shù)據(jù)則分別從不同的數(shù)據(jù)源提取而來,從而在某一主題內(nèi)形成了相關(guān)數(shù)據(jù)的高度集成性。為了解決多來源數(shù)據(jù)之間可能存在的數(shù)據(jù)矛盾與沖突的情況,因此在數(shù)據(jù)采集過程中必須經(jīng)過相關(guān)的預處理,通過數(shù)據(jù)粒度的細化與綜合,確保數(shù)據(jù)的正確性。
(3)時效性:由于企業(yè)數(shù)據(jù)的不斷積累,系統(tǒng)分析與處理的數(shù)據(jù)對象日益增大,而大量的歷史數(shù)據(jù)的有效性會逐漸消退,最終退化成影響分析結(jié)論客觀性的不良信息,因此,對于數(shù)據(jù)時效性的研究一直是數(shù)據(jù)倉庫領(lǐng)域研究的重點。目前最主流的解決方案是為不同時期的數(shù)據(jù)設(shè)定不同的權(quán)值,權(quán)值的高低由數(shù)據(jù)的類型和存在時間等多種因素綜合判斷,盡可能的保證被引用的數(shù)據(jù)都具有時效性。
3.數(shù)據(jù)倉庫主要應(yīng)用方案
目前數(shù)據(jù)倉庫技術(shù)在現(xiàn)代企業(yè)信息化管理領(lǐng)域已逐漸形成共識,其解決方案也逐漸的實現(xiàn)的標準化,這對跨平臺、跨地區(qū)的數(shù)據(jù)通信具有非常重要的促進作用。即先通過數(shù)據(jù)綜合分析將數(shù)據(jù)有計劃的放到數(shù)據(jù)倉庫中對應(yīng)的主題領(lǐng)域內(nèi),然后通過前臺接口與用戶進行交互,提供各種數(shù)據(jù)處理服務(wù),甚至可實現(xiàn)一定程度的智能化分析。目前使用最多前臺接口為聯(lián)機分析處理(OLAP)和數(shù)據(jù)挖掘(DM)。
3.1聯(lián)機分析處理OLAP
顧名思義,OLAP主要解決的是多系統(tǒng)連接與控制的問題,使得多個數(shù)據(jù)庫形成有機整體,共同完成用戶提出的商業(yè)信息的處理需求,其最大的功能在于對多維結(jié)構(gòu)數(shù)據(jù)的處理上,它可對不同數(shù)據(jù)庫內(nèi)的數(shù)據(jù)進行分門別類的篩選與引用,同時根據(jù)預設(shè)的條件將權(quán)值賦給不同時期、不同類型的數(shù)據(jù),在此基礎(chǔ)上實現(xiàn)數(shù)據(jù)的分析與匯總,實現(xiàn)數(shù)據(jù)精煉的效果。同時根據(jù)用戶提出的不同需求,采用不同的展示方式,將數(shù)據(jù)呈現(xiàn)給企業(yè)決策者,如常見的各類趨勢圖、指標圖、各類賬目分析表。
3.2數(shù)據(jù)挖掘
數(shù)據(jù)挖掘技術(shù)是近些年來發(fā)展較快的信息處理技術(shù),其特點是利用分類、關(guān)聯(lián)性分析、序列分析、群集分析、機器學習以及融合一些人工智能算法,來對龐大的海量數(shù)據(jù)進行處理,提取出有價值的信息[2]。在數(shù)據(jù)倉庫平臺中,數(shù)據(jù)挖掘技術(shù)往往用來對大量的歷史數(shù)據(jù)進行快速的處理,尤其對于一些不易察覺的數(shù)據(jù)間存在的邏輯關(guān)系進行提煉,從而有效的減少系統(tǒng)的計算量,盡可能的消除冗余的無效數(shù)據(jù),壓縮計算對象的體積,在此技術(shù)上再通過OLAP完成跨平臺的聯(lián)機分析就可達到事半功倍的效果。
3.3數(shù)據(jù)集市
數(shù)據(jù)集市本質(zhì)上也是數(shù)據(jù)倉庫的一種,只不過它是某個部門或某個重要業(yè)務(wù)的具體應(yīng)用,包括該部門或該項目在一定時期內(nèi)的數(shù)據(jù)累積。若每個部門或每個項目都有屬于自己的數(shù)據(jù)集市,那么將這些數(shù)據(jù)集市組合起來,就成為了該企業(yè)的數(shù)據(jù)倉庫系統(tǒng),因此,可以將數(shù)據(jù)集市看成是數(shù)據(jù)倉庫的一部分,或者是一個小型的數(shù)據(jù)倉庫。系統(tǒng)結(jié)構(gòu)如圖1所示。
4.結(jié)束語
數(shù)據(jù)倉庫在企業(yè)中已經(jīng)廣泛應(yīng)用,大量的使用經(jīng)驗證明,為企業(yè)建立符合自身經(jīng)營特點的數(shù)據(jù)倉庫,可以幫助企業(yè)決策層更全面的了解自身的經(jīng)營狀態(tài),更深入的分析大量的業(yè)務(wù)數(shù)據(jù)所隱藏的指導意義,從而可以更有效的利用企業(yè)資源,更科學的進行管理決策,從而在競爭中掙得先機。隨著大數(shù)據(jù)的逐漸興起,數(shù)據(jù)倉庫的發(fā)展必將迎來一個新的高峰。
參考文獻
[1]夏火松.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)[M].第1版 北京:科學出版社,2004
[2]高洪深.決策支持系統(tǒng)(DSS)理論方法案例[M].第3版 北京:清華大學出版社,2000