周賀
摘要:數(shù)據(jù)倉庫作為現(xiàn)代企業(yè)決策制定和數(shù)據(jù)支持的一項重要技術(shù),為前端查詢和分析奠定基礎(chǔ)。本文概述了報文信息處理中數(shù)據(jù)倉庫技術(shù)的應(yīng)用,利用聯(lián)機(jī)分析處理技術(shù)和多維數(shù)據(jù)報表展示數(shù)據(jù),使工作人員快速準(zhǔn)確定位報文信息,從而能更好地分析數(shù)據(jù)、提取決策信息。
關(guān)鍵詞:數(shù)據(jù)倉庫;聯(lián)機(jī)分析處理;多維數(shù)據(jù)報表;決策
隨著通信網(wǎng)絡(luò)行業(yè)的發(fā)展,對數(shù)據(jù)庫積累的大量數(shù)據(jù)存儲、處理和應(yīng)用的問題顯得尤為突出。對于一些企業(yè)來講,往往數(shù)據(jù)庫中已經(jīng)積累了大量的數(shù)據(jù),要是通過更換數(shù)據(jù)庫數(shù)據(jù)模型的方法,所付出的成本很高。所以對于大多數(shù)企業(yè)來說,短時間之內(nèi)企業(yè)的數(shù)據(jù)庫不可能不使用關(guān)系數(shù)據(jù)庫,導(dǎo)致許多新的應(yīng)用也要在關(guān)系數(shù)據(jù)庫平臺上進(jìn)行研發(fā)。為了實現(xiàn)工作人員對報文數(shù)據(jù)更好進(jìn)行分析及決策,需要把報文數(shù)據(jù)庫中每份報文的數(shù)據(jù)信息進(jìn)行整理和歸納。企業(yè)對數(shù)據(jù)分析的要求會更高,往往需求一些更優(yōu)化、更智能、更集成的聯(lián)機(jī)分析處理方案。本文論述了報文信息處理中數(shù)據(jù)倉庫技術(shù)的應(yīng)用,并實現(xiàn)報文數(shù)據(jù)報表的展示思路。
1 創(chuàng)建報文數(shù)據(jù)倉庫并生成多維數(shù)據(jù)集
1.1 報文數(shù)據(jù)倉庫
數(shù)據(jù)倉庫是一套面向數(shù)據(jù)的、集成的、時變的、非易失性的數(shù)據(jù)倉庫,這是一個支持管理的決策過程。對報文數(shù)據(jù)進(jìn)行集成后,創(chuàng)建了報文數(shù)據(jù)倉庫,從而組建報文數(shù)據(jù)倉庫報表服務(wù)器。數(shù)據(jù)倉庫的建立,目的在于有意引入冗余,保證數(shù)據(jù)的多樣性,同時也利于工作人員多角度看待數(shù)據(jù)。報文數(shù)據(jù)倉庫中,可用報文元素做為主題,多維數(shù)據(jù)模型采用星型模式建立。本文論述的報文數(shù)據(jù)倉庫使用的是SQL Server Analysis Services創(chuàng)建的,為企業(yè)提供聯(lián)機(jī)分析處理(OLAP)功能。基于關(guān)系表的報文數(shù)據(jù)倉庫的存儲方式是星型模型,它更成熟,更適用,查詢速度更快。
1.2 創(chuàng)建報文數(shù)據(jù)倉庫并生成多維數(shù)據(jù)集
對于報文數(shù)據(jù)庫,使用的為多維報文數(shù)據(jù)倉庫,并適合OLAP的星型模型來存儲數(shù)據(jù)。基于星型數(shù)據(jù)模型,通過設(shè)置參數(shù)工作人員可以進(jìn)行各種查詢。對這些數(shù)據(jù)的深入分析,可以得到各種報文的頻率變化,從而幫助報文工作人員進(jìn)行決策,確?,F(xiàn)有的技術(shù)能夠更好地服務(wù)于報文的應(yīng)用領(lǐng)域。報文數(shù)據(jù)倉庫包含大量的報文數(shù)據(jù)信息,同時報文數(shù)據(jù)可伴隨多個維度數(shù)據(jù)。有時往往并不知道哪些信息是有用的,而是將所有的數(shù)據(jù)都存入數(shù)據(jù)倉庫中,導(dǎo)致信息處理量增大,查詢報文信息效率受到了極大影響。
以報文數(shù)據(jù)倉庫為基礎(chǔ),報文工作人員可對報文數(shù)據(jù)進(jìn)行初步查詢,例如統(tǒng)計、歸類等。在報文數(shù)據(jù)倉庫中,數(shù)據(jù)的處理、存儲和挖掘都要在后臺完成,而工作人員操作的前端就是OLAP。OLAP是數(shù)據(jù)倉庫技術(shù)的重要應(yīng)用,它會仿照企業(yè)本身進(jìn)行多個角度思維方式,先一步建立起多維數(shù)據(jù)模型,從而可以進(jìn)行復(fù)雜的分析,并完成決策。
2 報文數(shù)據(jù)報表展示
2.1 以數(shù)據(jù)倉庫為基礎(chǔ)的報表展示
Reporting Services是基于服務(wù)器的新型報表平臺。它支持聯(lián)機(jī)操作,由模塊組成,伸縮性強。其自身可以生成、發(fā)布和管理報表,并擴(kuò)展出強大的功能,以及定義出最優(yōu)的解決方案。Analysis Services聯(lián)機(jī)分析處理出的數(shù)據(jù)結(jié)果,可用來創(chuàng)建和管理關(guān)系數(shù)據(jù)庫的數(shù)據(jù)源。工作人員定義維度和參數(shù),通過這些工作最終將生成的結(jié)果發(fā)布至網(wǎng)絡(luò),由網(wǎng)絡(luò)完成多維數(shù)據(jù)報表的展示。企業(yè)可以通過網(wǎng)絡(luò)查詢多維數(shù)據(jù)報表,從而進(jìn)一步分析和管理報文數(shù)據(jù)報表。
2.2 Reporting Services實現(xiàn)報文數(shù)據(jù)報表展示
Reporting Services在工作人員執(zhí)行數(shù)據(jù)分析之后創(chuàng)建報文數(shù)據(jù)報表。報表采用矩陣式報表,這種報表、視圖方式多種多樣,直觀地理解報文數(shù)據(jù)的變化。報表是為滿足數(shù)據(jù)顯示的需要而設(shè)計的,它可以提供最好的研究成果,使報告的效益和可靠性。
報文數(shù)據(jù)報表通過設(shè)計與部署后,等待應(yīng)用程序執(zhí)行完畢就可以查詢已發(fā)布至網(wǎng)絡(luò)的報表。可以人工定義報表參數(shù),把時間維度定義為參數(shù)對象。當(dāng)然,可以根據(jù)企業(yè)的需求來定義所需的參數(shù)對象。Reporting Services的優(yōu)勢在于,對分析數(shù)據(jù)后生成的報文數(shù)據(jù)報表,可以通過部署與發(fā)布進(jìn)行網(wǎng)絡(luò)共享,企業(yè)的工作人員可以在不同地點對報表進(jìn)行查詢和分析,從而完成最優(yōu)決策。
3 結(jié)語
本文介紹了應(yīng)用數(shù)據(jù)倉庫技術(shù)、利用聯(lián)機(jī)分析處理技術(shù)和多維數(shù)據(jù)報表展示數(shù)據(jù),為報文數(shù)據(jù)信息分析和決策提供了解決方案。Reporting Services平臺生成報文數(shù)據(jù)報表發(fā)布至網(wǎng)絡(luò),報文工作人員對報文數(shù)據(jù)有效地提取和分析。應(yīng)用數(shù)據(jù)倉庫對報文數(shù)據(jù)信息進(jìn)行展示還有待大量的研究開發(fā),我們需要不斷嘗試,將好的想法付諸于實現(xiàn),這一項研究對于空中交通報文數(shù)據(jù)領(lǐng)域具有重要意義。
參考文獻(xiàn):
[1]中國石化股份有限公司,等.中國石化加油IC 卡試點工程設(shè)備技術(shù)規(guī)范匯編(試行)[Z].北京:中國石化股份有限公司等,2002.
[2]陳峰.數(shù)據(jù)倉庫技術(shù)綜述[J].重慶:重慶工學(xué)院學(xué)報,2002.
[3]歐廣宇,曹渠江.連鎖超市配送決策支持系統(tǒng)的模型與實現(xiàn)[J].上海:上海理工大學(xué)學(xué)報,2004.
[4]G.Andrew Duthie.Microsoft ASP.NET程序設(shè)計[M].北京:清華大學(xué)出版社,2002.
[5]林煌章.ASP.NET程序設(shè)計基礎(chǔ)[M].北京:清華大學(xué)山版社,2001.
[6]楊云,王毅.ASP.NET 2.0程序開發(fā)詳解[M].北京:人民郵電出版社,2007.
[7]林杰斌,劉明德,陳湘.數(shù)據(jù)挖掘與OLAP 理論與務(wù)實[M].北京:清華大學(xué)出版社,2002.
[8]Claudia Imhoff,Nicholas Galemmo,Jonathan G.Geiger.Mastering Data Warehouse Design:Relational and Dimensional Techniques[M].Wiley,2003.