高曉峰
摘要 隨著科技時代的到來,信息數(shù)據(jù)的儲存方式和分析模式早已改革,科技信息多維數(shù)據(jù)模型的建立與OLAP設計對相關人員的幫助不可小覷?;诖?,本文對科技管理信息系統(tǒng)概念模型、科技信息多維數(shù)據(jù)庫邏輯模型建立的相關理論進行研究,然后對科技管理信息系統(tǒng)的OLAP設計中的常規(guī)維、維層次及類、粒度、分區(qū)、聚集等設計進行了簡單的闡述。
【關鍵詞】科技管理信息系統(tǒng) 概念模型 邏輯模型 OLAP設計
隨著科學與技術的迅猛發(fā)展,科技信息數(shù)據(jù)更加膨脹,信息數(shù)據(jù)的管理需要緊跟時代的發(fā)展。建立好科技信息管理系統(tǒng),可以迅速將信息數(shù)據(jù)的結果轉(zhuǎn)化為現(xiàn)實生產(chǎn)力和相關決策,對于人才培養(yǎng)與管理也更有效率。使用OLAP技術對數(shù)據(jù)庫進行分析,減少了所需時間,節(jié)省了一定人力、物力,還能將數(shù)據(jù)直觀地呈現(xiàn)給管理人員。
1 科技管理信息系統(tǒng)多維數(shù)據(jù)模型的建立
1.1 科技管理信息系統(tǒng)概念模型的建立
概念模型是服務于系統(tǒng)設計、收集信息的聯(lián)系主觀與客觀的概念性工具,主要作用是將具體信息轉(zhuǎn)化為抽象數(shù)據(jù),是信息世界里的信息結構。建立系統(tǒng)概念模型需要確定系統(tǒng)的邊界、界定系統(tǒng)主題域、建立概念模型幾個步驟。例如:在企業(yè)內(nèi)的人才培養(yǎng)與錄用過程中,需要對各個人才的個人情況、評價、獲獎情況、科研成果等信息進行考量、綜合分析,這就需要將不同數(shù)據(jù)按不同主題重新組合起來,按照多立方結構的形式存入到子立方中。在主題域被確定后還要對每個主題域內(nèi)的數(shù)據(jù)進行細化,根據(jù)細化結果建立多位概念模型。
1.2 科技信息多維數(shù)據(jù)庫邏輯模型的建立
邏輯模型指導著系統(tǒng)的實施,直接反映著部門的需求,是系統(tǒng)運行的重要一步。當前階段最常用的模型包括星型模型、雪花模型和第三范式。第三范式是具有規(guī)范性、基礎性的邏輯模型,考慮到數(shù)據(jù)庫引擎和系統(tǒng)的響應速度,實際應用時要做不規(guī)范處理,所以常常采用星型模型和雪花型模型。星型模型是指類似星星一樣的結構,中心是一個事實表,周圍是一組附屬表。雪花型模型是非規(guī)范性,一個中心事實表周圍連接一個或多個維表,也有其他維表不直接連在中心事實表上,而是通過連接別的維表連接到中心事實表上。它的特點是通過減少了數(shù)據(jù)存儲量,改善查詢性能。
2 科技管理信息系統(tǒng)的OLAP設-
2.1 科技管理信息系統(tǒng)OLAP常規(guī)維的設計
常規(guī)維分為共享維和私有維兩種,兩個或兩個以上的立方一起擁有的維是共享維,僅有一個立方使用的維是私有維。共享維的優(yōu)點是節(jié)省處理時間,查詢反映速度快,內(nèi)存利用率高。例如:在選拔人才時,共享維在層次上設計出時間維,包含年、月、日三個層次,學歷維包含學歷、學位兩個層次,學位維又可以分成無學位、學士、碩士及博士各個層次等等。
2.2 科技管理信息系統(tǒng)OLAP維層次及類的設計
層次是含有父子關系的,維的層次變多,粒度層次會越豐富,其中的子成員數(shù)量也會越多。類是按維成員的某一共同特質(zhì)分類,成員之間存在某一相同屬性。在科技信息系統(tǒng)的分析數(shù)據(jù)過程中,既有按維的層次遞進分析,也有按類屬性進行分析。按維的層次分析又有兩種分析方法,一種是聚合分析,即從維的低到高層次綜合分析;另一種是鉆取分析,即從維的高到低層次數(shù)據(jù)分析。按維的類分析也可分為分類和歸納,從粗粒度向細粒度成員向下進行的是分類,從細粒度向粗粒度進行的總結是歸納。考慮到儲存空間的因素,系統(tǒng)維的層次應該簡潔分明。
2.3 科技管理信息系統(tǒng)的粒度設計
粒度作為度量數(shù)據(jù)庫中數(shù)據(jù)綜合程度的重要考量因素,如果粒度越細,存放數(shù)據(jù)需要的空間就會越大,查詢需要的響應時間就越長??萍脊芾硇畔⑾到y(tǒng)數(shù)據(jù)庫的大部分查詢時間里在一定綜合數(shù)據(jù)上,很涉及到細節(jié),所以為了快速響應和細節(jié)查詢,系統(tǒng)需要整合數(shù)據(jù),并按規(guī)律結構儲存到數(shù)據(jù)立方中去,同時葉子級的數(shù)據(jù)仍存放在數(shù)據(jù)庫中,這就形成了多重粒度的數(shù)據(jù)架構。
2.4 科技管理信息系統(tǒng)的分區(qū)設計
為加速多維數(shù)據(jù)庫的查詢速度,進行分區(qū)設計,分區(qū)后,用戶查詢只需訪問相關數(shù)據(jù)所在的分區(qū),也可同時容納多個用戶各自加載,不相沖突,同時可以添加并刪除新的分區(qū),使系統(tǒng)的并行性得到提升。雖然多維數(shù)據(jù)集中分區(qū)數(shù)量沒有限制,但如果分區(qū)過多,對多個分區(qū)集合的花費就會增加??萍脊芾硇畔⑾到y(tǒng)以一萬行事實數(shù)據(jù)為單位進行一個分區(qū),那分區(qū)一旦超過一萬行,粒度就會被細化。例如:由于查詢經(jīng)常會集中在最近的數(shù)據(jù),所以以時間為第一分區(qū)矢量,運用多維數(shù)據(jù)定期填充程序加載數(shù)據(jù),進而其他分區(qū)的數(shù)據(jù)隨時間的變化自動維護加載。將系統(tǒng)的分區(qū)設定為一萬行事實數(shù)據(jù),當其中一個分區(qū)的數(shù)據(jù)量超過一萬時,將細化粒度,由年轉(zhuǎn)化為月等等。
2.5 技管理信息系統(tǒng)聚集設計
科技信息管理系統(tǒng)在設計時,聚集程度也是重要考慮因素,聚集度加高,查詢時間也減少。但是儲存空間再聚集時是以指數(shù)形式增加,聚集加高時,會產(chǎn)生數(shù)據(jù)擁擠現(xiàn)象。為了為避免這一問題的發(fā)生,在系統(tǒng)設計時,初始聚集設計要控制在小范圍內(nèi),也要使用優(yōu)化功能控制聚集數(shù)量。例如:在儲存向?qū)е?,選擇多維數(shù)據(jù)庫聯(lián)機分析處理儲存方式,并優(yōu)先考慮儲存,然后為立方體選擇聚集。
3 結論
綜上所述,科技管理信息多維數(shù)據(jù)模型的建立與OLAP設計會大大幫助管理人員從不同方面進行數(shù)據(jù)查詢、分析,得到需要的結論。本文簡要對科技管理信息多維數(shù)據(jù)模型的建立與OLAP設計的相關理論進行了研究、闡述,而科技管理信息系統(tǒng)在運行中,隨著數(shù)據(jù)量的增加,儲存空間的減少各個方面都將接受著挑戰(zhàn),需要不斷進行優(yōu)化和維護。
參考文獻
[1]黃雪菊,科技管理信息多維概念模型的建立與OLAP設計[J].湖州職業(yè)技術學院學報,2005 (04):80-83.
[2]周維.基于數(shù)據(jù)倉庫的管理信息系統(tǒng)的研究[D].昆明理工大學,2002.