史松+冀亞林+蔡娜+王霞+馬成龍
摘要: 當(dāng)今正處于信息高速發(fā)展的時代,數(shù)據(jù)量高速膨脹,難以在以前的系統(tǒng)中進(jìn)行交流、共享和融合。為了整合數(shù)據(jù)資源、消除“信息孤島”、構(gòu)建企業(yè)發(fā)展藍(lán)圖,人們逐漸意識到頂層設(shè)計(jì)的重要性。很多企業(yè)針對自身發(fā)展建立了自己的企業(yè)架構(gòu)進(jìn)行頂層設(shè)計(jì),而作為其核心的數(shù)據(jù)架構(gòu)模型形式也根據(jù)不同行業(yè)體現(xiàn)出不同發(fā)展。本文主要對數(shù)據(jù)架構(gòu)模型進(jìn)行研究,闡述數(shù)據(jù)架構(gòu)模型的作用及其相互關(guān)系。
Abstract: Today is in the era of rapid development of information, data volume of high-speed expansion, it is difficult in the previous system for communication, sharing and integration. In order to integrate data resources, eliminate the "information island", build enterprise development blueprints, people gradually realize the importance of top design. Many enterprises for their own development establish their own enterprise architecture of the top design, and as its core data architecture model is also reflected in different industries according to different development. This paper mainly studies the data architecture model, expounds the role of data architecture model and its relationship.
關(guān)鍵詞: 企業(yè)架構(gòu);數(shù)據(jù)架構(gòu);數(shù)據(jù)模型
Key words: enterprise architecture;data architecture;data model
中圖分類號:F279.23 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-4311(2017)33-0054-03
0 引言
數(shù)據(jù)和信息是21世紀(jì)的經(jīng)濟(jì)命脈。在信息時代,數(shù)據(jù)被認(rèn)為是一項(xiàng)重要的企業(yè)資產(chǎn)。通常一個企業(yè)長期以來會積累大量的需求、說明、數(shù)據(jù)庫、數(shù)據(jù)模型、程序以及各種信息技術(shù)成品構(gòu)件,但是卻缺少一個“總體設(shè)計(jì)”。
這并不是說哪個信息系統(tǒng)、數(shù)據(jù)庫或者數(shù)據(jù)庫管理系統(tǒng)(DataBase Management System,DBMS)是錯誤或者被誤導(dǎo)的,只是說當(dāng)前產(chǎn)生了大量的信息技術(shù)(Information Technology,IT)構(gòu)件,并且亟需建立一個“總體架構(gòu)”對其進(jìn)行規(guī)范、優(yōu)化甚至標(biāo)準(zhǔn)化。
隨著企業(yè)的發(fā)展或者重組,企業(yè)數(shù)據(jù)扮演著越來越重要的角色。有的企業(yè)業(yè)務(wù)范圍廣,部門多,各項(xiàng)數(shù)據(jù)種類繁多,信息來源廣泛、內(nèi)容重疊、數(shù)據(jù)分散,沒有統(tǒng)一的企業(yè)數(shù)據(jù)架構(gòu),缺乏頂層設(shè)計(jì),很難使企業(yè)的信息化建設(shè)與其發(fā)展戰(zhàn)略相一致。而且當(dāng)今信息飛速發(fā)展,數(shù)據(jù)量高速膨脹,那些舊的信息系統(tǒng)都是由不同廠商在不同時期分別開發(fā),造成有價值的數(shù)據(jù)在舊系統(tǒng)間難以交流、共享和融合,加劇了數(shù)據(jù)的破碎性,系統(tǒng)間缺乏信息共享,業(yè)務(wù)數(shù)據(jù)獨(dú)立存在,形成“數(shù)據(jù)孤島”。
本文認(rèn)為,企業(yè)信息化想要建設(shè)的成功很大程度上依賴于系統(tǒng)模型的合理性和不同系統(tǒng)間標(biāo)準(zhǔn)的一致性,而企業(yè)級數(shù)據(jù)架構(gòu)模型是企業(yè)信息化的核心所在,建立企業(yè)級數(shù)據(jù)架構(gòu)模型,能夠定義和統(tǒng)一整個企業(yè)信息化體系的數(shù)據(jù)標(biāo)準(zhǔn),合理規(guī)劃企業(yè)信息化建設(shè)前景,管理所需資源建設(shè)。并且企業(yè)數(shù)據(jù)架構(gòu)模型也會提高信息定義的一致性,全面性,從企業(yè)全業(yè)務(wù)的角度,全面、一致的定義信息需求,指導(dǎo)所有未來系統(tǒng)開發(fā),設(shè)計(jì)實(shí)現(xiàn)數(shù)據(jù)需求的藍(lán)圖,全面提升經(jīng)營決策、運(yùn)營管理、業(yè)務(wù)拓展和客戶服務(wù)等方面的支撐能力。
1 企業(yè)級數(shù)據(jù)架構(gòu)模型的定義
1.1 數(shù)據(jù)架構(gòu)模型基本定義
企業(yè)級數(shù)據(jù)架構(gòu)模型,是一種用來定義信息常規(guī)表示的方法。通過使用信息模型,我們可以使用不同的應(yīng)用程序?qū)λ芾淼臄?shù)據(jù)進(jìn)行重用,變更以及分享。企業(yè)數(shù)據(jù)架構(gòu)可以幫助企業(yè)消除信息孤島,建立一個共享、通用、一致和廣泛的企業(yè)數(shù)據(jù)基礎(chǔ)平臺。[1]
這里提的企業(yè)級數(shù)據(jù)架構(gòu)模型并不是數(shù)據(jù)倉庫模型,而是站在整個企業(yè)業(yè)務(wù)的視角,對企業(yè)所有數(shù)據(jù)整體性描述。企業(yè)級數(shù)據(jù)架構(gòu)模型是業(yè)務(wù)人員和IT人員進(jìn)行溝通的媒介,同時也是企業(yè)內(nèi)外進(jìn)行交流的紐帶。
1.2 數(shù)據(jù)模型結(jié)構(gòu)
一個企業(yè)的數(shù)據(jù)架構(gòu)的參考模型包括:
數(shù)據(jù)元素模型;
概念數(shù)據(jù)模型;
數(shù)據(jù)庫邏輯模型;
數(shù)據(jù)庫物理模型;
連接物理數(shù)據(jù)庫和應(yīng)用信息系統(tǒng)的視圖模型。
上述五個數(shù)據(jù)結(jié)構(gòu)層次形成了一個核心,圍繞這個核心大量信息技術(shù)支撐件可以互聯(lián)、互操作,并且是非冗余的。
我們可以把全部的信息技術(shù)產(chǎn)品,包括數(shù)據(jù)結(jié)構(gòu)參考模型中的那些,統(tǒng)一都畫在一個圖里面,就會得到如圖1所示的圖。[2]
然后我們需要一個具有“元數(shù)據(jù)庫”核心的應(yīng)用信息系統(tǒng)。這種“元數(shù)據(jù)庫”是從腦力勞動者框架的主要產(chǎn)品延伸得來的,包含了數(shù)據(jù)結(jié)構(gòu)參考模型中的核心模型。這種“元數(shù)據(jù)庫”的數(shù)據(jù)模型是高度工程化的,它真正支持相互關(guān)聯(lián)、互操作性、非冗余性。[3]
2 數(shù)據(jù)架構(gòu)參考模型
一直以來企業(yè)的數(shù)據(jù)架構(gòu)及其伴隨的數(shù)據(jù)模型都被看作是重要的資產(chǎn)。前文的圖1說明了這種資產(chǎn)是多么重要。這種重要性不僅體現(xiàn)在數(shù)據(jù)模型組成了企業(yè)策略闡述的基礎(chǔ),而且數(shù)據(jù)模型還是所有信息技術(shù)產(chǎn)品最終的“交匯”所在。[4]endprint
數(shù)據(jù)架構(gòu)中單獨(dú)的數(shù)據(jù)模型都是相互獨(dú)立的,而且分別處理不同的數(shù)據(jù)。這些架構(gòu)促進(jìn)了模型的完整性、互操作型和非冗余性。此外,“更高級”的模型可被用作創(chuàng)建“低級”模型的模板。
一旦完成了數(shù)據(jù)架構(gòu)的參考模型,就可以作為一個框架來幫助理解組件模型的范圍和相互關(guān)系。
這樣的模型對于數(shù)據(jù)架構(gòu)模型中組件實(shí)例之間的通信很有幫助。
我們對數(shù)據(jù)的自然概念,數(shù)據(jù)庫部署和業(yè)務(wù)信息系統(tǒng)的理解都經(jīng)過了多年的發(fā)展,在此基礎(chǔ)上,可以認(rèn)為數(shù)據(jù)結(jié)構(gòu)參考模型(參見圖2)有6個單獨(dú)的模型組成。[5]這6個模型分別是:
數(shù)據(jù)元素模型;
概念數(shù)據(jù)模型;
邏輯數(shù)據(jù)庫模型;
物理數(shù)據(jù)庫模型;
SQL視圖模型;
XML文檔結(jié)構(gòu)模型。
3 數(shù)據(jù)架構(gòu)參考模型中各模型的作用
3.1 數(shù)據(jù)元素模型
數(shù)據(jù)元素是企業(yè)的本質(zhì),被用作概念數(shù)據(jù)模型中實(shí)體屬性的語義基礎(chǔ),支撐業(yè)務(wù)需要的數(shù)據(jù)庫模型中表里面的列,并在數(shù)據(jù)庫管理系統(tǒng)中實(shí)現(xiàn),相應(yīng)地被用在業(yè)務(wù)信息系統(tǒng)(視圖數(shù)據(jù)模型)中,實(shí)現(xiàn)了企業(yè)資源所需的數(shù)據(jù)庫對象,支撐了企業(yè)任務(wù)的完成。
3.2 概念數(shù)據(jù)庫模型
概念數(shù)據(jù)模型,由主題,實(shí)體,屬性和實(shí)體間的關(guān)系構(gòu)成。關(guān)系可以體現(xiàn)實(shí)體間多個主題的相互聯(lián)系。每個數(shù)據(jù)模型應(yīng)該只對應(yīng)一個概念,如人的名字或地址等。概念數(shù)據(jù)模型可在創(chuàng)建數(shù)據(jù)庫模型(邏輯數(shù)據(jù)模型或物理數(shù)據(jù)模型)時當(dāng)作模板。每一個實(shí)體屬性都應(yīng)該映射到其父數(shù)據(jù)元素。語義和數(shù)據(jù)使用修飾語可被歸屬于每個實(shí)體屬性。其中關(guān)鍵的組件是主題、實(shí)體、屬性和關(guān)系。
概念數(shù)據(jù)模型可表示為一個容器,比如學(xué)生、學(xué)校、組織、或是地址。這些容器(例如學(xué)生或?qū)W校)必需先進(jìn)行具體化描述,然后才能在一個或多個不同的數(shù)據(jù)庫表中實(shí)現(xiàn),并最終成為可被Oracle等數(shù)據(jù)庫管理系統(tǒng)操作的對象。
3.3 邏輯數(shù)據(jù)庫模型
邏輯數(shù)據(jù)模型,是獨(dú)立于數(shù)據(jù)庫管理系統(tǒng)的數(shù)據(jù)庫的數(shù)據(jù)模型。組成該模型的數(shù)據(jù)結(jié)構(gòu)組件包括:模式、表、列和表之間的關(guān)系。關(guān)系被限定于單一模式的表中。盡管每個實(shí)現(xiàn)數(shù)據(jù)庫模型可以對應(yīng)多個描述數(shù)據(jù)模型,但是每個實(shí)現(xiàn)數(shù)據(jù)庫模型應(yīng)該只對應(yīng)一個問題。表的每一列都應(yīng)該映射到一個父屬性。語義和數(shù)據(jù)使用修飾語可被歸屬于每一列。描述數(shù)據(jù)模型和實(shí)現(xiàn)數(shù)據(jù)庫模型之間存在多對多的關(guān)系。其中關(guān)鍵的組件是模式、表、列和關(guān)系。
3.4 物理數(shù)據(jù)庫模型
作數(shù)據(jù)模型是綁定到特定數(shù)據(jù)庫管理系統(tǒng)的數(shù)據(jù)庫的數(shù)據(jù)模型。組成該模型的數(shù)據(jù)結(jié)構(gòu)組件包括:數(shù)據(jù)庫管理系統(tǒng)模式、數(shù)據(jù)庫管理系統(tǒng)表、數(shù)據(jù)庫管理系統(tǒng)列以及數(shù)據(jù)庫管理系統(tǒng)表之間的關(guān)系。數(shù)據(jù)庫管理系統(tǒng)關(guān)系被限定于單一的模式的數(shù)據(jù)庫管理系統(tǒng)表中。每個操作數(shù)據(jù)庫模型可以對應(yīng)多個實(shí)現(xiàn)數(shù)據(jù)庫模型。數(shù)據(jù)庫管理系統(tǒng)每一列都應(yīng)該映射到一個父列。實(shí)現(xiàn)數(shù)據(jù)庫模型和操作數(shù)據(jù)庫模型之間存在多對多的關(guān)系。其中關(guān)鍵組件是數(shù)據(jù)庫管理系統(tǒng)模式、數(shù)據(jù)庫管理系統(tǒng)表、數(shù)據(jù)庫管理系統(tǒng)列和數(shù)據(jù)庫管理系統(tǒng)關(guān)系。[6]
如果數(shù)據(jù)模型是依賴于一個特定數(shù)據(jù)庫管理系統(tǒng)和一個特定軟件應(yīng)用程序性能的狀態(tài),該數(shù)據(jù)模型就被稱作“物理的”,這樣的數(shù)據(jù)模型是通過視圖數(shù)據(jù)模型綁定到應(yīng)用程序業(yè)務(wù)信息系統(tǒng)的操作數(shù)據(jù)庫模型。操作數(shù)據(jù)庫模型里面數(shù)據(jù)庫管理系統(tǒng)表中的列是實(shí)現(xiàn)數(shù)據(jù)庫模型里面單一表中單一列的部署。
3.5 視圖數(shù)據(jù)模型
視圖數(shù)據(jù)模型表示的是物理數(shù)據(jù)庫模型和業(yè)務(wù)信息系統(tǒng)之間的接口。視圖和視圖的列可被定性為輸入/輸出。此外,這些視圖能以列為基礎(chǔ)相互映射,過程可以被指定來定義任意數(shù)據(jù)值轉(zhuǎn)換。
視圖數(shù)據(jù)模型是通過其定義綁定到特定數(shù)據(jù)庫管理系統(tǒng)的。視圖數(shù)據(jù)模型使應(yīng)用程序系統(tǒng)可以根據(jù)其物理數(shù)據(jù)模型來選擇、應(yīng)用或更新數(shù)據(jù)庫系統(tǒng),而不用在應(yīng)用程序系統(tǒng)中包含物理數(shù)據(jù)模型的細(xì)節(jié)信息。[7-8]
4 結(jié)論與展望
企業(yè)架構(gòu)是一種戰(zhàn)略性的信息資產(chǎn)。它描述了一個組織機(jī)構(gòu)的業(yè)務(wù)、使命、管理流程和支撐性基礎(chǔ)設(shè)施之間當(dāng)前和期望的關(guān)系。而數(shù)據(jù)架構(gòu)作為企業(yè)架構(gòu)中的核心,使業(yè)務(wù)或使命進(jìn)化到一種效率更高、更加有效、更為通用流行的狀態(tài)。同時,提升了互操作性、加強(qiáng)了信息流通共享、升級改進(jìn)業(yè)務(wù)流程、促進(jìn)重大決策規(guī)劃。
許多企業(yè)系統(tǒng)有著相同的體系結(jié)構(gòu)方法,雖然在企業(yè)數(shù)據(jù)架構(gòu)的實(shí)施過程中,一個組織可以有很多不同的流派和做法進(jìn)行選擇。這說明獨(dú)立于特定應(yīng)用領(lǐng)域的各種技術(shù)模式和設(shè)計(jì),能夠有效產(chǎn)生反應(yīng)迅速、可伸縮的、靈活的和可統(tǒng)一的企業(yè)應(yīng)用。企業(yè)的發(fā)展壯大離不開企業(yè)數(shù)據(jù)架構(gòu),而合理數(shù)據(jù)架構(gòu)應(yīng)用或許會成為未來信息社會企業(yè)生存的關(guān)鍵所在。
參考文獻(xiàn):
[1]于海瀾.企業(yè)架構(gòu)[M].北京:東方出版社,2009.
[2]徐立波.圖書連鎖企業(yè)數(shù)據(jù)倉庫的模型設(shè)計(jì)[J].沈陽:沈陽工程學(xué)院學(xué)報,2011,8:23-24.
[3]林成亮.供電企業(yè)數(shù)據(jù)模型的分析與設(shè)計(jì)[D].北京:華北電力大學(xué).
[4]張根寶.企業(yè)信息化[M].北京:機(jī)械工業(yè)出版社,1999.
[5]企業(yè)架構(gòu).www.wiscorp.com/sp/sp08.pdf.
[6]楊吉江,賀煒,邢春曉.構(gòu)建電子政務(wù)通用數(shù)據(jù)模型[J].電子政務(wù),2007,1.
[7]工程和管理信息系統(tǒng)規(guī)劃. www.wiscorp.com/sp/sp11.pdf.
[8]Adamson,Christopher and Michael Venerable.Data Warehouse Desgn Solutions.John Wiley&Sons,1998.ISBN 0-471-25195-X.544 pages.endprint