李忠民 高曉欣
摘? 要:數(shù)據(jù)詞典是確保數(shù)據(jù)一致性的主要措施,通過編制數(shù)據(jù)詞典確保數(shù)據(jù)一致性,避免重復(fù)甚至沖突的定義,是系統(tǒng)建設(shè)中重要的基礎(chǔ)性工作,但是對于大型系統(tǒng)來說涉及的詞匯量巨大,數(shù)據(jù)詞典的編制面臨著管理上、業(yè)務(wù)上等諸多困難,確保數(shù)據(jù)詞典本身的質(zhì)量是一個重要問題。文章在某大型央企的業(yè)務(wù)中臺的建設(shè)過程中,對編制方法進(jìn)行了研究,在該方法的指導(dǎo)下完成了詞匯梳理工作,從中提煉編制了數(shù)據(jù)詞典,并結(jié)合MDA方法論在業(yè)務(wù)中臺項(xiàng)目實(shí)現(xiàn)落地。
關(guān)鍵詞:模型驅(qū)動架構(gòu);數(shù)據(jù)詞典;數(shù)據(jù)元
中圖分類號:TP393.09? ? ? 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2020)20-0107-05
Research on the Practice of Model Driven Architecture in the Middle Office (3)
——Establishment and Implementation of Data Dictionary
LI Zhongmin,GAO Xiaoxin
(Beijing China-Power Information Technology Co.,Ltd.,Beijing? 102208,China)
Abstract:Data dictionary is the main measure to ensure data consistency. It is an important basic work in system construction to compile data dictionary to ensure data consistency and avoid duplicate or even conflict definitions. However,for large-scale systems,the vocabulary involved is huge,and the compilation of data dictionary faces many difficulties in management and business. To ensure the quality of the data dictionary itself is an important issue. In the construction process of the financial center of a large-scale central enterprise,researched the compilation method,under the guidance of this method,we have completed the word sorting work,extracted and compiled the data dictionary,and combined with the MDA method to achieve the implementation of the financial middle office project.
Keywords:model driven architecture;data dictionary;data element
0? 引? 言
對大多數(shù)企業(yè)來說數(shù)據(jù)不一致是一個突出的數(shù)據(jù)質(zhì)量問題,已經(jīng)嚴(yán)重制約企業(yè)信息化應(yīng)用水平的提高。從企業(yè)的角度,不同時(shí)期、不同業(yè)務(wù)條線重復(fù)建設(shè),系統(tǒng)林立,系統(tǒng)之間相互割裂,呈煙囪式架構(gòu),造成數(shù)據(jù)無法共享,業(yè)務(wù)無法銜接。從單一系統(tǒng)來看,一是由于不規(guī)范的設(shè)計(jì),存在同一個語義的數(shù)據(jù)項(xiàng)多次定義,且每次定義的類型、長度、精度都存在不一致的情況;二是隨著系統(tǒng)的優(yōu)化升級,不斷地貼補(bǔ)丁,引入重復(fù)定義和不一致的定義,進(jìn)一步加劇了數(shù)據(jù)不一致性。獲得企業(yè)范圍的數(shù)據(jù)一致性,是企業(yè)信息化建設(shè)中孜孜以求的目標(biāo),從企業(yè)視角看,解決這個問題的關(guān)鍵是制定數(shù)據(jù)的企業(yè)標(biāo)準(zhǔn),從單個系統(tǒng)的層次看,就是根據(jù)數(shù)據(jù)標(biāo)準(zhǔn)編制數(shù)據(jù)詞典。
作為業(yè)務(wù)中臺的承建單位,我們展開了數(shù)據(jù)詞典編制方法論研究,提出了經(jīng)實(shí)踐證明可行的業(yè)務(wù)中臺數(shù)據(jù)詞典編制方法。同時(shí)模型驅(qū)動架構(gòu)方法論(MDA)是一種系統(tǒng)分析和設(shè)計(jì)的方法論,它把系統(tǒng)分析和設(shè)計(jì)過程抽象為一系列前后依賴的模型的建模過程,實(shí)現(xiàn)了業(yè)務(wù)需求的結(jié)構(gòu)化描述,該方法論在業(yè)務(wù)中臺中得到應(yīng)用。實(shí)踐中我們有機(jī)結(jié)合二者,不但應(yīng)用于數(shù)據(jù)詞典的編制,而且做到切實(shí)貫徹落實(shí)到系統(tǒng)分析設(shè)計(jì)過程中去,取得了不錯的效果。本文總結(jié)業(yè)務(wù)中臺數(shù)據(jù)詞典編制和實(shí)施實(shí)踐經(jīng)驗(yàn),提出一個可行的數(shù)據(jù)詞典的編制方法,并結(jié)合MDA方法論,探討了在系統(tǒng)分析設(shè)計(jì)過程中貫徹落實(shí)數(shù)據(jù)詞典的路徑。
1? 數(shù)據(jù)詞典制定過程中的幾個關(guān)鍵概念
1.1? 數(shù)據(jù)元
一種元數(shù)據(jù),在本文中特指模型中的數(shù)據(jù)項(xiàng)及其抽象父類,如邏輯模型中的屬性、物理模型中的字段等。每個數(shù)據(jù)元都由定義域、值域來描述,定義域即數(shù)據(jù)元的語義,值域即Domain,包括數(shù)據(jù)元的取值范圍、編碼規(guī)則、格式等約束,如圖1所示。
1.2? 語義
數(shù)據(jù)元的定義域,不同的數(shù)據(jù)元語義不同,某些數(shù)據(jù)元之間在語義上存在泛化關(guān)系,存在泛化關(guān)系的數(shù)據(jù)元雖然語義不同,不過子類是父類語義的細(xì)化和補(bǔ)充明確。
1.3? Domain
數(shù)據(jù)元的值域,每個數(shù)據(jù)元都由語義和Domain二者來定義。Domain包括:數(shù)據(jù)類型、取值范圍(對于枚舉)、編碼規(guī)則、格式、最大值/最小值等約束,詳見圖1。Domain的概念是數(shù)據(jù)詞典制定過程中的關(guān)鍵概念,是保持?jǐn)?shù)據(jù)的一致性的重要措施。
1.4? 抽象數(shù)據(jù)類型
數(shù)據(jù)元的最高層抽象,規(guī)定了能夠加之于其上的操作集合,如數(shù)值型可以進(jìn)行加減乘除等操作,在數(shù)據(jù)標(biāo)準(zhǔn)這個領(lǐng)域,抽象數(shù)據(jù)類型分為數(shù)值型、字符型、日期型等,全部抽象數(shù)據(jù)類型的集合是數(shù)據(jù)類型詞典。
1.5? 抽象數(shù)據(jù)元
一種元數(shù)據(jù),數(shù)據(jù)模型中數(shù)據(jù)項(xiàng)的抽象父類,如“身份證號”是“投標(biāo)人身份證號”“企業(yè)法人代表身份證號”等數(shù)據(jù)項(xiàng)的抽象數(shù)據(jù)元。抽象數(shù)據(jù)元的集合構(gòu)成數(shù)據(jù)元詞典。
1.6? 標(biāo)準(zhǔn)數(shù)據(jù)元
一種元數(shù)據(jù),為某個抽象數(shù)據(jù)元的具體化,是領(lǐng)域模型中的屬性,邏輯模型中的屬性,物理模型中的字段的標(biāo)準(zhǔn)定義,每個標(biāo)準(zhǔn)數(shù)據(jù)元都是某個抽象數(shù)據(jù)元的子類,繼承于同一抽象數(shù)據(jù)元的多個標(biāo)準(zhǔn)數(shù)據(jù)元,其值域保持一致。如“投標(biāo)人身份證號”“企業(yè)法人代表身份證號”是標(biāo)準(zhǔn)數(shù)據(jù)元,其繼承于“身份證號”這一抽象數(shù)據(jù)元,其數(shù)據(jù)類型、長度、編碼規(guī)則都與“身份證號”保持一致。標(biāo)準(zhǔn)數(shù)據(jù)元的集合構(gòu)成數(shù)據(jù)詞典。
1.7? 普通數(shù)據(jù)元
一種元數(shù)據(jù),各類模型中描述數(shù)據(jù)的原子單位,如領(lǐng)域模型中的屬性,邏輯模型中的屬性,物理模型中的字段。普通數(shù)據(jù)元與標(biāo)準(zhǔn)數(shù)據(jù)元是遵從關(guān)系,每個普通數(shù)據(jù)元必須且只能遵從于一個標(biāo)準(zhǔn)數(shù)據(jù)元,其語義和值域與該標(biāo)準(zhǔn)數(shù)據(jù)元嚴(yán)格一致。例如數(shù)據(jù)模型的合同、合同履約信息等多個實(shí)體中都存在“投標(biāo)人身份證號”,這些數(shù)據(jù)項(xiàng)都對應(yīng)著數(shù)據(jù)詞典中的“投標(biāo)人身份證號”這個標(biāo)準(zhǔn)數(shù)據(jù)元,且語義、值域與其保持嚴(yán)格一致,這種關(guān)系可以確保在整個模型中所有“投標(biāo)人身份證號”的長度、編碼規(guī)則等特征完全一致。
1.8? 數(shù)據(jù)詞典
數(shù)據(jù)類型詞典、抽象數(shù)據(jù)元詞典和標(biāo)準(zhǔn)數(shù)據(jù)元詞典共同構(gòu)成數(shù)據(jù)詞典,定義了企業(yè)范圍內(nèi)所有數(shù)據(jù)元的權(quán)威的語義和值域。
2? 元數(shù)據(jù)之間的關(guān)系
元數(shù)據(jù)之間存在三種關(guān)系:組合關(guān)系、泛化關(guān)系、遵從關(guān)系,如圖2所示。
在數(shù)據(jù)詞典制定時(shí)存在一個重要的基礎(chǔ)性原則:即存在泛化關(guān)系或遵從關(guān)系的數(shù)據(jù)元其值域(Domain)嚴(yán)格一致,該規(guī)則是制定數(shù)據(jù)詞典和在模型中貫徹?cái)?shù)據(jù)詞典的重要依據(jù)。
2.1? 組合關(guān)系
如圖2所示,從左向右,元數(shù)據(jù)存在組合關(guān)系。數(shù)據(jù)詞典由數(shù)據(jù)類型詞典、抽象數(shù)據(jù)元詞典和標(biāo)準(zhǔn)數(shù)據(jù)元詞典構(gòu)成;數(shù)據(jù)類型詞典規(guī)定了元數(shù)據(jù)體系的最高抽象層次中的元素,即企業(yè)的數(shù)據(jù)的抽象數(shù)據(jù)類型,抽象數(shù)據(jù)類型數(shù)目是有限的、可枚舉的,一般有三種:字符型、數(shù)值型、日期型。抽象數(shù)據(jù)元詞典由抽象數(shù)據(jù)元構(gòu)成,其中的每個抽象數(shù)據(jù)元語義互相獨(dú)立,不存在相同的兩個抽象數(shù)據(jù)元;標(biāo)準(zhǔn)數(shù)據(jù)元詞典由標(biāo)準(zhǔn)數(shù)據(jù)元構(gòu)成,每個標(biāo)準(zhǔn)數(shù)據(jù)元都是某個抽象數(shù)據(jù)元的子類,其Domain與其父類嚴(yán)格一致,不存在相同的兩個標(biāo)準(zhǔn)數(shù)據(jù)元;數(shù)據(jù)模型由普通數(shù)據(jù)元構(gòu)成,一個模型中可以存在多個相同的普通數(shù)據(jù)元,普通數(shù)據(jù)元其語義和值域都嚴(yán)格遵從標(biāo)準(zhǔn)數(shù)據(jù)元。企業(yè)級的數(shù)據(jù)詞典實(shí)現(xiàn)對企業(yè)范圍的所有數(shù)據(jù)概念的全覆蓋、無遺漏、不重復(fù)的定義,且給出公司級的、權(quán)威的語義和值域定義。
2.2? 元數(shù)據(jù)的泛化關(guān)系
從上向下在元數(shù)據(jù)的各個概念中存在三個層次的抽象,即抽象數(shù)據(jù)類型、抽象數(shù)據(jù)元、標(biāo)準(zhǔn)數(shù)據(jù)元,具體含義為:
(1)抽象數(shù)據(jù)類型:最高層的抽象是抽象數(shù)據(jù)類型,抽象數(shù)據(jù)類型規(guī)定了數(shù)據(jù)的可能取值的范圍和可以作用其上的操作,作為最高的抽象形式,只有種類有限的數(shù)據(jù)類型,如字符型、數(shù)值型、日期型等。
(2)抽象數(shù)據(jù)元:第二層抽象是抽象數(shù)據(jù)元,其規(guī)定了數(shù)據(jù)元的抽象語義和Doma,抽象數(shù)據(jù)元繼承了抽象數(shù)據(jù)類型的所有特征,在此基礎(chǔ)上,又增加了語義和Domain等信息,即數(shù)據(jù)類型、編碼規(guī)則、取值范圍、格式、最大值/最小值等信息,抽象數(shù)據(jù)元的數(shù)據(jù)類型一定是抽象數(shù)據(jù)類型的某個枚舉值,抽象數(shù)據(jù)元的構(gòu)成元素詳見圖1。
(3)標(biāo)準(zhǔn)數(shù)據(jù)元:第三層抽象是標(biāo)準(zhǔn)數(shù)據(jù)元,標(biāo)準(zhǔn)數(shù)據(jù)元是數(shù)據(jù)的模板,對應(yīng)著模型中的“屬性”“字段”等元素。標(biāo)準(zhǔn)數(shù)據(jù)元的構(gòu)成元素與抽象數(shù)據(jù)元相同,但標(biāo)準(zhǔn)數(shù)據(jù)元必須是某個抽象數(shù)據(jù)元的子類,其語義繼承父類的語義并進(jìn)行細(xì)化,而其Domain與其父類保持完全一致,一個父類可以有多個子類,通過這種值域上的絕對一致性,使得同一父類的數(shù)據(jù)能夠保持全域一致性,簡化了數(shù)據(jù)交換的困難,促進(jìn)了數(shù)據(jù)共享。如“投標(biāo)人身份證號”“企業(yè)法人身份證號”這兩個標(biāo)準(zhǔn)數(shù)據(jù)元存在共同父類“身份證號”,因此二者的Domain都與父類“身份證號”完全一致,從而二者的Domain也完全一致(意味著二者數(shù)據(jù)類型、長度、精度、編碼規(guī)則等信息完全相同),推而廣之,整個模型中所有“xxx身份證號”的數(shù)據(jù)元,其Domain也完全一致,從而得到數(shù)據(jù)的全域一致性。
2.3? 元數(shù)據(jù)的遵從關(guān)系
從上向下,元數(shù)據(jù)之間存在遵從關(guān)系,在系統(tǒng)分析設(shè)計(jì)過程中建立的各類模型中的數(shù)據(jù)項(xiàng)(如屬性、字段)等元數(shù)據(jù)與標(biāo)準(zhǔn)數(shù)據(jù)元之間存在遵從關(guān)系,在建模時(shí)定義屬性、字段等元素時(shí),不是像往常一樣直接給出名稱、數(shù)據(jù)類型等要素,而是要引用標(biāo)準(zhǔn)數(shù)據(jù)元詞典中的某個數(shù)據(jù)元,即模型中的數(shù)據(jù)項(xiàng)要遵從標(biāo)準(zhǔn)數(shù)據(jù)元詞典中的某個標(biāo)準(zhǔn)數(shù)據(jù)元,在語義和值域上保持完全一致,這種遵從關(guān)系,使得數(shù)據(jù)詞典能夠貫徹到模型中去,從而確保在系統(tǒng)實(shí)現(xiàn)中得到數(shù)據(jù)的全域一致性,如圖2所示。
3? 數(shù)據(jù)詞典的一種編制方法
制定數(shù)據(jù)詞典有技術(shù)上、業(yè)務(wù)上、管理上的一系列困難,基于筆者在業(yè)務(wù)中臺項(xiàng)目中的實(shí)踐經(jīng)驗(yàn),介紹一下對于技術(shù)困難的解決方案。制定數(shù)據(jù)詞典要經(jīng)過原始數(shù)據(jù)元?dú)w集、抽象數(shù)據(jù)元詞典構(gòu)造、標(biāo)準(zhǔn)數(shù)據(jù)元詞典構(gòu)造三個階段。
3.1? 原始數(shù)據(jù)元?dú)w集
原始數(shù)據(jù)元詞典是客觀世界中存在的、未經(jīng)標(biāo)準(zhǔn)化的業(yè)務(wù)概念的集合,其中存在大量的重復(fù)、不規(guī)范甚至沖突的定義,是數(shù)據(jù)詞典化的工作對象。在業(yè)務(wù)中臺項(xiàng)目中,原始數(shù)據(jù)元詞典的來源是統(tǒng)一數(shù)據(jù)模型的數(shù)據(jù)元、ERP的數(shù)據(jù)元和已建系統(tǒng)的物理模型字段。
3.2? 抽象元詞典的構(gòu)造
抽象數(shù)據(jù)元詞典的構(gòu)造過程分為構(gòu)造抽象數(shù)據(jù)元、定義抽象數(shù)據(jù)元兩個階段,在構(gòu)造抽象數(shù)據(jù)元階段,我們對原始數(shù)據(jù)詞典中的單詞進(jìn)行語義分析,識別其間存在的泛化關(guān)系,構(gòu)造語義關(guān)系樹,把全部單詞處理完后會識別出一座森林,這片森林的根構(gòu)成一個集合,這個集合即抽象數(shù)據(jù)元詞典。在業(yè)務(wù)中臺項(xiàng)目中由于原始數(shù)據(jù)詞典中單詞數(shù)量達(dá)到70萬余條(由于是多個來源的簡單集合,分析后的結(jié)果表明大部分單詞是重復(fù)的),巨大的詞匯量是完成這項(xiàng)工作的障礙,實(shí)踐中我們的做法為:
第一步計(jì)算機(jī)輔助切詞處理:對原始數(shù)據(jù)詞典中的所有單詞進(jìn)行切詞處理,通過比較分詞的重復(fù)比率,識別出潛在的同義詞和近義詞,形成一個個的近義詞集合。
第二步同義詞人工過濾:首先把分詞后形成的近義詞集合分工給多個團(tuán)隊(duì),經(jīng)過分詞處理后每個集合的詞匯量還是相當(dāng)巨大的,各團(tuán)隊(duì)首先對集合中的單詞按照后綴分類排序(一般相同后綴的詞語義重復(fù)或者相近的概率比較大),先進(jìn)行一輪人工排重,經(jīng)驗(yàn)表明經(jīng)過這樣排重后詞匯量降到原來的二十分之一左右(3萬左右),平均每個團(tuán)隊(duì)5 000條左右。
第三步泛化關(guān)系的整理過程:首先從集合中隨機(jī)取一個小集合(如100條),人工對其中的單詞進(jìn)行分析:
(1)刪除不規(guī)范的單詞;
(2)拆分復(fù)合單詞;
(3)定義模糊的明確語義,如對于“審核人”,要確定是審核人名稱還是審核人員工編碼;
(4)合并同義詞;
(5)對每個詞識別其抽象語義,如果已經(jīng)存在則與該父類建立泛化關(guān)系,否則新建抽象父類;
(6)再取下一個100條,重復(fù)上述工作。
經(jīng)過多次迭代,每個單詞都與某個抽象數(shù)據(jù)元建立了泛化關(guān)系,整個詞典形成了一座語義森林。
第四步合并各團(tuán)隊(duì)工作成果:選取上述森林的根形成的抽象數(shù)據(jù)元集合,對該集合再次重復(fù)第三步的工作,最終形成抽象數(shù)據(jù)元詞典,實(shí)踐中最終得到數(shù)千條抽象數(shù)據(jù)元構(gòu)成的數(shù)據(jù)元詞典。
第五步抽象數(shù)據(jù)元定義:定義數(shù)抽象據(jù)元的Domain,即數(shù)據(jù)類型、長度、精度、取值范圍、編碼格規(guī)則缺省值等約束。定義依據(jù)是各項(xiàng)已存在的標(biāo)準(zhǔn)或者事實(shí)標(biāo)準(zhǔn),原則為:優(yōu)先遵從企標(biāo)、然后依次是行業(yè)標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)、國際標(biāo)準(zhǔn)、事實(shí)標(biāo)準(zhǔn)。
3.3? 標(biāo)準(zhǔn)數(shù)據(jù)元詞典的構(gòu)造方法
標(biāo)準(zhǔn)數(shù)據(jù)元詞典是與抽象數(shù)據(jù)元詞典同時(shí)構(gòu)造的,在抽象數(shù)據(jù)元詞典構(gòu)造過程中,最終形成一座語義森林,森林的根構(gòu)成了抽象數(shù)據(jù)元詞典,所有節(jié)點(diǎn)(包括根、中間節(jié)點(diǎn)和葉子節(jié)點(diǎn))構(gòu)成了標(biāo)準(zhǔn)數(shù)據(jù)元詞典。
標(biāo)準(zhǔn)數(shù)據(jù)元詞典中的單詞在語義上與抽象數(shù)據(jù)元詞典中的某個抽象數(shù)據(jù)元有繼承關(guān)系,在Domain上,與該數(shù)據(jù)元保持完全一致。
4? 數(shù)據(jù)詞典在系統(tǒng)建模過程中的貫徹落實(shí)
在業(yè)務(wù)中臺工作中的經(jīng)歷中,筆者提出了一個MDA落地的可行的模型序列:業(yè)務(wù)過程模型、用例模型、業(yè)務(wù)對象模型、領(lǐng)域模型、概念模型、邏輯模型、物理模型和組件模型。該模型序列覆蓋了系統(tǒng)分析設(shè)計(jì)開發(fā)實(shí)現(xiàn)全生命周期,通過對模型序列的模型逐一建模,引導(dǎo)從業(yè)務(wù)空間逐步逼近以至最終達(dá)到系統(tǒng)實(shí)現(xiàn)。在這一系列模型的建模過程中,都面臨對數(shù)據(jù)元的定義和引用,這些數(shù)據(jù)元都是普通數(shù)據(jù)元,其語義和取值都要嚴(yán)格遵從標(biāo)準(zhǔn)數(shù)據(jù)元給出的語義和值域,故通過各模型的建模過程中對數(shù)據(jù)詞典的嚴(yán)格遵從,使得數(shù)據(jù)詞典得以切實(shí)貫徹落實(shí):首先,從系統(tǒng)建設(shè)的角度,數(shù)據(jù)詞典得以在分析設(shè)計(jì)開發(fā)全生命周期中貫徹落實(shí);其次,從數(shù)據(jù)運(yùn)用的角度,數(shù)據(jù)詞典得以從輸入、系統(tǒng)處理到輸出全程貫徹落實(shí);再次,從數(shù)據(jù)分布的角度,數(shù)據(jù)詞典得以從展示層、業(yè)務(wù)邏輯層、數(shù)據(jù)訪問層以至于數(shù)據(jù)庫,都得以貫徹實(shí)現(xiàn);最后從數(shù)據(jù)傳輸?shù)慕嵌?,?shù)據(jù)詞典從數(shù)據(jù)存儲到交換都得以貫徹。同時(shí),使得不同系統(tǒng)間間和不同模型間同一語義的普通數(shù)據(jù)元也得以嚴(yán)格一致,從而實(shí)現(xiàn)全域的數(shù)據(jù)一致性,為數(shù)據(jù)共享、業(yè)務(wù)銜接鋪平道路。下文就具體實(shí)踐中數(shù)據(jù)詞典的落地實(shí)施做法進(jìn)行論述。
4.1? 在建模工具中建立數(shù)據(jù)標(biāo)準(zhǔn)模型
抽象數(shù)據(jù)類型、抽象數(shù)據(jù)元和標(biāo)準(zhǔn)數(shù)據(jù)元都是以對象的方式存儲在數(shù)據(jù)標(biāo)準(zhǔn)模型中,示例如圖3所示。
圖3中顯示了數(shù)據(jù)標(biāo)準(zhǔn)模型的一個例子,其包含數(shù)據(jù)類型詞典、抽象數(shù)據(jù)元詞典和標(biāo)準(zhǔn)數(shù)據(jù)元詞典三大部分,作為示例,數(shù)據(jù)類型詞典中有三種抽象數(shù)據(jù)類型:字符型、數(shù)值型、日期型;抽象數(shù)據(jù)元詞典中有四個抽象數(shù)據(jù)元:日期、金額、身份證號、id,實(shí)際上每個都規(guī)定了語義和Domain,由于工具所限圖中沒有顯示出來;數(shù)據(jù)詞典有七個標(biāo)準(zhǔn)數(shù)據(jù)元,分別繼承于抽象數(shù)據(jù)元詞典中的某個抽象數(shù)據(jù)元。
4.2? 在業(yè)務(wù)過程模型貫徹?cái)?shù)據(jù)詞典
業(yè)務(wù)過程模型包括業(yè)務(wù)流程模型和用例模型,這兩個模型都從交互場景分析入手,描述交互中的輸入輸出和相應(yīng)的系統(tǒng)處理過程,這些輸入輸出業(yè)務(wù)信息由數(shù)據(jù)項(xiàng)組成,這些數(shù)據(jù)項(xiàng)就是普通數(shù)據(jù)元,要在業(yè)務(wù)過程建模中貫徹?cái)?shù)據(jù)詞典,就要確保這些數(shù)據(jù)元遵從標(biāo)準(zhǔn)數(shù)據(jù)元詞典中的標(biāo)準(zhǔn)數(shù)據(jù)元定義,具體實(shí)現(xiàn)過程為:在傳統(tǒng)的業(yè)務(wù)流程模型或者用例模型中,這些數(shù)據(jù)項(xiàng)是輸入輸出業(yè)務(wù)信息的一個屬性,其數(shù)據(jù)類型可以取int、char等標(biāo)準(zhǔn)類型,但是在模型驅(qū)動的方法論中,數(shù)據(jù)類型可以取某一個已經(jīng)存在的類,比如標(biāo)準(zhǔn)數(shù)據(jù)元詞典模型中的某個標(biāo)準(zhǔn)數(shù)據(jù)元,我們利用這一特征,利用普通數(shù)元的數(shù)據(jù)類型來表達(dá)該屬性和標(biāo)準(zhǔn)數(shù)據(jù)元之間的血緣關(guān)系,即設(shè)置該普通數(shù)據(jù)元的數(shù)據(jù)類型為標(biāo)準(zhǔn)數(shù)據(jù)元詞典模型中其引用的標(biāo)準(zhǔn)數(shù)據(jù)元,示例如圖4所示。
圖中有兩個模型:a.數(shù)標(biāo)準(zhǔn)典模型,包含抽象數(shù)據(jù)元詞典和標(biāo)準(zhǔn)數(shù)據(jù)元詞典;b.業(yè)務(wù)流程模型。作為示例標(biāo)準(zhǔn)數(shù)據(jù)元詞典展示出了“合同簽訂日期”“訂單提交日期”“合同額”“招標(biāo)人身份證號”“企業(yè)法人代表身份證號”“合同編號”“訂單編號”等七個標(biāo)準(zhǔn)數(shù)據(jù)元。我們要為業(yè)務(wù)流程模型中的“合同編號”屬性和標(biāo)準(zhǔn)數(shù)據(jù)元詞典中的“合同編號”標(biāo)準(zhǔn)數(shù)據(jù)元之間建立遵從關(guān)系。步驟為:
(1)選中“業(yè)務(wù)流程模型-合同詳情數(shù)據(jù)對象”的“合同編號”普通數(shù)據(jù)元;
(2)點(diǎn)擊右下角type標(biāo)簽中的“搜索”圖標(biāo),打開“Select Type”搜索框;
(3)在彈出框中,選擇“數(shù)據(jù)標(biāo)準(zhǔn)模型-標(biāo)準(zhǔn)數(shù)據(jù)元詞典”并展開;
(4)在列表中選中“合同編號”標(biāo)準(zhǔn)數(shù)據(jù)元;
(5)點(diǎn)擊“OK”,完成設(shè)置,此時(shí)即設(shè)置業(yè)務(wù)流程模型中的“合同編號”屬性的數(shù)據(jù)類型為數(shù)據(jù)標(biāo)準(zhǔn)模型-標(biāo)準(zhǔn)數(shù)據(jù)元詞典中的“合同編號”標(biāo)準(zhǔn)數(shù)據(jù)元,在二者之間通過前者的數(shù)據(jù)類型建立了遵從關(guān)系,使得前者的取值、編碼、長度、精度等值域信息遵從于后者的定義。
4.3? 業(yè)務(wù)對象模型中貫徹?cái)?shù)據(jù)詞典
業(yè)務(wù)對象由屬性構(gòu)成,這些屬性也是普通數(shù)據(jù)元,與業(yè)務(wù)過程模型相同,其語義和值域都要遵從相應(yīng)的標(biāo)準(zhǔn)數(shù)據(jù)元,其遵從關(guān)系也是通過將該普通數(shù)據(jù)元的數(shù)據(jù)類型設(shè)置為其遵從的標(biāo)準(zhǔn)數(shù)據(jù)元實(shí)體表達(dá)的,即業(yè)務(wù)對象的屬性的數(shù)據(jù)類型取其遵從的標(biāo)準(zhǔn)數(shù)據(jù)元。
4.4? 在領(lǐng)域模型和數(shù)據(jù)模型中貫徹?cái)?shù)據(jù)詞典
領(lǐng)域模型由領(lǐng)域?qū)ο蟮仍亟M成,數(shù)據(jù)模型包含概念模型、邏輯模型、物理模型,其實(shí)體都是由普通數(shù)據(jù)元構(gòu)成,與業(yè)務(wù)過程模型的處理方式相同,不再重復(fù)論述。
5? 結(jié)? 論
編制數(shù)據(jù)詞典是確保數(shù)據(jù)全域一致性,實(shí)現(xiàn)數(shù)據(jù)共享、業(yè)務(wù)協(xié)同的重要基礎(chǔ)性工作,是企業(yè)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型的重要前提,MDA方法論實(shí)現(xiàn)了業(yè)務(wù)需求的結(jié)構(gòu)化描述,數(shù)據(jù)詞典的制定是模型驅(qū)動架構(gòu)設(shè)計(jì)方法的重要補(bǔ)充,二者結(jié)合能夠確保數(shù)據(jù)詞典在信息化過程中切實(shí)落實(shí)到系統(tǒng)實(shí)現(xiàn)中去,而不是停留在桌面上、條文中。本文提出了一種制定數(shù)據(jù)詞典的方法并且提出在模型驅(qū)動架構(gòu)方法論下數(shù)據(jù)詞典的貫徹落實(shí)策略,該方法能夠做到確保數(shù)據(jù)詞典在分析、設(shè)計(jì)、實(shí)現(xiàn)過程中全面得到貫徹,確保數(shù)據(jù)詞典在代碼、數(shù)據(jù)中全面得到貫徹,確保數(shù)據(jù)詞典在對業(yè)務(wù)全覆蓋、無遺漏、不重復(fù)、無沖突,是一種可行的、有實(shí)踐價(jià)值的數(shù)據(jù)詞典構(gòu)建方法。
參考文獻(xiàn):
[1] 張鵬,李忠民.企業(yè)級數(shù)據(jù)模型全域一致性的一種解決方案 [J].智庫時(shí)代,2018(35):135-136+139.
[2] 弗蘭克爾.應(yīng)用MDA [M].鮑志云,譯.北京:人民郵電出版社,2003.
[3] KLEPPE A,WARMER J,BAST W.解析MDA [M].鮑志云,譯.北京:人民郵電出版社,2004.
[4] 郭棟,王偉,曾國蓀.一種基于微服務(wù)架構(gòu)的新型云件PaaS平臺 [J].信息網(wǎng)絡(luò)安全,2015(11):15-20.
[5] 李蘇璇.基于微服務(wù)架構(gòu)的SaaS應(yīng)用構(gòu)建方法研究 [D].廣州:華南理工大學(xué),2016.
[6] 張?zhí)?,張巖,于笑豐,等.基于MDA的設(shè)計(jì)模式建模與模型轉(zhuǎn)換 [J].軟件學(xué)報(bào),2008(9):2203-2217.
作者簡介:李忠民(1967—),男,漢族,山東聊城人,技術(shù)專家,中級職稱,本科,研究方向:銀行應(yīng)用系統(tǒng)設(shè)計(jì)開發(fā)、大型互聯(lián)網(wǎng)平臺架構(gòu)設(shè)計(jì)、大數(shù)據(jù)應(yīng)用系統(tǒng)設(shè)計(jì);高曉欣(1982—),女,漢族,河北保定人,中級職稱,碩士研究生,研究方向:項(xiàng)目過程管控、大型互聯(lián)網(wǎng)平臺架構(gòu)設(shè)計(jì)。