宋 瑞
(沈陽理工大學經(jīng)濟管理學院 湖北 武漢 430000)
信息資源共享是實現(xiàn)大數(shù)據(jù)的前提,大數(shù)據(jù)是現(xiàn)代企業(yè)競爭力的利器,是企業(yè)獲得內(nèi)外部情報以及商機挖掘的重要途徑[1-2]。但信息系統(tǒng)種類繁多,信息標準化又不統(tǒng)一,面對海量數(shù)據(jù)的大量來襲企業(yè)反而像陷入信息孤島中一般被桎梏住[3-4]。因此,處于數(shù)字化轉型階段的企業(yè),需要找到一套應對信息孤島問題的方式方法,通過數(shù)據(jù)共享實現(xiàn)管理的智能決策。企業(yè)為了實現(xiàn)內(nèi)部系統(tǒng)間的信息資源互通所使用的方式方法即為企業(yè)數(shù)據(jù)共享[5-7]。國內(nèi)外研究現(xiàn)狀可知,國外學者提出企業(yè)主數(shù)據(jù)管理的方式可分為知識庫系統(tǒng)、主數(shù)據(jù)標準、領導系統(tǒng)和集中主數(shù)據(jù)系統(tǒng)等,這些概念非常具有參考價值[8]。數(shù)據(jù)共享在企業(yè)數(shù)字化轉型中占據(jù)著核心地位,因此必須要重視。Oracle、SAP與IBM針對數(shù)據(jù)共享提出了主數(shù)據(jù)管理這個重要概念,由此引申出現(xiàn)代企業(yè)數(shù)據(jù)共享可以主要通過主數(shù)據(jù)管理、部分數(shù)據(jù)集成和總體標準制定三種方式來實現(xiàn)[9]。其中主數(shù)據(jù)管理的應用最為廣泛。
企業(yè)管理中,傳統(tǒng)數(shù)據(jù)共享主要分為局部數(shù)據(jù)共享和全局數(shù)據(jù)共享,與這兩種模型相呼應的是部分數(shù)據(jù)集成方式和總體制定標準的共享數(shù)據(jù)方式。
為了達到獲取異構系統(tǒng)中部分數(shù)據(jù)的目的,企業(yè)通過語義轉換的方式將部分系統(tǒng)中的部分數(shù)據(jù)統(tǒng)一集中到一個平臺上,綜合分析處理和共享這部分數(shù)據(jù)的方式,即為部分數(shù)據(jù)集成,具體如圖1所示。
圖1 傳統(tǒng)數(shù)據(jù)共享實現(xiàn)方式1部分數(shù)據(jù)集成
如圖1可知,存在于企業(yè)中的各系統(tǒng)沒有進行統(tǒng)一規(guī)劃,各部門從自身需求出發(fā)獨立發(fā)起指令,數(shù)據(jù)的共享和綜合分析都是由不同集成目的觸發(fā)的。圖中集成平臺1和集成平臺2分別實現(xiàn)了應用系統(tǒng)1—3和應用系統(tǒng)4—6的數(shù)據(jù)標準化,轉化后對應的數(shù)據(jù)屬性分別為S和S',兩者間的數(shù)據(jù)標準沒有真正實現(xiàn)完全統(tǒng)一。異構系統(tǒng)間的部分數(shù)據(jù)通過集成后成了信息孤島。
從企業(yè)頂層開始設計出一套數(shù)據(jù)標準,并將其作為企業(yè)全部系統(tǒng)的數(shù)據(jù)執(zhí)行準則,要求系統(tǒng)內(nèi)原有異構應用系統(tǒng)都嚴格遵守,最終實現(xiàn)數(shù)據(jù)共享的方式即為總體制定標準。領導系統(tǒng)標準和總體制定最優(yōu)標準是總體定制標準的兩種方法。由信息標準化委員會牽頭完成企業(yè)信息系統(tǒng)的調(diào)研工作,先從元數(shù)據(jù)、數(shù)據(jù)元、分類編碼等分類入手,制定出一套適用于本企業(yè)的最優(yōu)標準,再下發(fā)給元數(shù)據(jù)、數(shù)據(jù)元和分類編碼,就是圖2中演示的執(zhí)行步驟,最后應用系統(tǒng)1—4的數(shù)據(jù)屬性均會變成S,信息孤島不復存在,數(shù)據(jù)的綜合處理及共享便得以實現(xiàn),這就是總體定制最優(yōu)標準。此過程中信息分類編碼必須與最優(yōu)標準統(tǒng)一,如果執(zhí)行遭到拒絕則需要推倒原系統(tǒng)進行重建。
圖2 傳統(tǒng)數(shù)據(jù)共享實現(xiàn)方式 1總體制定最優(yōu)標準
在領導系統(tǒng)標準方式中,企業(yè)則無須費力找到一套最優(yōu)數(shù)據(jù)標準,只需制定一個系統(tǒng)作為領導系統(tǒng),其他系統(tǒng)中嚴格執(zhí)行領導系統(tǒng)中的數(shù)據(jù)標準即可,如圖3所示。
圖3 傳統(tǒng)數(shù)據(jù)共享實現(xiàn)方式2領導系統(tǒng)標準
部分數(shù)據(jù)集成和總體制定標準各有利弊,是企業(yè)實現(xiàn)數(shù)據(jù)共享的兩種傳統(tǒng)方式,在信息數(shù)據(jù)不大的情況下能夠幫助企業(yè)解決部分數(shù)據(jù)共享需求。
企業(yè)在進行數(shù)據(jù)共享方式的選擇時需要將數(shù)據(jù)共享的可實現(xiàn)性,以及選擇此方式需要付出的成本、速度、可拓展性等因素考慮在內(nèi)。速度可以簡單理解為時間成本;可拓展性則是基于大數(shù)據(jù)不斷發(fā)展前提下,數(shù)據(jù)標準的范圍和數(shù)量是否具有足夠的延展性。可實現(xiàn)性最強、速度最快、成本最低、可拓展性最大的數(shù)據(jù)共享方式最應該被選擇,可用公式表示為:
S=f(R,C,V,E)
其中,R為可實現(xiàn)性,C為成本,V為速度,E為可拓展性。
在企業(yè)數(shù)字化轉型的大條件下,利用S公式分析部分數(shù)據(jù)集成和總體制定標準的變化和指標性,為企業(yè)選擇提供參考。
2.1.1 部分數(shù)據(jù)集成
圖4是通過部分數(shù)據(jù)集成方式實現(xiàn)的企業(yè)數(shù)據(jù)共享,由多個不同的信息系統(tǒng)集成一個大的異構平臺。
圖4 大數(shù)據(jù)條件下部分數(shù)據(jù)集成方式的變化
在大數(shù)據(jù)條件下,對這種集成方式的變化進行分析,
①數(shù)據(jù)共享的可實現(xiàn)性。部分數(shù)據(jù)集成方式是可針對局部信息共享的,能夠很好地處理部分系統(tǒng)中的局部數(shù)據(jù),但由于數(shù)據(jù)標準不統(tǒng)一,會造成信息孤島的產(chǎn)生,無法解決整個企業(yè)系統(tǒng)的數(shù)據(jù)共享問題。
②成本。需要成本投入的地方有接口調(diào)試費和系統(tǒng)調(diào)研費。其中,系統(tǒng)調(diào)研費的支出最多。
③速度。需要投入時間成本的環(huán)節(jié)有集成平臺開發(fā)、數(shù)據(jù)集成、系統(tǒng)設計和調(diào)研。此處,平臺集成的時間與系統(tǒng)開發(fā)的時間基本對等。
④可拓展性。如果按照海量數(shù)據(jù)的變化需求更改集成的數(shù)據(jù)與系統(tǒng)、調(diào)整平臺的功能、整理和清理系統(tǒng)中的數(shù)據(jù),就必須對集成平臺進行新的設計和開發(fā),需要付出的時間和經(jīng)濟成本會引起很多爭議,因此可拓展性無法與總體制定的標準方式相比。
將上述兩種數(shù)據(jù)共享方式的四個性能指標列表對比后發(fā)現(xiàn),其各項指標的表現(xiàn)都有所欠缺,企業(yè)需要盡快尋得一條更適合數(shù)字化轉型的數(shù)據(jù)共享實現(xiàn)方式,以提高企業(yè)的競爭力。
2.1.2 總體制定標準
觀察圖5再對比圖2,相較于之前傳統(tǒng)的數(shù)據(jù)標準,在原有的元數(shù)據(jù)、數(shù)據(jù)元和信息分類編碼的基礎上又增加了數(shù)據(jù)安全、數(shù)據(jù)分析、非結構化數(shù)據(jù)表達和數(shù)據(jù)質(zhì)量等與海量數(shù)據(jù)相對應的新數(shù)據(jù)標準。另外,多且復雜的系統(tǒng)已經(jīng)基本能夠滿足企業(yè)對于系統(tǒng)功能的所有業(yè)務需求,新建系統(tǒng)可有可無,因此將多種數(shù)據(jù)標準嚴格落實到企業(yè)全部異構系統(tǒng)中則更為實用。但無論選擇聯(lián)系開發(fā)商對系統(tǒng)中的數(shù)據(jù)標準進行修改還是推倒原系統(tǒng)重建,都會造成成本的浪費。
圖5 大數(shù)據(jù)條件下總體制定標準方式的變化
在大數(shù)據(jù)條件下,基于上述兩種變化對總體制定標準方式的個性指標進行分析如下。
①數(shù)據(jù)共享的可實現(xiàn)性:企業(yè)標準的制定離不開一個強大的組織,強大的組織需要專業(yè)的大數(shù)據(jù)人才。想要推倒企業(yè)原來的系統(tǒng),在龐大的海量數(shù)據(jù)標準面前重新構建系統(tǒng)無疑是事半功倍,因此通過總體制定標準來解決企業(yè)數(shù)據(jù)共享的問題是基本上不具備可行性。
②成本。需要成本投入的地方有系統(tǒng)修改、系統(tǒng)重建、標準宣貫、標準制定、招聘專家和系統(tǒng)調(diào)研等,其中系統(tǒng)修改和重建屬于重復性支出。
③速度。需要投入時間成本的環(huán)節(jié)有修改或者重建系統(tǒng)、數(shù)據(jù)標準宣貫、標準的制定與更新、系統(tǒng)調(diào)研等。單個系統(tǒng)的修改或重建時長在2~3個月之間,需要改動或者重建的系統(tǒng)越多需要的時間也越長,總體制定標準方式的速度可減少一半。
④可拓展性。數(shù)據(jù)標準的制定和實施決定著制定標準方式的可拓展性;根據(jù)大數(shù)據(jù)需求制定而得的數(shù)據(jù)標準是可以滿足企業(yè)數(shù)據(jù)共享需求的,這部分可拓展性較強;將多種數(shù)據(jù)標準強行套用到海量數(shù)據(jù)中,是非常有難度的,因此這部分可拓展性較弱。
在企業(yè)數(shù)字化轉型的道路中,在大數(shù)據(jù)條件下,主數(shù)據(jù)管理的誕生為解決數(shù)據(jù)共享問題提供了一條嶄新的思路。在企業(yè)中具有極高業(yè)務價值的,能夠實現(xiàn)整個系統(tǒng)共享的數(shù)據(jù),即為主數(shù)據(jù)。主數(shù)據(jù)管理就是將能夠代表企業(yè)核心業(yè)務實體的數(shù)據(jù)作為主數(shù)據(jù)從企業(yè)全部數(shù)據(jù)中抽離出來,并統(tǒng)一管理主數(shù)據(jù)的數(shù)據(jù)質(zhì)量、數(shù)據(jù)元和信息分類編碼,然后通過單一用戶視圖的方式分發(fā)給各個應用系統(tǒng)。圖6則是對這一方式的具體圖解。企業(yè)中使用頻繁的且具有高業(yè)務價值的數(shù)據(jù)可被確定為主數(shù)據(jù),例如生產(chǎn)、供應、銷售、財務、績效、人事等。負責對主數(shù)據(jù)進行管理的是主數(shù)據(jù)管理系統(tǒng),經(jīng)過一致性檢測后,系統(tǒng)會標準化管理主數(shù)據(jù)的信息分類編碼、元數(shù)據(jù)和數(shù)據(jù)元,并主動修復、匹配和清晰這些數(shù)據(jù),保證了主數(shù)據(jù)的質(zhì)量與標準化程度。為了確保發(fā)布到各應用系統(tǒng)中的主數(shù)據(jù)的同源性,采用MDM數(shù)據(jù)庫存儲標準化后的主數(shù)據(jù),使企業(yè)異構系統(tǒng)中數(shù)據(jù)共享功能的延展性發(fā)揮到最大。
圖6 大數(shù)據(jù)條件下企業(yè)數(shù)據(jù)共享實現(xiàn)方式——主數(shù)據(jù)管理
大數(shù)據(jù)側重數(shù)據(jù)的類型和數(shù)量,而主數(shù)據(jù)卻是以質(zhì)量為核心,主數(shù)據(jù)主要來自對大數(shù)據(jù)的提煉,因此可以通過有機組織主數(shù)據(jù)的方法進一步提升其數(shù)據(jù)價值和一致性。無論是從企業(yè)對大數(shù)據(jù)的要求出發(fā),還是從合理降本增效的角度考慮,企業(yè)數(shù)字化轉型離不開科學合理的數(shù)據(jù)共享方式。
對大數(shù)據(jù)條件下通過主數(shù)據(jù)管理實現(xiàn)數(shù)據(jù)共享的個性指標分析如下:
(1)數(shù)據(jù)共享的可實現(xiàn)性。將能夠代表企業(yè)核心業(yè)務實體的數(shù)據(jù)作為主數(shù)據(jù)從企業(yè)海量數(shù)據(jù)中抽離出來,并統(tǒng)一管理其數(shù)據(jù)質(zhì)量、數(shù)據(jù)元和信息分類編碼,通過單一用戶視圖的方式分發(fā)給各個應用系統(tǒng),既保證了主數(shù)據(jù)的同源性,又規(guī)范了數(shù)據(jù)的標準化,提高了處理速度,使數(shù)據(jù)共享的可行性得到了極大提升。
(2)成本。開發(fā)主數(shù)據(jù)管理系統(tǒng)的費用對等部分系統(tǒng)集成費用,低于總體制定標準的總支出。
(3)速度。相較于總體制定標準方式中,從標準定制到實施更新所消耗的時間,主數(shù)據(jù)管理用于開發(fā)和設計的時間更加短。
(4)可拓展性。為了方便管理主數(shù)據(jù)的數(shù)據(jù)質(zhì)量、數(shù)據(jù)分發(fā)和清理,主數(shù)據(jù)管理系統(tǒng)將主數(shù)據(jù)元與相應的數(shù)據(jù)集中在了一個平臺中,增加了系統(tǒng)可擴展性。
綜上所述,對比部分數(shù)據(jù)集成、總體制定標準和主數(shù)據(jù)管理這三種數(shù)據(jù)共享方式的可實現(xiàn)性、成本、時間和可拓展性得出,大數(shù)據(jù)條件下,主數(shù)據(jù)管理的個性指標均表現(xiàn)十分優(yōu)秀,不但可實現(xiàn)性強,而且速度更快,所需投入的成本更低,也具備足夠的可拓展性。因此想要應對企業(yè)數(shù)字化轉型中出現(xiàn)的數(shù)據(jù)共享問題,主數(shù)據(jù)管理必然是最佳選擇。
綜上所述,基于大數(shù)據(jù)特性的主數(shù)據(jù)管理可以最大限度地實現(xiàn)企業(yè)的數(shù)據(jù)共享,是大數(shù)據(jù)時代前提下企業(yè)最好的選擇??梢杂行椭髽I(yè)突破大數(shù)據(jù)的桎梏,解決信息孤島和海量數(shù)據(jù)問題,更能為企業(yè)的可視化展示以及信息資源的深度挖掘打下堅實的基礎。