付維維
摘 要:隨著各地?cái)?shù)據(jù)中心建設(shè)、云計(jì)算技術(shù)的發(fā)展,各數(shù)據(jù)中心協(xié)作日趨頻繁,異地多源數(shù)據(jù)共享成為必然趨勢(shì)。傳統(tǒng)的數(shù)據(jù)共享方式主要基于統(tǒng)一的數(shù)據(jù)中心,然而這種模式未能充分考慮各異地?cái)?shù)據(jù)中心權(quán)限管控、安全性等因素,使得異地多源數(shù)據(jù)共享仍然困難重重。本文提出了一種基于總線(xiàn)結(jié)構(gòu)的異地多源數(shù)據(jù)共享應(yīng)用模型,各數(shù)據(jù)中心只需將共享交換的數(shù)據(jù)副本上傳至總線(xiàn),通過(guò)統(tǒng)一的權(quán)限管控,以期為異地多源數(shù)據(jù)共享提供支持。相對(duì)傳統(tǒng)的數(shù)據(jù)共享模型,該模型靈活的權(quán)限管控既可以較好地保障數(shù)據(jù)安全又能防止利益沖突造成的信息壁壘,同時(shí)又可以大大降低共享的資金、人力和時(shí)間成本。
關(guān)鍵詞:異地多源數(shù)據(jù);總線(xiàn)結(jié)構(gòu);數(shù)據(jù)共享;數(shù)據(jù)副本;權(quán)限管控
Research on theApplication Modelof the Multi-Source Data Replica AuthorityControl
Abstract:With the development of data centers and the development of cloud computing technologies in various places, the cooperation of data centers has become more and more frequent, and multi-source data sharing in different places has become an inevitable trend.The traditional data sharing methodsare mainly based on a unified data center. However, these models fail to fully consider the control and security of data centers in different places, and other factors, making multi-source data sharing in different places still difficult.This paper proposed a multi-source data sharing application model based on bus structure. Each data center only needs to upload a copy of the shared exchange data to the bus, and through unified authority control, in order to provide support for multi-source data sharing in different places.Compared with the traditional data sharing model, the flexible privilege management of the model can better protect data security and prevent information barriers caused by conflicts of interest, and at the same time greatly reduce the shared capital, labor and time costs.
Key words:Different place Multi-Source Data;bus structure;data sharing;data replica;authority control
1 引言
隨著各地?cái)?shù)據(jù)中心建設(shè)、云計(jì)算技術(shù)的發(fā)展,各數(shù)據(jù)中心的協(xié)作日趨頻繁,根據(jù)業(yè)務(wù)需求產(chǎn)生了大量的數(shù)據(jù)交換。然而隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、人工智能等新興技術(shù)的高速發(fā)展,各地?cái)?shù)據(jù)中心的數(shù)據(jù)量激增,同時(shí)業(yè)務(wù)需求的多樣化導(dǎo)致各數(shù)據(jù)中心間數(shù)據(jù)交換需要大量的時(shí)間成本,因此異地多源數(shù)據(jù)共享成為一種必然趨勢(shì)。異地多源數(shù)據(jù)共享具有重要的作用和意義,一方面,它可以促進(jìn)異地?cái)?shù)據(jù)中心數(shù)據(jù)管理的科學(xué)、高效,促使有效數(shù)據(jù)應(yīng)用的形成; 另一方面,它可以解決當(dāng)前異地?cái)?shù)據(jù)中心多源數(shù)據(jù)共享存在的諸多問(wèn)題。
當(dāng)前的異地?cái)?shù)據(jù)中心多源數(shù)據(jù)共享主要面臨著三大難題: 其一,各數(shù)據(jù)中心形成信息壁壘。由于管理體制問(wèn)題,各數(shù)據(jù)中心間相互獨(dú)立,形成信息壁壘。這使得數(shù)據(jù)中心存在重復(fù)建設(shè)的想象,嚴(yán)重浪費(fèi)人力、物力、財(cái)力,同時(shí)也使得大量數(shù)據(jù)資源難以共享開(kāi)發(fā),其真正價(jià)值難以得到充分發(fā)揮[1-2]。其二,各數(shù)據(jù)中心缺乏統(tǒng)一的標(biāo)準(zhǔn)體系。各數(shù)據(jù)中心的數(shù)據(jù)庫(kù)缺乏標(biāo)準(zhǔn)體系的支撐,數(shù)據(jù)格式、元數(shù)據(jù)標(biāo)準(zhǔn)不一致,采用的處理技術(shù)各不相同,數(shù)據(jù)接口也不互通,數(shù)據(jù)共享困難[3]。最后,缺乏統(tǒng)一的權(quán)限管控。各數(shù)據(jù)中心數(shù)據(jù)或多或少涉及公民隱私和業(yè)務(wù)秘密,如果在共享交換過(guò)程中缺乏統(tǒng)一的權(quán)限管控,將會(huì)帶來(lái)嚴(yán)重后果。
本文提出了一種基于總線(xiàn)結(jié)構(gòu)的異地多源數(shù)據(jù)共享應(yīng)用模型,該模型主要從共享的數(shù)據(jù)副本權(quán)限管控方面支撐實(shí)現(xiàn)異地多源數(shù)據(jù)的共享。相較傳統(tǒng)模型,該模型具有多數(shù)據(jù)中心互聯(lián)互通、權(quán)限自主管控、物理上分散、邏輯上統(tǒng)一等特點(diǎn),既可以保障數(shù)據(jù)安全和各數(shù)據(jù)中心利益,又有利于異地多源數(shù)據(jù)共享的推進(jìn),同時(shí)還可以大大降低實(shí)施資金、人力和時(shí)間成本。
2 基于總線(xiàn)結(jié)構(gòu)的異地多源數(shù)據(jù)共享
當(dāng)前研究主要基于統(tǒng)一的數(shù)據(jù)中心實(shí)現(xiàn)數(shù)據(jù)共享,但各數(shù)據(jù)中心出于數(shù)據(jù)安全性的考慮,異地?cái)?shù)據(jù)中心多源數(shù)據(jù)共享積極性不高,因此亟需提出一種新的共享方式??偩€(xiàn)結(jié)構(gòu)具有全員互聯(lián)互通、權(quán)限管控、物理上分散、邏輯上統(tǒng)一等特點(diǎn),為解決上述異地多源數(shù)據(jù)共享的問(wèn)題提供了很好的思路,因此本文基于總線(xiàn)結(jié)構(gòu)提出了一種新型的異地多源數(shù)據(jù)共享模型。
2.1 異地多源數(shù)據(jù)共享模型
基于總線(xiàn)結(jié)構(gòu)實(shí)現(xiàn)異地多源數(shù)據(jù)共享的基本思想是各數(shù)據(jù)中心基于統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)體系,將需要共享交換的數(shù)據(jù)副本通過(guò)標(biāo)準(zhǔn)化的接口上傳至服務(wù)總線(xiàn),并通過(guò)統(tǒng)一的權(quán)限管控,識(shí)別用戶(hù)身份,控制訪(fǎng)問(wèn)權(quán)限,實(shí)行三員分立,從而形成一種邏輯上統(tǒng)一、物理上分散的總線(xiàn)結(jié)構(gòu)。如圖1所示:邏輯上統(tǒng)一體現(xiàn)在異地?cái)?shù)據(jù)中心基于統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)體系,通過(guò)統(tǒng)一的接口標(biāo)準(zhǔn)進(jìn)行數(shù)據(jù)副本交換共享,異地?cái)?shù)據(jù)中心之間不再孤立,而是通過(guò)統(tǒng)一的標(biāo)準(zhǔn)體系聯(lián)系在一起,形成邏輯上統(tǒng)一的整體; 而物理上分散體現(xiàn)在異地多源數(shù)據(jù)只儲(chǔ)存在該數(shù)據(jù)中心的數(shù)據(jù)庫(kù)中,因此物理上各數(shù)據(jù)中心是分散的。綜上,基于總線(xiàn)結(jié)構(gòu)異地多源數(shù)據(jù)共享的核心是一套統(tǒng)一標(biāo)準(zhǔn)體系和統(tǒng)一的總線(xiàn)共享數(shù)據(jù)副本權(quán)限管理體系。
3 數(shù)據(jù)副本權(quán)限管控體系
3.1數(shù)據(jù)副本管理
數(shù)據(jù)副本管理(Copy Data Management,CDM):是從生產(chǎn)環(huán)境通過(guò)快照技術(shù)獲取有應(yīng)用一致性保證的數(shù)據(jù),在非生產(chǎn)存儲(chǔ)上生成“黃金副本”(Golden Image),這個(gè)“黃金副本”數(shù)據(jù)格式是原始的磁盤(pán)格式,可再虛擬化成多個(gè)副本直接掛載給服務(wù)器,分別用于備份恢復(fù)、容災(zāi)或開(kāi)發(fā)測(cè)試[4]。在異地多源數(shù)據(jù)共享場(chǎng)景中,數(shù)據(jù)副本則主要用于數(shù)據(jù)的共享交換,根據(jù)業(yè)務(wù)需求,只需將共享的數(shù)據(jù)副本上傳至總線(xiàn)。此時(shí),數(shù)據(jù)副本的權(quán)限管控顯得尤為重要,不僅需要有效滿(mǎn)足各共享數(shù)據(jù)業(yè)務(wù)需求,同時(shí)還要保證各數(shù)據(jù)源的安全,防止數(shù)據(jù)泄漏。
3.2權(quán)限管控體系
各異地?cái)?shù)據(jù)中心的數(shù)據(jù)不可避免會(huì)涉及到大量的公眾隱私和業(yè)務(wù)秘密,對(duì)上傳至總線(xiàn)的數(shù)據(jù)副本需要實(shí)行嚴(yán)格的權(quán)限管控。包括三員分立管理、統(tǒng)一身份認(rèn)證、角色權(quán)限控制等。
3.2.1三員分立管理
總線(xiàn)服務(wù)采用基于角色的權(quán)限控制模型,禁止超級(jí)特權(quán)用戶(hù),實(shí)現(xiàn)三員(系統(tǒng)管理員、審計(jì)管理員、安全管理員)分立管理。
異地多源數(shù)據(jù)共享平臺(tái)系統(tǒng)將數(shù)據(jù)副本資源與操作相結(jié)合形成相應(yīng)的授權(quán)策略,并將授權(quán)策略授權(quán)給角色,建立三種類(lèi)型的角色;將角色分配給相應(yīng)的用戶(hù),實(shí)現(xiàn)用戶(hù)對(duì)數(shù)據(jù)副本資源的權(quán)限控制與分配。對(duì)資源的操作分為管理和使用兩種方式,實(shí)現(xiàn)對(duì)系統(tǒng)資源管理和使用的權(quán)限分離。結(jié)合以上三類(lèi)管理員的模式,將共享平臺(tái)系統(tǒng)的數(shù)據(jù)副本資源使用和管理進(jìn)行分離且三類(lèi)管理員的行為進(jìn)行相互制約,如圖2所示。
安全管理員:負(fù)責(zé)對(duì)共享平臺(tái)系統(tǒng)中系統(tǒng)管理員的創(chuàng)建及資源權(quán)限的分配,安全管理員自身不具備對(duì)資源使用的權(quán)限;安全管理員對(duì)資源權(quán)限的分配是根據(jù)管理員的安全域進(jìn)行限制,安全管理員不能為自身分配權(quán)限。
系統(tǒng)管理員:由安全管理員創(chuàng)建、維護(hù),系統(tǒng)管理員只能對(duì)共享平臺(tái)系統(tǒng)的數(shù)據(jù)副本資源擁有使用的權(quán)限,不具備相應(yīng)的管理權(quán)限;其使用資源的權(quán)限范圍由安全管理員分配。
審計(jì)管理員:負(fù)責(zé)對(duì)系統(tǒng)安全管理員及系統(tǒng)管理員的行為進(jìn)行審計(jì),并對(duì)共享平臺(tái)系統(tǒng)數(shù)據(jù)副本資源的運(yùn)行狀態(tài)進(jìn)行監(jiān)控,不能使用共享平臺(tái)系統(tǒng)資源,也不能對(duì)共享平臺(tái)系統(tǒng)資源進(jìn)行分配和管理。
3.2.2統(tǒng)一身份認(rèn)證
本文選取依托身份認(rèn)證服務(wù)體系,采用身份認(rèn)證載體與用戶(hù)崗位綁定的方式進(jìn)行統(tǒng)一身份認(rèn)證,實(shí)現(xiàn)用戶(hù)依授權(quán)訪(fǎng)問(wèn),為安全事件的跟蹤審計(jì)提供依據(jù)。
1)用戶(hù)管理
由系統(tǒng)管理員統(tǒng)一生成用戶(hù)的身份標(biāo)識(shí)符,采用基于數(shù)字證書(shū)和USBKey進(jìn)行身份認(rèn)證并確保身份標(biāo)識(shí)符在系統(tǒng)生命周期中的唯一性;對(duì)系統(tǒng)內(nèi)的身份標(biāo)識(shí)符加強(qiáng)管理、維護(hù),確保身份標(biāo)識(shí)符列表不被非授權(quán)地訪(fǎng)問(wèn)、修改或刪除;用戶(hù)標(biāo)識(shí)符與安全審計(jì)相關(guān)聯(lián),保證系統(tǒng)內(nèi)安全事件的可核查性。
2)用戶(hù)認(rèn)證
用戶(hù)登錄時(shí)采用用戶(hù)名/口令+數(shù)字證書(shū)的方式進(jìn)行,用戶(hù)登錄時(shí),首先輸入系統(tǒng)用戶(hù)名及口令然后輸入數(shù)字證書(shū)保護(hù)密碼,然后由密碼設(shè)備校驗(yàn)用戶(hù)的數(shù)字證書(shū),如果通過(guò),則用戶(hù)是合法用戶(hù),否則認(rèn)證失敗,采用雙因子認(rèn)證提供系統(tǒng)的安全性。
3)日志審計(jì)
針對(duì)登錄異地多源數(shù)據(jù)共享平臺(tái)的用戶(hù),建立跟蹤用戶(hù)在系統(tǒng)的共享數(shù)據(jù)副本操作行為,當(dāng)數(shù)據(jù)副本出現(xiàn)問(wèn)題時(shí)可提供一個(gè)數(shù)據(jù)修改記錄的追溯手段。對(duì)證書(shū)用戶(hù)的訪(fǎng)問(wèn)記錄進(jìn)行敏感訪(fǎng)問(wèn)記錄,對(duì)證書(shū)用戶(hù)的業(yè)務(wù)操作進(jìn)行不可抵賴(lài)的日志記錄。對(duì)日志進(jìn)行制度性地審核,確保安全事件及時(shí)發(fā)現(xiàn)制止。
3.2.3角色權(quán)限控制
用戶(hù)權(quán)限管理的主要目的就是保證系統(tǒng)的安全,而在信息系統(tǒng)中,基于用戶(hù)行為對(duì)用戶(hù)訪(fǎng)問(wèn)進(jìn)行控制是保證系統(tǒng)安全的主要措施之一[5]。當(dāng)前主要有3種訪(fǎng)問(wèn)控制策略: 自主訪(fǎng)問(wèn)控制( DAC: Discretionary Access Control )、強(qiáng)制訪(fǎng)問(wèn)控制( MAC: Mandatory Access Control) 和基于角色的訪(fǎng)問(wèn)控制( RBAC: Role-Based Access Control) 。
前兩種訪(fǎng)問(wèn)控制方式在授權(quán)時(shí)需要對(duì)每對(duì)主體與客體制定訪(fǎng)問(wèn)許可,當(dāng)主體和客體的數(shù)量非常大時(shí),授權(quán)工作會(huì)很困難。而基于角色的訪(fǎng)問(wèn)控制是將單個(gè)主體的權(quán)限轉(zhuǎn)換為角色的權(quán)限,通過(guò)給用戶(hù)分配不同的角色,達(dá)到賦予用戶(hù)不同權(quán)限的目的[6]。這種方式大大降低了系統(tǒng)的復(fù)雜度,同時(shí)體現(xiàn)了系統(tǒng)的組織結(jié)構(gòu),簡(jiǎn)潔并具有靈活性。因此,本文選取該種方式對(duì)用戶(hù)進(jìn)行訪(fǎng)問(wèn)控制。比如同一個(gè)數(shù)據(jù)副本,有的用戶(hù)可以查閱下載,有的用戶(hù)可以刪除修改,而有的用戶(hù)則不能做此操作。
4 結(jié)語(yǔ)
由于信息壁壘和安全性問(wèn)題,各地?cái)?shù)據(jù)中心大量的數(shù)據(jù)資源無(wú)法得到有效利用,為了更好地促進(jìn)信息化發(fā)展,異地多源數(shù)據(jù)共享是一個(gè)必然的趨勢(shì)。然而,傳統(tǒng)的數(shù)據(jù)共享大都基于統(tǒng)一的大數(shù)據(jù)中心實(shí)現(xiàn),這種方式主要存在三方面問(wèn)題: 一是共享成本比較高,包括搭建共享平臺(tái)的資金成本和集成各數(shù)據(jù)中心的多源數(shù)據(jù)并標(biāo)準(zhǔn)化的時(shí)間和人力成本; 二是數(shù)據(jù)安全難以保障,共享平臺(tái)中龐大的數(shù)據(jù)量為數(shù)據(jù)安全保障工作帶來(lái)了很大困難;三是需要考慮數(shù)據(jù)一致性問(wèn)題,需定期進(jìn)行數(shù)據(jù)維護(hù)。
為解決上述問(wèn)題,本文提出了一種基于總線(xiàn)結(jié)構(gòu)的異地多源數(shù)據(jù)共享應(yīng)用模型,該模型的基本思想是: 各數(shù)據(jù)中心基于統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)體系通過(guò)標(biāo)準(zhǔn)化接口實(shí)現(xiàn)異地?cái)?shù)據(jù)中心的互聯(lián)互通; 數(shù)據(jù)共享時(shí),各數(shù)據(jù)中心只需將用于共享交換的數(shù)據(jù)副本上傳至服務(wù)總線(xiàn),同時(shí)對(duì)總線(xiàn)上的數(shù)據(jù)副本進(jìn)行統(tǒng)一的權(quán)限管控,包三員分立管理、括統(tǒng)一身份認(rèn)證、角色訪(fǎng)問(wèn)控制。相較傳統(tǒng)的大數(shù)據(jù)中心共享方式,該模型通過(guò)物理上分散、邏輯上統(tǒng)一的總線(xiàn)結(jié)構(gòu),既用較少的成本實(shí)現(xiàn)了各地?cái)?shù)據(jù)中心的互聯(lián)互通,又通過(guò)數(shù)據(jù)副本權(quán)限管控很好地保障了各地?cái)?shù)據(jù)中心的數(shù)據(jù)安全,此外還無(wú)需考慮數(shù)據(jù)一致性問(wèn)題,大大減輕了數(shù)據(jù)維護(hù)工作,可行性更強(qiáng)。
參考文獻(xiàn)
[1] 董凌峰,李永忠. 基于云計(jì)算的政務(wù)數(shù)據(jù)信息共享平臺(tái)構(gòu)建研 究———以“數(shù)字福建”為例 [J]. 現(xiàn)代情報(bào),2015,35 ( 10) : 76-81.
[2] 鄧念國(guó). 政務(wù)大數(shù)據(jù)共享難題如何破解? [J]. 大數(shù)據(jù)時(shí)代,2017,( 3) : 22-25.
[3] 唐長(zhǎng)樂(lè),王春迎. 基于政務(wù)云數(shù)據(jù)中心的政府?dāng)?shù)據(jù)開(kāi)放共享服 務(wù)集成平臺(tái)研究 [J]. 情報(bào)資料工作,2017,( 5) : 13-19.
[4]Pushan Rinnen,Garth Landers. Innovation Insight: Copy Data Management Accelerates Bimodal IT. Gartner.com, 2016.
[5] Ping N,Liao J,Wang C,et al. Web Information Recommenda- tion Based on User Behaviors [P]. Computer Science and Informa- tion Engineering,2009 WRI World Congress on,2009.
[6] 唐成華,陳新度,陳新. 管理信息系統(tǒng)中多用戶(hù)權(quán)限管理的 研究及實(shí)現(xiàn) [J]. 計(jì)算機(jī)應(yīng)用研究,2004,( 3) : 217-219.