韋宇星
(廣西壯族自治區(qū)信息中心,廣西 南寧 530000)
壯美廣西·政務(wù)云于2019年3月基本建成,建設(shè)有互聯(lián)網(wǎng)區(qū)和公用網(wǎng)絡(luò)區(qū)的獨(dú)立云平臺(tái)。政務(wù)云在規(guī)劃建設(shè)之初,僅規(guī)劃建設(shè)本地備份系統(tǒng),實(shí)現(xiàn)對(duì)政務(wù)云上的數(shù)據(jù)本地備份,主要向自治區(qū)級(jí)政務(wù)部門提供統(tǒng)一的IAAS層政務(wù)云資源服務(wù),隨著廣西政務(wù)數(shù)據(jù)資源管理與改革的推進(jìn),現(xiàn)已承載800多個(gè)系統(tǒng)。壯美廣西·政務(wù)云是廣西政務(wù)服務(wù)開展的重要基礎(chǔ)設(shè)施,為保證政務(wù)云上信息系統(tǒng)的數(shù)據(jù)可靠,提供多種更安全的數(shù)據(jù)保護(hù)模式,因此開展壯美廣西·政務(wù)云災(zāi)備體系的擴(kuò)展建設(shè)十分必要。
較常見的容災(zāi)模式可分為同城容災(zāi)、異地容災(zāi)、兩地三中心、雙活中心等模式。同城災(zāi)難備份和異地災(zāi)難備份各有所長,為達(dá)到最理想的防災(zāi)效果,數(shù)據(jù)中心應(yīng)考慮采用同城和異地各建立一個(gè)災(zāi)難備份中心的方式[1]。綜合考慮容災(zāi)模式的成熟度、建設(shè)成本等因素,結(jié)合自治區(qū)級(jí)各政務(wù)部門提出的具體需求,壯美廣西·政務(wù)云災(zāi)備體系架構(gòu)在原有本地災(zāi)備的基礎(chǔ)上,構(gòu)建“兩地三中心”模式,建設(shè)同城雙中心和異地災(zāi)備中心。
壯美廣西·政務(wù)云構(gòu)建的“兩地三中心”模式,RPO/RTO指標(biāo)應(yīng)至少達(dá)到以下要求。
1.2.1 同城數(shù)據(jù)備份與恢復(fù)
普通業(yè)務(wù)(等保備案3級(jí)系統(tǒng)),同城數(shù)據(jù)級(jí)全備份與恢復(fù),RPO<60 s;重要業(yè)務(wù)(等保備案3級(jí)系統(tǒng)),同城數(shù)據(jù)級(jí)持續(xù)備份與恢復(fù),RPO<10 s[2]。
1.2.2 同城應(yīng)用切換及發(fā)布
重要業(yè)務(wù)(等保備案3級(jí)系統(tǒng)),同城基于軟件備份的系統(tǒng)恢復(fù)與發(fā)布服務(wù),RPO<60 s;關(guān)鍵業(yè)務(wù)(等保備案5級(jí)系統(tǒng)),同城應(yīng)用級(jí)應(yīng)急接管與發(fā)布服務(wù),RPO<10 s。
1.2.3 異地?cái)?shù)據(jù)備份與恢復(fù)
全部業(yè)務(wù),同城災(zāi)備數(shù)據(jù)異地備份與數(shù)據(jù)恢復(fù),RPO≤30 min;生產(chǎn)中心本地備份數(shù)據(jù)異地備份與數(shù)據(jù)恢復(fù),RPO≤24 h。
經(jīng)過統(tǒng)籌考慮,“兩地三中心”的災(zāi)備服務(wù)內(nèi)容包括數(shù)據(jù)備份服務(wù)和關(guān)鍵應(yīng)用系統(tǒng)接管服務(wù)設(shè)計(jì),服務(wù)如下。
1.3.1 同城數(shù)據(jù)級(jí)全備份與恢復(fù)服務(wù)
對(duì)生產(chǎn)中心主機(jī)(含虛擬機(jī)和物理機(jī),不包含實(shí)施應(yīng)急接管服務(wù)和重要數(shù)據(jù)庫系統(tǒng)實(shí)時(shí)備份與恢復(fù)服務(wù)的主機(jī))基于備份軟件進(jìn)行準(zhǔn)實(shí)時(shí)同步備份,實(shí)現(xiàn)每臺(tái)備份主機(jī)在同城災(zāi)備中心有一份準(zhǔn)實(shí)時(shí)克隆備份數(shù)據(jù)。
1.3.2 同城數(shù)據(jù)磁盤陣列級(jí)異步復(fù)制備份
對(duì)生產(chǎn)中心所有存儲(chǔ)在政務(wù)云集中式存儲(chǔ)系統(tǒng)上的數(shù)據(jù)進(jìn)行磁盤陣列級(jí)異步復(fù)制備份,實(shí)現(xiàn)政務(wù)云集中式存儲(chǔ)系統(tǒng)上的數(shù)據(jù)在同城災(zāi)備中心有一份克隆備份數(shù)據(jù)。
1.3.3 同城數(shù)據(jù)級(jí)持續(xù)備份與恢復(fù)
在同城數(shù)據(jù)級(jí)全備份與恢復(fù)的基礎(chǔ)上,可選擇部分主機(jī)中的重要目錄文件或數(shù)據(jù)庫進(jìn)行持續(xù)數(shù)據(jù)保護(hù),保留多份備份數(shù)據(jù),并可恢復(fù)7天內(nèi)任一時(shí)間點(diǎn)數(shù)據(jù)[3]。
1.3.4 同城應(yīng)用級(jí)應(yīng)急接管
對(duì)部分重要信息系統(tǒng)進(jìn)行應(yīng)急接管服務(wù),應(yīng)急接管服務(wù)實(shí)現(xiàn)生產(chǎn)中心的應(yīng)用快速切換至同城災(zāi)備中心運(yùn)行。
1.3.5 同城重要數(shù)據(jù)庫系統(tǒng)實(shí)時(shí)備份與恢復(fù)
對(duì)部分重要應(yīng)用的數(shù)據(jù)庫系統(tǒng)進(jìn)行實(shí)時(shí)備份服務(wù),服務(wù)支持?jǐn)?shù)據(jù)庫系統(tǒng)的快速恢復(fù)及啟動(dòng)運(yùn)行。
1.3.6 同城應(yīng)用級(jí)應(yīng)急運(yùn)行
在同城數(shù)據(jù)級(jí)全備份與恢復(fù)、同城數(shù)據(jù)級(jí)持續(xù)備份與恢復(fù)、同城應(yīng)用級(jí)應(yīng)急接管和同城重要數(shù)據(jù)庫系統(tǒng)實(shí)時(shí)備份與恢復(fù)的基礎(chǔ)上,可實(shí)現(xiàn)部分應(yīng)用手動(dòng)切換到同城災(zāi)備中心運(yùn)行,并向政務(wù)外網(wǎng)或互聯(lián)網(wǎng)提供服務(wù)。
1.3.7 同城災(zāi)備數(shù)據(jù)異地備份與恢復(fù)
將同城災(zāi)備中心的所有數(shù)據(jù),包括同城數(shù)據(jù)級(jí)全備份與恢復(fù)服務(wù)、同城數(shù)據(jù)級(jí)持續(xù)備份與恢復(fù)服務(wù)、同城應(yīng)用級(jí)應(yīng)急接管服務(wù)和同城重要數(shù)據(jù)庫系統(tǒng)實(shí)時(shí)備份與恢復(fù)服務(wù)產(chǎn)生的數(shù)據(jù)遠(yuǎn)程復(fù)制到異地災(zāi)備中心保存,當(dāng)發(fā)生災(zāi)難時(shí)可將相關(guān)數(shù)據(jù)恢復(fù)到同城災(zāi)備中心或生產(chǎn)中心。
壯美廣西·政務(wù)云生產(chǎn)中心位于南寧良慶區(qū),同城災(zāi)備中心在考慮機(jī)房條件和距離的情況下,機(jī)房選擇在南寧市高新區(qū),距離生產(chǎn)中心直線16 km;異地災(zāi)備中心機(jī)房選擇在來賓市運(yùn)營商機(jī)房,距離生產(chǎn)中心162 km。
如圖1所示,在南寧同城容災(zāi)中心的組網(wǎng)上,網(wǎng)絡(luò)區(qū)域化分為互聯(lián)網(wǎng)區(qū)、公用網(wǎng)絡(luò)區(qū)、安全管理區(qū)。在互聯(lián)網(wǎng)區(qū)、公用網(wǎng)絡(luò)區(qū)各自搭建同城災(zāi)備云平臺(tái),互聯(lián)網(wǎng)區(qū)云平臺(tái)負(fù)責(zé)生產(chǎn)中心互聯(lián)網(wǎng)區(qū)域業(yè)務(wù)的災(zāi)備,公用網(wǎng)絡(luò)區(qū)域負(fù)責(zé)生產(chǎn)中心公用網(wǎng)絡(luò)區(qū)域業(yè)務(wù)的災(zāi)備。安全管理區(qū)域承載本次項(xiàng)目所有的管理流量以及整個(gè)災(zāi)備中心的網(wǎng)絡(luò)安全保障。在同城災(zāi)備中心部署獨(dú)立的互聯(lián)網(wǎng)出口,可以實(shí)現(xiàn)互聯(lián)網(wǎng)區(qū)應(yīng)用系統(tǒng)的切換發(fā)布;來賓異地備份中心僅做數(shù)據(jù)級(jí)災(zāi)備,利用備份軟件實(shí)現(xiàn)操作系統(tǒng)層面數(shù)據(jù)存儲(chǔ)備份,不再建設(shè)云平臺(tái)。具體同城與異地災(zāi)備的網(wǎng)絡(luò)互連設(shè)計(jì)如下:
圖1 網(wǎng)絡(luò)架構(gòu)
(1)互聯(lián)網(wǎng)區(qū)域與公用網(wǎng)絡(luò)區(qū)物理上隔離,通過部署跨區(qū)域的數(shù)據(jù)交換系統(tǒng)實(shí)現(xiàn)受控的數(shù)據(jù)訪問和網(wǎng)絡(luò)互通。
(2)同城災(zāi)備中心互聯(lián)網(wǎng)交換機(jī)與生產(chǎn)中心互聯(lián)網(wǎng)核心路由器之間通過2*10GE專線三層互連,實(shí)現(xiàn)信息系統(tǒng)應(yīng)急接管后的業(yè)務(wù)發(fā)布訪問;公共網(wǎng)絡(luò)區(qū)與互聯(lián)網(wǎng)區(qū)域一致。
(3)災(zāi)備中心互聯(lián)網(wǎng)接入交換機(jī)與生產(chǎn)中心互聯(lián)網(wǎng)核心交換機(jī)之間通過4*10GE專線互連,其中兩根接云廠商A核心交換機(jī),兩根接云廠商B核心交換機(jī),每兩根通過鏈路聚合的模式捆綁為一個(gè)邏輯接口,并在邏輯接口下配置trunk模式放通相關(guān)VLAN,生產(chǎn)中心接口也做相關(guān)配置,實(shí)現(xiàn)二層互通,打通災(zāi)備中心與生產(chǎn)中心云平臺(tái)資源網(wǎng)絡(luò),滿足備份數(shù)據(jù)流;公共網(wǎng)絡(luò)區(qū)與互聯(lián)網(wǎng)區(qū)域一致。
(4)災(zāi)備中心所有區(qū)域的網(wǎng)絡(luò)、安全等設(shè)備均實(shí)現(xiàn)冗余部署,保證網(wǎng)絡(luò)可靠性。
針對(duì)容災(zāi)項(xiàng)目實(shí)施,網(wǎng)絡(luò)設(shè)計(jì)為同城災(zāi)備中心與生產(chǎn)中心網(wǎng)絡(luò)3層互通,保證同城災(zāi)備云平臺(tái)上備份軟件控制機(jī)與所需安裝備份軟件包的虛擬機(jī)網(wǎng)絡(luò)互通。
2.2.1 同城數(shù)據(jù)級(jí)全備份服務(wù)網(wǎng)絡(luò)架構(gòu)
數(shù)據(jù)級(jí)全備份涉及生產(chǎn)中心上所有信息系統(tǒng),用20對(duì)1的方式進(jìn)行數(shù)據(jù)實(shí)時(shí)同步,網(wǎng)絡(luò)采用三層互通的方式。
(1)備份軟件通過備份控制機(jī)進(jìn)行策略下發(fā),控制機(jī)分別與生產(chǎn)中心、災(zāi)備中心虛擬機(jī)網(wǎng)絡(luò)可達(dá)。
(2)備份軟件數(shù)據(jù)同步工作是通過生產(chǎn)中心業(yè)務(wù)IP與同城災(zāi)備中心對(duì)應(yīng)災(zāi)備機(jī)的數(shù)據(jù)復(fù)制IP可達(dá)實(shí)現(xiàn)。目前20個(gè)生產(chǎn)虛擬機(jī)數(shù)據(jù)同步至1臺(tái)災(zāi)備中心的備份虛擬機(jī)內(nèi)。
2.2.2 同城生產(chǎn)中心持續(xù)數(shù)據(jù)保護(hù)服務(wù)網(wǎng)絡(luò)架構(gòu)
基于數(shù)據(jù)級(jí)全備份服務(wù)架構(gòu)的網(wǎng)絡(luò)架構(gòu),可實(shí)現(xiàn)持續(xù)數(shù)據(jù)保護(hù)服務(wù)。
(1)災(zāi)備中心承載災(zāi)備數(shù)據(jù)的虛擬機(jī)與災(zāi)備中心連續(xù)保護(hù)機(jī)器網(wǎng)絡(luò)可達(dá),實(shí)現(xiàn)關(guān)鍵業(yè)務(wù)數(shù)據(jù)的連續(xù)保護(hù),20個(gè)災(zāi)備虛擬機(jī)數(shù)據(jù)同步至1臺(tái)連續(xù)保護(hù)虛擬機(jī)內(nèi)。
2.2.3 異地?cái)?shù)據(jù)級(jí)全備份服務(wù)網(wǎng)絡(luò)架構(gòu)
異地?cái)?shù)據(jù)級(jí)全備份涉及全網(wǎng)所有業(yè)務(wù)系統(tǒng),采用20對(duì)1的方式進(jìn)行數(shù)據(jù)定時(shí)同步,網(wǎng)絡(luò)采用三層互通的方式。
(1)異地備份軟件通過異地控制機(jī)進(jìn)行策略下發(fā),控制機(jī)與同城災(zāi)備中心的備份虛擬機(jī)、異地備份虛擬機(jī)網(wǎng)絡(luò)可達(dá)。
(2)備份軟件數(shù)據(jù)根據(jù)帶寬完成對(duì)同城災(zāi)備虛擬機(jī)在來賓異地的數(shù)據(jù)同步,實(shí)現(xiàn)20對(duì)1的備份。
2.3.1 同城數(shù)據(jù)級(jí)備份實(shí)施
采用多對(duì)一數(shù)據(jù)集中備份方式。生產(chǎn)中心4 000臺(tái)虛擬機(jī),比例為20∶1,則在同城災(zāi)備中心云平臺(tái)上開通200臺(tái)實(shí)時(shí)備份虛擬機(jī)。在生產(chǎn)中心的虛擬機(jī)、同城災(zāi)備中心的實(shí)時(shí)備份虛擬機(jī)上安裝備份軟件,在災(zāi)備控制機(jī)上啟動(dòng)實(shí)時(shí)備份規(guī)則,全服務(wù)器備份任務(wù)首先會(huì)將源端系統(tǒng)所有數(shù)據(jù)(包括文件系統(tǒng)、用戶數(shù)據(jù)目錄)一次性同步到備份虛擬機(jī)上。
2.3.2 同城數(shù)據(jù)級(jí)持續(xù)備份實(shí)施
采用多對(duì)一數(shù)據(jù)集中備份方式。同城災(zāi)備中心的200臺(tái)實(shí)時(shí)備份主機(jī)中獲取數(shù)據(jù)(原主機(jī)為≥1 000臺(tái)),按照20∶1的比例,開通10臺(tái)同城容災(zāi)中心持續(xù)備份虛擬機(jī),屬于一種級(jí)聯(lián)備份,啟動(dòng)備份軟件的CDP功能,實(shí)現(xiàn)7天的數(shù)據(jù)持續(xù)性保護(hù)。
2.3.3 同城重要數(shù)據(jù)庫系統(tǒng)備份實(shí)施
同時(shí)采用一對(duì)一、多對(duì)一數(shù)據(jù)集中備份方式。未來將根據(jù)調(diào)研云租戶的具體結(jié)果,混合采用復(fù)制和備份技術(shù)開展備份。選擇采用備份軟件的解析數(shù)據(jù)庫在線日志的實(shí)時(shí)復(fù)制技術(shù)或基于文件系統(tǒng)實(shí)施復(fù)制的高可用技術(shù)。
2.3.4 同城應(yīng)用級(jí)應(yīng)急接管實(shí)施
采用一對(duì)一備份形式。生產(chǎn)中心虛擬機(jī)與同城災(zāi)備中心的虛擬機(jī)一一對(duì)應(yīng),使用備份軟件的復(fù)制規(guī)則,將生產(chǎn)虛擬機(jī)直接復(fù)制至備份虛擬機(jī),并且啟用應(yīng)用高可用功能。
2.3.5 同城災(zāi)備數(shù)據(jù)的異地備份實(shí)施
采用多對(duì)一的數(shù)據(jù)集中備份方式。備份同城災(zāi)備中心的所有數(shù)據(jù),包括200臺(tái)實(shí)時(shí)備份主機(jī),50個(gè)數(shù)據(jù)庫的災(zāi)備主機(jī),50個(gè)應(yīng)用(200個(gè)虛擬機(jī)),利用來賓異地中心的物理服務(wù)器開展備份。
一是構(gòu)建異構(gòu)解耦容災(zāi)云平臺(tái)。具備云平臺(tái)無關(guān)性,實(shí)現(xiàn)生產(chǎn)中心和災(zāi)備中心之間使用異構(gòu)云平臺(tái)進(jìn)行的統(tǒng)一災(zāi)備,避免了品牌鎖定,增加整個(gè)政務(wù)云的數(shù)據(jù)可靠性,打造國內(nèi)電子政務(wù)領(lǐng)域首例異構(gòu)云容災(zāi)方案。二是應(yīng)用字節(jié)級(jí)復(fù)制技術(shù)?;诋悩?gòu)政務(wù)云的場景,采用業(yè)界領(lǐng)先的字節(jié)級(jí)復(fù)制技術(shù),以傳統(tǒng)容災(zāi)20%的資源實(shí)現(xiàn)政務(wù)云上信息系統(tǒng)的數(shù)據(jù)業(yè)務(wù)容災(zāi)。三是提供全?;臑?zāi)備服務(wù)。提供從網(wǎng)絡(luò)、存儲(chǔ)、數(shù)據(jù)庫、虛擬化到應(yīng)用的全棧容災(zāi)技術(shù),提供多樣化的容災(zāi)服務(wù),實(shí)現(xiàn)低成本、高可靠、高安全、滿足電子政務(wù)外網(wǎng)業(yè)務(wù)運(yùn)行的主要場景災(zāi)備。
本次項(xiàng)目災(zāi)備體系建設(shè),實(shí)現(xiàn)對(duì)壯美廣西·政務(wù)云生產(chǎn)中心進(jìn)行同城災(zāi)備及異地備份,實(shí)現(xiàn)生產(chǎn)中心每臺(tái)備份主機(jī)在同城災(zāi)備中心有一份準(zhǔn)實(shí)時(shí)克隆備份數(shù)據(jù),并且可支持部分核心業(yè)務(wù)系統(tǒng)在同城災(zāi)備中心同時(shí)進(jìn)行恢復(fù)數(shù)據(jù)和啟動(dòng)應(yīng)用,滿足RPO小于30 s,RTO小于30 min的要求。