賈棟
當今的世界,計算機技術(shù)在不斷告訴發(fā)展,各大、中型企業(yè)的日常運營及業(yè)務(wù)發(fā)展都已離不開信息系統(tǒng),因此往都建立自己的信息中心及業(yè)務(wù)系統(tǒng),并為此投入大量的財力物力,購置大量的IT設(shè)備,不動資產(chǎn)動則幾億甚至幾十億。但仔細推敲下來,企業(yè)信息中心里,最寶貴的并不是這些設(shè)備,而是無形資產(chǎn),即設(shè)備上承載的數(shù)據(jù)及業(yè)務(wù)。試想下如果銀行丟失了儲戶信息;通信公司中斷了通信業(yè)務(wù),哪怕只是停止一天,那么這些企業(yè)在當下競爭激烈的市場中,還能生存下去嗎?答案必然是否定的。
因此當企業(yè)發(fā)展到一定規(guī)模后,完全有必要建立起災(zāi)備中心,在災(zāi)備中心對核心生產(chǎn)系統(tǒng)的數(shù)據(jù)進行實時或準實時復(fù)制,同時建立一套業(yè)務(wù)系統(tǒng)的運行環(huán)境。在生產(chǎn)中心發(fā)生故障或受損后,在保證在備份中心數(shù)據(jù)的完整性的基礎(chǔ)之上,利用災(zāi)備側(cè)業(yè)務(wù)系統(tǒng)將生產(chǎn)業(yè)務(wù)迅速切換到災(zāi)備系統(tǒng),恢復(fù)生產(chǎn)業(yè)務(wù)的繼續(xù)運行。
一、災(zāi)備中心架構(gòu)模式
災(zāi)備中心建設(shè)前,需要先根據(jù)生產(chǎn)中心和災(zāi)備中心承擔的業(yè)務(wù)情況進行分類,確定其災(zāi)備的架構(gòu)模式,目前主要分為主備中心、雙中心互備、讀寫分離雙活,讀寫并行雙活四類。
主備中心模式:生產(chǎn)中心承擔生產(chǎn)業(yè)務(wù),災(zāi)備中心主要承擔容災(zāi)功能,生產(chǎn)中心與災(zāi)備中心為主備關(guān)系。在這種方式下災(zāi)備中心也有可能承擔輔助生產(chǎn)業(yè)務(wù),如:承擔軟件開發(fā)、性能測試、個性化統(tǒng)計或臨時的統(tǒng)計分析功能,但要注意不能影響容災(zāi)的功能。
雙中心互備模式:生產(chǎn)中心和災(zāi)備中心均承擔生產(chǎn)業(yè)務(wù),兩個中心互為災(zāi)備,負荷分擔,具體業(yè)務(wù)可按照系統(tǒng)功能域或地域劃分,中心間基本對等。該模式在提供容災(zāi)功能的基礎(chǔ)上,提高了資源的利用率,但也使容災(zāi)實現(xiàn)技術(shù)復(fù)雜化,實施及維護成本均加大,人員能力也隨之增加,投資規(guī)模較主備模式也有一定上升。
讀寫分離雙活模式:兩個中心同時承擔生產(chǎn)業(yè)務(wù),中心間能力基本對等,應(yīng)用層都承擔對外服務(wù),在數(shù)據(jù)層,其中一端承載讀寫業(yè)務(wù),另外一端承載只讀業(yè)務(wù)。一個中心平時承載讀寫類的生產(chǎn)業(yè)務(wù),另一個中心平時為只讀,當其中一個中心出現(xiàn)故障后將數(shù)據(jù)層讀寫角色轉(zhuǎn)換,再通過接入層的全局負載均衡機制或按照DNS進行應(yīng)用指向切換即可,該模式對應(yīng)用及數(shù)據(jù)一致性有一定要求。
讀寫并行雙活模式:兩個中心同時承擔生產(chǎn)業(yè)務(wù),中心間能力基本對等,應(yīng)用層都承擔對外服務(wù),在數(shù)據(jù)層兩端同時承載讀寫業(yè)務(wù),對應(yīng)用透明任何一個中心出現(xiàn)故障,另外一個中心自動接管業(yè)務(wù),無須切換過程。中心間業(yè)務(wù)接入可根據(jù)前端的全局負載均衡機制或按照DNS將不同業(yè)務(wù)區(qū)的業(yè)務(wù)接入到不同中心。
從上述四個架構(gòu)中來看,讀寫并行雙活模式大幅提升了資源利用率,不但使應(yīng)用層全部實現(xiàn)生產(chǎn)功能,而且使數(shù)據(jù)層實現(xiàn)日??梢宰x寫訪問,結(jié)合應(yīng)用部署改造,可實現(xiàn)災(zāi)難情況下快速自動切換,實現(xiàn)無縫接管。但由于基于跨中心模式,具體技術(shù)實現(xiàn)比較復(fù)雜,對中心間距離、時延、傳輸帶寬、傳輸鏈路的穩(wěn)定性相比其他方式帶來更高的要求,且由于架構(gòu)的特性可能出現(xiàn)“腦裂”的情況,降低整個系統(tǒng)的穩(wěn)定性,因此可以根據(jù)局房地址,投資情況,人員能力等實際情況進行選擇。
二、切換技術(shù)分析
災(zāi)備中心的建設(shè),最主要考慮的兩個指標就是RTO(恢復(fù)時間目標)和RPO(恢復(fù)點目標),RTO(恢復(fù)時間目標)指標主要通過切換技術(shù)實現(xiàn),RPO(恢復(fù)點目標)指標主要通過數(shù)據(jù)同步復(fù)制技術(shù)實現(xiàn)。
目前,通常的切換技術(shù)主要有以下幾種:
DNS:采用DNS域名切換技術(shù),所有的應(yīng)用需根據(jù)域名來訪問,而不是直接根據(jù)主機的IP地址來訪問??赏ㄟ^修改域名服務(wù)器上配置來進行切換。
LDAP:采用LDAP(輕量目錄訪問協(xié)議)技術(shù),所有的應(yīng)用只需配置一個簡單的LDAP連接串,之后通過LDAP服務(wù)器來解析數(shù)據(jù)庫的實際連接串(含IP,SID或SERVICE等配置信息)。可通過修改LDAP服務(wù)器中的配置來進行切換。
TNS配置文件:通過在客戶端主機上設(shè)置一個TNS配置文件,應(yīng)用程序通過TNS配置文件中來獲得數(shù)據(jù)庫的相關(guān)信息,并以此來連接數(shù)據(jù)庫。可通過修改該配置文件來進行切換。
L4/7 SWITCH:將L4交換機放置在客戶端的出口處,對于客戶端來說,訪問的始終是一個虛擬地址,這個虛擬地址由L4交換機進行判斷解析,始終將之映射到現(xiàn)在正常工作的數(shù)據(jù)庫上??赏ㄟ^修改L4交換機的配置來進行切換。
上述四種切換技術(shù)中,DNS、LDAP比較突出,其中DNS具有簡單,快速,費用低的優(yōu)點;LDAP具有簡單,快速,費用較低的優(yōu)點,此外還能修改連接串的具體內(nèi)容。因此通常建議主要考慮采用這兩種切換方式。
三、同步技術(shù)分析
容災(zāi)數(shù)據(jù)同步技術(shù)則主要分為如下幾種:
數(shù)據(jù)庫層復(fù)制:復(fù)制的粒度是數(shù)據(jù)庫內(nèi)數(shù)據(jù)操縱動作,復(fù)制的范圍為單個數(shù)據(jù)庫。在對數(shù)據(jù)操縱動作的執(zhí)行過程中,將一組整體完成的動作集合作為交易記錄來進行管理,可利用數(shù)據(jù)庫本身的重做日志記錄交易的變更情況,利用歸檔日志定期將聯(lián)機日志進行切割、保留。其同步方式為同時傳輸重做日志(如DSG)和歸檔日志(如dataguard),最終兩側(cè)數(shù)據(jù)庫中已提交執(zhí)行的事物一致性。
存儲底層復(fù)制:基于存儲鏡像復(fù)制技術(shù)的災(zāi)備方案的核心是利用存儲陣列自身的盤陣對盤陣的數(shù)據(jù)塊復(fù)制技術(shù)實現(xiàn)對生產(chǎn)數(shù)據(jù)的遠程拷貝,從而實現(xiàn)生產(chǎn)數(shù)據(jù)的容災(zāi)保護。在主數(shù)據(jù)中心發(fā)生故障時,可以利用災(zāi)備中心的數(shù)據(jù)在災(zāi)備中心建立業(yè)務(wù)運行環(huán)境,為業(yè)務(wù)繼續(xù)運營提供IT支持。同時,也可以利用災(zāi)備中心的數(shù)據(jù)恢復(fù)主數(shù)據(jù)中心的業(yè)務(wù)系統(tǒng),從而能夠讓業(yè)務(wù)運營快速回復(fù)到災(zāi)難發(fā)生前的正常運營狀態(tài)。如:IBM PPRC,EMC SRDF
操作系統(tǒng)卷復(fù)制:基于操作系統(tǒng)卷復(fù)制技術(shù)工作在主機的卷管理器這一層,通過磁盤卷的鏡像或復(fù)制,實現(xiàn)數(shù)據(jù)的容災(zāi)。通常通過安裝卷管理軟件來實現(xiàn),遠程復(fù)制控制管理軟件將主用節(jié)點系統(tǒng)的卷上每次I/O的操作數(shù)據(jù)實時或準實時復(fù)制到遠程節(jié)點的相應(yīng)卷上,實現(xiàn)遠程兩個卷之間的數(shù)據(jù)同步或準同步。主、備節(jié)點之間需要相應(yīng)帶寬的IP通道。如:Symantec VVR
遠程擴展集群技術(shù):通過數(shù)據(jù)庫擴展集群技術(shù)結(jié)合邏輯卷鏡像技術(shù),將生產(chǎn)、災(zāi)備兩地的磁盤遠程鏡像后生成邏輯卷,將IO的讀寫同時應(yīng)用在兩地的磁盤陣列上,實現(xiàn)雙中心磁陣的實時同步;再通過數(shù)據(jù)庫的遠程擴展集群技術(shù),在兩側(cè)機房分別搭建出數(shù)據(jù)庫節(jié)點,形成兩地的數(shù)據(jù)庫集群。最終實現(xiàn)底層存儲數(shù)據(jù)實時同步,兩地數(shù)據(jù)庫同時打開,對外提供服務(wù)。如:VERITAS SF + ORACLE Extend RAC。
基于歸檔文件的數(shù)據(jù)庫層復(fù)制技術(shù)的主要優(yōu)點:能和生產(chǎn)庫保持物理上完全一致,且實現(xiàn)相對簡單,主要缺點是,災(zāi)備側(cè)數(shù)據(jù)庫無法打開。
基于重做日志的數(shù)據(jù)庫層復(fù)制技術(shù)的主要優(yōu)點:能將災(zāi)備端的數(shù)據(jù)庫打開,實現(xiàn)雙中心雙活。主要缺點是:邏輯一致,兩側(cè)執(zhí)行計劃可能不一致。
存儲底層復(fù)制技術(shù)的主要優(yōu)點:兩側(cè)完全一致,數(shù)據(jù)丟失為零,部署簡單。主要缺點是:災(zāi)備端數(shù)據(jù)庫無法打開;設(shè)備及投資費用較高。
操作系統(tǒng)卷復(fù)制技術(shù)的主要優(yōu)點:投資少;兼容不同品牌。主要缺點是:對生產(chǎn)環(huán)境的性能有一定影響。
遠程擴展集群技術(shù)的主要優(yōu)點:能將兩側(cè)數(shù)據(jù)庫同時打開實現(xiàn)雙活,切換速度快。主要缺點是:網(wǎng)絡(luò)要求極高,部署復(fù)雜維護困難。
四、總結(jié)
企業(yè)級災(zāi)備中心的建設(shè)及技術(shù)類型有多種組合可以選擇,具體實施時還需根據(jù)公司的運營情況,業(yè)務(wù)特點,對外影響,預(yù)算情況等進行綜合評估后。比如:企業(yè)業(yè)務(wù)復(fù)雜,對外敏感,無法接受數(shù)據(jù)丟失的選擇“雙中心互備模式+DNS+存儲底層復(fù)制”;企業(yè)業(yè)務(wù)簡單,但不允許中斷的選擇“讀寫并行雙活模式+LDAP+遠程擴展集群技術(shù)”。