文/梁藝軍
中國(guó)人民大學(xué):異地容災(zāi)保護(hù)99%的校園資源
文/梁藝軍
數(shù)據(jù)一直是學(xué)校信息化建設(shè)的核心資源,但是經(jīng)常受到各種因素的影響:從最初的計(jì)算機(jī)病毒到網(wǎng)絡(luò)病毒,從人為的操作錯(cuò)誤到系統(tǒng)軟件或應(yīng)用軟件的缺陷、硬件的損毀,任何一種意外都有可能造成數(shù)據(jù)的丟失。一旦發(fā)生數(shù)字丟失的故障,尤其是作為數(shù)字校園基礎(chǔ)的數(shù)據(jù)丟失,將產(chǎn)生災(zāi)難性后果。因此,信息化越深入,如何保證在災(zāi)難發(fā)生后學(xué)校的數(shù)據(jù)信息仍然能夠得以保全、業(yè)務(wù)得以繼續(xù)的問(wèn)題,就越應(yīng)該得到重視和加強(qiáng)。而中國(guó)人民大學(xué)建立的校園異地容災(zāi)系統(tǒng)則為數(shù)據(jù)提供了重要的保護(hù)手段。
校園異地容災(zāi)系統(tǒng),是指為了保證關(guān)鍵業(yè)務(wù)和應(yīng)用,在出現(xiàn)災(zāi)難情況時(shí),能夠?qū)ο到y(tǒng)和應(yīng)用進(jìn)行有效恢復(fù),以降低風(fēng)險(xiǎn)和損失而建立的系統(tǒng)。
學(xué)校異地容災(zāi)系統(tǒng)建立在數(shù)據(jù)中心機(jī)房以外的場(chǎng)所,并且完成針對(duì)多點(diǎn)(校內(nèi)有多個(gè)數(shù)據(jù)產(chǎn)生點(diǎn))數(shù)據(jù)的復(fù)制,從而有效避免人為因素、自然災(zāi)害、供電問(wèn)題、病毒等各方面的破壞,確保信息資源的安全。
我們一般對(duì)以下幾種數(shù)據(jù)進(jìn)行復(fù)制。
核心應(yīng)用系統(tǒng)的數(shù)據(jù)
校園電子校務(wù)和校園卡等核心應(yīng)用系統(tǒng)日益成為學(xué)校日常工作的基礎(chǔ),針對(duì)它們的容災(zāi)手段一般是采用數(shù)據(jù)不間斷復(fù)制技術(shù)(CDP,Continuous Data Protection)來(lái)完成實(shí)時(shí)的異地鏡像,同時(shí)在容災(zāi)中心完成小環(huán)境的搭建,在原系統(tǒng)出現(xiàn)嚴(yán)重故障時(shí)可平滑過(guò)渡到容災(zāi)中心運(yùn)行。
教學(xué)科研環(huán)境的數(shù)據(jù)
對(duì)于教學(xué)輔助系統(tǒng)(比如很多學(xué)校使用的BlackBoard教學(xué)平臺(tái))、學(xué)校主頁(yè)等重要的數(shù)據(jù)可按策略完成數(shù)據(jù)級(jí)容災(zāi)(也可成為異地災(zāi)備系統(tǒng)),以保障數(shù)據(jù)的整體安全。
第三方系統(tǒng)和桌面系統(tǒng)的數(shù)據(jù)
第三方系統(tǒng)指的是種類繁多的各院系具體應(yīng)用系統(tǒng),對(duì)其可進(jìn)行數(shù)據(jù)容災(zāi)(災(zāi)備)保護(hù)。
桌面系統(tǒng)包括:1.校領(lǐng)導(dǎo)、部處院領(lǐng)導(dǎo)等各級(jí)管理者的行政辦公計(jì)算機(jī);2.專家、教授、講師在教學(xué)和科研中所使用的計(jì)算機(jī);3.重要課題組的計(jì)算機(jī);4.普通辦公計(jì)算機(jī)。這些終端產(chǎn)生的數(shù)據(jù)每天都會(huì)更改,有些數(shù)據(jù)非常重要,需要及時(shí)方便地備份。
校園異地容災(zāi)備份系統(tǒng)用到了多種技術(shù),如SAN或NAS技術(shù)、遠(yuǎn)程鏡像技術(shù)、虛擬存儲(chǔ)、基于IP的SAN的互連技術(shù)、快照技術(shù)、CDP技術(shù)等。
遠(yuǎn)程鏡像技術(shù)遠(yuǎn)程鏡像技術(shù)是在主數(shù)據(jù)中心和備援中心之間的數(shù)據(jù)備份時(shí)使用。鏡像是在兩個(gè)或多個(gè)磁盤或磁盤子系統(tǒng)上產(chǎn)生同一個(gè)數(shù)據(jù)鏡像視圖的信息存儲(chǔ)過(guò)程,一個(gè)叫主鏡像系統(tǒng),另一個(gè)叫從鏡像系統(tǒng)。按主從鏡像存儲(chǔ)系統(tǒng)所處的位置可分為本地鏡像和遠(yuǎn)程鏡像(本文主要介紹遠(yuǎn)程鏡像)。遠(yuǎn)程鏡像又叫遠(yuǎn)程復(fù)制,是容災(zāi)備份的核心技術(shù),同時(shí)也是保持遠(yuǎn)程數(shù)據(jù)同步和實(shí)現(xiàn)災(zāi)難恢復(fù)的基礎(chǔ)。遠(yuǎn)程鏡像按請(qǐng)求鏡像的主機(jī)是否需要遠(yuǎn)程鏡像站點(diǎn)的確認(rèn)信息,
又可分為同步遠(yuǎn)程鏡像和異步遠(yuǎn)程鏡像。
同步遠(yuǎn)程鏡像(同步復(fù)制技術(shù))是指通過(guò)遠(yuǎn)程鏡像軟件,將本地?cái)?shù)據(jù)以完全同步的方式復(fù)制到異地,每一個(gè)本地的I/O事務(wù)均需等待遠(yuǎn)程復(fù)制的完成確認(rèn)的信息,方予以釋放。同步鏡像使遠(yuǎn)程拷貝總能與本地機(jī)要求復(fù)制的內(nèi)容相匹配。當(dāng)主站點(diǎn)出現(xiàn)故障時(shí),用戶的應(yīng)用程序切換到備份的替代站點(diǎn)后,被鏡像的遠(yuǎn)程副本可以保證業(yè)務(wù)繼續(xù)執(zhí)行而沒(méi)有丟失數(shù)據(jù)。但它存在往返傳播延時(shí)較長(zhǎng)的缺點(diǎn),所以,只限于在相對(duì)較近的距離上應(yīng)用。
異步遠(yuǎn)程鏡像(異步復(fù)制技術(shù))保證在更新遠(yuǎn)程存儲(chǔ)視圖前完成向本地存儲(chǔ)系統(tǒng)的基本I/O操作,而由本地存儲(chǔ)系統(tǒng)提供給請(qǐng)求鏡像主機(jī)I/O操作完成的確認(rèn)信息。遠(yuǎn)程的數(shù)據(jù)復(fù)制是以后臺(tái)同步的方式進(jìn)行的,這使本地系統(tǒng)性能受到的影響很小,傳輸距離長(zhǎng)(可達(dá)1000公里以上),對(duì)網(wǎng)絡(luò)帶寬要求小。但是,許多遠(yuǎn)程的從屬存儲(chǔ)子系統(tǒng)的“寫”沒(méi)有得到確認(rèn),所以,當(dāng)某種因素造成數(shù)據(jù)傳輸失敗時(shí),可能出現(xiàn)數(shù)據(jù)一致性問(wèn)題。為了解決這個(gè)問(wèn)題,目前大多采用延遲復(fù)制的技術(shù),即在確保本地?cái)?shù)據(jù)完好無(wú)損后進(jìn)行遠(yuǎn)程數(shù)據(jù)更新。
快照技術(shù)
遠(yuǎn)程鏡像技術(shù)往往同快照技術(shù)結(jié)合起來(lái)實(shí)現(xiàn)遠(yuǎn)程備份,即通過(guò)鏡像把數(shù)據(jù)備份到遠(yuǎn)程存儲(chǔ)系統(tǒng)中,再用快照技術(shù)把遠(yuǎn)程存儲(chǔ)系統(tǒng)中的信息備份到遠(yuǎn)程。
對(duì)人為或者無(wú)法抗拒的災(zāi)難,提供恢復(fù)機(jī)制,將引發(fā)的損失降低到可接受的程度
快照技術(shù)是通過(guò)軟件對(duì)需要備份的磁盤子系統(tǒng)的數(shù)據(jù)快速掃描,為備份數(shù)據(jù)建立快照邏輯單元號(hào)和快照。在快速掃描時(shí),把備份過(guò)程中即將要修改的數(shù)據(jù)塊同時(shí)快速拷貝到快照中??煺者壿媶卧?hào)是一組指針,它指向快照和磁盤子系統(tǒng)中不變的數(shù)據(jù)塊(在備份過(guò)程中)。在正常業(yè)務(wù)進(jìn)行的同時(shí),用邏輯單元號(hào)對(duì)原數(shù)據(jù)實(shí)現(xiàn)完全備份。它可使用戶在正常業(yè)務(wù)不受影響的情況下,實(shí)時(shí)提取當(dāng)前在線業(yè)務(wù)數(shù)據(jù),其“備份窗口”接近于零,可大大增加系統(tǒng)業(yè)務(wù)的連續(xù)性,為實(shí)現(xiàn)系統(tǒng)真正的7×24運(yùn)轉(zhuǎn)提供了保證。
互連技術(shù)
早期的主數(shù)據(jù)中心和備援?dāng)?shù)據(jù)中心之間的數(shù)據(jù)備份,主要是基于SAN的遠(yuǎn)程復(fù)制,即通過(guò)光纖通道,把兩個(gè)SAN連接起來(lái),進(jìn)行遠(yuǎn)程鏡像(復(fù)制)。當(dāng)災(zāi)難發(fā)生時(shí),由備援?dāng)?shù)據(jù)中心替代主數(shù)據(jù)中心來(lái)保證系統(tǒng)工作的連續(xù)性。這種遠(yuǎn)程容災(zāi)備份方式存在一些缺陷,如:實(shí)現(xiàn)成本高、設(shè)備的互操作性差、跨越的地理距離短(10公里)等,這些因素阻礙了它的進(jìn)一步推廣和應(yīng)用。
目前,出現(xiàn)了多種基于IP的SAN的遠(yuǎn)程數(shù)據(jù)容災(zāi)備份技術(shù)。它們利用基于IP的SAN的互連協(xié)議,將主數(shù)據(jù)中心SAN中的信息通過(guò)現(xiàn)有的TCP/IP網(wǎng)絡(luò),遠(yuǎn)程復(fù)制到備援中心SAN中。當(dāng)備援中心存儲(chǔ)的數(shù)據(jù)量過(guò)大時(shí),可利用快照技術(shù)將其備份到磁帶庫(kù)或光盤庫(kù)中。這種基于IP的SAN的遠(yuǎn)程容災(zāi)備份,可以跨越LAN、MAN和WAN,成本低、可擴(kuò)展性好,具有廣闊的發(fā)展前景?;贗P的互連協(xié)議包括:FCIP、iFCP、Infiniband、iSCSI等。
虛擬存儲(chǔ)
異地容災(zāi)系統(tǒng)還采取了虛擬存儲(chǔ)技術(shù),虛擬化存儲(chǔ)技術(shù)在系統(tǒng)彈性和可擴(kuò)展性上開(kāi)創(chuàng)了新的局面。它將幾個(gè)IDE或SCSI驅(qū)動(dòng)器等不同的存儲(chǔ)設(shè)備串聯(lián)為一個(gè)存儲(chǔ)池。存儲(chǔ)集群的整個(gè)存儲(chǔ)容量可以分為多個(gè)邏輯卷,并作為虛擬分區(qū)進(jìn)行管理。
虛擬存儲(chǔ)系統(tǒng)還提供了動(dòng)態(tài)改變邏輯卷大小的功能。事實(shí)上,存儲(chǔ)卷的容量可以在線隨意增加或減少,可以通過(guò)在系統(tǒng)中增加或減少物理磁盤的數(shù)量來(lái)改變集群中邏輯卷的大小。這一功能允許卷的容量隨用戶的即時(shí)要求動(dòng)態(tài)改變。另外,存儲(chǔ)卷能夠很容易地改變?nèi)萘俊⒁苿?dòng)和替換。安裝系統(tǒng)時(shí),我們只需根據(jù)業(yè)務(wù)初始需要,為每個(gè)邏輯卷分配最小的空間。隨著業(yè)務(wù)的發(fā)展,我們可以用剩余空間根據(jù)需要擴(kuò)展邏輯卷,也可以將數(shù)據(jù)在線從舊驅(qū)動(dòng)器轉(zhuǎn)移到新的驅(qū)動(dòng)器上,而不中斷服務(wù)的運(yùn)行。
存儲(chǔ)虛擬化的一個(gè)關(guān)鍵優(yōu)勢(shì)是它允許異構(gòu)系統(tǒng)和應(yīng)用程序共享存儲(chǔ)設(shè)備,而不管它們位于何處。
CDP技術(shù)
CDP稱作連續(xù)數(shù)據(jù)保護(hù)。不同于傳統(tǒng)數(shù)據(jù)保護(hù)解決方案的關(guān)注點(diǎn)是定期的數(shù)據(jù)備份,CDP將注意力從備份轉(zhuǎn)向了恢復(fù)。
連續(xù)數(shù)據(jù)保護(hù)是數(shù)據(jù)保護(hù)領(lǐng)域的一項(xiàng)重大突破。在過(guò)去,各種數(shù)據(jù)保護(hù)解決方案都將主要精力放在定期的數(shù)據(jù)備份上。但是,在定期備份狀態(tài)下卻又會(huì)產(chǎn)生如備份時(shí)間窗口、打開(kāi)的文件及數(shù)據(jù)庫(kù)的保護(hù)以及備份操作過(guò)程對(duì)業(yè)務(wù)系統(tǒng)的影響等問(wèn)題。今天,CDP已經(jīng)使數(shù)據(jù)保護(hù)全面改觀,并且將注意力的焦點(diǎn)從備份轉(zhuǎn)向了恢復(fù)。 CDP可以為重要數(shù)據(jù)中的變化提供連續(xù)的保護(hù),IT管理員根本不需要考慮備份的問(wèn)題。當(dāng)災(zāi)難發(fā)生時(shí),基于CDP的解決方案可以迅速恢復(fù)到任何一個(gè)需要的還原點(diǎn),從而為用戶提供更大的靈活性和更高的性能。
與傳統(tǒng)的數(shù)據(jù)保護(hù)解決方案相比,CDP可以提供更靈活的目標(biāo)恢復(fù)點(diǎn)(Recovery Point Objectives , RPO)和更快的目標(biāo)恢復(fù)時(shí)間(Recovery Time Objectives , RTO),而傳統(tǒng)的方式只能創(chuàng)建、管理和恢復(fù)單個(gè)時(shí)間點(diǎn)的數(shù)據(jù)備份。相比之下,CDP可以捕獲和保護(hù)數(shù)據(jù)中所有的變化,而不僅僅是某個(gè)預(yù)先選定的時(shí)間點(diǎn)。這樣就可以隨時(shí)訪問(wèn)數(shù)據(jù),減少數(shù)據(jù)損失并消除代價(jià)高昂的停機(jī)損失。數(shù)據(jù)的檢索也變得非??煽俊⒖焖俸途?xì)。
CDP技術(shù)能減少?gòu)臑?zāi)難發(fā)生到數(shù)據(jù)恢復(fù)所需要的時(shí)間,滿足系統(tǒng)可靠性需達(dá)到99.999%的要求。
我們?cè)谶x擇和組合以上技術(shù)方案時(shí)主要依據(jù)以下幾個(gè)因素:1.業(yè)務(wù)對(duì)RPO和RTO的要求;
2.對(duì)數(shù)據(jù)庫(kù)數(shù)據(jù)、文檔數(shù)據(jù)、程序代碼、桌面文件的容災(zāi)要求;
3.存儲(chǔ)的異構(gòu)性;
4.傳輸距離和可用帶寬;
5.服務(wù)器防護(hù)和系統(tǒng)資源的獨(dú)占性。
校園異地容災(zāi)系統(tǒng)根據(jù)情況,綜合應(yīng)用上述技術(shù),完成備份系統(tǒng)所不能完成的功能,在存儲(chǔ)故障、邏輯錯(cuò)誤、人為錯(cuò)誤、惡意刪除、災(zāi)難發(fā)生后對(duì)系統(tǒng)進(jìn)行恢復(fù),保證學(xué)校關(guān)鍵數(shù)據(jù)的安全,為學(xué)校數(shù)據(jù)資源的再加工分析和決策提供支持,同時(shí),為全校提供統(tǒng)一的數(shù)據(jù)保護(hù),避免了各自為政分別建立容災(zāi)系統(tǒng)的情況,使學(xué)校的人力和資金的投入至少降至1/5。
(作者單位為中國(guó)人民大學(xué)網(wǎng)絡(luò)與教育技術(shù)中心)