鐘文基
摘 要:隨著企業(yè)信息化程度的提高,對信息化系統(tǒng)的依賴也越來越大,數(shù)據(jù)安全也顯得至關(guān)重要,作為數(shù)據(jù)和業(yè)務(wù)保護的最后屏障,園區(qū)網(wǎng)的容災(zāi)備份及優(yōu)化建設(shè)迫在眉睫。文章對數(shù)據(jù)中心災(zāi)備系統(tǒng)的建設(shè)及優(yōu)化進行了簡單的分析和研究。
關(guān)鍵詞:園區(qū)網(wǎng);容災(zāi)備份;數(shù)據(jù)安全
隨著信息化程度的加快,園區(qū)網(wǎng)的數(shù)據(jù)安全性和可靠性越來越受到重視,很多企業(yè)都建立了自己的數(shù)據(jù)中心,在中心機房對現(xiàn)有重要業(yè)務(wù)的數(shù)據(jù)和應(yīng)用部署了高可靠服務(wù),確保不會因為本地的軟硬件或系統(tǒng)故障導(dǎo)致應(yīng)用失效或數(shù)據(jù)丟失。但是,本地容災(zāi)方案無法解決因地震、洪水、火災(zāi)等災(zāi)害對系統(tǒng)和數(shù)據(jù)造成的破壞。僅依賴本地數(shù)據(jù)中心的數(shù)據(jù)備份和設(shè)備冗余是不夠的,如果數(shù)據(jù)中心出現(xiàn)區(qū)域性災(zāi)難,將對系統(tǒng)造成的重大影響。據(jù)互聯(lián)網(wǎng)數(shù)據(jù)中心(Internet Data Center, IDC)統(tǒng)計,美國在2000年以前的10年間發(fā)生過災(zāi)難的公司中,有55%當時倒閉,剩下的45%中,因為數(shù)據(jù)丟失,有29%也在兩年內(nèi)倒閉,生存下來的僅占16%。因此應(yīng)該采用本地備份和異地應(yīng)用容災(zāi)相結(jié)合的保護措施,確保數(shù)據(jù)中心即使遭遇整體性故障,容災(zāi)備份中心能在很短的時間內(nèi)恢復(fù)數(shù)據(jù)和接管服務(wù),確保業(yè)務(wù)的整體高可用性。
1 災(zāi)備中心概述
一般意義上,備份指的是本地的數(shù)據(jù)或系統(tǒng)備份,通常指在數(shù)據(jù)中心內(nèi),將全部或部分數(shù)據(jù)從應(yīng)用主機的硬盤或陣列復(fù)制到其他存儲介質(zhì)的過程,備份時是容災(zāi)的基礎(chǔ);容災(zāi)指的是在相隔較遠的異地,建立兩套或多套功能相同的It系統(tǒng),相互進行健康狀態(tài)監(jiān)視和功能切換,當一處系統(tǒng)發(fā)生意外,例如地震、火災(zāi)的時候,整個應(yīng)用系統(tǒng)切換到另一處,保證系統(tǒng)功能的正常運行。要達到真正意義上的災(zāi)備是將容災(zāi)與備份相結(jié)合,本地備份結(jié)合遠程數(shù)據(jù)復(fù)制實現(xiàn)完善的數(shù)據(jù)保護。災(zāi)備中心的關(guān)鍵指標主要有兩個:數(shù)據(jù)恢復(fù)時間點和應(yīng)用恢復(fù)時間,如圖1所示。
數(shù)據(jù)恢復(fù)時間點以數(shù)據(jù)為出發(fā)點,指災(zāi)難發(fā)生后,系統(tǒng)和數(shù)據(jù)必須恢復(fù)到得時間點要求,主要衡量能夠容忍的數(shù)據(jù)丟失量,數(shù)值越小表明丟失的數(shù)據(jù)越少;應(yīng)用恢復(fù)時間主要以應(yīng)用為出發(fā)點,指的是災(zāi)難發(fā)生后,信息系統(tǒng)或業(yè)務(wù)功能從停頓到必須恢復(fù)得時間要求,主要衡量能夠容忍的應(yīng)用系統(tǒng)恢復(fù)時間段,數(shù)值越小表明業(yè)務(wù)中斷時間越小。
2 災(zāi)備系統(tǒng)組成
容災(zāi)中心系統(tǒng)包括網(wǎng)絡(luò)容災(zāi)和應(yīng)用、數(shù)據(jù)的容災(zāi)。
2.1 網(wǎng)絡(luò)容災(zāi)
容災(zāi)機房的建設(shè)要充分考慮系統(tǒng)整體網(wǎng)絡(luò)結(jié)構(gòu)和配置的容錯和容災(zāi)能力,通過采取全面的容災(zāi)部署,來滿足業(yè)務(wù)系統(tǒng)的穩(wěn)定性、有效性及不間斷的需求。通過在數(shù)據(jù)中心配置路由器、交換機、防火墻,能實現(xiàn)在單一鏈路失效的情況下實現(xiàn)備份鏈路的網(wǎng)絡(luò)暢通。
2.2 應(yīng)用、數(shù)據(jù)的容災(zāi)
應(yīng)用、數(shù)據(jù)的容災(zāi)基于磁盤的數(shù)據(jù)復(fù)制技術(shù)來實現(xiàn)。磁盤的數(shù)據(jù)復(fù)制技術(shù)指的是主備系統(tǒng)的磁盤系統(tǒng)通過磁盤鏡像技術(shù)進行數(shù)據(jù)復(fù)制。系統(tǒng)需要把主數(shù)據(jù)中心的數(shù)據(jù)復(fù)制到備份數(shù)據(jù)中心。一般來講,物理級數(shù)據(jù)復(fù)制技術(shù)包括兩種方式:同步方式以及異步方式。
3 災(zāi)備方案設(shè)計
3.1 同城災(zāi)備
對于建筑物災(zāi)難,如建筑物內(nèi)外部火災(zāi)、機房內(nèi)部火災(zāi)、長時間停電、光纜中斷等,采用應(yīng)用級的同城異地容災(zāi)系統(tǒng),是比較理想的防范手段。容災(zāi)備份系統(tǒng)由于生產(chǎn)中心與容災(zāi)中心同在同一城市內(nèi),數(shù)據(jù)復(fù)制的距離不是很遠(在10~30公里之內(nèi)),采用同步數(shù)據(jù)復(fù)制方式,能保證數(shù)據(jù)的零丟失,同時為了保證主要核心業(yè)務(wù)系統(tǒng)能最快的得到接管。容災(zāi)技術(shù)對于業(yè)務(wù)性能的影響也可以降低到最低(5%之內(nèi)),能對業(yè)務(wù)影響程度和數(shù)據(jù)的保護程度達到最佳。
為了確保數(shù)據(jù)中心出現(xiàn)緊急事件(如大面積停電、自然災(zāi)害等)發(fā)生時,確保所有業(yè)務(wù)能第一時間切換到容災(zāi)中心,必須確保數(shù)據(jù)中心和容災(zāi)中心的數(shù)據(jù)實時的同步,而且確保這些數(shù)據(jù)能被容災(zāi)中心的業(yè)務(wù)在很短的時間內(nèi)使用,只有這樣,切換到容災(zāi)中心的客戶端連接才可以正常地處理業(yè)務(wù)。
3.2 異地災(zāi)備
對于區(qū)域性災(zāi)難,機房所在區(qū)域或有緊密聯(lián)系的地區(qū)交通、電信、能源及其他關(guān)鍵基礎(chǔ)設(shè)施遭到嚴重破壞,或大規(guī)模人口疏散的事件發(fā)生,例如地震、大規(guī)模衛(wèi)生事件、恐怖襲擊、電網(wǎng)故障等,異地災(zāi)備是較為理想的選擇。異地災(zāi)備設(shè)計,服務(wù)器之間采用3層互聯(lián),存儲采用同步數(shù)字體系(Synchronous Digital Hierarchy,SDH)專線或 IP/MPLS專線互聯(lián),F(xiàn)C/IP SAN定期遠程復(fù)制數(shù)據(jù),實現(xiàn)廣域網(wǎng)應(yīng)用級容災(zāi),應(yīng)用級保護,如圖2所示。
3.3 災(zāi)備的優(yōu)化
在災(zāi)備的優(yōu)化設(shè)計中,通過高復(fù)制對比技術(shù),基于內(nèi)存時間戳的全增量數(shù)據(jù)復(fù)制技術(shù),大大減少容災(zāi)數(shù)據(jù)量和容災(zāi)間隔時間,采用先進的數(shù)據(jù)壓縮技術(shù),提高壓縮比,提升鏈路傳輸效率。災(zāi)備的設(shè)計優(yōu)化國內(nèi)有不少廠商做得比較好,例如華為,其ALL IN ONE容災(zāi)統(tǒng)一管理,實現(xiàn)生產(chǎn)中心和容災(zāi)中心的統(tǒng)一監(jiān)控管理,使得容災(zāi)管理更簡單高效。
[參考文獻]
[1]鄧裕東.災(zāi)備系統(tǒng)建設(shè)及運維[J].電力信息化,2011(11):44-46.
[2]郭可,王慶福.數(shù)據(jù)中心災(zāi)備系統(tǒng)建設(shè)研究[J].電子測試,2016(15):110,136.
[3]張艷.基于IP-SAN遠程災(zāi)備系統(tǒng)結(jié)構(gòu)研究[J].湖南人文科技學院學報,2011(5):138-141.endprint