方銳 姚振 郭洋 吳躍
“十三五”以來,隨著國網(wǎng)公司信息化進(jìn)程的不斷深入,在國家電網(wǎng)公司十三五發(fā)展戰(zhàn)略綱要中明確指出,到2020年建成國家電網(wǎng)企業(yè)資源計劃系統(tǒng)3.0(SGERP3.0),實現(xiàn)業(yè)務(wù)活動動態(tài)監(jiān)控與分析優(yōu)化、核心資產(chǎn)集中管理和在線監(jiān)控;進(jìn)一步替身信息存儲、傳輸、集成、共享水平。伴隨國網(wǎng)業(yè)務(wù)流程的運(yùn)轉(zhuǎn)越來越高度依賴于數(shù)據(jù),而數(shù)據(jù)的丟失必然會導(dǎo)致企業(yè)正常業(yè)務(wù)運(yùn)作中斷,僅僅是依靠傳統(tǒng)的災(zāi)難備份/恢復(fù)已經(jīng)滿足不了業(yè)務(wù)的需求,因此如何確保數(shù)據(jù)庫數(shù)據(jù)的快速可恢復(fù)性,顯得十分重要。
國網(wǎng)業(yè)務(wù)流程的運(yùn)轉(zhuǎn)越來越高度依賴于數(shù)據(jù),使得數(shù)據(jù)成為了支撐企業(yè)運(yùn)作的基石。而數(shù)據(jù)的丟失必然會導(dǎo)致企業(yè)正常業(yè)務(wù)運(yùn)作中斷,帶來巨大的經(jīng)濟(jì)損失、聲譽(yù)損失、以及客戶忠誠度下降等各種損失。為了保證企業(yè)24*7連續(xù)運(yùn)營,對企業(yè)的IT建設(shè)提出了新的挑戰(zhàn),僅僅是依靠傳統(tǒng)的災(zāi)難備份/恢復(fù)已經(jīng)滿足不了業(yè)務(wù)的需求。因此,如何集中保護(hù)數(shù)據(jù)庫、確保數(shù)據(jù)庫可恢復(fù)性,顯得尤為重要。
隨著國網(wǎng)信息化進(jìn)程的不斷深入,數(shù)據(jù)已成為非常重要的資產(chǎn),如何確保數(shù)據(jù)庫數(shù)據(jù)準(zhǔn)確、可快速恢復(fù),顯得非常重要。
敏捷數(shù)據(jù)庫仿真平臺是一套集合了True-CDP備份,歷史數(shù)據(jù)秒級恢復(fù),災(zāi)備保護(hù)等功能的一體化云平臺。支持主流的Oracle、MySQL、MariaDB、SQLServer數(shù)據(jù)庫,可同時對大量數(shù)據(jù)庫做集中式備份和管理,并對備份進(jìn)行持續(xù)校驗以確保數(shù)據(jù)的可恢復(fù)性。此外,還可用于應(yīng)用測試、預(yù)發(fā)布、性能優(yōu)化,POC等諸多應(yīng)用場景。
敏捷數(shù)據(jù)庫仿真平臺的設(shè)計從以下幾個方面,提供更加便捷、可視化的管理。
軟件定義備份,智能管理工具:區(qū)別于傳統(tǒng)手工備份,原來DBA需要手設(shè)置備份策略,管理備份集。敏捷數(shù)據(jù)庫仿真平臺采用軟件定義備份,通過軟件整合底層物理資源,在高可用、高性能的物理平臺上,提供靈活的備份管理接口,一鍵式備份恢復(fù)管理,智能的備份策略。
化繁為簡,統(tǒng)一管理:對數(shù)據(jù)庫的備份,需要考慮的因素較多,很多企業(yè)內(nèi)部少則幾十套數(shù)據(jù)庫,備份工作非常繁瑣而且工作量大。敏捷數(shù)據(jù)庫仿真平臺,通過靈活的備份策略實現(xiàn)數(shù)據(jù)庫的自動備份和集中管理,簡化了備份的操作,降低了備份的管理成本。
資源虛擬化,資源分配靈活:通過虛擬化平臺,實現(xiàn)物理資源的靈活分配和安全隔離。如果有新的備份需求,不需要單獨(dú)申請物理機(jī)資源,直接通過管理界面申請需要的資源,即可實現(xiàn)對現(xiàn)有數(shù)據(jù)庫的備份恢復(fù)。
備份可用性保證,實時驗證:如何確保備份的物理文件在關(guān)鍵時刻能夠恢復(fù)可用。敏捷數(shù)據(jù)庫仿真平臺備份恢復(fù)方案,通過構(gòu)建“活”的備份,實現(xiàn)備份數(shù)據(jù)的實時驗證,確保備份數(shù)據(jù)的可用性。
數(shù)據(jù)可追回,歷史狀態(tài)快速回溯:數(shù)據(jù)丟失或者誤刪除在眾多企業(yè)中屢見不鮮,如何找回丟失數(shù)據(jù)。敏捷數(shù)據(jù)庫仿真平臺可實現(xiàn)歷史數(shù)據(jù)的快速找回,通過存儲級別快照和日志應(yīng)用的方式可以實現(xiàn)精確到秒級的歷史時間點(diǎn)恢復(fù)。
如圖1所示,使用數(shù)據(jù)庫日志的增量傳輸來實現(xiàn)數(shù)據(jù)庫的持續(xù)備份。日志的傳輸通Oracle DataGurad/Mysql Replication方式進(jìn)行重做日志的實時傳輸,在保證主庫性能的情況下,盡量實現(xiàn)日志的實時傳輸。
如圖2所示,備份使用zfs文件系統(tǒng),對備份的數(shù)據(jù)進(jìn)行文件系統(tǒng)級別的快照備份,采用 ROW(redirect over write)技術(shù),實現(xiàn)數(shù)據(jù)的增量保存和快照功能。ROW方式的快照,沒有寫放大,對數(shù)據(jù)寫入性能沒有影響,支持大量快照并存,基于切片的快照,快照顆粒度小,空間占用小。
如圖3所示,采用KVM主機(jī)虛擬化技術(shù),對一套硬件資源進(jìn)行統(tǒng)一的管理,為虛擬機(jī)分配內(nèi)存和存儲資源,每一臺虛擬機(jī)用于一套數(shù)據(jù)庫的備份,實現(xiàn)資源的隔離和安全保護(hù)。
如圖4所示,備份節(jié)點(diǎn)自身通過Raid5做磁盤保護(hù),任意壞一塊盤,不影響備份可用性。如果對備份有更高的安全要求,可以采用敏捷數(shù)據(jù)庫仿真平臺,通過zfs Raid Z保證數(shù)據(jù)的可靠性,任意一臺備份節(jié)點(diǎn)意外退出,不影響備份的可用性。
充分考慮備份和恢復(fù)的操作實用性,結(jié)合多名數(shù)據(jù)庫專家的運(yùn)維經(jīng)驗,自主研發(fā)的監(jiān)控管理平臺,可進(jìn)行自動化備份策略管理,降低了備份的難度,減輕了運(yùn)維人員的工作量,加強(qiáng)了對備份的管理和安全可控性,如圖5所示。
一是對數(shù)據(jù)庫進(jìn)行備份,保障數(shù)據(jù)的安全。解決現(xiàn)有備份方式對大數(shù)據(jù)量數(shù)據(jù)庫備份恢復(fù)風(fēng)險大的問題,實現(xiàn)數(shù)據(jù)庫的實時備份。
二是備份環(huán)境可實現(xiàn)歷史回溯,臨時庫拉起操作,用于測試或者臨時庫創(chuàng)建。
三是采用X86化的解決方案,可大幅度降低硬件設(shè)備投入,同時可以實現(xiàn)分布式架構(gòu),在容量不足時可在線橫向擴(kuò)展。
四是備份在生產(chǎn)庫意外宕機(jī)時,可臨時拉起承載業(yè)務(wù),縮短業(yè)務(wù)停機(jī)時間,減少經(jīng)濟(jì)損失。
五是通過統(tǒng)一的可視化管理界面,讓運(yùn)維變的更輕松,智能化運(yùn)維可以有效的減少運(yùn)維人員的投入。
通過敏捷數(shù)據(jù)庫仿真平臺的建設(shè),提高工作效率,減輕信息維護(hù)人員負(fù)擔(dān),為全力支撐公司建設(shè)“三型兩網(wǎng)”世界一流能源互聯(lián)網(wǎng)企業(yè)提供了必要的技術(shù)支撐。
通過敏捷數(shù)據(jù)庫仿真平臺的建設(shè),尋求新的技術(shù)解決方案,支撐經(jīng)營策略、財務(wù)運(yùn)行機(jī)制和集團(tuán)管控模式優(yōu)化。通過優(yōu)化標(biāo)準(zhǔn)、創(chuàng)新技術(shù),支撐新型卓越資金管理體系、電費(fèi)結(jié)算、全面預(yù)算管理、資產(chǎn)全壽命周期管理、工程全過程、全面風(fēng)險管理等財務(wù)業(yè)務(wù)管理優(yōu)化。隨業(yè)務(wù)發(fā)展,持續(xù)支撐多維精益管理體系變革,以一流的財務(wù)管理和經(jīng)營業(yè)績,保障國網(wǎng)三型兩網(wǎng)發(fā)展新戰(zhàn)略的全面實施。
作者單位:國網(wǎng)安徽省電力有限公司信息通信分公司