李瑞軍 呂江 智霆
摘 要:近年來(lái),隨著大數(shù)據(jù)、云計(jì)算等新興技術(shù)的飛速發(fā)展,各類信息系統(tǒng)對(duì)于基礎(chǔ)設(shè)施環(huán)境的依賴和要求越來(lái)越高。在此趨勢(shì)下,國(guó)內(nèi)電子信息機(jī)房的建設(shè)規(guī)模和建設(shè)速度顯著增加,各類型與規(guī)模的數(shù)據(jù)中心不斷投入使用,因而通過(guò)對(duì)數(shù)據(jù)中心的運(yùn)維體系與管理模式進(jìn)行仔細(xì)研究,規(guī)劃設(shè)計(jì)出合理可靠運(yùn)維管理系統(tǒng)與運(yùn)維體系框架,保障數(shù)據(jù)中心長(zhǎng)期運(yùn)行的安全與穩(wěn)定,具有重要的現(xiàn)實(shí)意義。
關(guān)鍵詞:數(shù)據(jù)中心 運(yùn)維 管理系統(tǒng) 架構(gòu) 設(shè)計(jì)
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2015)03(c)-0010-01
1 數(shù)據(jù)中心及其運(yùn)維管理系統(tǒng)現(xiàn)狀
自從1946年世界上第一臺(tái)電子計(jì)算機(jī)誕生之日開(kāi)始,計(jì)算機(jī)機(jī)房伴隨計(jì)算機(jī)的發(fā)展已走過(guò)近70年的歷程,從最初以計(jì)算為核心,逐步轉(zhuǎn)變發(fā)展為計(jì)算、傳輸和存儲(chǔ)全面發(fā)展,名稱也逐步轉(zhuǎn)變?yōu)閿?shù)據(jù)中心。數(shù)據(jù)中心全生命周期從始至終分為五部分,分別是:需求分析、規(guī)劃設(shè)計(jì)、施工安裝、檢測(cè)驗(yàn)收與運(yùn)維管理。其中運(yùn)維管理作為數(shù)據(jù)中心生命周期的末端,歷時(shí)最長(zhǎng),其周期從交付使用開(kāi)始,直至數(shù)據(jù)中心結(jié)束使用。從整體上,數(shù)據(jù)中心三成在建設(shè),七成靠管理,通過(guò)科學(xué)管理,可以為業(yè)務(wù)提供信息系統(tǒng)服務(wù)、收回投資,達(dá)到預(yù)期目標(biāo)。近年來(lái),隨著大數(shù)據(jù)、云計(jì)算、互聯(lián)網(wǎng)等新興技術(shù)的飛速發(fā)張,我國(guó)數(shù)據(jù)中心建設(shè)的步伐也在逐步加快,拒不完全統(tǒng)計(jì),目前國(guó)內(nèi)在建和已建成的各類電子信息系統(tǒng)機(jī)房或數(shù)據(jù)中心已有幾十萬(wàn)個(gè)。
2 數(shù)據(jù)中心運(yùn)維管理系統(tǒng)匹配設(shè)計(jì)的基本原則
規(guī)模、可用性等級(jí)、類別,分別是系統(tǒng)與數(shù)據(jù)中心的匹配設(shè)計(jì)的組成部分。
第一,數(shù)據(jù)中心基礎(chǔ)設(shè)施的可用性等級(jí)的應(yīng)與系統(tǒng)可用性設(shè)計(jì)相一致,在確立數(shù)據(jù)中心基礎(chǔ)設(shè)施的可用性等級(jí)的基礎(chǔ)上,運(yùn)維管理系統(tǒng)的可用性設(shè)計(jì)等級(jí)應(yīng)該與之匹配或提高。同一個(gè)數(shù)據(jù)中心中,如不同業(yè)務(wù)機(jī)房重要性有區(qū)別,則應(yīng)區(qū)別設(shè)計(jì)可用性,并與之匹配等級(jí)相符的運(yùn)維管理系統(tǒng)。第二,數(shù)據(jù)中心系統(tǒng)設(shè)計(jì)與數(shù)據(jù)中心類別相關(guān),且功能與架構(gòu)等方面都要進(jìn)行相應(yīng)的設(shè)計(jì)與匹配。因此,EDC與IDC的管理功能模塊與系統(tǒng)設(shè)計(jì)就會(huì)產(chǎn)生相應(yīng)的區(qū)分,這是由于兩者的核心和管理重點(diǎn)的不同所導(dǎo)致。第三,運(yùn)維管理系統(tǒng)的設(shè)計(jì)方案取決于數(shù)據(jù)中心的設(shè)計(jì)規(guī)模。運(yùn)維系統(tǒng)的處理能力、運(yùn)維監(jiān)控點(diǎn)、運(yùn)維壓力這三項(xiàng)指標(biāo)會(huì)隨著數(shù)據(jù)中心規(guī)模的增大而增大。因此,總控中心系統(tǒng)已經(jīng)成為大中型數(shù)據(jù)中心的標(biāo)準(zhǔn)配備,而對(duì)于小型機(jī)房則只需要實(shí)現(xiàn)基本信息采集監(jiān)控功能即可。
3 數(shù)據(jù)中心運(yùn)維管理系統(tǒng)架構(gòu)設(shè)計(jì)與具體功能
數(shù)據(jù)中心組織管理架構(gòu)與運(yùn)維管理系統(tǒng)的架構(gòu)設(shè)計(jì)應(yīng)該具備一致性,以便充分發(fā)揮運(yùn)維管理系統(tǒng)的信息化工具功能。為了使工作人員履行職能,在系統(tǒng)功能設(shè)計(jì)時(shí)必須全面周到,滿足管理、維護(hù)、監(jiān)控及其他操作的需要。數(shù)據(jù)中心運(yùn)維管理系統(tǒng)設(shè)計(jì)技術(shù)點(diǎn)較多,包括網(wǎng)絡(luò)通信技術(shù)、傳感技術(shù)、數(shù)據(jù)庫(kù)技術(shù)、工業(yè)自動(dòng)控制技術(shù)、計(jì)算機(jī)軟件技術(shù)等,該系統(tǒng)通過(guò)采集、分析、處理等操作,及時(shí)跟蹤各種非智能和智能系統(tǒng)及設(shè)備的信息參數(shù),獲取運(yùn)行狀態(tài),從而實(shí)現(xiàn)全面監(jiān)控?cái)?shù)據(jù)中心基礎(chǔ)設(shè)施的目的。通過(guò)實(shí)時(shí)掌控的數(shù)據(jù)中心運(yùn)行狀態(tài)數(shù)據(jù),通過(guò)對(duì)相關(guān)信息與資源進(jìn)行分析并提供可能的決策建議,可以及時(shí)發(fā)現(xiàn)并處理故障,高效的對(duì)數(shù)據(jù)中心進(jìn)行運(yùn)維,保障數(shù)據(jù)中心的安全性與可用性。數(shù)據(jù)中心運(yùn)維管理系統(tǒng)從功能結(jié)構(gòu)與層次上劃分為四個(gè)部分,分別是監(jiān)控系統(tǒng)、運(yùn)行管理系統(tǒng)、總控中心系統(tǒng)以及基礎(chǔ)服務(wù)系統(tǒng)。
3.1 監(jiān)控系統(tǒng)
監(jiān)控系統(tǒng)由兩大子系統(tǒng)組成,主要完成對(duì)基礎(chǔ)設(shè)施的監(jiān)控工作:(1)信息采集子系統(tǒng)。每個(gè)獨(dú)立的信息采集子系統(tǒng)均響應(yīng)上層信息處理子系統(tǒng)的控制命令,同時(shí)又是下層信息處理子系統(tǒng)的前驅(qū)系統(tǒng),負(fù)責(zé)將標(biāo)準(zhǔn)格式的信息傳輸?shù)较聦有畔⑻幚碜酉到y(tǒng),這些信息主要包括對(duì)安防、環(huán)境、供配電等監(jiān)控對(duì)象的參數(shù)、狀態(tài)、設(shè)備屬性、配置、數(shù)據(jù)等。(2)信息處理子系統(tǒng)。信息處理子系統(tǒng)主要完成信息的匯聚,并作相應(yīng)的處理及存儲(chǔ)。信息處理子系統(tǒng)數(shù)據(jù)來(lái)源于信息采集子系統(tǒng),通過(guò)對(duì)數(shù)據(jù)進(jìn)行處理與加工,按照告警規(guī)則產(chǎn)生新的告警信息,對(duì)告警信息進(jìn)行分類并做過(guò)濾、關(guān)聯(lián)、壓縮操作,實(shí)現(xiàn)故障定位與數(shù)據(jù)中心的一體化監(jiān)控。總控中心系統(tǒng)負(fù)責(zé)收集并顯示重要實(shí)時(shí)監(jiān)控信息,信息處理子系統(tǒng)存儲(chǔ)其他數(shù)據(jù)并形成供運(yùn)行管理系統(tǒng)調(diào)用的歷史資料庫(kù),并輸出統(tǒng)計(jì)分析報(bào)告。
3.2 運(yùn)行管理系統(tǒng)
運(yùn)行管理系統(tǒng)利用一體化監(jiān)控系統(tǒng)匯聚的數(shù)據(jù)加上用戶輸入的一些必要的管理信息,實(shí)現(xiàn)數(shù)據(jù)中心運(yùn)維管理、能耗管理、資產(chǎn)管理、容量管理等,完成數(shù)據(jù)中心運(yùn)行的“故障預(yù)防性管理”、“故障恢復(fù)性管理”及旨在降低運(yùn)維難度與成本,提高工作效率的日常運(yùn)維工作的信息化管理,使數(shù)據(jù)中心在高效運(yùn)轉(zhuǎn)的同時(shí),盡可能不發(fā)生故障或少發(fā)生故障,提高數(shù)據(jù)中心可用性,降低運(yùn)行成本。
3.3 總控中心系統(tǒng)
總控中心又稱ECC,包含展示子系統(tǒng)與服務(wù)臺(tái)子系統(tǒng)兩部分。(1)展示子系統(tǒng)。展示子系統(tǒng)提供監(jiān)控系統(tǒng)、總控中心系統(tǒng)、運(yùn)行管理系統(tǒng)的統(tǒng)一門(mén)戶,提供了各種豐富的展示終端,如總控中心大屏幕系統(tǒng)、移動(dòng)監(jiān)控終端系統(tǒng);提供豐富的信息展示方式與技術(shù),如3D虛擬現(xiàn)實(shí),溫度場(chǎng)等方針組態(tài)技術(shù)等;提供豐富的報(bào)警信息輸出方式,如聲光、短信、電話語(yǔ)音等。(2)服務(wù)臺(tái)子系統(tǒng)。運(yùn)維值守與管理人員能通過(guò)服務(wù)臺(tái)的各種通信方式收集記錄用戶使用信息,借助知識(shí)庫(kù),回復(fù)或解決用戶常見(jiàn)問(wèn)題;分發(fā)、跟蹤復(fù)雜、疑難問(wèn)題;通過(guò)監(jiān)控展示信息,分析、發(fā)現(xiàn)異常運(yùn)行情況,移動(dòng)、跟蹤處理流程,回訪服務(wù)結(jié)果。電話呼入型子系統(tǒng)是服務(wù)臺(tái)子系統(tǒng)的重要構(gòu)建,通過(guò)其接聽(tīng)來(lái)電,并對(duì)來(lái)電進(jìn)行自動(dòng)分配,記錄和存儲(chǔ)所有來(lái)話信息。
3.4 基礎(chǔ)服務(wù)系統(tǒng)
系統(tǒng)日志、統(tǒng)一權(quán)限認(rèn)證、在線幫助、系統(tǒng)管理等都屬于基礎(chǔ)服務(wù)系統(tǒng)提供的功能,是為上層功能構(gòu)件提供的一些公共性基礎(chǔ)服務(wù)。
4 結(jié)語(yǔ)
降低運(yùn)營(yíng)管理成本與提高可用性是數(shù)據(jù)中心管理永恒的主題。通過(guò)數(shù)據(jù)中心運(yùn)維管理系統(tǒng)的建設(shè)與實(shí)施,能夠有效幫助管理者增強(qiáng)數(shù)據(jù)中心可用性、提高運(yùn)維效率并降低運(yùn)維成本。隨著信息技術(shù)的不斷發(fā)展,運(yùn)維管理系統(tǒng)已經(jīng)成為現(xiàn)代數(shù)據(jù)中心必不可少的信息化工具,在數(shù)據(jù)中心的運(yùn)行、維護(hù)、管理等方面,不斷發(fā)揮著越來(lái)越重要的作用。
參考文獻(xiàn)
[1] 魏曉玲.銀行設(shè)備管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].西安電子科技大學(xué),2010.
[2] 敖翔.銀行設(shè)備維護(hù)管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].湖南大學(xué),2008.
[3] 張亮.基于數(shù)據(jù)倉(cāng)庫(kù)的銀行數(shù)據(jù)提取與應(yīng)用研究[D].江西師范大學(xué),2008.