何文金, 劉江, 李冬
(國網(wǎng)信通產(chǎn)業(yè)集團(tuán) 安徽繼遠(yuǎn)軟件有限公司, 合肥 230088)
管家式集約化運(yùn)維關(guān)鍵技術(shù)研究
何文金, 劉江, 李冬
(國網(wǎng)信通產(chǎn)業(yè)集團(tuán) 安徽繼遠(yuǎn)軟件有限公司, 合肥 230088)
針對(duì)國網(wǎng)集中式部署運(yùn)維應(yīng)用現(xiàn)狀,以集中式部署信息系統(tǒng)運(yùn)維為研究對(duì)象,通過分析國家電網(wǎng)公司運(yùn)維特點(diǎn)和發(fā)展趨勢,探索優(yōu)化配置運(yùn)維服務(wù)資源,創(chuàng)新運(yùn)維服務(wù)模式,以集約化監(jiān)控、故障預(yù)警、自動(dòng)恢復(fù)為切入點(diǎn),提升服務(wù)質(zhì)量,提高服務(wù)效率和業(yè)務(wù)可靠性,改善用戶體驗(yàn),推進(jìn)運(yùn)維管理集約化和智能化。
集中式部署; 運(yùn)維服務(wù)模式; 服務(wù)質(zhì)量; 用戶體驗(yàn)
隨著公司SG-ERP的建成,信息系統(tǒng)逐步實(shí)現(xiàn)集中部署,信息資源集中化程度更高,系統(tǒng)架構(gòu)更加復(fù)雜,資源配置更加集約,系統(tǒng)承載壓力大幅增加,傳統(tǒng)的運(yùn)維模式與集中部署后的運(yùn)維模式存在較大差異,對(duì)運(yùn)行管理工作提出更高要求。
國網(wǎng)公司信息化的發(fā)展,促使信息系統(tǒng)規(guī)模、服務(wù)用戶數(shù)日益增加,信息系統(tǒng)間集成關(guān)系日趨復(fù)雜。[文獻(xiàn)1]在企業(yè)信息系統(tǒng)運(yùn)維實(shí)踐中,經(jīng)常有業(yè)務(wù)問題找不到故障。主要是當(dāng)前監(jiān)控系統(tǒng)是分離監(jiān)控業(yè)務(wù)系統(tǒng)組成部分的工作狀態(tài)[2]。[文獻(xiàn)3]云計(jì)算技術(shù)逐漸成熟,大規(guī)模集群在企業(yè)部署與應(yīng)用,使企業(yè)IT架構(gòu)越來越復(fù)雜,對(duì)運(yùn)維人員技能的要求越來越高,對(duì)運(yùn)維工作也帶來極大的挑戰(zhàn)和困難。[文獻(xiàn)4]傳統(tǒng)的運(yùn)維模式沿襲了多年前的保守運(yùn)維體系,被動(dòng)式運(yùn)維。[文獻(xiàn)5]傳統(tǒng)手段無法精確定位故障。已無法滿足日益復(fù)雜的IT架構(gòu)運(yùn)維,主要表現(xiàn)在:
一是人員成本偏高。運(yùn)維工作中的操作多為手工作業(yè),不僅重復(fù)性工作量大,而且存在誤操作風(fēng)險(xiǎn),管理難度大,而隨著企業(yè)IT結(jié)構(gòu)的越來越復(fù)雜,又不得不投入更多的人力。
二是自動(dòng)化程度低?,F(xiàn)有模式只有發(fā)生故障或影響業(yè)務(wù)連續(xù)性時(shí)才會(huì)被發(fā)現(xiàn),并非是主動(dòng)預(yù)警、修復(fù),所以IT運(yùn)維往往陷入“救火隊(duì)員”的角色中,故障報(bào)警此起彼伏,惡性連鎖反應(yīng)持續(xù)發(fā)生,還會(huì)導(dǎo)致企業(yè)對(duì)IT運(yùn)維的滿意度大幅降低[5]。
三是隨著計(jì)算、存儲(chǔ)資源的池化,資源利用率提升,以往人工更新、檢測和故障排除的模式,在面臨虛擬化的成千上萬甚至更龐大的資源管理時(shí),將更加困難。[文獻(xiàn)6]云環(huán)境中的主要功能之一是用戶可以要求服務(wù),通常是通過自助服務(wù)門戶實(shí)現(xiàn)的。他們可以從中選擇各種不同類型的服務(wù)。
本文根據(jù)文獻(xiàn)研究成果,引入管家式保姆理念,研究分析國內(nèi)外先進(jìn)的運(yùn)維管理經(jīng)驗(yàn),開展集中部署信息系統(tǒng)運(yùn)維差異性分析,研究設(shè)計(jì)管家式集約化運(yùn)維管理模型,提出管家式運(yùn)維體系。通過管家式運(yùn)維實(shí)現(xiàn)對(duì)系統(tǒng)運(yùn)行狀態(tài)統(tǒng)一集中監(jiān)測與評(píng)估、故障分析與輔助定位、故障自動(dòng)處理、自動(dòng)化巡視巡檢、故障預(yù)警等,開展信息系統(tǒng)集約化監(jiān)控、故障預(yù)警、系統(tǒng)自動(dòng)恢復(fù)技術(shù)及相關(guān)系統(tǒng)研究,以支撐IT服務(wù)敏捷、快速的部署,高效、按需分配資源,安全穩(wěn)定運(yùn)行,固化運(yùn)維管理流程,減少重復(fù)勞動(dòng),提高工作效率和規(guī)范性,支撐信息系統(tǒng)運(yùn)維工作從設(shè)備監(jiān)控向全面監(jiān)控延伸,從手工操作向自動(dòng)操作演進(jìn),從被動(dòng)響應(yīng)向主動(dòng)服務(wù)轉(zhuǎn)變,促進(jìn)運(yùn)維規(guī)模、服務(wù)水平和工作效率提高。
本課題通過研究分析國內(nèi)外企業(yè)及國家電網(wǎng)公司的運(yùn)維特點(diǎn)和發(fā)展趨勢,探索優(yōu)化配置運(yùn)維服務(wù)資源,創(chuàng)新運(yùn)維服務(wù)模式,以集約化監(jiān)控、故障預(yù)警、自動(dòng)恢復(fù)為切入點(diǎn),提升服務(wù)質(zhì)量,提高服務(wù)效率和業(yè)務(wù)可靠性,改善用戶體驗(yàn),推進(jìn)運(yùn)維管理集約化、自動(dòng)化及智能化,具體目標(biāo)如下:
1)解放管理資源:分離出非關(guān)鍵工作,用管家建立“防火墻”;
2)提升服務(wù)質(zhì)量:統(tǒng)一管理、作業(yè)、流程、質(zhì)量標(biāo)準(zhǔn)體系和主動(dòng)服務(wù)。
3)提高服務(wù)效率:管家主導(dǎo),其他服務(wù)商配合,接口統(tǒng)一,責(zé)任明確。
4)豐富經(jīng)驗(yàn)儲(chǔ)備:通過繼遠(yuǎn)管家作為媒介,共享其它項(xiàng)目上成功的經(jīng)驗(yàn)。
5)優(yōu)化運(yùn)維流程:管家式運(yùn)維服務(wù)模式下,運(yùn)維流程的設(shè)計(jì)和管理將打破服務(wù)商和項(xiàng)目組的界限,對(duì)整體職能做統(tǒng)一界定,運(yùn)維流程整體性更強(qiáng)、端對(duì)端扁平化管理趨勢更明顯。
6)提高運(yùn)維黏性:通過管家對(duì)全業(yè)務(wù)質(zhì)量監(jiān)控,提升系統(tǒng)安全性和業(yè)務(wù)可靠性,增強(qiáng)客戶對(duì)團(tuán)隊(duì)的信賴,并因其無可替代的品質(zhì)而值得依賴。
通過研究分析國內(nèi)外企業(yè)運(yùn)維特點(diǎn)和新技術(shù)發(fā)展與應(yīng)用趨勢,發(fā)現(xiàn)企業(yè)信息系統(tǒng)運(yùn)維業(yè)務(wù)均強(qiáng)調(diào)了集約化、扁平化、資源配置管理及自動(dòng)化管理的發(fā)展目標(biāo),而集約化、扁平化、自動(dòng)化管理的實(shí)現(xiàn)基礎(chǔ)往往離不開信息系統(tǒng)軟硬件的高度集中,本次調(diào)研工作就集中部署及分散式運(yùn)維的差異性進(jìn)行了全面的分析,梳理出集中部署信息系統(tǒng)運(yùn)維工作存在以下幾個(gè)方面的問題與不足:
1)人員成本偏高運(yùn)維工作中的操作多為手工作業(yè),不僅重復(fù)性工作量大,而且存在誤操作風(fēng)險(xiǎn),管理難度大,而隨著企業(yè)IT結(jié)構(gòu)的越來越復(fù)雜,又不得不投入更多的人力。
2)自動(dòng)化程度低?,F(xiàn)有模式只有發(fā)生故障或影響業(yè)務(wù)連續(xù)性時(shí)才會(huì)被發(fā)現(xiàn),并非是主動(dòng)預(yù)警、修復(fù),所以IT運(yùn)維往往陷入”救火隊(duì)員”的角色中,故障報(bào)警此起彼伏,惡性連鎖反應(yīng)持續(xù)發(fā)生,還會(huì)導(dǎo)致企業(yè)對(duì)IT運(yùn)維的滿意度大幅降低。
3)隨著計(jì)算、存儲(chǔ)資源的池化,資源利率用提升,以往人工更新、檢測和故障排除的模式,在面臨虛擬化的成千上萬甚至更龐大的資源管理時(shí),將更加困難。
為了解決上述問題,通過管家式運(yùn)維實(shí)現(xiàn)對(duì)系統(tǒng)運(yùn)行狀態(tài)統(tǒng)一集中監(jiān)測與評(píng)估、故障分析與輔助定位、故障自動(dòng)處理、自動(dòng)化巡視巡檢、故障預(yù)警等,開展信息系統(tǒng)集約化監(jiān)控、故障預(yù)警、系統(tǒng)自動(dòng)恢復(fù)技術(shù)及相關(guān)系統(tǒng)研究,以支撐IT服務(wù)敏捷、快速的部署,高效、按需分配資源,安全穩(wěn)定運(yùn)行,固化運(yùn)維管理流程,減少重復(fù)勞動(dòng),提高工作效率和規(guī)范性,支撐信息系統(tǒng)運(yùn)維工作從設(shè)備監(jiān)控向全面監(jiān)控延伸,從手工操作向自動(dòng)操作演進(jìn),從被動(dòng)響應(yīng)向主動(dòng)服務(wù)轉(zhuǎn)變,促進(jìn)運(yùn)維規(guī)模、服務(wù)水平和工作效率提高。
集中部署信息系統(tǒng)運(yùn)維管理發(fā)展方面,在信息化建設(shè)初期,單個(gè)業(yè)務(wù)系統(tǒng)主要以售后服務(wù)模式為運(yùn)維核心,側(cè)重于解決問題;信息化建設(shè)中期,企業(yè)多業(yè)務(wù)系統(tǒng)運(yùn)維主要以流程管理為核心,側(cè)重于提高工作工作效率;信息化建設(shè)完成后,企業(yè)內(nèi)的業(yè)務(wù)系統(tǒng)運(yùn)維則需要對(duì)整個(gè)運(yùn)維資源(人員、技術(shù)、流程、資源)進(jìn)行統(tǒng)籌管理與管與分配,形成信息運(yùn)維標(biāo)準(zhǔn)體系,促進(jìn)運(yùn)維服務(wù)自動(dòng)化。企業(yè)經(jīng)歷了運(yùn)維發(fā)展過程中的各個(gè)階段, IT系統(tǒng)架構(gòu)逐漸走向標(biāo)準(zhǔn)化、模型化,通過運(yùn)維管理平臺(tái),可以對(duì)運(yùn)維服務(wù)進(jìn)行集中的遠(yuǎn)程自動(dòng)化監(jiān)控。能夠收集運(yùn)維過程中所有的問題、事件、變更、服務(wù)級(jí)別等信息并錄入管理系統(tǒng),不斷完善進(jìn)而形成一套趨向自動(dòng)化的運(yùn)維支撐體系。逐步由被動(dòng)式、高成本的運(yùn)維模式向高效率、低成本、規(guī)?;募惺竭\(yùn)維模式發(fā)展,具體體現(xiàn)在以下幾個(gè)方面:
1)規(guī)劃規(guī)?;?/p>
為了確保運(yùn)維服務(wù)模式能夠適應(yīng)不同的運(yùn)維環(huán)境,各企業(yè)能在運(yùn)維體系架構(gòu)設(shè)計(jì)時(shí)便充分考慮到標(biāo)準(zhǔn)化、模型化,新增業(yè)務(wù)資源可通過定制進(jìn)行完成。
2)服務(wù)自動(dòng)化
通過自動(dòng)化技術(shù),提高日常巡檢、故障告警、故障排除等運(yùn)維服務(wù)的工作效率,以達(dá)到自動(dòng)化運(yùn)維的目標(biāo),運(yùn)維模型的設(shè)計(jì)過程中重點(diǎn)要考慮自動(dòng)化批量處理能力。
3)管理智能化
通過運(yùn)維管理模型規(guī)范運(yùn)維人員和服務(wù)商的工作流程和協(xié)調(diào)配合,并以平臺(tái)工具進(jìn)行信息查詢、告警管理等操作。智能化:使用新技術(shù),提升運(yùn)維管理方式的處理效率,引入嵌入式自動(dòng)化架構(gòu),實(shí)現(xiàn)智能終端APP化管理。
4)監(jiān)控平臺(tái)化
國內(nèi)外各企業(yè)的運(yùn)維管理基本都設(shè)計(jì)了符合各自企業(yè)特色的運(yùn)維管理平臺(tái),通過管理平臺(tái)化監(jiān)控運(yùn)維服務(wù)過程、運(yùn)維服務(wù)質(zhì)量及運(yùn)維服務(wù)交付等,實(shí)現(xiàn)對(duì)運(yùn)維服務(wù)的全方位監(jiān)控。
5)運(yùn)維組織扁平化
信息技術(shù)的發(fā)展和運(yùn)維管理支撐系統(tǒng)的建設(shè)完善,使運(yùn)行維護(hù)組織管理的扁平化成為可能,管理的扁平化可以簡化生產(chǎn)作業(yè)流程和管理流程,增強(qiáng)運(yùn)行維護(hù)工作的靈活性和適應(yīng)性,提高工作效率,降低運(yùn)行維護(hù)成本。
未來,運(yùn)維管理模式的建設(shè)方向是一體化集中管控模式。針對(duì)國網(wǎng)公司集中部署模式已逐步完成的運(yùn)維管理現(xiàn)狀,為了提升國網(wǎng)公司運(yùn)維服務(wù)服務(wù)質(zhì)量,提高服務(wù)效率和業(yè)務(wù)可靠性,改善用戶體驗(yàn),推進(jìn)運(yùn)維管理的集約化、自動(dòng)化及智能化??紤]組織特點(diǎn)和未來的發(fā)展方向,以及基礎(chǔ)設(shè)施、應(yīng)用的大集中模式現(xiàn)狀,逐步嘗試融合私有云,集中化的運(yùn)維管理模式來支撐國網(wǎng)公司的運(yùn)維管理。借鑒IT運(yùn)維管理發(fā)展趨勢,結(jié)合國內(nèi)企業(yè)的現(xiàn)狀特點(diǎn),以統(tǒng)一的技術(shù)工具平臺(tái)為支撐,以“管家式服務(wù)”為理念,遵照統(tǒng)一規(guī)范的運(yùn)維流程執(zhí)行,明確出人員角色,建設(shè)集約化運(yùn)維管理模型,涵蓋組織模式、管理制度、管理流程、績效考核、知識(shí) 管理、技術(shù)支撐等內(nèi)容。
1)組織模式
為了實(shí)現(xiàn)一體化集中管控的運(yùn)維管理,將運(yùn)維管理團(tuán)隊(duì)、運(yùn)維執(zhí)行團(tuán)隊(duì)到后臺(tái)支持團(tuán)隊(duì)3個(gè)方面進(jìn)行統(tǒng)一,按照業(yè)務(wù) 設(shè)立統(tǒng)一的運(yùn)維團(tuán)隊(duì),為用戶提供統(tǒng)一的IT 運(yùn)維服務(wù)。
2)制度規(guī)范
管理制度體系分為 “信息化運(yùn)維管理辦法”、“各服務(wù)管理流程序文件”、 各信息系統(tǒng)項(xiàng)目根據(jù)具體情況再制定實(shí)施細(xì)則和操作指南以及表單4個(gè)層次。
3)管理流程
建立統(tǒng)一的服務(wù)管理流程,包括分別面向用戶的服務(wù)支持流 程,如事件、問題等流程。以及面向客戶服務(wù)交付流程,如容量管理、可用性管理等流程。
4)績效考核
績效考核從IT運(yùn)維管理體系的目標(biāo)出發(fā),按照組織、流程和崗位角色分解, 形成“IT運(yùn)維組織KPI關(guān)鍵績效指標(biāo)—流程KPI—角色崗位KPI”3層相互關(guān)聯(lián)的績效考 核指標(biāo)體系。
5)知識(shí)管理
整合知識(shí)資源,建立一套“統(tǒng)一、集中”的運(yùn)維知識(shí)管理平臺(tái),以便為總部及所屬企事業(yè)單位IT運(yùn)維工作提供支持。
6)技術(shù)支撐
建立集中統(tǒng)一的運(yùn)維管理平臺(tái),包括服務(wù)流程平臺(tái)、監(jiān)控平臺(tái)、知識(shí)管理平臺(tái)等。
運(yùn)維主動(dòng)式管理:隨著業(yè)務(wù)系統(tǒng)對(duì)網(wǎng)絡(luò)的依賴日趨加深,看似輕微的系統(tǒng)故障很有可能威脅到整個(gè)公司的運(yùn)作,而如果IT部門只是從報(bào)修電話中體現(xiàn)價(jià)值,總是做“事后諸葛亮”是很危險(xiǎn)的。如何借助于管家式集約化技術(shù)手段,提前預(yù)測業(yè)務(wù)系統(tǒng)潛在的安全隱患,及早緩解潛在風(fēng)險(xiǎn),成為主動(dòng)式運(yùn)維管理的一個(gè)難點(diǎn)。
故障自動(dòng)化處理:故障處理效率不高,人力成本攀升苦不堪言。首先,一線的IT運(yùn)維人員無法第一時(shí)間得到故障通知,而被動(dòng)讓故障處理再陷泥潭,定位故障源頭的難題讓這種局面惡化。其次,設(shè)備和業(yè)務(wù)系統(tǒng)日常巡檢依靠人力難以維持,工作量過大可能會(huì)造成巡檢工作敷衍了事,還會(huì)留下運(yùn)維“死角”。
IT運(yùn)維與業(yè)務(wù)脫離:IT運(yùn)維與業(yè)務(wù)脫離,無法用非技術(shù)化的數(shù)據(jù)向業(yè)務(wù)部門表述IT戰(zhàn)略及IT資源的分配狀況,業(yè)務(wù)部門也無法直觀的看到系統(tǒng)健康狀況。
而管家式集約化運(yùn)維管理模式能夠?qū)φ麄€(gè)IT資源進(jìn)行統(tǒng)一管理,而通過管家式集約化管理模型的建設(shè),實(shí)現(xiàn)從操作調(diào)度到基于最佳實(shí)踐的標(biāo)準(zhǔn)化流程的統(tǒng)一管理。從被動(dòng)服務(wù)向主動(dòng)服務(wù)轉(zhuǎn)變,從粗放管理向精細(xì)管理轉(zhuǎn)變,從單項(xiàng)優(yōu)勢向整體優(yōu)勢轉(zhuǎn)變,從運(yùn)行管理向全生命周期管理轉(zhuǎn)變。
本課題借鑒“管家式保姆”先進(jìn)理念,研究國內(nèi)外先進(jìn)的運(yùn)維管理經(jīng)驗(yàn)及信息技術(shù)發(fā)展趨勢,結(jié)合國網(wǎng)運(yùn)維管理現(xiàn)狀,整合運(yùn)維服務(wù)資源,改變以往被動(dòng)式、低效率、高成本的運(yùn)維服務(wù)模式,研究集中部署信息系統(tǒng)運(yùn)維差異性分析、管家式集約化運(yùn)維管理模型,實(shí)現(xiàn)服務(wù)主動(dòng)式、專業(yè)化、自動(dòng)化、可定制、高標(biāo)準(zhǔn)的要求。
[1] 吳舜,許大衛(wèi),魏征,等.基于用戶體驗(yàn)的信息系統(tǒng)主動(dòng)運(yùn)維平臺(tái)[J].電信科學(xué),2015,31(3):222-229.
[2] 姜旭,許國平,王珂,等.商業(yè)銀行應(yīng)用系統(tǒng)主動(dòng)運(yùn)維規(guī)范研究[J].金融科技時(shí)代,2016(2):40-43.
[3] 陳康,鄭維民.云計(jì)算:系統(tǒng)實(shí)例與研究現(xiàn)狀[J].軟件學(xué)報(bào),2009,20(5):1137-1148.
[4] 聞屏.構(gòu)建全鏈路監(jiān)控打造面向大客戶的主動(dòng)運(yùn)維服務(wù)新體系 [J].中國通信,2016,18(22):162-163.
[5] 吳舜,許大衛(wèi),魏征,等.基于用戶體驗(yàn)的信息系統(tǒng)主動(dòng)運(yùn)維平臺(tái)[R].中國電機(jī)工程學(xué)會(huì)電力信息化專業(yè)委員會(huì),2016.
[6] ZDNet.應(yīng)對(duì)四大挑戰(zhàn):實(shí)現(xiàn)云環(huán)境下的主動(dòng)運(yùn)維[J].Network & Information,2011,25(10):279-280.
ResearchonKeyTechnologiesofButlerIntensiveOperationandMaintenance
He Wenjing, He Wenjing, He Wenjing
(State Grid Communication Industry Group CO., LTD Anhui Jiyuan Software CO., LTD, China, Hefei 230088)
According to the national network of centralized deployment operation application, the centralized deployment information system maintenance is taken as the research object. Through the analysis of the national Power Grid Corp operation characteristics and development trend, the optimal allocation of service resources, innovative service model to intensive monitoring and fault warning and automatic recovery is used as the starting point, to improve service quality, service efficiency and the service reliability, to improve user experience, and promote intensive and intelligent operation and management.
Centralized deployment; Operation and maintenance service mode; Service quality; User experience
1007-757X(2017)12-0078-03
何文金(1978-),男,漳州人,工程師,研究方向:電力行業(yè)信息化。
劉江(1982-),男,渦陽人,工程師,研究方向:電力信息化工作。
李冬(1984-),男,阜陽人,助理工程師,研究方向:電力行業(yè)信息化。
TP311
A
2017.10.21)