陳世昌
(廈門市環(huán)境能源投資發(fā)展有限公司, 福建 廈門 361009)
在大數(shù)據(jù)時代下,電信運營商通常都會建立專門的大規(guī)模數(shù)據(jù)中心用戶數(shù)據(jù)收集與集成處理,這雖然為IT 運維服務管理提供了很多的幫助,但由于數(shù)據(jù)中心的網(wǎng)絡結構十分復雜,且缺乏完善的運維管理體制,因此在實際工作中,也同樣存在著運維服務壓力過大、信息孤島、決策意見不科學等問題。而通過對ITIL 的應用,則可以在實現(xiàn)IT 服務全生命周期覆蓋的前提下,對IT 服務運維管理流程進行全方位優(yōu)化,并將企業(yè)業(yè)務與運維管理服務整合起來,最終使問題得到有效解決。
ITIL 并非是固定的IT 運維服務管理規(guī)范,而是針對IT 運維服務管理實踐所制定的可量化標準規(guī)范,電信運營商在應用過程中,完全根據(jù)自身實際服務需求、服務水平,以ITIL 為參考展開IT 基礎架構規(guī)劃,并在現(xiàn)有業(yè)務管理平臺的基礎上,將明確、完善的運維服務管理流程建立起來,為數(shù)據(jù)中心的運維、管理工作者提供支持。因此,通過對ITIL 的應用,電信運營商對數(shù)據(jù)中心的運維管理工作能夠得到很大幫助,無論在運行工程過程中出現(xiàn)何種事件,運營服務平臺都可以對這些細粒度事件進行準確區(qū)分與全面細化監(jiān)控,并根據(jù)告警、配置等指標展開事件分析,確定時間、設備類型、系統(tǒng)范圍、變更情況等具體數(shù)據(jù),整個過程基本都能夠在五分鐘內(nèi)完成,這不僅使電信運營商的數(shù)據(jù)中心運維服務管理能力得到了顯著提升,同時也運營管理層的相關決策工作提供了詳細的基礎數(shù)據(jù)參考。
從管理流程上來看,ITIL 在IT 服務管理中的應用主要可分為事件管理問題管理、配置管理、變更管理、發(fā)布管理幾部分,由于各管理流程都會以大量的詳細數(shù)據(jù)作為支持,因此在這一流程下進行事件處理時,其處理效率會得到很大的提升,而用戶也會盡快獲得有關事件處理的滿意回復[1]。例如在應用ITIL 后,電信運營商數(shù)據(jù)中心通常會建立專門的統(tǒng)一服務臺,用于接收用戶的各種請求,一旦事件發(fā)生后用戶提出服務請求,服務臺就會立即進入到事件管理程序,對事件進行分類,并將事件的優(yōu)先級與升級機制建立起來,之后再根據(jù)事件類型將其分解到專門的負責人員手中進行處理,從而實現(xiàn)事件處理效率的最大化提升。而在進入到事件管理流程之后,系統(tǒng)則會展開問題管理,調(diào)查基礎設施等方面的各種信息,并依據(jù)事件數(shù)據(jù)庫來分析事件真正原因與潛在故障,這樣用戶在等待事件處理的同時,也可以通過服務臺來查詢事件處理進度、了解事件相關信息,這對于用戶滿意度的提升是很有幫助的。
當前電信運營商數(shù)據(jù)中心的運維服務管理基本都是在故障發(fā)生針對用戶的服務請求來展開相應的故障處理工作,在這樣的模式下,如果故障未曾發(fā)生,那么相關工作人員就會一直處于無所事事的狀態(tài),但若是故障集中出現(xiàn),工作量則會迅速提升,這不僅會給工作人員帶來很大的工作壓力,同時由于故障無法得到及時的解決,因此客戶滿意度也會大大降低。而在應用ITIL 后,由于電信運營商數(shù)據(jù)中心完全可以對系統(tǒng)變化展開全面監(jiān)控,發(fā)現(xiàn)并準確判斷出各種潛在故障風險,因此其運維服務管理模式逐漸從被動服務轉變?yōu)榱酥鲃臃眨谶@種全新的主動服務模式下,運維服務管理效率以及故障風險控制能力也都會得到進一步提升。例如在變更管理方面,安全系統(tǒng)不定的安裝常常會給整個系統(tǒng)帶來各種潛在風險,且很容易導致系統(tǒng)故障,但在基于ITIL 的運維服務管理模式下,管理人員卻可以增加變更管理流程,對系統(tǒng)變更情況進行全面實時監(jiān)管,這樣未知風險隱患基本都可以故障發(fā)生前得到及時發(fā)現(xiàn),變更風險的處理自然也會變得更加有效。
作為針對IT 運維服務管理實踐所制定的可量化標準規(guī)范,ITIL 的應用往往需要企業(yè)根據(jù)自身需求來進行自定義規(guī)劃設計,這里以某電信運營商數(shù)據(jù)中心在運維服務管理中的實際情況為例,對ITIL 體系的設計構建展開了具體探究。
從整體上來看,基于運維服務管理的實際情況,某電信運營商ITIL 體系主要可分為三部分。在日常運維工作中,由于數(shù)據(jù)中心運維服務管理的效率相對較低,很多用戶對故障處理速度并不滿意,因此在系統(tǒng)架構的設計中,根據(jù)ITIL 標準對運維服務管理流程進行了重構,在明確事件處理、問題排查、配置錄入、變更相應、信息發(fā)布等流程環(huán)節(jié)的同時,確定了各流程環(huán)節(jié)的具體操作要求,使運維服務管理更加高效、規(guī)范[2]。其次,在數(shù)據(jù)中心運維服務管理工作中,事件具體情況往往都存在著明顯的細節(jié)差異,這給事件處理帶來了很大的困難,針對這一問題,電信運營商在系統(tǒng)架構設計階段建立了專門的數(shù)據(jù)庫,用于記錄、存儲各類事件的原因、嚴重程度、處理方法等具體信息,以實現(xiàn)知識庫經(jīng)驗積累,為其他類似事件的處理提供經(jīng)驗、數(shù)據(jù)支持,并企業(yè)數(shù)據(jù)中心的整體運維質量與效率。最后,由于當前電信運營商的運維服務管理以用戶為中心,因此基于ITIL 體系,該電信運營商還利用相關數(shù)據(jù)設計了多維度報表輸入模塊,將運維服務管理的相關數(shù)據(jù)應用到了企業(yè)決策管理中來,為各項決策的確定提供了重要數(shù)據(jù)支持。
在管理流程方面,由于某電信運營商的ITIL 體系中包括事件管理、問題管理、配置管理等核心管理模塊及安全管理、日常運維管理等簡單流程功能模塊,因此在設計階段為各模塊都預留了需求管理接口,并對流程目的、實施內(nèi)容、執(zhí)行原則、流程間通知方式等實施規(guī)定進行了明確定義,同時還將事件優(yōu)先級定義標準、解決時間要求、職責劃分等確定了下來,這些都為ITIL 體系下的運維服務管理執(zhí)行提供了重要基礎支持。
依據(jù)ITIL 的相關管理流程標準與實際管理需求,某電信運營商對運維服務管理平臺展開了模塊化設計,平臺功能模塊包括事件管理、問題管理、變更管理、發(fā)布管理、配置管理、安全管理、日常運維管理、賬號權限管理、系統(tǒng)出入管理幾部分,各模塊的主要功能也得到了明確(具體功能框架如圖1)。例如事件管理模塊主要功能為記錄系統(tǒng)內(nèi)部故障、用戶請求,并執(zhí)行分類管理等操作,同時針對故障處理的全過程展開監(jiān)管;而日常維護管理模塊則主要負責對數(shù)據(jù)中心常規(guī)工作任務的管理,如分配日常任務、安排作業(yè)計劃等。
總而言之,ITIL 在IT 運維服務管理方面具有非常重要的作用,對于電信運營商來說,無論是事件處理效率的提升,還是運維服務流程的優(yōu)化,都需要依靠ITIL體系來實現(xiàn),因此未來各電信運營商還需提高對ITIL 的重視,同時結合實際情況,對ITIL 體系的展開科學的自定義設計。