黃曉明
摘要:在信息技術(shù)飛速發(fā)展的時代背景下,IT運維已經(jīng)成為IT服務(wù)中不可或缺的一部分。自從IT的應(yīng)用和維護誕生以來,自動化已經(jīng)成為其重要屬性之一,IT運維管理自動化取代了人工操作,是一種深入的探索和全局的分析。文章著眼于如何在當(dāng)前條件下對IT運維管理自動化的性能和服務(wù)進行優(yōu)化,實現(xiàn)投資回報最大化。
關(guān)鍵詞:IT運維;管理;自動化
隨著企業(yè)管理職能在體制逐步健全的過程中逐漸完善,企業(yè)內(nèi)部對IT運維信息管理業(yè)務(wù)中,涉及的各項工作的細化程度也逐步提高。企業(yè)隨著內(nèi)部的需求在發(fā)展,規(guī)模也在逐步的擴大,對于企業(yè)IT運維信息管理工作涉及的工作人員也越來越多,各個部門以及部門員工的分工也越來越明確,工作環(huán)境逐步變化、工作的邏輯性也逐步的增強,通過手工的方式已經(jīng)無法跟隨企業(yè)在IT運維信息管理發(fā)展的腳步。
盡管IT運維管理的技術(shù)在不斷進步,但實際上很多IT運維人員并沒有真正解脫出來,原因在于目前的技術(shù)雖然能夠獲取IT設(shè)備、服務(wù)器、網(wǎng)絡(luò)流量,甚至數(shù)據(jù)庫的警告信息,但成千上萬條警告信息堆積在一起,無法判斷問題的根源在哪里。另外,目前許多企業(yè)的更新管理絕大多數(shù)工作都是手工操作的。即使一個簡單的系統(tǒng)變更或更新往往都需要運維人員逐一登錄每臺設(shè)備進行手工變更,當(dāng)設(shè)備數(shù)量成百上千時,其工作量之大可想而知。而這樣的變更和檢查操作在IT運維中往往每天都在進行,占用了大量的運維資源。因此,實現(xiàn)運維管理工作的自動化對企業(yè)來說已迫在眉睫。
一、IT運維管理自動化概述
IT運維管理自動化是IT運維中的高工作量任務(wù)。IT運維管理可以減少人工操作,實現(xiàn)自動化操作,減少運維人員的負擔(dān),提高運維效率。IT運維自動化是維護設(shè)備正常運行的方法,還可以使管理設(shè)備正常運行,及時發(fā)現(xiàn)和解決檢測終端設(shè)備存在的問題。IT運維自動化是保證整個管理過程實現(xiàn)標(biāo)準(zhǔn)化、自動化的基礎(chǔ),促進企業(yè)實現(xiàn)信息化目標(biāo)。IT運維信息管理業(yè)務(wù)是對企業(yè)內(nèi)應(yīng)用系統(tǒng)在運行過程的維護工作進行管理,IT運維信息管理是企業(yè)信息化形成規(guī)模以后逐步產(chǎn)生的一項業(yè)務(wù)管理工作,并隨著企業(yè)的發(fā)展而逐漸的形成規(guī)范的、層次分明的業(yè)務(wù)體系。
現(xiàn)在,許多企業(yè)已經(jīng)開始采用IT運維的核心戰(zhàn)略,而IT部門在現(xiàn)代企業(yè)中扮演著很重要的角色。企業(yè)領(lǐng)導(dǎo)把信息技術(shù)作為推動因素,與國外的發(fā)展相比,我國的信息服務(wù)管理還處于發(fā)展階段。隨著數(shù)據(jù)中心運維市場的深入發(fā)展,數(shù)據(jù)中心軟硬件設(shè)備越來越復(fù)雜和多樣化,企業(yè)更愿意接受第三方運維服務(wù),實現(xiàn)跨廠商的硬件維保和軟件運維服務(wù),第三方運維服務(wù)商已經(jīng)逐漸成長為和原廠服務(wù)商勢均力敵的力量。以專業(yè)的數(shù)據(jù)中心運維服務(wù)為核心業(yè)務(wù)的IT服務(wù)商包括銀信科技、天璣科技、新炬網(wǎng)絡(luò)、海量數(shù)據(jù)等。這類企業(yè)在下游行業(yè)客戶的布局當(dāng)中各有側(cè)重,如天璣科技重點服務(wù)于電信運營商,而銀信科技則更多的面向金融行業(yè)客戶提供運維服務(wù)。IT部門可以有效地控制成本,降低運營成本和風(fēng)險,增加企業(yè)整體的投資收益,使企業(yè)獲得更多的效益,提高企業(yè)的綜合競爭力。
二、企業(yè)IT運維存在的問題
(一)工作效率比較低
信息系統(tǒng)架構(gòu)的創(chuàng)新不僅能帶來效率提升、成本降低等管理價值,還能加速企業(yè)的差異化應(yīng)用,成為保持核心優(yōu)勢的關(guān)鍵。IT系統(tǒng)的運行、維護和管理是企業(yè)商業(yè)系統(tǒng)的保障,是企業(yè)生存和快速發(fā)展的支撐。在IT的運用及維護過程中,只有當(dāng)涉及業(yè)務(wù)時,緊急情況才能被發(fā)現(xiàn)和處理。這種被動的“滅火”不僅增加了IT人員的工作量,而且使IT維護本身的質(zhì)量難以提高。企業(yè)IT部門和部門對IT應(yīng)用程序和服務(wù)感到不滿。早期預(yù)警機制的維護體系是不完善的。在出現(xiàn)故障或焦慮后,IT的使用和維護在許多情況下處于被動滅火狀態(tài),而且在許多情況下,還會有惡意的連鎖反應(yīng)。
(二)缺乏高效的IT運維機制
在公司信息化水平日益完善的同時,也需要更多的應(yīng)用系統(tǒng)、軟件和硬件平臺,以及設(shè)備的維護和管理。如何有效地監(jiān)控和管理結(jié)構(gòu)復(fù)雜的IT系統(tǒng),是企業(yè)信息部門面臨的一大難題。作為IT管理部門,經(jīng)常會遇到很多IT障礙和問題,經(jīng)常上演“拆東墻補西墻”的尷尬場面。無論是哪個公司,只要員工和IT系統(tǒng)發(fā)展到一定程度,在IT系統(tǒng)管理上必然會面臨一系列的問題。在IT運維管理的過程中,很多企業(yè)沒有實現(xiàn)完全自動化管理,沒有明確地劃分每個操作和維護人員。因此,在發(fā)生故障的情況下,由于沒有管理者負責(zé)及時處理事故,導(dǎo)致事故不能被及時排除。
(三)缺乏高效的IT運維技術(shù)工具
隨著企業(yè)信息化水平的不斷提高,越來越多的服務(wù)器、存儲設(shè)備和網(wǎng)絡(luò)設(shè)備將使IT系統(tǒng)變得復(fù)雜,每天都要進行維護和管理,但各種故障是不可避免的。這樣就會妨礙正在進行的工作,不能讓公司正常運營。造成這一問題的原因在于企業(yè)缺乏監(jiān)測工具和故障診斷工具,難以及時檢測和處理各種故障。另一方面,基于OA系統(tǒng),與財務(wù)、CRM、業(yè)務(wù)系統(tǒng)等構(gòu)成公司的核心操作系統(tǒng)。這些復(fù)雜的核心系統(tǒng)是企業(yè)整體業(yè)務(wù)順利運行的關(guān)鍵。但是作為支持核心系統(tǒng)運行的IT基礎(chǔ)設(shè)施和運維系統(tǒng),很多公司并不具備?,F(xiàn)有的IT管理工具側(cè)重于技術(shù)層面的故障檢測和早期預(yù)警。雖然對發(fā)現(xiàn)的事件有相應(yīng)的管理流程報告,但還沒有找到合適的工具來提供全面、安全、穩(wěn)定的運行支持。
(四)IT運維的績效考核機制尚不完善
主觀的績效考核難執(zhí)行,客觀的績效考核難制定,模糊的績效考核難見效。目前在績效考核方面雖然采用填寫工作表的方式,對不同崗位的工作時間進行收集、評測和考核,在一定程度上體現(xiàn)了IT運維人員的工作量,但還是很難全面準(zhǔn)確的反映IT運維人員真實的工作績效表現(xiàn)。例如,提交IT事件清單后,對事件的預(yù)判和優(yōu)先級設(shè)置不統(tǒng)一,沒有規(guī)范性的指導(dǎo)文件。IT事件的處理只能依靠運維工程師的經(jīng)驗判斷或習(xí)慣使用的主觀方法。有標(biāo)識卻不規(guī)范,有處理卻不管理,有制度卻沒有很好的利用。因此,IT運維管理“輕標(biāo)重維”的現(xiàn)狀容易造成員工技能水平參差不齊導(dǎo)致IT運維不穩(wěn)定,直接影響維護體系的有效性。簡單地說,其還沒有擺脫傳統(tǒng)管理思維的束縛。
三、建立高效IT運維自動化管理的建議
(一)建立自動化運維管理平臺
構(gòu)建IT操作和維護自動化管理的第一步,是構(gòu)建一個IT操作和維護的自動化監(jiān)控和管理平臺。服務(wù)器、數(shù)據(jù)庫、中間件、存儲、網(wǎng)絡(luò)、安全、備份計算機室、業(yè)務(wù)應(yīng)用程序,通過客戶端等的監(jiān)測工具,用戶運營規(guī)則的限制和IT資源的實時監(jiān)控,實現(xiàn)自動監(jiān)測,并通過障礙及管理平臺實現(xiàn)或者合并處理問題和中央集中式管理。
例如,它會在自定義周期內(nèi)自動觸發(fā),以便完成IT日常操作和維護檢查并生成檢查報告。包含自動化操作和維護,借助這種方式完成同步部署和升級系統(tǒng)補丁、數(shù)據(jù)備份、病毒檢測和刪除等工作。
(二)建立故障事件自動觸發(fā)流程,提高故障處理效率
所有IT設(shè)備應(yīng)在出現(xiàn)問題時自動報警,無論是系統(tǒng)自動報警還是用戶報告故障,操作和維護屏幕上都應(yīng)顯示紅色。然后,IT操作員只需根據(jù)相關(guān)數(shù)據(jù)逐步操作即可。因此,企業(yè)應(yīng)提前建立自動操作指令流程管理,當(dāng)設(shè)備或軟件異?;虺鲱A(yù)警指標(biāo)時,會發(fā)生相關(guān)事件,并向相關(guān)IT運維人員執(zhí)行相關(guān)操作指令處理程序。IT操作和維護人員必須在指定的時間內(nèi)完成流程中指定的鏈接和操作,以提高對IT操作和維護問題反應(yīng)的效率。
(三)建立規(guī)范的事件跟蹤流程,強化運維執(zhí)行力度
在IT操作和維護自動化管理的建立過程中,工作人員應(yīng)該首先設(shè)置錯誤和事件處理跟蹤進程,并使用表格工具和其他工具記錄錯誤和處理,以建立操作和維護日志,并定期進行檢查。識別和發(fā)現(xiàn)問題的線索和根本原因。在實踐中,很多例子表明,按事件類型設(shè)置標(biāo)準(zhǔn)化處理和跟蹤指南可以減少IT操作和維護的任意性,并增強操作和維護的執(zhí)行能力,從而顯著地減少失敗的概率。同時,用戶也應(yīng)該能夠隨時從自助服務(wù)臺、服務(wù)臺等跟蹤錯誤請求的處理狀態(tài)。
(四)設(shè)立IT運維關(guān)鍵流程,引入優(yōu)先處理原則
核心IT操作和維護流程的建立以及優(yōu)先處理原則的引入,意味著CIO定義了IT操作和維護的每個核心流程,要求他們不僅定義流程是什么,而且指出其目的是什么,每個主要流程對企業(yè)的影響和重要性。同時,在配置自動化進程時,需要引入優(yōu)先級原則。程序需要像往常一樣處理任務(wù),并且特殊事件需要按優(yōu)先級進行處理。即,將事件分解為日常事件和特別重大事件。IT操作和維護自動化管理的實現(xiàn),意味著將IT操作和維護中的日常和大量重復(fù)操作自動化,從過去的手工操作切換到自動化操作。自動化是IT運維操作的升華,IT運維自動化不僅是一種維護過程,也是一種管理改進過程,是IT運維操作的最高層次,是未來發(fā)展趨勢。
四、結(jié)束語
隨著社會的持續(xù)發(fā)展,中小企業(yè)也開始成長起來。因此,IT操作和維護自動化需要進一步的開發(fā),以滿足企業(yè)開發(fā)的需求。隨著企業(yè)信息化水平的不斷提升,IT操作和維護的自動化程度也在不斷提升。因此,IT操作和維護自動化應(yīng)該有更好的軟件、更多的功能、更多的數(shù)據(jù)處理能力,并為更多的中小企業(yè)提供方便。要不斷提高IT營運及維護處理問題的效率及服務(wù)質(zhì)量,我們需要建立一個IT營運及維護呼叫中心,該中心可將語音呼叫與業(yè)務(wù)數(shù)據(jù)連接起來,推動IT營運及維護自動化工作的發(fā)展。
參考文獻:
[1]李明富.東亞中國借助BSM實現(xiàn)IT運維管理自動化[J].金融電子化,2012(8):88-89.
[2]張曉明.IT運維自動化技術(shù)在電力系統(tǒng)內(nèi)的應(yīng)用[J].數(shù)字技術(shù)與應(yīng)用,2012(11):105-105.
[3]陸春,黃杰,陳云.自動化配置技術(shù)在高校IT運維的應(yīng)用[J].中國教育網(wǎng)絡(luò),2013(12):79-80.
[4]張霞.基于ITSM的企業(yè)IT運維管理信息系統(tǒng)初步設(shè)計[J].制造業(yè)自動化,2016,38(8):120-123.
[5]王欽可.基于ITIL框架的IT運維管理系統(tǒng)設(shè)計與實現(xiàn)[D].湖北工業(yè)大學(xué),2017.