王振宇
摘 要 隨著科技的不斷發(fā)展,信息技術水平不斷提高,推動了企業(yè)的信息化水平,提高了企業(yè)運營效率和競爭力。作為企業(yè)運營數(shù)據(jù)、計算和存儲的數(shù)據(jù)中心也成為各領域各行業(yè)的核心機構,但是目前數(shù)據(jù)中心運維管理水平普遍較低,不能適應和滿足網(wǎng)絡信息系統(tǒng)發(fā)展和業(yè)務發(fā)展實際需要。數(shù)據(jù)中心運維管理需要靈活的管理機制和方法,讓各技術層面協(xié)同工作有機配合并不容易,同時也需要企業(yè)數(shù)據(jù)中心管理人員提高管理水平,加強運維管理,向著高可用、高效穩(wěn)定、低成本和運維管理自動化的方向發(fā)展。為此,我們需要進一步分析和探討數(shù)據(jù)庫中心的運維管理現(xiàn)狀,不斷完善和改進運維管理手段和能力,全方位提高運維管理水平。
關鍵詞 數(shù)據(jù)中心;運維管理;IT運維;運維服務;業(yè)務驅(qū)動管理;運維管理自動化
中圖分類號 G2 文獻標識碼 A 文章編號 1674-6708(2018)205-0148-02
如今,作為企業(yè)數(shù)據(jù)傳輸、計算和存儲的數(shù)據(jù)中心,集中了各種軟硬件資源和關鍵業(yè)務系統(tǒng),這也讓數(shù)據(jù)中心的運維管理變得很困難。首先,依據(jù)上層業(yè)務的角度來看,計算是數(shù)據(jù)中心的主要任務,要確保服務器、數(shù)據(jù)庫、中間件和Web等運行正常。其次,依據(jù)運維和服務的角度來看,數(shù)據(jù)中心各個方面的服務質(zhì)量和服務流程是影響企業(yè)業(yè)務的直接因素。最后,從技術發(fā)展趨勢方面來看,一定要將數(shù)據(jù)中心軟硬件資源的各項指標標準化,最終實現(xiàn)運維自動化。這一過程需要靈活的管理機制和方法,需要業(yè)務相關部門協(xié)調(diào)配合,健全運維管理機制,從而實現(xiàn)企業(yè)級數(shù)據(jù)中心高效運行。
1 企業(yè)級數(shù)據(jù)中心運維管理工作范圍
企業(yè)級數(shù)據(jù)中心運維管理工作主要包含4個部分,其一是數(shù)據(jù)中心信息系統(tǒng)的運維管理,數(shù)據(jù)中心的信息系統(tǒng)主要包括運營支撐系統(tǒng)、企業(yè)資源管理系統(tǒng)、客戶服務系統(tǒng)、辦公自動化系統(tǒng)、監(jiān)控系統(tǒng)等多種數(shù)據(jù)信息系統(tǒng)以及承載的小型機、服務器和網(wǎng)絡設備等硬件資源。其二是數(shù)據(jù)中心數(shù)據(jù)庫及存儲管理,數(shù)據(jù)庫是系統(tǒng)的核心,存儲是承載數(shù)據(jù)的硬件設備,保證數(shù)據(jù)庫及數(shù)據(jù)安全和存儲管理是數(shù)據(jù)中心運維管理工作的重中之重。其三是數(shù)據(jù)中心機房的網(wǎng)絡管理,對網(wǎng)絡設備包括交換機、路由器、防火墻、負載均衡等設備進行統(tǒng)一配置和管理,保證網(wǎng)絡的正常運行。其四是數(shù)據(jù)中心機房環(huán)境管理,對數(shù)據(jù)中心的監(jiān)控以及機房環(huán)境進行管理,運維對象包括入侵監(jiān)測系統(tǒng)、精密空調(diào)、視頻監(jiān)控、環(huán)境監(jiān)控、門禁系統(tǒng)、電力設備系統(tǒng)、消防系統(tǒng)等。
數(shù)據(jù)中心運維管理的主要任務是配置管理、變更管理、故障管理、監(jiān)控管理以及資源管理。配置管理主要是指對數(shù)據(jù)中心的核心系統(tǒng)、核心設備以及機房環(huán)境等配置相應的檔案庫,提高數(shù)據(jù)中心的運維管理水平,充分調(diào)動管理人員的工作積極性和主動性。變更管理主要是指根據(jù)數(shù)據(jù)中心的業(yè)務需求和運維管理需求,對網(wǎng)絡配置、存儲資源、軟件系統(tǒng)、硬件設備、機房環(huán)境,調(diào)整業(yè)務數(shù)據(jù),升級和更換參數(shù)配置。故障管理主要是指數(shù)據(jù)中心對相關部門反映的問題和運維管理中出現(xiàn)的問題,及時進行處理和解決。監(jiān)控管理是指對網(wǎng)絡系統(tǒng)的運行性能和運行狀況、存儲系統(tǒng)、信息系統(tǒng)、主機設備、機房環(huán)境等進行實時監(jiān)控,定期進行巡檢和維護,全面掌握系統(tǒng)運行情況和運行趨勢。資源管理是指對數(shù)據(jù)中心的網(wǎng)絡資源、存儲資源、主機資源以及環(huán)境資源進行管理規(guī)劃,優(yōu)化資源配置,根據(jù)不同的需求及時調(diào)整資源配置,提高數(shù)據(jù)中心資源利用率。
2 企業(yè)級數(shù)據(jù)中心運維管理面臨的挑戰(zhàn)
從企業(yè)級數(shù)據(jù)中心運維管理發(fā)展現(xiàn)狀看,主要體現(xiàn)出如下問題:
現(xiàn)狀一:IT運維人員成本偏高。據(jù)專業(yè)調(diào)查,大多數(shù)CIO表示最關心的是IT運維成本過高。原因是在過去的5年中,很多企業(yè)因為業(yè)務的需要實施了很多IT信息系統(tǒng),使得系統(tǒng)運行越來越復雜,也越來越難管理。同時,IT運維成本過高的一個原因是IT運維的自動化程度很低,依靠手工流程來管理,不但使到運維效率不高,而且人力成本更是花費驚人。另一家國際知名調(diào)查機構Gartner調(diào)查發(fā)現(xiàn),在IT運維成本中,源自技術或產(chǎn)品(包括硬件、軟件、網(wǎng)絡等)成本其實只占20%,而流程維護成本占40%,運維人員成本占40%。流程維護成本包括日常維護、變更管理、測試成本等;人員成本包括培訓、人員流失、招聘成本等。
現(xiàn)狀二:處在“救火式”的IT運維方式。國內(nèi)在IT運維過程中,IT員工大多數(shù)只是處在被動低效率手工救火的狀態(tài),只有當事件已經(jīng)發(fā)生并已造成業(yè)務影響時才能發(fā)現(xiàn)和著手處理。這種被動“救火”會導致:IT運維人員終日忙碌,維護難度高,運維工作壓力大而不受重視;故障預警機制的不完善,往往是故障發(fā)生后或報警后才會進行處理,不但事倍功半而且故障還常常會出現(xiàn)惡性連鎖反應。IT運維服務人員的工作始終得不到業(yè)務部門的認可,而且工作量也難以量化。
現(xiàn)狀三:IT運維服務管理方式缺乏創(chuàng)新。IT運維服務管理方式效率低下。運維管理通常是企業(yè)運維部門根據(jù)技術類別需要培養(yǎng)各方面的IT運維人員,技術水平層次不齊,崗位設置不夠合理,技能考核不夠?qū)I(yè),技術監(jiān)控水平落后,疏于管理,缺乏有效監(jiān)督,工作效率低下,管理方式缺乏創(chuàng)新。
現(xiàn)狀四:運維管理技術落后。近年來信息系統(tǒng)的軟件和硬件都趨于集成化和實現(xiàn)云計算,對數(shù)據(jù)中心運維管理的能力提出了新的要求,目前數(shù)據(jù)中心的IT運維管理技術已經(jīng)不能滿足各個行業(yè)業(yè)務發(fā)展周期變化的需求,限制了很多企業(yè)的創(chuàng)新和發(fā)展,需要不斷改進運維技術手段和運維方式,提高運維管理水平,滿足業(yè)務發(fā)展的需求。
3 提高企業(yè)級數(shù)據(jù)中心運維管理能力的有效策略
3.1 提高運維管理人員的綜合素質(zhì),加強團隊建設
管理人員是數(shù)據(jù)中心運維管理的關鍵核心,只有不斷提高運維管理人員的綜合素質(zhì),才能不斷提升數(shù)據(jù)中心運維管理的水平。可以通過多種形式,鼓勵管理人員學習更多的運維管理知識,提高自身的運維操作技能,充分調(diào)動工作人員的積極性和主動性。開展數(shù)據(jù)中心運維管理的系統(tǒng)化、專業(yè)化培訓,重視運維技術的學習,激勵管理人員探究數(shù)據(jù)中心的信息系統(tǒng)建設,提高對企業(yè)的認同感。endprint
運維人員管理問題,關鍵在于運維工作分配業(yè)績考核??蓪⑦\維人員根據(jù)技能層次水平分成一、二、三線支持,不同運維人員各司其職,能使有限的運維力量得到合理利用,整體工作效率將明顯提升,同時也方便對各自的工作業(yè)績進行評估,再據(jù)此制定相應獎懲措施和制定技能培訓規(guī)劃,也能提高員工工作積極性。加強運維團隊的建設和管理,有利于沉淀內(nèi)部知識積累,快速培訓新員工,減少核心員工離職帶來的沖擊。
3.2 確立以業(yè)務價值為核心的業(yè)務驅(qū)動管理的管理思想
為了不斷提高數(shù)據(jù)中心運維管理的能力和水平,必須加強對業(yè)務環(huán)境的了解和分析,健全運維管理機制,提高決策能力。及時了解和研究業(yè)務環(huán)境,首先需要找出數(shù)據(jù)中心信息系統(tǒng)和業(yè)務環(huán)境之間的關聯(lián)因素,深入分析業(yè)務環(huán)境對信息系統(tǒng)的影響。其次,仔細分析業(yè)務環(huán)境的變化內(nèi)容,研究業(yè)務發(fā)展趨勢。最后,正確分析業(yè)務環(huán)境影響因素,評估業(yè)務環(huán)境的風險,提高數(shù)據(jù)中心建設發(fā)展決策能力。
要在運維管理的戰(zhàn)略層面上建立“業(yè)務驅(qū)動”的運維治理和管理思想,使得業(yè)務部門的目標和運維管理的目標一致,都是為了企業(yè)整體戰(zhàn)略目標的實現(xiàn),把對業(yè)務的支撐能力和管理實效,作為評價IT系統(tǒng)效用和運維部門工作的首要指標。只有這樣,才能在全企業(yè)范圍內(nèi)建立“技術服務于業(yè)務發(fā)展”的意識和文化,是真正實現(xiàn)IT與業(yè)務融合,共同為企業(yè)的戰(zhàn)略目標服務。
3.3 引進先進的運維監(jiān)控管理技術
企業(yè)級數(shù)據(jù)中心要積極引進先進的運維監(jiān)控管理技術,不斷提高運維管理自動化水平。做好業(yè)務系統(tǒng)與信息系統(tǒng)的結合,利用先進的管理方式和自動化運維監(jiān)控技術,不斷完善和提高數(shù)據(jù)中心系統(tǒng)的運行效能,構建以業(yè)務和客戶服務為中心的運維管理體系,加強技術能力團隊建設,制定規(guī)范的運維管理制度,提高數(shù)據(jù)中心運維管理效率。
3.4 數(shù)據(jù)中心運維服務管理的創(chuàng)新
企業(yè)級數(shù)據(jù)中心運維管理工作經(jīng)過不斷發(fā)展和探索,目前主要包括自營管理和外包管理,隨著IT系統(tǒng)復雜程度的增加,對于IT運維能力的要求也越來越高,自營服務的成本已遠遠大于外包服務的成本,在某些非關鍵的領域,應該引入IT運維服務外包這一創(chuàng)新管理模式,以降低服務成本并得到專業(yè)的運維服務,同時將企業(yè)自己的IT運維人員解放出來,做更有價值和意義的工作。
IT運維服務外包存在一定風險,關鍵在于對于IT運維服務外包供應商的管理不到位,具體體現(xiàn)在招標環(huán)節(jié)疏于審查、過程監(jiān)督環(huán)節(jié)疏于監(jiān)管、以及事后評價環(huán)節(jié)疏于考核。通過在招標環(huán)節(jié)加強對供應商資質(zhì)、能力水平、案例等考察可以有效的對供應商的資格進行把關;通過在服務過程中加強監(jiān)督可及時發(fā)現(xiàn)供應商提供運維服務的真實能力水平;通過事后評價可以建立運維服務供應商的退出機制,保證供應商提供優(yōu)質(zhì)的運維服務。
4 結論
企業(yè)級數(shù)據(jù)中心運維管理是一項系統(tǒng)的工程。加強運維工作科學管理和高效運作,同時全面提升包括業(yè)務各部門協(xié)同管理、高效運作的能力,從而持續(xù)推進企業(yè)的信息化建設,建立與信息化發(fā)展相配套、相適應的整體設想,通過持續(xù)、科學的管理,保障企業(yè)信息化的快速,協(xié)調(diào)、可持續(xù)發(fā)展,滿足企業(yè)業(yè)務發(fā)展要求。企業(yè)級數(shù)據(jù)中心運維管理是對計算機系統(tǒng)進行綜合集中管理,既面向資源又面向應用,同時還面向運維管理人員,是人才、技術、流程和工具緊密結合的系統(tǒng)工程,要不斷創(chuàng)新運維管理思路和方式,采用先進科學的技術手段,使企業(yè)級數(shù)據(jù)中心運維管理水平達到新高度,以適應時代發(fā)展的需要。
參考文獻
[1]朱偉雄,王德安,蔡建華.新一代數(shù)據(jù)中心建設理論與實踐[M].北京:人民郵電出版社,2009.
[2]林予松,李潤知,劉煒.數(shù)據(jù)中心設計與管理[M].北京:清華大學出版社,2017(8).
[3]韋琛江,谷和啟.淺析企業(yè)級數(shù)據(jù)中心運維管理[J].信息系統(tǒng)工程,2013(8):66-67.endprint