楊雪霽
隨著信息化技術的發(fā)展,信息化在科研單位開展科研和生產活動、提高組織競爭力等方面發(fā)揮著極其重要的戰(zhàn)略作用。然而,隨著科研單位信息化建設的不斷深入和完善,硬件設備、軟件資源、應用系統和數據量的日益增加,信息化的運維工作已成為不堪重負的問題。因此,必須提升信息化運維管理的效率與質量,保證信息系統安全、穩(wěn)定、高效的運行,從而有效保證科研工作的順利開展。
(一)運維工作涉及范圍廣,運維難度大
科研單位信息化有別于其他企業(yè),信息化建設的特點是“麻雀雖小,五臟俱全”。信息化的設備總數隨不多,但涉及范圍卻一點也不少,包括以機房、綜合布線、UPS、空調等為主的基礎設施;以服務器、交換機、存儲系統、防火墻等為主體的硬件設備;以操作系統、數據庫系統、應用系統等為核心的軟件系統;由此可見,信息化運維其涉及范圍廣,專業(yè)性強,運維難度大。
(二)運維問題響應處理及時性強,工作壓力大
隨著信息化應用的不斷深入,科研單位對信息化的依賴性與日俱增,信息化已成為是科研工作的正常開展的基礎。信息化運維工作不但要做到防患于未然,盡量避免問題的發(fā)生,同時還要做好應急處理。一旦信息化系統出現問題,必須第一時間響應并及時解決問題,將影響降到最低。因此,信息化運維工作及時性非常強,運維人員工作壓力大。
(三)運維管理制度不完善,操作流程與衡量標準不統一
目前科研單位雖然制定了信息化運維管理制度,但是大多都流于形式,沒有制定詳細的運維操作規(guī)程和質量衡量標準,這樣就造成了運維管理制度與實際工作并不能有效結合,對運維工作的質量、效率、工作量等無法進行評判,無法對運維人員進行有效的考核,沒有有效的評價機制,導致信息化運維管理制度失去約束力。
(四)運維隊伍建設不到位,績效評價機制不完善
一方面,信息化運維對專業(yè)技能要求高,而對運維人員的技術相關培訓不到位,導致技術水平滯后,造成運維水平落后。
另一方面,信息化運維人員在科研單位作為支撐崗位,往往存在不受重視的現象,績效評價機制不完善,出現相關人員待遇低、崗位低、職稱低的現象,導致人才流失,人才隊伍建設滯后等現象。
(一)建立信息化運維管理體系,實現運維管理的有效機制
信息化運維管理涉及到眾多信息系統、硬件設備、運維數據等,因此,科研單位可以充分運用當前流行的ITIL管理流程, 依據自身特點總結出與自身相符的規(guī)范的管理。
首先,運維管理體系要明確運維的對象和內容。信息化資源是運維工作的對象,必須建立資源基礎數據庫,全面掌握信息化資源的基本信息、詳細配置、設備狀態(tài)等情況,明確運維工作的具體內容,才能有效的開展信息化運維工作。
其次,運維管理體系要明確問題事件影響度和緊急度,并實現分級管理。通過分析單位信息化系統會產生的事故,并對事故的影響度、緊急度來進行分級。通過分級管理,制定好應急預案處理,明確相應的響應時間、解決措施和解決方案,從而及時處理問題事件。
再次,運維管理體系要明確管理責任制。明確運維團隊的人員組成,人員的具體工作內容與職責,同時做到崗位備份機制,避免工作落實不到位。
總之,通過信息化運維管理體系的建設,完整、全面、細致的規(guī)劃好運維工作,依靠技術和管理手段,使得每項運維工作有據可查、有章可循、有器可用,保證科研單位信息化運維工作順利開展。
(二)加強日常巡檢工作,動態(tài)掌握信息化設備的狀態(tài)
日常巡檢全面掌握信息化設備的狀態(tài),是開展運維工作的重要手段。巡檢工作可以按照不同的巡檢對象和內容,建立周期性巡檢工作機制。例如,可以分為每天、每周、每月、每季度巡檢。每天巡檢工作可以固定時間開展,進行例行檢查,例如登錄應用系統檢查是否正常、機房是否有報警、硬件設備是否有故障等;每周巡檢工作,運維人員可以對設備使用狀態(tài)進行檢查、分析,一旦發(fā)現問題及時解決;每月、每季度巡檢,可以針對某些基礎設施或是部分外包維保的設備,監(jiān)督運維商開展相關的運維服務并檢查完成的質量和有效性;
巡檢工作發(fā)現的問題及時處理,一方面通過檢查最先發(fā)現問題,在問題沒有擴散或是影響最低時及時解決問題,避免問題嚴重化;另一方面,要追溯問題的根源,不斷優(yōu)化系統的架構,改善架構設計的不完善和不合理的地方,避免單點故障的產生,保證系統運行正常。
(三)加強信息化運維工作知識的儲備,積累運維方法和問題處理方案
信息化運維工作中日常問題的處理,是信息化運維工作能力的體現。建立知名故障庫,通過對運維工作中每次遇到的問題都需要詳細記錄,尤其是對新遇到的問題,記錄問題的表象和解決問題的方法,形成知名的故障庫,并逐步完善該庫,儲備運維知識,從而指導后期運維工作中問題的處理,縮短解決時間,提升工作效率。
建立信息化運維工作手冊,制定詳細的運維操作規(guī)程和質量衡量標準。信息化運維管理人員建立且不斷完善信息化運維管理工作手冊,作為日常運維操作的參考和指導,對信息化應用系統、硬件設備的運維內容、操作流程、運維方法、注意事項進行詳細的描述,將運維管理工作書面化、標準化、規(guī)范化,提升運維管理水平。
(四)明確運維界面劃分,建立內控與外包相結合的運維管理模式
信息化運維作為科研單位信息化工作的支撐,應建立符合自身實際情況的運維管理模式,建議采用內控與外包相結合。
將信息化的基礎設施和硬件設備的保修等運維采用外包的方式,如機房空調、UPS、服務器、存儲等設備的硬件維修外包,在服務外包過程中,我們堅持“以我為主”,保持對系統建設運維的控制權。但關鍵技術、重要文檔和關鍵權限必須控制在自己手中,關鍵操作如系統的集成、變更工作不能外包。按照“服務外包、責任不外包”的原則,加強運維責任的監(jiān)督落實,采取定期檢查、事后審計的方式對服務外包進行監(jiān)控管理,建立風險防控三道防線。
內控管理則針對科研單位內部的核心應用系統,實現內部自主運維管理。核心應用系統是科研單位賴以生存和發(fā)展的基礎,是結合本單位業(yè)務和管理的特點建立的應用系統。因此,必須實現內部管理,系統日常運維由科研單位內部人員自主運維,一方面可以不斷優(yōu)化完善應用系統,另一方面保證當應用系統出現問題時,可以及時處理與解決。
(五)加強人才隊伍的建設,提高運維人員自身技術與管理水平
人才隊伍建設與能力提升,是信息化運維工作水平提升的重要途徑。通過定期組織相關專業(yè)的技術培訓,提升運維人員專業(yè)技術水平;通過經常性開展技術研討和經驗交流,提高運維人員團隊協作能力;通過參加一些產品宣講了解當今主流信息化技術與產品,提升科研單位信息化可持續(xù)發(fā)展的先進性。由此,通過不斷對運維工作人員開展技術培訓,自學、外部培訓等,從而提高信息化運維技術水平。
隨著科研單位信息化建設的不斷推進,信息化系統和硬件平臺的逐漸增加,運維管理任務日益繁重。為了保證信息化運維工作的順利開展,需要按照運維原則和運維范圍,規(guī)范運維行為,明確運維需求和目標。通過對信息化運維工作實現規(guī)范化、專業(yè)化、流程化、標準化的管理,提升運維工作的技術水平和管理水平,保證科研單位信息化系統安全、穩(wěn)定、高效的運行,從而保證科研單位科研工作的順利開展。
作者單位:中國科學院電子學研究所