賓劍蘭
摘要:本文主要介紹了企業(yè)計算機關(guān)鍵應(yīng)用系統(tǒng)應(yīng)急研究的方案和實施過程。
關(guān)鍵詞:關(guān)鍵系統(tǒng) 方案 實施
1 簡介
計算機關(guān)鍵應(yīng)用系統(tǒng)在現(xiàn)代企業(yè)生產(chǎn)經(jīng)營管理中的應(yīng)用越來越普及和廣泛,筆者所在企業(yè)主要有ERP系統(tǒng)、OA系統(tǒng)、AEI系統(tǒng)和HMIS(鐵路貨車技術(shù)管理信息系統(tǒng))系統(tǒng),這些系統(tǒng)的正常運行關(guān)系到企業(yè)的生產(chǎn)、經(jīng)營、管理、產(chǎn)品交付等各個方面的正常運轉(zhuǎn)。
2 實施過程
2.1 集思廣益,確立應(yīng)急研究方案。通過組織各應(yīng)用系統(tǒng)管理員梳理影響關(guān)鍵應(yīng)用系統(tǒng)正常運行的各種因素,確定主要從以下幾個方面進行研究:①研究關(guān)鍵應(yīng)用系統(tǒng)在支撐系統(tǒng)、應(yīng)用系統(tǒng)、數(shù)據(jù)庫等方面的配置是否滿足企業(yè)對應(yīng)用、管理和安全的需要;②研究關(guān)鍵應(yīng)用系統(tǒng)的日常監(jiān)控,完善服務(wù)器監(jiān)控管理平臺監(jiān)控內(nèi)容和策略,建立應(yīng)用系統(tǒng)日常監(jiān)控表;③研究影響關(guān)鍵應(yīng)用系統(tǒng)數(shù)據(jù)備份和恢復(fù)成功的原因,保證應(yīng)用系統(tǒng)數(shù)據(jù)丟失時能及時完整的恢復(fù)數(shù)據(jù);④研究如何保證環(huán)境電力支持關(guān)鍵應(yīng)用系統(tǒng)的正常運行;⑤研究如何從管理制度上保證關(guān)鍵應(yīng)用系統(tǒng)的正常有效運行。
2.2 明確分工,分步實施。由于關(guān)鍵應(yīng)用系統(tǒng)應(yīng)急研究牽涉的系統(tǒng)多、覆蓋面廣,為了保證應(yīng)急研究方案的實施落到實處,我們按應(yīng)用系統(tǒng)進行了分工,每位系統(tǒng)管理員負責(zé)從6大方面對管理的應(yīng)用系統(tǒng)進行梳理,提出需要完善、改進、新增的工作,然后由項目負責(zé)人牽頭組織實施。
2.3 管理和技術(shù)手段雙管齊下,實現(xiàn)系統(tǒng)的高可用性。
2.3.1 在應(yīng)用系統(tǒng)的安裝配置方面。①原有服務(wù)器操作系統(tǒng)的安裝都是由服務(wù)器管理員自行安裝,沒有統(tǒng)一的安裝配置模板,為了保證服務(wù)器操作系統(tǒng)安裝后不出現(xiàn)問題,建立了操作系統(tǒng)標(biāo)準(zhǔn)化安裝、配置模板。②為了保證服務(wù)器的穩(wěn)定性、合理性和規(guī)范性,結(jié)合服務(wù)器的硬件特性和應(yīng)用系統(tǒng)的使用需求提出服務(wù)器硬件選型配置建議方案。③將分散在各應(yīng)用系統(tǒng)管理員手上的各應(yīng)用系統(tǒng)、數(shù)據(jù)庫安裝配置文檔進行統(tǒng)一管理,保證系統(tǒng)恢復(fù)時有備可查。④為了在恢復(fù)應(yīng)用系統(tǒng)時能夠按照原有配置重建操作系統(tǒng)和應(yīng)用系統(tǒng),建立了各應(yīng)用系統(tǒng)硬件、應(yīng)用系統(tǒng)、網(wǎng)絡(luò)配置信息表。⑤為了積累處理系統(tǒng)故障經(jīng)驗,建立了機房故障處理表和應(yīng)用系統(tǒng)故障處理表。⑥服務(wù)器開、關(guān)機步驟不正確會導(dǎo)致系統(tǒng)數(shù)據(jù)丟失,規(guī)范了應(yīng)用系統(tǒng)開、關(guān)機步驟。
2.3.2 在應(yīng)用系統(tǒng)的日常監(jiān)控方面。①重新梳理關(guān)鍵應(yīng)用系統(tǒng)監(jiān)控內(nèi)容和策略,利用服務(wù)器監(jiān)控管理平臺保證監(jiān)控的及時、有效。②針對應(yīng)用系統(tǒng)管理員日常監(jiān)控存在隨意性,監(jiān)控內(nèi)容不規(guī)范,為了提高監(jiān)控質(zhì)量,對每個系統(tǒng)分別建立了各自的日常監(jiān)控表。③收集各種品牌的服務(wù)器報警燈解釋,加快服務(wù)器管理員對故障的判定。④強化服務(wù)器硬件、環(huán)境、電力的日常監(jiān)控,使故障能夠被及時發(fā)現(xiàn)。
2.3.3 在應(yīng)用系統(tǒng)的數(shù)據(jù)備份、恢復(fù)方面。①為了保證應(yīng)用系統(tǒng)備份數(shù)據(jù)的安全,將磁帶庫放置到檔案館,實現(xiàn)了一定意義上的異地備份。②提交磁帶庫、TSM軟件配置手冊,為重建系統(tǒng)做準(zhǔn)備。③隨著應(yīng)用系統(tǒng)的不斷變化,需要隨時完善、更新TSM數(shù)據(jù)備份策略。④及時更新數(shù)據(jù)備份介質(zhì)表。
2.3.4 在環(huán)境、電力支持方面。①UPS是企業(yè)提供凈化電源的唯一設(shè)備,為了了解設(shè)備的運行狀態(tài),定期請UPS原廠工程師對UPS進行體檢。針對UPS電池使用壽命定期進行更換,保證了斷電時機房的持續(xù)供電。②在長時間停電或UPS出現(xiàn)故障時,采用發(fā)電機供電來保證應(yīng)用系統(tǒng)的正常運行。③安裝機房空調(diào)自啟動設(shè)備,保證停電時,空調(diào)能自動啟動,保證滿足機房對溫度的要求。
2.3.5 在管理制度的保證方面。①嚴(yán)格執(zhí)行企業(yè)信息化管理制度,強化日常監(jiān)控、數(shù)據(jù)備份工作。②建立定期對關(guān)鍵應(yīng)用系統(tǒng)進行備份恢復(fù)測試的機制。
2.3.6 在采用技術(shù)手段實現(xiàn)高可用性、建立應(yīng)急流程及預(yù)案降低風(fēng)險方面。應(yīng)急流程及預(yù)案是關(guān)鍵應(yīng)用系統(tǒng)各種緊急事件和災(zāi)難性故障發(fā)生時有效應(yīng)對的措施,它能將故障對應(yīng)用系統(tǒng)的影響降到最低。①采用技術(shù)手段實現(xiàn)系統(tǒng)的高可用性,如ERP系統(tǒng)、AEI系統(tǒng)、HMIS系統(tǒng)都采用了主、備服務(wù)器,一旦主服務(wù)器宕機,備用服務(wù)器能在很短的時間內(nèi)完成切換,OA系統(tǒng)采用虛擬集群實現(xiàn)故障轉(zhuǎn)移。②針對各應(yīng)用系統(tǒng)特點,建立各自的應(yīng)急流程及預(yù)案,提交應(yīng)急處理人員聯(lián)系表。
3 實施體會
①通過對影響關(guān)鍵應(yīng)用系統(tǒng)穩(wěn)定運行的各種因素進行逐一排查,逐步整改,建立了一整套預(yù)防和應(yīng)急體系,做到事前預(yù)防和事后處理的過程有據(jù)可查,步驟清晰、流程規(guī)范,將故障對應(yīng)用系統(tǒng)的影響降到最低,從而有效的保障了企業(yè)各關(guān)鍵應(yīng)用系統(tǒng)的穩(wěn)定運行。②在進行關(guān)鍵應(yīng)用系統(tǒng)應(yīng)急研究的過程中,規(guī)范了系統(tǒng)管理員的崗位職責(zé)與考核標(biāo)準(zhǔn)、強化了日常監(jiān)控、數(shù)據(jù)備份與恢復(fù)機制。
4 后期設(shè)想
①強化日常管理,進一步把措施落實到實際工作中。②及時了解關(guān)鍵應(yīng)用系統(tǒng)的變化情況,從上述6大方面進行持續(xù)的更新和完善。③推廣關(guān)鍵應(yīng)用系統(tǒng)應(yīng)急研究成果,完善企業(yè)其他應(yīng)用系統(tǒng)的管理,提高企業(yè)信息化管理水平。④利用新的技術(shù)手段不斷提高應(yīng)用系統(tǒng)的穩(wěn)定性和高可用性。
參考文獻:
[1]馮海軍.探討計算機網(wǎng)絡(luò)建設(shè)中安全性問題及措施[J].電子制作,2013(15).
[2]裘曉燕.基于中間件在企業(yè)信息系統(tǒng)中的應(yīng)用[J].科技風(fēng),2009(12).
[3]陳杰勛,石柱,胡懷詠.計算機應(yīng)用系統(tǒng)的可靠性設(shè)計準(zhǔn)則[J]. 電子技術(shù)應(yīng)用,1996(09).