文/趙園生
當(dāng)今是信息化時代,也是網(wǎng)絡(luò)技術(shù)發(fā)展迅速的時代,互聯(lián)網(wǎng)已經(jīng)滲透進(jìn)了人們的生活。在當(dāng)前人們的工作中,計算機的使用尤其重要,而企業(yè)發(fā)展進(jìn)行正常業(yè)務(wù)運行的前提就是保證服務(wù)器能夠正常運轉(zhuǎn),一旦發(fā)生服務(wù)器系統(tǒng)出現(xiàn)緊急故障的情況,就會導(dǎo)致計算機的系統(tǒng)不能進(jìn)行正常的運轉(zhuǎn),幾乎所有的業(yè)務(wù)都會隨之停止,嚴(yán)重影響公司的經(jīng)濟利益并且會造成其他一系列不良的后果。因此,在服務(wù)器出現(xiàn)障礙時,要及時對服務(wù)器系統(tǒng)進(jìn)行修復(fù),如何在最短的時間內(nèi)將服務(wù)器系統(tǒng)恢復(fù)正常應(yīng)用,并能夠正常進(jìn)行業(yè)務(wù),將企業(yè)的損失降到最小,是尤其重要的。利用存儲系統(tǒng)能夠加快修復(fù)服務(wù)器系統(tǒng)的故障,本篇文章對存儲系統(tǒng)恢復(fù)某家企業(yè)的服務(wù)器系統(tǒng)出現(xiàn)的緊急故障進(jìn)行了相應(yīng)的分析與討論。
這家企業(yè)日常運營所使用的服務(wù)器是IBMX460,安裝有IBMserverraid-8iRAID卡,并做了RAID5,操作系統(tǒng)是windows2000server,數(shù)據(jù)庫系統(tǒng)是SQL2000,數(shù)據(jù)庫中有整個企業(yè)人員的信息以及企業(yè)的運營流程。存儲系統(tǒng)是愛數(shù)PX1200,該存儲系統(tǒng)基于CDP持續(xù)數(shù)據(jù)保護(hù)技術(shù),支持Windows平臺下的SQLServ-er及支持完整的RAID級別的實時復(fù)制。IBM服務(wù)器和愛數(shù)存儲系統(tǒng)在本單位局域網(wǎng)中同處于一個VLAN中,同一個網(wǎng)段。IBM服務(wù)器的IP是192.168.0.27(以下稱為27服務(wù)器),愛數(shù)存儲系統(tǒng)的IP是192.168.0.253,網(wǎng)關(guān)都是192.168.0.254。
在解決之前,先試著到一處工作用電腦進(jìn)行登錄,發(fā)現(xiàn)服務(wù)器系統(tǒng)登錄登錄不上去,并且ping27服務(wù)器和網(wǎng)絡(luò)鏈路都是通的,又在此情況下檢查了幾個其他工作地點的電腦登錄,都是同樣的問題狀況。因此,維護(hù)人員判斷網(wǎng)絡(luò)鏈路沒有問題,推測是27服務(wù)器出現(xiàn)了故障,檢查發(fā)現(xiàn)服務(wù)器處于關(guān)機狀態(tài)。估計是由于停電的原因,再加上UPS出問題不能為27服務(wù)器供電。先打開27服務(wù)器,嘗試幾次都進(jìn)不去,推測是停電導(dǎo)致系統(tǒng)文件造成損壞,不能進(jìn)入系統(tǒng)。
企業(yè)以前購買了愛數(shù)存儲系統(tǒng)PX1200,在啟用PX1200后,用它備份了27服務(wù)器的操作系統(tǒng)及應(yīng)用系統(tǒng),并對SQL數(shù)據(jù)庫作了實時備份。由于27服務(wù)器中運行的是企業(yè)經(jīng)營中的重要業(yè)務(wù),所以在備份完成后,沒有對完成的備份進(jìn)行驗證,也不確定是否成功將服務(wù)器系統(tǒng)徹底恢復(fù)。經(jīng)過一系列的分析,針對這次服務(wù)器系統(tǒng)出現(xiàn)故障的狀況,調(diào)試人員決定用愛數(shù)存儲系統(tǒng)PX1200來恢復(fù)操作系統(tǒng),用這種方式來驗證PX1200能否安全地將服務(wù)器系統(tǒng)進(jìn)行恢復(fù),并且在最短的時間內(nèi)恢復(fù)數(shù)據(jù)庫,過程中沒有任何損失,降低本次服務(wù)器系統(tǒng)故障造成的不好的影響,并且減少企業(yè)在這次服務(wù)器系統(tǒng)故障過程中造成的損失。
由于沒有在系統(tǒng)進(jìn)行備份的過程中加載企業(yè)人員的信息數(shù)據(jù)庫,所以在本次修復(fù)服務(wù)器系統(tǒng)后應(yīng)將公司人員的信息數(shù)據(jù)庫加上去。加上數(shù)據(jù)庫的過程很簡明,將SQL2000的企業(yè)管理器打開,點擊數(shù)據(jù)庫這一項,選擇所有要進(jìn)行的任務(wù)附加應(yīng)用數(shù)據(jù)庫就完成了這個過程。這只一系列的動作完成后,測試相應(yīng)的應(yīng)用系統(tǒng),結(jié)果是系統(tǒng)完全能夠正常運行,并且之前最后一步中存入的數(shù)據(jù)庫也保存完好,服務(wù)系系統(tǒng)完全得到修復(fù)。這次利用存儲系統(tǒng)進(jìn)行服務(wù)器系統(tǒng)修復(fù)的過程只用了30分鐘,并且服務(wù)器系統(tǒng)完全可以正常運行。利用存儲系統(tǒng)進(jìn)行服務(wù)器修復(fù)能夠減少修復(fù)的時間,并且具有安全、穩(wěn)定、高效率的優(yōu)點,在實際應(yīng)用中有著重要的意義。
當(dāng)企業(yè)的服務(wù)器系統(tǒng)在出現(xiàn)突發(fā)性故障時,這種緊急情況下維護(hù)人員更不能慌亂。要保持清醒、冷靜的頭腦,判斷可能導(dǎo)致故障發(fā)生的具體位置,從最初的判斷開始一點一點地摸清發(fā)生故障的位置,并根據(jù)身邊能夠利用的資源對這次故障采取最有效的解決辦法,盡量在最短的時間內(nèi)將服務(wù)器系統(tǒng)修復(fù)完成,并保證系統(tǒng)能夠正常穩(wěn)定地使用。運營維護(hù)人員還必須將所有設(shè)備的資料、信息和驅(qū)動盤保管好,保證其安全性。維護(hù)人員也要定期檢查服務(wù)器系統(tǒng)的運行狀態(tài),檢查設(shè)備的功能和狀態(tài)是否良好,保證設(shè)備配置參數(shù)正常,一旦發(fā)現(xiàn)任何故障或情況都要及時進(jìn)行維修處理,防止設(shè)備運營過程中出現(xiàn)更大的故障,導(dǎo)致產(chǎn)生更大的損失。
在這次服務(wù)器系統(tǒng)的實際修復(fù)過程中,利用存儲系統(tǒng)能夠?qū)⑵浜芸斓剡M(jìn)行修復(fù),并且過程安全,修復(fù)后的服務(wù)器系統(tǒng)也相對來說特別穩(wěn)定,沒有對企業(yè)造成嚴(yán)重的損失,也沒有過多地影響企業(yè)的正常運作。利用存儲系統(tǒng)來恢復(fù)服務(wù)器系統(tǒng)故障是一個非??尚胁⒕哂幸欢▽嶋H意義的修復(fù)手段,對服務(wù)器系統(tǒng)恢復(fù)中的應(yīng)用有著重要的作用和意義。