王芳芳
摘要:數(shù)據(jù)中心運(yùn)維管理是高校信息化建設(shè)工作中極為重要的一環(huán)。文章從分析高校數(shù)據(jù)中心的運(yùn)維管理體系和管理流程入手,剖析運(yùn)維管理工作中存在的困境和問題,從政策和管理、人員、技術(shù)、日常運(yùn)維管理4個(gè)方面探討數(shù)據(jù)中心正常穩(wěn)定運(yùn)行的具體措施。
關(guān)鍵詞:數(shù)據(jù)中心;管理;運(yùn)維;網(wǎng)絡(luò)安全;數(shù)據(jù)安全
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2024)04-0084-03
0 引言
隨著信息技術(shù)的發(fā)展和應(yīng)用,高校的信息化程度也日益提高,信息化建設(shè)成為了現(xiàn)代教育事業(yè)的核心。數(shù)據(jù)中心作為高校信息化建設(shè)的核心和重要基礎(chǔ)設(shè)施[1],有著不可忽視的重要性,其運(yùn)維管理變得越來越重要。李鑫等[1]從高校數(shù)據(jù)中心的組成、運(yùn)維管理現(xiàn)狀和安全運(yùn)維管理的必要性三個(gè)方面入手,分析了高校數(shù)據(jù)中心面臨的運(yùn)行風(fēng)險(xiǎn),從安全角度探討了數(shù)據(jù)中心在運(yùn)維管理過程中采取的措施;艾飛等[2]從管理制度角度探索數(shù)據(jù)中心的運(yùn)維管理的措施;魏冠華[3]選定管理模式、建立管理制度、做好日常運(yùn)行維護(hù)等多個(gè)層面討論了高校數(shù)據(jù)中心機(jī)房的規(guī)范管理,同時(shí)還分析了機(jī)房管理方面的重點(diǎn)內(nèi)容;鄭富煌[4]從中心機(jī)房運(yùn)維管理流程優(yōu)化展開研究,提升各類用戶滿意度的目標(biāo);劉小云[5]利用運(yùn)維審計(jì)設(shè)備即堡壘機(jī)這個(gè)統(tǒng)一的運(yùn)維中樞,幫助運(yùn)維人員高效完成運(yùn)維工作。
本文將從分析高校數(shù)據(jù)中心的運(yùn)維管理體系和管理流程入手,接著剖析運(yùn)維管理工作中存在的困境和問題,最后從政策和管理、人員、技術(shù)、日常運(yùn)維管理4個(gè)方面探討數(shù)據(jù)中心正常穩(wěn)定運(yùn)行的具體措施。
1 高校數(shù)據(jù)中心的運(yùn)維管理體系
高校的數(shù)據(jù)中心承擔(dān)著諸多重要的功能和任務(wù),如教學(xué)管理、人事管理、財(cái)務(wù)管理、科研管理、學(xué)工管理、資產(chǎn)管理等。它作為高校信息化建設(shè)的核心,要保障整個(gè)高校的信息流動和安全。一個(gè)高效、穩(wěn)定的數(shù)據(jù)中心是高校信息化建設(shè)的基礎(chǔ)保障,也是高校走向信息時(shí)代的必備條件。因此,高校數(shù)據(jù)中心的運(yùn)維管理是保證信息化建設(shè)穩(wěn)步發(fā)展的關(guān)鍵環(huán)節(jié)。高校數(shù)據(jù)中心運(yùn)維管理體系,如圖1所示。
2 高校數(shù)據(jù)中心的管理流程
高校的數(shù)據(jù)中心管理流程包含了多個(gè)方面,而且需要不斷地去優(yōu)化和完善,以保證數(shù)據(jù)中心的正常、穩(wěn)定、高效地運(yùn)行。
2.1 預(yù)防性維護(hù)
預(yù)防性維護(hù)是保證數(shù)據(jù)中心正常運(yùn)行的關(guān)鍵環(huán)節(jié),其中包括以下幾個(gè)方面。
1) 設(shè)備安全:首先,進(jìn)行設(shè)備安全管理,防止設(shè)備受到物理損壞。其次,通過數(shù)據(jù)備份等手段,預(yù)防因?yàn)樵O(shè)備損壞引起的數(shù)據(jù)丟失問題。
2) 設(shè)備性能監(jiān)控:定期檢查設(shè)備運(yùn)行情況,及時(shí)發(fā)現(xiàn)問題并進(jìn)行修復(fù)。此外,通過適當(dāng)?shù)谋O(jiān)控軟件,可以查看設(shè)備的性能情況,及時(shí)預(yù)測設(shè)備過載的情況,并進(jìn)行調(diào)整。
3) 設(shè)備維護(hù):定期進(jìn)行專業(yè)的設(shè)備維護(hù),收集設(shè)備運(yùn)行的日志,記錄設(shè)備的使用情況,為后續(xù)分析、調(diào)整做好準(zhǔn)備。
2.2 運(yùn)行調(diào)查
對于數(shù)據(jù)中心中的每一項(xiàng)工作,都需要開展運(yùn)行調(diào)查,了解工作的具體情況,以便及時(shí)發(fā)現(xiàn)問題并進(jìn)行解決。包括以下幾個(gè)方面。
1) 合理分配資源:根據(jù)工作負(fù)載、硬件資源等因素,合理安排各項(xiàng)工作,避免資源的浪費(fèi)。
2) 工作流程優(yōu)化:對數(shù)據(jù)中心的各項(xiàng)工作,建立良好的流程,及時(shí)發(fā)現(xiàn)并及時(shí)解決問題。
3) 一次定位:對數(shù)據(jù)中心運(yùn)行過程中出現(xiàn)的問題,應(yīng)該及時(shí)進(jìn)行定位,降低故障修復(fù)時(shí)間和成本。
2.3 綜合監(jiān)管
綜合監(jiān)管旨在提升數(shù)據(jù)中心的管理水平和效率,及時(shí)發(fā)現(xiàn)潛在的安全隱患和性能問題,調(diào)整服務(wù)策略,提高用戶的滿意度。綜合監(jiān)管包括以下幾個(gè)方面。
1) 合規(guī)性監(jiān)管:制定合理的安全措施和管理流程,防止數(shù)據(jù)泄露、損失、受損等風(fēng)險(xiǎn)。
2) 性能監(jiān)管:定期檢查各系統(tǒng)、組件的性能,對性能問題及時(shí)做出反應(yīng)和調(diào)整,保障用戶的滿意度。
3) 資產(chǎn)管理:對無用、老化的設(shè)備進(jìn)行及時(shí)替換和淘汰,充分利用資源,避免資源浪費(fèi)。
2.4 故障應(yīng)對
數(shù)據(jù)中心可能會遇到多種故障,例如電力故障、硬件故障、網(wǎng)絡(luò)故障和溫度過高。電力故障可能會導(dǎo)致整個(gè)數(shù)據(jù)中心關(guān)機(jī),原因可能是停電、電源故障或電纜故障等;硬件故障可能會影響服務(wù)器和存儲設(shè)備,導(dǎo)致數(shù)據(jù)丟失或應(yīng)用停機(jī);網(wǎng)絡(luò)故障可能導(dǎo)致數(shù)據(jù)中心無法連接到互聯(lián)網(wǎng)或運(yùn)行應(yīng)用程序,甚至可能造成數(shù)據(jù)丟失;溫度過高可能會損壞數(shù)據(jù)中心的服務(wù)器和存儲設(shè)備,因此需要確保數(shù)據(jù)中心保持良好的散熱系統(tǒng)。這些故障對數(shù)據(jù)中心的影響很大,所以需要進(jìn)行預(yù)防和及時(shí)處理,以保證數(shù)據(jù)中心的穩(wěn)定性和可靠性。
1) 要提前建立各種故障的應(yīng)急預(yù)案,這樣在故障發(fā)生時(shí),不至于手足無措,而是有條不紊地進(jìn)行故障恢復(fù)操作或者切換到臨時(shí)方案,以保證業(yè)務(wù)的正常運(yùn)行。
2) 建立一個(gè)管理團(tuán)隊(duì),由經(jīng)驗(yàn)豐富的管理員和技術(shù)人員共同組成。有時(shí)數(shù)據(jù)中心的故障排查難度較大,需要多個(gè)崗位以及多個(gè)供應(yīng)商的人員共同合作才能解決。
3 高校數(shù)據(jù)中心運(yùn)維管理的困境和問題
在高校數(shù)據(jù)中心運(yùn)維管理工作過程中,困境和問題也較為突出:
1) 設(shè)備和軟件開支。高校雖然已經(jīng)知曉數(shù)據(jù)中心的重要性,但是由于學(xué)校的經(jīng)費(fèi)有限,無法買到或買全心儀的產(chǎn)品和方案,此種類型的財(cái)務(wù)負(fù)擔(dān)成為需要重點(diǎn)解決的問題。
2) 招投標(biāo)體系和管理。數(shù)據(jù)中心從建設(shè)到正常運(yùn)行,會有很多招投標(biāo)過程。在這過程中,往往會出現(xiàn)低價(jià)沖標(biāo)的情況,最終提供的產(chǎn)品、方案、服務(wù)也差強(qiáng)人意。
3) 供電系統(tǒng)管理。一些數(shù)據(jù)中心沒有采取足夠的措施保證供電的穩(wěn)定性和可靠性。例如,供電設(shè)備可能出現(xiàn)故障,或高校附近施工導(dǎo)致的區(qū)域大面積斷電,導(dǎo)致數(shù)據(jù)中心供電中斷或不穩(wěn)定,影響到數(shù)據(jù)中心的正常運(yùn)行。
4) 系統(tǒng)平臺不穩(wěn)定。教學(xué)壓力大,系統(tǒng)上不穩(wěn)定,會給教學(xué)質(zhì)量帶來不利影響,并且如果系統(tǒng)故障,無法及時(shí)采取措施保護(hù)教育教學(xué)的正常開展。
5) 師生信息安全問題。由于信息化建設(shè)的應(yīng)用情況不同,信息和數(shù)據(jù)管理、分析、升級等過程中數(shù)據(jù)隱私和信息泄露問題凸顯,使師生的信息安全受到威脅。
6) 網(wǎng)絡(luò)安全問題。缺乏對網(wǎng)絡(luò)病毒和黑客攻擊的防范措施,就很難保證數(shù)據(jù)的安全性和完整性,這可能導(dǎo)致數(shù)據(jù)泄露或系統(tǒng)崩潰等安全問題。
7) 缺乏專業(yè)的運(yùn)維管理人員。如果沒有專業(yè)的運(yùn)維管理人員,就很難保證數(shù)據(jù)中心的穩(wěn)定性和可靠性。
8) 缺乏專門的數(shù)據(jù)備份和恢復(fù)措施。這可能導(dǎo)致數(shù)據(jù)丟失或系統(tǒng)崩潰等嚴(yán)重后果。
4 數(shù)據(jù)中心運(yùn)維管理的措施
為了更好地實(shí)現(xiàn)高效穩(wěn)定的數(shù)據(jù)中心運(yùn)維管理,下面提出了一些具體措施。
4.1 政策和管理方面
1) 加強(qiáng)資金保障。數(shù)據(jù)中心的建設(shè)和運(yùn)營需要大量且長期的資金投入,主要用于數(shù)據(jù)中心的升級和維護(hù)、設(shè)備的折舊和管理、數(shù)據(jù)存儲和管理、網(wǎng)絡(luò)安全和升級、保持高可用性、進(jìn)行冗余設(shè)計(jì)、設(shè)備和產(chǎn)品的定期升級和改造等。如果資金無法到位,數(shù)據(jù)中心將無法提供穩(wěn)定、高效的服務(wù),進(jìn)而影響教學(xué)和科研等各方面的質(zhì)量。
2) 強(qiáng)化數(shù)據(jù)中心的監(jiān)管與管理。高校數(shù)據(jù)中心的監(jiān)管與管理至關(guān)重要。在數(shù)據(jù)中心運(yùn)維管理過程中,需要明確崗位職責(zé)和工作要求,并對數(shù)據(jù)中心的運(yùn)營情況進(jìn)行動態(tài)監(jiān)管。采取有效的管理流程,清晰劃定管理角色,及時(shí)了解數(shù)據(jù)中心的運(yùn)營狀況,識別潛在的問題、瓶頸和風(fēng)險(xiǎn),并采取針對性的管理措施,及時(shí)糾正并加強(qiáng)內(nèi)部監(jiān)督,提高整個(gè)管理體系的效率和精準(zhǔn)性,減少管理過程中的瑕疵和錯(cuò)誤,保證數(shù)據(jù)中心的高效穩(wěn)定運(yùn)行。
4.2 人員方面
1) 建立數(shù)據(jù)中心管理團(tuán)隊(duì)。高校數(shù)據(jù)中心的規(guī)模較大、復(fù)雜且重要,其中涉及的領(lǐng)域有很多,如基礎(chǔ)設(shè)施管理、系統(tǒng)管理、數(shù)據(jù)庫管理、網(wǎng)絡(luò)管理、安全管理等。因此,建立一個(gè)管理團(tuán)隊(duì),由經(jīng)驗(yàn)豐富的、擁有一定專業(yè)知識和技能的管理員和技術(shù)人員共同組成,協(xié)同工作、協(xié)同保障數(shù)據(jù)中心的正常運(yùn)行。團(tuán)隊(duì)需要嚴(yán)格遵守管理規(guī)范、安全規(guī)范、數(shù)據(jù)規(guī)范等方面的標(biāo)準(zhǔn),確保數(shù)據(jù)中心的管理流程和管理質(zhì)量。
2) 高效的溝通協(xié)作機(jī)制。高效運(yùn)維管理不是簡單的流程和規(guī)則的制定,更關(guān)鍵的是管理人員在整個(gè)過程中的積極配合和有效溝通。數(shù)據(jù)中心涉及業(yè)務(wù)較多,不同團(tuán)隊(duì)的工作之間有許多交叉點(diǎn),在數(shù)據(jù)中心運(yùn)維管理中,管理人員和技術(shù)人員之間需要建立超越崗位和職責(zé)的優(yōu)秀協(xié)作關(guān)系,共同制定高質(zhì)量和可行的運(yùn)維管理方案,協(xié)同解決數(shù)據(jù)中心管理中的問題和矛盾,共同推動業(yè)務(wù)的優(yōu)化和提高。
此外,還需加強(qiáng)與其他部門的溝通和協(xié)調(diào),爭取更多的支持和資源,以便更好地進(jìn)行數(shù)據(jù)中心的管理和維護(hù)。
3) 學(xué)習(xí)與培訓(xùn)。隨著信息技術(shù)和管理技術(shù)不斷發(fā)展和完善,數(shù)據(jù)中心的運(yùn)維管理需要不斷學(xué)習(xí)新知識和新技能,以應(yīng)對日益增長的需求。管理人員和技術(shù)人員需要定期參加培訓(xùn)和學(xué)習(xí),通過自學(xué)、培訓(xùn)、交流、實(shí)踐等方式,不斷提升自己的技能和知識水平,保障數(shù)據(jù)中心的高效穩(wěn)定運(yùn)行。
4.3 技術(shù)方面
1) 推廣新技術(shù)。隨著數(shù)據(jù)中心業(yè)務(wù)的不斷擴(kuò)展、技術(shù)水平的提升,需要持續(xù)推進(jìn)新技術(shù)與新思路的應(yīng)用,以適應(yīng)日益復(fù)雜的數(shù)據(jù)中心環(huán)境,為數(shù)據(jù)中心管理及優(yōu)化帶來新的機(jī)會與挑戰(zhàn)。
2) 不斷優(yōu)化數(shù)據(jù)中心架構(gòu)。隨著新技術(shù)的不斷涌現(xiàn)和業(yè)務(wù)設(shè)計(jì)的不斷完善,高校數(shù)據(jù)中心的架構(gòu)也需要不斷優(yōu)化和調(diào)整。
3) 實(shí)施自動化運(yùn)維管理。隨著自動化技術(shù)的不斷發(fā)展,數(shù)據(jù)中心運(yùn)維管理的自動化成為了一種趨勢。通過引入自動化技術(shù),可以大大減少數(shù)據(jù)中心運(yùn)維管理的工作量和出錯(cuò)率,并能夠提高數(shù)據(jù)中心管理的效率和便捷性。目前,很多自動化技術(shù),如自動化部署、自動化監(jiān)控等技術(shù),在數(shù)據(jù)中心管理中得到了廣泛應(yīng)用。
4.4 日常運(yùn)維管理方面
1) 持續(xù)的監(jiān)控。原則上,對于整個(gè)數(shù)據(jù)中心里的所有設(shè)備和系統(tǒng),都應(yīng)設(shè)置監(jiān)控程序,保證其能夠及時(shí)對現(xiàn)場狀態(tài)進(jìn)行監(jiān)測。設(shè)備狀態(tài)、溫度、風(fēng)扇轉(zhuǎn)速、網(wǎng)絡(luò)傳輸能力等方面,直到細(xì)節(jié)都應(yīng)進(jìn)行監(jiān)控??膳鋫湎嚓P(guān)的警告機(jī)制,一旦某項(xiàng)參數(shù)發(fā)生問題,管理員立即收到警報(bào),及時(shí)處理問題。
2) 加強(qiáng)數(shù)據(jù)安全管理。數(shù)據(jù)安全對于高校數(shù)據(jù)中心來說尤其關(guān)鍵。高校數(shù)據(jù)中心,經(jīng)常有大量的重要數(shù)據(jù)。這些數(shù)據(jù)可能是研究人員的科研成果,也可能是學(xué)校的招生數(shù)據(jù),或者是學(xué)生課程表、成績等個(gè)人信息。因此,應(yīng)加強(qiáng)數(shù)據(jù)安全管控與管理,完善數(shù)據(jù)備份的手段和機(jī)制,保證備份操作的可靠性和有效性,以應(yīng)對數(shù)據(jù)丟失和其他數(shù)據(jù)安全問題。同時(shí),也應(yīng)該加強(qiáng)網(wǎng)絡(luò)安全防御措施,避免黑客攻擊、病毒入侵和其他網(wǎng)絡(luò)風(fēng)險(xiǎn),保證學(xué)校信息資產(chǎn)不受損失。
3) 強(qiáng)化故障應(yīng)對與恢復(fù)。在數(shù)據(jù)中心運(yùn)維管理過程中,難免會遇到各種故障和意外情況,如電力故障、服務(wù)器故障、網(wǎng)絡(luò)中斷等。為了保證數(shù)據(jù)中心的高效穩(wěn)定運(yùn)行,需要建立相應(yīng)的故障應(yīng)對和恢復(fù)機(jī)制,及時(shí)對故障進(jìn)行處置和恢復(fù),保證業(yè)務(wù)不受影響。同時(shí),也需要對每一次故障進(jìn)行分析和總結(jié),不斷完善故障應(yīng)對和恢復(fù)機(jī)制,提升數(shù)據(jù)中心運(yùn)維管理的水平和效率。
4) 提高設(shè)備的利用率。在設(shè)備管理方面,采取各種方法與策略,優(yōu)化和提高設(shè)備的使用效率。有效利用硬件資源,提前發(fā)現(xiàn)問題,盡可能延長設(shè)備的壽命。對于某些舊設(shè)備,可以通過固化其專屬的業(yè)務(wù)或?qū)⑵渥優(yōu)槿萜鞣?wù)器,轉(zhuǎn)化為新的應(yīng)用場景,提高設(shè)備的利用率。
5 結(jié)束語
數(shù)據(jù)中心運(yùn)維管理是高校信息化建設(shè)工作中極為重要的一環(huán)。高效穩(wěn)定地運(yùn)行數(shù)據(jù)中心,要依靠各方力量,只有通過不斷地優(yōu)化、改進(jìn)工作流程、加強(qiáng)管理、資金保障、提高運(yùn)維管理人員素質(zhì)等方面,才能真正保持?jǐn)?shù)據(jù)中心的順暢工作。在高校數(shù)據(jù)中心的運(yùn)維管理過程中,需要高度重視問題和挑戰(zhàn),并及時(shí)采取有力措施,持續(xù)不斷地提升數(shù)據(jù)中心的管理水平和運(yùn)行效率。只有在實(shí)際工作中不斷探索和實(shí)踐,不斷提高管理水平和技術(shù)能力,才能更好地應(yīng)對數(shù)據(jù)中心運(yùn)維管理的各種挑戰(zhàn),為高校的教學(xué)和科研事業(yè)提供更好的技術(shù)支持和保障,促進(jìn)學(xué)校信息化建設(shè)的整體發(fā)展。
參考文獻(xiàn):
[1] 李鑫,張琴.高校數(shù)據(jù)中心安全運(yùn)維實(shí)踐研究[J].山西大同大學(xué)學(xué)報(bào)(自然科學(xué)版),2022,38(4):33-37.
[2] 艾飛,黃建波,蘇宣瑞,等.華南理工大學(xué)數(shù)據(jù)中心管理之道[J].中國教育網(wǎng)絡(luò),2022(8):63-65.
[3] 魏冠華.高校圖書館數(shù)據(jù)中心機(jī)房管理研究[J].科技資訊,2020,18(18):199-200.
[4] 鄭富煌.數(shù)據(jù)中心機(jī)房硬件設(shè)備運(yùn)維管理研究[J].網(wǎng)絡(luò)安全和信息化,2023(8):59-61.
[5] 劉小云.淺談高校關(guān)于數(shù)據(jù)中心安全運(yùn)維的方法[J].電腦知識與技術(shù),2021,17(22):44-45,52.
【通聯(lián)編輯:聞翔軍】