張力影 閆永君
摘要:科技與經濟的發(fā)展帶動數(shù)據中心不斷擴大自身規(guī)模,隨著系統(tǒng)的復雜程度越來越高,運維管理水平也需要同步增長,但現(xiàn)行智能運維管理平臺技術的一體化程度仍然較低,需要進一步開展運維研究。在這一背景下,文章從宏觀角度分析了管理平臺的架構設計與功能模塊,并以高速公路領域為例,對智能運維管理平臺技術的一體化運維開展研究,指出智能管理平臺能夠賦予運維工作以直觀性,讓整體工作的專業(yè)水平得以再創(chuàng)新高。
關鍵詞:智能運維管理平臺;一體化運維;互聯(lián)網
中圖分類號:TP391.44文獻標志碼:A圖1數(shù)據中心智能運維管理平臺軟件架構
0引言隨著科技進步,物聯(lián)網、云計算與大數(shù)據等技術的實用性不斷提高,加上國內數(shù)字化轉型腳步的加快,中國的數(shù)據中心業(yè)務增長速度遠超其他國家,而業(yè)務的增長也帶動了數(shù)據中心的擴建,越來越多的基礎設施維護讓監(jiān)測工作變得日益復雜,對相關人員的管理水平要求也有所上升。若數(shù)據中心存在未被發(fā)現(xiàn)的隱患,就會威脅IT系統(tǒng)的正常運行,導致數(shù)據傳輸與儲存的安全系數(shù)降低。而找到維護數(shù)據中心基礎設施的有效途徑成為現(xiàn)在互聯(lián)網行業(yè)的首要任務,而智能運維管理平臺正是有效途徑之一。
1架構設計
1.1數(shù)據中心基礎設施主要運維管理問題
相關電子信息設備需要被放置在數(shù)據中心運行。根據數(shù)據中心的規(guī)模與功能不同,可能是建筑物的一部分,也可能是一棟甚至幾棟建筑物。單個數(shù)據中心分為主機房、輔助區(qū)、行政管理區(qū)等[1]。
從微觀角度來看,新時代背景下出現(xiàn)的大型數(shù)據中心與綜合型園區(qū)的區(qū)別并不大,這會放大傳統(tǒng)動環(huán)監(jiān)控系統(tǒng)的缺陷。監(jiān)控系統(tǒng)在設計與應用等方面存在重合與同質化現(xiàn)象,無法根據實際需求調整功能。橫跨多棟建筑物的子系統(tǒng)交互存在壁壘,傳統(tǒng)監(jiān)控系統(tǒng)雖然信息化水平較高,卻不具備智能化功能。數(shù)據采集功能需要分區(qū)塊執(zhí)行,綜合應用程度低。拓展應用需要大量的成本支撐。管理效率低下,甚至無法實現(xiàn)集中式管理,管理過程也較為復雜。無法實時監(jiān)控重要設備的狀態(tài),不能及時發(fā)現(xiàn)潛在隱患,事故預警能力差。
1.2數(shù)據中心智能運維管理平臺軟件將智能運維管理平臺應用于數(shù)據中心,可以有效解決上述問題,實現(xiàn)一體化運維管理,其具體表現(xiàn)在:
智能運維管理平臺能夠打通不同建筑內子系統(tǒng)之間的交互壁壘,拓寬數(shù)據傳輸渠道,提高傳輸?shù)陌踩禂?shù),便于實現(xiàn)系統(tǒng)的聯(lián)動控制。借助多協(xié)議物聯(lián)網網關,管理平臺能夠同時采集不同通信協(xié)議的信息,提高采集的兼容性,擴大采集覆蓋面,滿足設備的個性化需求。智能運維管理平臺作為物聯(lián)網平臺的一種,可以快速處理大量數(shù)據,在數(shù)據中心內部完成采集、儲存等工作,再通過專家引擎?zhèn)蓽y潛在隱患,及時做出隱患預警,還可以自動積累偵測與分析經驗,搭建診斷規(guī)則庫,在平臺內部共享數(shù)據,為數(shù)據中心和網絡設備的建模與挖掘提供基礎條件。該平臺能夠模擬數(shù)據中心基礎設施的運行工作狀態(tài),演練終端運作過程,其架構如圖1所示。
由此可以看出,智能運維管理平臺包括展示層、應用層與采集層等5個環(huán)節(jié)[2]。
1.2.1采集層該環(huán)節(jié)主要負責數(shù)據采集,對物聯(lián)網的應用程度最高。站在器件角度來看,該環(huán)節(jié)由數(shù)個傳感網絡與感應器件組成,對高新技術的需求量較大,包括射頻、無線網絡、現(xiàn)場總線等。
1.2.2接入層該環(huán)節(jié)需要應用網絡通信技術與信息設備,逐個接入采集層子系統(tǒng)獲取設備參數(shù),包括因特網絡、有線網絡、IoT網關等,過程中涉及的協(xié)議數(shù)量較多,如SNMP/OPC和MQTT等。
1.2.3平臺層該環(huán)節(jié)主要處理數(shù)據,并對這些數(shù)據進行分析與診斷,需要配套的數(shù)據引擎。涉及的公共服務組件數(shù)量十分龐大,對系統(tǒng)引擎的要求較高。核心技術包括無損實時數(shù)據壓縮傳輸?shù)取?/p>
1.2.4應用層該層主要用于構建業(yè)務,可以完成所有業(yè)務管理模塊與業(yè)務服務,如監(jiān)控、連接、事件記錄、崗位變更、人力調配等。
1.2.5展示層該層能夠直接接觸用戶,是用戶與數(shù)據中心交互的關鍵環(huán)節(jié),包括可視化大屏、移動終端軟件等交互形式,有明顯的多元化特點,讓用戶能夠隨時隨地使用各種方式接入平臺[3]。
1.3數(shù)據中心智能運維管理平臺系統(tǒng)泛用性較高的大型數(shù)據中心園區(qū)智能運維管理平臺系統(tǒng)結構如圖2所示。
位于系統(tǒng)中間位置的接入層能夠在連接園區(qū)與平臺的同時,將各個建筑物中的子系統(tǒng)串通為一個整體,并利用園區(qū)通信網絡,讓智能運維管理平臺也得到實時數(shù)據。此外,系統(tǒng)接入層還能夠為這些數(shù)據提供智能化應用服務,滿足總控中心、物業(yè)管理等部門的工作需求,并在物聯(lián)網與人工智能的幫助下拓展智慧化應用服務。
2功能模塊對于智能運維管理平臺來說,應用層作為核心層級,是在業(yè)務建構基礎上搭建完成的,是眾多模塊中最能體現(xiàn)管理平臺智能化水平的部分,其核心功能包括:設施監(jiān)控、能效管理、容量管理、資產管理、連接管理等。
2.1設施監(jiān)控通過圖形化顯示功能實現(xiàn)對基礎設施的監(jiān)控,控制相關參數(shù),對其進行分析,通過可視化大屏實時顯示結果,當參數(shù)異常時會觸發(fā)報警器進行告警。其中的告警環(huán)節(jié)包括警示顯示、異常處理與成因分析。
2.2能效管理該功能主要用于監(jiān)控能源消耗,包括水、電、氣等。平臺能夠全方位優(yōu)化管控過程,提高系統(tǒng)運作的安全系數(shù)與能源利用率,避免無意義的能源消耗。模塊分為能源組成與節(jié)能診斷等。
2.3容量管理該功能對基礎設施容量的針對性較強,能夠統(tǒng)計空間、電力等參數(shù),并對其進行部署后展示在屏幕上,擁有建立模型與資源優(yōu)化等功能,可以大幅度提高容量利用率。模塊分為容量的優(yōu)化、分析與監(jiān)視[4]。
2.4資產管理該功能能夠對數(shù)據中心資產設施進行全生命周期管理,包括資產的出入庫與變更等。模塊分為資產可視化與統(tǒng)計分析等。
2.5連接管理該功能主要用于鏈接中心設備,避免信息斷流,為數(shù)據中心提供連續(xù)性的數(shù)據支撐。模塊分為統(tǒng)計報表與配置信息等。
3實際應用——以高速公路行業(yè)為例隨著路況復雜程度的提升與汽車數(shù)量的不斷增多,傳統(tǒng)動環(huán)監(jiān)控系統(tǒng)已經不能滿足管理工作的需求。本文以應用于高速公路機電工程隧道及設備箱的一體化智能監(jiān)控箱運維管理系統(tǒng)為例,探究智能運維管理平臺視域下的一體化運維。
現(xiàn)有高速公路監(jiān)控箱體內部接線混亂,熱源集中程度較高,箱體無法自行發(fā)出告警。這一方面不利于維修人員開展工作,另一方面也增加了箱體附近的危險系數(shù)。此外,傳統(tǒng)動環(huán)監(jiān)控系統(tǒng)的智能化程度較低,不能配合維護人員完成遠程檢修工作,一旦箱體發(fā)生故障,技術人員必須親自到場解決問題。而使用新型智能運維管理平臺能夠有效提高檢修工作的效率,為維修人員提供“預判—管理—分析”的“一條龍”服務,能夠第一時間發(fā)現(xiàn)基礎設施的參數(shù)異常,準確定位故障點,提高處理效率。
3.1系統(tǒng)概述該智能運維管控平臺被稱為一體化智能監(jiān)控箱,能夠應用于高速公路的道路與隧道。該箱體在傳統(tǒng)箱體的基礎上接受了智能化改造,獲得了實時監(jiān)控以及故障定位等眾多智能化功能,可以保護外接攝像機的安全,并保障情報板的穩(wěn)定運行。該軟件在不影響監(jiān)控箱與配電箱基礎功能的前提下增強了自身的模塊化特點,進一步突出相關功能的作用,縮短了系統(tǒng)上傳與共享信息的時間,提高了信息的準確性,為交通部門的成本控制與人力資源控制做出了重大貢獻。通過使用一體化智能綜合箱管理平臺,能夠讓有關人員實時了解智慧運維箱的運行狀況與前端設備的供電情況等,大大加強了設備運維的精細化水平[4]。
3.2系統(tǒng)總體設計為解決傳統(tǒng)監(jiān)控箱的眾多弊端,在充分考量了現(xiàn)行智能交通系統(tǒng)對物聯(lián)網的應用程度后,該一體化平臺制訂了獨特的、有一定針對性的設計方案。該方案以IP網絡為基礎,在RS 232技術的實時監(jiān)控基礎上進行開發(fā),其軟件與硬件都以監(jiān)控服務器端為中心,大大降低了前期安裝與后期維護的難度與成本。其中的每個模塊都有明確的工作范圍,如客戶端只與用戶界面進行關聯(lián)。數(shù)據處理主體為嵌入式監(jiān)控主機,若需要進一步增加監(jiān)控數(shù)量或監(jiān)控范圍,可以升級該主機,增加內存,拓展功能,或增加監(jiān)控主機的數(shù)量,能夠賦予系統(tǒng)較高的靈活性。系統(tǒng)的主要技術為分布式計算機,能夠同時處理網絡內部數(shù)個一體化智能監(jiān)控箱所提供的監(jiān)控數(shù)據,系統(tǒng)模塊包括智能采集終端與運維管理系統(tǒng)等。同時,系統(tǒng)配備有報警功能,用戶可以自行設置報警方式,包括但不限于電腦顯示、語音播報、電話或短信通知,以及郵箱或專用App等渠道。
3.3一體化智能監(jiān)控箱的硬件設計相較于傳統(tǒng)監(jiān)控箱,一體化智能監(jiān)控箱的硬件結構復雜程度極高,包括智能采集終端、自動重合閘與智能PDU插座等。其中,智能采集終端又包括濕度傳感器、繼電器與觸摸屏等。
3.3.1智能采集終端整體系統(tǒng)都是圍繞智能采集終端構成的,該終端能夠實現(xiàn)對電壓、濕度、基礎設施狀態(tài)、IP等信息的集中顯示,能夠減輕前段本地檢修人員的工作壓力,提高工作質效。該系統(tǒng)還配置有預警功能,能夠在沒有備用電池的情況下對電量參數(shù)發(fā)出告警。該系統(tǒng)使用ST公司的32位 STM32F103ZET6 芯片,芯片的頻率與內容量都能夠滿足系統(tǒng)長期運作的要求,不需要頻繁進行維護。
3.3.2自動重合閘自動重合閘能夠有效降低負載短路造成的損失,一旦輸出接口出現(xiàn)短路,自動重合閘就會立刻切斷其他各路電源;當短路故障恢復或得到修理后,重合閘就會讓機器重回正常狀態(tài)。模塊包括斷電自動斷開、過欠壓等。
3.3.3電源防雷器在安裝該設備時,需要掌握客觀天氣需求,并以此為依據選擇輸出與板卡,盡可能提高防雷器的適應性,讓電壓能夠接受AC 70 V 至AC 250 V 的變化,維持設備運行。
3.3.4智能PDU插座該設備能夠避免系統(tǒng)漏電與過欠壓,總控制電源的輸出與關閉,提高城市電壓輸入的安全系數(shù)。
3.3.5交換模塊該設備選用工業(yè)級插卡式交換機,能夠自動同步手機設備參數(shù),為故障排查與系統(tǒng)優(yōu)化提供經驗。當設備參數(shù)波動超出告警閾值時,交換模塊會自動重啟設備,工作人員也無須前往現(xiàn)場,通過智能管控平臺即可操控開關,將運維成本維持在可控制范圍,也降低了故障維修的時間成本。
3.4智能運維管理系統(tǒng)3.4.1智能運維管理系統(tǒng)簡介該系統(tǒng)主要針對的是智慧交通隧道工程與外場設備運維管理,可以直接應用于隧道管理站,且監(jiān)控分中心也能夠通過該系統(tǒng)進行高效辦公。在系統(tǒng)啟動后,網絡內部的前端攝像機、微波車檢與情報板等設備的運行參數(shù)能夠被實時同步到工作人員手中,監(jiān)控工作具備一定的全面性與準確性,確保設備能夠長時間執(zhí)行高精度的運維工作。此外,工作人員既可以通過系統(tǒng)查閱基礎設施參數(shù),也能夠對設備進行遠程控制,相較于傳統(tǒng)箱體需要人工檢修的缺陷,該系統(tǒng)大大提高了運維效率與檢修安全系數(shù),對交通部門的成本控制工作有較大的促進作用,讓運維變得“可視”,讓整體工作的專業(yè)水平得以再創(chuàng)新高。
3.4.2系統(tǒng)功能智能運維管理平臺的搭建必須充分考慮對應高速路段的監(jiān)控特點,明確交管部門的未來發(fā)展方向,融合物聯(lián)網等通信技術,在拓寬功能的同時不斷提高性能,讓系統(tǒng)的實用化水平保持在巔峰狀態(tài)。
4結語隨著經濟與社會的進步,智能化科技水平不斷提高,面對越來越復雜的網絡環(huán)境與工作需求,各個領域都要充分發(fā)揮智能運維管理平臺的作用,彌補傳統(tǒng)監(jiān)控系統(tǒng)的缺陷,提升工作的質量與效率,實現(xiàn)一體化運維。
參考文獻
[1]宋志杰,鄒鐵漢,張韋微.焦作科瑞森重裝股份有限公司 堅守輸送主業(yè) 專注制造創(chuàng)新——智能運維管理平臺[J].起重運輸機械,2022(17):2-5,92.
[2]萬溧,蒲澤偉,吳敏,等.基于云架構的智能微網群智能運維管理平臺設計[J].西藏科技,2021(7):34-37.
[3]徐友恒.數(shù)據中心一體化智能運維管理平臺建設研究[J].中國管理信息化,2021(18):105-106.
[4]衷兆程.上海地鐵隧道設備智能運維管理平臺設計與開發(fā)[J].上海國土資源,2020(2):97-100.
(編輯 李春燕)
Research on the integrated operation and maintenance technology based on the intelligent
operation and maintenance management platform technologyZhang? Liying, Yan? Yongjun
(LuXun Academy of Fine Arts, Shenyang 110004, China)Abstract:? The development of science, technology and economy drives the data center to enlarge its scale continuously. With the increasing complexity of the system, the level of operation and maintenance management also needs to increase at the same time, the intelligent operation and maintenance management platform is an important means to improve the level of operation and maintenance management. Based on this, this paper analyzes the structure design and function module of the management platform from the macroscopic angle, and takes the expressway field as an example to study the integrated operation and maintenance of the intelligent operation and maintenance management platform technology, in order to help improve the operation and maintenance level of various fields.
Key words: intelligent operation and maintenance management platform; integrated operation and maintenance; Internet