曾旺
(中鐵十四局集團電氣化工程有限公司,山東 濟南 250000)
近年來,高速公路中的機電設(shè)備類別與數(shù)量越來越多,為提高機電設(shè)備性能,延長機電設(shè)備壽命,機電設(shè)備需要定期檢修維護,有著較高的養(yǎng)護代價和養(yǎng)護成本。同時,如果機電設(shè)備在運轉(zhuǎn)中出現(xiàn)問題,需要工作人員快速定位、及時處理,確保高速公路運維系統(tǒng)能夠穩(wěn)定、可靠運行。隨著高速公路IT技術(shù)不斷發(fā)展,引入新的智慧化運維方案,成為機電設(shè)備運維的新需求,深入設(shè)備統(tǒng)一接入、統(tǒng)一管理、業(yè)務高效處理等運維管理的各個方面,要求各業(yè)務系統(tǒng)能夠基于統(tǒng)一的標準規(guī)范緊密配合,讓一切業(yè)務數(shù)據(jù)化,一切數(shù)據(jù)業(yè)務化,形成更加貼近業(yè)務需求、各業(yè)務系統(tǒng)深度融合的整體解決方案。
交通運輸部印發(fā)了《交通運輸領(lǐng)域新型基礎(chǔ)設(shè)施建設(shè)行動方案(2021~2025年)》方案內(nèi)容以推動交通運輸高質(zhì)量發(fā)展為主題,以促進交通強國為總目標,要求堅持創(chuàng)新驅(qū)動、智慧發(fā)展,以數(shù)字化、網(wǎng)絡(luò)化、智能化為主線,增強在役基礎(chǔ)設(shè)施檢測監(jiān)測、評估預警能力。
探索高速公路機電智慧化運維模式,構(gòu)建完善的機電設(shè)備標準化運維體系,提升機電設(shè)備運維管理能力,將“互聯(lián)網(wǎng)+”技術(shù)與建、養(yǎng)、管、人、財、物、安全等管理業(yè)務有效結(jié)合,是探索交通行業(yè)“大數(shù)據(jù)+機電運維”新模式的內(nèi)在要求。實現(xiàn)信息資源統(tǒng)一管理和可視化展示,構(gòu)建機電設(shè)備智慧化運維體系,實現(xiàn)機電設(shè)備的整體監(jiān)管和個體跟蹤,實現(xiàn)設(shè)備信息交換共享,輔助設(shè)備運維決策以及設(shè)備故障預警預報,可以為機電設(shè)備的統(tǒng)籌、協(xié)調(diào)和聯(lián)動創(chuàng)造條件,全面提升機電設(shè)備運維效率,增加機電設(shè)備資源利用率,創(chuàng)造機電設(shè)備信息資源價值,以達到機電設(shè)備運維管理科學化、智慧化、規(guī)范化的目標。
隨著信息化的迅速發(fā)展,不同功能的機電運維系統(tǒng)覆蓋了機電設(shè)備運維的各個領(lǐng)域。為了適應市場的變化,不斷出現(xiàn)的業(yè)務系統(tǒng)導致了設(shè)備信息的分散,信息孤島的現(xiàn)象越來越明顯。而由于管理人員的分工領(lǐng)域不同,使得管理職責分散,針對同一類設(shè)備信息的側(cè)重點也不同,導致了管理人員對設(shè)備信息的描述也不盡相同,同一設(shè)備的信息可能出現(xiàn)差異和不準確,甚至是不一致的情況。同時,各業(yè)務系統(tǒng)對機電設(shè)備信息定義的標準和設(shè)計規(guī)范也不統(tǒng)一,導致各系統(tǒng)采集的信息很難實現(xiàn)交換和共享?;诖耍枰⒃O(shè)備標準化命名規(guī)范,對設(shè)備信息進行統(tǒng)一采集,保證設(shè)備信息錄入的標準化,從而確保設(shè)備管理的準確性和高效性。通過設(shè)備標準化命名,可以將組織機構(gòu)、收費站、門架、收費單元、路段、隧道、服務區(qū)、橋梁、設(shè)備屬性等各類信息進行統(tǒng)一管理,經(jīng)統(tǒng)一的設(shè)備采集門戶,工作人員采集的設(shè)備數(shù)據(jù)信息也可以進行標準化處理,經(jīng)過大數(shù)據(jù)平臺清洗、轉(zhuǎn)換、集成等步驟,形成標準的設(shè)備管理庫。同時,大數(shù)據(jù)平臺為各業(yè)務系統(tǒng)提供數(shù)據(jù)接入的高效通道,將各業(yè)務系統(tǒng)結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)進行匯聚,最后加載到數(shù)據(jù)倉庫或數(shù)據(jù)集市中,增強數(shù)據(jù)的分析、挖掘、共享能力。設(shè)備數(shù)據(jù)采集處理流程如圖1所示。
圖1 設(shè)備數(shù)據(jù)采集處理流程
隨著高速公路系統(tǒng)中的機電設(shè)備數(shù)量和種類越來越多,同類設(shè)備又存在品牌、參數(shù)與型號等不同,且各設(shè)備之間的關(guān)聯(lián)度也越來越高,導致運維環(huán)境日趨復雜,運維工作難度加大,需要一套集中、統(tǒng)一的自動化檢測系統(tǒng)來自主地監(jiān)測和發(fā)現(xiàn)設(shè)備硬件、軟件(操作系統(tǒng)環(huán)境、數(shù)據(jù)庫、中間件以及應用系統(tǒng))在運轉(zhuǎn)中的風險和問題,同時把各種類型的對象進行統(tǒng)一、集中監(jiān)控,并使其格式統(tǒng)一、規(guī)范,以便對其進行有效的處理和分析,并將最終結(jié)果以直觀的界面展現(xiàn)給運維人員。
通過網(wǎng)管系統(tǒng)和IP地址管理系統(tǒng),可以將各監(jiān)控指標的告警閾值及告警等級配置在數(shù)據(jù)庫,當設(shè)備上報運行數(shù)據(jù)報文后,平臺接收并解析報文,將報文里的實測值與告警閾值對比,如果滿足告警觸發(fā)條件,則即刻生成告警,實現(xiàn)設(shè)備的自動檢測。該系統(tǒng)可對IP示意節(jié)點進行撥測監(jiān)控,顯示監(jiān)控數(shù)據(jù),并對關(guān)鍵數(shù)據(jù)進行告警,實現(xiàn)IP地址電子化管理;對于服務器與網(wǎng)絡(luò)設(shè)備,實現(xiàn)分布式采集(安裝與業(yè)主方操作系統(tǒng)匹配的Agent)以及WEB集中管理功能;對設(shè)備內(nèi)部的中間件、數(shù)據(jù)庫、標準應用等軟件分類進行專項監(jiān)控,則可以實現(xiàn)軟件類的集成管理。自動檢測發(fā)現(xiàn)的告警數(shù)據(jù)實時傳輸?shù)酱髷?shù)據(jù)平臺后,通過大數(shù)據(jù)平臺進行標準化數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)清洗、關(guān)聯(lián)整合等處理,會導入告警管理平臺進行告警分析處理。設(shè)備自動檢測流程如圖2所示。
圖2 設(shè)備自動檢測流程
通過大數(shù)據(jù)平臺實現(xiàn)告警信息的標準化,包括告警設(shè)備、告警端口、告警位置、告警級別、告警名稱、告警時間、告警類型等,把標準的告警信息接入告警管理平臺,當接收到告警事件后,系統(tǒng)可以根據(jù)故障類型、設(shè)備屬性、時間策略、告警手段等綜合設(shè)置故障預警機制,及時通知運維人員。通過告警數(shù)據(jù)分析、告警根源分析、告警圖形化展示等手段,實現(xiàn)對設(shè)備告警信息的統(tǒng)一處理和集成過程的實時監(jiān)控。
3.3.1 告警數(shù)據(jù)分析
按照時間序列,對大量重復的告警事件進行聚合,壓縮形成一條有真正意義的告警。而后通過屬性關(guān)聯(lián)、機器學習等算法把相關(guān)的告警合并起來,為運維人員提供分析、甄選后的最重要的告警。借助告警控制臺,運維人員可以查看合并之后的告警、相關(guān)的子告警及其時間序列關(guān)系,從而更快地定位告警和問題根源。
3.3.2 告警根源分析
在實際運維過程中,現(xiàn)場各種專業(yè)監(jiān)控工具多達10余種,每天產(chǎn)生的紛繁復雜的告警數(shù)據(jù)中,存在大量的冗余告警信息,某些設(shè)施的指標告警是別的指標告警引起的,通過對各類監(jiān)控工具和告警信息進行分析,可以找出不同類型的設(shè)備與設(shè)備之間、設(shè)備的指標與指標之間產(chǎn)生告警的根本原因,挖掘隱藏的一些具有強關(guān)聯(lián)性的告警規(guī)則,為工作人員能夠快速、有效地排除故障提供支撐,確保業(yè)務系統(tǒng)安全穩(wěn)定地運行。
在告警關(guān)聯(lián)的分析中,建立相關(guān)的數(shù)據(jù)模型(包括告警時間的邏輯關(guān)系和特征分析),抽取事件特征并對其進行向量化,基于RNN/LSTM、Atention網(wǎng)絡(luò)等機器學習算法,對接入的異常事件進行收斂、降噪等處理后,可以得到壓縮后的告警結(jié)果,從而降低活動告警的種類和數(shù)目,再通過一定的策略將相關(guān)性的事件按照一定的時間周期進行合并收斂,從而達到過濾無效或重復信息的目的,實現(xiàn)根源告警的分類和識別,提高故障精確定位效率,減輕運維人員的工作壓力,使系統(tǒng)得以更快地恢復正常運行。
3.3.3 告警圖形化展示
圖形數(shù)據(jù)庫查詢和展示,是基于某種圖形數(shù)據(jù)庫(如Neo4j)動態(tài)展示模式分析和根源告警分析的結(jié)果,如根因事件以紅色顯示,共生的事件以藍色、黃色或綠色顯示??梢允褂枚鄠€視圖和顏色方案來表達事件的類型或頻率,并且可以深入了解事件發(fā)生的細節(jié)及其與其他事件的關(guān)系。選用Grafana開源工具,對接多種數(shù)據(jù)源,包括Elastic-search,InfluxDB,Postgres,MySQL,MicrosoftSQLServer(MSSQL),CloudWatch,Prometheus,OpenTSDB,Druid,SimpleJson,Graphite等。使用SimpleJson數(shù)據(jù)源,搭建WebAPI站點,構(gòu)建解析引擎,通過編寫契約式的SQL語句,將SQLServer等不同數(shù)據(jù)源中的數(shù)據(jù)靈活展現(xiàn)在Grafana中。這種方式最終形成的告警信息處理流程如圖3所示。
圖3 告警信息處理流程
機電設(shè)備運維工作面臨的問題紛繁復雜,很難及時做出合理的運維流程管理安排,這可能會導致重點事件被遺漏,影響事件解決的速度和質(zhì)量。智能服務管理平臺包括告警監(jiān)控、待辦工單、值班信息、通知公告等功能。運維人員借此集中受理設(shè)備故障,查看設(shè)備告警信息,可以幫助運維人員及時、準確地掌握各類事件告警。告警信息生成后,將特定告警遞交于服務流程管理的事件管理平臺,生成事件工單中的部分信息。事件管理平臺對告警事件的處理完成后,會將其反饋給告警模塊進行告警清除,實現(xiàn)工單反向確認告警。
智能服務管理平臺協(xié)調(diào)組成工作流的四大元素為人員、資源、事件和狀態(tài),其具有流程靈活跳轉(zhuǎn)的特性,通過拖拽實現(xiàn)流程自定義,以各流程環(huán)節(jié)的內(nèi)容、流程環(huán)節(jié)的執(zhí)行人、流程環(huán)節(jié)的執(zhí)行優(yōu)先程度等要素推動工作流的發(fā)生、發(fā)展、完成。每項工作以工單的形式,從發(fā)起流程開始,經(jīng)過責任部門的處理后,擁有不同的節(jié)點和分支,最終到達終點,實現(xiàn)全過程監(jiān)控。
通過可視化分析平臺可以設(shè)置服務請求類、事件處理類、問題處理類、變更類等大量符合最佳實踐的報表。報表可根據(jù)實際需要對機構(gòu)、時間、狀態(tài)、角色、業(yè)務系統(tǒng)等維度進行統(tǒng)計展現(xiàn)。每個報表可根據(jù)主題自選時間區(qū)間,如問題類型統(tǒng)計分析、問題起源分類統(tǒng)計分析、問題解決率統(tǒng)計分析、事件類型統(tǒng)計分析、事件優(yōu)先級統(tǒng)計分析、事件一線解決率統(tǒng)計分析、事件解決事件分類統(tǒng)計、變更類型統(tǒng)計分析、變更審批成功率統(tǒng)計分析、變更實施成功率統(tǒng)計分析等,也可以對工作人員個人的處理量及處理類型進行統(tǒng)計分析。
工作人員可以以WORD、EXCEL、PDF、TXT、FLASH等多種方式訪問報表中的數(shù)據(jù),也能夠?qū)⑵滢D(zhuǎn)化成Word、Excel、PDF等格式,根據(jù)機構(gòu)、職位、角色等的不同,靈活定制報表的種類、條件組合、時間粒度等;同時,系統(tǒng)通過權(quán)限控制,可以控制每張報表的顆粒度,支持對不同用戶分別授權(quán)。
隨著科技的飛速發(fā)展,高速公路智能化程度越來越高,涌現(xiàn)了大量的機電設(shè)備,這些機電設(shè)備種類多、功能雜、專業(yè)化程度高,對工作人員的運維能力提出了更高的要求,也增加了運維管理的難度,因此,需要探索新技術(shù)或新方法,采取智慧化的解決方案給機電設(shè)備運維賦能。本文對高速公路機電設(shè)備的智慧化運維技術(shù)和管理方案進行研究,提出了高速公路機電設(shè)備智慧化運維在日常運維管理中的應用,以滿足高速公路機電設(shè)備智慧化運維的需求。