趙德寧 李舒濤,2 吳勁松,2 廖霄 鄧振華
(1.中國(guó)能源建設(shè)集團(tuán)廣東省電力設(shè)計(jì)研究院有限公司 廣東省廣州市 510663 2.華南理工大學(xué) 廣東省廣州市 510641)
隨著經(jīng)濟(jì)全球化進(jìn)程的加速和我國(guó)改革開(kāi)放的縱深發(fā)展,數(shù)據(jù)中心對(duì)業(yè)務(wù)連續(xù)性要求極高,對(duì)關(guān)鍵業(yè)務(wù)數(shù)據(jù)安全性要求也非常之高。隨著數(shù)據(jù)中心的設(shè)備越來(lái)越復(fù)雜,系統(tǒng)也越來(lái)越多,使得故障診斷困難,并且管理也變得龐大和復(fù)雜。對(duì)于如何做好數(shù)據(jù)中心維護(hù),及時(shí)發(fā)現(xiàn)一些潛在隱患和排除突發(fā)故障,降低管理的成本,提高運(yùn)維的效率,降低數(shù)據(jù)中心的能耗,已經(jīng)變成管理者關(guān)注的重點(diǎn)。而要實(shí)現(xiàn)這些目標(biāo),數(shù)據(jù)中心的管理者面臨著諸多挑戰(zhàn):
應(yīng)用系統(tǒng)和系統(tǒng)管理、網(wǎng)絡(luò)管理、機(jī)房管理等工具系統(tǒng)各自獨(dú)立運(yùn)行,缺乏整合,無(wú)法提供統(tǒng)一管理視圖,難以協(xié)調(diào)配合。
各個(gè)技術(shù)領(lǐng)域之間沒(méi)有建立關(guān)聯(lián)關(guān)系,在系統(tǒng)發(fā)生故障時(shí),故障的根源定位非常困難,經(jīng)常要耗費(fèi)很多時(shí)間處理。
目前多數(shù)系統(tǒng)還是停留在數(shù)據(jù)庫(kù)管理和表格管理的二維維護(hù)層面,缺乏有效的可視化處理方案。
相當(dāng)部分運(yùn)維數(shù)據(jù)維護(hù)仍然使用傳統(tǒng)的表格(紙質(zhì)或電子化),管理比較分散,沒(méi)有進(jìn)行統(tǒng)一管理,準(zhǔn)確性也是個(gè)問(wèn)題。
針對(duì)當(dāng)前存在的上述問(wèn)題,廣東省電力設(shè)計(jì)研究院有限公司積極探索,經(jīng)過(guò)研究,決定采用BIM 技術(shù)、物聯(lián)網(wǎng)、人工智能等科學(xué)、可行的管理方法來(lái)解決這些問(wèn)題。建立基于BIM的數(shù)字孿生智慧機(jī)房管理系統(tǒng)以滿足公司的人員和領(lǐng)導(dǎo)及時(shí)掌握數(shù)據(jù)中心運(yùn)行狀態(tài);通過(guò)動(dòng)環(huán)監(jiān)控?cái)?shù)據(jù)進(jìn)行關(guān)聯(lián)和分析,實(shí)現(xiàn)對(duì)數(shù)據(jù)中心運(yùn)行故障進(jìn)行有效的防范決策,最終實(shí)現(xiàn)對(duì)數(shù)據(jù)中心精細(xì)化管理的目的。
根據(jù)《數(shù)字孿生白皮書(2019年)》書中的定義,數(shù)字孿生是綜合運(yùn)用了現(xiàn)代科技的物聯(lián)網(wǎng)感知、大數(shù)據(jù)計(jì)算、仿真建模等現(xiàn)代信息技術(shù),借由軟件定義功能,實(shí)現(xiàn)了對(duì)物理空間進(jìn)行展示以及故障診斷、運(yùn)行及狀態(tài)預(yù)測(cè)、行為決策,從而實(shí)現(xiàn)了賽博空間與物理空間二者的交互映射。如圖1所示。
BIM(英文全稱:Building Information Modeling 建筑信息模型)是用建筑工程項(xiàng)目中各個(gè)項(xiàng)相關(guān)的信息數(shù)據(jù)來(lái)作為基礎(chǔ)從而建立起建筑模型,它通過(guò)數(shù)字化信息來(lái)仿真模擬物理世界的建筑物所具有的物理信息。BIM 模型可存儲(chǔ)設(shè)計(jì)、施工、運(yùn)維,甚至?xí)r間、成本等信息,因此它成為建筑物管理的一個(gè)理想載體,貫穿全生命周期各個(gè)階段。
通過(guò)安裝的物聯(lián)網(wǎng)檢測(cè)設(shè)備,對(duì)數(shù)據(jù)中心的基礎(chǔ)設(shè)施進(jìn)行監(jiān)控,監(jiān)控?cái)?shù)據(jù)通過(guò)物聯(lián)網(wǎng)關(guān)實(shí)時(shí)傳輸?shù)綌?shù)據(jù)平臺(tái),物聯(lián)網(wǎng)支持RS485,ModBus, MQTT 等協(xié)議。
圖1
圖2
通過(guò)機(jī)器學(xué)習(xí)和深度學(xué)習(xí),結(jié)合知識(shí)圖譜,對(duì)系統(tǒng)故障進(jìn)行診斷,找到故障原因及位置定位,對(duì)故障診斷結(jié)果可以生產(chǎn)工單,進(jìn)行閉環(huán)管理。
本系統(tǒng)前端使用vue+bim+webgl 輕量化引擎(模型,數(shù)據(jù)分離)技術(shù)實(shí)現(xiàn),服務(wù)應(yīng)用層基于springcloud 框架,采用Eureka 作為注冊(cè)中心,Config 做為配置中心統(tǒng)一管理配置文件,F(xiàn)eign 實(shí)現(xiàn)各服務(wù)之間的數(shù)據(jù)調(diào)用,Hystrix 實(shí)現(xiàn)熔斷降級(jí),Redis 實(shí)現(xiàn)數(shù)據(jù)緩存,Websock 技術(shù)實(shí)現(xiàn)客戶端與服務(wù)端的實(shí)時(shí)通信。利用關(guān)系型數(shù)據(jù)庫(kù)Mysql 存儲(chǔ)系統(tǒng)關(guān)鍵業(yè)務(wù)數(shù)據(jù),非關(guān)系型數(shù)據(jù)庫(kù)Mongodb 存儲(chǔ)動(dòng)態(tài)模型數(shù)據(jù)及測(cè)點(diǎn)數(shù)據(jù)。系統(tǒng)采用大數(shù)據(jù)平臺(tái)作為離線計(jì)算及存儲(chǔ)支撐。在Iot 層制定統(tǒng)一的協(xié)議標(biāo)準(zhǔn),通過(guò)MQTT 等通用協(xié)議做統(tǒng)一的接入口,開(kāi)放廠商協(xié)議和數(shù)據(jù)的接入。如圖2所示。
通過(guò)BIM 技術(shù)對(duì)數(shù)據(jù)中心進(jìn)行可視化展示,從樓棟、樓層、房間、機(jī)柜一直到設(shè)備,逐級(jí)下鉆展示,并且建模的精度比較高,達(dá)到LOD500 級(jí)別,可以精細(xì)到線纜和端口,清晰看到某根線纜的精確走向和位置,甚至在橋架中線纜夾的位置都可以看到。
5.1.1 數(shù)據(jù)中心可視化
系統(tǒng)基于三維模型對(duì)數(shù)據(jù)中心的建筑結(jié)構(gòu)、機(jī)房布局、設(shè)備及強(qiáng)弱電鏈路進(jìn)行展示,設(shè)備及鏈路均可以在三維模型中進(jìn)行查看,對(duì)機(jī)柜的容量、機(jī)柜空間、電力信息等進(jìn)行統(tǒng)一展現(xiàn),實(shí)現(xiàn)對(duì)設(shè)備性能、告警信息的實(shí)時(shí)監(jiān)控。
5.1.2 資產(chǎn)配置可視化
通過(guò)BIM 三維建模,把各個(gè)機(jī)柜以及機(jī)柜內(nèi)IT 設(shè)備的基本配置信息導(dǎo)入可視化平臺(tái),通過(guò)三維模型里的設(shè)備就可查找相應(yīng)的配置信息,反過(guò)來(lái)也可以通過(guò)配置信息查找到對(duì)應(yīng)設(shè)備,實(shí)現(xiàn)資產(chǎn)配置的可視化展示。
5.1.3 設(shè)備配線可視化
通過(guò)采用自管理或集成CMDB 系統(tǒng)的方式,把各個(gè)機(jī)柜內(nèi)設(shè)備的連接信息導(dǎo)入可視化平臺(tái),通過(guò)設(shè)備、鏈路、端口信息相互查找,完成設(shè)備配線可視化展示。
5.1.4 機(jī)房容量可視化
把數(shù)據(jù)中心的機(jī)柜U 位、端口、機(jī)房的承重情況、空調(diào)負(fù)荷、電力負(fù)荷等集成在BIM 模型中展現(xiàn),便于運(yùn)維人員掌握機(jī)房容量情況。
通過(guò)數(shù)字孿生模型與機(jī)房各個(gè)監(jiān)控子系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)集成和控制集成,實(shí)現(xiàn)設(shè)備數(shù)據(jù)集成化展現(xiàn),可以在數(shù)字模型中直接對(duì)設(shè)備進(jìn)行操作,調(diào)整設(shè)備運(yùn)行參數(shù)與狀態(tài)。
5.2.1 動(dòng)環(huán)監(jiān)控系統(tǒng)
5.2.1.1 配電監(jiān)測(cè)
(1)監(jiān)測(cè)設(shè)備:配電柜、UPS 主機(jī)、智能母線等。
(2)監(jiān)測(cè)內(nèi)容:監(jiān)測(cè)主開(kāi)關(guān)及所有輸出開(kāi)關(guān)的支路開(kāi)關(guān)狀態(tài);輸入三相全電量參數(shù)(電壓、電流、功率、頻率、功率因數(shù)、電量等)。
5.2.1.2 蓄電池監(jiān)測(cè)
(1)監(jiān)測(cè)對(duì)象:蓄電池12VDC 或2VDC。
(2)監(jiān)測(cè)內(nèi)容:監(jiān)測(cè)每節(jié)單體電池的內(nèi)阻/電壓/電流、電池表面溫度、電池總電壓、總充放電流等。
5.2.1.3 空調(diào)系統(tǒng)監(jiān)測(cè)
(1)監(jiān)控對(duì)象:智能精密空調(diào)。
(2)監(jiān)測(cè)內(nèi)容:溫度、濕度、溫度設(shè)定值、濕度設(shè)定值、空調(diào)運(yùn)行狀態(tài)、風(fēng)機(jī)運(yùn)轉(zhuǎn)狀態(tài)、報(bào)警等數(shù)值。
5.2.1.4 溫濕度監(jiān)測(cè)
實(shí)現(xiàn)對(duì)機(jī)房的環(huán)境以及重要設(shè)備等目標(biāo)進(jìn)行溫度和濕度的高精度監(jiān)測(cè)。
5.2.1.5 漏水監(jiān)測(cè)
對(duì)于空調(diào)周圍以及其它地方可能發(fā)生漏水的重要位置,比如機(jī)房?jī)?nèi)如果有水管流經(jīng)的地方以及沒(méi)有設(shè)置封堵的門窗等重要位置進(jìn)行漏水監(jiān)測(cè)。
5.2.2 安防監(jiān)測(cè)系統(tǒng)
5.2.2.1 門禁監(jiān)測(cè)
在智慧運(yùn)維系統(tǒng)三維可視化展示門禁系統(tǒng)設(shè)備布局,通過(guò)對(duì)門禁人員常規(guī)進(jìn)出信息的讀取解析,在三維可視化環(huán)境中展示各個(gè)門禁入口的人員進(jìn)出情況。
通過(guò)聯(lián)動(dòng)視頻系統(tǒng)以及紅外雙鑒設(shè)備對(duì)人員入侵以及目標(biāo)越線和小動(dòng)物入侵等特殊異常情況進(jìn)行實(shí)時(shí)監(jiān)控告警。
5.2.2.2 消防監(jiān)測(cè)
在智慧運(yùn)維系統(tǒng)三維可視化展示消防設(shè)備布局,通過(guò)視頻系統(tǒng)、煙霧探測(cè)器、紅外熱能探測(cè)器等設(shè)備對(duì)消防異常情況進(jìn)行實(shí)時(shí)監(jiān)控及告警。
5.2.2.3 視頻監(jiān)測(cè)
在智慧運(yùn)維系統(tǒng)三維可視化展示視頻設(shè)備位置,在系統(tǒng)實(shí)時(shí)調(diào)用視頻監(jiān)控內(nèi)容,協(xié)同聯(lián)動(dòng)門禁系統(tǒng)、消防系統(tǒng)進(jìn)行異常發(fā)現(xiàn)、追蹤、告警流程的處理。
5.2.3 告警處理系統(tǒng)
系統(tǒng)通過(guò)接口接入各類物聯(lián)網(wǎng)傳感器的數(shù)據(jù)。當(dāng)系統(tǒng)中運(yùn)行的設(shè)備如果有告警發(fā)生,在三維場(chǎng)景中實(shí)時(shí)展示告警數(shù)據(jù),并且三維可視化系統(tǒng)中以高亮、閃爍告警,同時(shí)會(huì)發(fā)出聲音提示用戶。
5.2.4 AR 運(yùn)維
系統(tǒng)把AR 增強(qiáng)現(xiàn)實(shí)技術(shù)結(jié)合BIM 三維建模技術(shù)應(yīng)用于各種場(chǎng)景的巡視和運(yùn)維工作中,通過(guò)AR 技術(shù)在圖像識(shí)別、虛實(shí)疊加、信息交互,智能判斷糾錯(cuò)等各方面的優(yōu)勢(shì),通過(guò)AR 設(shè)備對(duì)被檢查的關(guān)鍵信息進(jìn)行掃描捕捉,把提醒內(nèi)容進(jìn)行實(shí)時(shí)疊加,并且與后臺(tái)信息進(jìn)行對(duì)比核查。運(yùn)維人員通過(guò)AR 設(shè)備可對(duì)故障發(fā)生位置進(jìn)行定位和導(dǎo)航,快速找到故障設(shè)備。
5.3.1 故障算法診斷模型
系統(tǒng)通過(guò)采集的監(jiān)控信息和運(yùn)行數(shù)據(jù),使用故障算法診斷模型進(jìn)行智能診斷,判斷故障原因,定位故障源頭設(shè)備,并結(jié)合知識(shí)圖譜專家?guī)爝M(jìn)行驗(yàn)證和匹配解決方案。
5.3.2 健康度評(píng)估模型
系統(tǒng)通過(guò)健康度檢測(cè)模型,結(jié)合全生命周期數(shù)據(jù)(包括初始數(shù)據(jù)、歷史數(shù)據(jù)和運(yùn)行數(shù)據(jù))對(duì)各專業(yè)系統(tǒng)和設(shè)備進(jìn)行健康度檢測(cè)評(píng)分,并進(jìn)行預(yù)測(cè)性維護(hù)推薦,使得系統(tǒng)故障或者停機(jī)檢修時(shí)間大為減少。
5.3.3 綠色能耗模型
運(yùn)用數(shù)字孿生技術(shù),對(duì)機(jī)房設(shè)備進(jìn)行1:1 仿真建模,系統(tǒng)調(diào)用設(shè)備建模數(shù)據(jù),搭載綠色能耗模型,通過(guò)安裝在設(shè)備末端的智能傳感器,反饋數(shù)據(jù)到運(yùn)維系統(tǒng),經(jīng)過(guò)能耗模型的分析,系統(tǒng)能自動(dòng)調(diào)節(jié)冷凍水管水流的大小并實(shí)時(shí)調(diào)節(jié)精密空調(diào)的風(fēng)力來(lái)達(dá)到節(jié)能的效果。在服務(wù)器夜間較少運(yùn)行時(shí),空調(diào)系統(tǒng)可以減少冷量輸出來(lái)節(jié)能。
綜合來(lái)說(shuō),本系統(tǒng)基于BIM 和數(shù)字孿生技術(shù),初步實(shí)現(xiàn)了數(shù)據(jù)中心的智慧運(yùn)維。通過(guò)物聯(lián)網(wǎng)監(jiān)測(cè)設(shè)備采集數(shù)據(jù),然后對(duì)各個(gè)物理實(shí)體的要素部分進(jìn)行實(shí)時(shí)監(jiān)測(cè)和動(dòng)態(tài)的展現(xiàn),基于歷史數(shù)據(jù)進(jìn)行分析,檢查各個(gè)設(shè)備的功能 、性能變化的情況及原因,揭示各類模式之間的關(guān)系,對(duì)于系統(tǒng)和設(shè)備的未來(lái)運(yùn)行情況進(jìn)行預(yù)測(cè),實(shí)現(xiàn)對(duì)運(yùn)維行為進(jìn)行指導(dǎo)。