孫一凱
中臺(tái)是由阿里在2015年提出的"大前臺(tái),小中臺(tái)"戰(zhàn)略中延伸出來(lái)的概念,靈感源于芬蘭的一家游戲公司,近些年來(lái),企業(yè)內(nèi)部都開(kāi)始建設(shè)各個(gè)中臺(tái),目的是為了幫忙企業(yè)更好支撐業(yè)務(wù)的開(kāi)展,達(dá)到事半功倍的效果。本文旨在談?wù)撝腔壑信_(tái)在企業(yè)IT支撐系統(tǒng)運(yùn)維過(guò)程中的建設(shè)和維護(hù)的經(jīng)驗(yàn),并淺顯易懂的闡明智慧中臺(tái)在IT系統(tǒng)中發(fā)揮的重要作用。
一、背景和目標(biāo)
隨著企業(yè)業(yè)務(wù)發(fā)展,應(yīng)用系統(tǒng)規(guī)模日益擴(kuò)大,涉及組件及架構(gòu)的復(fù)雜度劇增,對(duì)于系統(tǒng)深度管理、智能運(yùn)維的需求也日益劇增。
目前企業(yè)業(yè)務(wù)支撐系統(tǒng)的運(yùn)維管理隨著業(yè)務(wù)的蓬勃發(fā)展,多種傳統(tǒng)運(yùn)維模式下痛點(diǎn)問(wèn)題逐漸凸顯,主要體現(xiàn)在監(jiān)控運(yùn)維工具繁多,監(jiān)控覆蓋較全面,產(chǎn)生了海量監(jiān)控運(yùn)維數(shù)據(jù),但缺乏綜合分析能力;傳統(tǒng)運(yùn)維模式缺乏智能化手段,對(duì)生產(chǎn)各類(lèi)數(shù)據(jù)的價(jià)值挖掘能力有限;運(yùn)維編排工具局限于人為運(yùn)維操作,缺乏智能化聯(lián)動(dòng)能力。
深度解析智慧中臺(tái)AIOPS場(chǎng)景,切實(shí)落地健康度評(píng)分、根因分析、容量評(píng)估、故障預(yù)測(cè)四大AIOPS場(chǎng)景,同時(shí)在完成這四大AIOPS場(chǎng)景的基礎(chǔ)上,還聯(lián)動(dòng)本地運(yùn)維管理平臺(tái),實(shí)現(xiàn)AIOPS智能分析結(jié)果驅(qū)動(dòng)運(yùn)維操作,進(jìn)一步落地智能故障自愈、智能容量擴(kuò)縮容、智能巡檢、智能分析歸檔等智能運(yùn)維實(shí)施場(chǎng)景。
二、思路及方案
(一)智慧中臺(tái)AIOPS建設(shè)思路
智能中臺(tái)AIOPS的本地化建設(shè),同時(shí)結(jié)合數(shù)據(jù)統(tǒng)一集成及自動(dòng)化運(yùn)維實(shí)現(xiàn)智能運(yùn)維的實(shí)施方案,為AIOPS場(chǎng)景的順利實(shí)施及能力拓展提供助力。整體智能化運(yùn)維解決方案主要涉及三大部分,分別是數(shù)據(jù)集成、AIOPS智能分析、運(yùn)維聯(lián)動(dòng)執(zhí)行,分別解決生產(chǎn)海量數(shù)據(jù)的統(tǒng)一集成、海量數(shù)據(jù)的智能化分析價(jià)值挖掘、AIOPS分析價(jià)值導(dǎo)向運(yùn)維執(zhí)行。
(二)建設(shè)方案
企業(yè)智慧中臺(tái)AIOPS實(shí)施主要分為三部分,完整覆蓋數(shù)據(jù)集成、AIOPS場(chǎng)景建設(shè)和運(yùn)維聯(lián)動(dòng)能力建設(shè),將智慧中臺(tái)AIOPS場(chǎng)景深度契合企業(yè)運(yùn)維環(huán)境,結(jié)合數(shù)據(jù)集成工具,為AIOPS場(chǎng)景提供良好、規(guī)范、優(yōu)質(zhì)的數(shù)據(jù)基座,結(jié)合運(yùn)維編排組件聯(lián)動(dòng)執(zhí)行,進(jìn)一步提升AIOPS場(chǎng)景對(duì)實(shí)際生產(chǎn)運(yùn)維的價(jià)值體現(xiàn)。
1.海量生產(chǎn)數(shù)據(jù)統(tǒng)一集成
實(shí)現(xiàn)對(duì)生產(chǎn)上各類(lèi)生產(chǎn)數(shù)據(jù)的集成,支持多種數(shù)據(jù)源集成,包括關(guān)系型數(shù)據(jù)庫(kù) Oracle、Mysql、SQLServer、DB2 等,結(jié)構(gòu)化文件 TXT、CSV、Excel、XML等,NoSQL 數(shù)據(jù)庫(kù) Hadoop、HBase、MongoDB 等。提供內(nèi)置豐富的數(shù)據(jù)校驗(yàn)、清洗和轉(zhuǎn)換插件,屏蔽層次技術(shù)實(shí)現(xiàn)細(xì)節(jié),用戶(hù)只需要梳理業(yè)務(wù)數(shù)據(jù),通過(guò)圖形化界面快速定義數(shù)據(jù)處理邏輯,即可完成整個(gè)數(shù)據(jù)集成的過(guò)程。
提供數(shù)據(jù)集成及預(yù)處理作業(yè)流程編排,以及作業(yè)任務(wù)單調(diào)度、監(jiān)控、查看等功能,輕松圖形化管理數(shù)據(jù)處理作業(yè)。
2.智能化分析
結(jié)合大數(shù)據(jù)架構(gòu)和智能算法模型進(jìn)一步完善智能分析能力,結(jié)合生產(chǎn)需求及集團(tuán)規(guī)范,實(shí)現(xiàn)系統(tǒng)健康度評(píng)分、故障預(yù)測(cè)、根因分析、容量評(píng)估、告警收斂、應(yīng)用服務(wù)自愈、異常檢測(cè)等場(chǎng)景:結(jié)合多類(lèi)型海量運(yùn)維監(jiān)控日志數(shù)據(jù),提供多數(shù)據(jù)指標(biāo)綜合分析,適配各類(lèi)數(shù)據(jù)。
提供有監(jiān)督學(xué)習(xí),提取生產(chǎn)數(shù)據(jù),進(jìn)行指定指標(biāo)數(shù)據(jù)或業(yè)務(wù)數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí),得到相應(yīng)指標(biāo)或業(yè)務(wù)數(shù)據(jù)的準(zhǔn)確分析結(jié)果。
提供無(wú)監(jiān)督學(xué)習(xí)能力,針對(duì)生產(chǎn)數(shù)據(jù)進(jìn)行海量數(shù)據(jù)的聚類(lèi)分析,挖掘異常模式,進(jìn)一步結(jié)合有監(jiān)督分析結(jié)果,提升智能分析的精確性和及時(shí)性。
3.自動(dòng)化聯(lián)動(dòng)
自愈、智能巡檢、智能重啟等能力,提升運(yùn)維操作的智能化、敏捷化、精準(zhǔn)化。
三、組織開(kāi)展及落地舉措
通過(guò)對(duì)數(shù)據(jù)集成及預(yù)處理組件實(shí)現(xiàn)生產(chǎn)各類(lèi)運(yùn)維、監(jiān)控?cái)?shù)據(jù)的統(tǒng)一集成、預(yù)處理,將處理后的規(guī)范化的數(shù)據(jù),上報(bào)至AIOPS場(chǎng)景,結(jié)合機(jī)器學(xué)習(xí)實(shí)現(xiàn)具體AIOPS場(chǎng)景智能化分析,落地AIOPS能力,并結(jié)合智能分析結(jié)果,驅(qū)動(dòng)運(yùn)維作業(yè)執(zhí)行,進(jìn)一步實(shí)現(xiàn)智能化與自動(dòng)化的結(jié)合,綜合提升智能化運(yùn)維能力建設(shè)。
(一)數(shù)據(jù)集成及預(yù)處理
數(shù)據(jù)集成組件支持抽取和加載各種常見(jiàn)的數(shù)據(jù)源,如:關(guān)系型數(shù)據(jù)庫(kù)Oracle、Mysql、SQL Server、DB2等,結(jié)構(gòu)化文件TXT、CSV、Excel、XML等,NoSQL數(shù)據(jù)庫(kù)Hadoop、HBase、MongoDB等,內(nèi)置了豐富的數(shù)據(jù)校驗(yàn)、清洗和轉(zhuǎn)換插件,屏蔽了層次技術(shù)實(shí)現(xiàn)細(xì)節(jié),用戶(hù)只需要梳理業(yè)務(wù)數(shù)據(jù),通過(guò)圖形化界面快速定義數(shù)據(jù)處理邏輯,即可完成整個(gè)數(shù)據(jù)集成的過(guò)程。
本次部署,對(duì)于主機(jī)指標(biāo)數(shù)據(jù)、數(shù)據(jù)庫(kù)指標(biāo)數(shù)據(jù)、日志數(shù)據(jù)等主要來(lái)自現(xiàn)有的數(shù)據(jù)納管中心,分別是以數(shù)據(jù)庫(kù)表查詢(xún)及Kafka消費(fèi)形式進(jìn)行數(shù)據(jù)集成。應(yīng)用性能數(shù)據(jù)來(lái)源于WebGate,也是通過(guò)消費(fèi)Kafka形式進(jìn)行數(shù)據(jù)集成。
(二)AIOPS智能分析
企業(yè)深度解析自身運(yùn)維現(xiàn)狀,包括生產(chǎn)數(shù)據(jù)形態(tài)及運(yùn)維痛點(diǎn),依托于大數(shù)據(jù)為底座,結(jié)合數(shù)據(jù)集成組件,統(tǒng)一集成生產(chǎn)各類(lèi)數(shù)據(jù)。組件機(jī)器學(xué)習(xí)平臺(tái),集優(yōu)秀成熟智能算法,結(jié)合智慧中臺(tái)先進(jìn)AIOPS場(chǎng)景建設(shè)理念,完成本省AIOPS平臺(tái)研發(fā)及建設(shè)。
平臺(tái)以大數(shù)據(jù)為數(shù)據(jù)承載,結(jié)合有監(jiān)督和無(wú)監(jiān)督學(xué)習(xí),構(gòu)建智慧中臺(tái)四大AIOPS場(chǎng)景落地建設(shè)。
1.健康度評(píng)分
健康度評(píng)分模型,采用豐富的指標(biāo),分別以三個(gè)維度進(jìn)行指標(biāo)的分類(lèi),分別為支撐平臺(tái)、應(yīng)用組件、系統(tǒng)指標(biāo)。支撐平臺(tái)主要為主機(jī)層面的性能指標(biāo)、應(yīng)用組件為應(yīng)用系統(tǒng)層面的性能指標(biāo),系統(tǒng)指標(biāo)主要為應(yīng)用系統(tǒng)TPS和日志相關(guān)數(shù)據(jù)。
采用基于Drain的日志聚類(lèi)算法、Apriori/FP-growth關(guān)聯(lián)規(guī)則算法,綜合各類(lèi)數(shù)據(jù)的分析,進(jìn)行系統(tǒng)各指標(biāo)的打分,以及系統(tǒng)整體打分。實(shí)時(shí)掌握系統(tǒng)健康度情況,并結(jié)合次模型能力,可運(yùn)用于生產(chǎn)系統(tǒng)日常巡檢、維護(hù)質(zhì)量分析、維護(hù)人員工作考評(píng)基準(zhǔn)等。結(jié)合運(yùn)維聯(lián)動(dòng)可進(jìn)一步實(shí)現(xiàn)對(duì)系統(tǒng)健康度低的,自動(dòng)觸發(fā)執(zhí)行預(yù)定義的運(yùn)維作業(yè)進(jìn)行系統(tǒng)性能提升。
2.根因分析
根因分析通過(guò)對(duì)海量告警數(shù)據(jù)進(jìn)行AI的深度挖掘,結(jié)合Apriori/FP-growth算法及SBD算法,進(jìn)行關(guān)聯(lián)性分析,通過(guò)AI算法分析系統(tǒng)告警之間的關(guān)聯(lián)關(guān)系,對(duì)自動(dòng)分析的AI規(guī)則,可支持人工進(jìn)一步的打標(biāo)處理。實(shí)現(xiàn)無(wú)監(jiān)督和有監(jiān)督的靈活結(jié)合,綜合提高根因規(guī)則的準(zhǔn)確性。通過(guò)根因分析,可輕松定位故障根因,在海量告警和繁雜噪音數(shù)據(jù)里面,定位故障根因,為運(yùn)維人員提供便利、高效、高準(zhǔn)確率的故障定位能力。
3.容量評(píng)估
容量評(píng)估實(shí)現(xiàn)對(duì)主機(jī)的CPU、內(nèi)存、存儲(chǔ)的歷史數(shù)據(jù)分析,結(jié)合auto_arima、xgboost、holt-winter、LinearRegression等算法,提供關(guān)聯(lián)預(yù)測(cè)與單指標(biāo)趨勢(shì)預(yù)測(cè),結(jié)合相應(yīng)的評(píng)估任務(wù),可靈活定義預(yù)測(cè)的周期,如小時(shí)、天、周、月等,且支持具體的周期數(shù),如預(yù)測(cè)3天。后臺(tái)AIOPS模型會(huì)根據(jù)容量評(píng)估任務(wù)的預(yù)測(cè)周期時(shí)間,智能分析10倍預(yù)測(cè)周期時(shí)長(zhǎng)的歷史數(shù)據(jù),目前定位10:1的比例,亦可按需進(jìn)行調(diào)整。
通過(guò)對(duì)指標(biāo)歷史數(shù)據(jù)的智能分析,結(jié)合相應(yīng)的評(píng)估周期任務(wù),以及模型對(duì)于特定節(jié)假日的特殊處理,如月末月初、企業(yè)營(yíng)銷(xiāo)活動(dòng)、法定節(jié)假日等,綜合分析提高對(duì)容量評(píng)估的準(zhǔn)確性。
4.故障預(yù)測(cè)
故障預(yù)測(cè)是結(jié)合根因分析模型所分析到的關(guān)聯(lián)關(guān)系拓?fù)?,根?jù)因果關(guān)系,實(shí)時(shí)檢測(cè)系統(tǒng)各類(lèi)指標(biāo)數(shù)據(jù),結(jié)合趨勢(shì)預(yù)測(cè)(auto_arima、holt-winter)算法,通過(guò)對(duì)前序事件的實(shí)時(shí)檢測(cè),從而進(jìn)行后序事件的預(yù)測(cè),實(shí)現(xiàn)對(duì)故障的預(yù)測(cè)效果。
故障預(yù)測(cè)支持對(duì)前序事件的發(fā)生時(shí)間以及故障預(yù)測(cè)的發(fā)生時(shí)間展示,幫助運(yùn)維人員輕松了解AIOPS預(yù)測(cè)到的故障及發(fā)生時(shí)間,為后續(xù)的故障自愈、預(yù)處理提供支撐。
(三)智能運(yùn)維聯(lián)動(dòng)
1.運(yùn)維編排組件
運(yùn)維編排組件主要實(shí)現(xiàn)圖形化靈活的作業(yè)編排能力,支持組件拖拽形式編排,作業(yè)步驟之間的串/并行、條件判斷亦可靈活定義。每個(gè)步驟都可以靈活定義執(zhí)行目標(biāo)、執(zhí)行內(nèi)容、執(zhí)行輸出等,亦可支持變量性質(zhì)實(shí)現(xiàn)整體作業(yè)執(zhí)行目標(biāo)執(zhí)行過(guò)程中定義的需求。結(jié)合作業(yè)審批、歷史作業(yè)回溯、權(quán)限管理等功能,完成生產(chǎn)各類(lèi)自動(dòng)化運(yùn)維操作的集中納管、效率提升、提效節(jié)能的作用。
2.智能運(yùn)維聯(lián)動(dòng)
智能運(yùn)維聯(lián)動(dòng)主要是結(jié)合健康度評(píng)分、容量評(píng)估、故障預(yù)測(cè)模型的AIOPS智能分析結(jié)果,進(jìn)行聯(lián)動(dòng)相應(yīng)預(yù)定義的運(yùn)維作業(yè),實(shí)現(xiàn)AIOPS模型分析結(jié)果智能驅(qū)動(dòng)運(yùn)維作業(yè)執(zhí)行的效果。進(jìn)而實(shí)現(xiàn)系統(tǒng)亞健康性能自檢提升、容量異常自動(dòng)擴(kuò)縮容、預(yù)測(cè)故障進(jìn)行自愈等智能運(yùn)維場(chǎng)景的實(shí)現(xiàn)。
緊密結(jié)合AIOPS智能分析能力與自動(dòng)化運(yùn)維能力,實(shí)現(xiàn)智能運(yùn)維,為生產(chǎn)維護(hù)提速增效,降低人工定位、操作的時(shí)延影響,整體提高系統(tǒng)的穩(wěn)定性、可用性和用戶(hù)滿(mǎn)意度。
四、工作成效
企業(yè)順利完成智慧中臺(tái)AIOPS能力本地化建設(shè),并結(jié)合數(shù)據(jù)集成及運(yùn)維聯(lián)動(dòng)組件,實(shí)現(xiàn)完善全面的智能運(yùn)維解決方案,目前已接入了多套企業(yè)級(jí)日常運(yùn)營(yíng)支撐系統(tǒng),并對(duì)各個(gè)系統(tǒng)日常運(yùn)行所產(chǎn)生的各類(lèi)數(shù)據(jù)進(jìn)行集中集成,預(yù)處理后結(jié)合機(jī)器學(xué)習(xí),與具體的算法模型進(jìn)行測(cè)算演進(jìn),綜合分析得到準(zhǔn)確的分析結(jié)果,并結(jié)合具體的場(chǎng)景,完成運(yùn)維作業(yè)的聯(lián)動(dòng),實(shí)現(xiàn)深度智能運(yùn)維能力的建設(shè)。
通過(guò)智能運(yùn)維系統(tǒng)切實(shí)提升系統(tǒng)日常運(yùn)維效率,以及產(chǎn)能提升,主要體現(xiàn)在以下幾個(gè)方面:
(一)提升數(shù)據(jù)集成能力
通過(guò)數(shù)據(jù)集成組件,統(tǒng)一系統(tǒng)各類(lèi)數(shù)據(jù),打通數(shù)據(jù)壁壘,挖掘不同數(shù)據(jù)之間的相關(guān)性?xún)r(jià)值,從數(shù)據(jù)維度提升綜合分析能力。為后續(xù)的AIOPS智能綜合分析提供數(shù)據(jù)支撐。數(shù)據(jù)集成組件圖形化構(gòu)建數(shù)據(jù)預(yù)處理流程,在線配置數(shù)據(jù)接入定時(shí)任務(wù),輕松解決系統(tǒng)各類(lèi)數(shù)據(jù)的實(shí)時(shí)接入、轉(zhuǎn)換、封裝、上報(bào)全流程工作。
(二)AI智能分析能力
通過(guò)提供機(jī)器學(xué)習(xí)能力,并靈活結(jié)合各類(lèi)智能算法及模型,通過(guò)對(duì)生產(chǎn)運(yùn)維監(jiān)控產(chǎn)生的海量數(shù)據(jù)進(jìn)行測(cè)算分析,結(jié)合運(yùn)維經(jīng)驗(yàn),調(diào)優(yōu)模型,進(jìn)一步提升智能分析的精確度和可靠性。完成系統(tǒng)健康度評(píng)分、故障預(yù)測(cè)、根因分析、容量評(píng)估等場(chǎng)景的落地實(shí)現(xiàn)。與生產(chǎn)系統(tǒng)運(yùn)維流程相結(jié)合,切實(shí)提升運(yùn)維質(zhì)量和效率。
系統(tǒng)健康度評(píng)分:完成接入系統(tǒng)健康度評(píng)分,實(shí)時(shí)綜合評(píng)分,結(jié)合生產(chǎn)系統(tǒng)管理體系,對(duì)系統(tǒng)維護(hù)質(zhì)量、運(yùn)行質(zhì)量進(jìn)行量化考評(píng),轉(zhuǎn)化系統(tǒng)分析方式,提高監(jiān)控、管理、總結(jié)、匯報(bào)等生產(chǎn)工作質(zhì)量和效率。
目前企業(yè)接入系統(tǒng),結(jié)合各類(lèi)實(shí)時(shí)數(shù)據(jù),每5分鐘進(jìn)行健康度整體評(píng)分,并提供大屏實(shí)時(shí)展示,輕松掌握系統(tǒng)實(shí)時(shí)運(yùn)行健康狀態(tài),減少系統(tǒng)巡檢、分析壓力,提升系統(tǒng)異常處理時(shí)效。
故障預(yù)測(cè):以海量歷史數(shù)據(jù)為計(jì)算基礎(chǔ),提供指定時(shí)間(小時(shí)、天、周、月)的預(yù)測(cè)能力,以此增加有效告警,提供故障自愈能力。
目前結(jié)合多個(gè)生產(chǎn)系統(tǒng)歷史數(shù)據(jù),實(shí)時(shí)預(yù)測(cè)故障,平均每日預(yù)測(cè)近50個(gè)故障,為運(yùn)維人員提供有效的故障預(yù)警及預(yù)處理,提升系統(tǒng)整體穩(wěn)定性。
根因分析:結(jié)合生產(chǎn)系統(tǒng)海量歷史數(shù)據(jù),建立關(guān)聯(lián)性拓?fù)?,平均每月采?00多個(gè)因子,分析300多個(gè)事件根因,減少200余次的無(wú)效告警。
容量評(píng)估:結(jié)合生產(chǎn)系統(tǒng)海量歷史數(shù)據(jù),建立動(dòng)態(tài)閾值,結(jié)合智能預(yù)測(cè)算法,為系統(tǒng)提供定期(小時(shí)、天、周、月)容量預(yù)測(cè)服務(wù),助力生產(chǎn)系統(tǒng)各類(lèi)場(chǎng)景的容量評(píng)估和優(yōu)化,包括秒殺、活動(dòng)、月末月初出賬、法定節(jié)假日等業(yè)務(wù)突增場(chǎng)景。
目前配置預(yù)測(cè)任務(wù),平均每日預(yù)測(cè)20次左右容量不足及冗余情況,助力生產(chǎn)系統(tǒng)容量合理調(diào)整規(guī)劃。
(三)智能與運(yùn)維聯(lián)動(dòng)能力
通過(guò)智能分析與運(yùn)維操作的聯(lián)動(dòng),進(jìn)一步提升智能分析結(jié)果的價(jià)值,結(jié)合運(yùn)維操作,實(shí)現(xiàn)更靈活智能的運(yùn)維需求。實(shí)現(xiàn)故障自愈、智能巡檢、故障預(yù)測(cè)聯(lián)動(dòng)故障恢復(fù)等運(yùn)維場(chǎng)景落地,觸發(fā)故障預(yù)測(cè)及預(yù)處理實(shí)踐,降低業(yè)務(wù)系統(tǒng)故障率。
整體而言,截止目前已累計(jì)覆蓋10余種核心系統(tǒng)的智能運(yùn)維工作,日處理數(shù)據(jù)量達(dá)100G,為電子渠道系統(tǒng)提供容量規(guī)劃,累計(jì)節(jié)省176萬(wàn)投資。通過(guò)智能場(chǎng)景建設(shè),觸發(fā)自動(dòng)巡檢、主動(dòng)故障干預(yù),降低15%左右的告警數(shù)量,每月減少33萬(wàn)的人力成本,助力降本增效工作開(kāi)展。
五、應(yīng)用建議
本次實(shí)施方案綜合了大數(shù)據(jù)架構(gòu)、數(shù)據(jù)集成、數(shù)據(jù)預(yù)處理、智能AI分析、運(yùn)維操作聯(lián)動(dòng)方案的特性,提供針對(duì)海量數(shù)據(jù)的實(shí)時(shí)分析,結(jié)合AI智能算法與模型,實(shí)現(xiàn)各類(lèi)AIOPS場(chǎng)景的落地,并結(jié)合運(yùn)維作業(yè)組件,實(shí)現(xiàn)運(yùn)維聯(lián)動(dòng),進(jìn)一步提升智能分析產(chǎn)出價(jià)值,以及智能化運(yùn)維的實(shí)施,助力運(yùn)維模式從自動(dòng)化運(yùn)維向智能化運(yùn)維轉(zhuǎn)型,進(jìn)一步降低人員維護(hù)成本,提高系統(tǒng)可用性。
(一)應(yīng)用普適性
本方案采用分布式集群架構(gòu),具備高可用能力,具備了適用面廣泛、快速規(guī)模部署、模型通用性強(qiáng)等特點(diǎn),利于全網(wǎng)推廣與借鑒。
1. 適應(yīng)面廣泛
數(shù)據(jù)集成組件適配各類(lèi)數(shù)據(jù)源,無(wú)需用戶(hù)大量定制化改造,只需配置相應(yīng)的采集渠道,即可實(shí)現(xiàn)數(shù)據(jù)的統(tǒng)一集成,結(jié)合數(shù)據(jù)處理組件的模塊,圖形化編排數(shù)據(jù)預(yù)處理作業(yè),可實(shí)現(xiàn)數(shù)據(jù)的預(yù)處理操作,供后續(xù)大數(shù)據(jù)分析及智能分析使用,具備優(yōu)良的可推廣性。
2. 快速規(guī)模部署
采用分布式集群架構(gòu),支持快速部署,具備良好的擴(kuò)展性,基于大數(shù)據(jù)存儲(chǔ),實(shí)時(shí)流式分析,具備龐大的計(jì)算分析能力。核心組件提供容器化部署方案,可靈活快速擴(kuò)容。支持根據(jù)現(xiàn)場(chǎng)環(huán)境及需求,靈活調(diào)整集群部署量級(jí)及架構(gòu)。
3. AI能力固化
平臺(tái)提供AIOPS常見(jiàn)的算法及模型固化,并提供模型測(cè)算和訓(xùn)練功能,用戶(hù)可根據(jù)現(xiàn)場(chǎng)數(shù)據(jù)及業(yè)務(wù)場(chǎng)景,進(jìn)一步進(jìn)行模型測(cè)算和調(diào)優(yōu)即可完成相應(yīng)aiops場(chǎng)景的落地實(shí)現(xiàn)。
4. 智能運(yùn)維聯(lián)動(dòng)
智能分析聯(lián)動(dòng)運(yùn)維作業(yè),實(shí)現(xiàn)深度智能運(yùn)維??筛鶕?jù)用戶(hù)現(xiàn)場(chǎng)已有的運(yùn)維操作平臺(tái)或者智能分析平臺(tái)進(jìn)行接口對(duì)接,實(shí)現(xiàn)相應(yīng)能力集成。