王朝暉 孫強(qiáng) 陳威 李光兆
摘要:本文探討了使用XGBoost集成樹(shù)模型作為鐵路IT基礎(chǔ)設(shè)施健康評(píng)估模型的方法。IT設(shè)施是組織中不可或缺的重要資產(chǎn),對(duì)其健康狀況進(jìn)行準(zhǔn)確評(píng)估至關(guān)重要。XGBoost是一種基于梯度提升算法的集成樹(shù)模型,具有優(yōu)秀的預(yù)測(cè)性能和可解釋性。本文首先對(duì)需要用到的鐵路IT基礎(chǔ)設(shè)施健康評(píng)估指標(biāo)進(jìn)行了羅列,然后對(duì)這些鐵路IT基礎(chǔ)設(shè)施健康特征的預(yù)處理方式進(jìn)行介紹,最后介紹了XGBoost的原理和特點(diǎn),并詳細(xì)討論了如何將其應(yīng)用于鐵路IT基礎(chǔ)設(shè)施健康評(píng)估的流程中。結(jié)果表明,基于XGBoost的IT設(shè)施健康評(píng)估模型能夠有效檢測(cè)和預(yù)測(cè)潛在的故障和問(wèn)題,為鐵路基礎(chǔ)設(shè)施相關(guān)維護(hù)人員提供有價(jià)值的決策支持。
關(guān)鍵詞:XGBoost;集成樹(shù)模型;健康評(píng)估;IT設(shè)施;故障檢測(cè)
引言
鐵路IT基礎(chǔ)設(shè)施在鐵路業(yè)務(wù)中扮演著至關(guān)重要的角色,支持著鐵路系統(tǒng)的運(yùn)行和管理。為確保鐵路業(yè)務(wù)的安全性、高效性和可靠性,準(zhǔn)確評(píng)估和監(jiān)測(cè)鐵路IT基礎(chǔ)設(shè)施的健康狀況是至關(guān)重要的。隨著XGBoost集成樹(shù)模型在機(jī)器學(xué)習(xí)領(lǐng)域的廣泛應(yīng)用,將其應(yīng)用于鐵路IT基礎(chǔ)設(shè)施健康評(píng)估成為一種有前景的方法。本文旨在探討基于XGBoost集成樹(shù)模型的鐵路IT基礎(chǔ)設(shè)施健康評(píng)估方法在鐵路業(yè)務(wù)中的應(yīng)用,并闡明運(yùn)用到鐵路的IT基礎(chǔ)設(shè)施健康評(píng)估指標(biāo)和預(yù)處理方式,同時(shí)評(píng)估算法的效果和可行性。
1. 鐵路IT基礎(chǔ)設(shè)施健康評(píng)估指標(biāo)
IT設(shè)施在現(xiàn)代組織中起著關(guān)鍵的作用,對(duì)組織的運(yùn)行和業(yè)務(wù)流程至關(guān)重要。因此,準(zhǔn)確評(píng)估IT設(shè)施的健康狀況對(duì)于保障組織的正常運(yùn)行和決策制定具有重要意義。在研究中,我們收集了與鐵路IT基礎(chǔ)設(shè)施健康相關(guān)的各種指標(biāo),包括性能(日志)指標(biāo)及其衍生指標(biāo),周遭異常風(fēng)險(xiǎn)隱患指標(biāo),健壯性、歷史故障和專(zhuān)家知識(shí)庫(kù)指標(biāo)等。這些指標(biāo)反映了IT設(shè)施的不同方面,可以用于評(píng)估其健康狀況。
1.1性能(日志)指標(biāo)及其衍生指標(biāo)
性能(日志)指標(biāo)及其衍生主要指的是鐵路各IT基礎(chǔ)設(shè)施上采集到的各類(lèi)性能(日志)指標(biāo)數(shù)據(jù)、異常檢測(cè)后加工得到的量化異常程度,以及在一定時(shí)間窗口對(duì)性能(日志)指標(biāo)進(jìn)行聚合形成的統(tǒng)計(jì)指標(biāo)。性能指標(biāo)及其衍生主要涉及主板、CPU、內(nèi)存、Raid卡、網(wǎng)卡、磁盤(pán)、電源、接口、存儲(chǔ)池、存儲(chǔ)卷、磁盤(pán)等組件的關(guān)鍵參數(shù);日志指標(biāo)及其衍生主要涉及網(wǎng)絡(luò)設(shè)備日志、帶外數(shù)據(jù)日志的異常模板數(shù)。
1.2 周遭異常風(fēng)險(xiǎn)隱患指標(biāo)
周遭異常風(fēng)險(xiǎn)隱患主要指的是同一虛擬機(jī)(向上)上其他基礎(chǔ)設(shè)施的風(fēng)險(xiǎn)隱患,以及相同物理地址上(向下)聚合其他基礎(chǔ)設(shè)施的報(bào)警數(shù)。
1.3 健壯性、歷史故障和專(zhuān)家知識(shí)庫(kù)指標(biāo)
設(shè)備健壯性、歷史故障和專(zhuān)家知識(shí)庫(kù)中的數(shù)據(jù)可以從多維度補(bǔ)充采集到,以便更好地評(píng)估基礎(chǔ)設(shè)施的健康度。
2. 鐵路IT基礎(chǔ)設(shè)施健康特征預(yù)處理
在數(shù)據(jù)預(yù)處理階段,我們進(jìn)行了數(shù)據(jù)清洗、特征選擇和特征縮放等步驟,以確保數(shù)據(jù)的質(zhì)量和適用性。下面主要闡述特征選擇這一關(guān)鍵步驟的操作。
2.1 特征選擇(過(guò)濾無(wú)區(qū)分度和無(wú)關(guān)特征)
由于鐵路基礎(chǔ)設(shè)施設(shè)備繁多,采集的數(shù)據(jù)規(guī)模極大,如果直接使用所有特征,會(huì)造成模型訓(xùn)練時(shí)間很長(zhǎng),同時(shí)預(yù)測(cè)準(zhǔn)確性也無(wú)法保證。為了更好地處理輸入數(shù)據(jù),以提高健康評(píng)估的準(zhǔn)確性和可靠性,我們采用了特征選擇的辦法,剔除與故障無(wú)關(guān)的特征,篩選出最相關(guān)的特征。這可以提高模型的準(zhǔn)確性,并減少訓(xùn)練時(shí)間和內(nèi)存占用。
首先,可以比較各特征在正常時(shí)段和故障時(shí)段的分布,以篩選出在故障時(shí)段與正常時(shí)段之間分布區(qū)分度較大的特征。具體來(lái)說(shuō),通過(guò)KL散度比較任一特征在正常時(shí)段和故障時(shí)段的概率密度函數(shù)之間的差異,KL散度值較小的特征將其視為無(wú)關(guān)特征剔除。而KL散度值較大的特征則表示該特征在故障時(shí)段與正常時(shí)段之間存在較大的差異,該特征可能是導(dǎo)致故障的原因特征之一,并予以保留至特征子集。KL散度的計(jì)算公式為
其中,P和Q是兩個(gè)離散概率分布,n是樣本空間的大小,P(i)和Q(i)分別是樣本空間中第i個(gè)事件在兩個(gè)概率分布中的概率。
該特征在正常時(shí)段和故障時(shí)段的概率密度函數(shù)之間的差異較大,KL散度值也較大,即可選入特征子集留待后續(xù)最優(yōu)特征子集篩選。
之后,為得到最優(yōu)特征子集,在第一步篩選結(jié)果的基礎(chǔ)上結(jié)合了遞歸特征消除(基于隨機(jī)森林)的方法,盡可能得到最優(yōu)特征子集,算法流程如圖1所示。
2.2 正負(fù)樣本均衡(過(guò)下采樣結(jié)合)
由于鐵路基礎(chǔ)設(shè)施設(shè)備發(fā)生故障的幾率比正常運(yùn)行的幾率小得多,隨著時(shí)間增加,健康狀態(tài)記錄會(huì)越來(lái)越多,而非健康狀態(tài)的記錄僅有若干條,嚴(yán)重加劇了數(shù)據(jù)集樣本不均衡的問(wèn)題。如果不對(duì)數(shù)據(jù)進(jìn)行任何處理,直接放入模型進(jìn)行訓(xùn)練,會(huì)使分類(lèi)器預(yù)測(cè)結(jié)果嚴(yán)重偏向于占優(yōu)勢(shì)的多數(shù)類(lèi)別,而對(duì)少數(shù)類(lèi)別的分類(lèi)性能下降,無(wú)法有效預(yù)測(cè)出非健康狀態(tài)。為解決這個(gè)問(wèn)題,本項(xiàng)目中推薦采用過(guò)采樣結(jié)合欠采樣的技術(shù)降低樣本不均衡對(duì)建模的影響,平衡多數(shù)類(lèi)別和少數(shù)類(lèi)別的樣本數(shù)量,增加故障情況在建模中的重要性,以平衡分類(lèi)器的性能和泛化能力。
3. 鐵路IT基礎(chǔ)設(shè)施健康評(píng)估模型——XGBoost集成樹(shù)模型
3.1 XGBoost的原理
XGBoost是一種梯度提升算法的集成樹(shù)模型,通過(guò)迭代訓(xùn)練一系列的決策樹(shù)模型,以最小化損失函數(shù)并優(yōu)化預(yù)測(cè)結(jié)果。XGBoost采用了一種特殊的損失函數(shù)和正則化項(xiàng),以提高模型的魯棒性和泛化能力。XGBoost通過(guò)梯度下降的方法,逐步優(yōu)化每棵樹(shù)的結(jié)構(gòu)和葉節(jié)點(diǎn)的取值,從而提高整體模型的性能,算法原理示意圖如圖2所示。
3.2 XGBoost的特點(diǎn)
(1)高性能:通過(guò)并行計(jì)算和高效的數(shù)據(jù)結(jié)構(gòu),實(shí)現(xiàn)了高效的訓(xùn)練和預(yù)測(cè)速度。
(2)可解釋性:可以提供每個(gè)特征的重要性排序,以及每個(gè)決策樹(shù)的結(jié)構(gòu)和決策路徑,使模型的預(yù)測(cè)結(jié)果更具可解釋性和可理解性。
(3)魯棒性:通過(guò)正則化項(xiàng)和剪枝操作,減少模型的過(guò)擬合風(fēng)險(xiǎn),提高了模型的魯棒性和泛化能力。
(4)處理不平衡數(shù)據(jù):具有處理不平衡數(shù)據(jù)集的能力,通過(guò)設(shè)置適當(dāng)?shù)臋?quán)重或采樣策略,可以提高對(duì)少數(shù)類(lèi)樣本的識(shí)別能力。
3.3 基于XGBoost的鐵路IT基礎(chǔ)設(shè)施健康評(píng)估模型
3.3.1 數(shù)據(jù)收集與預(yù)處理
在構(gòu)建基于XGBoost的鐵路IT基礎(chǔ)設(shè)施健康評(píng)估模型之前,需要收集和準(zhǔn)備相應(yīng)的數(shù)據(jù),即第二章所述數(shù)據(jù)。同時(shí),還需要進(jìn)行數(shù)據(jù)清洗、缺失值處理和特征工程等預(yù)處理步驟,以提高數(shù)據(jù)質(zhì)量和模型的性能。
3.3.2 特征選擇與重要性排序
在建立模型之前,需要進(jìn)行特征選擇和重要性排序,以確定最具預(yù)測(cè)能力的特征。XGBoost提供了內(nèi)置的特征重要性評(píng)估方法,可以根據(jù)特征在模型訓(xùn)練過(guò)程中的貢獻(xiàn)程度進(jìn)行排序,從而選擇最相關(guān)的特征進(jìn)行建模。
3.3.3 模型訓(xùn)練與調(diào)優(yōu)
使用收集和預(yù)處理好的數(shù)據(jù),將其劃分為訓(xùn)練集和測(cè)試集,然后使用XGBoost進(jìn)行模型訓(xùn)練[1]。在訓(xùn)練過(guò)程中,可以設(shè)置合適的超參數(shù)和正則化項(xiàng),通過(guò)交叉驗(yàn)證和網(wǎng)格搜索等技術(shù)進(jìn)行模型調(diào)優(yōu),以達(dá)到更好的性能和泛化能力。
3.3.4 健康評(píng)估
訓(xùn)練好的基于XGBoost的IT設(shè)施健康評(píng)估模型可以用于實(shí)際的健康評(píng)估和故障檢測(cè)任務(wù)。通過(guò)輸入實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù),模型可以預(yù)測(cè)設(shè)施的健康狀態(tài)并檢測(cè)潛在的故障和問(wèn)題?;谀P偷念A(yù)測(cè)結(jié)果,組織可以及時(shí)采取相應(yīng)的措施,防止故障的發(fā)生或減少其影響。
3.3.5 實(shí)驗(yàn)結(jié)果與討論
為評(píng)估基于XGBoost的鐵路IT基礎(chǔ)設(shè)施健康評(píng)估模型的性能,我們進(jìn)行了一系列實(shí)驗(yàn),收集了真實(shí)的IT設(shè)施監(jiān)測(cè)數(shù)據(jù),并進(jìn)行了數(shù)據(jù)預(yù)處理和特征工程,然后使用XGBoost模型進(jìn)行訓(xùn)練,并使用交叉驗(yàn)證等技術(shù)進(jìn)行模型調(diào)優(yōu)。
通過(guò)實(shí)驗(yàn),得出了以下幾點(diǎn)結(jié)論:
(1)基于XGBoost的IT設(shè)施健康評(píng)估模型在預(yù)測(cè)性能上表現(xiàn)出色。與單個(gè)決策樹(shù)模型相比,XGBoost模型能夠提供更準(zhǔn)確和穩(wěn)定的預(yù)測(cè)結(jié)果[2]。這歸因于XGBoost的梯度提升算法和正則化技術(shù),能夠有效地處理復(fù)雜的關(guān)系和噪聲數(shù)據(jù)。
(2)XGBoost模型的特征重要性排序能力可幫助組織了解哪些指標(biāo)對(duì)于設(shè)施健康狀況的影響更大。通過(guò)特征重要性排序,我們可以識(shí)別出對(duì)健康評(píng)估最關(guān)鍵的指標(biāo),并在實(shí)際應(yīng)用中進(jìn)行重點(diǎn)監(jiān)測(cè)和管理。
(3)XGBoost模型具有較強(qiáng)的泛化能力,能夠處理不平衡數(shù)據(jù)集和噪聲數(shù)據(jù)。在實(shí)際應(yīng)用中,IT設(shè)施監(jiān)測(cè)數(shù)據(jù)往往存在不平衡和噪聲的情況,而XGBoost模型能夠通過(guò)樣本權(quán)重和正則化技術(shù),提高對(duì)少數(shù)類(lèi)樣本和異常數(shù)據(jù)的識(shí)別能力。
綜上所述,基于XGBoost的鐵路IT基礎(chǔ)設(shè)施健康評(píng)估模型具有良好的預(yù)測(cè)性能、可解釋性和魯棒性,能夠?yàn)榻M織提供準(zhǔn)確的健康評(píng)估和故障檢測(cè),為決策制定提供有價(jià)值的支持。
結(jié)語(yǔ)
本文探討了使用XGBoost集成樹(shù)模型作為鐵路IT基礎(chǔ)設(shè)施健康評(píng)估模型的方法。通過(guò)實(shí)驗(yàn)證明,基于XGBoost的模型在預(yù)測(cè)性能、特征重要性排序和魯棒性方面表現(xiàn)出色,能夠有效評(píng)估IT設(shè)施的健康狀況,并檢測(cè)潛在的故障和問(wèn)題,為組織提供重要的決策支持,幫助其及時(shí)采取措施,提高IT設(shè)施的穩(wěn)定性和可靠性。未來(lái)的研究可以在以下方面展開(kāi):
(1)模型改進(jìn):進(jìn)一步改進(jìn)和優(yōu)化基于XGBoost的IT設(shè)施健康評(píng)估模型,如嘗試不同的損失函數(shù)和正則化項(xiàng),以提高模型的性能和穩(wěn)定性。
(2)多模型集成:探索將XGBoost與其他機(jī)器學(xué)習(xí)模型集成的方法,以進(jìn)一步提高模型的預(yù)測(cè)能力和泛化能力。
(3)實(shí)時(shí)監(jiān)測(cè)和預(yù)測(cè):將基于XGBoost的模型應(yīng)用于實(shí)時(shí)的IT設(shè)施監(jiān)測(cè)和預(yù)測(cè),以實(shí)現(xiàn)對(duì)設(shè)施健康狀況的實(shí)時(shí)監(jiān)控和預(yù)警。這對(duì)于組織的運(yùn)維管理和故障響應(yīng)具有重要意義。
(4)可視化與決策支持:進(jìn)一步開(kāi)發(fā)可視化工具和決策支持系統(tǒng),以呈現(xiàn)基于XGBoost的健康評(píng)估模型的預(yù)測(cè)結(jié)果和特征重要性,并提供決策者所需的信息和洞見(jiàn)。
綜上所述,基于XGBoost的鐵路IT基礎(chǔ)設(shè)施健康評(píng)估模型具有廣闊的應(yīng)用前景和研究?jī)r(jià)值。通過(guò)不斷改進(jìn)和優(yōu)化,將為組織提供更準(zhǔn)確和可靠的健康評(píng)估和故障檢測(cè)能力,為IT設(shè)施的穩(wěn)定運(yùn)行和組織的決策制定提供有力支持。
參考文獻(xiàn):
[1]李?lèi)?基于深度學(xué)習(xí)的新能源汽車(chē)電池狀態(tài)評(píng)估方法研究[J].中國(guó)機(jī)械,2023(16):29-32.
[2]李世杰,王景升,牛帥.融合VMD和GRU模型的城市道路行程時(shí)間預(yù)測(cè)方法[J].科學(xué)技術(shù)與工程,2023,23(22):9680-9685.
作者簡(jiǎn)介:王朝暉,本科,高級(jí)工程師,研究方向:計(jì)算機(jī)技術(shù)及應(yīng)用;孫強(qiáng),本科,助理工程師,研究方向:計(jì)算機(jī)技術(shù)及應(yīng)用;陳威,本科,助理工程師,研究方向:計(jì)算機(jī)技術(shù)及應(yīng)用;李光兆,本科,助理工程師,研究方向:計(jì)算機(jī)技術(shù)及應(yīng)用。
基金項(xiàng)目:中國(guó)鐵路信息科技集團(tuán)有限公司科技研究開(kāi)發(fā)計(jì)劃(編號(hào):2022A01)。