張士存 張杜瑋 顧佳
摘 要:隨著高鐵的高速發(fā)展,動車組運(yùn)行安全面臨越來越大的挑戰(zhàn),作為動車組重要組成部分的轉(zhuǎn)向架受到的關(guān)注日益增加。本文利用隨機(jī)森林算法根據(jù)動車組軸箱的溫度識別軸箱是否故障,及時提醒動車組司機(jī)和隨車機(jī)械師確認(rèn)并進(jìn)行降速等處置措施,保障列車運(yùn)行安全。
關(guān)鍵詞:動車組;軸箱溫度;隨機(jī)森林;故障識別
中圖分類號:TP333.35 文獻(xiàn)標(biāo)識碼:A 文章編號:1671-2064(2018)08-0050-02
近些年,我國的高鐵事業(yè)得到迅猛發(fā)展,技術(shù)越來越成熟,速度越來越快,特別是我國自主設(shè)計(jì)研發(fā)的‘復(fù)興號動車組更是以350km/h速度試運(yùn)營,如何保障列車安全運(yùn)行成為極其重要的挑戰(zhàn)。動車組轉(zhuǎn)向架在列車運(yùn)行過程中起承載、轉(zhuǎn)向、緩沖、牽引、制動等作用,它的各種參數(shù)直接決定了列車的穩(wěn)定性和舒適性[1]。而高速列車軸箱軸承是高鐵轉(zhuǎn)向架的關(guān)鍵部件,其性能好壞直接影響列車的安全行駛,經(jīng)過以往研究發(fā)現(xiàn)軸箱發(fā)生故障后直接表現(xiàn)是其溫度異常變化,通過實(shí)時監(jiān)測溫度的異常溫升等變化情況,可以對列車軸箱故障進(jìn)行預(yù)警,保障列車運(yùn)行安全[2]。
1 隨機(jī)森林簡述
隨機(jī)森林算法是機(jī)器學(xué)習(xí)中最具有廣泛影響力的算法之一,它不僅應(yīng)用于分類還能進(jìn)行回歸預(yù)測,也可以用來聚類,它適合多個特征變量,且變量之間可以是多重共線性的,不會出現(xiàn)過擬合,適合大樣本數(shù)據(jù)訓(xùn)練,可以并行執(zhí)行,比神經(jīng)網(wǎng)絡(luò)時間復(fù)雜度小。
優(yōu)點(diǎn):(1)在數(shù)據(jù)集上表現(xiàn)良好,隨機(jī)森林不容易陷入過擬合;(2)隨機(jī)森林具有很好的抗噪聲能力;(3)它能夠處理很高維度的數(shù)據(jù),并且不用做特征選擇,既能處理離散型數(shù)據(jù),也能處理連續(xù)型數(shù)據(jù);(4)訓(xùn)練速度快,可以得到變量重要性排序;(5)可以并行計(jì)算;(6)實(shí)現(xiàn)比較簡單。
2 動車組軸箱故障預(yù)警模型
動車組列車中,轉(zhuǎn)向架是重要組成部分之一,軸箱是轉(zhuǎn)向架的關(guān)鍵部位,本文的目的是通過列車基本數(shù)據(jù)和軸箱溫度數(shù)據(jù)對列車運(yùn)行過程中軸箱故障進(jìn)行識別和報警。
2.1 建模思路
列車原始數(shù)據(jù)中,沒有真正發(fā)生故障的數(shù)據(jù),在只有正常樣本的情況下,只能對列車在正常運(yùn)行時的軸溫建模,得出軸溫的模型值,當(dāng)軸溫實(shí)際溫度與模型溫度值差異大時認(rèn)為軸溫所在軸可能出現(xiàn)異常,進(jìn)一步檢測后續(xù)軸溫狀況,差異值繼續(xù)增大,可認(rèn)定軸溫異常所在軸發(fā)生故障。建模思路如圖1所示。
(1)將所得數(shù)據(jù)提取特征,進(jìn)行建模,利用回歸模型回歸一條標(biāo)準(zhǔn)曲線得出列車在正常時的模型。(2)根據(jù)模型誤差,確定上下容忍邊界,在實(shí)際溫度在邊界內(nèi)的認(rèn)為是正常值,否則為異常值。(3)確定預(yù)警值,監(jiān)測到異常點(diǎn)溫度連續(xù)超過標(biāo)準(zhǔn)曲線累計(jì)達(dá)到某一值,認(rèn)為預(yù)警值。
2.2 實(shí)例建模
2.2.1 樣本說明
抽樣選擇某車型某段時間的全量數(shù)據(jù),數(shù)據(jù)包間隔30秒,樣本數(shù)共428732例,模型交叉驗(yàn)證訓(xùn)練集和測試集按照0.7比例劃分。驗(yàn)證樣本數(shù)據(jù):選擇某車(車內(nèi)預(yù)警)樣本,樣本數(shù)共3658例。
2.2.2 數(shù)據(jù)預(yù)處理
(1)數(shù)據(jù)清洗。剔除掉樣本數(shù)據(jù)中重復(fù)數(shù)據(jù)和無效數(shù)據(jù)。(2)數(shù)據(jù)標(biāo)準(zhǔn)化。樣本各指標(biāo)的單位不同,為消除量綱影響,對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,所采用方法為最小—最大規(guī)范化:
其中νi代表標(biāo)準(zhǔn)化后的新數(shù)據(jù),max和min分別代表原始指標(biāo)數(shù)據(jù)中的最大值和最小值,νi表示原始指標(biāo)數(shù)據(jù)。
2.2.3 建模結(jié)果
(1)回歸模型。評價回歸模型的指標(biāo)主要有R2,RMSE(均方根誤差),R2代表模型擬合的好壞,越接近1,表示模型擬合越好;RMSE(均方根誤差),代表真實(shí)值與預(yù)測值之間的誤差,RMSE越小,表示真實(shí)值與預(yù)測值差距越小,預(yù)測效果越準(zhǔn)確。隨機(jī)森林回歸結(jié)果R2=0.92,RMSE=6.235。在采用隨機(jī)森林回歸建立列車運(yùn)行正常的軸溫模型建立之后,真實(shí)值與模型值差的絕對值的最大值為閾值,因此,模型的容忍邊界設(shè)定為[-8,8]。落在上邊界外認(rèn)為異常,在測試樣本中,回歸模型識別的異常點(diǎn)如圖2所示:異常溫度值發(fā)生部位為8位軸端,共288個,顯而易見尖峰點(diǎn)為傳感器誤報,其余發(fā)生在后半段,異常軸溫與回歸模型差距逐步拉大,需要選擇過濾規(guī)則。(2)過濾模型。過濾模型規(guī)則:溫升:軸溫上升趨勢越高,差值越大,發(fā)生故障風(fēng)險越大,10min不間斷溫升大于7。軸端溫升:軸端相對外溫溫升大于78(根據(jù)附錄數(shù)據(jù)探索得出),排除外溫影響。過濾后的異常數(shù)據(jù)如表1所示:過濾后的數(shù)據(jù)比車上預(yù)警時間提前了5分鐘,但是預(yù)警點(diǎn)多了6個。
3 結(jié)語
預(yù)警的控制策略是軸端溫度大于閾值,本文認(rèn)為只靠軸溫值大于閾值來判定預(yù)警是不合理的,本模型認(rèn)為預(yù)警需要綜合考慮。在本文中通過隨機(jī)森林回歸擬合軸溫,找出異常溫度值后結(jié)合外溫、不間斷溫升來定故障點(diǎn)是可行的,在后續(xù)數(shù)據(jù)本身質(zhì)量和模型仍需近一步優(yōu)化。
參考文獻(xiàn)
[1]尹懷仙,王凱,張鐵柱,等.基于PSO-BP神經(jīng)網(wǎng)絡(luò)的城軌列車轉(zhuǎn)向架輪對軸箱故障預(yù)測[J].復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2015,(4):97-103.
[2]湯武初,王敏杰,陳光東,等.高速列車故障軸箱軸承的溫度分布研究[J].鐵道學(xué)報,2016,(7):50-56.