摘 要:鐵路道岔是鐵路運(yùn)輸系統(tǒng)中的關(guān)鍵組成部分,其工作狀態(tài)直接影響著列車(chē)運(yùn)行的安全與效率,鐵路道岔故障的及時(shí)診斷與檢修對(duì)確保鐵路系統(tǒng)正常運(yùn)行至關(guān)重要。本文提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)和長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)混合而成的深度學(xué)習(xí)故障診斷模型,通過(guò)采集鐵路道岔動(dòng)作電流和功率曲線(xiàn)數(shù)據(jù)來(lái)組成訓(xùn)練集和測(cè)試集,并對(duì)模型進(jìn)行訓(xùn)練和測(cè)試,結(jié)果表明,與單一的CNN和LSTM診斷模型相比,本文提出的CNN-LSTM混合模型的故障診斷效果更優(yōu)。最后設(shè)計(jì)并開(kāi)發(fā)了一套鐵路道岔故障監(jiān)測(cè)和診斷系統(tǒng),實(shí)現(xiàn)了對(duì)鐵路道岔的實(shí)時(shí)監(jiān)測(cè)和故障診斷。
關(guān)鍵詞:鐵路道岔 卷積神經(jīng)網(wǎng)絡(luò) 長(zhǎng)短期記憶網(wǎng)絡(luò)
0 引言
隨著我國(guó)高速鐵路網(wǎng)的快速發(fā)展,鐵路運(yùn)輸?shù)陌踩耘c可靠性日益受到社會(huì)各界的關(guān)注。鐵路道岔作為鐵路線(xiàn)路中的重要組成部分,其工作性能狀態(tài)直接關(guān)系到列車(chē)的安全運(yùn)行和鐵路運(yùn)輸?shù)男?。然而,由于道岔結(jié)構(gòu)的復(fù)雜性以及工作環(huán)境的惡劣性,道岔故障時(shí)有發(fā)生,給鐵路安全帶來(lái)了極大的隱患。因此,開(kāi)展鐵路道岔故障診斷的研究,對(duì)于保障鐵路運(yùn)輸安全具有重要的理論意義和實(shí)用價(jià)值。近年來(lái),深度學(xué)習(xí)技術(shù)的發(fā)展為鐵路道岔故障診斷提供了新的解決思路,卷積神經(jīng)網(wǎng)絡(luò)以其在圖像處理領(lǐng)域的卓越性能,被廣泛應(yīng)用于特征提取和模式識(shí)別任務(wù)中。而長(zhǎng)短期記憶網(wǎng)絡(luò)作為一種特殊類(lèi)型的循環(huán)神經(jīng)網(wǎng)絡(luò),能夠有效處理時(shí)間序列數(shù)據(jù),并捕捉數(shù)據(jù)中的長(zhǎng)期依賴(lài)關(guān)系。國(guó)內(nèi)學(xué)者運(yùn)用深度學(xué)習(xí)的方法對(duì)鐵路道岔故障的診斷開(kāi)展了一系列的相關(guān)研究,并取得了許多研究成果,但大部分研究都是使用單一的診斷方法,將多種方法綜合起來(lái)使用的研究相對(duì)較少。將CNN與LSTM相結(jié)合,組合起來(lái)使用可以充分發(fā)揮兩者的優(yōu)勢(shì),實(shí)現(xiàn)對(duì)鐵路道岔故障信號(hào)的深度特征學(xué)習(xí)和時(shí)序分析,從而提高故障診斷的準(zhǔn)確性和效率。
1 相關(guān)原理
1.1 卷積神經(jīng)網(wǎng)絡(luò)(CNN)
在20世紀(jì)80年代,受生物神經(jīng)科學(xué)的啟迪,Yann LeCun及其團(tuán)隊(duì)提出了一種基于前饋原理的神經(jīng)網(wǎng)絡(luò)架構(gòu)模型,該模型廣為人知為卷積神經(jīng)網(wǎng)絡(luò)(CNN)[1],它由五個(gè)關(guān)鍵層級(jí)構(gòu)成:輸入層、卷積層、池化層、全連接層以及輸出層。特別地,卷積層利用卷積操作作為其核心機(jī)制,旨在從輸入的鐵路道岔信號(hào)數(shù)據(jù)中高效地提取出關(guān)鍵特征。池化層通過(guò)縮小故障預(yù)測(cè)模型的大小來(lái)提高計(jì)算速度,在保留鐵路道岔信號(hào)數(shù)據(jù)重要特征的前提下降低特征的維度,提高所提取數(shù)據(jù)特征的魯棒性。全連接層通過(guò)對(duì)提取的特征值進(jìn)行整合并將其轉(zhuǎn)換為向量輸出。
卷積層的計(jì)算表達(dá)式如下:
在此公式中,第1個(gè)卷積層的第i個(gè)特征輸出被表達(dá)為,其中j代表了當(dāng)前層輸出特征的總數(shù),這一數(shù)量是基于上一層輸出向量的計(jì)算得出的。偏置項(xiàng)以符號(hào)表示,而特征圖矩陣則用j表示。卷積核的權(quán)重則由符號(hào)表示,其中n為卷積核的索引值。此外,卷積層的輸出數(shù)量由變量N給出,而激活函數(shù)則通過(guò)符號(hào)表示。
池化層計(jì)算公式如下:
其中,表示池化層的輸出結(jié)果,T,R分別表示池化層的步長(zhǎng)和核的大小,r為池化窗口。
1.2 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)
在20世紀(jì)90年代,Sepp Hochreiter與Jürgen Schmidhuber針對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)所存在的局限性,創(chuàng)新性地提出了長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)模型[2]。該模型通過(guò)引入獨(dú)特的“門(mén)控機(jī)制”,具體包括輸入門(mén)、遺忘門(mén)、記憶單元以及輸出門(mén),實(shí)現(xiàn)了對(duì)歷史信息的精細(xì)化更新與保留策略。這一設(shè)計(jì)顯著增強(qiáng)了網(wǎng)絡(luò)處理長(zhǎng)時(shí)間序列數(shù)據(jù)時(shí)的記憶能力,同時(shí)有效解決了梯度消失與梯度爆炸這一長(zhǎng)期困擾神經(jīng)網(wǎng)絡(luò)訓(xùn)練的難題。圖1為長(zhǎng)短期記憶網(wǎng)絡(luò)的基本單元結(jié)構(gòu)。
LSTM單元的向前計(jì)算公式如下[3]:
其中,ft表示遺忘門(mén)的激活值,it表示輸入門(mén)的激活值,Wf表示遺忘門(mén)的權(quán)重參數(shù)矩陣,Wi表示輸入門(mén)的權(quán)重參數(shù)矩陣,[ht-1,Xt]表示雙向量拼接結(jié)果,bf表示遺忘門(mén)的偏置值,bi表示輸入門(mén)的偏置值,sigmoid函數(shù)由表示。表示候選元素的狀態(tài),ct-1表示t-1時(shí)刻的狀態(tài),ct表示由當(dāng)前記憶狀態(tài)和長(zhǎng)期記憶狀態(tài)ct-1組合而成的新單元狀態(tài),ht表示t時(shí)刻的輸出。
2 CNN-LSTM故障診斷模型構(gòu)建
考慮到鐵路道岔轉(zhuǎn)轍機(jī)的動(dòng)作電流及功率曲線(xiàn)數(shù)據(jù)具有多維性和時(shí)序性的特點(diǎn),為了能夠從時(shí)間和空間兩個(gè)方面對(duì)數(shù)據(jù)的特征進(jìn)行充分提取,本文提出了一種基于CNN-LSTM的混合深度學(xué)習(xí)的故障診斷模型,CNN提取數(shù)據(jù)的空間特性,LSTM提取數(shù)據(jù)的時(shí)間特性。模型主要包含三個(gè)部分,第一部分為三層一維卷積的結(jié)構(gòu)網(wǎng)絡(luò)(CNN),每一層都進(jìn)行卷積、歸一化和最大池化的操作,選取Re lu激活函數(shù)[4]。第二部分為L(zhǎng)STM網(wǎng)絡(luò)。第三部分為全連接層,包含兩層全連接。數(shù)據(jù)輸入模型后,首先經(jīng)過(guò)三層CNN部分進(jìn)行維度的轉(zhuǎn)變處理,其次輸入到LSTM部分,完成時(shí)間和空間上的特征提取和計(jì)算,最后數(shù)據(jù)進(jìn)入全連接層后輸出診斷結(jié)果。CNN-LSTM混合網(wǎng)絡(luò)模型結(jié)構(gòu)如圖2所示。
3 實(shí)驗(yàn)和分析
3.1 數(shù)據(jù)采集
本文通過(guò)高鐵車(chē)站信號(hào)自動(dòng)控制CSM-KA型信號(hào)集中監(jiān)測(cè)系統(tǒng)采集得到了600組鐵路道岔轉(zhuǎn)轍機(jī)動(dòng)作電流和功率曲線(xiàn)數(shù)據(jù),其中正常工作數(shù)據(jù)100組,另外五種故障[5](轉(zhuǎn)轍機(jī)無(wú)法啟動(dòng)、轉(zhuǎn)轍機(jī)空轉(zhuǎn)、無(wú)小臺(tái)階、小臺(tái)階偏高、動(dòng)作電流波動(dòng)較大)數(shù)據(jù)各100組。將數(shù)據(jù)集中的70%作為訓(xùn)練集,剩下的30%作為測(cè)試集。
3.2 評(píng)價(jià)指標(biāo)
為了衡量模型在故障診斷方面的性能,我們選取了準(zhǔn)確率(Accuracy)、精確率(Precision)和召回率(Recall)[6]三個(gè)指標(biāo)作為關(guān)鍵的評(píng)估標(biāo)準(zhǔn),三個(gè)評(píng)價(jià)指標(biāo)的計(jì)算公式分別如下:
其中,TP表示模型正確地預(yù)測(cè)為故障的樣本數(shù),TN表示模型正確地預(yù)測(cè)為正常的樣本數(shù),F(xiàn)P表示模型錯(cuò)誤地預(yù)測(cè)為故障的樣本數(shù),F(xiàn)N表示模型錯(cuò)誤地預(yù)測(cè)為正常的樣本數(shù)。
3.3 實(shí)驗(yàn)與結(jié)果分析
首先,實(shí)驗(yàn)階段采用了訓(xùn)練數(shù)據(jù)集對(duì)卷積神經(jīng)網(wǎng)絡(luò)(CNN)、長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)以及它們的組合模型(CNN-LSTM)進(jìn)行了充分的訓(xùn)練。隨后,利用獨(dú)立的測(cè)試數(shù)據(jù)集對(duì)這三個(gè)模型在故障診斷方面的表現(xiàn)進(jìn)行了驗(yàn)證,所得到的評(píng)估指標(biāo)包括準(zhǔn)確率、精確度和召回率,具體數(shù)值已匯總至下表所示。
準(zhǔn)確率(Accuracy)是衡量模型整體預(yù)測(cè)準(zhǔn)確性的核心指標(biāo),它反映了模型對(duì)所有樣本的綜合判斷能力;精確率(Precision)則側(cè)重于評(píng)估模型在識(shí)別異常樣本時(shí)的精確度,即模型判斷為異常的樣本中實(shí)際異常的比例;而召回率(Recall)則強(qiáng)調(diào)模型在篩查異常時(shí)的全面性,即模型成功識(shí)別出所有實(shí)際異常樣本的能力。通過(guò)分析CNN、LSTM及CNN-LSTM這三個(gè)模型的測(cè)試結(jié)果,我們可以觀察到CNN-LSTM模型在準(zhǔn)確率、精確率及召回率這三項(xiàng)關(guān)鍵評(píng)價(jià)指標(biāo)上均達(dá)到了三個(gè)模型中的最高水平,這充分證明了相較于單一的診斷模型,該混合模型在鐵路道岔故障診斷中展現(xiàn)出了更為優(yōu)越的性能。
4 診斷系統(tǒng)開(kāi)發(fā)
基于上述建立的CNN-LSTM鐵路道岔故障診斷模型,設(shè)計(jì)并開(kāi)發(fā)了一套鐵路道岔故障監(jiān)測(cè)和診斷系統(tǒng),以此來(lái)對(duì)鐵路道岔的工作狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)測(cè),對(duì)鐵路道岔的故障進(jìn)行診斷。
4.1 系統(tǒng)開(kāi)發(fā)環(huán)境
系統(tǒng)開(kāi)發(fā)和運(yùn)行的硬件環(huán)境:CPU:AMD 銳龍 Threadripper 3990X ,內(nèi)存:32G,硬盤(pán):128G;系統(tǒng)開(kāi)發(fā)的操作系統(tǒng)和運(yùn)行平臺(tái):Windows 8 64位 旗艦版;系統(tǒng)開(kāi)發(fā)的環(huán)境和工具:IntelliJ IDEA、Eclipse;系統(tǒng)運(yùn)行的支撐環(huán)境和支持軟件:mysql v5.7.19;系統(tǒng)使用的編程語(yǔ)言:Java。
4.2 系統(tǒng)功能架構(gòu)
系統(tǒng)主要包含兩大模塊:故障診斷管理和數(shù)據(jù)處理管理,故障診斷管理模塊中包含有診斷首頁(yè)、故障診斷報(bào)警、故障預(yù)測(cè)預(yù)防和數(shù)據(jù)可視化四項(xiàng)功能,數(shù)據(jù)處理管理模塊中包含有數(shù)據(jù)采集處理、用戶(hù)管理權(quán)限和故障歷史記錄三項(xiàng)功能。
4.3 系統(tǒng)功能和特點(diǎn)
該系統(tǒng)運(yùn)用了先進(jìn)的傳感器技術(shù),并采用了基于CNN-LSTM混合模型的數(shù)據(jù)處理技術(shù),能夠?qū)崟r(shí)監(jiān)測(cè)鐵路道岔的運(yùn)行狀態(tài),包括道岔的位置、速度、電流、電壓等參數(shù)。通過(guò)監(jiān)測(cè)這些參數(shù),可以及時(shí)發(fā)現(xiàn)道岔的故障,并對(duì)其進(jìn)行診斷。該系統(tǒng)具有以下特點(diǎn):(1)實(shí)時(shí)監(jiān)測(cè):系統(tǒng)能夠?qū)崟r(shí)監(jiān)測(cè)鐵路道岔的運(yùn)行狀態(tài),及時(shí)發(fā)現(xiàn)故障,并對(duì)其進(jìn)行診斷。(2)數(shù)據(jù)處理:系統(tǒng)采用了基于CNN-LSTM混合模型的數(shù)據(jù)處理技術(shù),對(duì)監(jiān)測(cè)到的數(shù)據(jù)進(jìn)行處理和分析,提取出有用的信息。(3)故障診斷:系統(tǒng)能夠根據(jù)監(jiān)測(cè)到的數(shù)據(jù)和歷史數(shù)據(jù),對(duì)道岔的故障進(jìn)行診斷,并給出相應(yīng)的解決方案。(4)預(yù)警功能:系統(tǒng)能夠根據(jù)監(jiān)測(cè)到的數(shù)據(jù)和歷史數(shù)據(jù),對(duì)道岔的故障進(jìn)行預(yù)警,及時(shí)通知相關(guān)人員進(jìn)行處理。(圖4)
5 結(jié)論
本文結(jié)合CNN與LSTM兩者的優(yōu)勢(shì),構(gòu)建了一種基于CNN-LSTM的混合深度學(xué)習(xí)的鐵路道岔故障診斷模型,通過(guò)對(duì)鐵路道岔故障信號(hào)進(jìn)行深度特征學(xué)習(xí)和時(shí)序分析,提升了故障診斷的效果,診斷效果明顯優(yōu)于單一的CNN和LSTM診斷模型?;诨旌夏P?,設(shè)計(jì)并開(kāi)發(fā)了一套鐵路道岔故障監(jiān)測(cè)和診斷系統(tǒng),實(shí)現(xiàn)了對(duì)鐵路道岔的實(shí)時(shí)監(jiān)測(cè)和故障診斷,可以及時(shí)發(fā)現(xiàn)故障并對(duì)其進(jìn)行診斷,并給出相應(yīng)的解決方案,可為鐵路的安全和高效運(yùn)輸提供一定的參考意義。
基金項(xiàng)目:2023年廣西高校中青年教師科研基礎(chǔ)能力提升項(xiàng)目“基于CNN-LSTM的鐵路道岔故障診斷系統(tǒng)研究”(立項(xiàng)編號(hào):2023KY1437)、2022年柳州鐵道職業(yè)技術(shù)學(xué)院校級(jí)項(xiàng)目“基于深度學(xué)習(xí)的鐵路道岔故障診斷系統(tǒng)的開(kāi)發(fā)與研究”(立項(xiàng)編號(hào):2022-KJB10)。
參考文獻(xiàn):
[1] Yann Lecun,Leon Bottou,Y. Bengio, et al. Gradient-Based Learning Applied to Document Recognition[J]. Proceedings of the Ieee, 1988, 86(11): 2278-2324.
[2] Sepp Hochreiter,Jürgen Schmidhuber. Long Short-term Memory[J]. Neural Computation, 1997, 9.
[3]姚競(jìng)爭(zhēng),方玉潔,周雪菲.基于CNN-LSTM故障預(yù)測(cè)模型的客滾船安全評(píng)估研究[J].船電技術(shù),2024,44(06):6-10.
[4]何宗博.基于深度學(xué)習(xí)的鐵路道岔轉(zhuǎn)轍機(jī)故障診斷[D].太原:中北大學(xué),2021.
[5]楊菊花,于苡健,陳光武,司涌波,邢東峰.基于CNN-GRU模型的道岔故障診斷算法研究[J].鐵道學(xué)報(bào),2020,42(07):102-109.
[6]王成瀚,蘇沛源,張臣宏,等.基于深度CNN-LSTM神經(jīng)網(wǎng)絡(luò)的加工過(guò)程實(shí)時(shí)異常監(jiān)測(cè)模型[J].機(jī)械設(shè)計(jì)與研究,2021,37(06):128-132.