熊健
摘要:近年來(lái),城市軌道交通運(yùn)營(yíng)里程的快速增長(zhǎng)和運(yùn)營(yíng)安全要求的提高使得城市軌道列車安全保障技術(shù)面臨著巨大挑戰(zhàn),轉(zhuǎn)向架處于異常狀態(tài)往往會(huì)體現(xiàn)在轉(zhuǎn)向架和車體的異常振動(dòng)上,根據(jù)該類機(jī)械部件在整個(gè)系統(tǒng)中所起的作用和性能退化程度的不同,異常振動(dòng)信號(hào)的體現(xiàn)方式也有所不同。
關(guān)鍵詞:轉(zhuǎn)向架;故障診斷;LSTM網(wǎng)絡(luò)模型
1.研究背景
城市軌道列車走行部轉(zhuǎn)向架機(jī)械部件的振動(dòng)信號(hào)一直是用來(lái)分析轉(zhuǎn)向架穩(wěn)定性的一個(gè)重要指標(biāo)。
循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是深度學(xué)習(xí)中一種善于處理時(shí)間序列信息的網(wǎng)絡(luò)框架,它能夠結(jié)合前面時(shí)間點(diǎn)的信息來(lái)分析當(dāng)前時(shí)間點(diǎn)的信息,以此來(lái)提取時(shí)序信號(hào)內(nèi)部關(guān)聯(lián)性特征。由于轉(zhuǎn)向架振動(dòng)信號(hào)是時(shí)序信號(hào),所以利用RNN來(lái)對(duì)其進(jìn)行分析是十分符合客觀規(guī)律的。LSTM網(wǎng)絡(luò)可以通過(guò)對(duì)輸入數(shù)據(jù)量、記憶量及輸出數(shù)據(jù)量的控制,來(lái)對(duì)信息進(jìn)行一定地取舍,以此來(lái)挖掘時(shí)序信號(hào)內(nèi)部的關(guān)聯(lián)特征,進(jìn)而提升分析效率。
城市軌道列車轉(zhuǎn)向架至關(guān)重要的一個(gè)結(jié)構(gòu)為二級(jí)懸掛系統(tǒng),即:一系懸掛系統(tǒng)和二系懸掛系統(tǒng)。健康狀況良好的二級(jí)懸掛系統(tǒng)在高速列車行駛時(shí),會(huì)對(duì)列車的安全穩(wěn)定運(yùn)行起到充分的保障作用,因此本文研究的主要目標(biāo)就是二級(jí)懸掛系統(tǒng),其本身又包括:空氣彈簧、橫向減振器、垂向減震器、抗側(cè)滾扭桿及一系彈簧等幾個(gè)主要部件。
本實(shí)驗(yàn)選擇對(duì)列車時(shí)速為“120km/h”的轉(zhuǎn)向架振動(dòng)信號(hào)進(jìn)行故障診斷。其中全拆數(shù)據(jù)每種故障的數(shù)據(jù)規(guī)格為[50370,58],即:共計(jì)50370個(gè)時(shí)間點(diǎn),每個(gè)時(shí)間均有58個(gè)通道的故障數(shù)據(jù)。
2. 數(shù)據(jù)預(yù)處理與數(shù)據(jù)集劃分
1. z-score標(biāo)準(zhǔn)化:為了消除訓(xùn)練數(shù)據(jù)之間的尺寸差距,可以更好地訓(xùn)練訓(xùn)練集中的大量數(shù)據(jù)。訓(xùn)練集中的所有數(shù)據(jù)都通過(guò)z-score標(biāo)準(zhǔn)化處理,以便訓(xùn)練集中的每個(gè)數(shù)據(jù)在處理后符合標(biāo)準(zhǔn)正態(tài)分布,即:標(biāo)準(zhǔn)差歸一,其公式如公式1所示。
(1)
其中 為經(jīng)標(biāo)準(zhǔn)化處理后的訓(xùn)練集數(shù)據(jù), 為訓(xùn)練集原始數(shù)據(jù), 和 分別為這個(gè)原始數(shù)據(jù)的均值和標(biāo)準(zhǔn)差。經(jīng)處理后的數(shù)據(jù)將作為一個(gè)單純的數(shù)值,不再受量綱的約束,更有利于去作為模型的輸入數(shù)據(jù),也更有利于實(shí)驗(yàn)的分析和評(píng)價(jià)。
2. One-hot編碼:為了消除數(shù)據(jù)之間的間隙大小對(duì)實(shí)驗(yàn)結(jié)果的影響,本文采用One-hot編碼的方式對(duì)標(biāo)簽數(shù)據(jù)進(jìn)行預(yù)處理。其中N個(gè)寄存器的編碼由一個(gè)N位寄存器進(jìn)行處理,每個(gè)狀態(tài)都有自己獨(dú)立的寄存器,且在任何時(shí)候僅僅只有一個(gè)寄存器是生效的。這種編碼處理可以減少不同數(shù)據(jù)格式和不同數(shù)據(jù)維度對(duì)模型訓(xùn)練的影響,同時(shí)也大大提高了模型訓(xùn)練的精度和效率,也有利于擴(kuò)大樣本容量,便于樣本展開(kāi)。
3. 數(shù)據(jù)集劃分
圖1 數(shù)據(jù)集劃分流程圖
針對(duì)七種不同工況,每種工況均有50370個(gè)采樣數(shù)據(jù),并且每個(gè)采樣數(shù)據(jù)均包含58個(gè)通道,所以共有352590個(gè)實(shí)驗(yàn)數(shù)據(jù)。將實(shí)驗(yàn)數(shù)據(jù)按1:5的比例分為測(cè)試集和訓(xùn)練集,即:58765個(gè)測(cè)試樣本和293825個(gè)訓(xùn)練樣本。由于故障類別的數(shù)量為7,所以訓(xùn)練標(biāo)簽設(shè)定為{1,2,3,4,5,6,7},具體的數(shù)據(jù)集劃分細(xì)節(jié)見(jiàn)圖2。
模型對(duì)未知數(shù)據(jù)的認(rèn)知能力被稱為泛化能力,未經(jīng)特征提取的數(shù)據(jù)視為原始數(shù)據(jù),將原始數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集,其中訓(xùn)練集為:原始數(shù)據(jù)中劃分出來(lái)的所占比重較大的數(shù)據(jù),作為模型訓(xùn)練的主要數(shù)據(jù)。測(cè)試集為:原始數(shù)據(jù)中分出來(lái)的小部分的數(shù)據(jù),相對(duì)于訓(xùn)練集,對(duì)于所訓(xùn)練的網(wǎng)絡(luò)來(lái)說(shuō)測(cè)試集是完全沒(méi)有出現(xiàn)過(guò)的,所以測(cè)試集的表現(xiàn)結(jié)果也最能夠反應(yīng)網(wǎng)絡(luò)模型好壞。
4. 網(wǎng)絡(luò)模型的評(píng)測(cè)標(biāo)準(zhǔn)
1)識(shí)別精確度與loss函數(shù):估量你模型的預(yù)測(cè)值與真實(shí)值的一致程度,是一個(gè)非負(fù)實(shí)值函數(shù),識(shí)別精確度越高或loss函數(shù)越小,模型的魯棒性就越好。
2)混淆矩陣
混淆矩陣是一個(gè)大小均為待分類別數(shù)的誤差表現(xiàn)矩陣?;煜仃嚨牧袨槟P皖A(yù)測(cè)到相應(yīng)類別的樣本數(shù),混淆矩陣的行為數(shù)據(jù)中真正屬于該類的樣本數(shù)。通過(guò)混淆矩陣可以直觀地看到有多少數(shù)據(jù)被錯(cuò)誤分類以及錯(cuò)誤分類為哪一類。
3)AUC值
ROC曲線又稱為受試者(即網(wǎng)絡(luò)模型)工作特征曲線,即:以假陽(yáng)性概率為橫軸,真陽(yáng)性為縱軸所組成的坐標(biāo)圖,在此坐標(biāo)圖上繪制受試者受到刺激后產(chǎn)生的曲線。AUC曲線就是ROC曲線與橫縱坐標(biāo)軸所圍區(qū)域的面積,該值越大,說(shuō)明該網(wǎng)絡(luò)模型越好。
3.基于LSTM網(wǎng)絡(luò)的故障診斷
3.1 訓(xùn)練網(wǎng)絡(luò)·
預(yù)處理后的訓(xùn)練集數(shù)據(jù)用作輸入數(shù)據(jù)以進(jìn)入LSTM網(wǎng)絡(luò)參與訓(xùn)練。LSTM網(wǎng)絡(luò)的參數(shù)設(shè)置分以下幾種:學(xué)習(xí)率(lr),批量尺寸(batch_size),故障類別數(shù)(n_classes),隱藏層神經(jīng)元數(shù)(n_units)以及總迭代次數(shù)(epoch)。本次試驗(yàn)中,LSTM網(wǎng)絡(luò)參數(shù)的設(shè)置如表1所示。
其中,lr是一個(gè)極其重要的參數(shù),它的大小決定著目標(biāo)函數(shù)可否收斂到局部最小值以及何時(shí)可以收斂到該值。lr過(guò)小會(huì)導(dǎo)致網(wǎng)絡(luò)訓(xùn)練速度很慢從而無(wú)法達(dá)到最小值,本次實(shí)驗(yàn)采用Adam優(yōu)化器逐次遞減的可變lr設(shè)置方法,隨著訓(xùn)練分批進(jìn)行,lr也隨之遞減,這樣動(dòng)態(tài)地設(shè)置lr可以更好地讓LSTM網(wǎng)絡(luò)挖掘到時(shí)序信號(hào)內(nèi)部的有效信息。
batch_size是小批梯度下降算法中每一批的樣本數(shù)量,該算法將數(shù)據(jù)分為大小相等的多個(gè)批次,分別計(jì)算其損失函數(shù)、更新權(quán)值,batch_size越小則訓(xùn)練速度越快,但是太小的batch_size會(huì)導(dǎo)致訓(xùn)練精度急劇降低;batch_size越大則訓(xùn)練速度越慢,導(dǎo)致訓(xùn)練效率極其低下,經(jīng)過(guò)大量實(shí)驗(yàn),本文將batch_size設(shè)置為350。
n_classes是為已知的故障類別數(shù)。訓(xùn)練集中所有數(shù)據(jù)均被計(jì)算過(guò)一次,叫做一個(gè)epoch,epoch不宜過(guò)大不宜過(guò)小,通常設(shè)置范圍在10-50。n_units為隱藏層神經(jīng)元個(gè)數(shù),即每個(gè)隱藏層存在的神經(jīng)元的個(gè)數(shù),具體的數(shù)據(jù)設(shè)置需要按照樣本數(shù)量、網(wǎng)絡(luò)復(fù)雜度以及硬件水平來(lái)進(jìn)行調(diào)整。
LSTM網(wǎng)絡(luò)中的Dropout僅設(shè)置到非循環(huán)的隱藏層中,否則信息會(huì)因循環(huán)而逐步丟失,Dropout僅設(shè)置在虛線部分的隱藏層中,而不會(huì)加載到參與循環(huán)的部分。
LSTM網(wǎng)絡(luò)搭建如圖3所示。
3.2 實(shí)驗(yàn)結(jié)果
本次基于LSTM網(wǎng)絡(luò)的高速列車轉(zhuǎn)向架故障診斷實(shí)驗(yàn)所得識(shí)別精確度為95.6%,識(shí)別精度、loss曲線、混合矩陣分別如圖3、4、5所示。
由圖4和5可知,精確率隨著訓(xùn)練的進(jìn)行從0一直上升到0.956并一直保持,loss值則一直下降,代表訓(xùn)練誤差持續(xù)減小,直到降低為0.18并趨于穩(wěn)定。圖中較暗的曲線是小批量訓(xùn)練產(chǎn)生的震蕩效應(yīng),在訓(xùn)練的后期震蕩效果逐步下降,趨于穩(wěn)定,實(shí)驗(yàn)的AUC值為0.76。
參考文獻(xiàn)
[1]王剛,徐厚廣. 淺析“一帶一路”倡議對(duì)中國(guó)高速鐵路發(fā)展的影響[J]. 綜合運(yùn)輸. 2017,39(09):6-9.
[2]宿智利. 淺談中國(guó)高速鐵路的發(fā)展現(xiàn)狀及未來(lái)展望[J]. 才智. 2013(14):356.
(作者單位:深圳中車軌道車輛有限公司)