馬艷東,崔能西
(1.河北省科學(xué)院 應(yīng)用數(shù)學(xué)研究所,石家莊 050081;2.河北省信息安全認(rèn)證工程技術(shù)研究中心,石家莊 050081;3.石家莊精英中學(xué),石家莊 050081)
道岔運(yùn)行狀態(tài)的穩(wěn)定與否與列車運(yùn)行安全息息相關(guān)。鐵路電務(wù)部門從微機(jī)監(jiān)測系統(tǒng)讀取道岔動作電流數(shù)據(jù),人工分析判斷道岔運(yùn)行狀況。隨著列車運(yùn)行速度與行車密度的不斷提高,這種單純依靠人腦進(jìn)行故障診斷的手段面臨著越來越嚴(yán)峻的考驗。
傳統(tǒng)機(jī)器學(xué)習(xí)分類算法是以每類樣本的誤分類代價相等為前提,以識別準(zhǔn)確率為最終目標(biāo),進(jìn)行優(yōu)化。不同的道岔故障類型對鐵路相關(guān)部門帶來的影響(代價)[1-3]有較大的不同。使用傳統(tǒng)分類算法將無法有效處理這些數(shù)據(jù)。與BP神經(jīng)網(wǎng)絡(luò)(BPNN)相比,RBF神經(jīng)網(wǎng)絡(luò)(R BFNN)[4-5]不僅具有結(jié)構(gòu)簡單、收斂速度快、泛化能力強(qiáng)的特點,還具有優(yōu)異的函數(shù)逼近能力、全局尋優(yōu)能力。但RBFNN非代價敏感,無法直接應(yīng)用到道岔故障診斷領(lǐng)域。本文通過建立基于代價敏感RBFNN模型,將基于遺傳算法的RBFNN導(dǎo)向代價最小方向搜索,使其代價敏感化,并成功地將其應(yīng)用到道岔故障診斷系統(tǒng)中。
道岔動作電流是由微機(jī)監(jiān)測系統(tǒng)在轉(zhuǎn)轍機(jī)搬動道岔時,實時采集電流數(shù)值按時間先后順序組合而成的曲線如圖1所示。通過對道岔電流動作曲線不同區(qū)段的仔細(xì)分析,可對其機(jī)械、電氣、狀態(tài)、時間等特性有個比較充分的判斷。
圖1 道岔動作電流曲線
曲線1為正常進(jìn)行道岔搬動操作的道岔動作電流曲線。其他任何與曲線1不同的曲線都是發(fā)生某種故障的曲線。不同形狀規(guī)律的曲線對應(yīng)不同類型的道岔故障。例如,曲線2表明道岔在解鎖過程中用時過長;曲線3表明在道岔閉鎖階段的阻力過大;曲線4表明轉(zhuǎn)轍機(jī)處于抱死狀態(tài)。道岔故障診斷系統(tǒng)就是通過區(qū)分道岔動作曲線所呈現(xiàn)的不同形狀,來辨識其所蘊(yùn)含的故障信息。
利用遺傳算法[6]對RBFNN中心與寬度進(jìn)行優(yōu)化。ci、Widthi分別為第i個隱含節(jié)點的中心向量與寬度。數(shù)據(jù)維數(shù)為Ndim,隱含節(jié)點個數(shù)為Ncent。代價敏感RBFNN的染色體編碼方案為:每個中心向量與其相對應(yīng)的寬度組成“中心-寬度數(shù)據(jù)對”擺放在一起,不同的“中心-寬度數(shù)據(jù)對”依次排放,如圖2所示。
圖2 染色體編碼方案
為使傳統(tǒng)RBFNN敏感化,定義適應(yīng)度函數(shù)如下:
其中,tx、ox為樣本x的目標(biāo)輸出與實際輸出;CV(tx)為將類別為tx的樣本誤分成其它類的代價;分別為網(wǎng)絡(luò)在訓(xùn)練集與測試集上的誤分類代價;α∈[0, 1]平衡因子,負(fù)責(zé)平衡學(xué)習(xí)與泛化性能的沖突。
2.3.1 最佳保留選擇算子
為保證在遺傳算法搜索結(jié)束時得到的最終結(jié)果一定是歷次迭代中適應(yīng)度值最高的個體,本算法將當(dāng)前種群中適應(yīng)度最小的個體復(fù)制到下一代種群中。
2.3.2 交叉與變異操作
交叉操作采用3點算術(shù)交叉方案:(1)以一定概率隨機(jī)選擇2個要進(jìn)行交叉的染色體;(2)隨機(jī)選取要交叉的3個位置;(3)針對這2個染色體對應(yīng)的3個位置的分量,根據(jù)下面的公式進(jìn)行算術(shù)交叉。其中,與分別為中心向量X與Y第i個位置分量在第t次迭代時的數(shù)值;β∈[0, 1]。
變異操作采用3點變異方案:(1)以一定概率隨機(jī)選擇要進(jìn)行變異的染色體;(2)隨機(jī)選取該向量的3個分量;(3)隨機(jī)生成3個數(shù),替換染色體的3個分量。
(1)在參數(shù)取值范圍內(nèi),隨機(jī)生成初始種群;(2)計算種群個體適應(yīng)度;(3)根據(jù)適應(yīng)度數(shù)值,對種群個體由小到大排序;(4)對種群個體,分別以不同的概率進(jìn)行選擇、交叉、變異、遷移操作;(5)重復(fù)步驟(2)~(5),直到達(dá)到最大迭代次數(shù),或種群最佳適應(yīng)度達(dá)到閾值。
該道岔故障診斷系統(tǒng)[7-8]分為離線學(xué)習(xí)與在線診斷兩個模塊。離線學(xué)習(xí)模塊將歷史數(shù)據(jù)按比例隨機(jī)拆分成訓(xùn)練集與測試集;利用訓(xùn)練集按算法2.4生成代價敏感RBFNN(記為CS_RBF);在測試集上,判斷網(wǎng)絡(luò)的性能表現(xiàn)。如不滿意,則重新拆分歷史數(shù)據(jù)集,重新訓(xùn)練網(wǎng)絡(luò)。否則,將其參數(shù)遷移到實時診斷模塊;實時診斷模塊將接收的實時數(shù)據(jù)輸入CS_RBF,得到最終的故障類型。道岔故障診斷系統(tǒng)工作原理如圖3所示。
圖3 基于代價敏感RBFNN的道岔故障診斷系統(tǒng)工作原理圖
(1)對歷史數(shù)據(jù)采用min-max方法,進(jìn)行標(biāo)準(zhǔn)化;(2)將上述數(shù)據(jù)集,隨機(jī)拆分成訓(xùn)練集與測試集;(3)用訓(xùn)練集訓(xùn)練CS_RBF;(4)計算CS_RBF在測試集上性能表現(xiàn)。如果表現(xiàn)太差,則跳到步驟(2);(5)將CS_RBF參數(shù)拷到在線實時診斷模塊;(6)對實時診斷結(jié)果進(jìn)行判斷。如果診斷正確,則進(jìn)入下一條數(shù)據(jù)的診斷流程。否則,將該數(shù)據(jù)添加到歷史數(shù)據(jù)集中,轉(zhuǎn)入步驟(2)。
3.3.1 數(shù)據(jù)集描述
道岔動作電流數(shù)據(jù)采集自某車站的真實監(jiān)測數(shù)據(jù),經(jīng)處理形成100維1 050條的數(shù)據(jù)集,包括啟動電路斷線、外線混線、繼電器接觸不良等12種類型。
3.3.2 實驗方法
在本次仿真實驗中,隨機(jī)選擇數(shù)據(jù)集的70%為訓(xùn)練數(shù)據(jù),用來訓(xùn)練CS_RBF;其余數(shù)據(jù)為測試集,用來模擬實時數(shù)據(jù)以判斷整個模型的最終表現(xiàn)。
CS_RBF采用Matlab工具實現(xiàn),其相關(guān)參數(shù)如下:輸入節(jié)點數(shù)為100;輸出節(jié)點數(shù)為12;隱含層節(jié)點數(shù)為52;最大迭代次數(shù)為100,子種群數(shù)為6,子種群規(guī)模為10,交叉率為1,選擇壓力為2,變異概率為1,遷移概率為0.2。
為驗證模型的有效性,與BPNN、標(biāo)準(zhǔn)RBFNN(STD_RBF)、ELM、SVM等分類器對比驗證。選擇分類精度、誤分類代價、誤識率等指標(biāo)衡量各分類器的表現(xiàn)。其中,N為樣本個數(shù),Nt為分類正確樣本數(shù),Nf2n為故障樣本分類成正常樣本數(shù),Nf為故障樣本數(shù)。
3.3.3 實驗結(jié)果
依據(jù)各類型道岔故障給鐵路部門所造成的損失大小,電務(wù)專家根據(jù)經(jīng)驗,給定誤分類代價向量CV=[144377648454]。
(1)適應(yīng)度函數(shù)對算法搜索方向的影響
為驗證適應(yīng)度函數(shù)能否將搜索方向?qū)蚓W(wǎng)絡(luò)誤分類代價最小方向,隨著迭代次數(shù)的增加,分別記錄表明種群整體性能的種群適應(yīng)度均值與代表最優(yōu)個體的適應(yīng)度的值。如圖4所示,隨著迭代次數(shù)的增加,種群總體與個體表現(xiàn)都在不斷提高。這說明該適應(yīng)度函數(shù)起到了對搜索方向的監(jiān)督作用,能夠使種群向代價最小的方向搜索。
圖4 最優(yōu)解與種群均值的變化情況
(2)實驗結(jié)果
實驗結(jié)果如表1所示。由表1可知,在分類精度、誤分類代價、誤識率等指標(biāo)上,STD_RBF的表現(xiàn)要好于ELM、SVM、BPNN等分類器。相對于STD_RBF,CS_RBF可保證在分類精度基本不變的情況下,網(wǎng)絡(luò)的誤分類代價與誤識率都有明顯提高。這說明CS_RBF不論是在識別精度,還是誤分類代價與誤識率上,都有著較大程度的提高。
表1 實驗結(jié)果
針對道岔故障誤分類代價不同,且難以實時、快速、準(zhǔn)確地進(jìn)行人工診斷這一現(xiàn)實,建立基于代價敏感RBFNN的道岔故障診斷系統(tǒng)。利用某站監(jiān)測數(shù)據(jù)進(jìn)行驗證,證明該系統(tǒng)不僅能夠獲得比BPNN、ELM、SVM與標(biāo)準(zhǔn)RBFNN更高的識別精度,還在網(wǎng)絡(luò)的誤識率與誤分類代價等指標(biāo)上有著優(yōu)秀的表現(xiàn)。本系統(tǒng)可幫助維護(hù)人員快速、準(zhǔn)確地對道岔故障進(jìn)行診斷,降低故障誤分類的損失,減少故障處理時間,提高鐵路行車的安全性。本系統(tǒng)已經(jīng)在某電務(wù)段投入試運(yùn)行,現(xiàn)場反應(yīng)良好。
[1]陳振東,肖先勇,李長松,等.基于代價敏感極限學(xué)習(xí)機(jī)的電力系統(tǒng)暫態(tài)穩(wěn)定評估方法[J].電力自動化,2016,36(3):118-123.
[2]付忠良.多標(biāo)代價敏感分類集成學(xué)習(xí)算法[J].自動化學(xué)報,2014,40(6):1075-1085.
[3]廖元秀,周生明.誤差在Cost-Sensitive分類中的應(yīng)用[J].廣西師范大學(xué)學(xué)報:自然科學(xué)版,2011,29(2).
[4]Friedhelm Schwenker,Hans A.Kestler,Günther Palm.Three learning phase for radial-basis-function networks[J].Neural networks 14 (2001) 439-458, 18 December 2000.
[5]段錄平,周麗娟,王 宇.基于RBF神經(jīng)網(wǎng)絡(luò)的在線分類挖掘系統(tǒng)[J].鐵路計算機(jī)應(yīng)用,2007,16(3):40-42.
[6]葛繼科,邱玉輝,吳春明,等.遺傳算法研究綜述[J].計算機(jī)應(yīng)用研究,2008,25(10):2911-2916.
[7]梅 歡,馬艷東,單九思,等. 基于樣條插值與RBF網(wǎng)絡(luò)的道岔故障診斷系統(tǒng)[J]. 計算機(jī)技術(shù)與發(fā)展,2017,27(5):160-163,169.
[8]李雅美,魏文軍.基于模糊神經(jīng)網(wǎng)絡(luò)的道岔故障診斷系統(tǒng)研究[J].鐵路計算機(jī)應(yīng)用,2012,21(1):35-39.