朱文博, 王小敏
(西南交通大學(xué) 信息科學(xué)與技術(shù)學(xué)院, 四川 成都 611756)
無絕緣軌道電路是鐵路信號(hào)控制系統(tǒng)的關(guān)鍵設(shè)備,對保障列車安全運(yùn)行起著至關(guān)重要的作用。鐵路區(qū)間較多使用ZPW-2000A無絕緣軌道電路,該系統(tǒng)設(shè)備工作環(huán)境惡劣,故障多發(fā),工作狀態(tài)直接關(guān)系到鐵路運(yùn)輸?shù)男屎桶踩玔1]。目前主要采用定期檢修的方式排查軌道電路故障隱患,維修人員通過儀器測量相關(guān)監(jiān)測量,僅憑經(jīng)驗(yàn)對設(shè)備進(jìn)行故障診斷[2]。這種方法不僅勞動(dòng)強(qiáng)度大、效率低,而且診斷效果受人為因素影響較大,有必要引入智能診斷方法輔助現(xiàn)場維修工作人員及時(shí)準(zhǔn)確地判斷故障。
近年來,一些學(xué)者將各種智能技術(shù)引入軌道電路故障診斷中[3-11],在一定程度上取得了較好的效果。文獻(xiàn)[3]利用遺傳算法對補(bǔ)償電容故障和道砟電阻變化情況進(jìn)行了診斷分析。文獻(xiàn)[4]用模糊神經(jīng)網(wǎng)絡(luò)方法對相敏軌道電路的4種典型故障進(jìn)行有效的診斷。文獻(xiàn)[5]給出一種基于PSO參數(shù)優(yōu)化的SVM方法對軌道電路分路不良進(jìn)行預(yù)測。由于軌道電路系統(tǒng)設(shè)備組成結(jié)構(gòu)復(fù)雜,僅依靠單一網(wǎng)絡(luò)模型對系統(tǒng)進(jìn)行故障診斷存在較大的局限性。文獻(xiàn)[6]提出一種數(shù)據(jù)驅(qū)動(dòng)的網(wǎng)絡(luò)分解診斷方法,為軌道電路故障診斷提供了一種新思路。
一些智能方法僅能粗略地診斷出軌道電路的故障范圍,難以及時(shí)為維修人員提供有效的指導(dǎo)。為進(jìn)一步指導(dǎo)維修,對軌道電路的多種細(xì)分故障模式進(jìn)行有效診斷,本文結(jié)合C4.5算法[12]建立軌道電路組合決策樹診斷模型。該模型利用粗糙集屬性約簡為各級(jí)診斷子網(wǎng)絡(luò)選擇合適的特征屬性,再將C4.5融入各子網(wǎng)絡(luò)提取診斷規(guī)則,最終得到的規(guī)則具有清晰細(xì)化的特點(diǎn)。實(shí)驗(yàn)仿真測試結(jié)果表明,該模型能夠?qū)PW-2000A軌道電路多種故障模式進(jìn)行有效診斷。
C4.5作為一種常用的決策樹分類算法,對文獻(xiàn)[13]提出的ID3算法進(jìn)行了優(yōu)化改進(jìn),不僅能處理連續(xù)性數(shù)據(jù)分類問題,為不確定性數(shù)據(jù)[14]和非數(shù)值特征的模式識(shí)別問題也提供了有效的解決辦法。決策樹根據(jù)屬性值劃分節(jié)點(diǎn),產(chǎn)生分支,以信息增益率作為選擇樹節(jié)點(diǎn)的指標(biāo),挖掘隱含于數(shù)據(jù)中的真實(shí)規(guī)則,分類規(guī)則對應(yīng)根節(jié)點(diǎn)到葉節(jié)點(diǎn)的分支路徑,采用適當(dāng)?shù)募糁Ψ椒╗15]可以簡化決策樹。
在訓(xùn)練樣本集T中,每個(gè)樣本由n個(gè)條件屬性A共同決策某一類別Di(i=1,2,…,k)。同一類別的樣本個(gè)數(shù)記為|Di|,定義某類樣本的概率分布為Pi=|Di|/|T|,C4.5利用訓(xùn)練集形成決策樹的步驟如下:
Step1計(jì)算訓(xùn)練樣本初始熵為
( 1 )
Step2計(jì)算任一測試屬性A的信息熵為
( 2 )
Step3計(jì)算屬性A的信息增益為
G(A,T)=I(T)-I(A,T)
( 3 )
Step4依次推導(dǎo)屬性A的分割信息熵Split與信息增益率GR
( 4 )
( 5 )
Step5將信息增益率值最大的屬性選作當(dāng)前節(jié)點(diǎn),重復(fù)Step2~Step4依次選擇各級(jí)節(jié)點(diǎn),直到葉節(jié)點(diǎn)只有同種類別。
智能分類技術(shù)應(yīng)用到故障診斷中的主要任務(wù)是采用合適的特征選擇策略,提高診斷規(guī)則提取效率和分類準(zhǔn)確率。對于決策系統(tǒng)中識(shí)別不同的目標(biāo)類,往往會(huì)有不同的屬性組合方式構(gòu)成決策表,為給定決策表構(gòu)造深度盡量小的樹狀結(jié)構(gòu),需要簡化原始特征屬性集,消除冗余,改善分類性能。為此引入粗糙集[16]中屬性核(core)與相對約簡的概念,說明組合網(wǎng)絡(luò)模型的特征屬性選擇策略。
粗糙集中核是用來表示知識(shí)的最簡條件屬性集,核中任意屬性的缺失都會(huì)造成依賴性程度γC(D)變小。在保持依賴性程度γC(D)不變的前提下,屬性約簡過程不斷刪減冗余屬性,以獲得與識(shí)別決策類有關(guān)的最小條件屬性集為目的,具體算法描述如下。
決策表,C={ci|i=1,2,…,m}為條件屬性集,D={di|i=1,2,…,m}為決策屬性集,Rred?C設(shè)為初始約簡集,c∈C-Rred為任意屬性,給出如下定義。
γC(D)=POSC(D)/U
( 6 )
k(c,Rred,D)=γRred∪{c}(D)-γRred(D)
( 7 )
輸入:決策表S=;輸出:相對約簡集reduct。
Step1計(jì)算POSC(D),令coreC(D)=?;
Step2對于?ci∈C,若POSC-{ci}(D)≠POSC(D),則coreC(D)=coreC(D)∪{ci};
Step3令reduct=coreC(D),con=C-coreC(D),如果coreC(D)=?,則轉(zhuǎn)Step4,否則計(jì)算POSreduct(D),若POSreduct(D)=POSC(D),則終止,輸出約簡reduct;
Step5如果POSreduct(D)=POSC(D),則終止,輸出約簡reduct,否則轉(zhuǎn)Step4。
一般情況下某個(gè)決策系統(tǒng)的條件屬性集會(huì)有多種相對約簡組合,選擇相對約簡集reduct中任一組合,作為構(gòu)造決策樹的特征屬性。
決策樹從根節(jié)點(diǎn)依次向下按照實(shí)例屬性值遍歷分支路徑,最終由樹的葉節(jié)點(diǎn)標(biāo)記實(shí)例類別,形成的樹狀判別網(wǎng)絡(luò)結(jié)構(gòu)清晰、準(zhǔn)確率高且規(guī)則解釋性強(qiáng)。另一方面,組成無絕緣軌道電路系統(tǒng)的電氣設(shè)備較多,存在多種直接或間接故障組合因素導(dǎo)致的故障類型,將故障類型逐級(jí)劃分為多層決策子網(wǎng)構(gòu)成組合決策診斷模型,使得診斷效果更具針對性。
ZPW-2000A軌道電路由位于室外、室內(nèi)、送受端的各種電氣設(shè)備組成。區(qū)段紅光帶和分路不良為兩類常見的由電氣設(shè)備失效引發(fā)的故障現(xiàn)象,為準(zhǔn)確細(xì)致地劃分故障,并盡量便于維護(hù),本文歸納出表1所示的14種故障模式,其中TU1和TU2表示匹配調(diào)諧單元。
表1 軌道電路故障模式
基于3.2節(jié)劃分的故障模式,構(gòu)建組合決策樹網(wǎng)絡(luò)模型,見圖1,在根節(jié)點(diǎn)處判斷系統(tǒng)狀態(tài),系統(tǒng)正常運(yùn)行用“F0”表示,利用系統(tǒng)監(jiān)測信息結(jié)合專家經(jīng)驗(yàn)[17],判斷系統(tǒng)異常則繼續(xù)向下遍歷分支直到辨別出具體故障模式。粗糙集屬性約簡分別為組合網(wǎng)絡(luò)中樹節(jié)點(diǎn)1~樹節(jié)點(diǎn)3-2-2選擇相應(yīng)的特征屬性,再利用C4.5算法訓(xùn)練各子網(wǎng)樣本產(chǎn)生具體診斷規(guī)則,F(xiàn)1~F14為表1中的故障模式。
圖1 軌道電路故障診斷的組合決策樹網(wǎng)絡(luò)
由于現(xiàn)場的軌道電路故障樣本難以獲取,本文利用實(shí)驗(yàn)室軌道電路模擬仿真平臺(tái)設(shè)置各類故障,獲取足量樣本,該仿真平臺(tái)結(jié)構(gòu)見圖2。
該實(shí)驗(yàn)平臺(tái)除鋼軌線路部分用軌道模擬盤替代,其余設(shè)備與實(shí)際軌道電路所用設(shè)備一樣,電氣特性與實(shí)際軌道電路相似,不影響采集數(shù)據(jù)的可用性,軌道電路模擬仿真平臺(tái)相關(guān)參數(shù)見表2。
圖2 ZPW-2000A軌道電路結(jié)構(gòu)
表2 軌道電路模擬仿真平臺(tái)相關(guān)參數(shù)
結(jié)合現(xiàn)場軌道電路各設(shè)備故障發(fā)生比例的實(shí)際情況,在軌道電路仿真平臺(tái)上模擬設(shè)置各種設(shè)備故障,采集各節(jié)點(diǎn)監(jiān)測量數(shù)據(jù)組成樣本集,其中訓(xùn)練集由各種故障模式且不重復(fù)的樣本組成,測試樣本從剩余的樣本中隨機(jī)抽取,樣本集分布見表3。
將訓(xùn)練樣本集隨機(jī)劃分成包含各種故障模式等數(shù)量的10份,訓(xùn)練建模數(shù)據(jù)每次選取其中9份,余下1份數(shù)據(jù)用于模型檢驗(yàn),如此反復(fù)訓(xùn)練和檢驗(yàn)診斷模型的正確性。
表3 各類故障模式分布
通常,決策系統(tǒng)的條件屬性是能反映決策域分類信息的原始特征集C(c1,c2,...,cn),其每一分量ci都隱含了特定的分類信息,原始特征對于組合決策網(wǎng)絡(luò)各樹節(jié)點(diǎn)的待辨識(shí)類別存在不同的冗余情況,為各樹節(jié)點(diǎn)保留必要分類信息的前提下,采取特征選擇策略降低屬性冗余度,可以提高C4.5訓(xùn)練效率和分類準(zhǔn)確率。
本文以下列12種監(jiān)測量組成原始特征集:發(fā)送功出電壓M1、發(fā)送電流M2、電纜側(cè)發(fā)送電壓M3、主軌入電壓M4、發(fā)端TU1電流M5、發(fā)端SVA電流M6、發(fā)端TU2電流M7、受端TU1電流M8、受端SVA電流M9、受端TU2電流M10、電纜側(cè)接收電壓M11、主軌接收電壓M12。
根據(jù)各級(jí)C4.5決策子網(wǎng)的故障類別,利用屬性約簡算法從原始特征集中為各子網(wǎng)分別提取合適的特征向量組合,既可以提高訓(xùn)練效率又使分類過程更具針對性,采用粗糙集屬性約簡算法計(jì)算得到圖1中各樹節(jié)點(diǎn)的特征屬性見表4,訓(xùn)練得到各決策樹的平均深度為3層,其樹形結(jié)構(gòu)的辨識(shí)效果較理想。
表4 各樹節(jié)點(diǎn)的特征屬性組成情況
以組合網(wǎng)絡(luò)的樹節(jié)點(diǎn)1為例,直接利用屬性約簡的計(jì)算結(jié)果,取3個(gè)模擬量M1、M3、M11作為決策子網(wǎng)的特征屬性,抽取部分故障數(shù)據(jù)見表5,由C4.5算法訓(xùn)練得到樹節(jié)點(diǎn)1的診斷決策樹,見圖3。
表5 樹節(jié)點(diǎn)1的故障數(shù)據(jù)表 V
圖3 樹節(jié)點(diǎn)1的診斷決策樹
BP神經(jīng)網(wǎng)絡(luò)是一種廣泛應(yīng)用于故障診斷領(lǐng)域的非線性系統(tǒng)辨識(shí)工具。一方面按照軌道電路5種粗粒度故障范圍的劃分模式,每種各選取若干組數(shù)據(jù)經(jīng)過歸一化處理構(gòu)成訓(xùn)練集,分別利用BP 神經(jīng)網(wǎng)絡(luò)和本文方法進(jìn)行訓(xùn)練建立診斷模型。采用newff函數(shù)創(chuàng)建BP神經(jīng)網(wǎng)絡(luò),選擇trainlm函數(shù)進(jìn)行訓(xùn)練,輸入層以12個(gè)監(jiān)測模擬量作為節(jié)點(diǎn),隱含層設(shè)置10個(gè)節(jié)點(diǎn),輸出層由5個(gè)節(jié)點(diǎn)構(gòu)成診斷結(jié)果向量(如線路故障(0,0,1,0,0)),設(shè)置BP神經(jīng)網(wǎng)絡(luò)最大訓(xùn)練次數(shù)為1 000,期望誤差為0.000 1,學(xué)習(xí)率為0.05,訓(xùn)練到第92次時(shí)達(dá)到期望誤差。利用測試數(shù)據(jù)對訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)模型和本文屬性約簡方法建立的單C4.5決策樹,進(jìn)行準(zhǔn)確率仿真測試,對比結(jié)果見表6,C4.5決策樹判斷準(zhǔn)確率略高于BP神經(jīng)網(wǎng)絡(luò)法,達(dá)90.3%。軌道電路粗粒度故障范圍診斷系統(tǒng)的原始特征較多,BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程偏向擬合數(shù)據(jù)的輸入輸出關(guān)系,難以獲知特征屬性隱含的內(nèi)部規(guī)則,測試過程中不可避免受冗余屬性的影響,導(dǎo)致分類效果欠佳。本文所述方法相比BP神經(jīng)網(wǎng)絡(luò)法的優(yōu)勢在于,有針對性地采取有效的特征提取策略去除冗余,提高了C4.5訓(xùn)練的效率和準(zhǔn)確率,且生成的樹狀規(guī)則清晰直觀。
表6 C4.5與BP神經(jīng)網(wǎng)絡(luò)測試準(zhǔn)確率比較
另一方面利用訓(xùn)練好的組合決策樹網(wǎng)絡(luò)模型逐級(jí)對14種細(xì)分故障模式進(jìn)行識(shí)別,與單網(wǎng)絡(luò)C4.5模型的辨識(shí)效果做對比,得到兩種模型的正判率見表7。對比結(jié)果顯示,組合決策樹模型不僅第一級(jí)判別5種故障范圍時(shí)正判率高達(dá)98%,當(dāng)判別細(xì)分的14類故障模式時(shí),準(zhǔn)確率也有較明顯上升。在實(shí)際應(yīng)用中,通過安裝軌道電路室外設(shè)備信號(hào)采集裝置[18],結(jié)合信號(hào)集中監(jiān)測系統(tǒng)獲取室內(nèi)外監(jiān)測信息,為本文方法提供所需故障樣本數(shù)據(jù),若能獲取較完整的監(jiān)測數(shù)據(jù)以便劃分多種故障模式,對提高診斷及維護(hù)效率具有重要意義。
表7 決策樹組合網(wǎng)絡(luò)模型樣例檢驗(yàn)結(jié)果
注:如圖1網(wǎng)絡(luò)層級(jí),其中一級(jí)為室內(nèi)外故障范圍判斷,二級(jí)為送受端故障判斷,三級(jí)為具體故障模式判斷。
本文提出一種基于組合決策樹的無絕緣軌道電路故障診斷方法,利用粗糙集理論的屬性約簡原理為各子網(wǎng)C4.5決策樹提供有效的特征屬性選擇策略,能夠從大量樣本中自動(dòng)學(xué)習(xí)生成規(guī)則,實(shí)現(xiàn)方法簡單,自適應(yīng)能力強(qiáng)。根據(jù)軌道電路故障的逐級(jí)劃分,以C4.5決策樹作為組合網(wǎng)絡(luò)的基本組成單元,設(shè)計(jì)了具有針對性的故障判別網(wǎng)絡(luò)結(jié)構(gòu),從根本上改善分類器性能,分類效果遠(yuǎn)優(yōu)于單決策樹網(wǎng)絡(luò),克服了單決策樹處理屬性過多問題時(shí)難以收斂及樹結(jié)構(gòu)復(fù)雜等缺點(diǎn)。模型檢驗(yàn)結(jié)果表明,該組合決策樹網(wǎng)絡(luò)對ZPW-2000A型軌道電路故障診斷具有較高的準(zhǔn)確率。