許 清,黎川宇
(株洲中車時(shí)代電氣股份有限公司,湖南 株洲 412001)
近年來,我國軌道交通建設(shè)高速發(fā)展,高速動車組作為方便、快捷、大容量的公共交通工具之一,已成為人們出行的重要方式。由于動車組運(yùn)行速度較快,其安全運(yùn)行的重要性日益凸顯。動車組安全行駛過程中,網(wǎng)絡(luò)控制系統(tǒng)起著主要作用,故障分析則是保證動車網(wǎng)絡(luò)控制系統(tǒng)可靠運(yùn)行的一種重要技術(shù)手段。
國外各公司針對列車的故障分析起步較早且技術(shù)相對成熟,如加拿大龐巴迪公司的Mitrac?TCMS 系統(tǒng)、日本三菱公司在Arcnet網(wǎng)絡(luò)上研發(fā)的TIMS系統(tǒng)、法國阿爾斯通公司的eTrain 實(shí)時(shí)維護(hù)系統(tǒng)、德國西門子公司的SIBAS32系統(tǒng)、美國通用公司的DELTA系統(tǒng)等均實(shí)現(xiàn)了列車邏輯控制及故障深度分析功能[1]。我國的列車故障分析技術(shù)起步較晚,目前主要是根據(jù)系統(tǒng)的工作原理、特點(diǎn)、功能及架構(gòu)對所有發(fā)生的故障原因進(jìn)行分類匯總及羅列,發(fā)生故障時(shí)按既定程序逐一檢查并排除[2]。此方法未區(qū)分故障原因且分析步驟較為固定,不能相對準(zhǔn)確地反映出系統(tǒng)各不同層次故障間的關(guān)系,如關(guān)聯(lián)程度、功能邏輯關(guān)系等,不能高效、精準(zhǔn)地排查故障。
對此,為提升維護(hù)人員的診斷效率與故障處理能力,本文對高速動車組網(wǎng)絡(luò)控制系統(tǒng)的故障問題展開研究,并應(yīng)用故障樹分析法[3],結(jié)合VB 編程和Access 數(shù)據(jù)庫軟件設(shè)計(jì)了高速動車組網(wǎng)絡(luò)故障分析系統(tǒng)。
高速動車組網(wǎng)絡(luò)控制系統(tǒng)由中央控制單元CCU進(jìn)行控制[4],通過車輛總線、列車總線實(shí)現(xiàn)通信管理,收集車輛及子系統(tǒng)狀態(tài)信息,通過邏輯處理實(shí)現(xiàn)列車控制、故障診斷、狀態(tài)監(jiān)視、數(shù)據(jù)記錄等功能。網(wǎng)絡(luò)控制系統(tǒng)基本功能如圖1所示。
圖1 高速動車組網(wǎng)絡(luò)控制系統(tǒng)基本功能Fig.1 Basic functions of the network control system of high speed EMU
對高速動車組網(wǎng)絡(luò)控制系統(tǒng)的控制需求、應(yīng)用軟件及故障清單展開研究發(fā)現(xiàn),其出現(xiàn)的故障主要由軟件和硬件兩大原因造成。
軟件問題可歸根于應(yīng)用軟件故障、底層軟件故障及兩種軟件不匹配故障。應(yīng)用軟件故障主要與整車邏輯控制相關(guān)。底層軟件故障與操作系統(tǒng)、通信任務(wù)、算法處理任務(wù)相關(guān)。其中應(yīng)用軟件故障主要由整車邏輯問題、功能塊未使能、任務(wù)周期錯(cuò)誤及數(shù)據(jù)無寫入/輸出等故障導(dǎo)致;底層軟件故障主要由單板上電不打印、操作系統(tǒng)未加載、配置錯(cuò)誤及算法錯(cuò)誤等故障導(dǎo)致。
硬件問題可歸結(jié)于以下幾點(diǎn):中央控制單元、骨干網(wǎng)交換機(jī)、編組網(wǎng)交換機(jī)、輸入輸出設(shè)備、子系統(tǒng)設(shè)備、通信線纜及連接器等設(shè)備故障。其中中央控制單元、子系統(tǒng)設(shè)備故障由主控板或電源板故障導(dǎo)致,骨干網(wǎng)交換機(jī)、編組網(wǎng)交換機(jī)故障由交換板或電源板故障導(dǎo)致;輸入輸出設(shè)備故障由主控板或IO 板故障導(dǎo)致;通信線纜及連接器故障由電源板或線纜或連接器故障導(dǎo)致。
高速動車組網(wǎng)絡(luò)故障思維導(dǎo)圖如圖2所示。
圖2 高速動車組網(wǎng)絡(luò)控制故障思維導(dǎo)圖Fig.2 Mind map of high speed EMU network failure
故障樹分析法是以分析某個(gè)系統(tǒng)所診斷出的故障為目標(biāo),通過邏輯推理的方式挖掘出導(dǎo)致這些中間事件發(fā)生的所有的直接原因,并采用演繹法不斷進(jìn)行延伸及挖掘,直到找出導(dǎo)致某故障的所有原因,再通過故障樹圖的方式對其進(jìn)行直觀地描述。在實(shí)際使用的過程中,可應(yīng)用故障樹分析法迅速找出系統(tǒng)失效部分,并對其進(jìn)行定性和定量的分析,以提升故障分析的效率,保證系統(tǒng)能夠更穩(wěn)定、正常的運(yùn)行。故障樹技術(shù)運(yùn)用邏輯運(yùn)算實(shí)現(xiàn)各事件之間的聯(lián)系,常用的運(yùn)算關(guān)系包括“與”“或”“非”“異或”等[5]。
本文引用故障樹分析方法,結(jié)合上文對高速動車組網(wǎng)絡(luò)控制系統(tǒng)的結(jié)構(gòu)及故障形式的研究,建立高速動車組網(wǎng)絡(luò)控制系統(tǒng)的故障樹模型,以提高其故障分析效率及準(zhǔn)確性。圖3 示出高速動車組的輸入輸出裝置(IOM)通信故障的建立過程。其中,頂事件為T(即IOM故障)。中間事件包括數(shù)據(jù)鏈路A1(因數(shù)據(jù)鏈路異常所導(dǎo)致的故障,包括交換機(jī)和線纜故障)、數(shù)據(jù)源A2(因IOM 自身原因?qū)е碌墓收?,如IOM 未發(fā)出數(shù)據(jù))、數(shù)據(jù)宿A3(因CCU 異常導(dǎo)致的故障)、交換機(jī)異常A4(交換機(jī)未正常轉(zhuǎn)發(fā)數(shù)據(jù))、軟件原因A5(因運(yùn)行在PU300板卡上的底層軟件和應(yīng)用程序?qū)е掳蹇o法發(fā)出數(shù)據(jù))、應(yīng)用軟件異常A6(應(yīng)用軟件設(shè)計(jì)出錯(cuò))。底事件包括線纜故障B1(因線纜問題導(dǎo)致通信鏈路中斷)、硬件原因B2(因硬件導(dǎo)致板卡無法發(fā)出數(shù)據(jù))、軟件異常B3(軟件設(shè)計(jì)出錯(cuò)導(dǎo)致上報(bào)通信故障)、硬件原因B4(硬件原因?qū)е掳蹇o法收到數(shù)據(jù))、硬件異常B5(硬件原因?qū)е陆粨Q機(jī)無法收發(fā)數(shù)據(jù))、軟件異常B6(交換機(jī)軟件原因?qū)е聰?shù)據(jù)未送達(dá)CCU處)、底層軟件異常B7(底層軟件出錯(cuò))、匹配異常B8(應(yīng)用軟件與底層軟件不匹配)、配置文件出錯(cuò)B9(配置文件中未配置正確的以太網(wǎng)端口、周期、源IP)、程序出錯(cuò)B10。
圖3 高速動車組輸入輸出系統(tǒng)故障樹Fig.3 Fault tree of EMU input and output systems
在故障樹中導(dǎo)致頂事件發(fā)生的底事件集合為割集。求解最小割集的方法通常有下行法和上行法兩種[6]:
(1)上行法。從底事件出發(fā),由下往上開始運(yùn)算,計(jì)算事件的集合。當(dāng)遇到或門時(shí),可將該情況理解為輸出事件的并;當(dāng)遇到與門時(shí),可將該情況理解為輸出事件的交,直到最后得到最小割集。
(2)下行法。從頂事件出發(fā),由上往下開始運(yùn)算,計(jì)算事件的集合。同樣,當(dāng)遇到或門時(shí),可將該情況理解為輸出事件的并;當(dāng)遇到與門時(shí),可將該情況理解為輸出事件的交,一直到無法分解的事件為止,最后得到最小割集。以圖3 為例,利用下行法求解,其過程如表1所示。
表1 求解最小割集過程Tab.1 Process of solving the minimum cut set
經(jīng)吸收并簡化,得到10 個(gè)最小割集:K1:{B1};K2:{B2};K3:{B3};K4:{B4};K5:{B5};K6:{B6};K7:{B7};K8:{B8};K9:{B9};K10:{B10}。
對上述高速動車組輸入輸出系統(tǒng)故障樹進(jìn)行定性分析,由頂事件自上而下找出不能再分割的事件集合(即故障原因);根據(jù)已建好的故障樹,利用下行法求出最小割集[7]。所以,導(dǎo)致動車輸入輸出系統(tǒng)故障的原因有K1:{B1};K2:{B2};K3:{B3};K4:{B4};K5:{B5};K6:{B6};K7:{B7};K8:{B8};K9:{B9};K10:{B10}。
衡量底事件對頂事件的影響程度定義為底事件重要度,因此確定底事件重要度能迅速定位導(dǎo)致事件發(fā)生的最直接原因。為進(jìn)一步幫助維護(hù)人員快速定位分析和維修,節(jié)約故障排查及分析時(shí)間,需根據(jù)最小割集的重要度進(jìn)行排序,從而提高故障排查效率[8]。底事件重要度計(jì)算過程如下:
(1)頂事件發(fā)生的概率P(X)為
式中:X——輸出事件;xi——輸入時(shí)間,i=1,2,…,n;P(xi)——輸入事件發(fā)生的概率。
(2)底事件發(fā)生的概率qk為
式中:αk——第k個(gè)底事件發(fā)生的概率,由可靠性試驗(yàn)和長期故障統(tǒng)計(jì)得到;t——底事件工作時(shí)間。
(3)底事件重要度M(k)為
經(jīng)計(jì)算,以輸入輸出系統(tǒng)為例,數(shù)據(jù)鏈路發(fā)生故障的概率更大,其次是數(shù)據(jù)宿,最后是數(shù)據(jù)源。數(shù)據(jù)鏈路中,線纜故障的概率大于交換機(jī)故障的;交換機(jī)故障中,硬件異常概率大于軟件異常的。數(shù)據(jù)宿中,硬件原因?qū)е掳蹇o法收到數(shù)據(jù)的概率大于因軟件設(shè)計(jì)出錯(cuò)導(dǎo)致上報(bào)通信故障的概率。數(shù)據(jù)源中,硬件原因?qū)е掳蹇o法發(fā)出數(shù)據(jù)的概率大于因程序?qū)е掳蹇o法發(fā)出通信數(shù)據(jù)的概率。軟件在出廠前已調(diào)試得較完善,在正線運(yùn)行過程較穩(wěn)定,所以硬件故障的概率一般大于軟件故障的概率。
為縮短故障處理時(shí)間,實(shí)現(xiàn)對故障數(shù)據(jù)庫更便捷的查看、瀏覽及分析,本文結(jié)合VB編程及Access數(shù)據(jù)庫軟件,設(shè)計(jì)了高速動車組網(wǎng)絡(luò)故障分析系統(tǒng)對故障進(jìn)行分析。該故障分析系統(tǒng)總體設(shè)計(jì)如圖4所示。
圖4 故障分析系統(tǒng)設(shè)計(jì)步驟Fig.4 Design steps of the fault analysis system
故障分析系統(tǒng)主要由數(shù)據(jù)庫(包括案例庫和故障庫)、故障分析和數(shù)據(jù)庫維護(hù)組成,操作人員通過使用這3 個(gè)模塊能實(shí)現(xiàn)動車故障分析、曾經(jīng)案例及現(xiàn)有故障瀏覽、數(shù)據(jù)庫的修改及維護(hù)等操作,為故障分析提供數(shù)據(jù)及技術(shù)支撐。
當(dāng)技術(shù)人員從故障分析界面輸入故障時(shí),系統(tǒng)會從數(shù)據(jù)庫中選取一條內(nèi)容與輸入故障進(jìn)行匹配,當(dāng)匹配成功時(shí),系統(tǒng)會結(jié)合已建立的故障樹對輸入的信息進(jìn)行逐層推理及分析,最終得到故障分析結(jié)果。
為組織及管理大量由故障樹分析法所得的系統(tǒng)故障數(shù)據(jù),實(shí)際應(yīng)用中需搭建數(shù)據(jù)庫來存儲數(shù)據(jù),一般采用“產(chǎn)生式規(guī)則”。產(chǎn)生式規(guī)則一般用以下方式表示:IF A THEN B。其中A 表示條件,B 表示結(jié)論,其意思為:如果滿足條件A,則可以得到結(jié)論B。
故障樹的建立過程可認(rèn)為是獲取知識的過程,逐層深入剖析。在建立故障樹時(shí),將故障樹的頂事件存入數(shù)據(jù)庫故障表的故障類型中,將最小割集中的基本事件(底事件)即故障原因存入故障表的故障原因中,按底事件概率重要度從大到小對故障原因進(jìn)行排序,從而得到排查順序。數(shù)據(jù)庫創(chuàng)建流程如圖5所示。
圖5 數(shù)據(jù)庫創(chuàng)建流程Fig.5 Flowchart of database creation
3.1.1 案例庫模塊
案例庫為高速動車運(yùn)營到目前為止的故障案例,案例庫界面由4 個(gè)搜索框、1 個(gè)數(shù)據(jù)表格控件和3 個(gè)命令按鈕組成。用戶可根據(jù)需要在搜索框內(nèi)輸入相應(yīng)主題進(jìn)行搜索,瀏覽與其類似的案例,獲取分析經(jīng)驗(yàn);維護(hù)人員也可在該界面添加案例。案例庫界面如圖6所示。
圖6 案例庫界面Fig.6 Case library interface
3.1.2 故障庫模塊
故障庫是基于故障樹分析法得到的動車各系統(tǒng)故障的最小割集的數(shù)據(jù)庫,故障庫界面由4 個(gè)搜索框、3個(gè)命令按鈕和1 個(gè)數(shù)據(jù)表格控件組成。用戶既可在該界面瀏覽所有的故障現(xiàn)象、故障原因及排查順序,也可輸入關(guān)鍵詞搜索故障。故障庫為故障分析的基礎(chǔ),維護(hù)人員也可在該界面添加和刪除故障庫內(nèi)容。故障庫界面如圖7所示。
圖7 故障庫界面Fig.7 Fault library interface
故障分析模塊是系統(tǒng)的核心,其主要功能為分析動車的故障。故障推理是故障分析的關(guān)鍵,本文利用正向推理策略設(shè)計(jì)推理程序。故障搜索流程如圖8所示。當(dāng)需進(jìn)行故障分析時(shí),在檢索框中輸入故障的表征,由程序不斷地對上文中建立的數(shù)據(jù)庫進(jìn)行訪問和檢索。當(dāng)匹配成功,系統(tǒng)將結(jié)合已建好的故障樹對輸入信息進(jìn)行層層推理、逐一判斷,依次將得到的“故障原因”“排查順序”“字段”存儲在表格中[9],并生成故障分析建議表。若未匹配成功,系統(tǒng)將會提示重新輸入與數(shù)據(jù)庫內(nèi)容匹配的信息,繼續(xù)重復(fù)以上步驟,直到得到分析結(jié)果[10]。
圖8 故障搜索流程Fig.8 Flowchart of fault search
故障庫模塊的窗口由2個(gè)搜索框、1 個(gè)數(shù)據(jù)表格控件和2 個(gè)組合框控件組成。故障分析界面如圖9所示。本文設(shè)計(jì)的數(shù)據(jù)庫搜索功能代碼如圖10所示。
圖9 故障分析界面Fig.9 Failure analysis interface
圖10 搜索功能代碼Fig.10 Search function codes
數(shù)據(jù)庫維護(hù)模塊是技術(shù)人員對故障分析系統(tǒng)進(jìn)行維護(hù)的窗口,完成對曾經(jīng)案例及現(xiàn)有故障、數(shù)據(jù)庫的添加、刪除、修改及維護(hù)等操作,為故障分析提供數(shù)據(jù)及技術(shù)支撐。數(shù)據(jù)庫維護(hù)流程如圖11所示。
圖11 數(shù)據(jù)庫維護(hù)流程Fig.11 Database maintenance process
高速動車組網(wǎng)絡(luò)故障分析系統(tǒng)自創(chuàng)建以來,已取得較好的應(yīng)用效果。下面通過實(shí)例對高速動車組網(wǎng)絡(luò)故障分析系統(tǒng)的應(yīng)用展開說明。
故障現(xiàn)象:2021年3月16日18時(shí)10分,某動車報(bào)受電弓不可用故障,司機(jī)處理無效后車輛退出運(yùn)營。
若無高速動車組網(wǎng)絡(luò)故障分析系統(tǒng),技術(shù)員將用原始的診斷方法進(jìn)行故障排除,其過程如下:
(1)查看控制要求說明,研究受電弓工作原理;
(2)對導(dǎo)致受電弓不可用的原因進(jìn)行列舉;
(3)按上述原因進(jìn)行一一排查。
技術(shù)員通過高速動車組網(wǎng)絡(luò)故障分析系統(tǒng)對該故障按以下步驟進(jìn)行分析:
(1)登錄故障診斷系統(tǒng)。進(jìn)入故障診斷系統(tǒng),在故障類型中選擇“受電弓不可用”,在故障現(xiàn)象中選擇“受電弓不可用,無法升弓”,得到診斷建議如圖12所示。
圖12 故障診斷界面Fig.12 Failure diagnosis interface
(2)查看案例庫。點(diǎn)擊案例庫查看曾發(fā)生類似故障的原因,為故障診斷提供分析經(jīng)驗(yàn),圖13 所示為案例庫界面。
圖13 案例庫界面Fig.13 Case library interface
(3)故障排查。查看故障診斷界面,結(jié)合案例庫的經(jīng)驗(yàn),對本次故障進(jìn)行分析,依照排查順序依次展開檢查。檢查結(jié)果為列車還處于400 V供電模式狀態(tài),調(diào)整供電模式后,受電弓可用。
由上述流程可知,使用原故障診斷方法,技術(shù)人員需要通過分析設(shè)備工作原理及查看電氣圖紙來查找可能導(dǎo)致問題的原因或故障元器件,該過程至少耗費(fèi)0.5 h時(shí)間。采用本文設(shè)計(jì)的故障診斷系統(tǒng)對故障進(jìn)行診斷,導(dǎo)致故障的原因可立即被直接列舉出來,供技術(shù)人員第一時(shí)間排查故障使用,簡化了查看設(shè)備工作原理、分析故障原因的流程,縮短了排查故障時(shí)間,提高了診斷效率。
隨著列車運(yùn)營時(shí)間的增加,各設(shè)備發(fā)生故障的概率會逐漸增大,此時(shí)結(jié)合高速動車組網(wǎng)絡(luò)故障分析系統(tǒng)能使維護(hù)人員更快捷地進(jìn)行故障診斷。
本文通過分析高速動車組網(wǎng)絡(luò)控制系統(tǒng)的結(jié)構(gòu)以及故障形式,對網(wǎng)絡(luò)故障監(jiān)控系統(tǒng)進(jìn)行詳細(xì)的研究,采用基于故障樹的故障分析方法,根據(jù)底事件的重要度及發(fā)生概率對故障原因進(jìn)行排序研究,最終確定故障分析的最優(yōu)方法。在此基礎(chǔ)上,文章結(jié)合VB 編程及Access數(shù)據(jù)庫軟件,以最小割集和案例庫為數(shù)據(jù)庫,設(shè)計(jì)高速動車組網(wǎng)絡(luò)故障分析應(yīng)用系統(tǒng)。高速動車組網(wǎng)絡(luò)故障分析系統(tǒng)的應(yīng)用,可簡化故障診斷流程,快速定位故障,得到故障診斷建議,縮短故障分析時(shí)間。本系統(tǒng)雖然能在故障發(fā)生后提高故障分析效率,但不能提前預(yù)測故障。下一步,我們將在此系統(tǒng)的基礎(chǔ)上研究故障預(yù)測技術(shù),并展開應(yīng)用。