趙曉峰
(上海富欣智能交通控制有限公司,上海 201210)
基于WEKA的信號(hào)設(shè)備預(yù)測性維護(hù)信息系統(tǒng)
趙曉峰
(上海富欣智能交通控制有限公司,上海 201210)
信號(hào)設(shè)備預(yù)測性維護(hù)信息系統(tǒng)主要是對(duì)信號(hào)系統(tǒng)的各子系統(tǒng)維護(hù)信息進(jìn)行數(shù)據(jù)挖掘,結(jié)合系統(tǒng)可靠性、可用性、可維護(hù)性分析結(jié)果,制定預(yù)測性維護(hù)策略,定義故障信息收集模板,提供基于自由軟件WEKA的預(yù)測性維護(hù)方法,使用軟件集成的開發(fā)方式,建立數(shù)據(jù)挖掘的分類、聚類、關(guān)聯(lián)模型。這種方式既有助于縮短開發(fā)周期,也能夠有效降低軟件成本。
預(yù)測性維護(hù);自由軟件;數(shù)據(jù)挖掘;分類;聚類;關(guān)聯(lián)
預(yù)測性維護(hù)是以狀態(tài)為依據(jù)的維修,在設(shè)備運(yùn)行時(shí),對(duì)其主要部位進(jìn)行狀態(tài)檢測和故障診斷,判定設(shè)備所處的狀態(tài),并能預(yù)測設(shè)備未來的狀態(tài)趨勢和可能的故障模式,從而制定出預(yù)測性維護(hù)計(jì)劃。
懷卡托知識(shí)分析環(huán)境(WEKA)是一款使用Java語言編寫的面向機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的綜合工具平臺(tái),獲得了GNU通用公共許可認(rèn)證,為自由軟件,包含一系列可視化工具、數(shù)據(jù)分析算法以及建模技術(shù),支持?jǐn)?shù)據(jù)預(yù)處理、聚類、分類、回歸、可視化和特征選擇。
應(yīng)用于城市軌道交通信號(hào)系統(tǒng)的預(yù)測性維護(hù)信息系統(tǒng)是在實(shí)時(shí)監(jiān)督和收集運(yùn)營相關(guān)各子系統(tǒng)狀態(tài)和報(bào)警數(shù)據(jù)的基礎(chǔ)上,經(jīng)過大量數(shù)據(jù)挖掘和知識(shí)分析,同時(shí)輔以資產(chǎn)管理和辦公自動(dòng)化等工具,提供更準(zhǔn)確的預(yù)防性維護(hù)計(jì)劃和建議,有助于降低和減少糾正性維護(hù)發(fā)生的概率和造成的危害,并為整個(gè)信號(hào)系統(tǒng)可靠性、可用性、可維護(hù)性(RAM)指標(biāo)的驗(yàn)證提供依據(jù)。
預(yù)測性維護(hù)信息系統(tǒng)數(shù)據(jù)收集的范圍包括計(jì)算機(jī)聯(lián)鎖(CI)、區(qū)域控制器(ZC)、車載控制器(VOBC)、列車自動(dòng)監(jiān)控(ATS)、數(shù)據(jù)通信系統(tǒng)(DCS)的內(nèi)部和外部數(shù)據(jù),以及列車位置檢測設(shè)備、道岔、信號(hào)機(jī)、有源信標(biāo)、站臺(tái)屏蔽門、站臺(tái)緊急按鈕等軌旁外部設(shè)備的狀態(tài)和故障信息,車輛、速度計(jì)、加速度計(jì)、雷達(dá)傳感器、信標(biāo)應(yīng)答器、司機(jī)顯示器等車載外部設(shè)備的狀態(tài)和故障信息。
預(yù)測性維護(hù)信息系統(tǒng)經(jīng)過數(shù)據(jù)挖掘和知識(shí)分析后,會(huì)生成糾正性維護(hù)和預(yù)防性維護(hù)的計(jì)劃。其中,糾正性維護(hù)需要維護(hù)人員在預(yù)測故障發(fā)生前盡快執(zhí)行;預(yù)防性維護(hù)主要包括軌旁和車載設(shè)備的日檢、周檢、雙周檢、月檢、季檢、半年檢、年檢具體內(nèi)容的增加或更新。
根據(jù)EN50126標(biāo)準(zhǔn)要求,城市軌道交通信號(hào)系統(tǒng)應(yīng)進(jìn)行RAM評(píng)估,提交RAM分析報(bào)告和定量安全風(fēng)險(xiǎn)分析報(bào)告(QRA),尤其是計(jì)算機(jī)聯(lián)鎖、區(qū)域控制器、車載控制器等SIL4的子系統(tǒng)。表1給出了主要信號(hào)設(shè)備的RAM參考值。
表1 信號(hào)設(shè)備RAM參考值
預(yù)測性維護(hù)信息系統(tǒng)主要由數(shù)據(jù)采集、數(shù)據(jù)清洗和數(shù)據(jù)應(yīng)用3大功能模塊構(gòu)成,如圖1所示。
圖1 預(yù)測性維護(hù)信息系統(tǒng)架構(gòu)
數(shù)據(jù)采集模塊是對(duì)信號(hào)系統(tǒng)主要子系統(tǒng)的狀態(tài)和報(bào)警進(jìn)行收集,包括ATS、DCS、計(jì)算機(jī)聯(lián)鎖、區(qū)域控制器、車載控制器、微機(jī)監(jiān)測等,不同子系統(tǒng)的數(shù)據(jù)格式可能不同;數(shù)據(jù)清洗模塊是對(duì)不同格式的數(shù)據(jù)源進(jìn)行格式化,檢查數(shù)據(jù)一致性,處理無效值、缺失值和重復(fù)值,并存入預(yù)測性維護(hù)數(shù)據(jù)庫;數(shù)據(jù)應(yīng)用是以維護(hù)數(shù)據(jù)庫為核心,根據(jù)故障處理方式的不同,分為3類:(1)基于故障定位的維修工單子模塊,主要輔助解決糾正性維護(hù)任務(wù);(2)基于故障統(tǒng)計(jì)的RAM管理子模塊,實(shí)現(xiàn)長期數(shù)據(jù)的分析,為軌道交通維護(hù)和建設(shè)指標(biāo)提供參考;(3)基于故障預(yù)測的維修計(jì)劃子模塊,主要輔助持續(xù)更新預(yù)防性維護(hù)任務(wù),并圍繞系統(tǒng)外的維修因素—人員和備件進(jìn)行綜合管理。
城市軌道交通運(yùn)營單位一般會(huì)在信號(hào)系統(tǒng)開通后增設(shè)維護(hù)支持系統(tǒng),主要是完成對(duì)軌旁信號(hào)設(shè)備的微機(jī)監(jiān)測和機(jī)房環(huán)境監(jiān)測,所以在構(gòu)建預(yù)測性維護(hù)信息系統(tǒng)時(shí),應(yīng)支持獨(dú)立工作和軟件集成兩種運(yùn)行模式。WEKA的Simple CLI和Knowledge Flow功能環(huán)境可以很好地實(shí)現(xiàn)這兩種方式。其中,Simple CLI提供一個(gè)簡單的命令行界面,可以把模型保存下來,這樣有新的待預(yù)測數(shù)據(jù)出現(xiàn)時(shí),不用每次重新建模,直接應(yīng)用保存好的模型即可。此外,對(duì)預(yù)測結(jié)果給出置信度,用戶可以有選擇地采納預(yù)測結(jié)果。Knowledge Flow環(huán)境提供數(shù)據(jù)的預(yù)處理,數(shù)據(jù)格式的轉(zhuǎn)化,各種數(shù)據(jù)挖掘算法,并提供結(jié)果的可視化工具,還可以讓用戶創(chuàng)建、運(yùn)行、修改和分析算法試驗(yàn),比單獨(dú)分析各個(gè)算法更加方便。
下面從數(shù)據(jù)挖掘不同模型的角度詳細(xì)描述預(yù)測性維護(hù)信息系統(tǒng)核心功能的實(shí)現(xiàn)。
3.1 分類模型
分類是通過分析訓(xùn)練集中的數(shù)據(jù),為每個(gè)類別建立分類模型,并用該模型對(duì)數(shù)據(jù)庫中的其他記錄進(jìn)行分類。常用分類算法有貝葉斯(Bayes)、決策樹(Decision Tree)等。
如圖2所示,左側(cè)是各個(gè)子系統(tǒng)的維護(hù)數(shù)據(jù),CBI、ZC、VOBC主要是從診斷維護(hù)端口送出的內(nèi)部狀態(tài)和報(bào)警,以及各自嵌入式子系統(tǒng)的運(yùn)行日志;計(jì)軸(Axle Counter)主要是內(nèi)部串口版和并口版的工作狀態(tài)信息;ATS主要有數(shù)據(jù)庫Data Logger存儲(chǔ)的信息,以及計(jì)劃和實(shí)際時(shí)刻表;DCS主要有數(shù)據(jù)記錄器(Data Recorder)抓取的網(wǎng)絡(luò)通信數(shù)據(jù)包,以及各交換機(jī)和防火墻的運(yùn)行日志。經(jīng)過數(shù)據(jù)預(yù)處理后,通過類指定器(Class Assigner)標(biāo)明決定分類的屬性,再使用交叉驗(yàn)證模塊(Cross Validation Fold Maker)分配訓(xùn)練集和測試集,然后就可以對(duì)數(shù)據(jù)集進(jìn)行貝葉斯網(wǎng)絡(luò)(Bayes Net)分類器分析。處理結(jié)果通過圖形查看器Graph Viewer圖形化顯示到用戶前端,并在通過分類行為評(píng)估器(Classifier Performance Evaluator)評(píng)估合格后,轉(zhuǎn)存儲(chǔ)到預(yù)測性維護(hù)數(shù)據(jù)庫,同時(shí)提供XML擴(kuò)展接口,便于大數(shù)據(jù)的二次開發(fā)。
信號(hào)系統(tǒng)維護(hù)信息的分類主要是依據(jù)故障發(fā)生時(shí)間、地點(diǎn)、子系統(tǒng)等進(jìn)行處理,同時(shí)考慮系統(tǒng)外部和內(nèi)部的接口特性,并在大量數(shù)據(jù)積累基礎(chǔ)上對(duì)故障等級(jí)進(jìn)行細(xì)致處理。因此,當(dāng)發(fā)生故障時(shí),須全面記錄從故障發(fā)生時(shí)刻到設(shè)備恢復(fù)正常時(shí)刻之間的各項(xiàng)信息,以便后續(xù)利用預(yù)測性維護(hù)信息系統(tǒng)進(jìn)行分析和總結(jié)。表2列舉了信號(hào)設(shè)備故障信息收集模板,其中,每一個(gè)數(shù)據(jù)維度都可以按照不同的分析需要成為數(shù)據(jù)分類的依據(jù)。
圖2 信號(hào)設(shè)備維護(hù)信息分類模型
表2 信號(hào)設(shè)備故障信息收集模板
3.2 聚類模型
聚類是數(shù)據(jù)挖掘中用來發(fā)現(xiàn)數(shù)據(jù)分析和隱含模式的一項(xiàng)重要技術(shù),其目的是把大量數(shù)據(jù)點(diǎn)的集合分成若干類,使得每個(gè)類中的數(shù)據(jù)之間最大程度地相似,而不同類中的數(shù)據(jù)最大程度地不同。常用聚類算法有K方法(K-means)、基于密度含噪聲的空間聚類應(yīng)用算法(DBSCAN)、基于斜面的聚類算法(CLOPE)等。
如圖3所示,聚類模型的分析對(duì)象主要是經(jīng)過數(shù)據(jù)清洗的預(yù)測性維護(hù)數(shù)據(jù)庫,通過訓(xùn)練集生成器(Training Set Maker)的學(xué)習(xí),就可以正式使用DBSCAN算法建立預(yù)測模型,該算法是基于密度的聚類算法,從數(shù)據(jù)對(duì)象的分布密度出發(fā),將密度足夠大的相鄰區(qū)域連接起來,從而發(fā)現(xiàn)具有任意形狀的聚類,并能有效處理異常數(shù)據(jù)。處理結(jié)果通過文本查看器(Text Viewer)以表格形式顯示給用戶。
圖3 信號(hào)設(shè)備維護(hù)信息聚類模型
DBSCAN算法主要用于分析通信故障的相關(guān)數(shù)據(jù)。信號(hào)系統(tǒng)中影響行車的通信故障主要有兩類:車地?zé)o線信號(hào)不穩(wěn)定和定位信標(biāo)讀取失敗。城市軌道交通領(lǐng)域中目前大量使用符合IEEE 802.11標(biāo)準(zhǔn)的2.4 GHz無線通信,由于是ISM公共頻段,在傳輸信道中存在很多干擾源。經(jīng)過大量分析發(fā)現(xiàn),無線信號(hào)在地下段主要受隧道參數(shù)影響,如:曲率半徑、豎曲線半徑等;而在地面和高架段主要受外來環(huán)境的干擾,如:繁華地段的商用WIFI信號(hào)、雷暴日、太陽風(fēng)等。信標(biāo)系統(tǒng)是基于RFID技術(shù)的列車絕對(duì)定位系統(tǒng),主要有歐標(biāo)和美標(biāo)兩種制式,通信頻段分別是27 MHz和902 MHz。根據(jù)現(xiàn)場運(yùn)行數(shù)據(jù)分析,信標(biāo)讀取失敗故障主要與產(chǎn)品批次和工作環(huán)境相關(guān),如:金屬異物遮擋信標(biāo)、道岔區(qū)域正線和側(cè)線信標(biāo)安裝位置過近等。
3.3 關(guān)聯(lián)模型
關(guān)聯(lián)規(guī)則是當(dāng)前數(shù)據(jù)挖掘研究的主要方法之一,它反映一個(gè)事物與其他事物之間的相互依存性和關(guān)聯(lián)性。如果兩個(gè)或者多個(gè)事物之間存在一定的關(guān)聯(lián)關(guān)系,那么其中一個(gè)事物就能夠通過其他事物預(yù)測到。常用關(guān)聯(lián)規(guī)則算法有挖掘關(guān)聯(lián)規(guī)則的頻繁項(xiàng)集算法(Apriori)、頻繁項(xiàng)增長算法(FPGrowth)、Tertius等。
如圖4所示,關(guān)聯(lián)模型的分析對(duì)象主要是經(jīng)過數(shù)據(jù)清洗的預(yù)測性維護(hù)數(shù)據(jù)庫,通過訓(xùn)練集生成器(Training Set Maker)的學(xué)習(xí)后,就可以正式使用Predictive Apriori算法建立預(yù)測模型,該算法基于Apriori算法,其步驟是:(1)通過迭代,檢索出數(shù)據(jù)庫中的所有頻繁項(xiàng)集,即支持度不低于用戶設(shè)定的閾值的項(xiàng)集,利用頻繁項(xiàng)集構(gòu)造出滿足用戶最小信任度的規(guī)則。(2)通過不斷增大規(guī)則前項(xiàng)支持度和觀察置信度來逐步逼近獲得最大預(yù)測精度,從而返回最好的關(guān)聯(lián)規(guī)則。處理結(jié)果通過Text Viewer以表格形式顯示給用戶。
WEKA-based Signalling Equipment Predictive Maintenance Information System
ZHAO Xiaofeng
( Shanghai Fuxin Intelligent Transportation Solutions Co.Ltd.,Shanghai 201210,China)
Signaling Equipment Predictive Maintenance Information System was used to implement data mining for maintenance information of subsystems in signalling system,combine with reliability,availability,and maintenanceability analysis result,set predictive maintenance strategy,defne fault information collection template,provide free software WEKA-based predictive maintenance method,use the method software integrity development,build models of classifers,cluster and association.This method was helpful to shorten development period as well as reduce software cost effectively.
predictive maintenance;free software;data mining;classify;cluster;association
U284.7∶TP39
A
1005-8451(2016)01-0052-04
2015-05-07
趙曉峰,高級(jí)工程師。