• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于數(shù)據(jù)挖掘的鐵路信號設(shè)備故障自動診斷分析

      2022-01-06 06:01:54孫尉筌
      工程建設(shè)與設(shè)計 2021年22期
      關(guān)鍵詞:鐵路信號分詞分類器

      孫尉筌

      (中鐵第一勘察設(shè)計院集團有限公司,西安 710043)

      1 引言

      自“八橫八縱”鐵路網(wǎng)規(guī)劃建設(shè)提出以來,我國鐵路運輸事業(yè)邁入了蓬勃發(fā)展階段,綜合化、網(wǎng)絡(luò)化、智能化、數(shù)字化成為現(xiàn)代鐵路運輸系統(tǒng)發(fā)展的主要方向。而信號控制系統(tǒng)是現(xiàn)代鐵路運輸?shù)摹爸袠猩窠?jīng)”,信號設(shè)備故障的出現(xiàn)不僅會干擾鐵路行車效率,還會對行車安全造成較大的威脅。加之現(xiàn)有信號報告多以文本形式記錄,存儲、分析難度較大。因此,文本以數(shù)據(jù)挖掘為基礎(chǔ),探討短時間內(nèi)辨識鐵路信號設(shè)備故障特征并自動推敲原因的方案尤為關(guān)鍵。

      2 基于數(shù)據(jù)挖掘的故障自診斷整體架構(gòu)

      基于數(shù)據(jù)挖掘的故障自診斷整體架構(gòu)主要包括智能診斷層、模型優(yōu)化層、數(shù)據(jù)預(yù)處理層3 個層次。其中,智能診斷層主要負責根據(jù)中間層獲得的故障信息進行故障數(shù)據(jù)的自動查閱,或根據(jù)現(xiàn)有故障現(xiàn)象搜索歷史經(jīng)驗,提高故障診斷準確率,具體流程為:待診斷故障數(shù)據(jù)→集成分類器→軌道電路故障/道岔故障/信號機故障/……;模型優(yōu)化層為中間層,主要負責利用支持向量機、邏輯回歸基分類器隨機森林集成分類機,結(jié)合參數(shù)特點,對預(yù)處理后數(shù)據(jù)進行調(diào)優(yōu),具體流程為:初始化參數(shù)→基分類器/集成分類器→集中學習群(Voting);數(shù)據(jù)預(yù)處理層主要負責鐵路信號設(shè)備故障文本非結(jié)構(gòu)化數(shù)據(jù)的預(yù)處理。即抽取文本數(shù)據(jù)特征并將其轉(zhuǎn)化為計算機可識別、核算的文本向量,從根源上規(guī)避樣本數(shù)據(jù)不均衡情況。具體流程為:原始文本數(shù)據(jù)→特征向量矩陣→分類標簽→不均衡數(shù)據(jù)處理。

      3 基于數(shù)據(jù)挖掘的故障自診斷實現(xiàn)方案

      3.1 數(shù)據(jù)采集

      鐵路信號設(shè)備涉及調(diào)度指揮系統(tǒng)設(shè)備、列控系統(tǒng)設(shè)備、聯(lián)鎖系統(tǒng)設(shè)備閉塞設(shè)備等多種類型。為保障上述設(shè)備無故障運轉(zhuǎn),鐵路內(nèi)構(gòu)建了不同類別的監(jiān)測系統(tǒng)或監(jiān)控系統(tǒng),上述系統(tǒng)可以以圖形圖像、語音、文本形式進行非結(jié)構(gòu)化數(shù)據(jù)存儲[1]。在日常維護修理階段,也可以以文本形式進行不同類型信號設(shè)備故障現(xiàn)象、原因、處理手段的描述積累。長期下來,形成了以Excel、Word 形式存儲的海量故障數(shù)據(jù),如事后追蹤報告、行車日志等。在行車記錄登記簿、事故故障追蹤報告、日志維修臺賬記錄等信號集中監(jiān)測系統(tǒng)監(jiān)測的異常數(shù)據(jù)輸出文本采集的同時,還可以進行結(jié)構(gòu)化數(shù)據(jù)、外部數(shù)據(jù)的收集。如設(shè)備狀態(tài)、線路狀態(tài)、氣象局數(shù)據(jù)、公安局數(shù)據(jù)等。

      3.2 信號預(yù)處理

      由于外界環(huán)境的干擾,鐵路信號設(shè)備狀態(tài)數(shù)據(jù)無法保證完全有效,部分無效信息常以噪聲形式存在?;诖耍盘栴A(yù)處理的主要目的是將指定無價值符號去除,使文本內(nèi)僅保留漢字。進而對文本進行分詞并將停用詞去除,促使文本最終轉(zhuǎn)化為可輸入至算法的向量,為后期文本特征的提取、分類奠定基礎(chǔ)[2]。根據(jù)不同語言的文本差異,適用的分詞方法也存在一些差異。對于中文分詞,可以將一個漢字序列向單獨次切分。比如,在事先建立的統(tǒng)一詞典表內(nèi)進行分析句子拆分,并將其與詞典內(nèi)的詞條進行逐一匹配,在確定二者匹配后結(jié)束分詞,反之則繼續(xù)進行拆分。整個過程中可用的分詞工具主要有jieba(Python 中文分詞組件)分詞系統(tǒng)或NLPIR 分詞系統(tǒng),后者可以由用戶自定義“敏感點”實現(xiàn)自適應(yīng)分詞。比如,針對鐵路信號設(shè)備故障進行道岔、紅光帶、軌道電路、信號機、轉(zhuǎn)轍機等故障詞典自定義。進而采用NLPIR 分詞系統(tǒng)中的通用詞典對事故信號進行分詞,獲得某故障文本結(jié)果為“//8#道岔 定位 無表示 15:46 銷記 原因 8#道岔 主機 動作桿與 鎖框 摩卡 別勁 …… A 機 系統(tǒng) 報警 輸出未 驅(qū)動”。

      在分詞結(jié)束后,可以利用Word2vec 算法中的Skip-gram模型進行詞向量轉(zhuǎn)化。即設(shè)定輸入層為若干個詞向量,由輸入層到隱層進行上文向量、下文向量相加后獲得一個向量,進而經(jīng)softmax 算法輸出所獲得的向量。Skip-gram 模型可以表示為:

      式中,L 為輸入層詞向量;P 為隱層詞向量;W 為詞;context(W)為上文向量、下文向量相加;C 為窗口長度,具體可看作當前詞W(t)的前C 個詞、后C 個詞。通過求解公式(1)的最大值,可以訓練詞向量。比如,軌道電路詞向量維數(shù)為180 維,對應(yīng)詞向量為[-0.125 621 315,0.015 213 511 2,…,0.205 121 458],將上述詞向量縱向累加后可以獲得整句話的具體含義。

      3.3 特征提取

      進行特征提取時,可以選擇基于統(tǒng)計的常用加權(quán)方法——TF-IDF 法,即假定某詞在某一文檔中多次出現(xiàn),且在其他文本中出現(xiàn)概率較小,甚至為0,則可以將這一詞匯看作對應(yīng)文本的關(guān)鍵詞,詞頻TFi,j可表示為:

      式中,TFi為詞頻;IDFi為逆向文檔頻率。在得到wi的權(quán)重后,考慮到各鐵路信號設(shè)備故障自診斷所面對的特征向量Ti,j間存在較大的差異,需要對其進行歸一化操作。同時,設(shè)鐵路信號設(shè)備故障為信號機故障、微機聯(lián)鎖故障、道岔故障、軌道電路故障,取若干組正常數(shù)據(jù),按正常狀態(tài)、故障狀態(tài)對分析數(shù)據(jù)進行分組。分組后按不同故障狀態(tài)表現(xiàn)取值,將狀態(tài)對應(yīng)的幅值劃分為多個區(qū)段,以幅值最小的區(qū)段記錄為起始區(qū)間,取連續(xù)多個區(qū)間進行有效點的分布線密度計算[3]。逐次遞增進行下一個區(qū)間線密度計算。最終取線密度最大的區(qū)間進行均值計算,獲得估算正常值。同時,選擇一個備分析序列數(shù)據(jù)作為分析目標,將其按狀態(tài)順序分組,按狀態(tài)順序取一組數(shù)據(jù)判斷是否滿足式(4),若滿足則進入下一步,反之則為異常數(shù)據(jù)去除。則在正常狀態(tài)下參數(shù)錯誤(E0)、壓縮機高壓保護故障(E1)、燈箱型元顯示錯誤(E2)、壓縮機低壓保護故障(E3)分別為0.121、0.232、0.211、0.105 時,信號機故障下E0、E1、E2、E3分別為0.072、0.103、0.387、0.168,微機聯(lián)鎖故障下E0、E1、E2、E3分別為0.222、0.255、0.136、0.258,道岔故障下E0、E1、E2、E3分別為0.232、0.289、0.200、0.132,軌道電路故障下E0、E1、E2、E3分別為0.099、0.198、0.152、0.177。

      3.4 故障分類

      故障分類主要是針對故障記錄文本內(nèi)容,利用一個決策函數(shù)進行位置文本類別劃分。考慮到經(jīng)向量化的數(shù)據(jù)兼具高維度、稀疏特征,首先需要利用基分類器進行處理[4]。比如,設(shè)定向量數(shù)據(jù)集數(shù)量為n,特征維度為m,分類數(shù)為c,利用LR分類器進行統(tǒng)計后可以得到分類結(jié)果。在基分類器處理完畢之后,可以利用以Voting 的集成分類器按照分類器錯誤率均無聯(lián)系的策略,進行分類操作,以便盡可能選擇多樣、精確分類結(jié)果,避免分類中位置統(tǒng)計、核算風險的出現(xiàn)。

      3.5 參數(shù)優(yōu)化

      參數(shù)優(yōu)化的主要目的是進行不平衡數(shù)據(jù)處理,常常用合成少數(shù)過采樣技術(shù),即SMOTE 算法。在基于SMOTE 算法的參數(shù)優(yōu)化過程中,首先需要輸入多數(shù)類樣本集和少數(shù)類樣本集,以歐式距離D 為標準計算樣本到少數(shù)類樣本集的距離[5]。同時,根據(jù)數(shù)據(jù)集不平衡比例進行采樣倍率設(shè)置,由歐式距離D 選出最近的幾個樣本作為一個組合,每個組合樣本中2 個與2 個之間隨機連線,獲得新的少數(shù)類樣本并加入數(shù)據(jù)集內(nèi),循環(huán)后輸出新樣本集。上述方法可以滿足分布于密集域內(nèi)樣本參數(shù)優(yōu)化要求,而對于分布在稀疏域內(nèi)的樣本點,可以輸入多數(shù)類樣本集、少數(shù)類樣本集后,設(shè)置閾值、采集倍率,進行少數(shù)類樣本集、多數(shù)類樣本集以及二者的鄰集計算,選取若干個近鄰點生成新的樣本。若相鄰集中不含少數(shù)類樣本,則可以直接將其看作噪聲去除。

      3.6 診斷實現(xiàn)

      考慮到鐵路信號設(shè)備故障復(fù)雜度較高,且兼具不確定性、可傳播性,因此,為了順利實現(xiàn)參數(shù)優(yōu)化,可以面向故障自動診斷需求,以傳統(tǒng)Petri 網(wǎng)為基礎(chǔ)進行故障自動診斷的Petri 有機純網(wǎng)構(gòu)建[6]。即設(shè)定面向鐵路信號設(shè)備故障自動診斷的Petri十元組為:

      式(4)為基于P/T 網(wǎng)的故障自動傳播系統(tǒng)。其中,N 是三元組(基網(wǎng)),N=(P,T,F(xiàn),),T 為有限為空的庫所集合;F 為故障因子數(shù)量;P 為有限非空的庫所集合;W 為集合標識,集合的初始標識為1;K 為容量函數(shù),K∈{0,1};α 為真實度函數(shù)值,α∈{0,1},α>0 表示事件可信度較大,反之則表示完全不可信;μ、p 分別表示在T 上的實函數(shù)和各有向弧的概率權(quán)重函數(shù),前者代表變遷對應(yīng)故障自動診斷規(guī)則的置信度;后者表示經(jīng)驗給定值,p=0 表示當前條件下不可發(fā)生事件,p=1 表示當前條件下的一定發(fā)生事件。

      4 基于數(shù)據(jù)挖掘的故障自診斷應(yīng)用效果

      4.1 驗證平臺

      為確定以數(shù)據(jù)挖掘為基礎(chǔ)的故障自診斷應(yīng)用效果,選擇4核CPU 計算機,在32 GB 的內(nèi)存中安裝Windows2010 系統(tǒng),選擇傳統(tǒng)支持向量機、數(shù)據(jù)挖掘2 種鐵路信號設(shè)備診斷方法,在訓練樣本為400 個,測試樣本為100 個的情況下,將2種方法應(yīng)用效果進行對比[7]。

      4.2 應(yīng)用效果

      從鐵路信號設(shè)備自診斷準確度來看,正常狀態(tài)下,傳統(tǒng)支持向量機診斷準確度為92.00%,基于數(shù)據(jù)挖掘的故障自診斷準確度為96.00%;故障狀態(tài)下,傳統(tǒng)支持向量機診斷準確度為91.00%~93.00%,基于數(shù)據(jù)挖掘的故障自診斷準確度為94.00%~97.00%,這主要是由于傳統(tǒng)支持向量機在小樣本調(diào)解下訓練參數(shù)確定方式為隨機,信號設(shè)備診斷準確度低于數(shù)據(jù)挖掘方法。

      從鐵路信號設(shè)備自診斷時間來看,正常狀態(tài)下,傳統(tǒng)支持向量機診斷時間為6.00 s,基于數(shù)據(jù)挖掘的故障自診斷時間為4.80 s;故障狀態(tài)下,傳統(tǒng)支持向量機診斷時間為6.00~8.00 s,基于數(shù)據(jù)挖掘的故障自診斷時間為3.80~4.00 s,表明基于數(shù)據(jù)挖掘的鐵路信號設(shè)備故障自動診斷方法可以有效壓縮故障診斷時間,優(yōu)化鐵路信號設(shè)備故障診斷效率。

      5 結(jié)語

      綜上所述,為了順利發(fā)掘文本數(shù)據(jù)中蘊含的海量高價值故障特征信息,保證信號設(shè)備故障報告的使用價值,技術(shù)人員可以選擇數(shù)據(jù)挖掘技術(shù),對現(xiàn)有信號設(shè)備故障進行匯總剖析,自動分辨識別設(shè)備故障報告中特征。并對現(xiàn)有信號設(shè)備故障案例提取高頻詞匯,以固定故障案例中文分詞+形式化自定義規(guī)則的形式,進行故障信息提取和原因追溯,為故障處理與改進決策提供助力。

      猜你喜歡
      鐵路信號分詞分類器
      渝貴鐵路信號系統(tǒng)聯(lián)調(diào)聯(lián)試的思考與建議
      結(jié)巴分詞在詞云中的應(yīng)用
      智富時代(2019年6期)2019-07-24 10:33:16
      鐵路信號設(shè)備維修管理信息系統(tǒng)設(shè)計與開發(fā)
      BP-GA光照分類器在車道線識別中的應(yīng)用
      電子測試(2018年1期)2018-04-18 11:52:35
      雷擊對鐵路信號系統(tǒng)的影響探討
      值得重視的分詞的特殊用法
      加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
      結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
      既有鐵路信號改造工程實施與研究
      基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識別
      泌阳县| 邵武市| 陇川县| 江安县| 准格尔旗| 兴安县| 永丰县| 红河县| 西昌市| 昌乐县| 勐海县| 衢州市| 洛宁县| 乾安县| 永宁县| 太湖县| 玉树县| 义马市| 乌拉特后旗| 元江| 广德县| 北宁市| 万荣县| 上蔡县| 杭锦后旗| 句容市| 柯坪县| 通江县| 环江| 宜城市| 彭水| 淳化县| 沿河| 新营市| 任丘市| 宽城| 诸暨市| 巴林右旗| 东港市| 东兰县| 凤山县|