楊春艷
朔黃鐵路線路檢測和救援中心,中國·河北 滄州 062350
大數據;鋼軌磨耗;數據分析
隨著鐵路信息化步伐的加快,鐵路運營系統的數據已具有海量性、多源性、數據類型多、處理要求快等特點。傳統的鐵路數據分析仍然采用人力以Excel 表格為基本模板的定時定量分析鋼軌磨耗指標,并按月記錄原平分公司管內鋼軌側磨發(fā)展情況。但隨著數據量的逐月增加,Excel 表格功能已經遠遠無法滿足對海量檢測數據的梳理、統計、分析等需求,也無法滿足對磨耗數據更為深入的研究需要。分析鋼軌磨耗影響因素,研究曲線磨耗發(fā)展速率,預測磨耗發(fā)展趨勢,輔助實現鋼軌壽命管理等研究過程均受到了技術瓶頸制約。同時經考察全球尚不存在針對磨耗檢測數據開發(fā)的數據分析處理系統。因此,如何便利大數據分析,深度挖掘磨耗數據價值成為鋼軌磨耗研究的關鍵。
中國朔黃鐵路原平分公司管內線路屬于典型山區(qū)鐵路,橋隧毗連、填挖相接、坡度大、曲線多、半徑小是其主要特點。經統計,原平分公司上行重載線路有曲線179 條,共計94.182km,占原平分公司上行線路總長的36.8%;R ≤600m以下的曲線75 條,共計43.112km,占分公司上行曲線總長的45.8%;600 <R ≤800 的曲線35 條,共計21.309km,占分公司上行曲線總長的22.6%。由于線路條件復雜,加之面臨逐年增加的運量和更大軸重車輛的通行,小半徑曲線鋼軌磨耗發(fā)展呈現出加速趨勢。這不僅縮短了鋼軌使用壽命,增加了養(yǎng)護維修的工作量和費用,也給行車安全帶來極大隱患。因此,對朔黃重載鐵路曲線磨耗數據進行系統性管理和分析面臨以下六類問題[1]。
(1)檢測數據量大
朔黃鐵路綜合檢測車鋼軌磨耗檢測系統上線應用兩年,積累了大量鋼軌磨耗數據,綜合檢測車磨耗檢測數據的采集規(guī)則為一米四個采集點,每月的原平上行179 個曲線區(qū)段鋼軌磨耗數據可達近百萬條。
(2)曲線磨耗計算量大
為了考察每條曲線是否達到規(guī)定的磨耗傷損級別,曲線鋼軌磨耗值成為重要指標。其計算方式是對每條曲線鋼軌磨耗最明顯區(qū)段里程段內的磨耗值進行算數平均得到。但由于涉及的文件較多,計算過程會面臨與數據分割同樣的誤差問題。
(3)通過總重與換軌周期比較量大
每條曲線鋼軌在上線后其磨耗值會隨著累計通過總重的變化而變化,當磨耗傷損程度達到規(guī)定值后須下線。為了考察磨耗發(fā)展情況與自上線后鋼軌上所通過的重量總和之間的關系,累計通過總重成為一項重要考察指標。其計算方式是在同一次換軌周期內,檢測當日的調度日報統計通過總重數據與上線當日的調度日報統計通過總重數據差值。但由于每一條曲線的換軌時間起始點不同,需要根據不同鋼軌換軌日期的時間進行通過總重數據抓取,且曲線鋼軌的數目較多,人工計算統計效率低且可能出現誤差的可能性較大。
(4)磨耗數據與關聯數據量大
如果僅把數據結構化的進行儲存管理還無法充分體現出數據的價值,必須將數據庫中的數據進行關聯查詢才能對數據間隱含的信息加以利用。要研究曲線磨耗發(fā)展與累計通過總重之間的關系就必須對曲線磨耗、通過總重和臺賬信息進行關聯查詢。
(5)磨耗數據存儲量大
隨著綜合檢測車每月檢測后的磨耗數據不斷增加,對數據的安全可靠性管理也隨之增強。本項目計劃利用數據庫技術解決對海量數據的管理。數據庫是依靠結構性查詢語言SQL 對各種數據進行導入,由于涉及的數據相當大,同時涉及的表也比較多,人工逐條導入數據很繁瑣也很耗時。
(6)磨耗數據展示量大
僅按照里程情況對每條曲線的磨耗數據進行羅列無法直觀對磨耗傷損級別進行詳細考察,進而降低了對傷損曲線級別的迅速判斷。同時,如果利用Excel 表格作圖功能進行逐月磨耗考察,并不能靈活跨月份對磨耗發(fā)展情況進行觀察。磨耗檢測數據的可視化將便利以上需求。
如何利用檢測數據對朔黃鐵路曲線磨耗情況進行系統性分析,借助計算機來高效解決大數據量分析及入庫工作,并通過分析結果指導現場安全、經濟、科學的鋼軌“狀態(tài)修”,實現鋼軌的壽命管理,大數據分析技術的應用成為一種選擇[2]。
數據是記錄信息的載體,是知識的來源。數據的激增意味著記錄范圍、測量范圍和分析范圍不斷擴大,知識的邊界也在不斷延伸。如何收集、保存、維護、管理、分析、共享正在指數級增長的數據是我們必須面對的一個挑戰(zhàn)。
針對特定的業(yè)務過程,處理離散的事務,數據成為一種過程記錄。數據的不斷積累的結果,不僅僅用于查詢,而且應用于分析。怎樣從各個獨立的信息系統提取、整合有價值的數據,從而實現從數據到信息、從信息到知識、從知識到利潤的轉化。通過數據庫應用,建立一種格式多源數據存儲中心,即使通過不同平臺采集的數據,可以按照統一的定義格式被提取出來,再通過清洗、轉換、集成最后歸流入海,加載進數據倉庫[3]。
同時通過統一接口,為每個系統提供信息共享的機制,使得各種運輸數據充分共享,數據之間通過各種方式來匹配和結合,充分發(fā)揮和挖掘現有系統和數據的潛力,把業(yè)務數據進行采集、整理和統計分析,形成信息管理的基礎數據源,并在此之上開發(fā)出用戶需要的特殊功能,進一步提高朔黃鐵路的信息化管理水平。
將專業(yè)設備監(jiān)測數據,建立分析模型,實現設備狀態(tài)趨勢變化可感知、劣化自動預警,自動生成預警維護工單。數據之所以要進行分析處理,關鍵在于這些數據量巨大,這些數據精確地記載了過去和現在發(fā)生的事,對面向未來的決策有著極其重大的意義和價值。在數據中找出關聯,發(fā)現規(guī)律和驗證假設,可極大提升決策的準確性和可靠性,使決策真正智慧。智慧決策不僅有助于發(fā)現設備運行規(guī)律,同時為“狀態(tài)修”提供數據分析支撐。通過數據分析進行數據的可視化展現,進而將復雜的數據轉變?yōu)楹唵蔚慕换ィ蓪崿F對數據的“全方位”“立體式”呈現。如區(qū)別于傳統柱狀圖的玫瑰花圖,用于展現二維數據;表現宏觀數據趨勢的日歷圖;用于層級數據結構展現的太陽輻射圖及樹圖;表現節(jié)點關聯關系的弦圖等等,這些簡捷、生動且具有藝術氣息的絢麗圖表,不僅讓龐雜的數據變成具有特定業(yè)務指標并實現不同數據之間的聯動分析,并最終為企業(yè)提供科學決策[4]。
利用鋼軌磨耗信息系統軟件(如圖1所示)管理檢測數據,分析影響磨耗的關鍵因素和磨耗發(fā)展規(guī)律,建立鋼軌磨耗發(fā)展預測模型,對鋼軌的“狀態(tài)修”和修理周期提出合理化建議,并最終實現延長鋼軌使用壽命的目標。
圖1 鋼軌磨耗管理信息系統功能結構圖
(1)數據分割自動化
綜合檢測車磨耗檢測數據的采集規(guī)則為一米四個采集點,這代表每月的原平上行磨耗數據可達近百萬條,而每次的檢測數據都必須按照曲線所在的起始里程值將原始數據進行分割歸檔[5]。依靠人力去提取分析每條曲線的數據值,不僅耗時費力,還有可能導致提取數據時發(fā)生人工誤差,所以計算方式是對每條曲線鋼軌磨耗最明顯區(qū)段里程段內的磨耗值進行算數平均得到(如圖2所示)。
圖2 鋼軌磨耗速率擬合曲線
(2)曲線鋼軌磨耗值計算自動化
將數據提取分割管理是對數據進行分析的第一步。為了考察每條曲線是否達到規(guī)定的磨耗傷損級別,曲線鋼軌磨耗值成為重要指標。其計算方式是對每條曲線鋼軌磨耗最明顯區(qū)段里程段內的磨耗值進行算數平均得到。但由于涉及的文件較多,計算過程會面臨與數據分割同樣的誤差問題,所以也必須借助計算機來高效解決這部分工作,計算過程如圖3所示。
圖3 曲線傷損判斷流程圖
(3)累計通過總重計算自動化
每條曲線鋼軌在上線后其磨耗值會隨著累計通過總重的變化而變化,當磨耗傷損程度達到規(guī)定值后須下線。為了考察磨耗發(fā)展情況與自上線后鋼軌上所通過的重量總和之間的關系,累計通過總重成為一項重要考察指標。其計算方式是在同一次換軌周期內,檢測當日的調度日報統計通過總重數據與上線當日的調度日報統計通過總重數據差值。但由于每一條曲線的換軌時間起始點不同,需要根據不同鋼軌換軌日期的時間進行通過總重數據抓取,且曲線鋼軌的數目較多,人工計算統計效率低且出現誤差的可能性較大。
(4)磨耗檢測數據可視化
僅按照里程情況對每條曲線的磨耗數據進行羅列無法直觀對磨耗傷損級別進行詳細考察,從而降低了對傷損曲線級別的迅速判斷。同時,如果利用Excel 作圖功能進行逐月磨耗考察,并不能靈活跨月份對磨耗發(fā)展情況進行觀察。磨耗檢測數據的可視化將便利以上需求[6]。
(5)數據導入數據庫管理自動化
隨著綜合檢測車每月檢測后的磨耗數據不斷增加,對數據的安全可靠性管理也隨之增強。本項目計劃利用數據庫技術解決對海量數據的管理。數據庫是依靠結構性查詢語言SQL對各種數據進行導入,由于涉及的數據相當大,同時涉及的表也比較多。人工逐條導入數據很繁瑣也很耗時,所以必須將數據導入數據庫的過程實現自動化。鋼軌磨耗管理信息系統數據庫的E-R 關系圖,以及表中各字段的關聯關系如圖4所示。
圖4 鋼軌磨耗管理信息系統數據庫的E-R 關系圖
(6)曲線磨耗、通過總重和臺賬信息關聯查詢
如果僅把數據結構化進行儲存管理那還無法充分體現出數據的價值,必須將數據庫中的數據進行關聯查詢才能對數據間隱含的信息加以利用。
(7)利用查詢結果觀察磨耗發(fā)展趨勢
雖然利用數據庫可以實現方便的關聯查詢,但要想考察鋼軌磨耗整體的發(fā)展趨勢就需要對查詢后的數據進行二次處理。通過對查詢后的數據進行建模分析以及對數據點進行曲線擬合將考察對象量化和直觀化,從而進一步深入分析數據,挖掘數據中的價值。
以分割后每月每條曲線的磨耗數據為基礎數據庫,選擇任意一條曲線進行觀察,再選取其單月數據、連續(xù)或不連續(xù)的多月數據進行作圖。將磨耗數據以折線圖的形式呈現:X軸為曲線里程(單位:公里km),Y 軸為磨耗值(單位:毫米mm)。同時可以將朔黃曲線不同傷損程度磨耗標準值標注于圖中。此功能方便了檢測人員直觀跟蹤曲線磨耗的發(fā)展情況,且能第一時間對曲線的磨耗傷損程度進行判斷。
圖5 磨耗數據可視化設計示意圖
使用本系統統計分析鋼軌磨耗數據,可提高統計和分析工作效率,減少人為統計錯誤,增強信息傳輸的及時性和準確性,將技術人員從海量數據和繁瑣統計等流程中解脫出來。同時軟件系統分析的結果準確可靠,對指導安全生產、防止工作失誤、指導設備狀態(tài)修理有重要意義,其間接經濟效益更為樂觀。
鋼軌磨耗管理信息系統軟件的應用,通過斷面磨耗分析系統,可對側磨傷損程度進行問題地段篩選,對影響側磨因素進行側磨發(fā)展速率預判,對小半徑曲線側磨情況進行數據統計。更適用于重載鐵路的運營需要,可大大降低各類行車事故的發(fā)生概率,提高鐵路運輸生產的效率。對公司的運輸帶來很大的經濟效益和社會效益。