楊懷志,吳艷華,程智博
(1.京滬高速鐵路股份有限公司,北京 100038;2.中國鐵道科學(xué)研究院集團(tuán)有限公司 電子計算技術(shù)研究所,北京 100081)
工務(wù)設(shè)備是鐵路運輸?shù)幕A(chǔ),其狀態(tài)直接關(guān)系鐵路運輸?shù)陌踩c效率。隨著我國高速鐵路(簡稱:高鐵)運營里程不斷增長,運輸部門對工務(wù)設(shè)備的檢測、維修、養(yǎng)護(hù)、安全管理提出更高的要求。高鐵工務(wù)專業(yè)已積累海量設(shè)備相關(guān)狀態(tài)數(shù)據(jù),利用大數(shù)據(jù)技術(shù)搭建高鐵數(shù)據(jù)資產(chǎn)匯集平臺,從高速鐵路公司戰(zhàn)略決策和管理角度出發(fā),統(tǒng)籌工務(wù)專業(yè)需求開展大數(shù)據(jù)應(yīng)用,挖掘鐵路業(yè)務(wù)數(shù)據(jù)隱藏關(guān)系及規(guī)律,為支持高速鐵路設(shè)備精細(xì)化管理和企業(yè)高效化運營提供強有力的技術(shù)手段[1];從各級站段及工區(qū)維修及管理角度出發(fā),提出匯集工務(wù)設(shè)備屬性、檢查數(shù)據(jù)、維修動態(tài)、歷史情況、實時狀態(tài)等相關(guān)信息并進(jìn)行綜合分析,科學(xué)合理地制定維修及實施計劃,指導(dǎo)工務(wù)設(shè)備維修管理工作,輔助落實科學(xué)修、準(zhǔn)確修、精確修理念。
近10年來,大數(shù)據(jù)技術(shù)在歐美國家鐵路得到了較為廣泛的應(yīng)用,主要應(yīng)用領(lǐng)域為設(shè)施設(shè)備的狀態(tài)監(jiān)測與維護(hù),運營管理、乘務(wù)運用等方面也得到了一定的應(yīng)用。德國鐵路通過規(guī)劃建設(shè)統(tǒng)一的數(shù)據(jù)中心平臺,實現(xiàn)了對經(jīng)營狀況、設(shè)備故障分析等精益分析功能在內(nèi)的數(shù)據(jù)綜合應(yīng)用平臺[2];美國貨運鐵路啟動了“資產(chǎn)健康戰(zhàn)略計劃”(AHSI,Asset Health Strategic Initiative),AHSI擬編輯和分析由各個鐵路公司分別收集和存儲的大量數(shù)據(jù),并由此解決行業(yè)內(nèi)最關(guān)鍵的鐵路設(shè)備管理與維護(hù)問題[3];瑞典鐵路大量獲取軌道狀態(tài)檢測數(shù)據(jù),以評估基礎(chǔ)設(shè)施的整體狀態(tài)[4]。通過借鑒國外大數(shù)據(jù)應(yīng)用經(jīng)驗,結(jié)合我國鐵路工務(wù)設(shè)備需求,建立基于鐵路數(shù)據(jù)服務(wù)平臺的資產(chǎn)匯集平臺[5],將工務(wù)相關(guān)結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)全面匯集,提出工務(wù)大數(shù)據(jù)應(yīng)用總體框架,并研究關(guān)鍵技術(shù),根據(jù)實際需求開展典型應(yīng)用,對于實現(xiàn)設(shè)備健康狀態(tài)評估、故障預(yù)測及維修決策等功能具有重要意義。
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)已逐漸成為企業(yè)和公司的核心資產(chǎn)。高速鐵路公司雖然工務(wù)專業(yè)數(shù)據(jù)資源豐富,但大多數(shù)據(jù)存在來源不同、形式不同且雜亂無章等問題,并且包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。該部分?jǐn)?shù)據(jù)尚未被有序地整合,也未按照統(tǒng)一的標(biāo)準(zhǔn)化規(guī)范和流程進(jìn)行數(shù)據(jù)關(guān)聯(lián)、清洗、處理等,某些數(shù)據(jù)甚至從未被應(yīng)用過,反而增加存儲、服務(wù)器等成本。
以京滬高速鐵路工務(wù)設(shè)備數(shù)據(jù)為例,可歸納為如下幾類:
(1)動態(tài)檢測數(shù)據(jù):包括動檢數(shù)據(jù)、車載式線路檢查儀數(shù)據(jù)、便攜式線路檢查儀數(shù)據(jù);
(2)靜態(tài)檢查及維修數(shù)據(jù):人工檢查記錄、檢修計劃落實、軌檢小車、鋼軌淺表層病害分析等數(shù)據(jù);
(3)監(jiān)測數(shù)據(jù):精測網(wǎng)與變形監(jiān)測數(shù)據(jù)、鋼軌探傷數(shù)據(jù)、橋梁PHM數(shù)據(jù)、軌道精調(diào)、單點監(jiān)測數(shù)據(jù)、二型板和軌道結(jié)構(gòu)監(jiān)測數(shù)據(jù)等;
(3)問題庫:設(shè)備病害庫(動態(tài)、靜態(tài))數(shù)據(jù)、周邊問題巡查庫數(shù)據(jù);
(4)臺賬及履歷:更改大修數(shù)據(jù)、基礎(chǔ)設(shè)施臺賬、裝備和備品備件進(jìn)出庫記錄等;
(5)規(guī)章標(biāo)準(zhǔn):國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、標(biāo)準(zhǔn)性技術(shù)文件、作業(yè)方案及作業(yè)指導(dǎo)書等。
將以上類別數(shù)據(jù),結(jié)合現(xiàn)有信息系統(tǒng)及相關(guān)數(shù)據(jù)管理現(xiàn)狀,具體描述如表1所示。
表1 京滬高鐵工務(wù)設(shè)備數(shù)據(jù)現(xiàn)狀
通過大數(shù)據(jù)手段掌握高速鐵路全線構(gòu)筑物和設(shè)備的狀態(tài),及時分析發(fā)現(xiàn)可能出現(xiàn)的問題,保證線路設(shè)備條件處于最佳狀態(tài),持續(xù)保持運營期管理技術(shù)的領(lǐng)先水平,已成為高速鐵路運營管理中亟待解決的關(guān)鍵問題。根據(jù)各專業(yè)業(yè)務(wù)需要,整合各系統(tǒng)資源及數(shù)據(jù),同時開展大數(shù)據(jù)綜合應(yīng)用分析,推進(jìn)高速鐵路運維決策支持系統(tǒng)研究,實現(xiàn)設(shè)備健康狀態(tài)評估、故障預(yù)測及維修決策等功能具有重要意義。在高速鐵路工務(wù)數(shù)據(jù)管理現(xiàn)狀下,分析高速鐵路工務(wù)大數(shù)據(jù)應(yīng)用需求如下:
(1)高鐵示范站段及下屬車間調(diào)研數(shù)據(jù)的需求。了解工務(wù)設(shè)備維修管理相關(guān)數(shù)據(jù)應(yīng)用與管理現(xiàn)狀,調(diào)研現(xiàn)有主要數(shù)據(jù)存儲位置(站段/車間)、管理單位、管理方式、更新周期、使用情況等,分析數(shù)據(jù)接入方式等,為工務(wù)數(shù)據(jù)匯集奠定基礎(chǔ)。
(2)建立標(biāo)準(zhǔn)規(guī)范的高鐵工務(wù)數(shù)據(jù)模型的需求。高鐵工務(wù)設(shè)備管理需要掌握工務(wù)專業(yè)基礎(chǔ)數(shù)據(jù),根據(jù)這些數(shù)據(jù)形成標(biāo)準(zhǔn)規(guī)范的數(shù)據(jù)模型,為日常檢修維護(hù)等提供全面、精準(zhǔn)的數(shù)據(jù)支持。
(3)搭建高鐵數(shù)據(jù)資產(chǎn)匯集平臺的需求。根據(jù)邏輯模型,分層次、分類別將匯集數(shù)據(jù)進(jìn)行組織,需要實現(xiàn)數(shù)據(jù)的全景展示,并需要從專業(yè)角度對結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)分別管理,并支持相應(yīng)檢索功能。
(4)探索工務(wù)典型設(shè)備壽命周期規(guī)律應(yīng)用的需求。需要基于匯集平臺開展探索工務(wù)典型設(shè)備壽命周期管理應(yīng)用,如更改、大修及專項整治應(yīng)用、沉降觀測分析、二型板溫度分析等。
高速鐵路數(shù)據(jù)資產(chǎn)管理平臺,是鐵路數(shù)據(jù)服務(wù)平臺的核心組成部分,重點集中于數(shù)據(jù)采集、管理、治理、展現(xiàn)等部分功能。平臺以工務(wù)管理和應(yīng)用分析為突破口,以維修管理決策分析為核心,建立工務(wù)設(shè)備相關(guān)大數(shù)據(jù)應(yīng)用,集成工務(wù)專業(yè)部門的動態(tài)檢測數(shù)據(jù)、靜態(tài)檢查及維修數(shù)據(jù)、監(jiān)測數(shù)據(jù)、問題庫數(shù)據(jù)等,運用數(shù)據(jù)集成、數(shù)據(jù)治理、數(shù)據(jù)脫敏、數(shù)據(jù)同步、可視化等關(guān)鍵技術(shù),逐步實現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)目錄管理、數(shù)據(jù)治理、數(shù)據(jù)共享等功能,形成更改大修、沉降觀測、二型板溫度分析等應(yīng)用,為高鐵公司、路局等系統(tǒng)用戶提供相關(guān)決策支持和服務(wù),其總體框架如圖1所示。
圖1 工務(wù)大數(shù)據(jù)應(yīng)用總體框架
按照既定數(shù)據(jù)分類,展現(xiàn)平臺中所存儲和管理的所有結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù);根據(jù)數(shù)據(jù)表、字段名稱和類型搜索系統(tǒng)所有結(jié)構(gòu)化數(shù)據(jù)的元數(shù)據(jù);根據(jù)關(guān)鍵字搜索非結(jié)構(gòu)化的文檔型數(shù)據(jù),并需要提供元數(shù)據(jù)血緣分析、影響分析等。主要包括數(shù)據(jù)采集系統(tǒng)、數(shù)據(jù)目錄系統(tǒng)、數(shù)據(jù)治理系統(tǒng)等,具體功能如圖2所示。
圖2 高鐵數(shù)據(jù)資產(chǎn)匯集平臺功能架構(gòu)
2.4.1 數(shù)據(jù)的清洗治理
從數(shù)據(jù)質(zhì)量、元數(shù)據(jù)、數(shù)據(jù)標(biāo)準(zhǔn)等方面實現(xiàn)數(shù)據(jù)采集到數(shù)據(jù)使用全過程治理[6]。支持自動檢驗采集數(shù)據(jù)的值域分布,根據(jù)分布情況自動發(fā)現(xiàn)異常數(shù)據(jù),并向數(shù)據(jù)提供者發(fā)送郵件說明數(shù)據(jù)異常情況。平臺支持?jǐn)?shù)據(jù)自動加密、脫敏,在不改變數(shù)據(jù)分布情況、復(fù)合編碼規(guī)則的情況下,生成不影響業(yè)務(wù)分析的虛假數(shù)據(jù)。該種方式既能保護(hù)數(shù)據(jù)安全,又能支持業(yè)務(wù)分析。在數(shù)據(jù)存儲方面,支持行、列混合存儲,支持40倍以上高倍率壓縮存儲數(shù)據(jù)。
開展各類數(shù)據(jù)的清洗治理,包括結(jié)構(gòu)化數(shù)據(jù)的梳理、清洗、歸一、關(guān)聯(lián)等,非結(jié)構(gòu)化數(shù)據(jù)(人工記錄、規(guī)章制度、標(biāo)準(zhǔn)庫、作業(yè)指導(dǎo)書等)的格式轉(zhuǎn)換、錄入、檢索等,如圖3所示。
圖3 數(shù)據(jù)接入的清洗與治理
2.4.2 非結(jié)構(gòu)化文件全文檢索
平臺使用Elasticsearch、ORC、自然語言處理等技術(shù)處理非結(jié)構(gòu)化關(guān)鍵字檢索。其中,采用ORC識別圖像文件轉(zhuǎn)換為文字、使用自然語言處理對查詢關(guān)鍵詞進(jìn)行分詞、語義分析;采用Elasticsearch進(jìn)行分布式文件檢索[7],以支持.doc、.pdf、.txt、JSON、XML以及其他多種格式文件的全文檢索,檢索結(jié)果使用OpenOffice插件可在網(wǎng)頁端直接預(yù)覽、下載。
2.4.3 權(quán)限管理
Kerberos是Hadoop生態(tài)系中應(yīng)用最廣的集中式統(tǒng)一用戶認(rèn)證管理框架,Kerberos提供一個集中式的身份驗證服務(wù)器,各種后臺服務(wù)并不直接認(rèn)證用戶的身份,而是通過kerberos第三方服務(wù)來認(rèn)證[8,9]。用戶的身份和密碼信息在Kerberos服務(wù)框架中統(tǒng)一管理。平臺使用該后臺服務(wù),無需管理用戶身份和密碼信息,使用企業(yè)代碼加代碼命名用戶名,實現(xiàn)從路局到站段、不同路局間的權(quán)限分隔。
2.4.4 數(shù)據(jù)標(biāo)簽
平臺使用模式識別技術(shù),基于數(shù)據(jù)表、元數(shù)據(jù)、采樣數(shù)據(jù)進(jìn)行建模[10],自動生成標(biāo)簽,通過標(biāo)簽挖掘數(shù)據(jù)表之間的關(guān)聯(lián)關(guān)系,分析數(shù)據(jù)表間的相似度;同時能夠根據(jù)標(biāo)簽,快速了解數(shù)據(jù)類型、數(shù)據(jù)來源、數(shù)據(jù)內(nèi)容等。
在分析基于數(shù)據(jù)服務(wù)平臺的高速鐵路工務(wù)大數(shù)據(jù)應(yīng)用總體方案相關(guān)功能及技術(shù)后,結(jié)合京滬高速鐵路公司的管理現(xiàn)狀,開展京滬高鐵工務(wù)設(shè)備大數(shù)據(jù)應(yīng)用。
基于大數(shù)據(jù)應(yīng)用的發(fā)展過程規(guī)律,前期重點關(guān)注于數(shù)據(jù)的采集、治理、展現(xiàn)等功能,因此基于鐵路數(shù)據(jù)服務(wù)平臺,結(jié)合工務(wù)大數(shù)據(jù)應(yīng)用的具體需求,研發(fā)京滬高鐵數(shù)據(jù)資產(chǎn)匯集平臺?;跇I(yè)務(wù)現(xiàn)狀,建立高鐵工務(wù)數(shù)據(jù)目錄,實現(xiàn)數(shù)據(jù)資源統(tǒng)一分類管理;實現(xiàn)元數(shù)據(jù)管理、血緣分析、關(guān)聯(lián)分析等功能,展現(xiàn)數(shù)據(jù)量、數(shù)據(jù)記錄數(shù)等;實現(xiàn)數(shù)據(jù)地圖,全景展示平臺中所存儲和管理的所有結(jié)構(gòu)化和非結(jié)構(gòu)化工務(wù)數(shù)據(jù);基于平臺開展數(shù)據(jù)清洗、治理,規(guī)范數(shù)據(jù)結(jié)構(gòu)。平臺示例如圖4~圖6所示。
圖4 京滬高鐵數(shù)據(jù)資產(chǎn)匯集平臺首頁
圖5 結(jié)構(gòu)化數(shù)據(jù)表的檢索
圖6 非結(jié)構(gòu)化文檔的全文檢索
3.2.1 軌檢小車分析應(yīng)用
根據(jù)匯集平臺中的軌檢小車數(shù)據(jù)為例,從超限等級類別進(jìn)行統(tǒng)計,包括作業(yè)驗收、經(jīng)常保養(yǎng)、臨時補修、嚴(yán)重臨時補修數(shù)目,采用餅狀圖直觀展示各項超限等級類別占比,且支持?jǐn)?shù)據(jù)詳情查看;同時對各項檢查項目類別占比以樹形圖進(jìn)行展示,可看出軌道變化率及軌距檢查項目占比較大,并對不同車間及工區(qū)檢查項目總數(shù)進(jìn)行統(tǒng)計,如圖7所示。
3.2.2 動態(tài)檢測綜合分析應(yīng)用
將便攜式線路檢查儀、車載式線路檢查儀、TQI數(shù)據(jù)進(jìn)行綜合分析,不同日期的各項檢測值的密集程度,能夠間接反映該里程處的軌道平順性,用以指導(dǎo)計劃檢修及更改大修等作業(yè)。該分析應(yīng)用中,支持選擇線名、行別、添乘時間、自定義里程、自定義合并區(qū)間等功能,如圖8所示。
圖7 軌檢小車分析應(yīng)用
圖8 動態(tài)檢測綜合分析應(yīng)用
基于鐵路數(shù)據(jù)服務(wù)平臺,在綜合分析高鐵工務(wù)數(shù)據(jù)及系統(tǒng)現(xiàn)狀后,提出面向全生命周期管理的工務(wù)設(shè)備數(shù)據(jù)匯集和治理方案,并搭建高速鐵路數(shù)據(jù)資產(chǎn)匯集平臺,根據(jù)匯集數(shù)據(jù)開展大數(shù)據(jù)分析應(yīng)用,探索工務(wù)設(shè)備規(guī)律,為高鐵的科學(xué)化管理和決策提供支撐。下一步應(yīng)根據(jù)匯集數(shù)據(jù)開展綜合性應(yīng)用分析,同時結(jié)合不同算法為高鐵提供更加精準(zhǔn)的決策支持。