楊 將,陽(yáng)亦斌,歐盛芬,鄧永祁
(湖南中車(chē)時(shí)代通信信號(hào)有限公司,湖南 長(zhǎng)沙 410005)
近年來(lái),我國(guó)城市軌道交通(簡(jiǎn)稱(chēng)“城軌”)運(yùn)營(yíng)規(guī)模迅速擴(kuò)大,對(duì)城軌設(shè)備的RAMS技術(shù)(即可靠性、可用性、可維修性和安全性)不斷造成挑戰(zhàn)。2020年3月,中國(guó)城市軌道交通協(xié)會(huì)發(fā)布了《中國(guó)城市軌道交通智慧城軌發(fā)展綱要》,其明確指出智能運(yùn)維安全體系為智慧城軌建設(shè)藍(lán)圖中八大體系的重要組成部分之一。智能運(yùn)維安全體系中的信號(hào)系統(tǒng)運(yùn)維安全屬于運(yùn)營(yíng)安全的重點(diǎn)內(nèi)容[1]。一方面,城軌的運(yùn)營(yíng)線(xiàn)路、在建線(xiàn)路和規(guī)劃線(xiàn)路規(guī)模屢創(chuàng)新高,信號(hào)設(shè)備和設(shè)施分散、數(shù)量大、種類(lèi)多,使得線(xiàn)路運(yùn)維需求快速增長(zhǎng),需要更多專(zhuān)業(yè)的信號(hào)系統(tǒng)運(yùn)維人員。另一方面,信號(hào)設(shè)備運(yùn)維人員的專(zhuān)業(yè)能力需要長(zhǎng)時(shí)間的知識(shí)和經(jīng)驗(yàn)積累,否則無(wú)法快速合理地處置城軌信號(hào)系統(tǒng)故障,對(duì)線(xiàn)路的安全運(yùn)營(yíng)會(huì)產(chǎn)生重大影響[2]。此外,城軌信號(hào)系統(tǒng)的故障種類(lèi)繁多,診斷分析邏輯復(fù)雜,當(dāng)前國(guó)內(nèi)外主要廠商采用針對(duì)不同場(chǎng)景的故障設(shè)計(jì)診斷程序的方式,使得故障診斷系統(tǒng)的代碼冗余且開(kāi)發(fā)周期永無(wú)止境。為此,本文采用網(wǎng)絡(luò)本體語(yǔ)言,抽取和描述信號(hào)系統(tǒng)故障診斷的分析邏輯,建立知識(shí)模型;并基于知識(shí)模型,設(shè)計(jì)城軌信號(hào)故障診斷系統(tǒng)。該系統(tǒng)作為城軌信號(hào)智能運(yùn)維安全體系的關(guān)鍵部分,通過(guò)知識(shí)模型對(duì)信號(hào)系統(tǒng)運(yùn)行數(shù)據(jù)進(jìn)行智能推理,從而實(shí)現(xiàn)自動(dòng)故障診斷。
基于知識(shí)模型的城軌信號(hào)故障診斷系統(tǒng)架構(gòu)分為數(shù)據(jù)采集層、數(shù)據(jù)平臺(tái)層和應(yīng)用平臺(tái)層3層(圖1)。
圖1 基于知識(shí)模型的城軌信號(hào)故障診斷系統(tǒng)架構(gòu)示意圖Fig.1 Architecture of the urban rail signal fault diagnosis system based on knowledge model
數(shù)據(jù)采集層主要采用數(shù)據(jù)接入程序和數(shù)據(jù)解析程序完成信號(hào)子系統(tǒng)設(shè)備運(yùn)行數(shù)據(jù)的采集,其包括車(chē)載控制系統(tǒng)(vehicle on board control,VOBC)、聯(lián)鎖系統(tǒng)(computer interlocking,CI)、區(qū)域控制系統(tǒng)(zone controller,ZC)、應(yīng)答器系統(tǒng)、數(shù)據(jù)傳輸網(wǎng)管系統(tǒng)(data communication system,DCS)、列車(chē)自動(dòng)監(jiān)控系統(tǒng)(automatic train supervision,ATS)、計(jì)軸、道岔、轉(zhuǎn)轍機(jī)、外電網(wǎng)、信號(hào)機(jī)、電源系統(tǒng)及數(shù)據(jù)管理系統(tǒng)(data manage system,DMS)等。
數(shù)據(jù)平臺(tái)層采用典型的Lambda架構(gòu)和Hadoop技術(shù)生態(tài)圈相關(guān)技術(shù),通過(guò)消息中間件接收來(lái)自數(shù)據(jù)采集層的數(shù)據(jù),在大數(shù)據(jù)集群中完成數(shù)據(jù)的實(shí)時(shí)和離線(xiàn)處理。數(shù)據(jù)處理模塊在接收到故障報(bào)警數(shù)據(jù)后,根據(jù)所建的故障知識(shí)模型和設(shè)備運(yùn)行數(shù)據(jù)來(lái)實(shí)時(shí)診斷故障原因,并將故障診斷的結(jié)果實(shí)時(shí)推送給應(yīng)用平臺(tái)。數(shù)據(jù)處理模塊主要涉及的技術(shù)組件有:消息中間件、Spark、Sparkstreaming、Hbase、Hive、Hdfs、緩存及關(guān)系型數(shù)據(jù)庫(kù)等。
系統(tǒng)應(yīng)用平臺(tái)采用基于SpringCloud的微服務(wù)技術(shù)架構(gòu)。為提高效率,設(shè)備運(yùn)行數(shù)據(jù)采用周期傳輸?shù)牟杉绞?,故障?bào)警數(shù)據(jù)采用事件觸發(fā)的采集方式。
系統(tǒng)的知識(shí)模型主要包括故障診斷知識(shí)模型和故障診斷過(guò)程模型?;谛盘?hào)系統(tǒng)、故障診斷知識(shí)模型和故障診斷過(guò)程模型的流程設(shè)計(jì)如圖2所示。數(shù)據(jù)接入軟件根據(jù)信號(hào)子系統(tǒng)的具體工程通信協(xié)議框架,將所采集的信號(hào)子系統(tǒng)數(shù)據(jù)傳輸?shù)较㈥?duì)列中,數(shù)據(jù)解析程序根據(jù)工程碼位表對(duì)信號(hào)子系統(tǒng)數(shù)據(jù)進(jìn)行解析并傳入Spark。系統(tǒng)初始化時(shí),Spark從關(guān)系型數(shù)據(jù)庫(kù)讀出故障診斷知識(shí)模型和故障診斷過(guò)程模型的配置。Spark完成模型初始化后,實(shí)時(shí)進(jìn)行故障診斷分析,并將分析結(jié)果存儲(chǔ)到關(guān)系型數(shù)據(jù)庫(kù)和緩存中。微服務(wù)平臺(tái)從緩存中讀取故障診斷分析結(jié)果,由WebSocket實(shí)時(shí)推送到應(yīng)用系統(tǒng)前端。
圖2 基于知識(shí)模型的城軌信號(hào)故障診斷流程設(shè)計(jì)圖Fig.2 Design diagram of the urban rail signal fault diagnosis process based on knowledge model
城軌信號(hào)故障診斷系統(tǒng)的組成部分主要包括故障診斷的知識(shí)模型以及故障診斷過(guò)程分析模型。本體語(yǔ)言在工業(yè)互聯(lián)網(wǎng)領(lǐng)域中作為概念與知識(shí)模型的形式化規(guī)范說(shuō)明已經(jīng)得到行業(yè)廣泛應(yīng)用。其中,網(wǎng)絡(luò)本體語(yǔ)言(ontology web language,OWL)的子語(yǔ)言 OWL DL(description logic)除了能描述知識(shí)模型外,還具備在推理系統(tǒng)中實(shí)現(xiàn)最大程度表達(dá)的能力,并且推理系統(tǒng)能夠在有限的時(shí)間內(nèi)完成全過(guò)程計(jì)算[3]。城軌信號(hào)系統(tǒng)設(shè)備的故障診斷分析邏輯非常復(fù)雜,為了能夠?qū)崿F(xiàn)信號(hào)系統(tǒng)故障診斷的完全推理,本文采用OWL DL進(jìn)行知識(shí)建模:抽取和描述信號(hào)系統(tǒng)故障診斷的分析邏輯并建立知識(shí)模型,利用系統(tǒng)設(shè)備運(yùn)行狀態(tài)信息匹配故障原因,完成從信號(hào)系統(tǒng)設(shè)備狀態(tài)空間到故障原因空間的映射,實(shí)現(xiàn)信號(hào)系統(tǒng)設(shè)備故障自診斷。
城市軌道交通信號(hào)系統(tǒng)設(shè)備的故障診斷知識(shí)建模包括故障診斷知識(shí)創(chuàng)建、故障診斷知識(shí)映射和故障診斷知識(shí)獲取。
(1)故障診斷知識(shí)創(chuàng)建
城軌信號(hào)系統(tǒng)設(shè)備在運(yùn)行時(shí)會(huì)產(chǎn)生大量的實(shí)時(shí)運(yùn)行數(shù)據(jù),而不同信號(hào)子系統(tǒng)設(shè)備的數(shù)據(jù)格式與數(shù)據(jù)采集方式存在較大差異。為此,構(gòu)建故障診斷核心本體,通過(guò)抽取信號(hào)系統(tǒng)設(shè)備故障診斷的表達(dá)信息,將數(shù)據(jù)描述為系統(tǒng)可讀的形式,實(shí)現(xiàn)故障診斷知識(shí)的創(chuàng)建。
(2)故障診斷知識(shí)映射
通過(guò)建立完備的知識(shí)模型,通用化地描述所有城軌信號(hào)系統(tǒng)設(shè)備的故障診斷實(shí)體及其相互關(guān)系,以完成城軌信號(hào)系統(tǒng)設(shè)備的故障診斷知識(shí)映射[4]。故障診斷分析數(shù)據(jù)模型的建立主要通過(guò)分析現(xiàn)有故障診斷分析運(yùn)維手冊(cè)文檔和歷史故障案例、從信號(hào)系統(tǒng)運(yùn)維專(zhuān)家或者設(shè)計(jì)專(zhuān)家處獲取的專(zhuān)家知識(shí)經(jīng)驗(yàn)來(lái)實(shí)現(xiàn)[5]。故障診斷分析數(shù)據(jù)模型的建立,主要通過(guò)對(duì)故障診斷分析涉及的主要概念、關(guān)鍵字、特定類(lèi)型數(shù)據(jù)進(jìn)行專(zhuān)門(mén)標(biāo)識(shí)并提取和分析這些概念之間的重要關(guān)系來(lái)實(shí)現(xiàn)[6]。
(3)故障診斷知識(shí)獲取
知識(shí)獲取是將信號(hào)系統(tǒng)設(shè)備信息語(yǔ)義化,也就是把信號(hào)系統(tǒng)設(shè)備信息轉(zhuǎn)化成知識(shí),這些知識(shí)能夠在后續(xù)故障診斷分析中重復(fù)傳遞[7]。本體將各信號(hào)子系統(tǒng)設(shè)備的知識(shí)進(jìn)行匯聚,便于統(tǒng)一地處理語(yǔ)義化的知識(shí)[8]。
信號(hào)系統(tǒng)故障診斷知識(shí)具有異構(gòu)多源的結(jié)構(gòu),其特性具有較大的不確定性,不僅需要狀態(tài)監(jiān)測(cè)數(shù)據(jù),又與運(yùn)維參與者和系統(tǒng)設(shè)計(jì)者的經(jīng)驗(yàn)思維有關(guān)。因此,若要實(shí)現(xiàn)故障診斷知識(shí)的表示、推理與反饋,就需要求知識(shí)管理方法系統(tǒng)、全面。本文闡述的本體驅(qū)動(dòng)的信號(hào)系統(tǒng)故障診斷分析知識(shí)建模過(guò)程如圖3所示,其基本流程主要表現(xiàn):(1)過(guò)濾故障診斷分析任務(wù)的相關(guān)信息,以此建立可描述的知識(shí)模型;(2)根據(jù)實(shí)際運(yùn)維經(jīng)驗(yàn)與所設(shè)計(jì)的故障診斷方法,建立信號(hào)系統(tǒng)運(yùn)行狀態(tài)與故障原因之間的映射。
圖3 故障診斷知識(shí)建模示意Fig.3 Schematic diagram of the fault diagnosis knowledge modeling
完備清晰地整理城軌信號(hào)系統(tǒng)領(lǐng)域的核心概念是故障診斷知識(shí)建模的首要任務(wù),也就是構(gòu)造可擴(kuò)展的故障診斷分析語(yǔ)義層次(核心本體)。核心本體主要完成對(duì)分析對(duì)象、分析行為、實(shí)體關(guān)系和分析方法論的定義,并對(duì)分析對(duì)象、行為以及實(shí)體之間的相互關(guān)系進(jìn)行定義[9-11]。核心本體主要包括設(shè)備域本體(DeviceDomain)、數(shù)據(jù)域本體(DataDomain)、分析域本體(AnalyseDomain)和診斷域本體(DiagDomain),這些核心本體分別對(duì)設(shè)備實(shí)體、狀態(tài)、故障診斷、診斷過(guò)程、診斷決策的抽象概念以及相互關(guān)系進(jìn)行定義和描述,層次結(jié)構(gòu)如表1所示。
表1 故障診斷語(yǔ)義核心本體的層次劃分和作用Tab.1 Hierarchy division and function of fault diagnosis semantic core ontology
故障診斷知識(shí)模型中的領(lǐng)域概念知識(shí)之間關(guān)系復(fù)雜,圖4展示了故障診斷模型中的概念、模型位置、作用及其從屬關(guān)系。故障診斷分析過(guò)程(AnalyseProcess)細(xì)分為若干故障診斷分析步驟(AnalyseStep),主要涉及步驟所執(zhí)行的條件(Condition)、故障原因(FaultReason)與故障本身之間的相互關(guān)系。設(shè)備條件(Condition)語(yǔ)義描述較為復(fù)雜,分解為5個(gè)子類(lèi):DeviceOfState、ComponentOfState、DeviceOfCommand、DeviceOfLogstate與 DeviceOfAnaStepState,分別與設(shè)備狀態(tài)(State)、控制命令(Command)、邏輯狀態(tài)(LogState)及故障原因類(lèi)相關(guān)聯(lián)。故障診斷本體框架中主要概念關(guān)系的含義如表2所示。
表2 故障診斷本體框架的主要概念關(guān)系Tab.2 Main conceptual relationships of the fault diagnosis ontology framework
圖4 故障診斷本體知識(shí)關(guān)系示意Fig.4 Schematic diagram of knowledge relationship of the fault diagnosis ontologies
故障診斷知識(shí)建模是城軌信號(hào)系統(tǒng)故障診斷的基礎(chǔ),本節(jié)基于知識(shí)模型的核心本體進(jìn)行信號(hào)系統(tǒng)故障診斷分析過(guò)程建模,對(duì)故障診斷分析過(guò)程的數(shù)據(jù)和流程實(shí)現(xiàn)語(yǔ)義化并進(jìn)行抽取,將分析過(guò)程描述為基于狀態(tài)變遷的一系列執(zhí)行步驟。系統(tǒng)采用決策樹(shù)來(lái)執(zhí)行故障診斷分析過(guò)程。將故障診斷分析過(guò)程分解為執(zhí)行條件、故障診斷分析步驟和分析結(jié)果3部分。只有在作為執(zhí)行條件的分析步驟狀態(tài)滿(mǎn)足要求時(shí),故障診斷分析步驟才會(huì)執(zhí)行,并產(chǎn)生分析結(jié)果。這一系列執(zhí)行條件、分析步驟和分析結(jié)果組成故障診斷過(guò)程模型,如圖5所示。其中,故障診斷分析步驟狀態(tài)的邏輯表達(dá)結(jié)果為False時(shí),故障診斷分析過(guò)程進(jìn)入下一個(gè)分析步驟;邏輯表達(dá)結(jié)果為T(mén)rue時(shí),執(zhí)行故障診斷分析步驟,得出分析結(jié)果,最后結(jié)束診斷。
圖5 故障診斷過(guò)程示意圖Fig.5 Schematic diagram of the fault diagnosis process
分解后的診斷分析基本元素一一對(duì)應(yīng)于分析域本體中的類(lèi)和關(guān)聯(lián),整個(gè)診斷分析可以看作是一系列分析步驟(AnalyseStep)的實(shí)例集合,每一步驟包含多個(gè)分析步驟狀態(tài)(DeviceOfAnaStepState)。
該故障診斷系統(tǒng)被部署在控制中心機(jī)房,主要包括通信服務(wù)器、應(yīng)用服務(wù)器、數(shù)據(jù)服務(wù)器和交換機(jī)等,系統(tǒng)結(jié)構(gòu)示意如圖6所示。按照系統(tǒng)架構(gòu)的3層設(shè)計(jì),數(shù)據(jù)采集層由通信服務(wù)器實(shí)現(xiàn),數(shù)據(jù)平臺(tái)層由數(shù)據(jù)服務(wù)器集群實(shí)現(xiàn),應(yīng)用平臺(tái)層由應(yīng)用服務(wù)器實(shí)現(xiàn)。
圖6 系統(tǒng)組成示意Fig.6 Schematic diagram of the system composition
通信服務(wù)器主要完成實(shí)現(xiàn)本系統(tǒng)與信號(hào)子系統(tǒng)的數(shù)據(jù)接口,獲取信號(hào)子系統(tǒng)設(shè)備數(shù)據(jù)。應(yīng)用服務(wù)器提供web應(yīng)用服務(wù),滿(mǎn)足系統(tǒng)的應(yīng)用服務(wù)功能。數(shù)據(jù)服務(wù)器集群構(gòu)成大數(shù)據(jù)平臺(tái),用于存儲(chǔ)故障知識(shí)模型和故障診斷數(shù)據(jù)。萬(wàn)兆交換機(jī)滿(mǎn)足服務(wù)器大數(shù)據(jù)集群的需求,同時(shí)與維護(hù)網(wǎng)通信。
由于基于信號(hào)系統(tǒng)的知識(shí)建模工作繁雜,因此本文以列車(chē)移動(dòng)授權(quán)(movement authority,MA)回撤的異常診斷為例,建立知識(shí)模型和故障診斷過(guò)程模型。如圖7所示,根據(jù)ZC與CI系統(tǒng)采集數(shù)據(jù),建立知識(shí)模型,包括ZC與CI系統(tǒng)設(shè)備域和數(shù)據(jù)域的設(shè)備狀態(tài)(State)、部件(Component)、控制命令(Command)、邏輯狀態(tài)(LogState)。
圖7 知識(shí)建模示意Fig.7 Schematic representation of the knowledge modeling
根據(jù)圖7中的知識(shí)模型進(jìn)一步建立分析域和診斷域的知識(shí)模型,并建立列車(chē)回撤故障診斷過(guò)程模型,如圖8所示。系統(tǒng)同時(shí)采集ZC、CI設(shè)備的狀態(tài)、部件、控制命令和邏輯狀態(tài)數(shù)據(jù),因此系統(tǒng)基于知識(shí)模型和故障診斷過(guò)程模型快速診斷故障原因,輔助運(yùn)維人員定位故障,通過(guò)工程應(yīng)用能夠有效降低運(yùn)營(yíng)安全事故率15%,提升故障處置效率20%。
圖8 故障診斷過(guò)程建模示意Fig.8 Schematic diagram of the fault diagnosis process modeling
設(shè)備狀態(tài)空間到故障原因空間的映射關(guān)系表現(xiàn)為運(yùn)行狀態(tài)與故障原因之間的本體映射(簡(jiǎn)稱(chēng)狀態(tài)-故障原因映射)。狀態(tài)-故障原因映射主要依靠設(shè)備類(lèi)(Device)、部件類(lèi)(Component)、狀態(tài)類(lèi)(State)、控制命令類(lèi)(Command)、邏輯狀態(tài)類(lèi)(LogState)和條件類(lèi)(Condition)及其間的相互關(guān)系來(lái)完成,具體算法如下:
本文研發(fā)了一種基于知識(shí)模型的城軌信號(hào)故障診斷系統(tǒng),以實(shí)現(xiàn)城軌各信號(hào)子系統(tǒng)間協(xié)同聯(lián)動(dòng)分析和故障診斷。該系統(tǒng)采用網(wǎng)絡(luò)本體語(yǔ)言對(duì)信號(hào)系統(tǒng)故障診斷過(guò)程進(jìn)行知識(shí)建模,從信號(hào)系統(tǒng)知識(shí)創(chuàng)建、知識(shí)映射、知識(shí)獲取的維度完成知識(shí)模型的建立。基于知識(shí)模型構(gòu)造可擴(kuò)展的故障診斷核心本體,定義了分析對(duì)象、分析行為和實(shí)體關(guān)系,并進(jìn)行故障診斷語(yǔ)義關(guān)聯(lián)?;谥R(shí)模型的核心本體進(jìn)行信號(hào)系統(tǒng)故障診斷分析過(guò)程建模,對(duì)故障診斷分析過(guò)程的數(shù)據(jù)和流程實(shí)現(xiàn)語(yǔ)義化并進(jìn)行抽取,將分析過(guò)程描述為基于狀態(tài)變遷的一系列執(zhí)行步驟并采用決策樹(shù)來(lái)執(zhí)行分析過(guò)程?;诠收显\斷知識(shí)模型、故障診斷過(guò)程模型開(kāi)展應(yīng)用設(shè)計(jì),實(shí)現(xiàn)信號(hào)系統(tǒng)數(shù)據(jù)采集、數(shù)據(jù)分析以及分析結(jié)果推送的系統(tǒng)應(yīng)用,為城軌信號(hào)系統(tǒng)運(yùn)維管理提供決策支持,提升了運(yùn)營(yíng)和故障處置效率。
基于知識(shí)模型的城軌信號(hào)故障診斷系統(tǒng)可進(jìn)行故障原因分析并向運(yùn)維人員提供診斷結(jié)果,但由于故障處置往往涉及多部門(mén),存在資源調(diào)度與處理時(shí)無(wú)法高效統(tǒng)籌執(zhí)行等問(wèn)題,這是城軌信號(hào)運(yùn)維領(lǐng)域下一步亟須探討與研究的課題。