閆友為 李達(dá)明(北京全路通信信號(hào)研究設(shè)計(jì)院有限公司,北京 100073)
閆友為,男,碩士畢業(yè)于清華大學(xué),助理工程師。主要研究方向?yàn)殍F路通信信號(hào),曾參與“CTCS-3級(jí)列控系統(tǒng)綜合設(shè)計(jì)集成平臺(tái)測(cè)試”、“C3綜合測(cè)評(píng)系統(tǒng)”等項(xiàng)目工作。
隨著中國(guó)高速鐵路的快速發(fā)展,信號(hào)安全網(wǎng)的安全性對(duì)列車的行車安全至關(guān)重要。因此,搭建一套基于鐵路安全通信協(xié)議規(guī)范的故障診斷系統(tǒng),對(duì)由安全設(shè)備之間的通信組成的客運(yùn)專線信號(hào)安全網(wǎng)中的數(shù)據(jù)進(jìn)行分析和評(píng)判,可以輔助作業(yè)人員快速定位設(shè)備通信故障并及時(shí)解決,以保障列車行車安全。
傳統(tǒng)的通信數(shù)據(jù)分析方法主要依靠人工參照協(xié)議規(guī)范,逐字段解析數(shù)據(jù)以判斷數(shù)據(jù)的有效性和正確性,并通過(guò)人為觀察數(shù)據(jù)的通信邏輯來(lái)判斷數(shù)據(jù)的邏輯是否正確。這種完全依靠人的經(jīng)驗(yàn)來(lái)檢驗(yàn)數(shù)據(jù)故障的方法,誤判率、錯(cuò)判率和漏判率都會(huì)相當(dāng)高,因此,在本文中,搭建了一套不依賴于人工的基于鐵路信號(hào)安全通信協(xié)議規(guī)范的故障診斷系統(tǒng),用于對(duì)通信數(shù)據(jù)的有效性和邏輯性進(jìn)行評(píng)判,不但可以大大節(jié)約人力成本,而且可以提高故障診斷的效率和準(zhǔn)確性。
本文介紹的故障診斷系統(tǒng)主要采用的是基于通信協(xié)議規(guī)范的知識(shí)推理技術(shù),它根據(jù)一定的原則(公理或規(guī)則),從已知的事實(shí)(或判斷)推出新的事實(shí)(或另外的判斷)的思維過(guò)程。專家系統(tǒng)的推理是建立在知識(shí)庫(kù)中存儲(chǔ)的大量領(lǐng)域知識(shí)的基礎(chǔ)之上,即是基于知識(shí)的。使用專家系統(tǒng)的過(guò)程就是對(duì)知識(shí)庫(kù)中的知識(shí)進(jìn)行選擇和運(yùn)用的思維過(guò)程[1]。
傳統(tǒng)的知識(shí)推理機(jī)綜合考慮了各種前提和可能發(fā)生的情況,采用傳統(tǒng)的模式匹配算法。這樣的設(shè)計(jì)使系統(tǒng)獲得了很大的通用性,但也帶來(lái)了推理效率不高等缺陷。本系統(tǒng)為了提高推理機(jī)的效率,依據(jù)鐵路信號(hào)通信協(xié)議規(guī)范,提取了其中的專家知識(shí),針對(duì)不同設(shè)備的診斷需求,設(shè)計(jì)了對(duì)應(yīng)于不同規(guī)則集的各種精簡(jiǎn)高效的狀態(tài)機(jī),用于對(duì)客運(yùn)專線信號(hào)安全網(wǎng)的大量復(fù)雜來(lái)源數(shù)據(jù)進(jìn)行診斷和分析。
本通信協(xié)議故障診斷系統(tǒng)所處理的數(shù)據(jù)來(lái)源于既有客運(yùn)專線中各種安全通信設(shè)備之間的通信數(shù)據(jù)。
既有客運(yùn)專線通信信號(hào)系統(tǒng)主要包含以下安全設(shè)備:列控中心(TCC)、聯(lián)鎖(C I)、無(wú)線閉塞中心(RBC)、臨時(shí)限速服務(wù)器(TSRS)、車載設(shè)備(ATP)。其中,TCC與TCC、TCC與CI、TCC與TSRS之間采用RSSP-1協(xié)議規(guī)范[2],RBC與CI、RBC與TSRS之間采用RSSP-2協(xié)議規(guī)范[3],RBC與A TP之間采用037協(xié)議規(guī)范[4]。對(duì)于從安全設(shè)備之間采集到的原始數(shù)據(jù),首先通過(guò)數(shù)據(jù)預(yù)處理模塊,對(duì)輸入數(shù)據(jù)進(jìn)行預(yù)處理,解決數(shù)據(jù)丟失、數(shù)據(jù)不完整、數(shù)據(jù)間不一致、數(shù)據(jù)錯(cuò)誤等問(wèn)題,提高輸入數(shù)據(jù)的質(zhì)量,使推理過(guò)程更加有效和容易。
本故障診斷系統(tǒng)針對(duì)不同設(shè)備之間的通信數(shù)據(jù),分別設(shè)計(jì)了基于上述通信協(xié)議的3類規(guī)則集:RSSP-1通信協(xié)議規(guī)則集、RSSP-2通信協(xié)議規(guī)則集和037通信協(xié)議規(guī)則集。根據(jù)不同設(shè)備之間的通信數(shù)據(jù)故障診斷需求,選擇相應(yīng)的規(guī)則集,通過(guò)比較監(jiān)測(cè)數(shù)據(jù)與本地存儲(chǔ)或計(jì)算的數(shù)據(jù)來(lái)校驗(yàn)數(shù)據(jù)的有效性,并且通過(guò)基于通信協(xié)議的狀態(tài)機(jī)來(lái)校驗(yàn)數(shù)據(jù)的邏輯性。下面將分別對(duì)三類規(guī)則集以及它們所包含的狀態(tài)機(jī)進(jìn)行詳細(xì)介紹。
RSSP-1通信協(xié)議[2]規(guī)定了信號(hào)安全設(shè)備之間通過(guò)封閉式傳輸系統(tǒng)進(jìn)行安全相關(guān)信息交互的功能結(jié)構(gòu)和協(xié)議。封閉式傳輸系統(tǒng)可能存在以下威脅:數(shù)據(jù)幀重復(fù)、丟失、插入、次序混亂、錯(cuò)誤或傳輸超時(shí),為了降低上述威脅風(fēng)險(xiǎn),RSSP-1通信協(xié)議采用從接收端角度設(shè)計(jì)的保護(hù)算法,要求接收端必須對(duì)接收到的信息做出以下檢查:發(fā)送端的源信息真實(shí)性、信息幀的正確性、信息幀的時(shí)效性和信息幀序列的正確性。具體來(lái)說(shuō),它介紹了SSE幀、SSR幀和RSD幀消息安全層的消息格式并對(duì)安全連接建立的過(guò)程以及錯(cuò)誤消息和邏輯的處理方式進(jìn)行了詳細(xì)描述。
RSSP-1通信協(xié)議狀態(tài)機(jī)共有如下幾種狀態(tài):IN IT,當(dāng)故障診斷系統(tǒng)剛啟動(dòng)時(shí),狀態(tài)機(jī)處于初始狀態(tài);W FSSR,當(dāng)接收到時(shí)序校正請(qǐng)求消息SSE幀、RSD幀超時(shí)或RSD幀的時(shí)序錯(cuò)誤,則狀態(tài)機(jī)跳轉(zhuǎn)至請(qǐng)求安全連接狀態(tài),在此狀態(tài)下,安全連接尚未建立成功;SEQDATA,當(dāng)安全連接建立成功后,狀態(tài)機(jī)跳轉(zhuǎn)到數(shù)據(jù)狀態(tài),在該狀態(tài)下,規(guī)則集對(duì)數(shù)據(jù)字段的有效性和時(shí)序邏輯都進(jìn)行校驗(yàn);W FSVC,若狀態(tài)機(jī)在IN IT狀態(tài)下收到RSD幀,則進(jìn)入等待校驗(yàn)SVC狀態(tài),在此狀態(tài)下,規(guī)則集對(duì)數(shù)據(jù)不進(jìn)行時(shí)序性校驗(yàn),只校驗(yàn)數(shù)據(jù)字段的有效性,當(dāng)安全連接建立成功后,狀態(tài)機(jī)跳轉(zhuǎn)到SEQDATA。
RSSP-2通信協(xié)議規(guī)范[3]規(guī)定了信號(hào)安全設(shè)備之間通過(guò)封閉式傳輸系統(tǒng)或開(kāi)放式傳輸系統(tǒng)進(jìn)行安全相關(guān)信息交互的功能結(jié)構(gòu)和協(xié)議。對(duì)于一般的傳輸系統(tǒng)而言,所有可能的威脅如下:重復(fù)、刪除、插入、重排序、損壞、延遲或偽裝,為了降低上述威脅風(fēng)險(xiǎn),RSSP-2通信協(xié)議的MASL層和SA I層主要實(shí)現(xiàn)以下安全相關(guān)的傳輸功能:消息的真實(shí)性、消息的序列完整性、消息的時(shí)效性、消息的完整性、安全錯(cuò)誤報(bào)告、配置管理和訪問(wèn)保護(hù)。A LE層則提供M ASL層和傳輸層之間的適配和冗余處理。具體來(lái)說(shuō),它主要介紹了適配及冗余管理層(A LE)、消息鑒定安全層(M A SL)和安全應(yīng)用中間子層(SA I)的消息格式,并對(duì)安全連接建立的過(guò)程以及錯(cuò)誤消息的處理方法進(jìn)行了詳細(xì)的描述。本規(guī)則集分別對(duì)A LE層的CC、CR和DT消息,M ASL層的AU 1、AU 2、AU 3、AR、DT、D I消息以及SA I層的ECSTART、ECAPP消息的字段有效性進(jìn)行校驗(yàn)。并且通過(guò)圖2、3和圖4所示的狀態(tài)機(jī)分別對(duì)A LE層、M ASL層和SA I層的安全連接的建立過(guò)程進(jìn)行邏輯判斷。
ALE層狀態(tài)機(jī)共有如下幾種狀態(tài):INIT,初始狀態(tài);W FAU 2,當(dāng)接收到CC消息,狀態(tài)機(jī)跳轉(zhuǎn)到等待CR消息狀態(tài);DATA為數(shù)據(jù)狀態(tài),當(dāng)接收到有效的CR消息,ALE層的安全連接建立成功。
M ASL層狀態(tài)機(jī)共有如下幾種狀態(tài):IN IT,初始狀態(tài);W FAU 3,當(dāng)接收到有效的AU 1消息,狀態(tài)機(jī)跳轉(zhuǎn)到等待AU 3消息狀態(tài);W FTC,當(dāng)接收到有效的AU 2消息,狀態(tài)機(jī)跳轉(zhuǎn)到等待TC消息狀態(tài);W FRESP,當(dāng)狀態(tài)機(jī)按照正常邏輯順序,先收到AU 2消息,然后收到有效的AU 3消息,則狀態(tài)機(jī)跳轉(zhuǎn)到等待RESP消息狀態(tài)。當(dāng)出現(xiàn)數(shù)據(jù)采集不同步的情況時(shí),在收到A U 1消息之后,緊接著收到AU 3消息,此時(shí),應(yīng)該設(shè)定一個(gè)短暫的等待時(shí)間,若在該等待時(shí)間之內(nèi),收到AU 2消息,則首先校驗(yàn)AU 2消息是否有效,然后校驗(yàn)之前收到的AU 3消息,若消息有效,則狀態(tài)機(jī)跳轉(zhuǎn)到等待RESP消息狀態(tài);DA TA為數(shù)據(jù)狀態(tài),當(dāng)接收到有效的AR消息,MASL層的安全連接建立成功。
SA I層狀態(tài)機(jī)共有如下幾種狀態(tài):IN IT,初始狀態(tài);W FECSTART,當(dāng)接收到ECSTART消息,狀態(tài)機(jī)跳轉(zhuǎn)到等待ECSTART消息狀態(tài);DATA為數(shù)據(jù)狀態(tài),當(dāng)接收到有效的ECSTART消息,SA I層的安全連接建立成功。
037通信協(xié)議規(guī)范[4]為使用開(kāi)放網(wǎng)絡(luò)進(jìn)行安全相關(guān)的應(yīng)用處理的無(wú)線通信系統(tǒng)提供通信服務(wù),保證數(shù)據(jù)的安全傳送。它主要實(shí)現(xiàn)了以下功能:數(shù)據(jù)的傳輸功能,用以保證數(shù)據(jù)的安全性和可靠性;密鑰管理功能;對(duì)連接進(jìn)行維護(hù)(連接建立、維持、釋放)。具體來(lái)說(shuō),它主要介紹了鏈路層(DL)、網(wǎng)絡(luò)層(NET)、傳輸層(TRANS)和安全層(SA)的消息格式,并對(duì)安全連接建立的過(guò)程以及錯(cuò)誤消息的處理方法進(jìn)行了詳細(xì)描述。本規(guī)則集分別對(duì)DL層的RR幀、RNR幀、REJ幀和I幀,NET層的NPDU消息,TRANS層的AK消息、CC消息、CR消息、DC消息、DR消息和DT消息以及SA層的AU 1、AU 2、AU 3、AR、DT、D I消息的字段有效性進(jìn)行校驗(yàn),并且通過(guò)圖3、5、6、7所示的狀態(tài)機(jī)分別對(duì)SA層、NET層、TRA NS層和DL層的安全連接的建立過(guò)程進(jìn)行邏輯判斷。
SA層狀態(tài)機(jī)與RSSP-2通信協(xié)議的MASL層狀態(tài)機(jī)相同。
NET層狀態(tài)機(jī)共有如下兩種狀態(tài):IN IT為初始狀態(tài),當(dāng)故障診斷系統(tǒng)剛啟動(dòng)時(shí),狀態(tài)機(jī)處于IN IT狀態(tài);DA TA為數(shù)據(jù)狀態(tài),當(dāng)接收到有效的數(shù)據(jù),則跳轉(zhuǎn)到此狀態(tài)。
TRANS層[5]狀態(tài)機(jī)共有如下幾種狀態(tài):IN IT,初始狀態(tài);W FCC,當(dāng)接收到連接請(qǐng)求CR消息,狀態(tài)機(jī)跳轉(zhuǎn)到等待CC消息狀態(tài);W FAK,當(dāng)接收到連接應(yīng)答CC消息,狀態(tài)機(jī)跳轉(zhuǎn)到等待AK消息狀態(tài);DATA,當(dāng)接收到AK消息,狀態(tài)機(jī)跳轉(zhuǎn)到數(shù)據(jù)狀態(tài);W FDC,當(dāng)接收到斷開(kāi)請(qǐng)求DR消息,狀態(tài)機(jī)跳轉(zhuǎn)到等待DR消息狀態(tài);當(dāng)消息超時(shí)或在WFDC狀態(tài)下接收到斷開(kāi)應(yīng)答DC消息,狀態(tài)機(jī)跳轉(zhuǎn)到INIT狀態(tài)。
DL層[6]狀態(tài)機(jī)共有如下幾種狀態(tài):IN IT,初始狀態(tài);RR,當(dāng)接收到RR消息,狀態(tài)機(jī)跳轉(zhuǎn)到準(zhǔn)備接收數(shù)據(jù)狀態(tài);RNR,當(dāng)接收到RNR消息,狀態(tài)機(jī)跳轉(zhuǎn)到未準(zhǔn)備接收數(shù)據(jù)狀態(tài);REJ,當(dāng)接收到REJ消息,狀態(tài)機(jī)跳轉(zhuǎn)到數(shù)據(jù)重傳狀態(tài)。
上述狀態(tài)機(jī)對(duì)于有效的數(shù)據(jù)和邏輯,會(huì)向系統(tǒng)外輸出系統(tǒng)運(yùn)行正常的狀態(tài)提示。而對(duì)于錯(cuò)誤的數(shù)據(jù)和邏輯,對(duì)外輸出錯(cuò)誤提示分以下幾種情況。
1)若消息字段有錯(cuò)誤,則狀態(tài)機(jī)保持原狀態(tài),對(duì)外輸出“某消息某字段錯(cuò)誤”的提示信息;
2)若等待消息超時(shí),即狀態(tài)機(jī)在某一段時(shí)間內(nèi)沒(méi)有收到任何消息,則狀態(tài)機(jī)跳轉(zhuǎn)到IN IT狀態(tài),對(duì)外輸出“某設(shè)備無(wú)數(shù)據(jù)”;
3)若在安全連接的建立過(guò)程中,連接請(qǐng)求和應(yīng)答消息的邏輯錯(cuò)誤,則狀態(tài)機(jī)跳轉(zhuǎn)到IN IT狀態(tài),對(duì)外輸出“安全連接未建立成功”。
通過(guò)上述故障診斷過(guò)程,便能準(zhǔn)確快速定位系統(tǒng)故障,方便研究人員及時(shí)發(fā)現(xiàn)并解決問(wèn)題。
本文所提出的通信協(xié)議故障診斷系統(tǒng)盡可能全面地考慮了數(shù)據(jù)的復(fù)雜性,但由于從不同終端采集到的數(shù)據(jù)可能不同步,致使消息的時(shí)序性有一定的偏差,在這種情況下,可能會(huì)影響到系統(tǒng)的正常運(yùn)行,因?yàn)樵诎踩B接建立的過(guò)程中,收到消息的先后順序是通信協(xié)議中規(guī)定的,若消息時(shí)序有誤,會(huì)使得設(shè)備的安全連接無(wú)法建立。接下來(lái)的研究工作可能從以下兩個(gè)方面來(lái)開(kāi)展:一方面,從數(shù)據(jù)采集源頭確保檢測(cè)消息的時(shí)序性,比如在采集前端增加時(shí)間同步模塊或者對(duì)采集到的數(shù)據(jù)按照時(shí)間戳排序;另一方面,將數(shù)據(jù)順序的各種可能性都考慮到,通過(guò)增加狀態(tài)機(jī)的狀態(tài),確保系統(tǒng)能夠處理任意復(fù)雜的數(shù)據(jù),這種方法使得狀態(tài)機(jī)由線性一階升級(jí)為非線性二階,將大大增加系統(tǒng)的數(shù)據(jù)處理能力、容錯(cuò)能力和辨識(shí)能力。
本系統(tǒng)針對(duì)客運(yùn)專線信號(hào)安全網(wǎng)中,基于RSSP-1協(xié)議、RSSP-2協(xié)議和037協(xié)議規(guī)范進(jìn)行通信的安全設(shè)備之間的通信數(shù)據(jù)的有效性和邏輯性進(jìn)行校驗(yàn)和分析。這種全自動(dòng)實(shí)時(shí)的通信協(xié)議故障診斷系統(tǒng)可以代替?zhèn)鹘y(tǒng)的人工數(shù)據(jù)分析方式,不但可以提高效率,而且可以通過(guò)數(shù)據(jù)錯(cuò)誤準(zhǔn)確定位系統(tǒng)故障,從而快速解決系統(tǒng)問(wèn)題,保證行車安全。
[1] Giarratano J., Joseph c,Riley,et al. Expert Systems Principles and Programming[M]. 北京: 機(jī)械工業(yè)出版社, 2006.
[2] 運(yùn)基信號(hào)[2010]267號(hào) 鐵路信號(hào)安全通信協(xié)議[S].
[3] SubSet-098 V1.0.0. RBC-RBC Safe Communication Interface[S].
[4] SubSet-037 Version 2.3.0[S].
[5] ITU-T Rec.X.224(1995E)[S].
[6] ISO/IEC 7776:1995/AMD.1:1996(E)[S].