梅 靖 中國鐵路上海局集團(tuán)有限公司上海通信段
GSM-R是基于目前已經(jīng)成熟、通用的公共無線通信系統(tǒng)GSM平臺(tái)發(fā)展而來的,專門為滿足鐵路應(yīng)用而開發(fā)的數(shù)字移動(dòng)通信系統(tǒng)。本文對(duì)上海局將鄭徐線BSC從諾基亞MSC割接至上海華為MSC之后,鄭徐高鐵線陸續(xù)發(fā)生列車CTCS-3(以下簡稱C3)降級(jí)[1-4]運(yùn)行的問題,通過截取E接口、A接口信令,對(duì)列車降級(jí)原因進(jìn)行分析定位,分析局間切換流程、后續(xù)切換流程、MSC局間消息傳遞流程進(jìn)行故障定位,對(duì)今后的日常維護(hù)工作具有一定的指導(dǎo)意義。
2018年8月10日上海通信段完成了鄭徐高鐵(上海局管段)BSC接入新設(shè)MSC,隨即發(fā)現(xiàn)列車運(yùn)行在徐州東站至銅山線路所區(qū)間內(nèi),上下行均多次發(fā)生列車CTCS-3降級(jí)運(yùn)行。
2018年8月10日凌晨,上海局將鄭徐高鐵線XZBSC1從諾基亞MSC割接至上海華為MSC之后,部分列車在上海局與濟(jì)南局交界處發(fā)生C3降級(jí)。
(1)徐州東往鄭州方向:徐州東(上海諾基亞MSC)切換ZZ-XZD19(濟(jì)南 MSC)成功,ZZ-XZD19切換 ZZ-XZD18 成功,ZZ-XZD18(濟(jì)南 MSC)切換 TSXLS01A(上海華為 MSC)失敗后C3降級(jí)。
(2)鄭州往徐州東方向:TSXLS01A(上海華為MSC)切換ZZ-XZD18(濟(jì)南 MSC)成功,ZZ-XZD18切換 ZZ-XZD19 成功,ZZ-XZD19(濟(jì)南 MSC)切換 XuZhouDong(上海華為 MSC)失敗后C3降級(jí)。
由此可見,列車降級(jí)時(shí)主要涉及諾基亞MSC、濟(jì)南MSC、華為MSC之間的跨MSC切換,主要涉及后續(xù)切換信令流程。
根據(jù)接入新設(shè)的MSC后5天內(nèi)降級(jí)車次比例進(jìn)行分析,降級(jí)車次數(shù)量占總車次數(shù)量30%到48%不等,從降級(jí)次數(shù)、降級(jí)時(shí)間上看無明顯規(guī)律,如表1所示。
表1 降級(jí)車次數(shù)量占比分析
因列車降級(jí)涉及到上海諾基亞MSC、上海華為MSC、濟(jì)南MSC、武漢STP、北京STP,為保證分析數(shù)據(jù)的完整性,多家單位配合共同定位故障點(diǎn)。在濟(jì)南局MSC的E接口、A接口和BSC的Abis接口上掛信令儀。在上海局對(duì)MSC21和MSC22、XZBSC1、njBSC1的 E接口、A 接口和 Abis接口掛接信令儀,各掛接位置跟濟(jì)南局MSC掛接一致。
經(jīng)過對(duì)降級(jí)車次數(shù)據(jù)進(jìn)行綜合分析,判斷降級(jí)區(qū)段集中在shMSC2、濟(jì)南MSC與shMSC1跨局切換區(qū)域,為進(jìn)一步定位故障原因,通過對(duì)A口、E口掛表截取信令。
通過在上海MSC和北京武漢STP之間追蹤到一個(gè)切換失敗的記錄進(jìn)行分析。從信令流程中可見,切換未完成就收到華為的發(fā)REL消息,后面的切換流程中斷。由于A->B->C跨局切換失敗涉及到的三個(gè)局的A口和E口消息,僅僅從C局的E口消息無法判斷具體的故障點(diǎn),需要整個(gè)流程完整的信令消息才可用進(jìn)行更進(jìn)一步的分析定位。
3.2.1 上行列車(鄭州往上海)E接口信令分析
以2018年8月11日G1914次列車為例對(duì)E接口信令分析。上海局華為MSC在10:22:55收到濟(jì)南局MSC的后續(xù)切換請(qǐng)求消息,攜帶目的小區(qū)LAC 0X410b以及目的MSC號(hào)碼8614900411(上海諾西MSC)。華為MSC向上海諾西MSC發(fā)起切換消息,上海諾西MSC返回切換響應(yīng)消息。局間連接建立完成后,10:22:57上海華為MSC給濟(jì)南MSC回后續(xù)切換響應(yīng)消息,此時(shí)上海華為MSC進(jìn)入等待切換檢測消息狀態(tài)。7 s后上海華為MSC未收到上海諾西MSC發(fā)送的切換檢測消息,定時(shí)器超時(shí),主動(dòng)發(fā)出ABORT消息,拆除呼叫。
3.2.2 下行列車(上海往鄭州)E接口信令分析
以2018年8月12日G1879次列車為例對(duì)E接口信令分析。08:39:48上海華為MSC接收到來自上海諾西MSC的切換請(qǐng)求消息,上海華為MSC回切換響應(yīng)消息給上海諾西MSC,華為MSC處理機(jī)制正常。
3.2.3 A接口信令分析
08:39:48上海華為MSC收到上海諾西MSC發(fā)送的切換請(qǐng)求消息后,上海華為MSC 08:39:48向上海BSC發(fā)送HO_Request,上海BSC返回HO_Request_ack給上海華為MSC。上海華為MSC回切換響應(yīng)消息給上海諾西MSC。但是之后未收到上海鄭徐線BSC發(fā)送的切換檢測消息HO_DETECT消息。08:39:56上海華為MSC發(fā)clear_command消息拆除呼叫。
3.2.4 至武漢STP信令分析
08:39:49上海諾西MSC給上海華為發(fā)IAM消息,進(jìn)行局間連接建立。08:39:49上海華為MSC給上海諾西MSC回ACM消息,但是由于上海鄭徐線BSC未發(fā)送切換檢測消息給華為MSC,導(dǎo)致上海華為MSC未發(fā)切換檢測消息給上海諾西MSC,約7 s后08:39:56上海華為MSC等待切換檢測定時(shí)器超時(shí),華為MSC向上海諾西MSC發(fā)REL(拆線)消息,同時(shí)收到了上海諾西MSC發(fā)送的REL消息,拆除呼叫。
3.2.5 原因分析綜述
上海諾西MSC沒有發(fā)送切換檢測消息(HO_DETECT)給上海華為MSC,最終導(dǎo)致上海華為MSC等待切換檢測消息(HO_DETECT)定時(shí)器超時(shí),呼叫被釋放,后列車發(fā)生C3降級(jí)。
通過濟(jì)南局C3三接口檢測A接口和Abis接口數(shù)據(jù)分析發(fā)現(xiàn)濟(jì)南的MSC給BSC下發(fā)了HandOverCommand(切換命令),但是BSC收到該消息后并沒有將該消息發(fā)給BTS。
當(dāng)車載MT設(shè)備在上海諾基亞MSC下起呼鄭徐RBC后,首先切換至濟(jì)南MSC,后切換至上海華為MSC下,類似涉及3個(gè)MSC的跨局切換稱為“后續(xù)切換”,“后續(xù)切換流程”如圖1所示,MSC-A代表諾基亞MSC,2G-MSC-B代表濟(jì)南MSC,2G-MSC-B'代表華為MSC。移動(dòng)用戶從MSC-A(諾基亞MSC)起呼,切換至2G-MSC-B(濟(jì)南MSC),后續(xù)切換至2G-MSC-B'(華為MSC)。
圖1 后續(xù)切換流程圖
(1)BSC-B向2G-MSC-B發(fā)送切換請(qǐng)求消息HANDOVER REQUIRED,該消息中含有切換類型、原因、源位置信息、目標(biāo)位置區(qū)小區(qū)信息等切換必須的信元。
(2)接收到切換請(qǐng)求消息后,2G-MSC-B根據(jù)查詢所得到的目的位置區(qū)小區(qū)的位置,確定本次切換是局間切換,向2G-MSC-A發(fā)送后續(xù)切換請(qǐng)求MAP_PREPARE_SUBSEQUENT_HANDOVER_REQ消息,該消息中包含了目標(biāo)MSC的ID、目的位置區(qū)小區(qū)等信息,2G-MSC-A收到消息后,查詢消息中所攜帶的目的位置區(qū)小區(qū)的位置。
(3)2G-MSC-A根據(jù)目的MSC的ID判斷本次切換是后續(xù)切回還是后續(xù)切換到第三方。通過查表確定本次切換為后續(xù)切換到第三方,發(fā)送MAP_PREPARE_HANDOVER_REQ消息,示意2G-MSC-B'進(jìn)行切換前準(zhǔn)備工作,在該消息中帶有HANDOVER REQUIRED消息的所有信息。
(4)2G-MSC-B'請(qǐng)求VLR-B為本次切換分配切換號(hào)碼。2G-MSC-B'根據(jù)位置區(qū)小區(qū)號(hào)查詢目的位置區(qū)小區(qū)的位置,確定該小區(qū)屬于本局,然后構(gòu)造切換請(qǐng)求消息HANDOVER REQUEST,發(fā)送給目標(biāo)BSC-B',請(qǐng)求為本次切換分配無線資源。2G-MSC-B'向BSC-B請(qǐng)求無線資源和向VLR-B'請(qǐng)求切換號(hào)碼是并行的,2G-MSC-B'只有在收到這兩個(gè)請(qǐng)求的回復(fù)后,才會(huì)向2G-MSC-A回復(fù)消息。
(5)BSC-B'分配好無線資源,對(duì)2G-MSC-B'回復(fù)HANDOVER REQUEST ACKNOWLEDGE消息。
(6)VLR-B'分配好切換號(hào)碼后,2G-MSC-B'向2G-MSC-A發(fā)送MAP_PREPARE_HANDOVER_RSP消息,通知2GMSC-A切換準(zhǔn)備完成。該消息中含有切換號(hào)碼,2G-MSC-A可以通過該號(hào)碼實(shí)現(xiàn)到2G-MSC-B'的話路路由。
(7)2G-MSC-A對(duì)切換號(hào)碼做分析,進(jìn)行出局選路,選路成功后,則發(fā)送IAM消息到2G-MSC-B'。
(8)2G-MSC-B'對(duì)IAM消息中攜帶的號(hào)碼進(jìn)行被叫號(hào)碼分析,確認(rèn)是切換號(hào)碼,則通知VLR-B'釋放切換號(hào)碼。該消息可以在2G-MSC-B'收到IAM消息后的任何時(shí)間發(fā)送。同時(shí)2G-MSC-B'對(duì)2G-MSC-A返回ACM(Address Complete Message)消息。
(9)2G-MSC-A 發(fā)送 MAP_PREPARE_SUBSEQUENT_HANDOVER_RSP消息,通知2G-MSC-B后續(xù)切換準(zhǔn)備完成。
(10)2G-MSC-B發(fā)送HANDOVER COMMAND消息給BSC-B,通知MS可以發(fā)送切換了。
(11)BSC-B'檢測到正確的MS后,向2G-MSC-B'發(fā)送HANDOVER DETECT消息。此時(shí)MS已經(jīng)檢測到新的無線信道,并且具備接入的條件,但尚未真正切入,對(duì)于語音切換,必須要建立話路。
(12)2G-MSC-B'通過 MAP_PROCESS_ACCESS_SIGNALLING消息將HANDOVER DETECT消息透傳給2GMSC-A,2G-MSC-A收到該消息后,請(qǐng)求在MGW-A的上下文中改變端點(diǎn)間的流方向,并進(jìn)行內(nèi)部接網(wǎng)。
(13)新的話路已經(jīng)建立,用戶繼續(xù)通話或進(jìn)行其他業(yè)務(wù),BSC-B'向2G-MSC-B'發(fā)送HANDOVER COMPLETE消息上報(bào)切換完成。
(14)2G-MSC-B'通過MAP_SEND_END_SIGNAL_REQ消息將HANDOVER COMPLETE消息透傳給2G-MSC-A,通知2G-MSC-A切換已經(jīng)完成。
(15)2G-MSC-B'向 2G-MSC-A 發(fā)送 ANM(Answer Message)消息,切換完成。該消息沒有實(shí)際意義,其目的是為了和局間中繼信令保持一致。
(16)2G-MSC-A 向 2G-MSC-B 發(fā)送 REL(Release)消息,通知釋放局間切換時(shí)建立的局間電路。
(17)2G-MSC-A向 2G-MSC-B發(fā)送 MAP_SEND_END_SIGNAL_RSP消息,釋放局間切換時(shí)占用的MAP(Mobile Application Part)資源。
(18)2G-MSC-B對(duì)BSC-B發(fā)送CLEAR COMMAND消息,通知其釋放資源。
(19)BSC-B釋放完地面資源和無線資源后,對(duì)2G-MSCB回復(fù)CLEAR COMPLETE消息。
(20)通話結(jié)束,2G-MSC-A向2G-MSC-B'發(fā)送REL消息,釋放呼叫以及局間電路。
(21)2G-MSC-A 向 2G-MSC-B'發(fā)送 MAP_SEND_END_SIGNAL_RSP消息,釋放局間MAP資源。
3.5.1 信令分析
綜合信令儀測試手機(jī)的數(shù)據(jù)分析,得出以下結(jié)論:
(1)華為MSC作為主控MSC時(shí),沒有收到上海諾基亞MSC發(fā)送的切換檢測消息(HO_DETECT);
(2)諾基亞MSC作為主控MSC時(shí),也沒有收到上海華為MSC發(fā)送的切換檢測消息(HO_DETECT),而華為MSC沒有發(fā)該消息,是因?yàn)闆]有收到鄭徐BSC發(fā)送的切換檢測消息HO_DETECT消息;
(3)從三接口檢測數(shù)據(jù)看,濟(jì)南BSC沒有發(fā)HandOver Command給BTS,因此可以很自然的推測出:濟(jì)南收到上?;氐摹扒袚Q響應(yīng)”消息后,BSC沒有將“切換命令”下發(fā)給ATP,導(dǎo)致ATP沒有在上海的小區(qū)下發(fā)送“HO ACCESS”消息,上海側(cè)網(wǎng)元等待消息超時(shí),拆除切換流程,切換失敗。
因此,定位問題的關(guān)鍵節(jié)點(diǎn)在濟(jì)南MSC和BSS之間。
3.5.2 故障定位
對(duì)接入新MSC后4天內(nèi)所有C3降級(jí)車次的信令進(jìn)行逐一分析,發(fā)現(xiàn)華為MSC從收到濟(jì)南切換請(qǐng)求,到往濟(jì)南方向發(fā)出切換響應(yīng)消息,至少需要1.4 s以上(不含到武漢到濟(jì)南的回程傳輸時(shí)間以及武漢STP和濟(jì)南MSC的消息處理時(shí)間),同時(shí)降級(jí)車次的切換響應(yīng)時(shí)長基本在1.5 s以上,如表2所示。
根據(jù)切換成功與失敗的相應(yīng)時(shí)間對(duì)比,初步判斷列車跨局切換降級(jí)的原因?yàn)闈?jì)南京滬高BSC的T7計(jì)時(shí)器配置[5-7]存在問題,并結(jié)合接口檢測看到的切換執(zhí)行時(shí)長數(shù)據(jù)中,切換失敗的時(shí)長都大于2 s,可能導(dǎo)致濟(jì)南局京滬高BSC T7計(jì)時(shí)器超時(shí)。
3.5.3 BSC T7定時(shí)器參數(shù)說明
T7計(jì)時(shí)器在流程中的起止位置:出BSC切換時(shí),BSC上報(bào)切換請(qǐng)求消息后,T7定時(shí)器啟動(dòng);在T7定時(shí)器超時(shí)前,如果BSC收到切換請(qǐng)求應(yīng)答消息,T7定時(shí)器停止;T7定時(shí)器超時(shí)后,BSC進(jìn)行出BSC切換失敗處理。其位置如圖2所示。
該定時(shí)器設(shè)置過長,可能會(huì)浪費(fèi)信道資源,造成擁塞;該定時(shí)器設(shè)置過短,可能會(huì)影響切換成功率。根據(jù)不同設(shè)備廠家提供的產(chǎn)品手冊(cè)顯示,華為BSC,T7定時(shí)器默認(rèn)值為10 s,無需修改。而諾西BSC設(shè)備其產(chǎn)品手冊(cè)中有如下描述,“特別在MSC之間切換時(shí),等待HO CMD消息的時(shí)間可能超過3 s”,因此跨MSC切換時(shí)建議該值設(shè)置不低于3 s,具體值看實(shí)際情況。
表2 切換響應(yīng)時(shí)間對(duì)比
因?yàn)闈?jì)南局核心網(wǎng)京滬高BSC T7定時(shí)器的設(shè)置為2 s,在總公司通信中心指導(dǎo)下,濟(jì)南局將濟(jì)南京滬高BSC T7定時(shí)器設(shè)定為3.5 s后,經(jīng)過5天的驗(yàn)證,鄭徐高鐵線跨MSC切換時(shí)未再發(fā)生C3降級(jí)。
本次故障的定位主要通過截取E口、A口信令,深入分析局間切換流程、后續(xù)切換流程、MSC局間消息傳遞流程以及信令中的異常環(huán)節(jié),最終定位列車C3故障原因?yàn)闈?jì)南局BSC的T7計(jì)時(shí)器設(shè)置過短導(dǎo)致。同時(shí)通過對(duì)此次故障處置,發(fā)現(xiàn)對(duì)于跨3個(gè)不同廠家的MSC切換場景,如果BSC T7定時(shí)器設(shè)定為2 s過短,會(huì)導(dǎo)致一部分車次由于T7定時(shí)器超時(shí),BSC即使收到了切換命令(HandOver Command)也將其丟棄而不處理,導(dǎo)致后續(xù)的切換流程無法繼續(xù)執(zhí)行,從而導(dǎo)致切換失敗。通過對(duì)此類故障的排查流程,以及處置措施,對(duì)今后的日常維護(hù)工作具有一定的指導(dǎo)意義。
圖2 T7計(jì)時(shí)器在流程中的起止位置