甘從海,尚長順
GSM-R(GSM for Railways)系統(tǒng)是專門為鐵路通信設(shè)計(jì)的綜合專用數(shù)字移動(dòng)通信系統(tǒng)。它主要提供無線列調(diào)、編組調(diào)車通信、區(qū)段養(yǎng)護(hù)維修作業(yè)通信、應(yīng)急通信、隧道通信等語音通信功能,可為列車自動(dòng)控制與檢測(cè)信息提供數(shù)據(jù)傳輸通道,并可提供列車自動(dòng)尋址和旅客服務(wù)。
隨著鐵路建設(shè)規(guī)模的不斷擴(kuò)大,鐵路通信的安全可靠性日趨重要。由于移動(dòng)交換機(jī)在鐵路網(wǎng)絡(luò)中的特殊地位,它往往覆蓋較大范圍的多條線路,當(dāng)出現(xiàn)重大災(zāi)難情況時(shí),如人為操作失誤、設(shè)備故障、自然災(zāi)害等,移動(dòng)交換機(jī)的故障可能會(huì)導(dǎo)致大范圍的業(yè)務(wù)中斷,嚴(yán)重影響多條鐵路線的運(yùn)營安全。因此,核心網(wǎng)必須具備熱備份的容災(zāi)(Disaster Tolerance)能力,以確保網(wǎng)絡(luò)的安全性和可靠性。
軟交換GSM-R 移動(dòng)通信網(wǎng)與傳統(tǒng)GSM-R 移動(dòng)通信網(wǎng)的主要區(qū)別在于軟交換GSM-R 核心網(wǎng)引入了控制和承載分離的軟交換架構(gòu),將傳統(tǒng)網(wǎng)絡(luò)中的MSC(移動(dòng)交換中心)分離成MSC Server 和MGW(多媒體網(wǎng)關(guān)),其中MSC 服務(wù)器負(fù)責(zé)信令處理、路由和業(yè)務(wù);MGW 負(fù)責(zé)媒體流處理。軟交換GSM-R 移動(dòng)通信網(wǎng)絡(luò)組網(wǎng)示意圖略。
在給出容災(zāi)的定義之前,有必要先給出災(zāi)難的定義。從一個(gè)信息系統(tǒng)的角度講,一切引起系統(tǒng)非正常停機(jī)的事件都可以稱為災(zāi)難。大致可以分為3種類型:(1)自然災(zāi)害,包括地震、火災(zāi)、洪水、雷電等;(2)設(shè)備故障,包括系統(tǒng)的CPU、硬盤等損壞,電源中斷以及網(wǎng)絡(luò)故障等;(3)人為操作破壞,包括誤操作、人為蓄意破壞等。
容災(zāi)就是在上述災(zāi)難發(fā)生時(shí),在保證生產(chǎn)系統(tǒng)的數(shù)據(jù)盡量少丟失的情況下,保持系統(tǒng)的業(yè)務(wù)不間斷地運(yùn)行。
現(xiàn)在工業(yè)界都以數(shù)據(jù)丟失量和系統(tǒng)恢復(fù)時(shí)間作為標(biāo)準(zhǔn),對(duì)某個(gè)容災(zāi)系統(tǒng)進(jìn)行評(píng)價(jià),公認(rèn)的評(píng)價(jià)標(biāo)準(zhǔn)是RPO(Recovery Point Objective)和RTO(Recovery Time Objective)。
RPO:恢復(fù)點(diǎn)目標(biāo),以時(shí)間為單位,即在災(zāi)難發(fā)生時(shí),系統(tǒng)和數(shù)據(jù)必須恢復(fù)到的時(shí)間點(diǎn)要求。RPO 標(biāo)志系統(tǒng)能夠容忍的最大數(shù)據(jù)丟失量。系統(tǒng)容忍丟失的數(shù)據(jù)量越小,RPO 的值越小。
RTO:恢復(fù)時(shí)間目標(biāo),以時(shí)間為單位,即在災(zāi)難發(fā)生后,信息系統(tǒng)或業(yè)務(wù)功能從停止到必須恢復(fù)的時(shí)間要求。RTO 標(biāo)志系統(tǒng)能夠容忍的服務(wù)停止的最長時(shí)間。系統(tǒng)服務(wù)的緊迫性要求越高,RTO的值越小。
傳統(tǒng)的GSM-R MSC 組網(wǎng)模式下,1 個(gè)BSC(基站控制器)只能和1 個(gè)MSC 相連,因此當(dāng)1 個(gè)BSC到MSC 的話務(wù)擁塞并不能將擁塞的話務(wù)疏導(dǎo)到其他MSC 下,可能造成話務(wù)擁阻甚至癱機(jī)。
軟交換GSM-R MSC 容災(zāi)采用MSC 雙歸屬方式。MSC 雙歸屬是指MGW 與一個(gè)以上的MSC Server 連接,平常注冊(cè)到一個(gè)MSC Server 上,當(dāng)該MSC Server 故障后,MGW 會(huì)自動(dòng)注冊(cè)到另外一個(gè)MSC Server 上。一個(gè)MSC Server 也可以控制多個(gè)MGW。不同的MSC Server 和MGW 可以放置在不同的地域,以實(shí)現(xiàn)異地容災(zāi)備份。
MSC 雙歸屬可以采用以下3 種不同的模式:
(1)1+1 主備用模式。2 個(gè)MSC Server,一個(gè)承擔(dān)所有的業(yè)務(wù),而另一個(gè)不承擔(dān)業(yè)務(wù)。數(shù)據(jù)備份鏈路用來實(shí)時(shí)同步主備MSC Server 之間的數(shù)據(jù)配置、用戶數(shù)據(jù)等。心跳鏈路用來檢測(cè)配對(duì)的MSC Server 是否正常,以便判斷是否倒換。
(2)1+1 負(fù)荷分擔(dān)模式。在該模式下,2 個(gè)MSC Server 各自都承擔(dān)部分業(yè)務(wù)。正常情況下,MGW1 注冊(cè)到MSC Server1,MGW2 注冊(cè)到MSC Server2,BSC1 連接到MSC Server1,BSC2 連接到MSC Server2。如果MSC Server1 故障,則業(yè)務(wù)按如下路徑進(jìn)行處理:BSC1→MGW1→MSC Server2,BSC2→MGW2→MSC Server2。該方式下2 個(gè)MSC Server 應(yīng)盡量異地安裝。
(3)N+1 備份模式。在該模式下,一個(gè)MSC Server 作為另外N 個(gè)MSC Server 的備份,這個(gè)備份MSC Server 平時(shí)不承擔(dān)業(yè)務(wù),只有當(dāng)另外N 個(gè)MSC Server 其中之一故障時(shí),才承擔(dān)故障MSC Server 的業(yè)務(wù)。
在GSM-R 網(wǎng)絡(luò)中,由于網(wǎng)絡(luò)容量不大,目前開通的軟交換MSC 只采用了1+1 主備用方式。相比1+1 負(fù)荷分擔(dān)模式,該方式的優(yōu)點(diǎn)是邏輯上只有一個(gè)MSC,減少了維護(hù)的復(fù)雜度,避免了MSC間的切換。缺點(diǎn)是抗自然災(zāi)害能力差。
為了保證GSM-R 核心網(wǎng)的安全可靠,必須對(duì)其容災(zāi)能力進(jìn)行測(cè)試。在成都、太原、沈陽等鐵路局,對(duì)軟交換GSM-R MSC 核心網(wǎng)進(jìn)行了不同項(xiàng)目的測(cè)試,具體方法如下:
(1)主用/備用MSC Server 數(shù)據(jù)同步測(cè)試。在主用MSC Server 新開一些測(cè)試中繼鏈路進(jìn)行大話務(wù)量測(cè)試,通過人機(jī)命令進(jìn)行MSC Server 切換,檢查備用MSC Server 數(shù)據(jù)與主用MSC Server 數(shù)據(jù)是否一致,記錄PRO。確認(rèn)大話務(wù)量測(cè)試是否正常。
(2)1+1 主備用方式(MSC Server 故障)測(cè)試。采用軟件退出服務(wù)或強(qiáng)制斷電方式使主用的MSC Server 處于故障狀態(tài),檢查正在進(jìn)行的通話是否中斷,可否立即建立新的呼叫。從不能立即建立呼叫記錄到可建立呼叫的時(shí)間作為恢復(fù)時(shí)間目標(biāo)RTO。
(3)1+1 負(fù)荷分擔(dān)方式(MSC Server 故障)測(cè)試。采用軟件退出服務(wù)或強(qiáng)制斷電方式使MSC Server1 處于故障狀態(tài),檢查正在進(jìn)行的通話是否中斷,可否立即建立新的呼叫?;謴?fù)MSC Server1,待從網(wǎng)管上確認(rèn)系統(tǒng)恢復(fù)正常之后,再使MSC Server2 處于故障狀態(tài),檢查正在進(jìn)行的通話是否中斷,可否立即建立新的呼叫。該方式下應(yīng)不影響立即建立新的呼叫,否則可判為未滿足 MSC SERVER 負(fù)荷分擔(dān)方式。
(4)MGW 負(fù)荷分擔(dān)測(cè)試。采用分別斷開MGW1 或MGW2 與MSC Server1 的鏈路,使其中的一個(gè)MGW 工作,進(jìn)行各種呼叫撥測(cè),如MS(移動(dòng)臺(tái))?MS,MS?FAS(鐵路調(diào)度系統(tǒng))用戶,MS?PSTN(公共電話交換網(wǎng))用戶,保證2 個(gè)MGW 單獨(dú)工作時(shí)均能進(jìn)行各種呼叫。否則可判為未滿足MGW 負(fù)荷分擔(dān)方式。
在實(shí)際測(cè)試中發(fā)現(xiàn)有些設(shè)備主用/備用MSC Server 數(shù)據(jù)同步功能不完善,需要人工對(duì)2 個(gè)MSC Server 同時(shí)操作,若只對(duì)其中的一個(gè)MSC Server操作,就會(huì)造成數(shù)據(jù)不同步。1+1 主備用方式也會(huì)造成系統(tǒng)全局業(yè)務(wù)中斷數(shù)分鐘,在目前尚未實(shí)現(xiàn)不影響業(yè)務(wù)完成主/備MSC Server 倒換。