朱玉峰,黃耀軍,唐子民
(中國移動通信集團公司廣東有限公司深圳分公司,深圳 518048)
VoLTE是基于LTE網(wǎng)絡為用戶提供高質量語音業(yè)務的技術,作為國內運營商應對OTT挑戰(zhàn)的關鍵技術,對運營商的戰(zhàn)略轉型有著不同尋常的意義。隨著各大運營商對VoLTE的快速部署,VoLTE網(wǎng)絡已經初具規(guī)模,但由于新技術的復雜性以及建設部署中的不確定性,當前VoLTE網(wǎng)絡建設中如何保障網(wǎng)絡的健壯性,快速定位故障原因、搶通業(yè)務依然是網(wǎng)絡運維工作中面臨的巨大挑戰(zhàn),首先了解一下VoLTE現(xiàn)網(wǎng)組網(wǎng)方案及容災機制原理。
VoLTE容災范圍包括EPC、CS和IMS 3個網(wǎng)絡域。其中,EPC域包括MME、S/P-GW、PCRF;CS域包括MSS、MGCF;IMS域包括SBC、ISBG、VoLTE AS,其拓撲結構如圖1所示。
圖1 VoLTE網(wǎng)絡拓撲
當IMS網(wǎng)絡中某個網(wǎng)元故障后,通過采用容災倒換機制,使網(wǎng)絡中其它同類網(wǎng)元接管故障網(wǎng)元的業(yè)務,在這個過程中可能會造成一定的業(yè)務損失,因此需要對容災倒換產生的用戶體驗提出要求。
當IMS網(wǎng)絡中某個網(wǎng)元故障恢復并承載業(yè)務后,通過采用容災倒回機制,使網(wǎng)絡中一定范圍內同類網(wǎng)元的部分業(yè)務快速遷移至這個網(wǎng)元上,因此需要對容災倒回可遷移的業(yè)務量和所需時長提出要求。
IMS域中使用SIP協(xié)議通信的網(wǎng)元的故障檢測基于SIP協(xié)議的OPTIONS消息,使用此故障檢測方式的IMS網(wǎng)元包括VoLTE SBC、I-CSCF、S-CSCF、MGCF、VoLTE AS(TAS、SCC AS)。IMS域 其 它網(wǎng)元采用各自原有故障檢測方式,此處不贅述。適用于Mw、ISC、Mg等接口網(wǎng)元。
IMS域故障檢測流程如圖2所示。
圖2 IMS域故障檢測流程
步驟1:源節(jié)點網(wǎng)元發(fā)送至目的節(jié)點網(wǎng)元的REGISTER、INVITE、MESSAGE等SIP消息。
步驟2:在t1時間內未收到響應,源節(jié)點網(wǎng)元啟動向目的節(jié)點網(wǎng)元的OPTIONS檢測(檢測周期和次數(shù)可配置)。
步驟3:檢測后,未收到目的節(jié)點網(wǎng)元任何響應,判斷目的節(jié)點網(wǎng)元故障,移入黑名單,在檢測到故障恢復之前,任何消息均不發(fā)送至此網(wǎng)元。
步驟4:源節(jié)點網(wǎng)元可選等待t3時間后,啟動OPTIONS檢測(檢測周期和次數(shù)可配置),確定目的節(jié)點網(wǎng)元故障是否已恢復。
步驟5:源節(jié)點網(wǎng)元收到目的節(jié)點網(wǎng)元的200 OK響應。
步驟6:源節(jié)點網(wǎng)元判斷目的節(jié)點網(wǎng)元故障恢復,將其移出黑名單。
目前的IMS容災主要基于OPTIONS信息檢測,實現(xiàn)全網(wǎng)網(wǎng)元級別的容災備份,但是還存在如下不確定因素。
(1)檢測機制可以實現(xiàn)故障網(wǎng)元的快速隔離,對于非注冊類網(wǎng)元,可以完美實現(xiàn)業(yè)務的快速容災切換;對于保存用戶信息的注冊類網(wǎng)元,可以保證新注冊用戶業(yè)務正常,但是對于已注冊用戶,如無主動操作,可能會影響用戶的被叫業(yè)務,如SBC類網(wǎng)元。
(2)假活場景的存在,導致網(wǎng)元可以正常響應OPTIONS消息,但是無法正常提供業(yè)務,容災檢測機制失效,需要通過人工干預實現(xiàn)隔離。
(3)IMS網(wǎng)絡路由高度依賴ENS的地址解析翻譯,ENS故障可能會導致整個IMS網(wǎng)絡的癱瘓,考慮到網(wǎng)元的重要性,需要增加ENS網(wǎng)元的容災備份冗余度。
綜上,考慮到以上存在的問題和因素,容災機制還存在缺陷和不足,一旦檢測機制無法生效,鑒于VoLTE網(wǎng)絡的復雜性,大大增加了故障定位的難度和業(yè)務搶通的時間,嚴重影響用戶業(yè)務感知?;谝陨显?,我們對VoLTE業(yè)務流程研究和梳理,提出了一種利用CS網(wǎng)絡在業(yè)務層面實現(xiàn)VoLTE網(wǎng)絡容災的方案。
VoLTE注冊:VoLTE用戶使用VoLTE終端在EPC、IMS網(wǎng)絡完成附著和注冊,為后續(xù)呼叫等IMS多媒體業(yè)務提供基礎。VoLTE注冊完成后EPC網(wǎng)絡建立IMS信令缺省承載通道,用戶獲取IMS網(wǎng)絡P-CSCF地址,P-CSCF、S-CSCF 均保存用戶信息。
圖3 VoLTE呼叫及被叫錨定流程
錨定:為了保證用戶業(yè)務一致性,VoLTE用戶的業(yè)務處理需要錨定到IMS域處理。由于主叫補充業(yè)務相對較少,中國移動采用“主叫不錨定,被叫錨定”的方案,即VoLTE用戶作為被叫一定要經過IMS域處理,特別是主叫從CS網(wǎng)絡發(fā)起呼叫時。具體業(yè)務流程如圖3所示。
(1) VoLTE用戶正常主叫呼叫流程是通過EPC網(wǎng)絡進入本地IMS網(wǎng)絡,通過在SAEGW上關閉IMS APN的方式,可以將主叫呼叫流通過CSFB方式流入本地CS網(wǎng)絡,實現(xiàn)這部分用戶主叫業(yè)務的容災。
(2) VoLTE用戶做被叫,主叫用戶起呼于CS網(wǎng)絡,被叫呼叫流進入IMS網(wǎng)絡是通過被叫錨定進入IMS網(wǎng)絡,通過關閉被叫錨定可以使被叫流程不再經過IMS域處理,實現(xiàn)容災。
(3) 通過以上兩種方式,關閉進入IMS核心網(wǎng)的兩個入口,實現(xiàn)將VoLTE用戶切換回CS網(wǎng)絡,主被叫都不再經過IMS域處理,具體如圖4所示。
2017年3月,某地運營商部分客戶無法正常撥打接聽電話,提示“用戶正忙”,故障位置不集中,客服引導投訴用戶通過短信取消VoLTE功能后,用戶主被叫通話恢復正常;投訴量迅速增加,故障矛頭直指VoLTE網(wǎng)絡,由于故障位置不集中,且網(wǎng)元運行無明顯異常,維護人員無法在短時間內定位故障原因,此時為保障用戶正常通話,啟動強制用戶CSFB方案,操作實施10min內迅速恢復用戶語音業(yè)務,取得了很好的業(yè)務搶通效果。
圖4 容災原理圖
CSFB容災方案實現(xiàn)了極端情況下通過CS網(wǎng)絡對IMS業(yè)務的快速容災,能有效阻斷本地PS網(wǎng)絡和CS網(wǎng)絡語音呼叫流,達到了提升VoLTE業(yè)務運維能力和用戶業(yè)務感知的目的。但是不可否認的是,本方案也還存在一些不足,如無法實現(xiàn)異地VoLTE用戶呼叫本地VoLTE用戶的業(yè)務搶通。VoLTE 的建設還需要更多更深入的研究,各類用戶體驗還需要不斷地提升和優(yōu)化,此文旨在拋磚引玉,借此問題的分析,希望能夠為網(wǎng)絡運維能力的提升提供一種新的思考方式和角度。
[1] 3GPP TS 24.228 V5.15.0. Signalling flows for the IP multimedia call control based on Session Initiation Protocol (SIP) and Session Description Protocol (SDP)[S]. 2006.
[2] 3GPP TS 23.272.Circuit Switched (CS) Fallback in Evolved Packet System (EPS); Stage 2[Z]. 2009.
[3] 3GPP TS 23.228 V12.4.0. IP Multimedia Subsystem (IMS)[S].2014.
[4] 王辰, 李志鋒, 劉鈞. 基于IMS的VoLTE語音業(yè)務實現(xiàn)方案的研究及優(yōu)化[J]. 電信技術, 2015(1):86-89.
[5] 趙訓威, 林輝, 張明. 3GPP長期演迸(LTE)系統(tǒng)架構與技術規(guī)范[M]. 北京: 人民郵電出版社, 2010.
[6] 劉英橋,朱鋒,潘偉堅. VoLTE用戶呼叫特服號碼感知問題研究及解決方案[J]. 電信工程技術與標準化,2017(1).