劉克清,周俊,李世光,戴鵬程
(中國移動通信集團(tuán)設(shè)計院有限公司,北京 100080)
VoLTE語音業(yè)務(wù)由LTE網(wǎng)絡(luò)負(fù)責(zé)語音多媒體業(yè)務(wù)的承載,IMS網(wǎng)絡(luò)負(fù)責(zé)業(yè)務(wù)控制,網(wǎng)元眾多結(jié)構(gòu)復(fù)雜。網(wǎng)絡(luò)建設(shè)涉及到電路域、分組域、IMS域多個網(wǎng)元的設(shè)備改造升級。用于實現(xiàn)VoLTE呼叫建立、控制、終止的流程復(fù)雜網(wǎng)元多,僅通過分析空口信令很難定位VoLTE語音業(yè)務(wù)出現(xiàn)的掉話未接通等問題。隨著核心網(wǎng)大數(shù)據(jù)處理能力的提升,我們有了獲取規(guī)范化核心網(wǎng)關(guān)鍵信息的途徑,具備了進(jìn)行端到端數(shù)據(jù)分析的終端、核心網(wǎng)數(shù)據(jù)來源。本文主要闡述了將空口信令與EPC核心網(wǎng)、IMS核心網(wǎng)多接口信令關(guān)聯(lián)分析的方法,并列舉了通過端到端數(shù)據(jù)關(guān)聯(lián)定位問題的案例。
目前《中國移動統(tǒng)一DPI設(shè)備技術(shù)規(guī)范》已經(jīng)明確了將VoLTE呼叫所涉及的S1-MME、S6a、S11、Gm、Mw、ISC、Cx、Gx、Rx多接口海量信令進(jìn)行關(guān)鍵信息提取并合成XDR數(shù)據(jù)要求,為了實現(xiàn)終端數(shù)據(jù)與核心網(wǎng)數(shù)據(jù)的關(guān)聯(lián),其前提條件是從終端側(cè)記錄的全量信令中提取關(guān)鍵信息合成為“UE XDR”。 “UE XDR”的格式以統(tǒng)一DPI規(guī)范中的字段定義為藍(lán)本,增加與UE相關(guān)的特有信息,同時終端側(cè)可以記錄的數(shù)據(jù)囊括了統(tǒng)一DPI規(guī)范中Uu、S1-MME、Mw等多個接口涉及的過程,“UE XDR”數(shù)據(jù)具有多接口多協(xié)議類型的特點(diǎn)。為了能夠更加詳細(xì)的記錄用于分析掉話未接通原因的關(guān)鍵信息,將VoLTE終端數(shù)據(jù)呼叫過程涉及的不同協(xié)議和信令過程進(jìn)行細(xì)化,分別合成“UE_CALL”、“UE_LTE_UU_NAS”、“UE_LTE_UU_RRC”3個XDR;另外,終端還可以生成特有的“UE_LOCATION”XDR,合成終端的位置信息,并用于后續(xù)與其它業(yè)務(wù)XDR的關(guān)聯(lián),實現(xiàn)所有業(yè)務(wù)XDR的位置定位?!癠E_CALL”主要記錄呼叫過程的結(jié)果(包含正常掛機(jī)、掉話、未接通),出現(xiàn)該呼叫結(jié)果時的網(wǎng)絡(luò)制式、服務(wù)小區(qū)ID、異常釋放的原因值,這些信息可以為分析問題提供比較準(zhǔn)確的指導(dǎo);PROCEDURE_STATUS字段內(nèi)容在中國移動統(tǒng)一DPI設(shè)備技術(shù)規(guī)范的基礎(chǔ)上,專門為終端數(shù)據(jù)進(jìn)行擴(kuò)展設(shè)計,其進(jìn)程狀態(tài)中的“路測文件結(jié)束”以終端文件出現(xiàn)結(jié)束標(biāo)簽觸發(fā),此狀態(tài)是針對終端數(shù)據(jù)的特點(diǎn)進(jìn)行特殊標(biāo)記,當(dāng)出現(xiàn)該狀態(tài)時會結(jié)束對核心網(wǎng)側(cè)后續(xù)數(shù)據(jù)的關(guān)聯(lián);掉話狀態(tài)是終端信令狀態(tài)機(jī)的判斷結(jié)果,對于呼叫掉話結(jié)果的判斷終端信令比核心網(wǎng)信令會更加準(zhǔn)確?!癠E XDR”中還增加了“DT_LOG_NAME”字段,用于記錄終端數(shù)據(jù)的文件名,每個呼叫的多接口關(guān)聯(lián)XDR都屬于一對主被叫l(wèi)og,以終端數(shù)據(jù)出發(fā)發(fā)現(xiàn)用戶感知問題,結(jié)合核心網(wǎng)數(shù)據(jù)深度分析定界也是本研究的一個核心思想。主叫號碼從上行SIP INVITE REQUEST消息 中 的 f: 終端與核心網(wǎng)數(shù)據(jù)同步分為兩個層面,一個是以終端每呼叫為單位進(jìn)行時間同步,用于判斷掉話未接通的原因;一個是以XDR過程開始信令和XDR過程結(jié)束信令為單位進(jìn)行時間同步,用于進(jìn)行端到端XDR過程回放查看。 每呼叫同步是利用主叫號碼、被叫號碼和呼叫開始時間3個參數(shù)進(jìn)行計算,如圖1所示。終端測試中主被叫號碼在每次呼叫基本相同,每次呼叫的間隔固定,測試終端與核心網(wǎng)系統(tǒng)都與NTP時鐘同步,兩者的時間差很小。通過將UE_CALL XDR中的主被叫號碼與核心網(wǎng)XDR中的主被叫號碼匹配找到相應(yīng)數(shù)據(jù),然后查找核心網(wǎng)起呼時間與終端呼叫起呼時間的前后固定時間范圍內(nèi)的記錄,實現(xiàn)終端與核心網(wǎng)每呼叫的端到端數(shù)據(jù)關(guān)聯(lián)。 圖1 每呼叫同步算法示意 信令同步是利用下行SIP信令或NAS信令可以經(jīng)過核心網(wǎng)透傳到終端的特點(diǎn),將其作為同步信令,再將核心網(wǎng)信令以同步信令時間為基礎(chǔ)進(jìn)行調(diào)整實現(xiàn)的,如表1所示。計算步驟有3個:由于同步信令均為下行信令,核心網(wǎng)信令時間應(yīng)早于終端信令,因此調(diào)整核心網(wǎng)同步信令時間為終端同步信令時間減1 ms;計算核心網(wǎng)同步信令調(diào)整前后時間差;記錄上述時間差,作為核心網(wǎng)后續(xù)所有信令時間調(diào)整偏移量,直到下一條下行SIP、NAS信令出現(xiàn)。 表1 信令同步時間調(diào)整舉例 多數(shù)據(jù)源關(guān)聯(lián)用于XDR中部分字段的回填。一類是同協(xié)議不同XDR過程參數(shù)回填,另外一類是跨協(xié)議的XDR過程參數(shù)回填。 根據(jù)中國移動統(tǒng)一DPI設(shè)備技術(shù)規(guī)范定義,NAS單協(xié)議生成的XDR中包含了MME_GROUP_ID、MME_CODE、TMSI等信息,但不是所有NAS層過程均包含上述參數(shù)。對于不包含這些參數(shù)的過程,根據(jù)過程的先后順序,可將XDR過程信令中能夠提取到的參數(shù)關(guān)聯(lián)回填到其它XDR過程中,從而達(dá)到在同層XDR中實現(xiàn)參數(shù)回填的目的。 對于NAS協(xié)議生成的XDR中還包含CELL_ID等參數(shù),而NAS中的所有信令均不包含任何服務(wù)小區(qū)信息。在RRC層相關(guān)過程中,包含了服務(wù)小區(qū)信息,例如系統(tǒng)消息1。根據(jù)NAS過程和RRC過程的先后順序,將RRC層相關(guān)XDR中的服務(wù)小區(qū)信息關(guān)聯(lián)回填到NAS層相關(guān)的XDR中,從而達(dá)到在NAS層XDR中實現(xiàn)參數(shù)回填的目的。 掉話未接通問題的結(jié)果由終端信令狀態(tài)機(jī)判斷,在UE_CALL XDR的PROCEDURE_STATUS字段中輸出,而原因自動定位以終端測試數(shù)據(jù)的每呼叫關(guān)聯(lián)數(shù)據(jù)為單位進(jìn)行判斷,主要過程包括4個步驟:判斷UE_CALL XDR中的呼叫結(jié)果是否為正常;判斷是否有核心網(wǎng)數(shù)據(jù);遍歷呼叫過程涉及的所有接口的XDR是否有異常結(jié)束;取得離起呼時間最近的異常結(jié)束對應(yīng)的XDR進(jìn)程、原因大類、原因小類作為本次呼叫的故障原因。判斷流程圖如圖2所示。 原因大類的判斷方法包括如下。 (1)S1-MME XDR中的cause_type字段取值(非默認(rèn)值),取值為0時,原因大類為“無線網(wǎng)異?!?;取值為1時,原因大類為“傳輸異?!保蝗≈禐?時,原因大類為“NAS異?!?;取值為3時,原因大類為“協(xié)議異?!?;取值為4時,原因大類為“其它異?!?。 (2)S10 XDR異常時,原因大類為“核心網(wǎng)異?!?。 (3)S11 XDR異常時,原因大類為“核心網(wǎng)異常”。 (4)S6a XDR異常時,原因大類為“核心網(wǎng)異?!薄?/p> (5)UE_MR、Uu_RRC XDR進(jìn)程異常時,原因大類為“無線網(wǎng)異?!薄?/p> 圖2 判斷流程圖 圖3 終端信令流程說明 (6)不滿足上述條件時,原因大類為“原因未知”。 原因小類的判斷主要根據(jù)各個接口XDR中異常進(jìn)程的cause字段取值歸類。 以終端側(cè)發(fā)生的一次未接通為例,從VoLTE起呼、RRC連接建立進(jìn)程UE完成SRB1、SRB2和DRB無線資源配置、TRACK區(qū)更新均正常情況下終端收到網(wǎng)絡(luò)側(cè)下發(fā)的SIP INVITE消息,SIP狀態(tài)碼是503 Service Unavailable。該未接通單純從終端信令中無法挖掘其深層次原因。具體信令過程如圖3所示。 但是當(dāng)結(jié)合核心網(wǎng)S1-MME和S11口信令就可以發(fā)現(xiàn),該問題的出現(xiàn)在IMS核心網(wǎng)下發(fā)SIP 503(Warning:Media Bearer Lost)給終端之前,就已經(jīng)在S1-MME接口的E-RAB建立過程中有所體現(xiàn),如圖4所示。按照規(guī)范流程當(dāng)IMS核心網(wǎng)收到INVITE REQUEST消息后會回復(fù)TRYING消息給終端,并向PCRF查詢策略信息;由PCRF通知SGW創(chuàng)建專用承載,SGW會通過S11接口下發(fā)CREATE BEARER REQUEST消息到MME,MME再通過S1-MME接口的E-RAB SETUP REQUEST攜帶Activate Dedicated EPS bearer context request的NAS消息來通知終端建立專用承載并由eNode B分配無線承載信道。但此時終端剛好上報了A3測量報告,造成了eNode B幾乎需要同時處理分配無線承載信道和切換兩件事,在這種情況下,eNode B廠家將切換作為高優(yōu)先級處理事件,而不分配無線承載信道、下發(fā)Activate Dedicated EPS bearer context request消息給終端,并對E-RAB SETUP REQUEST反饋攜帶Radio NetWork:X2 Handover triggered原因的E-RAB SETUP RESPONSE消息,說明此承載未建立。此次承載建立失敗最終導(dǎo)致了IMS網(wǎng)絡(luò)下發(fā)SIP 503(Warning:Media Bearer Lost)造成未接通。如圖5所示,利用端到端自動定位方法可以直接發(fā)現(xiàn)問題所在。 圖4 終端核心網(wǎng)關(guān)聯(lián)信令說明 圖5 端到端問題自動定位結(jié)果 大數(shù)據(jù)分析技術(shù)在網(wǎng)優(yōu)工作中的應(yīng)用是當(dāng)今非常重要研究方向。海量核心網(wǎng)數(shù)據(jù)為我們提供宏觀的網(wǎng)絡(luò)質(zhì)量指標(biāo)的同時,對大數(shù)據(jù)中出現(xiàn)異常問題進(jìn)行深入的分析挖掘進(jìn)而定位原因并解決問題也是一個關(guān)鍵環(huán)節(jié)。隨著統(tǒng)一DPI技術(shù)的不斷完善,核心網(wǎng)XDR數(shù)據(jù)完整性準(zhǔn)確性的提升,端到端問題自動定位方法的應(yīng)用也會越來越廣泛。本方法也開創(chuàng)了真正端到端數(shù)據(jù)分析的先河。 [1] 中國移動統(tǒng)一DPI設(shè)備技術(shù)規(guī)范-LTE信令采集解析服務(wù)器接口規(guī)范-v2.3. [2] 中國移動統(tǒng)一DPI設(shè)備技術(shù)規(guī)范-LTE數(shù)據(jù)合成服務(wù)器接口規(guī)范v2.2.4. [3] 劉克清. LTE軟采信令標(biāo)準(zhǔn)化及無線網(wǎng)絡(luò)優(yōu)化方法[J]. 移動通信, 2015(8). [4] 周俊. 基于LTE信令大數(shù)據(jù)的網(wǎng)絡(luò)質(zhì)量評估體系研究[J]. 互聯(lián)網(wǎng)天地, 2015(3).1.2 多數(shù)據(jù)源同步
1.3 多數(shù)據(jù)源關(guān)聯(lián)
2 問題自動定位方法
3 案例分析
4 結(jié)束語