李金生
【摘 要】為了提升終端與網(wǎng)絡交互問題分析及定位的效率,提出了基于終端側(cè)感知異常事件智能動態(tài)采集,并結(jié)合網(wǎng)絡側(cè)信令進行聯(lián)合溯源定位問題的方法。通過在終端上安裝異常事件采集APP,自動采集終端側(cè)關鍵參數(shù),在關鍵參數(shù)偏離正常范圍時觸發(fā)感知異常事件并動態(tài)擴展參數(shù)采集范圍,從而為問題定位提供更多有效的終端側(cè)網(wǎng)絡環(huán)境信息,并結(jié)合網(wǎng)絡側(cè)信令,從端到端角度提升問題分析定位的效率。
【關鍵詞】異常事件 終端與網(wǎng)絡交互 問題定位
1 引言
隨著智能手機普及程度的不斷提升,越來越多的人熱衷于利用手機上網(wǎng)進行社交以及購物等,這些新型的用戶行為對網(wǎng)絡的傳輸速率及數(shù)據(jù)傳輸?shù)姆€(wěn)定性要求越來越高。與此同時,運營商網(wǎng)絡容量和資源利用方式面臨的壓力劇增[1],終端方面也每天都有各種影響感知的異常事件出現(xiàn),比如信號強度弱、應用異常退出等。由于涉及的業(yè)務鏈長,終端與網(wǎng)絡交互存在的問題定位難度變大。
為了提升終端與網(wǎng)絡交互問題分析及定位的效率,本文提出了基于終端側(cè)智能動態(tài)采集感知異常事件,并結(jié)合網(wǎng)絡側(cè)信令進行聯(lián)合溯源定位的方法。
2 目前針對終端與網(wǎng)絡交互問題的解決
方案
對于如何及時發(fā)現(xiàn)客戶在使用網(wǎng)絡業(yè)務過程中出現(xiàn)的終端與網(wǎng)絡交互問題并進行解決,主要存在如下3種方法:
(1)客戶投訴記錄挖掘[2]:通過采集人工客服收到的投訴工單,并按照投訴的時間、地點、投訴內(nèi)容、終端類型等維度進行深入的挖掘分析,找出與終端相關的具備共性的投訴案例并進行撥測驗證。
該方法優(yōu)點是能準確界定問題所在,缺點是通過客戶投訴記錄來挖掘終端問題無法先于用戶發(fā)現(xiàn),具有滯后性。
(2)人工遍歷測試[3]:使用疑似存在問題的智能終端實體,按照預設的測試用例,在現(xiàn)網(wǎng)進行大量的測試,最后匯總其中測試不通過的用例及終端,進行二次確認和排障。
終端撥測驗證法能主動地先于客戶投訴發(fā)現(xiàn)終端存在的問題,但消耗資源極高,對于目前現(xiàn)網(wǎng)龐大的終端數(shù)量,幾乎不可能進行完備的測試。
(3)基于網(wǎng)絡側(cè)信令進行聚類挖掘[4]:此方法難以實現(xiàn)對終端側(cè)與網(wǎng)絡側(cè)異常事件的精準定位與分析,網(wǎng)絡側(cè)無法采集與分析還沒有到達網(wǎng)絡的數(shù)據(jù),例如由于終端側(cè)原因產(chǎn)生的業(yè)務失敗、終端本身的性能下降等。
3 基于異常事件機制的分析定位方法
異常事件是指客戶在使用智能移動終端的過程中,信號覆蓋、語音業(yè)務、數(shù)據(jù)業(yè)務、終端性能、APP等方面的相關參數(shù)偏離正常范圍,導致用戶使用感知下降,甚至無法正常使用業(yè)務的情況[5]。
本文提出一種基于異常事件動態(tài)采集的終端與網(wǎng)絡交互問題分析定位方法:對于安裝有終端異常事件統(tǒng)計APP的智能手機用戶,當用戶終端發(fā)生異常事件時,APP會動態(tài)智能擴展采集范圍,從該異常事件的核心定義參數(shù)擴展到終端側(cè)環(huán)境數(shù)據(jù),包括用戶維度數(shù)據(jù)(用戶標識號、APP標識號和系統(tǒng)版本號等);時間維度數(shù)據(jù)(異常事件采集時間點、間隔等);空間維度數(shù)據(jù)(異常事件發(fā)生的小區(qū)號等)。然后,終端側(cè)采集APP將異常事件核心定義參數(shù)與環(huán)境參數(shù)發(fā)送回后臺系統(tǒng)。最后,通過異常事件環(huán)境構建,聯(lián)合異常事件前后一段時間與鄰近地區(qū)的參數(shù),對發(fā)現(xiàn)問題的情景進行復現(xiàn)和回放,協(xié)助問題的分析定位。處理機制的主要工作流程如圖1所示:
圖1 異常事件采集及分析流程
下文將對異常事件采集及分析的關鍵步驟進行分析闡述。
3.1 采集終端關鍵參數(shù),觸發(fā)異常事件
首先在終端上安裝異常事件統(tǒng)計APP,運行該APP后,可以從信號覆蓋、數(shù)據(jù)業(yè)務、終端性能和終端應用4個維度對手機終端的關鍵指標參數(shù)進行日常監(jiān)控,自動提取手機終端異常事件核心參數(shù)[6],并與正常值進行對比,從而判斷是否發(fā)生異常事件。
3.2 智能動態(tài)擴展參數(shù)采集范圍
(1)采集機制
當終端異常事件統(tǒng)計APP采集到核心參數(shù)異常(即發(fā)生異常事件)時,觸發(fā)智能動態(tài)參數(shù)采集:基于時間軸,動態(tài)調(diào)整采集頻率與采集內(nèi)容,智能擴展終端側(cè)及網(wǎng)絡側(cè)參數(shù)采集范圍,自動采集異常事件發(fā)生時刻前后一段時間內(nèi)、異常事件發(fā)生地點鄰近小區(qū)等的環(huán)境參數(shù),如小區(qū)號、經(jīng)緯度、采集時刻等,并將數(shù)據(jù)傳送至系統(tǒng)后臺,重構終端異常事件發(fā)生環(huán)境及情景[7],進行異常事件分析。參數(shù)采集動態(tài)擴展原理如圖2所示。
(2)動態(tài)采集算法
使用基于時間序列的預測[8]進行關鍵指標的動態(tài)采集。通過對時間序列的關鍵指標進行分析,掌握關鍵指標隨時間變化的規(guī)律,從而動態(tài)決策外延指標的采集范疇。
由于終端客戶感知與終端所處的無線網(wǎng)絡環(huán)境息息相關,因此選取信號強度作為指標動態(tài)采集的關鍵參考指標,并對信號強度的時間序列使用加權移動平均法進行預測。算法包含如下4個步驟:
1)以一定的時間間隔采集用戶所處網(wǎng)絡的信號強度時間序列:S1, S2, …, SN;
2)以N為移動的時間段,使用簡單移動平均數(shù)的計算方法得出預測值Mt,如公式(1)所示:
(1)
3)考慮各期數(shù)據(jù)的重要性,對近期數(shù)據(jù)給予較大的權值,遠期數(shù)據(jù)給予較小的權值,將預測值改良為加權移動平均數(shù)Mtw,如公式(2)所示:
(2)
4)根據(jù)信號強度的預測值Mtw,動態(tài)決策信號類、數(shù)據(jù)類、應用類、終端類四大類共50多個具體指標的采集,以達到在滿足異常事件溯源分析的前提下,節(jié)省采集APP待機時資源消耗的目的。
3.3 異常事件環(huán)境構建與情景復現(xiàn)
通過終端異常事件統(tǒng)計APP采集到了終端異常事件擴展數(shù)據(jù),包括基于時間軸前后一段時間的終端、網(wǎng)絡與業(yè)務參數(shù)指標,如終端本身(CPU內(nèi)存利用率、界面交互等)、終端與網(wǎng)絡交互(小區(qū)、信號強度、制式、速率、語音數(shù)據(jù)掉線率等)[9]、終端與業(yè)務平臺(平臺連通性、時延等)等方面的指標。然后根據(jù)這些指標,對發(fā)現(xiàn)問題的情景進行復現(xiàn)和回放[10],協(xié)助問題的分析定位。endprint
(1)根據(jù)終端異常事件統(tǒng)計APP采集的參數(shù),結(jié)合網(wǎng)絡側(cè)信令參數(shù),展示、構建異常事件發(fā)生時間前后的空間場景與全時間流程,網(wǎng)絡側(cè)輔助參數(shù)包括HLR(Home Location Register,歸屬位置寄存器)用戶簽約數(shù)據(jù)、話音及數(shù)據(jù)網(wǎng)絡留存的控制面和媒體面信令等數(shù)據(jù)。終端側(cè)與網(wǎng)絡側(cè)信令的關聯(lián)示例如圖3所示:
圖3 終端側(cè)與網(wǎng)絡側(cè)信令的關聯(lián)示例
(2)結(jié)合終端側(cè)參數(shù)與網(wǎng)絡側(cè)信令數(shù)據(jù),形成完備分析工具,判斷檢測結(jié)果,得出初步分析結(jié)論。如圖3所示,終端進入弱信號覆蓋區(qū)域,從網(wǎng)絡信令上看,終端一直在TD-SCDMA和GSM網(wǎng)絡之間不停選擇,但信號強度均達不到穩(wěn)定在一種網(wǎng)絡下,此時獲取到的網(wǎng)絡制式、LAC、CI均會有錯位,終端側(cè)APP的判斷“2G弱覆蓋”符合預期。
3.4 異常事件聚類分析與定位
在3.3節(jié)的基礎上,根據(jù)幾個場景分類,分析異常事件發(fā)生時的各項指標,具體流程如下:
(1)導出異常事件,從終端、小區(qū)等維度進行聚類分析,對于在終端維度的異常事件,從網(wǎng)絡制式、用戶維度進行聚類分析。
(2)根據(jù)場景分類,確定各場景流程環(huán)節(jié)中的重點指標參數(shù)并進行分析,如上網(wǎng)場景中的PDP(Packet Data Protocol,包數(shù)據(jù)協(xié)議)激活成功率,終端異常場景中的終端配置等,輔助問題定位分析。
(3)結(jié)合網(wǎng)絡側(cè)信令,確認最終問題,將問題派單分發(fā)給下一級運營商或者廠商。
3.5 方案優(yōu)點
本方案具備如下3個方面的優(yōu)點:
(1)分析挖掘效率高:通過對現(xiàn)網(wǎng)用戶的無線覆蓋、網(wǎng)絡互操作、終端行為、應用行為等進行深度數(shù)據(jù)挖掘,可高效快速地定位網(wǎng)絡指標異常和用戶網(wǎng)絡行為異常的終端。
(2)準實時性:實時采集用戶網(wǎng)絡日志,實現(xiàn)感知異常事件發(fā)現(xiàn)時延控制在5分鐘以內(nèi)。
(3)分析成本低:無須使用終端進行撥測,充分利用了現(xiàn)網(wǎng)的用戶作為龐大的虛擬測試群體,因而能節(jié)省人力成本和測試實體機的購買成本。
4 結(jié)束語
本文提出了一種基于終端側(cè)感知異常事件智能動態(tài)采集,對終端與網(wǎng)絡交互問題進行分析定位的方法。通過在終端上安裝異常事件采集APP,自動采集終端關鍵參數(shù),在異常事件發(fā)生后自動觸發(fā)動態(tài)擴展參數(shù)采集范圍,并結(jié)合網(wǎng)絡側(cè)信令對終端及網(wǎng)絡交互環(huán)境進行溯源定位,提升用戶感知異常發(fā)現(xiàn)及定位的效率。
參考文獻:
[1] 樓旭明,孫中原,趙合. 4G時代流量爆發(fā)性增長的實證分析[J]. 價值工程, 2016,35(13): 49-51.
[2] 唐盛濤. 基于數(shù)據(jù)挖掘的運營商客戶投訴分析方法研究[J]. 互聯(lián)網(wǎng)天地, 2016(3): 53-55.
[3] 郭寶. TD主流商務終端的路測與優(yōu)化[J]. 通信世界, 2012(14): 23.
[4] 陳平,宋玉蓉,蔣國平. 基于多維聚類挖掘的異常檢測方法研究[J]. 計算機技術與發(fā)展, 2012,22(7): 136-139.
[5] 趙旺飛,戴罕琦. 基于互聯(lián)網(wǎng)模式的4G網(wǎng)絡感知提升技術研究[J]. 電信快報, 2016(3): 18-21.
[6] 黃斐一,孫立軍,孔繁盛. 基于移動互聯(lián)網(wǎng)手機應用的無線網(wǎng)絡性能采集方案[J]. 廣東通信技術, 2014(4): 2-6.
[7] 莫建林. 基于虛擬終端上下文環(huán)境感知的多終端重構系統(tǒng)和方法: 中國, 103248653 A[P]. 2013-08-14.
[8] 李健,孫廣中,許胤龍. 基于時間序列的預測模型應用與異常檢測[J]. 計算機輔助工程, 2006,15(2): 49-51.
[9] 王凱,姚東升. 無線通信網(wǎng)絡信號質(zhì)量監(jiān)測系統(tǒng): 中國, 1905588 A[P]. 2007-01-31.
[10] 楊理想. 移動通信網(wǎng)絡用戶感知智能分析系統(tǒng):投訴回放和故障重現(xiàn)模塊的研究與開發(fā)[D]. 重慶: 重慶郵電大學, 2013. ★endprint