陳 旻,姚賽彬,李 凌,黃久成
(中國聯(lián)通上海分公司,上海200080)
隨著4G網(wǎng)絡(luò)快速發(fā)展和智能手機的普及,實時在線手機游戲越來越受到人們的追捧,用戶因游戲使用體驗問題對現(xiàn)網(wǎng)的訴求也越來越多。王者榮耀作為市面上關(guān)注度、用戶數(shù)均最高的一款實時對戰(zhàn)游戲,通過對其分析可為用戶體驗提升及重點業(yè)務(wù)的端到端優(yōu)化提供參考,以便形成針對重點業(yè)務(wù)的端到端網(wǎng)絡(luò)問題定位及優(yōu)化解決方案,指導(dǎo)運營商開展針對具體業(yè)務(wù)質(zhì)量的速率優(yōu)化工作。
傳統(tǒng)的KPI+DT/CQT的管控手段在面對越來越多的APP智能應(yīng)用已經(jīng)顯得越來越力不從心,用戶的真實的KQI使用感知無法完全通過傳統(tǒng)的管控手段進行管控承接。因此本文基于現(xiàn)有話統(tǒng)、MR、卡頓清單等數(shù)據(jù)對王者榮耀游戲卡頓特征進行系統(tǒng)化的關(guān)聯(lián)分析,并形成一套針對重點業(yè)務(wù)的端到端分析優(yōu)化方法。
啟動過程,客戶端通過DNS域名解析獲得王者榮耀游戲服務(wù)器的IP地址,建立TCP連接,進行數(shù)據(jù)交互啟動游戲。
在實時對戰(zhàn)的過程中,客戶端與服務(wù)器間主要有2個交互連接,一個為TCP連接,一個為UDP連接。
游戲客戶端與服務(wù)器之間建立一個TCP長連接,由終端發(fā)起,通過這個TCP長連接進行心跳和其他信息交互,用以確認服務(wù)器狀態(tài)正常,心跳間隔3 s,消息大小固定,流程如圖1所示。
圖1 TCP長連接建立流程
客戶端和服務(wù)器之間交互的報文,除了TCP長連接報文以外,還有大量的UDP報文,主要有如下2類。
a)上行UDP報文:客戶端通過上行UDP報文將玩家所做的操作上報給服務(wù)器。
b)下行UDP報文:服務(wù)器匯總參加對戰(zhàn)的所有玩家的操作,通過下行UDP報文廣播給參加對戰(zhàn)的所有玩家的客戶端。
據(jù)騰訊消息,王者榮耀采用的同步機制為幀同步(非狀態(tài)同步),主要流程如圖2所示。
a)玩家上報操作。
b)服務(wù)器收集各玩家上報的各自操作,進行匯總,以固定的時間間隔(例如60 ms)向參加對戰(zhàn)的各玩家廣播所有玩家的操作。
c)各客戶端接收到廣播,知道了所有玩家的操作,按照相同的游戲邏輯進行運算,得到相同的結(jié)果,呈現(xiàn)在游戲界面上。
通過上述幀同步機制,基本可以保證參加對戰(zhàn)的各玩家游戲步調(diào)是一致的,即游戲玩家間的顯示基本是相同的(因為網(wǎng)絡(luò)時延的不同會略有差異)。
目前已知信息:5v5對戰(zhàn)場景下,廣播間隔60 ms,報文大小不超過460 B。
對游戲進行中的報文進行分析:
報文大?。鹤钚?8 B,最大313 B,平均190.8 B,分布如圖3所示。
圖2 幀同步流程
圖3 廣播報文大小分布示意圖
發(fā)包頻率:按時間對每秒的下行UDP報文個數(shù)進行統(tǒng)計,發(fā)現(xiàn)有3個臺階:16個/s、32個/s、48個/s。王者榮耀服務(wù)器每隔60 ms廣播一次,每次廣播的報文個數(shù)不同,有的場景每次廣播1個報文,有的場景每次2個報文,還有的場景每次3個報文。
a)16個/s:發(fā)包間隔基本是60 ms,每次發(fā)1個包,個別有發(fā)2個包的。
b)32個/s:發(fā)包間隔基本是60 ms,每次發(fā)2個包。c)48個/s:發(fā)包間隔基本是60 ms,每次發(fā)3個。
大部分報文大小都是140 B,少量為68 B。操作上報報文的個數(shù)與玩家所做的操作有關(guān),操作越頻繁,操作上報報文個數(shù)越多。
客戶端游戲操作與界面顯示是通過UDP數(shù)據(jù)流與服務(wù)器進行交互的。
a)下行UDP廣播報文約66 ms一組(每秒16組),每組報文個數(shù)不定(服務(wù)器有糾錯機制,從已有終端抓包看每組可達3個報文),每個報文大小不定(從已有終端抓包看最小68 B,最大313 B,平均190.8 B)。因此可粗略計算下行速率需求為:16×3包×200 B約80 kbit/s。
b)終端上行UDP發(fā)包一般為140 B,但由于無固定發(fā)包周期,因此采用騰訊反饋的數(shù)據(jù)計算:平均4 000 B/s,峰值8 000 B/s。即估算上行速率需:64 kbit/s。
另外,客戶端游戲登錄是采用TCP連接,并且游戲交互過程中保持TCP長連接通過心跳包(3 s間隔)來檢測用戶是否在線。
a)采樣范圍:對手機客戶端對局進行信息采集,包括時延、信號格數(shù)、終端IMEI、經(jīng)緯度、ENBID、CELLID。
b)采集方式:信號格數(shù)、經(jīng)緯度、ENBID、CELLID在每局游戲開始前采集一次。
c)時延采集:在游戲中每5 s采集一次。
如圖4所示,通過終端右上角時延顯示,表征相關(guān)時延體驗情況。
a)100 ms以下,流暢。
b)100~200 ms,一般。
c)200~460 ms,體驗不好。
圖4 終端時延顯示示意圖
d)460 ms以上,服務(wù)器視為丟包,不處理。
依據(jù)高時延(200 ms+)的采樣點的比例定義卡頓,具體為:
a)無卡頓:200 ms以上的采樣點比例低于3%。
b)輕微卡頓:200 ms以上的采樣點比例大于3%,低于5%。
c)一般卡頓:200 ms以上的采樣點比例大于5%,低于10%。
d)較嚴重卡頓:200 ms以上的采樣點比例大于10%,低于15%。
e)嚴重卡頓:200 ms以上的采樣點比例大于15%。
游戲時延的影響主要為容量、覆蓋、下行質(zhì)差、上行干擾、終端問題、服務(wù)器問題、漫游用戶等因素導(dǎo)致。
容量及上行干擾的影響,建議依據(jù)現(xiàn)網(wǎng)的實際話統(tǒng)數(shù)據(jù)及卡頓比例進行擬合分析確定標準門限。數(shù)據(jù)擬合采用話統(tǒng)基于用戶數(shù)小區(qū)自忙時數(shù)據(jù),按騰訊通報的周時間,獲取一周用戶數(shù)自忙時周均值指標。
用戶數(shù)或PRB利用率高是導(dǎo)致空口管道容量受限的主要因素,利用騰訊通報的小區(qū)卡頓比例與話統(tǒng)平均用戶數(shù)和下行PRB利用率進行數(shù)據(jù)擬合,結(jié)果如圖5所示。
中國聯(lián)通目前按照卡頓比例7%的比例判定嚴重卡頓小區(qū),但根據(jù)實際擬合情況來看,上海市各個參數(shù)段的平均卡頓率很難達到7%的程度,因此建議按照卡頓比例3%進行數(shù)據(jù)擬合,可得出以下結(jié)論。
a)隨著用戶數(shù)的增加,卡頓率呈線性上升趨勢,且用戶數(shù)超過210個時,卡頓率超過3%。
b)隨著下行PRB利用率的增長,卡頓率呈線性上升趨勢,且PRB利用率超過87%時,卡頓率超過3%。
與容量數(shù)據(jù)擬合方式相同,針對話統(tǒng)上行干擾與卡頓比例進行數(shù)據(jù)擬合,結(jié)果如圖6所示。
按照卡頓比例3%進行數(shù)據(jù)擬合,可得出以下結(jié)論:卡頓率隨著上行干擾的增加而加大,當卡頓率在3%時,上行干擾值為-93 dBm。
將王者榮耀平均卡頓率與話統(tǒng)上行MCS和上行IBLER進行數(shù)據(jù)擬合,結(jié)果如圖7所示。
按照卡頓比例3%進行數(shù)據(jù)擬合,可得出以下結(jié)論。
a)卡頓率隨上行MCS的減小而增加,當平均上行MCS小于5.5時,卡頓率大于3%。
b)卡頓率隨上行IBLER的增加而增加,當上行IBLER大于24%時,卡頓率大于3%。
圖5 平均用戶數(shù)、下行PRB利用率與卡頓率的數(shù)據(jù)擬合結(jié)果
圖6 上行干擾與卡頓率的數(shù)據(jù)擬合結(jié)果
將王者榮耀平均卡頓率與話統(tǒng)下行MCS和下行IBLER進行數(shù)據(jù)擬合,結(jié)果如圖8所示。
按照卡頓比例3%進行數(shù)據(jù)擬合,可得出以下結(jié)論。
a)卡頓率隨下行MCS的減小而增加,當平均下行MCS小于5.5時,卡頓率大于3%。
b)卡頓率隨下行IBLER的增加而增加,當下行IBLER大于26.5%時,卡頓率大于3%。
將王者榮耀平均卡頓率與話統(tǒng)倒流次數(shù)進行數(shù)據(jù)擬合,結(jié)果如圖9所示。
按照卡頓比例3%進行數(shù)據(jù)擬合,可得出以下結(jié)論:卡頓率隨倒流次數(shù)增加而逐漸增加,但本次擬合未發(fā)現(xiàn)卡頓率超過3%的判斷門限,但當?shù)沽鞔螖?shù)大于600時,卡頓率陡增,暫定門限為倒流次數(shù)大于600次。
將王者榮耀平均卡頓率與話統(tǒng)TA>2 km進行數(shù)據(jù)擬合,結(jié)果如圖10所示。
圖7 上行MCS、上行IBLER與卡頓率的數(shù)據(jù)擬合結(jié)果
按照卡頓比例3%進行數(shù)據(jù)擬合,可得出以下結(jié)論:卡頓率隨TA>2 km比例增加而增加,當TA>2 km比例大于46%時,卡頓率超過3%。
圖8 下行MCS、下行IBLER與卡頓率的數(shù)據(jù)擬合結(jié)果
圖10 平均卡頓率與話統(tǒng)TA>2 km比例數(shù)據(jù)擬合結(jié)果
圖11 平均卡頓率與無鄰區(qū)導(dǎo)致無法切換的數(shù)據(jù)擬合結(jié)果
將王者榮耀平均卡頓率與無鄰區(qū)導(dǎo)致無法切換進行數(shù)據(jù)擬合,結(jié)果如圖11所示。
按照卡頓比例3%進行數(shù)據(jù)擬合,可得出以下結(jié)論:卡頓率隨無鄰區(qū)導(dǎo)致無法切換次數(shù)增加而增加,當無鄰區(qū)導(dǎo)致無法切換次數(shù)大于4 000時,卡頓率超過3%。
對游戲業(yè)務(wù)進行端到端問題分析,主要從3段進行問題分類:空口、傳輸和上游(見圖12)。
a)空口排查。主要針對覆蓋、干擾、容量、策略配置、小帶寬站點、故障告警等進行排查。排查前需結(jié)合前面數(shù)據(jù)定標分析,找出本地網(wǎng)容量、干擾等門限標準。影響王者榮耀感知的空口問題主要由容量、弱覆蓋、過覆蓋、上行干擾、切換、重疊覆蓋等引起。
b)傳輸排查。根據(jù)IPRAN和基站的對應(yīng)關(guān)系,將基站的卡頓情況匯聚至IPRAN,找出高卡頓IPRAN,剔除無線側(cè)問題后,定位問題IPRAN,然后Ping包定位具體問題。
c)上游排查(核心網(wǎng)及以上)。在沒有明確的服務(wù)器等問題的情況下,上游的排查需根據(jù)本地網(wǎng)對比進行。
圖12 端到端問題分析
具體分析思路如圖13所示。
圖13 問題分析排查思路
表1給出了幾種常見問題的解決方案。
對于精細化的優(yōu)化,可參考下面小節(jié)完成本地網(wǎng)分析。
表1 幾種常見問題的解決方案
5.2.1 擴容方案
鎖定有效擴容需求。
a)多用戶小流量:小區(qū)忙時平均流量≥8 GB。
b)單用戶高流量:小區(qū)忙時平均RRC連接用戶數(shù)≥100。
制定分場景差異化閾值。
a)針對口碑場景:對應(yīng)下行PRB利用率>24%。
b)針對普通場景:對應(yīng)下行PRB利用率>50%。
優(yōu)化多用戶并發(fā)調(diào)度。用戶并發(fā)時長:PRB滿調(diào)度占比>10%。
5.2.2 干擾排查
a)外部干擾:指直放站、互調(diào)、阻塞等外部干擾源導(dǎo)致。
b)鄰站干擾:與鄰小區(qū)的用戶數(shù)或PRB利用率呈明顯的同升同降趨勢。
對于“鄰站干擾”的鄰小區(qū),若用戶數(shù)或PRB利用率高,可以將其納入擴容清單;若不滿足高條件,則需要降低本小區(qū)和鄰小區(qū)間的重疊區(qū)域或調(diào)整方位角。
5.2.3 小帶寬小區(qū)
需要將5 MHz或10 MHz小區(qū)擴容至20 MHz,若短期內(nèi)無法擴容,需要進行負載均衡調(diào)整。
5.2.4 覆蓋收縮方案
對于過覆蓋、上行干擾、弱覆蓋小區(qū),可能由于邊緣用戶的分布導(dǎo)致卡頓的產(chǎn)生,因此可以采取收縮覆蓋的方式進行優(yōu)化。
方案實施時需連片進行,實施后可能會影響用戶數(shù)和流量指標,需密切觀測。
收縮覆蓋的方案主要是調(diào)整互操作參數(shù),原則為:2G/3G/4G互操作門限同升,避免4G門限抬升后,2G/3G不變情況下產(chǎn)生乒乓問題。
5.2.5 鄰區(qū)優(yōu)化(ANR受控模式)
由于現(xiàn)網(wǎng)可能存在偽基站,因此直接開啟free模式ANR可能導(dǎo)致切換成功率的下降,因此需開啟受控ANR。受控ANR在U2000上顯示需要License支持(ENB側(cè)無需License)。
5.2.6 參數(shù)優(yōu)化方案
a)通過用戶識別調(diào)速、提升上行增益、增加預(yù)調(diào)度等方法進行參數(shù)優(yōu)化;關(guān)閉DRX,降低時延。
b)SRI發(fā)送門限調(diào)整,對于高負荷場景下無效。
c)其他參數(shù)參考CQI及速率優(yōu)化參數(shù)執(zhí)行,且該參數(shù)與基線相同,也可按基線參數(shù)直接核查。
5.2.7 單向CA策略
對于大小帶寬組合的CA,由于小帶寬很容易下行PPRB利用率高,且SCELL用戶數(shù)多,導(dǎo)致卡頓擁塞,因此建議在大小帶寬組合CA的場景,開啟單向CA,即為:小帶寬(PCELL)+大帶寬(SCELL)方式,關(guān)閉大帶寬(PCELL)+小帶寬(SCELL)方式。如20 MHz+5 MHz組合,僅開啟5 MHz作為PCELL的組合CA方式。
5.2.8 室分單雙流核查
現(xiàn)網(wǎng)可能存在室分小區(qū)配置為2T2R,但實際通道為1T1R的場景,需要對此類場景進行核查,核查方式需結(jié)合現(xiàn)網(wǎng)小區(qū)配置及現(xiàn)場勘測或設(shè)計圖紙對比完成。
本文通過對王者榮耀游戲進行端到端用戶體驗分析,找出游戲中不同階段影響用戶感知的因素,對影響用戶感知的因素進行差異化分析并提出相應(yīng)的解決措施,建立了一套王者榮耀體驗提升解決方案,并且結(jié)合實際感知和理論基礎(chǔ)找出了一套針對王者榮耀的感知,在各網(wǎng)元進行排查及優(yōu)化分析方法,為后續(xù)其他端到端業(yè)務(wù)的的優(yōu)化與處理提供了優(yōu)化指導(dǎo)意見。
作者簡介:
陳旻,畢業(yè)于上海市東華大學(xué),本科,主要從事重點場景管控、重要活動保障、重點業(yè)務(wù)優(yōu)化等工作;姚賽彬,畢業(yè)于上海交通大學(xué),碩士,主要從事無線網(wǎng)絡(luò)規(guī)劃、優(yōu)化、性能監(jiān)測,新技術(shù)研究等工作;李凌,畢業(yè)于重慶郵電大學(xué),學(xué)士,主要從事無線網(wǎng)絡(luò)優(yōu)化,KPI+、自動化、大數(shù)據(jù)網(wǎng)優(yōu)等系統(tǒng)性網(wǎng)優(yōu)能力研究等工作;黃久成,畢業(yè)于華中科技大學(xué),學(xué)士,主要從事高速、高架、高鐵、地鐵優(yōu)化、語音業(yè)務(wù)專項優(yōu)化、NB-IoT網(wǎng)絡(luò)優(yōu)化和專項研究、5G研究等工作。