徐宇輝
(中國移動通信集團廣東有限公司,廣州 510623)
隨著移動互聯(lián)網(wǎng)迅猛發(fā)展和4G網(wǎng)絡(luò)的普及,各類手機應(yīng)用越來越多。對于不同的手機應(yīng)用,互聯(lián)網(wǎng)應(yīng)用提供商有著不同的服務(wù)質(zhì)量(Quality of Service,QoS)需求,視頻類的應(yīng)用強調(diào)降低抖動;手機游戲?qū)崟r類的應(yīng)用強調(diào)減少丟包以及降低網(wǎng)絡(luò)延時。在國際3GPP的標(biāo)準(zhǔn)架構(gòu)當(dāng)中,移動運營商已經(jīng)具備了可供互聯(lián)網(wǎng)調(diào)用的QoS能力開放接口,接受互聯(lián)網(wǎng)發(fā)起的調(diào)用請求并執(zhí)行QoS提升操作,滿足互聯(lián)網(wǎng)應(yīng)用的QoS要求。QoS接口的調(diào)用功能可視作運營商能力開放體系的一種服務(wù),移動運營商可按調(diào)用次數(shù)以及調(diào)用時間向互聯(lián)網(wǎng)應(yīng)用提供商收取費用,形成商業(yè)合作[1]。
但由于QoS提升需求的多樣性,并且運營商的網(wǎng)絡(luò)環(huán)境尤其是無線網(wǎng)絡(luò)資源的變化,造成很多QoS能力調(diào)用并不能達到滿意的效果,甚至增加運營商網(wǎng)絡(luò)負荷。用戶位置不固定,在不同無線小區(qū)位置漫游移動,導(dǎo)致每一個無線小區(qū)內(nèi)有著不同的QoS提升效果。在某些極端情況的小區(qū),能力調(diào)用之后,QoS提升效果可能不理想,甚至?xí)霈F(xiàn)某些用戶感知指標(biāo)下降。在這種情況下,互聯(lián)網(wǎng)應(yīng)用提供商認為運營商提供的該次QoS能力調(diào)用為不合理收費,影響了能力開放業(yè)務(wù)的服務(wù)口碑。
為解決上述問題,本文研究一種基于網(wǎng)絡(luò)狀態(tài)的能力開放方案與流程,最大程度地滿足互聯(lián)網(wǎng)應(yīng)用的保障需求,減少無效或負作用的調(diào)用次數(shù),將QoS提升效果最大化。
在3GPP國際標(biāo)準(zhǔn)中,4G移動網(wǎng)絡(luò)包括核心網(wǎng)與無線網(wǎng),涉及網(wǎng)元主要有eNodeB、MME以及SAEGW。eNodeB主要負責(zé)用戶手機的無線接入以及給用戶手機分配無線帶寬和優(yōu)先級,MME負責(zé)手機的移動會話管理,SAEGW負責(zé)手機流量的路由[2]。
在核心網(wǎng)與無線網(wǎng)的層次之上,移動運營商還部署了PCC設(shè)備(Policy and Charging Control,策略和計費控制),PCC設(shè)備包括PCRF(Policy and Charging Rules Function),SPR(Subscription Profile Repository)以及AAC(Application Access Control)[3]。PCRF對特定套餐、特定用戶、特定業(yè)務(wù)、特定區(qū)域和特定管控參數(shù)等實施訪問管理、網(wǎng)絡(luò)事件上報管理和QoS控制等,建立對上網(wǎng)應(yīng)用和用戶的差異化管理機制,實現(xiàn)網(wǎng)絡(luò)管道能力增值,實現(xiàn)網(wǎng)絡(luò)資源和用戶感知差異化管理;SPR基于用戶顆粒度存儲用戶的策略數(shù)據(jù);AAC負責(zé)充當(dāng)運營商網(wǎng)絡(luò)的對外開放網(wǎng)關(guān),代理來自互聯(lián)網(wǎng)服務(wù)器的請求,并且進行協(xié)議轉(zhuǎn)換,將互聯(lián)網(wǎng)HTTP協(xié)議轉(zhuǎn)化成移動運營商網(wǎng)絡(luò)內(nèi)部可執(zhí)行的Diameter協(xié)議,將請求傳達到網(wǎng)絡(luò)內(nèi)部由核心網(wǎng)與無線網(wǎng)執(zhí)行本次調(diào)用請求。核心網(wǎng)、無線網(wǎng)以及PCC設(shè)備構(gòu)成的網(wǎng)絡(luò)架構(gòu)如圖1所示。
圖1 標(biāo)準(zhǔn)QoS能力調(diào)用的網(wǎng)絡(luò)架構(gòu)
在移動網(wǎng)絡(luò)中,QoS決定某個用戶或某種業(yè)務(wù)的質(zhì)量,由一組參數(shù)所組成,主要QoS參數(shù)描述如表1所示[4]。
表1 移動網(wǎng)絡(luò)QoS參數(shù)描述
運營商QoS能力開放調(diào)用流程包含以下步驟[5]:
(1)用戶手機上的應(yīng)用發(fā)現(xiàn)存在延時與卡頓,發(fā)起QoS能力調(diào)用以提升質(zhì)量,發(fā)送請求到互聯(lián)網(wǎng)服務(wù)器,請求中攜帶了手機IP地址以及手機號碼。
(2)互聯(lián)網(wǎng)應(yīng)用服務(wù)器收到請求之后,根據(jù)用戶手機號碼與手機IP地址,定位手機歸屬的移動運營商網(wǎng)絡(luò),向歸屬運營商網(wǎng)絡(luò)的接口AAC發(fā)送QoS能力調(diào)用,調(diào)用請求中除了手機號碼以及手機IP地址,還含有QoS參數(shù),包括最大帶寬、最小保證帶寬及流量優(yōu)先級等。
(3)AAC收到請求之后,向用戶手機流量承載所在SAEGW和PCRF發(fā)送QoS更新請求,SAEGW、MME以及eNodeB等網(wǎng)元同步執(zhí)行請求,保證流量承載達到QoS參數(shù)要求。
流程的描述如圖2所示[6-7]。
圖2 QoS能力開放調(diào)用的流程
從圖2的流程描述可以看出,從發(fā)起調(diào)用請求,到接受請求再到執(zhí)行請求,都是直接簡單的流程,沒有考慮到請求執(zhí)行的效果與反饋,沒有考慮到根據(jù)手機所在位置的無線網(wǎng)絡(luò)實際狀態(tài)進行準(zhǔn)入判斷。
在實際應(yīng)用中,與某互聯(lián)網(wǎng)應(yīng)用提供商合作,對某款手機實時游戲應(yīng)用進行QoS提升。應(yīng)用提供商于2017年12月發(fā)起了將近200萬次QoS能力調(diào)用請求,發(fā)現(xiàn)調(diào)用后用戶時延發(fā)生了明顯改善,但其中4.5%的人次在調(diào)用后存在2%以上的丟包現(xiàn)象,比調(diào)用之前反而增加了1.5%的人次,其主要原因是由于無線網(wǎng)資源過度緊張,基站為保證實時應(yīng)用的時延和帶寬要求而犧牲了數(shù)據(jù)報文的重傳機制。2%丟包被認為是實時應(yīng)用感知劣化的分界點,事先判斷每次調(diào)用之后是否存在2%丟包的可能并根據(jù)判斷結(jié)果接受或拒絕本次調(diào)用,是移動運營商能力開放業(yè)務(wù)要克服的一個技術(shù)問題。
標(biāo)準(zhǔn)架構(gòu)只考慮了策略的執(zhí)行,并沒有考慮QoS調(diào)用后的效果,調(diào)用效果應(yīng)該以用戶感知為標(biāo)準(zhǔn)。在互聯(lián)網(wǎng)上,用戶感知通過以下三個指標(biāo)來體現(xiàn):丟包、時延以抖動。如果不能達到用戶感知的提升效果,甚至觸發(fā)反效果,將造成用戶反感以及互聯(lián)網(wǎng)應(yīng)用服務(wù)提供商的投訴,無法為移動運營商提供收入。時延、丟包以及抖動的解釋如圖3所示。
圖3 用戶感知指標(biāo)時延、丟包以及抖動的解釋
另外,標(biāo)準(zhǔn)架構(gòu)也無考慮各項無線小區(qū)性能指標(biāo)參數(shù)以及其與用戶感知指標(biāo)的相關(guān)性。在4G網(wǎng)絡(luò)中,無線小區(qū)性能指標(biāo)主要有PRB利用率、CCE利用率以及RRC連接數(shù)。PRB利用率代表無線信道的占有程度,CCE利用率代表無線信令的占有程度,而RRC連接數(shù)代表在線手機數(shù)量。
為解決標(biāo)準(zhǔn)架構(gòu)存在的問題,對以下方面進行增強。
(1)在調(diào)用流程方面,定義兩個階段:網(wǎng)絡(luò)狀態(tài)數(shù)據(jù)訓(xùn)練階段與網(wǎng)絡(luò)狀態(tài)決策應(yīng)用階段。在第一個階段中,AAC將按一定周期收集所轄范圍的網(wǎng)絡(luò)中無線小區(qū)各項性能指標(biāo)(如PRB利用率),手機應(yīng)用也通過接口向AAC上報用戶體驗指標(biāo),如丟包、時延以及抖動等用戶感知數(shù)據(jù);AAC將根據(jù)算法學(xué)習(xí)小區(qū)性能指標(biāo)與用戶體驗指標(biāo)的相關(guān)性。在第二個階段中,AAC將應(yīng)用訓(xùn)練出的相關(guān)性模型,結(jié)合實時的網(wǎng)絡(luò)狀態(tài)指標(biāo)數(shù)據(jù),通過第一階段的模型運算做出對用戶感知的預(yù)測,判斷對QoS的調(diào)用請求準(zhǔn)入或拒絕。為確保模型的應(yīng)用價值,訓(xùn)練階段占用時間,比重應(yīng)該遠小于應(yīng)用階段;但是,必須在某一固定周期內(nèi)分配相應(yīng)的訓(xùn)練時間,重新計算相關(guān)性模型。理由有以下:網(wǎng)絡(luò)中無線小區(qū)的性能參數(shù)跟當(dāng)?shù)匾约爱?dāng)時的業(yè)務(wù)量有較大關(guān)系,如覆蓋車站等交通樞紐的無線網(wǎng)在白天是業(yè)務(wù)量高峰,而覆蓋住宅的無線網(wǎng)絡(luò)在夜晚是業(yè)務(wù)量高峰,不同時段的相關(guān)性模型可能不同;在實際運營中,無線網(wǎng)絡(luò)的網(wǎng)元經(jīng)常進行變更或者割接,如運營商會針對某些無線網(wǎng)絡(luò)基站eNodeB擴充載波板卡或變更基站參數(shù),導(dǎo)致模型進行重新計算。所以在本項目中,安排固定每天兩次的訓(xùn)練階段,每個階段耗時半個小時,確保收集到足夠的樣本計算最新模型。上述兩個階段的劃分如圖4所示。
圖4 兩個階段的劃分
(2)在網(wǎng)絡(luò)功能方面,做出以下增強。
1)手機應(yīng)用增加探測、收集以及上傳用戶感知數(shù)據(jù)的能力。由于手機應(yīng)用是上行用戶流量的起始點與下行用戶流量終止點,其收集的用戶感知數(shù)據(jù)是最準(zhǔn)確的。一般來說,探測手段包括手機應(yīng)用采用UDP PING或者ICMP PING,根據(jù)每條發(fā)送報文以及收到回應(yīng)報文的時間點來計算延時、抖動和丟包。
2)運營商的AAC增加收集網(wǎng)絡(luò)無線小區(qū)性能數(shù)據(jù)的能力,從運營商網(wǎng)絡(luò)管理系統(tǒng)獲取按短周期時間顆粒度的無線小區(qū)指標(biāo)數(shù)據(jù)。另外,AAC還必須增加接受手機應(yīng)用上傳的用戶感知數(shù)據(jù)的能力?;谑占降木W(wǎng)絡(luò)性能數(shù)據(jù)和用戶感知數(shù)據(jù),AAC具備輸出相關(guān)性模型的能力,即能基于學(xué)習(xí)算法發(fā)現(xiàn)兩類數(shù)據(jù)的定量相關(guān)性。最后,基于模型和應(yīng)用階段收集的數(shù)據(jù),AAC必須具備預(yù)測能力,對用戶感知作出預(yù)測,對QoS的調(diào)用請求進行準(zhǔn)入和拒絕。網(wǎng)絡(luò)功能增強后網(wǎng)絡(luò)功能架構(gòu)如圖5所示,網(wǎng)絡(luò)功能架構(gòu)中各網(wǎng)元之間的交互如圖6所示。
為研究PRB利用率等網(wǎng)絡(luò)性能指標(biāo)與用戶感知指標(biāo)的相關(guān)性,在項目實踐過程中,采用三個網(wǎng)絡(luò)性能指標(biāo)作為樣本屬性(即自變量),由于丟包率對于用戶感知影響最大,采用丟包率作為樣本標(biāo)簽(即因變量),并采用多元線性回歸算法研究相關(guān)性。AAC采集數(shù)據(jù)與訓(xùn)練出算法模型之后,采用模型估算出丟包率,在4G移動互聯(lián)網(wǎng)的實時應(yīng)用中,業(yè)務(wù)丟包率2%是門限值,大于等于2%被視為影響用戶感知,將拒絕本次調(diào)用。多元線性回歸的模型見公式(1)。
z=b0+b1x1+b2x2+b3x3+e
(1)
式中:z為丟包率;x1為PRB利用率;x2為CCE利用率;x3為RRC連接數(shù);e為誤差項,b0~b3為PRB利用率等幾個指標(biāo)與丟包率的相關(guān)系數(shù)。
圖5 基于網(wǎng)絡(luò)狀態(tài)的QoS能力開放的功能架構(gòu)
圖6 基于網(wǎng)絡(luò)狀態(tài)的QoS能力開放的調(diào)用流程
將樣本值代入公式(1),得到公式(2)。
……………………………………
(2)
公式(2)的矩陣表達式為公式(3)
Z=BTX+E
(3)
為求得最優(yōu)的B,即相關(guān)系數(shù)b0、b1、b2、b3,采用最小二乘法對損失函數(shù)SE進行擬合,損失函數(shù)見公式(4)。
(4)
將n個丟包率的樣本值zn與n組網(wǎng)絡(luò)指標(biāo)的樣本值代入式(4)中,可求得使損失函數(shù)SE達到最小值的b0、b1、b2以及b3。
在實際應(yīng)用中采用上述架構(gòu)、流程以及模型,采集數(shù)據(jù)樣本值并進行模型運算,發(fā)現(xiàn)用戶感知指標(biāo)丟包率與PRB利用率、CCE利用率以及RRC連接數(shù)呈線性關(guān)系。如PRB利用率越大,用戶在這種小區(qū)內(nèi)發(fā)起調(diào)用后丟包比例越大。丟包率與PRB利用率、CCE利用率以及RRC連接數(shù)之間的線形相關(guān)性如圖7、圖8以及圖9所示。
圖7 PRB利用率與丟包率線性相關(guān)
圖8 CCE利用率與丟包率線性相關(guān)
2017年12月采用標(biāo)準(zhǔn)架構(gòu)與流程后,QoS調(diào)用前后丟包劣化的請求數(shù)占比變化為1.5%,具體數(shù)據(jù)如表2所示。2018年3月在運用基于網(wǎng)絡(luò)狀態(tài)的QoS能力開放架構(gòu)與流程之后,丟包率大于2%的用戶調(diào)用次數(shù)得到了控制與減少,占比變化為-0.06%,具體數(shù)據(jù)見表3。同時,網(wǎng)絡(luò)時延也得到了保證,網(wǎng)絡(luò)時延具體數(shù)據(jù)見表4。由于應(yīng)用新的架構(gòu)與流程,1595次的QoS的請求被拒絕,丟包超過2%的調(diào)用在QoS調(diào)用之后并沒有增加,有效的保證了能力開放業(yè)務(wù)的實際應(yīng)用效果。
圖9 RRC連接數(shù)與丟包率線性相關(guān)
狀態(tài)丟包率<0.2%的請求次數(shù)/次丟包率0.2%~2%的請求次數(shù)/次丟包率≥2%的請求次數(shù)/次丟包率超過2%的請求次數(shù)的占比/%丟包率超過2%明顯劣化的請求次數(shù)占比變化/%調(diào)用前101476641133653.001.50調(diào)用后96759939151024.50
表3 采用基于網(wǎng)絡(luò)狀態(tài)的QoS調(diào)用前后丟包劣化對比
表4 采用標(biāo)準(zhǔn)架構(gòu)與流程時延保證效果 %
在手機應(yīng)用、互聯(lián)網(wǎng)服務(wù)器以及運營商核心網(wǎng)引入網(wǎng)絡(luò)狀態(tài)數(shù)據(jù)的收集、模型運算以及QoS調(diào)用的準(zhǔn)入功能,能有效確保用戶感知指標(biāo),有利于運營商能力開放業(yè)務(wù)的順利開展。本文成果主要以手機游戲為應(yīng)用對象,在移動互聯(lián)網(wǎng)中不同
的應(yīng)用有不同側(cè)重的用戶感知指標(biāo)。在今后工作中,將研究不同的用戶感知指標(biāo)(如時延、抖動)與網(wǎng)絡(luò)性能參數(shù)的相關(guān)模型,進一步擴大應(yīng)用范圍。