陸 威,章 璐,杜 鵬,李立平,史庭祥,楊 立
(1.中興通訊股份有限公司,江蘇 南京 210012;2.移動網(wǎng)絡和移動多媒體技術國家重點實驗室,廣東 深圳 518055)
邊緣計算(Multi-Access Edge Computing,MEC)指在靠近數(shù)據(jù)生成的位置來處理、分析、存儲數(shù)據(jù),從而降低傳輸時延、節(jié)省骨干傳輸網(wǎng)絡帶寬,并帶來數(shù)據(jù)隱私保護和安全性。邊緣計算已在工業(yè)領域獲得大量應用,幫助工廠實現(xiàn)數(shù)字化處理的本地化,用極低的時延保障生產自動化,從而提升生產效率。
當前的邊緣計算技術處在第一階段,屬于靜態(tài)的邊緣處理技術,即終端在小范圍內移動時,本地的邊緣計算節(jié)點能提供低時延、高帶寬的處理[1]。當終端大范圍移動時,邊緣計算服務節(jié)點并未跟隨遷移,導致終端和邊緣計算服務節(jié)點間出現(xiàn)較長的通信路徑,終端產生的數(shù)據(jù)不能被最近的邊緣計算節(jié)點處理,從而不能充分利用邊緣計算的本地化能力。
隨著5G網(wǎng)絡的普及和未來B5G/6G新網(wǎng)絡預研開展,(超)低時延的移動性應用需求越來越多[2],尤其是V2X車聯(lián)網(wǎng)、火車人地通信、元宇宙應用領域、空天地一體化[3],迫切需要解決大范圍移動場景下的邊緣計算網(wǎng)絡問題。實現(xiàn)終端移動時,5G網(wǎng)絡的UPF能跟隨切換,UPF旁的MEC能伴隨UPF切換,讓終端和UPF、MEC間一直保持最短的通信路徑。由于MEC內的應用軟件一般規(guī)模比較大,應用從一個源節(jié)點切換到另一個目標節(jié)點需要較長時間,因此需要采用一些智能技術,預先判斷終端的移動方向,提前完成應用在MEC間的遷移,在終端稍后真正進入新的MEC區(qū)域時,能實時獲得最短路徑的通信體驗。本文從網(wǎng)絡和邊緣計算的智能化角度,介紹解決該問題的若干關鍵技術。
通信網(wǎng)絡和計算技術一直在迭代升級,從固定網(wǎng)絡發(fā)展到移動網(wǎng)絡,解決了移動性問題,從低帶寬高時延的GSM移動網(wǎng)絡發(fā)展到高帶寬低時延的5G移動網(wǎng)絡,解決了移動通信容量、覆蓋、QoS和業(yè)務體驗問題[4]。當前的5G網(wǎng)絡采用MEC技術實現(xiàn)低時延,把UPF和MEC節(jié)點部署在靠近基站側的位置,縮短數(shù)據(jù)報文傳輸路徑,減少路由節(jié)點,從而保障用戶終端獲得低時延高帶寬的業(yè)務交互體驗[2]。這項技術針對企業(yè)園區(qū)等終端小范圍移動的場景,能提供低時延、高帶寬、數(shù)據(jù)隱私保護的高質量業(yè)務,大大提升了生產效率。但在終端大范圍移動的場景下,并不能有效地提供較低時延的業(yè)務體驗。
場景1MEC管轄范圍內的用戶終端發(fā)起業(yè)務請求,但該MEC內沒有該業(yè)務的服務端軟件,需要把業(yè)務請求送到遠端的云內應用軟件進行處理,導致該用戶終端的業(yè)務流經(jīng)過較長的路徑和較多的轉發(fā)節(jié)點,帶來較大的時延。這個問題是MEC大規(guī)模邊緣部署特征帶來的,MEC被部署到邊緣后,節(jié)點數(shù)量非常多,但每節(jié)點內所配置的硬件資源不能太多,如果簡單地為所有MEC節(jié)點增加硬件資源,除了成本高外,還有邊緣機房空間小、電力消耗大等問題。因此在MEC有限的硬件資源中,只能部署適量的應用軟件,無法把云端的所有低時延應用軟件都部署到每個MEC中。當用戶終端移動到某MEC區(qū)域時,不能保證該終端請求的業(yè)務就在本區(qū)域MEC內,即需要解決MEC如何總能為終端提供本地化應用服務的問題。
場景2用戶終端就近接入了5G UPF和MEC,MEC內也部署了該終端請求的業(yè)務軟件。用戶的業(yè)務流量能在最短路徑中處理,獲得極低時延的業(yè)務體驗。后續(xù)用戶終端發(fā)生大范圍移動時,該終端初始連接服務的UPF和MEC并沒有變化,導致終端和UPF之間的通信路徑變長,路由節(jié)點數(shù)變多,最終帶來更大的時延,降低業(yè)務體驗。需要解決終端大范圍移動時,5G核心網(wǎng)能根據(jù)終端最新位置,把UPF遷移到更靠近終端位置的問題。
場景3在解決了場景1和場景2的問題后,UPF能跟隨終端的移動而遷移,從而保障終端和UPF之間的通信路徑最短。但基于現(xiàn)有的5G和MEC技術,UPF切換遷移后,MEC并不能跟隨UPF切換,因此終端移動后,新目標UPF和源服務MEC處在不同區(qū)域,通信路徑變長,仍會帶來較大的時延,影響用戶的低時延體驗,因此需要解決MEC能跟隨UPF的切換而遷移的問題。
根據(jù)3GPP和ETSI對5G網(wǎng)絡和MEC的架構設計[5],5G網(wǎng)絡的用戶面網(wǎng)元UPF盡量下沉到邊緣位置[6],使得用戶終端的IP流量能本地路由,MEC作為邊緣計算節(jié)點,跟隨UPF所在位置進行部署,一些低時延應用可以就近部署到MEC中,一些時間不敏感的業(yè)務可以部署在遠端云中。該部署架構能較好地滿足企業(yè)園區(qū)等固定場所的低時延業(yè)務需求,但在V2X或高鐵衛(wèi)星通信等場景下[7],終端會快速地大范圍移動,導致終端跟源UPF和源MEC之間的通信路徑變長。圖1對現(xiàn)有5G和MEC架構做了智能化增強[8],即在不改變總體部署架構的情況下,通過一些流程和增強功能,解決了前文中提到的問題。
圖1 智能邊緣計算網(wǎng)絡架構和流程Fig.1 Intelligent edge computing network architecture and process
針對場景1問題,采用“MEC-云”智能預加載技術,解決MEC資源有限和低時延應用數(shù)量多之間的矛盾。
針對場景2問題,采用UPF切換遷移技術,解決終端移動后的“終端-UPF”最短路徑問題。
針對場景3問題,采用“MEC-MEC”智能預切換遷移技術,解決終端移動后“終端-UPF-MEC”最短路徑問題。
MEC屬于邊緣輕量級節(jié)點,MEC內的計算、網(wǎng)絡、存儲資源不會配置太多,因此難以同時部署整個云中所有低時延應用軟件??梢圆捎糜嬎銠C中的catch原理,在MEC中動態(tài)緩存最近要用或常用的低時延應用軟件。一般采用兩級緩存架構,MEC的本地內存作為一級緩存,運行正在使用的或者未來數(shù)小時內將要被使用的低時延應用。MEC本地硬盤作為二級緩存,存儲未來幾天內將要被使用的低時延應用。一級緩存和二級緩存的資源有限,MEC需要采用人工智能(Artificial Intelligence,AI)技術根據(jù)終端在MEC間的移動趨勢和不同時間段低時延應用的使用頻率,在一級緩存、二級緩存內動態(tài)地預加載低時延應用軟件。具體流程包括:
① 當終端進入某MEC管轄區(qū)域時,終端向MEC上報該終端已安裝的低時延業(yè)務清單(例如V2X應用)。MEC收到此低時延應用清單后,檢查本地一級緩存是否有這些應用,如果有,結束本流程;反之,MEC檢查本地二級緩存是否有這些應用,如果有,則從二級緩存獲取應用軟件的鏡像,部署到MEC的計算節(jié)點,后續(xù)即可為終端服務。如果有些應用未在二級緩存中查到,MEC向云端請求下載該應用軟件。
② 云端收到MEC的應用下載請求后,向MEC傳送軟件版本。(說明:由于應用軟件大小一般在數(shù)百兆字節(jié)或數(shù)吉字節(jié),軟件版本從云端下載到MEC二級緩存需要數(shù)十分鐘。建議在MEC二級緩存中存放一些常用的低時延應用,提升二級緩存的命中率。)
③ MEC接收應用軟件版本后,存儲在二級緩存中,并實例化部署到MEC的計算節(jié)點中(說明:應用軟件一般有兩種實現(xiàn)方式:基于虛擬機的方式[9],或者基于容器的方式。由于容器應用的部署一般在數(shù)十秒內完成,而虛機應用的部署需要數(shù)十分鐘才能完成,因此建議低時延應用盡量采用容器技術[10])。
5G的端到端網(wǎng)絡和計算架構包括:終端、5G基站、5G媒體面網(wǎng)元UPF、邊緣節(jié)點MEC和云端[11]。其中UPF是終端IP會話連接的錨點,終端和5G網(wǎng)絡之間的IP路徑長度取決于終端和UPF的位置。終端具有移動的特點,尤其在車聯(lián)網(wǎng)和高鐵旅途的場景中,終端會發(fā)生快速地大范圍移動。如果終端移動了,UPF不能及時跟隨切換遷移到最近的UPF,終端和UPF之間的路徑會變長。3GPP標準已針對IP會話及業(yè)務連續(xù)性(Session and Service Continuity,SSC)問題定義了3種連續(xù)性管理模式[12]。但這些模式只解決了終端切換的業(yè)務連續(xù)性問題,并沒有解決終端移動后一直保持最短IP路徑的問題。需要通過UPF智能預切換技術增強,具體如下:
SSC模式一PDU會話建立時選擇的PDU會話錨點UPF,不會因為終端用戶的移動而發(fā)生改變,即用戶的IP地址保持不變。
在模式一下,UPF一直保持不變,因此終端大范圍移動后,終端和UPF之間的IP路徑會變長。對于低時延要求的應用場景,不推薦模式一。
SSC模式二當終端用戶采用SSC模式二時,用戶離開原UPF區(qū)域,網(wǎng)絡會觸發(fā)釋放原有PDU會話及錨點UPF,并指示終端用戶選擇新的UPF與同一DN建立新的PDU會話。
在模式二下,UPF能跟隨終端的移動及時切換,讓終端和UPF之間保持最短路徑。但由于先釋放原UPF的PDU會話,才可再在新UPF建立PDU會話,切換期間會丟失IP報文,不適用于V2X等低時延高可靠的應用場景。
SSC模式三網(wǎng)絡允許在新的PDU會話(新的PDU會話錨點接入同一DN)建立完成前依然保持用戶與原有PDU會話錨點間的PDU會話,此時用戶同時擁有兩個UPF會話錨點和PDU會話,最后釋放掉原有的PDU會話。
在模式三下,既能保證終端和UPF之間維持最短IP路徑,也能保證UPF切換期間不丟IP報文。但由于UPF間切換需要一定時間(1秒或幾秒),在終端高速移動場景下,切換過程中帶來較大的時延會影響業(yè)務體驗。
可以對模式三進行改良,讓UPF能智能預判終端的移動方向,在終端切換前幾秒,提前選擇目標UPF列表(選擇多個UPF的目的是提高切換命中率),并在這些UPF提前準備好PDU會話資源,當終端進入新的UPF區(qū)域時,由于該UPF已提前準備好PDU會話資源,終端能以毫秒級的速度快速從原UPF切換到目標UPF,進而實時保證終端和UPF之間的最短路徑。
UPF智能預切換技術的關鍵是如何較準確地預判終端將要切換的目的UPF。一般根據(jù)如下參數(shù)使用AI算法做出預判:
① 終端賬號。根據(jù)終端賬號能獲取該終端以往的UPF切換大數(shù)據(jù),可以獲得該終端以往在不同時間段的UPF切換情況[11]。
② 終端當前使用的業(yè)務類型。例如V2X業(yè)務,需要重點看終端的移動軌跡和導航數(shù)據(jù)。
③ 終端移動的歷史軌跡。例如在火車上,終端在之前的數(shù)十分鐘一直沿著軌道方向移動的軌跡。
④ 終端的導航數(shù)據(jù)。例如V2X業(yè)務中,終端的地圖軟件中已提前設置了導航的起始地、目的地、導航路線。
⑤ 終端的移動速度。
⑥ 當前時間段。例如一些上班族的V2X業(yè)務,在周一到周五的上下班期間路徑是較固定的,可以根據(jù)歷史大數(shù)據(jù)記錄,做出較正確的預判。
針對3GPP定義的3種SSC模式,推薦針對模式三進行UPF智能預切換技術增強,以滿足MEC的低時延應用需求。
根據(jù)前文介紹的UPF智能切換技術,當終端移動時,UPF可跟隨終端及時切換到更靠近終端的新的UPF,但為終端服務器的MEC仍在原UPF所在地,導致新UPF和原MEC間產生較長的IP路徑。采用邊隨網(wǎng)動的“MEC-MEC”智能預切換技術,能使終端移動后,“終端-UPF-MEC”之間的IP路徑一直保持最短。
圖1描述了終端(以V2X車輛為例)從UPF#1管轄區(qū)域將要移動到目標UPF區(qū)域(UPF#2或UPF#3)的“MEC-MEC”智能預切換流程。由于應用軟件從原MEC切換到目標MEC中需要較長時間(基于容器的應用軟件一般需要數(shù)分鐘才能完成切換)[13],因此需要原MEC的AI智能分析終端的移動軌跡,提前預判終端將要進入的目標區(qū)域(例如可能要進入MEC#2或MEC#3區(qū)域),原MEC#1提前把應用軟件切換到MEC#2和MEC#3中。當終端真正切換到目標區(qū)域的UPF(例如UPF#2)后,由于MEC#2已提前完成了應用軟件的切換,終端通過UPF#2傳輸?shù)腎P報文能就近傳送到MEC#2,保證了“終端-UPF#2-MEC#2”之間的IP路徑最短。
原MEC的AI智能分析的正確率會影響預切換的成功率。如果正確率低,預加載錯誤,等終端切換到真正的目標MEC后,發(fā)現(xiàn)缺失應用軟件需要再加載,中間可能有數(shù)分鐘的時延。一個比較好的方法是讓MEC的AI智能分析系統(tǒng)反饋多個目標MEC列表(例如圖1中的MEC#2和MEC#3),把原MEC內的應用軟件預先切換到這些目標MEC中,從而提高終端切換后選中目標MEC的成功率。AI智能分析系統(tǒng)也需要根據(jù)應用的業(yè)務特征做出更好的預判,例如車聯(lián)網(wǎng)業(yè)務,一般帶有終端的導航數(shù)據(jù),包括行程的起始地、目的地、導航路徑信息,AI就能較準確地提前預判目標MEC,使得汽車到達該MEC區(qū)域前,已準備好應用軟件實例和數(shù)據(jù)。
面對5G網(wǎng)絡和邊緣計算的應用越來越豐富,移動應用對低時延的需求也越來越多,5G和5G-A系統(tǒng)演進[14]下的MEC需要根據(jù)業(yè)務提出的新需求迭代完善技術方案。當前的應用需求正在從靜態(tài)的園區(qū)MEC場景,轉換到高速移動的V2X、高鐵、衛(wèi)星、元宇宙等應用場景,通過對網(wǎng)絡和邊緣計算賦予智能化能力,可有效地解決高速移動帶來的終端和應用之間的通信路徑變長問題。在實際商業(yè)部署時,需要終端廠商、5G設備商、運營商、低時延應用軟件廠商之間協(xié)同合作,終端要能在機密的通道中給網(wǎng)絡上報終端和應用的信息[15],例如身份、位置、導航數(shù)據(jù)等,5G設備商和運營商要能制定新的標準,并通過智能化增強UPF、MEC的功能,低時延應用軟件廠商需要采用容器技術開放軟件,并能配合運營商實現(xiàn)軟件在云端、MEC一級緩存和二級緩存之間的動態(tài)預加載。
目前由于大數(shù)據(jù)和AI的智能化水平并不完美,預判的正確率會影響低時延業(yè)務的體驗。未來主要從兩個方向研究如何提升預判的正確率:一個是業(yè)界一直在持續(xù)提升的大數(shù)據(jù)和AI技術水平;另一個是具體行業(yè)應用能針對業(yè)務自身的特點,利用大數(shù)據(jù)和AI優(yōu)化預判正確率。
大數(shù)據(jù)和AI的特點是越用越聰明,隨著數(shù)據(jù)量的增加,行業(yè)應用不斷地對AI的參數(shù)調優(yōu)和實踐,智能邊緣技術網(wǎng)絡將給V2X等大量低時延應用提供越來越好的業(yè)務體驗。
物理世界和數(shù)字世界的結合將越來越緊密,V2X、全息通信、通感互聯(lián)、數(shù)字孿生、元宇宙等應用將逐步從概念變成現(xiàn)實,智能邊緣計算網(wǎng)絡技術在這個轉變中將起著關鍵的作用,通過“MEC-云”智能預加載、網(wǎng)隨端動的UPF智能預切換、邊隨網(wǎng)動的“MEC-MEC”智能預切換等技術,大大滿足了低時延應用的核心需求。這些應用的落實是撬動物理世界的杠桿,將大大提升人類的生活水平和工業(yè)生產效率。