:劉贏 胡旋 侯磊磊 章臣斌
【摘要】隨著5G網絡的全面應用,運營商已在2B市場(針對企業(yè)的市場)全面發(fā)力,在各垂直行業(yè)進行了大量5G應用場景探索和部署。行業(yè)用戶的應用場景有別于普通個人用戶,對5G網絡的安全性、高可靠性、業(yè)務連續(xù)性均有更高的需求,因此網絡容災能力成為一個重要課題。本文重點闡述5G核心網控制面、用戶面在應急恢復、高可靠性部署、5G網絡極端情況下的“逃生”方案進行了分析研究。
【關鍵詞】5G核心網;網絡容災;組網架構;控制面;用戶面
中圖分類號:TN929? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? DOI:10.12246/j.issn.1673-0348.2022.09.012
隨著通信技術的快速發(fā)展,自上世紀90年代末以來,我國移動通訊網絡從2G逐漸發(fā)展到5G網絡。從2G引入、3G跟隨、4G同步到5G引領,我國的通信行業(yè)一次次實現(xiàn)跨越式發(fā)展,每一次通訊技術升級換代都對社會發(fā)展帶來巨大影響與推動,移動網絡的應用場景也從最開始的基礎語音業(yè)務進化為萬物互聯(lián)時代。應用場景的改變對網絡高可靠性以及應急恢復提出了更高的要求。本文結合5G組網架構特點,對網絡存在的潛在隱患進行了分析,結合業(yè)界常用容災能力進行了總結,并對極端情況下如何利用4G網絡“逃生”進行了研究。
1. 5G組網架構
5G核心網通??煞譃閰⒖键c方式呈現(xiàn)和服務化架構方式呈現(xiàn)。具體內容如下。
1.1 參考點方式呈現(xiàn)
核心網采用控制轉發(fā)分離架構,實現(xiàn)移動性管理和會話管理的獨立進行。5G用戶面引入了“流概念”(類似但不同于4G的“承載”),即QoS參數(shù)直接體現(xiàn)在會話中的不同流。通過不同的用戶面網元可同時建立多個不同的會話,并由多個控制面網元同時管理,實現(xiàn)本地分流和遠端流量的并行管理。參考點方式呈現(xiàn)如圖1所示。
1.2 重要參考點簡介
參考點是特定兩個功能塊之間的交互界面,是標準的雙方之間的協(xié)議映射關系。本文重點介紹與容災方面相關的內容,因此僅介紹如下參考點或接口。
N4:用戶面UPF與控制面SMF的參考點,在垂直行業(yè)應用中下沉UPF也使用N4接口與控制面互通,是一個重要的參考點。
N8:AMF與UDM的參考點,輕量化控制面下沉應用中重要的參考點。
N10:SMF與UDM的參考點,輕量化控制面下沉應用中重要的參考點。
N12:AMF與AUSF的參考點,用于鑒權的消息交互,輕量化控制面下沉應用中重要的參考點。
S6a:4G網絡MME網元與5G網絡UDM互通的重要接口,主要用于數(shù)據(jù)業(yè)務消息交互。
Cx/Sx:IMS網絡與5G網絡UDM交互的重要接口,主要用于語音業(yè)務消息交互。
1.3 服務化架構方式呈現(xiàn)
服務化架構是在控制面釆用API能力開放形式進行信令的傳輸,目前業(yè)界主流機型底層協(xié)議均采用HTTP2協(xié)議。在傳統(tǒng)的信令流程中,很多的信令消息在不同的網元間交互使用不同的協(xié)議類型,這為故障定位和運維帶來了一定繁瑣性。5G網絡控制面將相同或相似的消息提取出來以API能力調用的形式封裝起來,對交互協(xié)議進行了統(tǒng)一。服務化架構方式呈現(xiàn)如圖2。
2. 5G組網方面的潛在隱患
5G網絡引入了網絡功能虛擬化NFV概念,控制面完全基于云資源池通用硬件,隨著云化技術的不斷發(fā)展,三層解耦一定是未來發(fā)展的趨勢。目前各運營商為了安全起見,都引入了多DC(數(shù)據(jù)中心)組網模式,以省為單位或以大區(qū)為單位組建雙DC或多DC部署。由于5G核心網的高度集中,在實際運營過程中也產生了一定的風險隱患。按照組網結構,可分為控制面隱患和用戶面隱患。
2.1 控制面隱患
信令風暴:核心網高度集中后在容災應急啟動的過程中,如果網絡所帶的用戶較多,同時對控制面網元卸載用戶操作未引起足夠的重視而沒有采用合理的流控,那么勢必會引發(fā)信令風暴。經過測試,5G核心網在DC級容災時,信令交互量是平時的5倍以上。
控制面暴露:在垂直行業(yè)應用中,5G核心網為給用戶提供低時延場景,通常將UPF下沉至用戶機房或者與第三方UPF相連,這樣就形成5G核心網暴露面。
2.2 用戶面隱患
用戶面UPF單點部署:5G建網初期,為了節(jié)約投資,在為垂直行業(yè)用戶提供低時延解決方案時,通常會采用單點下沉UPF方案。而這些重要行業(yè)用戶有的是24小時不間斷生產。這為5G網絡高可靠性、高連續(xù)性埋下隱患,例如UPF升級、硬件故障等情況都有可能影響用戶的使用。
用戶面UPF或定制DNN單點接入:用戶面UPF或用戶定制DNN在開通初期如果考慮不夠周全,可能會出現(xiàn)與控制面SMF單點對接的可能。當控制面SMF做升級或調整參數(shù)需要卸載用戶時,可能引發(fā)UPF無法使用故障。這個問題比較好解決,平時做好數(shù)據(jù)比對和隱患排查,發(fā)現(xiàn)問題時及時更正數(shù)據(jù)配置即可。
3. 各場景容災解決方案分析
考慮到上述隱患,各運營商在建設和維護期要對各種潛在的風險隱患進行排查梳理以及制定網絡容災策略。網絡容災大致分為控制面容災和用戶面容災兩大部分內容。按照應急等級又可分為服務器或網絡設備硬件級、虛機級、虛擬化網元級、DC級、機房級等。
3.1 控制面容災方案分析
服務器或網絡設備硬件級:目前各大運營商對服務器以及網絡設備級的容災考慮是比較全面的,由于云架構的引入以及云化帶來的好處,基本上單一底層硬件故障時并不會引發(fā)上層應用過多的反應,甚至單一設備故障上層應用無感知。
虛機級:虛機以及虛擬化網元目前業(yè)界在容災方面相對成熟。虛機層不出現(xiàn)大面積故障或軟件級BUG通常情況下不會引發(fā)大面積故障。
虛擬化網元級:虛擬化網元級容災涉及網元比較多,容災時要充分考慮系統(tǒng)的容量配置,避免出現(xiàn)容災后系統(tǒng)過載,從而影響業(yè)務。某些國外設備在過載情況下可能會出現(xiàn)系統(tǒng)鎖死現(xiàn)象,后果非常嚴重。另外,SMF等虛擬化網元以及用戶面網元UPF在啟動容災時涉及用戶卸載,在日間忙時可能會對周邊網元產生信令沖擊。因此,這些網元在啟動容災操作時一定要做好流控,盡量放在夜間非忙時進行操作。
DC級和機房級:極端情況下,各運營商可能會面臨DC級或機房級容災,在5G建設初期國內各運營商都已經考慮過該場景下的應急預案,但隨著用戶數(shù)的不斷增加,DC級或機房級容災變得不再那么容易實現(xiàn)。其中主要原因包括一是系統(tǒng)容量的限制,要滿足DC級容災,首先兩個DC要滿足1+1備份關系,另外周邊網元也要有足夠的資源配合完成。二是信令風暴抑制,當極端情況下啟動DC級或機房級容災時,信令風暴問題要做好深度評估,稍有不慎很可能造成“雪崩”效應,不但5G網絡自身沒能完成自救,還很有可能對4G或IMS網絡產生嚴重沖擊。一般解決該問題都是通過在AMF或MME等接入管理網元以及DRA等信令轉發(fā)網元采用“流控”方式進行管制。或者在基站無線側進一步壓降DC級容災所產生的信令風暴。
5G逃生4G網絡:4G網絡在相當長一段時間內都會做為一套“打底”的網絡與5G網絡共存。因此業(yè)界也對極端情況下5G用戶是否能利用4G網絡做為5G網絡的“逃生”方案做了探討。經過研究分析,雖然4G和5G網絡是一套深度融合的網絡,如圖3所示,HSS與UDM、PCF和PCRF、UPF和PGW-U是原生融合,而MME和AMF是深度融合,因此,如果僅僅對少量2C用戶進行容災,那么在不考慮時間因素是可行的。
值得注意的是,如果采用HSS Proxy代理方式尋址的運營商(5G用戶數(shù)據(jù)只在UDM里存在,在4G網絡接入時由HSS通過Proxy機制路由至UDM完成接入和會話),在極端情況下2C用戶逃生4G網絡也存在諸多問題,主要是HSS容量問題、信令風暴問題、UDM用戶數(shù)據(jù)如何快速轉換成HSS格式并加載至HSS系統(tǒng)等問題都需要耗費一定的資源和人力,而且并不容易實現(xiàn)。
如果是5G 2B行業(yè)用戶,極端情況下很可能就無法實現(xiàn)逃生4G網絡,因為4G網絡無法完全繼承5G網絡的業(yè)務特性,比如切片、定制DNN、低時延、多連接業(yè)務等等。也就是說即使用戶可以回落到4G網絡,但也無法完成相應的業(yè)務。綜上所述,利用4G網絡作為5G網絡的逃生手段僅能保證部分2C/2B用戶基本的數(shù)據(jù)和語音業(yè)務,5G特色業(yè)務無法實現(xiàn)。
控制面C-IWF隔離:5G定制網主要面向行業(yè)客戶,滿足不同行業(yè)客戶數(shù)字化轉型升級過程中對網絡、邊緣、云、應用等的差異化需求。例如:低時延場景、自主管理部分控制面網元等場景,這就涉及用戶面網元UPF以及AMF/SMF/PCF等控制面下沉至客戶園區(qū)。
5G核心網需要與各種廠商的大量網元(UPF/UDM/AMF等)做互通,操作及對接復雜,增加運營成本、不便于擴展,因此設備提供商在積極探索C-IWF(控制面-信令互通網關)方案。希望通過C-IWF的引入,滿足定制網業(yè)務安全敏捷部署、N4/N8/N10/N12/N14接口信令轉接等需求。如圖4所示。
C-IWF可起到安全隔離作用,定制網下沉網元通過網關一點接入大網,與大網進行隔離,網關具備客戶網元認證、消息過濾、信令轉接等能力,由網關實現(xiàn)大網與定制網的安全隔離。還可實現(xiàn)信令互通,將涉及定制網的網元選擇、消息轉發(fā)等操作都統(tǒng)一轉發(fā)到網關,由網關實現(xiàn)信令轉接,保證大網配置的穩(wěn)定。還可在一定程度上降低5G核心網與眾多UPF進行繁雜的對接繁瑣性。目前該方案處于積極探索階段。
3.2 用戶面的網絡容災分析
5G網絡在2B行業(yè)用戶應用過程中,由于前期應用場景不明朗或為節(jié)約投資成本,對于下沉UPF的建設一般采用單點方式,這為后期運維帶來了風險隱患,設備故障、軟件升級都有可能造成業(yè)務中斷,不符合高可靠性、高安全性要求。通常這類風險可通過“中心/地市UPF集中備份容災”和“邊緣雙UPF主備容災”解決方案予以規(guī)避。
3.2.1 地市/中心UPF集中備份容災
如圖5所示,在地市或中心建設一套下沉UPF,將其作為多園區(qū)UPF共用的備份UPF,在兼顧投資產出比的同時,可有效解決園區(qū)UPF單點運行所帶來的風險。
采用該方案啟動容災時,數(shù)據(jù)需要出園區(qū),數(shù)據(jù)路徑不同,會稍有延遲。因此,對數(shù)據(jù)傳輸要求敏感的企業(yè)不太適合。另外,多園區(qū)故障,可能存在備份UPF資源搶占;在建設過程中需充分考慮邊緣UPF的容量。如果企業(yè)用戶的終端為固定IP地址,備份的UPF還要考慮接入數(shù)量。
3.2.2 邊緣雙UPF主備容災
邊緣雙局主備容災是中心/地市UPF集中備份容災機制的補充。如圖6所示,園區(qū)UPF在建設的時候,采用主備UPF工作模式,安全性和可靠性得以提升。適合企業(yè)對數(shù)據(jù)要求不出園區(qū)、終端要求地址不變等應用場景,該方案支持的靜態(tài)用戶數(shù)量不受主機路由條目限制。在啟動容災時,數(shù)據(jù)也可以保證安全性和時效性,企業(yè)數(shù)據(jù)和應用場景都不發(fā)生改變。當然,該組網方案一定程度上會帶來建設成本的增加。
近兩年境內外知名運營商發(fā)生過多次重大網絡故障,從獲取到的信息來看相當一部分原因是網絡潛在隱患未排除導致的。5G核心網與前幾代核心網相比,不論是從組網和復雜度上都有了明顯提高,而且應用場景也變的豐富多樣,有些還是非常重要的垂直行業(yè)用戶(24小時生產),這就對維護工作者提出了非常高的要求。本文重點對5G網絡組網進行了分析,主要對控制面和用戶面高可靠性、高連續(xù)性以及在容災策略方面進行了研究,希望能對從事5G核心網維護的業(yè)內人士提供一些借鑒。
參考文獻:
[1]李雪芳,吉翔川,丁志剛,潘潔,韋薇,張鑫磊.5G網絡安全風險應對思路研究[C]//推動網絡演進 促進應用創(chuàng)新——5G網絡創(chuàng)新研討會(2021)論文集.,2021:35-39.DOI:10.26914/c.cnkihy.2021.039105.
[2]余海波,金志堅,秦二民.5G移動專網技術方案探討[C]//推動網絡演進 促進應用創(chuàng)新——5G網絡創(chuàng)新研討會(2021)論文集.,2021:346-350.DOI:10.26914/c.cnkihy.2021.039166.
[3]俞樂.5G輕量核心網在應急通信中的應用分析[J].中國新通信,2021,23(16):1-2.
[4]吳遠清.5G移動通信核心網關鍵技術研究[J].長江信息通信,2021,34(08):184-186.