梁芳 佟恬 馬賀榮 曹暢
(1. 中國聯(lián)合網(wǎng)絡(luò)通信有限公司研究院,北京100048;2.山東港口煙臺(tái)港股份有限公司礦石碼頭分公司,煙臺(tái) 264004)
隨著數(shù)字經(jīng)濟(jì)的快速發(fā)展,數(shù)據(jù)作為核心要素,對(duì)其承載和處理的需求高速增長。算力作為數(shù)據(jù)處理能力,迎來了大規(guī)模發(fā)展時(shí)期,成為數(shù)字經(jīng)濟(jì)的重要生產(chǎn)力和重要載體。但我國存在東西部算力資源與供需不平衡的問題,影響了我國區(qū)域發(fā)展、產(chǎn)業(yè)發(fā)展、能源發(fā)展,掣肘了我國數(shù)字經(jīng)濟(jì)的高速均衡發(fā)展,因此,“東數(shù)西算”工程成為我國數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的必然要求。本文對(duì)東數(shù)西算下算網(wǎng)建設(shè)的具體需求進(jìn)行了分析,提出了 CUBE-Net 3.0 算力網(wǎng)絡(luò)架構(gòu),并對(duì)下一步算力網(wǎng)絡(luò)發(fā)展給出了建議。
隨著東數(shù)西算工程的實(shí)施,用戶側(cè)的需求是面向體驗(yàn)結(jié)果的需求,即無論身處何處都能獲得及時(shí)、可靠、高性能的算力服務(wù),而對(duì)算力提供地點(diǎn)、算力服務(wù)底層技術(shù)等要求并不太關(guān)心。這實(shí)際上是要求網(wǎng)絡(luò)基礎(chǔ)設(shè)施側(cè)能提供“高速路”“多服務(wù)”“一體化”的能力,主要是高速泛在、高可靠、低時(shí)延通信網(wǎng)絡(luò)、多樣化算力云資源接入要求和一體化算網(wǎng)協(xié)同調(diào)度要求,具體如下。
由于我國東西部將產(chǎn)生大量的交互和跨域流量,因此對(duì)東數(shù)西算工程的基礎(chǔ)設(shè)施即通信網(wǎng)絡(luò)建設(shè)提出以下要求。
(1)“寬”道路
在數(shù)據(jù)中心建設(shè)中,呈現(xiàn)了東部DC以服務(wù)本區(qū)域算力需求為主、西部DC以服務(wù)全國算力需求為主的特征,產(chǎn)生大量跨省流量,出省帶寬比例高,預(yù)計(jì)在完成東數(shù)西算規(guī)劃中的機(jī)架數(shù)時(shí),我國骨干網(wǎng)傳輸帶寬需求將達(dá)到現(xiàn)有運(yùn)營商骨干帶寬的3 倍左右,東西部的骨干網(wǎng)帶寬將達(dá)到2 000 T以上。因此,對(duì)我國通信網(wǎng)絡(luò)“高速路”建設(shè)的帶寬流量提出了較高的要求。
(2)“快”物流
時(shí)延是影響用戶算力服務(wù)體驗(yàn)的關(guān)鍵因素之一,不同類型的算力服務(wù)對(duì)時(shí)延要求不同。根據(jù)各類算力業(yè)務(wù)的時(shí)延需求,可分為熱業(yè)務(wù)(低時(shí)延業(yè)務(wù))、溫業(yè)務(wù)(時(shí)延相對(duì)敏感業(yè)務(wù))和冷業(yè)務(wù)(時(shí)延不敏感、數(shù)據(jù)讀寫頻度較低)三類。由于不同業(yè)務(wù)對(duì)時(shí)延要求的不同,東數(shù)西算工程的部署應(yīng)能按照不同的業(yè)務(wù)需求進(jìn)行不同網(wǎng)絡(luò)SLA的配置,實(shí)現(xiàn)網(wǎng)絡(luò)“高速路”快慢車道的有效劃分,完成網(wǎng)絡(luò)資源的合理利用,推動(dòng)?xùn)|數(shù)西存(東部熱點(diǎn)區(qū)域完成數(shù)據(jù)計(jì)算、西部進(jìn)行備份存儲(chǔ))、東數(shù)西訓(xùn)(東部部署算法倉庫、西部完成離線大數(shù)據(jù)分析)、實(shí)時(shí)性要求不高的業(yè)務(wù)部署于西部節(jié)點(diǎn)。
(3)“零”丟損
通常來說,數(shù)據(jù)中心內(nèi)部網(wǎng)絡(luò)的可靠性遠(yuǎn)高于長途網(wǎng)絡(luò)的可靠性,但東數(shù)西算的一些業(yè)務(wù)場景,如多云協(xié)同、存算分離、業(yè)務(wù)遠(yuǎn)程集約化部署等,將本屬于數(shù)據(jù)中心內(nèi)部的網(wǎng)絡(luò)連接,或者城域、區(qū)域內(nèi)的連接,擴(kuò)展為長途傳輸連接,并由于開銷的代價(jià),對(duì)長距離傳輸?shù)木W(wǎng)絡(luò)可靠性提出更為嚴(yán)苛的要求,包括網(wǎng)絡(luò)無故障、無丟包、無突發(fā)擁塞、故障快速自愈、網(wǎng)絡(luò)性能確定(路由、時(shí)延、帶寬等)等方面。
(4)“低”成本
東數(shù)西算工程推動(dòng)了東西部向長途傳輸需求的高速增長,但“舍近求遠(yuǎn)”的網(wǎng)絡(luò)線路的搭建,提高了身處東數(shù)西算上下游企業(yè)的運(yùn)營成本,暫不能滿足企業(yè)“降本增利”的思路和用戶側(cè)“高性價(jià)比”的需求。因此,建議采取多方面措施以降低網(wǎng)絡(luò)建設(shè)和運(yùn)營成本。
搭建了“高速路”的基礎(chǔ)能力,面向多樣云資源能力等算力服務(wù),需要能夠滿足多樣化算力云資源接入能力。對(duì)網(wǎng)絡(luò)的需求主要為以下兩個(gè)方面:一是客戶入云的需求,包括終端客戶訪問云端資源、獲取云端算力服務(wù)的需求,云租戶接入云資源池,對(duì)云上應(yīng)用和業(yè)務(wù)進(jìn)行運(yùn)營和維護(hù)的需求,算力設(shè)施服務(wù)商接入云資源池,對(duì)算力設(shè)施進(jìn)行運(yùn)營和維護(hù)的需求等;二是數(shù)據(jù)中心間或云間互聯(lián)的需求,其中云間互聯(lián)需求包括公有云內(nèi)部互通、混合云間互通、多公有云間互通、數(shù)據(jù)遷移與備份等。
實(shí)現(xiàn)了基礎(chǔ)能力和多樣服務(wù),需要建立一體化機(jī)制充分發(fā)揮能力,因此東數(shù)西算工程的實(shí)施對(duì)網(wǎng)絡(luò)的智能管控和統(tǒng)一協(xié)同調(diào)度服務(wù)能力提出了更高要求。實(shí)現(xiàn)跨網(wǎng)、跨地區(qū)、跨企業(yè)的算力高效調(diào)度,需要智能、感知、靈活、確定的網(wǎng)絡(luò)支撐,網(wǎng)絡(luò)需要基于算力和網(wǎng)絡(luò)的全局資源視圖,根據(jù)網(wǎng)絡(luò)部署狀況進(jìn)行全局的編排調(diào)度。
(1)實(shí)現(xiàn)對(duì)全局算力資源的自動(dòng)感知,按需自動(dòng)創(chuàng)建面向應(yīng)用的全局多級(jí)算力資源自動(dòng)分配調(diào)度、算網(wǎng)一體化服務(wù)編排、動(dòng)態(tài)彈性算力和網(wǎng)絡(luò)資源的協(xié)同調(diào)整。
(2)可編程的調(diào)度和協(xié)同服務(wù),主要包括多云之間、云和數(shù)據(jù)中心之間資源調(diào)度,跨行業(yè)、跨地區(qū)、跨層級(jí)的算力資源調(diào)度;跨域?qū)>€業(yè)務(wù)開通等一鍵式開通,其中云間協(xié)同服務(wù)要求網(wǎng)絡(luò)能夠智能、自動(dòng)、實(shí)時(shí)感知應(yīng)用,并基于需求提供靈活、實(shí)時(shí)、可靠的全局可編程的調(diào)度和協(xié)同服務(wù)。
根據(jù)上述“東數(shù)西算”工程對(duì)通信網(wǎng)絡(luò)和算力服務(wù)的需求分析,網(wǎng)絡(luò)需要整合不同類型算力資源,根據(jù)業(yè)務(wù)場景特點(diǎn),通過調(diào)度平臺(tái)按需統(tǒng)一調(diào)度,滿足業(yè)務(wù)對(duì)多種算力協(xié)同、多云協(xié)同的應(yīng)用需求。上述復(fù)雜的應(yīng)用場景對(duì)算力調(diào)度的要求更高,涉及全局資源感知、資源采集、統(tǒng)一管控、統(tǒng)一注冊(cè)/建模/度量、最優(yōu)化靈活調(diào)度、計(jì)費(fèi)與結(jié)算、生命周期管理等多方面。因此,算力網(wǎng)絡(luò)是實(shí)現(xiàn)東數(shù)西算戰(zhàn)略的重要承載方式。
2019年,我國提出了“算力網(wǎng)絡(luò)”的概念[1]。算力網(wǎng)絡(luò)是指在計(jì)算能力不斷泛在化發(fā)展的基礎(chǔ)上,通過網(wǎng)絡(luò)手段將計(jì)算、存儲(chǔ)等基礎(chǔ)資源在云—邊—端之間進(jìn)行有效調(diào)配的方式,以此提升業(yè)務(wù)服務(wù)質(zhì)量和用戶的服務(wù)體驗(yàn),超前的概念實(shí)現(xiàn)了與東數(shù)西算戰(zhàn)略的契合,加速東數(shù)西算戰(zhàn)略落地。同時(shí),東數(shù)西算的戰(zhàn)略提出也為算力網(wǎng)絡(luò)的發(fā)展注入深場景和大意義,行業(yè)內(nèi)加速了算力網(wǎng)絡(luò)技術(shù)的研究,并在國內(nèi)外取得了顯著的進(jìn)展[5-9]。
在國際,以運(yùn)營商和華為技術(shù)有限公司為代表在IETF開展了Computing First Network Framework系列研究,在ETSI和BBF(寬帶論壇)上分別啟動(dòng)了NFV-EVE 020和SD-466項(xiàng)目的研究;在ITU-T,中國電信聯(lián)合中國聯(lián)通在SG13組發(fā)布了Y.2501,同時(shí)中國聯(lián)通和中國移動(dòng)分別牽頭啟動(dòng)了Q.CPN、Y.A SA-CPN、Q.BNG-INC與Y.CAN等 SG1和SG13組的相關(guān)標(biāo)準(zhǔn)制定。
圖1 CUBE-Net 3.0頂層架構(gòu)圖
在國內(nèi),CCSA方面,三大運(yùn)營商聯(lián)合開展算力網(wǎng)絡(luò)系列標(biāo)準(zhǔn)研究,開展包括算力網(wǎng)絡(luò)需求與架構(gòu)、算力路由協(xié)議技術(shù)、算力網(wǎng)絡(luò)標(biāo)識(shí)解析技術(shù)、算力網(wǎng)絡(luò)控制器技術(shù)、算力網(wǎng)絡(luò)交易平臺(tái)技術(shù)、算力網(wǎng)絡(luò)管理與編排技術(shù)、算力度量與算力建模技術(shù)等全方位的標(biāo)準(zhǔn)技術(shù)研究工作,有力地推動(dòng)了算力網(wǎng)絡(luò)的技術(shù)發(fā)展。
算力網(wǎng)絡(luò)是面向承載網(wǎng)算網(wǎng)融合演進(jìn)的新型網(wǎng)絡(luò)架構(gòu),通過算力資源與網(wǎng)絡(luò)資源的協(xié)同調(diào)度,將不同應(yīng)用的業(yè)務(wù)請(qǐng)求通過最優(yōu)路徑調(diào)度到最優(yōu)的計(jì)算節(jié)點(diǎn),實(shí)現(xiàn)用戶體驗(yàn)最優(yōu)的同時(shí),保證網(wǎng)絡(luò)資源和計(jì)算資源利用率最優(yōu)化。面向東數(shù)西算的建設(shè)需求,本文提出了新的算力網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)思路,即基于第三代面向云的無處不在的寬帶彈性網(wǎng)絡(luò)(Cloud-oriented Ubiquitous Broadband Elastic Network 3.0,CUBE-Net 3.0),通過“聯(lián)接+計(jì)算”的算網(wǎng)一體理念,以云網(wǎng)為基、數(shù)智為核,實(shí)現(xiàn)算網(wǎng)聯(lián)動(dòng),融入云原生、邊緣計(jì)算、人工智能、區(qū)塊鏈、內(nèi)生安全、確定性等新技術(shù)元素,打造了新一代數(shù)字基礎(chǔ)設(shè)施建設(shè)[1-3],實(shí)現(xiàn)不同技術(shù)和產(chǎn)業(yè)要素的深度融合,加速東數(shù)西算戰(zhàn)略的落地。圖1為CUBE-Net 3.0 頂層架構(gòu)圖。
(1)打造全光底座的算力承載底座
構(gòu)建“ROADM+OTN”光電雙平面立體架構(gòu),形成覆蓋國家樞紐的“5+4+31+X”的云—網(wǎng)—邊一體化算網(wǎng)布局,打造架構(gòu)領(lǐng)先、體驗(yàn)領(lǐng)先、運(yùn)力充沛、智能開放的全光傳送底座。從帶寬驅(qū)動(dòng)的管道網(wǎng)絡(luò)向體驗(yàn)驅(qū)動(dòng)的全光算力網(wǎng)絡(luò)演進(jìn),強(qiáng)化大帶寬、低時(shí)延、高可靠、高安全的算力輸送服務(wù)能力,提供高速泛在、靈活接入,實(shí)現(xiàn)一跳入算,為東數(shù)西算算力資源通信服務(wù)提供高質(zhì)量運(yùn)力保障,降低了傳輸時(shí)延,提升了傳輸效率,筑基了高速泛在低時(shí)延的算力底座。
(2)構(gòu)建IPv6+的算網(wǎng)架構(gòu)
以用戶為中心和以支持IPv6協(xié)議的網(wǎng)絡(luò)全面部署為基礎(chǔ),開展“IPv6+”新技術(shù)研究加速網(wǎng)絡(luò)演進(jìn),打造低時(shí)延、廣聯(lián)接、智能化、便捷化的云—網(wǎng)—邊多級(jí)算力接入的IP承載網(wǎng),擴(kuò)展了SRv6段路由標(biāo)識(shí)(SID)功能,構(gòu)建了云—網(wǎng)—邊一體的可編程服務(wù)(SID as a Service)體系,使能了新型組播 (BIERv6)、VPN+切片、服務(wù)功能鏈(SFC)、隨流檢測(iFIT)、應(yīng)用感知網(wǎng)絡(luò)(APN6)等IPV6+承載技術(shù),具備了承載能力、調(diào)度能力、感知能力和運(yùn)維能力,踐行了“轉(zhuǎn)發(fā)融合,管控分離,一體編排”算網(wǎng)一體架構(gòu),實(shí)現(xiàn)了多樣算力接入的能力。
(3)實(shí)踐面向云—網(wǎng)—邊一體的算力網(wǎng)絡(luò)智能調(diào)度體系
基于面向云—網(wǎng)—邊一體的算力網(wǎng)絡(luò)管理編排體系,構(gòu)建算網(wǎng)一體化調(diào)度平臺(tái),實(shí)現(xiàn)算網(wǎng)統(tǒng)一管控,協(xié)同編排和靈活調(diào)度,支持公有云、私有云以及端到端網(wǎng)絡(luò)的一體化編排調(diào)度能力。具備在云—網(wǎng)—邊之間按需分配和智能調(diào)度計(jì)算資源、存儲(chǔ)資源以及網(wǎng)絡(luò)資源的能力,滿足不同計(jì)算場景對(duì)帶寬、延遲、算力等的需求,提供了隨需可調(diào)、場景多樣、質(zhì)量感知一體化算力服務(wù)協(xié)同調(diào)度能力。
目前,在行業(yè)內(nèi)的共同努力下,我國算力網(wǎng)絡(luò)發(fā)展取得一定先發(fā)優(yōu)勢,為東數(shù)西算工程建設(shè)貢獻(xiàn)了力量,但仍存在算力供給不足、算力需求有待激發(fā)、創(chuàng)新研發(fā)不足、算網(wǎng)產(chǎn)業(yè)融合不深等發(fā)展難題。因此,建議繼續(xù)從優(yōu)化算網(wǎng)布局、提升算網(wǎng)資源效率、增強(qiáng)算網(wǎng)管控與編排、保障算網(wǎng)安全等方面進(jìn)行提升,從而進(jìn)一步面向東數(shù)西算深場景開發(fā),促進(jìn)我國數(shù)字經(jīng)濟(jì)發(fā)展。
隨著全國一體化大數(shù)據(jù)中心體系規(guī)劃布局的完成,樞紐節(jié)點(diǎn)將作為我國算力網(wǎng)絡(luò)的骨干連接點(diǎn),發(fā)展數(shù)據(jù)中心集群,開展數(shù)據(jù)中心與網(wǎng)絡(luò)、云計(jì)算、大數(shù)據(jù)之間的協(xié)同建設(shè),并作為國家“東數(shù)西算”工程的戰(zhàn)略支點(diǎn),推動(dòng)算力資源有序向西轉(zhuǎn)移,促進(jìn)解決東西部算力供需失衡問題。但我國運(yùn)營商骨干網(wǎng)的核心節(jié)點(diǎn)和骨干節(jié)點(diǎn)主要在省會(huì)城市及部分重點(diǎn)城市,需經(jīng)省會(huì)等骨干節(jié)點(diǎn)轉(zhuǎn)接到部分國家算力節(jié)點(diǎn),增加了傳輸時(shí)延。因此,需要運(yùn)營商側(cè)進(jìn)一步進(jìn)行骨干網(wǎng)絡(luò)的結(jié)構(gòu)調(diào)整和優(yōu)化,并對(duì)光纜網(wǎng)絡(luò)的路由和傳輸承載網(wǎng)絡(luò)的組網(wǎng)結(jié)構(gòu)進(jìn)行優(yōu)化,減少數(shù)據(jù)在網(wǎng)絡(luò)上的繞轉(zhuǎn)和轉(zhuǎn)發(fā)時(shí)延,縮短網(wǎng)絡(luò)傳輸時(shí)延,解決供給側(cè)的根本問題,從而催生多云協(xié)同、存算分離、云邊協(xié)同等創(chuàng)新服務(wù)模式,促進(jìn)東數(shù)西算堅(jiān)實(shí)落地。
算網(wǎng)深度融合階段為算力感知網(wǎng)絡(luò),即通過無所不在的網(wǎng)絡(luò)連接分布式計(jì)算節(jié)點(diǎn),實(shí)現(xiàn)服務(wù)的自動(dòng)化部署、最優(yōu)路由和負(fù)載均衡,從而構(gòu)建可以感知算力的全新網(wǎng)絡(luò)基礎(chǔ)設(shè)施,保證網(wǎng)絡(luò)能夠按需、實(shí)時(shí)調(diào)度不同位置的計(jì)算資源,提高網(wǎng)絡(luò)和計(jì)算資源利用率。為實(shí)現(xiàn)這一階段,需要全行業(yè)上下游產(chǎn)業(yè)的配合,如何從供給側(cè)推動(dòng)產(chǎn)業(yè)協(xié)同,仍需在“降本增效”上進(jìn)行探索,一方面運(yùn)營商需要采取措施多方面降低網(wǎng)絡(luò)建設(shè)和運(yùn)營成本,從而降低網(wǎng)絡(luò)帶寬租用成本;另一方面需要通過智能管控系統(tǒng)提供業(yè)務(wù)按需開通、帶寬按需動(dòng)態(tài)調(diào)整等靈活的短租網(wǎng)絡(luò)連接服務(wù),提高網(wǎng)絡(luò)利用效率。因此,算網(wǎng)產(chǎn)業(yè)協(xié)同發(fā)展將為東數(shù)西算大產(chǎn)業(yè)協(xié)同發(fā)展提供有力的能量。
算網(wǎng)管控與編排是“五數(shù)”體系中“數(shù)紐”層著力要解決的問題,也是實(shí)現(xiàn)東數(shù)西算工程總體目標(biāo)的重要基礎(chǔ)能力。在東數(shù)西算業(yè)務(wù)場景的驅(qū)動(dòng)下,云邊算趨向泛在化,網(wǎng)絡(luò)更加扁平化、靈活化、服務(wù)化,需要進(jìn)一步加強(qiáng)技術(shù)創(chuàng)新內(nèi)驅(qū)力,破解算力度量、算力編排與調(diào)度等難題,通過IPv6+、AI、邊緣計(jì)算、區(qū)塊鏈等技術(shù)對(duì)業(yè)務(wù)、算力資源和網(wǎng)絡(luò)資源的協(xié)同感知,將業(yè)務(wù)按需調(diào)度到合適的節(jié)點(diǎn),為算網(wǎng)資源綜合最優(yōu)、高效調(diào)度打基礎(chǔ),實(shí)現(xiàn)面向算網(wǎng)一體的算力網(wǎng)絡(luò)編排調(diào)度體系的研發(fā),并能聯(lián)合業(yè)界內(nèi)各方力量共同研究、共同推動(dòng),探索出實(shí)現(xiàn)算網(wǎng)管控與編排的協(xié)調(diào)調(diào)度機(jī)制。
隨著當(dāng)前國際局勢的變化,網(wǎng)絡(luò)安全已成為我國發(fā)展的重要課題。在東數(shù)西算下,海量數(shù)據(jù)在跨域流通時(shí),面臨著更嚴(yán)峻的網(wǎng)絡(luò)安全風(fēng)險(xiǎn),現(xiàn)有的外掛式安全體系難以滿足“東數(shù)西算”工程的安全需求,應(yīng)積極研發(fā)新型安全技術(shù)體系或架構(gòu),基于網(wǎng)絡(luò)內(nèi)生安全技術(shù),在網(wǎng)絡(luò)層提供高水平的網(wǎng)絡(luò)安全體系,避免基于網(wǎng)絡(luò)對(duì)算力系統(tǒng)、應(yīng)用和數(shù)據(jù)的攻擊,提高安全保障和服務(wù)能力。但構(gòu)建自感知、自免疫、按需分配的網(wǎng)絡(luò)內(nèi)生安全能力現(xiàn)仍為前沿技術(shù)能力,尚需產(chǎn)業(yè)界共同努力以盡快實(shí)現(xiàn)網(wǎng)絡(luò)內(nèi)生安全技術(shù)的產(chǎn)業(yè)化,從而作為算網(wǎng)安全的根本內(nèi)生能力,全力保障“東數(shù)西算”工程安全運(yùn)行。
以5G為代表的新一代信息技術(shù)的快速迭代,帶領(lǐng)各行業(yè)數(shù)字化轉(zhuǎn)型的快速升級(jí),全社會(huì)數(shù)據(jù)總量爆發(fā)式增長,數(shù)據(jù)資源存儲(chǔ)、計(jì)算和應(yīng)用需求大幅提升,內(nèi)在促生了東數(shù)西算戰(zhàn)略工程,算力網(wǎng)絡(luò)架構(gòu)及體系天然適合作為東數(shù)西算工程的具體解決思路。同時(shí),由于東數(shù)西算工程實(shí)施及其應(yīng)用場景也對(duì)算力網(wǎng)絡(luò)提出了一些需求,作為設(shè)計(jì)思路,本文闡述了CUBE-Net 3.0算力網(wǎng)絡(luò)創(chuàng)新體系。未來,建議從優(yōu)化算網(wǎng)布局、提升算網(wǎng)資源效率、增強(qiáng)算網(wǎng)管控與編排、保障算網(wǎng)安全方面加強(qiáng),助力東數(shù)西算的下一階段發(fā)展,全面推動(dòng)數(shù)字經(jīng)濟(jì)的持續(xù)健康發(fā)展。