雷波 馬小婷 李聰 唐靜 周舸帆
(中國(guó)電信股份有限公司研究院網(wǎng)絡(luò)技術(shù)研究所,北京102209)
隨著數(shù)字產(chǎn)業(yè)化與產(chǎn)業(yè)數(shù)字化進(jìn)程的提速升級(jí),新型數(shù)字基礎(chǔ)設(shè)施已經(jīng)成為推動(dòng)智能化數(shù)字中國(guó)建設(shè)、數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的重要基石。云網(wǎng)融合作為新型基礎(chǔ)設(shè)施的本質(zhì)特征,代表了信息通信技術(shù)自主創(chuàng)新的重要發(fā)展方向,推動(dòng)著社會(huì)數(shù)字化向更高層次、更廣范圍、更深程度擴(kuò)展。《“十四五”數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃》明確指出,要推動(dòng)云網(wǎng)協(xié)同和算網(wǎng)融合發(fā)展,加快構(gòu)建以算力、算法、數(shù)據(jù)等多維資源協(xié)同為核心的全國(guó)一體化數(shù)據(jù)中心體系。同時(shí),“東數(shù)西算”重大工程建設(shè)全面啟動(dòng),也標(biāo)志著國(guó)家層面對(duì)云網(wǎng)融合的認(rèn)可和推動(dòng)。本文從算與網(wǎng)的協(xié)同發(fā)展歷程出發(fā),探討云網(wǎng)融合下網(wǎng)絡(luò)基礎(chǔ)設(shè)施的發(fā)展方向,并通過(guò)相關(guān)技術(shù)的分析,提出一種具有固移融合、算網(wǎng)融合、云光融合特性的新型組網(wǎng)方案。所提方案以云為核心,進(jìn)行園區(qū)、入云、云內(nèi)、云間四部分組網(wǎng)方案設(shè)計(jì),四部分既可彼此獨(dú)立發(fā)展也能按需靈活組合,適配多樣化業(yè)務(wù)服務(wù)需求。
在全社會(huì)數(shù)字化與智能化的算力時(shí)代中,大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)、區(qū)塊鏈等關(guān)鍵技術(shù)的應(yīng)用帶來(lái)了全球數(shù)據(jù)的爆發(fā)式增長(zhǎng),同時(shí)也成為算力需求攀升的核心驅(qū)動(dòng)力。根據(jù)分析[1],人工智能對(duì)算力資源的需求正以每3.5個(gè)月翻一倍的速度增長(zhǎng);物聯(lián)網(wǎng)行業(yè)對(duì)算力的拉動(dòng)效應(yīng)也十分顯著,預(yù)計(jì)到 2025 年,全球物聯(lián)網(wǎng)設(shè)備將超400 億臺(tái),數(shù)據(jù)量將達(dá)到80 ZB,算力將達(dá)到3 300 EFLOPS。然而,隨著摩爾定律的失效,單點(diǎn)算力計(jì)算性能的增長(zhǎng)顯然難以滿足算力需求的指數(shù)級(jí)攀升,如何解決熱點(diǎn)區(qū)域算力資源供需失衡的問(wèn)題是算力發(fā)展面臨的痛點(diǎn)之一。
(1)數(shù)量堆疊,增加算力密度
通過(guò)芯片工藝升級(jí)或芯片數(shù)量堆疊等方式不斷增強(qiáng)單臺(tái)設(shè)備的計(jì)算能力,同時(shí)盡可能部署更多服務(wù)器,增加區(qū)域算力密度。以建立超級(jí)算力節(jié)點(diǎn)的方式,提升熱點(diǎn)區(qū)域的算力能力,勢(shì)必會(huì)產(chǎn)生巨大的成本開銷。當(dāng)區(qū)域算力需求下降時(shí),算力資源將會(huì)閑置。因此,單獨(dú)規(guī)劃建設(shè)算力,資源利用率極低。
(2)易地而建,減低運(yùn)營(yíng)成本
算力服務(wù)器根據(jù)建設(shè)成本易地而建,并利用網(wǎng)絡(luò)強(qiáng)大的連接能力實(shí)現(xiàn)數(shù)據(jù)與資源的有效拉通,降低運(yùn)營(yíng)成本。以東數(shù)西算工程為例,與東部地區(qū)比,西部地區(qū)在能源、氣候、建設(shè)運(yùn)營(yíng)成本上的優(yōu)勢(shì)明顯,通過(guò)網(wǎng)絡(luò)連通東部的海量數(shù)據(jù)與西部的計(jì)算資源,在保障充足算力供給的同時(shí)進(jìn)一步降低算力資源的使用成本。
(3)化整為零,提高算力效率
借助網(wǎng)絡(luò)的強(qiáng)大連通能力將泛在算力資源匯聚成算力網(wǎng)絡(luò),并通過(guò)網(wǎng)調(diào)云、云調(diào)網(wǎng)技術(shù)路線,基于用戶需求實(shí)時(shí)動(dòng)態(tài)分配算力資源,滿足多樣性業(yè)務(wù)差異性服務(wù)需求。利用網(wǎng)絡(luò)匯聚云邊端泛在算力,通過(guò)通信、計(jì)算等多維資源聯(lián)合優(yōu)化編排提升算力利用率,推動(dòng)算力資源普惠性發(fā)展。
現(xiàn)階段僅依靠工藝升級(jí)或數(shù)量堆積的方式暴力解決熱點(diǎn)區(qū)域供需矛盾,將加劇快速增加的業(yè)務(wù)需求與算力基礎(chǔ)設(shè)施的建設(shè)成本間的矛盾。以網(wǎng)強(qiáng)算,利用無(wú)處不在的網(wǎng)絡(luò)連通分布式算力節(jié)點(diǎn),通過(guò)集中調(diào)度分散的算力資源,提升算力資源利用率。然而,要實(shí)現(xiàn)算力服務(wù)像水電一樣的普惠性發(fā)展,就要求網(wǎng)絡(luò)不斷增強(qiáng)傳輸處理能力,以保障數(shù)據(jù)跑得更快、更遠(yuǎn)。
從發(fā)展歷程上看,計(jì)算技術(shù)與網(wǎng)絡(luò)技術(shù)的進(jìn)步總是相輔相成,二者的互補(bǔ)融合持續(xù)推動(dòng)信息技術(shù)的發(fā)展。在傳統(tǒng)封閉式網(wǎng)絡(luò)中,網(wǎng)絡(luò)龐雜、設(shè)備功能單一、通用性不足、設(shè)備更新維護(hù)成本過(guò)高,難以適配業(yè)務(wù)發(fā)展趨勢(shì)。在通信網(wǎng)中,創(chuàng)新地引入云化技術(shù),在使網(wǎng)絡(luò)更加靈活的同時(shí),也激發(fā)了新型云化網(wǎng)元設(shè)備的發(fā)展。以SDN/NFV技術(shù)為例,SDN基于控制面、轉(zhuǎn)發(fā)面分離,利用集中控制器實(shí)現(xiàn)底層硬件的可編程化控制,擺脫硬件對(duì)網(wǎng)絡(luò)架構(gòu)的限制。正是由于算力的不斷增強(qiáng),控制面才有能力以集中方式管控整個(gè)網(wǎng)絡(luò),進(jìn)而通過(guò)開放接口打破傳統(tǒng)網(wǎng)絡(luò)“煙囪式”服務(wù)架構(gòu),實(shí)現(xiàn)網(wǎng)絡(luò)對(duì)用戶服務(wù)的快速響應(yīng)。NFV通過(guò)軟硬件解耦,進(jìn)行軟件功能化與模塊化,并以通用服務(wù)器代替專用封閉的網(wǎng)元設(shè)備,使得網(wǎng)元軟件功能擺脫了對(duì)特定昂貴硬件的依賴,在不影響網(wǎng)絡(luò)性能的同時(shí)極大降低建網(wǎng)成本。同時(shí),基于虛擬化技術(shù),NFV通過(guò)硬件資源池可以彈性伸縮適配業(yè)務(wù)需求,顯著提升硬件利用率,提升網(wǎng)絡(luò)部署的靈活性。
計(jì)算技術(shù)的進(jìn)步將持續(xù)不斷地為網(wǎng)絡(luò)技術(shù)創(chuàng)新發(fā)展注入新動(dòng)能。隨著大數(shù)據(jù)、人工智能、數(shù)據(jù)中心、區(qū)塊鏈等新技術(shù)的快速發(fā)展,以及工業(yè)互聯(lián)網(wǎng)、自動(dòng)駕駛、元宇宙等新型應(yīng)用的不斷涌現(xiàn),網(wǎng)絡(luò)不僅需要承載更高的下行與上行流量、更多樣的業(yè)務(wù),更需要通過(guò)更深層次的云化技術(shù)突破單純的連接功能,為新興業(yè)務(wù)提供差異性、確定性的一體化服務(wù)。
從信息技術(shù)發(fā)展的視角來(lái)看,云網(wǎng)融合已經(jīng)成為算力時(shí)代信息基礎(chǔ)設(shè)施自主創(chuàng)新的重要方向。在網(wǎng)絡(luò)與計(jì)算技術(shù)的聯(lián)合推動(dòng)下,云網(wǎng)融合經(jīng)歷了從1.0階段的云網(wǎng)協(xié)同,到2.0階段的網(wǎng)隨云動(dòng),以及正在步入集成數(shù)據(jù)中心、網(wǎng)、算力、云、大數(shù)據(jù)、AI、安全、綠色多種要素的3.0云網(wǎng)一體全新階段。在云網(wǎng)融合3.0階段,網(wǎng)絡(luò)基礎(chǔ)設(shè)施需要進(jìn)一步向智能化、綜合化方向發(fā)展,為多樣性業(yè)務(wù)提供敏捷智能、安全高效、綠色低碳的一體化資源供給[2],并自適應(yīng)未來(lái)復(fù)雜不確定性新業(yè)務(wù)。具體而言,網(wǎng)絡(luò)基礎(chǔ)設(shè)施應(yīng)滿足但不限于以下需求。
(1)終端靈活安全接入:隨著新業(yè)務(wù)種類的增加,多樣性接入方式進(jìn)一步加劇了網(wǎng)絡(luò)冗雜程度。網(wǎng)絡(luò)基礎(chǔ)設(shè)施亟需打通多種接入模式間的壁壘,為泛在終端提供無(wú)地址約束、敏捷高效、安全可信的接入服務(wù)。
(2)業(yè)務(wù)按需靈活入云:隨著各類應(yīng)用服務(wù)上云進(jìn)程的加快,網(wǎng)絡(luò)需要根據(jù)業(yè)務(wù)需求提供差異化云網(wǎng)資源配置,并按需選擇最優(yōu)入云路徑,提供端到端差異化確定性承載服務(wù)。例如,與云監(jiān)工、訂餐等娛樂(lè)性服務(wù)業(yè)務(wù)相比,遠(yuǎn)程醫(yī)療、遠(yuǎn)程教育等時(shí)延敏感性業(yè)務(wù)要求網(wǎng)絡(luò)提供更低時(shí)延的確定性承載。
(3)數(shù)據(jù)中心高效轉(zhuǎn)發(fā):網(wǎng)絡(luò)帶寬的不斷增長(zhǎng)導(dǎo)致海量數(shù)據(jù)轉(zhuǎn)發(fā)將占用大量的CPU算力資源,這嚴(yán)重制約了數(shù)據(jù)中心網(wǎng)絡(luò)的轉(zhuǎn)發(fā)能力。網(wǎng)絡(luò)亟需通過(guò)算力資源合理管理,提升數(shù)據(jù)轉(zhuǎn)發(fā)能力,帶動(dòng)數(shù)據(jù)中心降本增效。
(4)云間可靠高效互聯(lián):隨著云計(jì)算產(chǎn)業(yè)的發(fā)展與成熟,以云間互聯(lián)為目的的網(wǎng)絡(luò)部署需求與日俱增。在云網(wǎng)融合的大背景下,網(wǎng)絡(luò)需要為云間網(wǎng)絡(luò)提供無(wú)損確定性傳輸。
云網(wǎng)融合的實(shí)現(xiàn)涉及眾多新興網(wǎng)絡(luò)技術(shù)演進(jìn)和前沿技術(shù)創(chuàng)新,本章節(jié)基于當(dāng)前熱點(diǎn)網(wǎng)絡(luò)技術(shù)發(fā)展分析云網(wǎng)融合下承載網(wǎng)的統(tǒng)一運(yùn)營(yíng)、確定傳輸和資源一體編排的實(shí)現(xiàn),進(jìn)一步探討新型網(wǎng)絡(luò)基礎(chǔ)設(shè)施融合新動(dòng)向,并基于網(wǎng)絡(luò)關(guān)鍵技術(shù)分析,提出了一種以云為核心的超融合組網(wǎng)方案。
云網(wǎng)融合的實(shí)現(xiàn)離不開現(xiàn)有網(wǎng)絡(luò)技術(shù)的不斷演進(jìn)與發(fā)展,其中包括基于IPv6承載技術(shù)進(jìn)行云網(wǎng)統(tǒng)一承載,實(shí)現(xiàn)跨網(wǎng)智能開通與運(yùn)維;基于確定性網(wǎng)絡(luò)技術(shù)提供云網(wǎng)融合下接入網(wǎng)、局域網(wǎng)、數(shù)據(jù)中心網(wǎng)絡(luò)、廣域網(wǎng)以及網(wǎng)絡(luò)端到端的確定性保障;基于算力網(wǎng)絡(luò)技術(shù)進(jìn)行云網(wǎng)端多維資源統(tǒng)一管控與調(diào)度,自下而上開展資源融合調(diào)度,徹底打破云網(wǎng)邊界等。
2.1.1 IPv6承載技術(shù)
IPv6不僅可以緩解IPv4協(xié)議地址緊缺的問(wèn)題,而且為云網(wǎng)融合的全面連接、高可靠性提供廣闊的網(wǎng)絡(luò)技術(shù)創(chuàng)新空間[3]。IPv6承載技術(shù)主要包含IPv6單棧相關(guān)技術(shù)和以SRv6為代表的IPv6協(xié)議增強(qiáng)創(chuàng)新技術(shù)。隨著IPv6在全球的規(guī)模部署,互聯(lián)網(wǎng)從雙棧逐步向IPv6單棧演進(jìn)的趨勢(shì)日益明顯[4]。IPv6單棧技術(shù)包括但不限于適用于移動(dòng)網(wǎng)絡(luò)的464XLAT技術(shù)[5]以及適用于多域互聯(lián)網(wǎng)絡(luò)的IPv6-only Underlay Network[6],以上技術(shù)可以在不同場(chǎng)景下實(shí)現(xiàn)在網(wǎng)絡(luò)邊緣對(duì)于IPv4業(yè)務(wù)進(jìn)行接入和承載。構(gòu)建IPv6單棧網(wǎng)絡(luò)不僅可以滿足云計(jì)算、物聯(lián)網(wǎng)和工業(yè)互聯(lián)網(wǎng)等海量編址需求,同時(shí)簡(jiǎn)化網(wǎng)絡(luò)協(xié)議層次、簡(jiǎn)化網(wǎng)絡(luò)運(yùn)維,并且支持基于IPv6地址的人和物的標(biāo)識(shí)管理能力,有利于身份溯源與安全管理。
IPv6協(xié)議增強(qiáng)型技術(shù)包括SRv6技術(shù)、APN6應(yīng)用感知技術(shù)、iFIT技術(shù)、BIERv6技術(shù)等。SRv6技術(shù)簡(jiǎn)化了復(fù)雜的網(wǎng)絡(luò)協(xié)議,可將業(yè)務(wù)意圖翻譯成網(wǎng)元可執(zhí)行的轉(zhuǎn)發(fā)和處理指令,助力靈活端到端連接的建立。APN6利用IPv6數(shù)據(jù)報(bào)文擴(kuò)展頭攜帶相關(guān)應(yīng)用感知信息,使得網(wǎng)絡(luò)感知到業(yè)務(wù)信息,便于提供差異化SLA服務(wù)。iFIT技術(shù)將OAM指令攜帶在IPv6擴(kuò)展報(bào)頭中,進(jìn)行網(wǎng)絡(luò)性能的高精度實(shí)時(shí)檢測(cè)。BIERv6技術(shù)利用IPv6特性的新型組播技術(shù),簡(jiǎn)化網(wǎng)絡(luò)部署并且具有良好的可擴(kuò)展性。IPv6承載技術(shù)能夠有效簡(jiǎn)化網(wǎng)絡(luò)并提升網(wǎng)絡(luò)廣連接、自動(dòng)化、安全性等,是構(gòu)建云網(wǎng)融合中的網(wǎng)絡(luò)基礎(chǔ)設(shè)施必不可少的新技術(shù)。
2.1.2 確定性網(wǎng)絡(luò)技術(shù)
確定性網(wǎng)絡(luò)技術(shù)是構(gòu)建下一代網(wǎng)絡(luò)基礎(chǔ)設(shè)施體系、提升數(shù)據(jù)傳輸服務(wù)質(zhì)量的關(guān)鍵技術(shù)之一,可面向工業(yè)互聯(lián)網(wǎng)、車聯(lián)網(wǎng)等對(duì)網(wǎng)絡(luò)時(shí)延抖動(dòng)、可靠性要求極高的垂直行業(yè),提供確定性的網(wǎng)絡(luò)質(zhì)量保障技術(shù)。確定性網(wǎng)絡(luò)技術(shù)需求廣泛,涵蓋局域網(wǎng)、數(shù)據(jù)中心網(wǎng)絡(luò)和廣域網(wǎng),以及網(wǎng)絡(luò)端到端的確定性。
確定性網(wǎng)絡(luò)技術(shù)的來(lái)源主要是由于終端接入的不確定性,以及網(wǎng)絡(luò)本身的局限性。所謂終端接入的不確定性,是指用戶可隨時(shí)隨地,通過(guò)不同的終端靈活接入網(wǎng)絡(luò)。例如,用戶可使用手機(jī)終端通過(guò)4G/5G等移動(dòng)方式接入互聯(lián)網(wǎng),也可使用寬帶、Wi-Fi等在家中上網(wǎng)。終端接入的位置、方式不同,導(dǎo)致網(wǎng)絡(luò)邊緣側(cè)無(wú)法提供“確定性”的網(wǎng)絡(luò)QoS指標(biāo),進(jìn)而無(wú)法實(shí)現(xiàn)端到端的SLA保障;其次,網(wǎng)絡(luò)本身的局限性也難以保證確定性的傳輸質(zhì)量,比如移動(dòng)網(wǎng)絡(luò)的空口側(cè)傳輸極易受到環(huán)境的影響,傳統(tǒng)IP網(wǎng)絡(luò)在出現(xiàn)高并發(fā)、大流量的場(chǎng)景時(shí)將導(dǎo)致網(wǎng)絡(luò)擁塞和高時(shí)延、高抖動(dòng)。確定性網(wǎng)絡(luò)技術(shù)是一套涵蓋了流量整形、隊(duì)列調(diào)度、時(shí)鐘同步等多維技術(shù)的集合,共同保障網(wǎng)絡(luò)的確定性,其主要包含帶寬確定性、路徑確定性與時(shí)延確定性三個(gè)層面[7]。三種確定性指標(biāo)相互依存,通過(guò)確定性網(wǎng)絡(luò)技術(shù)構(gòu)建一張各類參數(shù)(帶寬、時(shí)延、抖動(dòng)等)均在確定性范圍內(nèi)的可靠網(wǎng)絡(luò),為各行各業(yè)的升級(jí)創(chuàng)新提供基礎(chǔ)。
2.1.3 算力網(wǎng)絡(luò)技術(shù)
算力網(wǎng)絡(luò)技術(shù)作為實(shí)現(xiàn)云網(wǎng)端統(tǒng)一管控的新型網(wǎng)絡(luò)架構(gòu),也是云網(wǎng)融合戰(zhàn)略體系中的一種關(guān)鍵技術(shù)。算力網(wǎng)絡(luò)以網(wǎng)絡(luò)為平臺(tái),通過(guò)網(wǎng)絡(luò)控制面(包含集中式控制器、分布式路由協(xié)議等)收集和分發(fā)服務(wù)節(jié)點(diǎn)的算力、存儲(chǔ)、算法等資源信息,并結(jié)合網(wǎng)絡(luò)信息和上層應(yīng)用(如工業(yè)互聯(lián)網(wǎng))需求,提供最佳的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等資源的分發(fā)、關(guān)聯(lián)、交易與調(diào)配,從而實(shí)現(xiàn)整網(wǎng)資源的最優(yōu)化配置和使用。算力網(wǎng)絡(luò)技術(shù)可以自下而上展開資源融合,徹底打破云網(wǎng)邊界,真正實(shí)現(xiàn)云網(wǎng)一體。
算力網(wǎng)絡(luò)技術(shù)首先需要通過(guò)解決算力與網(wǎng)絡(luò)資源的整合,實(shí)現(xiàn)多維資源的聯(lián)合編排。各大運(yùn)營(yíng)商、通信類廠商都在針對(duì)算力度量、算力標(biāo)識(shí)、算力感知、算力路由等技術(shù)開展研究,希望通過(guò)抽象整合基礎(chǔ)設(shè)施層的各類資源,為用戶的上層應(yīng)用提供保障。其次,抽象后的資源如何為用戶提供算力服務(wù),是提升算力網(wǎng)絡(luò)服務(wù)便捷性的關(guān)鍵一環(huán)。通過(guò)構(gòu)建以用戶需求為核心的算力網(wǎng)絡(luò)交易平臺(tái),解析各類應(yīng)用對(duì)算力的需求并為其匹配最佳資源方案,形成統(tǒng)一的資源供給機(jī)制。最后,為了滿足服務(wù)普惠性需求,算力網(wǎng)絡(luò)技術(shù)在實(shí)際部署層面,主要有集中式部署、分布式部署和混合式部署三種方案。集中式部署方案基于編排管理平臺(tái)集中收錄資源信息,并根據(jù)用戶選擇建立用戶與計(jì)算節(jié)點(diǎn)間的連接;分布式部署方案借助IP路由協(xié)議進(jìn)行資源信息的收集與分發(fā),用戶通過(guò)查找資源信息表選擇適合的計(jì)算節(jié)點(diǎn);混合式部署方案采用分布式資源信息收集、集中式資源交易調(diào)度,滿足用戶需求[8]。
云網(wǎng)一體化的實(shí)現(xiàn)不僅需要網(wǎng)絡(luò)技術(shù)不斷演進(jìn),更需要重視基礎(chǔ)設(shè)施中前瞻技術(shù)發(fā)展。以下基于網(wǎng)絡(luò)中算力與通信的融合發(fā)展,重點(diǎn)從網(wǎng)中有算、算中有網(wǎng)、DPU智能網(wǎng)卡三個(gè)方向探討新型網(wǎng)絡(luò)基礎(chǔ)設(shè)施進(jìn)一步融合動(dòng)向。
2.2.1 網(wǎng)中有算
網(wǎng)中有算是指數(shù)據(jù)在網(wǎng)絡(luò)傳輸?shù)耐瑫r(shí),利用網(wǎng)卡、交換機(jī)、信道等網(wǎng)絡(luò)元素進(jìn)行數(shù)據(jù)處理,有效減少數(shù)據(jù)傳輸再處理產(chǎn)生的時(shí)延,例如在網(wǎng)計(jì)算、空中計(jì)算等技術(shù)。網(wǎng)絡(luò)中交換機(jī)、智能網(wǎng)卡等設(shè)備擁有流處理核心,可以作為執(zhí)行部分計(jì)算任務(wù)的平臺(tái)。將深度學(xué)習(xí)等人工智能模型卸載到智能網(wǎng)卡中[9],數(shù)據(jù)在智能網(wǎng)卡中傳輸?shù)耐瑫r(shí)完成計(jì)算與處理。同時(shí),在網(wǎng)計(jì)算還被證明可以在共識(shí)協(xié)議、在網(wǎng)緩存等多種場(chǎng)景下提升通信系統(tǒng)性能[10]。空中計(jì)算利用信道的疊加特性和節(jié)點(diǎn)的并發(fā)傳輸,直接在空中對(duì)來(lái)自不同用戶的數(shù)據(jù)進(jìn)行快速計(jì)算,實(shí)現(xiàn)通信計(jì)算一體化[11]。此外,空中計(jì)算與分布式架構(gòu)的聯(lián)邦學(xué)習(xí)結(jié)合,在通信時(shí)完成全局參數(shù)匯聚可增強(qiáng)數(shù)據(jù)隱私安全性;與深度學(xué)習(xí)等算法結(jié)合,設(shè)計(jì)適用于人工智能的框架,更好服務(wù)于與機(jī)器學(xué)習(xí)相關(guān)的上層應(yīng)用。
2.2.2 算中有網(wǎng)
算中有網(wǎng)是云網(wǎng)融合發(fā)展的另外一個(gè)理念,通過(guò)網(wǎng)絡(luò)實(shí)現(xiàn)異構(gòu)分布式資源或設(shè)備的統(tǒng)一管控與調(diào)度,從而提供標(biāo)準(zhǔn)統(tǒng)一、高效便捷、安全可靠的服務(wù)。分布式解耦機(jī)框技術(shù)(Distributed Disaggregated Chassis,DDC)深度解耦服務(wù)器設(shè)備、云化管控平面,并基于轉(zhuǎn)發(fā)資源池思想構(gòu)建網(wǎng)絡(luò)云模型,借助網(wǎng)絡(luò)互聯(lián)運(yùn)行遠(yuǎn)端服務(wù)器或數(shù)據(jù)平面的容器,優(yōu)化資源使用方式,實(shí)現(xiàn)資源的按需使用與彈性伸縮[12]。算中有網(wǎng)技術(shù)實(shí)現(xiàn)了基于體系結(jié)構(gòu)的解耦與云化,使得解耦后的設(shè)備通過(guò)網(wǎng)絡(luò)靈活彈性運(yùn)行遠(yuǎn)端資源或服務(wù)功能,從軟硬件維度上全面突破單個(gè)機(jī)框資源限制。
2.2.3 數(shù)據(jù)處理單元智能網(wǎng)卡
傳統(tǒng)以計(jì)算存儲(chǔ)分離為主要特征的計(jì)算機(jī),在運(yùn)行人工智能等大數(shù)據(jù)訓(xùn)練任務(wù)時(shí),需要進(jìn)行頻繁的數(shù)據(jù)讀取、計(jì)算、存儲(chǔ),產(chǎn)生巨大的“數(shù)據(jù)中心稅”開銷。隨著人工智能技術(shù)的不斷發(fā)展,CPU產(chǎn)生的性能損耗、算力開銷、功率損耗以及性能提升帶來(lái)的成本不斷上升,甚至超過(guò)了其承受范圍,成為限制先進(jìn)算法探索的重要因素。數(shù)據(jù)處理單元(Data Process Unit,DPU)以軟件定義技術(shù)、虛擬化技術(shù)為支撐,卸載了CPU中的網(wǎng)絡(luò)、存儲(chǔ)、管理等平臺(tái)軟件,解放了更高成本的主機(jī)CPU算力。以DPU為中心的智能網(wǎng)卡具有節(jié)能減排、提升效率,且節(jié)省空間的優(yōu)勢(shì),成為了云網(wǎng)融合中未來(lái)基礎(chǔ)設(shè)施新設(shè)備的重點(diǎn)突破方向之一。
隨著網(wǎng)絡(luò)技術(shù)的不斷演進(jìn)與新興技術(shù)的革新,云網(wǎng)融合下網(wǎng)絡(luò)基礎(chǔ)設(shè)施的創(chuàng)新升級(jí)可以從接入網(wǎng)、入云網(wǎng)、云內(nèi)網(wǎng)、云間網(wǎng)四部分進(jìn)行開展。通過(guò)對(duì)網(wǎng)絡(luò)關(guān)鍵技術(shù)與基礎(chǔ)設(shè)施融合動(dòng)向的探討,提出一種以云為核心的新型超融合組網(wǎng)方案(見圖1),具體如下。
(1)園區(qū)部分:針對(duì)園區(qū)多種接入方式共存的現(xiàn)狀,提出云原生園區(qū)網(wǎng)方案。在該方案中,網(wǎng)關(guān)設(shè)備上云,并將功能拆解為原子能力,用戶通過(guò)統(tǒng)一網(wǎng)關(guān)接入,按需進(jìn)行網(wǎng)絡(luò)功能服務(wù)化重構(gòu),從而滿足泛在終端接入需求。
(2)入云部分:網(wǎng)絡(luò)需要感知算力資源,基于算力路由獲取全域分布式算力信息。當(dāng)用戶入云時(shí),網(wǎng)絡(luò)根據(jù)用戶業(yè)務(wù)需求為用戶分配最優(yōu)入云路徑,同時(shí)基于確定性網(wǎng)絡(luò)技術(shù)提供云、邊、端全連接的確定性承載。
(3)云內(nèi)部分:為提升數(shù)據(jù)中心效率,提出基于DPU的新型數(shù)據(jù)中心組網(wǎng)方案。該方案利用DPU管理分散的服務(wù)器,當(dāng)業(yè)務(wù)數(shù)據(jù)到達(dá)數(shù)據(jù)中心時(shí),DPU根據(jù)解析結(jié)果決定數(shù)據(jù)的處理位置與芯片類型,并基于I/O處理能力調(diào)配CPU、GPU等不同類型的服務(wù)器。
(4)云間部分:根據(jù)多數(shù)據(jù)中心協(xié)同處理的需求,云間網(wǎng)絡(luò)能夠提供不同地域、不同類型的多云互聯(lián)。為實(shí)現(xiàn)云云協(xié)同、云邊協(xié)同時(shí)的無(wú)損確定性傳輸,提出云+光融合的高效云間互聯(lián)方案。
圖1 新型超融合組網(wǎng)方案
該新型超融合組網(wǎng)方案具備以下三大特征。
? 固移融合
用戶種類與數(shù)量不斷增多,接入方式具有多樣性,且擁有單獨(dú)專用的協(xié)議棧,導(dǎo)致網(wǎng)絡(luò)龐雜,管理維護(hù)難度大。在新型組網(wǎng)方案中,接入網(wǎng)絡(luò)需要將無(wú)線網(wǎng)絡(luò)、物聯(lián)網(wǎng)、光纖固定網(wǎng)絡(luò)等多種接入方式結(jié)合起來(lái),通過(guò)統(tǒng)一的接入網(wǎng)關(guān)實(shí)現(xiàn)多種業(yè)務(wù)場(chǎng)景下的泛在接入。并借助虛擬化和云計(jì)算相關(guān)技術(shù),將不同的網(wǎng)絡(luò)功能通過(guò)統(tǒng)一的基礎(chǔ)設(shè)施呈現(xiàn)出來(lái),實(shí)現(xiàn)固移融合的一體化網(wǎng)絡(luò)供給。
? 算網(wǎng)融合
針對(duì)云、邊、端協(xié)同場(chǎng)景,網(wǎng)絡(luò)需要感知業(yè)務(wù)需求和算力資源,為新型互聯(lián)網(wǎng)業(yè)務(wù)提供通信、計(jì)算、存儲(chǔ)、算法等多種資源的協(xié)同優(yōu)化配置。為滿足用戶的差異化算力需求,在該超融合組網(wǎng)方案中,算力資源需要借助無(wú)處不在的網(wǎng)絡(luò)進(jìn)行調(diào)度與整合,以網(wǎng)絡(luò)為基礎(chǔ)實(shí)現(xiàn)多要素資源的一體化供給,提高算力資源利用效率。
? 云光融合
隨著云業(yè)務(wù)的不斷增加,承載網(wǎng)絡(luò)不僅需要應(yīng)對(duì)大數(shù)據(jù)流量傳輸,還要為特定的垂直行業(yè)提供確定性承載網(wǎng)絡(luò)服務(wù)。新型超融合組網(wǎng)方案充分發(fā)揮光網(wǎng)絡(luò)的高可靠、大帶寬、低時(shí)延特性,為行業(yè)用戶提供云間互聯(lián)的確定性品質(zhì)專線,并通過(guò)云光融合的一體化服務(wù)供給,實(shí)現(xiàn)多業(yè)務(wù)的靈活確定性承載。
新型超融合組網(wǎng)方案的四部分以云為紐帶緊密結(jié)合,同時(shí)可以彼此分解獨(dú)立發(fā)展。以下將分別介紹園區(qū)、入云、云內(nèi)、云間四部分的實(shí)現(xiàn)方案。
園區(qū)存在有線接入、無(wú)線Wi-Fi接入、無(wú)線4G/5G接入等多種接入方式共存的現(xiàn)狀,為滿足企業(yè)用戶多種接入模式的互聯(lián)互通需求,實(shí)現(xiàn)多類型設(shè)備快速接入園區(qū)網(wǎng),接入側(cè)面臨固定和移動(dòng)網(wǎng)絡(luò)無(wú)縫傳輸?shù)奶魬?zhàn)。如圖2(a)所示,現(xiàn)有接入方案已經(jīng)實(shí)現(xiàn)了轉(zhuǎn)發(fā)平面和控制平面的解耦,并對(duì)數(shù)據(jù)管理功能、移動(dòng)性管理、會(huì)話管理功能、用戶平面功能等統(tǒng)一功能進(jìn)行抽象處理。然而,各接入方式彼此獨(dú)立,擁有單獨(dú)的控制面和轉(zhuǎn)發(fā)面,難以滿足泛在終端動(dòng)態(tài)靈活接入。為了提升資源的利用率,實(shí)現(xiàn)設(shè)備到網(wǎng)絡(luò)層面的無(wú)縫連接,提出基于用戶定制的云原生園區(qū)網(wǎng)部署方案。
云原生園區(qū)網(wǎng)的目標(biāo)是實(shí)現(xiàn)對(duì)底層網(wǎng)絡(luò)資源進(jìn)行抽象處理,并通過(guò)多種類型網(wǎng)絡(luò)的轉(zhuǎn)發(fā)面、控制面分離,為用戶提供更加敏捷的服務(wù)。如圖2(b)所示,云原生技術(shù)將虛擬化部署的轉(zhuǎn)發(fā)面和控制面進(jìn)一步云化,將網(wǎng)元功能拆分提取為原子能力,對(duì)控制平面中數(shù)據(jù)庫(kù)服務(wù)、策略服務(wù)、鑒權(quán)服務(wù)、轉(zhuǎn)發(fā)服務(wù)、接入服務(wù)等通用功能抽象化形成單獨(dú)微服務(wù)。在進(jìn)行業(yè)務(wù)請(qǐng)求響應(yīng)時(shí),利用可編程方式,根據(jù)不同接入類型進(jìn)行不同的流程編排,按需彈性組裝原子能力模塊,實(shí)現(xiàn)服務(wù)化重構(gòu),為不同業(yè)務(wù)轉(zhuǎn)發(fā)提供敏捷服務(wù),極大提升資源利用率。
圖2 用戶定制的云原生園區(qū)網(wǎng)方案
通過(guò)固定和移動(dòng)網(wǎng)絡(luò)功能的服務(wù)化,基于云原生技術(shù)架構(gòu)的園區(qū)網(wǎng)不僅實(shí)現(xiàn)固定和移動(dòng)網(wǎng)絡(luò)的同時(shí)部署,而且其良好的兼容性為新業(yè)務(wù)開發(fā)和系統(tǒng)升級(jí)改造提供了極大的創(chuàng)新空間。例如,云原生園區(qū)網(wǎng)憑借微服務(wù)設(shè)計(jì)等技術(shù)改造現(xiàn)有管理系統(tǒng)或吸納新增網(wǎng)元設(shè)備,縮短了業(yè)務(wù)開發(fā)周期,實(shí)現(xiàn)了容量彈性伸縮。用戶定制的云原生園區(qū)網(wǎng)憑借其開放、共享、包容等特性,有效地提升服務(wù)的靈活性和業(yè)務(wù)的適應(yīng)性,并自然適應(yīng)未來(lái)新業(yè)務(wù)的復(fù)雜不確定演進(jìn)。
在傳統(tǒng)網(wǎng)絡(luò)中,數(shù)據(jù)包轉(zhuǎn)發(fā)時(shí)通過(guò)路由表查找到最短路徑,再通過(guò)IP進(jìn)行盡力而為承載,實(shí)現(xiàn)業(yè)務(wù)入云。隨著邊緣計(jì)算、端計(jì)算算力形態(tài)的出現(xiàn),算力資源從單一化的集中式部署方式,往多級(jí)化的分布式部署方式發(fā)展,承載網(wǎng)連接了多種類型的算力資源。在云網(wǎng)融合的大背景下,網(wǎng)絡(luò)需要將算力資源進(jìn)行整合,針對(duì)業(yè)務(wù)場(chǎng)景和用戶需求,通過(guò)權(quán)衡算力資源與網(wǎng)絡(luò)通信性能,為用戶選擇最優(yōu)的入云路徑。
基于算力路由與確定性承載的入云網(wǎng)絡(luò)如圖3所示,在該方案中,用戶通過(guò)算力網(wǎng)關(guān)接入,網(wǎng)關(guān)實(shí)現(xiàn)對(duì)用戶及應(yīng)用需求的多維度感知?;贗Pv6技術(shù),網(wǎng)絡(luò)側(cè)實(shí)現(xiàn)計(jì)算節(jié)點(diǎn)實(shí)時(shí)負(fù)載信息的感知,并根據(jù)通信時(shí)延與算力資源建立路由表,形成以用戶為中心的資源視圖。以用戶對(duì)網(wǎng)絡(luò)時(shí)延、傳輸抖動(dòng)與算力資源類型、算力大小等需求作為選路依據(jù),綜合考慮用戶需求與實(shí)時(shí)的算力、存儲(chǔ)、網(wǎng)絡(luò)等多維資源可利用狀態(tài),為業(yè)務(wù)流選定最優(yōu)的云資源池。
圖3 基于算力路由與確定性承載的入云網(wǎng)絡(luò)
在實(shí)現(xiàn)用戶需求和資源匹配的基礎(chǔ)上,基于算力路由建立用戶與目標(biāo)算力位置的端到端通信鏈路。根據(jù)用戶業(yè)務(wù)的不同需求,入云網(wǎng)絡(luò)可提供高帶寬保障、確定性時(shí)延、抖動(dòng)可控、無(wú)損傳輸多維度的確定性承載,提供端到端的確定性服務(wù)。首先,以用戶峰值帶寬為指標(biāo)明確用戶帶寬需求,通過(guò)上下行帶寬限速實(shí)現(xiàn)帶寬確定性;然后,根據(jù)用戶低時(shí)延、零丟包、高可靠性等不同類型的需求,基于SRv6等技術(shù)為用戶劃分合理路徑,解決傳統(tǒng)IP報(bào)文轉(zhuǎn)發(fā)造成的前后報(bào)文路徑不可控問(wèn)題;最后,在指定的路徑上設(shè)置抖動(dòng)可控的端到端承載方案,消除排隊(duì)轉(zhuǎn)發(fā)抖動(dòng),確保所有報(bào)文的傳送時(shí)延被嚴(yán)格限制在一定范圍內(nèi)。
基于算力路由與確定性承載的入云網(wǎng)絡(luò)方案,可以實(shí)現(xiàn)對(duì)于用戶需求、網(wǎng)絡(luò)算力資源的多維度感知,并根據(jù)業(yè)務(wù)需求提供一線多用、多等級(jí)并存的確定性承載服務(wù)。
在傳統(tǒng)數(shù)據(jù)中心組網(wǎng)方案中,以CPU為核心的服務(wù)器通過(guò)網(wǎng)絡(luò)接口控制器接入Leaf-Spine網(wǎng)絡(luò),多臺(tái)服務(wù)器匯聚形成數(shù)據(jù)中心網(wǎng)絡(luò),參見圖4(a)。當(dāng)業(yè)務(wù)請(qǐng)求到達(dá)數(shù)據(jù)中心后,CPU首先對(duì)數(shù)據(jù)進(jìn)行解析,根據(jù)解析結(jié)果判定數(shù)據(jù)處理位置。隨著數(shù)據(jù)中心數(shù)據(jù)量的增多,數(shù)據(jù)解析將占據(jù)CPU大量算力資源,嚴(yán)重影響了業(yè)務(wù)程序的運(yùn)行效率。
為充分發(fā)揮數(shù)據(jù)中心計(jì)算能力,新型數(shù)據(jù)中心網(wǎng)絡(luò)引入DPU新型處理芯片進(jìn)行網(wǎng)絡(luò)重構(gòu),以提供高性能的數(shù)據(jù)處理能力,方案架構(gòu)如圖4(b)所示,DPU可以嵌入多個(gè)CPU、GPU、FPGA等專用硬件。DPU的專用處理能力分擔(dān)I/O處理,進(jìn)行網(wǎng)絡(luò)中數(shù)據(jù)壓縮/解壓縮、內(nèi)存分配、多線程調(diào)度和數(shù)據(jù)搬運(yùn)等流量處理,實(shí)現(xiàn)純網(wǎng)絡(luò)通信加速。因此,當(dāng)業(yè)務(wù)到達(dá)數(shù)據(jù)中心后,DPU可以取代CPU進(jìn)行數(shù)據(jù)分析,并根據(jù)數(shù)據(jù)解析結(jié)果選擇合適的數(shù)據(jù)處理芯片。DPU在釋放CPU巨量算力的同時(shí),提升I/O性能,適合用于數(shù)據(jù)驅(qū)動(dòng)的人工智能算法處理場(chǎng)景,以及對(duì)時(shí)延要求極高的場(chǎng)景。同時(shí),利用DPU承擔(dān)操作系統(tǒng)ROM的角色管理散亂的邊緣服務(wù)器,有效解決邊緣服務(wù)器鋪設(shè)存放缺乏統(tǒng)一管理的難題。DPU將算力分布在更靠近數(shù)據(jù)發(fā)生的地方,基于網(wǎng)絡(luò)、存儲(chǔ)的虛擬化功能,新型數(shù)據(jù)中心網(wǎng)絡(luò)具有資源靈活調(diào)配的優(yōu)勢(shì),可提升整個(gè)數(shù)據(jù)中心資源池的資源利用效率。此外,針對(duì)加解密、數(shù)據(jù)防火墻等安全防護(hù)需求,將隔離規(guī)則寫入DPU中,在運(yùn)算主體之外做安全防護(hù),有效避免服務(wù)器本身的規(guī)則被服務(wù)器運(yùn)行程序修改,在主機(jī)CPU之外進(jìn)行安全處理,可以在降低CPU開銷的同時(shí),進(jìn)一步增強(qiáng)網(wǎng)絡(luò)的安全防護(hù)。
圖4 基于DPU的新型數(shù)據(jù)中心網(wǎng)絡(luò)
以DPU為基礎(chǔ)的新型異構(gòu)架構(gòu)為數(shù)據(jù)處理提供計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等虛擬化基礎(chǔ)設(shè)施服務(wù),進(jìn)一步實(shí)現(xiàn)數(shù)據(jù)中心網(wǎng)絡(luò)的扁平化和簡(jiǎn)潔化,有助于帶動(dòng)整體數(shù)據(jù)中心降本增效,并加強(qiáng)數(shù)據(jù)中心網(wǎng)絡(luò)的安全防護(hù)。
傳統(tǒng)云間網(wǎng)絡(luò)通過(guò)IP網(wǎng)絡(luò)與光網(wǎng)絡(luò)進(jìn)行互聯(lián),兩種網(wǎng)絡(luò)彼此分離。POD內(nèi)部由實(shí)體路由器等網(wǎng)元設(shè)備組成,并通過(guò)交換機(jī)選擇連通方式(見圖5)。傳統(tǒng)云間網(wǎng)絡(luò)難以滿足數(shù)據(jù)中心間數(shù)據(jù)無(wú)損確定性傳輸?;谠苹腿饩W(wǎng)技術(shù),提出云光融合的云間網(wǎng)絡(luò)部署方案。該方案中,充分利用全光網(wǎng)的能力來(lái)構(gòu)建高容量、高性能、高可靠的新型云間網(wǎng)絡(luò),具有云內(nèi)網(wǎng)絡(luò)簡(jiǎn)潔化和云間網(wǎng)絡(luò)全光化兩大特征。云內(nèi)網(wǎng)絡(luò)依托于NFV技術(shù)將IP層功能進(jìn)行分解,虛擬化的路由功能在服務(wù)器中實(shí)現(xiàn),光傳輸設(shè)備直連云底層基礎(chǔ)設(shè)施中,有效減少背對(duì)背節(jié)點(diǎn)。云間網(wǎng)絡(luò)利用全光網(wǎng)實(shí)現(xiàn)架構(gòu)扁平化、調(diào)度全光化和運(yùn)維智能化,其中主要節(jié)點(diǎn)之間由Full-Mesh連接,通過(guò)光層直達(dá),實(shí)現(xiàn)毫秒級(jí)低時(shí)延、高速大帶寬的網(wǎng)絡(luò)連接。此外,引入SDN理念達(dá)到轉(zhuǎn)發(fā)控制分離、網(wǎng)絡(luò)能力開放的目的,打造端到端智能可控的全光云間網(wǎng)絡(luò)。
圖5 云光融合的云間網(wǎng)絡(luò)方案
該方案基于虛擬化技術(shù)、全光傳輸、全光智能調(diào)度等多種手段實(shí)現(xiàn)云+光+IP的深度融合,利用全光網(wǎng)絡(luò)打造大帶寬、低時(shí)延的云間互聯(lián)網(wǎng)絡(luò),有效服務(wù)于多云協(xié)同業(yè)務(wù)。
以國(guó)家數(shù)字經(jīng)濟(jì)政策和國(guó)家級(jí)重大工程建設(shè)為導(dǎo)向,在業(yè)務(wù)數(shù)字化、技術(shù)融合化、數(shù)據(jù)價(jià)值化的共同作用下,云網(wǎng)融合已進(jìn)入一體化、智能化發(fā)展階段。在云網(wǎng)融合階段,新型數(shù)字基礎(chǔ)設(shè)施勢(shì)必滿足泛在互聯(lián)、確定性承載、多維異構(gòu)資源融合管理的需求。本文提出了具有固移融合、算網(wǎng)融合和云光融合特性的新型超融合云網(wǎng)一體化方案。該方案以云為核心,通過(guò)泛在終端接入、業(yè)務(wù)按需靈活入云、數(shù)據(jù)中心高效轉(zhuǎn)發(fā)和云間高效互聯(lián),實(shí)現(xiàn)自下而上、多網(wǎng)絡(luò)、多要素的融合,為多樣化業(yè)務(wù)提供差異化服務(wù)保障,并助力網(wǎng)絡(luò)基礎(chǔ)設(shè)施自然適應(yīng)未來(lái)新業(yè)務(wù)的復(fù)雜不確定性演進(jìn)。