趙倩穎,邢文娟,雷波,蔣林濤
(1.中國電信股份有限公司研究院,北京 102209;2.中國信息通信研究院,北京 100191)
隨著人工智能(AI)、物聯(lián)網(wǎng)等新型技術(shù)的迅速發(fā)展,以及虛擬現(xiàn)實(shí)(VR)/增強(qiáng)現(xiàn)實(shí)(AR)、云游戲等新型業(yè)務(wù)的不斷涌現(xiàn),信息數(shù)據(jù)呈爆炸式增長。IDC《未來算力推動(dòng)企業(yè)邁向數(shù)字化2.0》白皮書報(bào)告,預(yù)計(jì)2024年全球數(shù)據(jù)總量將達(dá)到142.6 ZB。對(duì)各類數(shù)字化應(yīng)用的支撐以及對(duì)海量數(shù)據(jù)進(jìn)行處理,都需要大量的算力資源[1]。新型業(yè)務(wù)催生了邊緣計(jì)算的誕生,未來算力節(jié)點(diǎn)將出現(xiàn)泛在化的特性,云—邊—端多級(jí)泛在算力將逐步落地部署并成為典型的算力基礎(chǔ)架構(gòu),“隨時(shí)隨地,無限算力”成為新興的業(yè)務(wù)訴求[2]。隨之而來的是網(wǎng)絡(luò)流量模型的變化,流量模型從集中式(云—網(wǎng)—端)演進(jìn)到分布式(云—網(wǎng)—邊—端)。從用戶視角來看,不同位置的資源并不是平等關(guān)系,需要綜合考慮用戶到資源距離的不同(即網(wǎng)絡(luò)空間距離)、網(wǎng)絡(luò)狀況的好壞、資源報(bào)價(jià)不同等多方面因素選擇最優(yōu)資源。如何將算力、存儲(chǔ)等資源與網(wǎng)絡(luò)結(jié)合,更好地為用戶提供最合適的資源服務(wù),成為一個(gè)非常重要的研究點(diǎn),算力網(wǎng)絡(luò)應(yīng)運(yùn)而生[3]。
算力網(wǎng)絡(luò)通過無處不在的網(wǎng)絡(luò)連接,整合多級(jí)算力、存儲(chǔ)等資源孤島,結(jié)合網(wǎng)絡(luò)信息(如帶寬、時(shí)延等)與不同類型的用戶需求,為用戶提供最佳的資源分配方案,進(jìn)而實(shí)現(xiàn)整網(wǎng)資源的最優(yōu)化使用。算力網(wǎng)絡(luò)可提高云、邊、端多級(jí)算力協(xié)同工作效率及整網(wǎng)資源利用率,保證服務(wù)靈活動(dòng)態(tài)部署和用戶體驗(yàn)的一致性,用戶無須關(guān)心各類基礎(chǔ)資源的位置和部署狀態(tài),由網(wǎng)絡(luò)協(xié)同調(diào)度各類資源。算力網(wǎng)絡(luò)作為資源分配與網(wǎng)絡(luò)連接的一體化解決方案,將成為未來網(wǎng)絡(luò)技術(shù)體系的重要組成部分[4]。
算力網(wǎng)絡(luò)目前在技術(shù)路線上可以分為集中式、分布式和混合式3種。
(1)集中式
集中式的算力網(wǎng)絡(luò)實(shí)現(xiàn)方案通過算力網(wǎng)絡(luò)平臺(tái)統(tǒng)一收集全網(wǎng)的算力資源、網(wǎng)絡(luò)資源以及其他資源信息,用戶將業(yè)務(wù)需求發(fā)送給該平臺(tái),由平臺(tái)利用全局視角進(jìn)行最優(yōu)化的資源選擇與分配。典型的集中式方案如SDN集中控制器+NFV編排管理體系方案等。
算力網(wǎng)絡(luò)平臺(tái)需要收集各類資源信息進(jìn)行相應(yīng)的抽象與計(jì)算,將算力分配策略發(fā)送給用戶和算力資源池,最終通過調(diào)度網(wǎng)絡(luò)建立相應(yīng)的傳送通道。因此,算力網(wǎng)絡(luò)平臺(tái)需要集成原有的網(wǎng)絡(luò)管理控制單元、業(yè)務(wù)與資源編排單元實(shí)現(xiàn)算網(wǎng)資源的集中管控。從某種意義上,也可以認(rèn)為是集成了算網(wǎng)信息與算網(wǎng)策略的新型網(wǎng)絡(luò)編排調(diào)度系統(tǒng)。
集中式方案實(shí)現(xiàn)簡單,網(wǎng)絡(luò)控制單元的研發(fā)有較成熟的基礎(chǔ)。算力網(wǎng)絡(luò)平臺(tái)處理能力、可靠性及可擴(kuò)展性依賴于運(yùn)營系統(tǒng)對(duì)全網(wǎng)資源的管控能力。
(2)分布式
為了在業(yè)務(wù)狀態(tài)頻繁變化時(shí)對(duì)算力資源進(jìn)行精細(xì)的監(jiān)控和分配,參照分布式路由協(xié)議提出了算力網(wǎng)絡(luò)分布式技術(shù)路線。分布式方案通過擴(kuò)展BGP、IGP等路由協(xié)議,將當(dāng)前的資源信息作為路由信息發(fā)布到網(wǎng)絡(luò),讓網(wǎng)絡(luò)設(shè)備參與算力和網(wǎng)絡(luò)等資源信息的分發(fā)與收集,再由網(wǎng)絡(luò)將計(jì)算任務(wù)報(bào)文路由到相應(yīng)的計(jì)算節(jié)點(diǎn),并利用IP報(bào)文擴(kuò)展字段獲取業(yè)務(wù)需求信息[5]。該方案的實(shí)現(xiàn)需要對(duì)原有路由協(xié)議進(jìn)行擴(kuò)展并在原有的網(wǎng)絡(luò)設(shè)備中擴(kuò)展資源信息分發(fā)與收集的功能。
分布式方案可擴(kuò)展性好,需要對(duì)現(xiàn)有網(wǎng)絡(luò)設(shè)備進(jìn)行改造,技術(shù)成熟度、標(biāo)準(zhǔn)化程度依賴于網(wǎng)絡(luò)設(shè)備的更新。對(duì)于大規(guī)模網(wǎng)絡(luò)的支持能力有待進(jìn)一步驗(yàn)證。
(3)混合式
混合式方案旨在融合上述兩種方案的優(yōu)勢(shì),將集中式方案中算力及網(wǎng)絡(luò)信息收集的能力下放給算力網(wǎng)絡(luò)設(shè)備,從而減輕算力網(wǎng)絡(luò)平臺(tái)的復(fù)雜程度。在該方案中,對(duì)于算力、網(wǎng)絡(luò)等本身具有分布式屬性的資源信息,通過擴(kuò)展路由協(xié)議的方式進(jìn)行分發(fā)收集,關(guān)于資源選擇、路徑?jīng)Q策、用戶需求分析以及交易等功能的實(shí)現(xiàn)則依賴于集中式的算力網(wǎng)絡(luò)平臺(tái)。
因此混合式方案對(duì)于大規(guī)模網(wǎng)絡(luò)支持能力較好,但對(duì)路由節(jié)點(diǎn)以及控制器之間的協(xié)同配合要求高,方案成熟周期較長,需要展開大量研究及實(shí)踐。
鑒于上述3種算力網(wǎng)絡(luò)技術(shù)路線的核心思想,本文提出了一種基于域名解析機(jī)制的算力網(wǎng)絡(luò)實(shí)施方案。該方案使用URL語言將算力、存儲(chǔ)等資源劃分成標(biāo)準(zhǔn)化單元并進(jìn)行統(tǒng)一標(biāo)識(shí),并根據(jù)不同的業(yè)務(wù)需求進(jìn)行分配。用戶通過域名解析服務(wù)器將分配到的URL標(biāo)識(shí)映射成算力資源節(jié)點(diǎn)所對(duì)應(yīng)網(wǎng)絡(luò)位置信息,并通過算力網(wǎng)關(guān)建立與資源池的網(wǎng)絡(luò)連接,從而調(diào)用相應(yīng)的算力、存儲(chǔ)等資源為用戶使用。該方案為算力網(wǎng)絡(luò)技術(shù)的實(shí)現(xiàn)提供了一種新的思路,具有通用性強(qiáng)、易使用、易擴(kuò)展等特點(diǎn)。
基于域名解析機(jī)制的算力網(wǎng)絡(luò)方案主要包含以下六大功能模塊,如圖1所示。
圖1 基于域名解析機(jī)制的算力網(wǎng)絡(luò)方案架構(gòu)
? 算力用戶:指利用算力網(wǎng)絡(luò)尋找相應(yīng)的資源或者服務(wù)的使用方。通常包括需要使用基礎(chǔ)資源的應(yīng)用開發(fā)平臺(tái),需要使用服務(wù)資源的終端用戶。
? 算力資源:指利用算力網(wǎng)絡(luò)向其他用戶提供資源或服務(wù)的供應(yīng)者,算力網(wǎng)絡(luò)提供者所提供的算力資源呈多級(jí)化、泛在化的特點(diǎn)。算力資源池可以是小微型的邊緣計(jì)算節(jié)點(diǎn),也可以是大中型的云計(jì)算節(jié)點(diǎn)或者城域計(jì)算節(jié)點(diǎn)、超算中心等。
? 算力網(wǎng)關(guān):算力網(wǎng)關(guān)可以是物理設(shè)備,也可以是虛擬設(shè)備,用于算網(wǎng)信息和算力用戶請(qǐng)求的收集和轉(zhuǎn)發(fā)。
? 網(wǎng)絡(luò)5.0資源模塊:用戶管理數(shù)據(jù)通信網(wǎng)網(wǎng)絡(luò)資源,一般在網(wǎng)管中設(shè)置管理,并在節(jié)點(diǎn)中實(shí)施,以確??蓴U(kuò)展性。
? 算力資源管理平臺(tái):管理算力資源的平臺(tái),與算力網(wǎng)關(guān)、網(wǎng)絡(luò)5.0資源模塊,進(jìn)行交互;接受算力用戶的算力資源請(qǐng)求,并發(fā)送給算力用戶滿足需求的資源標(biāo)識(shí)。包括算力用戶管理模塊、算力資源管理模塊以及資源選擇和調(diào)度模塊。
? 算力域名映射平臺(tái):用于將算力資源的域名(標(biāo)識(shí)的第一個(gè)字段為節(jié)點(diǎn)的域名)映射成該算力節(jié)點(diǎn)的網(wǎng)絡(luò)地址。
算力資源信息的標(biāo)識(shí)是算力網(wǎng)絡(luò)方案實(shí)現(xiàn)的前提。在域名解析方案中,算力的標(biāo)識(shí)需要具有可讀、可分類、可擴(kuò)展等特性。為了便于算力資源信息的管理,該方案使用URL語言將算力、存儲(chǔ)等資源劃分成標(biāo)準(zhǔn)化單元并進(jìn)行統(tǒng)一標(biāo)識(shí)。對(duì)某一算力資源具體的編碼規(guī)則為:算力單元名/算力類別/算力屬性1/算力屬性2/算力屬性3/…,其中,算力單元名為該算力單元的具體名稱,并且具有唯一性,如天翼云N;算力類別即算力的種類或算力的單位,根據(jù)目前常見的算力分類方法,可以將算力類別分為:等效核、MIps、函數(shù);算力屬性可以包括算力域、服務(wù)器以及可以提供的算力數(shù)量。算力標(biāo)識(shí)示例如圖2所示。
圖2 算力標(biāo)識(shí)示例
URL:tianyicloudN/Core/az1/s1/5表示天翼云N資源是可以提供5個(gè)等效核算力,位于算力域az1服務(wù)器1。
在域名解析方案中,資源信息的收集依靠集 中式方法,由算力資源主動(dòng)將池化后的算力標(biāo)識(shí)信息上報(bào)給算力資源管理模塊,再由算力資源管理模塊按照資源類型進(jìn)行分類,生成資源列表。具體實(shí)現(xiàn)流程如圖3所示。
首先,算力資源及算力用戶在算力資源管理模塊和算力用戶管理模塊進(jìn)行可信認(rèn)證。在確定算力資源和算力用戶可信的前提下,網(wǎng)絡(luò)5.0資源模塊為算力資源及用戶建立到網(wǎng)絡(luò)邊緣的安全連接,從而確保算力資源及算力用戶的可信安全。其次,算力資源在算力資源管理模塊進(jìn)行注冊(cè),并向域名解析平臺(tái)發(fā)送資源域名和其對(duì)應(yīng)的網(wǎng)絡(luò)地址。最后,算力資源管理模塊將已注冊(cè)的算力資源按照類別進(jìn)行分類,算力資源的網(wǎng)絡(luò)信息將通過網(wǎng)絡(luò)5.0資源模塊與算力資源管理平臺(tái)實(shí)時(shí)同步。
算力資源申請(qǐng)及分配流程分為以下4步,如圖4所示。
圖4 資源申請(qǐng)及分配流程
第一步,算力用戶向管理模塊發(fā)送算力申請(qǐng)。用戶申請(qǐng)算力資源的格式為:算力類型/服務(wù)等級(jí)/算力資源數(shù)量,算力用戶管理模塊向資源選擇調(diào)度模塊發(fā)送算力資源請(qǐng)求。資源選擇調(diào)度模塊從算力資源管理模塊獲取資源信息。
第二步,資源選擇調(diào)度模塊根據(jù)算力用戶請(qǐng)求以及資源信息,分配最佳資源給算力用戶,并與網(wǎng)絡(luò)5.0資源模塊確認(rèn)路徑信息,更新相應(yīng)資源表項(xiàng)。
第三步,算力用戶管理模塊根據(jù)資源選擇結(jié)果向算力用戶發(fā)送算力節(jié)點(diǎn)標(biāo)識(shí)URL。算力用戶將算力節(jié)點(diǎn)標(biāo)識(shí)的第一個(gè)字段(算力資源域名),發(fā)給算力域名映射平臺(tái),經(jīng)過算力域名映射平臺(tái)解析,獲得該算力節(jié)點(diǎn)的網(wǎng)絡(luò)地址。
第四步,算力用戶通過算力域名解析平臺(tái)返回的網(wǎng)絡(luò)地址經(jīng)算力網(wǎng)關(guān)和網(wǎng)絡(luò)5.0與分配的算力資源建立確定性連接。
網(wǎng)絡(luò)上的計(jì)算機(jī)通過IP地址進(jìn)行定位,使用具體的網(wǎng)絡(luò)空間IP地址可以定位到對(duì)應(yīng)的主機(jī)。由于IP地址難于記憶,便出現(xiàn)了替代IP地址的域名。通過域名并不能直接訪問某臺(tái)主機(jī)或服務(wù),需要經(jīng)過一個(gè)從域名轉(zhuǎn)換到IP地址的解析過程,這個(gè)過程就是域名解析[6]。在算力網(wǎng)絡(luò)方案中使用域名解析技術(shù),可以實(shí)現(xiàn)算力域名到算力資源網(wǎng)絡(luò)地址的轉(zhuǎn)換,采用該方案可以保證算力資源的易讀性而且在網(wǎng)絡(luò)地址發(fā)生變化時(shí)不影響算力域名。
算力度量技術(shù)是實(shí)現(xiàn)算力網(wǎng)絡(luò)的前提,為算力的感知、管控、服務(wù)提供基礎(chǔ)和標(biāo)準(zhǔn)。算力度量,顧名思義是算力的量化,即使用某個(gè)單位衡量計(jì)算資源的大小。算力的度量包括兩方面:一是量化異構(gòu)的算力資源,二是對(duì)業(yè)務(wù)算力需求的量化。算力的度量與電力等其他資源不同,它的度量方式更加復(fù)雜,其原因包括:由于算力資源的異構(gòu)性,算力資源尚未有統(tǒng)一的單位;其次,同種計(jì)算能力在不同的場(chǎng)景下性能不同,不能僅依靠某個(gè)場(chǎng)景該類算力資源的性能判斷算力資源的大??;業(yè)務(wù)場(chǎng)景復(fù)雜,單個(gè)場(chǎng)景所需的計(jì)算資源種類存在多樣性,需求量化復(fù)雜。因此,試圖將所有算力資源單位進(jìn)行統(tǒng)一面臨很大困難。近期在算力度量方向,可以根據(jù)特性場(chǎng)景及資源類型進(jìn)行歸類,力求尋找簡化、通用的算力度量與建模方案為算力網(wǎng)絡(luò)服務(wù)奠定基礎(chǔ)[7]。
算力交易技術(shù)包含對(duì)業(yè)務(wù)需求的實(shí)時(shí)智能感知及分析,以及根據(jù)業(yè)務(wù)需求為其匹配最佳資源,實(shí)現(xiàn)算力使用者和算力提供者之間的資源交換。除此之外,算力交易還包括:算力計(jì)費(fèi)即通過綜合考慮資源的建設(shè)成本、維護(hù)成本、稀缺性、競(jìng)合關(guān)系指定合理價(jià)格,并依據(jù)算力、網(wǎng)絡(luò)等資源的占用情況生成算力消費(fèi)者的支付賬單以及算力供應(yīng)商的收入賬單;可信交易即確保算力供應(yīng)商服務(wù)資源的可靠性,以及借助區(qū)塊鏈等新型技術(shù)實(shí)現(xiàn)交易的真實(shí)有效可溯源;交易視圖生成即如何以每個(gè)算力消費(fèi)者為中心,生成可供其選擇最佳資源組合的視圖,視圖中應(yīng)包含可供選擇資源組合的算力、存儲(chǔ)、網(wǎng)絡(luò)等信息。
算力編排技術(shù)指將用戶的業(yè)務(wù)需求轉(zhuǎn)化為算力資源需求,通過統(tǒng)一整合全網(wǎng)的算力、網(wǎng)絡(luò)以及其他資源信息,根據(jù)用戶的資源需求以全局視角進(jìn)行最優(yōu)化的資源選擇與分配策略。進(jìn)一步地,根據(jù)算力編排模塊輸出,對(duì)不同位置、不同歸屬、不同結(jié)構(gòu)等算力資源進(jìn)行算力調(diào)度,按需進(jìn)行資源切換。
在網(wǎng)絡(luò)和計(jì)算深度融合的大趨勢(shì)下,網(wǎng)絡(luò)演進(jìn)的核心需求需要網(wǎng)絡(luò)和計(jì)算相互感知、高效協(xié)同,算力網(wǎng)絡(luò)將實(shí)現(xiàn)泛在計(jì)算互聯(lián),實(shí)現(xiàn)云、網(wǎng)、邊高效協(xié)同[8]。在此基礎(chǔ)上,本文探索了一種基于域名解析機(jī)制的算力網(wǎng)絡(luò)方案,為各種算力資源分配統(tǒng)一的標(biāo)識(shí),根據(jù)不同的用戶需求為用戶匹配對(duì)應(yīng)的資源,并證實(shí)了此方案的可用性及有效性。未來6G時(shí)代,隨著業(yè)務(wù)需求與商業(yè)模式的不斷發(fā)展,計(jì)算資源與網(wǎng)絡(luò)資源將會(huì)進(jìn)一步融合,算力網(wǎng)絡(luò)將迎來更大的發(fā)展空間。