熊 余, 李志強, 楊婭婭
(重慶郵電大學 光通信與網(wǎng)絡重點實驗室,重慶 400065)
在云計算推動下,傳統(tǒng)的網(wǎng)絡架構逐漸向以數(shù)據(jù)中心為核心的數(shù)據(jù)中心網(wǎng)絡演進.由于數(shù)據(jù)中心之間數(shù)據(jù)備份及數(shù)據(jù)同步等需求愈發(fā)迫切,亟需通過高效的傳輸網(wǎng)來滿足數(shù)據(jù)中心間的互聯(lián)需求.光網(wǎng)絡憑借大容量、高帶寬、低時延等優(yōu)勢成為互聯(lián)數(shù)據(jù)中心的最佳選擇.顯然,互聯(lián)數(shù)據(jù)中心的光網(wǎng)絡上承載有海量的數(shù)據(jù)業(yè)務,這對網(wǎng)絡的可靠性提出巨大挑戰(zhàn).保護技術以網(wǎng)絡冗余為代價實現(xiàn)了故障業(yè)務的快速恢復,是提高網(wǎng)絡可靠性的重要手段.但是數(shù)據(jù)中心間光互聯(lián)網(wǎng)絡屬于典型的跨層系統(tǒng),其底層是連接數(shù)據(jù)中心的光網(wǎng)絡,上層是由基于數(shù)據(jù)中心業(yè)務服務構成的IP網(wǎng)絡[1].因此,如何結合數(shù)據(jù)中心間光互聯(lián)網(wǎng)絡的結構特點和業(yè)務特點,實現(xiàn)層間信息交互并設計高效跨層保護策略,是需要重點研究的問題.
針對跨層保護問題,最早基于通用多協(xié)議標志交換協(xié)議(Generalized MultiProtocol Label Switching,GMPLS)光控技術文獻[2]在IP over波分復用(Wavelength Division Multiplexing,WDM)中提出跨層保護算法,通過GMPLS協(xié)議作為IP層和光層溝通的橋梁,提高了網(wǎng)絡利用率和傳輸可靠性.近年來,彈性光網(wǎng)絡(Elastic Optical Network, EON)的出現(xiàn)打破了WDM光網(wǎng)絡粗糙的光層資源分配方式,將光層的帶寬分配粒度降低到子載波信道的亞波長量級,大大提高了網(wǎng)絡的帶寬利用率和靈活性[3].文獻[4]提出了IP over彈性光網(wǎng)絡中基于業(yè)務疏導的共享保護策略,仿真表明,所提策略可以有效提高網(wǎng)絡的資源利用率.與此同時,軟件定義網(wǎng)絡(Software Defined Network, SDN)作為新一代管控技術,憑借其集中控制的優(yōu)勢被引入到光網(wǎng)絡中[5].其彈性管道、即時帶寬和可編程控制等特性,能夠滿足未來光網(wǎng)絡發(fā)展的需要.文獻[6]基于軟件定義光網(wǎng)絡(Software Defined Optical Network, SDON)場景,提出一種IP over Optical的多層彈性架構和資源整合圖策略,通過IP層控制器與光層控制器之間的交互,實現(xiàn)了層間的信息共享和資源的統(tǒng)一調度,有效提升了網(wǎng)絡的可靠性.本項目組前期也針對SDON中的可靠性進行過研究,提出控制器部署算法和跨層生存性算法,增強了網(wǎng)絡控制平面的可靠性[7].以上研究雖然提高了網(wǎng)絡可靠性,也對跨層保護有初步研究,但未考慮業(yè)務的多樣性問題.數(shù)據(jù)中心間由于業(yè)務的多樣性,不同業(yè)務的可靠性需求將各不相同.用戶可根據(jù)自己的需要,向服務提供商購買符合自身需求的網(wǎng)絡服務.一般地,用戶和網(wǎng)絡提供商之間會簽訂服務等級協(xié)議(Service Level Agreement, SLA),若出現(xiàn)違背協(xié)議的情況,網(wǎng)絡提供商將向用戶支付大量的賠償[8].可見,針對數(shù)據(jù)中心間光互聯(lián)網(wǎng)絡這一重要場景,面向業(yè)務本身提供可靠性的保護尤為重要.文獻[9]提出一種生存性自適應保護策略,該策略將業(yè)務分為3個等級并提供不同的保護方案.仿真表明,所提策略有效提升了資源利用率,但是其并不能保證業(yè)務的可靠性要求.文獻[10]根據(jù)業(yè)務的重要程度,為業(yè)務設置n條保護光路來達到業(yè)務所需可靠性,其中n的值由業(yè)務的重要程度決定.以上研究雖然保證了用戶對可靠性的要求,但在業(yè)務持續(xù)時間內,保護光路始終存在且所占資源無法被其他業(yè)務利用.而由于數(shù)據(jù)中心間的業(yè)務具有大帶寬的特性,這將導致大量網(wǎng)絡資源在整個業(yè)務持續(xù)時間都被占用,過多的保護開銷嚴重降低了網(wǎng)絡資源利用率.
為此,為了在保證業(yè)務可靠性需求的同時降低保護開銷,文中提出了帶有可靠性感知的跨層動態(tài)保護策略(Reliability-aware Cross-layer Protection Strategy, RCPS).首先,建立軟件定義的IP over彈性光網(wǎng)絡架構,通過控制器間的信息交互實現(xiàn)跨層的可靠性感知,使光層控制器充分了解業(yè)務的實時可靠性.然后光層控制器根據(jù)業(yè)務實時可靠性的變化情況,利用最小資源占用塊釋放方法調整光層的保護資源,從而在充分保證業(yè)務可靠性的前提下達到降低保護開銷的目的.
軟件定義IP over彈性光網(wǎng)絡打破底層光網(wǎng)絡簡單作為IP承載層的局限,將IP層與光層設備中的控制平面抽離出來,形成各自獨立的控制器,然后通過控制器間的協(xié)同工作實現(xiàn)兩層間的流量調度、路徑計算、保護協(xié)作等功能,從而在全網(wǎng)對兩層進行資源優(yōu)化.在此基礎上對網(wǎng)絡架構進行重新設計,如圖1所示.該架構包括IP層和光層,每一層的資源都由該層控制器集中管控.IP層控制器的功能包括:通過相應的接口與IP層OpenFlow使能的路由器(OF-Router)相連,負責收集IP網(wǎng)絡拓撲;通過業(yè)務請求接口來接收數(shù)據(jù)中心間業(yè)務請求,實時監(jiān)測業(yè)務的狀態(tài)并向光層控制器發(fā)送資源調度信息.光層控制器的功能包括:與光層OpenFlow使能的帶寬可變光交叉連接器(OF-BVOS)相連,負責收集光網(wǎng)絡拓撲、光層資源使用情況等;向上層的IP控制器提供資源調度接口,接到IP控制器的資源調度信息后調用底層的彈性光網(wǎng)絡資源來滿足上層業(yè)務需求.
定義1 網(wǎng)絡元件的可靠性r,即在整個服務時間內底層物理鏈路正常工作時間所占的比例,如式(1)所示.
r=tMTBF(tMTBF+tMTTR) ,(1)
其中,tMTBF表示平均無故障時間,tMTTR表示平均故障修復時間.由此得到一條物理路徑的可靠性如式(2)表示.
(2)
其中,rj表示第j條鏈路的可靠性,G表示該條路徑的鏈路集合.同理,多條路徑的聯(lián)合可靠性可以由式(3)來計算.
(3)
其中,Ri表示第i條路徑的可靠性,Q表示n條路徑的集合.
定義2 業(yè)務的可靠性要求Rd,即在業(yè)務請求時間內被正常服務時間所占的比例.業(yè)務的可靠性要求是SLA中最重要的服務質量衡量指標,如式(4)所示:
Rd=TwTd=Tw(Tw+Tf) ,(4)
其中,Tw表示業(yè)務請求持續(xù)時間中正常工作時間,Td表示業(yè)務請求持續(xù)時間,包括Tw和業(yè)務所能容忍的故障時間Tf.
圖2 跨層可靠性感知的信息交互流程
在軟件定義IP over彈性光網(wǎng)絡架構中,IP層控制器和光層控制器通過擴展的OpenFlow協(xié)議分別掌握各層的全局信息.通過控制器之間的信息交互,實現(xiàn)光層即時感知IP層業(yè)務的可靠性需求,并根據(jù)業(yè)務的實時可靠性變化動態(tài)調整光層網(wǎng)絡資源,達到提高網(wǎng)絡資源利用率的目的.其跨層可靠性感知流程如圖2所示.首先,當業(yè)務到來時,IP層控制器對PACKET_IN消息進行分析處理,獲知業(yè)務基本信息.然后將這些信息發(fā)送給光層控制器.光層控制器收到IP層發(fā)送的消息后,在光層為業(yè)務尋找滿足其可靠性要求的光路(包括工作光路和保護光路),并向相關的光交換機發(fā)送FLOW_MOD信息,完成建路過程.為充分滿足業(yè)務的可靠性需求,這里的保護光路可能有多條.建路完成后,光層控制器將為業(yè)務分配的工作光路和保護光路的信息發(fā)送給IP層控制器.在業(yè)務正常傳輸期間,IP層控制器監(jiān)測業(yè)務實時狀態(tài),并判斷是否對保護光路進行釋放,如果達到釋放底層光路的條件,則IP層控制器將釋放保護光路的信息發(fā)送給光層控制器.光層控制器接到信息后,向相應的光交換機發(fā)送拆除冗余保護光路的信息,釋放的光路資源可以被其他的業(yè)務利用.
為滿足IP層業(yè)務對可靠性的要求,傳統(tǒng)可靠性保護一般在整個業(yè)務請求的持續(xù)時間內,保護光路始終存在且所占的資源無法被其他業(yè)務利用.在數(shù)據(jù)中心業(yè)務大帶寬的特點下,這種做法導致大量冗余網(wǎng)絡資源在業(yè)務持續(xù)時間內被占用,嚴重降低網(wǎng)絡資源利用率.而實際上這樣是沒有必要的.為此,這里給定一個數(shù)據(jù)中心間業(yè)務請求r(s,d,φ,R,Td),其中s和d為業(yè)務的源目節(jié)點,φ代表業(yè)務的帶寬請求,R表示業(yè)務的可靠性需求,Td表示業(yè)務的持續(xù)時間.如果業(yè)務已經(jīng)被服務了一段時間ξ,而這段時間內沒有中斷發(fā)生,那對于網(wǎng)絡提供商來說,只需保證在業(yè)務請求剩余的時間Td-ξ內可以有Tw-ξ的正常工作時間即可[11].下面給出實時可靠性的定義.
定義3 實時可靠性R*,即在業(yè)務被正常服務期間,從某一時刻起到業(yè)務結束這段時間內,網(wǎng)絡提供商為保證SLA要求而至少需要為業(yè)務提供的可靠性稱為業(yè)務在該時刻的實時可靠性,如式(5)所示.
R*=(Tw-ξ)((Tw+Tf)-ξ) .(5)
圖3 不同釋放順序下的資源占用塊
由式(5)易知,隨著時間ξ的增加,業(yè)務的實時可靠性是下降的.也就是說,隨著業(yè)務被正常服務時間的增加,網(wǎng)絡提供商可以降低為該業(yè)務提供的可靠性,而這并不影響服務的SLA質量.這就為利用實時可靠性來降低網(wǎng)絡保護開銷提供了契機.根據(jù)上節(jié)所述跨層可靠性的信息交互可知,光層控制器可以時刻感知業(yè)務的實時可靠性變化.在此基礎上,隨著業(yè)務實時可靠性下降,如果在一定時刻,釋放某一條保護光路后,業(yè)務的實時可靠性仍可以被滿足,則釋放該條保護光路.但是在釋放保護光路時,由于保護光路的可靠性以及帶寬不相同導致不同的釋放順序下保護光路的持續(xù)時間也不一樣,因此,對網(wǎng)絡資源的消耗是不一樣的.如圖3所示,同一個業(yè)務請求在不同的保護光路釋放順序下(假設保護光路1的可靠性大于保護光路2,帶寬大小相同),右邊的釋放順序在業(yè)務持續(xù)時間內對網(wǎng)絡資源的占用較少.由此看來,選擇合適的釋放順序可以進一步提高網(wǎng)絡的資源利用率,為此擬設計最小資源占用塊釋放方法來對冗余的保護光路進行釋放.
定義4 資源占用塊(Resource Occupation Block, ROB),即光路在持續(xù)時間內對資源的占用情況,用頻譜和時間的乘積來衡量.
LROB=BT,(6)
其中,B表示光路的帶寬,T表示光路的持續(xù)時間.因此,一個業(yè)務的資源占用塊可以用式(7)表示.
(7)
一個業(yè)務的ROB越小,表示該業(yè)務在其持續(xù)時間內占用網(wǎng)絡資源越少,網(wǎng)絡的資源利用率越高.從圖3可以看出,由于保護光路的釋放順序不同,導致在左邊的釋放順序下業(yè)務的ROB要大于右邊業(yè)務的ROB.由此看來,不同的光路釋放順序影響到業(yè)務的ROB大小.尤其是在數(shù)據(jù)中心間業(yè)務的大帶寬特性下,其影響將更大.為了選擇合理的保護光路釋放順序,達到更好的資源利用率,最小資源占用塊(MinROB)釋放方法的步驟如下:
步驟2 根據(jù)式(5)及每條保護光路的可靠性,可以得到不同釋放方案中每條保護光路何時可以釋放(即保護光路的持續(xù)時間),然后利用式(7)計算每一種釋放方案中業(yè)務的RROB大小.
利用MinROB釋放方法可以最小化業(yè)務在其持續(xù)時間內對資源的占用,有效提高網(wǎng)絡的資源利用率.在此基礎上結合定義3中業(yè)務的實時可靠性,提出帶有可靠性感知的跨層動態(tài)保護策略,其具體步驟如下:
步驟1 當一個業(yè)務請求到來時,IP層的控制器首先對業(yè)務進行分析處理,掌握業(yè)務的源目節(jié)點、帶寬大小、業(yè)務持續(xù)時間以及可靠性需求等信息.
步驟2 IP層的控制器將業(yè)務基本信息發(fā)送給底層的光層控制器,光層控制器在接到IP層控制器發(fā)來的信息之后,首先根據(jù)其源目節(jié)點和帶寬大小,在底層的彈性光網(wǎng)絡中利用k最短路徑算法找到k條鏈路分離的光路,并按可靠性下降的順序排列.如果不存在可行的光路,則阻塞這個請求;否則,轉步驟3.
步驟3 判斷k條光路中可靠性最大的光路是否可以滿足業(yè)務的可靠性需求,如果可以滿足可靠性要求,則選擇可靠性最大的光路作為工作光路,且不為其設置保護光路,轉步驟6;否則,轉步驟4.
步驟5 隨著業(yè)務被正常服務時間的增加,按照MinROB釋放方法中的光路釋放順序,根據(jù)業(yè)務實時可靠性的下降,IP層控制器告知光層控制器,動態(tài)地對保護光路進行逐一釋放,直至只剩下工作光路.
步驟6 工作光路一直持續(xù)到業(yè)務結束,如果在此期間工作光路發(fā)生中斷,則選擇對業(yè)務重路由,轉步驟1.
采用floodlight+mininet作為仿真平臺,在NSF網(wǎng)絡(14節(jié)點,21條鏈路)及COST239網(wǎng)絡(11節(jié)點,26條鏈路)進行仿真.在NSF網(wǎng)絡中,數(shù)據(jù)中心部署在節(jié)點0、5和8上[13]; 在COST239網(wǎng)絡中,數(shù)據(jù)中心部署在節(jié)點2、5和8上[13].假設每條光纖鏈路上有400個頻隙,每個頻隙的帶寬為 12.5 GHz.業(yè)務帶寬請求在 [12.5 Gb/s,100 Gb/s] 上服從均勻分布,為業(yè)務進行頻譜分配時使用首次命中算法[10].業(yè)務請求到達的速率服從參數(shù)為β的泊松分布,業(yè)務持續(xù)時間服從均值為 1/μ的指數(shù)分布,網(wǎng)絡中總負載為 (β/μ) Erlang,仿真時,μ取值為1.底層彈性光網(wǎng)絡中鏈路的可靠性均為0.99,業(yè)務的可靠性需求在[0.980,0.999]上服從均勻分布.
為衡量所提RCPS策略的性能,選擇傳統(tǒng)的專有通道保護(Dedicated Path Protection, DPP)策略、文獻[9]所提的生存性自適應(Adaptive Survivability Approach, ASA)保護策略及文獻[10]所提的多路徑保護(MultiPath Protection, MPP)策略作為對比.其中,DPP策略在工作光路的可靠性無法滿足業(yè)務要求時,最多為其分配一條保護光路,并不保證業(yè)務的可靠性.ASA策略將業(yè)務分為3個等級,對高等級的業(yè)務采用專有保護,中等級的業(yè)務采用壓縮帶寬專有保護,低等級的業(yè)務不設置保護.而MPP策略充分滿足業(yè)務的可靠性要求,對于可靠性要求較高的業(yè)務,為其分配多條保護光路,但在業(yè)務的持續(xù)時間內保護光路上的資源始終被占用.圖4是在兩種網(wǎng)絡拓撲下,所提RCPS策略同兩種對比策略的可靠性滿足率(Reliability Satisfaction Ratio, RSR)對比情況,可以看到,RCPS策略和MPP策略的RSR都是100%,而DPP策略和ASA策略的RSR較低且隨著網(wǎng)絡負載的增加略有下降.
圖4 可靠性滿足率對比情況
圖5為兩種網(wǎng)絡拓撲下,所提RCPS策略同兩種對比策略在保護開銷(Protection Overbuild, PO)上的對比情況,其中PO為保護光路占用資源和工作光路占用資源的比值.MPP策略選擇為業(yè)務設置多條保護路徑來滿足可靠性要求,對于優(yōu)先級較高的業(yè)務可能存在多條保護路徑,故MPP的PO最高.而DPP策略最多為業(yè)務設置一條保護路徑,當工作光路的可靠性滿足業(yè)務的需求時,不為業(yè)務設置保護路徑,故DPP的PO在1附近且略低于1.ASA策略只對優(yōu)先級高的業(yè)務設置一條保護路徑,對于中等優(yōu)先級的業(yè)務采用壓縮專有保護,不重要的業(yè)務不設置保護,故其PO要小于DPP策略.RCPS策略的PO最低,甚至比MPP節(jié)省了約49%的保護開銷,這是因為RCPS策略采用了動態(tài)保護策略,雖然也采取設置多條保護光路來充分滿足業(yè)務的可靠性需求,但是隨著業(yè)務的實時可靠性下降,可以動態(tài)釋放冗余的保護光路,因此,有效地減少了PO.
圖5 保護開銷對比情況
圖6為所提RCPS策略同3種對比策略在帶寬阻塞率(Bandwidth Blocking Ratio, BBR)上的對比情況.同時為了說明MinROB釋放方法的合理性,這里對RCPS without和RCPS也進行了對比,其中RCPS without表示保護光路按隨機順序進行釋放.隨著網(wǎng)絡負載的增加,4種策略的BBR都隨負載的增加而增加.因為MPP需要確保業(yè)務所需的可靠性得到滿足,對于可靠性要求較高的業(yè)務,要消耗更多的保護資源,因此,BBR最高.而DPP策略最多為業(yè)務設置一條保護路徑,所以BBR低于MPP策略.ASA策略的保護開銷小于DPP策略的,所以其阻塞率也要小于DPP策略的.RCPS策略和MPP策略一樣,需要確保業(yè)務的可靠性得到滿足.但是隨著業(yè)務的正常傳輸,業(yè)務的實時可靠性需求在下降,此時可以動態(tài)釋放冗余的保護路徑,因此,網(wǎng)絡中將會有更多可用資源用來成功建立業(yè)務請求,從而減少被阻塞的業(yè)務請求數(shù)量.與MPP策略相比,RCPS策略阻塞率降低了約58%.RCPS without和RCPS兩種策略中RCPS的BBR較低,這是因為MinROB釋放方法可以進一步減少業(yè)務在持續(xù)時間內占用的網(wǎng)絡資源,與隨機順序釋放保護光路相比,有更多的可用資源來承載新到來的業(yè)務,從而取得更小的網(wǎng)絡阻塞率.
圖6 阻塞率對比情況
為了使業(yè)務所需的可靠性得到充分滿足,同時最小化保護開銷,文中提出了帶有可靠性感知的跨層動態(tài)保護策略.該策略首先建立IP over彈性光網(wǎng)絡架構,通過IP層和光層設置各自的控制器來實現(xiàn)對網(wǎng)絡狀態(tài)的全局掌握; 其次,在IP over彈性光網(wǎng)絡架構中,通過控制器間的信息交互,實現(xiàn)跨層可靠性感知,使光層了解業(yè)務的實時可靠性;最后,提出RCPS策略,光層控制器根據(jù)業(yè)務的實時可靠性的變化,在不違背SLA的前提下,利用MinROB方法動態(tài)地釋放冗余的保護光路.仿真試驗表明,在保證業(yè)務的可靠性得到滿足的前提下,相對于MPP策略所提RCPS策略的保護開銷降低了49%,同時網(wǎng)絡阻塞率降低了58%.
[1] YANG H, ZHAO Y, ZHANG J, et al. Multi-stratum Resilience with Resources Integration for Software Defined Data Center Interconnection Based on IP over Elastic Optical Networks[C]//Proceedings of the 2014 European Conference on Optical Communications. Piscataway: IEEE, 2014: 6964052.
[2] YE Y, ASSI C, DIXIT S, et al. A Simple Dynamic Integrated Provisioning/Protection Scheme in IP over WDM Networks[J]. IEEE Communications Magazine, 2001, 39(11): 174-182.
[3] XIONG Y, FAN X, LIU S. Fairness Enhanced Dynamic Routing and Spectrum Allocation in Elastic Optical Networks[J]. IET Communications, 2016, 10(9): 1012-1020.
[4] TANG F, LI L, CHEN B, et al. Mixed Channel Traffic Grooming in Shared Backup Path Protected IP over Elastic Optical Network[C]//Proceedings of the 2017 Optical Fiber Communications Conference and Exhibition. Piscataway: IEEE, 2017: 1-3.
[5] 左青云, 陳鳴, 王秀磊, 等. 一種基于SDN的在線流量異常檢測方法[J]. 西安電子科技大學學報, 2015, 42(1): 155-160.
ZUO Qingyun, CHEN Ming, WANG Xiulei, et al. Online Traffic Anomaly Detection Method for SDN[J]. Journal of Xidian University, 2015, 42(1): 155-160.
[6] YANG H, ZHANG J, ZHAO Y, et al. Global Resources Integrated Resilience for Software Defined Data Center Interconnection Based on IP over Elastic Optical Network[J]. IEEE Communications Letters, 2014, 18(10): 1735-1738.
[7] 熊余, 董先存, 李圓圓, 等. 軟件定義光網(wǎng)絡中基于最小點覆蓋的控制平面跨層生存性設計[J]. 電子與信息學報, 2016, 38(5): 1211-1218.
XIONG Yu, DONG Xiancun, LI Yuanyuan, et. al. The Cross-layer Survivable Design of Control Plane Based on Minimum Point Covering in Software Defined Optical Network[J]. Journal of Electronics & Information Technology, 2016, 38(5): 1211-1218.
[8] GAO Y, GUAN H, QI Z, et al. Service Level Agreement Based Energy-efficient Resource Management in Cloud Data Centers[J]. Computers and Electrical Engineering, 2014, 40(5): 1621-1633.
[9] AIBIN M, WALKOWIAK K, SEN A. Software-defined Adaptive Survivability for Elastic Optical Networks[J]. Optical Switching and Networking, 2017, 23: 85-96.
[10] YANG H, CHENG L, YUAN J, et al. Multipath Protection for Data Center Services in Openflow-based Software Defined Elastic Optical Networks[J]. Optical Fiber Technology, 2015, 23: 108-115.
[11] LUCERNA D, TORNATORE M, MUKHERJEE B, et al. Trading Availability among Shared-protected Dynamic Connections in WDM Networks[J]. Computer Networks, 2012, 56(13): 3150-3162.
[12] XIONG Y, LI Y, DONG X, et al. Exploiting SDN Principles for Extremely Fast Restoration in Elastic Optical Datacenter Networks[C]//Proceedings of the 2016 IEEE Global Communications Conference. Piscataway: IEEE, 2016: 7841831.
[13] MA C, ZHANG J, ZHAO Y L, et al. Bandwidth-adaptability Protection with Content Connectivity against Disaster in Elastic Optical Datacenter Networks[J]. Photonic Network Communications, 2015, 30(2): 309-320.