【摘 ?要】NFV技術降低了運營商組網的成本,實現了網絡的快速彈性部署,但同時也帶來了諸多問題。為了解決網元分層解耦之后故障定位和故障修復變得復雜,NFV網絡運維難度增加的問題,提出了一種自適應回環(huán)診斷算法。該算法基于自適應診斷策略,針對各類多網元網絡進行故障診斷的特性,利用MANO的集中管控,實現對VNF層故障的高效診斷。該算法理論上能達到100%的診斷效率,并且無論系統中有多少個VNFC發(fā)生故障都能準確進行定位。
【關鍵詞】NFV;MANO;VNF;自適應診斷;回環(huán)診斷算法
doi:10.3969/j.issn.1006-1010.2019.12.016 ? ? ?中圖分類號:TN929.5
文獻標志碼:A ? ? ?文章編號:1006-1010(2019)12-0084-05
引用格式:云龍,陽志明. NFV下自適應診斷策略的運用[J]. 移動通信, 2019,43(12): 84-88.
Application of Adaptive Diagnosis Strategy in NFV
YUN Long, YANG Zhiming
(China Telecom Intelligent Network and Terminal Research Institute., Guangzhou 510630, China)
[Abstract]?NFV technology reduces the cost of operator networking and enables a rapid and flexible network deployment, while it also brings some challenges. Since the hierarchical decoupling of network elements complicates fault location and repair and increases the difficulty of NFV network operation and maintenance, an adaptive loopback diagnostic algorithm is proposed to solve these problems. The proposed algorithm is based on an adaptive diagnosis strategy, and performs fault diagnosis for various types of multi-element networks, and an efficient diagnosis of VNF layer faults is achieved using the centralized management of MANO. The algorithm theoretically reaches 100% diagnostic efficiency, and accurately locates faults no matter how many VNFC exists in the system.
[Key words]NFV; MANO; VNF; adaptive diagnosis; loopback diagnostic algorithm
0 ? 引言
在傳統的通信網絡中,每一類服務都由特定的專有服務器的專用設備承載,并通過專有的通信鏈路進行通信。隨著業(yè)務種類的持續(xù)增加,現網累積了大量的專有設備,這就給運營商的運維帶來了極大的不便。
為解決專有網絡業(yè)務增長帶來的諸多問題,實現新業(yè)務的快速部署,達到網絡的高度自動化和動態(tài)配置,同時降低企業(yè)的支出和運營成本,NFV技術應運而生。NFV通過使用基于行業(yè)標準的X86服務器、交換機、存儲設備等通用硬件,取代專有設備,利用虛擬化技術實現網絡功能的承載[1]。ETSI提出的NFV架構[2]已成為業(yè)界認可的事實標準(如圖1)。NFV架構可從縱向解構為:基礎設施層、虛擬網絡層和運營支撐層;從橫向可解構為:業(yè)務網絡域和管理編排域(MANO, Management and Orchestration)。NFV通過MANO能夠為系統提供可管理、可控制、可運營的服務環(huán)境[3]。MANO的本質是實現VNF以及NS(Network Service,網絡服務)的自動化部署、彈性調度及高效運維管理[4]。
圖1 ? ?ETSI提出的NFV框架
NFV的引進使得運營商的網絡部署成本降低,并能快速適應網絡需求的變化,但網元分層解耦后的故障定位問題增加了運維的復雜性,在一定程度上對NFV的應用前景產生了影響[5]。
系統級故障診斷作為一種針對多處理器系統的故障處理方法,為NFV的故障處理提供了一種新的解決方案。隨著業(yè)務的擴展,NFV系統的規(guī)模也會越來越大,進行系統級診斷也變得非常有必要。
1 ? 系統級故障診斷的相關概念
系統級故障診斷其研究的是如何根據已有的癥狀推出系統的故障節(jié)點的位置。根據已有癥狀找出系統的故障模式的這一過程就被稱之為“診斷”。
(1)系統級故障診斷[6]?;舅枷胧亲屜到y中的處理機相互測試,產生一組測試結果,隨后對該測試結果進行分析,最終找出故障設備。這種方法不需要使用專門的測試設備,僅依靠系統內的處理機和通信鏈路進行,在不增加系統額外成本的情況下就可以實現系統的快速自診斷。
(2)自適應測試策略[7]。這是系統級故障的一種具體診斷方法。它是指每次只選擇執(zhí)行部分測試,然后根據這些部分測試的結果進行診斷。該種策略運用“集中控制,分散處理”的思想,允許分時分塊地對系統進行測試,對于系統中已安排的測試,可以先執(zhí)行某些測試,根據得到的診斷結果動態(tài)地安排后面的測試,利用已確定節(jié)點測試未確定節(jié)點,直到系統中所有故障節(jié)點都被檢測出來。
(3)PMC模型及其相關約定。為了更加方便地研究多機系統,一般將具體的拓撲網絡抽象為圖,實際網絡中的通信鏈路抽象為測試邊,網絡中的各類硬件設備抽象為節(jié)點。系統中所有測試結果的集合稱為癥狀。在一個系統中,節(jié)點的狀態(tài)分為故障和非故障兩種,任意兩個節(jié)點之間的測試結果用0和1來表示,當測試節(jié)點ai測試被測試節(jié)點aj為故障時用1表示;反之,ai測試aj為非故障時用0表示,因此,一個系統的癥狀即為一串0和1相間的序列。測試結點正常的時候,測試結果是可靠的;而當測試結點故障時,測試結果是不可靠的。表1給出了PMC模型具體的診斷規(guī)則[8]:
表1 ? ?PMC模型的診斷規(guī)則
測試節(jié)點狀態(tài) 被測試節(jié)點狀態(tài) 測試結果
非故障 非故障
故障 0
1
故障 非故障
故障 0或1
0或1
(4)分治回環(huán)診斷算法[8]。這是一種自適應的診斷算法,其主要思想為將整個系統劃分為多個包含回測邊的01序列,對每個01序列進行診斷得出故障節(jié)點位置,然后修復故障節(jié)點,最終將所有故障節(jié)點診斷出來。
2 ? 自適應測試策略在NFV故障診斷中的
應用
2.1 ?NFV對故障管理的影響分析
網絡NFV化之后,對軟硬件進行了分層解耦,引入了更多的廠商,這就使得系統內可能發(fā)生故障的點更多。發(fā)生故障時,故障的定位以及責任劃定也更為復雜。在故障處理方面,NFV網元相較于傳統的網元有很大不同,傳統網元設備都是軟硬件一體化,當發(fā)生故障時,只需定位到具體的物理設備進行排查即可。而在NFV下,NFVI層、虛擬化層、應用軟件層、業(yè)務邏輯層都會發(fā)生故障[9]。因此,如何對故障進行定位和修復成為NFV系統是否可靠的關鍵。文獻[9]給出了一種NFV故障關聯及故障自愈方案,對NFV下的故障處理采用“逐層關聯、分類管理”的辦法,對物理資源、虛擬資源、虛擬網元、網絡服務進行垂直式的逐層關聯,對資源故障和業(yè)務故障進行分類管理,為NFV場景下的故障定位和處理提供了很好的指引。
根據NFV的技術原理,一個虛擬業(yè)務網絡可以包含多個VNF和VL(不同VNF之間的虛擬連接),一個VNF可以劃分為一組VNFC(Virtualised Network Function Component,虛擬化網絡功能模塊的內部組件)和VL(某個VNF內的虛擬連接)。這些VNFC和VL構成了一個巨大的網絡拓撲結構。
將VNF解構為VNFC,網絡功能細化為更小的功能,這樣能提供更靈活的應用,更快的響應,發(fā)生故障時能更加精確地定位故障位置。
目前,NFV下網絡單元有動態(tài)擴縮容的場景,但大多數情況下網絡保持穩(wěn)定,也就是說,網絡在搭建完成之后,網絡拓撲結構基本不變,這就符合了系統級診斷的要求。
2.2 ?系統級診斷在NFV下運用的可行性
自適應診斷的策略能夠屏蔽不同設備間的性能差異,只要求這些物理或者虛擬網元具備相應計算功能即可。同時自適應診斷策略的容錯性很高,也就是說當系統中同時出現多處故障時,利用自適應診斷的相應方法仍能正確地確定故障位置。
系統級診斷要求網絡中的節(jié)點都有產生和接收信號的能力,在實際的電信網絡中,無論是物理設備還是虛擬網元都能產生和接收相應的測試信號并且處理這些信號,這就給系統級診斷的相關方法在電信網絡中應用提供了基礎。
運營商發(fā)展NFV最重要的目標是基于通用設備,利用虛擬化的技術實現傳統電信設備的功能。NFV的虛擬網絡層直接與網絡業(yè)務相關,可將物理網元映射為VNF,在邏輯上實現IMS、EPC等網元的功能,利用VNF在基礎設施層提供的服務是NFV的主要運營目標,這意味著VNF左右著網絡虛擬化的前景。在云計算時代,網絡功能升級是由軟件來實現的,對硬件的依賴度很低,而像微服務、容器、Devops這些新技術的賦能對象應該是VNF,可見VNF在整個NFV中的重要性。
NFV架構下實現自動化運維的關鍵環(huán)節(jié)就是VNF生命周期管理,這也是MANO的核心支撐要求。MANO在進行VNF的部署時,根據系統實際的需求以及基礎硬件設施的性能進行自動化編排,實現VNF的實例化、擴縮容、查詢、轉發(fā)、終結、自愈等功能。當VNF發(fā)生故障時,MANO能夠依據自適應診斷的相關策略確認故障位置,對故障進行修復。大致步驟是OSS/MANO進行集約管理,根據網絡拓撲結構,提前安排好測試方向和測試輪回。按照一定的自適應診斷算法診斷出故障位置,修復一部分故障,然后再次安排一輪自適應診斷,修復一部分故障,如此反復,最終修復系統中所有故障。
上文提到了網元功能分層解耦讓故障處理變得復雜,要涉及到故障關聯、責任劃分、組織結構調整等問題。同時,由于VNF在NFV中的重要性,因此本文只從宏觀上針對VNF層面的故障進行診斷。解決好VNF層的故障,在很大程度上解決了NFV下最大的故障處理問題。
系統級診斷策略的實現需要系統中的節(jié)點能產生并處理測試信息,同時要求有相關模塊對整個系統進行測試規(guī)劃、整體結果分析等。在NFV中,VNF具有相當的計算能力,能處理系統分配的測試信號;MANO進行中央控制,完成整個系統的測試序列劃分,對診斷癥狀進行分析,對故障節(jié)點進行修復??梢奛FV自身的特性滿足了系統級診斷策略實施的條件。
系統級故障診斷能屏蔽各網元和鏈路之間的信息處理方式,只從宏觀層面上關注各節(jié)點之間是否產生測試,不關注測試是如何產生的,當處理機之間有性能功能方面的差異時也不會影響整體的測試結果[10]。盡管VNF中各VNFC有功能和性能差異,系統級故障診斷策略仍適用。
2.3 ?分治回環(huán)診斷算法對VNF層的診斷