洪行
(銅陵有色金屬集團(tuán)企業(yè)管理部,安徽 銅陵 244001)
隨著企業(yè)信息化的飛速發(fā)展和應(yīng)用普及,ERP管理系統(tǒng)、BI商務(wù)智能系統(tǒng)等各類(lèi)重要系統(tǒng)的部署應(yīng)用,網(wǎng)絡(luò)可靠性已經(jīng)成為企業(yè)最關(guān)心的問(wèn)題之一。作為信息化的重要基礎(chǔ),進(jìn)一步提高網(wǎng)絡(luò)的可靠性,最大程度地保障網(wǎng)絡(luò)的連續(xù)正常運(yùn)行,就成了我們今天所必須面對(duì)和需要解決的新課題。
在組建信息通信網(wǎng)絡(luò)的過(guò)程中,交換機(jī)與交換機(jī)之間采用生成樹(shù)算法(Spanning Tree Algorithm)可以實(shí)現(xiàn)它們之間的鏈路冗余,能保證交換機(jī)無(wú)單點(diǎn)故障;交換機(jī)與主機(jī)之間采用鏈路聚合(Link-aggregation)等技術(shù)可以實(shí)現(xiàn)它們之間的鏈路冗余并有效提高鏈路之間的帶寬;網(wǎng)絡(luò)使用多條鏈路,可以實(shí)現(xiàn)在某條鏈路意外故障時(shí),備用鏈路瞬間替代,確保鏈路的穩(wěn)定性。這樣任何單點(diǎn)故障都不會(huì)影響網(wǎng)絡(luò)的連通性。
本文主要討論網(wǎng)絡(luò)鏈路故障判斷機(jī)制,以及如何實(shí)現(xiàn)自動(dòng)判斷、自動(dòng)切換的功能。通常懷疑線路存在故障的時(shí)候Ping一下,根據(jù)Ping的結(jié)果來(lái)判斷線路正常與否,想要實(shí)現(xiàn)自動(dòng)判斷的話,我們就必須引用NQA網(wǎng)絡(luò)技術(shù)。NQA的全名叫網(wǎng)絡(luò)質(zhì)量分析(Network Quality Analysis),是用于測(cè)量端到端網(wǎng)絡(luò)質(zhì)量的,它的原理如下:
(1)根據(jù)用戶設(shè)置,定期執(zhí)行一些操作,最簡(jiǎn)單的操作就是Ping(回聲探測(cè)機(jī)制);
(2)自動(dòng)記錄每次探測(cè)的結(jié)果,如Ping成功就是OK,失敗就是FAILED;
(3)根據(jù)用戶設(shè)置,自動(dòng)根據(jù)結(jié)果采取動(dòng)作,如連續(xù)3次FAILED,那么就觸發(fā)機(jī)關(guān);
(4)觸發(fā)機(jī)關(guān)可以和一些特性關(guān)聯(lián),比如靜態(tài)路由,機(jī)關(guān)一旦被觸發(fā),靜態(tài)路由自動(dòng)失效;
(5)有失效就有生效,也就是線路備份機(jī)制也被啟發(fā)了,所有數(shù)據(jù)切換到備用線路。
從這里我們可以得知NQA相當(dāng)于一個(gè)自動(dòng)代理,執(zhí)行探測(cè)、聯(lián)動(dòng)功能。
以兩臺(tái)異地放置的H3C 7506E交換機(jī)作為核心交換,之間兩條物理鏈路連接——公網(wǎng)VPN鏈路和2M專(zhuān)線鏈路,拓?fù)鋱D如下:
以上靜態(tài)路由的配置,只實(shí)現(xiàn)了默認(rèn)從一條優(yōu)先級(jí)高的鏈路通過(guò),但存在這條鏈路中斷,無(wú)法自動(dòng)切換到另一條鏈路的問(wèn)題,因此我們采用H3C NQA技術(shù)來(lái)解決
Switch A上配置Track組探測(cè)Switch B的地址192.168.1.2是否可達(dá),如果探測(cè)失敗,將Switch A上優(yōu)先級(jí)高的靜態(tài)路由失效
Switch B上配置Track組探測(cè)Switch A的地址192.168.1.1是否可達(dá),如果探測(cè)失敗,將Switch B上優(yōu)先級(jí)高的靜態(tài)路由失效
配置步驟如下:
配置完成后,用戶A 嘗試ping對(duì)端服務(wù)器地址172.16.32.1,反饋正常通訊,此時(shí)查看Switch A路由表,可以看到從優(yōu)先級(jí)較高的專(zhuān)線鏈路通過(guò);
保持用戶A ping對(duì)端服務(wù)器地址以查看鏈路狀態(tài),中斷專(zhuān)線鏈路,可以看到掉3個(gè)ping包,然后恢復(fù),與nqa 3次ping探測(cè)失敗則使靜態(tài)路由失效配置吻合,查看Switch A路由表,此時(shí)從優(yōu)先級(jí)較低的公網(wǎng)VPN鏈路通訊,鏈路自動(dòng)切換成功;
繼續(xù)保持用戶A ping對(duì)端服務(wù)器地址以查看鏈路狀態(tài),恢復(fù)專(zhuān)線鏈路,可以看到掉1個(gè)ping包,然后恢復(fù),此為鏈路自動(dòng)切換的結(jié)果,查看Switch A路由表,此時(shí)從優(yōu)先級(jí)較高的專(zhuān)線鏈路通訊,鏈路自動(dòng)切換,恢復(fù)成功;
1)配置NQA探測(cè)組,其中關(guān)鍵配置是Reaction的配置
2)配置Ttack跟蹤組,并和Reaction綁定
3)將靜態(tài)路由和Track組綁定
4)使能nqa agent和nqa調(diào)度
NQA技術(shù)原理雖然不復(fù)雜,但是很實(shí)用,并且功能強(qiáng)大,大致可以應(yīng)用在兩大方面。一是局域網(wǎng)的網(wǎng)絡(luò)出口鏈路上,對(duì)于網(wǎng)絡(luò)穩(wěn)定性需求較高的企業(yè),必定擁有多條運(yùn)營(yíng)商鏈路,此時(shí)NQA技術(shù)可以實(shí)現(xiàn)故障鏈路自動(dòng)切換;二是跨地域網(wǎng)絡(luò)鏈路的可靠性保障,在重要的系統(tǒng)中,異地網(wǎng)絡(luò)連接往往會(huì)部署雙鏈路,如VPN、專(zhuān)線等,采用NQA技術(shù)可以實(shí)現(xiàn)路由自動(dòng)切換,保障網(wǎng)絡(luò)可靠性與穩(wěn)定性。
在網(wǎng)絡(luò)組建設(shè)計(jì)中,單鏈路存在發(fā)生故障即會(huì)中斷業(yè)務(wù)的隱患,基于NQA技術(shù)的雙鏈路可極大地提高網(wǎng)絡(luò)的穩(wěn)定可靠性。由于其可以自動(dòng)判斷網(wǎng)絡(luò)通暢性、自動(dòng)切換網(wǎng)絡(luò)鏈路,能最大程度的保障網(wǎng)絡(luò)的連續(xù)正常運(yùn)行,因而具有良好的應(yīng)用前景。