樓樺
(常州信息職業(yè)技術(shù)學(xué)院計(jì)算機(jī)學(xué)院/軟件學(xué)院 江蘇常州 213164)
基于SNMP網(wǎng)絡(luò)監(jiān)控系統(tǒng)的自適應(yīng)步長設(shè)計(jì)
樓樺
(常州信息職業(yè)技術(shù)學(xué)院計(jì)算機(jī)學(xué)院/軟件學(xué)院 江蘇常州 213164)
基于SNMP(簡單網(wǎng)絡(luò)管理協(xié)議)設(shè)計(jì)的網(wǎng)絡(luò)監(jiān)控系統(tǒng)在設(shè)計(jì)時(shí)經(jīng)常要設(shè)定采集流量參數(shù)的步長。分析了步長取值過大和過小對監(jiān)控系統(tǒng)的消極影響,并對監(jiān)控系統(tǒng)中的步長取值提出了相應(yīng)的策略。應(yīng)用該策略后,監(jiān)控系統(tǒng)在獲取流量參數(shù)時(shí)既控制了不合理定義步長帶來的消極影響,又使系統(tǒng)具備了對所在監(jiān)控環(huán)境的自適應(yīng)能力。
簡單網(wǎng)絡(luò)管理協(xié)議;步長;自適應(yīng)
目前,隨著云計(jì)算基礎(chǔ)設(shè)施的大量構(gòu)建和應(yīng)用,虛擬化服務(wù)的響應(yīng)時(shí)間、吞吐量等核心運(yùn)行參數(shù)愈發(fā)得到網(wǎng)絡(luò)管理人員的關(guān)注和重視[1]?;赟NMP協(xié)議[2]的網(wǎng)絡(luò)監(jiān)控系統(tǒng),獲取流量參數(shù)的OID類型為COUNTER32,這個(gè)變量類型的取值就是對范圍在0~232-1的流量字節(jié)數(shù)進(jìn)行計(jì)數(shù),達(dá)到最大值后跳變?yōu)榱?,其跳變的周期并不是一個(gè)時(shí)間的函數(shù),見圖1。
由于網(wǎng)絡(luò)流量的突發(fā)性和不可預(yù)測性。以及COUNTER32類型的這個(gè)跳變特點(diǎn),導(dǎo)致了設(shè)計(jì)網(wǎng)絡(luò)監(jiān)控系統(tǒng)時(shí)步長定義的復(fù)雜性,引出了監(jiān)控系統(tǒng)流量參數(shù)步長的取值問題。
圖1COUNTER32跳變圖
采用C/S架構(gòu)的網(wǎng)絡(luò)監(jiān)控系統(tǒng)SolarWinds.Engineers.Edition將流量采集步長設(shè)為11秒,因?yàn)閃indows2000家族的操作系統(tǒng)對SNMP數(shù)據(jù)每十秒刷新一次,所以設(shè)定為11秒可以保證所有的刷新數(shù)據(jù)都被記錄并計(jì)算。但對于支持歷史查詢的服務(wù)器監(jiān)控系統(tǒng)來說,每小時(shí)對一個(gè)網(wǎng)絡(luò)接口采集出入流量SNMP參數(shù)的存儲條數(shù)達(dá)到了(3 600x2)/11>650條。當(dāng)對多個(gè)網(wǎng)絡(luò)設(shè)備進(jìn)行監(jiān)控時(shí),單位時(shí)間內(nèi)采集的大量參數(shù)記錄使數(shù)據(jù)量激增,導(dǎo)致前端執(zhí)行查詢效率低下。即使在流量參數(shù)存儲數(shù)據(jù)庫之前采用先統(tǒng)計(jì)后存儲策略,仍然存在統(tǒng)計(jì)算法執(zhí)行效率低、網(wǎng)絡(luò)帶寬占用大的弱點(diǎn),直接影響整個(gè)監(jiān)控系統(tǒng)的穩(wěn)定性。
采用B/S架構(gòu)的流量監(jiān)測系統(tǒng),如廣泛使用的MRTG(The Multi Router Traffic Grapher多路由流量記錄器),通過對網(wǎng)絡(luò)設(shè)備接口每五分鐘采集一次SNMP參數(shù)進(jìn)行統(tǒng)計(jì)并顯示。流量參數(shù)采用COUNTER32變量類型,經(jīng)過計(jì)算,這種默認(rèn)的五分鐘步長對所監(jiān)控設(shè)備的出入流量是有上限的。式(1)計(jì)算了五分鐘的采集步長所支持的設(shè)備接口最大上行(或下行)流量:
接口實(shí)際帶寬如果高于這個(gè)流量最大值時(shí),在一個(gè)五分鐘步長內(nèi)COUNTER32變量類型將進(jìn)行跳變,取出的值將錯(cuò)過數(shù)個(gè)COUNTER32周期,造成的直接后果就是流量計(jì)算結(jié)果不正確,監(jiān)控系統(tǒng)數(shù)據(jù)的可靠性受到極大影響。
綜上所述,在設(shè)計(jì)網(wǎng)絡(luò)監(jiān)控系統(tǒng)的過程中,采集流量參數(shù)的步長取值過大或過小都會對系統(tǒng)穩(wěn)定性和結(jié)果可靠性產(chǎn)生負(fù)面影響。必須設(shè)計(jì)相應(yīng)的策略來獲得系統(tǒng)運(yùn)行環(huán)境在一個(gè)COUNTER32跳變周期內(nèi)的合理步長,也就是所監(jiān)控接口出現(xiàn)最大流量值下的步長。根據(jù)這個(gè)值來判定步長取值的合理性。
本文設(shè)計(jì)的策略是使網(wǎng)絡(luò)監(jiān)控系統(tǒng)采集流量步長的取值具備所在監(jiān)控環(huán)境的自適應(yīng)步長能力。既保證監(jiān)控系統(tǒng)的使用者可以手工定義步長,又通過相應(yīng)的算法避免自定義步長可能會給監(jiān)控系統(tǒng)帶來的消極影響。
策略設(shè)計(jì)如下:在監(jiān)控系統(tǒng)投入運(yùn)行前定義一個(gè)采集流量參數(shù)小步長(如20秒),20秒小步長支持的設(shè)備流量上限:
這個(gè)上限值已經(jīng)完全可以滿足千兆設(shè)備端口的流量監(jiān)控需要。
監(jiān)控系統(tǒng)通過對正常工作日的監(jiān)控環(huán)境進(jìn)行連續(xù)采集,對COUNTER32跳變周期內(nèi)的步長比較計(jì)算,在這個(gè)時(shí)段并沒有數(shù)據(jù)庫的存取操作。本文把這個(gè)比較計(jì)算的采集時(shí)段稱為“學(xué)習(xí)階段”。在這個(gè)“學(xué)習(xí)階段”采集模塊采用最簡單的比較法始終保留最小步長,該階段主要是得到所在監(jiān)控環(huán)境的最小步長。“學(xué)習(xí)階段”結(jié)束后,求出的監(jiān)控環(huán)境最小跳變步長與手工定義的步長進(jìn)行比較,如果大于手工定義的步長則采用手工定義的步長,如果小于手工定義的步長則采用計(jì)算出的最小步長??紤]到流量異常、設(shè)備擴(kuò)容等復(fù)雜因素,在進(jìn)行比較步長之前應(yīng)當(dāng)對計(jì)算出的最小步長乘以一個(gè)環(huán)境冗余系數(shù)X(X≤1,視具體的監(jiān)控環(huán)境來定義大小),然后再與手工定義的步長進(jìn)行比較。在步長確定以后,監(jiān)控系統(tǒng)開始以選擇的步長對所監(jiān)控網(wǎng)絡(luò)設(shè)備進(jìn)行流量參數(shù)采集,并將采集參數(shù)值送往數(shù)據(jù)庫存儲。
實(shí)現(xiàn)自適應(yīng)步長的策略用UML活動(dòng)圖見圖2:
采用自適應(yīng)步長策略的網(wǎng)絡(luò)監(jiān)控系統(tǒng)對三臺比較有代表性的測試服務(wù)器網(wǎng)絡(luò)接口進(jìn)行三十天出流量步長自學(xué)習(xí)。“學(xué)習(xí)階段”為2011年2月10日到2011年3月10日,共29天。
IP地址為202.196.64.122的測試服務(wù)器為FTP服務(wù)器(采用雙網(wǎng)卡負(fù)載均衡)。IP地址為202.196.64.4的服務(wù)器為WEB服務(wù)器。IP地址為61.52.127.251的服務(wù)器為一臺公網(wǎng)做企業(yè)路由的服務(wù)器(雙網(wǎng)卡)。
由系統(tǒng)運(yùn)行結(jié)果圖3可以看到FTP服務(wù)器網(wǎng)絡(luò)接口出流量的最小跳變步長為600秒,在達(dá)到最小步長時(shí)的網(wǎng)絡(luò)接口流量(232×8)/1 024/1 024/ 600=54.61 Mbps.
圖2 自適應(yīng)步長的UML活動(dòng)圖表現(xiàn)
圖3 三臺服務(wù)器三十天自學(xué)習(xí)步長結(jié)果系統(tǒng)截圖(圖中縱坐標(biāo)數(shù)據(jù)單位為秒)
圖4是采用自適應(yīng)步長策略的采集模塊在學(xué)習(xí)過程結(jié)束后自動(dòng)選擇步長值,對 FTP服務(wù)器202.196.64.122(雙網(wǎng)卡負(fù)載均衡)2011年3月12日進(jìn)行出流量參數(shù)采集的小時(shí)均流量統(tǒng)計(jì)結(jié)果樣圖。環(huán)境冗余系數(shù)為33%,采集步長為200秒,圖中數(shù)字單位為Mbps。
圖4 雙網(wǎng)卡單日小時(shí)均流量統(tǒng)計(jì)系統(tǒng)截圖(圖中縱坐標(biāo)數(shù)據(jù)單位為Mbps)
本文設(shè)計(jì)了一種可以適應(yīng)所在網(wǎng)絡(luò)環(huán)境的監(jiān)控系統(tǒng)流量采集步長取值策略,并使用Delphi 7.0作為前臺網(wǎng)絡(luò)監(jiān)控流量參數(shù)顯示平臺,VC++6.0作為網(wǎng)絡(luò)監(jiān)控參數(shù)采集平臺實(shí)現(xiàn)了該策略的測試和調(diào)試。通過運(yùn)行和測試,監(jiān)控系統(tǒng)取得了預(yù)期的設(shè)計(jì)目標(biāo),按照相應(yīng)的部署策略[4]進(jìn)行監(jiān)控部署后增強(qiáng)了整個(gè)監(jiān)控系統(tǒng)的靈活性和可靠性。
[1] “虛擬化與云計(jì)算”小組.虛擬化與云計(jì)算[M].北京:電子工業(yè)出版社,2009:74-75.
[2] DOUGLASE.COMER.Internetworking With TCP/IP Vol 1[M].3版.北京:清華大學(xué)出版社,2002:447-452.
[3] 邁爾斯,漢密爾頓.UML 2.0學(xué)習(xí)指南[M].北京:清華大學(xué)出版社,2007:46-54.
[4] 樓樺.不同監(jiān)控環(huán)境下服務(wù)器監(jiān)控系統(tǒng)部署策略設(shè)計(jì)[J].鄭州輕工業(yè)學(xué)院學(xué)報(bào):自然科學(xué)版,2005(20): 76-78.
Design of Self-adaptive Pace for Net Monitor System Based on SNMP
LOU Hua
(School of Computer and Software,Changzhou College of Information Technology,Changzhou 213164,China)
How to configure pace of collecting network flow parameter is important when designing network monitor system based on SNMP.This paper analyses negative effect on network monitor system brought by improper pace configuration,and proposes the countermeasures for configuring pace of network monitor system.By applying the proposed countermeasures,the network monitor system can avoid the negative effect caused by improper pace configuring and has the ability of self adapting for monitoring environment.
SNMP;pace;self adapting
TP 393.07
A
1672-2434(2011)03-0026-03
2011-03-14
江蘇省現(xiàn)代教育技術(shù)研究2010年度立項(xiàng)課題(2010-R-16078);2010年度常州科教城(高職教育園區(qū))院??蒲谢痦?xiàng)目(K2010205)
樓 樺(1976-),男,講師,從事研究方向:計(jì)算機(jī)網(wǎng)絡(luò)、軟件架構(gòu)