張嵩
中國電信股份有限公司天津分公司
電信設備的運維過程中,光模塊的管理、測試、數(shù)據(jù)收集、模塊調(diào)撥,是電信日常維護中一項必不可少的工作。隨著互聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)設備量持續(xù)大規(guī)模增長,板卡密度不斷增加,光模塊作為可跨設備利用的資源,其可用性、安全性、可靠性顯得尤為重要。另外,對一些擴容、網(wǎng)絡割接工程、軟件升級等,工程前后也需要對光模塊進行檢查??梢姽饽K管理是一項非常重要的維護工作。
現(xiàn)有對光模塊的管理比較粗放,實施方法是工作人員按照自己所管轄的設備進行管理,采取telnet登錄設備的方式逐個查看,設備型號繁雜,命令種類較多,且無法記錄和統(tǒng)一管理。這種查看方式存在很大缺陷,首先,如果對單個設備模塊進行逐個查看,按照現(xiàn)有設備的端口密度,完成查看共需要30分鐘,若完成多臺設備將占用大量人力工時;其次,由于長時間的重復操作使工作人員容易產(chǎn)生厭煩情緒,稍有馬虎就導致錯誤,這使得到的結果的準確性不高,對后續(xù)的故障定位排除、業(yè)務割接形成干擾;再有,即使今天完成查看確認,明天可能還需要再次查看,工作陷入無休止的重復之中。諸如此類的工作必將接踵而來。這讓我們不得不去思考這樣一個問題——能不能讓機器來代替人進行管理呢?答案是肯定的,就是我們所研發(fā)的數(shù)據(jù)網(wǎng)光模塊管理系統(tǒng)。
光模塊管理系統(tǒng)的設計思想就是用機器來代替人工勞動,盡量將人從煩冗的光模塊管理工作中解放出來。數(shù)據(jù)網(wǎng)智能化工程中引入了光模塊管理系統(tǒng),可以預見到的效果有:
(1)大大節(jié)省人力工時。顯然,之前由人來完成的工作被機器替換了,一方面,將人從此項工作中解放出來,另一方面,也增添了其他工作的人力資源。
(2)大大縮短確認時長。系統(tǒng)通過程序登錄設備并和設備MIB庫進行比對,較短的時間就可輪詢一遍所有端口。
(3)準確率可達到100%。這是因為測試管理過程全部通過系統(tǒng)自動完成,消除了人為因素干擾。
(4)模塊管理率將提升到100%。因為采用了軟件邏輯控制,自動定時采集模塊信息,對異常情況進行人工確認,避免模塊丟失、誤用等情況的發(fā)生。
圖1 系統(tǒng)架構圖
系統(tǒng)架構如圖1所示,該系統(tǒng)總體上分成兩大部分,第一部分是網(wǎng)絡管理部分。該部分由網(wǎng)管軟件、數(shù)據(jù)庫、采集服務器、網(wǎng)絡設備等組成。網(wǎng)管軟件制定一定的采集策略,通過TCP/IP網(wǎng)絡控制采集機對IP網(wǎng)中的網(wǎng)絡設備進行采集。這個時候,采集機就替換了工作人員操作指令,自動發(fā)送出查看指令。采集上來的數(shù)據(jù)存入數(shù)據(jù)庫,并通過應用服務器的程序進行歸并、整理、分析、生成前臺可管理的頁面。
采集流程如圖2所示,
(1)在系統(tǒng)中輸入所要采集的設備信息(設備名稱、IP地址、管理口令、SNMP口令等);
(2)網(wǎng)管進行設備登錄,采集設備基本信息,如設備類型,版本信息等;
(3)執(zhí)行命令采集設備模塊及板卡信息;
(4)將采集的模塊信息進行入庫管理,以便后續(xù)調(diào)用分析。
圖2 采集流程圖
按照用戶提供的每種設備型號的mib庫,把相應的設備mib庫信息都存儲在服務器上,每天定時通過使用snmpwalk采集設備的OID信息方式采集全網(wǎng)可管設備模塊信息(與存儲在服務器上的mib信息作比對),把采集到的現(xiàn)網(wǎng)的所有模塊信息存儲到數(shù)據(jù)庫中。
按采集到模塊的序列號,讀取OpticalView中的現(xiàn)網(wǎng)采集到的光模塊,并與OpticalModule表中的光模塊進行比對。OpticalView中序列號非空的光模塊記為A。OpticalModule中序列號非空的光模塊記為B,按序列號進行比對,如果A中有,B中沒有,則為新增硬件,插入OpticalModuleCheck表一條新增記錄(OMCheckSEQ,系統(tǒng)時間,add,A中的設備ID,硬件序列號,所在端口,硬件類型,硬件描述,硬件型號,硬件版本)。如果A中沒有,B中有,則為刪除硬件,插入OpticalModuleCheck表一條刪除記錄(OMCheckSEQ,系統(tǒng)時間,del,B中的設備ID,硬件序列號,所在端口,硬件類型,硬件描述,硬件型號,硬件版本)。如果A和B都有,則比較A的設備+所在端口和B的設備+所在端口。如果一致,則跳過。如果不一致,則為變化硬件,插入OpticalModuleCheck表一條變化記錄(OMCheckSEQ,系統(tǒng)時間,mod,A中的設備ID,硬件序列號,所在端口,硬件類型,硬件描述,硬件型號,硬件版本,B中的設備ID,B中的所在端口)。
對于沒有序列號的光模塊,按所在端口比對。讀取OpticalView中序列號為空的光模塊記為C。讀取OpticalModule中序列號為空的光模塊記為D。C有D沒有的,則為新增硬件,插入OpticalModuleCheck表一條新增記錄(OMCheckSEQ,系統(tǒng)時間,add,C中的設備ID,硬件序列號,所在端口,硬件類型,硬件描述,硬件型號,硬件版本)。C沒有D有的,則為刪除硬件,插入OpticalModuleCheck表一條刪除記錄(OMCheckSEQ,系統(tǒng)時間,del,D中的設備ID,硬件序列號,所在端口,硬件類型,硬件描述,硬件型號,硬件版本)。
不同類型設備采集根據(jù)其設備特點有不同的采集差異,具體分為如下三類:
(1)二層匯聚交換機系列設備
a)首先確定采集硬件信息的實體范圍。
采集硬件實體class,對應class類型為 container(5)或者module(9)時,過濾出對應實體進一步獲取實體的index和entityName。
b)根據(jù)entity-mib采集額外信息。
根據(jù)以下mib補充硬件信息:
'1.3.6.1.2.1.47.1.1.1.1.2', #entPhysicalDescr
'1.3.6.1.2.1.47.1.1.1.1.4', #entPhysicalContainedIn
'1.3.6.1.2.1.47.1.1.1.1.8', #entPhysicalHardwareRev
'1.3.6.1.2.1.47.1.1.1.1.11', #entPhysicalSerialNum
'1.3.6.1.2.1.47.1.1.1.1.7', #entslotName
'1.3.6.1.2.1.47.1.1.1.1.13' #entpartno
示例如下:
Cardsn硬件序號:entPhysicalSerialNum
ENTITY-MIB:entPhysicalSerialNum 47.1.1.1.1.11.51="SAD131800J6"
Carddescr硬件描述:entPhysicalDescr
ENTITY-MIB:entPhysicalDescr 47.1.1.1.1.2.51="ISE 10G Modular Services Card v2"
(2)二層接入交換機設備
a)導入硬件實體信息值對應的模塊類型說明。
根據(jù)MIB對應模塊的硬件類型,型號過多僅列舉如下說明:
{1}='type-10OR100M(10M/100M Ethernet Copper Interface Module)'
{2}='type-1000BASE-LX-SM(1000BASE-X Module (SMF, LC))'
{3}='type-1000BASE-SX-MM(1000BASE-X Module (MMF, SC))'
{4} = 'type-1000BASE-TX'
{5}='type-100M-SINGLEMODE-FX(100M Ethernet Single Mode Optical Interface Module)'
{6}='type-100M-MULTIMODE-FX(100M Ethernet Multi-mode Optical Interface Module)'
{7}= 'type-100M-100BASE-TX(100M Ethernet copper Interface Module(RJ45))'
{8}='type-100M-HUB(100M Base-TX transportation Interface Module)'
{9} = 'type-VDSL(VDSL)'
{10} = 'type-STACK(GigaStack Module)'
{11}='type-1000BASE-ZENITH-FX(1000M Ethernet Single Mode Optical Interface Module(1550nm,70km,LC))'
{12}='type-1000BASE-LONG-FX(1000M Ethernet Single Mode Optical Interface Module(1550nm,40km,LC))'
b)通過lsw-dev-adm mib私有mib采集板卡和子卡信息,并通過Entity-mib進行補充,對應實體序號、標識等。
舉例如下所示:
$ snmpwalk -v2c -c switch-huawei
59.43.224.29 .1.3.6.1.4.1.2011.2.23.1.18.4.3.1.2
enterprises.2011.2.23.1.18.4.3.1.2.0.0 = 256
type-Main(256)
$ snmpwalk -v2c -c switch-huawei
59.43.222.15 .1.3.6.1.4.1.2011.2.23.1.18.4.3.1.2
enterprises.2011.2.23.1.18.4.3.1.2.0.0 = 364
type-LSB2SRP1N2(364), -- Switching and Route Process Unit, 5*LPU
enterprises.2011.2.23.1.18.4.3.1.2.0.1 = 364
enterprises.2011.2.23.1.18.4.3.1.2.0.2 = 98
type-LSB1GP24B(98), -- 24-Ports 1000Base-X Ethernet Interface Module B
enterprises.2011.2.23.1.18.4.3.1.2.0.3 = 183
(3)BRAS、路由器等設備
先通過disp device命令判斷單框還是多框,然后根據(jù)不同類型進行采集。
a)單框
首先確定光模塊所在板卡信息,然后進行光模塊的端口拼接,最后采集光模塊信息與之對應。具體如下所示:
disp ela 1
[Slot_1]……………………………………………槽位信息
/$[Board Integration Version]
/$BoardIntegrationVersion=3.0
[Main_Board_0]
/$[ArchivesInfo Version]
/$ArchivesInfoVersion=3.0
[Board Properties]
BoardType=CR52P4UFG0
BarCode=030FMV108 9000058
Item=03030FMV
Description=NetEngine80E,CR52P4UFG0,4-port 2.5G POS SFP Optical Interface LPU G………………………板卡信息
Manufactured=2008-09-06
VendorName=Huawei
IssueNumber=00
CLEICode=
BOM=
[Main_Board_1]
/$[ArchivesInfo Version]
/$ArchivesInfoVersion=3.0
[Board Properties]
BoardType=CR52FADD
BarCode=0291326T88001595
Item=03029132
Description=NetEngine80E,CR52FADD,F(xiàn)abric Adapter Board D,1*1
Manufactured=2008-09-06
VendorName=Huawei
IssueNumber=00
CLEICode=
BOM=
[Main_Board_2]
/$[ArchivesInfo Version]
/$ArchivesInfoVersion=3.0
[Board Properties]
BoardType=CR52LPUG
BarCode=020DTB6T88000514
Item=03020DTB
Description=NetEngine80E,CR52LPUG,Line Processing Unit G,1*1
Manufactured=2008-09-06
VendorName=Huawei
IssueNumber=00
CLEICode=
BOM=
[Daughter_Board_0]………………………光模塊所在子卡
/$[ArchivesInfo Version]
/$ArchivesInfoVersion=3.0
[Board Properties]
BoardType=CR52TCMH
BarCode=020DTU6T88001147
Item=03020DTU
Description=NetEngine80E,CR52TCMH,Search Engine Daughter Card H,1*1
Manufactured=2008-09-06
VendorName=Huawei
IssueNumber=00
CLEICode=
BOM=
[Daughter_Board_1]
/$[ArchivesInfo Version]
/$ArchivesInfoVersion=3.0
[Board Properties]
BoardType=CR52P4UF
BarCode=020EJX1089000010
Item=03020EJX
Description=NetEngine50 00E,CR52P4UFX,4 Port 2.5G POS SFP Optical Interface Daughter Card ,1*1…………光模塊所在板卡信息
Manufactured=2008-09-06
VendorName=Huawei
IssueNumber=00
CLEICode=
BOM=
[Port_0]……………光模塊拼接,1/0/0
/$[ArchivesInfo Version]
/$ArchivesInfoVersion=3.0
[Board Properties]
BoardType=SCP6828-H1-BNE
BarCode=877010E00195 ………光模塊信息
Item=
Description=2500Mb/s-1310nm-LC-2km(0.009mm)
Manufactured=2008-07-17
VendorName=SumitomoElectric
IssueNumber=
CLEICode=
BOM=
b)多框
多框采集過程和單框相比增加了一個業(yè)務框的判定過程。
其他基本類似,在此不再一一說明。
根據(jù)業(yè)務需要編寫了采集程序,如下所示:
DevUSwitchHuaVRP.pl
DevUSHuaLsw.pl
DevURouterhwNE5k.pl
DevUBHuawei.pl
圖3 光模塊變更管理頁面設計
如圖3所示:
●節(jié)點為登錄用戶有配置權限的節(jié)點樹,作用于OpticalView表、OpticalModuleCheck表、OpticalModuleCheckH表的設備所在節(jié)點。
●設備廠商,類型,型號下拉框聯(lián)動,可空。設備屬性下拉框為多選下拉框,可空。均作用于OpticalView表、OpticalModuleCheck表、OpticalModuleCheckH表的設備相關字段。本文型號均為設備詳細型號。
●所在設備/IP,所在端口,文本框,like匹配。作用于OpticalView表、OpticalModuleCheck表、OpticalModuleCheckH表的設備和所在端口字段。
●原所在設備/IP,原所在端口,文本框,like匹配作用于OpticalModuleCheck表、OpticalModuleCheckH表的原設備和原端口字段。
●光模塊序列號,文本框,等匹配,作用于OpticalView表、OpticalModuleCheck表、OpticalModuleCheckH表的硬件序列號字段。
●變化類型,下拉框,可空。add:新增;del:刪除;mod:變更。作用于OpticalModuleCheck表、OpticalModuleCheckH表的Changetype字段。
●變化日期,日期控件。作用于OpticalModuleCheck表、OpticalModuleCheckH表的changeTime字段。
●確認人,文本框,like匹配,作用于OpticalModuleCheckH表的Operator字段
●備注,文本框,like匹配,作用于OpticalModuleCheck表、OpticalModuleCheckH表的remark字段。
●點擊“變更查詢”按鈕,顯示第一個紅框的列表。點擊“當前光模塊查詢”按鈕,顯示第二個紅框的列表。點擊“確認歷史查詢”,顯示第三個紅框的列表。頁面上的查詢條件對3個按鈕,能生效的都生效。
●頁面打開后,默認執(zhí)行變更查詢。
●導出excel功能,與下面列表查詢的數(shù)據(jù)保持一致,只是忽略翻頁,顯示符合條件的全部數(shù)據(jù)。
●變更查詢:列表顯示OpticalModuleCheck表中數(shù)據(jù)。
●當前光模塊查詢:列表顯示OpticalView表數(shù)據(jù)。
●確認歷史查詢:列表顯示OpticalModuleCheckH表數(shù)據(jù)。
●變更歷史查詢結果,點擊列表中的備注,可彈出浮現(xiàn)框編輯備注,并保存到OpticalModuleCheck.remark字段。
●選中多條記錄點擊批量確認時,浮現(xiàn)彈出頁面如圖4:
圖4 確認頁面
點擊確認,校驗備注必填,執(zhí)行下述入庫邏輯:
●更新選中checkno對應的remark字段(只更新remark為空的記錄)。
●對于選中的記錄,根據(jù)checkno將OpticalModuleCheck表中記錄復制到OpticalModuleCheckH表(確認人為當前登錄用戶,確認時間為系統(tǒng)時間)。
●刪除OpticalModuleCheck表選中checkno對應的記錄。
(1)點擊界面變更查詢:界面可以顯示模塊變化日期,變化類型(新增、刪除、變更),模塊序列號,所在設備,設備IP,所在端口,以及硬件描述。其中對于變更的,會顯示模塊所在原設備、原設備IP,及原設備端口信息。如圖5所示。
圖5 前臺頁面-1
(2)點擊當前模塊查詢:可顯示光模塊序列號、所在設備、所在設備IP、設備廠商、設備型號、設備屬性、所在端口、硬件描述(傳輸距離等)。如圖6所示。
圖6 前臺頁面-2
(3)點擊確認歷史查詢:可顯示變化日期、變化類型、光模塊序列號、所在設備、所在設備IP、所在端口、硬件描
述(傳輸距離等)、原設備、原設備IP、原設備端口、確認人、確認時間,以及確認填寫備注情況等。如圖7所示。
圖7 前臺頁面-3
(4)點擊導出excel,可以把當前查詢結果導出到表格。
為了對設備模塊變更實現(xiàn)自動提醒,特別設計了郵件通知功能,對當天發(fā)生的模塊變化進行郵件通知,以便維護人員及時進行確認和操作。
設計了OpticalModuleCheck.pl程序,每天運行一次。查詢系統(tǒng)參數(shù)表,若光模塊發(fā)生變化,執(zhí)行下面發(fā)郵件功能:
收件人:XXX(可以是逗號分隔的多個郵箱地址。)
郵件主題:2015年1月20日光模塊變化情況:新增:XX個 變更:XX個 刪除:XX個。
郵件內(nèi)容:
郵件附件:上述表格的excel文件。
表格數(shù)據(jù)來自OpticalModuleCheck表,按變化日期過濾,只發(fā)變化日期為當天的記錄。列表中變化日期字段顯示到日即可。如果沒記錄,則不用帶附件和正文,郵件標題改為:2015年1月20日光模塊變化情況:無變化。
本文提出了采用系統(tǒng)替換人工進行光模塊的方案,并從軟硬件角度分析了該方案的實現(xiàn)原理。最后實現(xiàn)了系統(tǒng)功能,可以說該系統(tǒng)填補了我們運維領域中的一項空白,既減少了人工參與,提高了管理效率,也節(jié)省了人力工時。
但是目前該系統(tǒng)還有幾個地方在未來有待改進,首先是應用的設備類型問題,隨著設備廠家和設備類型的不斷增加,還需要對系統(tǒng)的適配性進行更新;另外,該系統(tǒng)對模塊輪詢的周期只能為24小時,時效性還有待提高。