【摘要】本文闡述了PTN技術(shù)的特點(diǎn)。作者通過自身實(shí)踐,總結(jié)了PTN故障處理的故障原因、常用的定位方法。結(jié)合中興設(shè)備具體的實(shí)例,給人深入淺出的體會(huì)。
【關(guān)鍵詞】PTN MPLS故障處理方法
1PTN技術(shù)特點(diǎn)
PTN(分組傳送網(wǎng),Packet Transport Network)的產(chǎn)生是適應(yīng)全I(xiàn)P化的業(yè)務(wù)需求而產(chǎn)生的,統(tǒng)一網(wǎng)絡(luò)協(xié)議,簡化網(wǎng)絡(luò)層次,便于提供各種類型的業(yè)務(wù),實(shí)現(xiàn)綜合業(yè)務(wù)運(yùn)營。PTN是一種以分組作為傳送單位,承載電信級以太網(wǎng)業(yè)務(wù)為主,兼容TDM,ATM和FC等業(yè)務(wù)的傳送技術(shù),繼承了MSTP的理念,融合了Ethernet和MPLS(多協(xié)議標(biāo)簽交換,Multi-protocol label switching)的優(yōu)點(diǎn),成為下一代分組承載的技術(shù)選擇。
2PTN故障處理的原因和方法
2.1故障處理的基本原則
①查看。②訊問。③思考。④動(dòng)手。
2.2故障原因
常見故障原因有工程問題、外部原因、操作不當(dāng)、設(shè)備對接問題以及設(shè)備原因。
3故障定位的常見方法
故障定位的常見方法觀察分析法、測試法、插拔法、替換法、配置數(shù)據(jù)分析法、儀表測試法和經(jīng)驗(yàn)處理法。
4故障實(shí)例及解決方法
4.1PTN網(wǎng)管告警上報(bào)問題排查
【系統(tǒng)概述】某網(wǎng)絡(luò)中,網(wǎng)元A和B組成鏈型網(wǎng)絡(luò),其中A作為接入網(wǎng)元接入網(wǎng)管,并且網(wǎng)元A和B能正常管理。
【故障現(xiàn)象】斷開網(wǎng)元A和B間的光纖連接,網(wǎng)管查不到設(shè)備的告警信息。
【故障分析】網(wǎng)管能正常管理A和B,排除是管理通道配置問題。告警的產(chǎn)生和上報(bào)都是由設(shè)備完成的,網(wǎng)管只是顯示告警并進(jìn)行相關(guān)管理或操作。
【故障處理】
(1)通過串口或是網(wǎng)管CLI命令登陸設(shè)備,在全局模式下輸入:show run
(2)檢查顯示命令中是否有“snmp-server host 61.1.1.111 trap version 2c public udp-port 162”。
該配置是顯示告警平臺(tái)告警TRAP包發(fā)往哪里,告警肯定是發(fā)往網(wǎng)管(61.1.1.111為網(wǎng)管服務(wù)器的ip地址),注意是服務(wù)器地址而非客戶端地址,162是TRAP的發(fā)送端口。
(3)檢查顯示命令的信息是否有“snmp-server trap-source 63.5.1.1”。
設(shè)備上報(bào)告警給網(wǎng)管時(shí),TRAP報(bào)文中會(huì)包含發(fā)送端的IP(即網(wǎng)元的IP地址,本例中為63.5.1.1),網(wǎng)管通過這個(gè)IP地址獲取對應(yīng)的網(wǎng)元信息。Mcc組網(wǎng)時(shí)如果不設(shè)置,TRAP報(bào)文的IP可能不是網(wǎng)元IP,網(wǎng)管找不到對應(yīng)的網(wǎng)元就會(huì)丟棄這個(gè)告警,所以必須設(shè)置。
4.2PTN 6300 RSCCU主備單板倒換異常
【系統(tǒng)概述】某地由于PTN6200設(shè)備升級RSCCU單板,為單板更新boot芯片。在拔插單板過程中出現(xiàn)主控板倒換異常。
【故障現(xiàn)象】設(shè)備正常工作時(shí),5槽位主控板是主用狀態(tài)。先拔出6槽位主控板后為其更換芯片再插回,等待6號槽位告警燈滅,綠燈正常閃爍;把5槽位單板拔出,此時(shí)6槽位單板變?yōu)橹饔谩?槽位單板更換后插回?zé)o法正常工作,現(xiàn)象為紅燈常亮15秒,熄滅15秒,依次交替。復(fù)位6槽位單板應(yīng)無法倒回5槽位單板為主用,在本地串口嘗試連接5槽位單板,無法連接,其他單板也不能正常工作。
【故障分析】由于6200上的主控軟件版本和boot版本相同,因此懷疑是軟件或是boot存在問題;同時(shí)容易忽視在主備倒換時(shí)主控板的數(shù)據(jù)同步問題。
【故障排除】排除軟件版本與boot版本問題后,問題鎖定在主備單板的倒換時(shí)間上。RSCCU單板的重新啟動(dòng)時(shí)間是在ALM燈熄滅,RUN燈運(yùn)行正常時(shí),還需要2-3分鐘的時(shí)間與主控進(jìn)行同步業(yè)務(wù)的MAC配置。本例中操作忽視了主備單板數(shù)據(jù)同步的時(shí)間,即6號槽位單板插拔后沒由真正運(yùn)行起來就把5號槽位的主控拔掉。
【故障總結(jié)與思考】復(fù)位主控單板要等待7-8分鐘再復(fù)位主控單板,原因是被復(fù)位單板啟動(dòng)后需要到主控板恢復(fù)運(yùn)行和同步數(shù)據(jù);若等待時(shí)間不夠?qū)?dǎo)致兩塊主控單板都沒有正常運(yùn)行,進(jìn)而導(dǎo)致業(yè)務(wù)、監(jiān)控中斷。
5結(jié)束語
隨著PTN設(shè)備在各通信運(yùn)營商網(wǎng)絡(luò)的加快入網(wǎng),設(shè)備的維護(hù)也將成為維護(hù)工作的重要內(nèi)容。PTN設(shè)備也有其自身的特點(diǎn),PTN技術(shù)是傳輸技術(shù)和數(shù)據(jù)業(yè)務(wù)的融合產(chǎn)物,因此對于技術(shù)人員不僅要具有傳輸?shù)闹R(shí)理念,同時(shí)要有一定數(shù)據(jù)業(yè)務(wù)常識(shí)。維護(hù)人員在實(shí)際工作中要加強(qiáng)學(xué)習(xí)和積累,提高設(shè)備運(yùn)行質(zhì)量,讓PTN技術(shù)更好的服務(wù)于通信發(fā)展。