付饒
摘要:闡述廣電OTN傳輸網絡維護過程中故障快速處理的思路和方法,通過對兩種典型故障的詳細分析,總結故障發(fā)生的原因,并提出具體的排查思路和方法,最后從便于維護和故障排查的角度提出一些OTN網絡的日常維護建議。
關鍵詞:廣電網絡;OTN;傳輸故障
引言
OTN就是光傳送網絡,是由一組通過光纖鏈路連接在一起的光網元組成的網絡,能夠提供基于光通道客戶信號的傳送、復用、路由、管理、監(jiān)控以及保護。OTN的一個明顯特征是對于任何數字客戶信號的傳送與客戶特性無關,即客戶無關性。與傳統SDH網絡相比,OTN網絡具有以下優(yōu)勢。
①更強的前向誤碼糾正(FEC)能力.
②更多級別(6級)的串聯連接監(jiān)視(TCM).
③客戶信號的透明傳送.
OTN網絡是個龐大復雜的系統,OTN系統的網絡層次多,業(yè)務關聯多,任何一個環(huán)節(jié)都有可能發(fā)生故障,正是因為OTN網絡有層次多的明顯特點,導致OTN網絡故障定位難,管理難,其主要表現為兩點,一是故障發(fā)生時往往告警數量多尤其是會產生大量的關聯告警,造成維護人員無從下手的感覺,二是有時故障發(fā)生卻沒有任何告警,只能摸索排查,故障定位耗時長,非常依賴于維護人員的經驗,這兩種現象給故障排查帶來非常大的困難,下文就是這兩種情況舉例并分析說明
1OTN故障的典型類型
以我省干線OTN波分網絡為例,省中心站有6個傳輸方向,9個設備機柜,27個設備子柜,914根設備連纖,整個省干線18個站點一共有4766根連纖。
以上還不含業(yè)務側連纖,平均每個站尾纖數量達到265根。如圖1所示,為省干OTN網絡上開通的一條千兆以太網GE通道業(yè)務波道圖,LOG板為OTN單板,LSXR中繼板。
該業(yè)務源端為哈爾濱站,業(yè)務宿端為牡丹江站,工作路由為短徑, 經省中心站到達牡丹江,保護路由為長徑經牡丹江中繼1、伊春等站點到達哈爾濱站,該業(yè)務的媒介層,該業(yè)務的工作路由方向歷經3個站,38塊單板,保護路由方向歷經14個站,190塊單板.當系統在以上任何一個節(jié)點發(fā)生故障時,由于OTN網絡是基于光通道的業(yè)務傳送,具有業(yè)務和告警關聯性,底層故障會衍生出大量高層告警,或主要的告警衍生出大量的次要告警,一條告警的產生會引起業(yè)務的上下游站點單板 檢測,上報告警,這些告警都會在短時間內上,給故障定位帶來許多干擾,如果是主光路故障,還會導致該光路承載的所有波道產生相同的告警,在用波道越多,告警就越多,有時候一個主光路故障能引起近千條告警,比如R-LOS、OCH-OCH-LOS-P、ODU2-PM-SSF、OUT2-SSF、OTS-LOS-P、OSC-LOS、MUT-LOS、CHAN-LOS、OMS-LOS-P等。
此類故障一般可分為四種情形,一是單板硬件故障,二是主光路故障,三是單波故障,四是單一業(yè)務故障。
若在大量告警中發(fā)現“單板不在位”“單板硬件故障”“單板壽命終止”等告警,則定位為單板故障并立即更換上報告警的單板。若大量高警中有“MUT-LOS”、“OTS-LOS”、“OSC-LOS”等告警,則基本可定位是主光路故障,可根據告警信息迅速定位到故障的區(qū)間或站點,通過更換尾纖,調整光纖路由解決故障,若告警中出現“R-LOS”“CHAN-LOS”則可基本定位是單薄或單一業(yè)務故障,此時可根據光功率查詢功能,迅速定位到具體單板,端口,通過排查上游設備或更換尾纖來排除故障.
當大量告警同時出現時,建議不要受以下告警干擾,緊急告警;“OTUk-SSF”、“OUT-LOF”、“ODUk-PM-SSF”,主要告警有;“CLIENT-PORT-PS”、“OCH-SSF”、“ODUk-PM-AIS”、“ODUk-PORT-EXC”“OUD-SNCP-INDI”
、“RRM-SF”次要告警有“SW-SNCP-STA”“REM-SF”“REM-SD”“OTUk-DEG”
“OTNk-BDI”“OPUk-PLM”“ODU-SNCP-STA-IN-DI”“ODUk-PM-DEG“ODUk-PM-BDI”“CLIENT-PORT-STA-INDI”提示告警;“BEFFEC-EXC”以上告警都是上游告警產生后衍生出的告警,對于故障定位不起直接作用,僅作輔助作用,這類告警類型較多,數量龐大,對于故障的迅速定位排除,經常會起到干擾作用,須在定位故障時,注意判斷。
OTN維護建議
①做好規(guī)范化常態(tài)維護工作,涉及到OTN波分網絡的重點指標應作為每日例行維護操作,如所有光功率查詢,信噪比查詢,重要的廣播業(yè)務保護狀態(tài)查詢,大顆粒業(yè)務的保護狀態(tài)查詢,并做好記錄,以上記錄不但可作為故障發(fā)生時的維護參考,更重要的意義在于故障發(fā)生前提前發(fā)現隱患并加以排除,提高維護質量和客戶滿意度。
②建立告警關聯機制,抑制無關,告警。一方面,無關告警抑制或反轉,另一方面,定期檢查告警抑制情況,網絡在建設或擴容后,由于業(yè)務為上齊或提前預留了通道,都會產生相關業(yè)務未接入告警,需要平時維護過程中做到準確更新,。
③做好光功率管理工作,光功率管理對于OTN網絡非常重要,通過光功率查詢,基準值比較可以定位90%以上的故障。對光功率查詢可提前進行模板分類,細分為線路光功率,波分測光功率和客戶測光功率,線路光功率又細分為環(huán)網a光功率和環(huán)網b光功率。
④建立定期巡檢機制,檢查,落實地市維護工作,建立主動維護意識,定期進行網絡健康檢查,通過健康檢查,可以發(fā)現網絡配置等方面的不足或錯誤,及時進行修正。
⑤加強基本知識儲備,OTN網絡對一線維護人員要求更高,不僅需要了解傳統的波分原理知識,更重要的是對圍繞G.709協議的下一代傳送網絡標準要有一定的了解,特別要加強的是協議中相關層級對應的通道關系以及相關的告警關聯等等。
結束語
從2012年在全國廣電網絡系統最近開始建設省市干線OTN波分網絡,并維護至今,在公司各級領導的關心指導下,在所有維護人員的共同努力下,該系統一直健康穩(wěn)定運行,我們在平時的維護過程中,善于總結經驗,鼓勵創(chuàng)新和嘗試,重視與廠家的溝通,目前已形成了多項符合OTN網絡特點的可靠的網絡保障措施與維護規(guī)范手冊和流程,。本文闡述了一線運維人員常見的兩種OTN典型故障的思路并加以總結,希望能給同行一定的參考和幫助。