許文淵
(中國鐵路上海局集團(tuán)有限公司上海通信段,上海 200434)
SDH網(wǎng)協(xié)議路數(shù)SDH網(wǎng)絡(luò)中的嵌入控制信道(Embedded Control Channel,ECC)是傳送操作、管理和維護(hù)(OAMP)信息的邏輯信道。隨著鐵路各類業(yè)務(wù)需求的高速增長、不同鐵路線路的業(yè)務(wù)互聯(lián)互通,作為承載網(wǎng)的傳輸網(wǎng)網(wǎng)元數(shù)已經(jīng)高達(dá)400~500個(gè),SDH網(wǎng)絡(luò)的ECC需要管理的網(wǎng)元越來越多,極易導(dǎo)致巨型ECC網(wǎng)絡(luò)問題影響傳輸系統(tǒng)穩(wěn)定性和業(yè)務(wù)的安全性。通過研究分析ECC原理、巨型ECC網(wǎng)絡(luò)對傳輸網(wǎng)絡(luò)造成的影響,提出巨型ECC網(wǎng)絡(luò)分割方法來解決ECC網(wǎng)絡(luò)風(fēng)暴的問題。
SDH網(wǎng)絡(luò)的操作維護(hù)管理(Operation Administration and Maintenance,OAM)功能具有高度自動(dòng)化水平,能根據(jù)用戶需求利用網(wǎng)管終端完成對管理網(wǎng)元的命令下發(fā)及數(shù)據(jù)查詢工作,完成準(zhǔn)同步數(shù)字體系(PDH)系統(tǒng)所無法完成的業(yè)務(wù)實(shí)時(shí)調(diào)配、告警故障定位、性能在線測試等功能。鐵路SDH傳輸系統(tǒng)常見的網(wǎng)元管理組網(wǎng)示意如圖1所示。當(dāng)SDH傳輸網(wǎng)管在對網(wǎng)元進(jìn)行維護(hù)時(shí),至少需一個(gè)網(wǎng)關(guān)網(wǎng)元(GNE1)與網(wǎng)管服務(wù)器進(jìn)行通信(網(wǎng)線直連,通過TCP/IP協(xié)議),非網(wǎng)關(guān)網(wǎng)元(NE2-NE4)通過ECC與網(wǎng)關(guān)網(wǎng)元連接,進(jìn)而實(shí)現(xiàn)與網(wǎng)管間的數(shù)據(jù)信息傳輸,從而實(shí)現(xiàn)網(wǎng)管對整個(gè)網(wǎng)絡(luò)的OAM。
圖1 網(wǎng)管、網(wǎng)關(guān)網(wǎng)元、網(wǎng)元通信關(guān)系管理組網(wǎng)Fig.1 Network management, gateway network element,network element communication relationship management networking
在鐵路傳輸系統(tǒng)中存在大量的區(qū)間點(diǎn)對點(diǎn)業(yè)務(wù),主要為信號(hào)CTC、供電SCADA、FAS、應(yīng)急、防災(zāi)等業(yè)務(wù)。目前客專線傳輸系統(tǒng)主流保護(hù)方式為二纖雙向復(fù)用段保護(hù)環(huán),它不僅最適用于上述分散型業(yè)務(wù)組網(wǎng),同時(shí)能有效提高傳輸系統(tǒng)通道利用率、節(jié)約投資,如圖2所示。
圖2 某客專線傳輸系統(tǒng)組網(wǎng)示意圖Fig.2 Schematic diagram of transmission system networking of a passenger dedicated line
1)隨著鐵路傳輸網(wǎng)網(wǎng)絡(luò)規(guī)模的不斷擴(kuò)大,一個(gè)傳輸網(wǎng)絡(luò)內(nèi)ECC互通的傳輸網(wǎng)元數(shù)量多達(dá)400~500多個(gè),隨著更多的網(wǎng)元入網(wǎng),傳輸設(shè)備支持的DCC路數(shù)越來越多,如華為公司的OSN7500可支持達(dá)到160路DCC路數(shù)。無論網(wǎng)絡(luò)多大,ECC都能互通,通過ECC可以支持對更多網(wǎng)元的管理。當(dāng)網(wǎng)關(guān)網(wǎng)元ECC互聯(lián)網(wǎng)超過一定數(shù)量的子網(wǎng)(為保證ECC網(wǎng)絡(luò)的正常性能,通常建議單個(gè)ECC子網(wǎng)的網(wǎng)元數(shù)量需不高于50個(gè),保證基本可用需不高于64個(gè)),就可以稱為巨型ECC網(wǎng)絡(luò)。
2)由于管理DCN本質(zhì)上是個(gè)星形網(wǎng)絡(luò),其帶內(nèi)帶寬最大為768 kbit/s,且不可擴(kuò)展。當(dāng)某個(gè)傳輸系統(tǒng)網(wǎng)元規(guī)模過于龐大,此時(shí)網(wǎng)絡(luò)管理DCN的拓?fù)湟矔?huì)相應(yīng)變大,對網(wǎng)絡(luò)的路由計(jì)算速度會(huì)造成較大影響;同時(shí),因網(wǎng)絡(luò)的變化造成路由廣播信息不停的在全網(wǎng)范圍內(nèi)廣播,使得路由不斷重算,再加上網(wǎng)絡(luò)中每個(gè)網(wǎng)元的路由表收斂時(shí)間差距,就影響了管理DCN拓?fù)涞姆€(wěn)定性,而且因組網(wǎng)規(guī)模過大,在網(wǎng)絡(luò)故障時(shí)因傳輸距離、告警數(shù)量導(dǎo)致管理DCN數(shù)據(jù)流量擴(kuò)大,進(jìn)而造成網(wǎng)絡(luò)擁塞。由于在DCN網(wǎng)絡(luò)中傳送的數(shù)據(jù)包是有生命期的(缺省為63),當(dāng)該網(wǎng)絡(luò)路由因故發(fā)生變化時(shí),數(shù)據(jù)包在傳送過程中有可能造成傳輸路徑不斷變化,如由較多網(wǎng)元組成的傳輸環(huán)或鏈型網(wǎng)絡(luò)一旦出現(xiàn)斷纖,相關(guān)數(shù)據(jù)包極有可能因經(jīng)過較長路由使得在達(dá)到目標(biāo)網(wǎng)元前出現(xiàn)丟失。在一個(gè)大型網(wǎng)絡(luò)某個(gè)網(wǎng)元脫網(wǎng)的路由信息廣播到整個(gè)網(wǎng)絡(luò)需經(jīng)過一定時(shí)間,但當(dāng)信息傳達(dá)到整個(gè)網(wǎng)絡(luò)時(shí),可能該脫網(wǎng)網(wǎng)元又恢復(fù)可達(dá)或者該網(wǎng)絡(luò)其他網(wǎng)元又脫網(wǎng)了,進(jìn)而造成整個(gè)網(wǎng)絡(luò)不停振蕩。
巨型ECC網(wǎng)絡(luò)易導(dǎo)致主機(jī)異常復(fù)位。網(wǎng)元主控板的內(nèi)存容量是固定的,當(dāng)網(wǎng)絡(luò)中的網(wǎng)元過多時(shí),ECC網(wǎng)絡(luò)路由表的數(shù)據(jù)流量依然很大,當(dāng)網(wǎng)絡(luò)發(fā)生任何變動(dòng)時(shí),會(huì)導(dǎo)致主控板的短期內(nèi)接收到的待處理網(wǎng)絡(luò)信息達(dá)到峰值,嚴(yán)重時(shí)會(huì)造成主控板的異常復(fù)位。因?yàn)镾NCP和TPS的倒換機(jī)制在交叉板,因此主控板復(fù)位時(shí),這兩類保護(hù)無影響。但對于復(fù)用段保護(hù)倒換,由于倒換協(xié)議下發(fā)至交叉板完成,對設(shè)備不影響,但在主控板復(fù)位后會(huì)觸發(fā)主控板倒換,將造成網(wǎng)元配置下發(fā)或數(shù)據(jù)下載失敗。
巨型ECC網(wǎng)絡(luò)導(dǎo)致網(wǎng)元脫管。傳輸網(wǎng)管以每分鐘為周期向所有網(wǎng)元發(fā)送監(jiān)視信號(hào),若連續(xù)2次無法收到傳輸設(shè)備的返回值時(shí),邏輯上便認(rèn)定該網(wǎng)元的連接中斷。因此當(dāng)?shù)谝淮芜B接報(bào)文通信異常時(shí),第二次的報(bào)文有一點(diǎn)時(shí)間上的延時(shí),傳輸網(wǎng)管大概率就會(huì)做出傳輸設(shè)備脫管的判斷,當(dāng)同一網(wǎng)絡(luò)內(nèi)的ECC過量時(shí),就會(huì)容易導(dǎo)致傳輸設(shè)備的脫管現(xiàn)象,直到傳輸設(shè)備再連續(xù)兩次與傳輸網(wǎng)管的通信正常后,脫管故障恢復(fù),因每臺(tái)傳輸設(shè)備與網(wǎng)管間的跳接點(diǎn)長度不一,會(huì)造成傳輸設(shè)備恢復(fù)的時(shí)間和頻率也不一樣。
巨型ECC網(wǎng)絡(luò)的路由穩(wěn)定性差。D1-D3字節(jié)的速率為固定的192 kbit/s,在所有網(wǎng)元開啟性能監(jiān)控已經(jīng)占用部分通信帶寬的情況下,當(dāng)網(wǎng)絡(luò)變化時(shí)路由廣播信息需要在網(wǎng)絡(luò)中不斷廣播、不斷反復(fù)計(jì)從而算造成ECC路由不穩(wěn)定。在一個(gè)大型網(wǎng)絡(luò)某個(gè)網(wǎng)元脫網(wǎng)的路由信息廣播到整個(gè)網(wǎng)絡(luò)需經(jīng)過一定的時(shí)間,但當(dāng)信息傳達(dá)到整個(gè)網(wǎng)絡(luò)時(shí)可能該脫網(wǎng)網(wǎng)元又恢復(fù)可達(dá)或者該網(wǎng)絡(luò)其他網(wǎng)元又脫網(wǎng)了,進(jìn)而造成整個(gè)網(wǎng)絡(luò)不停的振蕩,期間又增加了網(wǎng)絡(luò)的通信量。針對華為設(shè)備的ECC收斂時(shí)間測試結(jié)果如表1所示。
通過對巨型ECC網(wǎng)絡(luò)進(jìn)行切割優(yōu)化,將一個(gè)大的ECC子網(wǎng)絡(luò)(管理網(wǎng)元數(shù)量超過400個(gè)及以上)劃分為多個(gè)小的ECC子網(wǎng),并且關(guān)閉各個(gè)小的ECC子網(wǎng)之間互聯(lián)互通端口的ECC,把路由信息和數(shù)據(jù)限制在某個(gè)子網(wǎng)內(nèi)傳播,不會(huì)擴(kuò)散影響到其他網(wǎng)絡(luò)。通過合理規(guī)劃ECC子網(wǎng)組網(wǎng),可有效避免因ECC網(wǎng)絡(luò)過大造成的傳輸網(wǎng)網(wǎng)絡(luò)不能正常監(jiān)控和管理通道堵塞問題。
通過增加SDH網(wǎng)絡(luò)中網(wǎng)關(guān)網(wǎng)元的數(shù)量,將原有的大網(wǎng)劃分成不同的小子網(wǎng),實(shí)現(xiàn)巨型ECC網(wǎng)絡(luò)分割。每個(gè)子網(wǎng)內(nèi)建議同時(shí)設(shè)置主備用兩個(gè)網(wǎng)管網(wǎng)元,保障在ECC子網(wǎng)分割后的非網(wǎng)關(guān)網(wǎng)元與網(wǎng)關(guān)網(wǎng)元之間可達(dá)。這樣由于網(wǎng)關(guān)網(wǎng)元數(shù)量的增多,與網(wǎng)管進(jìn)行DCN連接的帶寬將大大增加,每個(gè)子網(wǎng)內(nèi)的網(wǎng)元都有足夠的帶寬與網(wǎng)管直接通信,不僅可以減少網(wǎng)絡(luò)維護(hù)開銷,提高整個(gè)網(wǎng)絡(luò)的管理水平,還能增強(qiáng)ECC通信網(wǎng)絡(luò)的穩(wěn)定性。
巨型ECC網(wǎng)絡(luò)的分割原則:一是要保證網(wǎng)絡(luò)出現(xiàn)異常情況時(shí),網(wǎng)管仍能和分割前一樣可管理所有傳輸網(wǎng)元,避免影響維護(hù);二是每個(gè)ECC子網(wǎng)內(nèi)的傳輸網(wǎng)元數(shù)量不能超過建議的數(shù)量范圍;三是完成ECC子網(wǎng)分割優(yōu)化后,按分層、分域的管理原則,網(wǎng)絡(luò)上任何一處斷纖或其他異常情況,應(yīng)確保數(shù)據(jù)包在到達(dá)目的網(wǎng)元前不被丟棄或消失,確保能夠達(dá)到分割前的ECC路由恢復(fù)(保護(hù))能力。
如圖3所示,SNCP的保護(hù)方式為“首端雙發(fā)、末端選收”,正常工作狀態(tài)下,NEA到NEB的業(yè)務(wù)在NEA設(shè)備側(cè)表現(xiàn)為雙發(fā),分別經(jīng)過子網(wǎng)1(工作通道)和子網(wǎng)2(保護(hù)通道),同時(shí)到達(dá)NEB,NEB優(yōu)先監(jiān)測工作通道是否正常,若正常則從工作通道收取NEA的業(yè)務(wù),即可完成NEA至NEB之間的業(yè)務(wù)通信。如果子網(wǎng)1工作通道發(fā)生中斷,NEB在監(jiān)測到子網(wǎng)1工作通道不通后,NEB倒換從子網(wǎng)2的保護(hù)通道收取NEA的業(yè)務(wù),實(shí)現(xiàn)正常通信,待子網(wǎng)1工作通道正常后,NEB再次倒換至子網(wǎng)1的工作通道進(jìn)行通信。通過分析SNCP子網(wǎng)連接的保護(hù)方式可知,業(yè)務(wù)倒換的功能實(shí)現(xiàn)主要在起始點(diǎn)和終結(jié)點(diǎn)實(shí)現(xiàn),與子網(wǎng)內(nèi)的其他網(wǎng)元主要提供業(yè)務(wù)即可,無需參與倒換過程,因此即使將起始點(diǎn)和終結(jié)點(diǎn)分割在不同的ECC子網(wǎng)內(nèi),也不會(huì)對SNCP保護(hù)造成任何影響。
MSP復(fù)用段環(huán)的保護(hù)方式相比SNCP較復(fù)雜一些,但因其多用于分布式業(yè)務(wù),在目前客專線傳輸系統(tǒng)組網(wǎng)中應(yīng)用廣泛,MSP環(huán)的保護(hù)方式將兩個(gè)網(wǎng)元之間的光纖時(shí)隙資源一分為二,前一半時(shí)隙為工作,后一半時(shí)隙為保護(hù),如圖4所示,NEA至NEC的業(yè)務(wù)經(jīng)過S1工作時(shí)隙,經(jīng)過NEB達(dá)到NEC,如果A-B之間光纜中斷,NEA和NEB的保護(hù)狀態(tài)由正常狀態(tài)變?yōu)榈箵Q狀態(tài),NED和NEC的保護(hù)狀態(tài)由正常狀態(tài)變?yōu)榇┩顟B(tài),相對應(yīng)的NEA至NEC的業(yè)務(wù)將經(jīng)過NED-NEC-NEB后到達(dá)NEC,在經(jīng)過NED-NEC-NEB區(qū)段使用的是后一半的保護(hù)時(shí)隙,從倒換原理看,業(yè)務(wù)倒換時(shí)需要環(huán)內(nèi)的所有網(wǎng)元共同參與才可以完成。而通過APS協(xié)議控制環(huán)內(nèi)的網(wǎng)元在發(fā)生倒換時(shí),需要利用APS協(xié)議,由APS協(xié)議來給一個(gè)環(huán)網(wǎng)內(nèi)的各個(gè)網(wǎng)元起名字后統(tǒng)一管理,APS協(xié)議信息由K1、K2攜帶,目的節(jié)點(diǎn)標(biāo)識(shí)碼(5~8 bit)。由于只有4 bit,因此一個(gè)復(fù)用段保護(hù)環(huán)上的網(wǎng)元數(shù)最多不能超過16個(gè),環(huán)上網(wǎng)元號(hào)最小的節(jié)點(diǎn)編號(hào)為0,按照東發(fā)西收方向逐一為1、2、3……14、15,環(huán)網(wǎng)內(nèi)每個(gè)網(wǎng)元都有對應(yīng)的數(shù)字編號(hào),當(dāng)發(fā)生倒換時(shí)APS協(xié)議將指揮各個(gè)網(wǎng)元各司其職。ECC分割需要關(guān)斷網(wǎng)元間的DCC通道,關(guān)閉后兩個(gè)網(wǎng)元之間將無法互通,對MSP的保護(hù)倒換。
如圖5所示,按照客專線傳輸系統(tǒng)組網(wǎng)情況,將整個(gè)系統(tǒng)分割為黃色和紅色兩個(gè)ECC子網(wǎng),子網(wǎng)與子網(wǎng)之間不可通信,分別由各自的網(wǎng)關(guān)網(wǎng)元與網(wǎng)管進(jìn)行通信,此時(shí)原環(huán)網(wǎng)B-C-D-E-F因子網(wǎng)劃分,將網(wǎng)元B分離出環(huán)網(wǎng),為了保障D-E之間的光纜中斷后,E-F網(wǎng)元也可與網(wǎng)管正常通信,需要在網(wǎng)元B設(shè)置DCC透傳,實(shí)現(xiàn)網(wǎng)元C直接與網(wǎng)元F進(jìn)行通信。對于B-C-D-E-F環(huán)網(wǎng)來說,由于網(wǎng)元B設(shè)置了DCC穿通,該環(huán)網(wǎng)實(shí)際通信可達(dá)的網(wǎng)元變?yōu)镃-D-E-F,網(wǎng)元B將不可達(dá),ECC分割后對MSP環(huán)保護(hù)是否會(huì)產(chǎn)生影響。
圖4 二纖雙向復(fù)用段保護(hù)環(huán)(MSP)連接工作與保護(hù)示意圖Fig.4 Schematic diagram of connection and protection of two-fiber bidirectional multiplex section protection ring (MSP)
圖5 ECC分割示意圖Fig.5 ECC segmentation diagram
APS協(xié)議使用的是K1、K2字節(jié),DCC通信使用的是D1-D3字節(jié),K字節(jié)和D字節(jié)雖同屬于復(fù)用段開銷,但D字節(jié)用于網(wǎng)元網(wǎng)管之間、網(wǎng)元和網(wǎng)元之間OAM信息通路,K字節(jié)用于傳送自動(dòng)保護(hù)倒換信令,使網(wǎng)絡(luò)具備自愈功能,相互之間沒有關(guān)聯(lián),是不同的開銷字節(jié),關(guān)閉D字節(jié)不會(huì)影響K字節(jié)的功能,反之亦然。因此針對圖5中巨型ECC網(wǎng)絡(luò)分割后,網(wǎng)元B設(shè)置的DCC穿通,雖然會(huì)造成同一MSP環(huán)內(nèi)個(gè)別網(wǎng)元的DCC通信不可達(dá),但不會(huì)影響APS協(xié)議中K字節(jié)的傳送,對MSP環(huán)網(wǎng)的保護(hù)沒有影響。
隨著鐵路行業(yè)逐漸發(fā)展,傳輸網(wǎng)絡(luò)的子網(wǎng)將會(huì)越來越大,巨型ECC網(wǎng)絡(luò)的影響和對網(wǎng)絡(luò)的危害,迫使需要進(jìn)行ECC子網(wǎng)分割,劃分成多個(gè)小的ECC子網(wǎng),以提高網(wǎng)絡(luò)整體運(yùn)行安全性,本文對SNCP保護(hù)和MSP保護(hù)兩種情形的ECC分割方案進(jìn)行分析,對巨型ECC網(wǎng)絡(luò)執(zhí)行DCC通道關(guān)斷的方式可以實(shí)現(xiàn)巨網(wǎng)ECC的分割,以滿足當(dāng)前鐵路客專的組網(wǎng)保護(hù)方式。此方案在京滬高鐵上海局管段已實(shí)施ECC子網(wǎng)分割,取得了較好效果。