覃 旺
目前,廣州地鐵信號系統(tǒng)維修維護(hù)模式主要以周期檢修、預(yù)防維修為主,人力成本和材料成本消耗巨大,只能依靠檢修人員以及復(fù)雜的維修管理流程保證設(shè)備維修質(zhì)量。當(dāng)檢修人員或維修管理環(huán)節(jié)出現(xiàn)問題時,就會導(dǎo)致設(shè)備故障。為了提高信號系統(tǒng)維修水平,降低人力和材料消耗,同時保證信號系統(tǒng)安全、可靠運(yùn)行,廣州地鐵、廣州鐵科智控公司聯(lián)合開展了信號系統(tǒng)智能運(yùn)維平臺的研究。
智能運(yùn)維平臺需要采集各線路列車運(yùn)行和關(guān)鍵設(shè)備狀態(tài)等信息,并通過分布式控制系統(tǒng)DCS 系統(tǒng)傳輸?shù)胶笈_服務(wù)器,實現(xiàn)可視化呈現(xiàn);根據(jù)DCS 系統(tǒng)設(shè)計的四維評價法[1-2],可通過設(shè)備、網(wǎng)絡(luò)拓?fù)涞娜哂?,實現(xiàn)網(wǎng)絡(luò)系統(tǒng)的高可靠保護(hù);同時,部分業(yè)務(wù)系統(tǒng)對時延要求敏感,要求網(wǎng)絡(luò)系統(tǒng)在故障切換過程中,盡可能地縮短切換時間。本文根據(jù)DCS 系統(tǒng)需求,提出了3 種不同的基于ERPS協(xié)議的環(huán)網(wǎng)架構(gòu),通過可靠性的分析、計算和對比,以及收斂性能的測試和分析,其結(jié)果可直接用于軌道交通或相關(guān)領(lǐng)域,工程人員可根據(jù)實際條件來選擇合適的組網(wǎng)架構(gòu)。
1)接入冗余。服務(wù)器雙歸接入交換機(jī),服務(wù)器啟用雙網(wǎng)卡綁定功能,其中主、備網(wǎng)卡分別接入主交換機(jī)和備交換機(jī),正常時,主網(wǎng)卡處于活躍狀態(tài),備網(wǎng)卡處于靜默狀態(tài)。當(dāng)主網(wǎng)卡出現(xiàn)故障時,服務(wù)器的備網(wǎng)卡立刻激活,代替主網(wǎng)卡工作,實現(xiàn)環(huán)網(wǎng)保護(hù)。
2)交換機(jī)冗余。在每個節(jié)點機(jī)柜布置2 臺交換機(jī),一臺為主,一臺為備,兩交換機(jī)之間通過堆疊線互連,用以傳輸心跳報文或業(yè)務(wù)數(shù)據(jù)。當(dāng)主交換機(jī)故障時,數(shù)據(jù)切換到備交換機(jī)轉(zhuǎn)發(fā),實現(xiàn)環(huán)網(wǎng)保護(hù)。
3)線路冗余。節(jié)點之間主交換機(jī)與主交換機(jī)互連,備交換機(jī)與備交換機(jī)互連。配置跨設(shè)備的鏈路聚合,將2 條鏈路劃入同一個跨設(shè)備Eth-Trunk接口,實現(xiàn)鏈路間的備份,保證了數(shù)據(jù)流量的可靠傳輸。
4)拓?fù)淙哂唷>W(wǎng)絡(luò)拓?fù)錇榄h(huán)型,通過ERPS協(xié)議避免產(chǎn)生環(huán)路,防止發(fā)生廣播風(fēng)暴;同時在出現(xiàn)故障時,可快速激活冗余備份鏈路,恢復(fù)網(wǎng)絡(luò)連通性,可達(dá)到電信級切換要求[3]。
該組網(wǎng)架構(gòu)可以保證環(huán)網(wǎng)中出現(xiàn)二度故障時,業(yè)務(wù)不中斷。全冗余環(huán)網(wǎng)架構(gòu)拓?fù)湟妶D1。
圖1 全冗余環(huán)網(wǎng)架構(gòu)拓?fù)?/p>
1)接入冗余。服務(wù)器2 塊網(wǎng)卡不綁定,每個網(wǎng)卡均處于活躍狀態(tài)。2 塊網(wǎng)卡分別接到2 個互相獨立的環(huán)網(wǎng)1 和環(huán)網(wǎng)2,由服務(wù)器的上層軟件實現(xiàn)數(shù)據(jù)的“雙發(fā)選收”,進(jìn)行業(yè)務(wù)保護(hù)。
2)交換機(jī)冗余。在每個節(jié)點機(jī)柜布置2 臺交換機(jī),不區(qū)分主備,不需要互連,也不需要組成堆疊。2 臺交換機(jī)分別屬于2 個獨立的環(huán)網(wǎng)Ring1 和環(huán)網(wǎng)Ring2,任何1 臺交換機(jī)故障都只會影響其中1 個環(huán)網(wǎng),實現(xiàn)冗余保護(hù)。
3)線路冗余。節(jié)點之間的2 條鏈路分別屬于不同環(huán)網(wǎng),其中1 條出現(xiàn)故障不影響另一個環(huán)網(wǎng)的運(yùn)行,實現(xiàn)線路冗余。
4)拓?fù)淙哂唷? 個獨立環(huán)網(wǎng)分別運(yùn)行ERPS 協(xié)議,在環(huán)內(nèi)避免發(fā)生廣播風(fēng)暴,并在故障切換時進(jìn)行業(yè)務(wù)倒換,實現(xiàn)環(huán)內(nèi)保護(hù);環(huán)網(wǎng)Ring1 和環(huán)網(wǎng)Ring2 互為備份,進(jìn)一步提高了其可靠性。
該網(wǎng)絡(luò)架構(gòu)同樣可以保證環(huán)網(wǎng)中出現(xiàn)二度故障時,業(yè)務(wù)不中斷。雙環(huán)網(wǎng)架構(gòu)拓?fù)湟妶D2。
圖2 雙環(huán)網(wǎng)架構(gòu)拓?fù)?/p>
單環(huán)網(wǎng)架構(gòu)是雙環(huán)網(wǎng)架構(gòu)的簡化,即去掉環(huán)網(wǎng)Ring2,只保留1 個環(huán)網(wǎng)。該架構(gòu)無接入冗余、線路冗余、交換機(jī)冗余,只存在環(huán)路的拓?fù)淙哂?,可靠性相對較低;但由于其網(wǎng)絡(luò)結(jié)構(gòu)簡單,節(jié)省了交換機(jī)資源和光纜(或電纜) 資源,降低了投資成本。單環(huán)網(wǎng)架構(gòu)拓?fù)湟妶D3。
圖3 單環(huán)網(wǎng)架構(gòu)拓?fù)?/p>
網(wǎng)絡(luò)系統(tǒng)的可靠性計算是當(dāng)前研究的熱門方向,主要有:狀態(tài)枚舉法、因子分解法、最小路(割)集法、不交化方法等精確算法;定界法、圖變換、模擬法等近似算法[4-6]。這些計算方法都能有效解決網(wǎng)絡(luò)可靠性的計算問題,但均較為復(fù)雜,直接應(yīng)用于工程實踐存在較大難度。本文提出的3種環(huán)網(wǎng)結(jié)構(gòu),其拓?fù)浣Y(jié)構(gòu)規(guī)則,每條鏈路、每個交換機(jī)的狀態(tài)相互獨立,可根據(jù)古典概型直接計算可靠性,計算過程如下。
全冗余環(huán)網(wǎng)拓?fù)淇傻刃橐恍┗靖罴拇⒙?lián)[7],其等效拓?fù)浣Y(jié)構(gòu)如圖4 所示。
圖4 全冗余環(huán)網(wǎng)等效架構(gòu)
假設(shè)任意一條鏈路的可靠性為λ,任意一臺交換機(jī)的可靠性為P,服務(wù)器發(fā)送端下掛在節(jié)點1,服務(wù)器接收端下掛在節(jié)點k,整個環(huán)路有n 個節(jié)點,系統(tǒng) 整體可 靠 性 為P1。記u=2λ-λ2,v=[λP(2-λP)],x=(1-P)·(λ+P-λP)·(λP)2,得到:
式中,P(La)為在環(huán)路無故障時,數(shù)據(jù)流通過順時針方向鏈路La傳輸?shù)目煽啃?;P(Lb)為在順時針鏈路La不通后,數(shù)據(jù)流通過逆時針方向鏈路Lb傳輸?shù)目煽啃?。為了減小計算P(La)、P(Lb)時的計算量,本文做了以下工程化假設(shè)。
1)通過拓?fù)浞指畛苫ハ嗒毩⒌淖蛹髟O(shè)備與主鏈路、備設(shè)備與備鏈路各看作一個基本割集,本節(jié)點內(nèi)只需要保證任意一個割集聯(lián)通,就認(rèn)為本節(jié)點通向相鄰節(jié)點存在一條有效路徑。此時,有2 種耦合形式會導(dǎo)致“黑洞路徑”,需要排除。“黑洞路徑”如圖5 紅線所示。
2)主備交換機(jī)之間的堆疊線,其距離近,且布置在有人值守機(jī)柜內(nèi),故障時可立即替換,維修耗時接近于0,因此可以忽略其可靠性對系統(tǒng)整體可靠性的影響,即默認(rèn)可靠性等于1。
根據(jù)上述假設(shè),記:
根據(jù)串并聯(lián)概率計算方法,計算通過鏈路La通信的可靠性:
計算在La上發(fā)生“黑洞路徑”概率,得到:
圖5 節(jié)點間耦合故障
計算整條La的可靠性:
同理,可求得在La故障時,數(shù)據(jù)通過Lb傳輸?shù)目煽啃裕?/p>
將式(2)、(9)、(8)代入式(1)、(3),得:
雙環(huán)網(wǎng)拓?fù)湟嗫傻刃橐恍┗靖罴ㄟ^串并聯(lián)而成,其等效拓?fù)浣Y(jié)構(gòu)如圖6 所示。
假設(shè)任意一條鏈路可靠性為λ,任意一臺交換機(jī)可靠性為P,服務(wù)器發(fā)送端下掛在節(jié)點1,服務(wù)器接收端下掛在節(jié)點k,整個環(huán)路有n 個節(jié)點,系統(tǒng)整體可靠性P2,并記w =P(A網(wǎng))。則有:
圖6 雙環(huán)網(wǎng)等效架構(gòu)圖
將式(14)代入(13),得
將(15)式代入(12),有
單環(huán)網(wǎng)只有1個ERPS 環(huán),其可靠性即為雙環(huán)網(wǎng)A 網(wǎng)的可靠性。設(shè)單環(huán)網(wǎng)系統(tǒng)整體可靠性為P3,有:
根據(jù)廣州地鐵集團(tuán)公司的光纜、交換機(jī)故障維修記錄,在2004—2016 年的12 年時間內(nèi),網(wǎng)絡(luò)故障主要來源于光纖鏈路故障,未發(fā)生過因為交換機(jī)故障而造成的網(wǎng)絡(luò)中斷。
根據(jù)交換機(jī)性能指標(biāo)參數(shù),其MTBF(平均無故障時間)=57 年,MTTR(平均修復(fù)時間)=2h,則根據(jù)可維修系統(tǒng)的可靠性計算公式[8~9],有
計算得到交換機(jī)可靠性P=0.99999,為計算方便,取值P=0.99。
對于光纜故障,由于其發(fā)生的隨機(jī)性較大,光纜可靠性λ 可視為變量,在0.9~1 變化區(qū)間內(nèi),觀察其對網(wǎng)絡(luò)可靠性的影響。
根據(jù)上述分析計算結(jié)果,本文給出不同n(環(huán)網(wǎng)節(jié)點總數(shù))、k(環(huán)網(wǎng)中,服務(wù)器接收端下掛的節(jié)點編號,該變量表示接收端到發(fā)送端的距離)值的可靠性曲線,如圖7 所示。同時,為了直觀看出不同網(wǎng)絡(luò)架構(gòu)的可靠性,給出故障率變化曲線,如圖8 所示。
由圖7、圖8 可看出,全冗余環(huán)網(wǎng)的可靠性最高,雙環(huán)網(wǎng)次之,單環(huán)網(wǎng)的可靠性最低。由于全冗余網(wǎng)絡(luò)架構(gòu)采用心跳線互聯(lián),可提供更多連通路徑。經(jīng)過分析計算得出:當(dāng)設(shè)備可靠性、鏈路可靠性均在0.999 以上時,全冗余網(wǎng)絡(luò)架構(gòu)的故障率比雙環(huán)網(wǎng)架構(gòu)的故障率低3個數(shù)量級。
圖7 3 種環(huán)網(wǎng)的可靠性對比
當(dāng)網(wǎng)絡(luò)出現(xiàn)拓?fù)涓淖兓蛘吖收蠒r,觸發(fā)網(wǎng)絡(luò)鏈路切換。在網(wǎng)絡(luò)狀態(tài)收斂過程中,不同組網(wǎng)方式、不同協(xié)議條件下會產(chǎn)生不同的故障切換時間[10-12]。本文針對3 種組網(wǎng)架構(gòu),采用6 臺華為S5700 交換機(jī),分別根據(jù)圖1~圖3,在節(jié)點數(shù)n=3 條件下,給出在一度、二度故障條件下的試驗結(jié)果,并簡單分析影響切換時間的因素。3 種組網(wǎng)方式的性能對比見表1。
圖8 3 種環(huán)網(wǎng)架構(gòu)的故障率對比
表1 3 種組網(wǎng)形式性能對比
續(xù)表
經(jīng)過測試結(jié)果對比分析,可以看到,全冗余網(wǎng)絡(luò)收斂最慢,雙環(huán)網(wǎng)和單環(huán)網(wǎng)收斂性能相當(dāng),但單環(huán)網(wǎng)可靠性低,不能進(jìn)行二度故障保護(hù)。
3 種組網(wǎng)方式各有優(yōu)缺點,對比如表2 所示。
表2 3 種組網(wǎng)方式的優(yōu)缺點對比
綜上所述,在一些對可靠性要求極高的場合,全冗余環(huán)網(wǎng)是首選方案,適合在信號系統(tǒng)部署;在一些對可靠性、時延有一定要求,但要求又不是特別高的場合,雙環(huán)網(wǎng)方案是首選,適合在地鐵綜合監(jiān)控系統(tǒng)部署;在一些可靠性要求較低、時延要求高,且價格敏感的應(yīng)用場合,如運(yùn)維系統(tǒng)、PIS 系統(tǒng)等,可優(yōu)先考慮單環(huán)網(wǎng)方案[13-18]。目前,3種網(wǎng)絡(luò)架構(gòu)在廣州地鐵舊線運(yùn)維、新線建設(shè)中得到了廣泛應(yīng)用,將來可在軌道交通其他線路或其他應(yīng)用領(lǐng)域推廣。