李 杰,盧 穎,曲少春,郭 琪,傅妍芳
(西安工業(yè)大學(xué),西安 710000)
網(wǎng)絡(luò)可用性是戰(zhàn)術(shù)通信網(wǎng)建設(shè)和運(yùn)行最重要的性能之一,是衡量網(wǎng)絡(luò)系統(tǒng)結(jié)構(gòu)設(shè)計(jì)優(yōu)劣和系統(tǒng)穩(wěn)定性以及維護(hù)能力的一個(gè)重要指標(biāo),直接影響到作戰(zhàn)信息和指揮命令的實(shí)時(shí)傳遞。因此,研究如何建立戰(zhàn)術(shù)通信網(wǎng)的可用性模型和評(píng)估技術(shù),從而采取相應(yīng)的措施來提高戰(zhàn)術(shù)通信網(wǎng)在戰(zhàn)時(shí)的可靠可用性具有重要意義。目前,針對(duì)復(fù)雜戰(zhàn)術(shù)通信網(wǎng)的可用性研究至今仍尚無完整的體系結(jié)構(gòu),對(duì)其進(jìn)行可用性能的評(píng)價(jià)也沒有一個(gè)統(tǒng)一指標(biāo)。在評(píng)估一個(gè)戰(zhàn)術(shù)通信網(wǎng)系統(tǒng)的好壞時(shí),須要以“可用性”來衡量,而可靠性和可用性常常被混淆?!翱煽啃浴敝荒芊从吵鼍W(wǎng)絡(luò)系統(tǒng)或者設(shè)備組件出現(xiàn)故障的概率,而“可用性”考慮了網(wǎng)絡(luò)的可修復(fù)能力,更能反映出網(wǎng)絡(luò)的品質(zhì)。目前,國內(nèi)文獻(xiàn)[1-4]在網(wǎng)絡(luò)可靠性方面的論述較多,可用性較少,也沒有對(duì)戰(zhàn)術(shù)網(wǎng)進(jìn)行相關(guān)的仿真。本文針對(duì)網(wǎng)絡(luò)可用性評(píng)估問題,采用Markov 數(shù)學(xué)分析法對(duì)子網(wǎng)可用性進(jìn)行了模型分析和計(jì)算機(jī)仿真,接著運(yùn)用Monte Carlo 法進(jìn)行了仿真建模,該方法根據(jù)戰(zhàn)術(shù)通信子網(wǎng)的特點(diǎn),在K/N 端連通可用度方法的基礎(chǔ)上,結(jié)合深度優(yōu)先搜索算法和權(quán)重減枝法給出含權(quán)節(jié)點(diǎn)連通度P 來判定系統(tǒng)當(dāng)前時(shí)刻的狀態(tài),最終計(jì)算出網(wǎng)絡(luò)可用性參數(shù),同時(shí)對(duì)子網(wǎng)進(jìn)行了可用性分析評(píng)估。
工程中通常采用平均無故障間隔時(shí)間MTTF(Mean Time To Failure)來衡量系統(tǒng)的可靠性[5],而用平均維修時(shí)間MTTR(Mean Time To Repair)來衡量系統(tǒng)的可修復(fù)[6]性,可用度A 可由這兩個(gè)參數(shù)得出。
由式(1)可知,當(dāng)MTTF 趨于無窮大時(shí)或當(dāng)MTTR 趨近于0 時(shí),則可用度A 趨向于1。因此,可通過提高設(shè)備可靠性和對(duì)系統(tǒng)的修復(fù)能力兩種方法來提高可用性。
戰(zhàn)術(shù)通信子網(wǎng)中可工作節(jié)點(diǎn)數(shù)隨著故障以及維修事件而發(fā)生變化,即在故障事件的驅(qū)動(dòng)下,整個(gè)系統(tǒng)運(yùn)行的時(shí)間被不同的時(shí)刻劃分,而每個(gè)時(shí)刻系統(tǒng)的工作狀態(tài)(可工作節(jié)點(diǎn)數(shù))將發(fā)生變化,工作狀態(tài)由上一個(gè)時(shí)刻的工作狀態(tài)決定,因此,系統(tǒng)中可工作節(jié)點(diǎn)數(shù)的狀態(tài)[7-8]具有馬爾可夫性。
將戰(zhàn)術(shù)通信子網(wǎng)系統(tǒng)視作多狀態(tài)Markov 可修復(fù)系統(tǒng)[9]。對(duì)于系統(tǒng)的工作狀態(tài)和故障狀態(tài)可依據(jù)K/N 連通可靠度準(zhǔn)則[10]來進(jìn)行判定,即當(dāng)n 個(gè)部件中有k 個(gè)或k 個(gè)以上部件工作,則認(rèn)定系統(tǒng)處于正常工作狀態(tài)(n≥k)。由此得出,系統(tǒng)故障狀態(tài)可根據(jù)出現(xiàn)故障的節(jié)點(diǎn)個(gè)數(shù)定義為E={0,1,…,n-k+1},該集合由工作狀態(tài)集W 和網(wǎng)絡(luò)故障集F 組成,即E={W,F(xiàn)},W={0,1,…,n-k},F(xiàn)={n-k+1}。系統(tǒng)狀態(tài)之間的轉(zhuǎn)換如圖1 所示,由于節(jié)點(diǎn)的故障與維修事件的發(fā)生,系統(tǒng)的運(yùn)行狀態(tài)根據(jù)K/N 連通可靠度準(zhǔn)則在W 和F 之間轉(zhuǎn)換。
圖1 系統(tǒng)狀態(tài)轉(zhuǎn)換圖
戰(zhàn)術(shù)通信網(wǎng)系統(tǒng)由多個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)設(shè)備和修理部門組成。本節(jié)研究基于以下假定:
1)系統(tǒng)中各節(jié)點(diǎn)的故障時(shí)間與修復(fù)時(shí)間相互獨(dú)立,且故障節(jié)點(diǎn)在維修過后,按照新節(jié)點(diǎn)[12]的損壞概率來計(jì)算。
2)節(jié)點(diǎn)的故障和維修是服從指數(shù)分布的無記憶隨機(jī)過程。每個(gè)設(shè)備節(jié)點(diǎn)的故障時(shí)間Tn為:
3)維修部門的維修能力無限,且節(jié)點(diǎn)損壞后立即進(jìn)行維修。
可得到時(shí)間連續(xù)多狀態(tài)的齊次Markov 鏈{X(t),t≥0},其中,X(t)=j,j∈{0,1,…,n-k+1},該式表示時(shí)刻t 系統(tǒng)有j 個(gè)節(jié)點(diǎn)故障并在修理,系統(tǒng)的狀態(tài)轉(zhuǎn)移概率圖如圖2 所示(為表達(dá)清晰圖中未畫出自己轉(zhuǎn)移到自己)。
圖2 網(wǎng)絡(luò)多狀態(tài)轉(zhuǎn)移概率圖
對(duì)式(5)求Δt→0 求極限可得轉(zhuǎn)移概率矩陣:
令Pj(t)表示t 時(shí)刻系統(tǒng)處于j 狀態(tài)的概率,并令P(t)=(P0(t),P1(t),…,Pn-k+1(t)),它表示t 時(shí)刻系統(tǒng)處于各狀態(tài)的分布概率,即一組行向量。由式(5)建立微分方程如下:
這是一階線性微分方程組,可由此求出P(t),則系統(tǒng)的網(wǎng)絡(luò)可用度如式(7)所示。
將3.2 節(jié)中表1 的參數(shù)代入上式并利用matlab軟件計(jì)算系統(tǒng)可用性參數(shù),其結(jié)果如下頁表2 所示,用Markov 方法建立一個(gè)簡(jiǎn)單例子與仿真方法得出的可用性進(jìn)行比對(duì)驗(yàn)證。
在戰(zhàn)術(shù)通信網(wǎng)中引起系統(tǒng)狀態(tài)改變的故障與修復(fù)事件是在離散時(shí)刻出現(xiàn)的,因此,可通過離散故障事件[13-14]驅(qū)動(dòng)法對(duì)其進(jìn)行仿真分析。
3.1.1 網(wǎng)絡(luò)連通度計(jì)算
在仿真過程中使用了深度優(yōu)先算法,實(shí)時(shí)更新當(dāng)前系統(tǒng)的最大節(jié)點(diǎn)連通度參數(shù)n,并通過K/N 端連通可靠度準(zhǔn)則來判定當(dāng)前子網(wǎng)是否處于可工作狀態(tài),接下來通過計(jì)算式(1)得出網(wǎng)絡(luò)的可用性參數(shù)A。
初始化時(shí),設(shè)置一個(gè)子網(wǎng)標(biāo)準(zhǔn)閾值k,如果最大連通節(jié)點(diǎn)數(shù)大于或等于k,將定義網(wǎng)絡(luò)當(dāng)前“可用”,否則網(wǎng)絡(luò)系統(tǒng)癱瘓。定義一個(gè)函數(shù)Φ(x)來描述當(dāng)前時(shí)刻網(wǎng)絡(luò)的狀態(tài)x∈{0,1,…,k-1,k,k+1,…,n},系統(tǒng)中最大節(jié)點(diǎn)數(shù)為n。
Φ(x)的值由x 與K 之間的關(guān)系確定,Φ(x)為0,表示系統(tǒng)癱瘓,Φ(x)為1,則表示系統(tǒng)可正常工作。
3.1.2 可用性參數(shù)評(píng)估
可用性仿真評(píng)估參數(shù)計(jì)算如下:
1)平均無故障間隔時(shí)間MTTF(MTTF 記錄為TTF)計(jì)算公式如下:
其中,NS為仿真運(yùn)行總次數(shù),ti是第i 次仿真的平均故障時(shí)間。
2)平均修理時(shí)間MTTR(MTTR 記錄為TTR)的計(jì)算公式如下:
其中,NS為仿真運(yùn)行總次數(shù),tmi是第i 次仿真中的網(wǎng)絡(luò)平均修復(fù)時(shí)間
3)穩(wěn)態(tài)可用度Ai的計(jì)算公式如下:
其中,Ai為第i 次仿真的穩(wěn)態(tài)可用度,WT 為第i 次仿真的網(wǎng)絡(luò)系統(tǒng)可工作總時(shí)間,WT 為第i 次仿真的網(wǎng)絡(luò)系統(tǒng)癱瘓的總時(shí)間。
4)平均可用度A(t)的計(jì)算公式如下:
其中,Ai(t)為第i 次仿真在當(dāng)前t 時(shí)刻下的穩(wěn)態(tài)可用度,NS為總仿真次數(shù)。
3.1.3 仿真流程
實(shí)驗(yàn)中設(shè)定仿真次數(shù)為NS,每一次仿真時(shí)長(zhǎng)為Tmax,仿真過程中將根據(jù)可用性參數(shù)的定義來評(píng)估計(jì)算網(wǎng)絡(luò)可用性,仿真流程如下頁圖3 所示。
仿真步驟如下:
1)設(shè)置系統(tǒng)仿真次數(shù)初值為NS,將網(wǎng)絡(luò)拓?fù)涑跏蓟癁猷徑泳仃嚒?/p>
2)仿真是由兩種故障事件推進(jìn)的,故障產(chǎn)生事件和修復(fù)事件,先根據(jù)一定的故障修復(fù)比來產(chǎn)生隨機(jī)事件,并針對(duì)每一次不同隨機(jī)故障事件的時(shí)間值TFi,排序并生成鏈表。
3)根據(jù)故障事件驅(qū)動(dòng)的方法,推進(jìn)仿真進(jìn)程,直至仿真次數(shù)達(dá)到NS。
4)事件處理過程中,判斷當(dāng)前發(fā)生事件是故障產(chǎn)生事件還是故障修復(fù)事件,在仿真推進(jìn)中對(duì)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)動(dòng)態(tài)更新。并實(shí)時(shí)進(jìn)行深度優(yōu)先搜索,求出當(dāng)前的最大連通數(shù)n,當(dāng)n≥k 時(shí),網(wǎng)絡(luò)系統(tǒng)可用,若n<k,則網(wǎng)絡(luò)癱瘓,并記錄系統(tǒng)癱瘓時(shí)間TF和可用時(shí)間Tw。
圖3 仿真算法流程圖
5)仿真結(jié)束,統(tǒng)計(jì)網(wǎng)絡(luò)可用性參數(shù)值。
實(shí)驗(yàn)設(shè)置:假定戰(zhàn)術(shù)通信子網(wǎng)為10 節(jié)點(diǎn)單元,不考慮作戰(zhàn)任務(wù)、組織關(guān)系、重要程度等因素,將通過計(jì)算機(jī)仿真和馬爾科夫方法來計(jì)算系統(tǒng)可用性。仿真參數(shù)如表1 所示,M 表示仿真節(jié)點(diǎn)數(shù)量,E(F)為故障期望,P1、P2、P3、P4分別代表4 種不同的修復(fù)期望(修復(fù)時(shí)間由短變長(zhǎng)),Stimes為仿真總次數(shù),Tmax為仿真時(shí)長(zhǎng)。表1 中閾值K 為6,同時(shí)修復(fù)期望、節(jié)點(diǎn)故障期望和仿真時(shí)長(zhǎng)的時(shí)間單位都為min。
表1 仿真參數(shù)設(shè)置
實(shí)驗(yàn)所得可用性評(píng)估結(jié)果如表2 所示,A1、TTF、TTR分別表示蒙科卡洛方法中所獲得的平均可用度、平均故障時(shí)間、平均修復(fù)時(shí)間;A2表示馬爾可夫方法獲得的可用度,Vi代表的是網(wǎng)絡(luò)節(jié)點(diǎn)中損壞i 個(gè)節(jié)點(diǎn)的狀態(tài)。
表2 可用性結(jié)果參數(shù)
如表2 可知,兩組實(shí)驗(yàn)的系統(tǒng)可用度(A1與A2)呈現(xiàn)出了較為接近的趨勢(shì),即與節(jié)點(diǎn)的修復(fù)期望呈線性相關(guān),修復(fù)期望值越大(由于戰(zhàn)術(shù)環(huán)境、自然環(huán)境的限制,設(shè)備的損壞程度不同以及維修部門的維修力度不同導(dǎo)致了修復(fù)時(shí)間的期望值不同),系統(tǒng)的可用性就會(huì)越低。
將表2 的馬爾可夫方法中各個(gè)狀態(tài)Vi的損壞概率提取出來,其生成結(jié)果如圖4 所示。
圖4 各損壞狀態(tài)概率折線圖
從圖4 中可以看出,當(dāng)節(jié)點(diǎn)的修復(fù)期望越大,同時(shí)損壞多個(gè)節(jié)點(diǎn)的概率明顯上升,而無損壞節(jié)點(diǎn)的概率降低。兩組實(shí)驗(yàn)的可用度結(jié)果都顯示出了該系統(tǒng)具有高可用性,不同修復(fù)期望比的情況下可用度誤差在6%以內(nèi),說明了所采用基于蒙特卡洛的網(wǎng)絡(luò)可用性仿真建模法對(duì)戰(zhàn)術(shù)通信網(wǎng)可用性的評(píng)估具有一定的參考價(jià)值。
戰(zhàn)術(shù)通信網(wǎng)中信息的傳遞呈現(xiàn)出一種“縱向化”的特征。同時(shí),根據(jù)戰(zhàn)術(shù)通信網(wǎng)層級(jí)特點(diǎn)以及各節(jié)點(diǎn)級(jí)別的不同,仿真可以設(shè)定一個(gè)簡(jiǎn)單的3 級(jí)指揮結(jié)構(gòu)。第1 層為營(yíng)指揮節(jié)點(diǎn);第2 層為連指揮節(jié)點(diǎn);第3 層為火炮節(jié)點(diǎn),構(gòu)建如圖5 所示的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。
圖5 層級(jí)指揮網(wǎng)拓?fù)涫疽鈭D
仿真模型中,為符合實(shí)際情況將根據(jù)戰(zhàn)術(shù)通信網(wǎng)各節(jié)點(diǎn)的層級(jí)關(guān)系及系統(tǒng)中所處的不同重要程度,為該樹狀層級(jí)指揮網(wǎng)各節(jié)點(diǎn)賦予相應(yīng)權(quán)值Pij。
仿真算法中,用P 值取代網(wǎng)絡(luò)連通度n。由此,生成簡(jiǎn)化條件下的作戰(zhàn)體系網(wǎng)絡(luò)。戰(zhàn)術(shù)三級(jí)指揮網(wǎng)拓?fù)浣Y(jié)構(gòu)(含權(quán)重)生成算法如下:
1)設(shè)網(wǎng)絡(luò)中有N 個(gè)信息節(jié)點(diǎn),生成第1 層(層級(jí)h=1)的旅節(jié)點(diǎn),個(gè)數(shù)為1,并賦予此節(jié)點(diǎn)重要度權(quán)值P1j;
2)以第1 層的旅節(jié)點(diǎn)為父節(jié)點(diǎn),生成N2個(gè)第2層(層級(jí)h=2)團(tuán)節(jié)點(diǎn),并賦予本層各節(jié)點(diǎn)權(quán)值P2j;
3)重復(fù)算法2)直至h=L(L 為最大層數(shù)),即完成了網(wǎng)絡(luò)系統(tǒng)的生成,此時(shí)節(jié)點(diǎn)個(gè)數(shù)N 由式(13)所得,其中,Ni表示第i 層節(jié)點(diǎn)的個(gè)數(shù);
網(wǎng)絡(luò)各節(jié)點(diǎn)權(quán)重值之和P 由式(14)所得,其中,L 表示網(wǎng)絡(luò)系統(tǒng)當(dāng)前層數(shù),m 表示每層的節(jié)點(diǎn)數(shù)。
仿真過程中,如若某節(jié)點(diǎn)隨機(jī)損毀,則其本身權(quán)重值及其所帶分枝上所有節(jié)點(diǎn)權(quán)重值均不予計(jì)算(即此路不通),從網(wǎng)絡(luò)最大連通節(jié)點(diǎn)的權(quán)值之和中將其剔除即為權(quán)重剪枝法。剪枝后,若當(dāng)前最大連通權(quán)重總和P 達(dá)不到閾值K,則認(rèn)定當(dāng)前戰(zhàn)術(shù)通信網(wǎng)運(yùn)行狀況不符合生存要求,系統(tǒng)癱瘓。如圖6 所示,當(dāng)V1與V2的鏈路損壞,由于虛線中除去了壞掉的鏈路,V2,V4,V5無法與系統(tǒng)中其他節(jié)點(diǎn)連通,所以,計(jì)算總權(quán)重P 時(shí)將會(huì)去排除此枝中所有節(jié)點(diǎn)。
仿真實(shí)驗(yàn)仍在5 種不同修復(fù)期望強(qiáng)度P1、P2、P3、P4和P5(修復(fù)強(qiáng)度逐漸減弱),仿真次數(shù)都為10,仿真時(shí)間都為5 000 min。
圖6 權(quán)重剪枝
表3 仿真實(shí)驗(yàn)參數(shù)
表3 中,M 表示仿真節(jié)點(diǎn)數(shù)量,E(F)為故障期望,根據(jù)M 和E(F)可算出含權(quán)三級(jí)子網(wǎng)滿枝權(quán)值總和N=70,分別在K=35、45、55、60、65 時(shí),測(cè)試修復(fù)期望在由強(qiáng)減弱的過程中系統(tǒng)可用性變化情況。
表4 平均可用性結(jié)果參數(shù)
圖7 修復(fù)強(qiáng)度與可用度關(guān)系圖
從表4 和圖7 所示的實(shí)驗(yàn)結(jié)果中可以看出,戰(zhàn)術(shù)通信網(wǎng)的可用度與節(jié)點(diǎn)的修復(fù)期望有關(guān),修復(fù)期望值越大,則系統(tǒng)的可用性就越低,原因是維修的期望值較大,被維修節(jié)點(diǎn)不能夠進(jìn)行工作,而在此維修這段時(shí)間內(nèi)損壞的節(jié)點(diǎn)數(shù)在不斷增加,造成了多個(gè)損壞節(jié)點(diǎn)在單位時(shí)間內(nèi)大量冗余,總體上導(dǎo)致系統(tǒng)的癱瘓時(shí)間變多。隨著設(shè)定的閾值K 逐漸增大(對(duì)戰(zhàn)術(shù)網(wǎng)要求變高),低連通值不能滿足戰(zhàn)術(shù)指令下達(dá)以及情報(bào)共享功能,導(dǎo)致系統(tǒng)可用性降低。
根據(jù)實(shí)驗(yàn)結(jié)果,為了提升系統(tǒng)可用性可采取以下措施:1)在戰(zhàn)前對(duì)設(shè)備進(jìn)行加強(qiáng)維護(hù),定期更換或者維修老化的設(shè)備部件;2)可以采用多個(gè)備用設(shè)備節(jié)點(diǎn),加固戰(zhàn)術(shù)網(wǎng)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu);3)提升通信技術(shù),保證戰(zhàn)術(shù)網(wǎng)在網(wǎng)絡(luò)嚴(yán)重打擊(低閾值K)下依然能夠獲取到戰(zhàn)術(shù)指令以及情報(bào)數(shù)據(jù);4)需依據(jù)網(wǎng)絡(luò)的規(guī)模來相應(yīng)地增加并合理地安排維修人員,改進(jìn)維修技術(shù),提高通訊設(shè)備維修能力。
如何在復(fù)雜戰(zhàn)術(shù)指控網(wǎng)絡(luò)環(huán)境下實(shí)時(shí)、快速評(píng)估網(wǎng)絡(luò)可用性,進(jìn)而為網(wǎng)絡(luò)的規(guī)劃建設(shè)進(jìn)行指導(dǎo)有著一定的現(xiàn)實(shí)意義。本文在構(gòu)建戰(zhàn)術(shù)通信層級(jí)子網(wǎng)模型的基礎(chǔ)上,針對(duì)子網(wǎng)可用性進(jìn)行了仿真評(píng)估,并通過實(shí)驗(yàn)分析了該方法的有效性和可行性,從而為戰(zhàn)場(chǎng)通信網(wǎng)絡(luò)的可用性研究提供了新的方法和參考。本文在可用性評(píng)價(jià)過程中仍存在很多簡(jiǎn)化的假設(shè),有一定的局限性。因此,還需要結(jié)合實(shí)際的戰(zhàn)場(chǎng)網(wǎng)絡(luò)背景進(jìn)行針對(duì)地可用性研究。