吳乃哲
(北京市軌道交通運營管理有限公司,北京 100068)
全自動運行系統(tǒng)(fully automatic operation,F(xiàn)AO),是基于現(xiàn)代計算機、通信、控制和系統(tǒng)集成等技術(shù)來實現(xiàn)列車運行全過程自動化的新一代城市軌道交通系統(tǒng)。全自動運行系統(tǒng)是一項系統(tǒng)工程,涉及信號、車輛、綜合監(jiān)控、通信、站臺門、車輛基地等多個專業(yè),以行車為核心,通過信號、車輛、綜合監(jiān)控、通信系統(tǒng)的深度集成,提升軌道交通運行系統(tǒng)的整體自動化水平。FAO 信號系統(tǒng)是關(guān)鍵設(shè)備,可以控制列車運行,保證行車安全,提高運輸效率,傳遞行車信息,改善行車人員的勞動強度。FAO 信號系統(tǒng)是當前城軌主流信號系統(tǒng)CBTC(基于通信的列車運行控制系統(tǒng))的升級版,在CBTC 的基礎(chǔ)上,增加了包括列車休眠喚醒、動靜態(tài)自檢、障礙物/脫軌防護、遠程復位等20 余項功能,具備高度自動化和深度集成、充分的冗余配置、完善的安全防護、豐富的控制中心功能,且完全兼容常規(guī)的CBTC。隨著全自動運行系統(tǒng)技術(shù)的逐漸發(fā)展,越來越多的國家和城市選擇采用了自動化程度更高、運行性能更穩(wěn)定的全自動運行系統(tǒng)。在我國,隨著燕房線等全自動運行線路的開通,在國家大力倡導發(fā)展智慧城軌的趨勢下,未來FAO 信號系統(tǒng)必將代替CBTC 成為城軌信號系統(tǒng)的新主流。
城市軌道交通與地面公交相比,具有載客量大、運行軌道單一的特點。這意味著列車一旦出現(xiàn)運行故障,不僅影響自身的列車運行以及所載乘客的正常出行,而且也會影響后續(xù)列車的運行,因此軌道交通系統(tǒng)的運行故障影響有傳播面廣、發(fā)展迅速的特點。即使全自動運行系統(tǒng)已經(jīng)在CBTC 的基礎(chǔ)上提升了安全水平,降低了系統(tǒng)發(fā)生故障的可能性,但故障的發(fā)生仍是不可能被完全杜絕的。為了進一步提升全自動運行系統(tǒng)的安全水平,研究人員也需要考慮當故障發(fā)生后,如何將故障影響降到最低,即系統(tǒng)能夠抵抗故障,減緩故障產(chǎn)生的性能下降速度,并且快速恢復彈性能力。
彈性(resilience)一詞源于拉丁文resiliere,為回彈的意思。該詞最早由生態(tài)學家Holling[1]引入生態(tài)學領(lǐng)域,用于衡量系統(tǒng)可持續(xù)性、吸收變化和擾動后維持種群關(guān)系的能力,之后這一概念逐漸擴展到組織管理、基礎(chǔ)設(shè)施、工程系統(tǒng)等領(lǐng)域,廣泛用于評價個體、集體或系統(tǒng)承受擾動以及擾動后的恢復能力。自然災害、設(shè)備故障和人為失誤等都可能對組織或系統(tǒng)的連續(xù)運行造成潛在和嚴重的威脅,這些極端自然事件和技術(shù)事故之后伴隨的災害和危機的發(fā)生,都顯示出傳統(tǒng)風險評估和管理的局限性。在風險的背景下,彈性已被作為常規(guī)風險管理的補充和替代方案進行討論。為了應對眾多的大規(guī)模意外事件,如軌道交通系統(tǒng)中嚴重的意外事故,彈性分析成為大型復雜基礎(chǔ)設(shè)施系統(tǒng)的最佳決策,同時也可作為對于復雜系統(tǒng)自適應管理具有重要意義的風險管理分析的補充。
彈性評估方法從大體上可分為定性、半定量以及定量3 種類型。定性評估的思路主要是分析影響系統(tǒng)彈性的因素,并根據(jù)彈性影響因素建立彈性評價框架,對系統(tǒng)展開彈性評估。例如,兩組研究人員都根據(jù)自身系統(tǒng)的特點,各有側(cè)重地建立了用于定性分析的彈性評估框架[2-3]。半定量評估方法通常是利用定性評價來獲取源數(shù)據(jù),繼而使用數(shù)學模型進行定量計算。例如,Muller 采用模糊規(guī)則評價法評估了基礎(chǔ)設(shè)施系統(tǒng)的整體彈性[4];Azadeh 等采用數(shù)據(jù)包絡(luò)分析法對石油化工廠系統(tǒng)進行彈性計算,同時還用模糊認知圖對系統(tǒng)彈性進行評價[5]。定量評估方式則是通過獲取真實事件的數(shù)據(jù)或者通過模擬仿真得到的數(shù)據(jù),采用一定的數(shù)學模型進行計算。例如,魏群通過對列車運行過程進行模擬仿真獲取原始運行數(shù)據(jù),將列車運行間隔和延誤時間作為性能指標,采用彈性曲線模型的方式評估系統(tǒng)彈性[6]。
城市軌道交通系統(tǒng)的彈性研究還處于較為初級的階段,而隨著全自動運行系統(tǒng)的不斷發(fā)展,為保證該系統(tǒng)能以更高安全水平的方式運行,除了采取傳統(tǒng)的風險管理方式外,提升系統(tǒng)的彈性、使系統(tǒng)更具有“韌性”也是不能忽視的。為此,本研究提供一種基于貝葉斯網(wǎng)絡(luò)模型的彈性評估方法,從全自動運行系統(tǒng)的彈性特點出發(fā),從宏觀到微觀的邏輯思維,探究了全自動運行系統(tǒng)內(nèi)部以及外部的彈性因果關(guān)系,通過敏感度分析,對彈性影響因子進行敏感度排序,理清影響系統(tǒng)彈性的主要因素,為提升全自動運行系統(tǒng)彈性提供指導意見。
貝葉斯統(tǒng)計推斷起源于英國學者Bayes 發(fā)表的一篇論文,他在這篇論文中提出了著名的貝葉斯公式。1988 年,Pearls 深入分析了拓撲結(jié)構(gòu)以及變量間的條件獨立性關(guān)系,提出了貝葉斯網(wǎng)絡(luò)(Bayesian Network,BN)。貝葉斯公式是貝葉斯網(wǎng)絡(luò)進行推斷和計算的理論基礎(chǔ),如果事件B1,B2,…,Bn是彼此互斥的事件,且這些事件構(gòu)成一個完整事件,并且有 P(Bi)≥0 (i=1, 2, …, n),同時有事件A,且A 與B1, B2, B3, …, Bn中的事件同時發(fā)生,則貝葉斯公式可表示為
式中:P(Bi)表示先驗概率,它一般是觀測者根據(jù)先驗知識主觀判斷得到的概率或是根據(jù)現(xiàn)有的統(tǒng)計數(shù)據(jù)及歷史資料計算得到的概率;P(Bi|A)表示后驗概率,它是先驗概率在經(jīng)過貝葉斯公式進行修正計算后得到的更符合實際的概率;P(A|Bi)表示條件概率,它是指在事件B 己經(jīng)發(fā)生的條件下事件A 發(fā)生的概率。
貝葉斯網(wǎng)絡(luò)又稱信度網(wǎng)絡(luò),是貝葉斯方法的擴展,是目前不確定知識表達和推理領(lǐng)域最有效的理論模型之一。貝葉斯網(wǎng)絡(luò)用二元組BN=(G,P)來表示,其中G=(N,E)用來對網(wǎng)絡(luò)結(jié)構(gòu)進行定性的描述,代表一個有N 個節(jié)點的有向無環(huán)圖,E 是有向無環(huán)圖中邊的集合;P 代表條件概率表,貝葉斯網(wǎng)絡(luò)中的節(jié)點與其條件概率表相關(guān)聯(lián),該表用于確定節(jié)點狀態(tài)在其父節(jié)點條件下的概率,沒有父節(jié)點的用先驗概率進行信息表達。節(jié)點之間的相互依賴關(guān)系由聯(lián)合概率分布來定義,因此全貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的聯(lián)合概率可以使用鏈式規(guī)則計算所有“父項”的因子分解形式。這樣,包含n 個變量的貝葉斯網(wǎng)絡(luò)的全聯(lián)合概率分布P(B1, B2, …, Bn)可以表示為
式中,Pa(Bi)為節(jié)點Bi的父節(jié)點集。
貝葉斯網(wǎng)絡(luò)學習包括網(wǎng)絡(luò)的參數(shù)學習與網(wǎng)絡(luò)的結(jié)構(gòu)學習兩種。貝葉斯網(wǎng)絡(luò)的參數(shù)學習是在已知確定的貝葉斯網(wǎng)絡(luò)拓撲結(jié)構(gòu)的條件下,確定與有向無環(huán)圖中每個節(jié)點相關(guān)的條件概率分布。貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)學習是在已知網(wǎng)絡(luò)中節(jié)點數(shù)量與狀態(tài)的情況下,利用先驗知識及數(shù)據(jù)經(jīng)驗,結(jié)合訓練樣本集的方法,確定合理的貝葉斯網(wǎng)絡(luò)拓撲結(jié)構(gòu)。
一般情況下,貝葉斯網(wǎng)絡(luò)的學習主要基于兩個假設(shè)條件:一是數(shù)據(jù)集中每個記錄的數(shù)據(jù)服從統(tǒng)一的概率分布,二是網(wǎng)絡(luò)參數(shù)θ 同時滿足局部獨立性和全局獨立性的假設(shè)。
當具有完整數(shù)據(jù)集時,最常采用的參數(shù)學習方法是最大似然估計法和貝葉斯方法,但在現(xiàn)實情況中,收集的數(shù)據(jù)可能會有不同程度的缺失現(xiàn)象。當對具有缺失數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)進行參數(shù)學習時,可采用最大期望算法(expectation-maximization algorithm,EM),EM 算法的實質(zhì)是設(shè)法將不完備的數(shù)據(jù)轉(zhuǎn)化為完備數(shù)據(jù)。
EM 算法主要由兩個步驟完成,即E 步驟計算期望和M 步驟最大化。通過對這兩個步驟的反復迭代,直到算法收斂,從而計算出未知參數(shù)的估計值。實際上,計算期望值就是計算對數(shù)似然函數(shù)的下界值:設(shè)X 為未知變量,Y 為觀測變量,D 為訓練集,定義q(X=x|Y)表示當觀測值為Y 時X=x 的概率,可以得到
設(shè)對數(shù)似然函數(shù)L 為
假設(shè)函數(shù)P(X=xi,Y=D)為有極值的凸函數(shù),則根據(jù)Jensen 不等式可以得到
EM 算法實際就是在E 步驟得到參數(shù)的下界,在M 步驟進行更新計算,得到其最大值。令q(X=x|Y)= P(X|θt),θt代表當前迭代結(jié)果的未知參數(shù),θt+1為下一次迭代的參數(shù),求解L 的下界其實就是在給定當前參數(shù)的條件下求下一次迭代的參數(shù),L 的下界設(shè)為Q(θt+1|θ),則:
按照最大似然估計中的方法,求出Q(θt+1|θ)最大時參數(shù),有
式中,ENijk表示數(shù)據(jù)集D 中滿足Xi=xik,Pa(Xi)=Pa(Xi)j,即滿足當節(jié)點i 的值取第k 個值時對應的父節(jié)點為j的數(shù)據(jù)。
彈性研究在工程系統(tǒng)、電力系統(tǒng)、交通網(wǎng)絡(luò)等領(lǐng)域都得到了有效的應用,到目前為止還沒有形成統(tǒng)一的彈性定義,但總結(jié)起來大致相似,都關(guān)注于系統(tǒng)對擾動的承受和恢復能力。Bruneau 在其論文中,用系統(tǒng)在遭受擾動前后的性能變化曲線來刻畫彈性[7],如圖1 所示。通過彈性曲線的描述,系統(tǒng)的彈性能力可以在擾動前后的4 個不同階段來體現(xiàn):階段1,體現(xiàn)系統(tǒng)在未遭受嚴重擾動時能保持正常運行,同時能實現(xiàn)目標運力;階段2,在系統(tǒng)遭受來自內(nèi)部或外部的干擾后,系統(tǒng)性能開始下降,這一階段能夠體現(xiàn)系統(tǒng)抵抗性能下降的彈性能力;階段3,系統(tǒng)逐漸開始恢復,主要體現(xiàn)了系統(tǒng)恢復的快速性;階段4,描述了系統(tǒng)再次恢復穩(wěn)定后的性能水平,體現(xiàn)了系統(tǒng)彈性的恢復完備性。
圖1 性能“下降-恢復”曲線 Figure 1 “Failure-recovery” performance curve
因此,通過彈性曲線的直觀描述,可以得到彈性由4 種彈性能力來體現(xiàn),如圖2 所示。
圖2 彈性的四大能力 Figure 2 Four abilities of resilience
Murray-Tuite 首次提出了關(guān)于彈性在交通運輸領(lǐng)域的定義,同時還提出了交通系統(tǒng)彈性的量化方法,他認為彈性包含多個維度,分別是冗余性、多樣性、有效性、部件的自主性、協(xié)作、適應性、移動性、安全性以及迅速恢復等[8]。從RAMS 角度可以發(fā)現(xiàn),系統(tǒng)的可靠性、可用性及可維修性等靜態(tài)指標越好,系統(tǒng)能夠正常運行的能力就越強;而系統(tǒng)彈性除了受RAMS 靜態(tài)指標的影響,由擾動引發(fā)的系統(tǒng)性能下降以及性能恢復過程也體現(xiàn)了彈性的動態(tài)特性。另外,從全自動運行系統(tǒng)的功能實現(xiàn)角度可以發(fā)現(xiàn),系統(tǒng)的正常運行同樣離不開人員的參與,而在發(fā)生故障時能否有效恢復,與人員的工作效率有很大關(guān)系,因此全自動運行系統(tǒng)的彈性也受人員組織的影響。專業(yè)研究認為,彈性是一個系統(tǒng)在變化和干擾之前或之后調(diào)整其功能的內(nèi)在能力,能幫助系統(tǒng)在發(fā)生重大事故或在持續(xù)壓力的情況下也能維持運行[9]。為了具有彈性,一個系統(tǒng)或一個組織必須具備以下4 個品質(zhì):一是能以穩(wěn)健而靈活的方式應對常規(guī)和非常規(guī)的威脅;二是監(jiān)視正在發(fā)生的事情,包括它自己的表現(xiàn);三是預測風險(風險事件);四是能從經(jīng)驗中學習。
表1 歸納總結(jié)了關(guān)于全自動運行系統(tǒng)的彈性評估貝葉斯網(wǎng)絡(luò)模型的各節(jié)點元素,從彈性的四大能力出發(fā),探究其影響因素,并確定表征影響因素的指標作為根節(jié)點。
表1 全自動運行系統(tǒng)的貝葉斯網(wǎng)絡(luò)節(jié)點 Table 1 Bayesian network nodes for a fully automatic operation system
在確定了全自動運行系統(tǒng)的彈性貝葉斯網(wǎng)絡(luò)模型的節(jié)點變量后,需要為各節(jié)點設(shè)置條件概率,明確子節(jié)點對父節(jié)點的依賴關(guān)系。在本研究中,基礎(chǔ)節(jié)點(無父節(jié)點)的先驗概率由統(tǒng)計專家的打分結(jié)果來獲取,為每個基礎(chǔ)節(jié)點設(shè)置2、1、0 三個分值,采集10 位專家的打分結(jié)果,其中貝葉斯網(wǎng)絡(luò)模型的各節(jié)點分別設(shè)置high、medium 和low 三個狀態(tài),再統(tǒng)計每個分值的占比。例如,若有兩位專家為該基礎(chǔ)節(jié)點打2 分,則該節(jié)點的high 狀態(tài)對應的先驗概率為40%。
在確定了基礎(chǔ)節(jié)點的先驗概率后,需要為其余有父節(jié)點的子節(jié)點確定條件概率。確定方式為:將每個節(jié)點的high、medium、low 三個狀態(tài)分別對應2、1和0 分,為了獲得子節(jié)點的條件概率,計算父節(jié)點的數(shù)值之和,然后除以它們的最大值之和,為子節(jié)點構(gòu)建一個介于0~1 之間的全局相對值x,有
式中,x 是被分析子節(jié)點的全局相對值,i 代表該子節(jié)點的父節(jié)點。
在獲得子節(jié)點的全局相對值后,用公式x2、2x(1-x)、(1-x)2分別進行計算,再分別對應該子節(jié)點在父節(jié)點時的high、medium 和low 三種狀態(tài)的條件概率值。這種分配方式確保了分配的規(guī)范化和連續(xù)的參數(shù)化,若子節(jié)點只有成功和失敗兩種狀態(tài),則全局相對值x 則可代表成功的概率。在模糊理論中,這些方程稱為隸屬函數(shù)(membership function,MF)。隸屬函數(shù)是一條曲線,它定義了如何將輸入空間中的每個點映射到0~1 之間的成員值(或隸屬度)。其中,將x值轉(zhuǎn)換為隸屬度稱為模糊化。有較多的隸屬度公式可供選擇,如三角隸屬度公式:當x 介于(0,0.5)之間時,隸屬度公式為(-2x+1,2x,0);當x 介于(0.5,1)之間時,隸屬度公式為(0,-2x+2,2x-1)。無論使用哪種成員函數(shù),任何點的總和都應始終等于1。在本研究中,選擇了一組連續(xù)的隸屬函數(shù)。為了更清楚地展示該過程,以表2 為例,計算一個假設(shè)有4 個父節(jié)點的子節(jié)點的條件概率。
表2 給定父節(jié)點狀態(tài)的子節(jié)點的條件概率 Table 2 CPT of a Son node, given the states of the father nodes
本研究采用GeNIe 的貝葉斯網(wǎng)絡(luò)建模軟件,GeNIe使用EM 算法對貝葉斯網(wǎng)絡(luò)的參數(shù)進行學習,使用聯(lián)合樹的方法對貝葉斯網(wǎng)絡(luò)進行推理,且可視化窗口操作方便、學習速度快、計算精度較高,因此比較適合全自動運行系統(tǒng)的貝葉斯網(wǎng)絡(luò)的構(gòu)建與分析。在表1中,確定了全自動運行系統(tǒng)的貝葉斯網(wǎng)絡(luò)模型的節(jié)點,同時簡單梳理了各節(jié)點之間的因果關(guān)系。在本研究中,貝葉斯網(wǎng)絡(luò)大致可以劃分為3 個部分,第一部分為四大彈性能力,第二部分是影響因素層,第三部分為指標層[10]。本研究以北京地鐵燕房線為例,對指標層制定打分表,采集了10 位專家的打分意見,按照上文中先驗概率和條件概率的確定方式,繪制出了全自動運行系統(tǒng)的貝葉斯網(wǎng)絡(luò)模型,如圖3 所示。其中,黃色表示指標節(jié)點,綠色表示彈性能力節(jié)點,紫色表示彈性節(jié)點,其余的節(jié)點為影響因素節(jié)點??梢钥吹阶罱K全自動運行系統(tǒng)的彈性結(jié)果:高的占比為23%,中等的占比為41%,低的占比為36%,因此最大可能為中等水平。向最終的彈性節(jié)點輸入狀態(tài)為高的證據(jù),可以看到各指標的數(shù)據(jù)變化,可以指導專業(yè)人員更好地提升系統(tǒng)彈性。
圖3 全自動運行系統(tǒng)的貝葉斯網(wǎng)絡(luò)模型 Figure 3 Bayesian network model of a fully automatic operation system
通過靈敏度分析,幫助了解貝葉斯網(wǎng)絡(luò)概率參數(shù)對目標節(jié)點的影響程度;根據(jù)網(wǎng)絡(luò)參數(shù)的微小變化,探究目標節(jié)點的變化程度。識別靈敏度高的節(jié)點,可以直接指導系統(tǒng)的彈性提升工作。在GeNIe 軟件中,可以直接進行靈敏度的分析,在給定一組目標節(jié)點的情況下,有效計算每個貝葉斯網(wǎng)絡(luò)數(shù)值對目標節(jié)點的后驗概率分布的導數(shù)。這些導數(shù)表明了網(wǎng)絡(luò)數(shù)值參數(shù)對計算目標后驗概率的重要性,參數(shù)p 的導數(shù)大,會導致目標在給定參數(shù)p 變化的情況下后驗變化很大,說明目標節(jié)點對該參數(shù)變化的靈敏度較高;如果導數(shù)很小,那么即使參數(shù)的變化較大,也不會對后驗產(chǎn)生很大的影響,因此說明目標節(jié)點對該參數(shù)的靈敏度較差。
在執(zhí)行靈敏度分析時,目標節(jié)點的每個狀態(tài)都被單獨處理。因此,靈敏度分析顯示了目標節(jié)點在所選狀態(tài)的最敏感參數(shù)。如圖4 所示,分別是系統(tǒng)彈性節(jié)點以及4 個彈性能力節(jié)點在狀態(tài)高的條件下的靈敏度分析。當參數(shù)在選定范圍內(nèi)更改時,所選擇的是參數(shù)左右波動10%,條形圖顯示目標狀態(tài)中的更改范圍,筆者選擇繪制了10 個最有影響的參數(shù)。條形圖的顏色表示目標狀態(tài)變化的方向,紅色表示負變化,綠色表示正變化。從中可以清楚地看到,目標節(jié)點對每個參數(shù)變化的敏感度都不同,狀態(tài)為高的彈性目標節(jié)點對狀態(tài)為低的參數(shù)P8 最為敏感;當參數(shù)P8 狀態(tài)為低的概率下降10%后,系統(tǒng)彈性為高的狀態(tài)概率從23.29%提升到了24.47%。因此,若想更好地提升系統(tǒng)彈性,首先可以從改善參數(shù)P8(也就是系統(tǒng)故障后的維修時間)入手。在對彈性四大能力的敏感度進行分析后發(fā)現(xiàn),最為敏感的參數(shù)主要集中在P8、P7 以及P1??梢园l(fā)現(xiàn),全自動運行系統(tǒng)在故障后有導致嚴重事故后果的特征,這決定了該系統(tǒng)的故障恢復過程較為緩慢,因此極大地影響了系統(tǒng)的彈性。另外,人員的工作能力也對系統(tǒng)彈性產(chǎn)生較為嚴重的影響。
圖4 彈性節(jié)點在狀態(tài)為高的敏感度分析 Figure 4 Sensitivity analysis for resilience with a high state
筆者基于貝葉斯網(wǎng)絡(luò)建模方法,提出一種對列車全自動運行系統(tǒng)的彈性評估方式,通過劃分彈性能力、影響因素以及指標,確定全自動運行系統(tǒng)的貝葉斯網(wǎng)絡(luò)節(jié)點,通過理清節(jié)點之間的因果關(guān)系,確定各節(jié)點之間的網(wǎng)絡(luò)結(jié)構(gòu),建立全自動運行系統(tǒng)的貝葉斯網(wǎng)絡(luò)模型。通過對指標層制定打分表,確定基礎(chǔ)節(jié)點的先驗概率,同時采用一定的隸屬度分配方法來確定條件概率;在輸入模型中進行系統(tǒng)彈性計算,結(jié)果發(fā)現(xiàn)在狀態(tài)為高、中、低的概率占比中,系統(tǒng)彈性狀態(tài)為中的占比最大。因此可以說明,以北京地鐵燕房線為例的全自動運行系統(tǒng)的彈性水平為中等的概率最大。對目標節(jié)點進行敏感度分析可以發(fā)現(xiàn),系統(tǒng)彈性目標節(jié)點對參數(shù)P8(即故障維修時間)在狀態(tài)為低時的敏感度最大;同時,通過彈性四大能力的敏感度分析發(fā)現(xiàn),最為敏感的參數(shù)集中在P8、P7 以及P1。因此,提升全自動運行系統(tǒng)的彈性,應該重點關(guān)注故障維修時間、故障嚴重程度以及人員工作能力這三個方面。