李鵬程,金 肖,王炎鑫,戴立操,羅筑華
(南華大學 人因研究所,湖南 衡陽 421001)
班組情景意識(TSA)就是兩個或兩個以上的班組成員在某時刻對當前系統(tǒng)和環(huán)境中發(fā)生的事件、事件的含義及其未來狀態(tài),通過共享各自觀點以達到對事物一致的看法和共同理解,在此,TSA被看作是班組成員共同的知識[1-2]。TSA對于高風險系統(tǒng)中的班組任務的成功執(zhí)行非常重要,像核電廠(NPP)這樣復雜工業(yè)系統(tǒng)中的系統(tǒng)運行狀態(tài)監(jiān)控和異常狀態(tài)處理,因個人難以完成復雜任務,所以需不同專業(yè)知識、技能的人共同來完成[3]。研究表明,像NPP和空中交通管制(ATC)這樣的復雜動態(tài)系統(tǒng),其系統(tǒng)安全績效更多地取決于班組績效,而不是個人績效[4],且班組績效與TSA呈正相關關系[5-6]。因此,TSA對于NPP的安全至關重要,從而需發(fā)展定量方法來對TSA可靠性進行評價以識別班組人因風險,并采取有利措施預防TSA失誤的發(fā)生。從人因可靠性分析(HRA)的視角來看,TSA可靠性就是在系統(tǒng)運行中的任一階段,班組在規(guī)定的時間和條件下,從環(huán)境中收集和處理信息,正確完成對系統(tǒng)狀態(tài)真實理解的能力。
迄今為止,發(fā)展了一些TSA的測量方法來測量TSA的水平[7-8],但難以識別影響TSA的影響因素及其重要度。盡管一些HRA方法對TSA(相當于診斷)進行了定量可靠性分析,如人的認知可靠性模型(HCR)[9]將班組診斷看作一個整體來進行研究,是一種綜合的TSA評價方法,但只考慮有限的3個行為形成因子(PSF)的影響,且3個PSF之間存在相關性。側重執(zhí)行型失誤(EOC)分析的認知可靠性和失誤分析方法(CREAM)[10]通過專家判斷確定基本的情景意識(SA)失誤概率,通過共同績效條件(CPC)的評估對基本的人因失誤概率(HEP)進行修訂,但只考慮了個體的SA,且假設CPC是相互獨立的,未考慮PSF的相互影響,如果通過相關性分析來考慮班組的SA可靠性,則會帶來諸多的不確定性,使結果產(chǎn)生較大偏差。同樣,NUREG-1792[11]和標準化工廠風險分析-人因可靠性分析(SPAR-H)方法[12]也是通過PSF對基本HEP進行修訂,存在上述缺陷。
因此,為克服上述缺陷,本文發(fā)展一種基于貝葉斯網(wǎng)絡(BN)的TSA可靠性評價方法,為提高HRA的質量提供理論支持。
針對NPP數(shù)字化主控室運行班組而言,當電廠出現(xiàn)異常情況時,班組需收集和分析信息,識別NPP發(fā)生的問題、系統(tǒng)的狀態(tài)及對所處狀態(tài)的驗證與評估等[13-14]。不同系統(tǒng)的自動化水平(有不同的人機界面特征)、數(shù)字化人機界面和數(shù)字化規(guī)程影響信息的呈現(xiàn)和質量(如信息的醒目性、相關性等),影響信息的收集和分析,從而會影響TSA[15-17]。當收集到信息之后,班組成員需對信息進行認識、理解和評估,這就需要個體的知識和經(jīng)驗,班組成員的知識和經(jīng)驗水平影響個體的SA水平,從而會影響TSA水平[18-19]。班組知識和經(jīng)驗水平主要受培訓水平和班組交流合作水平的影響,以確定班組成員知識的全面性和互補性。由于自動化水平的提高,系統(tǒng)變得更為復雜,任務的高風險后果給個體和班組帶來壓力,因此,壓力會影響TSA等認知行為[20-21]。班組壓力主要受任務的復雜性、可用時間及班組知識和經(jīng)驗水平的影響。任務的復雜性決定班組成員需要通過交流與合作來共同完成,交流與合作的充分性影響班組的知識和經(jīng)驗水平,從而影響TSA水平[22-25]。班組為識別系統(tǒng)狀態(tài),需收集大量信息,因此信息的顯示質量會影響TSA水平,影響信息顯示質量的因素主要有數(shù)字化規(guī)程和人機界面質量[16-17,21]。人因事件分析表明,注意力和態(tài)度是影響TSA水平的重要因素[13],注意力受工作環(huán)境的影響(如電話的干擾),安全態(tài)度主要是由電廠的安全文化建設水平?jīng)Q定的。盡管班組情景意識受諸多因素的影響,且相互影響關系非常復雜,但本工作考慮主要的影響因素及其影響關系。此外,研究團隊已基于145個人因事件樣本數(shù)據(jù)建立了TSA的因果概念模型(包括班組感知、班組理解和班組評估)[26],但為了工程應用需對其進行合理簡化。因此,通過上述分析并基于專家組討論(包括模擬機教員2人,具有2~5 a經(jīng)驗的高級操縱員6人,人因專家2人)以修訂,最終建立的TSA因果概念模型如圖1所示。
圖1 TSA因果概念模型Fig.1 Causal concept model of TSA
BN是由節(jié)點和邊組成的有向無環(huán)圖,可用N=?V,E>,P>來描述。其中:離散隨機變量V={X1,X2,…,Xn}對應的節(jié)點表示具有有限狀態(tài)的變量;有向邊E表示節(jié)點間的概率因果關系,P為定量部分,是V上的概率分布,對于離散情況,可用條件概率表(CPT)來表示。BN的推理計算是基于父節(jié)點所處狀態(tài)的概率和CPT進行的[27]。
TSA可靠性受諸多PSF的影響,它們之間有相互的影響。圖1描述了TSA與各PSF間的因果關系,可用BN理論來進行TSA可靠性的定量評價。其推理算法是基于下列4個方程[28]。
1) 條件獨立
(1)
2) 聯(lián)合概率
P(Y=yj,X=xi)=
P(X=xi)·P(Y=yj|X=xi)
(2)
3) 邊緣化定理
P(Y=yj|X=xi)
(3)
4) 貝葉斯定理
P(X=xi|Y=yj)=
(4)
其中:xi為隨機變量X處于第i種狀態(tài);yj為隨機變量Y處于第j種狀態(tài)。
假設父節(jié)點X和Y有l(wèi)ow、moderate、high 3種狀態(tài),子節(jié)點Z可能有狀態(tài)值為low、moderate、high等。通常情況下,父節(jié)點狀態(tài)值與子節(jié)點狀態(tài)值越接近,父節(jié)點導致子節(jié)點狀態(tài)的概率越大,如:
P(Z=high|X=high)>
P(Z=moderate|X=high)>
P(Z=low|X=high)
或:
P(Z=low|X=low)>
P(Z=low|X=moderate)>
P(Z=low|X=high)
因此,可建立一種規(guī)范化的程序或方法來獲取條件概率。
1) 采用層次分析法(AHP)確定PSF的相對重要性
由于不同PSF對TSA可靠性影響的重要程度不同,為確定影響TSA的PSF的相對權重,本文采用AHP對PSF的權重進行辨識。其分析過程主要包括以下步驟[29]:建立層次結構模型;構造成對比較判斷矩陣;計算權向量并做一致性檢驗。
2) 確定考慮權重的父節(jié)點狀態(tài)與子節(jié)點狀態(tài)的距離
由于節(jié)點狀態(tài)之間的距離不同,其概率分布不同,因此采用加權距離絕對值來計算父節(jié)點狀態(tài)與子節(jié)點狀態(tài)之間的距離:
(5)
其中:Dj為父節(jié)點狀態(tài)與子節(jié)點處于j狀態(tài)之間的距離;Dij為第i個父節(jié)點的狀態(tài)與子節(jié)點PSF的正考慮的狀態(tài)之間的距離;n為父節(jié)點PSF的個數(shù);j為所考慮的PSF的可能的狀態(tài),j=a、b、c,a、b、c分別代表3種不同的狀態(tài);wi為第i個父節(jié)點的權重。
3) 確定子節(jié)點處于不同狀態(tài)的條件概率分布
針對不同的Dj進行概率分配,采用Roed等[30]建議的概率分布計算公式:
(6)
其中,分子確定子節(jié)點PSF處于3個不同狀態(tài)間的概率分布,分母是用于標準化或歸一化的因子,使得3個Pj的和等于1。概率分布情況由定義的分布指數(shù)R進行控制,R越大,則子節(jié)點PSF處于遠離它的父節(jié)點狀態(tài)的某個狀態(tài)的概率越低。
由式(6)可知,確定PSF的條件概率分布,主要需確定R,在數(shù)據(jù)缺乏的情況下可通過專家判斷來確定。但為減少R的不確定性,基于以前的模擬機實驗研究結果[31],發(fā)現(xiàn)同一子節(jié)點的父節(jié)點PSF之間的相對權重相差比較大的,則R就大,基本相當于他們權重的比值,因此為簡化計算,均取同一子節(jié)點的父節(jié)點PSF之間兩者權重較大者之間的比值作為需確定的R,即:
(7)
4) 確定二值變量的條件概率分布
對于像人的可靠性(成功和失敗兩種狀態(tài))這樣的二值節(jié)點變量,上述計算條件概率的方法不太適用,因此需發(fā)展一種新的方法來進行條件概率的識別。為預測操縱員的失誤或可靠性概率,需建立函數(shù)來表達HEP與PSF之間的關系。
文獻[32]構建的人因失誤概率f(X)與綜合的PSF的影響關系如下:
f(X)=KeλX
(8)
其中:K和λ為兩個常量;變量X為所有PSF的綜合影響。
依據(jù)PSF的相對權重和其狀態(tài)等級水平來確定PSF的綜合影響,進而確定PSF的狀態(tài)等級水平與HEP的對應關系,確定變量X的方法為:(1) 確定HEP區(qū)間,由SPAR-H方法[12]可知,可選擇操作失誤概率區(qū)間為[10-5,1];(2) 需考慮PSF的權重w和狀態(tài)等級水平S,以確定他們的綜合影響,權重和狀態(tài)等級水平的取值范圍均為[0,1];(3) 一般而言,當所有PSF的影響處于平均值0.5或所有PSF影響之和等于0.5時,則操縱員的失誤概率為名義的失誤概率,定義為HEPN,當所有PSF的影響處于0時,則失誤概率為1,當所有PSF的影響處于1時,則失誤概率為10-5。
因此,所有PSF的影響X可采用以下公式來表示:
(9)
其中:wi為第i個PSF的權重,∑wi=1;xi為第i個PSF的狀態(tài)等級水平,其取值為區(qū)間[0,1],X的區(qū)間為[-1,1]。當xi的取值為0時,X的值為-1,當xi的取值為1時,X的值為1,因此有:
(10)
其中:HEPmin為人因失誤的最小值,為10-5;HEPmax為人因失誤的最大值,為1。將上述值代入式(9)可得:
(11)
從而可得人因失誤概率估計公式為:
HEP=3.16×
(12)
基于式(12)就可確定TSA可靠性或失誤的條件概率分布。已知TSA可靠性的因果概念模型及通過構建的評價方法獲取的數(shù)據(jù),可對TSA可靠性進行定量評價。
選取NPP典型的事故——功率運行期間1臺蒸汽發(fā)生器中發(fā)生1根傳熱管破裂的事故(SGTR)來進行實例分析,主要任務是隔離破損蒸汽發(fā)生器。
1) 根節(jié)點的先驗概率
由于歷史數(shù)據(jù)和統(tǒng)計數(shù)據(jù)有限,因此采用專家組對根節(jié)點的先驗概率分布進行估計。專家組包括2名教員、6名有經(jīng)驗的操縱員和2名人因專家,假定他們的權重一樣,經(jīng)計算得到的綜合評估結果列于表1。
表1 影響TSA可靠性的根節(jié)點PSF的先驗概率Table 1 Prior probability of root node PSF affecting TSA reliability
2) 中間變量的條件概率
(1) 確定PSF之間的相對權重
依據(jù)已構建的TSA可靠性因果概念模型,采用AHP對影響TSA可靠性的PSF進行兩兩比較,得到的相對權重列于表2。
(2) 確定父節(jié)點狀態(tài)與子節(jié)點狀態(tài)的距離
選取PSF“人機界面質量”與“數(shù)字化規(guī)程質量”影響“信息顯示質量”為例進行說明。當父節(jié)點“人機界面質量”處于“好(a)”的狀態(tài)與子節(jié)點“信息顯示質量”處于“好(a)”狀態(tài)的距離Daa=0,父節(jié)點“數(shù)字化規(guī)程質量”處于“好(a)”的狀態(tài)與子節(jié)點“信息顯示質量”處于“好(a)”狀態(tài)的距離Daa=0,且其父節(jié)點權重分別為wH=0.75、wP=0.25,由式(5)可得其加權距離為Da=0、Db=1、Dc=2。
表2 影響TSA的PSF的相對權重及RTable 2 Relative weight and R of PSF affecting TSA
(3) 確定子節(jié)點處于不同狀態(tài)的條件概率分布
首先依據(jù)式(7)確定R(表2),然后計算子節(jié)點處于不同狀態(tài)的條件概率分布,同樣以“信息顯示質量”為例進行說明。將R=3代入式(6)可得Pa=0.95、Pb=0.047、Pc=0.003,從而可得其條件概率分布分別為0.95、0.047和0.003。同理可得其他條件概率分布。
(4) 確定二值變量的條件概率分布
依據(jù)獲得的先驗概率和條件概率及貝葉斯理論,就可對TSA可靠性進行定量評價。為簡化計算,采用匹茲堡大學決策系統(tǒng)實驗室開發(fā)的可支持貝葉斯推理的軟件GeNIe來進行概率推理,主要包括因果推理和診斷推理。
1) 因果推理
因果推理是由原因推知結論,是一種自上而下的推理。在給定原因或證據(jù)的條件下,通過貝葉斯推理,求得結果發(fā)生的概率。在本例特定情景中,根據(jù)與操縱員訪談的情況獲得的根節(jié)點PSF的狀態(tài)等級列于表3。然后采用GeNIe軟件和已知數(shù)據(jù)構建TSA可靠性的BN推理模型,得到TSA可靠性為TSAR=0.998,對應的失誤概率為TSAE=0.002。
表3 SGTR情境下訪談得到的PSF狀態(tài)水平Table 3 Level of PSF state obtained from interview in SGTR scenario
2) 診斷推理
診斷推理是由結論推知原因,是一種自下向上的推理過程。當已知結果時,找出產(chǎn)生該結果各種原因的可能性。在本文中假設發(fā)生了TSA失誤,利用貝葉斯理論公式可計算相應的后驗概率,采用GeNIe程序算得的結果如圖2所示。將上述后驗概率與先驗概率(選取最差狀態(tài)進行對比)進行比較,可得變化的百分比(由后驗概率減去先驗概率再除以先驗概率),結果列于表4。
圖2 SGTR情景下TSA可靠性分析的BN診斷推理模型Fig.2 Bayesian network diagnostic inference model for TSA reliability analysis in SGTR scenario
表4 根節(jié)點變量的先驗概率與后驗概率的對比Table 4 Comparison of prior probability and posterior probability of root node variable
由表4可知,當發(fā)生TSA失誤時,班組培訓水平差、人機界面質量差、班組交流與合作水平差、可用時間不充分的后驗概率與先驗概率相比發(fā)生了較大變化,分別提高了530%、204%、100%、80%,這表明節(jié)點“TSA可靠性”對節(jié)點“班組培訓水平”、“人機界面質量”、“班組交流與合作水平”、“可用時間”很敏感,這些節(jié)點狀態(tài)的微小波動,可能對班組情景意識失誤產(chǎn)生較大影響,成為引發(fā)TSA失誤的主要原因。
3) 靈敏度分析
為說明本文所構建的TSA可靠性評價模型的有效性和合理性,對其進行簡單靈敏度分析,當PSF處于不同狀態(tài),獲取的TSA可靠性或失誤概率不同。當所有PSF狀態(tài)均取“好”時,失誤概率為0.000 147,當所有PSF狀態(tài)均取“中”時,失誤概率為0.004 479,當所有狀態(tài)均取“差”時,失誤概率為0.114 133。因此從整體概率跨度來看,模型構建是合理的。
另外,當其余PSF所有狀態(tài)均取“好”時,改變班組培訓水平的狀態(tài),其狀態(tài)“好”、“中”、“差”分別對應的失誤概率為0.000 147、0.000 671、0.002 116。同樣,當其余PSF所處狀態(tài)均取“中”以及“差”時,改變班組培訓水平的狀態(tài),其狀態(tài)“好”、“中”、“差”分別對應的失誤概率為0.001 537、0.004 479、0.017 278以及0.016 378、0.039 355、0.114 133。
同理可分析其他變量的靈敏度,分析結果示于圖3。根據(jù)圖3可知,其余PSF狀態(tài)不變,改變某個PSF的狀態(tài)水平,對應的TSA失誤概率不同,說明構建的模型具有較好的靈敏度。
圖3 根節(jié)點PSF在不同狀態(tài)下的TSA失誤概率Fig.3 TSA error probability of root node PSF in different states
4) 比較驗證
為驗證本文所構建的TSA可靠性評價方法的有效性,選取2個典型的HRA進行比較分析,分別是CREAM方法[10]和SPAR-H方法[12]。其基本原理為:先確定基本的HEP,然后考慮PSF的影響,再對基本HEP進行修正。CREAM方法采用9個共同績效條件(CPCs)對基本的HEP進行修訂,即組織的充分性(PSF1)、工作條件(PSF2)、人機界面與操作支持的充分性(PSF3)、規(guī)程的可用性(PSF4)、需同時考慮的目標數(shù)量(PSF5)、可用時間(PSF6)、工作時間段(PSF7)、培訓和經(jīng)驗水平(PSF8)、成員之間的合作水平(PSF9)。SPAR-H方法考慮8個PSF的影響,即工作適應性(PSF1)、壓力水平(PSF2)、人機界面/工效學(PSF3)、規(guī)程質量(PSF4)、任務復雜性(PSF5)、可用時間(PSF6)、工作流程(PSF7)、經(jīng)驗/培訓水平(PSF8)。并且不同影響因素分成不同等級,不同等級對應不同的調整值。因此,單個行為的可靠性可用如下公式來計算:
(13)
其中:Pj為第j個行為HEP;BHEPj為第j個行為的基本HEP;PSFk為第k個PSF的調整值,k=1,2,…,m。CREAM方法和SPAR-H方法的分析步聚和數(shù)據(jù)詳見文獻[10,12]。由情景環(huán)境分析和CREAM方法可知TSA可能的失誤模式為“診斷錯誤”,其對應的基本HEP為2×10-2。由SPAR-H方法可得診斷的基本HEP為1×10-2。具體分析結果列于表5。
表5 CREAM方法和SPAR-H方法的分析結果Table 5 Analysis result of CREAM method and SPAR-H method
由表5可知,采用CREAM方法識別的HEP為8.0×10-3,采用SPAR-H方法識別的HEP為3.2×10-3。而本文建立的考慮PSF因果關系及權重的可靠性評價方法得到的HEP為2.0×10-3,在同一個數(shù)量級,且較CREAM和SPAR-H方法的略低。這說明考慮PSF因果關系及權重的方法用于評估TSA可靠性是有效的。結果產(chǎn)生偏差的原因來源于各方面,如基本HEP、PSF、數(shù)據(jù)和計算方法的不同。但可以肯定的是,本文建立的方法考慮了PSF之間的相互影響關系與PSF之間的相對權重,從理論分析來看,HEP的計算結果更為準確和合理(但還需進一步實驗驗證)。另外,本文構建的方法基于BN模型,推理過程具有較強的數(shù)理依據(jù),分析過程更具科學性。
TSA對于NPP安全而言特別重要,為識別TSA可靠性水平,克服傳統(tǒng)HRA分析方法的不足,本文構建了一種基于BN的TSA可靠性評價方法,得到如下結論。
1) 考慮影響TSA可靠性的PSF相對權重及它們之間的因果關系,克服傳統(tǒng)方法在考慮PSF影響時存在雙重計算其影響的不足,使方法更加合理,評估結果更符合客觀實際。
2) 構建了規(guī)范化的中間變量的條件概率計算方法,克服了傳統(tǒng)HRA方法基于專家判斷帶來的不確定性等問題,使獲得的概率數(shù)據(jù)更為合理可靠,提高了數(shù)據(jù)的質量和分析精度。
3) 案例分析表明,基于BN構建的TSA可靠性評價方法不僅能定量評估特定情景下的人因可靠性(因果推理),且能識別給定證據(jù)情景下(假設發(fā)生TSA失誤,診斷推理)引發(fā)TSA失誤的主要貢獻因子,為人因失誤預防提供理論與實踐支持;通過靈敏度分析表明,構建的模型具有較好的靈敏度。同時,經(jīng)過方法的比較驗證,說明該方法有效。
盡管本文方法具有諸多優(yōu)點,但評估結果的有效性和可靠性還需通過實驗來進行驗證,發(fā)現(xiàn)不足并進行改進,以提升分析的精度,這是未來需進一步研究的工作。同時,TSA可靠性評價過程是一動態(tài)過程,因此需進一步收集動態(tài)數(shù)據(jù)和建立動態(tài)模型來評估TSA的可靠性,則更符合客觀實際。