徐征捷
(湖南中車時代通信信號有限公司, 湖南 長沙 410005)
可靠性是衡量產(chǎn)品質(zhì)量的重要指標。產(chǎn)品的可靠性一般包括定性和定量要求,可靠性預(yù)計的目的是給出可靠性的量化值,它是衡量可靠性定量要求是否達到指標要求的重要手段[1]。在過往研究中,可靠性預(yù)計技術(shù)已被廣泛應(yīng)用于汽車、航空等領(lǐng)域。
軌道交通信號產(chǎn)品作為保障列車行車安全的實時控制系統(tǒng),必須具有高可靠性和高安全性[2]。安全計算機平臺被廣泛應(yīng)用于軌道交通信號產(chǎn)品中,其中倒機單元作為安全計算平臺的核心單元,能夠有效提高安全計算機的可靠性。倒機單元中的各個功能模塊由元器件組成,功能模塊失效通常是因為模塊內(nèi)一個或多個元器件失效造成的。因此,開展軌道交通領(lǐng)域信號產(chǎn)品的可靠性預(yù)計技術(shù)的研究在工程中有現(xiàn)實意義[3]。
本文以安全計算機平臺中的倒機單元為研究對象,采用元器件應(yīng)力法對其進行可靠性預(yù)計,定量估計產(chǎn)品的可靠性,綜合評價設(shè)計方案,鑒別研發(fā)方案和設(shè)計中的潛在問題,合理分配可靠性指標,為優(yōu)選及使用元器件提供數(shù)據(jù)支撐。
目前在工程領(lǐng)域應(yīng)用較為廣泛的可靠性預(yù)計方法主要有元器件計數(shù)法和元器件應(yīng)力法。
元器件計數(shù)法一般應(yīng)用于產(chǎn)品方案初步設(shè)計階段的可靠性預(yù)計中,在列出系統(tǒng)中所有元器件的種類、數(shù)量和質(zhì)量等級以及系統(tǒng)工作環(huán)境的基礎(chǔ)上,通過對系統(tǒng)中各種類型元器件的通用故障率及相應(yīng)類型元器件的數(shù)量進行計算,最終得到系統(tǒng)的總失效率[4]。這種方法的特點是不需要詳細地了解每個元器件的應(yīng)力和環(huán)境條件,能夠快速估算出系統(tǒng)的失效率。
元器件應(yīng)力法一般應(yīng)用于產(chǎn)品設(shè)計階段的可靠性預(yù)計中。確定系統(tǒng)中各種元器件的種類以及所承受的各種應(yīng)力后,以元器件基本失效率為基礎(chǔ),根據(jù)使用環(huán)境、生產(chǎn)制造工藝、質(zhì)量等級、工作方式和工作應(yīng)力的不同,做出相應(yīng)的修正,從而預(yù)計元器件的失效率,進而求出模塊的失效率,最后得到產(chǎn)品的失效率。國產(chǎn)和進口元器件的失效率,可以分別參考標準GJB/Z 299C-2006《電子設(shè)備可靠性預(yù)計手冊》和MIL-HDBK-217F Reliability prediction of electronic equipment所提供的數(shù)據(jù)和方法進行預(yù)計[5-6]。
依據(jù)標準GJB 813-90《可靠性模型的建立和可靠性預(yù)計》提供的方法[7],可靠性預(yù)計可以概括為以下3個步驟:
(1)明確系統(tǒng)定義、工作條件、環(huán)境條件以及故障模式;
(2)對產(chǎn)品各個模塊進行梳理,明確各個模塊之間的關(guān)系,繪制產(chǎn)品可靠性框圖,建立可靠性模型;
(3)預(yù)計各個模塊的可靠性,根據(jù)可靠性模型預(yù)計整個產(chǎn)品的可靠性。
其中,在進行元器件可靠性預(yù)計時,涉及的質(zhì)量等級定義為在元器件制造、檢驗和篩選過程中的質(zhì)量控制水準。不同質(zhì)量等級對元器件失效率的影響程度用質(zhì)量系數(shù)πQ表示。設(shè)備的應(yīng)用環(huán)境類別用環(huán)境系數(shù)πE表示[8]。平均故障間隔時間(mean time between failure,MTBF)、平均修復(fù)時間(mean time to repair,MTTR)常被用于作為產(chǎn)品的可靠性量化指標[9]。下面以安全計算機平臺中的倒機單元為例,詳細介紹基于元器件應(yīng)力法的產(chǎn)品可靠性預(yù)計過程。
倒機單元是二乘二取二安全計算機平臺的關(guān)鍵單元,二乘指的是兩系構(gòu)成熱備冗余結(jié)構(gòu),保證系統(tǒng)在其中一系故障的情況下能夠倒向備機工作。雙系熱備是基于主/備方式,主機和備機同步運行,都進行系統(tǒng)的數(shù)據(jù)輸入/輸出、邏輯運算;但在同一時刻,只有主機才有系統(tǒng)的最終控制權(quán)。當主機故障時,系統(tǒng)通過倒機單元實現(xiàn)兩系的主備切換,以保證在盡量短的時間內(nèi)使系統(tǒng)恢復(fù)正常工作,達到無縫切換的效果[10]。圖1為安全計算機平臺與倒機單元的關(guān)聯(lián)關(guān)系圖。
圖1 安全計算機平臺與倒機單元關(guān)聯(lián)關(guān)系圖Fig.1 Association diagram of safety computer platform and switching unit
3.2.1 系統(tǒng)定義及環(huán)境條件
倒機單元的工作環(huán)境為室內(nèi)機柜,因此可將其定義為地面設(shè)備。倒機單元工作時,環(huán)境溫度為50℃;對于在計算失效率時需要利用結(jié)溫參數(shù)的元器件,結(jié)溫選擇為60℃。
3.2.2 可靠性框圖和模型
倒機單元共由6個模塊組成,功能模塊劃分以及各個模塊的組成部分如表1所示。
表1 倒機單元各功能模塊及組成部分Tab.1 Function modules and components of switching unit
每個功能模塊在電路功能上相對獨立,系統(tǒng)可靠性模型為串聯(lián)結(jié)構(gòu),其可靠性框圖如圖2所示。
圖2 倒機單元可靠性框圖Fig.2 Reliability block diagram of switching unit
對倒機單元進行可靠性預(yù)計時,先計算各個功能模塊內(nèi)元器件的工作失效率;再將模塊內(nèi)各類元器件的工作失效率相加,得出各個模塊的失效率;最后將各個模塊的失效率相加,得到倒機單元的總失效率。
倒機單元的可靠性預(yù)計模型如式(1)所示,模塊的失效率由模塊內(nèi)所有元器件的失效率累加得到。
式中:λp_倒機單元——倒機單元的工作失效率;λp_切換模塊——切換模塊的工作失效率;λp_主用確認——主用確認模塊的工作失效率;λp_接口模塊——接口模塊的工作失效率;λp_端子——端子的工作失效率;λp_線纜——線纜的工作失效率。
3.2.3 倒機單元可靠性預(yù)計
按照標準GJB/Z 299C-2006中第4.3節(jié)提供的定義,將倒機單元的環(huán)境類別定義為“一般地面固定”,用GF1表示。系統(tǒng)在正常工作條件(沒有超過規(guī)定溫度范圍、電應(yīng)力比在0~1之間)下運行,且倒機單元采用的元器件等級均為工業(yè)級。
由于大多數(shù)元器件手冊或者官方網(wǎng)站均沒有提及元器件的質(zhì)量等級,因此,在進行元器件的可靠性預(yù)計時,各元器件的質(zhì)量系數(shù)按標準GJB/Z 299C-2006進行選取,具體如表2所示。
表2 倒機單元各元器件質(zhì)量等級及系數(shù)Tab.2 Quality grades and coefficients of switching unit components
根據(jù)元器件所述類別,結(jié)合倒機單元的環(huán)境類別、工作環(huán)境溫度以及是否為國產(chǎn)元器件等條件,計算各類元器件的工作失效率。倒機單元的繼電器、旋轉(zhuǎn)開關(guān)和指示燈為進口元器件,采用應(yīng)力分析法時,按標準GJB/Z 299C-2006中附錄A.2提供的工作失效率模型計算元器件的工作失效率。
除國產(chǎn)電纜的失效率按標準GJB/Z 299C-2006第5章表5.22-1中電纜的工作失效率直接換算之外,其他元器件的失效率按λb與環(huán)境系數(shù)πE、質(zhì)量系數(shù)πQ等一系列π系數(shù)相連乘的方式進行計算。不同元器件的計算公式不同,式(2)為通用繼電器的可靠性預(yù)計模型。
式中:λp——元器件的工作失效率;λb——元器件基本失效率;πT——溫度系數(shù);πS——應(yīng)力系數(shù)。
其他元器件的計算公式可以在標準GJB/Z 299C-2006中進行查找,這里不再贅述。倒機單元的元器件具體系數(shù)取值如表3所示。
表3 倒機單元各元器件系數(shù)取值Tab.3 Specific coefficient values of switching unit components
按照上述計算方法和參數(shù)計算得到倒機單元各個模塊及總失效率數(shù)據(jù)如表4所示。
表4 倒機單元各模塊失效率及總失效率Tab.4 Failure rate of each module and the total failure rate of switching unit
通過可靠性預(yù)計可得,倒機單元總失效率λp_倒機單元=9.9501×10-7/h;平 均 故 障 間 隔 時 間MTBF倒機單元=1/λp_倒機單元=1 005 015 h。根據(jù)倒機單元需求規(guī)范規(guī)定的倒機單元MTTR不超過30 min的要求,得到倒機單元的可用性A倒機單元=[MTBF倒機單元/(MTBF倒機單元+MTTR倒機單元)]=99.999 9%。由可靠性預(yù)計結(jié)果可知,該倒機單元的可靠性指標能滿足產(chǎn)品設(shè)計規(guī)范要求(設(shè)計需求規(guī)定模塊MTBF不小于1×106h,可用性不低于99.999%),不需要進行重新分配可靠性指標或者優(yōu)選元器件等操作。
可靠性預(yù)計能夠定量評估產(chǎn)品的可靠性,為優(yōu)選及使用元器件提供數(shù)據(jù)支撐。本文以軌道交通信號產(chǎn)品中倒機單元為例,通過建立可靠性框圖和模型,在元器件通用失效率的基礎(chǔ)上,考慮實際工況下的各種應(yīng)力水平,通過元器件應(yīng)力法將元器件工作失效率轉(zhuǎn)換為元器件實際工況下的失效率,并對其模塊及系統(tǒng)進行可靠性預(yù)計。計算得到倒機單元的MTBF指標為1 005 015 h,可用性達99.999 9%,可靠性指標計算結(jié)果滿足產(chǎn)品設(shè)計規(guī)范的要求。
該方法同樣可以推廣應(yīng)用于軌道交通領(lǐng)域其他電子產(chǎn)品的可靠性預(yù)計中。根據(jù)可靠性預(yù)計結(jié)果與產(chǎn)品可靠性要求進行比較,評價設(shè)計方法是否滿足要求,從而針對產(chǎn)品薄弱環(huán)節(jié)提前采取措施,提高整個產(chǎn)品的可靠性。