范哲銘,陳墾倫,李亞球,2
(1.工業(yè)和信息化部電子第五研究所,廣東 廣州 511370;2.廣東省電子信息產(chǎn)品可靠性技術(shù)重點實驗室,廣東 廣州 511370)
對于長期儲存和一次性使用的復(fù)雜系統(tǒng),經(jīng)過一段時間的存儲、探測和故障維護后,其內(nèi)部材料性能的變化將直接導致其性能下降,這對其任務(wù)的執(zhí)行會造成不良的影響。例如:電子元件焊點的氧化膜或雜質(zhì),機械部件的腐蝕或銹蝕,軸承潤滑劑的氧化變質(zhì),橡膠部件等材料的老化變脆,支撐結(jié)構(gòu)材料的微裂紋膨脹等因素都將導致復(fù)雜系統(tǒng)的可靠性逐漸地下降[1]。在實際的使用過程中,隨著維護和試驗方法的不斷進行,復(fù)雜系統(tǒng)在儲存過程中將承受測試、維護甚至部件更換過程,這一系列操作也將直接影響復(fù)雜系統(tǒng)的儲存可靠性。
目前國內(nèi)外存儲可靠性研究主要采用以下方法[2-3]:存儲故障率預(yù)測方法、自然存儲壽命測試數(shù)據(jù)評估方法、故障插值方法、加速壽命測試方法[4]和故障樹分析方法,以及基于貝葉斯定理的評估方法、基于神經(jīng)網(wǎng)絡(luò)的預(yù)測方法[5]和基于模糊系統(tǒng)的存儲可靠性方法等。其中,存儲故障率預(yù)測方法、自然存儲壽命測試數(shù)據(jù)評價方法和故障插值法通常采用現(xiàn)場存儲數(shù)據(jù)和長期存儲測試進行存儲可靠性的工程和統(tǒng)計評估;加速壽命測試方法通過更大的壓力使元件快速地失效來推斷元件的故障率和壽命,可以在短時間內(nèi)評估元件的存儲壽命;傳統(tǒng)的故障樹分析方法和基于模糊系統(tǒng)的存儲可靠性方法通過分解系統(tǒng)功能和收集故障數(shù)據(jù)來建立系統(tǒng)故障樹,然后通過分析或仿真方法計算,進而評價系統(tǒng)的存儲可靠性。這些方法通常從數(shù)據(jù)的角度來研究存儲對復(fù)雜系統(tǒng)固有可靠性的影響。然而,在復(fù)雜系統(tǒng)的實際使用中,合理的維護工作、適當?shù)谋U腺Y源、適當數(shù)量的備件將對復(fù)雜系統(tǒng)任務(wù)的完成造成重大的影響。
為了評估存儲對復(fù)雜系統(tǒng)任務(wù)執(zhí)行的影響,考察復(fù)雜系統(tǒng)執(zhí)行單元在特定維護和保障資源條件下完成給定任務(wù)的能力,本文采用仿真思想考慮復(fù)雜系統(tǒng)存儲、使用、維護和保護等環(huán)節(jié),并考慮存儲過程以對復(fù)雜系統(tǒng)可用性進行仿真研究,以此提出評估復(fù)雜系統(tǒng)可靠性、維修性和保障性(RMS)特征水平的手段。
從交付到任務(wù)執(zhí)行(或退役),復(fù)雜系統(tǒng)應(yīng)經(jīng)歷運輸/處理、倉庫存儲、測試、維護、待機工作與存儲和任務(wù)執(zhí)行(或退役),以及其壽命概況中的其他幾個環(huán)節(jié)[6-7]。其壽命一般可分為3個階段:倉庫存儲階段、任務(wù)準備階段和任務(wù)執(zhí)行階段。復(fù)雜系統(tǒng)在倉庫儲存階段處于非工作狀態(tài),但在任務(wù)準備階段和任務(wù)執(zhí)行階段則處于工作狀態(tài)。復(fù)雜系統(tǒng)需要在前兩個階段進行測試、維護和其他工作。
復(fù)雜系統(tǒng)在存儲、使用、維護和保護過程中具有以下特點。
a)不同的階段有不同的故障率
倉庫儲存階段和任務(wù)準備階段的復(fù)雜系統(tǒng)由于不同的環(huán)境條件而承受不同的壓力,前者是非工作狀態(tài),而后者是工作狀態(tài),因此其失效機制發(fā)生變化,導致不同階段的復(fù)雜系統(tǒng)具有不同的失效率。
b)存儲故障應(yīng)通過定期測試進行識別和修復(fù)
在存儲過程中引起的復(fù)雜系統(tǒng)故障應(yīng)稱為存儲故障,屬于隱藏的功能故障。在倉庫儲存階段,復(fù)雜系統(tǒng)及其部件處于非工作狀態(tài),無法及時地感知其故障。存儲故障只能在定期測試過程中進行識別和修復(fù)。在任務(wù)準備階段,復(fù)雜系統(tǒng)的各個部件均處于通電、測試和組裝等工作狀態(tài),一旦發(fā)生故障,就可及時地進行維護和維修。
c)不同的階段有不同的維修時間
為了從時間上促進維修工作,倉庫倉儲階段進行的定期測試及維護工作在儲存任務(wù)的執(zhí)行過程中進行,類似預(yù)防性維修;而準備階段的修理工作在任務(wù)完成后進行。
為了更好地描述上述復(fù)雜系統(tǒng)的儲存、使用、維護和支持過程,在充分地考慮復(fù)雜系統(tǒng)存儲過程、任務(wù)需求和保障需求的基礎(chǔ)上,本文建立了由4個部分組成的仿真模型的整體結(jié)構(gòu),包括功能模型、任務(wù)模型維護模型和保障模型[8]。
a)功能模型
功能模型用于描述復(fù)雜系統(tǒng)的功能和結(jié)構(gòu)組成,以及各個部件的可靠性、維修性、保障性和其他功能特性。由單元與單元數(shù)之間的故障邏輯關(guān)系、單元類型和單元故障數(shù)據(jù)分布等信息組成。
b)任務(wù)模型
它是一個用于描述復(fù)雜系統(tǒng)存儲過程、任務(wù)場景或使用程序的模型,包括任務(wù)級別、執(zhí)行對象、序列、概況、任務(wù)階段時間、時間關(guān)系、成功條件和致命故障判斷等信息。
復(fù)雜系統(tǒng)模型被定義為順序、概況和任務(wù)階段3個層次。任務(wù)階段定義任務(wù)開始時間、持續(xù)時間和結(jié)束時間等,一些任務(wù)時間根據(jù)特定的時間關(guān)系形成概況,多個概況形成序列。在復(fù)雜系統(tǒng)的倉庫階段,存儲概況需要經(jīng)歷多次定期測試和相應(yīng)的修理與維護。
c)維修模型
用于描述復(fù)雜系統(tǒng)零部件的所有類型的修理和維護工作過程。它包含維護對象、維護屬性(預(yù)防性修理和維護/恢復(fù)性修理和維護、故障部件和維護資源所需的維護資源量、MTTR、修理和維護的類型、維修站點)等信息。
d)保障模型
該模型用于描述復(fù)雜系統(tǒng)支援系統(tǒng)及其相關(guān)特性。它主要由維修站點對象、維修站點之間的關(guān)系、修理和維護站點屬性(位置、級別和站點之間的層次關(guān)系、維修資源的類型和配置數(shù)量或配置率)和其他信息組成。
可知,復(fù)雜系統(tǒng)的存儲、使用、維修和保障過程可以描述為在功能模型的條件下由任務(wù)模型驅(qū)動保障模型上的任務(wù)模型和維修模型的過程。其中,功能模型是運行的主體;保障模型作為運行平臺;任務(wù)模型是驅(qū)動事件,當維修模型作為任務(wù)內(nèi)容時同時也是任務(wù)內(nèi)容。因此,整個仿真模型可以充分地描述復(fù)雜系統(tǒng)在存儲和使用過程中的靜態(tài)配置,也可以提供在仿真過程中,隨著任務(wù)驅(qū)動而生成的各種事件的動態(tài)變化的能力。
復(fù)雜系統(tǒng)存儲、使用和維修保障系統(tǒng)是一種典型的離散事件系統(tǒng),其系統(tǒng)狀態(tài)由任務(wù)開始、故障發(fā)生和修理完成等離散事件驅(qū)動,本文采用離散事件動態(tài)仿真的思想,采用面向事件的時鐘推進方法完成復(fù)雜系統(tǒng)存儲、使用、維修和保障過程的仿真。
在仿真過程中,任務(wù)模型是驅(qū)動整個仿真運行的核心,因此仿真過程邏輯的設(shè)計是正確運行仿真的關(guān)鍵。本文考慮了在復(fù)雜系統(tǒng)壽命中任務(wù)、故障和維護等特征,設(shè)計的仿真過程邏輯如圖1所示。
圖1 故障采樣的邏輯原理圖
首先,對歷史故障進行檢查,每次任務(wù)開始時掃描執(zhí)行任務(wù)的復(fù)雜系統(tǒng)的所有故障,使用該階段的可靠性方框圖來確定故障是否會影響本階段的執(zhí)行。若有,提交維修申請;若無,繼續(xù)下一步申請保障資源的使用。如果保障資源的使用不能滿足條件,則任務(wù)失敗;如果保障資源的使用能滿足條件,則保障資源取得成功,繼續(xù)接收設(shè)備功能模型發(fā)送的故障信息,使用可靠性模型確定故障是否會影響任務(wù)的實施。如果故障影響了任務(wù)的執(zhí)行,則根據(jù)任務(wù)階段的信息來確定是否可以進行緊急修理。
a)如果可以進行緊急修理,則向維修模塊發(fā)出維修事件請求,維修模塊將執(zhí)行維修處理過程,并消耗維修時間。維護時間可用來判斷任務(wù)階段是否達到可延遲時間,如果維修時間超過可延遲時間,則任務(wù)失??;如果維修時間在任務(wù)階段的可延遲時間內(nèi),則任務(wù)繼續(xù)執(zhí)行。
b)如果沒有緊急修理備,該任務(wù)就會失敗。
當所有的故障處理完成后,任務(wù)仍在繼續(xù)時,進入下一個任務(wù)階段,并繼續(xù)執(zhí)行上述程序。
獲取的復(fù)雜系統(tǒng)及其部件的故障時間是復(fù)雜系統(tǒng)仿真運行的來源,故障發(fā)生會引發(fā)維修事件,維修需要保障資源,因此故障時間的采樣是正確運行仿真的先決條件。
在考慮存儲過程的復(fù)雜系統(tǒng)可用性仿真中,由于兩階段復(fù)雜系統(tǒng)失效機制的變化,存儲階段和任務(wù)準備階段的失效率不同,需要根據(jù)不同的分布進行采樣。同時,復(fù)雜系統(tǒng)在長時間儲存后,其性能會有一定程度的下降,可靠性也會下降。復(fù)雜系統(tǒng)的可靠性不再和準備階段初始時相同,因此在準備階段對故障時間采樣不能直接獲得分布函數(shù),需要根據(jù)失效分布進行轉(zhuǎn)換以獲得故障時間。故障采樣邏輯如圖2所示。
圖2 故障采樣的邏輯原理圖
首先,應(yīng)將所有的部件添加到故障采樣列表中,進行逐個故障采樣。通過采樣部件倉庫存儲階段的故障率信息獲取故障時間ti,比較存儲階段的任務(wù)時間,如果故障時間短于存儲任務(wù)時間,我們可以認為故障發(fā)生在存儲階段,讓當前時間T等于最近的常規(guī)檢測時間,即故障在這個時刻被確定并被修復(fù)。然后,繼續(xù)采樣組件以獲取下一個故障時間,直到故障發(fā)生時間大于存儲任務(wù)時間。
如果故障發(fā)生時間比存儲任務(wù)時間長,它表明故障不發(fā)生在存儲任務(wù)時間,因此,我們需要計算在存儲任務(wù)時間結(jié)束時刻部件的故障概率并通過轉(zhuǎn)換獲得部件在準備階段開始時刻的可靠性,然后采用坐標平移法對準備階段的MTBF信息進行采樣,采用初始可靠性非1的采樣公式,獲取任務(wù)準備階段部件的失效時間。
以此類推,直到通過采樣獲得所有部件的故障時間之前,可以根據(jù)時間順序形成故障事件列表。
復(fù)雜系統(tǒng)概況分為存儲階段、戰(zhàn)備準備階段和任務(wù)執(zhí)行階段兩個階段,如圖3所示。
圖3 仿真的任務(wù)概況圖
存儲時間為10年,戰(zhàn)備準備和任務(wù)執(zhí)行階段總平均時間為1 000 h,可延遲時間為150 h,定期測試間隔為3年,資源備件滿足率可達90%。
復(fù)雜系統(tǒng)設(shè)備由A、B、C、D、E、F等幾個子系統(tǒng)組成,整個復(fù)雜系統(tǒng)視為一個系列模型,各個子系統(tǒng)的MTBF(h)和MTTR輸入?yún)?shù)如表1所示。為了簡化模型,假設(shè)存儲狀態(tài)下的故障率是戰(zhàn)備狀態(tài)[9]下的故障率的10倍,故障和維修時間服從指數(shù)分布。
表1 仿真輸入?yún)?shù)列表 單位:h
對于復(fù)雜系統(tǒng)這類一次性使用設(shè)備,任務(wù)成功率通??梢杂脕肀硎酒淇煽啃訹10]。在傳統(tǒng)的分析中,仿真邏輯不考慮存儲階段,復(fù)雜系統(tǒng)的可用性計算公式如下:
而在戰(zhàn)備準備階段發(fā)生的故障可以隨時接受修理和維護,但在任務(wù)執(zhí)行階段發(fā)生的故障無法維修。修理和維護應(yīng)滿足資源和備件的數(shù)量要求。如果在任務(wù)時間結(jié)束時整個任務(wù)中的所有故障都已被修復(fù),并且修理消耗的總時間沒有超過允許延遲時間,則認為復(fù)雜系統(tǒng)的任務(wù)執(zhí)行成功。
在式(1)中,AO代表復(fù)雜系統(tǒng)的可用性,Pzc和Pww分別表示復(fù)雜系統(tǒng)在存儲階段、戰(zhàn)備階段和任務(wù)執(zhí)行階段成功使用的概率。存儲過程后成功的概率通??梢钥梢暬癁槠浯鎯煽啃訰zc,例如:
Pzc=Rzc。
共進行了6次仿真,每次仿真時整個任務(wù)概況循環(huán)25次,得到了每次仿真結(jié)果的Pww或AO的統(tǒng)計平均值。無論存儲階段如何,存儲階段的仿真條件都不會輸入到任務(wù)概況中,得到Pww值后,AO值采用公式法計算;考慮到存儲階段,在任務(wù)概況中輸入存儲階段的仿真條件以得到AO價值。
無論是否考慮存儲過程,復(fù)雜系統(tǒng)可用性值的仿真輸出結(jié)果如表2所示。
表2 仿真輸出結(jié)果列表
由表2可知,不考慮存儲階段的仿真邏輯通常依賴于人類的經(jīng)驗來選擇Rzc值,這可能會導致可用性的巨大波動。本文假定存儲階段的復(fù)雜系統(tǒng)的可靠性分別為0.8和0.9來進行仿真,Rzc被發(fā)現(xiàn)對可用性的計算結(jié)果有很大的影響,但不能反映檢測和維修對存儲的影響??紤]存儲過程的仿真邏輯直接根據(jù)存儲過程中復(fù)雜系統(tǒng)各個部分的RMS參數(shù)進行仿真,以表明存儲階段的各種事件對復(fù)雜系統(tǒng)可用性的影響。仿真結(jié)果表明,兩種仿真結(jié)果在相同條件下收斂,后者可以實現(xiàn)更精細的仿真,反映存儲的各種特性對復(fù)雜系統(tǒng)能力的影響。
定期測試周期也將對復(fù)雜系統(tǒng)的存儲,甚至整個任務(wù)概況產(chǎn)生影響。因此,建議將定期試驗周期間隔(單位:年)設(shè)置為1、2、3、4年,存儲時間(單位:年)為4、8、12、16、20年。通過仿真模型計算了復(fù)雜系統(tǒng)的可用性,結(jié)果如圖4所示。
圖4 定期試驗周期和儲存年限對復(fù)雜系統(tǒng)可用性的影響
從圖4中可以看出,隨著存儲年份的增加,當復(fù)雜系統(tǒng)需要執(zhí)行任務(wù)時,復(fù)雜系統(tǒng)的可用性將會下降,延長定期測試的周期將會加強這種可用性的下降趨勢。定期測試周期越長,故障修復(fù)時間越長,在轉(zhuǎn)向使用過程時出現(xiàn)可用狀態(tài)的概率就越小,因此可用性就越低。在給定的仿真案例數(shù)據(jù)下,當存儲周期不超過8年時,1、2或3年的測試周期對復(fù)雜系統(tǒng)的可用性沒有顯著的影響,但4年的測試周期將大大地降低這種可用性。因此,可以根據(jù)圖4和給定的可用性要求確定合理的定期測試周期。仿真結(jié)果與MTBF、MTTR等數(shù)據(jù)直接相關(guān),因此需要獲得更準確的結(jié)果和影響,從而進一步詳細地確定復(fù)雜系統(tǒng)各個子系統(tǒng)的MTBF和MTTR分布和數(shù)值。
本文在考慮存儲過程對復(fù)雜系統(tǒng)影響的基礎(chǔ)上,分析了存儲過程和使用過程不同的仿真邏輯,建立了考慮存儲過程的復(fù)雜系統(tǒng)可用性仿真模型,分析和評估RMS水平對完整戰(zhàn)備率和任務(wù)成功率的影響。仿真更關(guān)注復(fù)雜系統(tǒng)在存儲和工作狀態(tài)下故障率的差異,比如磨損和撕裂故障的影響,以及存儲過程中經(jīng)歷的各種測試和維修事件對復(fù)雜系統(tǒng)能力的影響。該仿真可用于復(fù)雜系統(tǒng)的演示階段,為用戶提出適當?shù)膹?fù)雜系統(tǒng)RMS指標時提供手段,也可在已知存儲相關(guān)失效數(shù)據(jù)的前提下應(yīng)用于復(fù)雜系統(tǒng)壽命的評估,并可進一步地用于復(fù)雜系統(tǒng)的壽命延長工作。