余珊珊,張永進(jìn),張燕軍,展佳慧
(1.安徽工業(yè)大學(xué) 數(shù)理科學(xué)與工程學(xué)院,安徽 馬鞍山 243002;2.揚(yáng)州大學(xué) 機(jī)械工程學(xué)院,江蘇 揚(yáng)州 225127)
對(duì)于長(zhǎng)期處于貯存狀態(tài)的產(chǎn)品,需要保證在結(jié)束貯存、投入使用時(shí)具備很高的可靠性[1]。為保持其高可靠性,在產(chǎn)品貯存期間通常要對(duì)其進(jìn)行周期檢測(cè)試驗(yàn),從而需要分析系統(tǒng)的失效信息數(shù)據(jù)。此處的失效信息數(shù)據(jù)來(lái)源于系統(tǒng)中失效的具體元件。以串聯(lián)系統(tǒng)和并聯(lián)系統(tǒng)為例,在串聯(lián)系統(tǒng)中,組成系統(tǒng)的元件中如果有1個(gè)失效,就會(huì)導(dǎo)致系統(tǒng)失效,因此最早發(fā)生失效的元件即為該系統(tǒng)的失效原因[2]。但是,對(duì)于實(shí)際貯存產(chǎn)品,由于缺乏檢測(cè)設(shè)備以及檢測(cè)對(duì)產(chǎn)品造成破壞等原因,導(dǎo)致貯存試驗(yàn)中系統(tǒng)失效的元件不能被準(zhǔn)確識(shí)別,而只能將其歸咎于某些元件所組成的集合,系統(tǒng)真正的失效原因被屏蔽掉了。在并聯(lián)系統(tǒng)中,組成系統(tǒng)的所有元件失效才會(huì)導(dǎo)致系統(tǒng)失效,因此在系統(tǒng)的未失效數(shù)據(jù)中可能含有部分元件失效數(shù)據(jù),此時(shí)該部分元件失效數(shù)據(jù)就被屏蔽掉了。由于系統(tǒng)中部分失效元件未知,稱(chēng)這種系統(tǒng)壽命試驗(yàn)數(shù)據(jù)為屏蔽數(shù)據(jù)[3,4]。因產(chǎn)品貯存壽命檢測(cè)試驗(yàn)中常包含屏蔽數(shù)據(jù),所以考慮含屏蔽失效信息下的貯存可靠性具有重要的理論與實(shí)際意義。
已有的有關(guān)產(chǎn)品貯存可靠性評(píng)定與預(yù)測(cè)研究[5]主要分為不包含及包含屏蔽數(shù)據(jù)2種情形。若不考慮屏蔽數(shù)據(jù),早期Merren[6]分析了貯存3~6 a的大量電子元器件的成敗型檢測(cè)數(shù)據(jù),獲得了貯存失效率,認(rèn)為貯存壽命并非完全服從常數(shù)型參數(shù)的指數(shù)分布。由于貯存失效數(shù)據(jù)需要通過(guò)測(cè)試手段獲得,Martinez[7]基于指數(shù)壽命分布,評(píng)估了周期檢測(cè)失效數(shù)據(jù)。針對(duì)周期檢修記錄的貯存失效數(shù)據(jù),Zhang等[8]給出了參數(shù)估計(jì)的極大似然(Maximum likelihood,ML)方法,對(duì)周期檢修下的貯存可靠性進(jìn)行評(píng)估與預(yù)測(cè),并在Poisson失效過(guò)程的假設(shè)下,給出了在周期檢測(cè)點(diǎn)處貯存可靠性點(diǎn)估計(jì)“倒掛”數(shù)據(jù)的修正方法[9]。為此,Zhao等[10,11]修正檢修時(shí)刻的點(diǎn)估計(jì)值,給出了產(chǎn)品貯存可靠性的最小二乘估計(jì)(Least square estimate,LSE),但未考慮實(shí)際情況下的周期檢測(cè)情形。由于定期檢修是提高貯存產(chǎn)品使用可靠性的主要措施,閆霞[12]、張永進(jìn)等[13-15]、楊軍等[16,17]考慮此情形并討論了貯存可靠性相關(guān)問(wèn)題,但未考慮失效信息被屏蔽的情形。目前,考慮貯存檢測(cè)失效數(shù)據(jù)具有屏蔽情形的文獻(xiàn)較少,最早Friedman等[3]給出了屏蔽數(shù)據(jù)相關(guān)概念,Usher等[18]應(yīng)用ML方法估計(jì)了含屏蔽數(shù)據(jù)信息的系統(tǒng)可靠性問(wèn)題。針對(duì)完全樣本數(shù)據(jù),Sarhan等[19]給出了含屏蔽信息的并聯(lián)系統(tǒng)可靠性ML估計(jì);對(duì)于截尾樣本數(shù)據(jù),基于逆Weibull壽命分布,Cai等[20,21]研究了元件屏蔽數(shù)據(jù)情況下并聯(lián)系統(tǒng)的可靠性。然而,文獻(xiàn)[3,18-21]未涉及產(chǎn)品在貯存狀態(tài)下的可靠性問(wèn)題,為此,Zhao等[22]給出了含屏蔽數(shù)據(jù)的串聯(lián)系統(tǒng)貯存可靠性,基于LSE,對(duì)含有初始失效元件的貯存可靠性進(jìn)行了分析,但未涉及并聯(lián)貯存系統(tǒng)情形。
鑒于貯存屏蔽數(shù)據(jù)存在的合理性,以及大量存在的并聯(lián)結(jié)構(gòu)系統(tǒng)問(wèn)題,本文將建立含元件級(jí)屏蔽數(shù)據(jù)的并聯(lián)系統(tǒng)貯存可靠性模型??紤]各元件都具有不同的初始失效情況,在指數(shù)壽命分布下進(jìn)行周期檢測(cè)試驗(yàn)。考慮成敗型周期檢測(cè)數(shù)據(jù),其中在未失效的系統(tǒng)數(shù)據(jù)中含屏蔽元件級(jí)失效數(shù)據(jù)。擬使用改進(jìn)的期望最大化(Expectation maximization,EM)算法在未失效系統(tǒng)數(shù)據(jù)中挖掘被屏蔽的元件失效數(shù)據(jù),用來(lái)更新周期檢測(cè)的實(shí)時(shí)數(shù)據(jù),并用LSE對(duì)各元件的初始可靠度和失效率進(jìn)行參數(shù)估計(jì)。最后通過(guò)仿真數(shù)據(jù)驗(yàn)證模型的有效性以及改進(jìn)的EM算法的可行性。
為保持產(chǎn)品的高使用可靠性,通常在產(chǎn)品貯存期間進(jìn)行周期檢測(cè)并維護(hù)[7],則周期檢測(cè)下貯存試驗(yàn)條件如下:
(1)試驗(yàn)環(huán)境為,貯存試驗(yàn)的外界應(yīng)力恒定,產(chǎn)品系統(tǒng)或元件能在同一環(huán)境條件下處于等待使用狀態(tài);
(2)貯存初始狀態(tài)為,產(chǎn)品系統(tǒng)或元件在出廠或貯存開(kāi)始時(shí)并非處于完美狀態(tài),即貯存初始可靠度滿足0≤R0≤1;
(3)貯存樣本個(gè)數(shù)為,在條件(1)的試驗(yàn)環(huán)境中存放N個(gè)同型產(chǎn)品,構(gòu)成該產(chǎn)品的元件1,2,…,m分別為N10,N20,…,Nm0個(gè);
(4)抽樣方式為無(wú)放回抽樣方式,對(duì)貯存產(chǎn)品及其構(gòu)成元件進(jìn)行檢測(cè)試驗(yàn);
(5)抽檢樣本量為,在各檢測(cè)時(shí)刻,產(chǎn)品系統(tǒng)及元件檢測(cè)數(shù)遠(yuǎn)小于對(duì)應(yīng)總貯存樣本數(shù);
(6)貯存壽命為假定服從常用的指數(shù)分布。
設(shè)t′為產(chǎn)品系統(tǒng)的貯存壽命,其中t′為1個(gè)隨機(jī)變量且在試驗(yàn)中很難觀察到其具體值,通常已知的是1個(gè)偏大、偏小或在某段貯存時(shí)間點(diǎn)之間的值。記A為“產(chǎn)品在貯存開(kāi)始時(shí)刻是合格的”這一隨機(jī)事件,則根據(jù)上述基本假設(shè)以及條件概率理論,產(chǎn)品在貯存時(shí)刻t的可靠度為[13]
R(t)=P(t′>t)=P(A)P(t′|A)=R0Rs(t)
(1)
式中:Rs(t)為條件貯存可靠性,表示某產(chǎn)品處于完美狀態(tài)下,在貯存時(shí)刻t的瞬時(shí)可靠度,反映的是在一定貯存環(huán)境條件下,貯存對(duì)產(chǎn)品系統(tǒng)帶來(lái)的可靠度影響。
根據(jù)條件假設(shè)(6),記該產(chǎn)品系統(tǒng)中元件i的條件貯存失效率為λi,則根據(jù)式(1)知,其元件的可靠度為
Ri(t)=R0iexp(-λit)
(2)
因?yàn)槊總€(gè)產(chǎn)品由m個(gè)獨(dú)立且不完全相同的元件并聯(lián)構(gòu)成,從而當(dāng)且僅當(dāng)所有元件失效時(shí)才導(dǎo)致該產(chǎn)品失效,則式(1)中貯存壽命t′應(yīng)為max(t′1,…,t′i,…,t′m)。記t′i表示第i個(gè)元件的貯存壽命時(shí)間,R0i表示第i個(gè)元件的初始可靠度,λi是第i個(gè)元件的貯存失效率(i=1,2,…,m),根據(jù)式(1)、(2),該產(chǎn)品系統(tǒng)在時(shí)刻t的貯存可靠性為
R(t)=p{max(t′1,…,t′i,…,t′m)>t}=
1-p{max(t′1,…,t′i,…,t′m)≤t}=
1-p{t′1≤t,…,t′i≤t,…,t′m≤t}=
(3)
對(duì)于同時(shí)貯存的產(chǎn)品系統(tǒng),若記該產(chǎn)品的失效率為λ,則根據(jù)式(1),產(chǎn)品系統(tǒng)在貯存時(shí)刻t的可靠度應(yīng)為
R(t)=R0exp(-λt)
(4)
由式(3)、(4)得
(5)
(6)
式(6)表明,系統(tǒng)在并聯(lián)結(jié)構(gòu)形式下,初始可靠度R0可根據(jù)元件初始可靠度確定。
由于部分元件失效并未導(dǎo)致系統(tǒng)失效,從而檢測(cè)成功的產(chǎn)品系統(tǒng)中可能隱藏著部分失效元件,需要在未失效的產(chǎn)品系統(tǒng)數(shù)據(jù)中挖掘屏蔽的元件失效數(shù)據(jù)。對(duì)于貯存產(chǎn)品的周期檢驗(yàn)結(jié)果,假定周期檢測(cè)記錄數(shù)據(jù)為成敗型數(shù)據(jù)。根據(jù)假設(shè)條件(3)、(5),在周期檢測(cè)時(shí)刻tj,從貯存的N件產(chǎn)品系統(tǒng)中抽樣nj(nj=N)件,檢測(cè)出產(chǎn)品失效數(shù)為fj,未失效數(shù)為sj,j=1,2,…,v。同一時(shí)刻,從Ni0(nij==Ni0)個(gè)貯存元件i中抽樣nij個(gè),檢測(cè)出該型號(hào)的元件失效數(shù)為fij,未失效數(shù)為sij,i=1,2,…,m。具體地,產(chǎn)品系統(tǒng)與元件檢測(cè)記錄數(shù)據(jù)如表1所示,其中,nj=fj+sj,nij=fij+sij,i=1,2,…,m,j=1,2,…,v。
表1 檢測(cè)時(shí)記錄的成敗型數(shù)據(jù)表
在貯存檢測(cè)時(shí)刻tj,系統(tǒng)含有元件個(gè)數(shù)為m的條件下,造成系統(tǒng)失效的元件集可表示為1個(gè)非空集合Fj?{1,2,…,m}。由于檢測(cè)的系統(tǒng)是并聯(lián)結(jié)構(gòu)形式,所有元件失效才會(huì)導(dǎo)致系統(tǒng)失效,即有Fj={1,2,…,m}。反之,可定義系統(tǒng)未失效時(shí)所對(duì)應(yīng)的元件集為Sj,則有Sj?{1,2,…,m}。而在并聯(lián)系統(tǒng)中,只要有1個(gè)元件未失效系統(tǒng)就不會(huì)失效。若系統(tǒng)中各元件均未失效,此時(shí)沒(méi)有失效數(shù)據(jù)被屏蔽,即Sj={1,2,…,m};若未失效的產(chǎn)品系統(tǒng)中,至少有1個(gè)元件失效,此時(shí)系統(tǒng)的失效數(shù)據(jù)存在一定的隱蔽性,稱(chēng)該產(chǎn)品系統(tǒng)的失效數(shù)據(jù)信息被屏蔽,此時(shí)成功元件集應(yīng)為集合{1,2,…,m}的非空真子集,即Sj?{1,2,…,m}。
在使用貯存可靠性模型進(jìn)行可靠性分析前,首先需要確定模型的參數(shù)。對(duì)于并聯(lián)系統(tǒng)下的貯存可靠性模型式(3),共有2i個(gè)參數(shù)R0i,λi需要進(jìn)行估計(jì),i=1,2,…,m。若不考慮系統(tǒng)屏蔽失效數(shù)據(jù),根據(jù)成敗型數(shù)據(jù),在指數(shù)壽命分布下,使用LSE確定貯存可靠性函數(shù)中的參數(shù)。應(yīng)用貯存元件的檢測(cè)數(shù)據(jù),根據(jù)式(2)可得到各元件在時(shí)刻tj的可靠度函數(shù)Ri(tj)為
Ri(tj)=R0iexp(-λitj)
(7)
取對(duì)數(shù)有l(wèi)n(Ri(tj))=ln(R0i)-λitj,若令Yij=ln(Ri(tj)),ai=ln(R0i),bi=-λi,i=1,2,…,m,j=1,2,…,v,則有一元線性回歸方程Yij=ai+bitj。結(jié)合式(7)有
于是貯存元件可靠性參數(shù)的LSE可表示為
(8)
(9)
另一方面,基于產(chǎn)品系統(tǒng)的貯存檢測(cè)數(shù)據(jù),根據(jù)式(4)知,產(chǎn)品系統(tǒng)的可靠性參數(shù)的LSE為
(10)
(11)
顯然,通過(guò)式(8)~(11),可對(duì)產(chǎn)品系統(tǒng)及元件的可靠性做出評(píng)估和預(yù)測(cè),并對(duì)產(chǎn)品的貯存檢測(cè)周期給出理論依據(jù)。
EM算法的一般思想是首先給出待估參數(shù)的初始值,如α0,然后計(jì)算缺失數(shù)據(jù)的期望。利用ML方法,計(jì)算出α1,從而獲得完整的數(shù)據(jù)。以α1為新的初始值,重復(fù)這個(gè)過(guò)程,一直達(dá)到穩(wěn)定值[10]。
(12)
系統(tǒng)在對(duì)應(yīng)檢測(cè)時(shí)刻的貯存可靠度ML估計(jì)為
(13)
結(jié)合式(3),易通過(guò)ML方法得出各元件初始可靠度R0i和失效率參數(shù)λi[13,14]。
EM算法的適用前提是易獲得ML估計(jì),但當(dāng)系統(tǒng)屏蔽失效數(shù)據(jù)存在時(shí),要考慮各元件參數(shù)的ML函數(shù),此時(shí)ML函數(shù)會(huì)變成1個(gè)具有高維度的多變量函數(shù),一般不存在參數(shù)的分析解,因此直接使用EM算法很復(fù)雜。
由于元件參數(shù)的LSE具有近似的解析形式,基于LSE可對(duì)EM算法改進(jìn)如下:
(1)E步,給出元件參數(shù)的初始值α0,找出系統(tǒng)屏蔽未失效數(shù)據(jù)的期望。
(2)M-LS步,使用計(jì)算出的系統(tǒng)屏蔽未失效數(shù)據(jù)期望和系統(tǒng)檢測(cè)數(shù)據(jù),假設(shè)其數(shù)據(jù)完整,更新數(shù)據(jù)后,利用LSE,計(jì)算出元件參數(shù)α1。
將α1作為新的初始值,進(jìn)行k次迭代,直至相鄰2次參數(shù)之差的絕對(duì)值小于指定閾值,即
|α(k)-α(k-1)|<ε
ε→0時(shí),達(dá)到收斂。
考慮并聯(lián)系統(tǒng),當(dāng)系統(tǒng)中元件失效數(shù)據(jù)被屏蔽且檢測(cè)數(shù)據(jù)是成敗型數(shù)據(jù)時(shí),使用改進(jìn)的EM算法對(duì)貯存可靠性參數(shù)進(jìn)行估計(jì)。
(14)
由于系統(tǒng)未失效時(shí),至少有1個(gè)元件未失效,則有
i=1,2,…,mj=1,2,…,v
對(duì)于屏蔽數(shù)據(jù)(nj,fj),使用式(14)計(jì)算每個(gè)元件的期望未失效數(shù)
(2)M-LS步,將表1中的元件成敗型數(shù)據(jù)更新為
(15)
利用式(15)的計(jì)算結(jié)果估計(jì)元件成敗型數(shù)據(jù),再應(yīng)用式(7)~(9)、(12),得到各元件的初始可靠度和失效率估計(jì)為
(16)
(17)
(18)
(19)
ε→0時(shí),可以終止E步和M-LS步的迭代。
為演示改進(jìn)的EM算法估計(jì)模型參數(shù)的有效性,以2個(gè)元件構(gòu)成的并聯(lián)系統(tǒng)為例。貯存系統(tǒng)及元件的檢測(cè)數(shù)據(jù)(n,f)如表2所示,根據(jù)貯存模型的條件假設(shè),其中系統(tǒng)未失效數(shù)據(jù)中含有被屏蔽的元件失效數(shù)據(jù)。
表2 系統(tǒng)及元件的成敗型數(shù)據(jù)表
根據(jù)式(3)并聯(lián)系統(tǒng)下的貯存可靠性模型,分別對(duì)元件1、元件2的初始可靠度R01、R02及失效率λ1、λ2進(jìn)行計(jì)算。
圖1 元件1與元件2的初始可靠度及失效率變化圖
圖2 參數(shù)差值變化圖
從算法結(jié)果知,考慮屏蔽數(shù)據(jù)時(shí)的初始可靠度均低于不考慮屏蔽數(shù)據(jù)時(shí)的初始可靠度,考慮屏蔽數(shù)據(jù)時(shí)的失效率均高于不考慮屏蔽數(shù)據(jù)時(shí)的失效率。鑒于貯存屏蔽數(shù)據(jù)的存在性,考慮屏蔽數(shù)據(jù)與工程實(shí)際情況更相符。
表3 元件1、元件2的貯存可靠性模型的參數(shù)估計(jì)表
表3估計(jì)出的各元件初始可靠度和失效率再結(jié)合式(2),可得到元件1和元件2的貯存可靠性函數(shù)如圖3所示。
圖3 各元件的貯存可靠性變化趨勢(shì)圖
圖3表示元件1、元件2在貯存情形下,不考慮屏蔽數(shù)據(jù)時(shí),通過(guò)LSE得到的貯存可靠性變化曲線,以及考慮屏蔽數(shù)據(jù)時(shí),通過(guò)改進(jìn)的EM算法得到的貯存可靠性變化曲線圖。由圖3知,不管是元件1還是元件2,考慮屏蔽數(shù)據(jù)時(shí),得到的貯存可靠性函數(shù)值均比不考慮屏蔽數(shù)據(jù)時(shí)低,主要原因是:不考慮屏蔽數(shù)據(jù)時(shí),只需要通過(guò)檢測(cè)到的元件數(shù)據(jù)來(lái)估計(jì)元件模型中的參數(shù),沒(méi)有考慮到系統(tǒng)對(duì)其元件的可靠性也會(huì)造成影響;而考慮屏蔽數(shù)據(jù)時(shí),不僅要通過(guò)檢測(cè)到的元件數(shù)據(jù)來(lái)進(jìn)行估計(jì),還要結(jié)合檢測(cè)到的系統(tǒng)數(shù)據(jù)進(jìn)行參數(shù)估計(jì)。
表4 系統(tǒng)的貯存可靠性模型的參數(shù)估計(jì)表
工程上,常用預(yù)測(cè)的可靠性相對(duì)誤差來(lái)度量實(shí)際值和擬合值的匹配程度[24,25],具體地,設(shè)θE和θP分別表示估計(jì)的參數(shù)值和預(yù)測(cè)的參數(shù)值,則預(yù)測(cè)的參數(shù)值相對(duì)誤差可以表示為
(20)
根據(jù)表4數(shù)據(jù),取θ=R0和θ=λ,RE1和RE2分別為計(jì)算得出的系統(tǒng)初始可靠度相對(duì)誤差和失效率相對(duì)誤差,相關(guān)結(jié)果如表5所示。
表5 系統(tǒng)初始可靠度和失效率的相對(duì)誤差表
表5中數(shù)據(jù)顯示,考慮屏蔽數(shù)據(jù)時(shí)系統(tǒng)初始可靠度和失效率的相對(duì)誤差均小于不考慮時(shí)的情形,從而表明考慮屏蔽數(shù)據(jù)得到的參數(shù)估計(jì)更加精確。表4估計(jì)出的系統(tǒng)初始可靠度和失效率再結(jié)合式(4),可得到系統(tǒng)的貯存可靠性函數(shù)如圖4所示。
圖4 系統(tǒng)的貯存可靠性函數(shù)圖
圖4表示系統(tǒng)及元件在貯存情形下,通過(guò)系統(tǒng)檢測(cè)數(shù)據(jù),得到的系統(tǒng)貯存可靠性變化曲線,以及在考慮屏蔽數(shù)據(jù)與不考慮屏蔽數(shù)據(jù)時(shí),通過(guò)元件檢測(cè)數(shù)據(jù)估計(jì)得到的系統(tǒng)貯存可靠性函數(shù)變化曲線圖。由圖4可清晰地看出,考慮屏蔽數(shù)據(jù)時(shí)的曲線變化圖與通過(guò)系統(tǒng)檢測(cè)數(shù)據(jù)得到的曲線變化圖較吻合,更符合實(shí)際情形。
針對(duì)并聯(lián)形式的貯存結(jié)構(gòu)系統(tǒng),基于指數(shù)壽命分布,本文工作主要有:
(1)建立了各元件都具有不同初始失效情況的系統(tǒng)貯存可靠性模型,得到了貯存可靠性失效率與初始可靠度的等效方程;
(2)針對(duì)并聯(lián)系統(tǒng)中的屏蔽失效數(shù)據(jù),提出了基于LSE的改進(jìn)EM算法,估計(jì)了考慮系統(tǒng)屏蔽失效數(shù)據(jù)的元件及系統(tǒng)貯存可靠性模型中的參數(shù);
(3)通過(guò)算例分析知,本文算法能有效挖掘系統(tǒng)未失效數(shù)據(jù)中的元件失效信息。雖然考慮屏蔽失效數(shù)據(jù)時(shí),得到的元件及系統(tǒng)貯存可靠性函數(shù)值都略低于沒(méi)有考慮屏蔽數(shù)據(jù)時(shí)的貯存可靠性函數(shù)值,但更符合實(shí)際貯存情形。