魏莎莎,李真
(1.中國(guó)電科芯片技術(shù)研究院,重慶 400060; 2.中國(guó)電子科技集團(tuán)公司第二十四研究所,重慶 400060)
可靠性是產(chǎn)品、結(jié)構(gòu)、通信網(wǎng)絡(luò)、軍事裝備和許多其他項(xiàng)目的關(guān)鍵質(zhì)量特征之一[1]。電信網(wǎng)絡(luò)故障和可能影響數(shù)百萬(wàn)用戶的電力中斷就是此類復(fù)雜系統(tǒng)的例子,其故障會(huì)對(duì)具有不同需求的許多用戶產(chǎn)生直接影響。新材料、傳感器的引入,以及新產(chǎn)品功能的復(fù)雜性,以及用戶對(duì)更“可靠”產(chǎn)品的更高期望,促使工程師在產(chǎn)品(或服務(wù))發(fā)布之前進(jìn)行廣泛的試驗(yàn)[2]。事實(shí)上,試驗(yàn)占產(chǎn)品總成本的很大一部分,特別是軍事裝備,電子元器件的可靠性是確保組件、系統(tǒng)可靠性的前提,要求比工業(yè)級(jí)產(chǎn)品更為嚴(yán)苛,因此,電子元器件可靠性試驗(yàn)方法的研究至關(guān)重要[3]。
準(zhǔn)確的可靠性度量是使用正常工作條件下的試驗(yàn)數(shù)據(jù)獲得的。然而,在正常工作條件下需要很長(zhǎng)的時(shí)間,特別是對(duì)于預(yù)期壽命較長(zhǎng)的器件和產(chǎn)品。它還需要大量的試驗(yàn)單元,因此在正常條件下進(jìn)行可靠性試驗(yàn)通常是昂貴和不切實(shí)際的。此外,該結(jié)果僅適用于與試驗(yàn)條件相似的運(yùn)行環(huán)境,可能不適用于在明顯不同條件下運(yùn)行的機(jī)組的可靠性預(yù)測(cè)。因此,更多人尋求使用數(shù)據(jù)和試驗(yàn)條件來(lái)“預(yù)測(cè)”可靠性指標(biāo)的替代方法,而不是使用正常的操作條件,這些方法稱為加速試驗(yàn)方法,主要目的是在較短的時(shí)間內(nèi)誘發(fā)器件、組件和系統(tǒng)的故障或退化,并利用加速條件下的故障數(shù)據(jù)和退化觀察來(lái)估計(jì)正常運(yùn)行條件下的可靠性[4]。
在產(chǎn)品生命周期的第一階段(設(shè)計(jì)階段)對(duì)系統(tǒng)、器件和組件進(jìn)行仔細(xì)的可靠性試驗(yàn),對(duì)于在后續(xù)階段實(shí)現(xiàn)期望的可靠性至關(guān)重要。在這個(gè)早期階段,通過(guò)試驗(yàn)、分析、修復(fù)和試驗(yàn)(Test、Analyze、Fix、Test,TAFT)過(guò)程來(lái)消除復(fù)雜系統(tǒng)中間原型固有的設(shè)計(jì)缺陷,這個(gè)過(guò)程通常被稱為“可靠性增長(zhǎng)”。具體地說(shuō),可靠性增長(zhǎng)是由于故障模式的發(fā)現(xiàn)、分析和有效的糾正而對(duì)開(kāi)發(fā)項(xiàng)目的真實(shí)但未知的初始可靠性的改進(jìn)[5]。糾正措施通常采用對(duì)系統(tǒng)的硬件、軟件或人為錯(cuò)誤方面發(fā)現(xiàn)的問(wèn)題進(jìn)行修復(fù)、調(diào)整或修改的形式。同樣,現(xiàn)場(chǎng)試驗(yàn)結(jié)果用于改進(jìn)產(chǎn)品設(shè)計(jì),從而提高產(chǎn)品的可靠性。
綜上所述,研究可靠性試驗(yàn)方法對(duì)提高電子元器件的可靠性具有重要意義,在實(shí)際的工程上有各種各樣的可靠性試驗(yàn)方法和目標(biāo)。第二節(jié)對(duì)常用的可靠性試驗(yàn)方法進(jìn)行了介紹,包括高加速壽命試驗(yàn)(Highly Accelerated Life Testing,HALT)[6]、可靠性增長(zhǎng)實(shí)驗(yàn)(Reliability Growth Testing,RGT)[7]、高加速應(yīng)力篩選(Highly Accelerated Stress Screening,HASS)[8]、可靠性驗(yàn)證試驗(yàn)(Reliability Demonstration Testing,RDT)[10]、可靠性驗(yàn)收試驗(yàn)[9]、加速壽命試驗(yàn)(Accelerated Life Testing,ALT)[11]和加速老化試驗(yàn)(Accelerated Degradation Testing,ADT)[12]。最后對(duì)全文進(jìn)行了展望和總結(jié)。
HALT的目標(biāo)是確定器件、組件和系統(tǒng)的操作限制。這些是不同失效機(jī)制發(fā)生的極限,而不是在正常操作條件下發(fā)生的失效機(jī)制。此外,也應(yīng)用極端應(yīng)力條件來(lái)確定被測(cè)單元的所有潛在失效(和失效模式)。HALT主要用于產(chǎn)品的設(shè)計(jì)階段,在典型的HALT試驗(yàn)中,產(chǎn)品(或組件)受到溫度和振動(dòng)(單獨(dú)和組合)以及快速熱轉(zhuǎn)變(循環(huán))和與產(chǎn)品實(shí)際使用相關(guān)的其他特定應(yīng)力的影響。例如,在電子學(xué)中,HALT用于定位電路板故障的原因。這些試驗(yàn)通常包括在溫度、振動(dòng)和濕度下試驗(yàn)產(chǎn)品,但濕度對(duì)產(chǎn)品失效機(jī)理的影響需要較長(zhǎng)的時(shí)間。因此,HALT只在兩個(gè)主要應(yīng)力下進(jìn)行:溫度和振動(dòng)。
RGT的目標(biāo)是在設(shè)計(jì)階段持續(xù)改進(jìn)。該試驗(yàn)在正常運(yùn)行條件下進(jìn)行,對(duì)試驗(yàn)結(jié)果進(jìn)行分析,以驗(yàn)證是否達(dá)到特定的可靠性目標(biāo)。一般來(lái)說(shuō),產(chǎn)品的第一個(gè)原型可能包含設(shè)計(jì)缺陷,其中大部分可以通過(guò)嚴(yán)格的試驗(yàn)程序發(fā)現(xiàn)。最初的設(shè)計(jì)也不太可能滿足目標(biāo)可靠性指標(biāo)。然而,初始設(shè)計(jì)將經(jīng)歷迭代變更(設(shè)計(jì)變更),這將導(dǎo)致產(chǎn)品可靠性的改進(jìn),這是相當(dāng)常見(jiàn)的。一旦設(shè)計(jì)投入生產(chǎn),產(chǎn)品就會(huì)在現(xiàn)場(chǎng)進(jìn)行試驗(yàn)和監(jiān)控,以發(fā)現(xiàn)潛在的設(shè)計(jì)變更,從而進(jìn)一步提高其可靠性。
HASS的主要目的是對(duì)正常生產(chǎn)產(chǎn)品進(jìn)行篩選試驗(yàn),以驗(yàn)證實(shí)際生產(chǎn)產(chǎn)品在試驗(yàn)過(guò)程中所使用的環(huán)境變量的循環(huán)作用下繼續(xù)正常運(yùn)行。它還用于檢測(cè)生產(chǎn)過(guò)程中“質(zhì)量”的轉(zhuǎn)移(和變化)。它使用的應(yīng)力與HALT試驗(yàn)中使用的應(yīng)力相同,只是應(yīng)力降低了,因?yàn)镠ASS主要用于檢測(cè)工藝轉(zhuǎn)移,而不是設(shè)計(jì)邊際問(wèn)題。
進(jìn)行RDT是為了證明產(chǎn)品是否滿足一個(gè)或多個(gè)可靠性度量。這些措施包括在規(guī)定的周期或試驗(yàn)持續(xù)時(shí)間之前未失敗的總體的分位數(shù)。它還可能包括試驗(yàn)后的故障率不應(yīng)超過(guò)預(yù)定值。通常,RDT是在產(chǎn)品的正常運(yùn)行條件下進(jìn)行的。進(jìn)行RDT有幾種方法,例如“成功運(yùn)行”試驗(yàn)。該試驗(yàn)涉及使用具有預(yù)定尺寸的樣品,如果在試驗(yàn)結(jié)束時(shí)不超過(guò)特定數(shù)量的故障發(fā)生,則該產(chǎn)品被認(rèn)為是可接受的。否則,根據(jù)試驗(yàn)不合格的次數(shù),重新抽取樣品,重新進(jìn)行試驗(yàn),或認(rèn)為產(chǎn)品不合格。
可靠性驗(yàn)收試驗(yàn)的目標(biāo)與RDT類似,在RDT中,產(chǎn)品服從于一個(gè)精心設(shè)計(jì)的試驗(yàn)計(jì)劃,并相應(yīng)地做出關(guān)于產(chǎn)品驗(yàn)收的決定。圖1給出了某大型汽車公司可靠性試驗(yàn)計(jì)劃的實(shí)例。在圖1中,試驗(yàn)產(chǎn)品在480 min的周期內(nèi)承受所示的溫度分布。當(dāng)這些裝置在200次循環(huán)中沒(méi)有故障時(shí),就被認(rèn)為是可以接受的。被認(rèn)可的車輛的平均壽命預(yù)計(jì)相當(dāng)于10萬(wàn)英里的行駛里程(基于工程師的經(jīng)驗(yàn))。這種驗(yàn)收試驗(yàn)是基于經(jīng)驗(yàn)的。然而,基于一定的準(zhǔn)則和約束條件,可以為驗(yàn)收試驗(yàn)設(shè)計(jì)最優(yōu)試驗(yàn)計(jì)劃。
圖1 驗(yàn)收試驗(yàn)的溫度曲線
在許多情況下,ALT可能是評(píng)估產(chǎn)品是否滿足預(yù)期的長(zhǎng)期可靠性要求的唯一可行方法。ALT試驗(yàn)可以使用三種不同的方法進(jìn)行。第一種方法是在正常操作條件下加速設(shè)備的“使用”,例如在典型的一天中只使用一小部分時(shí)間的產(chǎn)品;第二種是通過(guò)使樣本承受比正常操作條件更嚴(yán)重的應(yīng)力來(lái)加速故障;第三種是通過(guò)使表現(xiàn)出某種退化的單元(如金屬的腐蝕和機(jī)械部件的磨損等)承受加速應(yīng)力來(lái)進(jìn)行。
最后一種方法稱為ADT,利用從實(shí)驗(yàn)中獲得的可靠性數(shù)據(jù)構(gòu)建可靠性模型,然后通過(guò)統(tǒng)計(jì)和/或基于物理的推理程序預(yù)測(cè)產(chǎn)品在正常工作條件下的可靠性。推理過(guò)程的準(zhǔn)確性對(duì)可靠性估計(jì)以及隨后關(guān)于系統(tǒng)配置、保證和預(yù)防性維護(hù)計(jì)劃的決策有深遠(yuǎn)的影響。具體而言,可靠性估計(jì)取決于兩個(gè)因素:ALT模型和ALT試驗(yàn)計(jì)劃的試驗(yàn)設(shè)計(jì)。一個(gè)好的模型可以為試驗(yàn)數(shù)據(jù)提供適當(dāng)?shù)臄M合;這個(gè)好的模型可以在正常情況下實(shí)現(xiàn)準(zhǔn)確的估計(jì)。同樣,試驗(yàn)計(jì)劃的優(yōu)化設(shè)計(jì),它決定了應(yīng)力載荷(恒定應(yīng)力、斜坡應(yīng)力、循環(huán)應(yīng)力)、試驗(yàn)樣品的分配、應(yīng)力水平的數(shù)量、最佳試驗(yàn)持續(xù)時(shí)間和其他試驗(yàn)變量,可以提高可靠性估計(jì)的準(zhǔn)確性。事實(shí)上,如果沒(méi)有一個(gè)最佳的試驗(yàn)計(jì)劃,很可能一系列昂貴且耗時(shí)的試驗(yàn)會(huì)導(dǎo)致不準(zhǔn)確的可靠性估計(jì)。
在進(jìn)行可靠性試驗(yàn)時(shí),有必要縮短加速退化試驗(yàn)和可靠性論證試驗(yàn)所需的時(shí)間。下面簡(jiǎn)要討論兩個(gè)有前途的方向:
1)虛擬-物理混合試驗(yàn)方法。建立虛擬數(shù)字平臺(tái),模擬電子元器件在加速或正常應(yīng)力水平下的退化水平[13],并結(jié)合物理試驗(yàn)來(lái)校準(zhǔn)數(shù)字平臺(tái)中使用的模型。由于很大一部分是通過(guò)模擬完成的,因此可以在不影響結(jié)果相關(guān)性的情況下減少所需的時(shí)間。
2)結(jié)合早期磨損預(yù)測(cè)來(lái)加速試驗(yàn)。將早期試驗(yàn)結(jié)果的退化曲線預(yù)測(cè)應(yīng)用于電子元器件的可靠性試驗(yàn)中。在最近的案例研究中[14],已經(jīng)證明,在有早期預(yù)測(cè)的情況下,224種候選電池中識(shí)別高循環(huán)壽命充電協(xié)議所需的時(shí)間減少到預(yù)期時(shí)間的3.2 %,并隨后驗(yàn)證了該方法的準(zhǔn)確性和效率。因此,電子元器件的退化試驗(yàn)值得探討,并可將其當(dāng)成可靠性試驗(yàn)的先驗(yàn)信息,幫助后面可靠性試驗(yàn)的進(jìn)行,并提高效率。
電子元器件的可靠性對(duì)整體系統(tǒng)的運(yùn)行具有至關(guān)重要的作用,而在實(shí)際試驗(yàn)的時(shí)候,要想辦法降低試驗(yàn)的成本,并且還要對(duì)其進(jìn)行多種應(yīng)力組合的情況下才能找到電子元器件的缺陷,因此了解電子元器件的可靠性試驗(yàn)方法有助于我們?cè)趯?shí)際中合理選擇的試驗(yàn)方法,準(zhǔn)確的發(fā)現(xiàn)產(chǎn)品的故障,從而保證元器件的質(zhì)量和可靠性。