郭晶磊,顧 吉
(中國(guó)電子科技集團(tuán)公司第58研究所,江蘇 無(wú)錫 214035)
P5000設(shè)備由全球著名半導(dǎo)體設(shè)備廠商美國(guó)應(yīng)用材料公司(Applied Materials)生產(chǎn),P5000系統(tǒng)是世界上第一臺(tái)成功的以單晶片、多反應(yīng)室理念而設(shè)計(jì)的量產(chǎn)與研發(fā)均適用的半導(dǎo)體制程設(shè)備。P5000系統(tǒng)具有絕佳的制程整合、量產(chǎn)制造等優(yōu)點(diǎn),并在不破真空的狀況下,最多有四個(gè)相同或不相同的制程反應(yīng)室同時(shí)進(jìn)行生產(chǎn),更富有彈性和整合能力。反應(yīng)原理為:材料源以氣體形式進(jìn)入工藝腔體內(nèi),在RF加功率的情況下,材料源(反應(yīng)氣體)從輝光放電(Plasma:等離子場(chǎng))中獲得激活能,激活并增強(qiáng)化學(xué)反應(yīng),從而實(shí)現(xiàn)化學(xué)氣象淀積。在實(shí)際使用過程中,P5000平臺(tái)經(jīng)常會(huì)出現(xiàn)各種各樣的死機(jī)現(xiàn)象,本文就針對(duì)具體的各種死機(jī)現(xiàn)象進(jìn)行分析,并提供相關(guān)的解決方案。
P5000系統(tǒng)軟件能夠自動(dòng)保存最后一次死機(jī)信息,具體查看方法為:
(1)在主界面用光筆點(diǎn)擊Service菜單,如圖1;
(2)在Service下拉菜單中選擇Diagnostics菜單,如圖2;
(3)在Diagnostics下拉菜單中選擇Last Exception Report菜單,如圖3。
圖1 死機(jī)代碼查詢界面1
圖2 死機(jī)代碼查詢界面2
圖3 死機(jī)代碼查詢界面3
圖4 死機(jī)代碼查詢界面4
該死機(jī)信息同時(shí)被保存在FAULT.LOG文件中,從死機(jī)信息報(bào)告界面中我們可以得到相關(guān)信息,見圖4和表1。
在表1所述信息中,最重要的是第4條(Exception number),根據(jù)該代碼可以對(duì)死機(jī)原因進(jìn)行分析排查,最終解決死機(jī)問題。
表1 死機(jī)信息報(bào)告內(nèi)容
例如Exception number 2,Bus error-FFFF4818,此類死機(jī)原因一般是因?yàn)橛布栴}引起(典型的是DIO或AIO板故障),但偶爾也會(huì)是軟件、VME電壓和VME接地問題引起。其中FFFF4818是導(dǎo)致死機(jī)硬件的內(nèi)存地址,從表2硬件內(nèi)存地址表中我們可以查出引起此次死機(jī)的是AIO#3電路板,更換AIO #3電路板即可解決此次死機(jī)問題。
如果每次出現(xiàn)Exception number 2,Bus error的硬件內(nèi)存地址都不相同,那么最大的可能就是VME電壓被瞬間拉低,此時(shí)應(yīng)該著重檢查VME電壓。
Exception 3-Address Error,軟件、硬件、接地、電磁干擾均會(huì)引起地址錯(cuò)誤死機(jī),出現(xiàn)該死機(jī)問題時(shí)一般先從防電磁干擾方面著手:
(1)檢查VME總線架上所有板卡上下螺釘是否擰緊;
(2)空余的插槽是否用鋁合金盲板封??;
將資產(chǎn)管理和預(yù)算管理進(jìn)行相互結(jié)合,能夠?qū)Y產(chǎn)增量和資產(chǎn)存量進(jìn)行有效結(jié)合,實(shí)現(xiàn)資產(chǎn)相關(guān)信息的共享。能夠避免出現(xiàn)資源浪費(fèi)現(xiàn)象,可以對(duì)資源進(jìn)行最佳配置,有效降低資產(chǎn)配置不合理現(xiàn)象,構(gòu)建鴿鴿合理高效的社會(huì)保障。
(3)設(shè)備各部件之間EMC接地線(P/N:1390-01554)是否安裝;
(4)EMC接地線與設(shè)備地線間阻值是否小于2Ω。
如果電磁干擾檢查沒有問題,那么再?gòu)能浖矫嬷郑ǜ袷交脖P、重新安裝系統(tǒng)軟件等)。
Exception 4-Illegal Instruction,非法指令引起的死機(jī)原因(如系統(tǒng)軟件執(zhí)行了680X0機(jī)器代碼之外的指令),與Exception 3相似,參照其解決方案。
表2 硬件內(nèi)存地址表
Exception 5-Divide by Zero,引起該死機(jī)的原因是系統(tǒng)軟件BUG,所以,從軟件方面著手(如格式化硬盤、重新安裝系統(tǒng)軟件等)可以解決該死機(jī)問題。
Exception 7-TrapCC,該死機(jī)類型具體又分為三小類,分別是Exception 7-TRAPCC(Instruction)、Exception 7-TRAPCC(Failed to Send Software Heartbeat)和Exception 7-TRAPCC(Other)。
Exception 7-TRAPCC(Instruction),引起該死機(jī)的原因是日期或時(shí)間沖突,一般指千年蟲問題,可通過系統(tǒng)升級(jí)的方法來解決該問題。
Exception 7-TRAPCC(Other),一般可通過重啟解決該問題。
Exception 24-Spurious Interrupt,引起該死機(jī)的原因是VME系統(tǒng)總線IACK信號(hào)跳線設(shè)置錯(cuò)誤,檢查每個(gè)VME系統(tǒng)總線插槽,如果有板卡那么插上的IACK信號(hào)跳線應(yīng)該為斷開,如果沒有板卡那么插上的IACK信號(hào)跳線應(yīng)該為短路。
該死機(jī)類型具體又分為三小類,分別是Exception 31-Sys-Fail、Exception 31-Abort Unknown和Exception 31-Memory Parity Error。
Exception 31-Sys-Fail,引起該死機(jī)問題一般比較典型的是VME系統(tǒng)總線電源系統(tǒng)和接地問題,可以從以上兩方面去解決問題。
Exception 31-Abort Unknown,引起該死機(jī)問題一般比較典型的是VME系統(tǒng)總線接地問題或不小心碰了SBC主板上的“abort”按鈕,對(duì)于后者,只需重新啟動(dòng)系統(tǒng)就行了。
Exception 31-Memory Parity Error,引起該死機(jī)問題一般是由于V440型號(hào)的SBC主板運(yùn)算時(shí)奇偶校驗(yàn)錯(cuò)誤,對(duì)于此問題,必須將SBC主板升級(jí)至MA3版本。
該死機(jī)類型具體又分為三小類,分別是Exception 39-Failed to Send Software Heartbeat、Exception 39-Message Pool Full和Exception 39-Memory Pool Full。
Exception 39-Failed to Send Software Heartbeat,引起該死機(jī)問題的類似于Exception 7-TRAPCC(Failed to Send Software Heartbeat),可參照其解決方案。
Exception 39-Message Pool Full,引起該死機(jī)問題的原因是系統(tǒng)執(zhí)行兩個(gè)任務(wù)的時(shí)候信息量過載,當(dāng)信息量大于255條時(shí)會(huì)導(dǎo)致死機(jī),重新啟動(dòng)系統(tǒng)可解決該問題。
Exception 39-Memory Pool Full,一般系統(tǒng)軟件會(huì)自動(dòng)填充和清空內(nèi)存地址,當(dāng)系統(tǒng)只填充不清空內(nèi)存地址時(shí)就會(huì)導(dǎo)致該內(nèi)存池出錯(cuò)死機(jī),一般重啟可解決。3.9 Exception 46
Exception 46-Array Range Error,一般是因?yàn)檐浖栴}引起的死機(jī),可參照Exception 5-Divide by Zero解決該問題。
除上述死機(jī)代碼之外,有些機(jī)臺(tái)可能還會(huì)出現(xiàn)一些其他類型的死機(jī)代碼,也需要用相應(yīng)的方法來解決,在一時(shí)查不出問題的時(shí)候可以嘗試著從接地、電源、硬盤、軟件等方面入手,往往可以取得意想不到的效果。