李宗澤
摘 要: 隨著現(xiàn)代技術的進步,計算機技術得到普及,人們對于計算機技術應用的可靠性也越來越重視。文章對常用的計算機技術進行對比。對計算機特性進行更進一步的闡述,為微機應用和鑒定的使用者提供系統(tǒng)方案,并分析計算機可靠性的發(fā)展趨向。
1.引言
技術的進步推動科技的發(fā)展,微機技術的應用領域范圍不斷延伸[1-2]。人們對計算機系統(tǒng)的可靠性要求更加嚴格,供應商也提供越來越多的技術手段。因此本文以常用的可靠性技術手段為基礎,對其特性進行全面分析,為使用者提供決策依據(jù)[3]。
2.可靠性技術研究
微機應用系統(tǒng)的可靠性是指給定固定時間,在這個時間范圍內保證系統(tǒng)能正常運行的概率,影響因素是在運行過程的故障率造成的。對于一個應用系統(tǒng),無法實現(xiàn)絕對無故障,只能通過降低故障率來提高運行系統(tǒng)的可靠性。
一般對于系統(tǒng)運行技術的應用,按要求不同使用相應的技術。影響故障的因素主要有運行系統(tǒng)的費用、操作技術人員的生命和使用者的需求,分出不同的等級,有以下相應技術。
1)費用的影響主要適用于商業(yè)領域;
2)對于微機軍用系統(tǒng)或者核電站等重要或危險場所對操作人員的生命影響比較大;
3.可靠性
3.1故障的分類和故障機理
從系統(tǒng)運行功能上分析,主要分為三大故障:硬件、軟件和過程故障,不同原因對應不同的故障特點。硬件故障:設計不合理;整體結構不完善;可靠性不高等;軟件故障:代碼編寫不正確;系統(tǒng)無法正確讀取數(shù)據(jù)等;運行故障:操作步驟不完善,文件不正確等。
從可靠性方面分析,主要故障有:很多對于可靠性的高要求在實際運行中可能只是對于某一些故障類別有特殊要求,在設計過程中可以對此進行費用、程序進行合理規(guī)劃,既能節(jié)省費用也能提高可靠性。
3.2可靠性參數(shù)
常用度量可靠性參數(shù)主要有可靠性、可維性、可用性,被稱為RAS技術。其中常用的指標是可靠性技術指標。在實際使用過程中,雖然可靠性技術指標指向明確,但是在供應商和使用者之間對故障率存在不同看法。比如,對于一臺中央處理機的可靠性進行檢測,往往使用者發(fā)現(xiàn)的故障遠遠高于工程師檢測的故障率,而對于這些故障問題,大多情況下只需要關閉系統(tǒng)重新起動即可。
為了使使用者切實感受到微機系統(tǒng)運行的可靠性,使用者可以選擇最好的運行系統(tǒng),并對故障提前做出應對措施,讓使用者充分了解系統(tǒng)的可維護性、診斷性以及如何恢復等操作技能。
3.3可靠性的技術條件
為了對系統(tǒng)的可靠性進行綜合分析,從以下幾個方面進行討論:
1)系統(tǒng)開發(fā)成本:決定了系統(tǒng)級別,也是可靠性技術的一個重要支撐;
2)技術的復雜性:主要是硬件的復雜程度,為系統(tǒng)工藝精確性提供保障;
3)系統(tǒng)的開發(fā)難度:決定了系統(tǒng)的成本和適用范圍;
4可靠性技術剖析
硬件、軟件和使用流程都是影響可靠性的因素,包括一些技術手段、防錯技術、容錯技術、維護措施等,針對這些技術特點,本文進行詳細闡述,為使用者提供更完善的決策依據(jù)。
4.1系統(tǒng)結構技術
對于系統(tǒng)的可靠性往往從使用者要求的服務質量和經(jīng)濟性進行選擇合適系統(tǒng)結構。對于子系統(tǒng)的可靠性一般采用軟件技術,而子系統(tǒng)的可靠性對整體系統(tǒng)的影響也至關重要。通過實驗驗證,對于一個擁有四個子系統(tǒng)的系統(tǒng),串聯(lián)系統(tǒng)要比串并聯(lián)系統(tǒng)的可靠性高。
4.2防錯技術
這項技術要求在系統(tǒng)設計過程中提前考慮影響因素并避免。遵守的原則有:
1)保證元件質量:在保證成本合理情況下,選用可靠性高的元件;
2)結構合理:系統(tǒng)結構要簡化,使用比較成熟的結構設施,減少故障率;
3)設計合理:對于仿真模擬電路要進行實際實驗;減少集成電路的分電路,對電路進行簡化;
4)采用先進的并且成熟的技術。
4.3容錯技術
為了提高系統(tǒng)的可靠性,容錯技術是對軟件和硬件技術很重要的一項技術措施。容錯技術可以對一些系統(tǒng)設計進行合理的補充,使系統(tǒng)可以正常運行。
冗余技術和檢測技術是容錯技術的兩大組成部分。
(1)冗余技術
作為容錯技術的重要組成部分,冗余技術是附加軟件、硬件、時間或他們之間的組合。他們的特點主要有:
1)屏蔽冗余,也稱為靜態(tài)冗余,能夠通過附件分元件對故障元件進行屏蔽。有N模冗余系統(tǒng),一般N為奇數(shù),若多塊模塊可靠性高,則必須保證單個模塊的性能提高。糾錯碼在冗余系統(tǒng)中能夠實現(xiàn)故障的自行監(jiān)測和故障屏蔽,他的特點是當容錯能力固定時,N模冗余模式相對于編碼可靠性更高;當復雜程度是定值時,合理編碼更能提高可靠性。
2)動態(tài)冗余,指的是系統(tǒng)運行過程中,指定一個模塊運行,若此模塊發(fā)生故障則直接被換掉。
3)混合冗余,此方式可以通過計算設備模塊的數(shù)量,來計選擇模塊的最佳值,達到最優(yōu)可靠性。
4)自清除方式,其特點是與一般冗余方式相比結構簡單;若果系統(tǒng)具備修復功能時,則更能顯示此系統(tǒng)的優(yōu)勢,特別對于數(shù)字系統(tǒng)效果更加明顯;隨著現(xiàn)代設備容量的加大,表決器也會變得更加復雜;如果改用其他的元件,不僅會增加成本,可靠性也會大打折扣。
(2)檢測技術
容錯要求系統(tǒng)運行過程應把故障進行屏蔽,但過多的故障累計可能會導致系統(tǒng)運行的失敗。為防止這種現(xiàn)象發(fā)生,需建立相應的檢測技術來發(fā)現(xiàn)故障并及時進行維修,減少故障率,降低維修時間,減少成本。建立故障檢測機制分為硬件檢測和軟件檢測。硬件檢測要對編碼進行檢驗,并定時重復校驗,硬件檢驗設施比較全面。軟件故障檢驗主要是對數(shù)據(jù)和控制程序和功能進行檢驗,但在實際運行過程中比較復雜,應用成本高。
4.4降格恢復運行
除了采用冗余技術改善系統(tǒng)運行的可靠性,我們也可以運用分離方式把故障模塊分隔,再對其余模塊進行重組,通過降級使系統(tǒng)工作,就是降格恢復運行。這種運行方式工作的首要條件是系統(tǒng)能夠接受降級工作,再次降格不影響系統(tǒng)工作的正常運行,并在不能維修的狀況下能實施全恢復。對于效率要求高的系統(tǒng)中,比較適合采用此方法。
5可靠性技術比較
在避錯、檢測和動靜態(tài)冗余這幾項技術中,綜合成本避錯技術最低,靜態(tài)冗余的可靠性改善程度最好,但復雜性也是偏高,技術難度較大,而避錯技術相對簡易。
6可靠性設計方法
(1)可靠性分配
明確各項要求指標,并確定在系統(tǒng)中的重要程度和復雜程度以及維修成本和是否易于維修,對各部分進行合理分配,使子系統(tǒng)、整體和操作人員得到優(yōu)化配置。
(2)可靠性評估
根據(jù)系統(tǒng)要求確定材料的可靠性,進行整體評估,提出方案,對數(shù)據(jù)進行分析。
(3)可靠性設計
1)根據(jù)使用者和系統(tǒng)本身的要求,分析材料,設計合適方案。
2)如果設計的系統(tǒng)運行可靠性低,則要采取措施提高可靠性,既要防止人為的失誤操作,也要增加系統(tǒng)的安全指數(shù);可運用自動檢測系統(tǒng)進行故障分析。
3)設計過程中,如出現(xiàn)沖突,要對矛盾進行分析,減少損耗,進行合理取舍,最終達到較強功能和可靠性的方案。
4)可靠性預測和驗證
了解系統(tǒng)性能,對改進提出適應方案。并在使用壽命,應用環(huán)境和維修以及模擬階段進行試驗驗證。通過這些環(huán)節(jié)確定系統(tǒng)的可靠性,如果不達標,及時找出問題進行改進。
7結束語
科學技術和應用電子的發(fā)展使微機系統(tǒng)應用更加廣泛。系統(tǒng)結構的復雜要求微機系統(tǒng)的各個組成部件設計更加精細,再加上人為操作等社會環(huán)境的偶然因素,都使系統(tǒng)可靠性受到影響。
針對這些原因,我們更要在系統(tǒng)設計中發(fā)揮我們的特長,不斷設計過程中總結經(jīng)驗,提高系統(tǒng)的整體性能。
參考文獻
[1]黃永勤, 金利峰, 劉耀. 高性能計算機的可靠性技術現(xiàn)狀與趨勢[J]. 計算機研究與發(fā)展, 2010, 589-594.
[2]于銀鳳. 計算機網(wǎng)絡可靠性提高方法研究[J]. 電大理工, 2016, 28-29.
[3]李霄, 郭彤, 王常洲. 企業(yè)計算機應用系統(tǒng)可靠性測試技術研究[J]. 中國科技信息, 2013, 87-88.