顏興輝
摘要:在經(jīng)濟(jì)發(fā)展速度逐漸加快的過程中,信息已經(jīng)成為個行業(yè)發(fā)展的根本。伴隨著信息時代的到來。計(jì)算機(jī)已經(jīng)成為信息系統(tǒng)的關(guān)鍵設(shè)備。就當(dāng)代企業(yè)而言,計(jì)算機(jī)提供及時可靠的信息與服務(wù)已經(jīng)是必不可少的,同時也是多部門的關(guān)鍵,不少部門已經(jīng)對計(jì)算機(jī)系統(tǒng)產(chǎn)生出一定的依賴性。但是計(jì)算機(jī)的硬件與軟件不可能不會出現(xiàn)故障,一旦故障出現(xiàn)就會帶來難以估量的損失。這其中計(jì)算機(jī)運(yùn)作的關(guān)鍵性問題就是可靠性,而容錯技術(shù)是計(jì)算機(jī)可靠性的保證。該文就容錯技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)中的應(yīng)用進(jìn)行論述。
關(guān)鍵詞:容錯技術(shù);計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng);應(yīng)用
中圖分類號:TP393 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2015)24-0031-02
在網(wǎng)絡(luò)時代快速發(fā)展的過程中,電子商務(wù)為人們帶來一種嶄新的生活模式。電子商務(wù)涉及領(lǐng)域越來越寬泛,甚至出現(xiàn)全球蔓延的現(xiàn)象。如果電子商務(wù)涉及全球市場,就會出現(xiàn)信息急劇增長的情況。即便是再堅(jiān)固的平臺也是一大嚴(yán)峻的考驗(yàn)。同時,在客戶要求越來越高的前提下,造成系統(tǒng)高性能與始終如一的可靠性方面承受著越來越大的壓力?;诖朔N情況,對全球性的電子商務(wù)系統(tǒng)與客戶隱私進(jìn)行保護(hù)是安全措施的關(guān)鍵。就優(yōu)秀的電子商務(wù)系統(tǒng)而言,在線客戶找不到與需要相匹配的東西,那么就會立即選擇其他的廠商。如果沒有滿足商定的正常運(yùn)行時間要求,那么就要面對嚴(yán)厲的懲罰。在這種環(huán)境中,可用性并不是一項(xiàng)簡單的選擇,而轉(zhuǎn)變成為命令執(zhí)行。因此,容錯技術(shù)已經(jīng)成為電子商務(wù)運(yùn)營商構(gòu)造自己系統(tǒng)的首要選擇。
1容錯技術(shù)的應(yīng)用方法
容錯技術(shù)對計(jì)算機(jī)系統(tǒng)良好的運(yùn)行具有非常重要的意義。在計(jì)算機(jī)系統(tǒng)運(yùn)行的過程中,如果整個系統(tǒng)出現(xiàn)故障,則可以通過容錯技術(shù)促使起保持良好的狀態(tài)繼續(xù)運(yùn)行。而容錯技術(shù)的具體應(yīng)用需要通過有效的方法才得以實(shí)現(xiàn)。
1.1冗余設(shè)計(jì)
在計(jì)算機(jī)逐步發(fā)展以及計(jì)算機(jī)系統(tǒng)應(yīng)用領(lǐng)域越來愈寬泛的情況下,影響計(jì)算機(jī)實(shí)際工作的一個關(guān)鍵性問題就是可靠性[1]。而要保證計(jì)算機(jī)技術(shù)的可靠性,就需要借助容錯技術(shù)。容錯技術(shù)其實(shí)就是在計(jì)算機(jī)因?yàn)槠骷匣?、錯誤輸入以及原始設(shè)計(jì)和外部環(huán)境影響等多種因素下引起異常行為維持系統(tǒng)正常運(yùn)行的技術(shù)總稱。簡單來說就是在計(jì)算機(jī)系統(tǒng)發(fā)生故障的時候通過容錯技術(shù)促使系統(tǒng)得以正常的運(yùn)行。要想容錯技術(shù)在計(jì)算機(jī)系統(tǒng)運(yùn)行的時候充分發(fā)揮出作用,就需要借助冗余。通過冗余可以將錯誤的信息屏蔽或者是利用重構(gòu)來促使系統(tǒng)緩慢的降級,繼而計(jì)算機(jī)能夠在出現(xiàn)故障的時候不會影響正常操作。
1.2集成技術(shù)
隨著科學(xué)技術(shù)的快速發(fā)展,網(wǎng)絡(luò)技術(shù)發(fā)展速度也在不斷加快。在環(huán)境與應(yīng)用條件不斷提高的過程中,用戶在系統(tǒng)計(jì)算速度與可靠性方面提出了更高的要求?;诖耍滦偷募河?jì)算系統(tǒng)開始出現(xiàn)在計(jì)算機(jī)系統(tǒng)中,并逐漸成為主流。用戶利用集群系統(tǒng)就能夠?qū)⒊R姷挠布到y(tǒng)轉(zhuǎn)變成為組合機(jī)群。如此,用戶就能夠根據(jù)實(shí)際需要增加硬件,并將系統(tǒng)的可用性與伸縮性提高。采用這樣的方式,提高系統(tǒng)使用性能的同時,還能夠降低整個系統(tǒng)運(yùn)行的成本。為方便用戶,即便集群系統(tǒng)是一個普通的系統(tǒng),但是其中有包含相應(yīng)的處理單元,不同的單元其實(shí)有著獨(dú)立的空間,并利用高速或者是標(biāo)準(zhǔn)的商品網(wǎng)絡(luò)來進(jìn)行連接。集群應(yīng)用的時候可以達(dá)到這么兩個目的,即在沒有用戶參與的情況下促使系統(tǒng)保持在最佳的運(yùn)行狀態(tài);另外就是一個或者部分節(jié)點(diǎn)在失效的時候,其他節(jié)點(diǎn)可以順利的階梯工作,促使集群系統(tǒng)能夠正常的對外提供服務(wù),實(shí)現(xiàn)容錯能力。
2 容錯技術(shù)的相關(guān)性
研究分析容錯技術(shù)的主要目的就是要消除由于故障產(chǎn)生停機(jī)結(jié)果的出現(xiàn)。其實(shí)就計(jì)算機(jī)系統(tǒng)來說要正確認(rèn)識到容錯技術(shù),需要將故障、失效與錯誤之間的關(guān)系區(qū)別開,這樣才能夠促使容錯技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)中更好的應(yīng)用。
2.1故障分類
通常情況下,計(jì)算機(jī)網(wǎng)路系統(tǒng)在運(yùn)行的時候會出現(xiàn)多種不同類型的故障。研究分析就會發(fā)現(xiàn),故障主要有這么幾類,即永久性故障、間歇性故障以及偶然性故障。根據(jù)不同的故障需要采用不同的容錯方法。對永久性故障,則可以利用診斷程序來定位故障,隨后就可以采取糾錯措施;針對間歇性故障,因?yàn)槌霈F(xiàn)故障的時間比較短,也就無法利用診斷程序,但是這種故障重復(fù)性特點(diǎn)表現(xiàn)得非常明顯,并且還會提供一個判斷錯誤的機(jī)會。針對這種故障可以通過軟硬件的方式來修復(fù);而對于因?yàn)榄h(huán)境因素引起的偶然性故障,則是一件比較困難的事情,該故障只會一閃而過,關(guān)于故障的各個因素都難以確定,但是結(jié)果已經(jīng)產(chǎn)生,唯有通過改善環(huán)境來減少由于環(huán)境引起的偶然性故障[2]。從這就可以看出,就故障的特點(diǎn)來看,將間隙性故障與偶然性故障消除掉,屬于容錯技術(shù)的關(guān)鍵部分。其實(shí)在實(shí)踐終究會發(fā)現(xiàn),間歇性故障與偶然性故障所占比例較大,因而也就是系統(tǒng)出錯的主要原因。因此,容錯技術(shù)應(yīng)當(dāng)主要解決的是如何糾正間歇性故障與偶然性故障引起的錯誤。
2.2比較典型的容錯設(shè)計(jì)
在計(jì)算機(jī)系統(tǒng)中,容錯技術(shù)中必然含有幾項(xiàng)比較典型的容錯設(shè)計(jì)。首先,冗余設(shè)計(jì)。通常情況下,容錯技術(shù)總是會與冗余相聯(lián)系。在計(jì)算機(jī)系統(tǒng)某一部件出現(xiàn)錯誤的時候,冗余設(shè)計(jì)就是要針對該錯誤配備相應(yīng)的不見來接替。如果接替的部件僅僅是來提高系統(tǒng)的可靠性,且不會對系統(tǒng)的計(jì)算性能產(chǎn)生影響,就應(yīng)當(dāng)屬于冗余。冗余可以通過關(guān)鍵性部件配備多份、關(guān)鍵性操作配備若干個可選擇程序與糾正錯碼以及操作重復(fù)等方式來實(shí)現(xiàn)冗余。目前的冗余設(shè)計(jì)主要是在功能部件上為一級,可以借助檢測與切換等裝置來實(shí)現(xiàn)檢錯或者是糾錯。其次,雙擊并聯(lián)結(jié)構(gòu)。在以前,為提高系統(tǒng)運(yùn)行的可靠性,需要給予相應(yīng)的條件,并且利用雙擊并聯(lián)的形式來控制整個系統(tǒng),簡單來說就是在兩臺完全相同的計(jì)算機(jī)利用雙擊部件來控制整個的并聯(lián)工作,其實(shí)這也是傳統(tǒng)冗余方式的一種體現(xiàn)。雙擊并聯(lián)系統(tǒng)不僅需要具備兩套硬件與軟件系統(tǒng),還得有與之相應(yīng)的切換管理軟件。而為保證整個系統(tǒng)運(yùn)行的穩(wěn)定性,就需要運(yùn)行的時候進(jìn)行不同的檢查,即檢查點(diǎn)檢查與聯(lián)機(jī)相互健康檢查。如果兩臺相連的計(jì)算機(jī)同時運(yùn)行,就能夠利用處理與檢查來處理各項(xiàng)檢查結(jié)果。但是如果兩者不相同,就有可能出現(xiàn)錯誤,繼而分別對不同的計(jì)算機(jī)進(jìn)行錯誤排查。并切粒計(jì)算機(jī),進(jìn)入到維修狀態(tài),保證系統(tǒng)在單臺計(jì)算機(jī)下可以繼續(xù)的運(yùn)行。最后,部件級容錯系統(tǒng)[3]。這種系統(tǒng)容錯通常都是單機(jī)配置,并沒有切換軟件。有利于用戶開發(fā)管理,同時容錯對用戶是透明的,這樣就能夠降低開發(fā)的費(fèi)用。這項(xiàng)設(shè)計(jì)其實(shí)簡單說來就是故障檢測與故障處理。在故障出現(xiàn)的時候,為實(shí)現(xiàn)容錯,就需要對每種電路板與外圍設(shè)備進(jìn)行擴(kuò)充。這樣計(jì)算機(jī)在加電的時候就可以診斷。有助于將潛藏性的問題找出來。而故障處理則是在電路板或者是連接設(shè)備出現(xiàn)故障的時候,就會立即退出服務(wù),電路板的指示燈量,并向操作系統(tǒng)發(fā)出信號,操作系統(tǒng)就會判斷出錯是瞬時性還是持久性。維護(hù)軟件與應(yīng)用軟件是并發(fā)運(yùn)行的,并且對用戶是透明的,由于雙工工作的部件保證持續(xù)地以最佳速度運(yùn)行,因此故障不會影響性能。
3 容錯技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)中的應(yīng)用
最近幾年,在客戶對系統(tǒng)安全性要求不斷提高的過程中,以及客戶對系統(tǒng)關(guān)鍵性應(yīng)用可靠性要求不斷增加的情況,可靠的系統(tǒng)方案已經(jīng)成為用戶的一大需求。該系統(tǒng)必須要不斷擴(kuò)展計(jì)算機(jī)的性能,同時還要提高系統(tǒng)的可靠性。在這樣一種情況下,集群技術(shù)逐漸引起人們的注意。作為一種技術(shù),集群技術(shù)將不同的系統(tǒng)聯(lián)系到一起,促使兩臺服務(wù)器能夠像一臺機(jī)器那般工作,就好比是一臺機(jī)器。維護(hù)軟件與應(yīng)用軟件是并發(fā)運(yùn)行的,并且對用戶是透明的,由于雙工工作的部件保證持續(xù)地以最佳速度運(yùn)行,因此故障不會影響性能。
3.1集群的概述
集群技術(shù)是相互獨(dú)立于服務(wù)器在網(wǎng)絡(luò)系統(tǒng)的單一系統(tǒng),同時采用單一系統(tǒng)模式進(jìn)行管理。通常情況下,將所有的計(jì)算機(jī)必須有一個相應(yīng)的名稱,這樣集群中運(yùn)行的系統(tǒng)可以供所有的網(wǎng)絡(luò)用戶使用[4]。單項(xiàng)集成技會有與之相應(yīng)的儲存空間服務(wù)器。如果在一個系統(tǒng)內(nèi)加以應(yīng)用,那么所有的應(yīng)用數(shù)據(jù)都會存儲到該空間內(nèi)。與此同時,不同的服務(wù)操作系統(tǒng)與應(yīng)用操作文件都會被存儲在與之相應(yīng)的空間內(nèi)。如果是同一項(xiàng)集成技術(shù),即便是不同的節(jié)點(diǎn)也需要通過相同的局域網(wǎng)來保持聯(lián)絡(luò)。如果是同一各節(jié)點(diǎn)服務(wù)器出現(xiàn)了故障,那么這一臺服務(wù)器的所有的程序就會自動的被另外一臺服務(wù)器接管。如若出現(xiàn)故障,應(yīng)用服務(wù)器就會重新的啟動或者是另外一臺服務(wù)器接管。只要是同一個局域網(wǎng),只要是出現(xiàn)故障,用戶就會很快地連接到其他的應(yīng)用服務(wù)上。在集群中,錯誤接管技術(shù)經(jīng)常食用在數(shù)據(jù)庫服務(wù)器與MA兒服務(wù)器中。由于使用這樣的集成技術(shù)就相當(dāng)于是實(shí)現(xiàn)了共享存儲設(shè)備的應(yīng)用,因此必然會增加使用費(fèi)用。但是如果同時使用數(shù)臺機(jī)器集群,就能夠?qū)⑾到y(tǒng)的可用性與擴(kuò)展性相應(yīng)的提高。
3.2容錯接管集成技術(shù)的應(yīng)用
所謂的容錯接管集成技術(shù),其實(shí)就是在相同的網(wǎng)絡(luò)中啟用不同的服務(wù)器將各項(xiàng)容錯技術(shù)以期各項(xiàng)都能夠保持聯(lián)系,節(jié)點(diǎn)不相同,其實(shí)在運(yùn)行的時候都會有各自應(yīng)用的特點(diǎn)。在節(jié)點(diǎn)出現(xiàn)故障的時候,利用集成系統(tǒng)的指定服務(wù)在最短的時間內(nèi)對出現(xiàn)故障的數(shù)據(jù)進(jìn)行接管,同時還能夠進(jìn)行應(yīng)用,這樣就能夠?yàn)橛脩籼峁┫鄳?yīng)的服務(wù)。
3.3容錯集成技術(shù)的應(yīng)用
就計(jì)算機(jī)容錯技術(shù)來說,集成技術(shù)應(yīng)當(dāng)屬于非常典型的技術(shù)。在整個計(jì)算機(jī)的容錯系統(tǒng)內(nèi),每個部分都有與之相匹配的冗余設(shè)計(jì)。容錯集成技術(shù)的各節(jié)點(diǎn)會與之相對應(yīng)的節(jié)點(diǎn)相互聯(lián)系,同時在其間還會應(yīng)用到硬盤、CPU以及I/O等具有共享性的系統(tǒng)[5]。從本質(zhì)上來說,容錯集成技術(shù)不同節(jié)點(diǎn)有著相應(yīng)的獨(dú)立系統(tǒng),并且不同的系統(tǒng)是整個系統(tǒng)的組成部分。在容錯集成系統(tǒng)內(nèi),節(jié)點(diǎn)在相互切換的時候是很容易的實(shí)現(xiàn),不會受到時間的限制。即便容錯集成技術(shù)在軟硬件設(shè)計(jì)方面有著非常高的要求,并且涉及的成本相對較高,但是該項(xiàng)技術(shù)的可用性是比較高的。這對財(cái)政和金融相關(guān)部門來說是最佳的選擇。
4 結(jié)語
總而言之,在計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)逐步發(fā)展的過程中,要保證計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)運(yùn)行的可靠,運(yùn)行中獲取的各種技術(shù)可以保證安全性,就需要冗余技術(shù)應(yīng)用于其中。
參考文獻(xiàn):
[1] 李麗云,田東力,李凱,等.關(guān)于計(jì)算機(jī)容錯技術(shù)的應(yīng)用和分析[J].工程技術(shù)學(xué)報,2013,10(04):57.
[2] 雒寶鵬,王仲生.小衛(wèi)星星務(wù)管理計(jì)算機(jī)容錯系統(tǒng)的設(shè)計(jì)[J].宇航計(jì)測技術(shù),2014,14(04):54-55.
[3] 李顯彤.工業(yè)控制計(jì)算機(jī)容錯技術(shù)研究及應(yīng)用[J].科技咨詢導(dǎo)報,2011,19(29):101-103.
[4] 方蕾.一種采用軟硬件雙重容錯技術(shù)的微機(jī)系統(tǒng)[J].上海鐵道大學(xué)學(xué)報,2013,13(03):99-101.
[5] 龔健,楊孟飛.基于可進(jìn)化硬件的容錯技術(shù)及其原理[J].航天控制,2012,17(06):67-69.