上海天然氣管網(wǎng)有限公司 謝深
容錯(cuò)技術(shù)的基本思想是由馮·諾依曼在1962年提出的。它要求系統(tǒng)具有自動(dòng)修復(fù)及故障容錯(cuò)能力在系統(tǒng)的某個(gè)部件出錯(cuò)的情況下保證整個(gè)系統(tǒng)的可靠性運(yùn)行,其目的就是使得系統(tǒng)能自動(dòng)、適時(shí)地監(jiān)測(cè)并診斷出系統(tǒng)的故障,然后采取相應(yīng)的故障控制和處理方法。而達(dá)到這一要求可行方法有硬件的冗余,系統(tǒng)的同步性、系統(tǒng)的表決性、重構(gòu)性、故障監(jiān)測(cè)多方面。容錯(cuò)控制系統(tǒng)的一般要求:
(1)每個(gè)安全相關(guān)功能,應(yīng)該冗余運(yùn)行;
(2)應(yīng)用軟件有周期性檢查的功能;
(3)通過(guò)比較保證時(shí)鐘和定時(shí)器的正確性;
(4)有措施避免系統(tǒng)進(jìn)入死循環(huán)或停止運(yùn)行;
(5)保證通訊鏈路的正確;
(6)任何硬件故障必須立即得到反映,避免故障累積而發(fā)生的事故;
(7)和安全有關(guān)的數(shù)值不能人工輸入;
(8)保證CP指令執(zhí)行的完整性(針對(duì)多字節(jié)的指令)。
整個(gè)LNG站的控制系統(tǒng)按區(qū)域上可分為三大區(qū)域:中央控制室(NCR)、原有控制室(ECR)、碼頭控制室(JCR),由功能可分為三套系統(tǒng):分布式集成控制系統(tǒng)(DCS);火焰及氣體滅火系統(tǒng)(FGS);緊急停車系統(tǒng)(ESD)。
LNG站的控制系統(tǒng)采用霍尼韋爾(Honeywell)集成控制系統(tǒng),它是基于分布式服務(wù)器架構(gòu)與控制的以太網(wǎng)技術(shù)。該系統(tǒng)包括三處控制室(NCR、ECR、JCR),該系統(tǒng)架構(gòu)見(jiàn)圖1。
圖1 系統(tǒng)架構(gòu)示意
如圖所示:其中碼頭控制室包括基于霍尼韋爾C300系列的DCS分布式集散控制系統(tǒng)及FSC701系列的FGS火焰及氣體滅火系統(tǒng)1套;中央控制室包括基于霍尼韋爾C300系列的DCS系統(tǒng)(包括接入的第三方成套設(shè)備的 PLC控制系統(tǒng))及 FSC701系列的FGS系統(tǒng)和ESD緊急停車系統(tǒng)各1套;原有控制室則由基于AB(Allen-Bradley)PLC5系列的霍尼韋爾SCAN300系統(tǒng)和經(jīng)過(guò)升級(jí)后使用FSC701系列的FGS火焰及氣體滅火系統(tǒng)和ESD緊急停車系統(tǒng)各1套。而兩處分控制室(ECR、JCR)都通過(guò)光纖進(jìn)行連接到中央控制室集成進(jìn)行數(shù)據(jù)通訊。
1.2.1 連接網(wǎng)絡(luò)
此次擴(kuò)建項(xiàng)目采用的是霍尼韋爾的控制網(wǎng)絡(luò)。它不僅提供容錯(cuò)功能,而且反應(yīng)速度快,決定能力強(qiáng),且安全性更高。在這個(gè)項(xiàng)目中,通過(guò)冗余的DCS服務(wù)器,將所有的操作員站和工程師站,集散控制系統(tǒng)控制器(DCS),緊急停車系統(tǒng),火氣系統(tǒng),以及各種第三方控制系統(tǒng)(通過(guò) Modbus/TCP 或Modbus/RTU協(xié)議接入),都通過(guò)冗余光纖連接將NCR,ECR和JCR的各個(gè)系統(tǒng)將連接在同一個(gè)控制網(wǎng)絡(luò)中。
1.2.2 接口方式
基于霍尼韋爾C300系列DCS分布式集散控制系統(tǒng)和ECR的Allen-Bradley的PLC5之間的DH+網(wǎng)絡(luò)的連接,原有站區(qū)的SCAN3000系統(tǒng)采用的是AB PLC為控制器的控制系統(tǒng),需和新站的DCS相集成,PKS提供了與 Allen-Bradley PLC通訊的RSLinx接口與Allen-Bradley可編程控制器連接。在現(xiàn)有工廠,Allen-Bradley公司PLC5作為控制器,集散控制系統(tǒng)(與老站的ESD FGS系統(tǒng)通訊)會(huì)作為SCADA點(diǎn)通過(guò)在服務(wù)器上了一個(gè)監(jiān)控的PKS 1784 PKTXD適配器接入ECR的PKS監(jiān)控服務(wù)器。(PKS SCADA服務(wù)器可以與使用了ALLEN-BRADLEY PLC5通過(guò)DH+網(wǎng)絡(luò)的Allen-Bradley RSLinx接口。)接口方式如圖2。
圖2 接口方式示意
系統(tǒng)中的火氣系統(tǒng)/緊急停車系統(tǒng) FSC系列與PKS通過(guò)FSC的接口與系統(tǒng)集成。NCR的EPKS服務(wù)器可以訪問(wèn)所有的 FSC控制器(ESD/FGS系統(tǒng)),如實(shí)時(shí)數(shù)據(jù),歷史,報(bào)警和事件,SOE(順序事件),診斷等,所有的報(bào)警和FSC的事件、順序在事件日志在PKS系統(tǒng)和操作員工作站(HMI)可視人機(jī)界面中均可查詢,使其成為完全整合的系統(tǒng)。而FSC系統(tǒng)和PKS系統(tǒng)統(tǒng)一,信息功能,時(shí)間同步,能有效幫助操作員找出工藝出現(xiàn)故障。
項(xiàng)目的網(wǎng)絡(luò)采用霍尼韋爾的控制網(wǎng)絡(luò),整個(gè)控制網(wǎng)絡(luò)提供了一個(gè)的100 Mbps的冗余總線的分布式控制系統(tǒng)(DCS)以太網(wǎng)網(wǎng)絡(luò),連接兩套(NCR、JCR各1套)冗余并同步系統(tǒng)控制器(C300系統(tǒng)Controller)及防火墻(C300控制系列防火墻)。一般情況下,傳統(tǒng)的以太網(wǎng)結(jié)構(gòu)通常采用兩個(gè)獨(dú)立的以太網(wǎng)網(wǎng)絡(luò),每個(gè)節(jié)點(diǎn)連接兩個(gè)相互獨(dú)立網(wǎng)絡(luò)。如果有一個(gè)網(wǎng)絡(luò)上的連接失敗,一個(gè)節(jié)點(diǎn)同時(shí)間切換到其它網(wǎng)絡(luò)的范圍可以從10 s到30 s以上,而項(xiàng)目采用的單一多路徑的網(wǎng)絡(luò),當(dāng)出現(xiàn)故障時(shí),重新建立網(wǎng)絡(luò)連接。將切換時(shí)間提高到只有1 s,并且通過(guò)提供更多的節(jié)點(diǎn)之間的通信路徑,整個(gè)控制網(wǎng)也容忍包括個(gè)別節(jié)點(diǎn)單故障和多故障的發(fā)生。該網(wǎng)絡(luò)提供了一種先進(jìn)的網(wǎng)絡(luò)解決方案,使用集成通信技術(shù)方案提高了系統(tǒng)的可靠性,同時(shí)減少試運(yùn)轉(zhuǎn)調(diào)試和維修成本。
2.2.1 基本原理
LNG站分布式系統(tǒng)的架構(gòu)(DSA)采用的是一套冗余的服務(wù)器并通過(guò)硬件同步(通過(guò)硬件時(shí)鐘信號(hào)來(lái)同步個(gè)信號(hào)的運(yùn)行節(jié)拍)和軟件同步(采用網(wǎng)絡(luò)通訊的方法,通過(guò)傳輸同步幀實(shí)現(xiàn)模塊間的同步)使主服務(wù)器和備份服務(wù)器處于同步狀態(tài),它的選項(xiàng)中提供了外部接入功能,無(wú)需做任何服務(wù)器上重復(fù)配置。使系統(tǒng)中所有的服務(wù)器,PLC都能接入 DCS并獲得的數(shù)據(jù)(選項(xiàng)包括訪問(wèn)系統(tǒng)的數(shù)據(jù)點(diǎn)、報(bào)警、信息、歷史、共享等)。每個(gè)服務(wù)器提供自動(dòng)為所有客戶能夠遠(yuǎn)程數(shù)據(jù)的動(dòng)態(tài)緩存,以便客戶端訪問(wèn)的本地服務(wù)器其所有的數(shù)據(jù)。這種機(jī)制可確保無(wú)論在服務(wù)器和在網(wǎng)絡(luò)上最高的效率。主 DCS終端服務(wù)器與現(xiàn)場(chǎng)設(shè)備服務(wù)器進(jìn)行通信并通過(guò)其余服務(wù)器。如果主服務(wù)器發(fā)生故障,備份 DCS服務(wù)器將成為主服務(wù)器與現(xiàn)場(chǎng)設(shè)備進(jìn)行通信。
2.2.2 服務(wù)器連接示意圖
圖3 服務(wù)器連接示意
軟件錯(cuò)誤一般編碼和程序錯(cuò)誤引起,PKS的軟件平臺(tái)通過(guò)軟件的時(shí)間冗余、信息冗余、系統(tǒng)的重構(gòu)性等功能有效避免這些錯(cuò)誤的發(fā)生,保障了其穩(wěn)定性,并通過(guò)所具有的自檢性、SOE(事件順序)、EVENT故障報(bào)錯(cuò)和存檔的能力以及自診斷和糾錯(cuò)有效避免了故障的累積,使得軟件的可靠性得到了保障。是需要強(qiáng)調(diào)的是PKS軟件系統(tǒng)為保障系統(tǒng)的冗余及監(jiān)測(cè)所帶來(lái)的代價(jià)是占據(jù)的相當(dāng)大系統(tǒng)資源,以及報(bào)錯(cuò)、報(bào)警偏多的問(wèn)題。
本文從各方面介紹了整個(gè)項(xiàng)目的容錯(cuò)實(shí)現(xiàn),以及系統(tǒng)組成,容錯(cuò)性能確保了系統(tǒng)的安全、穩(wěn)定和可靠性,但同時(shí)也考慮到各種冗余的實(shí)現(xiàn)及通過(guò)SOE事件順序、EVENT故障報(bào)錯(cuò)及存檔的能力所帶來(lái)極大的占據(jù)系統(tǒng)資源的問(wèn)題,以及報(bào)錯(cuò)過(guò)于頻繁,易造成操作員警覺(jué)下降。因此容錯(cuò)性的有效性和合理性才是要重點(diǎn)考慮的合理的容錯(cuò)技術(shù)才能保證系統(tǒng)可靠性,否則會(huì)造成系統(tǒng)資源的浪費(fèi)。