劉雙龍
(中海石油寧波大榭石化有限公司,浙江 寧波 315812)
中海石油寧波大榭石化有限公司自2016年6月份開工以來先后兩次發(fā)生同一原因?qū)е碌难b置聯(lián)鎖停車,都是由于SIS系統(tǒng)與遠程IO的兩路冗余通信同時通信中斷,輔操臺停車按鈕安全狀態(tài),導(dǎo)致裝置聯(lián)鎖停車的事故。
2017年 5月23日 03:46:35,210×104t/a原料油加氫裝置SIS系統(tǒng)與遠程IO的兩路冗余通信同時通信中斷,輔操臺停車按鈕安全狀態(tài),導(dǎo)致裝置聯(lián)鎖停車,輔操臺報警燈屏全部燈滅。
2017年9月2日23:28:26,6×104標立/小時制氫裝置SIS系統(tǒng)與遠程IO的兩路冗余通信同時通信中斷,輔操臺停車按鈕安全狀態(tài),導(dǎo)致裝置聯(lián)鎖停車,輔操臺報警燈屏全部燈滅。
210×104t/a原料油加氫裝置、6×104標立/小時制氫裝置的安全聯(lián)鎖系統(tǒng)SIS全部選用霍尼韋爾公司的SM系統(tǒng),SM系統(tǒng)是冗余的雙處理器CPU和冗余的IO卡件構(gòu)成,采用2oo4D表決方式,各裝置SIS系統(tǒng)獨立設(shè)置,包括控制站、操作站、輔助操作臺及遠程IO柜等。操作站、輔助操作臺、遠程IO柜、工程師站等安裝在全廠中心控制室(CCR)內(nèi),控制站、端子柜等安裝在各裝置現(xiàn)場機柜室(FAR)內(nèi)。
每套裝置的SIS系統(tǒng)都在CCR有獨立的遠程IO與之相連,控制器與遠程IO采用是SAFENET獨立冗余網(wǎng)絡(luò),控制器與操作站采用是FTE冗余網(wǎng)絡(luò)通信,從現(xiàn)場機柜室(FAR)控制器到中心控制室(CCR)的遠程IO通信網(wǎng)絡(luò)用冗余單模鎧裝光纖+冗余交換機連接。遠程IO主要連接CCR輔操臺的緊急停車按鈕及停車指示燈,遠程IO按故障安全性設(shè)計,遠程IO斷電輔操臺緊急停車按鈕自動動作。
3.1.1 停機過程
通過系統(tǒng)診斷記錄[1]顯示,SIS系統(tǒng)于2017年5月23日03:46:35,SIS控制器與CCR的遠程IO兩路冗余的通信同時中斷,communication fault,錯誤代碼為228。由于遠程IO連接輔操臺的急停按鈕和報警燈,所以當通信中斷時,SIS聯(lián)鎖停車。
3.1.2 原因分析
由于通信故障只是瞬間發(fā)生,并于43 s后通信恢復(fù),目前已經(jīng)開車投產(chǎn),所以通信故障無法重現(xiàn)。同時檢查發(fā)現(xiàn),遠程IO的電源、風扇及機柜環(huán)境溫度綜合報警信息連接在本柜卡件上,一旦遠程IO通信中斷,無法有效地記錄報警狀態(tài)。根據(jù)現(xiàn)在情況及以往經(jīng)驗可知,可能的原因如下,(1)遠程IO電源松動瞬時失電;(2)遠程IO網(wǎng)絡(luò)交換機網(wǎng)絡(luò)風暴問題。
3.1.3 采取的措施
采取的措施具體如下:
(1)緊固遠程IO電源端子,發(fā)現(xiàn)端子基本上不松動;
(2)更換交換機;
(3)原11套SIS的遠程IO的電源、風扇及機柜環(huán)境溫度綜合報警信息接到自身的遠程柜,通信失敗主控制器無法記錄,將報警信息接到DCS控制系統(tǒng)上進行記錄。
3.2.1 停機過程
通過系統(tǒng)診斷記錄顯示,SIS系統(tǒng)于9月2日23:28:26,SIS控制器與CCR的遠程IO兩路冗余的通信同時中斷,communication fault,錯誤代碼為228。由于遠程IO所連接的是輔操臺的急停按鈕和報警燈,當冗余通信同時中斷時,SIS聯(lián)鎖停車。SIS系統(tǒng)于9月3日03:14:47對系統(tǒng)復(fù)位操作后,系統(tǒng)恢復(fù)工作。
3.2.2 SIS系統(tǒng)停車原因分析
根據(jù)SIS系統(tǒng)診斷信息和SOE事件記錄表明,此次聯(lián)鎖停車是由于兩路冗余的遠程IO通信同時故障導(dǎo)致,故重點分析并排查的對象如下。
3.2.2.1 柜內(nèi)故障點趨勢分析
遠程機柜內(nèi)的風扇故障、柜內(nèi)溫度報警以及電源故障點經(jīng)串接后連入DCS系統(tǒng)進行監(jiān)視。
調(diào)取停車事件發(fā)生時間附近的故障點趨勢,DCS記錄在9月2日23:28:27此裝置的SIS安全聯(lián)鎖系統(tǒng)綜合報警信息出現(xiàn)了ON(1)到OFF(0)變換的趨勢,并在23:28:40恢復(fù)正常,故障信號持續(xù)了13 s,SIS的診斷記錄中23:28:53控制器同時識別到遠程卡狀態(tài)。
DCS目前監(jiān)控的是風扇故障、溫度報警以及電源故障串聯(lián)后的信號,考慮機柜內(nèi)的溫度模塊設(shè)定為35℃報警,并且機柜間的溫度一直穩(wěn)定在24 ℃,所以溫度報警排除。風扇故障為不可恢復(fù)的故障,所以排除風扇后最大的可能是停車時電源發(fā)生短時間掉電故障。
3.2.2.2 UPS供電問題檢查
經(jīng)檢查,SIS遠程IO機柜的供電是由DCS配電柜統(tǒng)一供電,并且分別位于兩個供電柜冗余供電,每一路的空開都來自供電母排,所以基本排除了UPS外供電問題。
3.2.2.3 SIS遠程機柜內(nèi)部供電和電源檢查
經(jīng)檢查,220 V冗余供電接線沒有松動現(xiàn)象,內(nèi)部24 V供電接線也沒有松動現(xiàn)象。由于SIS系統(tǒng)聯(lián)鎖后,大約27 s后CP可以與遠程卡通信并診斷出故障,所以基本也排除供電線松動問題。
遠程電源目前所接負載分別為FTE交換機、遠程IO專用交換機、風扇以及遠程IO卡,對于目前所有負載發(fā)生短路故障分析如下。FTE交換機、遠程IO專用交換機及風扇均由24 V DC專用供電分配板獨立供電,每一路均有一個2 A的保險保護,目前保險完好,即排除所述元器件短路的可能。遠程IO背板上有一個10 A的保險,由于停車故障后同在一塊背板上的其他IO卡供電正常,所以基本排除遠程IO卡部分短路故障的可能性。
3.2.2.4 人為因素
通過維保單位協(xié)助核查機柜間的視頻記錄,SIS聯(lián)鎖停車時未發(fā)現(xiàn)有人在CCR機柜間,所以排除人為因素。
3.2.2.5 接 地
經(jīng)檢查,CCR機柜間相鄰機柜安全地之間的電阻為0.2 Ω左右,柜內(nèi)安全地與機柜間安全地排之間的電阻為0.2 Ω左右,柜內(nèi)安全地與儀表地電阻為無窮大。接地以及絕緣良好,故排除接地因素。
3.2.2.6 霍尼韋爾全球技術(shù)支持中心(GTAC)
故障發(fā)生后,將現(xiàn)場采集到的SM數(shù)據(jù)、診斷記錄、SOE記錄以及連接至DCS處的機柜故障報警趨勢統(tǒng)一上報至HONEYWELL全球技術(shù)支持中心處,技術(shù)人員根據(jù)當前所提供信息提示可以考慮的因素。
(1)直流電源FC-PSU-UNI2412在強電磁干擾下可能會有性能降低的情況,會導(dǎo)致電源重啟。
(2)直流電源FC-PSU-UNI2412在2 kV接地浪涌的作用下可能會導(dǎo)致電源重啟。
直流電源FC-PSU-UNI2412在國外項目也發(fā)生過類似情況,并停產(chǎn)了相應(yīng)的版本。結(jié)合技術(shù)人員的分析對機柜間附近可能存在的電磁干擾源進行排查,機柜頂上有對接機天線鐵塔,但由于停車時的強電磁干擾無法重現(xiàn),所以此類原因不排除存在的可能性。
9月2日晚間現(xiàn)場天氣狀況良好,無雷電情況,故排除瞬時浪涌的干擾。
3.2.3 處理措施
根據(jù)分析可知,導(dǎo)致遠程IO卡通信中斷的直接原因應(yīng)為遠程IO機柜內(nèi)為遠程IO模塊供電的直流電源FC-PSU-UNI2412輸出短時掉電重啟造成的。將遠程柜電源FC-PSU-UNI2412更換為抗干擾能力強的FCPSU-UNI2450U V2.1的直流電源,于2017年9月11日-2017年9月12日對全廠12套SIS系統(tǒng)共計24臺直流電源進行了在線更換,截止到2019年6月份未發(fā)生同樣的故障,徹底消除了全廠緊急停車的隱患。
本文對HONEYWELL的SIS系統(tǒng)遠程IO電源模塊故障進行了大量觀察及認真仔細地分析,并采取及時有效的監(jiān)控手段,診斷準確,制定處理措施完善,使問題得到及時解決,提高了系統(tǒng)的穩(wěn)定安全性,給安全生產(chǎn)提供了強有力的保障。