關(guān)文俊
關(guān)鍵詞:萊斯塔臺(tái)自動(dòng)化;RAID1;Linux;SSACLI;磁盤(pán)陣列
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2023)10-0099-03
0 引言
民航湛江空管站萊斯集成塔臺(tái)自動(dòng)化系統(tǒng)屬于湛江機(jī)場(chǎng)遷建工程空管工程項(xiàng)目之一,是由南京萊斯信息科技股份有限公司自主研發(fā)的具備自有知識(shí)產(chǎn)權(quán)的集成塔臺(tái)自動(dòng)化系統(tǒng)。該系統(tǒng)是中南地區(qū)首套面向機(jī)場(chǎng)管制用戶的業(yè)務(wù)集成系統(tǒng),能夠?qū)崿F(xiàn)管制信息資源統(tǒng)一處理與顯示,實(shí)現(xiàn)管制業(yè)務(wù)一體化整合,向用戶提供一體化、集成式管制指揮平臺(tái)。系統(tǒng)覆蓋塔臺(tái)管制全流程的電子化、數(shù)字化航班進(jìn)程管理(EFS);一體化的機(jī)場(chǎng)場(chǎng)面和空中態(tài)勢(shì)監(jiān)控;基于監(jiān)視趨勢(shì)及管制意圖的安全告警、停止排燈控制;先進(jìn)的航空器滑行路由規(guī)劃(人工、自動(dòng))功能;靈活顯示的運(yùn)行環(huán)境信息(氣象、情報(bào)、流量等);高度信息關(guān)聯(lián)、便捷的集成顯示聯(lián)動(dòng)操作界面;與外部單位(系統(tǒng))交互聯(lián)動(dòng)的一體化運(yùn)行等功能。解決了塔臺(tái)設(shè)備繁多、信息關(guān)聯(lián)集成度低等問(wèn)題,并著眼于塔臺(tái)管制業(yè)務(wù)和系統(tǒng)整體規(guī)劃,基于塔臺(tái)管制流程,創(chuàng)新新模式、新格局,從物理、信息、功能三個(gè)層面,構(gòu)建了基于塔臺(tái)工作流的信息化集成框架,形成一體化、集成式塔臺(tái)管制系統(tǒng)解決方案。萊斯機(jī)集成塔臺(tái)自動(dòng)化系統(tǒng)基于Linux 7.8操作平臺(tái),采用C/C++語(yǔ)言編程、QT圖形工具開(kāi)發(fā)的三網(wǎng)分布式系統(tǒng)。該系統(tǒng)中,服務(wù)器均采用雙機(jī)熱備份方式工作。終端均采用單機(jī)三網(wǎng)工作方式,由于終端沒(méi)有雙機(jī)冗余結(jié)構(gòu),所以終端配置RAID1顯得更加重要。
民航湛江空管站萊斯集成塔臺(tái)自動(dòng)化系統(tǒng)的終端硬件型號(hào)為惠普Z(yǔ)4,所有終端配置兩塊設(shè)置了鏡像RAID1的硬盤(pán),最多可允許一塊硬盤(pán)故障而不影響設(shè)備的運(yùn)行。
1 RAID的介紹
RAID全稱是Redundant Arrays of InexpensiveDisks,即容錯(cuò)式廉價(jià)磁盤(pán)陣列[1]。磁盤(pán)陣列分為軟件RAID與硬件RAID,軟件RAID主要是通過(guò)軟件來(lái)仿真數(shù)組的任務(wù),因此會(huì)損耗較多的系統(tǒng)資源。硬件RAID是通過(guò)磁盤(pán)陣列卡來(lái)達(dá)成數(shù)組的目的,磁盤(pán)陣列卡上面有一塊專門(mén)的芯片在處理RAID的任務(wù),因此在性能上會(huì)比較好。這也是目前湛江空管站所有終端及服務(wù)器所采用的方式。RAID根據(jù)類型的不同有著不同的功能,常見(jiàn)的RAID 類型有RAID0、RAID1、RAID5、RAID10等。
RAID0 稱為stripe 即等量模式。這種模式的RAID會(huì)將磁盤(pán)先切出等量的名為chunk的區(qū)塊大小,chunk 一般設(shè)為4k~1M 之間[2],當(dāng)一個(gè)文件要寫(xiě)入RAID時(shí),如圖1所示,該文件會(huì)依據(jù)chunk的大小切割好,之后再依序交錯(cuò)等量地放到各個(gè)磁盤(pán)里去。由于數(shù)據(jù)已經(jīng)先被切割并且依序放置到不同的磁盤(pán)上面,因此每個(gè)磁盤(pán)所負(fù)責(zé)的數(shù)據(jù)量都降低了,也就是RAID0的數(shù)據(jù)寫(xiě)入性能提高了。但是由于數(shù)據(jù)被等量分開(kāi)存儲(chǔ),當(dāng)RAID0 中的某一個(gè)硬盤(pán)故障了,在RAID0上面的所有數(shù)據(jù)都會(huì)丟失。
RAID1稱為mirror即鏡像模式。RAID1模式主要是讓同一份數(shù)據(jù),完整地保存在兩個(gè)磁盤(pán)上面[3],當(dāng)一份數(shù)據(jù)傳送到RAID1之后,陣列卡會(huì)主動(dòng)復(fù)制一份分成兩股并分別寫(xiě)到各個(gè)硬盤(pán)上面,兩個(gè)硬盤(pán)上面的內(nèi)容一模一樣。RAID1的特點(diǎn)就是磁盤(pán)容量一半在用,另一半備份,當(dāng)其中一個(gè)硬盤(pán)故障時(shí)數(shù)據(jù)依然完整,不影響系統(tǒng)的運(yùn)行[4]。此時(shí)插入一個(gè)新的硬盤(pán)后就可以進(jìn)行數(shù)據(jù)重建。即RAID1最多允許1個(gè)硬盤(pán)故障,對(duì)于安全第一的空管行業(yè)而言,在塔臺(tái)自動(dòng)化系統(tǒng)上使用RAID1可以有效提高系統(tǒng)的安全保障級(jí)別。目前湛江空管站塔臺(tái)自動(dòng)化大部分對(duì)硬盤(pán)容量需求不高的終端、服務(wù)器所使用的就是RAID1。
RAID10,所謂的RAID1 0就是先讓兩個(gè)硬盤(pán)組成RAID1,這兩組RAID1再組成一個(gè)RAID0。如圖3所示,Disk A+Disk B 組成第一組RAID1,Disk C+Disk D 組成第二組RAID1,然后這兩組RAID1 再組成RAID0。這樣第一組或第二組RAID1中的一個(gè)硬盤(pán)故障了不影響數(shù)據(jù)的完整性,同時(shí)RAID的寫(xiě)入性能也得到的提升。
2 萊斯塔臺(tái)自動(dòng)化RAID配置
以萊斯的HP DL380為例,DL380的兩塊硬盤(pán)由陣列卡(HP Smart Array P408i-a SR Gen10)管理,在安裝一臺(tái)新主機(jī)時(shí)需要先設(shè)置陣列卡,將兩塊硬盤(pán)配置為RAID 1 模式,以保證系統(tǒng)運(yùn)行的可靠性。具體步驟如下:
1)在主機(jī)開(kāi)機(jī)引導(dǎo)的過(guò)程中,關(guān)注屏幕打印,當(dāng)屏幕下方看到如圖4 畫(huà)面時(shí),及時(shí)按下“F9”,按下F9 后,進(jìn)入System Utilities 設(shè)置界面,然后選擇Systemconfiguration進(jìn)入系統(tǒng)配置界面[5]。
2)在系統(tǒng)配置界面選擇“Embedded RAID1:Smart Array P408i-a SR Gen10”進(jìn)入到陣列卡配置界面如圖5所示:
3)在陣列卡配置界面選擇“Array Configuration”,然后勾選需要?jiǎng)?chuàng)建RAID的兩塊硬盤(pán),選擇“Proceedto next From”回車然后再設(shè)置RAID級(jí)別為RAID1。
4)設(shè)置完成RAID 級(jí)別后點(diǎn)擊“Proceed to nextFrom”進(jìn)入如圖7 所示的確認(rèn)界面,點(diǎn)擊“SubmitChanges”然后保存配置并重啟即可完成RAID1 的配置。
3 惠普SSACLI 陣列管理工具
SSACLI是HP為L(zhǎng)inux環(huán)境提供的一個(gè)磁盤(pán)管理工具,通過(guò)此工具,維護(hù)人員可以查看陣列的健康狀態(tài);配置RAID 陣列以及手動(dòng)重建數(shù)據(jù)等一系列的操作。
3.1 安裝SSACLI 陣列管理工具
首先將SSACLI管理工具拷貝至萊斯系統(tǒng)的home 目錄下,然后進(jìn)入超級(jí)用戶,輸入以下命令進(jìn)行安裝:“rmp -ivh SSACLI-4.21-7.0.x86_64.rpm”[6]。如圖8 所示:
3.2 SSACLI 排查故障應(yīng)用分析
湛江空管站萊斯塔臺(tái)自動(dòng)化EFS0所采用的機(jī)器是HP Z4 陣列卡采用的為MSCC 的SmartHBA 2000-4i4e。值班室在2022年的年維護(hù)中錯(cuò)誤將其中一塊硬盤(pán)接到EFS0主板的sata線而非陣列卡上進(jìn)行啟動(dòng),導(dǎo)致監(jiān)控上有告警。值班員誤以為該硬盤(pán)發(fā)生故障,將有告警的硬盤(pán)用一塊同型號(hào)但非全新的硬盤(pán)替換,并接回陣列卡上。開(kāi)機(jī)發(fā)現(xiàn)換上的新硬盤(pán)可以正常識(shí)別,但故障硬盤(pán)信息仍在而且數(shù)據(jù)無(wú)法自動(dòng)重建。如圖9所示:
進(jìn)入SSACLI 管理界面輸入“ctrl slot=5 pd allshow”命令來(lái)查看陣列的硬盤(pán)狀態(tài)信息,經(jīng)過(guò)分析發(fā)現(xiàn),故障硬盤(pán)信息顯示成unknown且未自動(dòng)從陣列清除,導(dǎo)致新?lián)Q上的硬盤(pán)能夠正常識(shí)別硬盤(pán),但是無(wú)法自動(dòng)加入RAID1 的磁盤(pán)陣列,從而導(dǎo)致數(shù)據(jù)無(wú)法重建。
如圖11所示將原硬盤(pán)正確接入陣列卡后通過(guò)下列命令操作可以在不丟失數(shù)據(jù)的情況下將陣列信息恢復(fù)。
1)通過(guò)SSACLI命令進(jìn)入到SSACLI管理界面;
2)輸入“ctrl slot=5 ld all show”命令查看該陣列的邏輯磁盤(pán)信息;
3)輸入“ctrl slot=5 array A delete”命令來(lái)刪除RAID1陣列信息;
4)輸入“ctrl slot=5 pd all show”命令發(fā)現(xiàn)故障硬盤(pán)信息已經(jīng)消失;
5)輸入“ctrl slot=5 create type=ld driver=cn0:1:1-cn0:1:2 RAID=1”重新創(chuàng)建RAID1陣列;
6)輸入“ctrl slot=5 pd all show”命令發(fā)現(xiàn)陣列已成功創(chuàng)建;
7)重啟后監(jiān)控恢復(fù)正常,再次通過(guò)“ctrl slot=5 pdall show”命令檢查陣列情況,發(fā)現(xiàn)陣列已經(jīng)恢復(fù),如圖12所示:監(jiān)控告警消失且經(jīng)檢查系統(tǒng)數(shù)據(jù)未發(fā)生任何丟失。
4 結(jié)束語(yǔ)
本文介紹了常見(jiàn)的RAID種類及作用,以及在湛江空管站萊斯塔臺(tái)自動(dòng)化上的配置方法和通過(guò)SSACLI陣列管理工具解決運(yùn)行過(guò)程中遇到的問(wèn)題的案例分析。為RAID如何在終端、服務(wù)器配置安裝提供了一個(gè)參考方法。湛江空管站萊斯塔臺(tái)自動(dòng)化系統(tǒng)的各服務(wù)器及終端均配置了RAID1,對(duì)于日志服務(wù)器等配置了RAID1+RAID5,由2022年3月24日正式轉(zhuǎn)場(chǎng)使用至截稿日期,共發(fā)生2起硬盤(pán)故障事件,但兩起故障發(fā)生過(guò)程中均未造成過(guò)任何因硬盤(pán)故障導(dǎo)致的數(shù)據(jù)丟失情況。證明RAID1能夠正常有效地提高系統(tǒng)的保障級(jí)別。
對(duì)于空管行業(yè)而言,安全始終是放在第一位的。服務(wù)器和終端配置RAID1 是大勢(shì)所趨,因?yàn)榕渲肦AID1可以極大地提高安全保障等級(jí),有效地減少因設(shè)備原因?qū)е碌牟话踩录踔潦鞘鹿实陌l(fā)生。