曹若愚
摘要:THALES自動化系統(tǒng)是民航空管行業(yè)目前廣泛應(yīng)用的空管自動化系統(tǒng),該自動化系統(tǒng)以THALIX為操作系統(tǒng)。目前北京THALES自動化系統(tǒng)應(yīng)用THALIX 11.1版本,并搭配eHCT裝機工具,對系統(tǒng)節(jié)點實施操作系統(tǒng)安裝。本文將分析THALIX11.1操作系統(tǒng)安裝流程中的各個環(huán)節(jié)及配置,并結(jié)合具體案例分析安裝異常情況,以期加深對THALES自動化系統(tǒng)安裝的理解,豐富排故手段。
關(guān)鍵詞:THALES自動化系統(tǒng);THALIX操作系統(tǒng);無人值守安裝
中圖分類號:TP393
文獻標識碼:A
文章編號:1009-3044(2020)04-0200-02
收稿日期:2019-11-02
THALES自動化系統(tǒng)以THALIX為操作系統(tǒng),THALIX操作系統(tǒng)是基于LINUX開發(fā)而成,搭載Eurocat-X軟件,該系統(tǒng)涉及網(wǎng)絡(luò)復(fù)雜,節(jié)點類型多,不同節(jié)點配置不同。目前北京THALES自動化系統(tǒng)應(yīng)用THALIX11.1版本,并搭配eHCT裝機工具,對THALES系統(tǒng)節(jié)點實施操作系統(tǒng)安裝。
1 THALIX11.1安裝過程分析
1.1 利用裝機USB引導(dǎo)
北京現(xiàn)場目前以DBM節(jié)點為eHCTServer,Server端部署eHCT工具及其相關(guān)腳本、系統(tǒng)RPM包、配置等。引導(dǎo)USB中.主要有g(shù)rub引導(dǎo)內(nèi)核程序,及vmlinuz、initrd.img文件。設(shè)置主機USB優(yōu)先啟動后,USB中的grub.conf文件定義了引導(dǎo)內(nèi)容,設(shè)置kernel路徑及initrd鏡像文件路徑,通過vmlinuz內(nèi)核文件及initrd鏡像文件,進人操作系統(tǒng)安裝進程。
1.2 通過DHCP服務(wù)為節(jié)點分配IP地址
所要安裝的節(jié)點為eHCTClient,DBM節(jié)點為eHCTServer,Client會通過eth0網(wǎng)口(S網(wǎng))廣播DHCP Discover 消息,請求包中包含Client節(jié)點的MAC地址。Server收到Client的請求消息后,會在eHCTdatabase中找到MAC地址對應(yīng)的主機名及IP地址,發(fā)送DHCPOffer消息廣播。Client從接收到的第一個DHCPOf-fer消息中選擇IP地址,而后通過DHCPRequest消息廣播到所有DHCPServer,表示接受提供的內(nèi)容。最后,Server通過DHC-PAck消息廣播,表示成功確認,消息中包含根據(jù)dhepd.conf提供的租約期限及其他配置信息等。至此,ClientIP地址分配完畢。
1.3 通過NFS從eHCTServer下載kickstart文件
網(wǎng)絡(luò)文件系統(tǒng)(NFS),允許網(wǎng)絡(luò)中的計算機之間通過TCP/IP協(xié)議網(wǎng)絡(luò)共享資源。本地NFS客戶端可以讀寫位于遠端NFS服務(wù)器上的文件。
kickstart是一種無人值守的操作系統(tǒng)安裝方式,它的工作原理是在安裝過程中將需要人工干預(yù)填寫的各種參數(shù)生成在kickstart文件。在安裝過程中,出現(xiàn)需要填寫參數(shù)的情況,安裝程序會按照kickstart文件中的設(shè)置執(zhí)行,通過這種方式,達到減少人工干預(yù)的效果。
THALIX11.1操作系統(tǒng)安裝kickstart文件存放于eHCT-Server服務(wù)器,即DBM,/ehet_data/built/BETM_ER/11.1/kickstart中,文件夾中含有不同節(jié)點IP對應(yīng)的kickstart文件。被安裝節(jié)點通過網(wǎng)絡(luò)找到對應(yīng)自己IP的kickstart文件,按照文件中設(shè)置執(zhí)行操作系統(tǒng)安裝過程。
1.4 執(zhí)行kickstart文件中設(shè)置內(nèi)容
kickstart文件可分為三段,命令段、軟件包段、腳本段。命令段用來配置鍵盤類型、語言、安裝方式等系統(tǒng)配置。軟件包段用來指定安裝或不安裝的包組,腳本段指定安裝系統(tǒng)前執(zhí)行的命令或腳本或安裝系統(tǒng)后執(zhí)行的命令或腳本。THALIX11.1的kickstart文件命令段主要為設(shè)置硬盤、語言、鼠標、時區(qū)等。軟件包段主要為安裝THALIX基礎(chǔ)包,配置硬盤、dhep等。腳本段主要為配置NFS,傳輸共享文件,檢查硬件等。
通過kickstart文件,可以完成所裝節(jié)點操作系統(tǒng)基本設(shè)置、節(jié)點網(wǎng)絡(luò)設(shè)置、DHCP/NFS設(shè)置,硬件檢查、硬盤分區(qū)、THALIX安裝包傳輸安裝、節(jié)點啟動設(shè)置等。
2 安裝異常案例分析
2.1 U盤引導(dǎo)進入安裝界面后,提示ERROR:getFileFromNfs:noactivenetworkdevices
1)安裝節(jié)點eth0網(wǎng)口異常
THALIX操作系統(tǒng)安裝默認通過eth0網(wǎng)口安裝,即S網(wǎng)網(wǎng)口,需確保網(wǎng)線質(zhì)量正常,網(wǎng)線連接正確。檢查硬件連接無誤后,查看安裝節(jié)點的eth0網(wǎng)口是否正常啟動。登錄root用戶,輸入指令servicenetworkstatus,查看確認eth0是否激活。或通過ifconfig-a查看所有網(wǎng)口配置及運行狀態(tài),是否處于RUN-NING狀態(tài)。
如有必要,按需要打開或重啟eth0網(wǎng)口,root用戶輸入指令,ifdowneth0,或ifupeth0。也可通過service network restart 重啟網(wǎng)絡(luò)服務(wù)。
eHCTServer(即DBM節(jié)點)端排查思路相同。
2)eth0網(wǎng)口MAC地址配置錯誤
目前,北京所用版本DBM中eHCTdatabase配置文件所在位置為/ehct_data/database/BETM_BJ_ER/11.1/Database_HDMT,文件中包含所有系統(tǒng)節(jié)點MAC地址配置,IP配置,網(wǎng)絡(luò)配置,機型配置,時鐘配置等。MAC地址配置文件為目錄下mac.hes,文件內(nèi)容為現(xiàn)場所有節(jié)點名及其對應(yīng)的MAC地址。
修改文件方法有兩種,一種是通過CS裝機工具。北京現(xiàn)場CS裝機工具在DBM節(jié)點,/usr/local/ehet/Server/bin下。CS裝機工具具有可視化界面工具,通過選擇需安裝節(jié)點的節(jié)點名,并輸入對應(yīng)的MAC地址實現(xiàn)修改。但是此種方法只能同時安裝一臺節(jié)點,無法批量安裝多臺節(jié)點。
第二種方法是直接修改mac.hes,可以一次修改多個節(jié)點對應(yīng)的MAC地址,實現(xiàn)批量安裝。此種方法與第一種方法原理相同,不同之處在于第一種方法修改后,無須人工干預(yù),自動執(zhí)行build_platform。而第二種方法手動修改mac.hes后,需手動執(zhí)行build_platform.sh 腳本,以進行相關(guān)全局數(shù)據(jù)、配置文件及環(huán)境變量的統(tǒng)一修改生效。如果沒有執(zhí)行build_platform,即使修改了mac.hes文件,也無法進行正常裝機操作。
2.2 DHCP/NFS服務(wù)異常
當eHCTServer端DHCP或NFS服務(wù)異常時,無法執(zhí)行正常安裝??赏ㄟ^觀察裝機時節(jié)點啟動報錯排查是否由于DHCP/NFS服務(wù)異常導(dǎo)致。在裝機過程中,界面會實時有裝機執(zhí)行的相關(guān)提示,如有DHCP/NFS異常報錯,則可能為相關(guān)服務(wù)未開。也可以通過eHCTServer,即DBM節(jié)點上的/var/log/mesage 文件查看報錯信息。
DHCP及NFS是THALIX操作系統(tǒng)中的重要服務(wù)??梢酝ㄟ^root用戶運行servicedhepdstatus查看DHCP服務(wù)運行狀態(tài),servicenfsstatus查看NFS服務(wù)運行狀態(tài)。如有需要,可通過service dhepd start/service dhepd restart 啟動或重啟DHCP服務(wù),se-vicenfs start/service nfs restart啟動或重啟NFS服務(wù)。
2.3 需安裝節(jié)點機型與eHCT數(shù)據(jù)庫中不匹配
在eHCT數(shù)據(jù)配置中,不同的節(jié)點機型在安裝操作系統(tǒng)時會有部分差異,如果數(shù)據(jù)配置中該節(jié)點使用的機型與實際安裝:的機型不相符,則會在安裝過程中產(chǎn)生異常。一般在批量安裝前,須確認節(jié)點機型,并配置在eHCT數(shù)據(jù)中生效。在安裝操作系統(tǒng)過程中,出現(xiàn)硬件匹配相關(guān)告警,可能為機型不匹配,需要.檢查有關(guān)節(jié)點機型的eHCT配置數(shù)據(jù)是否一致。節(jié)點的所有機型,都提前配置在eHCT數(shù)據(jù)庫中的machine_types文件夾中,文件夾的路徑是/ehct_data/database/BETM_BJ_ER/11.1/ma-chine_types,在其內(nèi)有系統(tǒng)內(nèi)所有節(jié)點的機型。eHCT配置中涉及機型的配置文件是hosts_linux.hes 及nodes_linux.hes。這兩個文件中對應(yīng)節(jié)點的機型需要在machine_types 中定義好,與實際安裝的節(jié)點類型匹配,如果未匹配,則會在裝機過程中產(chǎn)生硬件識別錯誤相關(guān)的告警,如上圖中所示pci號識別錯誤等。
3 結(jié)束語
THALIX操作系統(tǒng)安裝過程中,涉及技術(shù)原理較多。本文通過分析安裝環(huán)節(jié)中的技術(shù)原理,并結(jié)合工作實際中常見的安裝異常排故,將安裝過程中的常發(fā)異常與技術(shù)原理結(jié)合起來,希望對THALIX操作系統(tǒng)安裝有更清晰的認識及思路。
參考文獻:
[1]蔣增恒.THALIX操作系統(tǒng)網(wǎng)絡(luò)安裝服務(wù)原理分析[J].空中交通,2016(3):65.
[2]王興隆,劉衛(wèi)香.基于故障樹的空管自動化系統(tǒng)分析[J].航空計算技術(shù),2009,39(3):18-21,33.
[3]林安.空管自動化系統(tǒng)應(yīng)用與維護技術(shù)分析[J].中國新通信,2019,21(7):92-93.
[通聯(lián)編輯:光文玲]