趙子杰,李成文,豐生磊
(航空工業(yè)西安航空計算技術研究所 陜西 西安 710065)
隨著航空技術和電子集成技術的飛速發(fā)展,對新一代高性能飛機核心處理平臺的綜合水平、計算能力、資源管理、系統(tǒng)調度等方面的要求變得越來越高。 多核實時并行處理平臺就是面向新一代高性能飛機復雜多功能任務計算需求而設計的,旨在解決新一代綜合核心處理系統(tǒng)高性能計算、多核并行處理、實時任務調度等核心瓶頸問題。多核實時并行處理平臺承擔新一代高性能飛機的綜合化航空電子系統(tǒng)的綜合管理等功能,可完成航電系統(tǒng)數(shù)據(jù)處理、信號處理、圖形/圖像處理、系統(tǒng)數(shù)據(jù)管理以及整個航電系統(tǒng)管理。 本文提出了多核實時并行處理平臺總體和軟件的設計。
處理平臺與飛機航電系統(tǒng)交聯(lián)圖如圖1 所示。 整個計算平臺包括信號處理單元、圖像處理單元、數(shù)據(jù)處理單元、網(wǎng)絡交換單元、遠程接口單元以及數(shù)據(jù)管理單元,該平臺完成航電系統(tǒng)數(shù)據(jù)處理、信號處理、圖形/圖像處理、系統(tǒng)數(shù)據(jù)管理以及整個航電系統(tǒng)管理。 數(shù)據(jù)處理單元提供高性能數(shù)據(jù)處理能力[1],完成任務系統(tǒng)數(shù)據(jù)處理和系統(tǒng)管理;網(wǎng)絡交換單元實現(xiàn)余度光纖網(wǎng)絡交換,并在環(huán)控系統(tǒng)失效時,提供基本計算能力,完成導航計算等最基本的航電功能;圖像處理單元完成圖像的處理,并通過接口驅動顯示器和頭盔;數(shù)據(jù)管理單元存儲航電系統(tǒng)參數(shù)、故障信息,記錄飛行視頻,并支持在地面狀態(tài)下的數(shù)據(jù)下載操作。系統(tǒng)采用統(tǒng)一光纖通道(fiber channel, FC)技術,用于前端傳感器信息、控制命令和中間計算數(shù)據(jù)以及視頻信息的傳輸。
圖1 處理平臺與飛機航電系統(tǒng)交聯(lián)圖
處理平臺體系結構包括數(shù)據(jù)處理單元、網(wǎng)絡交換單元、圖像處理單元。 組成模塊及單元如表1 所示。
表1 處理平臺組成模塊名稱、數(shù)量
數(shù)據(jù)處理單元提供高性能數(shù)據(jù)處理能力,完成任務系統(tǒng)數(shù)據(jù)處理和系統(tǒng)管理規(guī)定。
網(wǎng)絡交換單元提供可完成系統(tǒng)管理和導航解算的最基本計算能力,該單元采用自然散熱和28 V 應急供電,確保在環(huán)控系統(tǒng)故障或270 V 供電故障時,飛機航電系統(tǒng)頂層FC 通信網(wǎng)絡可用,系統(tǒng)具有最基本的計算能力,保證飛機安全返航。
圖像處理單元通過該接口接收系統(tǒng)管理命令,進行威脅告警。 該單元采用正常供電。
飛機電源系統(tǒng)正常供電時,處理平臺完成系統(tǒng)定義的所有功能。
在應急工作模式下,僅保證系統(tǒng)最小資源集工作,最小資源包括兩個光纖網(wǎng)絡模塊、承擔系統(tǒng)管理及導航計算任務的兩個低功耗GPPM 模塊,保證飛機正常飛行、安全返回至地面。
供電網(wǎng)絡可分為兩個層次,即飛機層和處理平臺層。
飛機層供電系統(tǒng)提供在正常工作狀態(tài)下使用的270 V 和在應急狀態(tài)使用的28 V。 當飛機供電系統(tǒng)的270 V故障時,由28 V 應急電源供電。 處理平臺系統(tǒng)進入應急狀態(tài),處理平臺層供電網(wǎng)絡僅保證網(wǎng)絡交換單元供電。
處理平臺層供電網(wǎng)絡由兩個PSM 組成。 當兩個PSM都正常運行時,兩個PSM 同時輸出為所有其他模塊供電。當一個PSM 故障時自動關閉輸出,由另一個PSM 為所有其他模塊供電。 故障PSM 發(fā)出電源故障信號,系統(tǒng)管理者記錄故障信息用于模塊地面維護。
處理平臺系統(tǒng)管理負責控制和管理處理平臺的運行和狀態(tài)轉換,負責從系統(tǒng)初始化、運行到系統(tǒng)關機的整個過程。 此外,處理平臺系統(tǒng)管理還負責航電系統(tǒng)其他任務設備的管理。
處理平臺系統(tǒng)中故障處理模式分為備份重構和系統(tǒng)降級重構。
(1)備份重構:用功能等同的備份模塊替代失效模塊,通過在備份模塊上重新運行失效模塊的軟件來實現(xiàn),該類處理沒有任何功能損失,該種處理操作較簡單。
(2)系統(tǒng)降級重構:降級處理是指當不能保證備份處理有效的情況下而進行的處理操作。 系統(tǒng)降級處理將保證高優(yōu)先功能。 在該情況下,將考慮航空電子系統(tǒng)各任務的優(yōu)先級,進行優(yōu)先級仲裁操作,重新分配低優(yōu)先級功能所用模塊以保證高優(yōu)先級功能。
處理平臺有3 種類型的時間:
(1)絕對全局時間(average generation time, AGT):提供當?shù)貢r區(qū)的年、月、日、小時、分、秒、毫秒的日歷時間。該時間可以通過全球定位系統(tǒng)(global positioning system,GPS)、數(shù)據(jù)鏈或手工授時給處理平臺。
(2)絕對本地時間(local date time, ALT):是航電系統(tǒng)中的系統(tǒng)參考時間,比AGT 的分辨率高,用于處理平臺內部任務間的同步。 在處理平臺系統(tǒng)中,由系統(tǒng)中唯一的參考時間源維護。 它需要在整個系統(tǒng)中同步。
(3)相對本地時間(relative retention time,RRT):是模塊的本地時間,有比AGT 和ALT 高的分辨率,用于分區(qū)、進程的同步和調度。
處理平臺提供數(shù)據(jù)通信功能[2]和網(wǎng)絡管理等功能,具體包括:
(1)網(wǎng)絡信息維護與交互:通過對網(wǎng)絡信息的收集與交互判斷網(wǎng)絡及系統(tǒng)當前的運行狀態(tài),提交給管理者作為決策依據(jù)。
(2)網(wǎng)絡控制權獲取:系統(tǒng)上電后,網(wǎng)絡管理器及備份網(wǎng)絡管理器進行網(wǎng)絡控制權獲??;當網(wǎng)絡管理器失效時,備份網(wǎng)絡管理器會進行網(wǎng)絡主控權的獲取。
(3)網(wǎng)絡運行方案加載/切換:網(wǎng)絡運行方案包括網(wǎng)絡拓撲和網(wǎng)絡消息規(guī)劃信息;在網(wǎng)絡初始化過程中,需要進行網(wǎng)絡運行方案的加載;在網(wǎng)絡運行過程中,有可能需要進行網(wǎng)絡運行方案的切換。
(4)健康監(jiān)控與故障管理:進行本地的錯誤狀態(tài)統(tǒng)計與監(jiān)控。
任務區(qū)域PHM 是任務成員PHM 和飛機級PHM 之間的接口。 利用其系統(tǒng)底層的數(shù)據(jù)和信息,實現(xiàn)成員子系統(tǒng)/部件異常檢測、故障診斷以及關鍵部件的壽命預測等功能。
(1)任務區(qū)域PHM 通過狀態(tài)監(jiān)控,按照一定的預置觸發(fā)條件,通過異常檢測、故障檢測、征兆檢測等方法,捕獲并存儲來自成員子系統(tǒng)/部件的異常信息、故障信息、征兆信息以及相關的狀態(tài)信息、飛行參數(shù)、環(huán)境信息等。
(2)任務區(qū)域PHM 把上述各種信息進行相關聯(lián)以解決各種數(shù)據(jù)的不一致性,通過對上述成員級PHM 結果進行關聯(lián)融合完成故障診斷。
(3)任務區(qū)域PHM 結合其他相關信息,通過算法分析和模型推理,進行預測推理。
(4)任務區(qū)域PHM 將確認后的異常、故障及確認/修正后的預測信息提交給區(qū)域級綜合評估模塊及飛機級的報告過濾模塊,并予以存儲。
(5)在異常檢測、故障診斷、預測推理的基礎上完成任務區(qū)域的綜合健康狀態(tài)評估。
處理平臺的數(shù)據(jù)存儲管理運行在地面加載狀態(tài),數(shù)據(jù)存儲管理通過比較各模塊上的數(shù)據(jù)和數(shù)據(jù)管理系統(tǒng)中保存的數(shù)據(jù)/映像的版本信息,將數(shù)據(jù)管理系統(tǒng)中最新的數(shù)據(jù)/映像加載到各模塊上。
數(shù)據(jù)管理系統(tǒng)中存儲處理平臺的相關數(shù)據(jù)庫及文件系統(tǒng)提供兩種數(shù)據(jù)擦除方法:第一是直接燒毀存儲器,通過外部毀鑰信號直接觸發(fā),第二是閃存(FLASH)扇區(qū)擦除方法,通過外部命令觸發(fā)。 數(shù)據(jù)管理系統(tǒng)采用直接燒毀存儲器方法,其他模塊采用FLASH 扇區(qū)擦除方法。
處理平臺的模塊可接收從數(shù)據(jù)管理分系統(tǒng)加載的數(shù)據(jù)庫[3],并將數(shù)據(jù)向處理平臺模塊分發(fā),加載數(shù)據(jù)包括威脅數(shù)據(jù)庫、參數(shù)庫等。
在飛行過程中,處理平臺按照航電系統(tǒng)工作過程和任務流程,對航電系統(tǒng)、分系統(tǒng)設備的數(shù)據(jù)進行分類整理和存貯,并將數(shù)據(jù)傳送給數(shù)據(jù)管理分系統(tǒng)。 按照系統(tǒng)任務階段整理記錄,記錄數(shù)據(jù)按用途分為評估和故障分析兩類。任務邏輯流程數(shù)據(jù)包括飛行操作命令、系統(tǒng)對命令解釋、系統(tǒng)模式、對分系統(tǒng)控制命令和分系統(tǒng)響應等。 任務數(shù)據(jù)記錄包括傳感器輸入?yún)?shù)、任務解算的數(shù)據(jù)結果等。 按報故時間和故障等級對全機故障數(shù)據(jù)進行分類整理,同時按任務模式對相關故障分類整理。 通過系統(tǒng)時間以及系統(tǒng)邏輯流程對上述數(shù)據(jù)進行關聯(lián)。
處理平臺文件系統(tǒng)包括局部文件系統(tǒng)與遠程文件系統(tǒng)兩部分,遠程文件系統(tǒng)駐留在數(shù)據(jù)管理設備的存儲器中,局部文件系統(tǒng)駐留在處理平臺內各模塊。
處理平臺的容錯和冗余設計具體情況如下:
(1)FC 容錯設計:航電系統(tǒng)頂層光纖網(wǎng)絡為容錯網(wǎng)絡,每個網(wǎng)絡終端采用雙多址接入信道(multiple access channel, MAC)收發(fā),分別與兩個交換機相連,構成容錯星型網(wǎng)絡結構。
(2)集成電路總線網(wǎng)絡采用余度網(wǎng)絡設計:系統(tǒng)配置兩條集成電路總線,當一條故障時,使用另一條。
(3)視頻轉換容錯:在模塊內部實現(xiàn),內部交換開關采用冗余設計,當一個交換芯片/端口故障時,則關閉故障芯片/端口。
(4)電源冗余設計:處理平臺具有兩塊電源模塊,采用1+1 冗余供電結構。 正常工作時,由兩個并聯(lián)的PSM為系統(tǒng)供電,每個PSM 承擔系統(tǒng)中的一半負載,當其中一個PSM 模塊故障時,由另一塊PSM 模塊自動接替并獨立向整個系統(tǒng)供電。
(5)時間服務器冗余設計:系統(tǒng)采用4 種授時方式,包括全球定位系統(tǒng)(GPS)授時、數(shù)據(jù)鏈時鐘信號授時、物理計時器授時和人工授時。 只要系統(tǒng)中存在一個可用時間源,處理平臺時間服務器可正常工作;當一個時間服務器故障時,系統(tǒng)可使用處理平臺中另一個時間服務器。
(6)系統(tǒng)控制器冗余設計:處理平臺中的GPPM 均可作為系統(tǒng)控制器,系統(tǒng)包含主/從兩類系統(tǒng)器。 當當前主系統(tǒng)控制器故障時,模塊標識符比當前主控制器大1 的模塊可升級為主系統(tǒng)控制器,其余模塊認為是從系統(tǒng)控制器。 當數(shù)據(jù)處理單元故障時,網(wǎng)絡交換單元GPPM 成為系統(tǒng)控制器。
處理平臺軟件架構包括目標機執(zhí)行軟件和軟件開發(fā)支撐環(huán)境。 目標機執(zhí)行軟件運行在處理平臺中,分為操作系統(tǒng)段、I/O 服務段、平臺服務段、傳輸服務段、應用程序段。 軟件開發(fā)支撐環(huán)境運行在PC 機端,提供軟件開發(fā)輔助功能。
處理平臺開發(fā)環(huán)境包括基本調試工具與綜合支持工具兩部分。 基本調試工具支持應用軟件開發(fā)工作。 綜合支持工具支持處理平臺系統(tǒng)綜合人員進行子系統(tǒng)軟件的綜合調試,包括系統(tǒng)配置數(shù)據(jù)工具、分析工具、網(wǎng)絡配置工具。
處理平臺采用基于以太網(wǎng)絡的調試環(huán)境,用戶通過該網(wǎng)絡可調試任意模塊上運行的程序,觀察任一程序的輸出結果。
處理平臺采用實時操作系統(tǒng)(OS),其結構如圖2 所示,應用運行在應用分區(qū)中[4],每個應用分區(qū)包含一個分區(qū)OS。 每個分區(qū)OS 管理自己的進程/線程、信號量、庫以及內部的調度[5]。 分區(qū)OS 運行在用戶態(tài),它只能訪問自己的內存堆,不能直接訪問I/O 設備或者特權層的處理器資源,不能直接接收硬件中斷或異常。
圖2 操作系統(tǒng)結構示意圖
平臺服務段由系統(tǒng)管理、圖形圖像支持以及平臺設備管理構成,提供與平臺相關的系統(tǒng)服務。
處理平臺系統(tǒng)管理負責處理平臺從系統(tǒng)初始化、故障檢測、故障定位、故障隔離、故障處理、系統(tǒng)重構直到系統(tǒng)關機的管理,共分為兩級管理:處理平臺系統(tǒng)級是處理平臺內部的最高管理者,負責整個處理平臺系統(tǒng)的管理,管理和控制每一個RE 級;資源元素級負責一個處理單元的管理,負責資源和應用任務的控制和管理。
圖形圖像支持采用開放圖形庫OpenGL 規(guī)范,提供圖形/圖像處理功能,直接調用圖形圖像驅動。
平臺設備管理將系統(tǒng)平臺中的具體設備抽象為相應的設備對象,為應用程序段中的航電應用提供相應的服務。
傳輸服務段負責向平臺服務段、應用程序段中的各個軟件提供數(shù)據(jù)傳輸服務,平臺服務段和應用程序段中的軟件必須使用傳輸服務段提供傳輸服務接口與這兩個段中的其他軟件進行通信。
應用程序段由各類應用程序構成,根據(jù)其用途可分為通用服務軟件和航電應用軟件。
綜上所述,多核實時并行處理平臺承擔新一代高性能飛機的綜合化航空電子系統(tǒng)的系統(tǒng)綜合管理等功能。 該平臺由信號處理單元、圖像處理單元、數(shù)據(jù)處理單元、網(wǎng)絡交換單元以及數(shù)據(jù)管理單元組成。 數(shù)據(jù)處理單元提供高性能數(shù)據(jù)處理能力,完成任務系統(tǒng)數(shù)據(jù)處理和系統(tǒng)管理;網(wǎng)絡交換單元實現(xiàn)余度交換,并在環(huán)控系統(tǒng)失效時,提供基本計算能力,完成導航計算等最基本的航電功能;圖像處理單元完成服務器附加存儲、電子光學瞄準系統(tǒng)以及逐次逼近式模擬數(shù)字轉換器圖像的處理,并通過接口驅動顯示器和頭盔;數(shù)據(jù)管理單元存儲航電系統(tǒng)參數(shù)、故障信息,記錄飛行視頻,并支持在地面狀態(tài)下的數(shù)據(jù)下載操作。