王鈞慧,劉愛平,肖小兵
(中國西南電子技術(shù)研究所,成都610036)
裝備健康管理是隨著故障診斷技術(shù)的進步而發(fā)展起來的,其內(nèi)涵是通過分析裝備健康狀態(tài)的影響因素,緊密結(jié)合狀態(tài)監(jiān)測、維修、使用和環(huán)境等信息,對裝備健康狀態(tài)進行評估和預(yù)測,并基于裝備的健康狀態(tài)合理選擇維修策略,周密計劃維修活動。
近年來國內(nèi)外學(xué)者針對健康管理開展了大量工作并取得了豐碩的研究成果。Wang等人[1]提出了基于面向服務(wù)架構(gòu)(Service Oriented Architecture,SOA)和雙總線技術(shù)的健康管理軟件體系架構(gòu),實現(xiàn)了民用飛機的健康管理功能。Zhang等人[2]對大數(shù)據(jù)收集、清理、存儲和分析等內(nèi)容進行了完整的描述,提出了一種基于大數(shù)據(jù)開源軟件框架來實現(xiàn)航天器健康管理的方法。Li等人[3]針對衛(wèi)星星座網(wǎng)絡(luò)的健康管理方法,提出了衛(wèi)星星座網(wǎng)絡(luò)建模方法,根據(jù)節(jié)點重要性評估算法來尋找網(wǎng)絡(luò)中的關(guān)鍵節(jié)點,并根據(jù)實時運行狀態(tài)對衛(wèi)星星座網(wǎng)絡(luò)的健康狀態(tài)進行評估。Orsagh等人[4]針對航空電子設(shè)備中開關(guān)模式電源和GPS接收機兩種設(shè)備,利用數(shù)據(jù)進行模型訓(xùn)練實現(xiàn)了對設(shè)備壽命和故障的預(yù)測。黃鶴等人[5]設(shè)計了一種航空電子系統(tǒng)的健康管理體系,并對基于測試性模型的多信號增強診斷和基于馬爾科夫及貝葉斯網(wǎng)絡(luò)的健康評估方法進行了詳細論述。高洪青[6]從有源相控陣雷達的狀態(tài)監(jiān)測與健康管理入手,構(gòu)建了分層式健康管理系統(tǒng)框架,根據(jù)作用距離和副瓣電平等指標(biāo)進行了信息融合和健康評估,實現(xiàn)了有源相控陣雷達的狀態(tài)監(jiān)測和健康管理。何謙等人[7]針對S頻段統(tǒng)一測控系統(tǒng)故障診斷及健康管理的需求給出了故障診斷軟件體系架構(gòu),并基于故障樹的設(shè)備故障診斷開展了設(shè)備狀態(tài)評估設(shè)計。楊羅蘭等人[8]在經(jīng)典測控系統(tǒng)故障識別和預(yù)測技術(shù)的基礎(chǔ)之上,針對測控系統(tǒng)關(guān)鍵指標(biāo)預(yù)測的問題,探索了基于歷史數(shù)據(jù)的指標(biāo)預(yù)測方法,并對基于SVR的單步和多步指標(biāo)預(yù)測方法進行了具體分析。孫寶升等人[9]基于中繼衛(wèi)星S頻段多址(S-band Multiple Access,SMA)全景波束支持本文提出了一種中低軌衛(wèi)星在軌健康管理的新概念和模式。王儲等人[10]對故障預(yù)測與健康管理(Prognostic and Health Management,PHM)的相關(guān)概念、國內(nèi)外發(fā)展現(xiàn)狀以及關(guān)鍵技術(shù)進行了簡要介紹,并結(jié)合測控系統(tǒng)的發(fā)展現(xiàn)狀提出了針對該領(lǐng)域的PHM技術(shù)的研究方法和具體實施策略。魏永峰等人[11]以某型雷達抗干擾測試系統(tǒng)為例,闡述了可應(yīng)用于測控裝備故障預(yù)測與健康管理的一種科學(xué)管理方法,提出基于模型的PHM技術(shù)在抗干擾測試系統(tǒng)中應(yīng)用?;谝暻榫S修的開放體系(Open System Architecture for Condition Based Maintenance,OSA-CBM)架構(gòu)在航電、動車組等應(yīng)用場景已經(jīng)進行了應(yīng)用[12-13],該架構(gòu)對航天測控數(shù)傳一體化系統(tǒng)健康管理系統(tǒng)設(shè)計也有很強的指導(dǎo)意義。
本文提出了一種適用于航天測控數(shù)傳一體化系統(tǒng)的健康管理設(shè)計方法,包括系統(tǒng)工作模式、組成、軟件體系架構(gòu)、主要業(yè)務(wù)流程和關(guān)鍵技術(shù)解決方法。
本系統(tǒng)采用在線診斷和離線診斷兩種手段來完成全系統(tǒng)健康管理。系統(tǒng)工作模式如圖1所示。
圖1 系統(tǒng)工作模式示意圖
在線診斷是通過設(shè)備在線診斷和業(yè)務(wù)在線評估兩個手段來實現(xiàn)。設(shè)備在線診斷是指結(jié)合系統(tǒng)/設(shè)備故障樹模型、故障傳導(dǎo)模型和規(guī)則知識,識別虛警,確定設(shè)備故障。通過故障樹分析和專家系統(tǒng)規(guī)則引擎進行邏輯推理,定位真實故障設(shè)備,確定故障原因。業(yè)務(wù)在線評估是指通過業(yè)務(wù)運行數(shù)據(jù)感知設(shè)備缺陷,反證設(shè)備健康狀態(tài);建立業(yè)務(wù)健康度曲線,降低業(yè)務(wù)健康評估復(fù)雜度。系統(tǒng)運行時,將能夠反映系統(tǒng)和業(yè)務(wù)狀態(tài)的多維度信號/數(shù)據(jù)特征與業(yè)務(wù)健康模型對比后進行多維特征融合,降維形成健康度曲線,對業(yè)務(wù)狀態(tài)進行直觀展示和評價;關(guān)注健康曲線劇烈波動時刻的瞬時系統(tǒng),為后續(xù)離線分析提供參考輸入。
離線診斷是指綜合利用系統(tǒng)全域全景數(shù)據(jù)和在線關(guān)注的業(yè)務(wù)異常數(shù)據(jù),結(jié)合健康模型、專家知識和分析算法,在大量數(shù)據(jù)中分析設(shè)備運行規(guī)律,提取設(shè)備故障特征信號,發(fā)現(xiàn)、識別、確認設(shè)備故障和缺陷,必要時輔以主動式診斷(標(biāo)校測試)協(xié)助分析。故障預(yù)測的方法主要有兩類:一是基于失效物理模型的故障預(yù)測技術(shù);二是基于數(shù)據(jù)驅(qū)動的故障預(yù)測技術(shù)。航天測運控裝備中存在大量的電子設(shè)備,失效物理模型建立的難度較高,建議采用基于數(shù)據(jù)驅(qū)動的故障預(yù)測技術(shù)。航天測運控裝備中大量的數(shù)據(jù)都屬于帶時間標(biāo)簽的數(shù)據(jù),比如設(shè)備運行狀態(tài)、測試數(shù)據(jù)、標(biāo)校數(shù)據(jù)和環(huán)境數(shù)據(jù)等內(nèi)容,因此可采用InfluxDB、Kdb+等時序數(shù)據(jù)庫來進行數(shù)據(jù)存儲。為了獲取足夠多的數(shù)據(jù),建議健康管理采用“中心+端”的模式,由中心獲取多套航天測控數(shù)傳一體化系統(tǒng)的運行數(shù)據(jù),通過機器學(xué)習(xí)算法完成模型訓(xùn)練;中心將訓(xùn)練好的模型下發(fā)給設(shè)備端,設(shè)備端根據(jù)模型完成實時故障預(yù)測。
如圖2所示,健康管理系統(tǒng)包含測控數(shù)傳設(shè)備、監(jiān)控分系統(tǒng)、健康管理軟件及信息庫等。
圖2 健康管理系統(tǒng)組成
(1)測控數(shù)傳設(shè)備
包括各個分系統(tǒng)的可監(jiān)控單元,設(shè)備主要是利用內(nèi)置的傳感器進行健康狀態(tài)信息采集并上報監(jiān)控分系統(tǒng)。健康管理數(shù)據(jù)傳輸網(wǎng)絡(luò)可共用現(xiàn)有的監(jiān)控網(wǎng),無需單獨建設(shè)。
(2)監(jiān)控分系統(tǒng)
定時獲取各設(shè)備的健康狀態(tài)信息,實時將設(shè)備健康狀態(tài)信息寫入狀態(tài)庫;監(jiān)控分系統(tǒng)同時接收測控數(shù)傳任務(wù)運行狀態(tài)并進行記錄;監(jiān)控分系統(tǒng)接收健康管理的要求完成相關(guān)的測試標(biāo)校工作。
(3)健康管理軟件
健康管理軟件主要包括信息采集服務(wù)、數(shù)據(jù)預(yù)處理服務(wù)、故障診斷服務(wù)、健康狀態(tài)評估服務(wù)、預(yù)測分析服務(wù)、狀態(tài)維護服務(wù)等。各個服務(wù)密切配合完成健康管理的相關(guān)功能;
(4)信息庫
主要包括狀態(tài)庫、裝備庫和知識庫。狀態(tài)庫可根據(jù)數(shù)據(jù)特點選用關(guān)系型數(shù)據(jù)庫或者大數(shù)據(jù)平臺,主要完成設(shè)備健康狀態(tài)、任務(wù)狀態(tài)、測試標(biāo)校結(jié)果等各類信息;裝備庫主要保存設(shè)備關(guān)鍵信息、設(shè)備健康狀態(tài)、預(yù)測狀態(tài)等內(nèi)容;知識庫主要包括健康管理各服務(wù)所需要的知識,包括故障診斷知識、健康評估知識和預(yù)測分析知識。
如圖3所示,健康管理流程通過如下三種方式來觸發(fā)啟動:第一種方式為健康管理軟件接收到設(shè)備狀態(tài)異常消息;第二種方式為健康管理軟件接收到任務(wù)結(jié)束消息;第三種方式為健康管理軟件根據(jù)日常維護計劃通過時間符合方式來觸發(fā)。
健康診斷處理核心思想是模擬專業(yè)操作維護人員對設(shè)備問題解決的思維方式與步驟進行系統(tǒng)故障分析與定位、系統(tǒng)健康狀態(tài)及任務(wù)執(zhí)行狀態(tài)預(yù)測和任務(wù)執(zhí)行能力評估。因此上述三種激活方式,一旦設(shè)備狀態(tài)異常或任務(wù)執(zhí)行異常均會激活系統(tǒng)健康診斷的故障定位與分析功能,屬于條件驅(qū)動方式。設(shè)備狀態(tài)異常采用專家故障診斷(故障樹)方式進行分析和定位,必要時可結(jié)合實時測試和標(biāo)校進行進一步確認;任務(wù)執(zhí)行異常則通過對執(zhí)行任務(wù)的功能和性能分析進行故障定位,也可結(jié)合實時測試和標(biāo)校進行進一步確認。第三種方式為日常管理方式,并采用定期計劃管理,即依據(jù)健康模型,定期對系統(tǒng)健康狀態(tài)指數(shù)開展健康檢查,并對各項檢測、標(biāo)校、測試結(jié)果進行分析。
系統(tǒng)健康診斷首先為系統(tǒng)設(shè)備建立健康檔案,進而在設(shè)備故障、任務(wù)異常定位分析或日常健康檢查結(jié)果基礎(chǔ)上進一步開展信息綜合分析處理,進行系統(tǒng)健康狀態(tài)預(yù)測,更新系統(tǒng)設(shè)備健康狀態(tài)。系統(tǒng)標(biāo)校、測試是系統(tǒng)級健康診斷的重要依據(jù)。
圖3 健康管理工作流程設(shè)計
航天測控數(shù)傳一體化系統(tǒng)健康管理實現(xiàn)從狀態(tài)檢測、特征提取、故障診斷、綜合評估、趨勢預(yù)測及維修決策全過程的管理,具備設(shè)備級自主健康管理能力,構(gòu)建良好的人機交互輔助決策機制,作為裝備維護與使用管理的主要平臺。本節(jié)介紹系統(tǒng)任務(wù)健康評估和設(shè)備故障預(yù)測兩個關(guān)鍵點的實現(xiàn)路徑,同時給出健康管理軟件架構(gòu)設(shè)計方法。
1.4.1 傳感器設(shè)計
根據(jù)航天測運控設(shè)備的典型故障模式,并根據(jù)測試性設(shè)計和維修性設(shè)計,總結(jié)出能夠表征設(shè)備健康狀態(tài)的檢測點和測試點。在系統(tǒng)運行過程中由監(jiān)控分系統(tǒng)完成狀態(tài)采集和存儲。同時,需要根據(jù)后續(xù)健康管理分析的結(jié)果進行迭代,逐漸完善采集點的設(shè)計。
針對天伺饋分系統(tǒng)等機電設(shè)備,一般采集齒輪箱振動、俯仰箱噪聲、方位基座噪聲、溫度、水浸狀態(tài)、饋源氣壓、電機振動等數(shù)據(jù)。電機的振動傳感器安裝在電機外殼上;電樞電壓傳感器和電樞電流傳感器套在電機電纜上;測速反饋傳感器套在測速反饋線上;溫度傳感器探頭自帶強磁片,吸附在電機的外殼上;齒輪箱的振動傳感器安裝位置齒輪箱輸入軸向上;水浸傳感器安裝齒輪箱的底部。針對變頻器、功放等設(shè)備主要采集電流、電壓、溫度等數(shù)據(jù)。
1.4.2 系統(tǒng)健康評估方法
采用層次分析法來對航天測控數(shù)傳一體化系統(tǒng)進行系統(tǒng)任務(wù)健康狀態(tài)評估。層次分析法是指先將一個復(fù)雜問題分解為幾個子問題,然后再對子問題向下進行層層分解,一直分解到不可再分解的評估指標(biāo)為止。計算出各個評價指標(biāo)后,將指標(biāo)的評估結(jié)果進行歸一化,然后通過加權(quán)融合的方式計算其父級指標(biāo)評分,再向上層層融合得到子問題的評估得分,最后通過D-S證據(jù)合成的方法計算原復(fù)雜問題的評估結(jié)果。以S自跟蹤功能健康評估為例,其評估元素如圖4所示。
圖4 S自跟蹤功能健康評估
1.4.3 設(shè)備故障預(yù)測方法
采用基于數(shù)據(jù)驅(qū)動的設(shè)備故障預(yù)測技術(shù),通過分析輸入、輸出和狀態(tài)參數(shù)之間的關(guān)系,獲得機器學(xué)習(xí)模型,并從大量的歷史樣本中學(xué)習(xí)輸入與輸出值之間的映射關(guān)系,建立非線性、非透明及非針對特定對象的模型用來計算未來值,從而可以進行故障預(yù)測。
(1)健康度計算
由于航天測運控設(shè)備故障場景較少,因此采用一分類故障預(yù)測模型。根據(jù)設(shè)備大量正常樣本的分布,總結(jié)出一個多元正態(tài)分布模型,作為設(shè)備的健康模型,定義聚類中心的健康度為1,越靠近中心,健康度越大;離中心越遠,健康度越小。將該模型用于預(yù)測時,設(shè)備每個時刻都可以獲取一組工作參數(shù),將這組工作參數(shù)輸入到多元正態(tài)分布模型中,可以得到一個健康度??赏ㄟ^馬氏距離來描述設(shè)備的健康度。設(shè)由n個設(shè)備的正常歷史樣本組成的樣本集為X:
X=x1,x2,…,xn。
式中:xi=(xi1,xi2,…,xim),i=1,2,…,n,表示第i時刻設(shè)備的所有參數(shù)。計算樣本均值:
計算樣本斜方差:
δ=(X-μ)×(X-μ)T。
新樣本xt與聚類中心μ的馬氏距離定義為
Mahalanobis(xt,μ)=(xt-μ)T·δ-1(xt-μ)。
新樣本xt越趨近于聚類中心μ,馬氏距離趨近于0,即健康度越大;新樣本xt越遠離于聚類中心μ,馬氏距離越大,健康度越小。
(2)基于時間序列的故障預(yù)測
設(shè)備的每個時刻都可以得到一個模式,并且每個模式都可以對其計算故障度,那么可以得到設(shè)備前n個時刻的故障度,也就形成了一個時間序列的觀測值:
(t1,y1),(t2,y2),…,(tn,yn)。
每個觀測值表示ti時刻的故障度為yi,基于這n個觀測值,預(yù)測未來一段時間的故障度走勢。故障預(yù)測算法可選用自回歸(Autoregressive,AR)模型、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)、長短時神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory Network,LSTM)等機器學(xué)習(xí)算法來完成。
針對航天測控數(shù)傳一體化系統(tǒng)不斷演進的特點,本文提出了基于微服務(wù)的健康管理軟件體系架構(gòu),證明該架構(gòu)具有通用、開放、靈活的特點,可滿足健康管理應(yīng)用要求。軟件體系架構(gòu)如圖5所示。
圖5 軟件體系架構(gòu)設(shè)計
面向微服務(wù)的架構(gòu)具有結(jié)構(gòu)清晰、易于理解、松耦合、便于獨立測試、部署和管理等特點。每個服務(wù)組件都是簡單靈活、可獨立部署的;服務(wù)之間是松耦合的,服務(wù)內(nèi)部是高內(nèi)聚的,每個服務(wù)很容易按需擴展。
基礎(chǔ)設(shè)施為系統(tǒng)健康管理軟件運行提供支撐環(huán)境,包括硬件設(shè)備、操作系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)等。
數(shù)據(jù)服務(wù)層包括數(shù)據(jù)庫和數(shù)據(jù)服務(wù),健康管理數(shù)據(jù)庫分為狀態(tài)數(shù)據(jù)庫、裝備信息庫和知識庫三類,業(yè)務(wù)數(shù)據(jù)可并入狀態(tài)數(shù)據(jù)庫或獨立存儲。
(1)狀態(tài)數(shù)據(jù)庫
狀態(tài)數(shù)據(jù)庫涵蓋地面站設(shè)備健康管理所需的數(shù)據(jù)類型,包括業(yè)務(wù)數(shù)據(jù)、狀態(tài)數(shù)據(jù)、測試數(shù)據(jù)及環(huán)境數(shù)據(jù)等。
(2)裝備信息庫
為了滿足設(shè)備信息化全生命周期管理需求,建立設(shè)備信息電子檔案,為日后的數(shù)據(jù)挖掘分析、技術(shù)狀態(tài)管控以及設(shè)備精準維修提供支撐。
(3)知識庫
知識庫主要包括系統(tǒng)關(guān)聯(lián)、數(shù)據(jù)篩查、故障診斷、狀態(tài)評估、趨勢預(yù)測、等級劃分、維修決策以及數(shù)據(jù)挖掘等方面的各類算法模型,用于支撐故障診斷和健康狀態(tài)評估等。
業(yè)務(wù)服務(wù)是健康管理的核心層,用于實現(xiàn)健康管理的主要功能。業(yè)務(wù)服務(wù)可根據(jù)需要分層設(shè)計不同粒度的業(yè)務(wù)服務(wù),也可以通過服務(wù)聚合形成更高層的業(yè)務(wù)服務(wù)。
分系統(tǒng)業(yè)務(wù)服務(wù)可根據(jù)需求分為多層,初步考慮可分為基礎(chǔ)服務(wù)、功能服務(wù)和任務(wù)服務(wù)三層。
基礎(chǔ)服務(wù)主要實現(xiàn)一些細粒度的較單一功能,主要包括天伺饋信息采集、監(jiān)控信息采集、環(huán)境信息采集、數(shù)據(jù)篩選、數(shù)據(jù)異常檢測、數(shù)據(jù)特征提取、設(shè)備故障診斷、系統(tǒng)/分系統(tǒng)業(yè)務(wù)能力診斷、設(shè)備健康狀態(tài)評估、系統(tǒng)/分系統(tǒng)業(yè)務(wù)能力評估、系統(tǒng)性能預(yù)測和設(shè)備壽命預(yù)測等。
功能服務(wù)主要實現(xiàn)健康管理的主要功能,主要包括:
(1)信息采集——主要完成系統(tǒng)各類健康狀態(tài)相關(guān)信息的采集,數(shù)據(jù)采集的顆粒度以現(xiàn)場可更換最小單元為單位,采集周期可設(shè)置。
(2)數(shù)據(jù)預(yù)處理——分類完成各類數(shù)據(jù)的處理,包括數(shù)據(jù)篩選、平滑、降噪、均值、方差和變異特征提取等。
(3)故障診斷——依據(jù)設(shè)備狀態(tài)監(jiān)測信息,結(jié)合故障診斷模型完成各設(shè)備的故障診斷。
(4)健康狀態(tài)評估——根據(jù)健康狀態(tài)評估模型,完成系統(tǒng)設(shè)備健康狀態(tài)評估及系統(tǒng)/分系統(tǒng)業(yè)務(wù)能力評估。
(5)預(yù)測分析——根據(jù)預(yù)測算法模型及裝備信息預(yù)測設(shè)備剩余使用壽命及設(shè)備故障發(fā)生時間。
(6)裝備維護——根據(jù)裝備信息(健康體檢、故障診斷、狀態(tài)評估等)提出裝備維修建議。
(7)數(shù)據(jù)管理——完成所有健康管理數(shù)據(jù)庫和數(shù)據(jù)文件的管理與維護。
任務(wù)服務(wù)主要實現(xiàn)一些粗粒度的高層服務(wù),主要包括:
(1)綜合健康體檢——協(xié)調(diào)監(jiān)控分系統(tǒng),分級完成系統(tǒng)、分系統(tǒng)和單機設(shè)備的健康體檢,并按要求形成體檢報告。
(2)故障聯(lián)合診斷——完成系統(tǒng)、分系統(tǒng)設(shè)備等復(fù)雜故障的多手段聯(lián)合診斷。
(3)全壽命周期管理——完成設(shè)備信息錄入、運行過程中狀態(tài)跟蹤等功能。
(4)裝備效能評估——完成任務(wù)完成率、設(shè)備完好性等效能評估內(nèi)容。
完成設(shè)備故障信息、設(shè)備健康評估信息、設(shè)備健康預(yù)測信息和裝備維修維護決策等多信息的綜合顯示。健康管理人機交互界面如圖6所示。
圖6 健康管理人機交互界面
本文提出了一種航天測控數(shù)傳一體化系統(tǒng)健康管理設(shè)計方法,闡述了系統(tǒng)運行模式、組成和工作流程,給出了一種面向航天測運控設(shè)備的系統(tǒng)任務(wù)健康評估和設(shè)備故障預(yù)測實現(xiàn)路徑,并介紹了基于微服務(wù)的健康管理軟件體系架構(gòu),對于后續(xù)健康管理系統(tǒng)的建設(shè)具有指導(dǎo)意義。但同時,還需要對以下部分繼續(xù)進行研究:
(1)健康管理在本領(lǐng)域是一項新技術(shù),離視情維修的目標(biāo)還有一定差距,需要結(jié)合用戶應(yīng)用場景加強理論研究和工程應(yīng)用探索。同時,利用積累的歷史數(shù)據(jù)對關(guān)重件的故障預(yù)測算法開展研究,逐步完善算法模型庫。
(2)根據(jù)健康管理系統(tǒng)的應(yīng)用效能,在下一代裝備中重新優(yōu)化系統(tǒng)“六性”設(shè)計,逐步提高裝備作戰(zhàn)效能。