李 良, 李 原, 黃家彬
(96921 部隊, 北京 100020)
由于日趨復(fù)雜的裝備功能集成和使用環(huán)境影響因素的增加, 其發(fā)生故障和功能失效的幾率逐漸增大,因此故障診斷和健康維護逐漸成為裝備正常運行的重要保障。 而當(dāng)前傳統(tǒng)的基于專家知識、基于統(tǒng)計數(shù)據(jù)分析和基于模型的故障診斷方法難以適用功能日趨復(fù)雜的現(xiàn)代化裝備保障需求。 隨著人工智能、大數(shù)據(jù)技術(shù)迅速發(fā)展,應(yīng)用相關(guān)的機器學(xué)習(xí)、總線控制、數(shù)據(jù)挖掘方法對裝備試驗和操作使用過程中產(chǎn)生的大量數(shù)據(jù)進行采集、分析,學(xué)習(xí)、挖掘“海量”數(shù)據(jù)中隱藏的知識,有效地認(rèn)識和掌握裝備運行規(guī)律,并通過機器學(xué)習(xí)、智能搜索快速定位故障,這對現(xiàn)代化作戰(zhàn)背景下實現(xiàn)復(fù)雜裝備的故障檢測、故障定位、故障識別和健康預(yù)測具有特別重要的意義。
隨著現(xiàn)代裝備的復(fù)雜性、綜合化、智能化程度不斷提高,其研制、生產(chǎn)尤其是維護和保障的成本越來越高,基于復(fù)雜系統(tǒng)可靠性、安全性、經(jīng)濟性考慮,以診斷和預(yù)測技術(shù)為核心的故障診斷、 預(yù)測和健康管理(Diagnosis,Prognostics and Health Management,DPHM)策略獲得越來越多的重視和應(yīng)用。 研制、生產(chǎn)DPHM 是對復(fù)雜系統(tǒng)傳統(tǒng)使用的機內(nèi)測試(build-in test,BIT)和狀態(tài)(健康)監(jiān)控能力的進一步擴展,它是從狀態(tài)監(jiān)控向健康管理的轉(zhuǎn)變,這種轉(zhuǎn)變引入了對系統(tǒng)未來可靠性的預(yù)測能力, 有效提高電氣系統(tǒng)安全性、完好性和任務(wù)成功性,從而以較少的維修投入, 實現(xiàn)基于狀態(tài)的維修或視情維修 (conditionbased maintenance,CBM)和自主式保障[1]。
故障診斷、預(yù)測及健康管理技術(shù)(PHM)起源于20 世紀(jì)90 年代末,綜合診斷系統(tǒng)向測試、監(jiān)控、診斷、預(yù)測和維修管理一體化方向發(fā)展, 并從最初側(cè)重考慮的電子系統(tǒng)擴展到電子、機械、結(jié)構(gòu)、動力等各種主要分系統(tǒng)。 總的來說,PHM 系統(tǒng)是在需求牽引、技術(shù)推動下,并借助高技術(shù)裝備項目的研制契機而誕生的。 美軍20 世紀(jì)90 年代末引入民用領(lǐng)域的視情維修, 作為一項戰(zhàn)略性的裝備保障策略,其目的是對裝備狀態(tài)進行實時或近實時的監(jiān)控,根據(jù)電氣系統(tǒng)的實際狀態(tài)確定最佳維修時機。 隨著高速數(shù)據(jù)采集、大容量數(shù)據(jù)存儲、高速數(shù)據(jù)傳輸和處理、信息融合、MEMS 和網(wǎng)絡(luò)等信息技術(shù)和高新技術(shù)的迅速發(fā)展,意味著允許在裝備中完成更多的數(shù)據(jù)存儲和處理功能,以消除過多依賴地面站來處理信息的需求,為提高PHM能力創(chuàng)造了條件。近年來,PHM 技術(shù)受到各國軍方和工業(yè)界的廣泛關(guān)注, 各方都在積極采取各種方式加速這類軍民兩用技術(shù)的開發(fā)和利用。
在軍事領(lǐng)域, 美軍為F-35 JSF 開發(fā)的PHM 系統(tǒng)是最早、也是目前技術(shù)水平最高的應(yīng)用,F(xiàn)-35 的PHM 系統(tǒng)代表了目前CBM 應(yīng)用的最高水準(zhǔn)。 同時,PHM 技術(shù)也已廣泛應(yīng)用于英、美、加拿大等國研制的各類飛機系統(tǒng)中,稱作“健康與使用監(jiān)控系統(tǒng)(HUMS)”的集成應(yīng)用平臺。美國各軍種及其他機構(gòu)也開展了與PHM/HUMS 類似的技術(shù)發(fā)展項目, 如美國空軍研究實驗室提出的綜合系統(tǒng)健康管理(ISHM)系統(tǒng)方案:海軍的綜合狀態(tài)評估系統(tǒng)(ICAS)和預(yù)測增強診斷系統(tǒng)(PEDS)項目;陸軍的診斷改進計劃(ADIP)、嵌入式診斷和預(yù)測同步(EDAPS)計劃等。
目前國內(nèi)在故障診斷、預(yù)測和健康管理方面,也開展了較為廣泛的研究工作。 研究需求和研究對象主要集中在航空、航天、船舶和兵器等復(fù)雜高技術(shù)裝備研究和應(yīng)用領(lǐng)域。研究主體以高校和研究院所居多,雖然在一些設(shè)計中進行了積極的嘗試, 但是總體的應(yīng)用研究規(guī)模和水平仍然不太成熟,各機構(gòu)的研究能力和水平參差不齊,行業(yè)或技術(shù)領(lǐng)域?qū)I(yè)研究組織薄弱。雖然近年來,也出現(xiàn)了一些基礎(chǔ)研究成果,但是由于缺乏良好的研究管理機制,研究體系分散,統(tǒng)一高效的協(xié)調(diào)機制欠缺,造成了理論和應(yīng)用脫節(jié), 基礎(chǔ)研究缺乏背景支撐和實驗驗證等致命的缺陷。可以說,國內(nèi)對于故障預(yù)測和健康管理技術(shù)的研究目前正處于研究探索階段, 尚未上升到設(shè)備視情維護所要求的剩余壽命預(yù)測階段。
在航空航天、 國防軍事以及工業(yè)各領(lǐng)域中應(yīng)用的不同類型的PHM 系統(tǒng),其體現(xiàn)的基本思想是類似的,區(qū)別主要表現(xiàn)在不同領(lǐng)域其具體應(yīng)用的技術(shù)和方法的不同。視情維修的開放體系結(jié)構(gòu) (open system architecture for condition-based maintenance,OSA-CBM ) 綜合了這些PHM 系統(tǒng)共同的設(shè)計思想以及應(yīng)用技術(shù)和方法,可用于指導(dǎo)實際構(gòu)建應(yīng)用于機械、 電子和結(jié)構(gòu)等領(lǐng)域的各種具體類型的PHM 系統(tǒng)。
在裝備電氣系統(tǒng)全壽命周期健康管理總體架構(gòu)下,采用基于數(shù)據(jù)驅(qū)動和知識相結(jié)合的方法,對電氣系統(tǒng)全生命周期故障診斷和預(yù)測技術(shù)展開研究, 主要包括數(shù)據(jù)管理、特征提取、智能診斷與健康預(yù)測。 基于測試數(shù)據(jù)的裝備電氣系統(tǒng)智能故障診斷技術(shù),可實現(xiàn)電氣系統(tǒng)測試數(shù)據(jù)的存儲和管理,利用數(shù)據(jù)挖掘、人工智能、機器學(xué)習(xí)等理論和方法實現(xiàn)對數(shù)據(jù)的特征提取, 通過智能搜索和定位技術(shù)實現(xiàn)快速、準(zhǔn)確故障定位。故障診斷的實現(xiàn)方法包括基于規(guī)則推理的專家系統(tǒng)和智能推理方法等; 知識庫通過專家添加或離線模式挖掘獲??; 故障預(yù)測方法包括回歸分析、外推趨勢預(yù)測、智能預(yù)測方法[2-4]。
智能故障診斷技術(shù)研究方法包括故障特征提取方法、故障定位方法和故障預(yù)測方法。每一部分的實現(xiàn)需要通過算法構(gòu)建模型來完成, 本論文提出了智能故障診斷系統(tǒng)實現(xiàn)的具體算法。
針對系統(tǒng)測試數(shù)據(jù)的特點, 故障特征提取擬采用的具體算法包括閾值分析、包絡(luò)分析、相似性分析。
3.1.1 閾值分析
閾值分析法,即給出實測數(shù)據(jù)的閾值范圍,若實測數(shù)據(jù)超過該閾值范圍, 判斷該組數(shù)據(jù)不正常閾值分析包括臨界值判別法和N%誤差閾值定制法。 臨界值判別法是在分析模擬量或數(shù)字量時, 根據(jù)歷史數(shù)據(jù)或經(jīng)驗確定正常數(shù)據(jù)的上下臨界值,將實測數(shù)據(jù)與閾值進行比較,得到數(shù)據(jù)正?;虿徽5慕Y(jié)論。如判斷電壓、溫度值是否正常時,首先設(shè)定一個正常的閾值范圍,當(dāng)電壓或溫度超過閾值時,則判斷為異常。
N%誤差閾值制定法以所測得數(shù)字量或模擬量在均值N%的誤差范圍內(nèi)為正常狀態(tài),其中N 根據(jù)需求制定。
3.1.2 包絡(luò)分析
傳感數(shù)據(jù)的類型多樣,有的傳感數(shù)據(jù)呈波形分布,閾值并不是固定不變的,在不同的時刻,閾值不同。 因此其包絡(luò)線有一定的規(guī)律或趨向, 采用包絡(luò)線分析方法可以對作更詳細(xì)的分析。
如圖1 和圖2 所示,實線表示實測數(shù)據(jù),虛線表示對應(yīng)準(zhǔn)則,當(dāng)實測數(shù)據(jù)在上下包絡(luò)線之內(nèi),表示數(shù)據(jù)正常,若超過包絡(luò)線,表示某時刻數(shù)據(jù)異常,此時提取異常數(shù)據(jù)信息(對應(yīng)值)。
圖1 包絡(luò)線分析圖例1
圖2 包絡(luò)線分析圖例2
在包絡(luò)線分析法中,包絡(luò)線來源于準(zhǔn)則庫,根據(jù)理論值設(shè)置,或根據(jù)歷史數(shù)據(jù)提取包絡(luò)線。
3.1.3 相似性分析
相似性度量意在量化分析給定數(shù)據(jù)之間的近似程度, 對于時間序列而言, 相似性度量主要衡量的是序列之間是否具有相似的趨勢和形態(tài)。 由于時間序列往往容易受到噪聲、 延遲和波動等因素的影響, 其數(shù)據(jù)在表現(xiàn)形式上往往呈現(xiàn)振幅不一致、平移和不連續(xù)等特點。 同時相似性度量在序列搜索、聚類等任務(wù)中有重要應(yīng)用,因此如何設(shè)計和實現(xiàn)有效的相似性度量方法將極大影響時間序列上層應(yīng)用分析的準(zhǔn)確和有效性。對于系統(tǒng)健康管理系統(tǒng)中的故障特征提取, 同樣可以通過對時間序列的相似性分析來完成。
所提出的故障定位方法包含4 個主要步驟: 控制系統(tǒng)的故障樹模型的構(gòu)建、故障編碼、神經(jīng)網(wǎng)絡(luò)建模、以及測試評估,見圖3。
圖3 神經(jīng)網(wǎng)絡(luò)故障定位流程
第一階段,根據(jù)系統(tǒng)結(jié)構(gòu)、功能和行為方面知識的構(gòu)建故障樹模型。 它是以某一故障事件為根節(jié)點,以該故障發(fā)生的前提條件為父節(jié)點、測點信息為子節(jié)點而建立的反映事件邏輯與或關(guān)系的倒樹狀結(jié)構(gòu)圖。
第二階段,依據(jù)故障樹模型,對測點狀態(tài)信息和故障事件進行編碼。用0 和1 表示某個測點的狀態(tài)信息,表征是否出現(xiàn)異常值,異常為0,正常為1,所有測點測量值的狀態(tài)編碼組合成測試編碼。 對具體位置發(fā)生的故障事件用二進制編碼,作為故障編碼。從而建立控制系統(tǒng)的測試編碼和故障編碼。
第三階段,以測試編碼作為神經(jīng)網(wǎng)絡(luò)的輸入,故障編碼作為神經(jīng)網(wǎng)絡(luò)的輸出,基于大量歷史數(shù)據(jù),訓(xùn)練神經(jīng)網(wǎng)絡(luò),建立特定的網(wǎng)絡(luò)模型。
第四階段,在建立的故障定位模型的基礎(chǔ)上,根據(jù)實時測點的狀態(tài)信息,進行故障定位。對模型輸出結(jié)果的準(zhǔn)確性進行評估。
在基于人工智能和數(shù)據(jù)挖掘的控制系統(tǒng)診斷與預(yù)測方案下,具體實現(xiàn)控制系統(tǒng)的故障功能,有三種模式,即基于關(guān)鍵測試參數(shù)的故障預(yù)測、 基于主成分分析的故障預(yù)測和基于健康因子的故障預(yù)測。
3.3.1 基于關(guān)鍵測試參數(shù)的故障預(yù)測
基于關(guān)鍵測試參數(shù)的故障預(yù)測包括關(guān)鍵參數(shù)選擇、預(yù)測模型、診斷推理,最后得出故障預(yù)測結(jié)論。 該方法通過離線構(gòu)建回歸預(yù)測模型(構(gòu)建方法有神經(jīng)網(wǎng)絡(luò)、LSTM、SVM 等),對關(guān)鍵狀態(tài)量進行預(yù)測,得到未來時間點的參數(shù)值,即控制系統(tǒng)的未來狀態(tài),在對未來狀態(tài)進行故障診斷,判讀是否發(fā)生故障。
關(guān)鍵測試參數(shù)選擇: 整個電氣控制系統(tǒng)測試數(shù)據(jù)量多,對每個參數(shù)進行預(yù)測會造成處理量大和冗余,因此從數(shù)據(jù)庫中選擇能表征未來變化狀態(tài)的關(guān)鍵測試參數(shù)。
預(yù)測模型:由于不同的參數(shù)分布特點和變化趨勢不同,因此預(yù)測時所采用的預(yù)測模型不同, 預(yù)測模型通過離線構(gòu)建和訓(xùn)練。 預(yù)測算法有神經(jīng)網(wǎng)絡(luò)、SVM、LSTM、線性回歸等。
診斷推理:預(yù)測模型得到參數(shù)未來的值,表征電氣控制系統(tǒng)未來的狀態(tài),基于參數(shù)值進行故障診斷,包括異常檢測、針對推理。
預(yù)測結(jié)論: 診斷推理的結(jié)果可判斷系統(tǒng)未來是否發(fā)生故障。
3.3.2 基于主成分分析的故障預(yù)測
基于主成分分析的故障預(yù)測是在基于關(guān)鍵測試參數(shù)的故障預(yù)測基礎(chǔ)上加入主成分分析。 該方法不直接對測試參數(shù)進行預(yù)測,先對測試數(shù)據(jù)降維和特征提取,選擇主成分,提取出有效信息,降低冗余,減少運算量。在對提取出來的主成分進行分析和預(yù)測[5]。
3.3.3 基于健康因子的故障預(yù)測
基于健康因子的故障預(yù)測是構(gòu)建能夠表征系統(tǒng)當(dāng)前狀態(tài)的健康因子,即對當(dāng)前狀態(tài)進行健康評估,再對健康因子進行預(yù)測和分析,得到系統(tǒng)未來的健康狀態(tài)。
本文分析了智能故障診斷的國內(nèi)外發(fā)展現(xiàn)狀, 并結(jié)合國內(nèi)外的一些研究成果給出了智能故障診斷系統(tǒng)的實現(xiàn)方案, 并結(jié)合實現(xiàn)方案給出了診斷和預(yù)測方案流程中每一部分功能實現(xiàn)擬采用的具體算法, 為智能故障診斷技術(shù)工程化設(shè)計提供參考和借鑒。