楊彪,熊贇,傅玲,徐蔚峰,李婧
1. 復(fù)旦大學(xué)計算機科學(xué)技術(shù)學(xué)院,上海 200433;2. 上海市數(shù)據(jù)科學(xué)重點實驗室,上海 200433;3. 西門子中國研究院,北京 100102
工業(yè)數(shù)字化已經(jīng)成為全球范圍內(nèi)的新型工業(yè)化趨勢。在數(shù)字化工業(yè)中,企業(yè)利用數(shù)字化技術(shù)將生產(chǎn)流程和業(yè)務(wù)過程數(shù)字化,實現(xiàn)工業(yè)生產(chǎn)的自動化、自主化和智能化,從而提高生產(chǎn)效率和質(zhì)量,降低成本和風(fēng)險,實現(xiàn)可持續(xù)發(fā)展。
由于這些工業(yè)系統(tǒng)復(fù)雜化和高度集成化,故障可能會影響整個系統(tǒng)的運行,并引發(fā)擴散效應(yīng),出現(xiàn)生產(chǎn)停滯、資源浪費的情況,造成重大的安全事故和經(jīng)濟損失。故障診斷技術(shù)可以快速、準確地確定設(shè)備故障及其原因并及時維修,從而減少損失[1-3]。故障診斷數(shù)字化技術(shù)成為工業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵技術(shù),在系統(tǒng)整體效能、產(chǎn)品生產(chǎn)質(zhì)量等方面起著重要的提質(zhì)增效的作用。故障診斷數(shù)字化技術(shù)的研究逐步受到工業(yè)界和學(xué)術(shù)界的關(guān)注。
工業(yè)數(shù)字化轉(zhuǎn)型經(jīng)歷了工業(yè)設(shè)備及其相關(guān)流程的數(shù)字化,積累了豐富的數(shù)據(jù),進而通過數(shù)據(jù)驅(qū)動業(yè)務(wù)和管理。工業(yè)界和學(xué)術(shù)界對于如何更好地利用這些數(shù)據(jù)開展了研究和實踐。本文聚焦故障診斷數(shù)字化方法的研究現(xiàn)狀,按照其發(fā)展特點劃分為領(lǐng)域經(jīng)驗主導(dǎo)的建模方法、數(shù)據(jù)驅(qū)動與領(lǐng)域經(jīng)驗結(jié)合的數(shù)字化方法、數(shù)據(jù)驅(qū)動主導(dǎo)與可解釋性結(jié)合的數(shù)字化方法3個階段,如圖1所示。故障診斷涉及的數(shù)據(jù)是多源、多類型的,例如,傳感器等設(shè)備獲取的系統(tǒng)運行過程中的時域信息和頻域信息,包括振動信號、載荷信號、電路信號等;儀器、儀表等智能終端實時采集的設(shè)備運行狀態(tài)。這些數(shù)據(jù)在不同的階段有不同的處理方式。
圖1 故障診斷方法的3 個階段
在早期的領(lǐng)域經(jīng)驗主導(dǎo)階段,故障診斷主要建模方法包括符號有向圖、故障樹、Petri網(wǎng)和鍵合圖等,這些算法在很大程度上依賴專業(yè)人員的領(lǐng)域知識。隨著數(shù)字化的發(fā)展以及工業(yè)數(shù)據(jù)的大量積累,數(shù)據(jù)驅(qū)動與領(lǐng)域經(jīng)驗結(jié)合階段更加注重對數(shù)據(jù)特征及其關(guān)聯(lián)的挖掘,包括基于決策樹、支持向量機、貝葉斯網(wǎng)絡(luò)等算法的故障診斷方法。工業(yè)系統(tǒng)運行數(shù)據(jù)不斷積累,呈現(xiàn)出多源、多模態(tài)等特性。相對于獲取的運行數(shù)據(jù),領(lǐng)域知識難以捕獲潛在的數(shù)據(jù)特征。深度學(xué)習(xí)等數(shù)字化方法的發(fā)展,催生出數(shù)據(jù)驅(qū)動主導(dǎo)的方法。這些方法也考慮到工業(yè)領(lǐng)域的可解釋性,這一階段被稱為數(shù)據(jù)驅(qū)動主導(dǎo)與可解釋性結(jié)合階段。在這一階段,深度學(xué)習(xí)方法降低了對人工特征的依賴,圖神經(jīng)網(wǎng)絡(luò)(graph neural network,GNN)等建模方法提供了可解釋性的方案。
早期的領(lǐng)域經(jīng)驗主導(dǎo)階段依據(jù)專家經(jīng)驗,用定性的方法分析工業(yè)流程中各個環(huán)節(jié)、各個單元之間的關(guān)系,通常采用圖論的方式來建模,包括符號有向圖、故障樹、Petri網(wǎng)和鍵合圖等。
符號有向圖利用節(jié)點和有向邊描述系統(tǒng)的結(jié)構(gòu)和功能,建立變量之間的因果關(guān)系圖[4],并結(jié)合推理策略解釋故障傳播路徑[5]。Peng等人[6]提出一種基于貝葉斯推理的多邏輯概率符號有向圖模型,實現(xiàn)過程變量之間的因果表示。但是,在描述復(fù)雜系統(tǒng)時,符號有向圖的復(fù)雜結(jié)構(gòu)限制了推理能力。為了簡化圖結(jié)構(gòu),Liu等人[7]引入規(guī)則矩陣和狀態(tài)矩陣,Xie等人[8]采用壓縮節(jié)點、約束傳播和中間優(yōu)化技術(shù)建立基于分層的符號有向圖模型。符號有向圖方法能夠根據(jù)因果關(guān)系圖推理故障的傳播路徑,但難以處理復(fù)雜邏輯關(guān)系,并且有向圖的構(gòu)建需要依賴人工經(jīng)驗。
故障樹同樣用圖對系統(tǒng)故障與它的各個部件之間的邏輯關(guān)系進行建模,例如,采用最小割集和最小路徑等算法分析不同部件故障導(dǎo)致的系統(tǒng)故障[9]。Chen等人[10]使用故障樹對故障及其邏輯關(guān)系進行建模,然后從故障樹中提取規(guī)則以識別故障。Wang等人[11]提出基于故障配置的故障樹生成方法,對系統(tǒng)故障進行建模分析。故障樹方法已被廣泛應(yīng)用,但該方法靜態(tài)結(jié)構(gòu)有限,難以捕捉系統(tǒng)動態(tài)故障行為,不適用于處理不確定性推理問題,高度依賴專家經(jīng)驗。為了克服這些問題,研究者將故障樹建模與貝葉斯網(wǎng)絡(luò)推理的優(yōu)點結(jié)合起來,實現(xiàn)故障診斷和推理[12-14]。
Petri網(wǎng)是一種圖形化的建模方法,常被用于復(fù)雜、動態(tài)、并發(fā)和離散事件系統(tǒng)的建模任務(wù)[15]。Mansour等人[16]將Petri網(wǎng)模型應(yīng)用到電站故障診斷。AL-AJELI等人[17]使用帶標簽的Petri網(wǎng)對離散事件系統(tǒng)進行建模,捕獲正常狀態(tài)和錯誤行為。但是,上述方法只關(guān)注前向故障診斷而忽略了后向原因追溯[18]。Liu等人[18]使用模糊證據(jù)推理方法和動態(tài)自適應(yīng)模糊Petri網(wǎng)解決上述問題。在動態(tài)性方面,Zhang等人[19]創(chuàng)建了時間推理模糊Petri網(wǎng)處理時間約束和模糊信息,其模塊化結(jié)構(gòu)能夠適應(yīng)各種保護配置,適應(yīng)拓撲變化。
鍵合圖適用于建模獨立于系統(tǒng)參數(shù)值的結(jié)構(gòu)化系統(tǒng),該方法計算量較低,可以應(yīng)用于大規(guī)模系統(tǒng)[20]。Benmoussa等人[20]利用雙因果關(guān)系和因果路徑的性質(zhì),從系統(tǒng)鍵合圖中獲得故障可檢測性和可隔離性的結(jié)構(gòu)條件。Badoud等人[21]通過鍵合圖對風(fēng)力系統(tǒng)、渦輪系統(tǒng)進行建模,使用因果路徑生成解析冗余關(guān)系,從而避免窮舉所有組合,以此應(yīng)用于故障診斷。目前,鍵合圖模型在多故障診斷領(lǐng)域存在局限性,在決策步驟的魯棒性方面仍存在難點。對此,Chatti等人[22]提出有符號鍵合圖,綜合利用結(jié)構(gòu)特性,以消除可能存在的沖突。鍵合圖模型計算量較低,但在大型復(fù)雜系統(tǒng)或多故障診斷領(lǐng)域的適應(yīng)性較差。
在領(lǐng)域經(jīng)驗主導(dǎo)階段中,符號有向圖、故障樹、Petri網(wǎng)和鍵合圖等故障診斷技術(shù)是通過領(lǐng)域知識,專家經(jīng)驗構(gòu)建關(guān)聯(lián)圖,具有較好的可解釋性,支持故障原因追溯。然而,這些方法在缺乏先驗知識的情況下難以應(yīng)用于工業(yè)過程,對變量之間因果關(guān)系的強弱以及時序動態(tài)性的考慮較為欠缺。
第一階段中的方法需要依賴領(lǐng)域經(jīng)驗對相關(guān)數(shù)據(jù)進行關(guān)聯(lián)建模,隨著數(shù)據(jù)的增多,構(gòu)建變量之間的因果關(guān)聯(lián)圖存在一定的挑戰(zhàn)。如何更好地利用數(shù)據(jù),將數(shù)據(jù)驅(qū)動的方法與領(lǐng)域經(jīng)驗結(jié)合,是一個好的解決方法。通過數(shù)據(jù)驅(qū)動的方法發(fā)現(xiàn)因果拓撲關(guān)系,確定故障的特征,以實現(xiàn)故障診斷,主要包括基于特征關(guān)聯(lián)的學(xué)習(xí)方法,基于特征工程的學(xué)習(xí)方法(如決策樹、支持向量機、貝葉斯網(wǎng)絡(luò)等)以及基于時序特征的時序分析方法。
基于特征關(guān)聯(lián)的學(xué)習(xí)方法主要利用不同特征之間的關(guān)聯(lián)性和相互作用進行學(xué)習(xí)和診斷,重點是探索正常狀態(tài)與故障狀態(tài)特征之間的關(guān)聯(lián)關(guān)系,以提高故障診斷的準確率。
灰色理論[23]通過研究設(shè)備運行狀態(tài)與故障狀態(tài)特征的相關(guān)性預(yù)測故障狀態(tài)的特性和趨勢[24]。Wang等人[25]使用灰色預(yù)測模型預(yù)測燃料電池的運行特征,利用運行特征的預(yù)測值判斷未來的運行狀態(tài),從而實現(xiàn)故障診斷。Hu等人[23]提出基于灰色理論和專家系統(tǒng)的軌道電路故障預(yù)測方法。為了更有效地利用基于灰色理論學(xué)習(xí)到的特征之間的關(guān)聯(lián)性,Dong等人[26]提出了一種粗糙集與灰色關(guān)聯(lián)分析相結(jié)合的冗余保護配置變電站故障診斷方法,Wu等人[27]提出基于灰色理論的自適應(yīng)動態(tài)閾值調(diào)整算法。
多元統(tǒng)計分析主要包括主成分分析法、獨立元分析法、偏最小二乘法和非負矩陣分解等方法。主成分分析法通過降維處理,提取數(shù)據(jù)特征,消除不同指標間的相關(guān)性。Du等人[28]將經(jīng)驗?zāi)J椒纸?、主成分分析法、累積和等方法用于故障診斷。主成分分析法需要假設(shè)數(shù)據(jù)服從高斯分布,而工業(yè)數(shù)據(jù)未必完全服從高斯分布。獨立元分析法假設(shè)非高斯源信號具有相互獨立性,將信號或數(shù)據(jù)分離為相互獨立的變量[29]。例如,Xiong等人[30]采用獨立元分析法尋找電站故障的特征振動信號;Ali等人[31]利用獨立元分析法區(qū)分發(fā)電廠冷凝器系統(tǒng)中多個不同部分的主要異常因素;Yu等人[32]在機器故障先驗知識的基礎(chǔ)上結(jié)合獨立元分析法提取故障特征。偏最小二乘法是一種多元統(tǒng)計分析方法,適用于變量間的多重相關(guān)性建模。Jiao等人[33]將偏最小二乘法用于非線性質(zhì)量相關(guān)故障檢測,提出核偏最小二乘模型。Zhu等人[34]利用偏最小二乘法處理非平穩(wěn)、非線性的變壓器放電信號,提取特征之間的相互關(guān)系。偏最小二乘法算法可以實現(xiàn)多變量間的回歸建模,且能夠處理自變量間的多重相關(guān)性,但工業(yè)數(shù)據(jù)內(nèi)部往往存在錯綜復(fù)雜的動態(tài)關(guān)系,偏最小二乘法難以發(fā)揮有效作用。非負矩陣分解是一種矩陣分解方法,在一定程度上可以減少非線性工業(yè)系統(tǒng)數(shù)據(jù)的維度[35],例如,感應(yīng)電機故障診斷系統(tǒng)[36]、軸承故障診斷系統(tǒng)[37]均采用了這一方法。在非負矩陣分解的優(yōu)化和改進方面,Chen等人[35]提出了有監(jiān)督的非負矩陣分解方法,用于分離特征,緩解非負矩陣分解缺乏先驗知識的問題。Yang等人[38]將類別信息引入非負矩陣分解中以解決有類標簽數(shù)據(jù)的監(jiān)督任務(wù)表現(xiàn)不佳的難題。非負矩陣分解算法計算效率高,大規(guī)模數(shù)據(jù)處理速度快,但是非負矩陣分解不允許矩陣中出現(xiàn)負值,且無法處理數(shù)據(jù)間復(fù)雜的因果關(guān)系。
在數(shù)據(jù)驅(qū)動與領(lǐng)域經(jīng)驗結(jié)合的階段,決策樹、支持向量機和貝葉斯網(wǎng)絡(luò)等方法主要依賴特征工程以提取與工業(yè)故障相關(guān)的特征信息,進而為故障診斷提供依據(jù)。
決策樹[39]算法適用于多故障診斷領(lǐng)域,且更容易解釋,例如,軸承故障診斷[40]、離心泵故障診斷[41]、銑刀狀態(tài)監(jiān)測[42]、風(fēng)力渦輪機故障診斷[39]、光伏系統(tǒng)[43]。在其他領(lǐng)域,一些學(xué)者將決策樹與其他算法進行了結(jié)合。例如,Aydin等人[44]基于邊界分析法和模糊決策樹算法提出了新的感應(yīng)電機故障診斷方案;Li等人[45]提出了將決策樹模型與基于虛擬傳感器的故障指示器結(jié)合的“三階段法”進行故障診斷與追溯。決策樹算法可以在沒有假設(shè)的情況下對系統(tǒng)進行操作,不依賴專家解釋,能夠完成缺失數(shù)據(jù)的診斷任務(wù),模型易于實現(xiàn),但是泛化能力較弱,容易過擬合,進而降低故障診斷與追溯的性能。
支持向量機是基于結(jié)構(gòu)風(fēng)險最小化原理的有監(jiān)督機器學(xué)習(xí)算法[46]。Wu等人[47]通過多尺度置換熵從故障軸承振動信號中提取特征,然后應(yīng)用支持向量機實現(xiàn)故障診斷。Saidi等人[48]采用主成分分析法對軸承振動信號進行降維處理,然后采用支持向量機進行故障隔離與診斷。Jegadeeshwaran等人[49]將決策樹與支持向量機結(jié)合,分別應(yīng)用于液壓制動器信號的特征工程和故障診斷。支持向量機算法在二次規(guī)劃問題中實時性較差,不適于在線故障診斷。對此,Deng等人[50]提出一種將支持向量機和糾錯輸出碼相結(jié)合的方法,提升了傳感器故障特征提取和在線識別能力。支持向量機診斷模型對內(nèi)核參數(shù)敏感,不合適的內(nèi)核參數(shù)會影響診斷結(jié)果,同時處理多故障診斷任務(wù)也存在一定的困難。
貝葉斯網(wǎng)絡(luò)是一種重要的概率圖模型,可以有效地處理不確定知識表達和推理等問題[51]。例如,Amin等人[52]提出基于動態(tài)貝葉斯網(wǎng)絡(luò)的故障診斷方案;Liu等人[53]采用動態(tài)貝葉斯網(wǎng)絡(luò)進行海底生產(chǎn)系統(tǒng)的故障診斷。為了提高基于貝葉斯網(wǎng)絡(luò)的故障診斷模型的準確度和靈敏度,Yu等人[54]采用改進的獨立元分析法識別故障過程變量,再根據(jù)過程變量及其流程圖獲得的依賴關(guān)系建立貝葉斯網(wǎng)絡(luò)模型;Cai等人[55]和Don等人[56]將隱馬爾可夫模型與動態(tài)貝葉斯網(wǎng)絡(luò)相結(jié)合,隱馬爾可夫模型用于系統(tǒng)運行數(shù)據(jù)的異常檢測,貝葉斯網(wǎng)絡(luò)用于故障原因診斷;Amin等人[57]將主成分分析法與貝葉斯網(wǎng)絡(luò)相結(jié)合。貝葉斯網(wǎng)絡(luò)算法可以在數(shù)據(jù)不完備的情況進行故障診斷與追溯,但是對于復(fù)雜系統(tǒng)的故障診斷較為困難。
隨著數(shù)字化技術(shù)的發(fā)展,越來越多的工業(yè)故障數(shù)據(jù)被收集和存儲,這為數(shù)據(jù)主導(dǎo)的故障診斷方法提供了支撐,決策樹、支持向量機和貝葉斯網(wǎng)絡(luò)等機器學(xué)習(xí)算法的應(yīng)用也逐步從數(shù)據(jù)驅(qū)動與領(lǐng)域經(jīng)驗結(jié)合的階段,過渡到以數(shù)據(jù)驅(qū)動主導(dǎo)和可解釋性結(jié)合的階段,逐步減少了特征工程的需求和降低了特征工程的復(fù)雜性。
上述基于特征工程的方法沒有考慮數(shù)據(jù)在時間上的影響,而大多工業(yè)數(shù)據(jù)具有時序特征。為了充分利用數(shù)據(jù)的時序特征,時序分析法被廣泛應(yīng)用于故障診斷。
互相關(guān)分析是一種用于衡量兩個相關(guān)信號之間相似性強度的算法,通過分析時間序列間的關(guān)聯(lián)信息推斷因果關(guān)系。目前,已有多個領(lǐng)域的故障診斷算法采用互相關(guān)分析算法,例如,監(jiān)測可變負載和變速齒輪箱狀態(tài)[58]、輸電線路故障診斷[59]、識別變壓器故障[60]等。格蘭杰因果分析通過對工業(yè)過程參數(shù)的分析,明確過程參數(shù)之間變化的因果關(guān)系,構(gòu)建相應(yīng)的因果拓撲圖[61]。在工業(yè)故障診斷領(lǐng)域,已有學(xué)者將格蘭杰因果分析用于處理過程變量之間的相關(guān)影響以及確定它們之間因果關(guān)系[61-63]?;ハ嚓P(guān)分析算法易于建模和自動化,同時對因果圖的解釋簡單,診斷效率高,但是它難以區(qū)分復(fù)雜工業(yè)系統(tǒng)中時間序列之間的直接或間接因果關(guān)系。格蘭杰因果分析算法對數(shù)據(jù)選擇具有魯棒性,計算負荷較低,得到了很好的工業(yè)應(yīng)用。
在數(shù)據(jù)驅(qū)動與領(lǐng)域經(jīng)驗結(jié)合的階段中,這些數(shù)字化方法對人工經(jīng)驗的依賴程度較小,可以在缺乏先驗知識的情況下進行故障診斷,有助于在不同的領(lǐng)域進行數(shù)據(jù)驅(qū)動的研究和分析。然而,這些數(shù)字化方法在故障診斷過程中面臨較高的復(fù)雜性,在特征工程方面仍然存在一定的挑戰(zhàn)性,特征工程可以顯著影響分析結(jié)果的準確性和可解釋性。
隨著數(shù)字化技術(shù)的發(fā)展,知識圖譜、深度學(xué)習(xí)、圖神經(jīng)網(wǎng)絡(luò)等方法的出現(xiàn)減少了特征工程的需求,降低了特征工程的復(fù)雜性,提升了故障診斷算法的學(xué)習(xí)能力和準確率。在數(shù)據(jù)驅(qū)動主導(dǎo)與可解釋性結(jié)合階段,故障診斷數(shù)字化技術(shù)通過學(xué)習(xí)工業(yè)系統(tǒng)在正常和異常工況下的歷史數(shù)據(jù)特征,根據(jù)學(xué)習(xí)到的特征識別機器狀態(tài),進而達到故障診斷以及原因追溯的目的。
反向傳播網(wǎng)絡(luò)作為一種自適應(yīng)模式的淺層神經(jīng)網(wǎng)絡(luò),具有良好的適應(yīng)性和學(xué)習(xí)能力[64]。基于反向傳播網(wǎng)絡(luò)[65]的故障診斷如圖2所示。Zhao等人[66]利用二次函數(shù)對軌道電路數(shù)據(jù)特征進行提取,并訓(xùn)練一個反向傳播神經(jīng)網(wǎng)絡(luò),進行調(diào)諧單元的故障診斷。Ngaopitakkul等人[67]采用離散小波變換分解信號高頻分量,構(gòu)建基于反向傳播網(wǎng)絡(luò)的決策算法。Zhang等人[68]基于改進的時間同步平均算法提取齒輪狀態(tài)特征,然后訓(xùn)練反向傳播網(wǎng)絡(luò)識別齒輪芯片級別。在算法優(yōu)化方面,Yu等人[69]利用自適應(yīng)遺傳算法優(yōu)化反向傳播網(wǎng)絡(luò),實現(xiàn)液體火箭發(fā)動機的實時故障檢測。反向傳播網(wǎng)絡(luò)算法能夠從工業(yè)數(shù)據(jù)中學(xué)習(xí)到診斷知識,識別出機器的多種狀態(tài),但是基于反向傳播網(wǎng)絡(luò)的診斷算法的復(fù)雜度大大增加,存在過擬合的問題,可解釋性較差。
圖2 基于反向傳播網(wǎng)絡(luò)[65]的故障診斷
深度學(xué)習(xí)方法包括深度置信網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)以及圖神經(jīng)網(wǎng)絡(luò)等。深度置信網(wǎng)絡(luò)是一種具有許多神經(jīng)元隱藏層的生成模型,由多個受限玻爾茲曼機(restricted Boltzmann machine,RBM)堆疊而成[70]?;谏疃戎眯啪W(wǎng)絡(luò)[71]的故障診斷如圖3所示,有以下兩個特點,其一,它特殊的結(jié)構(gòu)使其能夠自適應(yīng)地提取復(fù)雜特征;其二,深度置信網(wǎng)絡(luò)在處理高維和非線性數(shù)據(jù)方面具有優(yōu)勢[72]。Zhao等人[72]提出一種基于深度置信網(wǎng)絡(luò)的模擬電路故障診斷方法,簡化了診斷設(shè)計;Qin等人[73]設(shè)計一種基于深度置信網(wǎng)絡(luò)的在線電纜故障識別算法,相較于傳統(tǒng)淺層神經(jīng)網(wǎng)絡(luò),該算法在準確性方面有了一定提升。一些學(xué)者針對不同領(lǐng)域的故障診斷算法進行相應(yīng)的改進,例如,Shao等人[74]針對滾動軸承故障識別提出了一種基于自適應(yīng)深度置信網(wǎng)絡(luò)的故障診斷方法;Zhang等人[70]提出了一種基于可擴展深度置信網(wǎng)絡(luò)的化學(xué)過程故障診斷模型。深度置信網(wǎng)絡(luò)適用于處理高維和非線性數(shù)據(jù),能夠表征系統(tǒng)數(shù)據(jù)與故障特征之間的映射關(guān)系,但是該診斷模型結(jié)構(gòu)較為復(fù)雜,難以訓(xùn)練,收斂速度慢。
圖3 基于深度置信網(wǎng)絡(luò)[71]的故障診斷
卷積神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò),因其具有強的局部特征提取能力和靈活的結(jié)構(gòu),在故障診斷領(lǐng)域得到廣泛的使用[75],基于卷積神經(jīng)網(wǎng)絡(luò)[76]的故障診斷如圖4所示。例如,Janssens等人[77]將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于軸承故障檢測,提出狀態(tài)監(jiān)測特征學(xué)習(xí)模型;Wu等人[78]和Pan等人[79]分別將深度卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于化工過程故障診斷和機器人故障診斷;Zhang等人[80]提出了基于卷積神經(jīng)網(wǎng)絡(luò)的制造系統(tǒng)故障診斷算法,完成了特征提取和故障診斷。目前,相關(guān)研究主要關(guān)注故障類型分布不平衡以及多故障容易與單故障混淆等問題,Chen等人[81]提出了基于隨機過采樣的隨機離散時間序列深度卷積神經(jīng)網(wǎng)絡(luò)算法,利用時序特點提高診斷性能。
圖4 基于卷積神經(jīng)網(wǎng)絡(luò)[76]的故障診斷
循環(huán)神經(jīng)網(wǎng)絡(luò)是一種處理時間序列數(shù)據(jù)的框架,具有記憶歷史信息的能力,適合于動態(tài)故障診斷[82]。基于循環(huán)神經(jīng)網(wǎng)絡(luò)[83]的故障診斷如圖5所示。長短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)因其具備學(xué)習(xí)長程依賴關(guān)系的能力,在故障診斷領(lǐng)域受到了關(guān)注,例如,Wu等人[84]提出了基于LSTM網(wǎng)絡(luò)的設(shè)備退化序列故障預(yù)測算法;Lee等人[85]使用基于注意力的LSTM算法診斷匝間短路故障;Chadha等人[86]設(shè)計基于雙向LSTM的狀態(tài)監(jiān)測和故障診斷的新方法,該方法允許處理更長時間序列內(nèi)的變量關(guān)系;Kang等人[87]使用LSTM網(wǎng)絡(luò)進行復(fù)雜化學(xué)過程的早故障診斷?,F(xiàn)有的故障診斷方法大多只關(guān)注故障類型的識別,忽視了設(shè)備性能退化的問題。對此,Qin等人[88]提出多重卷積循環(huán)神經(jīng)網(wǎng)絡(luò),同時診斷故障類型和監(jiān)測性能退化狀態(tài)。循環(huán)神經(jīng)網(wǎng)絡(luò)具有記憶歷史信息的能力,能夠處理更長時間范圍內(nèi)的故障關(guān)系,有利于避免關(guān)鍵過程故障,但是該網(wǎng)絡(luò)存在梯度消失的問題,且診斷模型較為復(fù)雜,難以訓(xùn)練。
圖5 基于循環(huán)神經(jīng)網(wǎng)絡(luò)[83]的故障診斷
圖神經(jīng)網(wǎng)絡(luò)在非歐幾里得空間對圖數(shù)據(jù)具有強大的建模能力,度量未知故障和已知故障之間的相似度,基于圖神經(jīng)網(wǎng)絡(luò)[89]的故障診斷如圖6所示。目前,在故障診斷領(lǐng)域,應(yīng)用范圍最廣的GNN架構(gòu),分別是圖卷積神經(jīng)網(wǎng)絡(luò)(graph convolutional neural network,GCN)、圖注意力網(wǎng)絡(luò)(graph attention network,GAN)。GCN適用于挖掘故障類型與過程變量之間的復(fù)雜非線性關(guān)系,還能通過鄰接矩陣表示未知樣本與標記樣本之間的相似度[90]。例如,Liao等人[90]提出了一種基于GCN的變壓器故障診斷算法,Zhang等人[91]基于深度GCN架構(gòu)設(shè)計了一種基于聲學(xué)信息的軸承故障診斷方案,Wang等人[92]提出了一種基于振動的GCN的軸承故障診斷算法。由于GCN存在著諸多局限性,一些學(xué)者針對這些局限性給出了相應(yīng)的解決方案。例如,Chen等人[93]采用基于結(jié)構(gòu)分析的GCN故障診斷模型來解決GCN嚴重依賴標記數(shù)據(jù)集這一問題;Li等人[94]提出了一種多感受野GCN算法,用于解決GCN感受野固定的局限性,并應(yīng)用于故障診斷。針對小樣本機械故障診斷困難的問題,Gao等人[95]提出基于半監(jiān)督GCN的旋轉(zhuǎn)機械故障智能診斷算法。GCN模型的性能取決于鄰接矩陣,為了更好地表示與相鄰節(jié)點的連接關(guān)系,GAN被提出。GAN將注意力機制用于度量不同樣本之間的相似度,同時更關(guān)注其他樣本的特征[96]。目前,GAN已被應(yīng)用于多個故障診斷領(lǐng)域,例如,柴油機工況識別模型[96]、軸承故障診斷[97]。實際工業(yè)過程會不斷出現(xiàn)新的故障類型,為了使新的故障類型能夠在第一次出現(xiàn)后就能被迅速識別,Long等人[98]采用自適應(yīng)GAN實現(xiàn)元學(xué)習(xí)器,使其具有元知識學(xué)習(xí)能力。GNN既可以挖掘系統(tǒng)狀態(tài)數(shù)據(jù)與故障特征之間復(fù)雜的非線性關(guān)系,還可以度量未知故障與已知故障之間的相似度,但是模型靈活性較差,且有限的感受野限制了其在故障數(shù)據(jù)特征表示方面的有效性。
圖6 基于圖神經(jīng)網(wǎng)絡(luò)的故障診斷
在數(shù)據(jù)驅(qū)動主導(dǎo)與可解釋性結(jié)合的階段,反向傳播網(wǎng)絡(luò)、深度置信網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)相對于強依賴特征工程的機器學(xué)習(xí)算法,具有良好的適應(yīng)性和學(xué)習(xí)能力,能夠處理高維、多源的工業(yè)數(shù)據(jù)。然而,這些模型的可解釋性相對較差。相比之下,圖神經(jīng)網(wǎng)絡(luò)在這方面具有顯著優(yōu)勢:一方面,相較于第一階段,它建模的圖網(wǎng)絡(luò)是直接從工業(yè)數(shù)據(jù)中學(xué)習(xí)的,對專家經(jīng)驗依賴度低;另一方面,相較于第二階段,它有更好的故障追溯能力,因此可解釋性更強,從而很好地體現(xiàn)出數(shù)據(jù)驅(qū)動和可解釋性等特點。
工業(yè)系統(tǒng)運行數(shù)據(jù)具有海量、高維、異構(gòu)性以及時序性等特點,如何有效地挖掘數(shù)據(jù)中潛在故障的因果關(guān)系是建立復(fù)雜系統(tǒng)模型的關(guān)鍵問題之一。數(shù)字化的方法正逐漸減少對領(lǐng)域知識的依賴,并轉(zhuǎn)向以數(shù)據(jù)為主導(dǎo),提高了故障診斷的效率和準確率,但是仍然面臨數(shù)據(jù)標注少、追溯難等問題,具體如下。
● 在實際應(yīng)用中,一方面存在數(shù)據(jù)收集困難、標注代價高等問題;另一方面由于現(xiàn)今系統(tǒng)的完備性和抗干擾性強,收集到的系統(tǒng)故障樣本較少,雖然數(shù)據(jù)量大,但有效信息少,這增加了故障診斷與追溯的難度。因此,如何處理好小樣本問題是提升診斷模型泛化性和準確率的關(guān)鍵。
● 復(fù)雜工業(yè)系統(tǒng)內(nèi)部各個組件、各個單元相互制約,具有層次性、傳播性等特點,使得在一個時間節(jié)點上發(fā)生的故障很有可能引起后續(xù)短時間內(nèi)其他組件功能異常,甚至多個故障并發(fā)。但是目前的故障診斷與追溯模型大多只關(guān)注單故障診斷問題,多故障診斷問題也是很值得探究的問題。
● 圖神經(jīng)網(wǎng)絡(luò)的發(fā)展給可解釋性故障診斷和追溯提供了支持,如何將時序和圖方法結(jié)合,既考慮動態(tài)性又考慮工業(yè)數(shù)據(jù)之間的關(guān)系,成為故障診斷和追溯問題的重點研究方向之一。
本文對工業(yè)故障診斷數(shù)字化方法的國內(nèi)外研究現(xiàn)狀進行了分析,從領(lǐng)域經(jīng)驗主導(dǎo)、數(shù)據(jù)驅(qū)動與領(lǐng)域經(jīng)驗結(jié)合、數(shù)據(jù)驅(qū)動主導(dǎo)與可解釋性結(jié)合3個階段進行介紹。隨著數(shù)據(jù)的積累,故障診斷所依賴的數(shù)據(jù)基礎(chǔ)變得更加豐富。在故障診斷中引入數(shù)字化方法有助于提升工業(yè)領(lǐng)域關(guān)鍵環(huán)節(jié)的可靠性和生產(chǎn)效率,這些為工業(yè)數(shù)字化轉(zhuǎn)型提供了技術(shù)和方法的支撐,促進了工業(yè)生產(chǎn)的智能化和可持續(xù)發(fā)展。