張宏樂,韓雪華,史 凱,任賀賀,徐 磊,錢恒昌,李 燦,李方迪,黃 璜
(1.兗礦能源集團(tuán)股份有限公司 濟(jì)寧二號煤礦,山東 濟(jì)寧 273599; 2.兗礦能源集團(tuán)股份有限公司 山東煤炭科技研究院分公司,山東 濟(jì)南 250117)
礦井提升機(jī)作為連接煤礦井下與地面的關(guān)鍵設(shè)備,擔(dān)負(fù)提升煤炭、矸石,下放材料,升降人員和設(shè)備的任務(wù),其運行狀況將直接影響礦山生產(chǎn)人員的生命安全和礦井的生產(chǎn)能力[1-3]。軸承是提升機(jī)系統(tǒng)的關(guān)鍵部件之一,其一旦發(fā)生故障,將帶來提升機(jī)安全隱患,因此,研究提升機(jī)軸承狀態(tài)監(jiān)測與故障診斷對保障礦井提升機(jī)安全穩(wěn)定運行具有理論意義和工程價值。
近年來,隨著人工智能與物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,智能故障診斷方法逐漸成為研究熱點[4],目前,基于深度學(xué)習(xí)和遷移學(xué)習(xí)的框架被研究人員常用于機(jī)械設(shè)備故障診斷[5,6],并取得了許多研究成果。張西寧等[7]利用預(yù)訓(xùn)練-微調(diào)的遷移學(xué)習(xí)方法,提出將源域樣本訓(xùn)練得到的模型參數(shù)遷移至目標(biāo)域,對深度模型的參數(shù)進(jìn)行微調(diào),使其適用于目標(biāo)域樣本的故障識別與分類。Zhiyi等[8]提出一種提出了一種增強(qiáng)型深度自解碼器,利用足量的源域故障樣本訓(xùn)練模型,再通過參數(shù)遷移與微調(diào)的方法使模型適用于目標(biāo)域樣本的故障識別與分類。然而,由于實際工作環(huán)境下的機(jī)械設(shè)備常處于高溫、高速和變負(fù)載的狀態(tài),基于深度學(xué)習(xí)的故障診斷模型存在以下主要問題[5-9]:①缺少足量有標(biāo)簽故障樣本。由于機(jī)械設(shè)備在實際工作中處于變工況,因此獲取足量的不同工況下故障樣本的難度大;②變工況導(dǎo)致實際故障樣本與訓(xùn)練樣本間存在分布差異,而大多數(shù)基于深度學(xué)習(xí)的故障診斷模型是在訓(xùn)練樣本與測試樣本同分布的假設(shè)下訓(xùn)練得到的;③由于前兩個問題,使目前大多數(shù)基于深度學(xué)習(xí)的故障診斷模型對實際工業(yè)場景下的機(jī)械設(shè)備故障診斷效果不佳,無法直接推廣到實際工程應(yīng)用。 遷移學(xué)習(xí)作為克服上述問題的一個有前景的方向,近年來也受到許多研究者的關(guān)注,將其運用于變工況下的機(jī)械設(shè)備故障診斷。 將已有工況下的帶標(biāo)簽故障樣本數(shù)據(jù)作為源域,而其他工況下無標(biāo)簽故障數(shù)據(jù)作為目標(biāo)域,遷移學(xué)習(xí)能夠利用源域和目標(biāo)域樣本訓(xùn)練跨域故障診斷模型,實現(xiàn)對無標(biāo)簽?zāi)繕?biāo)域數(shù)據(jù)的故障識別和分類[7,8]。但是,現(xiàn)有的遷移學(xué)習(xí)故障診斷方法通常缺乏對訓(xùn)練數(shù)據(jù)在模型訓(xùn)練過程中的完備性的考慮,在實際工業(yè)場景下,描述機(jī)械設(shè)備狀態(tài)的目標(biāo)域數(shù)據(jù)采集往往按照在線獲取的序列方式,無法滿足數(shù)據(jù)在模型訓(xùn)練過程中的完備性假設(shè),導(dǎo)致無法解決數(shù)據(jù)按照序列方式到達(dá)的在線識別問題[2,10]。
針對上述問題,本文提出一種融合邊緣節(jié)點的遷移故障診斷架構(gòu),以提升機(jī)軸承為應(yīng)用對象,實現(xiàn)變工況下的提升機(jī)軸承在線故障診斷。并提出了一種基于ResNet與多核聯(lián)合分布差異的遷移故障診斷算法(RN-MK-JDD),利用足量帶標(biāo)簽源域樣本與無標(biāo)簽?zāi)繕?biāo)域故障樣本訓(xùn)練深度遷移故障診斷模型;邊緣診斷層基于訓(xùn)練好的深度遷移故障診斷模型參數(shù),重構(gòu)模型,進(jìn)而對本地存儲的狀態(tài)數(shù)據(jù)進(jìn)行故障特征的識別。最后,在上述提出的故障診斷框架基礎(chǔ)上,構(gòu)建提升機(jī)檢測診斷平臺,實現(xiàn)了對礦井提升機(jī)運行狀態(tài)的監(jiān)測與在線診斷。
基于數(shù)據(jù)驅(qū)動的提升機(jī)狀態(tài)監(jiān)測與故障診斷是在提升機(jī)運行過程中的狀態(tài)數(shù)據(jù)基礎(chǔ)上,分析和挖掘故障特征,實現(xiàn)智能診斷。目前,大多研究者采用中央云服務(wù)器集中處理訓(xùn)練樣本和訓(xùn)練模型,這種模式優(yōu)點是能夠按需分配計算資源,降低成本并為煤炭生產(chǎn)管理過程中其他部門提供數(shù)據(jù)挖掘,分析和決策能力[1]。但是,這種集中處理的模式在當(dāng)前快速發(fā)展的智能礦山建設(shè)中存在一些問題[1,2,10]:①由于自動化礦山設(shè)備越來越多,以及5G遠(yuǎn)程作業(yè),煤礦井下環(huán)境監(jiān)測以及智能礦車等推廣,集中處理的模式會造成大量延時,進(jìn)而影響此類系統(tǒng)的正常工作;②海量數(shù)據(jù)造成網(wǎng)絡(luò)擁堵,中央云服務(wù)器負(fù)載壓力大,進(jìn)而存在降低礦山網(wǎng)絡(luò)的穩(wěn)定性和可靠性的風(fēng)險;③目前大多數(shù)故障診斷方法缺乏對訓(xùn)練數(shù)據(jù)在模型訓(xùn)練過程中的完備性的考慮,對于數(shù)據(jù)按照序列方式到達(dá)的在線故障狀態(tài)識別,存在一定的局限。
為解決上述問題,本文采用融合邊緣節(jié)點的方式構(gòu)建新的故障診斷架構(gòu)。通過增加邊緣節(jié)點來分擔(dān)一部分中央云服務(wù)器的工作量,邊緣節(jié)點的功能包括三個方面:①原始數(shù)據(jù)預(yù)處理。按照序列方式到達(dá)的原始傳感器數(shù)據(jù),采用時頻分析方法預(yù)處理,去除原始數(shù)據(jù)中存在的噪聲以及干擾信息,再提取時頻特征后存儲于邊緣計算中臺;②故障模式推理。邊緣計算中臺根據(jù)中央云服務(wù)器下發(fā)的故障診斷模型參數(shù),對本地存儲的時頻特征數(shù)據(jù)進(jìn)行故障模式識別與推理,以及上傳本地存儲數(shù)據(jù)至中央云服務(wù);③邊緣計算中臺根據(jù)故障模式識別與推理的結(jié)果,通過網(wǎng)絡(luò)交換機(jī)和網(wǎng)關(guān)等設(shè)備,像控制設(shè)備的PLC控制器輸出報警信息,控制設(shè)備停機(jī)等。中央云服務(wù)器功能包括:①煤礦管理的控制中心服務(wù)器,和煤礦的其他部分管理應(yīng)用服務(wù);②數(shù)據(jù)存儲服務(wù)器,用于存儲邊緣節(jié)點層上傳的多傳感器數(shù)據(jù)和煤礦井下其他數(shù)據(jù);③應(yīng)用服務(wù)器,部署煤礦井下應(yīng)用服務(wù),包括開展基于人工智能算法的故障診斷模型的在線訓(xùn)練,再將訓(xùn)練好的模型參數(shù)經(jīng)網(wǎng)絡(luò)層傳輸?shù)竭吘壒?jié)點。融合邊緣節(jié)點的遷移故障診斷架構(gòu)和邊緣節(jié)點的功能結(jié)構(gòu)分別如圖1和圖2所示。
圖1 融合邊緣節(jié)點的遷移故障診斷架構(gòu)
圖2 邊緣診斷層功能結(jié)構(gòu)
近年來,經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)[11]憑借其強(qiáng)大的深度特征提取能力,被許多研究者應(yīng)用于故障診斷領(lǐng)域。但是,隨著網(wǎng)絡(luò)深度的增加,會出現(xiàn)梯度爆炸和衰減等問題,從而導(dǎo)致故障診斷準(zhǔn)確率飽和甚至下降[11]。對此,深度殘差網(wǎng)絡(luò)(Deep Residual Network,ResNet)[12]采用殘差神經(jīng)網(wǎng)絡(luò)來改進(jìn)特征提取方式,能夠克服經(jīng)典CNN網(wǎng)絡(luò)的梯度爆炸和衰減等問題。ResNet的核心是殘差單元模塊,如圖3(a) 所示,主要由權(quán)重層,批量歸一化層(BN)和ReLU構(gòu)成。圖3中X為神經(jīng)網(wǎng)絡(luò)的輸入,Y為輸出,ResNet通過訓(xùn)練,使有參層學(xué)習(xí)到一個殘差映射f:X→Y-X,最后通過與X求和獲得輸出Y。與CNN相比,這種學(xué)習(xí)殘差映射的方式能夠有效降低映射的學(xué)習(xí)難度并提高模型收斂速率,能夠避免CNN深度過大而導(dǎo)致的模型退化問題[12]。ResNet的結(jié)構(gòu)如圖3(b)所示,主要包括卷積層、池化層,多個殘差單元模塊,全連接層和分類層。
本文采用ResNet-18作為深度特征提取器,從時頻特征中進(jìn)一步挖掘故障特征,提高故障診斷精度。ResNet-18的網(wǎng)絡(luò)參數(shù)見表1。
圖3 標(biāo)準(zhǔn)殘差單元模塊與ResNet結(jié)構(gòu)
表1 ResNet-18網(wǎng)絡(luò)的詳細(xì)結(jié)構(gòu)參數(shù)
2.2.1 最大均值差異(MMD)
MMD[13]是遷移學(xué)習(xí)模型中被廣泛應(yīng)用的一種用于度量源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)間分布差異的方法。假設(shè)有源域DS={XS,YS}和目標(biāo)域DT={XT},XS與XT分別為源域和目標(biāo)域的樣本數(shù)據(jù),YS為源域樣本的類別標(biāo)簽。源域和目標(biāo)域的邊緣分布與條件分布分別為PS,PT,QS和QT?;贛MD分別計算源域和目標(biāo)域間的邊緣分布與條件分布差異,邊緣分布差異的表達(dá)式如下:
式中,φ表示一個將數(shù)據(jù)映射到再生核希爾伯特空間H的一個非線性映射函數(shù)。nS和nT分別為源域和目標(biāo)域樣本數(shù)。條件分布差異的表達(dá)式如下:
式中,c∈[1,2,…,C],C為樣本的類別數(shù)。
2.2.2 聯(lián)合分布差異(JDD)
聯(lián)合分布適應(yīng)[14]是一種旨在減小源域與目標(biāo)域樣本間邊緣分布和條件分布差異的特征遷移學(xué)習(xí)方法,在式(1)和式(2)基礎(chǔ)上,通過擴(kuò)展非參數(shù)MMD獲得聯(lián)合分布差異來度量邊緣分布和條件分布的差異,實現(xiàn)對兩種分布的適配,聯(lián)合分布差異的表達(dá)式如下:
2.2.3 多核聯(lián)合分布差異(MK-JDD)
式(1)和式(2)中的再生核希爾伯特空間H選擇不同的內(nèi)核時,會對源域和目標(biāo)域間分布差異的度量產(chǎn)生重要影響,相關(guān)研究表明,與單一核的MMD相比,多個不同內(nèi)核混合的MMD,能夠提高遷移學(xué)習(xí)模型的自適應(yīng)效率。因此,本文使用多個內(nèi)核的Hk:
式中,K為內(nèi)核總數(shù),kθi為帶寬為θi的高斯核?;谑?1)—(4),MK-JDD的表達(dá)式如下:
本文提出的基于ResNet與MK-JDD的遷移故障診斷框架(RN-MK-JDD)整體結(jié)構(gòu)如圖4所示,主要包括三個部分,數(shù)據(jù)采集與信號處理,遷移故障診斷模型訓(xùn)練和故障模式識別。
1)數(shù)據(jù)采集與信號處理:利用振動傳感器采集提升機(jī)運行過程中的軸承振動信號,為過濾原始振動信號中的噪聲以及干擾信號,采用經(jīng)典時頻分析方法小波包變換對原始信號進(jìn)行分解,提取時頻特征,構(gòu)建時頻圖像作為ResNet的輸入。
2)遷移故障診斷模型訓(xùn)練:將第一步獲得的分別來自源域有標(biāo)簽樣本和目標(biāo)域無標(biāo)簽樣本的時頻圖像作為ResNet的輸入樣本。為了提高ResNet提取可遷移深度特征的性能,降低源域與目標(biāo)域間的分布差異,本文在ResNet的優(yōu)化目標(biāo)中引入MK-JDD,對每一個殘差單元模塊提取出的源域和目標(biāo)域的深度特征進(jìn)行分布差異度量,同時計算邊緣分布差異和條件分布差異,并不斷最小化ResNet總體損失。MK-JDD作為損失項的表達(dá)式如下:
式中,Hk表示在不同內(nèi)核k下的再生核希爾伯特空間;Ul和Vl分別為在第l個殘差塊提取出的源域和目標(biāo)域的深度特征的分布;Nl為ResNet殘差塊的層數(shù)。除了MK-JDD損失項外,ResNet的訓(xùn)練過程中還包含Softmax分類器的交叉熵?fù)p失LC,用以度量模型對源域故障樣本的預(yù)測標(biāo)簽和真實標(biāo)簽間差異。本文提出的RN-MK-JDD框架的損失項如下:
LRN-MK-JDD=LC+αMK-JDDLJDD
(7)
式中,αMK-MMD表示損失項的平衡因子,其取值范圍在0~1之間。
3)故障模式識別:在第二步得到的RN-MK-JDD遷移故障診斷模型基礎(chǔ)上,對目標(biāo)域無標(biāo)簽測試樣本進(jìn)行模式識別與分類,輸出對應(yīng)類別標(biāo)簽,計算遷移故障診斷準(zhǔn)確率。
2.4.1 基于美國凱斯西儲大學(xué)軸承故障數(shù)據(jù)的實驗驗證
本文分別采用2hp和3hp下的12種軸承故障振動數(shù)據(jù)開展實驗驗證,實驗數(shù)據(jù)與文獻(xiàn)[15-17]中的相同。為驗證MK-JDD損失項對于提高模型的遷移故障診斷性能的有效性,本文設(shè)置由多種經(jīng)典機(jī)器學(xué)習(xí)方法構(gòu)建的故障診斷對比模型見表2。以SVM-FD與TCA-SVM-FD為例,SVM-FD表示原始故障信號經(jīng)時頻分析方法提取時頻特征后輸入SVM,獲得故障模式識別結(jié)果;TCA-SVM-FD表示信號經(jīng)時頻分析方法處理后再運用遷移成分分析(Transfer Component Analysis,TCA)處理后輸入SVM,獲得故障診斷結(jié)果。TCA與JDA是經(jīng)典的基于特征的遷移學(xué)習(xí)方法。RN-FD模型是在RN-MK-JDD模型基礎(chǔ)上去除MK-JDD損失項。
表2 經(jīng)典機(jī)器學(xué)習(xí)方法構(gòu)建的故障診斷對比模型
實驗?zāi)P途捎貌捎?hp下的有標(biāo)簽故障數(shù)據(jù)作為源域,2hp下的無標(biāo)簽故障數(shù)據(jù)作為目標(biāo)域,遷移故障診斷任務(wù)為,源域有標(biāo)簽故障數(shù)據(jù)與目標(biāo)域無標(biāo)簽故障數(shù)據(jù)用于訓(xùn)練遷移故障診斷模型,對目標(biāo)域無標(biāo)簽測試樣本進(jìn)行故障模式識別與分類。表2中各模型的最大遷移故障診斷準(zhǔn)確率見表3。
表3 故障診斷對比模型的最大故障 遷移故障診斷準(zhǔn)確率
根據(jù)表3的故障診斷結(jié)果,RN-MK-JDD模型的最大故障診斷準(zhǔn)確率高于其他模型,達(dá)到100%,具有明顯的優(yōu)勢,表明該診斷模型能夠?qū)?2種軸承狀態(tài)數(shù)據(jù)均做出正確的分類預(yù)測。與RN-FD模型相比,診斷準(zhǔn)確率高出14.37%,表明引入MK-JDD損失項能夠明顯提高模型遷移故障診斷性能,進(jìn)而驗證了本文提出的RN-MK-JDD模型的有效性與優(yōu)越性。
2.4.2 基于SQI-MFS試驗臺軸承故障數(shù)據(jù)的實驗驗證
為進(jìn)一步驗證本文提出的RN-MK-JDD遷移故障診斷模型的適應(yīng)性,采用SQI-MFS試驗臺的軸承故障數(shù)據(jù)開展與2.4.1節(jié)相同的實驗。
本文采用該試驗臺在1800r/min和1200r/min轉(zhuǎn)速下的10種軸承故障數(shù)據(jù)開展遷移故障診斷實驗驗證,實驗數(shù)據(jù)與文獻(xiàn)[15]中的SQI-MFS軸承故障數(shù)據(jù)相同。實驗設(shè)置與2.4.1節(jié)類似,采用1800r/min下的有標(biāo)簽故障樣本作為源域,1200r/min下的無標(biāo)簽故障樣本作為目標(biāo)域。表2中各模型的最大遷移故障診斷準(zhǔn)確率見表4。根據(jù)實驗結(jié)果可知,RN-MK-JDD模型的遷移故障診斷性能最優(yōu),能夠達(dá)到91%的故障診斷準(zhǔn)確率,明顯高于其他模型,相比RN-FD模型,高出15.5%。
表4 故障診斷對比模型的最大故障 遷移故障診斷準(zhǔn)確率
綜合上述實驗結(jié)果分析,結(jié)論如下:
1)本文提出的RN-MK-JDD遷移故障診斷模型在CWRU軸承故障數(shù)據(jù)和SQI-MFS試驗臺軸承故障數(shù)據(jù)下,均能夠取得理想的遷移故障診斷準(zhǔn)確率,表明該模型對于變工況下的提升機(jī)軸承故障狀態(tài)識別有應(yīng)用潛力。
2)通過與RN模型對比,引入了MK-JDD損失項后,能夠明顯提升故障診斷模型的跨域診斷性能,提高診斷準(zhǔn)確率。
提升機(jī)檢測平臺包含以下幾個部分:
1)多傳感器數(shù)據(jù)實時采集與監(jiān)測。為充分感知提升機(jī)運行過程中的狀態(tài),圖1中的多源數(shù)據(jù)感知層通過加裝多種傳感器(振動、電壓/電流、電渦流、溫度、聲發(fā)射等)采集提升機(jī)運行過程中的信號。采集到的多傳感器數(shù)據(jù)在邊緣診斷層進(jìn)行數(shù)據(jù)清洗與本地存儲,再將數(shù)據(jù)進(jìn)一步傳輸至云計算服務(wù)中心。
2)智能算法配置管理與在線診斷。提升機(jī)檢測診斷平臺中集成了基礎(chǔ)算法庫,包括基礎(chǔ)數(shù)學(xué)計算、現(xiàn)代信號分析方法、特征工程算法和人工智能判識算法,能夠滿足故障信號分析、統(tǒng)計特征提取、故障狀態(tài)判識等應(yīng)用功能,實現(xiàn)對應(yīng)信號的實時在線分析和故障診斷?;趶亩嘣磾?shù)據(jù)感知層采集到的歷史數(shù)據(jù)和行業(yè)技術(shù)專家提供的工程經(jīng)驗知識,運用統(tǒng)計、聚類、關(guān)聯(lián)分析、回歸分析、時間序列分析等大數(shù)據(jù)挖掘手段分析各類狀態(tài)數(shù)據(jù)的關(guān)聯(lián)關(guān)系及演化規(guī)律,通過大量數(shù)據(jù)的多維統(tǒng)計、挖掘分析和知識聚合,建立基于數(shù)據(jù)驅(qū)動的狀態(tài)評價、故障診斷和剩余壽命預(yù)測模型。
3)特征趨勢分析。提升機(jī)檢測診斷平臺中還集成多分析與多維特征分析算法,研發(fā)了實時特征分析服務(wù),實現(xiàn)對采集的高頻傳感數(shù)據(jù)的實時特征分析,并將分析結(jié)果存儲到歷史數(shù)據(jù)庫,研發(fā)了數(shù)據(jù)特征查詢服務(wù),可查詢設(shè)備關(guān)鍵部件特定時間的特征數(shù)據(jù),分析數(shù)據(jù)變化趨勢和超限情況,判斷設(shè)備健康狀態(tài),分析異常出現(xiàn)時間,為狀態(tài)分析和預(yù)測性維保提供支撐。
4)監(jiān)控中心。提升機(jī)檢測診斷平臺的首頁監(jiān)控中心用于直觀的反應(yīng)提升系統(tǒng)中各關(guān)鍵運行參數(shù)和提升狀態(tài)的的具體數(shù)據(jù),包含設(shè)備運行狀態(tài)、關(guān)鍵參數(shù)實時值、設(shè)備告警信息等實時信息,首頁集成關(guān)重統(tǒng)計數(shù)據(jù)/圖表展示,可概覽整個設(shè)備系統(tǒng)當(dāng)天的運行分布、當(dāng)日設(shè)備系統(tǒng)運行效率情況、能源消耗對比展示和設(shè)備異常與故障告警相關(guān)信息,通過首頁者能夠更直觀、全面地了解到設(shè)備運行狀況和設(shè)備健康狀態(tài)。
5)平臺基礎(chǔ)管理功能。本文設(shè)計的提升機(jī)檢測診斷平臺具有完備的基礎(chǔ)數(shù)據(jù)管理功能,包含設(shè)備管理、采集終端管理、點位管理、人員管理、權(quán)限管理等基礎(chǔ)管理模塊。
1)本文提出了一種融合邊緣節(jié)點的遷移故障診斷架構(gòu),包括四個部分:多源數(shù)據(jù)感知層,邊緣節(jié)點層,網(wǎng)絡(luò)層和中央云服務(wù)器層。該框架通過增加邊緣節(jié)點來分擔(dān)一部分中央云服務(wù)器的工作量,解決目前普遍采用中央云服務(wù)器集中處理訓(xùn)練樣本和訓(xùn)練智能診斷模型存在的局限。
2)以提升機(jī)軸承為對象,提出了一種基于ResNet與多核聯(lián)合分布差異的遷移故障診斷算法RN-MK-JDD,利用足量帶標(biāo)簽源域樣本與目標(biāo)域無標(biāo)簽樣本訓(xùn)練得到深度遷移故障診斷模型,實現(xiàn)變工況下的提升機(jī)軸承故障狀態(tài)識別。采用美兩種軸承故障數(shù)據(jù)驗證所提出的RN-MK-JDD模型的有效性與適應(yīng)性。實驗結(jié)果表明該模型中引入的MK-JDD損失項能夠有效提高模型的跨域故障診斷性能,獲得理想的變工況故障診斷結(jié)果。
3)在融合邊緣節(jié)點下的遷移故障診斷框架基礎(chǔ)上,設(shè)計構(gòu)建提升機(jī)檢測診斷平臺,部署于煤礦地面云計算服務(wù)中心,實現(xiàn)了對礦井提升機(jī)運行狀態(tài)的監(jiān)測與關(guān)鍵部件在線故障診斷。