馮銀輝,宋 陽,李務晉,吳雨欣,秦澤宇
(1.北京天瑪智控科技股份有限公司,北京 101399;2.中國礦業(yè)大學(北京) 機電與信息工程學院,北京 100083;3.中國礦業(yè)大學(北京) 化學與環(huán)境工程學院,北京 100083)
采煤機作為綜采工作面的關鍵設備,其在煤礦開采中起著舉足輕重的作用??紤]到采煤機應用場景的復雜性,其設備的退化評估是一個具有挑戰(zhàn)性的問題。采煤機的工作狀態(tài)決定了生產(chǎn)效益,缺乏早期的異常檢測會導致系統(tǒng)產(chǎn)生災難性問題。因此采煤機的異常檢測方法對設備高效穩(wěn)定運行具有重要意義[1-5]。
近年來隨著深度學習技術與硬件的發(fā)展,深度學習的模式識別能力推動了機械設備異常檢測方面的發(fā)展,基于設備歷史工況數(shù)據(jù)的數(shù)據(jù)驅(qū)動方式成為了機械設備異常檢測的可能方法。此外由于振動監(jiān)測在表示故障信息方面具有良好的性能,是目前監(jiān)測機械設備退化的主要監(jiān)測方法[6]。目前通過采集帶標簽數(shù)據(jù)基于深度學習對設備振動信號建模在機械設備異常檢測領域有一定研究[7-10]。
上述數(shù)據(jù)驅(qū)動的方法屬于監(jiān)督學習,依賴于大量標簽數(shù)據(jù)。但在實際煤礦開采過程中,采集到的原始數(shù)據(jù)存在信息缺失問題,帶標簽的數(shù)據(jù)量貧乏甚至難以采集到標簽數(shù)據(jù),且現(xiàn)實世界存在未收集到的故障類型數(shù)據(jù),因此目前的機械設備早期異常檢測多在實驗臺仿真搭建物理模型采集數(shù)據(jù)再進行建模分析,其難以在現(xiàn)場真實環(huán)境得以應用。此外由于異常數(shù)據(jù)與正常數(shù)據(jù)存在極度不平衡問題,常規(guī)的機器學習模型難以達到理想效果[11-16]。
針對這些問題,本文提出了基于孿生神經(jīng)網(wǎng)絡的采煤機異常檢測,該方法主要貢獻如下:提出了一種采煤機運行異常狀態(tài)的弱標簽提取模式克服了數(shù)據(jù)標注的難題,以孿生網(wǎng)絡結(jié)合LSTM-CNN自編碼搭建了采煤機故障狀態(tài)的檢測模型,實現(xiàn)采煤機在工作狀態(tài)中的異常檢測。
采煤機故障可分為截割部故障,牽引部故障,采煤機電控箱故障以及其他類故障,其中采煤機截割部故障主要指采煤機搖臂齒輪箱、截割電機及螺旋滾筒故障3大類。牽引部故障主要是由牽引電機、牽引齒輪箱、牽引塊引起的故障。截割部故障及牽引部故障占總故障約50%左右[17]。
搖臂齒輪箱故障特征通常表現(xiàn)為高速區(qū)高溫、低速區(qū)噪聲異常及漏油。故障發(fā)生的主要原因通常是潤滑不良;搖臂齒輪箱行星系統(tǒng)疲勞磨損;搖臂齒輪箱過負荷運行,工作面地質(zhì)條件差,受沖擊載荷大; 浮動密封損壞漏油; 齒輪潤滑油乳化,潤滑失效等。
截割電機電氣類故障遠高于機械軸承類故障,其中電氣故障主要表現(xiàn)為電機繞阻絕緣失效,機械故障主要表現(xiàn)為電機軸承疲勞磨損失效,振動大。故障發(fā)生的主要原因是電機繞阻老化,高溫跳閘,絕緣失效; 電機進水絕緣失效; 電機軸承疲勞磨損失效; 檢修時異物進入電機內(nèi)部,導致定轉(zhuǎn)子摩擦等。
截割螺旋滾筒故障主要特征表現(xiàn)在滾筒連接螺栓松動斷裂、截齒齒座脫落及滾筒疲勞磨損開裂等故障。故障發(fā)生的主要原因是滾筒安裝方面滾筒連接內(nèi)方頭與搖臂外方頭配合間隙大,引起螺旋滾筒振動大; 工作面地質(zhì)條件差,滾筒負荷、沖擊大,引發(fā)連接螺栓松動且維護不及時;滾筒疲勞磨損,引發(fā)齒座、滾筒體磨損開焊等失效。
牽引塊故障特征主要表現(xiàn)采煤機停機不牽引、振動大、溫度高、牽引電流不平衡、鏈輪、驅(qū)動及惰輪齒輪斷裂、軸承故障等。主要原因為牽引塊部件疲勞磨損; 牽引塊潤滑油不良,各軸承高溫引發(fā)故障。
牽引齒輪箱故障特征主要表現(xiàn)采煤機牽引異常、牽引轉(zhuǎn)矩軸斷裂、溫度高、牽引電流不平衡及密封失效漏油。主要原因為疲勞損壞,引發(fā)齒輪箱軸承齒輪疲勞磨損失效; 工作面工程質(zhì)量差或地質(zhì)條件差,牽引齒輪箱過負荷運行或受到?jīng)_擊;轉(zhuǎn)矩軸質(zhì)量故障,沒有起到應有的機械保護作用;密封失效故障等。
牽引電機故障主要由電機繞阻絕緣失效,或因疲勞老化、或因電機長期過載運行,冷卻流量低溫度高等原因所致,其次因電機軸承質(zhì)量問題,引發(fā)機械故障或?qū)е码姍C轉(zhuǎn)子與定子摩擦故障。
本文采集截割部、牽引部電流溫度共八維數(shù)據(jù)構(gòu)建弱標簽數(shù)據(jù)集,以LSTM-CNN自編碼器結(jié)合孿生神經(jīng)網(wǎng)絡搭建神經(jīng)網(wǎng)絡實現(xiàn)采煤機的異常檢測。
本文構(gòu)建了時空融合的LSTM-CNN Auto-Encoder Siamese(LCAS)神經(jīng)網(wǎng)絡,解決異常信息過少導致的數(shù)據(jù)類別不平衡問題問題,孿生神經(jīng)網(wǎng)絡減弱了類別不平衡對訓練的影響,結(jié)合LSTM與CNN的自編碼神經(jīng)網(wǎng)絡可以實現(xiàn)特征的有效提取。
循環(huán)神經(jīng)網(wǎng)絡(RNN)在處理時序數(shù)據(jù)領域應用廣泛,機械設備的工況數(shù)據(jù)具有天然的時序性。但是,原始的循環(huán)神經(jīng)網(wǎng)絡存在梯度消失或梯度爆炸問題,長短時記憶網(wǎng)絡(LSTM)將長期依賴引入RNN,結(jié)構(gòu)如圖1所示。
圖1 LSTM‘門’結(jié)構(gòu)
LSTM通過門的結(jié)構(gòu)改變cell狀態(tài),門是一種可選地讓信息通過的方式。它由Sigmoid神經(jīng)網(wǎng)絡層和點乘法運算組成,Sigmoid神經(jīng)網(wǎng)絡層輸出0和1之間的數(shù)字代表每個組件可以通過的信息量,LSTM有三個門,用于保護和控制cell的狀態(tài)。在輸入、輸出、忘記過去信息上分別加入了輸入門、輸出門、遺忘門來控制信息通過,緩解了梯度消失或爆炸問題。公式如下:
ft=σ(Wf·[ht-1,Xt]+bf)
(1)
it=σ(Wi·[ht-1,Xt]+bi)
(2)
ot=σ(Wo·[ht-1,Xt]+bo)
(3)
式中,Xt為t時刻的輸入信號;ht-1為上一時刻的輸出信號;Wf、Wi、Wo分別為對應的權重參數(shù);σ為對結(jié)果進行Sigmoid運算。
LSTM的cell包括兩種不同的狀態(tài)信息:一種是長期狀態(tài),另一種是短期記憶。時序數(shù)據(jù)的兩個相鄰的時間步之間,通過在長期狀態(tài)中遺忘不太重要的信息,同時增加過濾的短期記憶的信息,結(jié)合兩者輸入到后續(xù)步驟。LSTM的cell的長期狀態(tài)類似于“高速公路”,cell的狀態(tài)類似車流在高速公路上運行,小的線性操作作用其上如同車輛離開或并入車流,信息很容易保持不變的流過整個高速公路,即使較早時間步長的信息也能攜帶到較后時間步長的細胞中,克服了短時記憶的影響。Cell公式為:
it作為輸入門決定將哪些信息將加入到當前時刻細胞狀態(tài)Ct中。ot作為輸出門與Ct相乘得到輸出信號ht,同時ht也作為下一時間步的輸入信號傳遞到下一階段,其公式為:
ht=ot×tanh(Ct)
(6)
卷積神經(jīng)網(wǎng)絡(CNN)利用卷積運算操作在諸多領域應用特別是圖像相關任務上表現(xiàn)優(yōu)異,諸如,圖像分類,圖像語義分割,圖像檢索,物體檢測等計算機視覺問題,適合處理空間數(shù)據(jù)。本文采用一維卷積神經(jīng)網(wǎng)絡處理一維數(shù)據(jù)。通過卷積層能夠保持數(shù)據(jù)的空間連續(xù)性,提取數(shù)據(jù)的局部特征,池化層采用最大池化降低中間隱含層的維度,減少后續(xù)計算的運算量,并提供了旋轉(zhuǎn)不變性。CNN提供了數(shù)據(jù)的分層表示,將原始信號經(jīng)過逐層的處理,依次識別出部分到整體。
自編碼神經(jīng)網(wǎng)絡,其中編碼器encoder部分將大數(shù)量級的源信息X壓縮,解碼器decoder部分將壓縮后的信息解壓成X,通過對比兩者的誤差,反向傳遞,逐步提升自編碼網(wǎng)絡的準確性,這一過程無需標簽數(shù)據(jù)。其中encoder部分提取了源數(shù)據(jù)的精髓,解碼器將精髓信息解壓,當解壓的結(jié)果與源數(shù)據(jù)一致性很高時,自編碼神經(jīng)網(wǎng)絡就提取到了源數(shù)據(jù)的最具代表性的特征。相比源數(shù)據(jù),encoder部分提取的特征維度大大降低,減少了后續(xù)神經(jīng)網(wǎng)絡訓練的負擔的同時能達到很好的訓練效果。此時將encoder部分輸出結(jié)果輸送到下一環(huán)節(jié)進行處理。
孿生神經(jīng)網(wǎng)絡(Siamese Network)在處理類別不平衡數(shù)據(jù)上有良好的表現(xiàn)。網(wǎng)絡一次接受兩個樣本組成一個樣本對作為輸入,分別輸入到特征提取網(wǎng)絡,將輸入在新的空間映射成兩個特征向量Gw(X1)、Gw(X2),其中兩個特征網(wǎng)絡Network1、Network2共享權值。計算兩個特征向量的相似程度,在訓練過程中通過不斷優(yōu)化損失函數(shù),使兩個相同分類樣本對的相似性盡可能大,兩個異類樣本對的相似性盡可能小,從而達到區(qū)分異常數(shù)據(jù)的目的。損失函數(shù)的定義如下:
(1-Y)max(m-DW,0)2
(7)
式中,DW為某種度量距離;m為設置的相似度閾值,本文選用歐氏距離來計算兩個向量之間的相似性,公式為:
其中,P為樣本特征維數(shù)。
當Y=1即樣本相似時,損失函數(shù)為式(9);當樣本相似時,特征空間歐式距離越小,損失函數(shù)越小,當Y=0,即樣本不相識時,損失函數(shù)為式(10):
當樣本不相似時,其特征空間的歐式距離越大,損失函數(shù)越小。上述損失函數(shù)可以很好的表達成對樣本的匹配程度,有助于模型訓練時提取有效特征。網(wǎng)絡結(jié)構(gòu)如圖2所示。
圖2 孿生神經(jīng)網(wǎng)絡
方法的第一階段涉及從采煤機原始數(shù)據(jù)提取出弱標簽數(shù)據(jù)集。采煤機在綜采工作面具有固定的作業(yè)時間,由于采煤機的往復工作機制,結(jié)合工況信息可以繪制采煤機隨時間變化的運動軌跡,如圖3所示。
圖3 采煤機運動軌跡
圖像的橫軸代表非等長間隔的時間順序,左縱軸代表從采煤機位置架從標號0—150,右縱軸代表在其工作位置停留時間,在作業(yè)狀態(tài)下過高的滯留時間意味著采煤機發(fā)生了異常情況。根據(jù)需求,截取20—120位置架之間的數(shù)據(jù)如圖4所示。
圖4 采煤機局部運動軌跡
根據(jù)時間戳截取采煤機設備的截割部與牽引部的電流溫度數(shù)據(jù)。為采煤機某異常狀態(tài)的8維數(shù)據(jù),如圖5所示。設置滑動時間窗口(500,50),以大小為500(約10min),步幅為50(約1min),滑動截取距離采煤機異常間隔小于10min的長度為500的工況數(shù)據(jù)。以同樣方式滑動截取正常數(shù)據(jù)。
圖5 異常多維數(shù)據(jù)
第二階段的基于LCAS模型的采煤機異常檢測方法具體步驟如下:①對數(shù)據(jù)集進行平穩(wěn)性檢驗與處理;②將數(shù)據(jù)成對輸入到搭建好的LCES模型進行訓練;③選取某月數(shù)據(jù)進行模擬部署,驗證模型檢測效果。
工況數(shù)據(jù)為天然時序數(shù)據(jù),用樣本時序數(shù)據(jù)的均值、方差、協(xié)方差來刻畫時間序列的本質(zhì)特征,這些統(tǒng)計量須保持在未來階段的一個時期內(nèi)維持不變,可被人為樣本時序數(shù)據(jù) 具有平穩(wěn)性。本文通過單位根檢驗(ADF)對時序數(shù)據(jù)平穩(wěn)性進行判定,序列平穩(wěn)就不存在單位根,ADF檢驗的H0假設存在單位根,通過對顯著性檢驗統(tǒng)計量小于三個置信度(10%、5%、1%)則對應有(90%、95%、99%)的把握拒絕原假設,通過對數(shù)據(jù)進行差分以滿足ADF檢驗,作為模型輸入。
樣本對分別輸入并聯(lián)的LSTM、CNN編碼器,提取樣本數(shù)據(jù)特征,對提取到的特征進行相似性度量,通過優(yōu)化損失函數(shù),不斷增大相異類別數(shù)據(jù)提取的特征之間的差異,并使相同類別數(shù)據(jù)對的特征之間的差異更小,實現(xiàn)異常檢測。同時通過解碼器將壓縮的特征還原,通過提升解碼結(jié)果對于原始數(shù)據(jù)的還原度,從而增強編碼器提取的特征的有效性。
實驗中所選取的測試數(shù)據(jù)為某綜采面采煤機一月、二月的工況數(shù)據(jù),包含采煤機截割部、牽引部的電流溫度共八維數(shù)據(jù),通過選取與上文數(shù)據(jù)集制作時相同的滑動窗口,在測試數(shù)據(jù)上按時序滑動截取數(shù)據(jù),模擬采煤機工作產(chǎn)生工況數(shù)據(jù),將截取的數(shù)據(jù)輸入訓練好的模型,輸出采煤機異常與否的判別情況,將結(jié)果與記錄的采煤機急停數(shù)據(jù)對比,完成模型檢驗。
本文通過對歷史工況數(shù)據(jù)構(gòu)建訓練集與驗證集完成對LCAS模型的訓練,原始數(shù)據(jù)存儲在influxdb時序數(shù)據(jù)庫中,通過對原始數(shù)據(jù)清洗重構(gòu)生成csv格式的數(shù)據(jù),選取綜采面采煤機一、二月份工況數(shù)據(jù)作為測試集對模型性能進行檢測,數(shù)據(jù)包含采煤機的截割部、牽引部四個部位的電流、溫度共八維工況數(shù)據(jù)。一月份數(shù)據(jù)共選取約230000個數(shù)據(jù)點,其中包含了18個異常數(shù)據(jù)節(jié)點,通過構(gòu)建大小為500的滑動窗口對一月份數(shù)據(jù)滑窗截取作為一條樣本數(shù)據(jù)進行測試集構(gòu)建,距離異常節(jié)點小于2h的數(shù)據(jù)歸為異常數(shù)據(jù)。測試數(shù)據(jù)統(tǒng)計見表1。
表1 測試數(shù)據(jù)統(tǒng)計量
一、二月份的工況數(shù)據(jù)對LCAS模型檢測結(jié)果見表2、3(將異常情況視為正例),其中TP為被模型預測為正類的正樣本,TN為被模型預測為負類的負樣本,F(xiàn)P為被模型預測為正類的負樣本,F(xiàn)N為被模型預測為負類的正樣本。
表2 一月份工況數(shù)據(jù)模擬部署結(jié)果
表3 二月份工況數(shù)據(jù)模擬部署結(jié)果
一、二月份的工況數(shù)據(jù)對LCAS模型評價指標見表4。
表4 測試結(jié)果評價指標
從上述實驗結(jié)果可以看出,在兩個不同月份測試集上進行部署模擬,整體準確率均在97%以上,對于異常檢測的精準率均在96%以上。漏警率大于10%的原因在于,部署策略通過滑動截取異常數(shù)據(jù),在相對較遠離異常點,即正常與異常數(shù)據(jù)的交界處的數(shù)據(jù)易被誤檢,這也是漏檢易發(fā)生的區(qū)域,隨著越來越接近異常點,檢測的準確率也會隨之提高。從診斷結(jié)果可以看出,基于自編碼孿生神經(jīng)網(wǎng)絡的采煤機異常檢測,通過LCAS模型對構(gòu)建的弱標簽數(shù)據(jù)集學習,可以有效識別出采煤機在工作過程的異常狀況,且模型對數(shù)據(jù)標注需求較低,極大程度的降低了標注成本。
1)結(jié)合采煤機工況信息對采煤機截割部、牽引部工況數(shù)據(jù)進行標定,通過ADF單位根檢驗實現(xiàn)對時序工況數(shù)據(jù)進行平穩(wěn)性檢驗,利用差分實現(xiàn)時序數(shù)據(jù)平穩(wěn)化,完成數(shù)據(jù)集構(gòu)建。
2)基于自編碼孿生神經(jīng)網(wǎng)絡架構(gòu),并聯(lián)LSTM、CNN在時間域、空間域提取不同尺度的特征,通過Concatenate層將特征合并,保證特征的泛化性、魯棒性。通過自編碼結(jié)構(gòu)約束特征能最大程度代表原始數(shù)據(jù),保證所提取的特征的有效性。利用Siamese孿生網(wǎng)絡結(jié)構(gòu)對輸入的數(shù)據(jù)對進行相似性度量,在不平衡數(shù)據(jù)集上檢測出異常數(shù)據(jù)。
3)以某綜采面采煤機工況數(shù)據(jù)搭建模型并進行模擬部署測試,測試結(jié)果表明本文提出的數(shù)據(jù)集構(gòu)建模式及模型,能對采煤機的異常情況作出有效檢測,并且模型具有不錯的泛化能力。