孫洪展
(中國石油大學(華東)計算機科學與技術學院 青島 266580)
隨著物聯(lián)網(wǎng)、大數(shù)據(jù)、云計算等技術的快速發(fā)展以及各領域學科技術的相互融合[1~3],對機械設備的時序數(shù)據(jù)的挖掘和分析顯得尤為重要。時序數(shù)據(jù)[4~5]記錄了設備運行過程中隨著時間而產生的不同時刻的運行狀態(tài)信息,充分利用這些信息對機械設備進行故障預測可以幫助企業(yè)降低經(jīng)濟損失。
機械設備的故障預測是在了解和掌握設備的運行狀態(tài)信息及規(guī)律的基礎上,根據(jù)一定的方法和策略對設備運行狀態(tài)下未來變化趨勢及變化狀態(tài)進行推測,并對未來可能造成損失、故障的情況進行及時預警,實現(xiàn)故障預防、視情維修等目的[6~7]。
早期的故障預測手段主要是根據(jù)專家或維修人員通過經(jīng)驗、感官和儀器儀表等進行判斷,但隨著機械設備的日益復雜化,傳統(tǒng)的分析手段已不滿足現(xiàn)狀。數(shù)據(jù)挖掘技術[8]的廣泛應用,彌補了傳統(tǒng)方法上的不足?;跀?shù)據(jù)驅動的預測技術[9]的典型代表有神經(jīng)網(wǎng)絡、馬爾可夫模型[10]等,通過分析數(shù)據(jù)中隱含信息進行故障預測。
本文提出一種基于GRU 神經(jīng)網(wǎng)絡[11~12]的機械設備故障預測方法。首先,通過CRITIC 算法[13]挖掘設備運行數(shù)據(jù)各參數(shù)之間的權重值[14~15]大小,結合設備歷史故障的特點,確定影響故障發(fā)生的關鍵參數(shù);然后,通過GRU 神經(jīng)網(wǎng)絡對設備歷史數(shù)據(jù)進行模型訓練,通過多次實驗迭代模型訓練結果[16];最后,使用該模型對設備實時數(shù)據(jù)進行預測。實驗表明,應用該方法對**商業(yè)空調故障進行預測,避免了人工進行預測的繁瑣步驟,提高了故障預測準確率。
以**商業(yè)空調時序數(shù)據(jù)為數(shù)據(jù)樣本,首先對時序數(shù)據(jù)中含有缺失值、異常值和重復值的數(shù)據(jù)進行清洗、填充和去除等操作,確保數(shù)據(jù)的完整性,提高數(shù)據(jù)的質量。其次,對處理好的時序數(shù)據(jù)進行權重值分析,挖掘設備中影響各故障發(fā)生的關鍵參數(shù)。然后,利用GRU 神經(jīng)網(wǎng)絡模型對時序數(shù)據(jù)進行模型訓練,不斷迭代最優(yōu)的模型訓練結果。最后,使用該模型實現(xiàn)設備實時故障預測。
選取**商業(yè)空調數(shù)據(jù)時間、蒸發(fā)器側進水溫度、蒸發(fā)器側出水溫度、冷凝器側進水溫度、冷凝器側出水溫度、壓縮機吸氣溫度、壓縮機排氣溫度、蒸發(fā)器側壓力(吸氣壓力)、冷凝器側壓力(排氣壓力)、排氣過熱度、主回路液位、主供液閥開度共12個參數(shù)數(shù)據(jù)作為初始樣本集,對數(shù)據(jù)進行預處理。通過對數(shù)據(jù)特點進行分析,相鄰數(shù)據(jù)的平均值用于填充數(shù)據(jù)中的缺失值以及修正數(shù)據(jù)中的異常值。
CRITIC 權重法對多參數(shù)數(shù)據(jù)來講是一種較好的客觀賦值法,它是基于數(shù)據(jù)中參數(shù)的對比強度和參數(shù)間的沖突性來綜合衡量參數(shù)的客觀權重,將處理數(shù)據(jù)進行量綱話處理后,數(shù)據(jù)的標準差可以體現(xiàn)數(shù)據(jù)參數(shù)之間的差異性:
Sj表示第j個參數(shù)類型的標準差,以此來表示各參數(shù)內數(shù)值的差異波動情況,標準差越大表示該參數(shù)中數(shù)據(jù)的差異越大,越能反映出更多的數(shù)據(jù)信息,也表示該參數(shù)本身的評價強度越強,應該給該參數(shù)類型分配更多的權重。
參數(shù)之間的沖突性用相關系數(shù)進行表示:
使用相關系數(shù)來表示參數(shù)之間的沖突性,若與其他參數(shù)的相關性越強,則該參數(shù)就與其他參數(shù)的沖突性越小,反映出相同的信息越多,所能體現(xiàn)的評價內容就越有重復之處,一定程度上也就削弱了該參數(shù)的評價強度,應該減少對該參數(shù)的分配權重。
CRITIC 權重值法以參數(shù)信息量大小的形式來表示具體的某個參數(shù)在總指標體系中的作用,參數(shù)的信息量越大則表示該參數(shù)的作用越大,應該給該參數(shù)分配更高的權重值,參數(shù)信息量表示如下:
因此,客觀權重值可以表示為
利用CRITIC 權重值法,計算關鍵參數(shù)中各參數(shù)的權重值,并結合設備各故障發(fā)生時的數(shù)據(jù)特點,確定影響故障發(fā)生的關鍵參數(shù)。
設備運行過程中的數(shù)據(jù)是不斷變化的實時數(shù)據(jù),結合故障數(shù)據(jù)特點,利用GRU 神經(jīng)網(wǎng)絡對設備運行的歷史故障數(shù)據(jù)進行分析。GRU 神經(jīng)網(wǎng)絡是LSTM長短期記憶神經(jīng)網(wǎng)絡的變體,它相對于LSTM只含有兩個門控結構。通過挖掘數(shù)據(jù)關鍵參數(shù),對篩選出設備關鍵參數(shù)的歷史數(shù)據(jù)進行GRU 神經(jīng)網(wǎng)絡的模型訓練。
GRU 神經(jīng)網(wǎng)絡單元在得到門控信號之后,使用重置門控得到“重置”之后的數(shù)據(jù),定義如下:
通過重置門控重置后的數(shù)據(jù)與輸入神經(jīng)元的數(shù)據(jù)進行拼接,通過tanh 激活函數(shù)將輸入的數(shù)據(jù)縮放到-1~1的范圍之內,得到隱藏狀態(tài)數(shù)據(jù)?':
GRU 模型關鍵的步驟—更新記憶階段,在這個階段,同時進行了遺忘和記憶:
GRU 神經(jīng)網(wǎng)絡使用一個門控單元同時實現(xiàn)輸入數(shù)據(jù)的遺忘和記憶兩個步驟,其中(1-z)⊙?t-1表示對原本數(shù)據(jù)的選擇性遺忘,忘記?t-1中的一些不重要的信息;z⊙?'表示對包含當前節(jié)點信息的?'進行選擇性“記憶”。
選取**商業(yè)空調2021 年6 月份數(shù)據(jù)作為故障預測的數(shù)據(jù)樣本。首先進行數(shù)據(jù)預處理,填充缺失值,并對時序數(shù)據(jù)中的異常值進行剔除。經(jīng)數(shù)據(jù)預處理后,挖掘設備數(shù)據(jù)中的關鍵參數(shù),并進行GRU神經(jīng)網(wǎng)絡模型訓練。樣本數(shù)據(jù)中共包含86361 條數(shù)據(jù),12個空調設備參數(shù)。
通過與空調設備生產方專業(yè)人員交流,確定空調各項參數(shù)的正常值范圍。通過觀察正常值數(shù)據(jù),將該樣本數(shù)據(jù)中缺失的數(shù)據(jù)根據(jù)前后兩條數(shù)據(jù)的平均值進行填充,并將數(shù)據(jù)類型錯誤的數(shù)據(jù)按照同樣的方法進行修正。數(shù)據(jù)預處理后的部分數(shù)據(jù)如表1所示。
對預處理之后的數(shù)據(jù)進行關鍵參數(shù)挖掘,除數(shù)據(jù)時間之外的11 個參數(shù)進行CRITIC 權重法計算,經(jīng)過多次實驗對比,選取空調設備中影響故障發(fā)生的關鍵參數(shù)。CRITIC 權重法計算各參數(shù)權重值如表2所示。
表2 各參數(shù)權重值
選取設備運行過程中影響故障發(fā)生的關鍵參數(shù),剔除對設備運行影響較小的參數(shù),減少該類無用參數(shù)對模型訓練時間和結果的影響。根據(jù)CRITIC 權重法訓練結果,選取蒸發(fā)器側進水溫度、冷凝器側進水溫度、冷凝器側出水溫度、壓縮機排氣溫度、冷凝器側壓力(排氣壓力)、主回路液位6個關鍵參數(shù)進行模型分析。
利用TensorFlow搭建GRU時序數(shù)據(jù)預測模型,將挖掘的關鍵參數(shù)時序數(shù)據(jù)輸入到GRU 神經(jīng)網(wǎng)絡模型中進行訓練,并將該數(shù)據(jù)集進行劃分,其中80%為訓練集,20%為測試集。調整模型學習率、迭代次數(shù)等參數(shù),對模型進行訓練優(yōu)化。對設備實時數(shù)據(jù)進行故障預測,預測部分結果如表3所示。
表3 設備故障預測(部分)
根據(jù)模型對設備實時數(shù)據(jù)的預測結果,結合設備運行過程中實際發(fā)生的故障進行對比。實驗表明,該方法對**商業(yè)空調機械設備故障預測準確率顯著提高。
本文結合機械設備故障預測的開發(fā)現(xiàn)狀,以商業(yè)空調時序數(shù)據(jù)作為數(shù)據(jù)樣本,提出了一種基于GRU 神經(jīng)網(wǎng)絡的機械設備故障預測方法。該方法從設備實際運行過程出發(fā),利用CRITIC 權重法從12 個空調設備運行參數(shù)中提取影響設備運行的關鍵參數(shù),剔除無用參數(shù)對模型訓練結果的影響,通過GRU 神經(jīng)網(wǎng)絡進行模型訓練,不斷迭代最優(yōu)模型訓練結果。利用該模型進行設備時序數(shù)據(jù)的故障預測,能夠提前預警設備故障發(fā)生,降低了人工成本及企業(yè)經(jīng)濟損失,為機械設備故障預測工作提供支持。