李貝貝,彭 力
江南大學(xué) 物聯(lián)網(wǎng)工程學(xué)院,江蘇 無錫214122
軸承作為各種工業(yè)現(xiàn)場(chǎng)機(jī)械設(shè)備的重要零部件之一,對(duì)工業(yè)流程的順利進(jìn)行和設(shè)備運(yùn)行安全有著重要意義。但在長(zhǎng)期的高強(qiáng)度、大載荷的復(fù)雜工況下,軸承極易出現(xiàn)異常狀況,導(dǎo)致故障發(fā)生。若能準(zhǔn)確、及時(shí)地檢測(cè)到異常數(shù)據(jù),則有助于設(shè)備及時(shí)維護(hù),避免嚴(yán)重事故的發(fā)生。在大數(shù)據(jù)時(shí)代,隨著傳感器和機(jī)器學(xué)習(xí)技術(shù)的飛速發(fā)展,通過先進(jìn)理論和方法使用歷史采集的狀態(tài)監(jiān)控?cái)?shù)據(jù)提取特征,構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的軸承異常檢測(cè)模型,并保證異常檢測(cè)的準(zhǔn)確性和穩(wěn)定性,成為了當(dāng)前研究的熱點(diǎn)并具有明確學(xué)術(shù)價(jià)值與應(yīng)用意義。
軸承的振動(dòng)監(jiān)測(cè)數(shù)據(jù)是最直觀最方便判斷軸承是否出現(xiàn)異常的數(shù)據(jù),通過加速度傳感器可以方便快速地采集數(shù)據(jù)并實(shí)時(shí)檢測(cè)。振動(dòng)數(shù)據(jù)的采集通常需要在多個(gè)位置放置多個(gè)采集傳感器,因此振動(dòng)數(shù)據(jù)的特點(diǎn)主要包括:數(shù)據(jù)量大、維度較低、各維度之間具有一定相關(guān)性。
軸承振動(dòng)異常的檢測(cè)主要使用許多異常點(diǎn)檢測(cè)方法。檢測(cè)方法主要包括:(1)基于統(tǒng)計(jì)學(xué)的方法,假定大部分正常數(shù)據(jù)服從相同的數(shù)據(jù)分布,異常數(shù)據(jù)則不屬于該分布,但此類方法確定數(shù)據(jù)的概率分布模型以及參數(shù)比較困難。(2)基于鄰域的異常檢測(cè)方法,如近鄰算法(-nearest neighbor,NN)和局部異常因子算法(local outlier factor,LOF)。NN算法易于實(shí)現(xiàn),但對(duì)于異常數(shù)據(jù)占比較少、樣本不平衡的軸承振動(dòng)數(shù)據(jù)表現(xiàn)較差。LOF 算法通過局部可達(dá)密度彌補(bǔ)NN 算法對(duì)于樣本不平衡的數(shù)據(jù)集表現(xiàn)較差的缺點(diǎn),但是LOF 算法對(duì)于參數(shù)的確定極為敏感,且算法復(fù)雜度高,時(shí)間成本高。(3)支持向量機(jī)(support vector machine,SVM),通過訓(xùn)練數(shù)據(jù)對(duì)象的邊界或特征來確定異常數(shù)據(jù)。此方法需要大量能用于訓(xùn)練的正常數(shù)據(jù),并確定相應(yīng)參數(shù),且參數(shù)的設(shè)置對(duì)于檢測(cè)效果影響較大。(4)孤立森林(isolation forest,iForest)算法,通過構(gòu)建隔離樹檢測(cè)異常數(shù)據(jù),具有線性時(shí)間復(fù)雜度。但其采用無監(jiān)督的方式,忽略數(shù)據(jù)特征之間的相關(guān)性進(jìn)行隨機(jī)選取特征構(gòu)建隔離樹,因此檢測(cè)準(zhǔn)確度較低。
近年來,深度神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN)已在特征的自動(dòng)提取和識(shí)別上成功應(yīng)用,可自適應(yīng)地提取信息豐富的重要特征,簡(jiǎn)化繁重且有挑戰(zhàn)性的特征提取過程,具有較好的普適性。自編碼器(autoencoder,AE)最早由Rumelhart 等人提出,并將其用于復(fù)雜數(shù)據(jù)處理。隨后,Hinton 等人提出了深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),由此產(chǎn)生了深度自編碼器。在深度自編碼器的基礎(chǔ)上,Ng提出高維而稀疏的隱層,對(duì)隱層加入稀疏性限制提高自編碼器特征學(xué)習(xí)能力,提出了稀疏自編碼器。如今,自編碼器和深度神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于故障診斷、圖像識(shí)別、異常檢測(cè)等領(lǐng)域中。自編碼器和神經(jīng)網(wǎng)絡(luò)也被研究應(yīng)用于軸承振動(dòng)等工業(yè)數(shù)據(jù)的異常檢測(cè)問題上,自編碼器因其優(yōu)越的特征提取能力得到了大量研究與應(yīng)用。
由于傳感器技術(shù)的發(fā)展,軸承振動(dòng)數(shù)據(jù)的采集更加方便快速,但導(dǎo)致數(shù)據(jù)量龐大,在自編碼器和神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中,過大的數(shù)據(jù)量使得訓(xùn)練效率較低并且檢測(cè)準(zhǔn)確度無法得到有效提升。為了減少自編碼器和神經(jīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)量,本研究通過正常振動(dòng)數(shù)據(jù)樣本的馬氏距離(Mahalanobis distance)得到判定閾值,計(jì)算數(shù)據(jù)與正常數(shù)據(jù)均值的馬氏距離,將沒有超過判定閾值的數(shù)據(jù)記為不確定數(shù)據(jù)并將該部分?jǐn)?shù)據(jù)用于自編碼器和神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。
對(duì)于神經(jīng)網(wǎng)絡(luò)參數(shù)初始化問題,傳統(tǒng)的權(quán)值隨機(jī)初始化方法依然會(huì)有陷入局部最優(yōu)的風(fēng)險(xiǎn)。本研究結(jié)合自編碼器和Sigmoid 分類器構(gòu)建自編碼網(wǎng)絡(luò)(autoencoder network,AN)解決了神經(jīng)網(wǎng)絡(luò)參數(shù)初始化問題,并且減少了網(wǎng)絡(luò)訓(xùn)練次數(shù)和時(shí)間,提高了訓(xùn)練效率。本研究將訓(xùn)練完成的自編碼器中編碼層輸出作為分類器輸入,利用自編碼器獲得的編碼層權(quán)值和偏差解決神經(jīng)網(wǎng)絡(luò)參數(shù)初始化問題,最后使用標(biāo)簽化數(shù)據(jù)進(jìn)行有監(jiān)督的微調(diào)以完成整個(gè)自編碼網(wǎng)絡(luò)的訓(xùn)練。
軸承振動(dòng)數(shù)據(jù)各特征之間具有相關(guān)性,馬氏距離可用作判斷數(shù)據(jù)異常與否的重要特征,因此本研究將數(shù)據(jù)的馬氏距離作為特征添加到數(shù)據(jù)的特征中用于自編碼網(wǎng)絡(luò)的訓(xùn)練過程,有效提高了自編碼網(wǎng)絡(luò)對(duì)軸承振動(dòng)數(shù)據(jù)的異常檢測(cè)準(zhǔn)確度。
自編碼器常被用在高維數(shù)據(jù)的特征提取和降維過程中,而對(duì)于特征較少的低維軸承振動(dòng)數(shù)據(jù),自編碼器的特征提取和降維作用并不顯著。為了增強(qiáng)自編碼器的特征提取能力以獲得更好的編碼層參數(shù),提高整個(gè)自編碼網(wǎng)絡(luò)的異常檢測(cè)效果,本研究加入了稀疏約束條件并構(gòu)建先升維再編碼的改進(jìn)自編碼器結(jié)構(gòu),提高了自編碼器特征提取能力,并通過實(shí)驗(yàn)證明了該結(jié)構(gòu)具有更好的收斂性和異常檢測(cè)效果。
本研究的主要貢獻(xiàn)如下:通過馬氏距離快速判別出一部分異常數(shù)據(jù)以減少自編碼網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)量;將自編碼器和分類器結(jié)合解決了神經(jīng)網(wǎng)絡(luò)的參數(shù)初始化問題,減少了網(wǎng)絡(luò)訓(xùn)練時(shí)間;通過數(shù)據(jù)加入馬氏距離特征、先升維再編碼的自編碼器結(jié)構(gòu)、稀疏約束條件,構(gòu)建了一種改進(jìn)自編碼網(wǎng)絡(luò)用于軸承振動(dòng)異常檢測(cè);通過實(shí)驗(yàn)證明了該方法對(duì)于低維軸承振動(dòng)數(shù)據(jù)具有較好的異常檢測(cè)效果。
印度統(tǒng)計(jì)學(xué)家Mahalanobis 提出了一種考慮到各變量之間相關(guān)性的廣義距離,稱為馬氏距離(Mahalanobis distance),其主要思想是利用向量間的協(xié)方差矩陣來表示其馬氏距離。
對(duì)于包含個(gè)數(shù)據(jù)、每個(gè)數(shù)據(jù)維度為的數(shù)據(jù)集=(,,…,X),其中均值為=(,,…,μ),協(xié)方差矩陣為,其中一數(shù)據(jù)為=(,,…,x),則其馬氏距離如下所示:
其中,為協(xié)方差矩陣的逆矩陣,馬氏距離可看作數(shù)據(jù)與總體數(shù)據(jù)均值的距離。
由于馬氏距離的計(jì)算需要使用數(shù)據(jù)集的協(xié)方差矩陣,較歐式距離等其他距離的最大優(yōu)勢(shì)為馬氏距離考慮數(shù)據(jù)特征之間的相關(guān)性。在數(shù)據(jù)集中,如果一個(gè)數(shù)據(jù)的馬氏距離越小,則說明其與數(shù)據(jù)集中均值數(shù)據(jù)的相似度越大。在軸承振動(dòng)數(shù)據(jù)等低維工業(yè)數(shù)據(jù)中,由于工藝流程和采集設(shè)備等緣故,數(shù)據(jù)的每個(gè)特征之間有著不可忽視的相關(guān)性,馬氏距離更適合用于軸承振動(dòng)數(shù)據(jù)的距離表達(dá)。
考慮在軸承振動(dòng)異常檢測(cè)中,假設(shè)某數(shù)據(jù)為正常數(shù)據(jù),使用正常數(shù)據(jù)集的均值和協(xié)方差矩陣根據(jù)式(1)計(jì)算其馬氏距離。若該數(shù)據(jù)馬氏距離與正常數(shù)據(jù)馬氏距離接近,說明該數(shù)據(jù)與正常數(shù)據(jù)相似度較大,該數(shù)據(jù)大概率為正常數(shù)據(jù);若該數(shù)據(jù)馬氏距離與正常數(shù)據(jù)馬氏距離相差較遠(yuǎn),說明該數(shù)據(jù)與正常數(shù)據(jù)相似度較小,則該數(shù)據(jù)大概率為異常數(shù)據(jù)。因此能夠使用軸承振動(dòng)數(shù)據(jù)的馬氏距離來判斷數(shù)據(jù)為異常數(shù)據(jù)的可能性,該思想在2.1 節(jié)中詳細(xì)說明。
如上所述,軸承振動(dòng)數(shù)據(jù)的馬氏距離可以用來判斷該數(shù)據(jù)為異常數(shù)據(jù)的可能性,故考慮將數(shù)據(jù)的馬氏距離作為軸承振動(dòng)數(shù)據(jù)的一個(gè)特征。由于正常數(shù)據(jù)和異常數(shù)據(jù)的馬氏距離有較大的差別,在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中,加入的馬氏距離特征將作為重要特征,有利于提升神經(jīng)網(wǎng)絡(luò)的異常檢測(cè)效果。因此在本研究提出的改進(jìn)自編碼網(wǎng)絡(luò)訓(xùn)練和檢測(cè)過程中,將數(shù)據(jù)的馬氏距離加入數(shù)據(jù)特征中,5.1 節(jié)中通過對(duì)比實(shí)驗(yàn)證明了該思想的優(yōu)越性。
自編碼器主要包括編碼和解碼階段,且結(jié)構(gòu)對(duì)稱,即若存在多個(gè)隱層時(shí),編碼和解碼階段的隱層數(shù)量及結(jié)構(gòu)相同。主要結(jié)構(gòu)由輸入層、隱層和輸出層組成,如圖1 所示。隱層對(duì)輸入層數(shù)據(jù)進(jìn)行編碼,輸出層對(duì)隱層表達(dá)進(jìn)行解碼重構(gòu)原始數(shù)據(jù),最小化重構(gòu)誤差以獲得最佳的隱層表達(dá)。其目標(biāo)是擬合一個(gè)恒等函數(shù),使得每個(gè)輸出值盡可能等于相對(duì)應(yīng)的輸入值。
圖1 自編碼器結(jié)構(gòu)Fig.1 Structure of AE
對(duì)于數(shù)據(jù)集=(,,…,X),為數(shù)據(jù)個(gè)數(shù),每個(gè)數(shù)據(jù)維度為,即X∈R(=1,2,…,)。每一個(gè)數(shù)據(jù)X經(jīng)過編碼過程得到隱層表達(dá),編碼過程可描述為:
其中,和為編碼權(quán)重和偏置,σ為編碼層激活函數(shù),目前比較常用的有Sigmoid、Tanh、ReLU 等。然后隱層表達(dá)經(jīng)解碼過程得到重構(gòu)數(shù)據(jù)X′,解碼過程可描述為:
其中,′和′為解碼權(quán)重和偏置,取′=,σ為解碼層激活函數(shù)。
其中,為單個(gè)數(shù)據(jù)的損失函數(shù),在式(4)中為均方誤差損失函數(shù)。同時(shí)為了防止出現(xiàn)過擬合,給代價(jià)函數(shù)添加一個(gè)L2 正則化權(quán)重衰減項(xiàng),為懲罰因子,控制正則化項(xiàng)影響權(quán)重衰減的程度,得到最終的損失函數(shù)為:
文獻(xiàn)[17]證明,使用Sigmoid 激活函數(shù)時(shí),交叉熵?fù)p失函數(shù)要優(yōu)于均方誤差損失函數(shù),由于本研究構(gòu)建的自編碼網(wǎng)絡(luò)最終輸出為二分類,且通過實(shí)驗(yàn)得到,無論是自編碼器的訓(xùn)練階段還是編碼層結(jié)合分類器階段,Sigmoid 作為輸出層激活函數(shù)效果最理想,因此本研究采用交叉熵代價(jià)函數(shù)為:
在自編碼器的訓(xùn)練過程中,通過編碼和解碼過程使代價(jià)函數(shù)最小來學(xué)習(xí)并提取數(shù)據(jù)重要的特征,即獲得最佳的隱層表達(dá)。
假設(shè)采集到的軸承振動(dòng)數(shù)據(jù)集記為=(,,…,X),數(shù)據(jù)維度為。其中正常數(shù)據(jù)集記為X=(,,…,X),正常數(shù)據(jù)均值為μ=(,,…,μ),協(xié)方差矩陣為Σ,根據(jù)式(1)計(jì)算得到正常數(shù)據(jù)集中每個(gè)數(shù)據(jù)的馬氏距離記為:
其中,M表示在正常數(shù)據(jù)集中第個(gè)正常數(shù)據(jù)的馬氏距離。
接下來根據(jù)式(1)計(jì)算整個(gè)數(shù)據(jù)集中所有數(shù)據(jù)的馬氏距離。由于某一數(shù)據(jù)的變化會(huì)影響到數(shù)據(jù)集均值的變化,馬氏距離夸大了微小變化向量的作用,從而影響其他數(shù)據(jù)的馬氏距離計(jì)算。為了改善上述馬氏距離的缺點(diǎn),在計(jì)算所有數(shù)據(jù)的馬氏距離時(shí)使用的均值和協(xié)方差矩陣仍然為正常數(shù)據(jù)集中的μ和Σ,顯然獨(dú)立的μ和Σ不受向量變化影響;根據(jù)1.1節(jié),得到的某個(gè)數(shù)據(jù)的馬氏距離可看作該數(shù)據(jù)與正常數(shù)據(jù)集均值的距離。則數(shù)據(jù)X的馬氏距離記為:
根據(jù)統(tǒng)計(jì)學(xué)相關(guān)知識(shí)以及后續(xù)對(duì)軸承振動(dòng)數(shù)據(jù)的實(shí)驗(yàn)分析可知:如果數(shù)據(jù)X為正常數(shù)據(jù),則其馬氏距離D(X)應(yīng)符合正常數(shù)據(jù)馬氏距離數(shù)據(jù)集即M的統(tǒng)計(jì)分布;如果X為異常數(shù)據(jù),則D(X)不符合M的統(tǒng)計(jì)分布。
通過實(shí)驗(yàn)驗(yàn)證,馬氏距離不在(,)區(qū)間內(nèi)的數(shù)據(jù)均為異常數(shù)據(jù)。將馬氏距離在(,)區(qū)間內(nèi)的數(shù)據(jù)判定為不確定數(shù)據(jù),記為X,然后使用不確定數(shù)據(jù)集X訓(xùn)練自編碼網(wǎng)絡(luò)以完成模型構(gòu)建。同時(shí)將數(shù)據(jù)的馬氏距離加入到數(shù)據(jù)特征中,用于自編碼網(wǎng)絡(luò)的訓(xùn)練。
于是,通過馬氏距離檢測(cè)出了一部分異常數(shù)據(jù),將剩余的不確定數(shù)據(jù)輸入自編碼網(wǎng)絡(luò)中。對(duì)于數(shù)據(jù)量大的軸承振動(dòng)數(shù)據(jù)而言,減少了用于自編碼網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù),并且能夠根據(jù)馬氏距離判別閾值快速判別出一部分異常數(shù)據(jù),提高了檢測(cè)效率。
為了提高自編碼器學(xué)習(xí)數(shù)據(jù)特征的能力,在自編碼器基礎(chǔ)上添加約束條件,在其代價(jià)函數(shù)上加入稀疏懲罰項(xiàng),使其形成稀疏自編碼器。稀疏自編碼器代價(jià)函數(shù)為:
本研究使用自編碼器的主要目的是利用其學(xué)習(xí)并提取數(shù)據(jù)特征的能力提取數(shù)據(jù)更有用的特征,得到更好的隱層表達(dá)用于結(jié)合分類器。而對(duì)于低維軸承振動(dòng)數(shù)據(jù),由于其維度較低、特征較少,不利于自編碼器提取其特征,導(dǎo)致自編碼器的收斂性較差。在實(shí)際應(yīng)用中已證明了自編碼器對(duì)高維數(shù)據(jù)優(yōu)秀的特征提取能力,因此考慮將數(shù)據(jù)先升維再編碼的自編碼器結(jié)構(gòu),通過升維結(jié)構(gòu)提高了數(shù)據(jù)的維度,類似于增加了數(shù)據(jù)的特征。增加了升維層必然增加自編碼器訓(xùn)練的運(yùn)算復(fù)雜度,也相應(yīng)地增加了自編碼器單次訓(xùn)練的時(shí)間,但是自編碼器通過較少的訓(xùn)練次數(shù)便可以得到最佳的隱層表達(dá),其收斂速度增大。就總體時(shí)間而言,先升維再編碼的自編碼器能夠用較少的時(shí)間完成訓(xùn)練,得到最佳隱層表達(dá)。因此不同于一般自編碼器直接降維編碼的結(jié)構(gòu),本研究基于稀疏自編碼器,構(gòu)建先升維再編碼的網(wǎng)絡(luò)結(jié)構(gòu)以提升對(duì)軸承振動(dòng)數(shù)據(jù)的特征提取能力,同時(shí)在解碼階段保持與編碼階段的對(duì)稱結(jié)構(gòu)。5.2 節(jié)中通過實(shí)驗(yàn)證明了先升維再編碼的自編碼器結(jié)構(gòu)收斂性更好,訓(xùn)練時(shí)間更短,提升了自編碼器對(duì)低維數(shù)據(jù)的特征提取能力。
本研究構(gòu)建的改進(jìn)自編碼器結(jié)構(gòu)如圖2 所示,X為輸入數(shù)據(jù),數(shù)據(jù)維度為維,通過升維過程得到隱層表達(dá)U,其中>,維度升為維,同時(shí)解碼過程保持對(duì)稱結(jié)構(gòu)。 h為編碼層輸出,為編碼之后的維度,使用訓(xùn)練數(shù)據(jù)通過無監(jiān)督貪婪算法使代價(jià)函數(shù)最小,從而完成自編碼器的訓(xùn)練以得到最終編碼層輸出h作為分類器的輸入。
圖2 改進(jìn)自編碼器結(jié)構(gòu)Fig.2 Improved structure of AE
通過自編碼器的訓(xùn)練,得到了最優(yōu)的權(quán)值和偏差,將h作為分類器的輸入,把最優(yōu)的和作為網(wǎng)絡(luò)的初始化參數(shù),解決了神經(jīng)網(wǎng)絡(luò)參數(shù)初始化問題。如圖3 所示,S為使用Sigmoid 激活函數(shù)的分類層,h作為其輸入,X為一維輸出結(jié)果,表示正常或異常數(shù)據(jù),通過輸入標(biāo)簽化訓(xùn)練數(shù)據(jù),結(jié)合誤差反向傳播算法和隨機(jī)梯度下降進(jìn)行有監(jiān)督的參數(shù)微調(diào),最終完成整個(gè)自編碼網(wǎng)絡(luò)的構(gòu)建。
圖3 有監(jiān)督的微調(diào)Fig.3 Supervised fine-tuning
通過自編碼器的訓(xùn)練得到了較為合適的網(wǎng)絡(luò)初始化參數(shù),因此在自編碼網(wǎng)絡(luò)有監(jiān)督的微調(diào)階段,能夠減少所需訓(xùn)練次數(shù),提高整個(gè)網(wǎng)絡(luò)的訓(xùn)練效率。在5.3 節(jié)中,通過與普通DNN 的對(duì)比證明了將自編碼器與分類器結(jié)合的方法能顯著減少網(wǎng)絡(luò)的訓(xùn)練時(shí)間。
文獻(xiàn)[19]指出,神經(jīng)網(wǎng)絡(luò)的隱層數(shù)量比學(xué)習(xí)算法和自編碼器結(jié)構(gòu)對(duì)性能的影響更加重要,本研究主要關(guān)注自編碼器用于軸承振動(dòng)異常檢測(cè),因此在此只使用單層的神經(jīng)網(wǎng)絡(luò)分類器結(jié)構(gòu),由于是二分類任務(wù),故單層使用Sigmoid 激活函數(shù),輸出分類結(jié)果。
首先對(duì)所有振動(dòng)數(shù)據(jù)歸一化處理,并從中提取出部分正常數(shù)據(jù),計(jì)算正常數(shù)據(jù)的馬氏距離,根據(jù)式(9)、式(10)得到馬氏距離判別閾值。
根據(jù)式(8)得到所有數(shù)據(jù)的馬氏距離,將馬氏距離超過閾值的數(shù)據(jù)判定為異常數(shù)據(jù),沒有超過閾值的數(shù)據(jù)記為不確定數(shù)據(jù),并將數(shù)據(jù)的馬氏距離加入數(shù)據(jù)特征中。
將加入馬氏距離特征的不確定數(shù)據(jù)集作為圖2 所示的改進(jìn)自編碼器的輸入,以無監(jiān)督的方式訓(xùn)練自編碼器,得到最優(yōu)的編碼層輸出h以及最優(yōu)的權(quán)值和偏差參數(shù)。
將h作為Sigmoid 分類器的輸入,使用帶標(biāo)簽的不確定數(shù)據(jù)作為圖3 所示的結(jié)構(gòu)中的輸入,進(jìn)行有監(jiān)督的微調(diào)以得到整個(gè)網(wǎng)絡(luò)的最優(yōu)參數(shù),完成自編碼網(wǎng)絡(luò)的構(gòu)建。
隨機(jī)選取全部振動(dòng)數(shù)據(jù)的一部分作為測(cè)試數(shù)據(jù),根據(jù)式(8)得到其馬氏距離,將超過馬氏距離判別閾值的數(shù)據(jù)判定為異常數(shù)據(jù),將沒有超過閾值的數(shù)據(jù)加入馬氏距離特征后放入訓(xùn)練好的自編碼網(wǎng)絡(luò)中,得到最終檢測(cè)結(jié)果。從而測(cè)試整個(gè)異常檢測(cè)模型的異常檢測(cè)效果。
實(shí)驗(yàn)環(huán)境為CPU Intel Core i5-6500 3.20 GHz、12 GB RAM 和Windows10 操作系統(tǒng),使用python3.6下Keras框架實(shí)現(xiàn)。
實(shí)驗(yàn)過程所用數(shù)據(jù)集為美國(guó)國(guó)家航空航天局(National Aeronautics and Space Administration,NASA)提供的智能維護(hù)系統(tǒng)(intelligent maintenance system,IMS)采集的軸承振動(dòng)數(shù)據(jù)集,記作IMS Bearing data。該數(shù)據(jù)集通過加速度傳感器按照一定頻率采集機(jī)械設(shè)備的軸承振動(dòng)數(shù)據(jù),每隔10 s 能夠采集到20 480 條數(shù)據(jù);共包含3 個(gè)子數(shù)據(jù)集,每個(gè)數(shù)據(jù)集均經(jīng)過長(zhǎng)時(shí)間數(shù)據(jù)采集,包含從正常到異常的振動(dòng)數(shù)據(jù)。本實(shí)驗(yàn)先選擇數(shù)據(jù)集1 描述實(shí)驗(yàn)過程,該數(shù)據(jù)集是通過4個(gè)加速度傳感器采集同一軸承的各部分振動(dòng)數(shù)據(jù)得到的,故該數(shù)據(jù)有4 個(gè)特征,由于傳感器分布于同一軸承設(shè)備,各特征具有一定相關(guān)性。之后,使用IMS Bearing data 剩余的數(shù)據(jù)集2、數(shù)據(jù)集3 以及XJTU-SY數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),進(jìn)一步觀察本研究提出方法的異常檢測(cè)效果。
為了進(jìn)一步提高實(shí)驗(yàn)中異常檢測(cè)模型的構(gòu)建效率,更好地體現(xiàn)異常檢測(cè)效果,本實(shí)驗(yàn)需對(duì)數(shù)據(jù)集進(jìn)行一定的預(yù)處理。首先由于軸承振動(dòng)數(shù)據(jù)不具有突變性,為了提高實(shí)驗(yàn)效率,本實(shí)驗(yàn)將每10 s 的數(shù)據(jù)求平均值,將其歸并為1 條數(shù)據(jù),用該平均值表示。然后將數(shù)據(jù)歸一化到[0,1]區(qū)間,有利于更好地進(jìn)行自編碼網(wǎng)絡(luò)的訓(xùn)練。隨后,根據(jù)2.2 節(jié)中的模型構(gòu)建過程,經(jīng)過馬氏距離快速檢測(cè)異常數(shù)據(jù)并得到不確定數(shù)據(jù),隨后進(jìn)行自編碼器的訓(xùn)練,與Sigmoid 分類器結(jié)合,構(gòu)建自編碼網(wǎng)絡(luò)檢測(cè)模型。整個(gè)異常檢測(cè)模型如圖4 所示。
圖4 軸承振動(dòng)異常檢測(cè)模型Fig.4 Bearing vibration abnormal detection model
為了更易說明實(shí)驗(yàn)的評(píng)價(jià)指標(biāo),本實(shí)驗(yàn)定義異常數(shù)據(jù)為正類,正常數(shù)據(jù)為負(fù)類,因此評(píng)價(jià)指標(biāo)混淆矩陣如表1 所示。
表1 評(píng)價(jià)指標(biāo)混淆矩陣Table 1 Evaluation index confusion matrix
研究中使用準(zhǔn)確率(Accuracy,)、精確率(Precision,)、召回率(Recall,)、F1 值(1)這4個(gè)度量標(biāo)準(zhǔn)來評(píng)價(jià)異常檢測(cè)效果,這4 個(gè)指標(biāo)越接近1,則表明效果越好。
準(zhǔn)確率()為所有預(yù)測(cè)正確的數(shù)據(jù)量占總數(shù)據(jù)量的比重,表達(dá)式為:
精確率()也稱查準(zhǔn)率,即數(shù)據(jù)正確預(yù)測(cè)為異常數(shù)據(jù)的數(shù)據(jù)量占全部預(yù)測(cè)為異常數(shù)據(jù)的數(shù)據(jù)量的比重,表達(dá)式為:
召回率()也稱查全率,即數(shù)據(jù)正確預(yù)測(cè)為異常數(shù)據(jù)的數(shù)據(jù)量占全部實(shí)際為異常數(shù)據(jù)的數(shù)據(jù)量的比重,表達(dá)式為:
F1 值(1)為精確率和召回率的調(diào)和平均數(shù),在異常檢測(cè)中,1 值能更全面地說明檢測(cè)方法的效果,取值范圍從0 到1,越接近于1 表示算法效果越好,其表達(dá)式為:
實(shí)驗(yàn)使用的數(shù)據(jù)集1包含4個(gè)特征,即通過加速度傳感器在4個(gè)位置采集到的振動(dòng)數(shù)據(jù),記為Bearing1、Bearing2、Bearing3、Bearing4。其變化如圖5 所示,在時(shí)間點(diǎn)“2004-02-16 4:02:39”開始出現(xiàn)異常數(shù)據(jù),由于軸承異常為不可逆的,該時(shí)間點(diǎn)之后采集到的數(shù)據(jù)均為異常數(shù)據(jù)。經(jīng)過預(yù)處理后的數(shù)據(jù)集1 樣本大小如表2 所示。
圖5 數(shù)據(jù)集1 的軸承振動(dòng)數(shù)據(jù)Fig.5 Bearing vibration data from dataset 1
表2 數(shù)據(jù)集1 樣本大小Table 2 Size of dataset 1
實(shí)驗(yàn)中選擇正常數(shù)據(jù)中時(shí)間點(diǎn)“2004-02-13 11:02:39”到“2004-02-14 23:52:39”之間的數(shù)據(jù)用于計(jì)算馬氏距離判別閾值,該部分?jǐn)?shù)據(jù)如圖6 所示。
圖6 正常軸承振動(dòng)數(shù)據(jù)Fig.6 Normal bearing vibration data
將實(shí)驗(yàn)數(shù)據(jù)集進(jìn)行預(yù)處理之后,根據(jù)式(1)計(jì)算上述正常數(shù)據(jù)的馬氏距離,結(jié)果如圖7 所示。同時(shí)根據(jù)式(9)、式(10)得到馬氏距離判別閾值為19.23,為-0.38。
圖7 正常數(shù)據(jù)的馬氏距離Fig.7 Mahalanobis distance for normal data
接下來根據(jù)式(8)得到所有數(shù)據(jù)的馬氏距離,如圖8 所示,并通過馬氏距離判別閾值快速判別異常數(shù)據(jù)與不確定數(shù)據(jù)。
圖8 所有數(shù)據(jù)馬氏距離Fig.8 Mahalanobis distance for all data
由圖8 可知,許多異常數(shù)據(jù)的馬氏距離明顯超過了,將馬氏距離超過的數(shù)據(jù)判定為異常數(shù)據(jù)。通過實(shí)驗(yàn),根據(jù)式(14)得此次異常檢測(cè)精確率為1,說明此次檢測(cè)結(jié)果為異常的數(shù)據(jù)均為真實(shí)異常數(shù)據(jù),所有正常數(shù)據(jù)的馬氏距離均未超過。將馬氏距離未超過的數(shù)據(jù)作為不確定數(shù)據(jù)集進(jìn)入自編碼網(wǎng)絡(luò)的訓(xùn)練階段,其中包含正常數(shù)據(jù)與異常數(shù)據(jù)。
判定為異常數(shù)據(jù)樣本個(gè)數(shù)為362,得到不確定數(shù)據(jù)樣本個(gè)數(shù)為622,不確定數(shù)據(jù)集如表3 所示。將超過閾值的異常數(shù)據(jù)快速檢測(cè)出來,提高了檢測(cè)速度,同時(shí)明顯減少了訓(xùn)練樣本數(shù)量,有利于提高自編碼網(wǎng)絡(luò)的訓(xùn)練效率。
表3 不確定數(shù)據(jù)集Table 3 Uncertain dataset
在得到各數(shù)據(jù)的馬氏距離之后,將其馬氏距離也作為數(shù)據(jù)的一個(gè)特征,因此數(shù)據(jù)的特征即維度增加到5 個(gè),在后續(xù)的實(shí)驗(yàn)中,將證明加入馬氏距離作為數(shù)據(jù)特征可增強(qiáng)異常檢測(cè)的效果。
本實(shí)驗(yàn)構(gòu)建以式(11)為代價(jià)函數(shù)的稀疏自編碼器,首先構(gòu)建如圖2 所示的先升維再編碼的改進(jìn)自編碼器結(jié)構(gòu)。由于輸入數(shù)據(jù)為5 維,自編碼器的輸入層為5 維。升維層和編碼輸出層的維數(shù)需通過實(shí)驗(yàn)進(jìn)行確定,而這兩層的維數(shù)關(guān)系到自編碼器與分類器結(jié)合的自編碼網(wǎng)絡(luò)異常檢測(cè)效果,因此升維層和編碼輸出層的維數(shù)通過4.3 節(jié)中自編碼網(wǎng)絡(luò)異常檢測(cè)實(shí)驗(yàn)確定。在此,構(gòu)建結(jié)構(gòu)為5-10-2-10-5 的先升維再編碼的改進(jìn)自編碼器以調(diào)節(jié)其他參數(shù)。
由于在代價(jià)函數(shù)中加入了稀疏性限制,稀疏懲罰項(xiàng)權(quán)重系數(shù)和稀疏常數(shù)的設(shè)置尤為重要。為了更為明顯地觀察自編碼器重構(gòu)誤差隨參數(shù)的變化,將自編碼器的訓(xùn)練次數(shù)設(shè)置為10,進(jìn)行5 次實(shí)驗(yàn)取最后重構(gòu)誤差的平均值。圖9給出了稀疏懲罰項(xiàng)權(quán)重系數(shù)與自編碼器重構(gòu)誤差的關(guān)系,圖10 給出了稀疏常數(shù)與自編碼器重構(gòu)誤差的關(guān)系。由圖9、圖10可得稀疏懲罰項(xiàng)權(quán)重系數(shù)和稀疏常數(shù)的最佳值分別為0.20 和0.04。自編碼器的參數(shù)設(shè)置如表4 所示。
圖9 自編碼器訓(xùn)練誤差隨β 的變化Fig.9 Training loss changes with β
圖10 自編碼器訓(xùn)練誤差隨ρ 的變化Fig.10 Training loss changes with ρ
表4 自編碼器參數(shù)設(shè)置Table 4 Parameter setting of autoencoder
將上述訓(xùn)練完成的自編碼器編碼(隱層)輸出層作為Sigmoid 分類器的輸入層以構(gòu)建如圖11 所示的改進(jìn)自編碼網(wǎng)絡(luò),將通過自編碼器得到的最優(yōu)和作為網(wǎng)絡(luò)的初始參數(shù)。通過輸入標(biāo)簽化的數(shù)據(jù)進(jìn)行如圖3 所示的有監(jiān)督的微調(diào),迭代訓(xùn)練次數(shù)為50。
圖11 改進(jìn)自編碼網(wǎng)絡(luò)Fig.11 Improved autoencoder network
對(duì)于本研究提出的改進(jìn)自編碼網(wǎng)絡(luò)中的升維層和編碼輸出層的維數(shù),在此通過改進(jìn)自編碼網(wǎng)絡(luò)對(duì)不確定數(shù)據(jù)集的異常檢測(cè)實(shí)驗(yàn)來確定。為了增強(qiáng)實(shí)驗(yàn)的可靠性和準(zhǔn)確性,采用5 折交叉驗(yàn)證方法進(jìn)行實(shí)驗(yàn),將不確定數(shù)據(jù)集隨機(jī)均勻分為5 份,輪流將其中1 份作為測(cè)試數(shù)據(jù),剩余4 份作為訓(xùn)練數(shù)據(jù)。將5 次實(shí)驗(yàn)結(jié)果數(shù)據(jù)的平均值作為實(shí)驗(yàn)結(jié)果。實(shí)驗(yàn)結(jié)果隨兩個(gè)層的維數(shù)的變化如圖12、圖13所示。從圖12可知,將升維層的維數(shù)設(shè)置為10 最合適;另外觀察到維度小于5 即沒有升維時(shí),異常檢測(cè)效果較差,而當(dāng)維度高于5 即升維時(shí),效果較好,進(jìn)一步證明了先升維再編碼的網(wǎng)絡(luò)結(jié)構(gòu)有利于提高自編碼網(wǎng)絡(luò)異常檢測(cè)效果。從圖13 可知,將編碼輸出層的維數(shù)設(shè)置為2 最合適,從自編碼器原理可知,由于輸入數(shù)據(jù)維度為5 維,編碼輸出層的維度必須小于5。
圖12 實(shí)驗(yàn)結(jié)果隨U 層維度變化圖Fig.12 Experimental result changes with dimension of U layer
圖13 實(shí)驗(yàn)結(jié)果隨h 層維度變化圖Fig.13 Experimental result changes with dimension of h layer
為了從不同角度進(jìn)一步考察提出方法的有效性,設(shè)計(jì)4 組不同對(duì)比實(shí)驗(yàn):(1)數(shù)據(jù)是否加入馬氏距離特征進(jìn)行構(gòu)建自編碼網(wǎng)絡(luò)的異常檢測(cè)效果對(duì)比;(2)傳統(tǒng)自編碼網(wǎng)絡(luò)和改進(jìn)自編碼網(wǎng)絡(luò)的對(duì)比;(3)本研究提出的異常檢測(cè)方法與其他傳統(tǒng)異常檢測(cè)方法的對(duì)比;(4)將本研究提出的方法用于IMS Bearing data 的另外兩個(gè)數(shù)據(jù)集以及XJTU-SY 數(shù)據(jù)集,觀察其檢測(cè)效果。
為了研究將數(shù)據(jù)的馬氏距離作為數(shù)據(jù)的特征放入改進(jìn)自編碼網(wǎng)絡(luò)中進(jìn)行訓(xùn)練對(duì)異常檢測(cè)效果的影響,將加入馬氏距離作為特征的不確定數(shù)據(jù)集和不加入馬氏距離作為特征的不確定數(shù)據(jù)集分為兩個(gè)數(shù)據(jù)集,分別訓(xùn)練本研究提出的改進(jìn)自編碼器和改進(jìn)自編碼網(wǎng)絡(luò)并測(cè)試。
不加入馬氏距離作為特征的不確定數(shù)據(jù)具有4個(gè)特征,因此輸入層維度改為4。將自編碼器的迭代訓(xùn)練次數(shù)設(shè)置為15,改進(jìn)自編碼網(wǎng)絡(luò)的訓(xùn)練次數(shù)設(shè)置為25,此時(shí)已經(jīng)得到較低的訓(xùn)練誤差。同樣采用4.3 節(jié)中提到的5 折交叉驗(yàn)證方法進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表5 所示??勺C明,將數(shù)據(jù)的馬氏距離作為數(shù)據(jù)的一個(gè)特征,可有效提高本研究提出的改進(jìn)自編碼網(wǎng)絡(luò)異常檢測(cè)效果。
表5 訓(xùn)練數(shù)據(jù)是否加入馬氏距離的對(duì)比Table 5 Comparison of training data with or without Mahalanobis distance
首先,需要構(gòu)建傳統(tǒng)自編碼器并結(jié)合分類器構(gòu)建傳統(tǒng)自編碼網(wǎng)絡(luò)。于是在本實(shí)驗(yàn)中,構(gòu)建結(jié)構(gòu)為5-2-5 的直接降維編碼的如圖1 所示的傳統(tǒng)自編碼器,除網(wǎng)絡(luò)結(jié)構(gòu)外的參數(shù)與4.2 節(jié)中構(gòu)建的改進(jìn)自編碼器相同。同4.2 節(jié)所述,將不確定數(shù)據(jù)集用于訓(xùn)練傳統(tǒng)自編碼器。同4.3 節(jié)所述,將訓(xùn)練完成的傳統(tǒng)自編碼器的二維編碼(隱層)輸出層作為Sigmoid 分類器的輸入層以構(gòu)建如圖14 所示的傳統(tǒng)自編碼網(wǎng)絡(luò),并通過輸入標(biāo)簽化的數(shù)據(jù)進(jìn)行有監(jiān)督的微調(diào),迭代訓(xùn)練次數(shù)仍然為50。
圖14 傳統(tǒng)自編碼網(wǎng)絡(luò)Fig.14 Traditional autoencoder network
首先進(jìn)行傳統(tǒng)自編碼器和改進(jìn)自編碼器的訓(xùn)練重構(gòu)誤差的比較,將不確定數(shù)據(jù)集作為兩種自編碼器的輸入進(jìn)行50 次迭代訓(xùn)練,兩者的訓(xùn)練重構(gòu)誤差曲線如圖15 所示。可知,在迭代訓(xùn)練次數(shù)到達(dá)15 次左右時(shí),改進(jìn)自編碼器的訓(xùn)練誤差基本達(dá)到了最小值,因此在后續(xù)對(duì)比實(shí)驗(yàn)中,將改進(jìn)自編碼器的迭代訓(xùn)練次數(shù)設(shè)置為15。
圖15 自編碼器誤差曲線比較Fig.15 Comparison of autoencoder loss
傳統(tǒng)自編碼器和改進(jìn)自編碼器的訓(xùn)練時(shí)間對(duì)比如表6 所示,為得到最佳的隱層表達(dá),傳統(tǒng)自編碼器需要50次迭代訓(xùn)練,而改進(jìn)自編碼器只需15次迭代訓(xùn)練。
如圖15 所示,先升維再編碼的改進(jìn)自編碼器通過更少的訓(xùn)練次數(shù)達(dá)到了最小的訓(xùn)練誤差即收斂速度更快,因此改進(jìn)自編碼器較傳統(tǒng)自編碼器具有更好的收斂性;如表6 所示,雖然先升維再編碼的結(jié)構(gòu)增加了單次迭代訓(xùn)練的時(shí)間,但是由于訓(xùn)練次數(shù)所需更少,改進(jìn)自編碼器的訓(xùn)練所需總時(shí)間更短。綜上,先升維再編碼的改進(jìn)自編碼器具有更好的低維數(shù)據(jù)特征學(xué)習(xí)能力。
表6 自編碼器訓(xùn)練時(shí)間的對(duì)比Table 6 Comparison of autoencoder training time
接下來進(jìn)行傳統(tǒng)自編碼網(wǎng)絡(luò)和改進(jìn)自編碼網(wǎng)絡(luò)在收斂性上的比較。將不確定數(shù)據(jù)集中的數(shù)據(jù)放入上述兩個(gè)自編碼網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練誤差曲線如圖16 所示,訓(xùn)練準(zhǔn)確率()曲線如圖17 所示。可知,在迭代訓(xùn)練次數(shù)到達(dá)30 次左右時(shí),改進(jìn)自編碼網(wǎng)絡(luò)的訓(xùn)練誤差基本達(dá)到了最小值且訓(xùn)練準(zhǔn)確率也基本達(dá)到最大值,而傳統(tǒng)自編碼網(wǎng)絡(luò)需要50 次以上的迭代訓(xùn)練次數(shù)才能夠?qū)⒂?xùn)練誤差降低到最小值并得到最大的訓(xùn)練準(zhǔn)確率。因此在后續(xù)對(duì)比實(shí)驗(yàn)中,將改進(jìn)自編碼網(wǎng)絡(luò)的迭代訓(xùn)練次數(shù)設(shè)置為30。
圖16 自編碼網(wǎng)絡(luò)誤差曲線比較Fig.16 Comparison of autoencoder network loss
圖17 自編碼網(wǎng)絡(luò)準(zhǔn)確率曲線比較Fig.17 Comparison of autoencoder network accuracy
傳統(tǒng)自編碼網(wǎng)絡(luò)和改進(jìn)自編碼網(wǎng)絡(luò)的訓(xùn)練時(shí)間對(duì)比如表7 所示,改進(jìn)自編碼網(wǎng)絡(luò)訓(xùn)練次數(shù)設(shè)置為30,而傳統(tǒng)自編碼網(wǎng)絡(luò)迭代訓(xùn)練次數(shù)為60 時(shí)才獲得與改進(jìn)自編碼網(wǎng)絡(luò)相同的訓(xùn)練誤差和準(zhǔn)確率。
表7 自編碼網(wǎng)絡(luò)訓(xùn)練時(shí)間的對(duì)比Table 7 Comparison of autoencoder network training time
如上所述,改進(jìn)自編碼網(wǎng)絡(luò)的收斂速度要明顯優(yōu)于傳統(tǒng)自編碼網(wǎng)絡(luò),前者能夠用更少的迭代訓(xùn)練次數(shù)得到不小于傳統(tǒng)自編碼網(wǎng)絡(luò)的收斂精度,故改進(jìn)自編碼網(wǎng)絡(luò)的收斂性更好;在訓(xùn)練時(shí)間方面,雖然改進(jìn)自編碼網(wǎng)絡(luò)的單次迭代訓(xùn)練時(shí)間較長(zhǎng),但其所需迭代訓(xùn)練次數(shù)較少,訓(xùn)練所需總時(shí)間更短。綜上,改進(jìn)自編碼網(wǎng)絡(luò)能達(dá)到更好的訓(xùn)練效果。
仍然采用5 折交叉驗(yàn)證方法進(jìn)行傳統(tǒng)自編碼網(wǎng)絡(luò)和改進(jìn)自編碼網(wǎng)絡(luò)的異常檢測(cè)效果對(duì)比實(shí)驗(yàn),同樣將不確定數(shù)據(jù)集隨機(jī)均勻分為5 份,輪流將其中1份作為測(cè)試數(shù)據(jù),剩余4 份用于網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)。將5次實(shí)驗(yàn)結(jié)果數(shù)據(jù)的平均值作為實(shí)驗(yàn)結(jié)果,如表8 所示。由表8 及以上實(shí)驗(yàn)可知,對(duì)于低維軸承振動(dòng)數(shù)據(jù),本研究提出的改進(jìn)自編碼網(wǎng)絡(luò)異常檢測(cè)效果要優(yōu)于傳統(tǒng)自編碼網(wǎng)絡(luò)。
表8 傳統(tǒng)自編碼網(wǎng)絡(luò)與改進(jìn)自編碼網(wǎng)絡(luò)的對(duì)比Table 8 Comparison between traditional autoencoder network and improved autoencoder network
為對(duì)比自編碼網(wǎng)絡(luò)的穩(wěn)定性,進(jìn)行在不同訓(xùn)練量的情況下傳統(tǒng)自編碼網(wǎng)絡(luò)和改進(jìn)自編碼網(wǎng)絡(luò)的異常檢測(cè)效果對(duì)比。在網(wǎng)絡(luò)訓(xùn)練階段,分別選用20%、40%、60%、80%的不確定數(shù)據(jù)集進(jìn)行訓(xùn)練,其余數(shù)據(jù)用于測(cè)試。自編碼器迭代訓(xùn)練次數(shù)為15,自編碼網(wǎng)絡(luò)迭代訓(xùn)練次數(shù)為30,每個(gè)實(shí)驗(yàn)重復(fù)20 次取實(shí)驗(yàn)結(jié)果平均值,不同訓(xùn)練量下的實(shí)驗(yàn)結(jié)果對(duì)比如表9所示。
表9 不同訓(xùn)練數(shù)據(jù)量下的實(shí)驗(yàn)結(jié)果對(duì)比Table 9 Experimental results comparison under different amounts of training data
由表9 可知,改進(jìn)自編碼網(wǎng)絡(luò)在不同訓(xùn)練數(shù)量的情況下,異常檢測(cè)效果均比傳統(tǒng)自編碼網(wǎng)絡(luò)要好。如圖18 所示,隨著訓(xùn)練數(shù)據(jù)量的增加,改進(jìn)自編碼網(wǎng)絡(luò)檢測(cè)效果越來越好,具有一定的穩(wěn)定性。
圖18 實(shí)驗(yàn)結(jié)果隨訓(xùn)練數(shù)據(jù)量變化圖Fig.18 Experimental result changes with amount of training data
同樣采用5 折交叉驗(yàn)證方法進(jìn)行實(shí)驗(yàn),使用IMS Bearing data 中的數(shù)據(jù)集1,將本研究提出的軸承振動(dòng)異常檢測(cè)方法與其他異常檢測(cè)方法進(jìn)行對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果如表10 所示。
表10 異常檢測(cè)算法與所提方法的對(duì)比Table 10 Comparison of anomaly detection algorithms with proposed method
由表10 可知,本研究所提方法對(duì)低維軸承振動(dòng)數(shù)據(jù)的異常檢測(cè)要優(yōu)于其他異常檢測(cè)方法。
在表10 中,DNN 的結(jié)構(gòu)設(shè)計(jì)為5-10-2-1,并將馬氏距離添加進(jìn)特征,與改進(jìn)自編碼網(wǎng)絡(luò)結(jié)構(gòu)相同,但是沒有自編碼器的訓(xùn)練階段。實(shí)驗(yàn)中發(fā)現(xiàn),由于不恰當(dāng)?shù)某跏蓟萑刖植孔顑?yōu)的情形,DNN 需要更多的訓(xùn)練次數(shù)而且穩(wěn)定性差。實(shí)驗(yàn)中,DNN 平均需要80 次迭代訓(xùn)練才能達(dá)到最小的訓(xùn)練誤差,每次迭代訓(xùn)練時(shí)間平均為141 μs,因此DNN 所需訓(xùn)練總時(shí)間為11 280 μs;本研究所提網(wǎng)絡(luò)的訓(xùn)練時(shí)間包括自編碼器的訓(xùn)練時(shí)間和自編碼網(wǎng)絡(luò)的訓(xùn)練時(shí)間,通過5.2節(jié)可知訓(xùn)練總時(shí)間為6 990 μs??梢娡ㄟ^自編碼器訓(xùn)練后結(jié)合分類器構(gòu)建的自編碼網(wǎng)絡(luò)比同結(jié)構(gòu)的普通神經(jīng)網(wǎng)絡(luò)所需訓(xùn)練時(shí)間更少,訓(xùn)練效率更高。
綜上,本研究所提方法通過自編碼器訓(xùn)練得到的隱層參數(shù)用于初始化分類器網(wǎng)絡(luò),減少了網(wǎng)絡(luò)訓(xùn)練次數(shù),大幅提高了網(wǎng)絡(luò)的訓(xùn)練效率。
IMS Bearing data 中的數(shù)據(jù)集2 通過8 個(gè)不同位置的加速度傳感器獲取數(shù)據(jù),因此數(shù)據(jù)集2 特征為8個(gè),在時(shí)間點(diǎn)“2003-11-21 12:08:36”開始出現(xiàn)異常數(shù)據(jù),其數(shù)據(jù)變化如圖19 所示。IMS Bearing data 中的數(shù)據(jù)集3 通過4 個(gè)不同位置的加速度傳感器獲取數(shù)據(jù),數(shù)據(jù)集3 特征為4 個(gè),在時(shí)間點(diǎn)“2004-04-15 10:21:53”開始出現(xiàn)異常數(shù)據(jù),數(shù)據(jù)集3 的數(shù)據(jù)變化如圖20所示。XJTU-SY數(shù)據(jù)集使用兩個(gè)加速度傳感器采集軸承水平和豎直方向上的振動(dòng)數(shù)據(jù),每分鐘采樣32 768個(gè)樣本,因此其數(shù)據(jù)特征為2 個(gè),數(shù)據(jù)預(yù)處理時(shí)將每秒鐘采集到的數(shù)據(jù)使用平均值歸為1 條數(shù)據(jù)。經(jīng)過預(yù)處理之后的3 個(gè)數(shù)據(jù)集樣本大小如表11 所示。
圖19 數(shù)據(jù)集2 的軸承振動(dòng)數(shù)據(jù)Fig.19 Bearing vibration data from dataset 2
圖20 數(shù)據(jù)集3 的軸承振動(dòng)數(shù)據(jù)Fig.20 Bearing vibration data from dataset 3
表11 3 個(gè)數(shù)據(jù)集樣本大小Table 11 Size of 3 datasets
同樣采取上文所提的5 折交叉驗(yàn)證方法進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表12 所示??芍狙芯刻岢龅姆椒ㄔ诹硗? 個(gè)數(shù)據(jù)集上保持了較好的檢測(cè)效果,因此對(duì)于低維軸承振動(dòng)數(shù)據(jù)具有一定的泛化能力。尤其數(shù)據(jù)集3 為異常數(shù)據(jù)占比較少的不平衡數(shù)據(jù)集,本研究提出的方法依然具有良好的檢測(cè)效果。
表12 在3 個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果Table 12 Experimental results on 3 datasets
本研究針對(duì)軸承振動(dòng)數(shù)據(jù)維度低、數(shù)據(jù)量大、各特征之間具有一定相關(guān)性的特點(diǎn),提出了一種結(jié)合馬氏距離與自編碼網(wǎng)絡(luò)的異常檢測(cè)方法。通過正常數(shù)據(jù)的馬氏距離,得到判別閾值以快速檢測(cè)出部分異常數(shù)據(jù),減少了自編碼網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)量;將自編碼器與分類器結(jié)合,解決了網(wǎng)絡(luò)參數(shù)初始化問題;提出先升維再編碼的自編碼器結(jié)構(gòu),而且將數(shù)據(jù)的馬氏距離作為特征加入到網(wǎng)絡(luò)訓(xùn)練中,有利于自編碼網(wǎng)絡(luò)的訓(xùn)練,提升了異常檢測(cè)效果。實(shí)驗(yàn)證明了本研究所提方法較其他異常檢測(cè)算法有著更好的檢測(cè)效果,并且具有一定的穩(wěn)定性和泛化能力。在未來的工作中,考慮引入時(shí)序深度學(xué)習(xí)模型研究如何實(shí)現(xiàn)快速在線檢測(cè)和分類。