(空軍工程大學(xué)防空反導(dǎo)學(xué)院 陜西西安 710038)
機械設(shè)備中不同磨損形式產(chǎn)生的磨粒,其特征如表面形貌、形狀、材質(zhì)以及色澤等各不相同,磨粒攜帶了機械設(shè)備豐富的磨損信息[1]。根據(jù)鐵譜片上磨粒的特征信息定性分析機械設(shè)備的磨損狀態(tài),可以判斷出設(shè)備的磨損形式和發(fā)生故障的部位[2]。其中,鐵譜磨粒模式識別成為分析設(shè)備磨損狀態(tài)的關(guān)鍵。由于依靠圖像處理技術(shù)的鐵譜磨粒識別過程本身存在局限性和不確定性,鐵譜技術(shù)和相關(guān)學(xué)科理論的結(jié)合還不完善,磨粒識別尚未形成完整的系統(tǒng)理論,磨粒識別智能化道路任重道遠。機械磨損情況較為復(fù)雜時,磨粒的智能化識別更需深入研究。
具有自學(xué)習(xí)、自組織功能以及大規(guī)模并行性、容錯性等特點的人工神經(jīng)網(wǎng)絡(luò)[3],成為人們用于識別鐵譜磨粒的有力工具。趙雪紅等[4]建立的BP神經(jīng)網(wǎng)絡(luò)系統(tǒng)可以自動識別設(shè)備的磨損狀態(tài),避免人為因素對判別過程的干擾。羅炳海等[5]采用PCA-BP分類器對航空發(fā)動機潤滑油液中的磨粒進行自動識別,結(jié)果表明PCA-BP分類器的識別準(zhǔn)確率高。李紹成等[6]設(shè)計的基于LS-SVM的磨粒綜合識別分類器,其識別精度能夠滿足磨粒在線測試的要求。邱麗娟[7]利用遺傳算法進行參數(shù)優(yōu)化設(shè)計的SVM分類器,能夠比較精確地識別正常滑動、嚴(yán)重滑動、球狀、切削、氧化物5種類型的磨粒。
BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于磨粒識別中存在學(xué)習(xí)速度很慢、網(wǎng)絡(luò)訓(xùn)練失敗可能性大的問題。支持向量機(Support Vector Machine, SVM)作為一個二分類器,應(yīng)用于磨粒識別這種多分類問題中,需要對其進行復(fù)雜的設(shè)計。極限學(xué)習(xí)機(Extreme Learning Machine,ELM) 是一種新型的快速學(xué)習(xí)算法,具有學(xué)習(xí)速度快、泛化性能好等優(yōu)點,適用于分類、模式識別等領(lǐng)域[8]。目前還沒有學(xué)者將ELM應(yīng)用于鐵譜磨粒識別中,對基于鐵譜磨粒特征參數(shù)建立的神經(jīng)網(wǎng)絡(luò)模型也沒有進行定量地研究。本文作者將ELM應(yīng)用于鐵譜磨粒識別中,并討論最優(yōu)模型的建立;通過與BP神經(jīng)網(wǎng)絡(luò)進行對比試驗,比較兩者性能優(yōu)劣,為機械磨損情況更為復(fù)雜時磨粒的智能化識別研究提供了幫助。
ELM是一種新型的快速學(xué)習(xí)算法,對于單隱含層神經(jīng)網(wǎng)絡(luò),ELM可以隨機初始化輸入權(quán)重和偏置并得到相應(yīng)的輸出權(quán)重。
對于一個SLFN網(wǎng)絡(luò),如圖1所示。假設(shè)有N個任意的樣本(Xi,ti),其中Xi=[xi1,xi2,......,xim]T∈Rn,ti=[ti1,ti2,......,tim]T∈Rm。
對于一個有L個隱含層節(jié)點的SLFN網(wǎng)絡(luò)可以表示為
(1)
式中:g(x)為激活函數(shù);Wi=[wi1,wi2,......,win]T為輸入權(quán)重;βi為輸出權(quán)重;bi是第i個隱含層單元的偏置;Wi·Xj表示W(wǎng)i和Xj的內(nèi)積。
單隱含層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的目標(biāo)是使得輸出的誤差最小,可以表示為
(2)
式中:oj為ELM輸出;ti為期望輸出。
即存在βi,Wi和bi使得:
(3)
式(3)可以用矩陣表示為
(4)
式中:H是隱含層節(jié)點的輸出;β為輸出權(quán)重;T為期望輸出。
為了能夠訓(xùn)練單隱層神經(jīng)網(wǎng)絡(luò)使得:
(5)
在ELM算法中,一旦輸入權(quán)重Wi和隱層的偏置bi被隨機確定,隱層的輸出矩陣H就被唯一確定。訓(xùn)練單隱層神經(jīng)網(wǎng)絡(luò)可以轉(zhuǎn)化為求解一個線性系統(tǒng):
Hβ=T
(6)
(7)
由前文分析可知,ELM在訓(xùn)練之前可以隨機產(chǎn)生w和b,只需確定隱含層神經(jīng)元個數(shù)及隱含層神經(jīng)元的激活函數(shù),即可計算出β。
針對正常滑動、嚴(yán)重滑動、球狀、切削、氧化物5種類型的磨粒,每種類型磨粒從鐵譜磨粒標(biāo)準(zhǔn)圖庫中隨機挑選出100張圖片作為處理的數(shù)據(jù)集。
鐵譜磨粒圖像在采集和轉(zhuǎn)換過程中會受到諸如光照強度不均勻、A/D轉(zhuǎn)換量化誤差、圖像存儲質(zhì)量不一等外界因素的影響,使得圖像往往含有較多的噪聲和畸變。為了改善圖像質(zhì)量以便于進行圖像特征的提取及識別,需對磨粒圖像進行預(yù)處理,包括彩色圖像的空間濾波和在RGB向量空間中分割圖像[10]。彩色圖像的空間濾波使用中值濾波,利用非線性濾波技術(shù),可以解決線性濾波導(dǎo)致的圖像細節(jié)模糊問題,并且對圖像噪聲處理更為有效,它不僅可以降低噪聲,還可以使圖像的輪廓邊緣細節(jié)信息不會受到損壞。在RGB向量空間中分割圖像,與對二值化或者灰度圖像進行分割相比,前者可以很好保留磨粒的顏色特征。處理前的磨粒圖像如圖2所示,處理后的圖像如圖3所示。
圖2 原磨粒圖像
圖3 處理后的磨粒圖像
磨粒是三維的,但采集的磨粒圖像是二維的,對基于圖像處理技術(shù)的磨粒分類識別,需要從二維磨粒圖像中盡可能提取三維磨粒的特征參數(shù)。因此,選擇從磨粒圖像的形狀尺寸、紋理特征和顏色特征幾個方面獲取磨粒特征參數(shù),在獲得磨粒較為全面信息的同時,也為磨粒識別模型的建立提供了數(shù)據(jù)基礎(chǔ)。
2.2.1 形狀尺寸
(1)面積:磨粒區(qū)域面積大小為鐵譜磨粒圖像像素點的計算:
(8)
式中:(i,j)表示圖像中像素的位置,二值圖像中用“1”表示磨粒圖像,“0”表示背景;面積A為“1”的圖像像素點之和;N為圖像矩陣行數(shù);M為列數(shù)。
(2)周長:磨粒輪廓外周邊緣的長度,計算公式為
(9)
式中:Ri為形心到輪廓邊緣的半徑;Δαi為兩個像素點與形心之間的夾角。
(3)粒度:粒度L為磨粒的等效圓直徑,它是判斷磨粒大小的重要參數(shù),計算公式為
(10)
(4)圓形度:圓形度用于判別球形磨粒,球形磨粒的圓形度一般處于0.8~1之間,其他形狀磨粒的圓形度一般低于0.8,計算公式為
(11)
(5)體態(tài)比:體態(tài)比用于表示磨粒的細長形狀。對于切削磨粒因其具有細長的顯著特征,所以可以用體態(tài)比對其進行判別,計算公式為
(12)
式中:a是磨粒圖像擬合的短軸;b是長軸。
(6)凹度:在傅立葉凹度中,球形磨粒的均值和方差都較小,說明磨粒是凸的,而切削磨粒的均值和方差近似于均勻,其計算公式為
(13)
式中:Pn是磨粒邊界輪廓經(jīng)傅立葉展開得到Freeman表示的傅立葉系數(shù)[11]。
2.2.2 磨粒顏色
顏色特征主要用來分析磨粒成分,對于紅色氧化物、黑色氧化物、銅合金磨粒及鋁合金磨粒的識別,顏色特征起著至關(guān)重要的作用。因此,對于彩色圖像可以充分利用磨粒自身攜帶的色澤和同類磨粒的顏色差異,判斷磨粒所屬的類別和機械設(shè)備磨損程度[12]。
在RGB顏色空間下,通常以R(i,j)、G(i,j)、B(i,j)三色指標(biāo)來表示磨粒的顏色特征。對已經(jīng)處理好的磨粒圖像,取磨粒的R(i,j)、G(i,j)、B(i,j)三個分量的均值和方差,并將其作為磨粒顏色特征信息的參數(shù)。
(1)均值
(14)
式中:X取R、G、B;X(i,j)分別為圖像矩陣R(i,j),G(i,j),B(i,j)三色指標(biāo)值。
(2)方差
(15)
2.2.3 紋理
磨粒是機械設(shè)備在長時間運轉(zhuǎn)后形成的,不同磨損機制形成不同的磨粒,而磨粒不同則其表面出現(xiàn)的紋理特征也有較大差異。借鑒多年來科研工作者對磨粒紋理特征的研究成果,文中采用灰度共生矩陣方法提取與磨粒紋理特征密切相關(guān)的5個特征參數(shù)[13]。
(1)能量:能量可以描述圖像紋理分布的均勻性和粗細程度。能量值越大,紋理往往排列越粗糙,反之亦然。
(16)
式中:P(i,j|d,θ)是灰度共生矩陣的元素,其中i,j、d、θ分別為這對像素點的灰度值、距離、平面方向[14]。
(2)熵:熵用于度量圖像內(nèi)容的隨機性,代表了圖像的信息量多少,能夠反映紋理的復(fù)雜程度。當(dāng)熵值越小,紋理越平滑,反之亦然。
(17)
(3)相關(guān)性:相關(guān)性反映了像素點的灰度值在行方向或者列方向上的相似程度。當(dāng)灰度共生矩陣中元素值均勻相等時,相關(guān)性最大,反之亦然。
(18)
(4)慣性矩:慣性矩又稱對比度,在一定程度上反映了矩陣的分布和圖像灰度的變化情況,慣性矩越小,圖像越模糊,紋理會更加不明顯,反之亦然。
I(d,θ)=∑(i-j)2P(i,j|d,θ)
(19)
(5)局部平穩(wěn)度:局部平穩(wěn)度又稱為逆差矩,反映了紋理排列的規(guī)則程度和局部變化程度。局部平穩(wěn)度越大,紋理表現(xiàn)的越規(guī)則,反之亦然。
(20)
2.2.4 特征參數(shù)值
根據(jù)特征參數(shù)計算公式,通過編寫的程序,得到了5類共500張鐵譜磨粒圖像的特征參數(shù)值。部分磨粒圖像分割后提取的17個特征參數(shù)如表1所示。
表1 部分磨粒圖像特征參數(shù)
ELM作為三層神經(jīng)網(wǎng)絡(luò),需要設(shè)計每層神經(jīng)元的個數(shù)。輸入層作為接收特征數(shù)據(jù)的接口,輸入向量的維數(shù)決定輸入層神經(jīng)元數(shù)。表2示出了6個模型對應(yīng)的輸入變量,其中,“o”表示對應(yīng)的輸入屬性參與模型建立。對于表2所示的模型1,輸入向量為6×1維,輸入層神經(jīng)元數(shù)是6;模型2,輸入向量為12×1維,輸入層神經(jīng)元數(shù)是12;其他,以此類推。ELM模型將輸入層接收的外部輸入數(shù)據(jù),經(jīng)過神經(jīng)網(wǎng)絡(luò)的計算由輸出層輸出預(yù)測結(jié)果。輸出層只需要輸出類別,為1×1維,故輸出層神經(jīng)元數(shù)是1個。
表2 6個模型對應(yīng)輸入變量
對于ELM,當(dāng)隱含層神經(jīng)元個數(shù)等于訓(xùn)練集樣本個數(shù)時,網(wǎng)絡(luò)輸出的預(yù)測結(jié)果可以有百分百的正確率,即可以以零誤差逼近所有訓(xùn)練樣本[15]。然而,隱含層神經(jīng)元個數(shù)越多并不意味著越好,這需要從網(wǎng)絡(luò)識別速度以及訓(xùn)練集測試集的預(yù)測正確率方面進行系統(tǒng)考慮,做出適中選擇。通過多次實驗,ELM隱含層神經(jīng)元數(shù)確定為50個。為了滿足對比試驗的要求,針對每種模型,BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)與ELM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)保持一致。
在各個類別的100個樣本中分別隨機選取90個樣本(5類共450個)構(gòu)成ELM神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集,剩余的10個樣本(5類共50個)作為測試集。模型建立及實驗測試后,通過計算測試集的預(yù)測率以及程序的運行時間,便可對模型和ELM、BP神經(jīng)網(wǎng)絡(luò)的性能進行綜合評價。實驗采用的計算機核心配置為:2.60 GHz主頻的CPU,4.0 GB的RAM,1 TB的硬盤,運行Windows 10操作系統(tǒng),并配有軟件MatLab R2014a。
6個模型的測試集正確率對比如圖4所示,運行時間對比如圖5所示。通過比較發(fā)現(xiàn),模型3預(yù)測效果最好,該模型測試集樣本預(yù)測結(jié)果對比如圖6所示。
圖4 6個模型測試集正確率對比
圖5 6個模型運行時間對比
圖6 模型3預(yù)測結(jié)果
從圖6中不難發(fā)現(xiàn):
(1)6個模型中,利用3個特征項共17個特征參數(shù)建立的模型3,ELM和BP測試集正確率分別達到96%和90%,取得的預(yù)測效果最好;
(2)6個模型的ELM神經(jīng)網(wǎng)絡(luò)平均運行時間在150 ms左右,遠快于BP神經(jīng)網(wǎng)絡(luò),且對于模型3,其ELM運行時間最短,為最優(yōu)磨粒識別模型。
(1)將ELM應(yīng)用于鐵譜磨粒識別中,對基于鐵譜磨粒特征參數(shù)建立的神經(jīng)網(wǎng)絡(luò)模型進行了定量研究,確定了最優(yōu)模型的建立。在模式識別中一些特征參數(shù)屬于冗余項,不僅會使網(wǎng)絡(luò)結(jié)構(gòu)更加復(fù)雜,還會使網(wǎng)絡(luò)出現(xiàn)過擬合,預(yù)測結(jié)果準(zhǔn)確率不升反降。因此,在最優(yōu)磨粒識別模型的建立上,不僅可以從三個方面的特征項進行探究,還可以從特征參數(shù)的類型和數(shù)量的組合上進行探究。
(2)BP神經(jīng)網(wǎng)絡(luò)的對比實驗表明:ELM神經(jīng)網(wǎng)絡(luò)較BP神經(jīng)網(wǎng)絡(luò)對測試樣本集預(yù)測正確率更高,速度更快,這為研究機械磨損情況更為復(fù)雜的磨粒的智能化識別提供一種新的方法。