吳益紅,許 鋼,江娟娟,畢運(yùn)鋒
(安徽工程大學(xué) 安徽檢測技術(shù)與節(jié)能裝置省級實(shí)驗(yàn)室,安徽 蕪湖 241000)
?
引用格式:吳益紅,許鋼,江娟娟,等.基于LBP和SVM的工件圖像特征識別研究[J].重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2016(1):77-84.
Citation format:WU Yi-hong, XU Gang, JIANG Juan-juan,et al.Research on Workpiece Image Feature Recognition Based on LBP and SVM[J].Journal of Chongqing University of Technology(Natural Science),2016(1):77-84.
基于LBP和SVM的工件圖像特征識別研究
吳益紅,許鋼,江娟娟,畢運(yùn)鋒
(安徽工程大學(xué)安徽檢測技術(shù)與節(jié)能裝置省級實(shí)驗(yàn)室,安徽 蕪湖241000)
摘要:針對工業(yè)現(xiàn)場諸如粉塵、光照、遮擋、攝像機(jī)抖動等復(fù)雜環(huán)境下工件目標(biāo)的識別問題,提出一種基于局部二值模式(local binary pattern, LBP)和支持向量機(jī)(support vector machine, SVM)的組合模型,對工件圖像進(jìn)行特征提取與類別判定。運(yùn)用基本LBP模式、LBP等價(jià)模式以及LBP旋轉(zhuǎn)不變模式,并結(jié)合多種去噪方法對工件圖片進(jìn)行特征提取,得出LBP特征直方圖。根據(jù)這些特征直方圖,利用分類模型對工件進(jìn)行分類識別。實(shí)驗(yàn)結(jié)果表明:基于均值濾波去噪的LBP基本特征算子較好地滿足了工件圖像的特征提取要求,為后續(xù)的工件圖片分類提供了保障,使得圖片識別準(zhǔn)確率達(dá)96%,識別效果較佳。
關(guān)鍵詞:工件圖像;局部二值模式;支持向量機(jī);特征提取;工件分類
在復(fù)雜環(huán)境中正確識別出目標(biāo)物體,是工業(yè)機(jī)器人實(shí)現(xiàn)有效分揀、目標(biāo)定位以及視覺跟蹤的前提和基礎(chǔ),其識別結(jié)果的正確與否直接影響機(jī)器人裝配操作的準(zhǔn)確性。然而,復(fù)雜環(huán)境下圖像易出現(xiàn)模糊、缺損、噪聲污染等降質(zhì)問題,對工業(yè)機(jī)器人的識別結(jié)果產(chǎn)生嚴(yán)重影響??焖贉?zhǔn)確地提取并識別出工件圖片對于機(jī)器人現(xiàn)場實(shí)時(shí)操作具有至關(guān)重要的意義。
LBP指局部二值模式,由芬蘭奧盧大學(xué)的T.ojala等[1]提出,可以對圖像局部紋理特征信息進(jìn)行高效的度量和提取。因具有旋轉(zhuǎn)不變性和灰度不變性及理論簡單、效果良好等優(yōu)點(diǎn),LBP被廣泛應(yīng)用于機(jī)器視覺、生物醫(yī)學(xué)、人臉識別等領(lǐng)域[2]。
文獻(xiàn)[3]提出一種多尺度LBP傅里葉直方圖與主動形狀模型相結(jié)合的方法并運(yùn)用于人臉表情識別,結(jié)果表明:該方法在人機(jī)交互方面有一定的應(yīng)用價(jià)值。文獻(xiàn)[4]提出一種基于多尺度LBP子模式特征的人臉描述與識別方法,對光照、人臉表情和位置的變化具有較高的魯棒性。文獻(xiàn)[5]將LBP用于X射線圖像的增強(qiáng)、邊緣提取和缺陷識別等應(yīng)用中,針對X射線圖像的特點(diǎn),從圖像的檢測效果和檢測時(shí)間2個(gè)方面提高了工業(yè)X射線圖像的檢測效率。
SVM是一種較好的基于混沌理論的非線性預(yù)測分類算法。與傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)基于經(jīng)驗(yàn)風(fēng)險(xiǎn)不同的是,SVM基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化,能夠有效避免過擬合、泛化能力差等不足[6]。由于其通用性好、魯棒性強(qiáng)、計(jì)算簡單、效果良好,故被廣泛地應(yīng)用于機(jī)器學(xué)習(xí)、模式識別、回歸預(yù)測等領(lǐng)域[7]。
文獻(xiàn)[8]采用區(qū)域直方圖作為圖像特征支持向量,利用SVM實(shí)現(xiàn)對圖像數(shù)據(jù)庫的檢索和分類。文獻(xiàn)[9]采用常用的灰度共生矩陣方法提取圖像紋理特征,作為圖像特征支持向量,采用一對一方法構(gòu)建出多分類SVM分類器實(shí)現(xiàn)了Brodatz紋理庫中的圖像分類。
本文提出一種基于去噪的LBP基本算子和SVM的對工件圖像進(jìn)行分類識別的算法,結(jié)合LBP在圖像特征提取上的優(yōu)勢,在兼顧識別的實(shí)時(shí)性和正確率的基礎(chǔ)上,利用SVM分類器完成對降質(zhì)圖像中各種類型不同形態(tài)工件的識別。本文對工業(yè)現(xiàn)場拍攝的圖片集進(jìn)行實(shí)驗(yàn),通過比較不同的LBP算子,驗(yàn)證去噪的LBP基本算子和SVM組合算法在工件圖片特征提取與識別分類中的高效性。圖1為本文采用的5類工件圖片(從左至右分別為1~5類,每類各列舉一例)。
圖1 5類工件圖片
1LBP提取圖像特征
1.1LBP算子
LBP算子是一種灰度尺度恒定的紋理算子,來自局部鄰域紋理的普通定義。其基本思想:以中心點(diǎn)像素的灰度值作為閾值,與它的鄰域比較,得到二進(jìn)制碼來表述局部紋理特征。本文利用3種不同的LBP算子,分別為基本LBP算子、LBP等價(jià)模式算子和LBP旋轉(zhuǎn)不變算子,對工件圖像進(jìn)行特征提取,找出最適合于工件圖像特征提取的LBP算子。
1.1.1LBP 基本算子
LBP基本算子即原始的LBP。原始的LBP在一個(gè)3×3矩陣窗口中定義,每個(gè)窗口值代表一個(gè)像素點(diǎn)的灰度值。如圖2所示,將中心點(diǎn)灰度值與外圍8個(gè)點(diǎn)灰度值進(jìn)行比較,大于中間像素點(diǎn)的灰度值的數(shù)值置為1,否則為0。然后,按所處的位置不同,給8個(gè)處理后的值以不同權(quán)值,逐個(gè)相加得到的結(jié)果定義為該區(qū)域內(nèi)的LBP值。
圖2 基本LBP算子
1.1.2LBP等價(jià)模式算子
LBP等價(jià)模式這樣定義:當(dāng)LBP算子的循環(huán)二進(jìn)制數(shù)從0到1或從1到0跳變最多有2次時(shí),如00000000或者00110000,這些二進(jìn)制模式都屬于等價(jià)模式類??梢园凑杖缦鹿接?jì)算二進(jìn)制模式是否是等價(jià)模式:
(1)
式中若某種模式計(jì)算得到的U(GP)不大于2,則被看作等價(jià)模式。通過這樣的改進(jìn),模式類別由之前的2P種降低到P(P-1)+2種,有效減少了模式類別。
通過等價(jià)模式計(jì)算可以簡化模式種類,還可降低高頻噪聲干擾,并且不損失圖像信息,有效降低了特征數(shù)據(jù)的維數(shù),提高了分類效率。
1.1.3LBP旋轉(zhuǎn)不變模式算子
基于LBP的灰度不變性和旋轉(zhuǎn)不變性,Maenpaa等[11]提出了旋轉(zhuǎn)不變的LBP算子。LBP旋轉(zhuǎn)模式通過不斷旋轉(zhuǎn)圖像的圓形領(lǐng)域,得到一系列的LBP值,選取其中的最小值作為最終的LBP值,用公式表示為
(2)
其中:LBPri表示LBP旋轉(zhuǎn)不變算子;ROR(x,i)為旋轉(zhuǎn)函數(shù),可以將x循環(huán)右移i(i
圖3描述了LBP旋轉(zhuǎn)不變模式的計(jì)算過程。其中,最上面代表原始LBP值,通過循環(huán)旋轉(zhuǎn),得到中間8個(gè)LBP值,取其中的最小值(即00001111)作為中間8種LBP模式的旋轉(zhuǎn)不變模式值。
圖3 LBP旋轉(zhuǎn)不變模式
旋轉(zhuǎn)不變模式在增強(qiáng)LBP算子魯棒性的同時(shí),顯著減少了LBP模式的類別,有利于特征分類。
1.2LBP特征譜直方圖
工件圖像的特征譜只反映了工件圖片的局部特征,不適合直接采用LBP特征譜進(jìn)行工件特征提取。為了獲得更加豐富、切合度更高的特征,一般的做法是將LBP特征譜轉(zhuǎn)變成LBP直方圖序列。
本文將該序列作為鑒別特征進(jìn)行工件識別分類。提取LBP工件圖像直方圖序列的具體過程如圖4所示。
圖4 提取LBP工件圖像直方圖序列的具體過程
2SVM與libSVM工具箱
2.1SVM圖像分類原理
SVM由Vapnik于1995年提出[12],其本質(zhì)是在訓(xùn)練數(shù)據(jù)中找出適合構(gòu)造最優(yōu)分類超平面的支持向量。對于圖像分類這種非線性分類問題,SVM的主要思路是通過非線性變換將輸入空間數(shù)據(jù)映射到高維特征向量空間,在該空間中構(gòu)造出最優(yōu)分類超平面,進(jìn)行線性分類,再映射回原數(shù)據(jù)空間,實(shí)現(xiàn)原空間下的非線性分類。SVM通過引入核函數(shù)降低了高維空間下數(shù)據(jù)計(jì)算的復(fù)雜度,但是引入核函數(shù)會產(chǎn)生偏差,故通過引入?yún)⒘克沙谙禂?shù)g和懲罰系數(shù)c,從而使得模型推廣能力提高,復(fù)雜性和經(jīng)驗(yàn)風(fēng)險(xiǎn)降低。
2.2libSVM工具箱
由臺灣大學(xué)林智仁(Lin Chih-Jen)教授等開發(fā)的SVM模式識別與回歸開源軟件包可以解決如圖像識別等諸多分類問題(C-SVR、-SVC等),在國內(nèi)外學(xué)術(shù)研究機(jī)構(gòu)被廣泛使用[13-14]。libSVM的使用步驟:
1) 特征數(shù)據(jù)歸一化
由于作為圖像特征數(shù)據(jù)的輸入測試集和訓(xùn)練集屬性的取值不屬于同一個(gè)數(shù)量級,輸入變量差異較大,因此在建立模型之前,需將數(shù)據(jù)進(jìn)行歸一化預(yù)處理[15]。
對訓(xùn)練集和測試集進(jìn)行歸一化采用的歸一化映射如下:
(3)
式中:xi,yi∈Rn;xmin=min(x);xmax=max(x)。歸一化使原始數(shù)據(jù)被映射到[0,1]范圍內(nèi),即yi[0,1],i=1,2,…,n, 這種歸一化方式稱為[0,1]區(qū)間歸一化。
在Matlab中,mapminmax函數(shù)可以實(shí)現(xiàn)上述的歸一化,mapminmax函數(shù)所采用的映射為
(4)
其中:xmax,xmin分別是原始數(shù)據(jù)x的最大值和最小值;ymin和ymax是映射的范圍參數(shù),可調(diào)節(jié)。如果把ymin和ymax分別置為0和1,此時(shí)的映射函數(shù)即為上面的[0,1]歸一化,也可以設(shè)置為-1和1,此時(shí)的映射函數(shù)即為[-1,1]歸一化。
2) SVM參數(shù)選取
核函數(shù)的參數(shù)選取影響到分類的性能,在利用libSVM進(jìn)行圖像分類前,首先需要對RBF核函數(shù)進(jìn)行參數(shù)尋優(yōu),然后進(jìn)行交叉檢驗(yàn)。在所有參數(shù)中,最重要的是c和g。其中c是設(shè)置C-SVC、e-SVR和v-SVR的參數(shù);g對核函數(shù)中的gamma函數(shù)進(jìn)行設(shè)置。
libSVM利用K-CV交叉驗(yàn)證方法確定最優(yōu)化參數(shù)值,函數(shù)實(shí)現(xiàn)形式是SVMcgForClass,輸出得到的最優(yōu)參數(shù)值bestmse、bestc、bestg分別表示最優(yōu)均方誤差以及最優(yōu)的c、g值。
3實(shí)驗(yàn)部分
3.1模型建立
從原始工件圖片數(shù)據(jù)里選定訓(xùn)練集和測試集,進(jìn)行圖片數(shù)據(jù)預(yù)處理和特征提取,之后用SVM對訓(xùn)練集的特征數(shù)據(jù)進(jìn)行訓(xùn)練,得到訓(xùn)練模型,然后再用得到的模型來預(yù)測測試集的分類標(biāo)簽,得出分類準(zhǔn)確率。模型算法流程見圖5。
圖5 模型算法流程
其中,預(yù)處理包括圖片亮度增強(qiáng)、灰度化等;LBP特征提取包括對圖片進(jìn)行去噪、提取LBP紋理特征以及獲得LBP直方圖;訓(xùn)練SVM則包括數(shù)據(jù)歸一化、設(shè)置標(biāo)簽以及參數(shù)選擇等。下面將對模型的每一步驟展開實(shí)驗(yàn)設(shè)計(jì)。
3.2預(yù)處理與LBP特征提取
3.2.1選定測試集和訓(xùn)練集
實(shí)驗(yàn)在Matlab R2012a平臺上運(yùn)行,計(jì)算機(jī)運(yùn)行環(huán)境為Pentium G2030T,2.60 GHz處理器。本文建立了一個(gè)工件圖片的小樣本數(shù)據(jù)集,采用5類(每類16幅)共80幅,每幅像素大小為300×200的工件圖片集。使用交叉驗(yàn)證法來選定最好的訓(xùn)練集和測試集,采用的訓(xùn)練集和測試集分別為每類圖片的前11幅和后5幅,即55幅作為訓(xùn)練集,25幅作為測試集。
3.2.2圖片亮度增強(qiáng)與灰度化
由圖1可知:工件圖片的亮度普遍偏低。為了不影響特征提取的精確度,在對圖像進(jìn)行特征提取前,需對各圖片進(jìn)行亮度增強(qiáng)處理。本文采用的方法是調(diào)節(jié)圖片的對比度,由函數(shù)imadjust(x,stret、chlim(x),[0 1])實(shí)現(xiàn)。
通常,在對圖像進(jìn)行處理前會將其轉(zhuǎn)換成灰度圖像,這樣在保留圖像的整體和局部信息的同時(shí)可以有效降低字節(jié)數(shù),提高數(shù)據(jù)處理速度。本文利用加權(quán)平均法,將RGB三個(gè)分量分配不同的權(quán)值,實(shí)現(xiàn)圖像的灰度化處理。按照人眼對RGB 3個(gè)分量的敏感度不同,設(shè)定以下3個(gè)權(quán)值以得到較好的灰度圖像:
0.11B(i, j)A
(5)
其中:f(i,j)為轉(zhuǎn)換后的灰度圖像在(i,j)處的灰度值;R(i,j)、G(i,j)和B(i,j)分別為(i,j)處的紅色值、綠色值以及藍(lán)色值。
3.2.3LBP特征提取
雖然LBP 算子具有旋轉(zhuǎn)不變性和灰度不變性等顯著優(yōu)點(diǎn),但LBP的抗噪性較差,所以不能直接運(yùn)用LBP對處理過的灰度圖像進(jìn)行特征提取。本文采用多種去噪方式和LBP結(jié)合來提取圖像特征。如采用1.2節(jié)所述方法提取各訓(xùn)練集和測試集圖片的LBP紋理圖像,并進(jìn)一步得到特征譜直方圖,以此作為各工件的特征進(jìn)行訓(xùn)練和測試分類。
3.3libSVM對圖片的訓(xùn)練和預(yù)測
3.3.1數(shù)據(jù)歸一化
libSVM在對圖片特征數(shù)據(jù)進(jìn)行訓(xùn)練和測試之前,需要對數(shù)據(jù)進(jìn)行歸一化。本文根據(jù)2.2節(jié)所述歸一化方法,設(shè)定歸一化范圍為[0,1]。
3.3.2訓(xùn)練和測試
1) 標(biāo)簽標(biāo)記
首先分別對訓(xùn)練集和測試集進(jìn)行標(biāo)簽標(biāo)記。具體做法如下:
① 載入數(shù)據(jù),使用load workpiece.mat;
② 將第1~5類工件圖片的前11幅作為訓(xùn)練集,剩下的5幅作為測試集:
train_workpiece=[wp1(1:11,:);wp2(1:11,:); …;wp5(1:11,:)];
test_workpiece=[wp1(12:16,:); wp2(12:16,:); …; wp5(12:16,:)];
③ 將相應(yīng)的標(biāo)簽提取出來:
train_workpiece_label=[wp1_label(1:11);…;wp5_label(1:11)];
test_workpiece_label=[wp1_label(11:16);…;wp5_label(11:16)];
2) 訓(xùn)練與測試
libSVM工具箱提供了訓(xùn)練函數(shù)和測試函數(shù)。
訓(xùn)練函數(shù):
model=SVMtrain(train_label,train_matrix,[‘libSVM_options’])
其中:model為訓(xùn)練得到的分類模型;train_label為訓(xùn)練集標(biāo)簽;train_matrix為訓(xùn)練集屬性,即訓(xùn)練集圖片特征,一般以矩陣形式給出;libSVM_options為一些參數(shù)選擇,一般為懲罰參數(shù)c、核函數(shù)參數(shù)g。本文中c、g采用2.2節(jié)提到的交差驗(yàn)證法得到。
測試函數(shù):
[predicted_label,accuray]=
SVMpredict(test_label,test_matrix,[‘libSVM_options’])
其中:predicted_label為預(yù)測得到的測試集標(biāo)簽;accuray為分類準(zhǔn)確率;test_label為測試集標(biāo)簽;test_matrix測試集屬性,即測試集圖片特征,一般以矩陣形式給出;libSVM_options是一些參數(shù)選擇函數(shù)。
4結(jié)果與分析
本文針對LBP的抗噪性差這一缺點(diǎn),采用小波去噪以及常用的5種去噪方式,即圓形區(qū)域均值濾波、對比度增強(qiáng)濾波、高斯低通濾波、5×5中值濾波、3×3均值濾波對圖片進(jìn)行去噪處理,并采用不同的LBP算子與SVM結(jié)合進(jìn)行分類。經(jīng)過試驗(yàn)得到的部分結(jié)果如表1~3所示。
表1 基本LBP算子在不同去噪方法下的分類結(jié)果
等價(jià)模式在不同去噪方法下的分類結(jié)果
旋轉(zhuǎn)不變模式在不同去噪方法下的分類結(jié)果
由表1~3可知:表1的模式在分類準(zhǔn)確率和耗時(shí)方面的總體效果最好,表2、3的模式則在這兩方面均顯示出較低的水平。這是因?yàn)榈葍r(jià)模式雖能代表絕大多數(shù)圖像的有效信息,然而圖像紋理的多樣性使得每一類圖像都有其各自的特點(diǎn)和關(guān)鍵信息。這種固定的等價(jià)模式并不適用于任何種類的圖像。采用等價(jià)模式時(shí)常發(fā)現(xiàn)混合模式的數(shù)量很大,特別是在工件圖片這種受光照或局部變化較明顯的圖像中,這對于特征提取的準(zhǔn)確性和穩(wěn)定性都是不利的。旋轉(zhuǎn)不變性的LBP算子丟失了方向性,這在工件圖像這種方向性比較重要的圖片中也是非常不利的。
由于紋理圖像的興趣點(diǎn)通常散布在圖片的整個(gè)區(qū)域內(nèi),而工件圖像包含了較多背景像素點(diǎn),因此在一定程度上來說,它并非嚴(yán)格意義上的紋理圖片。通過使用和對比幾種不同的LBP算子,結(jié)合不同的去噪模式,得出LBP基本算子最適合識別工件圖像。圖6是LBP基本算子的計(jì)算過程,其中:黑色點(diǎn)是去除噪聲的點(diǎn);虛線指濾波器作用范圍??梢园l(fā)現(xiàn):采樣點(diǎn)在半徑為2的圓的實(shí)線上,這樣,LBP基本算子能獲得大范圍的特征信息,避免了頻譜混疊,控制了采樣點(diǎn)個(gè)數(shù),有效減少了計(jì)算數(shù)量,適合本文工件圖片的特征提取。
圖6 本文的LBP
本文在圖像分類精度評價(jià)中,首先采用表1~3中的分類準(zhǔn)確率進(jìn)行評估。但是要獲得一個(gè)好的分類結(jié)果,除了需要較高的準(zhǔn)確率外,還需知道其具體的實(shí)測情況。評估分類可信度的一個(gè)基本工具是混淆矩陣(confusion matrix)。本文列出分類準(zhǔn)確率較高的基于3×3均值濾波、對比度增強(qiáng)濾波以及基于高斯低通濾波3種方法的混淆矩陣,分別對其分類可信度進(jìn)行評估測試。表4~6是這3種方法的混淆矩陣(表中的1~5類分別表示圖1中的1~5類圖片)。
表4 基于均值濾波方法的混淆矩陣
表5 基于對比度增強(qiáng)濾波方法的混淆矩陣
表6 基于高斯低通濾波方法的混淆矩陣
混淆矩陣的每一列代表了實(shí)際測得信息,每一列中的數(shù)值等于實(shí)際測得的圖片在分類圖像中對應(yīng)于相應(yīng)類別的數(shù)量。例如,表4中第2列中的‘1’表示在實(shí)際測得的結(jié)果中有1個(gè)第4類圖像被測分為第1類圖像;混淆矩陣的每一行代表了工件圖像的分類信息,每一行中的數(shù)值等于分類器在實(shí)測圖片相應(yīng)類別中的數(shù)量。
本文參與測試的工件圖片數(shù)為25幅,分為5類,每類5幅?;煜仃囍忻恳恍袌D片數(shù)之和為5,表示5個(gè)樣本。例如,表4中的第4行表示有4個(gè)樣本正確分類,有1個(gè)樣本被錯(cuò)分成2類圖片。每一列數(shù)目之和表示此次分類中被分成某類的圖片總數(shù)。由表4~6可以看出:表4,即基于均值濾波去噪的LBP對圖像進(jìn)行特征提取并與SVM結(jié)合進(jìn)行圖片分類時(shí),分類效果最好。
在混淆矩陣中,除了可以直觀地看到分類結(jié)果的好壞之外,還可根據(jù)各行各列的數(shù)據(jù)得到潛在的分類結(jié)果數(shù)據(jù):TP(true positive,真正類,被模型預(yù)測為正的正樣本),F(xiàn)N(false negative,假負(fù)類,被模型預(yù)測為負(fù)的正樣本),F(xiàn)P(false positive,假正類,被模型預(yù)測為正的負(fù)樣本),TN(true negative,真負(fù)類,被模型預(yù)測為負(fù)的負(fù)樣本)。根據(jù)這4個(gè)數(shù)據(jù)及其相關(guān)關(guān)系,繪制出受試者工作特征曲線(receiver operator characteristic curve,ROC),如圖7所示。
圖7 ROC曲線
ROC曲線可以通過描述真正類率TPR=TP/(TP+FN)和負(fù)正類率FPR=FP/(FP+FN)來實(shí)現(xiàn)。在ROC曲線中,分類模型越好就越靠近圖形的左上方,而一個(gè)隨機(jī)猜測模型則位于連接點(diǎn)(TPR=0,F(xiàn)PR=0)和(TPR=1,F(xiàn)PR=1)的主對角線上。
ROC曲線下方的面積(area under the ROC curve, AUC)提供了評價(jià)模型性能的另一種方法。如果模型是完美的,那么它的AUC=1;如果模型是簡單隨機(jī)猜測模型,那么它的AUC=0.5;如果一個(gè)模型優(yōu)于另一個(gè),則它的AUC相對較大。由此,從圖7中可以得到基于均值濾波的方法最靠近左上角,其AUC為0.999 3,明顯大于其他兩種方法(0.982 5,0.787 5)。這說明了基于均值濾波的LBP與SVM分類器結(jié)合的模型分類效果最好。
5結(jié)束語
本文將基于紋理特征的算法LBP運(yùn)用于工件圖片的特征提取,在運(yùn)用LBP各模式與多尺度結(jié)合提取特征的過程中,得出最好的實(shí)驗(yàn)結(jié)果是和工件圖像特點(diǎn)契合度較高的基本LBP算子。由于LBP對噪聲十分敏感,故本文采用多種去噪方式與LBP算子結(jié)合來處理圖片,最后使用SVM模型對LBP提取的特征進(jìn)行分類識別。實(shí)驗(yàn)結(jié)果表明:基于均值濾波去噪的LBP算子與SVM結(jié)合結(jié)果準(zhǔn)確率最高,同時(shí)也證明了LBP對非明顯紋理圖像的工件圖片進(jìn)行處理的可行性。
由于主流物體分類與識別數(shù)據(jù)庫中沒有特定的工件圖片集,因此本文方法有一定的局限性。采集的樣本數(shù)目雖滿足一般的小樣本集要求,但仍然較少,這也會影響分類效果。擁有研究特定的樣本集、擴(kuò)大樣本集數(shù)目是下一步要解決的問題。
參考文獻(xiàn):
[1]OJALAT,PIETIKAINENM,HARWOODD.Acomparativestudyoftexturemeasureswithclassificationbasedonfeaturedistributions[J].PatternRecognition,1996,29(1):51-59.
[2]劉偉鋒,李樹娟,王延江.人臉表情的LBP特征分析[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(2):149-152.
[3]王麗,李瑞峰,王珂.多尺度局部二值模式傅里葉直方圖特征的表情識別[J].計(jì)算機(jī)應(yīng)用,2014,34(7):2036-2039.
[4]黃非非.基于LBP的人臉識別研究[D].重慶:重慶大學(xué),2009.
[5]畢碧.局部二值模式的改進(jìn)及其在工業(yè)X射線圖像中的應(yīng)用研究[D].重慶:重慶大學(xué),2012.
[6]高錦.基于SVM的圖像分類[D].西安:西北大學(xué),2010.
[7]王曉云.基于SVM的圖像分類算法優(yōu)化實(shí)現(xiàn)[J].信息安全與通信保密,2013(2):59-62.
[8]王亮申.基于SVM的圖像分類[J].計(jì)算機(jī)應(yīng)用與軟件,2005,22(5):98-99.
[9]章智儒.SVM在圖像分類中的應(yīng)用[J].信息技術(shù),2009,8(25):133-134.
[10]OJALAT,PIETIKAINENM,MAENPAAT.Multiresolutiongrayscaleandrotationinvarianttextureclassificationwithlocalbinarypatterns[J].IEEETrans.onPatternAnalysisandMachineIntelligence,2002,24(7):971-987.
[11]MAENPAAT,PIETIKAINENM.Textureanalysiswithlocalbinarypatterns.HandbookofPatternRecognitionandComputerVision[M].3rded.WorldScientific,Singapore,2001:711-736.
[12]CORTESC,VAPNIKV.SupportvectornetworksMachineLearning[J].MachineIntelligence,2002,24(7):971-987.
[13]LINCJ.APracticalGuidetoSupportVectorClassification[Z].Taiwan:NationalTaiwanUniversity,Initialversion:,2010.
[14]CHANGCC,LINCJ.LIBSVM:ALibraryforSupportVectorMachines[Z].Taiwan:NationalTaiwanUniversity,Initialversion:2001Lastupdated:March4,2013.
[15]史峰,王小川.MATLAB神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析[M].北京:北京航空航天大學(xué)出版社,2010:115-116.
(責(zé)任編輯楊黎麗)
Research on Workpiece Image Feature Recognition
Based on LBP and SVM
WU Yi-hong, XU Gang, JIANG Juan-juan,BI Yun-feng
(Anhui Key Laboratory of Detection Technology and Automation Devices,
Anhui Polytechnic University, Wuhu 241000, China)
Abstract:Aiming at the problem of workpiece identification in the complex environment of industry field such as dust, light, shelter, and camera shake, this paper proposed a combined model based on local binary pattern (LBP for short) and support vector machine(SVM for short) for feature extraction and recognition of the workpiece images. By using basic LBP pattern, LBP uniform pattern and LBP rotation invariant pattern and combining with various noise attenuation, we extracted and analyzed workpiece image features, and obtained LBP feature histogram, and then classified and recognized the workpiece image by utilizing classification models according to these characteristics. The experimental results indicate that the basic LBP pattern on Mean Filter is more suitable for the feature extraction and provides guarantees for classification of the workpiece images, and the image recognition effect is better and the recognition rate is up to 96%.
Key words:workpiece image; local binary pattern; support vector machine; feature extraction; workpiece classification
文章編號:1674-8425(2016)01-0077-08
中圖分類號:TP391.41
文獻(xiàn)標(biāo)識碼:A
doi:10.3969/j.issn.1674-8425(z).2016.01.013
作者簡介:吳益紅(1989—),女,安徽宿州人,碩士研究生,主要從事智能信息處理及應(yīng)用、圖像處理等方面研究;許鋼(1972—),男,安徽蕪湖人,副教授,碩士生導(dǎo)師,主要從事數(shù)字信號處理、機(jī)器人視覺研究。
基金項(xiàng)目:國家自然科學(xué)基金資助項(xiàng)目(61271377);安徽省高等教育提升計(jì)劃省級自然科學(xué)研究一般項(xiàng)目(2014B02)
收稿日期:2015-10-10