朱善瑋,李玉惠
(昆明理工大學(xué) 信息工程與自動(dòng)化學(xué)院,昆明 云南 650500)
智能交通系統(tǒng)(ITS)在減輕交通壓力、提高交通管理效率、預(yù)防肇事逃逸等違法行為方面有很大的作用,其中的車輛識(shí)別是智能交通系統(tǒng)的一個(gè)重要方向,是國內(nèi)外學(xué)者研究的熱門話題,通過視頻圖像對(duì)車輛進(jìn)行識(shí)別是被廣泛研究的一種方法,近年來有許多相關(guān)的算法被提出。有關(guān)視頻圖像在車輛識(shí)別方面的應(yīng)用,最開始是通過車牌的信息來確定車輛身份,但對(duì)于一些遮擋車牌、無車牌等“灰牌照”的車輛則不能有效識(shí)別。后來的研究者們又提出其它有關(guān)車輛模型識(shí)別的方法,例如,文獻(xiàn)[1~3]利用SIFT特征并通過PCA、池化等方法對(duì)特征進(jìn)行降維,然后對(duì)車輛進(jìn)行識(shí)別;文獻(xiàn)[4]則是通過提取圖像中車輛輪廓的Harris角點(diǎn)對(duì)車輛進(jìn)行識(shí)別,這些方法都具有很好的識(shí)別效果,但只能識(shí)別出車輛的轎車、客車、卡車等大類的車型劃分,對(duì)于每類車型下的具體品牌則不能識(shí)別。
人臉的識(shí)別是通過面部及五官特征的不同分布來區(qū)分人的各異性,而對(duì)于車輛來說,不同品牌車輛的車標(biāo)不同,相同品牌下不同車系的柵格、車前燈也不相同,這些車標(biāo)、柵格、車燈構(gòu)成的車臉特征為車輛的識(shí)別提供依據(jù)。文獻(xiàn)[5~8]均提出了用車臉圖像的信息對(duì)車輛進(jìn)行識(shí)別的方法;文獻(xiàn)[6]利用灰度共生矩陣提取車臉圖像的紋理特征,然后用最小距離法對(duì)車輛進(jìn)行識(shí)別;文獻(xiàn)[7]提出利用車臉圖像的HOG特征對(duì)15個(gè)品牌下的80種不同轎車車型進(jìn)行識(shí)別,上述方法證明了基于車臉圖像識(shí)別車輛模型的可行性,但均需要提高識(shí)別率。LBP算子作為一種有效的紋理特征,可以度量和描述圖像中不同的紋理信息,并且它對(duì)單調(diào)的光照變化不敏感且計(jì)算效率高,被廣泛應(yīng)用于人臉識(shí)別[9-10]領(lǐng)域。原始的LBP算子不具有旋轉(zhuǎn)不變性,并且直方圖統(tǒng)計(jì)特征的維數(shù)相對(duì)較高,為了增加車臉圖像對(duì)光照和旋轉(zhuǎn)的魯棒性,本文采用旋轉(zhuǎn)不變模式和等價(jià)模式相結(jié)合的VAR/LBP[11]特征,并通過提取到的特征訓(xùn)練出SVM[12-13]分類模型,以此來提高車臉圖像的識(shí)別率。
基于SVM和VAR/LBP的車臉識(shí)別算法流程如圖1所示。
圖1 車臉圖像識(shí)別流程圖
從算法流程圖可知,車輛圖像的識(shí)別過程主要分為兩個(gè)部分,特征的提取和分類模型的訓(xùn)練。
原始的LBP算子的窗口大小定義為3×3的矩形窗口,特征編碼方式是將灰度圖像中矩形窗口的中心像素灰度值與其鄰域像素灰度值比較,領(lǐng)域像素灰度值大于中心像素的灰度值則置1,否則為0,編碼過程如圖2所示。
圖2 原始LBP編碼過程示意圖
由此可以得到一個(gè)8位的二進(jìn)制編碼,將每一位編碼乘以相對(duì)應(yīng)的權(quán)重累加求和可以得到LBP值,即
(1)
其中,gc為中心像素的灰度值,gi為鄰域像素的灰度值,s為權(quán)重系數(shù),其取值規(guī)則為
(2)
不同于原始的LBP編碼過程,VAR/LBP則是在關(guān)于中心像素對(duì)稱的半徑為R的圓形分布上采樣P個(gè)像素點(diǎn),代替原始的矩形窗口,對(duì)沒有處于圖像像素位置的采樣點(diǎn)通過線性插值的方法獲得相應(yīng)的灰度值,采樣過程如圖2所示。
圖3 VAR/LBP采樣示意圖
為了增加車臉圖像對(duì)光照的魯棒性,首先對(duì)車臉圖像提取VAR特征,然后再對(duì)提取到的VAR特征圖像進(jìn)行采樣,采樣點(diǎn)的編碼取值同原始的LBP;同時(shí)為了增加LBP特征的旋轉(zhuǎn)不變性,對(duì)圖像的采樣點(diǎn)進(jìn)行旋轉(zhuǎn),得到的最小的二進(jìn)制編碼值作為具有旋轉(zhuǎn)不變性的LBP值,這不僅增加了LBP特征的旋轉(zhuǎn)不變性同時(shí)也降低了特征編碼的模式。為了進(jìn)一步降低特征編碼的模式,研究者發(fā)現(xiàn)絕大多數(shù)LBP特征模式最多只包含兩次從1到0或從0到1的跳變,進(jìn)而提出了LBP等價(jià)模式(Uniform Pattern),即當(dāng)某個(gè)LBP所對(duì)應(yīng)的循環(huán)二進(jìn)制數(shù)從0到1或從1到0最多有兩次跳變時(shí),該類型保留;跳變次數(shù)超過2次時(shí),均歸為一類,最終的VAR/LBP特征編碼的公式為
(3)
其中
(4)
式中,gc為中心像素,gp為采樣點(diǎn),對(duì)一整幅圖像提取VAR/LBP特征并統(tǒng)計(jì)直方圖特征,所得到的VAR/LBP直方圖統(tǒng)計(jì)特征不能表達(dá)出圖像相對(duì)完整的信息,并且同一類圖像之間也會(huì)產(chǎn)生很大誤差,因此需要對(duì)圖像進(jìn)行分塊處理,分塊的車臉圖像提取VAR/LBP特征的步驟如下:
步驟1對(duì)車臉圖像進(jìn)行均衡化和高斯平滑的預(yù)處理;
步驟2對(duì)車臉圖像提取VAR特征,得到VAR特征圖像;
步驟3把VAR特征圖像劃分為M×N個(gè)子圖像塊;
步驟4對(duì)每個(gè)子圖像塊分別提取像素點(diǎn)的LBP特征,分別對(duì)各個(gè)子圖像塊的LBP特征統(tǒng)計(jì)直方圖;
施工單位還要對(duì)工程材料的使用進(jìn)行控制,根據(jù)相關(guān)規(guī)范的要求,對(duì)物資進(jìn)行定量供應(yīng),對(duì)材料的采購、領(lǐng)取、使用進(jìn)行嚴(yán)格的控制及監(jiān)督管理。施工單位要派專人進(jìn)行材料的管理工作,并且材料負(fù)責(zé)人要具備較高的專業(yè)水平和嚴(yán)謹(jǐn)?shù)墓ぷ鲬B(tài)度,并且各個(gè)部門要對(duì)材料的使用進(jìn)行相互監(jiān)督,共同維護(hù)工程材料的使用標(biāo)準(zhǔn),使工程材料的使用率最大化,實(shí)現(xiàn)材料成本的有效控制。
步驟5級(jí)聯(lián)各個(gè)子圖像塊的統(tǒng)計(jì)直方圖;
步驟6采用L2-norm方法對(duì)統(tǒng)計(jì)直方圖特征向量進(jìn)行歸一化處理。
至此,得到車臉圖像的VAR/LBP特征向量,用這些特征向量進(jìn)行下一步的SVM模型訓(xùn)練。
SVM的思想是通過核函數(shù)將在低維空間線性不可分的數(shù)據(jù)樣本映射到線性可分的高維空間,并找到線性可分的最大間距作為最優(yōu)的分類超平面。即對(duì)于數(shù)據(jù)樣本集(xi,yi),xi∈Rd,yi∈{-1,1},i=1,2,…,n,在滿足條件
yi[(w,xi)+b]≥1-ξi
(5)
的情況下,求解最優(yōu)化
(6)
式中,w為權(quán)重參數(shù);ξi為松弛變量;C為正則化參數(shù),用來調(diào)節(jié)分類的準(zhǔn)確率以及防止分類模型過擬合[14]。為取得較好的分類效果,對(duì)特征向量由低維空間向高維空間投影時(shí)采用高斯核函數(shù)k(xi,x)=exp(-‖xi-x‖2)。
實(shí)驗(yàn)環(huán)境為Intel i5-4210M CPU,2.60 GHz,8 GB內(nèi)存,Win8.1操作系統(tǒng),編程語言為Python,使用Scikit-learn作為SVM的開發(fā)工具包。實(shí)驗(yàn)數(shù)據(jù)為高速公路卡口所拍攝車輛的車臉圖像,共4 800幅(包括大眾、別克、雪弗蘭3個(gè)品牌下共8系不同的車臉圖像,每個(gè)車系有600幅)。
圖4 部分車臉樣本圖
采用KNN算法比較VAR/LBP直方圖特征在不同分塊1×1、1×2、2×2、2×4、4×4、4×8以及8×8之間的車臉圖像識(shí)別率,識(shí)別率結(jié)果如圖5所示。
圖5 不同分塊下的識(shí)別率
從圖中可以看出,當(dāng)分塊大小為4×4時(shí)車臉圖像的識(shí)別率最高,因此,實(shí)驗(yàn)選取的圖像分塊數(shù)為4×4。
SVM模型訓(xùn)練的一個(gè)關(guān)鍵環(huán)節(jié)是選取正則化參數(shù)[15],合適的正則化參數(shù)能夠降低模型的復(fù)雜度,避免模型發(fā)生過擬合,使訓(xùn)練模型具有較好的泛化能力。在同一車臉圖像樣本集下,本文通過交叉驗(yàn)證的方法,得到正則化參數(shù)C在不同取值下的損失值,如圖6所示。
圖6 不同參數(shù)C的損失值
由圖可知,當(dāng)正則化參數(shù)取0.1時(shí)訓(xùn)練集和交叉驗(yàn)證集的在SVM模型下的損失值最小,因此,實(shí)驗(yàn)選取的SVM模型的正則化參數(shù)為0.1。
將實(shí)驗(yàn)所得的車臉圖像分塊數(shù)4×4和正則化參數(shù)C值0.1作為實(shí)驗(yàn)的基準(zhǔn),在相同的實(shí)驗(yàn)環(huán)境下,用VAR/LBP特征與SVM分類器對(duì)比HOG特征與集成分類器、紋理特征與最小距離分類器、SURF特征與最近鄰匹配算法,得到4種不同算法的準(zhǔn)確率及平均識(shí)別時(shí)間,不同算法的準(zhǔn)確率實(shí)驗(yàn)結(jié)果如表1所示,不同算法的平均識(shí)別時(shí)間實(shí)驗(yàn)結(jié)果如表2所示。
表1 不同算法的準(zhǔn)確率
表2 不同算法的平均識(shí)別時(shí)間
分析表1和表2可知,本文提出的VAR/LBP特征與SVM分類器方法相比較HOG特征與集成分類器、紋理特征與最小距離分類器、SURF特征與最近鄰匹配3種算法,識(shí)別時(shí)間有所降低,識(shí)別準(zhǔn)確率有所提升,準(zhǔn)確率可達(dá)98.6%,說明VAR/LBP特征與SVM分類器方法在車臉識(shí)別方面應(yīng)用的可行性。
本文針對(duì)傳統(tǒng)LBP特征不具有旋轉(zhuǎn)不變性且特征編碼維數(shù)相對(duì)較高的問題,采用VAR/LBP特征不僅降低了特征的維數(shù),而且增加了車臉圖像對(duì)旋轉(zhuǎn)和光照的魯棒性。實(shí)驗(yàn)表明,對(duì)于不同的光照條件和一定的旋轉(zhuǎn)角度下的車臉圖像,訓(xùn)練出的SVM分類器對(duì)其都有著較好的分類效果,證明了VAR/LBP特征與SVM分類器方法對(duì)對(duì)光照變化、視角變化都具有較好的魯棒性。本文所提出的方法對(duì)無牌照或者牌照遮擋的車輛的識(shí)別方面具有一定的實(shí)用價(jià)值。