張輝
摘 要: 針對實(shí)際場景中的車輛檢測,提供了一種快速有效的檢測方法。首先對檢測圖像進(jìn)行拉普拉斯銳化增強(qiáng)圖像的邊緣,其次進(jìn)行方向梯度直方圖(HOG)特征提取,然后用Gentleboost算法訓(xùn)練的分類器來對目標(biāo)車輛進(jìn)行分類。實(shí)驗(yàn)結(jié)果及正確—召回曲線(Precision- Recall)表明,該方法能在在道路、地下停車場等不同光照環(huán)境下進(jìn)行車輛檢測,檢測精度較高且算法檢測收斂速度較快。
關(guān)鍵詞: 車輛檢測; HOG特征提??; GentleBoost算法; 正確—召回曲線(Precision- Recall)
中圖分類號:TP391.9 文獻(xiàn)標(biāo)志碼:A 文章編號:1006-8228(2018)06-81-04
A vehicle detection method with HOG-GentleBoost algorithm
Zhang Hui
(Zhejiang Police College, Hangzhou, Zhejiang 310053, China)
Abstract: This paper provides a fast and effective detection method for vehicle detection in the actual scene. Firstly, filtering the detected image with Laplace sharpening to enhancing the image edge, and then implement Histogram of Oriented Gradient (HOG) for feature extraction, and use Gentleboost algorithm train the classifier which is used to classify the vehicle. The result of the experiment and Precision-Recall curve show that the method can detect vehicles on road and in underground parking which are under different lighting conditions, the detection accuracy is high and the algorithm's convergence speed is fast as well.
Key words: vehicle detection; HOG feature extraction; GentleBoost; Precision- Recall
0 引言
現(xiàn)代城市交通快速發(fā)展,道路及停車場上的汽車數(shù)量大幅增長。隨著計(jì)算機(jī)技術(shù)的進(jìn)步,車輛的智能檢測識別成為交通安全領(lǐng)域的一大研究熱點(diǎn)[1]。目前實(shí)際應(yīng)用中對車輛檢測的方法主要是在路口鋪設(shè)感應(yīng)線圈的方式檢測,視頻圖像車輛檢測技術(shù)應(yīng)用尚處于起步階段。視頻車輛檢測由監(jiān)控視頻序列中提取出關(guān)鍵幀,通過圖像處理與模式識別的方法,檢測幀圖像內(nèi)的車輛,而這一方法可歸結(jié)為單幅靜態(tài)圖像的車輛檢測。對于圖像內(nèi)的車輛檢測,目前主要利用車輛的形狀特征進(jìn)行檢測。如利用方向梯度直方圖(HOG)和局部二進(jìn)制模式進(jìn)行車輛檢測[2],采用AdaBoost方法對圖像中車輛目標(biāo)進(jìn)行檢測也取得較好效果[3]。
Boosting算法[4]是一種通用的學(xué)習(xí)算法,可以提高任一給定弱分類算法的分類性能,達(dá)到強(qiáng)分類器的效果,對圖像中人物、車輛等目標(biāo)具有很好的分類效果。HOG算子[5]以圖像中局部區(qū)域的方向梯度直方圖來構(gòu)成特征,對行人、車輛等目標(biāo)物體的形狀具有很好的表述效果。本文采用HOG算子對目標(biāo)車輛進(jìn)行特征描述,利用改進(jìn)的Boosting算法即GentleBoost算法對圖像中車輛檢測。實(shí)驗(yàn)結(jié)果表明,該方法能對道路、地下停車場等不同光照環(huán)境下進(jìn)行車輛檢測,檢測精度較高且算法檢測收斂速度較快。
1 HOG特征描述
方向梯度直方圖(Histogram of Oriented Gradient,HOG)特征是在計(jì)算機(jī)視覺和圖像處理中用以物體檢測的特征描述子,核心思想是所檢測的局部物體外形能被灰度梯度和邊緣方向的分布描述。計(jì)算HOG特征過程中,首先對圖像進(jìn)行灰度化和gamma校正,一般γ取1/2;再對圖像計(jì)算每個(gè)像素位置I(x,y)的梯度大小和方向,其中x、y方向上的梯度分量由下式⑴,⑵表示:
⑴
⑵
Gx(x,y),Gy(x,y)表示像素點(diǎn)(x,y)處水平和垂直方向的梯度分量,則該點(diǎn)梯度大小和方向由式⑶,⑷表示:
⑶
⑷
得到梯度后,將圖像劃分為一定尺度的窗口,在每個(gè)窗口中劃分等大的細(xì)胞單元(Cell),對每個(gè)Cell的梯度投影到一定方向上進(jìn)行直方圖統(tǒng)計(jì),形成每個(gè)Cell的方向梯度直方圖,并歸一化合并成每個(gè)窗口的方向梯度直方圖向量(HOG),稱為HOG特征描述子,窗口沿著圖像矩陣的坐標(biāo)軸平移得到整個(gè)圖像的HOG特征秒速子,作為檢測分類的依據(jù)。假設(shè)64×128大小的目標(biāo)圖像,每8×8個(gè)像素組成Cell,2×2個(gè)Cell組成一個(gè)窗口,則圖像的HOG描述子為3780維向量。
2 GentleBoost算法
GentleBoost算法是Boosting算法的改進(jìn)版本,在人物檢測中已經(jīng)有了較多應(yīng)用[6]。
假設(shè)X∈Rn為樣本集,Rn為樣本空間,Y為車輛是非類別標(biāo)識,對于物體檢測而言是一個(gè)二值分類問題,Y={1,-1}。對于N個(gè)樣本序列{(x1,y1),…,(xN,yN)},其中xi∈Rn, yi∈Y={1,-1},為N個(gè)已標(biāo)注的樣本。利用GentleBoost算法分類步驟如下。
⑴ 首先,初始化權(quán)值w=1,從而簡化計(jì)算。
⑵ 確定迭代次數(shù)T:t=1,2,3,…,T。
⑶ 構(gòu)建弱分類器,定義弱分類函數(shù)fm(x)=(a+b)[xk?θ]+b[xk<θ],即線性回歸末端,如圖1所示。
其中,函數(shù)xk表示濾波器絕對響應(yīng),對于正確分類的響應(yīng)[xk?θ]和錯(cuò)誤分類響應(yīng)[xk<θ]賦以權(quán)值a,b,同時(shí)加大正確分類的權(quán)重值,保證分類器的分類效果略優(yōu)于50%分類正確率。
⑷ 迭代計(jì)算強(qiáng)化弱分類器性能。選擇fm以最小化[F+fm]的值,即誤差函數(shù),GentleBoost通過最小化誤差函數(shù)的泰勒估計(jì),其中為加權(quán)預(yù)測誤差(error)。由圖2,橫坐標(biāo)yF(x),表示分類得分,錯(cuò)誤分類為負(fù)值而正確分類為正值,損失函數(shù)有單調(diào)性。平方誤差曲線當(dāng)yF(x)大于1時(shí)變?yōu)檫f增,此為對分類過于正確的懲罰機(jī)制。每次迭代只需解決平方誤差曲線最小值問題。
⑸ 更新分類器權(quán)值,未對權(quán)值標(biāo)準(zhǔn)化處理,擴(kuò)大權(quán)值更新的范圍,以提高對復(fù)雜環(huán)境車輛檢測的正確率,通過多次迭代收斂至強(qiáng)分類器。
3 基于GentleBoost的車輛檢測
本文利用LabelMe數(shù)據(jù)庫對車輛檢測的實(shí)際情況進(jìn)行模擬,LabelMe為計(jì)算機(jī)視覺領(lǐng)域檢測復(fù)雜環(huán)境中的不同物體提供大量具有挑戰(zhàn)性的圖片數(shù)據(jù)。數(shù)據(jù)集中的圖片中,地面實(shí)況被注釋以利用公用,這些注釋包括圖像中物體的類別、形狀和位置信息。因此,這個(gè)數(shù)據(jù)庫可用于測試分類算法的性能以及用于有監(jiān)督學(xué)習(xí)的訓(xùn)練庫[7]。本文從此數(shù)據(jù)庫中選取1000幅圖像作為訓(xùn)練圖像,選取2000幅圖像作為測試圖像集。
部分圖像如圖3所示。算法步驟如下。
首先將數(shù)據(jù)庫中的圖片歸一化至同樣大小,進(jìn)行拉普拉斯銳化增強(qiáng)圖像的邊緣,提高HOG算子提取的特征強(qiáng)度,銳化結(jié)果如圖4所示。
然后對增強(qiáng)后的圖像進(jìn)行HOG算子檢測特征,具體方法如第一部分所述。這里取16×16大小的窗口進(jìn)行檢測,每個(gè)窗口由4×4個(gè)Cell組成,特征檢測可視化結(jié)果如圖5所示。
構(gòu)建合理的分類器稱為訓(xùn)練分類過程,對GentleBoost算法而言,核心思想是通過對權(quán)值的迭代計(jì)算、更新,達(dá)到優(yōu)化分類器性能、達(dá)到強(qiáng)分類效果的目的。算法通過優(yōu)化弱分類器如線性回歸末端得到改進(jìn)效果的強(qiáng)分類器。最小化預(yù)測誤差的值來確定每次迭代計(jì)算的fm,這一過程可轉(zhuǎn)化為最小化預(yù)測誤差函數(shù)的泰勒估計(jì),其中為權(quán)值w,xt為為訓(xùn)練樣本,yt為期望輸出即標(biāo)簽值,為預(yù)測輸出,尋找預(yù)測誤差J(F)最小的特征值并賦以較大權(quán)值,從而確定參數(shù)a, b的值,進(jìn)而得到,從而權(quán)值得到更新,迭代計(jì)算,。重復(fù)上述計(jì)算T次,得到一組弱分類器輸出強(qiáng)分類器,進(jìn)而有。
對于1000份圖像訓(xùn)練集,將圖像進(jìn)行邊緣增強(qiáng)和HOG特征檢測后,將得到的HOG特征向量輸入初始化的弱分類器進(jìn)行訓(xùn)練,其輸出值yt是已注釋的。依次按上上述步驟進(jìn)行強(qiáng)分類器訓(xùn)練。將測試圖像輸入強(qiáng)分類器進(jìn)行分類測試,對于輸出yt即分類得分大于0的進(jìn)行漢寧(hamming)低通濾波,可得到分類得分最大的像素位置(x,y),并依據(jù)此位置在原圖像中歐式距離最近的邊緣畫出分割線,得到如圖6所示的部分檢測輸出結(jié)果。
從圖6(a)-(e)可見,檢測方法對室內(nèi)外等光照不均條件下的檢測結(jié)果較好,對較小的遮擋問題也有較好的適應(yīng)性,這也跟HOG特征檢測算子對光照不敏感的特點(diǎn)相關(guān)。從圖6(f)可見,檢測錯(cuò)誤的原因主要是車輛距離較遠(yuǎn),邊緣特征不明顯所致。檢測結(jié)果以正確—召回曲線(Precision-Recall)進(jìn)行分析,如圖7所示。其中正確率表示正確檢測的比例,召回率指檢測結(jié)果數(shù)占實(shí)際結(jié)果總數(shù)的比例,這一曲線能全面反映檢測器對全部檢測目標(biāo)的響應(yīng)能力和檢測正確率,正確率和召回率越高表明檢測性能越好,圖7中紅色曲線和藍(lán)色曲線分別表示GentleBoost迭代次數(shù)為6次及30次,迭代次數(shù)增加對檢測器性能有積極影響。
4 小結(jié)
在目前交通車輛檢測對智能化需求的背景下,本文采用HOG算子對目標(biāo)車輛進(jìn)行特征描述,對不同光照環(huán)境下的車輛檢測具有較好的適應(yīng)性能,為提高HOG特征檢測的性能,采用拉普拉斯銳化對圖像進(jìn)行預(yù)處理,有效增強(qiáng)了HOG特征強(qiáng)度;利用改進(jìn)的Boosting算法即GentleBoost算法對圖像中車輛檢測,訓(xùn)練一系列弱分類器的組合得到強(qiáng)分類器,并對測試圖像進(jìn)行分類,輸出值最大的即為需要檢測的車輛目標(biāo),方法操作較簡單,檢測性能較好。實(shí)驗(yàn)結(jié)果表明,該方法能對道路、地下停車場等不同光照環(huán)境下進(jìn)行車輛檢測,檢測精度較高且算法檢測收斂速度較快。 對實(shí)際場景中遮擋較多的車輛,算法存在不同程度的漏檢率。下一步應(yīng)考慮引入車輛先驗(yàn)信息,如形狀對稱性等特征作進(jìn)一步研究,以解決這一問題。
參考文獻(xiàn)(References):
[1] Sun Zehang, Bebis G, Miller R. On-road Vehicle
Detection: A Review[J]. Pattern Analysis and Machine Intelligence,2006.28(5):694-711
[2] 楊先風(fēng),楊燕.一種基于HOG-LBP的高效車輛檢測方法[J].
計(jì)算機(jī)工程,2014.40(9):210-214
[3] 張朝暉,劉永霞,雷倩.基于SC-AdaBoost的圖像目標(biāo)檢測[J].
計(jì)算機(jī)科學(xué),2015.42(7):309-312
[4] Schapire R E. The strength of weak learnability[J].Machine
Learning,1990.5(2):197-227
[5] Zhu Q, Avidan S, Yeh M C, et. Fast human detection using
a cascade of histograms of oriented gradients[C].IEEE Computer Society Conference on Computer Vision and Pattern Recognition,2006.2:1491-1498
[6] Lior W, Ian M. Robust boosting for learning from few
examples[C].IEEE Conf on Computer Vision and Pattern Recognition (CVPR),2005: 359-364
[7] Russell B C, Torralba A. LabelMe: a database and
Web-based tool for image annotation[DB/OL]. http://labelme.csail.mit.edu/Release3.0/,2012.12.