劉鑫
摘 要:當(dāng)前車(chē)牌識(shí)別系統(tǒng)已經(jīng)在各種場(chǎng)景中有了廣泛的使用,但是對(duì)于車(chē)牌的定位和車(chē)牌字符識(shí)別的準(zhǔn)確率都有待于提高,近年來(lái)神經(jīng)網(wǎng)絡(luò)在字符識(shí)別中取得了不錯(cuò)的效果,所以本文提出了一種基于深度學(xué)習(xí)的車(chē)牌識(shí)別方法,該方法通過(guò)SVM對(duì)車(chē)牌進(jìn)行定位,通過(guò)RBFNN進(jìn)行車(chē)牌的字符的分割,最后輸出車(chē)牌號(hào)碼。所提方法結(jié)合SVM和RBFNN模型可以提高車(chē)牌識(shí)別系統(tǒng)的識(shí)別精度。
關(guān)鍵詞:車(chē)牌識(shí)別;支持向量機(jī);徑向神經(jīng)網(wǎng)絡(luò);“斷節(jié)”現(xiàn)象;多類(lèi)SVM
0 引言
車(chē)牌識(shí)別的原理是通過(guò)使用視頻采集圖像,自動(dòng)識(shí)別車(chē)輛的車(chē)牌。車(chē)牌識(shí)別在交通分析、交通執(zhí)法、自動(dòng)收費(fèi)等各種應(yīng)用中發(fā)揮著重要作用。在車(chē)牌識(shí)別方面,國(guó)內(nèi)外學(xué)者已經(jīng)取得了一定的研究成果。如吳攀志提出的基于POS-BP神經(jīng)網(wǎng)絡(luò)的車(chē)牌號(hào)碼識(shí)別算法[1],具有輸入誤差小、全局收斂速度快和識(shí)別率較高的特征。Sudhir K.Ingole等人提出了基于字符特征的印度車(chē)牌檢測(cè)與識(shí)別,采用自適應(yīng)預(yù)處理方法,利用提取的字符的垂直和水平投影進(jìn)行字符分割車(chē)牌,然后利用基于特征向量的K-最近鄰分類(lèi)器對(duì)字符進(jìn)行識(shí)別,解決了不同光照的識(shí)別問(wèn)題,但是太多的字符幾何變化會(huì)導(dǎo)致錯(cuò)誤分類(lèi),需要使用從單獨(dú)的訓(xùn)練數(shù)據(jù)集中提取的不同字符字體對(duì)分類(lèi)器進(jìn)行訓(xùn)練。
1 研究框架
在進(jìn)行車(chē)牌識(shí)別的處理時(shí),系統(tǒng)輸入是預(yù)先由視頻采集的圖像。然后將輸入的圖像發(fā)送到車(chē)牌檢測(cè)階段。第一步的結(jié)果將是車(chē)牌位置檢測(cè)出來(lái)。之后,將檢測(cè)成功的車(chē)牌用于字符識(shí)別階段,最后輸出分割好的字符組成車(chē)牌。具體過(guò)程如圖1所示。
在車(chē)牌檢測(cè)的過(guò)程中,首先利用圖像處理技術(shù)截取車(chē)牌的圖塊,進(jìn)行人工分類(lèi)后,輸入SVM中訓(xùn)練,得到SVM車(chē)牌判別模型。下一步根據(jù)獲得的車(chē)牌,來(lái)生成車(chē)牌號(hào),即字符識(shí)別過(guò)程。首先,在這幅圖塊中通過(guò)圖像處理技術(shù)獲得車(chē)牌中的所有的字符的二進(jìn)制黑白小圖塊。然后利用字符段生成的大量圖塊,進(jìn)行人工分類(lèi)后,輸入RBFNN中訓(xùn)練,得到RBFNN字符識(shí)別模型。最后,對(duì)這些小圖塊依次用訓(xùn)練好的RBFNN模型進(jìn)行預(yù)測(cè),輸出它們最有可能代表的字符,排序后成為車(chē)牌字符串。
2 車(chē)牌檢測(cè)
(1)圖像預(yù)處理。此過(guò)程由六個(gè)步驟組成:灰度化,高斯模糊,Sobel運(yùn)算,二值化,閉操作,輪廓處理。以車(chē)牌號(hào)為“魯C181NA”為例所生成的示例圖如圖2所示。
1)將原始圖片進(jìn)行灰度化操作,這個(gè)步驟是一個(gè)分水嶺,意味著后面的所有操作都不能基于色彩信息了。2)將圖片進(jìn)行高斯模糊,默認(rèn)的高斯模糊的半徑是5,對(duì)圖像去噪,為邊緣檢測(cè)算法做準(zhǔn)備。3)Sobel算子原理是對(duì)圖像求一階的水平與垂直方向?qū)?shù),根據(jù)導(dǎo)數(shù)值的大小來(lái)判斷是否是邊緣,檢測(cè)圖像中的垂直邊緣,便于區(qū)分車(chē)牌。4)進(jìn)行二值化和閉操作,目的是將車(chē)牌字母連接成為一個(gè)連通域,便于取輪廓。5)要對(duì)取出的輪廓進(jìn)行尺寸判斷、角度判斷、統(tǒng)一尺寸等操作,然后經(jīng)過(guò)偏斜角度的篩選和旋轉(zhuǎn)得到最終車(chē)牌。
3 字符識(shí)別
(1)圖像預(yù)處理。圖像預(yù)處理主要分為三個(gè)部分。第一步,將原始圖片進(jìn)行灰度化和去噪處理操作;第二步,進(jìn)行二值化操作,目的是將車(chē)牌字母連接成為一個(gè)連通域,便于取輪廓;第三步,進(jìn)行提取輪廓,為后續(xù)字符分割做鋪。
(2)RBFNN訓(xùn)練。RBFNN是一種前饋神經(jīng)網(wǎng)絡(luò),結(jié)構(gòu)簡(jiǎn)單,它還具有逼近最優(yōu)、無(wú)局部最小、收斂速度快、拓?fù)浣Y(jié)構(gòu)簡(jiǎn)單等特點(diǎn)。在逼近、分類(lèi)和研究能力方面優(yōu)于BP神經(jīng)網(wǎng)絡(luò),所以設(shè)計(jì)采用RBF作為車(chē)牌字符分類(lèi)器。為了提高識(shí)別率,減少計(jì)算量,本文采用高斯函數(shù)作為激活函數(shù)。
(3)字符分割。分割是字符識(shí)別中最重要的環(huán)節(jié)之一。在這個(gè)步驟中,從圖像中提取感興趣的對(duì)象或其他實(shí)體以進(jìn)行識(shí)別處理。在車(chē)牌字符分割中,將車(chē)牌分割成各個(gè)組成部分,分別得到字符。
在圖3中,X軸是車(chē)輛牌照?qǐng)D像的列,Y軸是投影值。該圖表明,平板的垂直投影有7組規(guī)則梳狀圖,除第2、3組間距較大外,各組間距大小固定。值得注意的是,每個(gè)梳狀圖都代表一個(gè)字符,組之間的空間與字符之間的空間相對(duì)應(yīng)。在二值圖像的垂直投影中,只要找到了空間位置,就確定了每個(gè)字符的位置。判斷空間的重要條件之一是投影值在空間位置為0。
4 實(shí)驗(yàn)結(jié)果分析
(1)實(shí)驗(yàn)分析。在表1中分別比較了多分類(lèi)SVM和分級(jí)RBF與本文方法的準(zhǔn)確度。對(duì)比以上兩種方法的準(zhǔn)確率可以看出,本文方法在正確率上又有了進(jìn)一步提高。
5 結(jié)束語(yǔ)
本文提出了一種基于深度學(xué)習(xí)的車(chē)牌識(shí)別方法,使用SVM和RBFNN結(jié)合進(jìn)行訓(xùn)練,利用垂直投影進(jìn)行字符分割,從而達(dá)到識(shí)別車(chē)牌的效果。實(shí)驗(yàn)結(jié)果充分證明了所提方法的有效性。
參考文獻(xiàn):
[1]吳攀志.基于PSO-BP神經(jīng)網(wǎng)絡(luò)的車(chē)牌號(hào)碼識(shí)別技術(shù)[J].中山大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,13(21):31-36.
[2]甘勝軍.利用HSV色彩空間進(jìn)行車(chē)牌識(shí)別的研究[D].重慶郵電大學(xué),2016:12-18.