廣東南方職業(yè)學(xué)院 李美玲
深圳大學(xué)信息工程學(xué)院 張俊陽(yáng)
基于計(jì)算機(jī)視覺(jué)的身份證號(hào)碼識(shí)別算法
廣東南方職業(yè)學(xué)院 李美玲
深圳大學(xué)信息工程學(xué)院 張俊陽(yáng)
針對(duì)圖像采集過(guò)程中閃光燈開(kāi)啟造成的高亮區(qū)域,本文先通過(guò)自適應(yīng)閾值分割算法去除身份證圖像背景區(qū)域,并使用形態(tài)學(xué)操作提取并篩選輪廓的方法定位身份證號(hào)碼區(qū)域,使用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)對(duì)切分得的字符進(jìn)行識(shí)別。算法識(shí)別準(zhǔn)確率高,文中使用了OpenCV庫(kù)及caffe開(kāi)源深度學(xué)習(xí)框架驗(yàn)證算法。
身份證號(hào)碼定位;caffe;OpenCV;身份證號(hào)碼識(shí)別
圖像是智能機(jī)器獲取信息的重要來(lái)源之一,隨著計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展,計(jì)算機(jī)視覺(jué)技術(shù)已經(jīng)在工業(yè)上獲得許多成功應(yīng)用,例如零件缺陷檢測(cè)、汽車(chē)自動(dòng)輔助駕駛等領(lǐng)域。OCR字符識(shí)別技術(shù)也取得了重大的進(jìn)展。身份證識(shí)別技術(shù)為OCR識(shí)別技術(shù)之一,目前身份證識(shí)別主要有基于匹配分類(lèi)和基于機(jī)器學(xué)習(xí)的方法[1]。而隨著深度學(xué)習(xí)的發(fā)展,深度學(xué)習(xí)正在顛覆傳統(tǒng)領(lǐng)域,使用深度學(xué)習(xí)識(shí)別字符圖像具有快速、準(zhǔn)確率高等優(yōu)勢(shì)。
本文主要針對(duì)的是拍攝設(shè)備近距離采集的身份證圖像,要求身份證圖像上號(hào)碼信息較為清晰,人眼基本可辨別,且圖像上身份證區(qū)域占據(jù)主要部分,無(wú)復(fù)雜背景干擾,當(dāng)前圖像采集器材分辨率、微距拍攝等功能已能滿(mǎn)足要求,故在實(shí)際應(yīng)用中是可行的。
圖1 基于計(jì)算機(jī)視覺(jué)的身份證識(shí)別算法框圖
圖1為基于計(jì)算機(jī)視覺(jué)的身份證識(shí)別算法框圖,文中首先提取原始圖像的R分量作為分析對(duì)象,針對(duì)拍攝亮度不足時(shí),補(bǔ)光燈造成的圖像亮度不均或存在高光等問(wèn)題,采用自適應(yīng)閾值圖像分割算法去除身份證非字符區(qū)域,然后使用形態(tài)學(xué)操作使字符粘連的方法提取字符輪廓,根據(jù)輪廓面積及長(zhǎng)寬比例提取身份證號(hào)碼區(qū)域,最后切分身份證字符并使用已訓(xùn)練的lenet-5深度學(xué)習(xí)網(wǎng)絡(luò)模型進(jìn)行識(shí)別。
2.1.1 圖像灰度化
身份證樣張上字體為黑色,背景則為純顏色,為使字體與背景具有更大的區(qū)分度,取身份證圖的R通道作為圖像的灰度化處理,為便于后期定位身份證號(hào)碼區(qū)域時(shí)字符之間相互粘合,結(jié)合身份證圖片長(zhǎng)寬比例,依次在3種分辨率下嘗試定位身份證號(hào)碼區(qū)域,這3種縮放分辨率分別為:
2.1.2 圖像二值化
本文針對(duì)的是近距離拍攝的身份證圖像,身份證整體輪廓占主要部分,由于身份證樣張上字符顏色與背景顏色通常存在明顯的差別,當(dāng)采集的身份證圖像光照均勻時(shí),采用Otsu全局閾值二值化圖像,二值化效果好;但由于光線不足,拍攝設(shè)備開(kāi)啟補(bǔ)光燈等原因造成高光區(qū)域時(shí),Otsu全局閾值二值化效果不佳,這是由于Otsu算法沒(méi)有考慮局部灰度信息的干擾[2]。
對(duì)Otsu二值化方法作出改進(jìn)。
將圖像切分為N×N塊,對(duì)每一分塊使用Otsu二值化算法計(jì)算得閾值,對(duì)其進(jìn)行排序,排序后的閾值記為,對(duì)其中的中位數(shù)做均值濾波,使用濾波后的中位值作為圖像二值化的全局閾值。經(jīng)過(guò)實(shí)驗(yàn)將N設(shè)為5,濾波器核大小設(shè)為9。
圖2 身份證圖像二值化
圖2為身份證圖像二值化處理的效果圖,可看出對(duì)于光照均勻或存在高光的圖像,算法都能得到清晰的二值化號(hào)碼。
2.1.3 形態(tài)學(xué)操作
對(duì)二值化圖像作反色操作,并使用核大小為[15,3]的矩形結(jié)構(gòu)元素對(duì)其做形態(tài)學(xué)閉運(yùn)算,使號(hào)碼字符發(fā)生粘連為一塊區(qū)域,然后使用Opencv庫(kù)自帶輪廓檢測(cè)方法檢測(cè)各區(qū)域輪廓,并依據(jù)身份證號(hào)碼輪廓面積及長(zhǎng)寬比例篩選各區(qū)域,將篩選剩余的區(qū)域中最長(zhǎng)的區(qū)域作為身份證號(hào)碼區(qū)域,文中將長(zhǎng)寬比例為 r =15,比例篩選范圍設(shè)定為面積篩選范圍設(shè)定為。
圖3 形態(tài)學(xué)閉操作及號(hào)碼定位
圖3為形態(tài)學(xué)操作及號(hào)碼區(qū)域定位的效果圖,由于形態(tài)學(xué)的粘連效果受到結(jié)構(gòu)元素大小的影響,故本文固定閉運(yùn)算結(jié)構(gòu)元素大小,并嘗試在三種分辨率下提取身份證號(hào)碼區(qū)域,以正確切分號(hào)碼的位數(shù)作為是否定位成功的標(biāo)志。
先從R分量上依據(jù)定位得的身份證號(hào)碼區(qū)域?qū)⑵浞指畛?,?duì)分割得的圖像作如下操作:
(1)使用Otsu二值化算法分割圖像并進(jìn)行反色,即字體為白色,背景為黑色。
(2)先使用水平投影法確定字符的高度,由于少部分字符之間可能存在粘連,故對(duì)垂直投影法做出改進(jìn),記身份證號(hào)碼區(qū)域圖像的寬度為W,為通過(guò)垂直投影法[3]確定的切割位置(包含起始點(diǎn)),若存在 k <18,則存在字符粘連。由于每個(gè)字符寬度為,假設(shè)粘連在一塊的字符總數(shù)記為c,則使用下式判斷粘連位置及粘連數(shù)。
當(dāng)滿(mǎn)足公式(1)時(shí),對(duì)[hi, hi+1]進(jìn)行C均等分,可將粘連的字符分開(kāi)。圖4為正確切分的號(hào)碼字符。
圖4 字符切分結(jié)果
lenet-5是Yann LeCun教授針對(duì)手寫(xiě)數(shù)字圖像所開(kāi)發(fā)的卷積神經(jīng)網(wǎng)絡(luò)模型[4],其已經(jīng)成功應(yīng)用于商業(yè),識(shí)別率可達(dá)99%以上,由于身份證號(hào)碼的字符圖像與手寫(xiě)圖像具有一定的相似性,且字體結(jié)構(gòu)較為固定,沒(méi)有手寫(xiě)體隨意,故本文采用lenet-5模型對(duì)身份證號(hào)碼圖像作訓(xùn)練及分類(lèi)。圖5為lenet-5的網(wǎng)絡(luò)模型。
圖5 lenet-5深度學(xué)習(xí)網(wǎng)絡(luò)
其中,卷積層C1、C3所用卷積核大小均為5×5大小,采樣層S2、C3通常為均值采樣,感受域大小為2×2,其余則為全連接結(jié)構(gòu)。
本文實(shí)驗(yàn)配置為Ubuntu14.04,GTX750Ti的機(jī)器,從網(wǎng)上及實(shí)際拍攝獲得身份證圖像共576張,分為兩部分,其中的300張用于訓(xùn)練,276張用于測(cè)試。使用本文算法對(duì)訓(xùn)練樣本做字符分割,可正確切分字符的樣本為287,定位及切分準(zhǔn)確率為95.66;
本文使用開(kāi)源的caffe版本lenet-5進(jìn)行實(shí)驗(yàn)。由于從訓(xùn)練樣本獲得的字符僅為4895張0~9二值圖像,故通過(guò)添加噪聲、小角度傾斜、不同閾值二值化等方法將字符集擴(kuò)充為8W,通過(guò)10W次迭代,訓(xùn)練準(zhǔn)確率為96%左右,在字符識(shí)別時(shí),容易錯(cuò)分的是字符“3”和“8”、“0”和“9”。276張用于測(cè)試的圖像可識(shí)別得251張,整體識(shí)別率為91%左右,具有較高的應(yīng)用價(jià)值。
本文提出了一種基于計(jì)算機(jī)視覺(jué)技術(shù)的身份證識(shí)別算法,算法對(duì)光照均勻圖像和存在高光的圖像均能有效地定位身份證號(hào)碼,對(duì)垂直投影法作出改進(jìn)以更適合分割粘連的字符,最后對(duì)于除校驗(yàn)位外的字符圖像,使用lenet-5深度學(xué)習(xí)模型進(jìn)行訓(xùn)練及分類(lèi),校驗(yàn)位可由前17位數(shù)字計(jì)算得到。
[1]李開(kāi),陳禮安,曹計(jì)昌.基于灰度多值化的身份證號(hào)碼識(shí)別[J].計(jì)算機(jī)工程與應(yīng)用,2015(13):191-196.
[2]許向陽(yáng),宋恩民,金良海.Otsu準(zhǔn)則的閾值性質(zhì)分析[J].電子學(xué)報(bào),2009(12):2716-2719.
[3楊曉娟,宋凱.基于投影法的文檔圖像分割算法[J].成都大學(xué)學(xué)報(bào)(自然科學(xué)版),2009(02):139-141.
[4]高燦.一種基于CNN手寫(xiě)字符識(shí)別的改進(jìn)方法[J].黑龍江科技信息,2017(03):164.
李美玲(1988—),女,廣東廉江人,大學(xué)本科,主要從事通信工程設(shè)計(jì)與管理和樓宇智能化工程技術(shù)的教學(xué)工作。
張俊陽(yáng)(1991—),男,廣東揭陽(yáng)人,碩士研究生,主要研究領(lǐng)域:模式識(shí)別。