基于計(jì)算機(jī)視覺(jué)的身份證號(hào)碼識(shí)別算法

2017-09-14 06:48:12廣東南方職業(yè)學(xué)院李美玲

電子世界 2017年17期

關(guān)鍵詞：字符形態(tài)學(xué)身份證

廣東南方職業(yè)學(xué)院李美玲

深圳大學(xué)信息工程學(xué)院張俊陽(yáng)

基于計(jì)算機(jī)視覺(jué)的身份證號(hào)碼識(shí)別算法

廣東南方職業(yè)學(xué)院李美玲

深圳大學(xué)信息工程學(xué)院張俊陽(yáng)

針對(duì)圖像采集過(guò)程中閃光燈開(kāi)啟造成的高亮區(qū)域，本文先通過(guò)自適應(yīng)閾值分割算法去除身份證圖像背景區(qū)域，并使用形態(tài)學(xué)操作提取并篩選輪廓的方法定位身份證號(hào)碼區(qū)域，使用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)對(duì)切分得的字符進(jìn)行識(shí)別。算法識(shí)別準(zhǔn)確率高，文中使用了OpenCV庫(kù)及caffe開(kāi)源深度學(xué)習(xí)框架驗(yàn)證算法。

身份證號(hào)碼定位；caffe；OpenCV；身份證號(hào)碼識(shí)別

1 引言

圖像是智能機(jī)器獲取信息的重要來(lái)源之一，隨著計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展，計(jì)算機(jī)視覺(jué)技術(shù)已經(jīng)在工業(yè)上獲得許多成功應(yīng)用，例如零件缺陷檢測(cè)、汽車(chē)自動(dòng)輔助駕駛等領(lǐng)域。OCR字符識(shí)別技術(shù)也取得了重大的進(jìn)展。身份證識(shí)別技術(shù)為OCR識(shí)別技術(shù)之一，目前身份證識(shí)別主要有基于匹配分類(lèi)和基于機(jī)器學(xué)習(xí)的方法[1]。而隨著深度學(xué)習(xí)的發(fā)展，深度學(xué)習(xí)正在顛覆傳統(tǒng)領(lǐng)域，使用深度學(xué)習(xí)識(shí)別字符圖像具有快速、準(zhǔn)確率高等優(yōu)勢(shì)。

2 算法實(shí)現(xiàn)

本文主要針對(duì)的是拍攝設(shè)備近距離采集的身份證圖像，要求身份證圖像上號(hào)碼信息較為清晰，人眼基本可辨別，且圖像上身份證區(qū)域占據(jù)主要部分，無(wú)復(fù)雜背景干擾，當(dāng)前圖像采集器材分辨率、微距拍攝等功能已能滿(mǎn)足要求，故在實(shí)際應(yīng)用中是可行的。

圖1 基于計(jì)算機(jī)視覺(jué)的身份證識(shí)別算法框圖

圖1為基于計(jì)算機(jī)視覺(jué)的身份證識(shí)別算法框圖，文中首先提取原始圖像的R分量作為分析對(duì)象，針對(duì)拍攝亮度不足時(shí)，補(bǔ)光燈造成的圖像亮度不均或存在高光等問(wèn)題，采用自適應(yīng)閾值圖像分割算法去除身份證非字符區(qū)域，然后使用形態(tài)學(xué)操作使字符粘連的方法提取字符輪廓，根據(jù)輪廓面積及長(zhǎng)寬比例提取身份證號(hào)碼區(qū)域，最后切分身份證字符并使用已訓(xùn)練的lenet-5深度學(xué)習(xí)網(wǎng)絡(luò)模型進(jìn)行識(shí)別。

2.1 身份證號(hào)碼區(qū)域檢測(cè)

2.1.1 圖像灰度化

身份證樣張上字體為黑色，背景則為純顏色，為使字體與背景具有更大的區(qū)分度，取身份證圖的R通道作為圖像的灰度化處理，為便于后期定位身份證號(hào)碼區(qū)域時(shí)字符之間相互粘合，結(jié)合身份證圖片長(zhǎng)寬比例，依次在3種分辨率下嘗試定位身份證號(hào)碼區(qū)域，這3種縮放分辨率分別為：

2.1.2 圖像二值化

本文針對(duì)的是近距離拍攝的身份證圖像，身份證整體輪廓占主要部分，由于身份證樣張上字符顏色與背景顏色通常存在明顯的差別，當(dāng)采集的身份證圖像光照均勻時(shí)，采用Otsu全局閾值二值化圖像，二值化效果好；但由于光線不足，拍攝設(shè)備開(kāi)啟補(bǔ)光燈等原因造成高光區(qū)域時(shí)，Otsu全局閾值二值化效果不佳，這是由于Otsu算法沒(méi)有考慮局部灰度信息的干擾[2]。

對(duì)Otsu二值化方法作出改進(jìn)。

將圖像切分為N×N塊，對(duì)每一分塊使用Otsu二值化算法計(jì)算得閾值，對(duì)其進(jìn)行排序，排序后的閾值記為，對(duì)其中的中位數(shù)做均值濾波，使用濾波后的中位值作為圖像二值化的全局閾值。經(jīng)過(guò)實(shí)驗(yàn)將N設(shè)為5，濾波器核大小設(shè)為9。

圖2 身份證圖像二值化

圖2為身份證圖像二值化處理的效果圖，可看出對(duì)于光照均勻或存在高光的圖像，算法都能得到清晰的二值化號(hào)碼。

2.1.3 形態(tài)學(xué)操作

對(duì)二值化圖像作反色操作，并使用核大小為[15,3]的矩形結(jié)構(gòu)元素對(duì)其做形態(tài)學(xué)閉運(yùn)算，使號(hào)碼字符發(fā)生粘連為一塊區(qū)域，然后使用Opencv庫(kù)自帶輪廓檢測(cè)方法檢測(cè)各區(qū)域輪廓，并依據(jù)身份證號(hào)碼輪廓面積及長(zhǎng)寬比例篩選各區(qū)域，將篩選剩余的區(qū)域中最長(zhǎng)的區(qū)域作為身份證號(hào)碼區(qū)域，文中將長(zhǎng)寬比例為 r =15，比例篩選范圍設(shè)定為面積篩選范圍設(shè)定為。

圖3 形態(tài)學(xué)閉操作及號(hào)碼定位

圖3為形態(tài)學(xué)操作及號(hào)碼區(qū)域定位的效果圖，由于形態(tài)學(xué)的粘連效果受到結(jié)構(gòu)元素大小的影響，故本文固定閉運(yùn)算結(jié)構(gòu)元素大小，并嘗試在三種分辨率下提取身份證號(hào)碼區(qū)域，以正確切分號(hào)碼的位數(shù)作為是否定位成功的標(biāo)志。

2.2 投影切分字符

先從R分量上依據(jù)定位得的身份證號(hào)碼區(qū)域?qū)⑵浞指畛?，?duì)分割得的圖像作如下操作：

（1）使用Otsu二值化算法分割圖像并進(jìn)行反色，即字體為白色，背景為黑色。

（2）先使用水平投影法確定字符的高度，由于少部分字符之間可能存在粘連，故對(duì)垂直投影法做出改進(jìn)，記身份證號(hào)碼區(qū)域圖像的寬度為W，為通過(guò)垂直投影法[3]確定的切割位置(包含起始點(diǎn))，若存在 k <18，則存在字符粘連。由于每個(gè)字符寬度為，假設(shè)粘連在一塊的字符總數(shù)記為c，則使用下式判斷粘連位置及粘連數(shù)。

當(dāng)滿(mǎn)足公式(1)時(shí)，對(duì)[hi, hi+1]進(jìn)行C均等分，可將粘連的字符分開(kāi)。圖4為正確切分的號(hào)碼字符。

圖4 字符切分結(jié)果

2.3 lenet-5深度學(xué)習(xí)模型

lenet-5是Yann LeCun教授針對(duì)手寫(xiě)數(shù)字圖像所開(kāi)發(fā)的卷積神經(jīng)網(wǎng)絡(luò)模型[4]，其已經(jīng)成功應(yīng)用于商業(yè)，識(shí)別率可達(dá)99%以上，由于身份證號(hào)碼的字符圖像與手寫(xiě)圖像具有一定的相似性，且字體結(jié)構(gòu)較為固定，沒(méi)有手寫(xiě)體隨意，故本文采用lenet-5模型對(duì)身份證號(hào)碼圖像作訓(xùn)練及分類(lèi)。圖5為lenet-5的網(wǎng)絡(luò)模型。

圖5 lenet-5深度學(xué)習(xí)網(wǎng)絡(luò)

其中，卷積層C1、C3所用卷積核大小均為5×5大小，采樣層S2、C3通常為均值采樣，感受域大小為2×2，其余則為全連接結(jié)構(gòu)。

3 實(shí)驗(yàn)與分析

本文實(shí)驗(yàn)配置為Ubuntu14.04，GTX750Ti的機(jī)器，從網(wǎng)上及實(shí)際拍攝獲得身份證圖像共576張，分為兩部分，其中的300張用于訓(xùn)練，276張用于測(cè)試。使用本文算法對(duì)訓(xùn)練樣本做字符分割，可正確切分字符的樣本為287，定位及切分準(zhǔn)確率為95.66；

本文使用開(kāi)源的caffe版本lenet-5進(jìn)行實(shí)驗(yàn)。由于從訓(xùn)練樣本獲得的字符僅為4895張0～9二值圖像，故通過(guò)添加噪聲、小角度傾斜、不同閾值二值化等方法將字符集擴(kuò)充為8W，通過(guò)10W次迭代，訓(xùn)練準(zhǔn)確率為96%左右，在字符識(shí)別時(shí)，容易錯(cuò)分的是字符“3”和“8”、“0”和“9”。276張用于測(cè)試的圖像可識(shí)別得251張，整體識(shí)別率為91%左右，具有較高的應(yīng)用價(jià)值。

4 結(jié)論

本文提出了一種基于計(jì)算機(jī)視覺(jué)技術(shù)的身份證識(shí)別算法，算法對(duì)光照均勻圖像和存在高光的圖像均能有效地定位身份證號(hào)碼，對(duì)垂直投影法作出改進(jìn)以更適合分割粘連的字符，最后對(duì)于除校驗(yàn)位外的字符圖像，使用lenet-5深度學(xué)習(xí)模型進(jìn)行訓(xùn)練及分類(lèi)，校驗(yàn)位可由前17位數(shù)字計(jì)算得到。

[1]李開(kāi),陳禮安,曹計(jì)昌.基于灰度多值化的身份證號(hào)碼識(shí)別[J].計(jì)算機(jī)工程與應(yīng)用,2015(13):191-196.

[2]許向陽(yáng),宋恩民,金良海.Otsu準(zhǔn)則的閾值性質(zhì)分析[J].電子學(xué)報(bào),2009(12):2716-2719.

[3楊曉娟,宋凱.基于投影法的文檔圖像分割算法[J].成都大學(xué)學(xué)報(bào)(自然科學(xué)版),2009(02):139-141.

[4]高燦.一種基于CNN手寫(xiě)字符識(shí)別的改進(jìn)方法[J].黑龍江科技信息,2017(03):164.

李美玲（1988—），女，廣東廉江人，大學(xué)本科，主要從事通信工程設(shè)計(jì)與管理和樓宇智能化工程技術(shù)的教學(xué)工作。

張俊陽(yáng)（1991—），男，廣東揭陽(yáng)人，碩士研究生，主要研究領(lǐng)域：模式識(shí)別。