• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于計(jì)算機(jī)視覺(jué)的身份證號(hào)碼識(shí)別算法

      2017-09-14 06:48:12廣東南方職業(yè)學(xué)院李美玲
      電子世界 2017年17期
      關(guān)鍵詞:字符形態(tài)學(xué)身份證

      廣東南方職業(yè)學(xué)院 李美玲

      深圳大學(xué)信息工程學(xué)院 張俊陽(yáng)

      基于計(jì)算機(jī)視覺(jué)的身份證號(hào)碼識(shí)別算法

      廣東南方職業(yè)學(xué)院 李美玲

      深圳大學(xué)信息工程學(xué)院 張俊陽(yáng)

      針對(duì)圖像采集過(guò)程中閃光燈開(kāi)啟造成的高亮區(qū)域,本文先通過(guò)自適應(yīng)閾值分割算法去除身份證圖像背景區(qū)域,并使用形態(tài)學(xué)操作提取并篩選輪廓的方法定位身份證號(hào)碼區(qū)域,使用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)對(duì)切分得的字符進(jìn)行識(shí)別。算法識(shí)別準(zhǔn)確率高,文中使用了OpenCV庫(kù)及caffe開(kāi)源深度學(xué)習(xí)框架驗(yàn)證算法。

      身份證號(hào)碼定位;caffe;OpenCV;身份證號(hào)碼識(shí)別

      1 引言

      圖像是智能機(jī)器獲取信息的重要來(lái)源之一,隨著計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展,計(jì)算機(jī)視覺(jué)技術(shù)已經(jīng)在工業(yè)上獲得許多成功應(yīng)用,例如零件缺陷檢測(cè)、汽車(chē)自動(dòng)輔助駕駛等領(lǐng)域。OCR字符識(shí)別技術(shù)也取得了重大的進(jìn)展。身份證識(shí)別技術(shù)為OCR識(shí)別技術(shù)之一,目前身份證識(shí)別主要有基于匹配分類(lèi)和基于機(jī)器學(xué)習(xí)的方法[1]。而隨著深度學(xué)習(xí)的發(fā)展,深度學(xué)習(xí)正在顛覆傳統(tǒng)領(lǐng)域,使用深度學(xué)習(xí)識(shí)別字符圖像具有快速、準(zhǔn)確率高等優(yōu)勢(shì)。

      2 算法實(shí)現(xiàn)

      本文主要針對(duì)的是拍攝設(shè)備近距離采集的身份證圖像,要求身份證圖像上號(hào)碼信息較為清晰,人眼基本可辨別,且圖像上身份證區(qū)域占據(jù)主要部分,無(wú)復(fù)雜背景干擾,當(dāng)前圖像采集器材分辨率、微距拍攝等功能已能滿(mǎn)足要求,故在實(shí)際應(yīng)用中是可行的。

      圖1 基于計(jì)算機(jī)視覺(jué)的身份證識(shí)別算法框圖

      圖1為基于計(jì)算機(jī)視覺(jué)的身份證識(shí)別算法框圖,文中首先提取原始圖像的R分量作為分析對(duì)象,針對(duì)拍攝亮度不足時(shí),補(bǔ)光燈造成的圖像亮度不均或存在高光等問(wèn)題,采用自適應(yīng)閾值圖像分割算法去除身份證非字符區(qū)域,然后使用形態(tài)學(xué)操作使字符粘連的方法提取字符輪廓,根據(jù)輪廓面積及長(zhǎng)寬比例提取身份證號(hào)碼區(qū)域,最后切分身份證字符并使用已訓(xùn)練的lenet-5深度學(xué)習(xí)網(wǎng)絡(luò)模型進(jìn)行識(shí)別。

      2.1 身份證號(hào)碼區(qū)域檢測(cè)

      2.1.1 圖像灰度化

      身份證樣張上字體為黑色,背景則為純顏色,為使字體與背景具有更大的區(qū)分度,取身份證圖的R通道作為圖像的灰度化處理,為便于后期定位身份證號(hào)碼區(qū)域時(shí)字符之間相互粘合,結(jié)合身份證圖片長(zhǎng)寬比例,依次在3種分辨率下嘗試定位身份證號(hào)碼區(qū)域,這3種縮放分辨率分別為:

      2.1.2 圖像二值化

      本文針對(duì)的是近距離拍攝的身份證圖像,身份證整體輪廓占主要部分,由于身份證樣張上字符顏色與背景顏色通常存在明顯的差別,當(dāng)采集的身份證圖像光照均勻時(shí),采用Otsu全局閾值二值化圖像,二值化效果好;但由于光線不足,拍攝設(shè)備開(kāi)啟補(bǔ)光燈等原因造成高光區(qū)域時(shí),Otsu全局閾值二值化效果不佳,這是由于Otsu算法沒(méi)有考慮局部灰度信息的干擾[2]。

      對(duì)Otsu二值化方法作出改進(jìn)。

      將圖像切分為N×N塊,對(duì)每一分塊使用Otsu二值化算法計(jì)算得閾值,對(duì)其進(jìn)行排序,排序后的閾值記為,對(duì)其中的中位數(shù)做均值濾波,使用濾波后的中位值作為圖像二值化的全局閾值。經(jīng)過(guò)實(shí)驗(yàn)將N設(shè)為5,濾波器核大小設(shè)為9。

      圖2 身份證圖像二值化

      圖2為身份證圖像二值化處理的效果圖,可看出對(duì)于光照均勻或存在高光的圖像,算法都能得到清晰的二值化號(hào)碼。

      2.1.3 形態(tài)學(xué)操作

      對(duì)二值化圖像作反色操作,并使用核大小為[15,3]的矩形結(jié)構(gòu)元素對(duì)其做形態(tài)學(xué)閉運(yùn)算,使號(hào)碼字符發(fā)生粘連為一塊區(qū)域,然后使用Opencv庫(kù)自帶輪廓檢測(cè)方法檢測(cè)各區(qū)域輪廓,并依據(jù)身份證號(hào)碼輪廓面積及長(zhǎng)寬比例篩選各區(qū)域,將篩選剩余的區(qū)域中最長(zhǎng)的區(qū)域作為身份證號(hào)碼區(qū)域,文中將長(zhǎng)寬比例為 r =15,比例篩選范圍設(shè)定為面積篩選范圍設(shè)定為。

      圖3 形態(tài)學(xué)閉操作及號(hào)碼定位

      圖3為形態(tài)學(xué)操作及號(hào)碼區(qū)域定位的效果圖,由于形態(tài)學(xué)的粘連效果受到結(jié)構(gòu)元素大小的影響,故本文固定閉運(yùn)算結(jié)構(gòu)元素大小,并嘗試在三種分辨率下提取身份證號(hào)碼區(qū)域,以正確切分號(hào)碼的位數(shù)作為是否定位成功的標(biāo)志。

      2.2 投影切分字符

      先從R分量上依據(jù)定位得的身份證號(hào)碼區(qū)域?qū)⑵浞指畛?,?duì)分割得的圖像作如下操作:

      (1)使用Otsu二值化算法分割圖像并進(jìn)行反色,即字體為白色,背景為黑色。

      (2)先使用水平投影法確定字符的高度,由于少部分字符之間可能存在粘連,故對(duì)垂直投影法做出改進(jìn),記身份證號(hào)碼區(qū)域圖像的寬度為W,為通過(guò)垂直投影法[3]確定的切割位置(包含起始點(diǎn)),若存在 k <18,則存在字符粘連。由于每個(gè)字符寬度為,假設(shè)粘連在一塊的字符總數(shù)記為c,則使用下式判斷粘連位置及粘連數(shù)。

      當(dāng)滿(mǎn)足公式(1)時(shí),對(duì)[hi, hi+1]進(jìn)行C均等分,可將粘連的字符分開(kāi)。圖4為正確切分的號(hào)碼字符。

      圖4 字符切分結(jié)果

      2.3 lenet-5深度學(xué)習(xí)模型

      lenet-5是Yann LeCun教授針對(duì)手寫(xiě)數(shù)字圖像所開(kāi)發(fā)的卷積神經(jīng)網(wǎng)絡(luò)模型[4],其已經(jīng)成功應(yīng)用于商業(yè),識(shí)別率可達(dá)99%以上,由于身份證號(hào)碼的字符圖像與手寫(xiě)圖像具有一定的相似性,且字體結(jié)構(gòu)較為固定,沒(méi)有手寫(xiě)體隨意,故本文采用lenet-5模型對(duì)身份證號(hào)碼圖像作訓(xùn)練及分類(lèi)。圖5為lenet-5的網(wǎng)絡(luò)模型。

      圖5 lenet-5深度學(xué)習(xí)網(wǎng)絡(luò)

      其中,卷積層C1、C3所用卷積核大小均為5×5大小,采樣層S2、C3通常為均值采樣,感受域大小為2×2,其余則為全連接結(jié)構(gòu)。

      3 實(shí)驗(yàn)與分析

      本文實(shí)驗(yàn)配置為Ubuntu14.04,GTX750Ti的機(jī)器,從網(wǎng)上及實(shí)際拍攝獲得身份證圖像共576張,分為兩部分,其中的300張用于訓(xùn)練,276張用于測(cè)試。使用本文算法對(duì)訓(xùn)練樣本做字符分割,可正確切分字符的樣本為287,定位及切分準(zhǔn)確率為95.66;

      本文使用開(kāi)源的caffe版本lenet-5進(jìn)行實(shí)驗(yàn)。由于從訓(xùn)練樣本獲得的字符僅為4895張0~9二值圖像,故通過(guò)添加噪聲、小角度傾斜、不同閾值二值化等方法將字符集擴(kuò)充為8W,通過(guò)10W次迭代,訓(xùn)練準(zhǔn)確率為96%左右,在字符識(shí)別時(shí),容易錯(cuò)分的是字符“3”和“8”、“0”和“9”。276張用于測(cè)試的圖像可識(shí)別得251張,整體識(shí)別率為91%左右,具有較高的應(yīng)用價(jià)值。

      4 結(jié)論

      本文提出了一種基于計(jì)算機(jī)視覺(jué)技術(shù)的身份證識(shí)別算法,算法對(duì)光照均勻圖像和存在高光的圖像均能有效地定位身份證號(hào)碼,對(duì)垂直投影法作出改進(jìn)以更適合分割粘連的字符,最后對(duì)于除校驗(yàn)位外的字符圖像,使用lenet-5深度學(xué)習(xí)模型進(jìn)行訓(xùn)練及分類(lèi),校驗(yàn)位可由前17位數(shù)字計(jì)算得到。

      [1]李開(kāi),陳禮安,曹計(jì)昌.基于灰度多值化的身份證號(hào)碼識(shí)別[J].計(jì)算機(jī)工程與應(yīng)用,2015(13):191-196.

      [2]許向陽(yáng),宋恩民,金良海.Otsu準(zhǔn)則的閾值性質(zhì)分析[J].電子學(xué)報(bào),2009(12):2716-2719.

      [3楊曉娟,宋凱.基于投影法的文檔圖像分割算法[J].成都大學(xué)學(xué)報(bào)(自然科學(xué)版),2009(02):139-141.

      [4]高燦.一種基于CNN手寫(xiě)字符識(shí)別的改進(jìn)方法[J].黑龍江科技信息,2017(03):164.

      李美玲(1988—),女,廣東廉江人,大學(xué)本科,主要從事通信工程設(shè)計(jì)與管理和樓宇智能化工程技術(shù)的教學(xué)工作。

      張俊陽(yáng)(1991—),男,廣東揭陽(yáng)人,碩士研究生,主要研究領(lǐng)域:模式識(shí)別。

      猜你喜歡
      字符形態(tài)學(xué)身份證
      都有身份證
      尋找更強(qiáng)的字符映射管理器
      辣椒也有身份證
      字符代表幾
      一種USB接口字符液晶控制器設(shè)計(jì)
      電子制作(2019年19期)2019-11-23 08:41:50
      消失的殖民村莊和神秘字符
      趣說(shuō)古人的“身份證”
      醫(yī)學(xué)微觀形態(tài)學(xué)在教學(xué)改革中的應(yīng)用分析
      數(shù)學(xué)形態(tài)學(xué)濾波器在轉(zhuǎn)子失衡識(shí)別中的應(yīng)用
      身份證里的“X”是什么意思
      伊宁县| 高碑店市| 杭州市| 英吉沙县| 六枝特区| 高雄市| 温宿县| 固安县| 北辰区| 沁阳市| 甘洛县| 兴海县| 山阳县| 乌鲁木齐市| 宁强县| 商丘市| 隆林| 巨鹿县| 饶阳县| 镇安县| 怀来县| 武夷山市| 杭锦旗| 亚东县| 阳高县| 丽水市| 万载县| 颍上县| 淅川县| 合江县| 弋阳县| 双鸭山市| 阳城县| 贵德县| 夏津县| 香港| 蒙山县| 沽源县| 大关县| 台前县| 连州市|