錢俞好,周 軍,田 勝,李少輝
(河海大學 機電工程學院,江蘇 常州 213022)
視覺檢測是機器視覺中的一個重要領(lǐng)域,涉及到計算機、圖像處理、模式識別等多個領(lǐng)域。近幾年隨著印刷產(chǎn)業(yè)的快速發(fā)展,機器視覺檢測技術(shù)逐漸在印刷檢測中得到廣泛應用,檢測識別結(jié)果的準確性以及識別效率已成為關(guān)鍵性的衡量標準[1]。
國外開始對字符識別的技術(shù)的研究相對較早,在理論和產(chǎn)品上都比較成熟。俄羅斯的ABBYY Finereader以及美國的Nuance Omnipage Professional都是當今世界上比較出色的OCR識別檢測系統(tǒng)軟件,支持多國語言,且識別率都能達到99%以上。我國于上世紀70年代末開始對OCR技術(shù)方面的研究,經(jīng)過近30年的努力已取得了重大進展?,F(xiàn)已出現(xiàn)一些性能比較出眾的產(chǎn)品成果,如清華TH-OCR97綜合集成漢字識別系統(tǒng),對中等質(zhì)量的樣本識別對象,識別率能夠達到98%或者更高。字符識別常用的算法有模板匹配、KNN、SVM、神經(jīng)網(wǎng)絡等。
本研究將基于模板匹配算法,提出一種改進的模板匹配算法。
模板匹配是模式識別中的一個基本方法,屬于一種統(tǒng)計思想的識別算法[2]。該方法原理簡單、識別過程直觀、計算方便,因此得到較為普遍的應用。字符模板匹配目前采用簡單的二值圖像模板,0表示黑(背景),1表示白(目標)[3]。原匹配圖像S、模板T、覆蓋的目標區(qū)域Sij,如圖1所示。
圖1 原匹配圖S及模板T
模板T(m,n)和所覆蓋目標區(qū)域Sij(i,j)之間的相似性D(i,j)的數(shù)學表達式為:
(1)
(2)
本研究計算目標圖像與所有的模板庫中的相關(guān)系數(shù),選取系數(shù)中最大的對應的模板圖像即為識別內(nèi)容。
按經(jīng)過多次實驗發(fā)現(xiàn),在一般條件下,選取自然光源的陰面采集圖像所呈現(xiàn)的效果最為理想,采集瓶蓋原始圖像如圖2所示。
圖2 采集瓶蓋原始圖像
閾值分割法是運用最為廣泛的圖像分割技術(shù)。常用的閾值分割算法有以下幾種:迭代法、最大類間誤差法、最大熵法等[4],該實驗著重研究基于最大類間誤差的閾值分割法。
根據(jù)圖像的灰度特性,將圖像分為背景和目標兩個部分,運用最大類間誤差閾值算法的步驟:
(1)計算圖像中每個灰度值的概率Pi;
(2)通過計算目標和背景的分布概率ω1、ω0以及各自的平均灰度值μ1、μ0來計算方差σ02、σ12;
σ02、σ03的計算公式如下:
(3)
式中:K—背景像素集合的最大容量。
(4)
式中:L—目標像素集合的最大容量。
(3)計算每個灰度值的類間差;
(5)
式中:μT=(μ0+μ1)/2,k=0,1。
(4)則所有類間差中最大的所對應的灰度值即為閾值。
本研究利用Matlab中提供的閾值分割法的函數(shù)im2bw()進行分割,效果如圖3所示。
圖3 閾值分割圖
圖像增強技術(shù)是進行正確檢測識別字符的必要保證[5]。目標字符主要位于圖像中的圓形區(qū)域內(nèi),在圖像處理中常用Hough變換的圓檢測的方法[6]。
圓檢測區(qū)域效果如圖4所示。
圖4 圓檢測目標圖像
由圖4可以看出:通過圓檢測出來的圖像包含了字符和部分的噪聲點。常用的去噪濾波方法有高斯濾波法、均值濾波發(fā)、中值濾波發(fā)、雙邊濾波法等[7]。在Matlab軟件環(huán)境中分別用這幾種濾波方法對圖像進行處理,效果如圖5所示。
圖5 幾種濾波方法效果圖
從以上4種濾波方式可以看出:相對于其他3種方法,中值濾波在該實驗中有更好的圖像增強效果。
常用的字符分割方法有CFS分割、投影分割、基于最小外接矩形框分割等[8],本文中采用的基于最小外接矩形及連通區(qū)域相結(jié)合的分割法。
(1)通過最小外接法選定出包含全部字符的最小矩陣區(qū)域;
最小外界矩形框如圖6所示。
圖6 最小外界矩形框
(2)遍歷圖中的最小矩形區(qū)域,去除像素值之和為0的行,得到所有的有效字符區(qū)域條;有效字符條區(qū)域如圖7所示。
圖7 有效字符條區(qū)域
(3)通過Matlab中提供的bwlabel()函數(shù)遍歷圖7中的每一個有效字符區(qū)域,確定出每一個連通字符區(qū)域,即為每一個需要待分割的字符。
由于該實驗中的字符之間的區(qū)分度較好,沒有粘連現(xiàn)象,字符之間的分割結(jié)果較滿意。
分割結(jié)果圖如圖8所示。
圖8 字符分割圖
積分圖像是一種快速計算圖像目標矩形區(qū)域內(nèi)像素之和的數(shù)據(jù)處理方法,在圖像濾波二值化圖像處理較為常見[9]。
積分圖像的數(shù)學公式為:
(6)
式中:I—原始圖像;II—積分圖象。
某一圖像區(qū)域的積分圖像示意圖如圖9所示。
圖9 積分圖像用法示意圖
則區(qū)域Ⅳ的像素值之和為:
IⅣ=I(i,j)+I(i-1,j-1)-I(i,j-1)-I(i-1,j)
(7)
要計算任意區(qū)域的像素和,通過3次加減法對一次內(nèi)存讀取4個區(qū)域的像素和進行運算,從而避免了傳統(tǒng)方法中逐點累加的繁瑣求和過程。一幅大小為N×M的二值圖中去統(tǒng)計K個區(qū)域內(nèi)的像素和,時間復雜度為K×(N×M-1),內(nèi)存讀取開銷為K×N×M。在二值圖的基礎上利用積分圖像的思想進行后續(xù)計算,時間復雜度和內(nèi)存讀取開銷僅為3×K和4×K,理論上大大縮短了圖像處理的時間[10]。
模板匹配中一般以原圖像與模板之間的相關(guān)系數(shù)來衡量,相關(guān)系數(shù)表示原圖像向量與模板圖像向量之間的夾角。設Amn和Bmn為積分圖像和模板圖像在標準處理后的二值矩陣,μ0、μ1和σ02、σ12分別為積分圖像和模板圖像在標準處理后的均值和方差,則相關(guān)系數(shù)r(A,B)可用下式來表示:
(8)
對上式進行近似處理:
(9)
比較上述兩式,改進后的式(9)在實現(xiàn)過程中只需遍歷一次目標圖像和模板圖像,計算得出均差、方差,計算開銷明顯減小。
原分割后字符圖像經(jīng)過歸一化后的大小均為24×42,模板庫由0~9這10個數(shù)字的模板組成,每一個數(shù)字搜集了50個模板,大小均為24×42。對0~9這10個數(shù)字分別在傳統(tǒng)模板匹配算法與改進的圖像積分模板匹配算法下進行60組識別實驗,傳統(tǒng)模板匹配算法的識別結(jié)果如表1所示。
表1 傳統(tǒng)模板匹配識別結(jié)果
改進之后的模板匹配算法的識別結(jié)果如表2所示。
表2 改進模板匹配識別結(jié)果
兩種方式的比較結(jié)果,如表3所示。
表3 兩種方式的比較結(jié)果
從表1和表2的結(jié)果可以看出:總體上在兩種匹配方式下除了個別字符,如“0”和“7”的識別率與平均識別率相差較大,大部分的字符識別率能在90%以上;從表3可以得出:改進模板匹配算法的識別率略低于傳統(tǒng)模匹算法,但是在識別速度比傳統(tǒng)方法提高了20%多。從張宏濤、龍翀,湯茂斌,謝渝平等人做的字符識別的結(jié)果來看,在滿足當今普遍研究結(jié)果的識別率在83%到94%的范圍條件下,本文提出的改進模板匹配算法能夠在滿足識別率在平均范圍內(nèi)的前提下,提高了識別檢測的速度。
筆者利用本文提出的基于圖像積分的改進模板匹配算法,從結(jié)果來看能夠正確地識別檢測出瓶蓋印刷碼中的所有字符,驗證該算法用來檢測瓶蓋印刷碼字符的可行性。
本研究介紹了一種基于圖像積分的改進模板匹配的算法,并與傳統(tǒng)模板匹配算法進行了比較,結(jié)果表明:改進之后的匹配算法在識別速率上能夠提高20%以上,為以后的研究提供了重要參考依據(jù)。
但該算法存在著個別字符識別結(jié)果不理想的情況,在下一階段,需要從識別算法上加以完善,在保證識別速度的同時,提高識別的準確率,減小實驗誤差。
參考文獻(References):
[1] 張宏濤,龍 翀,朱小燕,等.印刷體漢字識別后處理方法的研究[J].中文信息學報,2009,23(6):67-71.
[2] 劉云峰,楊小岡,齊乃新,等.基于模板匹配的前視自動目標識別模型[J].兵工自動化,2016,35(7):4-6.
[3] 李新良.模式識別理論的研究與應用[J].北京電子科技學院學報,2011,19(4):75-79.
[4] 劉 佳,傅衛(wèi)平,王 雯,李 娜.基于改進SIFT算法的圖像匹配[J].儀器儀表學報,2013,34(5):47-51.
[5] 湯茂斌,謝渝平,李就好.基于神經(jīng)網(wǎng)絡算法的字符識別研究[J].微電子學與計算機,2009,26(8):91-93.
[6] 張勇紅.基于霍夫變換的銘牌OCR圖像旋轉(zhuǎn)矯正方法[J].電測與儀表,2015,52(8):125-128.
[7] 戴憲策,劉昌錦.模板匹配的一種快速算法[J].信息科學與控制工程,2016,36(1):23-25.
[8] TAVAKOL A, SOLTANIAN M. Fast feature-based template matching, based on efficient keypoint extraction[J].AdvancedMaterialsResearchr,2012,17(21):798-802.
[9] WANG Y W, LIANG H,LI J,et al. An improved difference template matching algorithm[J].AdvancedMaterialsResearch,2012,22(13):117-121.
[10] JING J, DAUWELS J, RAKTHANMANON T, et al. Rapid annotation of interictal epileptiform discharges via template matching under dynamic time warping[J].Elsevier,2016,33(4):114-119.