• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于圖像處理的印刷字符分割提取方法

      2021-04-23 12:48:08王曉倩
      關(guān)鍵詞:字符塑料袋全局

      常 江,于 謙,王曉倩

      (哈爾濱商業(yè)大學(xué) 輕工學(xué)院,哈爾濱150028)

      隨著印刷行業(yè)的不斷發(fā)展,印刷制品種類繁多,在生產(chǎn)日常中,書本、宣傳報(bào)、包裝袋等都屬于印刷制品,大多數(shù)印刷品表面都印有各種各樣的字符,利用字符識別印刷品已成為必要途徑.字符可顯示印刷品的生產(chǎn)保質(zhì)期、質(zhì)量、體積、型號等特點(diǎn)[1].因而保證印刷品的相關(guān)產(chǎn)品信息在出廠前被清晰、正確的標(biāo)注是必要的.字符質(zhì)量檢測的任務(wù)之前都是由人工完成,但是由于人工的不確定因素,很多時(shí)候無法保證質(zhì)量要求.隨著科學(xué)的不斷進(jìn)步帶動著生產(chǎn)的發(fā)展,機(jī)器視覺的出現(xiàn)大量減少了不確定因素出現(xiàn)的可能[2],提高效率的同時(shí)大大提高了質(zhì)檢質(zhì)量,字符分割提取是下一步字符識別的前提條件,因此基于圖像處理的印刷品字符分割提取尤為重要.隨著對字符識別提取的深入研究,國內(nèi)外已然出現(xiàn)了許多成果,但是仍然存在著許多可以改進(jìn)優(yōu)化的地方.

      許多學(xué)者和企業(yè)開始高度重視利用新興技術(shù)來解決現(xiàn)存的問題,利用機(jī)器視覺技術(shù)來解決印刷品字符識別的問題.張立凡[3]針對于企業(yè)的生產(chǎn)需求并聯(lián)系實(shí)際情況,通過機(jī)器視覺技術(shù)完成了對印刷品圖文信息的缺陷檢測,但檢測結(jié)果仍然精準(zhǔn)度不高.張琪建[4]通過改進(jìn)機(jī)器視覺系統(tǒng)中圖像采集部分中硬件設(shè)備,以及聯(lián)系實(shí)際情況調(diào)整Halcon中的參數(shù)完成了針對于美術(shù)類試卷信息的識別提取系統(tǒng),但仍存在信息丟失和實(shí)效性不足等問題.甘玲、林小晶[5]提出了一種改進(jìn)過的關(guān)聯(lián)域提取字符分割算法,通過計(jì)算像素之間的連接比例,提取最終正確的連接標(biāo)簽,并且可以提取每個(gè)單獨(dú)的聯(lián)通域,達(dá)到了可以穩(wěn)定識別的目的,但對環(huán)境、燈光等條件依賴性過高.本文在現(xiàn)有研究基礎(chǔ)上結(jié)合圖像分割方法,設(shè)計(jì)一種針對于塑料袋的字符分割提取方法,并通過實(shí)驗(yàn)驗(yàn)證該方法的有效性.

      1 基本原理與方法

      閾值分割法是一種基于區(qū)域的圖像分割技術(shù),其基本原理是:通過設(shè)定不同的特征閾值,把圖像象素點(diǎn)分為若干類.常用的特征包括:直接來自原始圖像的灰度或彩色特征;由原始灰度或彩色值變換得到的特征.

      全局閾值法指利用全局信息對整幅圖像求出最優(yōu)分割閾值,可以是單閾值,也可以是多閾值.其中全局閾值法又可分為基于點(diǎn)的閾值法和基于區(qū)域的閾值法.閾值分割法的結(jié)果很大程度上依賴于閾值的選擇,因此該方法的關(guān)鍵是如何選擇合適的閾值[6].

      基于點(diǎn)的全局閾值算法與其他幾大類方法相比,算法時(shí)間復(fù)雜度較低,易于實(shí)現(xiàn),適合應(yīng)用于在線實(shí)時(shí)圖像處理系統(tǒng);對一幅圖像而言,不同的區(qū)域,比如說目標(biāo)區(qū)域或背景區(qū)域,同一區(qū)域內(nèi)的象素,在位置和灰度級上同時(shí)具有較強(qiáng)的一致性和相關(guān)性[7].基本全局閾值分割步驟如下:

      1)設(shè)定參數(shù)T0,并選擇一個(gè)初始的估計(jì)閾值T1.

      2)用閾值T1分割圖像.將圖像分成兩部分:G1是由灰度值大于的像素組成,G2是由灰度值小于或等于T1的像素組成.

      3)計(jì)算G1和G2中所有像素的平均灰度值μ1和μ2,以及新的閾值T2=(μ1+μ2)/2.

      4)如果|T1-T2|

      2 分割提取實(shí)驗(yàn)

      實(shí)驗(yàn)內(nèi)容主要針對于塑料袋這一印刷品上的字符進(jìn)行分割提取,將實(shí)驗(yàn)內(nèi)容結(jié)合機(jī)器視覺軟件中的OCR字符識別程序[9],進(jìn)行優(yōu)化改進(jìn).主要實(shí)驗(yàn)?zāi)康臑樘崛D1(B)中透明塑料袋中的“樂購生鮮連鎖超市”以及圖1(A)不透明塑料袋中的“大潤發(fā)全民環(huán)保關(guān)愛地球請珍惜地球上每一份資源”部分字符信息.

      2.1 實(shí)驗(yàn)所用設(shè)備

      本文實(shí)驗(yàn)對象為購物所用塑料袋,選取透明塑料袋和不透明塑料袋作為對照實(shí)驗(yàn)對象.

      實(shí)驗(yàn)設(shè)備的選?。簽楸WC檢測環(huán)境充足且穩(wěn)定的光照條件選取在LED線性光源條件下采集圖像[10];考慮到實(shí)際情況,選取智能手機(jī)的1 600萬像素后置攝像頭作為相機(jī).

      圖1 實(shí)驗(yàn)對象

      2.2 實(shí)驗(yàn)流程

      第一步選取不同透明度的塑料袋作為對照實(shí)驗(yàn)的對照實(shí)驗(yàn)對象,明確實(shí)驗(yàn)提取目標(biāo);第二步對所選實(shí)驗(yàn)對象分別進(jìn)行圖像采集,調(diào)整相機(jī)焦距,同時(shí)調(diào)整并選取合適的光源以便于采集到優(yōu)秀質(zhì)量的實(shí)驗(yàn)圖像;第三步對所采集到的優(yōu)秀圖像進(jìn)行圖像預(yù)處理;第四步采用基于全局閾值的分割方法對目標(biāo)圖像進(jìn)行分割,并且通過調(diào)整參數(shù)選取最優(yōu)的設(shè)計(jì);最后對圖像分割后的區(qū)域進(jìn)行漢字字符的提取.見圖2.

      圖2 實(shí)驗(yàn)流程圖

      2.3 基于全局閾值分割方法實(shí)驗(yàn)

      2.3.1 透明塑料袋

      首先采用基于全局閾值分割方法第實(shí)驗(yàn)對象進(jìn)行分割,后進(jìn)行基于連通域分割方法得出分割結(jié)果進(jìn)行對比后選較為提取效率高、較為簡便的優(yōu)化系統(tǒng).

      提取預(yù)處理后的圖像中較亮部分的字符信息,使用全局閾值分割較亮的字符部分:threshold(ImageMedian,Region,128,255)其中128為最小灰度值,255為最大灰度值,使用threshold算子分割較亮部分.使用closing_circle(Region,RegionClosing,19.5)將區(qū)域閉運(yùn)算[11],將字符連接在一起.最后經(jīng)過fill_up(RegionClosing,RegionFillUp)算子來填充部分孔洞[12].通過以上步驟提取字符中較亮部分.

      在預(yù)處理后得到的圖片的基礎(chǔ)上對所選目標(biāo)區(qū)域進(jìn)行閾值分割,據(jù)圖3(A)中顯示目標(biāo)區(qū)域中二值化效果明顯,處理效果較好,但由于漢字字體結(jié)構(gòu)的原因有些字體并非一個(gè)完整區(qū)域,所以進(jìn)行區(qū)域閉運(yùn)算如圖3(B)但是效果仍不明顯,所以針對字體間的孔洞進(jìn)行填充,結(jié)果如上圖3(C)所示,有明顯變化有些字體連成一個(gè)完整區(qū)域.

      圖3 提取較亮部分過程圖

      在上述操作后,提取灰度值較低的字符信息調(diào)整閾值范圍,使用:Threshold(ImageMedian,Region1,40,255)分割較暗字符區(qū)域,然后使用:Difference(Region1,RegionFillUPp,RegionDifference)得到較暗部分字符[13],如圖4所示:聯(lián)合較暗與較亮區(qū)域,獲得所有字符區(qū)域,利用union2( )算子完成.根據(jù)孔洞面積大小填充孔洞,利用算子:fill_up_shape( )完成填充,且填充效果如圖5所示.

      通過閉運(yùn)算方法,講左右結(jié)構(gòu)、上下結(jié)構(gòu)的漢字結(jié)合成一個(gè)聯(lián)通域,通過closing_rectangle1( )完成閉運(yùn)算,通過connection( )算子完成連通區(qū)域[14],最終通過intersection( )算子將兩個(gè)區(qū)域求交集得到圖6.

      圖4 較暗部分字符

      圖5 填充后圖像

      圖6 分割字符過程

      在填充后的圖像基礎(chǔ)上在進(jìn)行區(qū)域閉運(yùn)算,通過比較圖6(A)與圖5可以明顯觀測出字體邊緣輪廓變清晰了,“生鮮連鎖超市”幾個(gè)小字已經(jīng)基本形成一個(gè)完整的連通區(qū)域,但是“樂購”兩個(gè)較大的字體在結(jié)構(gòu)上仍留有空隙,不能作為一個(gè)連通區(qū)域進(jìn)行后續(xù)檢測.所以繼續(xù)進(jìn)行連通區(qū)域,效果如上圖6(B)中所示,所有字體都分別形成了一個(gè)獨(dú)立且完整的連通區(qū)域.在進(jìn)行區(qū)域求交集獲得單個(gè)字符如圖6(C)中所示,所選定的目標(biāo)區(qū)域中8個(gè)漢字分別對應(yīng)8個(gè)獨(dú)立且完整的字符區(qū)域.

      最后效果如圖7所示,清晰且完整地提取了透明塑料袋中所選目標(biāo)區(qū)域中的漢字字符信息.

      圖7 透明塑料袋字符提取結(jié)果

      2.3.2 不透明塑料袋

      第一步:將使用中值濾波處理去噪后得圖像進(jìn)行所有漢字提取,首先設(shè)置漢字字符檢測區(qū)域,所用代碼為:

      gen_rectangle2 (DetectROIUp, 2186.56, 1781.68, rad(177.563), 957.765, 285.555).把上漢字檢測區(qū)域從圖像中提取,其代碼為:

      reduce_domain (ImageMedian, DetectROIUp, ImageReduced).然后使用全局閾值分割域 threshold (ImageReduced, Region, 128, 255) ,提取所有亮區(qū)域[15].

      如圖8(A)所示,經(jīng)過圖像預(yù)處理后所采集的不透明塑料袋圖像中的噪聲基本不會影響后續(xù)工作,且二值化后圖像中待檢測字符與背景區(qū)域?qū)Ρ让黠@,非常有利于后續(xù)工作的進(jìn)行.將待檢測區(qū)域設(shè)置好后如圖8(B)所示,待檢測的“大潤發(fā)”三個(gè)字符被完全覆蓋,由此說明字符待檢測區(qū)域的選取和提取效果符合后續(xù)工作要求.

      圖8 提取所有亮區(qū)域過程

      第二步:分割字符.利用區(qū)域閉運(yùn)算把上下結(jié)構(gòu)、左右結(jié)構(gòu)的漢字合成一體,代碼為:

      closing_rectangle1 (Region, RegionClosing, 10, 100)

      然后利用算子connection (RegionClosing, ConnectedRegions)聯(lián)通區(qū)域.最后將連通區(qū)域和提取的所有亮區(qū)域漢字求交集,獲得單個(gè)漢字,其代碼顯示為:

      intersection (ConnectedRegions, Region, RegionIntersectionUp)

      如圖9(A)中所示,提取所有亮區(qū)域后選取了目標(biāo)區(qū)域中“大潤發(fā)”三個(gè)目標(biāo)字符,進(jìn)行了初步的區(qū)域閉運(yùn)算,三個(gè)漢字字符基本形成一個(gè)連通區(qū)域,但仍有一些筆畫因?yàn)樽煮w結(jié)構(gòu)未連成整體區(qū)域;圖9(B)所示經(jīng)過連通區(qū)域后對比可以明顯觀察到三個(gè)漢字分別形成了獨(dú)立且完整的連通區(qū)域;如圖9(C)所示交集后獲得所選漢字字符區(qū)域完整且獨(dú)立.

      圖9 分割字符過程

      第三步:同第二步操作相同,對“全民環(huán)保 關(guān)愛地球 請珍惜地球每一份資源!”進(jìn)行分割提取,將所有漢字字符提取后進(jìn)行分割,得到最終漢字字符的提取結(jié)果.

      最后識別效果如圖10所示,針對于不透明塑料袋中較大的字符的提取分割效果較好,提取的字符信息清晰且完整;但由于檢測方法的影響,在不透明塑料袋中較小字符的檢測結(jié)果不盡人意.

      圖10 不透明塑料袋字符分割提取結(jié)果

      3 結(jié) 論

      使用基于全局閾值分割方法對于透明塑料袋與不透明塑料袋的字符進(jìn)行分割提取后得到以下結(jié)論:

      1)使用基于全局閾值分割的方法來進(jìn)行塑料袋上字符信息的分割提取是可行的,整體來說基本上可以分割提取大部分的字符信息,且檢測速度較為優(yōu)秀,在程序的設(shè)計(jì)編寫中只需要運(yùn)行19步代碼即可完成對字符的分割提取,效率較高.

      2)對于透明塑料袋來說,通過觀測分割提取結(jié)果,基于全局閾值分割的方法最終效果較為令人滿意,在保證檢測速度的前提下準(zhǔn)確且完整的分割提取了透明塑料袋中的字符.

      3)對于不透明塑料袋來說,通過觀察分割提取結(jié)果,使用基于全局閾值分割的方法最終的效果不是特別理想,整體來說在不透明塑料袋中較大的字符分割提取使用基于閾值分割的方法還是可行的,但是在小字符的分割提取上很明顯該方法不是一種合適的方法,還需要進(jìn)行進(jìn)一步的優(yōu)化或改進(jìn).

      猜你喜歡
      字符塑料袋全局
      Cahn-Hilliard-Brinkman系統(tǒng)的全局吸引子
      尋找更強(qiáng)的字符映射管理器
      量子Navier-Stokes方程弱解的全局存在性
      我是一個(gè)塑料袋
      小讀者(2021年6期)2021-07-22 01:49:24
      字符代表幾
      一種USB接口字符液晶控制器設(shè)計(jì)
      電子制作(2019年19期)2019-11-23 08:41:50
      消失的殖民村莊和神秘字符
      落子山東,意在全局
      金橋(2018年4期)2018-09-26 02:24:54
      歐幾里得和塑料袋
      一個(gè)塑料袋
      汉川市| 衢州市| 大兴区| 太和县| 英超| 衡东县| 陇川县| 景洪市| 隆昌县| 阳东县| 舒城县| 抚远县| 新宁县| 永泰县| 定襄县| 大厂| 白水县| 湟源县| 临海市| 澎湖县| 南充市| 共和县| 新河县| 西藏| 吴桥县| 图片| 奎屯市| 兰州市| 吉木萨尔县| 洮南市| 黄龙县| 新干县| 麻江县| 新沂市| 赫章县| 淅川县| 海宁市| 漳州市| 贡觉县| 分宜县| 忻城县|