• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于DSP的字符識別系統(tǒng)的設(shè)計與實現(xiàn)

      2016-10-10 09:21:35劉宇旸鐘詩航邢昊然王睿
      中國科技縱橫 2016年14期
      關(guān)鍵詞:字符識別彩色圖像字符

      劉宇旸 鐘詩航 邢昊然 王睿

      (北方工業(yè)大學電子信息工程學院,北京 100043)

      基于DSP的字符識別系統(tǒng)的設(shè)計與實現(xiàn)

      劉宇旸 鐘詩航 邢昊然 王睿

      (北方工業(yè)大學電子信息工程學院,北京 100043)

      本系統(tǒng)(DSP)TMS320VC5509A應(yīng)用圖像處理和字符識別技術(shù),擬實現(xiàn)對一張圖片中單個字母與數(shù)字的識別、一行數(shù)字與字母的識別、多行數(shù)字與字母的識別、在同一行中字體大小不一的字母與數(shù)字的識別,以及部分漢字的識別等文字信息的處理和識別,并以可編輯的形式輸出。

      DSP CCS 數(shù)字圖像處理 字符識別

      隨著計算機網(wǎng)絡(luò)飛速發(fā)展,信息電子化已經(jīng)成為一個時代的必然趨勢。文字作為信息中最重要、最集中的載體,其電子化進程顯得越來越重要。很多的電子圖書、期刊文獻和會議論文中都包含著大量有用的信息,但這些文件大都是以PDF格式進行保存的,只能以圖片的形式查看,無法直接對其中的文字信息進行復(fù)制和編輯,因此如何快捷地獲取這些文字信息,一直是困擾著人們的一個難題。本系統(tǒng)實現(xiàn)對字母以及部分漢字的識別和處理并以可編輯形式輸出。

      1 系統(tǒng)設(shè)計方案(圖一)

      2 各部分原理

      (1)灰度化彩色圖像。實現(xiàn)將一張彩色RGB圖像轉(zhuǎn)換成灰度圖[1]。日常生活中人們所見到的圖像一般為彩色圖像,其每個像素點的顏色值由三個字節(jié)組成,分別為R(紅)、G(綠)、B(藍)三個分量,每個分量占一個字節(jié),因此每個像素點的顏色變化范圍為0~255*255*255,如果對彩色圖像直接進行處理識別的話會非常麻煩,因此本系統(tǒng)將所采集的彩色圖像先進行了灰度化處理,使一個字節(jié)代表一個像素點,每個像素點的顏色值變化范圍為0~255,從而很大程度上減少了運算量[2]。

      (2)二值化處理?;叶葓D像的二值化處理,就是將圖像上像素點的灰度值設(shè)置為0或255,也就是使整個圖像呈現(xiàn)出明顯的只有黑和白的視覺效果,以便于后期對圖像的進一步處理。二值化是圖像處理中很重要的一步,二值化后的圖像效果很大程度上影響到圖像識別的準確率[3]。

      (3)分隔字符。通過算法處理,實現(xiàn)將每一個字符單獨分割出來,以便于處理和識別。由于行與行之間、字符與字符之間都是存在空白間隙,利用這一原理可掃描并識別出每一行字符的上下邊界,以及每一行中每一個字符的左右邊界,從而將每個字符的上下左右邊界確定[4],實現(xiàn)字符與字符之間的分割。

      (4)制作字符庫。即制作出一套標準的參照數(shù)據(jù)庫,每個字符都有自己獨特的特征,可根據(jù)這些特征的不同來區(qū)分不同的字符。將分割后每個字符的數(shù)據(jù)信息與字符庫進行特征對比和匹配,從而識別出該字符,最終輸出并顯示。

      圖一 系統(tǒng)設(shè)計框圖

      圖二 測試原圖

      圖三 識別結(jié)果

      3 各部分算法實現(xiàn)

      3.1 灰度化彩色圖像

      讀入彩色圖像每一點的索引值,并將此索引值作為該點的灰度值,存入存放該圖像的一位數(shù)組。

      3.2 二值化處理

      首先求出圖像的最佳閾值,我們采用了迭代法來計算,步驟如下:

      (1)求出圖像灰度的最大和最小值Hmax、Hmin,取初始閾值為其均值,即(Hmax+Hmin)/2,記作T(0);

      (2)根據(jù)閾值T(k)將圖像分為前后景,分別求前后景平均灰度值,在對其求平均,作為T(k+1);

      (3)重復(fù)第2步,知道T(k+1)-T(k) 小于我們設(shè)定的精度極限,得到最佳閾值。得到最佳閾值后,再對像素點遍歷,大于該值的改為255,小于的記為0[5]。

      3.3 分隔字符

      得到二值化的圖像后,需要將一個個的字符單獨提取出來。我們利用了圖像投影來分割字符。

      當我們把一行字符沿行方向投影后,我們可以看到一系列分離的堆,每一個堆代表一個字符,這樣我們便可以記錄堆間空白的位置信息來分割字符[6]。

      同理,沿列方向投影,我們可以分割出各個行。

      所以我們首先對圖像進行行分割,再對各個行進行字符分割。需要注意,此時分割出的字符在列方向并不是完全去除了白邊(由于行分割是對一行的投影,一行的字符高度并不一定相等),所以需要有一個調(diào)整的步驟,把分離出來的圖像再沿行方向投影,從頂部和底部開始,分別找到第一個非零值后,即以此點位置開始裁剪。

      通過以上步驟即可得到一個個完全且僅包含一個字符的子圖像。

      3.4 特征提取

      表1

      表2

      表3

      英文字符和簡單漢字的結(jié)構(gòu)都不太復(fù)雜,我們選擇用就一個九維向量來描述它的特征。

      我們求取上述步驟提取的字符子圖像總的非零像素點數(shù)。然后將每個子圖像等分為9區(qū),求取每區(qū)非零像素點數(shù)占總點數(shù)的比值,作為特征向量的一個值[7]。

      3.5 制作字符庫

      該步驟需要獲取標準字符的信息,我們利用Matlab的便捷來進行處理。對標準字符進行上述步驟處理后,會得到各個標準字符的特征向量,整理后作為模板,以待后續(xù)識別使用。

      3.6 匹配模板并輸出

      字符的識別部分采用了余弦算法,利用余弦定理來判斷其與標準字符的相似性。

      4 測試結(jié)果

      4.1 測試結(jié)果展示圖二、圖三(部分字符庫字符識別)

      4.2 可識別字符庫

      4.2.1 可識別的英文字母以及識別率(單位 %)(見表1)

      4.2.2 可識別的數(shù)字以及識別率(單位:%)(見表2)

      4.2.3 可識別的漢字以及識別率(單位:%)(見表3)

      5 結(jié)語

      本文提出了基于DSP的字符識別系統(tǒng)的設(shè)計,原理與基本算法。通過最后的實驗結(jié)果,可以表明,系統(tǒng)工作穩(wěn)定,識別效率高,識別精度高,并有較大的提升空間。伴隨著大量的文章,圖片分別以PDF以及BMP格式進入互聯(lián)網(wǎng),對字符以及圖像中的字符識別成為了一大難題,同時也說明了有較大的研究空間和發(fā)展價值[8]。

      [1]Rafael C.Gonzalez,Richard E.Woods.數(shù)字圖像處理第三版.Digital Image Processing,Third Edition.[M].北京:電子工業(yè)出版社,2011.6.

      [2]Rafael C.Gonzalez,Richard E.Woods,Steven L.Eddins.數(shù)字圖像處理的MATLAB實現(xiàn)(第2版)[M].北京:清華大學出版社,2013.4.

      [3]汪春梅,孫洪波.TMS320C55xx DSP原理及應(yīng)用[M].北京:電子工業(yè)出版社,

      [4]趙小強,李大湘,白本督.DSP原理及圖像處理應(yīng)用[M].

      [5]孫明.數(shù)字圖像處理與分析基礎(chǔ)——MATLAB和C++實現(xiàn)[M].北京:電子工業(yè)出版社,

      [6]劉珂含,何培宇,關(guān)勝平,田芳芳,吳嶸.基于TMS320VC5509A的圖像采集與識別系統(tǒng)[J].四川大學學報(自然科學版),2008,45(1).

      [7]陳炳權(quán).基于DSP+FPGA的實時圖像識別系統(tǒng)硬件與算法設(shè)計[J].衡陽師范學院學報 2008,29(3).

      [8]肖明明,黎耀榮.基于DSP的字符識別系統(tǒng)的實現(xiàn)[J].微計算機信息(嵌入式與SOC), 2009,25(1-2).

      猜你喜歡
      字符識別彩色圖像字符
      尋找更強的字符映射管理器
      字符代表幾
      一種USB接口字符液晶控制器設(shè)計
      電子制作(2019年19期)2019-11-23 08:41:50
      基于FPGA的實時彩色圖像邊緣檢測
      電子制作(2019年16期)2019-09-27 09:34:46
      消失的殖民村莊和神秘字符
      一種改進深度學習網(wǎng)絡(luò)結(jié)構(gòu)的英文字符識別
      基于最大加權(quán)投影求解的彩色圖像灰度化對比度保留算法
      自動化學報(2017年5期)2017-05-14 06:20:56
      儀表字符識別中的圖像處理算法研究
      基于顏色恒常性的彩色圖像分割方法
      基于CUDA和深度置信網(wǎng)絡(luò)的手寫字符識別
      德保县| 霍邱县| 息烽县| 融水| 务川| 宁国市| 韶关市| 彭山县| 乌恰县| 东宁县| 马鞍山市| 育儿| 荣昌县| 红原县| 宁南县| 湄潭县| 得荣县| 阳东县| 理塘县| 泰州市| 丹巴县| 锦州市| 伊宁县| 大城县| 咸阳市| 彭山县| 宝坻区| 大姚县| 莆田市| 新营市| 象州县| 柳江县| 隆尧县| 年辖:市辖区| 临沂市| 三都| 开阳县| 灵台县| 孟州市| 泾川县| 荃湾区|