王景中++王兆亮
摘要:文本行的檢測(cè)提取是文本圖像分析的支柱。這里提出一種新的扭曲文本行信息檢測(cè)提取方法,直接從灰度圖像進(jìn)行文本行的檢測(cè)。首先用高斯平滑濾波增強(qiáng)文本行的結(jié)構(gòu),然后用脊線檢測(cè)找出文本行的中心線,在脊線的基礎(chǔ)上用自適應(yīng)主動(dòng)輪廓模型來估算出文本行的邊緣線。理論分析和實(shí)驗(yàn)結(jié)果表明,該算法檢測(cè)文本行邊緣線的精確度較好,而且具有一定的魯棒性和較好的適應(yīng)性。
關(guān)鍵詞:灰度文本圖像;扭曲圖像;高斯平滑濾波;脊線;主動(dòng)輪廓模型
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2017)03-0130-03
近十幾年以來,一直都是用掃描儀來采集文本圖像?,F(xiàn)如今已是數(shù)字化時(shí)代,數(shù)碼相機(jī)以其高質(zhì)量和低成本正在逐漸替代掃描儀,此外相機(jī)還具有遠(yuǎn)距離、非接觸、快速采集等特點(diǎn),這些特性使得相機(jī)適用于多功能的OCR相關(guān)應(yīng)用,如移動(dòng)OCR、數(shù)字化厚書、數(shù)字化歷史文獻(xiàn)等。但也出現(xiàn)了如運(yùn)動(dòng)模糊、低分辨率、光照不均、曝光不足或曝光過度以及扭曲和透視變形等影響因素,這給傳統(tǒng)的OCR系統(tǒng)帶來了新的問題。因此在文字識(shí)別之前需要做二值化和扭曲校正這樣的預(yù)處理。扭曲文本行檢測(cè)和文本線的估算是校正處理非常重要的步驟。之前的扭曲文本行檢測(cè)方法都是基于二值圖像的,這些方法可以分為兩類:(1)基于連通域處理[1-3]和(2)基于文本線處理[4-5]?;谶B通域方法是從單個(gè)連通域開始并搜索鄰域區(qū)域中的其他連通域,而且需要使用某些復(fù)雜的標(biāo)準(zhǔn)規(guī)則來進(jìn)行文本行搜索,這種方法由于處理單個(gè)連通域?qū)е滤俣缺容^慢,但優(yōu)點(diǎn)是處理較為細(xì)致;基于文本線方法優(yōu)點(diǎn)在于處理速度快,這主要得益于以文本行為單位處理的,但因此也會(huì)對(duì)精準(zhǔn)度造成一定偏差。此外,這些方法大多數(shù)是處理英文文本圖像的,由于中英文字符的結(jié)構(gòu)差異,應(yīng)用到中文文本圖像上效果較差,難以適用。
通常,基于連通域處理和基于文本線處理的方法都依賴于自適應(yīng)閾值處理的二值化方法作為文本行檢測(cè)之前的預(yù)處理步驟,在存在諸如不均勻陰影、低分辨率、運(yùn)動(dòng)模糊、曝光不足或曝光過度等情況下,二值化可能會(huì)產(chǎn)生不良的結(jié)果。如圖1所示,因此二值化可以對(duì)文本行檢測(cè)結(jié)果產(chǎn)生不利影響。本文提出一種直接從灰度文本圖像進(jìn)行扭曲文本行信息檢測(cè)提取的方法。我們用基于匹配濾波器組方法的多方向多尺度各向異性高斯平滑來增強(qiáng)扭曲文本行的結(jié)構(gòu),然后從平滑的圖像中檢測(cè)到脊線,其中脊線定義為通過文本行中心的未破壞的中心線結(jié)構(gòu),然后用自適應(yīng)主動(dòng)輪廓模型作用在脊線上估計(jì)出文本行的邊緣線。
1 扭曲中文文本圖像的特征分析
在獲得圖像的過程中,由于書本的擺放以及相機(jī)的位置,或者書的厚度等都會(huì)導(dǎo)致圖像出現(xiàn)扭曲,如圖2所示,這些都會(huì)使得OCR識(shí)別率大大降低。扭曲一般分為兩種情況:行扭曲和字扭曲。從識(shí)別處理的思維來說,扭曲文本行的信息更容易檢測(cè)提取出來。本文提出的方法是基于灰度圖的,因此需要對(duì)拍攝的文本圖像作灰度化處理。圖像灰度化是數(shù)字圖像處理中一種經(jīng)典的處理方法,目的在于將彩色圖像轉(zhuǎn)換成灰度圖像。常用的灰度化算法是加權(quán)平均法,即對(duì)原始圖像像素?cái)?shù)據(jù)中的RGB分量代入權(quán)重求其均值,式(1)是該方法的常見加權(quán)均值公式:
其中,R(i,j),G(i,j),B(i,j)分別是原始圖像中像素(i,j)的R、G、B分量值,Gray(i,j)為計(jì)算得到的灰度值,也就是新圖像中像素(i,j)的值。
2 扭曲文本行信息檢測(cè)提取方法
我們的扭曲文本行信息檢測(cè)提取方法包括三個(gè)步驟:(1)使用多方向多尺度各向異性高斯平滑增強(qiáng)灰度文本行的結(jié)構(gòu);(2)使用脊線檢測(cè)扭曲文本行的中心線;(3)自適應(yīng)主動(dòng)輪廓模型作用在脊線上估算出文本行的邊緣線。
2.1 增強(qiáng)文本行結(jié)構(gòu)
3 實(shí)驗(yàn)結(jié)果分析
之前的方法都是基于二值圖像的,沒有針對(duì)灰度圖的文本行信息檢測(cè)的直接評(píng)估方法,為了檢驗(yàn)效果,同時(shí)選取針對(duì)外文的文本行檢測(cè)方法進(jìn)行對(duì)比,通過和外文的檢測(cè)正確精度對(duì)比可以看出,本文的算法正確度較高,而且相對(duì)于傳統(tǒng)的需要二值化處理的方法,本方法對(duì)諸如光照不均,低分辨率,運(yùn)動(dòng)模糊等魯棒性較好,對(duì)扭曲程度較高的情況也能得到穩(wěn)定的保證。
4 結(jié)語
本文針對(duì)扭曲文本行信息的檢測(cè)提取提出了一種新方法,此方法獨(dú)立于二值化算法,文本行檢測(cè)精度高達(dá)93%以上,針對(duì)低分辨率,運(yùn)動(dòng)模糊,過度曝光等問題魯棒性較好,能準(zhǔn)確的在這些情況下檢測(cè)出文本行。對(duì)扭曲度較高的文本行也不需要后續(xù)處理,該方法可以直接從灰度圖像提取文本行信息,對(duì)傳統(tǒng)的通過影響二值化導(dǎo)致文本行提取不精確的情況提出了挑戰(zhàn)。
參考文獻(xiàn)
[1]Liu Hong, Ye Lu, A method restore Chinese warped document images based on binding characters and building curved lines [C]// International Conference on Systems, Man and Cybernetics(ICSMC),2009:984-990.
[2]Gatos B, Pratikakis I, Ntirogiannis K. Segmentation based recovery of arbitrarily warped document images[C]//9th International Conference on Document Analysis and Recognition, 2007:989-993.
[3]宋麗麗,吳亞東,孫波.改進(jìn)的文檔圖像扭曲校正方法[J].計(jì)算機(jī)工程,2011,37(1):204-206.
[4]張偉業(yè),趙群飛.讀書機(jī)器人的版面分析及文字圖像預(yù)處理算法.[J].微型電腦應(yīng)用,2011, 27(1):58-61.
[5]Liu Hong, Ding Run-wei. International Conference on Systems Man and Cybernetics: ICSMC 2009: Restoring Chinese warped document images based on text boundary lines, [C].2009:571-576.