鄭靜+王騰
摘要:本文針對(duì)各種印刷和手寫(xiě)的紙質(zhì)材料經(jīng)過(guò)掃描儀掃描后形成的結(jié)果圖像,甚至是老舊手寫(xiě)資料的掃描結(jié)果圖像或圖像質(zhì)量不理想的歷史掃描資料,通過(guò)對(duì)批量圖像的共同特點(diǎn)進(jìn)行分析,經(jīng)算法設(shè)計(jì),最終實(shí)現(xiàn)了對(duì)JPG、PDF等在內(nèi)的多種格式掃描圖像的批量性角度校正、去黑白邊、高壓縮比壓縮和文檔化歸檔處理,且著重介紹了算法的難點(diǎn)及其解決方案。
關(guān)鍵詞:傾斜校正;自動(dòng)裁剪;自適應(yīng)閾值分割;高壓縮比壓縮
中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)28-0217-03
Abstract:in this paper, a variety of printed and handwritten paper materials by scanning the results after the formation of the image, and even history scans of old handwritten data image or image quality is not ideal, by analyzing the common characteristics of batch image, the algorithm design, the final realization of the JPG, including a variety of PDF the bulk of the image format scan angle correction, go to the black and white edge, high compression ratio and document archiving, and emphatically introduces the algorithm of difficulties and solutions.
Key words: tilt correction; automatic clipping; adaptive threshold segmentation; high compression ratio
1 引言
在將紙質(zhì)文檔通過(guò)圖像掃描設(shè)備轉(zhuǎn)換為文本圖像并進(jìn)一步進(jìn)行歸檔的過(guò)程中,由于人為因素或機(jī)械設(shè)備誤差的影響,文檔圖像普遍存在圖像質(zhì)量不理想的狀況,一般包括圖像有黑邊或白邊、某種程度的傾斜、對(duì)比度較差等問(wèn)題;此外,要符合歸檔要求,圖像文件的壓縮格式和圖像大小也必須符合特定的要求。只有將圖像中存在的問(wèn)題進(jìn)行修正后再按要求歸檔,才有利于紙質(zhì)材料的統(tǒng)一保存和歸檔管理,以進(jìn)一步實(shí)現(xiàn)辦公自動(dòng)化的要求。
我們?cè)趻呙栉臋n時(shí),會(huì)遇到的人為因素中,通常包括紙張放置存在傾角或紙張放置不平整的情況,這些人為因素會(huì)導(dǎo)致圖像整體明暗不均或使掃描的圖像在邊緣處留有難看的黑邊,另外,紙張大小不恰當(dāng)也會(huì)使掃描的圖像在邊緣處有黑邊或灰邊。這些黑邊或灰邊與紙張的底色反差很大。
目前,絕大多數(shù)的掃描儀都帶有內(nèi)置的圖像處理模塊。掃描儀自帶的內(nèi)置圖像處理程序?qū)⒅攸c(diǎn)放在圖像清晰度的改善上,并不重視圖像的傾斜校正和黑邊等問(wèn)題,且對(duì)圖像最后的格式和壓縮比采用通用算法設(shè)計(jì),用戶只能通過(guò)菜單選擇圖像文件的保存格式,而無(wú)法決定圖像的壓縮比。這樣的內(nèi)置圖像處理模塊不但無(wú)法完全適應(yīng)辦公自動(dòng)化對(duì)圖像處理的需要,更無(wú)法進(jìn)行大批量圖像的批量化自動(dòng)處理,無(wú)法提高辦公效率。
目前,存在一些流行的掃描優(yōu)化軟件,即可以先將掃描圖像保存起來(lái),再安裝此類優(yōu)化軟件,對(duì)圖像進(jìn)行進(jìn)一步優(yōu)化。這一類的優(yōu)化軟件通??梢詫?duì)掃描圖像進(jìn)行基本的修正,如旋轉(zhuǎn)、黑邊補(bǔ)白、裁剪、改變文件格式等。但是,這些軟件中使用的優(yōu)化方法,都是利用手動(dòng)輸入?yún)?shù)的操作方法來(lái)實(shí)現(xiàn)的,這需要使用者先自行觀察圖像中存在的問(wèn)題,然后點(diǎn)擊相應(yīng)菜單并輸入自己估算的參數(shù)。例如,圖像旋轉(zhuǎn)校正的角度是由用戶手動(dòng)輸入的,如果發(fā)現(xiàn)結(jié)果不理想,再調(diào)整參數(shù)。這樣的逐張手動(dòng)處理的方法是無(wú)法實(shí)現(xiàn)掃描圖像的自動(dòng)化和批量化處理的。
目前,還存在少數(shù)第三方的硬件驅(qū)動(dòng)程序,可以直接優(yōu)化底片掃描的結(jié)果,但是多數(shù)沒(méi)有實(shí)現(xiàn)自動(dòng)批量處理。
本文在總結(jié)上述軟件優(yōu)缺點(diǎn)的基礎(chǔ)上,提出了一種新的紙質(zhì)材料掃描圖像自動(dòng)化批量處理流程。本文將處理過(guò)程分為二值化、傾角檢測(cè)、旋轉(zhuǎn)校正、去邊、壓縮等步驟,使每一步都能自動(dòng)執(zhí)行并能夠一次性處理批量圖像。在傾角檢測(cè)中,利用Radon變換,快速、準(zhǔn)確地計(jì)算出對(duì)應(yīng)的文本行的方向角,從而得到整個(gè)頁(yè)面的傾斜角。通常頁(yè)面傾斜旋轉(zhuǎn)校正采用旋轉(zhuǎn)變換的方法。
2 二值化
由于原始掃描結(jié)果圖像一般保存為JPG格式或PDF等格式,且默認(rèn)保存為真彩色圖像。首先應(yīng)該對(duì)掃描結(jié)果圖像進(jìn)行二值化處理,將其作為黑白圖像來(lái)處理,一方面是可以減少后面幾個(gè)計(jì)算步驟的數(shù)據(jù)量,另一方面也有利于后續(xù)算法的設(shè)計(jì)和實(shí)施。由于后續(xù)的裁剪和傾角檢測(cè)等操作對(duì)二值化要求并不高,經(jīng)過(guò)實(shí)驗(yàn)對(duì)比,常用的二值化方法,如Otsu法、全局閾值法等,都能滿足要求,且效果差別不大。在此,可任選一種即可。
3傾角檢測(cè)和旋轉(zhuǎn)校正
由于掃描儀的掃描頭是在特定背景下獲得的掃描結(jié)果圖像,掃描圖像經(jīng)過(guò)二值化后,背景部分有可能全部變黑。由于深色背景的影響,傳統(tǒng)的傾斜校正法,如Hough變換法、投影法都不能準(zhǔn)確地進(jìn)行傾角檢測(cè)。
本文的解決辦法是采用Radon變換來(lái)進(jìn)行傾角檢測(cè)。一條直線沿它的法線方向投影所得的投影最長(zhǎng),而沿與其平行方向投影則所得的投影最短,Radon變換理論就是這樣一種投影理論。用這種方法可以檢測(cè)圖像中的直線,例如紙張的邊緣可以形成直線,紙張中的表格中的線條可以形成直線,稿紙中的線條可以形成直線,通過(guò)這些直線,可以確定圖像的傾角大小,進(jìn)而逆向處理,即可對(duì)圖像實(shí)現(xiàn)旋轉(zhuǎn)校正。
文本圖像的傾斜校正可分解為傾角檢測(cè)和旋轉(zhuǎn)校正兩個(gè)問(wèn)題,但重點(diǎn)在于傾斜角的檢測(cè)。
目前最常用的傾斜角的檢測(cè)有基于Hough變換的方法、基于交叉相關(guān)性的方法、基于投影特征的方法、基于Fourier變換的方法、基于 K—最近鄰簇的方法等。
Radon變換與計(jì)算機(jī)視覺(jué)中的Hough變換很相似,我們可以利用Radon變換來(lái)檢測(cè)圖像中的直線的傾斜角度。利用Radon變換檢測(cè)直線傾斜角度的具體步驟為:
1) 用edge函數(shù)計(jì)算圖像的邊緣二值圖像,檢測(cè)出原始圖像中的直線;
2) 計(jì)算出邊緣圖像的Radon變換,再對(duì)每一個(gè)像素為1的點(diǎn)進(jìn)行運(yùn)算;
3) 檢測(cè)出Radon變換矩陣中的峰值,這些峰值對(duì)應(yīng)原始圖像中的直線。
Radon變換矩陣中的這些峰值的列坐標(biāo)就是與原始圖像中的直線垂直的直線的傾斜角度,所以圖像中直線的傾角為90°減去峰值的列坐標(biāo)。
得到頁(yè)面的傾角之后,便可對(duì)文本圖像進(jìn)行校正。一般的傾角校正算法都采用逆向旋轉(zhuǎn)的方法來(lái)實(shí)現(xiàn),運(yùn)算量通常較大。本文采用一種圖像快速高精度旋轉(zhuǎn)算法來(lái)簡(jiǎn)化旋轉(zhuǎn)過(guò)程。這種方法只需使用浮點(diǎn)運(yùn)算計(jì)算出第一行第一列像素點(diǎn)的逆向位置,其他像素點(diǎn)的定位可通過(guò)判別誤差項(xiàng)大小和位置增量來(lái)得到,完全消除了傳統(tǒng)方法中雙層循環(huán)內(nèi)大量浮點(diǎn)乘法運(yùn)算。因一般嵌入式平臺(tái)處理器的浮點(diǎn)運(yùn)算效率較低,該算法在計(jì)算逆向映射點(diǎn)位置時(shí)采用的增量定位思想,避免了旋轉(zhuǎn)過(guò)程中的大量浮點(diǎn)運(yùn)算,提高了圖像旋轉(zhuǎn)的效率。
4 去邊
旋轉(zhuǎn)校正后的圖像中,仍然沒(méi)有解決掉圖像有效部分之外的黑邊或白邊的問(wèn)題,本文的解決辦法是,鑒于我們對(duì)紙張區(qū)域以外的區(qū)域并不關(guān)心,經(jīng)旋轉(zhuǎn)后的紙張的上邊緣是基本水平的,所以,我們可以提取出紙張的有效部分,自然可以將紙張外圍的黑邊或白邊裁剪掉。
對(duì)于圖像子區(qū)的選擇問(wèn)題,目前還沒(méi)有非常有效的解決辦法。其中一種方法是,對(duì)于選取的子區(qū)根據(jù)其內(nèi)部的連通區(qū)特征來(lái)判斷是否為紙張所在的子區(qū),這種方法需要對(duì)整個(gè)紙張所在子區(qū)進(jìn)行連通域分析,耗時(shí)較多。另一種方法是,根據(jù)紙張子區(qū)的梯度圖統(tǒng)計(jì)分析來(lái)判定是否為紙張內(nèi)部子區(qū)。這種判定方法無(wú)法用數(shù)學(xué)公式準(zhǔn)確表達(dá),過(guò)多依靠經(jīng)驗(yàn)值來(lái)判定,準(zhǔn)確率較低。以上兩種方法均采用隨機(jī)策略來(lái)選擇子區(qū),最壞情況下需要遍歷整幅圖像才能找到合適子區(qū),并且隨機(jī)方法并不是全圖最優(yōu)的選取策略。
本文在總結(jié)上述算法的基礎(chǔ)上,提出了一種利用黑邊分布特征的新的子區(qū)提取方法,通過(guò)對(duì)圖像矩陣在四個(gè)方向上分別遍歷,在遍歷的過(guò)程中對(duì)圖像中出現(xiàn)的像素值進(jìn)行概率統(tǒng)計(jì),當(dāng)非黑邊像素值出現(xiàn)的概率達(dá)到一定比例時(shí),認(rèn)為已不屬于黑邊范圍,可以進(jìn)行裁剪的動(dòng)作。同理,對(duì)于白邊的處理也采用統(tǒng)計(jì)方法。
5 壓縮和歸檔
此時(shí),圖像經(jīng)過(guò)了二值化、旋轉(zhuǎn)校正、去黑邊等操作,且這些操作都不需要人為輸入?yún)?shù)或手動(dòng)操作,全部自行判斷執(zhí)行,圖像效果已基本達(dá)到要求。但是此時(shí)的圖像仍然是一個(gè)以JPG格式保存的、圖像尺寸較大的、數(shù)據(jù)量也較大的二值圖像,仍然不符合歸檔和長(zhǎng)期保存的要求。
歸檔和長(zhǎng)期保存時(shí),應(yīng)對(duì)圖像有統(tǒng)一的大小和壓縮格式的要求。首先,應(yīng)對(duì)圖像的大小進(jìn)行改變,即對(duì)圖像按照要求的尺寸進(jìn)行相應(yīng)比例的縮小,在縮小圖像的同時(shí),應(yīng)注意檢查圖像質(zhì)量的下降情況。其次,應(yīng)按照要求的格式對(duì)進(jìn)行壓縮。例如,本文中選擇TIFF格式作為圖像文件的最終保存格式,并且在TIFF的眾多壓縮協(xié)議中選擇第四組壓縮協(xié)議。
那么,以上的描述過(guò)程為對(duì)一張掃描結(jié)果圖像的優(yōu)化處理過(guò)程,在實(shí)際的辦公應(yīng)用中,通常會(huì)遇到批量掃描圖像需要優(yōu)化的情況。例如,對(duì)一本書(shū)進(jìn)行掃描,對(duì)一批報(bào)表進(jìn)行掃描等。那么,怎樣實(shí)現(xiàn)掃描圖像的批量化優(yōu)化處理呢?
這樣的情況下,我們通常會(huì)先將需要掃描的資料原件進(jìn)行手動(dòng)批量掃描,在計(jì)算機(jī)中會(huì)將生成的批量掃描圖像保存在特定的文件夾下。之后,工作人員可以對(duì)這些圖片進(jìn)行分類,并存放在某個(gè)特定的文件夾中,也可以在一個(gè)文件夾下建立多個(gè)子文件夾用于存放不同類別的圖像。
在優(yōu)化程序啟動(dòng)時(shí),首先彈出對(duì)話框,供用戶選擇要處理的批量掃描結(jié)果圖像所在的路徑,然后,程序會(huì)對(duì)該路徑下的各個(gè)文件夾依次進(jìn)行遞歸遍歷,在遍歷的過(guò)程中,對(duì)圖像依次優(yōu)化,直到遍歷到該文件夾的最內(nèi)層,不再有子文件夾時(shí)返回,繼續(xù)對(duì)下一個(gè)文件夾進(jìn)行遞歸優(yōu)化。在優(yōu)化的過(guò)程中,根據(jù)原先的掃描結(jié)果圖像保存的樹(shù)形目錄結(jié)構(gòu),建立相似的目錄結(jié)構(gòu),將優(yōu)化后的圖像保存在對(duì)應(yīng)的目錄中。這樣,優(yōu)化后的圖像的分類存放和優(yōu)化前的分布結(jié)構(gòu)是相同的,工作人員不需要再對(duì)優(yōu)化后的圖像進(jìn)行分類整理,且查找相應(yīng)圖片時(shí)會(huì)更加便捷。
6 結(jié)束語(yǔ)
本文最終能夠?qū)崿F(xiàn)批量掃描圖像的自動(dòng)閾值化處理、自動(dòng)旋轉(zhuǎn)校正和自動(dòng)剪取、壓縮等功能,最終的結(jié)果可以形成高壓縮比的TIFF圖像文件,還可以進(jìn)一步形成PDF文檔,實(shí)現(xiàn)電子化歸檔。
本文對(duì)圖文圖像的傾角檢測(cè)和旋轉(zhuǎn)校正進(jìn)行了討論和研究,提出了一種新的掃描圖像的傾角檢測(cè)方法和一種更加快捷簡(jiǎn)便的旋轉(zhuǎn)校正方法。大量實(shí)驗(yàn)結(jié)果表明,新的算法簡(jiǎn)單實(shí)用,計(jì)算時(shí)間短,具有較好的性能,同時(shí)對(duì)今后進(jìn)行掃描圖像的進(jìn)一步模式識(shí)別奠定了良好基礎(chǔ)。
Radon變換算法的抗噪性能較好,并具有較好的抗干擾性和尺度相關(guān)性,適合在有噪聲源的環(huán)境中使用,但Radon變換法在線段檢測(cè)中仍存在不足,有待改進(jìn)。
參考文獻(xiàn):
[1] 鄧白云.二維碼圖像傾斜校正中的算法研究綜述[J].工業(yè)控制計(jì)算機(jī),2016,29(2):77-78.
[2] 曾凡鋒.一種快速文本圖像傾斜校正方法[J].計(jì)算機(jī)應(yīng)用與軟件,2015,32(4):181-185.