周 迪,夏哲雷
(中國計(jì)量大學(xué) 信息工程學(xué)院,浙江 杭州 310018)
?
LabVIEW平臺(tái)的文本圖像傾斜校正方法
周迪,夏哲雷
(中國計(jì)量大學(xué) 信息工程學(xué)院,浙江 杭州 310018)
【摘要】文本圖像掃描過程中會(huì)出現(xiàn)傾斜的情況,這給后期的圖像處理和分析帶來了困難,因此對(duì)文本圖像進(jìn)行檢測(cè)和傾斜校正具有十分重要的意義.為解決這個(gè)問題,提出了一種基于文本圖像邊緣特征的方法,通過提取文本圖像邊緣的像素點(diǎn),利用最小二乘法對(duì)這些像素點(diǎn)進(jìn)行直線擬合,從而計(jì)算得到傾斜角.在LabVIEW平臺(tái)上,利用LabVIEW視覺庫IMAQ中強(qiáng)大的圖像處理函數(shù),實(shí)現(xiàn)傾斜角度檢測(cè)方法,進(jìn)而通過旋轉(zhuǎn)變換對(duì)傾斜的圖像進(jìn)行校正.結(jié)果表明,該方法對(duì)圖像校正的效果較好,并且能夠快速實(shí)現(xiàn).
【關(guān)鍵詞】文本圖像;傾斜校正;最小二乘法;直線擬合;LabVIEW視覺庫
由于一些因素導(dǎo)致文本圖像采集時(shí)存在一定角度傾斜,這會(huì)影響后續(xù)的圖像分析、圖像理解等,因此研究圖像的傾斜校正有十分重要的意義.圖像傾斜校正的關(guān)鍵在于檢測(cè)出圖像的傾斜角度.現(xiàn)有的傾斜角度估計(jì)方法主要有5類:基于Hough[1]變換的方法,基于交叉相關(guān)性的方法,基于投影[2-3]的方法,基于Fourier[4]變換的方法和K-最近鄰族方法[5].近年來有關(guān)研究人員提出一些基于圖像內(nèi)容特征的檢測(cè)方法.文獻(xiàn)[6]提出通過一次旋轉(zhuǎn)來得到一條直線上的2個(gè)點(diǎn),2個(gè)點(diǎn)可以確定這條邊,通過這條邊來得到圖像的傾角.文獻(xiàn)[7]利用圖像的紋理特征對(duì)投影窗口內(nèi)圖形進(jìn)行水平投影分析,自適應(yīng)地篩選出只含有文字的文本子區(qū),從而進(jìn)行檢測(cè).文獻(xiàn)[8]通過提取表格的水平線和垂直線或文字行從而得到傾斜角進(jìn)行校正.但是,在實(shí)際應(yīng)用時(shí),Hough變換法、投影法等一些改進(jìn)方法的計(jì)算量較大,不能夠快速的實(shí)現(xiàn)傾斜校正.
本文在總結(jié)上述算法的基礎(chǔ)上,提出一種新的方法.利用文本圖像邊緣為直線的特點(diǎn),對(duì)圖像邊緣的像素點(diǎn)進(jìn)行操作,得到一些邊界特征點(diǎn)的坐標(biāo)值,利用最小二乘法將這些特征點(diǎn)進(jìn)行直線擬合,從而根據(jù)直線的斜率計(jì)算得到傾斜角度,并通過實(shí)驗(yàn)進(jìn)行驗(yàn)證,能夠快速進(jìn)行傾斜校正.
1傾斜角檢測(cè)算法
1.1算法思想
在文檔圖像中,文字排版是有特征的,文字排列的特征是每行的行頭都是對(duì)齊的,即左邊界都是對(duì)齊的,這樣就會(huì)在左邊緣形成一條基線.當(dāng)圖像發(fā)生傾斜時(shí),這些基線隨之也發(fā)生傾斜,因此對(duì)于一副傾斜的圖像,找出邊緣像素點(diǎn)連成的基線,基線的方向角大小即對(duì)應(yīng)圖像的傾斜角大?。疚膶⑦吘壪袼攸c(diǎn)稱為特征點(diǎn),通過像素遍歷的方法,找出這些特征點(diǎn),并將坐標(biāo)值存儲(chǔ)在數(shù)組中.通過最小二乘法直線擬合,將這些數(shù)組中的數(shù)據(jù)擬合成直線,得到直線的斜率后,再反換算出角度,最后根據(jù)得到的傾斜角度對(duì)圖像進(jìn)行校正.因此特征點(diǎn)集的確定是本算法的關(guān)鍵.圖1為存在傾斜的文本圖像示意圖.
圖1 傾斜的文本圖像Figure 1 Tilted document image
1.2特征點(diǎn)集的確定
設(shè)文檔圖像為M×N個(gè)像素點(diǎn)組成,M為圖像的寬度,N為圖像的高度.對(duì)圖像進(jìn)行二值化后,圖像中像素點(diǎn)的值只有0和255兩種.對(duì)二值圖像逐列從0~M-1列遍歷像素,對(duì)每一列的像素從0~N-1遍歷,直至遍歷得到第一個(gè)像素值不為0的點(diǎn),如圖1中A點(diǎn)所示,此時(shí)的列即為A點(diǎn)的X坐標(biāo)值,A點(diǎn)在這一列的位置即為Y坐標(biāo)值.對(duì)二值圖像逐行從0~N-1遍歷像素,對(duì)每一行從0~M-1遍歷像素,直至遍歷到第一個(gè)像素值不為0的點(diǎn),如圖1中B點(diǎn)所示,此時(shí)的行即為B點(diǎn)的Y坐標(biāo)值,B點(diǎn)在這一列的位置即為X坐標(biāo)值.在A點(diǎn)與B點(diǎn)之間,逐列遍歷出第一個(gè)像素值不為0的點(diǎn),即為左邊緣上的特征點(diǎn),如圖1中的E、F點(diǎn)等,記錄下這些點(diǎn)的坐標(biāo)值,這樣就確定了特征點(diǎn)集.圖1顯示的是圖像右傾斜的情況,對(duì)于圖像左傾斜的情況特征點(diǎn)確定的方法與右傾斜相同.
1.3特征點(diǎn)直線擬合
將最小二乘法應(yīng)用到直線擬合中,設(shè)所求的直線方程為:y=a+bx,將前面所得到的特征點(diǎn)集中的特征點(diǎn)坐標(biāo)作為樣本,設(shè)特征點(diǎn)集中有N個(gè)特征點(diǎn),即(x1,y1),(x2,y2),(x3,y3),…,(xN,yN),則估計(jì)值與樣本的偏差為
δi=yi-a-bxi,i=1,2,…N.
(1)
根據(jù)最小二乘法原理,目標(biāo)是將估計(jì)值與樣本的偏差的平方和為最小,即
(2)
當(dāng)適當(dāng)?shù)腶和b使f(a,b)為最小值時(shí),此時(shí)的直線方程y=a+bx即是最佳的,對(duì)函數(shù)f(a,b)分別對(duì)a和b求偏導(dǎo)數(shù).
(3)
解式(3)的方程組得到
(4)
經(jīng)過上述計(jì)算得到擬合的直線方程y=a+bx,b即為直線的斜率,則傾斜角θ為
θ=90°-|arctanb|.
(5)
當(dāng)θ≥0時(shí),表明圖像是右傾斜,當(dāng)θ<0時(shí),表明圖像是左傾斜.
1.4傾斜校正
根據(jù)計(jì)算得到的傾斜角θ.對(duì)圖像進(jìn)行傾斜校正,校正方法采用簡(jiǎn)單的旋轉(zhuǎn)變換.即
(6)
2傾斜校正在LabVIEW中實(shí)現(xiàn)
傾斜校正在LabVIEW編程[9]環(huán)境下設(shè)計(jì)實(shí)現(xiàn).LabVIEW視覺庫是一種應(yīng)用十分廣泛的函數(shù)庫,應(yīng)用如自動(dòng)測(cè)量系統(tǒng)[10]和視覺檢測(cè),等等.本文程序主要分為圖像預(yù)處理模塊,特征點(diǎn)提取與傾角檢測(cè)模塊,傾斜校正模塊.
2.1圖像預(yù)處理
2.1.1圖像灰度化
通過采集得到的一副文檔圖像是彩色的,這樣不利于利用圖像處理算法對(duì)圖像進(jìn)行處理.本文采用基于LabVIEW IMAQ函數(shù)庫中的IMAQ Extract Single Color Plane函數(shù)來對(duì)圖像進(jìn)行灰度化.通過從彩色圖像中抽取單個(gè)顏色板來作為灰度圖像的灰度.本文中抽取綠色來作為圖像的灰度.
2.1.2圖像重采樣
一般的圖像采集到的圖像分辨率較高,這樣會(huì)影響處理的速度,利用重采樣技術(shù)降低圖像的分辨率.LabVIEW IMAQ中的函數(shù)Resample是對(duì)圖像進(jìn)行重采樣的函數(shù),本文將圖像的分辨率重采樣為200×200,采用的算法為雙線性插值算法.雙線性插值算法參考了源像素相應(yīng)位置周圍4個(gè)點(diǎn)的值,根據(jù)相對(duì)位置取相應(yīng)的權(quán)重,從而得到目標(biāo)圖像.
2.1.3圖像增強(qiáng)與閾值分割
圖像增強(qiáng)是圖像處理的一個(gè)重要過程,通過改變灰度圖像的亮度值,對(duì)比度以及Gamma校正來改善圖像,Gamma校正是擴(kuò)大高灰度級(jí)范圍,同時(shí)壓縮低灰度級(jí)范圍.二值圖像能夠?qū)D像的背景與前景分割開,更進(jìn)一步提取圖像的有效信息.文檔圖像一般為背景不復(fù)雜圖像,通過一般的閾值分割方法即可將前景與背景分割開.本文通過IMAQ Auto Threshold函數(shù)中的聚類方法來實(shí)現(xiàn)分割.
2.1.4形態(tài)學(xué)處理
二值圖像中會(huì)有一些小的顆粒像素,會(huì)對(duì)后續(xù)的特征點(diǎn)提取帶來誤差,通過形態(tài)學(xué)的開運(yùn)算,即先腐蝕再膨脹,這樣可以去掉目標(biāo)外孤立的像素點(diǎn),然后通過膨脹二值化圖像得到目標(biāo)的輪廓.如圖2,圖2(a)為原始文本圖像,圖2(b)為經(jīng)過預(yù)處理后的圖像.
圖2 預(yù)處理前后的圖像Figure 2 Images before and after the pretreatment
2.2特征點(diǎn)提取與傾角檢測(cè)
特征點(diǎn)的確定方法在前面已經(jīng)敘述,現(xiàn)在通過LabVIEW平臺(tái)來實(shí)現(xiàn).根據(jù)得到的特征點(diǎn)最左邊點(diǎn)開始逐列遍歷像素,利用IMAQ Get RowCol函數(shù)可以得到一列或一行像素值,通過兩個(gè)for循環(huán),外層的for循環(huán)從最左邊像素點(diǎn)A的列數(shù)開始到200逐列遍歷像素,內(nèi)層的for循環(huán)在某一列中,將一列的像素值逐個(gè)讀取,直到得到第一個(gè)像素值不為0的像素點(diǎn),通過LabVIEW for循環(huán)的索引功能,將兩層for循環(huán)得到不為0的像素點(diǎn)的i值索引出來,即為這個(gè)點(diǎn)的坐標(biāo)值.特征點(diǎn)提取程序如圖3.
圖3 特征點(diǎn)提取程序框圖 Figure 3 Block diagram of feature point extraction procedure
將得到坐標(biāo)值寫入LabVIEW線性擬合IMAQ Line Fit函數(shù)中,擬合方法為最小二乘法,擬合直線的直線方程為y=a+bx.根據(jù)式(5)得到傾斜角度θ.圖4是線性擬合和傾角計(jì)算在LabVIEW中實(shí)現(xiàn).
圖4 線性擬合和傾斜角計(jì)算程序框圖Figure 4 Block diagram of linear fitting and tilt Angle calculation procedure
2.3傾斜校正
通過IMAQ Rotate函數(shù)可以對(duì)圖像進(jìn)行旋轉(zhuǎn).旋轉(zhuǎn)方法采用式(6)的旋轉(zhuǎn)變換.其中(x,y)為旋轉(zhuǎn)前像素坐標(biāo),(x′,y′)為旋轉(zhuǎn)后像素坐標(biāo).圖5是基于LabVIEW的校正界面.
3實(shí)驗(yàn)結(jié)果與分析
對(duì)測(cè)試圖片進(jìn)行重采樣,實(shí)驗(yàn)軟件平臺(tái)為L(zhǎng)abVIEW,PC機(jī)主要配置為:DDR3 4G內(nèi)存,CPU為3.7 GHz.圖像分辨率為200×200,對(duì)圖像從-5°到5°之間,每隔1°取樣本,10張圖像共有100個(gè)傾斜樣本圖像,檢測(cè)到角度見表1.
由表1可以看出,本文方法檢測(cè)角度的最小絕對(duì)誤差為0.1°,最大絕對(duì)誤差為0.3°,平均誤差為0.27°,均在0.5°以內(nèi),對(duì)后續(xù)的處理影響不大.實(shí)驗(yàn)表明本文方法檢測(cè)角度具有較好的精度.將本文方法與傳統(tǒng)Hough及投影法的精度和運(yùn)算時(shí)間進(jìn)行比較,具體見表2.
表1 檢測(cè)傾斜角
表2 三種方法檢測(cè)對(duì)比
由表2可知,傳統(tǒng)的Hough和投影法的檢測(cè)精度與本文方法相當(dāng),但Hough變換法和投影法的平均處理時(shí)間分別為2.16 s和1.53 s,而本文方法的處理時(shí)間僅為0.033 s,與兩種方法相比運(yùn)算時(shí)間大大減少,可使算法能夠快速實(shí)現(xiàn).校正結(jié)果如圖6,其中圖6(a)、(b)是存在傾斜的文本圖像,圖6(c)、(d)是本文方法校正后的圖像.
圖6 傾斜校正結(jié)果Figure 6 Results of tilt correction
4結(jié)語
提出了一種文本圖像傾斜校正方法,該方法利用文本圖像文字排版邊緣為直線的特點(diǎn),通過像素遍歷的方法,得到邊緣直線上的像素點(diǎn)坐標(biāo),將這些像素點(diǎn)通過最小二乘法進(jìn)行直線擬合,根據(jù)擬合直線的斜率計(jì)算出傾斜角.最后,結(jié)合LabVIEW平臺(tái),快速實(shí)現(xiàn)該方法.結(jié)果表明,該方法較Hough變換法和投影法,能夠快速實(shí)現(xiàn)文本圖像傾斜校正,且效果良好.
【參考文獻(xiàn)】
[1]李政,楊揚(yáng),頡斌,等.一種基于Hough變換的文檔圖像傾斜糾正方法[J].計(jì)算機(jī)應(yīng)用,2005,25(3):583-585.
LI Zheng,YANG Yang,XIE Bin,et al. Skew angle detection and correction of document images based on hough transform[J]. Computer Applications,2005,25(3):83-585.
[2]GATOS B, PAPERMARKOS N, CHAMZAS C. Skew detection and text line position detection in digitized documents[J]. Pattern Recognition,1997,30(9):1505-1519.
[3]張順利,李衛(wèi)斌,吉軍.基于投影的文檔圖像傾斜校正方法[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(3):166-168.
ZHANG Shunli,LI Weibin,JI Jun.Skew correction method for document image based on projection[J]. Computer Engineering and Applications,2010,46(3):166-168.
[4]PSTL W. Detection of linear oblique structure and skew scan in digitized documents[C] ∥Proceedings of the 8th International Conference on Pattern Recognition. Pairs,France:[s..n.],1986:487-489.
[5]GOMAN L O. The document spectrum for page layout analysis[J]. IEEE Transaction on PAMI,1993,15(11):1162-1173.
[6]李慶峰,付忠良,劉琴.一種高效的傾斜圖像校正方法[J].計(jì)算機(jī)工程,2006,32(21):194-196.
LI Qingfeng,FU Zhongliang,LIU Qin.An effective skewimage correction method[J]. Computer Engineer,2006,32(21):194-196.
[7]曾凡峰,吳飛飛,肖珂,等.一種快速文本圖像傾斜校正方法[J].計(jì)算機(jī)應(yīng)用與軟件,2015,32(4):181-185.
ZENG Fanfeng,WU Feifei,XIAO Ke,et al. A fast correction method for text image tilt[J].Computer Applications and Software,2015,32(4):181-185.
[8]呂亞軍,陳繼榮,鹿曉亮.基于內(nèi)容的文檔圖像傾斜校正方法[J].計(jì)算機(jī)仿真,2006,23(12):192-196.
LYU Yajun,CHEN Jirong,LU Xiaoliang.Content based document image skew adjusting[J].Computer Simulation,2006,32(4):181-185.
[9]楊樂平,李海濤,肖相生.LabVIEW程序設(shè)計(jì)與應(yīng)用[M].北京:電子工業(yè)出版社,2001:340-381.
[10]陳挺,毛振華,周聞青,等.Labview平臺(tái)的平面螺紋測(cè)量系統(tǒng)研制[J].中國計(jì)量學(xué)院學(xué)報(bào),2015,26(2):145-150.
CHEN Ting, MAO Zhenhua, ZHOU Wenqing,et al. Development of mersureing system for plane thread based on LabVIEW platform[J]. Journal of China University of Metrology,2015,26(2):145-150.
【文章編號(hào)】1004-1540(2016)02-0234-05
DOI:10.3969/j.issn.1004-1540.2016.02.019
【收稿日期】2016-04-15《中國計(jì)量學(xué)院學(xué)報(bào)》網(wǎng)址:zgjl.cbpt.cnki.net
【基金項(xiàng)目】浙江省自然科學(xué)基金資助項(xiàng)目(No.LY12F01011).
【作者簡(jiǎn)介】周迪(1991-),男,江蘇省高郵人,碩士研究生,主要研究方向?yàn)閿?shù)字圖像處理.E-mail: 1226114690@qq.com 通信聯(lián)系人:夏哲雷,男,教授.E-mail: xia663618@163.com
【中圖分類號(hào)】TP391
【文獻(xiàn)標(biāo)志碼】A
A text image horizontal tilt correction method for LabVIEW
ZHOU Di, XIA Zhelei
(College of Information Engineering, China Jiliang University, Hangzhou 310018, China)
Abstract:We proposed a method based on the text image edge character to solve the problem of angle inclination in the image processing system. The inclination angle was calculated by using the least square method for linear fitting these pixels after the extraction of the text image edge pixels. By using the image processing function in the LabVIEW IMAQ, the angle detection method was carried out. The tilt image was corrected through rotation transformation. Results show that the image correction effect of this method is satisfactory.
Key words:text image; tilt correction; least square; line fitting; LabVIEW IMAQ