童立靖 鄭俊朝
(北方工業(yè)大學(xué)計(jì)算機(jī)學(xué)院 北京 100144)
?
基于點(diǎn)云數(shù)據(jù)的扭曲文本圖像傾斜校正方法
童立靖鄭俊朝*
(北方工業(yè)大學(xué)計(jì)算機(jī)學(xué)院北京 100144)
摘要針對(duì)傳統(tǒng)二維層面的傾斜校正算法難以處理扭曲文本的傾斜,提出一種基于點(diǎn)云數(shù)據(jù)的扭曲文本圖像傾斜校正方法。首先,通過(guò)三維掃描儀采集文本的數(shù)據(jù)信息,重建文本的三維點(diǎn)云模型,接著通過(guò)檢測(cè)文本在空間中的位置,定義為空間傾斜與平面傾斜,最后實(shí)現(xiàn)文本的自動(dòng)傾斜校正。實(shí)驗(yàn)結(jié)果表明,基于點(diǎn)云數(shù)據(jù)的傾斜校正算法在處理扭曲文本的傾斜校正正確率達(dá)到95%以上。
關(guān)鍵詞點(diǎn)云數(shù)據(jù)扭曲文本傾斜檢測(cè)空間傾斜平面傾斜傾斜校正
0引言
隨著信息技術(shù)快速發(fā)展,信息化成為人們提高辦公效率、生活品質(zhì)的重要途徑。電子文檔具有保存方便,并易于在互聯(lián)網(wǎng)中傳輸?shù)忍攸c(diǎn),因此將紙質(zhì)文檔轉(zhuǎn)換為電子文檔的技術(shù)越來(lái)越重要。目前通過(guò)電子設(shè)備來(lái)進(jìn)行這種轉(zhuǎn)換的方法主要是通過(guò)攝像頭獲取文本資料數(shù)字圖像,經(jīng)過(guò)一系列的圖像預(yù)處理、OCR(光學(xué)字符識(shí)別)等將其轉(zhuǎn)化為電子文檔。而在這種轉(zhuǎn)換過(guò)程中,文本的傾斜會(huì)對(duì)整個(gè)轉(zhuǎn)化過(guò)程產(chǎn)生不利的影響,因此圖像的傾斜校正在圖像的預(yù)處理中始終占據(jù)一個(gè)非常重要的地位。實(shí)際采集文本數(shù)字圖像時(shí),若整個(gè)文本處于一個(gè)斜面上時(shí)或者拍攝角度不對(duì)而出現(xiàn)射影文本情況,導(dǎo)致采集的文本圖像出現(xiàn)像素的堆積,影響OCR識(shí)別率。同樣若文本為具有一定厚度的書(shū)籍時(shí),采集文本數(shù)字圖像時(shí)會(huì)由于書(shū)籍的厚度出現(xiàn)文本扭曲,無(wú)法直接進(jìn)行傾斜校正處理。
傳統(tǒng)的二維文本圖像傾斜校正算法主要分為以下幾類:基于Hough變換的方法、基于投影的方法、基于K-最近鄰方法以及基于Fourier變換方法。文獻(xiàn)[1,2]中基于Hough變換的方法使用圖像空間目標(biāo)像素的坐標(biāo)去計(jì)算參數(shù)空間中參考點(diǎn)的可能軌跡,是目前用得較多的一種傾斜角檢測(cè)方法,但對(duì)扭曲文本圖像因無(wú)法準(zhǔn)確提取文本線而出現(xiàn)難以處理的情況。文獻(xiàn)[3]以文字行之間存在一固定的行間距為基礎(chǔ)再使用基于投影的方法來(lái)確定傾斜角度,同樣無(wú)法處理扭曲文本。文獻(xiàn)[4]使用基于投影輪廓的方法來(lái)求得傾斜角度,之后對(duì)整幅圖片進(jìn)行等角度旋轉(zhuǎn),而非像素的旋轉(zhuǎn),經(jīng)此方法校正后的扭曲文本圖像很難再接著進(jìn)行扭曲恢復(fù)等處理,影響最終的OCR識(shí)別率。文獻(xiàn)[5]使用近鄰法則是找出所有中心點(diǎn)的K個(gè)最鄰近點(diǎn),計(jì)算每對(duì)近鄰的矢量方向并統(tǒng)計(jì)生成直方圖,直方圖的峰值對(duì)應(yīng)著整幅圖像的傾角,同樣對(duì)原始扭曲文本校正效果一般。文獻(xiàn)[6]基于Fourier變換方法則以Fourier空間密度最大的方向?qū)?yīng)于傾斜方向。雖然該方法傾斜校正較為精確,但由于空間復(fù)雜度很高, 計(jì)算的時(shí)間長(zhǎng), 因此在實(shí)際中使用較少。
由以上文獻(xiàn)可知,傳統(tǒng)的二維傾斜校正算法無(wú)法有效處理原始扭曲文本的傾斜。而本文將三維處理技術(shù)應(yīng)用于文本圖像傾斜校正領(lǐng)域,提出一種基于點(diǎn)云數(shù)據(jù)的扭曲文檔傾斜校正方法,能有效處理扭曲文本的傾斜狀況,并通過(guò)實(shí)驗(yàn)進(jìn)行了驗(yàn)證。
1算法思路
圖1 算法流程圖
若文本模型存在噪點(diǎn),會(huì)對(duì)后續(xù)的處理產(chǎn)生極大的影響,因此需要先對(duì)文本點(diǎn)云模型進(jìn)行去噪。去噪后將傾斜檢測(cè)分為兩步:空間傾斜檢測(cè)與平面傾斜檢測(cè)??臻g傾斜檢測(cè)通過(guò)提取模型邊界特征點(diǎn),采用魯棒方法求得文本模型邊界所在平面的法向量,最后通過(guò)與一平行于Z軸的單位向量之間的叉乘、內(nèi)積等計(jì)算出空間傾斜角,并進(jìn)行判斷,若傾斜則采用空間旋轉(zhuǎn)算法進(jìn)行旋轉(zhuǎn)校正。平面傾斜檢測(cè)時(shí),由于文本模型是扭曲、非平面的,因此先對(duì)文本模型進(jìn)行平面投影。接著提取投影的邊界特征點(diǎn),采用空間最小二乘法對(duì)其進(jìn)行空間線性擬合,計(jì)算出其平面傾斜角,進(jìn)行平面傾斜校正。圖1是本文的算法流程圖。
2點(diǎn)云去噪
在三維掃描儀獲取結(jié)構(gòu)光的投影并進(jìn)行處理的過(guò)程中,不可避免地會(huì)產(chǎn)生一些噪點(diǎn)數(shù)據(jù),這些噪點(diǎn)數(shù)據(jù)將會(huì)對(duì)后續(xù)的處理產(chǎn)生較大的干擾作用,因此必須先對(duì)其進(jìn)行點(diǎn)云去噪。由于三維掃描儀都有配套的處理軟件,可以對(duì)采集的模型數(shù)據(jù)進(jìn)行初步分割,去除那些不需要的部分。但有時(shí)個(gè)別單點(diǎn)或者微量點(diǎn)云會(huì)由于人眼無(wú)法觀察到而導(dǎo)致人工清除失敗,因此進(jìn)行去噪的主要目的就是去除那些遺漏的離群點(diǎn)。本文采用的方法是基于K-近鄰的散亂點(diǎn)云去噪算法。
2.1K-近鄰搜索
文本模型是由無(wú)數(shù)個(gè)孤立的點(diǎn)組成的,因此我們讀入到內(nèi)存中的數(shù)據(jù)點(diǎn)都是混亂的、無(wú)序的,這和傳統(tǒng)的BMP位圖有著顯著區(qū)別。所以在對(duì)模型進(jìn)行其他處理前,必須先將模型中的散亂點(diǎn)通過(guò)某種結(jié)構(gòu)關(guān)聯(lián)起來(lái),建立數(shù)據(jù)點(diǎn)之間的空間拓?fù)潢P(guān)系。本文采用K-近鄰結(jié)構(gòu)[7]。
目前最常用的K-近鄰計(jì)算方法有八叉樹(shù)法、 空間單元格法和K-d樹(shù)法。其中前兩種方法都是基于空間包圍盒的劃分, 后一種方法則用來(lái)查找相距最近的兩點(diǎn)。本文采用空間單元格法進(jìn)行K-近鄰計(jì)算。首先設(shè)P=Pi(i=0,1,…,n)是文本點(diǎn)云模型S上的一個(gè)采樣點(diǎn)集,將S中與當(dāng)前點(diǎn)Pi距離最近的k個(gè)數(shù)據(jù)點(diǎn)稱為點(diǎn)Pi的K-近鄰,記作Nb(p)。接著讀入文本模型數(shù)據(jù)點(diǎn)集,將整個(gè)點(diǎn)集的坐標(biāo)存入三個(gè)一維數(shù)組中,得到模型點(diǎn)集在X、Y、Z三個(gè)坐標(biāo)軸方向上的最大值與最小值,然后根據(jù)極值信息,k值及點(diǎn)的總數(shù)n,計(jì)算出子立方體邊長(zhǎng)L。同時(shí)將文本點(diǎn)云模型劃分成m′×n′×l′個(gè)子立方體,記錄每個(gè)子立方體所包含的數(shù)據(jù)點(diǎn)以及每個(gè)點(diǎn)所在的立方體索引號(hào),并刪去不包含任何點(diǎn)的子立方體。最后通過(guò)子立方體內(nèi)點(diǎn)的信息遍歷數(shù)據(jù)點(diǎn)進(jìn)行K-近鄰搜索。
定義三個(gè)方向上最小坐標(biāo)為: Min _x、Min _ y、Min _z;最大坐標(biāo)為: Max _ x、Max _ y、Max _ z,則式(1)文本點(diǎn)云模型的子立方體的長(zhǎng)度L:
(1)
其中β為調(diào)節(jié)立方體編程L大小的比例因子;n為數(shù)據(jù)點(diǎn)的總個(gè)數(shù);k為可調(diào)整的近鄰點(diǎn)的個(gè)數(shù)。那么由式(2)可以推導(dǎo)出子立方體在三個(gè)坐標(biāo)上的個(gè)數(shù):
(2)
同樣由式(3)可推導(dǎo)出當(dāng)前點(diǎn)P(x,y,z)在子立方體中三個(gè)坐標(biāo)方向的索引號(hào):
(3)
在此為每一個(gè)立方體子空間建立一鏈表。該表存儲(chǔ)每個(gè)子立方體內(nèi)的所有點(diǎn),并統(tǒng)計(jì)該子立方體內(nèi)點(diǎn)的個(gè)數(shù),其結(jié)構(gòu)如下:
typedefstructCubecell
{
LinkedListLink;
//子立方體內(nèi)數(shù)據(jù)點(diǎn)集表的頭指針
intn;
//子立方體中所含數(shù)據(jù)點(diǎn)的個(gè)數(shù)
}Cube;
求取當(dāng)前點(diǎn)的K個(gè)近鄰點(diǎn)的步驟為:
1) 根據(jù)當(dāng)前點(diǎn)的坐標(biāo)值,確定其所在子立方體的索引號(hào),同時(shí)將此子立方體視為初始搜索區(qū)域;
2) 計(jì)算當(dāng)前點(diǎn)到所在立方體六個(gè)面的最短距離ds;
3) 計(jì)算當(dāng)前搜索區(qū)域點(diǎn)的總個(gè)數(shù)N1,若N1不小于K,則接著計(jì)算當(dāng)前點(diǎn)與搜索區(qū)域內(nèi)其他點(diǎn)的最大距離dmax。若dmax小于ds,取前k個(gè)點(diǎn)為當(dāng)前點(diǎn)的K近鄰點(diǎn),否則以當(dāng)前區(qū)域?yàn)橹行南蛑車鷶U(kuò)展建立新的搜索區(qū)域;
4) 為每一個(gè)數(shù)據(jù)點(diǎn)建立一個(gè)k鄰近表。該表保存每個(gè)點(diǎn)的k個(gè)鄰近點(diǎn)以及它與鄰近點(diǎn)的距離,其結(jié)構(gòu)如下:
typedefstructKpoint
{
doublex,,y,z;
// 鄰近點(diǎn)的坐標(biāo)信息
doubledistance;
// 數(shù)據(jù)點(diǎn)與鄰近點(diǎn)之間的距離
structKpoint*next;
//下一個(gè)鄰近點(diǎn)
}Kpoint, *List;
2.2鄰域平均算法
建立好散亂點(diǎn)之間的空間拓?fù)潢P(guān)系之后,就可以使用二維圖像處理中的濾波算法對(duì)點(diǎn)云模型進(jìn)行去噪處理。遍歷模型搜索每個(gè)數(shù)據(jù)點(diǎn)的K-近鄰,采用鄰域平均法進(jìn)行去噪。 具體算法描述如下[8]:
1) 讀入三維文本模型點(diǎn)云數(shù)據(jù);
2) 建立散亂點(diǎn)云之間的空間拓?fù)潢P(guān)系;
3) 搜索當(dāng)前點(diǎn)Pi的K-近鄰Nb(p);
4) 計(jì)算當(dāng)前點(diǎn)Pj與其各K-近鄰點(diǎn)之間的距離,取其平均值Dmid(pi)可由式(4)求出:
(4)
5) 判斷該平均距離Dmid(pi) 是否大于設(shè)定的閾值D,若超過(guò),則認(rèn)為該點(diǎn)是噪點(diǎn),將其刪除;
6) 重復(fù) 3)~5),直到處理完所有的數(shù)據(jù)點(diǎn)。
3傾斜檢測(cè)
首先對(duì)文本模型可能發(fā)生的傾斜情況進(jìn)行分類,在此共分為三大類:空間單傾斜、平面單傾斜、空間平面雙傾斜。以圖2(a)所示圖像為例,文本點(diǎn)云模型在空間上存在傾斜,同時(shí)如圖2(b)所示,模型在平面上也存在傾斜,因此模型屬于空間平面雙傾斜類。圖中曲面部分為扭曲文本模型,平面部分為一垂直于Z軸的對(duì)照平面,用于觀察文本模型在空間中傾斜狀況。因此結(jié)合分類情況以及文本模型本身特點(diǎn),將對(duì)文本點(diǎn)云模型的傾斜檢測(cè)分為兩步:空間傾斜檢測(cè)與平面傾斜檢測(cè)。
圖2 傾斜檢測(cè)示意
3.1空間傾斜檢測(cè)
由于本文研究的文檔模型是扭曲的,也就是說(shuō)其所有的點(diǎn)并不落在同一個(gè)平面上。因此,需要先選擇某一斜切面為切入點(diǎn),通過(guò)它來(lái)研究完整文本模型的特征。結(jié)合實(shí)際情況,選擇文本模型左右邊界所在的平面為我們所需要的平面。確定平面后,采用曲面邊界提取算法采集模型的邊界特征點(diǎn)。
點(diǎn)云去噪階段已獲得當(dāng)前點(diǎn)p的K近鄰點(diǎn)集X={x0,x1,…,xk-1},設(shè)X的中心點(diǎn)v,可由式(5)計(jì)算[9,10]:
(5)
Ax+By+Cz+D=0
(6)
其中A=xp-xv,B=yp-yv,C=zp-zv,D可由式(7)計(jì)算:
(7)
圖3 模型邊界分析圖
得到模型的邊界特征點(diǎn)集之后,通過(guò)限制邊界點(diǎn)的X值與Y值得到模型左右邊界特征點(diǎn),如圖3所示。
通過(guò)魯棒的方法求得左右邊界所在平面的法向量[11]。由式(8)計(jì)算平面法向量m的分向量(mx,my,mz):
(8)
這里的N是特征點(diǎn)集中的頂點(diǎn)總數(shù),(xi,yi,zi)是第i個(gè)特征點(diǎn)的位置坐標(biāo),next(i)=(i+1)modN是點(diǎn)i的下一個(gè)頂點(diǎn)序號(hào)。取模運(yùn)算保證了第(N-1)號(hào)頂點(diǎn)的后一個(gè)頂點(diǎn)是頂點(diǎn)0。這種方法在計(jì)算法向量的每一個(gè)分量過(guò)程中,只需對(duì)每一條邊使用一次乘法運(yùn)算,而且不需要做共線測(cè)試。
得到m向量后先將其單位化,得一單位法向量m′。接著選取一平行于Z軸的單位向量n(0,0,1),并由式(9)計(jì)算向量m′與n的夾角:
(9)
計(jì)算出夾角后設(shè)一閾值D=0.5°,若夾角位于(-D,D)內(nèi),則認(rèn)為模型在空間中無(wú)傾斜,否則繼續(xù)對(duì)兩個(gè)向量進(jìn)行叉乘運(yùn)算,得到一新向量即空間旋轉(zhuǎn)所需要的轉(zhuǎn)軸,并使用空間旋轉(zhuǎn)算法對(duì)其進(jìn)行空間旋轉(zhuǎn)。
圖4(a)中曲面部分為原始模型,平面為一垂直于Z軸的對(duì)照平面,圖4(b)為空間校正后模型,黑色線條為上文中所提到的向量m′、n以及它們叉乘后得到的向量。
圖4 空間校正示意
3.2平面傾斜檢測(cè)
經(jīng)過(guò)空間傾斜檢測(cè)及校正,此時(shí)整個(gè)文本模型垂直于Z軸。先將文檔模型垂直投影到Z=0平面上,投影到此平面上后的模型Z坐標(biāo)值皆為0,可減少計(jì)算量,提高檢測(cè)精度。
投影后采集投影四條邊界的特征點(diǎn),使用基于最小二乘法的空間線性擬合算法,對(duì)模型的四條邊界進(jìn)行線性擬合,分別計(jì)算上下兩條直線與左右兩條直線的斜率,并判定兩對(duì)傾斜角的差值是否在一個(gè)范圍(-1°,1°)內(nèi)。結(jié)果可能存在三種情況:
1) 若每對(duì)傾斜角的差值都在范圍內(nèi),則對(duì)兩對(duì)邊界直線的傾斜角取兩輪平均值,這樣可以得到一個(gè)高精度的傾斜角;
2) 若其中一對(duì)差值在范圍內(nèi),另一對(duì)差值不在范圍內(nèi),則取差值在范圍內(nèi)的一對(duì)的平均值為傾斜角;
3) 若兩對(duì)邊界線斜率均不在,則提示模型不合格。
基于初期采集模型時(shí)已經(jīng)過(guò)選擇與處理,因此后兩種情況較少。
設(shè)空間內(nèi)方向向量為s=(m,n,p)且過(guò)(x0,y0,z0)點(diǎn)的直線方程由式(10)表示[12,13]:
(10)
當(dāng)點(diǎn)(xi,yi,zi) 不在直線上時(shí),分別記其在x方向、y方向、z方向的誤差為(εi2,εi2,εi3)。作為最佳擬合直線,必須同時(shí)考慮這三個(gè)方向的誤差。根據(jù)最佳平方逼近原理,最佳直線應(yīng)滿足式(11):
(11)
最小。因?yàn)楦鳒y(cè)量點(diǎn)在x方向、y方向、z方向的誤差(εi2,εi2,εi3)服從正態(tài)分布,所以最佳直線也應(yīng)滿足式(12):
(12)
據(jù)此我們?cè)诩s束條件式(11)式(12)下求由離散點(diǎn) (xi,yi,zi),i=1,2,…,N,所確定的最佳直線。
3.3空間旋轉(zhuǎn)算法
本文使用的是由薛文風(fēng)[14]提出的空間坐標(biāo)旋轉(zhuǎn)算法。設(shè)一個(gè)點(diǎn)通過(guò)軸(x0,y0,z0),其方向余弦為(nx,ny,nz)。其中θ為坐標(biāo)點(diǎn)(x,y,z)繞該軸的旋轉(zhuǎn)角度。則旋轉(zhuǎn)后的點(diǎn)經(jīng)式(13)計(jì)算:
x′ =(x-x0)[nx2(1-cosθ) + cosθ] +(y-y0)[nxny(1-cosθ)-nzsinθ]+ (z-z0)[nxnz(1-cosθ) +nysinθ] +x0y′ =(x-x0)[nxny(1-cosθ) +nzcosθ] +(y-y0)[ny2(1-cosθ)-cosθ]+ (z-z0)[nynz(1-cosθ)-nxsinθ] +y0z′ =(x-x0)[nxnz(1-cosθ)-nycosθ]+(y-y0)[nynz(1-cosθ)-nxcosθ]+(z-z0)[nz2(1-cosθ)-cosθ] +z0
(13)
當(dāng)(x0,y0,z0)=(0,0,0)時(shí),該軸通過(guò)原點(diǎn)繞任意軸旋轉(zhuǎn)的變換關(guān)系表達(dá)式比較長(zhǎng),而且需要浮點(diǎn)數(shù)來(lái)表示,所以在程序編寫(xiě)時(shí),最好在計(jì)算表達(dá)式之前先把sinθ和cosθ算出,以提高程序的執(zhí)行速度。值得注意的是,當(dāng)進(jìn)行空間檢測(cè)得到所需數(shù)據(jù)后,若存在傾斜需先進(jìn)行空間傾斜校正,以免干擾平面傾斜角的計(jì)算。
4實(shí)驗(yàn)結(jié)果
本算法在VisualStudio2005環(huán)境下采用C++語(yǔ)言實(shí)現(xiàn),測(cè)試環(huán)境為:Intel?CoreTM7cpu; 內(nèi)存 8GB;操作系統(tǒng)為Windows7的機(jī)器上進(jìn)行。本文先使用三維掃描儀對(duì)5本不同厚度的書(shū)籍共采集了50個(gè)書(shū)籍點(diǎn)云模型,其中空間域平面傾斜角皆在(-45°,45°)范圍內(nèi)。所用書(shū)籍均為16開(kāi)普通中文書(shū)。接著使用普通攝像頭采集了50幅BMP圖像,拍攝攝像頭像素為500萬(wàn),圖像的獲取均在光照均勻的環(huán)境下進(jìn)行,忽略噪聲的干擾。
表1將傳統(tǒng)的Hough變換法、投影法與本文方法對(duì)重度扭曲文本傾斜檢測(cè)精度進(jìn)行了對(duì)比分析。傳統(tǒng)的Hough變換法、投影法與K近鄰法總體檢測(cè)正確率都低于50%,而本文方法對(duì)三種情況的正確率都達(dá)到95%以上。此處的正確率是指經(jīng)傾斜校正后視覺(jué)上無(wú)傾斜的文本圖像個(gè)數(shù)與參加測(cè)試的樣本個(gè)數(shù)之比。由實(shí)驗(yàn)結(jié)果可知傳統(tǒng)的二維傾斜校正方法只能對(duì)扭曲程度較輕的文本進(jìn)行有效校正,對(duì)于厚度較大、扭曲程度較高的傾斜文本處理能力很差。而本文方法則具有很大的適用范圍,對(duì)于以上情況均有很高的校正正確率。
表1 原始扭曲文本總體校正正確率對(duì)比分析
用本文算法對(duì)選取模型進(jìn)行傾斜校正,部分實(shí)驗(yàn)效果對(duì)比圖如圖5-圖7所示。其中圖5為扭曲文本空間單傾斜對(duì)比圖,圖6為扭曲文本空間平面雙傾斜校正效果對(duì)比圖,圖7為非扭曲文本傾斜校正效果對(duì)比圖。
圖5 單傾斜對(duì)比
圖6 雙傾斜對(duì)比
圖7 校正效果對(duì)比
5結(jié)語(yǔ)
本文結(jié)合當(dāng)前快速發(fā)展的三維處理技術(shù),將三維點(diǎn)云處理技術(shù)應(yīng)用到文本圖像傾斜校正領(lǐng)域,克服了傳統(tǒng)二維傾斜校正方法對(duì)原始扭曲文本、射影文本傾斜校正效果不佳的缺點(diǎn)。提出的基于點(diǎn)云數(shù)據(jù)的扭曲文本傾斜校正方法,對(duì)于復(fù)雜文本如扭曲文本、射影文本可以直接進(jìn)行傾斜校正處理。經(jīng)試驗(yàn)表明,本文方法對(duì)于扭曲文本傾斜校正正確率能達(dá)到95%。本方法已試用于本實(shí)驗(yàn)室開(kāi)發(fā)的輔助閱讀器改進(jìn)項(xiàng)目,實(shí)現(xiàn)了對(duì)于市面上大部分不同厚度的書(shū)籍的自動(dòng)傾斜校正處理,擴(kuò)大了閱讀器使用范圍,提高了用戶操作容錯(cuò)率。
參考文獻(xiàn)
[1] 周冠瑋,平西建,程娟. 基于改進(jìn)Hough變換的文本圖像傾斜校正方法[J].計(jì)算機(jī)應(yīng)用,2007,27(7):52-57.
[2] 段汝嬌,趙偉,黃松嶺. 一種基于改進(jìn)Hough變換的直線快速檢測(cè)算法[J]. 儀器儀表學(xué)報(bào), 2012, 31(12):2774-2780.
[3] 張順利,李衛(wèi)斌,吉軍. 基于投影的文檔圖像傾斜校正方法[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(3): 166-168.
[4] 程立,姚為,李波. 基于投影輪廓的文本圖像傾斜檢測(cè)[J]. 中國(guó)圖象圖形學(xué)報(bào),2015,20(1):29-38.
[5]DeyP,NoushathS.Arobustskewdetectionmethodforscanneddocumentimages[J].PatternRecognition, 2010, 43(3):937-948.
[6]PSTLW.Detectionoflinearobliquestructureandskewscanindigitizeddocuments[C]//Proceedingsofthe8thInternationalConferenceonPatternRecognition.Paris,France:[s.n.],1986:687- 689.
[7] 謝方方,徐連誠(chéng),牛冰茹. 一種基于反向K近鄰的孤立點(diǎn)檢測(cè)改進(jìn)算法[J].計(jì)算機(jī)應(yīng)用與軟件,2014,31(6),267-270.
[8] 曹爽,岳建平,馬文. 基于特征選擇的雙邊濾波點(diǎn)云去噪算法[J]. 東南大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,43(S2):351-354.
[9] 陳義仁,王一賓,彭張節(jié),等.一種改進(jìn)的散亂點(diǎn)云邊界特征點(diǎn)提取算法[J]. 計(jì)算機(jī)工程與應(yīng)用,2012,48(23):177-180.
[10] 吳祿慎,晏海平,陳華偉,等. 一種基于散亂點(diǎn)云的邊界提取算法[J]. 計(jì)算機(jī)應(yīng)用與軟件,2014,31(11):264-268.
[11] 李寶,程志全,黨崗,等. 三維點(diǎn)云法向量估計(jì)綜述[J]. 計(jì)算機(jī)工程與應(yīng)用,2010,46(23):1-7.
[12] 姚宜斌,黃書(shū)華,孔建,等. 空間直線擬合的整體最小二乘算法[J]. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2014,39(5):571-574.
[13] 王繼剛,周立,蔣廷臣,等. 一種簡(jiǎn)單的加權(quán)整體最小二乘直線擬合方法[J].測(cè)繪通報(bào),2014(4):33-35.
[14] 薛文風(fēng). 三維空間坐標(biāo)的旋轉(zhuǎn)算法[J].電腦編程技巧與維護(hù),1995(6):59-60.
A TILT CORRECTION METHOD FOR DISTORTED TEXT ANDIMAGEBASEDONPOINTCLOUDDATA
Tong LijingZheng Junchao*
(College of Computer, North China University of Technology, Beijing 100144, China)
AbstractIn view of that traditional two-dimensional tilt correction algorithm is difficult to deal with the tilts of distorted text, we put forward a point cloud data-based tilt correction method for distortion text and image. First, it collects data information of text by a 3D scanner, and reconstructs the 3D point cloud model of text. Then according to the examined text position in space, it defines the tilt as either the space tilt or plane tilt. Finally it realises automatic tilt correction of the text. Experimental results show that the correction rate of tilt correction algorithm based on point cloud data reaches over 95% in dealing with the distorted text.
KeywordsPoint cloud dataDistorted textSkew detectionSpace tiltPlane tiltTilt correction
收稿日期:2015-06-10。國(guó)家自然科學(xué)基金項(xiàng)目(61371142);北京市教委專項(xiàng)(PXM2013_014212_000026)。童立靖,副教授,主研領(lǐng)域:圖像處理,智能控制,系統(tǒng)辨識(shí)等。鄭俊朝,碩士生。
中圖分類號(hào)TP3
文獻(xiàn)標(biāo)識(shí)碼A
DOI:10.3969/j.issn.1000-386x.2016.06.043