• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于Hough變換的手寫(xiě)體維文字符傾斜校正算法

      2013-02-21 07:52:58盧朝陽(yáng)
      關(guān)鍵詞:維文手寫(xiě)體小格

      姜 文,盧朝陽(yáng),李 靜

      (西安電子科技大學(xué) 通信工程學(xué)院,陜西 西安710071)

      近年來(lái),隨著科技的發(fā)展,手機(jī)的應(yīng)用范圍越來(lái)越廣泛,這就給手機(jī)終端上的手寫(xiě)輸入以及手寫(xiě)識(shí)別提供了很大的發(fā)展空間。目前,國(guó)內(nèi)手機(jī)上的中文手寫(xiě)輸入技術(shù)發(fā)展很迅速,國(guó)外關(guān)于英文、阿拉伯文等文字的手機(jī)終端手寫(xiě)輸入技術(shù)已經(jīng)發(fā)展得比較成熟了。我國(guó)新疆地區(qū)的少數(shù)民族文字——維吾爾族文字與阿拉伯文非常相似,可以借鑒阿拉伯文手機(jī)終端的手寫(xiě)輸入技術(shù)。不同的人有不同的書(shū)寫(xiě)風(fēng)格,造成手寫(xiě)體維吾爾文有很大的隨意性;而且受手機(jī)屏幕大小的限制,導(dǎo)致手機(jī)終端上手寫(xiě)的維文字符會(huì)產(chǎn)生一定的傾斜度。進(jìn)行聯(lián)機(jī)和脫機(jī)維文字符的特征提取和識(shí)別[1]之前都需要對(duì)手寫(xiě)體維文字符進(jìn)行傾斜校正。

      目前,比較常用的傾斜檢測(cè)方法有基于Hough變換的方法[2]、基于交叉相關(guān)性的方法、行間距跨度相關(guān)法[3]、基于 Fourier變換的方法[3]、基于投影的方法[3]和 K-最近鄰簇的方法等。

      本文基于Hough變換檢測(cè)字符傾斜角度,利用Hough變換對(duì)灰度化之后的傾斜字符提取字符的基線(xiàn),根據(jù)基線(xiàn)并結(jié)合維文字符的書(shū)寫(xiě)特點(diǎn),利用旋轉(zhuǎn)變換對(duì)手寫(xiě)體維文字符進(jìn)行傾斜校正。

      1 手寫(xiě)體維文字符的特征

      1.1 手寫(xiě)體維文字符的特征

      手寫(xiě)體維文字符具有如下獨(dú)特的特征[4]。

      (1)維吾爾文由32個(gè)基本字符組成,其中包括8個(gè)原音字符和24個(gè)輔音字符。

      (2)根據(jù)每一個(gè)字符出現(xiàn)的位置不同(詞首、詞中、詞末等),通??梢苑譃楠?dú)立、前連、前后連和后連4種書(shū)寫(xiě)形式,因此,維文字符有120多種書(shū)寫(xiě)形式。

      (3)維文字符書(shū)寫(xiě)時(shí)筆畫(huà)連續(xù)流暢,根據(jù)從右向左的方向書(shū)寫(xiě),主體筆劃方向特征明顯。

      (4)維文字符的筆劃較少,許多字符的主體筆劃相同,僅僅根據(jù)不同的附加筆劃來(lái)區(qū)分,附加部分與字符主體上、下不粘連。一般地,主體筆劃是沿著基線(xiàn)書(shū)寫(xiě)的,而附加筆劃在基線(xiàn)的上方或下方分布,所以基線(xiàn)可以作為區(qū)分附加筆畫(huà)位置的參考線(xiàn)。

      1.2 維文字符的分類(lèi)

      維文字符的120多種形式是以32個(gè)基本字符為基礎(chǔ)的,是根據(jù)字符處于詞的不同位置而變換出來(lái)的。對(duì)32個(gè)基本字符按照基線(xiàn)進(jìn)行分類(lèi),其中基線(xiàn)為垂直線(xiàn)的有9個(gè),基線(xiàn)為水平線(xiàn)的有22個(gè),其他1個(gè)。

      2 基于Hough的傾斜檢測(cè)算法

      2.1 Hough變換原理

      Hough變換的原理[2,4]是:利用圖像空間和 Hough參數(shù)空間的點(diǎn)-線(xiàn)對(duì)偶性,將圖像空間的檢測(cè)問(wèn)題轉(zhuǎn)換到參數(shù)空間。通過(guò)在參數(shù)空間里進(jìn)行簡(jiǎn)單的累加統(tǒng)計(jì),再根據(jù)概率最大原理得到圖像空間的一些特性,最后將數(shù)據(jù)映射回圖像空間。Hough變換檢測(cè)受干擾的影響較小,是一種快速的直線(xiàn)檢測(cè)方法。在實(shí)際應(yīng)用中,通常圖像平面上的一個(gè)點(diǎn)就對(duì)應(yīng)到參數(shù)r-θ平面上的一條曲線(xiàn)上。如圖1所示,直線(xiàn)與原點(diǎn)的法線(xiàn)距離為r,法線(xiàn)與x軸的夾角為θ,直線(xiàn)上的每個(gè)點(diǎn)都滿(mǎn)足:

      r=x×cosθ+y×sinθ (1)

      計(jì)算Hough變換的方法是將r-θ域量化成許多小格,如表 1所示。

      對(duì)于每一個(gè)點(diǎn) (x0,y0) 代入 θ的量化值,算出 r(經(jīng)量化)落在哪個(gè)小格內(nèi),便對(duì)該小格的計(jì)數(shù)累加器加 1。當(dāng)全部點(diǎn)(x,y)變換后,對(duì)小格進(jìn)行檢驗(yàn),計(jì)數(shù)較大的小格對(duì)應(yīng)共線(xiàn)點(diǎn),其(r,θ)可用作直線(xiàn)擬合參數(shù);計(jì)數(shù)較小的小格一般反映非共線(xiàn)點(diǎn),丟棄不用。

      表 1 r-θ量化表

      如果r和θ量化得太粗糙,則參數(shù)空間的凝聚效果差,找不到直線(xiàn)準(zhǔn)確的 r、θ值;相反,如果 r、θ量化得過(guò)細(xì),則計(jì)算量將增大,因此需兼顧這兩方面,取合適的量化值。

      2.2 手寫(xiě)體維文字符雙線(xiàn)傾斜檢測(cè)算法

      Hough變換在檢測(cè)過(guò)程中抗干擾性好,它利用圖像空間目標(biāo)像素的坐標(biāo)去計(jì)算參數(shù)空間中參考點(diǎn)的可能軌跡,是一種很好的直線(xiàn)提取方法。

      2.2.1 維文字符預(yù)處理

      進(jìn)行Hough變化之前還需要對(duì)字符圖像進(jìn)行預(yù)處理,包括灰度化和細(xì)化兩個(gè)過(guò)程。

      (1)對(duì)字符圖像進(jìn)行灰度化。將24色位圖格式的傾斜維文字符圖像轉(zhuǎn)換成256色的灰度圖像,并進(jìn)行去噪處理。

      (2)通過(guò)細(xì)化,對(duì)字符圖像進(jìn)行骨架提取。

      2.2.2 手寫(xiě)體維文字符雙線(xiàn)傾斜檢測(cè)算法

      算法過(guò)程如下:

      (1)初始化一塊內(nèi)存區(qū)域分配給(r,θ)變換域,存儲(chǔ)參數(shù)(r,θ)對(duì)應(yīng)的累加數(shù)據(jù),將 θ的取值范圍定為 0°~180°,定義 r的最大值的表達(dá)式為:(其中,lWidth、lHeight分別表示字符圖像的高度和寬度),分配 r×180×sizeof(int)字節(jié)的內(nèi)存區(qū)域作為 θ變換域。

      (2)對(duì)字符圖像中的所有點(diǎn)(i,j)進(jìn)行 Hough變換,將角度 θ取值范圍分為(0°,90°)和(91°,180°)兩個(gè)區(qū)間,當(dāng)θ 在 (0°,90°) 范圍時(shí),r=i×cos(θ×π/180°)+j×sin(θ×π/180°);而 θ在 (91°,180°)范圍 時(shí),r=i×cos((180°-θ)×π/180°)+(lHeight-j)×sin((180°-θ)×π/180°);然后將變換域中(r,θ)對(duì)應(yīng)的計(jì)數(shù)累加器加 1。

      (3)經(jīng)過(guò) Hough變換之后,在(r,θ)變換域中找出最大值,由最大值在變換域中的位置確定參數(shù)r和θ,其中θ就是檢測(cè)到的第一個(gè)傾斜角α。

      (4)完成第一個(gè)傾斜角度的提取之后,將(r,θ)變換域中最大值附近數(shù)值清零,繼續(xù)在(r,θ)變換域中尋找第二個(gè)最大值,提取第二個(gè)傾斜角β。

      (5)將角度α和β轉(zhuǎn)換為檢測(cè)出來(lái)的直線(xiàn)與水平線(xiàn)的夾角。

      把兩條檢測(cè)出來(lái)的直線(xiàn)繪制在字符圖像中,結(jié)果如圖2所示。

      2.3 維文字符的傾斜校正

      根據(jù)檢測(cè)出的傾斜角度α和β,對(duì)維文字符進(jìn)行旋轉(zhuǎn)變換,實(shí)現(xiàn)字符的傾斜校正。

      3 實(shí)驗(yàn)結(jié)果與分析

      實(shí)驗(yàn)利用Visual Studio 2008為平臺(tái)編寫(xiě)程序來(lái)實(shí)現(xiàn)基于Hough變換的維文字符的傾斜校正。大多數(shù)手寫(xiě)體字符的傾斜校正角度在[-45°,45°]之間,少數(shù)手寫(xiě)體字符的傾斜校正角度超出這個(gè)范圍。以水平基線(xiàn)或者垂直基線(xiàn)為軸進(jìn)行校正,校正結(jié)果與印刷體原圖的對(duì)比如圖 3、圖 4所示。

      一些字符使用基于水平或者垂直基線(xiàn)進(jìn)行校正之后,仍不能得到理想的效果。為了解決這一特殊情況,根據(jù)雙線(xiàn)檢測(cè)提取出兩個(gè)傾斜角度,可采用角平分線(xiàn)法,即將Hough變換檢測(cè)到的兩條直線(xiàn)的角平分線(xiàn)作為基線(xiàn)進(jìn)行傾斜校正。利用角平分線(xiàn)法進(jìn)行校正的結(jié)果如圖5、圖 6所示。

      可以看出,與單純使用水平基線(xiàn)或垂直基線(xiàn)作為旋轉(zhuǎn)軸相比,使用角平分線(xiàn)法對(duì)傾斜維文字符進(jìn)行校正,傾斜度有了明顯的改善。

      對(duì)480幅傾斜手寫(xiě)體圖像進(jìn)行字符校正,結(jié)果如表2和表3所示,其中表3根據(jù)基線(xiàn)的檢測(cè)次序分類(lèi),表3根據(jù)基線(xiàn)的方向分類(lèi)。

      本文根據(jù)維文字符的書(shū)寫(xiě)特點(diǎn)和字符基線(xiàn)位置的不同對(duì)字符進(jìn)行分類(lèi);對(duì)經(jīng)過(guò)預(yù)處理的維文手寫(xiě)體字符采用基于Hough變換的雙線(xiàn)傾斜校正算法提取傾斜角度。用該算法校正了480幅不同的手寫(xiě)體維文字符,得到了滿(mǎn)意的效果。國(guó)內(nèi)外均有文獻(xiàn)研究手寫(xiě)體數(shù)字的傾斜校正[5],本文算法也可用于手寫(xiě)體數(shù)字的傾斜校正。此外,該算法也可用于處于傾斜狀態(tài)的印刷體維文字符和印刷體數(shù)字的傾斜校正。

      表2 根據(jù)基線(xiàn)的檢測(cè)次序分類(lèi)

      表3 根據(jù)基線(xiàn)的方向分類(lèi)

      [1]任宏宇,袁保社,田園.基于BP神經(jīng)網(wǎng)絡(luò)的維吾爾聯(lián)機(jī)手寫(xiě)字符識(shí)別[J].微電子學(xué)與計(jì)算機(jī),2010,27(8):238-241.

      [2]MAHMOUD A,SHATNAWI A,OMAR K.Skew detection and correction technique for arabic document images based on centre of gravity[J].Journal of Computer Science,2009,21(3):363-368.

      [3]李政,楊揚(yáng),頡斌,等.一種基于 Hough變換的文檔圖像傾斜糾正方法[J].計(jì)算機(jī)應(yīng)用,2005,25(3):583-585.

      [4]萬(wàn)芳.聯(lián)機(jī)手寫(xiě)維吾爾文字識(shí)別技術(shù)的研究與實(shí)現(xiàn)[D].烏魯木齊:新疆大學(xué),2007.

      [5]王有偉,劉捷.手寫(xiě)體數(shù)字識(shí)別中的一種新的傾斜校正的 方 法[J].計(jì) 算 機(jī) 工 程 ,2004,30(11):128-130.

      猜你喜歡
      維文手寫(xiě)體小格
      哐當(dāng)(外一首)
      哐當(dāng)(外一首)
      石維文
      基于大數(shù)據(jù)下的手寫(xiě)體識(shí)別的設(shè)計(jì)與研發(fā)
      披著書(shū)法外衣的手寫(xiě)體
      互聯(lián)網(wǎng)上的維語(yǔ)多文轉(zhuǎn)換機(jī)制的設(shè)計(jì)與實(shí)現(xiàn)
      林小格,下一站春暖花開(kāi)
      察合臺(tái)維文文獻(xiàn)《伊米德史》研究概況
      安小格的夏天
      在籬笆外奔跑
      平罗县| 黑水县| 关岭| 新建县| 淮南市| 政和县| 郧西县| 鄂州市| 噶尔县| 巴马| 镶黄旗| 定边县| 婺源县| 崇义县| 北宁市| 赤城县| 随州市| 赤水市| 平江县| 上饶县| 沁水县| 日喀则市| 屯昌县| 玉田县| 通海县| 浠水县| 曲沃县| 酒泉市| 竹溪县| 黄骅市| 江华| 东明县| 肃南| 鹤山市| 高碑店市| 常德市| 龙川县| 乌海市| 百色市| 阳原县| 图木舒克市|