馬金定
【摘 要】特征在圖像處理中起著非常重要的作用。利用特征提取技術(shù)來提取圖像的特性,通過這些特征可以快速的對(duì)字符圖像進(jìn)行分類和識(shí)別。我們通過對(duì)不同類型的特征和特征提取技術(shù)分析,研究在不同的特征類型中哪些特征提取技術(shù)最適合的,整個(gè)分析研究以字符識(shí)別為基礎(chǔ)來進(jìn)行。
【關(guān)鍵詞】特征提??;字符識(shí)別;模式識(shí)別
特征是描述了一幅圖像中關(guān)于形狀的信息,通過對(duì)圖像的特征提取和處理,使得對(duì)圖像的分類很容易實(shí)現(xiàn)。在模式識(shí)別和圖像處理中,特征提取是一種特殊的降維處理,主要目的是從原始數(shù)據(jù)的低維度空間信息表達(dá)方式中獲得相關(guān)的信息。對(duì)數(shù)據(jù)處理算法來說,輸入數(shù)據(jù)處理時(shí)間太長(zhǎng),我們認(rèn)為是數(shù)據(jù)是冗余的,為了提高處理速度,將著輸入數(shù)據(jù)將轉(zhuǎn)化為精簡(jiǎn)的一系列特征表達(dá)方式(如特征向量),這個(gè)過程稱為特征提取。常用的特征提取方法有模板匹配、圖像轉(zhuǎn)換、圖形描述、直方圖、幾何不變矩、Zernike矩、樣條曲線逼近、傅里葉描述、梯度特征和Gabor特性[1]。文中以字符識(shí)別為基礎(chǔ)進(jìn)行特征與特征提取技術(shù)的研究。
1 特征提取
特征提取盡可能判別和獲得特征,而對(duì)于特征選擇,對(duì)原有的特征集的一個(gè)子集選擇,特征提取重要的一步是分類器的建設(shè),旨在提取每一類特征的相關(guān)信息,在這一過程中相關(guān)特征從對(duì)象、字母中提取出來構(gòu)成特征向量。然后使用這些特征向量分類器識(shí)別輸入單元和目標(biāo)輸出單位。特征提取的過程是從原始數(shù)據(jù)檢索最重要的數(shù)據(jù),找到特定的一系列參數(shù),這些參數(shù)對(duì)一個(gè)字符來書來說是精確描述并且是獨(dú)一無二的形狀特性的。在特征提取階段,字符是由特征向量表示。特征提取的主要目標(biāo)是提取一組特征,實(shí)現(xiàn)用最少的特征實(shí)現(xiàn)最大化的識(shí)別率和對(duì)各種各樣的相同的符號(hào)實(shí)例生成類似的特征集。
2 特征選擇
特征選擇的主要思想是:通過刪除弱或無預(yù)測(cè)信息的特征來選擇輸入變量的一個(gè)子集同時(shí)保持分類精度,約翰等人描述了強(qiáng)和弱相關(guān)特征的關(guān)聯(lián)性,強(qiáng)相關(guān)特征意味著在不損失分類精度情況下是不能被刪除。弱相關(guān)的特征意味著對(duì)分類精度影響不大[2]。
選擇最有意義的特性集合是在分類問題處理過程中的至關(guān)重要的一步,良好的特征集包含可以從其他對(duì)象區(qū)分出特定對(duì)象的識(shí)別信息。特征可分為局部特征和全局特征,局部特征通常是幾何特性(凹、凸部分,端點(diǎn)數(shù)量、分支、節(jié)點(diǎn)等)。全局特征,全局特征,通常拓?fù)涮匦裕ㄟB通性、投影特性等)或統(tǒng)計(jì)特性(不變矩等)。
筆跡識(shí)別包括宏觀和微觀兩個(gè)類型的筆跡特性。宏觀特性主要有:基于灰度值的宏觀特性(閾值,黑色像素),基于輪廓的宏觀特性(內(nèi)部和外部輪廓),基于斜率的宏觀特性(水平,積極的,垂直的),筆劃寬度、傾斜度和高度。字符的凹凸特性通過捕捉主要的拓?fù)浜蛶缀翁卣?。微觀特性發(fā)現(xiàn)不同的作家的筆跡,微觀特征有:縱橫比,終點(diǎn)數(shù),節(jié)點(diǎn)數(shù),形狀大小和圈數(shù),寬度和高度的分布,傾斜,形狀,平均曲率和梯度特征。
3 特征提取方法的研究
3.1 傅里葉描述
傅里葉變換廣泛應(yīng)用于形狀分析,傅里葉變換的系數(shù)構(gòu)成圖形的傅立葉描述,這些描述是在頻域中表示圖形的特征,描述符包含的低頻信息表示圖形的一般特征,而高頻率信息表示圖形細(xì)節(jié)部分。雖然傅里葉變換的系數(shù)的數(shù)目往往很大,但是該系數(shù)的一個(gè)子集足以捕捉圖形的整體特征。
假設(shè)一個(gè)特定圖形的邊界有K個(gè)像素,編號(hào)從0到K-1,沿著圖形輪廓的第K個(gè)像素的位置為(xk,yk)。因此,我們可以用兩參數(shù)方程來描述的圖形:
x(k)= xk,y(k)= yk,我們認(rèn)為,(x,y)的坐標(biāo)點(diǎn)不在直角坐標(biāo)系,而是在復(fù)平面,表達(dá)方式如下:
3.2 主成分分析(PCA)
主成分分析是一種數(shù)學(xué)方法,采用一個(gè)正交變換將一組可能相關(guān)的變量轉(zhuǎn)換為一組不相關(guān)變量,這些不相關(guān)的變量叫做主成分,他們是數(shù)據(jù)的中心X,計(jì)算的協(xié)方差矩陣C,獲得特征向量和協(xié)方差矩陣的特征值U,P,在特征空間的原始數(shù)據(jù)P=UT·X。
主成分個(gè)數(shù)小于或等于原始變量的數(shù)目,這種轉(zhuǎn)變的方式為,第一主成分盡可能多地具有較高的方差(也就是說,占據(jù)盡可能多的數(shù)據(jù)變化),主成分的數(shù)量小于或等于原始變量的數(shù)量。這種轉(zhuǎn)變中定義,第一主成分盡可能高方差(即占盡可能多的數(shù)據(jù)的變化),并且每一個(gè)成功的成分又有盡可能高的方差,在與前面計(jì)算出的數(shù)據(jù)正交(不相關(guān)的)的約束情況下,步驟計(jì)算出PCA變換的數(shù)據(jù)矩陣X。只有當(dāng)數(shù)據(jù)是滿足正態(tài)分布時(shí),主成分的保證是獨(dú)立的。
3.3 Gabor濾波器
在空間域和頻域中伽柏濾波器具有最佳的定位特性,依據(jù)給定的系數(shù)矩陣Gabor濾波器提出了一種多分辨率分析的方法[3],在這種方法中,用一個(gè)二維Gabor濾波器進(jìn)行特征提取。Gabor濾波器在空間域是正弦信號(hào)調(diào)制高斯函數(shù),在頻域中是高斯頻移。Gabor濾波器可表示為:
Gabor過濾器的性能通過調(diào)節(jié)參數(shù)?姿,?酌,和?茲來改變。x和y是圖像坐標(biāo)。?姿是余弦方程的波長(zhǎng),?酌是高斯函數(shù)形狀的特征,當(dāng)γ= 1時(shí),形狀是圓的。當(dāng)γ<1時(shí),形狀為橢圓形。?茲指定了Gabor函數(shù)并行條紋的方向,它的取值為0到360度。
3.4 扇形特征提取
扇形特征提取的識(shí)別率完全取決于從字符中提取特征的效率。這些特征可以是拓?fù)洌瑤缀魏徒Y(jié)構(gòu)(角度,距離)等等[4]。對(duì)于機(jī)打字符,這些字符的形狀變化不大,拓?fù)浜徒Y(jié)構(gòu)的特征提取效果很好。然而,對(duì)于手寫字體,由于寫作習(xí)慣的不同,同一個(gè)字符的形狀也不同,相應(yīng)的拓?fù)浜徒Y(jié)構(gòu)特性不適用于手寫字體的特征。
在扇形提取中,我們使用特征矩陣的中心作為固定點(diǎn),字符圖像尺寸統(tǒng)一變?yōu)?2×32像素,從圖像的中心選擇一個(gè)角把圖像分割成一個(gè)固定數(shù)量的扇區(qū)。字符“E”細(xì)分為12部分,如圖1所示。第一部分是從0度到30度;第二部分是從30到60度等等,每個(gè)部分用于特征提取。
3.5 距離和角度的特征提取
Nk表示在第K個(gè)子塊中的像素值為1的像素?cái)?shù)量,k=1,2,…,12,歸一化向量距離為每個(gè)字塊中的像素為1的數(shù)量和除以整個(gè)字符圖像中像素為1總數(shù)量,在字符圖像中(xi,yi)是字塊中像素為1的坐標(biāo),(xM,yN)是字符圖像的中心坐標(biāo)。
向量距離DK作為一組特征,角度AK作為另一組特征。從12個(gè)子塊中提取了距離向量和角度向量共24個(gè)特征,這些特征繪制出一個(gè)原字符的近似形狀如圖2所示。
3.6 Zernike矩
Zernike矩已被用于對(duì)二值化字符的識(shí)別,Zernike矩可以提取旋轉(zhuǎn)變化和旋轉(zhuǎn)不變特征,很明顯不變特征對(duì)灰度圖像是非常有用[5]。當(dāng)使用傅里葉描述符,矩不變量,或Zernike矩等這些技術(shù)時(shí),由于我們不使用高階項(xiàng),相應(yīng)的可以去除離散誤差和其它高頻噪聲。分區(qū)的方法采用低通濾波的方法,抗高頻噪聲干擾的能力很強(qiáng)。在單一的圖像變換,K-L變換是均方誤差意義下數(shù)據(jù)壓縮的最佳變換。然而,由于特征僅僅是輸入字符圖像像素的線性組合,我們不能指望他們能夠提取高層次特征,因此,一個(gè)大的特征訓(xùn)練數(shù)據(jù)集是必要的,同時(shí)特征與像素位置相對(duì)應(yīng),我們不能期望得到的類描述適用于參數(shù)統(tǒng)計(jì)分類器,然而,非參數(shù)的分類,如最近鄰分類器在K-L變換的特征方面表現(xiàn)出色。
4 結(jié)論
本文對(duì)字符的特征類別進(jìn)行了詳細(xì)分析,在此基礎(chǔ)上根據(jù)特征的類別找出相對(duì)應(yīng)的特征提取技術(shù),同時(shí)對(duì)已有的特征提取技術(shù)的優(yōu)缺點(diǎn)進(jìn)行了分析。字符的宏觀特征主要針對(duì)于字符的識(shí)別和分類,而對(duì)于筆跡識(shí)別更側(cè)重于微觀特征來識(shí)別。隨著字符圖像類型的復(fù)雜程度越來越高(如,灰度圖像,彩色圖像),特征提取技術(shù)的改進(jìn)和新的特征選取將快速提高處理速度和識(shí)別效率。
【參考文獻(xiàn)】
[1]王巖.離線手寫體漢字鑒別及其算法研究[M].河北工業(yè)大學(xué),2013.
[2]Khaled Mohammed bin Abdl,Siti Zaiton Mohd,Azad Kamilah Muda,“Feature Extraction and Selection forHandwriting Identification: A Review”,375-381[M].
[3]陳蓉,鄧洪波,金連文.一種基于局部Gabor濾波器組的手寫體漢字識(shí)別方法[J].計(jì)算機(jī)應(yīng)用,2007,27(5):1222-1224.
[4]曾子銘,韓中華,等.基于扇形特征和BP神經(jīng)網(wǎng)絡(luò)算法的字符識(shí)別[J].沈陽建筑大學(xué)學(xué)報(bào),2010,26(3):604-608.
[5]簡(jiǎn)麗瓊.基于Hu矩和Zernike矩的文字識(shí)別,科技信息[J].2009,17:460-461.
[責(zé)任編輯:鄧麗麗]