余 彪 ,萬(wàn)水龍,劉 進(jìn) ,王強(qiáng)德
(1.中國(guó)人民解放軍92493部隊(duì),遼寧 葫蘆島 125000;2.中國(guó)人民解放軍91960部隊(duì),廣東 汕頭 515074;3.南京航空航天大學(xué),江蘇 南京 210016)
分類識(shí)別是印章圖像處理的最終目的,分類的準(zhǔn)確與否、識(shí)別率的高低是其中的重要評(píng)判標(biāo)準(zhǔn)[1]。只有提取到印章圖像的關(guān)鍵特征,才有可能改進(jìn)分類的準(zhǔn)確度,而識(shí)別率的提高就要求選擇一款性能良好的分類器。矩函數(shù)對(duì)圖像形狀能進(jìn)行有效的描述,因而得到迅速發(fā)展,如Tchebichef矩、Krawtchouk矩、Zemike矩和Legendre矩[2],其中Krawtchouk矩是基于離散域的正交矩,不存在數(shù)字過(guò)程中的近似誤差和計(jì)算中的坐標(biāo)變換問(wèn)題。參考文獻(xiàn)[3]將Krawtchouk矩用于對(duì)運(yùn)動(dòng)目標(biāo)進(jìn)行分類,有效地提高了分類的準(zhǔn)確率。與此同時(shí),人工神經(jīng)網(wǎng)絡(luò)ANN(Artificial Neural Network)自提出以來(lái)就得到了快速發(fā)展,其中徑向基函數(shù)RBF(Radial Basis Function)神經(jīng)網(wǎng)絡(luò)具有良好的非線性映射、自學(xué)習(xí)能力和收斂性,因此被越來(lái)越多地運(yùn)用于對(duì)目標(biāo)的分類當(dāng)中,取得了較好的分類效果[4-6]。
基于此,本文提出一種基于Krawtchouk矩和RBF神經(jīng)網(wǎng)絡(luò)的印章圖像分類識(shí)別方法。首先提取出標(biāo)準(zhǔn)印章圖像的Krawtchouk矩不變量,將其作為RBF神經(jīng)網(wǎng)絡(luò)的原始訓(xùn)練樣本;然后提取全部待鑒印章圖像的Krawtchouk矩不變量,將其作為RBF神經(jīng)網(wǎng)絡(luò)的輸入量進(jìn)行分類識(shí)別。實(shí)驗(yàn)表明,使用Krawtchouk矩來(lái)描述印章圖像的特征并通過(guò)RBF神經(jīng)網(wǎng)絡(luò)來(lái)對(duì)其進(jìn)行分類識(shí)別,相對(duì)于參考文獻(xiàn)[4]中的KPCA-RBF法和參考文獻(xiàn)[6]中的Brushlet-RBF法,其分類更準(zhǔn)確,識(shí)別率更高。
Krawtchouk矩是以Krawtchouk多項(xiàng)式為基礎(chǔ)的一種正交矩。一般來(lái)說(shuō),n階Krawtchouk多項(xiàng)式定義為:
其中,x,n=0,1,…,N;N>0;p∈(0,1);2F1(a,b;c;z)是超函數(shù)。
其中,Krawtchouk多項(xiàng)式的加權(quán)表達(dá)式為:
其中,
現(xiàn)用 Krawtchouk矩來(lái)描述一幅大小為M×N的圖像f(x,y):
其中,
Krawtchouk矩不變量具有平移、旋轉(zhuǎn)、尺度不變性,可表示為:
其中,
利 用q01、q10、q11、q02、q20、q12、q217 個(gè) 不 變 量 構(gòu) 造 一 個(gè)不變向量Q來(lái)描述一幅圖像,其中q01、q10與圖像內(nèi)容無(wú)關(guān),所以本文選擇其余5個(gè)變量:
通過(guò)式(12)構(gòu)成的特征向量對(duì)印章圖像進(jìn)行特征提取。
RBF神經(jīng)網(wǎng)絡(luò)由輸入端、隱藏段和輸出端3部分組成,具體的結(jié)構(gòu)如圖1所示。輸入端將輸入信號(hào)傳輸?shù)诫[藏段,隱藏段再通過(guò)基函數(shù)的響應(yīng)激烈程度給予輸出端相應(yīng)的輸出信號(hào)。其中,輸入端的節(jié)點(diǎn)數(shù)對(duì)應(yīng)于輸入向量的維數(shù),隱藏段的節(jié)點(diǎn)數(shù)要視實(shí)際情況而定,輸出端的節(jié)點(diǎn)數(shù)按分類的類別總數(shù)來(lái)確定。
圖1 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
一般來(lái)說(shuō),徑向基函數(shù)選取高斯函數(shù),其具體形式為:
其中,Q為輸入向量,ui為隱藏節(jié)點(diǎn)i的中心向量,σi為相應(yīng)的寬度,‖Q-ui‖為歐式范數(shù)。
輸出端第j個(gè)節(jié)點(diǎn)的輸出值yi為:
其中,j=1,…,m為輸出端節(jié)點(diǎn),wij為隱藏段第i個(gè)節(jié)點(diǎn)到輸出端第j個(gè)節(jié)點(diǎn)的連接權(quán)值。
令d為訓(xùn)練樣本的期望輸出值,則可知:
RBF神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程一般分為選取中心、確定寬度和導(dǎo)出連接權(quán)值3部分。選取中心的方法通常采用K-means 聚類、ROLS(Recumive Orthogonal Least Square)法和自組織聚類等,然后根據(jù)標(biāo)準(zhǔn)樣本來(lái)確定寬度,最后通過(guò)誤差導(dǎo)出隱藏段各節(jié)點(diǎn)到輸出端各節(jié)點(diǎn)的連接權(quán)值。
本文算法的具體描述如下:
(1)根據(jù)印章圖像的特點(diǎn),對(duì)于第一個(gè)輸入向量Q1=(q11,q02,q20,q12,q21)來(lái)說(shuō),此時(shí)RBF網(wǎng)絡(luò)的隱藏段只有一個(gè)節(jié)點(diǎn),中心為Q1。現(xiàn)設(shè)定一個(gè)參數(shù)a(該參數(shù)會(huì)根據(jù)實(shí)驗(yàn)結(jié)果進(jìn)行適當(dāng)調(diào)整),對(duì)于第二個(gè)輸入向量Q2,計(jì)算其與Q1之間的歐氏距離D,若D>a,則 Q2也成為一個(gè)中心;若D≤a,則 Q1為此處的中心。對(duì)于第n個(gè)輸入向量Qn,此時(shí)已有M個(gè)中心,現(xiàn)分別計(jì)算Qn與這M個(gè)中心的歐式距離,其中D0為其中的最小值,若D0>a,則 Qn成為新一個(gè)中心;若D0≤a,則中心數(shù)仍為M個(gè)。
(2)因?yàn)楸疚倪x取的徑向基函數(shù)為高斯函數(shù),所以可通過(guò)式(16)直接求取寬度:
(3)隱藏段至輸出端的連接權(quán)值可直接用ROLS法求得:
算法實(shí)現(xiàn)的具體過(guò)程如下。
(1)提取標(biāo)準(zhǔn)印章圖像的Krawtchouk矩不變量,將其作為RBF神經(jīng)網(wǎng)絡(luò)的原始訓(xùn)練樣本。
(2)提取全部待鑒印章圖像的Krawtchouk矩不變量,通過(guò)RBF神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行分類。
(3)分類結(jié)果分為正確、錯(cuò)誤和可疑3類,并在實(shí)驗(yàn)中分別用阿拉伯?dāng)?shù)字1、-1和0表示。
具體的流程圖如圖2所示。
圖2 RBF神經(jīng)網(wǎng)絡(luò)分類流程圖
為了驗(yàn)證本文提出的基于Krawtchouk矩和RBF的印章圖像分類識(shí)別方法的分類識(shí)別情況,針對(duì)大量不同類型的印章圖像做了實(shí)驗(yàn),并與參考文獻(xiàn)[4]中的KPCA-RBF法和參考文獻(xiàn)[6]中的Brushlet-RBF法進(jìn)行了比較,發(fā)現(xiàn)本文方法優(yōu)勢(shì)明顯。實(shí)驗(yàn)是在Intel(R)Core(TM)i3 CPU 2.4 GHz/1.92 GB內(nèi)存/Matlab 2009a環(huán)境中運(yùn)行的。
圖3 印章圖像實(shí)驗(yàn)用圖
表2 RBF神經(jīng)網(wǎng)絡(luò)分類識(shí)別結(jié)果
印章圖像(323×324)在5種不同條件下所蓋印出來(lái)的效果如圖3所示。先進(jìn)行去噪、分割及配準(zhǔn)等預(yù)處理,然后通過(guò)Krawtchouk矩不變量提取圖像特征,結(jié)果數(shù)據(jù)如表1所示。再利用RBF神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行訓(xùn)練,RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中輸入端節(jié)點(diǎn)數(shù)選為5,輸出端節(jié)點(diǎn)數(shù)選為3,最后再將所有待鑒印章圖像通過(guò)該網(wǎng)絡(luò)來(lái)分類識(shí)別,結(jié)果數(shù)據(jù)如表 2所示,其中 1代表正確,0代表可疑,-1代表錯(cuò)誤。
表1 印章圖像的特征向量參數(shù)
圖4所示印章圖像中后3幅圖像對(duì)原圖中的字體、形狀或面積進(jìn)行了一定的變動(dòng),并將得到的印章通過(guò)用力過(guò)大、用力過(guò)小、用力不均、缺上角、缺下角等方式產(chǎn)生實(shí)驗(yàn)用的全部待鑒印章圖像,按照先后順序編號(hào)為1~5,6~10,11~15,16~20,然后將其輸入 RBF 神經(jīng)網(wǎng)絡(luò)來(lái)對(duì)其進(jìn)行分類識(shí)別,結(jié)果如表3所示。
圖4 待鑒印章圖像
表3 各類方法效率比較
從表2可以看出,本文方法、KPCA-RBF法和Brushlet-RBF法對(duì)于原始印章圖像及變換了圖像形狀的分類均取得了較好的結(jié)果,但是對(duì)于只改變了字體或字體間間距的圖像來(lái)說(shuō),本文方法具有明顯的優(yōu)勢(shì)。由表3可以看出,本文提出的Krawtchouk-RBF法相對(duì)于KPCA-RBF法和Brushlet-RBF法來(lái)說(shuō),其分類識(shí)別的正確率更高。
本文提出了一種基于Krawtchouk矩和RBF神經(jīng)網(wǎng)絡(luò)的印章圖像分類識(shí)別方法。首先提取標(biāo)準(zhǔn)印章圖像的Krawtchouk矩不變量,將其作為RBF網(wǎng)絡(luò)的原始訓(xùn)練樣本;然后提取全部待鑒印章圖像的Krawtchouk矩不變量,將其作為RBF神經(jīng)網(wǎng)絡(luò)的輸入量進(jìn)行分類識(shí)別。針對(duì)實(shí)際印章圖像做了大量的實(shí)驗(yàn),并與參考文獻(xiàn)[4]中的KPCA-RBF法和參考文獻(xiàn)[6]中的Brushlet-RBF法進(jìn)行了對(duì)比,結(jié)果表明,本文的方法分類更準(zhǔn)確,識(shí)別率更高。
[1]何瑾,劉鐵根,周怡潔,等.基于邊緣差異的印鑒自動(dòng)鑒別[J].儀 器 儀 表 學(xué) 報(bào) ,2010,31(1):85-91.
[2]CHONG C W,RAVEENDRAN P,MUKUNDAN R.Translation and scale invariants of Legendre moments[J].Pattern Recongniton,2004(37):119-129.
[3]王曉靜,原達(dá),李道凱.基于krawtchouk矩的運(yùn)動(dòng)目標(biāo)分類[J].計(jì)算機(jī)工程與設(shè)計(jì),2012,33(5):1890-1894.
[4]楊俊,陳賢富.基于KPCA和RBF網(wǎng)絡(luò)的文本分類研究[J].微電子學(xué)與計(jì)算機(jī),2010,27(3):122-125.
[5]王行甫,覃啟賢,程用遠(yuǎn),等.一種改進(jìn)的徑向基神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)算法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2012,21(8):214-217.
[6]李曉輝,謝建紅,高鑫.基于 Brushlet和 RBF網(wǎng)絡(luò)的SAR圖像分類[J].微計(jì)算機(jī)信息,2009,25(2-3):295-297.