柳春華,姚建峰
(信陽師范學(xué)院 計算機與信息技術(shù)學(xué)院,河南 信陽 464000)
自動清分、銷毀銀行回籠的易損紙幣并補充等額的新幣是銀行、金融等機構(gòu)中一項非常重要且繁重的工作[1,2].研究一種具有高準(zhǔn)確率的新舊紙幣自動識別方法以減輕匯兌紙幣的工作強度量,對于銀行或金融機構(gòu)具有重要意義,并受到高度關(guān)注[3-5].
然而,訓(xùn)練模型用到的新舊紙幣樣本集中經(jīng)常出現(xiàn)樣本分布不均衡的情況,這容易導(dǎo)致傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)算法收斂于局部最優(yōu)值,進(jìn)而使得學(xué)習(xí)到的模型不能很好地擬合真實的樣本分布[6].
基于以上問題,本文提出了一種基于圖像統(tǒng)計特征的新舊紙幣識別方法,該方法使用清分機計算未經(jīng)流通新紙幣的新舊特征塊灰度平均值,并視其為該幣種的標(biāo)準(zhǔn)亮度,以完成紙幣新舊程度特征塊的定位,進(jìn)而求出其平均灰度值.對新舊識別的測量值進(jìn)行計算和量化處理.依據(jù)紙幣圖像的均勻性特征對紙幣圖像的新舊程度進(jìn)行判斷.通過標(biāo)準(zhǔn)方差與間斷強度對均勻性特征進(jìn)行描述.分析了LVQ網(wǎng)絡(luò)模型,LVQ網(wǎng)絡(luò)中競爭層的所有神經(jīng)元利用學(xué)習(xí)原型向量對輸入空間進(jìn)行分類[7].仿真實驗結(jié)果表明,所提算法具有很高的識別正確率.
因為不同面額紙幣圖像的大小有所差別,其新舊清分區(qū)域的位置也不同,所以需通過面額與面向的識別結(jié)果對新舊清分區(qū)域進(jìn)行定位,從而實現(xiàn)新舊紙幣的識別.
首先利用清分機對100張未經(jīng)流通新紙幣的新舊特征塊的灰度平均值進(jìn)行計算,將其平均值看作是該幣種的標(biāo)準(zhǔn)亮度.具體步驟如下:
(1)通過面額面向識別結(jié)果對新舊程度特征塊進(jìn)行定位,用100元面值紙幣舉例說明,新舊程度特征塊用圖1進(jìn)行描述.
圖1 損傷特征塊定位結(jié)果Fig. 1 Location of the damaged feature blocks
(2)求出20張紙幣新舊特征塊的灰度平均值Gi(x,y),i=1,2,…,20.用G(x,y)描述新幣圖像灰度,用W描述特征塊的寬度,用L描述特征塊的長度,則特征塊的尺寸可描述成W×L.按照新舊程度特征塊的定位結(jié)果,假設(shè)特征塊左上角坐標(biāo)是(x0,y0),則特征塊的平均灰度可由下式求出:
(3)標(biāo)準(zhǔn)亮度的計算:對將紙幣新舊特征塊的灰度平均值的平均值看作是該幣種新舊識別的測量標(biāo)準(zhǔn)Vs:
(4)通過上述步驟分別求出各種面值紙幣的標(biāo)準(zhǔn)亮度.
完成紙幣新舊程度特征塊的定位后,求出其平均灰度值.
設(shè)經(jīng)噪聲處理及傾斜校正等預(yù)處理后的待測紙幣圖像灰度是G′(x,y),則新舊程度特征塊的平均灰度可通過下式求出
將VA和VS的比值Vnew作為新舊識別的測量值:
Vnew=VA/VS.
(4)
令100元紙幣的新舊識別的測量值描述為:
Vnew=VA/VS100.
(5)
測量值Vnew越大,則紙幣越新.
中國人民銀行在2000年對流通紙幣的整潔度進(jìn)行了規(guī)范要求,提出流通中的紙幣必須在7成新以上,7成新以下的即為舊幣,不允許繼續(xù)流通.通過Vnew值對紙幣新舊識別測量值進(jìn)行量化處理:
若0.9≤Vnew≤1,則認(rèn)為待測紙幣為9成新紙幣;若0.8≤Vnew≤0.9,則認(rèn)為待測紙幣為8成新紙幣;若0.7≤Vnew≤0.8,則認(rèn)為待測紙幣為7成新紙幣.上述Vnew≥0.7紙幣為可流通紙幣,若Vnew<0.7,則認(rèn)為該紙幣是舊幣,需回收.
紙幣圖像是由大量細(xì)小線條及繁雜的紋理組成的,紙幣圖像邊緣的清晰程度以及紋理區(qū)域的平滑程度均可有效體現(xiàn)出紙幣的新舊程度[8].紙幣流通時在正常磨損的狀態(tài)下,其均勻性特征將越來越強,因此,可依據(jù)紙幣圖像的均勻性特征對紙幣圖像的新舊程度進(jìn)行判斷.
均勻性特征主要取決于從圖像中采集的局部信息.均勻性特征主要包括標(biāo)準(zhǔn)方差與間斷強度[9].標(biāo)準(zhǔn)方差是局部區(qū)域?qū)Ρ榷鹊捏w現(xiàn),而間斷性是灰度級突變程度的體現(xiàn),可利用對應(yīng)區(qū)域應(yīng)用邊緣算子計算求出.
坐標(biāo)(x,y)處的標(biāo)準(zhǔn)方差vx,y可利用下式求出:
像素點(x,y)處的間斷性可用邊緣值表示,當(dāng)前常見的邊緣提取算子為Sobel算子、Laplace算子、Canny算子等.考慮到本文無須獲取精確的定位圖像邊緣,為了便于計算,選用Sobel算子對坐標(biāo)(x,y)處的水平梯度Gx和垂直梯度Gy進(jìn)行計算.圖像在點(x,y)處的間斷性特征可描述如下:
為了獲取一致性計算結(jié)果,完成標(biāo)準(zhǔn)方差與間斷值的歸一化操作,可將圖像中各坐標(biāo)點的均勻性特征hx,y描述成:
式中:vmax=max{vx,y},emax=max{ex,y},0≤x≤M-1,0≤y≤N-1.圖像中所有點的均勻性特征值均處于[0,1]區(qū)間中,一個像素點相鄰的局部區(qū)域越一致,則均勻性特征值越小.若紙幣圖像上存在折痕或污損,則上述區(qū)域的均勻性將出現(xiàn)突變,紙幣的均勻性強度將逐漸降低.
由Kohonen提出的LVQ神經(jīng)網(wǎng)絡(luò)模型是一種前向有監(jiān)督的模式分類方法,它有三部分組成:向量輸入層、競爭層、線性輸出層,如圖2所示.該模型主要通過三層結(jié)構(gòu)完成工作,主要有幾層數(shù)據(jù)聯(lián)合工作,共同完成計算任務(wù),但是層與層之間不是完全的信息通信過程.層與層之間如果無特殊說明,那么權(quán)值設(shè)為l,各輸出神經(jīng)元被描述成不一樣的類[10].
假設(shè)網(wǎng)絡(luò)輸入層的輸入向量用X=(x1,x2,…,xM)描述,其中,M表示輸入神經(jīng)元的總量;輸入層與競爭層之間的連接權(quán)值矩陣可描述成
其中:i=1,2,…,P;j=1,2,…,M,用于描述競爭層第i個神經(jīng)元與輸入層第j個神經(jīng)元之間的連接權(quán)值;P表示競爭神經(jīng)元的總量,競爭層的輸出向量可描述成
V=(v1,v2,…,vp);
競爭層和輸出層神經(jīng)元間的連接權(quán)值矩陣可描述成
圖2 LVQ網(wǎng)絡(luò)模型Fig. 2 LVQ network model
考慮到LVQ網(wǎng)絡(luò)競爭學(xué)習(xí)與監(jiān)督學(xué)習(xí)的規(guī)則,用一組正確網(wǎng)絡(luò)行為對網(wǎng)絡(luò)進(jìn)行訓(xùn)練:
{x1,t1},{x2,t2},…,{xQ,tQ},
(10)
式中,各目標(biāo)輸出向量tj(j=1,2,…,Q)有且只有一個分量為1.為了保證學(xué)習(xí)過程的順利進(jìn)行,一般將各競爭層的神經(jīng)元劃分給一個輸出神經(jīng)元,從而完成矩陣W2的定義.W2的列代表子類,行代表類.W2的各列均僅存在一個1出現(xiàn)的行,用于描述該類屬于該行表示的類,也就是:
W2是無法改變的,神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)即利用優(yōu)化后的Kohonen規(guī)則使W1改變完成的.LVQ學(xué)習(xí)算法具體實現(xiàn)過程如下:
(1)假設(shè)變量與參量
x(n)=[x1(n),x2(n),…,xN(n)]T
是輸入向量.Wij(n)=[wi1(n),wi2(n),…,wiN(n)]T是權(quán)值向量,i=1,2,…,M.選擇學(xué)習(xí)速率的函數(shù)η(n),n表示迭代次數(shù),N表示迭代總次數(shù);
(2)對權(quán)值向量Wi(0)及學(xué)習(xí)速率η(n)=η(0)進(jìn)行初始化處理;
(3)從訓(xùn)練集合中選擇輸入向量X;
(4)對歐氏距離進(jìn)行計算,從而獲取最小的標(biāo)準(zhǔn):
‖X-Wc‖=min‖X-Wi‖.
(12)
檢索競爭成功的神經(jīng)元c,從而完成神經(jīng)元的競爭;
(5)確定分類的正確性,通過下述規(guī)則對得到神經(jīng)元的權(quán)值向量進(jìn)行調(diào)增:
用Lwc描述和獲勝神經(jīng)元權(quán)值向量聯(lián)系的類,用Lxi描述和輸入向量相聯(lián)系的類.
若Lxi=Lwc,則有:
Wc(n+1)=Wc(n)+η(n)[X-Wc(n)].
(13)
反之,如果Lxi≠Lwc,則有:
Wc(n+1)=Wc(n)-η(n)[X-Wc(n)].
(14)
其他神經(jīng)元的權(quán)值則保持不變;
(6)對學(xué)習(xí)速率η(n)進(jìn)行調(diào)整:
(7)判斷迭代次數(shù)是否大于N,若n≤N,則重新進(jìn)行步驟(3),否則停止迭代.
為了驗證本文算法的有效性,需要進(jìn)行相關(guān)的實驗分析.將6種人民幣紙幣作為研究對象,分別采用本文算法和傳統(tǒng)算法進(jìn)行對比分析.實驗過程中的訓(xùn)練樣本數(shù)量、測試樣本數(shù)量及兩種算法識別正確率的比較結(jié)果如表1所示.
表1中訓(xùn)練樣本即用于作為參考紙幣進(jìn)行新舊訓(xùn)練的個數(shù).新舊正確識別率即對空白區(qū)域新舊程度的判斷結(jié)果.
表1 本文算法和傳統(tǒng)算法識別正確率結(jié)果Tab. 1 Accuracies achieved by the proposed algorithm and the traditional algorithm
分析表1可以看出,采用本文算法對新舊紙幣進(jìn)行識別的準(zhǔn)確率明顯大于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法,且一直大于傳統(tǒng)算法,說明本文算法具有很高的識別精度.
為了進(jìn)一步驗證本文算法的有效性,在上述實驗的基礎(chǔ)上,對本文算法和傳統(tǒng)算法完成識別所需的時間進(jìn)行比較,獲取的結(jié)果用圖3進(jìn)行描述.
分析圖3可知,對同一幣種相同數(shù)量樣本進(jìn)行識別時,本文算法所需的時間顯著低于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法,說明本文算法不僅具有很高的識別精度,而且具有很高的識別效率,驗證了本文算法的有效性.
圖3 本文算法和傳統(tǒng)算法所需時間比較結(jié)果Fig. 3 Comparison of time taken by this algorithm and the traditional algorithm
提出一種基于圖像統(tǒng)計特征的新舊紙幣識別算法,利用清分機對未經(jīng)流通新紙幣的新舊特征塊的灰度平均值進(jìn)行計算,將其平均值看作是該幣種的標(biāo)準(zhǔn)亮度,儲存于機器內(nèi)存中,完成紙幣新舊程度特征塊的定位后,求出其平均灰度值.對新舊識別的測量值進(jìn)行計算和量化處理.依據(jù)紙幣圖像的均勻性特征對紙幣圖像的新舊程度進(jìn)行判斷.通過標(biāo)準(zhǔn)方差與間斷強度對均勻性特征進(jìn)行描述.分析了LVQ網(wǎng)絡(luò)模型,LVQ網(wǎng)絡(luò)中競爭層的所有神經(jīng)元利用學(xué)習(xí)原型向量對輸入空間進(jìn)行分類.通過一組正確網(wǎng)絡(luò)行為對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過優(yōu)化后的Kohonen規(guī)則實現(xiàn)LVQ網(wǎng)絡(luò)的學(xué)習(xí)過程.仿真實驗結(jié)果表明,所提算法具有很高的識別正確率.