王 進(jìn),謝水寧,頡小鳳,LEE Chongho,陳喬松,鄧 欣
(1.重慶郵電大學(xué) 計(jì)算智能重慶市重點(diǎn)實(shí)驗(yàn)室,重慶 400065;2.Department of Information and Communucation Engineering, Inha University, Incheon 402-751, Korea)
生物特征認(rèn)證技術(shù)憑借其可靠性、穩(wěn)定性以及唯一性,已成為身份認(rèn)證領(lǐng)域的一個(gè)研究熱點(diǎn)。生物特征認(rèn)證技術(shù)是指利用人固有的生理特征或行為特征進(jìn)行個(gè)人身份認(rèn)證的技術(shù),主要包括指紋、虹膜、人臉、聲音等認(rèn)證技術(shù),盡管這些生物特征認(rèn)證技術(shù)已有部分實(shí)用產(chǎn)品,但其必須有專(zhuān)門(mén)的設(shè)備,成本高,不易普及使用。而手寫(xiě)簽名[1-2]是被大眾普遍接受的社會(huì)行為,是眾多基于生物特征認(rèn)證系統(tǒng)最自然和最友好的方式,是一種利用人的簽名這種行為特征進(jìn)行身份鑒定的技術(shù)。通常手寫(xiě)簽名認(rèn)證技術(shù)主要分為在線和離線2種方式[3]。離線手寫(xiě)簽名認(rèn)證因其只采集簽名的靜態(tài)特征,處理簽名的形狀來(lái)鑒定簽名,忽略了速度、壓力等動(dòng)態(tài)特征,給離線簽名認(rèn)證系統(tǒng)帶來(lái)了特征提取困難、易模仿等問(wèn)題。與此相反,在線手寫(xiě)簽名認(rèn)證則可以采集簽名的筆順、速度、位置和方向等動(dòng)態(tài)信息與真實(shí)簽名樣本進(jìn)行對(duì)比,以實(shí)時(shí)鑒定手寫(xiě)簽名的真?zhèn)?,具有操作?jiǎn)單、難模仿等特點(diǎn),所以比離線簽名更容易鑒定,精確度更高。
目前,比較常見(jiàn)的在線手寫(xiě)簽名認(rèn)證方法主要有神經(jīng)網(wǎng)絡(luò)(neural network,NN)、動(dòng)態(tài)時(shí)間彎曲(dynamic time warping,DTW)、隱馬爾可夫模型(hidden markov model,HMM)等。神經(jīng)網(wǎng)絡(luò)[4]因其良好的非線性映射特性,易自我改進(jìn)和學(xué)習(xí)的優(yōu)點(diǎn),使得該算法很容易為簽名認(rèn)證系統(tǒng)增加學(xué)習(xí)特性,以適應(yīng)簽名者的書(shū)寫(xiě)風(fēng)格。神經(jīng)網(wǎng)絡(luò)針對(duì)在線英文手寫(xiě)簽名認(rèn)證已得到很好的應(yīng)用[5]。為了提高手寫(xiě)簽名安全性,克服單一模型的缺點(diǎn),Alhaddad等[6]將概率模型和神經(jīng)網(wǎng)絡(luò)2個(gè)模型進(jìn)行結(jié)合,提出了BPNN/PM模型;針對(duì)手寫(xiě)體漢字具有類(lèi)別多、結(jié)構(gòu)復(fù)雜、相似字多、字形的多樣化等特點(diǎn),Yang等[7]借助深層卷積神經(jīng)網(wǎng)絡(luò)強(qiáng)大的特征表達(dá)能力,對(duì)漢字手寫(xiě)簽名進(jìn)行鑒定,在一定程度上降低了錯(cuò)誤率。然而,由于神經(jīng)網(wǎng)絡(luò)提取有限的結(jié)構(gòu)特征和動(dòng)態(tài)特征,很難適應(yīng)手寫(xiě)體的復(fù)雜性和多樣性,達(dá)不到理想的匹配結(jié)果;動(dòng)態(tài)時(shí)間彎曲[8]是一種基于動(dòng)態(tài)規(guī)劃思想的非線性優(yōu)化算法,并在簽名認(rèn)證系統(tǒng)中得到很好的應(yīng)用[9-10],但其算法過(guò)于復(fù)雜,且效果沒(méi)有明顯優(yōu)于其他算法。經(jīng)典的DTW算法是基于歐幾里德距離實(shí)現(xiàn)樣本分類(lèi),然而歐幾里德距離對(duì)特征矢量的各維度是平等對(duì)待的,且忽略了簽名時(shí)間序列長(zhǎng)度的影響以及局部差異的重要性,同時(shí)使得部分真實(shí)樣本由于偶爾出現(xiàn)的畸變點(diǎn)而被拒絕;隱馬爾科夫模型能夠很好地描述時(shí)間連續(xù)的動(dòng)態(tài)過(guò)程,專(zhuān)門(mén)針對(duì)語(yǔ)音識(shí)別和漢字識(shí)別等領(lǐng)域而提出,由于簽名數(shù)據(jù)具有語(yǔ)音信號(hào)某些相似的性質(zhì),因此,HMM模型被引入到在線簽名識(shí)別領(lǐng)域[11],但其算法識(shí)別率不高,訓(xùn)練收斂時(shí)間較長(zhǎng)。本文使用一種新的簽名認(rèn)證方法──演化超網(wǎng)絡(luò)(evolutionary hypernetwork)來(lái)對(duì)手寫(xiě)簽名進(jìn)行鑒定。
超網(wǎng)絡(luò)(hypernetwork)是受生物分子網(wǎng)絡(luò)啟發(fā)而建立的一種基于超圖(hypergraph)的認(rèn)知學(xué)習(xí)模型[12],由大量的超邊組成。超網(wǎng)絡(luò)演化學(xué)習(xí)過(guò)程,是通過(guò)不斷地對(duì)超邊進(jìn)行匹配、選擇、放大,從而準(zhǔn)確擬合訓(xùn)練數(shù)據(jù),挖掘出特征間的高階相關(guān)性。超網(wǎng)絡(luò)具有流體性、可重置的分子結(jié)構(gòu),能夠有效模仿人類(lèi)認(rèn)知學(xué)習(xí)過(guò)程。目前,超網(wǎng)絡(luò)在模式識(shí)別領(lǐng)域已得到廣泛應(yīng)用[13-14]。王進(jìn)等[15]提出了一種結(jié)合最優(yōu)類(lèi)別信息離散(optimal class-dependent discretization,OCDD)的細(xì)粒度演化超網(wǎng)絡(luò)算法,旨在解決超網(wǎng)絡(luò)只能處理二值化數(shù)據(jù)的缺陷;孫開(kāi)偉等[16-17]為了解決多標(biāo)簽分類(lèi)問(wèn)題,通過(guò)擴(kuò)展傳統(tǒng)超網(wǎng)絡(luò)模型提出了一種多標(biāo)簽超網(wǎng)絡(luò)的算法(multi-label hypernetwork,MLHN);Choi等[18]提出了一種基于超圖融合語(yǔ)義信息子網(wǎng)標(biāo)識(shí)的場(chǎng)景分類(lèi)算法,通過(guò)利用超圖挖掘語(yǔ)義信息間的高階關(guān)聯(lián)特性對(duì)場(chǎng)景進(jìn)行分類(lèi)。本文將超網(wǎng)絡(luò)引入到手寫(xiě)簽名認(rèn)證中,提出了一種基于演化超網(wǎng)絡(luò)的手寫(xiě)簽名認(rèn)證方法,通過(guò)對(duì)簽名者的筆跡進(jìn)行真?zhèn)闻袛嗍欠駷楸救苏鎸?shí)簽名。
基于演化超網(wǎng)絡(luò)的手寫(xiě)簽名識(shí)別系統(tǒng)的學(xué)習(xí)過(guò)程,主要是對(duì)采集到的簽名樣本不斷地進(jìn)行選擇、放大和匹配。在采集簽名樣本特征過(guò)程中,為了平滑噪聲、構(gòu)造出可讀性強(qiáng)的筆跡特征集,采用了向量化和平滑采集點(diǎn)的方法對(duì)簽名樣本進(jìn)行預(yù)處理,從而提取出位置和方向特征屬性;采用演化超網(wǎng)絡(luò)模型對(duì)筆跡特征集進(jìn)行學(xué)習(xí)分類(lèi),嘗試提升模型在小樣本訓(xùn)練集下的泛化能力,挖掘簽名樣本之間的高階關(guān)聯(lián)性。圖1為在移動(dòng)終端實(shí)現(xiàn)的手寫(xiě)簽名識(shí)別系統(tǒng)流程。由圖1可知,簽名認(rèn)證過(guò)程可分為2個(gè)步驟:①簽名注冊(cè),即根據(jù)用戶訓(xùn)練樣本建立簽名模型;②簽名認(rèn)證,即利用給定的超網(wǎng)絡(luò)模型判別待認(rèn)證簽名的真?zhèn)巍?/p>
圖1 系統(tǒng)流程圖Fig.1 System flow diagram
對(duì)簽名樣本數(shù)據(jù)預(yù)處理包括向量化、平滑等步驟。向量化旨在對(duì)提取有效的筆跡特征,增強(qiáng)特征數(shù)據(jù)的可讀性;平滑旨在平滑噪聲筆跡,從而構(gòu)造出能夠適應(yīng)于超網(wǎng)絡(luò)分類(lèi)器的簽名特征集。
2.1.1 向量化
為了方便記錄簽名筆跡的位置,將手寫(xiě)簽名面板劃分為50×50的網(wǎng)格,從落筆點(diǎn)開(kāi)始采集樣本。在獲取手寫(xiě)簽名的過(guò)程中,通過(guò)判別位置點(diǎn)是否有落筆來(lái)判斷是否存在筆跡特征,用‘1’表示該網(wǎng)格存在筆跡特征屬性,‘0’表示無(wú)筆跡特征屬性,并記錄樣本特征值為‘1’的點(diǎn)坐標(biāo)(x,y)。簽名者在簽名鑒定面板上簽名,記錄并獲取筆跡點(diǎn)位置坐標(biāo)的過(guò)程如圖2所示。
圖2 獲取手寫(xiě)簽名面板特征點(diǎn)坐標(biāo)過(guò)程Fig.2 Get feature point process from handwritten signature board
2.1.2 平 滑
平滑是在線手寫(xiě)簽名認(rèn)證中廣泛采用的數(shù)據(jù)預(yù)處理方法之一,其主要目的是去掉各種噪音和失真,降低對(duì)特征提取產(chǎn)生的干擾。本文采用五點(diǎn)三次平滑公式對(duì)坐標(biāo)點(diǎn)數(shù)據(jù)進(jìn)行平滑,利用多項(xiàng)式的最小二乘法逼近對(duì)采樣點(diǎn)實(shí)現(xiàn)平滑濾波。
設(shè)n個(gè)等時(shí)間間隔ti(i=0,1,…,n-1)上的坐標(biāo)點(diǎn)數(shù)據(jù)為Y(t)0,Y(t)1,…,Y(t)n-1,則可在每個(gè)數(shù)據(jù)點(diǎn)的前后各取2個(gè)相鄰的點(diǎn),用三次多項(xiàng)式Y(jié)(t)=a0+a1t+a2t2+a3t3進(jìn)行逼近。用最小二乘法來(lái)確定方程(t)中的待定系數(shù),令
(1)
可得到五點(diǎn)三次平滑公式為
(2)
(3)
(4)
(5)
(6)
對(duì)于筆劃中間的數(shù)據(jù)點(diǎn),采用(4)式進(jìn)行平滑,對(duì)于筆劃開(kāi)頭的點(diǎn)用(2)式和(3)式進(jìn)行平滑,對(duì)于筆劃結(jié)束的2點(diǎn)則用(5)式和(6)式進(jìn)行平滑。
特征提取是簽名認(rèn)證的關(guān)鍵,能反映簽名者的個(gè)人獨(dú)有信息,所以能區(qū)別于簽名偽造者。在模仿過(guò)程中,雖然仿造者容易模仿出真實(shí)簽名者的簽名形態(tài),但對(duì)于筆跡的位置、方向、速度、壓力等因個(gè)人簽名習(xí)慣而形成動(dòng)態(tài)特征則難以模仿。本文主要提取簽名的位置和方向特征。
2.2.1 位置特征提取
筆劃位置參數(shù)包括隨時(shí)間變化的x和y坐標(biāo),能夠表征簽名位置隨時(shí)間變化趨勢(shì)。從落筆點(diǎn)開(kāi)始到結(jié)束,簽名按等時(shí)間間隔劃分成50段,并記錄每一段的位置坐標(biāo)(x,y),從而得到橫縱位置坐標(biāo)序列x(i)和y(i),其中,i=0,1,…,49,通過(guò)(7)式計(jì)算得到位置特征Pi。由于在線簽名是一個(gè)動(dòng)態(tài)的過(guò)程,每次簽名的位置也不同,從而導(dǎo)致即使同一用戶簽名,其采集到的位置特征也不同。
(7)
2.2.2 方向特征提取
將簽名鑒定面板的平面空間劃分為8個(gè)區(qū)域,每個(gè)區(qū)域代表一個(gè)方向,即可構(gòu)造平面方向向量圖如圖3所示。其中,不同象限和不同角度的取值范圍如表1所示,每個(gè)區(qū)域的大小為45°。
圖3 平面方向向量圖Fig.3 Plane direction vectors diagram
將每個(gè)樣本按等時(shí)間間隔劃分為50段,每一段代表一個(gè)方向向量特征,即方向向量代表了該樣本每一段筆劃在此處的傾斜值,因此,利用最小二乘法擬合出來(lái)的方程的斜率值進(jìn)行反正切公式(8)計(jì)算,得到角度θi。將樣本角度θi通過(guò)映射關(guān)系,映射到表1即可得到該方向角所隸屬的方向向量區(qū)域,從而可得到簽名方向向量特征集Di。
(8)
采集方向向量的過(guò)程如圖4所示。其中,Xi為某一段提取出來(lái)的方向向量集,Yi為樣本類(lèi)別標(biāo)簽集,由于簽名認(rèn)證為二分類(lèi)問(wèn)題,因此,樣本標(biāo)簽取值為{0,1},表示不是本人簽名或是本人簽名,通過(guò)最小二乘法對(duì)各個(gè)片段進(jìn)行擬合得到方向向量特征集。由圖4可知,前4個(gè)簽名為本人簽名,最后一個(gè)為非本人簽名。
表1 方向向量表Tab.1 Direction to the scale
圖4 平面方向向量采集過(guò)程Fig.4 Plane direction vectors collection process
超網(wǎng)絡(luò)是超圖[19]的推廣,是由大量具有權(quán)值的超邊(hyperedges)組成的任意超圖結(jié)構(gòu)。利用三元組H={V,E,W}表示一個(gè)超網(wǎng)絡(luò),其中,V={v1,v2,…,vn}為超網(wǎng)絡(luò)n個(gè)頂點(diǎn)集合,E={e1,e2,…,em}為m條超邊集合,W={w1,w2,…,wm}為m條超邊的權(quán)值集合。超邊e={vi1,vi2,…,vik,yi}由k個(gè)頂點(diǎn)及類(lèi)別標(biāo)識(shí)yi組成,其中,k(2≤k≤n)稱為超邊的階數(shù)(order),如果一個(gè)超網(wǎng)絡(luò)中所有超邊的階數(shù)都為k,則這個(gè)超網(wǎng)絡(luò)被稱為k階超網(wǎng)絡(luò)。圖5為一個(gè)包含8個(gè)頂點(diǎn)4條超邊的超網(wǎng)絡(luò),在圖5中,超邊線條的粗細(xì)代表了超邊權(quán)值的大小,線條越粗,權(quán)值越大。
圖5 包含8個(gè)頂點(diǎn)4條超邊的超網(wǎng)絡(luò)Fig.5 Hypernetwork contains eight vertices and four hyperedges
超網(wǎng)絡(luò)可用作概率性的聯(lián)想存儲(chǔ)器[12],通過(guò)演化學(xué)習(xí)將數(shù)據(jù)集以一定的概率檢索出來(lái),實(shí)際上代表輸入樣本X與輸出類(lèi)別Y的聯(lián)合概率P(X,Y),即樣本X隸屬于類(lèi)別Y的概率,可根據(jù)點(diǎn)估計(jì)計(jì)算公式(9)得到。在分類(lèi)過(guò)程中,通過(guò)計(jì)算樣本X隸屬于每個(gè)類(lèi)別的條件概率y*,選取出條件概率值最大的類(lèi)別作為分類(lèi)結(jié)果,如(10)式和(11)式所示。該過(guò)程主要利用超邊數(shù)量眾多這一特性,使得分類(lèi)能力具有較強(qiáng)的魯棒性。
(9)
(10)
超網(wǎng)絡(luò)分類(lèi)器的分類(lèi)步驟如下。
步驟1對(duì)超邊集合L進(jìn)行點(diǎn)估計(jì),得到經(jīng)驗(yàn)概率分布P(X,Y);
步驟2輸入訓(xùn)練樣本Xi;
步驟3根據(jù)以下步驟對(duì)輸入樣本Xi進(jìn)行分類(lèi)。
①將X與L中所有超邊進(jìn)行匹配運(yùn)算,并將與X匹配的超邊放入集合M中;
②根據(jù)超邊的類(lèi)別標(biāo)識(shí),對(duì)集合M中的超邊劃分:類(lèi)別為0的超邊歸類(lèi)到M0中,將類(lèi)別為1的超邊歸類(lèi)到M1中;
采用演化超網(wǎng)絡(luò)對(duì)簽名樣本進(jìn)行分類(lèi)時(shí),超邊庫(kù)[15,17]決定了演化超網(wǎng)絡(luò)的性能。在每次迭代過(guò)程中,超邊經(jīng)過(guò)不斷地匹配、替代和放大操作對(duì)權(quán)值進(jìn)行調(diào)整,從而形成一種能夠再現(xiàn)訓(xùn)練數(shù)據(jù)的超網(wǎng)絡(luò)。超網(wǎng)絡(luò)演化學(xué)習(xí)算法流程如下。
輸入:集合X:訓(xùn)練集;Y:類(lèi)別數(shù);t:每個(gè)樣本生成的超邊數(shù);k:超邊階數(shù);w:超網(wǎng)絡(luò)學(xué)習(xí)率。
輸出:超邊庫(kù)L。
步驟1初始化超邊庫(kù)。
fori=1 tondo
樣本Xi生成t條k階超邊,置每條超邊的fitw=0,fitc=0,將超邊加入L。fitw為超邊不能正確分類(lèi)訓(xùn)練樣本的適應(yīng)值,fitc表示超邊正確分類(lèi)訓(xùn)練樣本的適應(yīng)值。
end for
步驟2訓(xùn)練樣本分類(lèi)。
fori=1 tondo
若當(dāng)前超網(wǎng)絡(luò)模型正確分類(lèi)樣本Xi,則將Xi加入集合XC,否則加入集合XW;
end for
計(jì)算錯(cuò)誤分類(lèi)比例r=|XW|/|X|;
步驟3計(jì)算適應(yīng)值。
fori=1 tondo
forj=1 tomdo
end for
fork=1 topdo
end for
end for
步驟4超邊排序。
根據(jù)fitw將超邊降序排序,對(duì)于fitw值相同的超邊,將其按照f(shuō)itc降序排序。
步驟5計(jì)算超邊替代數(shù)目。
步驟6替換經(jīng)過(guò)排序后適應(yīng)值最低的substCnt條超邊。
步驟7返回步驟2,直到substCnt=w×r×|L|substCnt=0。
用戶簽名樣本的訓(xùn)練是針對(duì)二分類(lèi)問(wèn)題,通過(guò)對(duì)用戶簽名進(jìn)行訓(xùn)練,對(duì)待測(cè)簽名進(jìn)行測(cè)試時(shí),只需判別能否和訓(xùn)練庫(kù)的信息進(jìn)行匹配即可。因此,通過(guò)步驟1將提取后的筆跡特征字符串作為輸入信息,并隨機(jī)生成一個(gè)初始化超網(wǎng)絡(luò),即構(gòu)造簽名樣本向量集,通過(guò)演化學(xué)習(xí),階數(shù)設(shè)為10,從而得到學(xué)習(xí)庫(kù)樣本。
從上述超網(wǎng)絡(luò)的演化學(xué)習(xí)過(guò)程中可以看出,超網(wǎng)絡(luò)的最大可能超邊數(shù)目是2k×C(n,k),其中,n為簽名樣本的特征維數(shù),k為超邊階數(shù)。由于超網(wǎng)絡(luò)演化學(xué)習(xí)過(guò)程中,超邊的數(shù)目會(huì)隨著輸入空間的維數(shù)n增加而急劇增加,如果初始化后的超網(wǎng)絡(luò)沒(méi)有包含那些對(duì)分類(lèi)重要的超邊,則在演化學(xué)習(xí)過(guò)程中超網(wǎng)絡(luò)的分類(lèi)性能提升是非常有限的?;诖?,本文采用超邊替代的演化學(xué)習(xí)方法來(lái)演化學(xué)習(xí)低階超網(wǎng)絡(luò)(演化學(xué)習(xí)步驟5),把那些適應(yīng)值低的超邊用新的超邊替代,以搜索更大的解空間。如果步驟2的錯(cuò)分樣本較多時(shí),步驟5被替代的超邊數(shù)目也越多,即被替代的超邊數(shù)目與步驟2中樣本錯(cuò)分的比例成正比關(guān)系。在步驟1中,每個(gè)簽名樣本生成相同數(shù)量的超邊,為了防止超網(wǎng)絡(luò)只對(duì)某些類(lèi)別的樣本有較好的分類(lèi)效果,因此,步驟6隨機(jī)選取與被替代的超邊具有相同類(lèi)別的樣本來(lái)生成新的超邊。步驟4對(duì)超邊進(jìn)行排序時(shí),之所以考慮將超邊按照其降序排序,是為了達(dá)到替代那些分類(lèi)錯(cuò)誤的超邊的目的。
采用簽名識(shí)別優(yōu)化改進(jìn)后的高效超邊替代超網(wǎng)絡(luò)分類(lèi)器對(duì)筆跡特征進(jìn)行學(xué)習(xí)分類(lèi),保存為離線低階超邊庫(kù),搜索具有決策能力的最佳超邊,演化完成后的超網(wǎng)絡(luò)能夠利用大量具有決策能力的超邊共同對(duì)樣本進(jìn)行分類(lèi),具體實(shí)現(xiàn)方式如圖6所示。
圖6 超網(wǎng)絡(luò)的演化學(xué)習(xí)過(guò)程Fig.6 Learning process of evolutionary hypernetwork
測(cè)試環(huán)境為Android 4.4.2,機(jī)型名稱為華為榮耀X1,分辨率為1 200像素×1 920像素。
基于上述移動(dòng)終端環(huán)境,分別對(duì)20個(gè)簽名用戶采集40個(gè)真實(shí)簽名和20個(gè)偽造簽名進(jìn)行實(shí)驗(yàn),即共采集到1 200個(gè)簽名樣本,包括800個(gè)真實(shí)簽名和400個(gè)偽造簽名,如表2所示。在實(shí)驗(yàn)過(guò)程中,應(yīng)用每個(gè)用戶的20個(gè)真實(shí)簽名樣本作為訓(xùn)練集,其余20個(gè)真實(shí)簽名樣本和20個(gè)偽造簽名樣本為驗(yàn)證測(cè)試集。
在簽名驗(yàn)證過(guò)程中,簽名偽造通常會(huì)有以下3種類(lèi)型[8]。
1)簡(jiǎn)單偽造(simple forgery):偽造者不作任何努力來(lái)模仿一個(gè)真正的簽名,即按照偽造者書(shū)寫(xiě)風(fēng)格進(jìn)行偽造,但知道簽名者的簽名。
2)隨機(jī)偽造(random forgery):偽造者不了解原始簽名的構(gòu)造,并使用偽造者自身的簽名進(jìn)行隨機(jī)偽造測(cè)試。
3)熟練偽造(skilled forgery):偽造者可以看到簽名者真正的簽名,有時(shí)間來(lái)練習(xí)模仿并試圖盡可能模擬真正簽名。
本文主要以隨機(jī)偽造和熟練偽造進(jìn)行偽造簽名測(cè)試,測(cè)試樣本數(shù)分別為200個(gè),如表2所示。
表2 20個(gè)簽名者樣本數(shù)據(jù)Tab.2 Algorithm flowchart of evolutionary hypernetwork
為了驗(yàn)證簽名識(shí)別系統(tǒng)的性能,本文采用誤拒率、誤納率、以及識(shí)別率[8]3個(gè)指標(biāo)進(jìn)行評(píng)價(jià)。其中,誤拒率(false rejection ratio,F(xiàn)RR)是指當(dāng)系統(tǒng)不能鑒定原始真實(shí)簽名并拒絕偽造的嘗試,被定義為發(fā)生虛假拒絕嘗試鑒定的百分比;誤納率(false acceptance ratio,F(xiàn)AR)則指當(dāng)系統(tǒng)出現(xiàn)錯(cuò)誤接收偽造簽名,把其視為真實(shí)簽名進(jìn)行鑒定,被定義為錯(cuò)誤接收鑒定的百分比。由于本文簽名偽造主要采取隨機(jī)偽造和熟練偽造2種形式,因此,采用隨機(jī)偽造誤納率(random FAR)和熟練偽造誤納率(skill FAR)分別評(píng)價(jià)2種形式下得到的誤納率,并通過(guò)均衡兩者得到平均偽造誤納率(average FAR);識(shí)別率(verification accuracy,VA)則指綜合考慮了由于誤拒和誤納行為導(dǎo)致出現(xiàn)的錯(cuò)分樣本,而得到的正分樣本占總樣本的比例。各評(píng)價(jià)指標(biāo)的計(jì)算公式為
(11)
(12)
(13)
(14)
圖7為某2個(gè)簽名用戶簽名對(duì)比圖。其中,圖7a和圖7e分別為用戶原始簽名數(shù)據(jù);圖7b和圖7f為用戶真實(shí)簽名鑒定數(shù)據(jù);圖7c和圖7g為隨機(jī)偽造數(shù)據(jù);圖7d和圖7h為熟練偽造數(shù)據(jù)。
通過(guò)超網(wǎng)絡(luò)模型對(duì)所有樣本進(jìn)行測(cè)試,并分別記錄每個(gè)簽名用戶的錯(cuò)誤拒絕真實(shí)簽名次數(shù),錯(cuò)誤接收隨機(jī)偽造簽名次數(shù),以及錯(cuò)誤接收熟練偽造簽名次數(shù),將所得數(shù)據(jù)通過(guò)(11)—(13)式計(jì)算得到FRR和FAR。圖8為20個(gè)用戶的FRR和FAR對(duì)比圖,其中,橫坐標(biāo)表示用戶所簽名的文字,縱坐標(biāo)為FRR和FAR的百分比。
圖7 用戶簽名對(duì)比圖Fig.7 Comparison diagram of the user signature
圖8 用戶FAR和FRR對(duì)比圖Fig.8 Comparison diagram of FAR and FRR about user
結(jié)合圖8的數(shù)據(jù)以及(14)式,可以得到20個(gè)簽名用戶的FRR,F(xiàn)AR和VA結(jié)果,如表3所示。其中,skill FAR比random FAR高出3.5%,主要是由于熟練偽造是在一定程度上對(duì)原始簽名數(shù)據(jù)進(jìn)行練習(xí)偽造。同時(shí),通過(guò)random FAR和skill FAR可計(jì)算得出average FAR為3.75%,比skill FAR低31.82%,比random FAR高46.67%,因此,average FAR在一定程度上可表示random FAR和skill FAR。
在數(shù)據(jù)采集過(guò)程中,由于采集手段不同,即使使用同個(gè)分類(lèi)器其鑒定結(jié)果也可能會(huì)導(dǎo)致不同。為了驗(yàn)證本文方法的泛化性,在同等條件下將其和目前流行的分類(lèi)算法進(jìn)行對(duì)比,本文采用了C4.5決策樹(shù)算法(decision tree,DT),樸素貝葉斯算法(na?ve bayes,NB),K近鄰算法(K-nearest neighbor,KNN),以及支持向量機(jī)算法(support vector machine,SVM),其實(shí)現(xiàn)分別對(duì)應(yīng)Weka機(jī)器學(xué)習(xí)開(kāi)源項(xiàng)目所提供的J48,Na?ve Bayes,IBk以及SMO算法[20-23],實(shí)驗(yàn)結(jié)果如表4所示。
表3 誤拒率,誤納率和識(shí)別率Tab.3 False rejection ratio, false acceptance ratio and verification accuracy %
表4 簽名鑒定方法性能對(duì)比Tab.4 Method performance comparison of signature verification %
從表4可以看出,在手寫(xiě)簽名識(shí)別系統(tǒng)中,雖然本文方法的FRR比SVM低,random FAR和SVM持平,但在其余性能方面均有所提升。且本文方法相比于DT,NB以及KNN 3種分類(lèi)算法,在識(shí)別率、誤拒率和誤納率等性能上優(yōu)勢(shì)明顯。由此可見(jiàn),相對(duì)于其他傳統(tǒng)分類(lèi)方法,在小樣本數(shù)據(jù)下演化超網(wǎng)絡(luò)具有較好的泛化能力,主要是因?yàn)槌W(wǎng)絡(luò)在演化學(xué)習(xí)過(guò)程中,利用了超邊替代的方法,把分類(lèi)效果差的超邊用新的超邊不斷進(jìn)行替換,從而使得演化學(xué)習(xí)過(guò)程中可以搜索到盡可能大的問(wèn)題解空間。
本文基于演化超網(wǎng)絡(luò)實(shí)現(xiàn)了一個(gè)手寫(xiě)簽名識(shí)別系統(tǒng)。通過(guò)數(shù)據(jù)預(yù)處理,提取出能較好地反映簽名者書(shū)寫(xiě)風(fēng)格的簽名特征集,驗(yàn)證了特征提取算法的可行性和可靠性;并對(duì)超網(wǎng)絡(luò)分類(lèi)算法的學(xué)習(xí)速度快、靈活性好、適應(yīng)性高、結(jié)果可讀性強(qiáng)等優(yōu)點(diǎn)進(jìn)行了實(shí)驗(yàn)驗(yàn)證。同其他傳統(tǒng)分類(lèi)方法相比,演化超網(wǎng)絡(luò)具有較高的分類(lèi)準(zhǔn)確度。
參考文獻(xiàn):
[1] RADHIKA K S, GOPIKA S. Online and offline signature verification: a combined approach[J]. Procedia Computer Science, 2015, 46(2): 1593-1600.
[2] CPALKA K, ZALASINSKI M, RUTKOWSKI L. New method for the online signature verification based on horizontal partitioning[J].Pattern Recognition, 2014, 47(8): 2652-2661.
[4] DU Jun, ZHAI Jianfang, HU Jinshui, et al. Writer adaptive feature extraction based on convolutional neural networks for online handwritten Chinese character recognition[C]//IEEE.Proceedings of the 2015 13th International Conference on Document Analysis and Recognition. Tunis: IEEE Press, 2015: 841-845.
[5] FALLAH A, JAMAATI M, SOLEAMANI A. A new online signature verification system based on combining Mellin transform, MFCC and neural network[J]. Digital Signal Processing, 2011, 21(2): 404-416.
[6] ALHADDAD M J, MOHAMAD D, AHSAN A M. Online signature verification using probablistic modeling and neural network[C]//IEEE.Proceedings of the 2012 Spring Congress on Engineering and Technology. Xi’an, China: IEEE Press, 2012: 1-5.
[7] YANG Weixin, JIN Lianwen, XIE Zecheng, et al. Improved deep convolutional neural network for online handwritten Chinese character recognition using domain specific knowledge[C]//IEEE.Proceedings of the 2015 13th International Conference on Document Analysis and Recognition. Tunis: IEEE Press, 2015: 551-555.
[8] FAUNDEZ Z M.Online signature recognition based on VQ-DTW[J].Pattern Recognition,2007,40(3):981-992.
[9] FISCHER A, DIAZ M, PLAMONDON R, et al. Robust score normalization for DTW based online signature verification[C]//IEEE.Proceedings of the 2015 13th International Conference on Document Analysis and Recognition. Tunis: IEEE Press, 2015: 241-245.
[10] 于宏斌,吳仲城,申飛.基于HMM/DTW兩級(jí)結(jié)構(gòu)的簽名認(rèn)證方法[J].模式識(shí)別與人工智能, 2010, 23(1): 107-114.
YU Hongbin, WU Zhongcheng, SHEN Fei. Signature verification algorithm based on HMM/DTW two level architecture[J]. PR & AI, 2010, 23(1): 241-245.
[11] SHAFIEI M M, RABIEE H R. A new online signature verification algorithm using variable length segmentation and hidden markov models[C]//IEEE.Proceedings of Seventh International Conference on Document Analysis and Recognition. Edinburgh, UK: IEEE Press, 2003: 443-446.
[12] ZHANG B T.Hypernetworks: A molecular evolutionary architecture for cognitive learning and memory[J]. IEEE Computational Intelligence Magazine,2008,3(3):49-63.
[13] SUO Qi, SUN Shiwei, Hajli N, et al.User ratings analysis in social networks through a hypernetwork method[J]. Expert Systems with Applications, 2015, 42(21): 7317-7325.
[14] RUCCO M, SOUSA R D, MERELLI E, et al. Neural hypernetwork approach for pulmonary embolism diagnosis[J]. Bmc Research Notes, 2015, 8(1): 1-11.
[15] 王進(jìn),張軍,胡白帆.結(jié)合最優(yōu)類(lèi)別信息離散的細(xì)粒度超網(wǎng)絡(luò)微陣列數(shù)據(jù)分類(lèi)[J].上海交通大學(xué)學(xué)報(bào), 2013, 47(12): 1856-1862.
WANG Jin, ZHANG Jun, HU Baifan. Optimal class-dependent discretization-based fine-grain hypernetworks for classification of microarray data[J]. Journal of Shanghai Jiaotong University, 2013, 47(12): 1856-1862.
[16] SUN Kaiwei, LEE C H, XIE Xiaofeng.MLHN: a hypernetwork model for multi-label classification[J]. International Journal of Pattern Recognition and Artificial Intelligence, 2015, 29(6): 1550020-1-1550020-28.
[17] SUN Kaiwei, LEE C H, WANG Jin. Multilabel Classification via Co-evolutionary Multilabel Hypernetwork[J]. IEEE Transactions on Knowledge and Data Engineering, 2016, 28(9): 2438-2451.
[18] CHOI S W, LEE C H, PARK I K. Scene classification via hypergraph-based semantic attributes subnetworks identification[M].Germany: Springer International Publishing, 2014: 361-376.
[19] 王進(jìn),任小龍,孫開(kāi)偉,等.HSV顏色空間下用演化超網(wǎng)絡(luò)識(shí)別道路限速標(biāo)志的研究[J]. 高技術(shù)通訊, 2013, 23(7): 679-684.
WANG Jin, REN Xiaolong, SUN Kaiwei, et al. Road speed limit sign recognition using HSV color space and evolutionary hypernetwork[J]. High Technology Letters, 2013, 23(7): 679-684.
[20] QUINLAN J R. C4.5: Programs for machine learning[M]. San Mateo, CA: Morgan Kaufmann Publishers, 1993:17-55.
[21] JOHN G H, LANGLEY P. Estimating continuous distributions in bayesian classifiers[C]//Proceedings of the Eleventh Conference on Uncertainty in Artificial Intelligence. San Francisco: ACM Press, 1995: 338-345.
[22] AHA D W, KIBLER D, ALBERT M K.Instance based learning algorithms[J]. Machine Learning, 1991, 6(1): 37-66.
[23] KEERTHI S S, SHEVADE S K, BHATTACHARYYA C, et al. Improvements to platt’s SMO algorithm for SVM classifier design[J].Neural Computation, 2001, 13(3): 637-649.