• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于圖像風(fēng)格遷移技術(shù)生成圖像驗(yàn)證碼研究?

      2024-01-23 13:38:14秦志偉
      關(guān)鍵詞:風(fēng)格化識(shí)別率卷積

      秦志偉 陳 黎

      (1.武漢科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 武漢 430065)(2.武漢科技大學(xué)智能信息處理與實(shí)時(shí)工業(yè)系統(tǒng)湖北省重點(diǎn)實(shí)驗(yàn)室 武漢 430065)

      1 引言

      國(guó)民經(jīng)濟(jì)的高速發(fā)展,社會(huì)各行各業(yè)包括互聯(lián)網(wǎng)也得到了快速的成長(zhǎng),互聯(lián)網(wǎng)在不斷滿足人們需要的同時(shí),也一樣會(huì)帶來一些不利的風(fēng)險(xiǎn)。通過計(jì)算機(jī)腳本攻擊網(wǎng)站系統(tǒng),將會(huì)對(duì)現(xiàn)實(shí)生活中普遍應(yīng)用的計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)產(chǎn)生極大的危險(xiǎn),并且會(huì)造成用戶的個(gè)人信息泄露,安全隱患非常大,而應(yīng)用驗(yàn)證碼技術(shù)則能很好地防止這種安全隱患。

      驗(yàn)證碼技術(shù)[1~2]隨著科技的不斷進(jìn)步,也有不少改進(jìn)和突破。驗(yàn)證碼的種類增多,比如登錄賬戶經(jīng)常需要指定的手機(jī)號(hào)反饋的短信驗(yàn)證碼,登錄部分網(wǎng)站需要問題要求選擇特殊的圖像的驗(yàn)證碼,還出現(xiàn)了拖拽式和拼圖式的圖像驗(yàn)證碼。目前很多網(wǎng)站都是圖像式驗(yàn)證碼,通過識(shí)別字符并輸入字符來獲取進(jìn)入網(wǎng)站的權(quán)限,但是大部分圖像驗(yàn)證碼級(jí)別較低,機(jī)器的識(shí)別率較高,網(wǎng)站容易遭到攻擊[3~4],這就需要開發(fā)出一種人類容易識(shí)別而機(jī)器不易識(shí)別的驗(yàn)證碼。

      近些年來,由于深度學(xué)習(xí)[5]領(lǐng)域取得了較大的進(jìn)步,在圖像領(lǐng)域的研究也有了更多的方向。研究者們將深度學(xué)習(xí)的理念應(yīng)用于圖像藝術(shù)化,得到了非常好的效果?!吧窠?jīng)藝術(shù)“這個(gè)關(guān)鍵詞首先出自Gatys 的文章[6]中,這篇文章主張一種全新的圖像風(fēng)格藝術(shù)化的方法,實(shí)驗(yàn)中應(yīng)用深度卷積神經(jīng)網(wǎng)絡(luò)通過一定數(shù)量地學(xué)習(xí)圖像風(fēng)格,便能模仿出相應(yīng)風(fēng)格化后的圖像。而風(fēng)格化的效果與圖像特征的識(shí)別效率密切相關(guān),很多專家學(xué)者在這特征識(shí)別方面取得了一定的成果。如蔡彪等使用Mask R-CNN方法完成圖像缺陷快速識(shí)別[7],該方法的圖像預(yù)處理能力較差,識(shí)別精度相對(duì)較低;尹立航等使用改進(jìn)多尺度采樣方法完成圖像缺陷快速識(shí)別[8],該方法的模型訓(xùn)練易發(fā)生過擬合,誤識(shí)率較高。

      遷移學(xué)習(xí)可提取源領(lǐng)域的知識(shí),將其應(yīng)用到目標(biāo)領(lǐng)域,以提高目標(biāo)領(lǐng)域的學(xué)習(xí)效果,并可通過充分考量任務(wù)間關(guān)聯(lián)性,解決生成模型時(shí)產(chǎn)生的梯度彌散現(xiàn)象[9]。本文提出基于遷移學(xué)習(xí)的VGG 網(wǎng)絡(luò)優(yōu)化,能夠提高識(shí)別精度,更好地訓(xùn)練和生成模型。神經(jīng)風(fēng)格遷移又名圖像風(fēng)格遷移,能較好地將一幅圖片的風(fēng)格應(yīng)用到另一幅圖中[10]。文中主要應(yīng)用圖像風(fēng)格遷移技術(shù)[11]來實(shí)現(xiàn)圖像驗(yàn)證碼生成技術(shù),本文先優(yōu)化了VGG 模型,提高了特征獲取的精度,然后充分利用深度卷積神經(jīng)網(wǎng)絡(luò)特有的強(qiáng)大學(xué)習(xí)和分析功能,逐步獲取圖像的多層的具有實(shí)質(zhì)代表性的特征圖,并進(jìn)行綜合分析計(jì)算[12],達(dá)到實(shí)現(xiàn)圖像風(fēng)格遷移的目的。在利用圖像風(fēng)格遷移技術(shù)設(shè)法提高驗(yàn)證碼安全性的過程中,本文設(shè)計(jì)了幾種驗(yàn)證碼生成方案,并通過設(shè)計(jì)對(duì)比實(shí)驗(yàn),來評(píng)估方案,從而得到最佳方案。

      2 圖像風(fēng)格遷移與圖像驗(yàn)證碼生成

      2.1 卷積神經(jīng)網(wǎng)絡(luò)的構(gòu)建

      卷積神經(jīng)網(wǎng)絡(luò)的常用結(jié)構(gòu)如圖1,由卷積層、降采樣層和全鏈接層等組成。每一層都有多個(gè)特征圖,每個(gè)特征圖通過一種卷積濾波器可以提取輸入圖像的一種特征,其中每個(gè)特征圖有多個(gè)神經(jīng)元。

      圖1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖

      本文使用VGG模型實(shí)施訓(xùn)練,功能如下:

      1)卷積層:將特征圖輸入到卷積層后,使用卷積濾波器實(shí)施加偏置計(jì)算,該層的局部特征圖,可利用激活特征函數(shù)獲得,式(1)描述了計(jì)算過程:

      式內(nèi),卷積層數(shù)量,用l 描述;卷積濾波器,用m 描述;輸入到卷積層的特征圖,用描述;卷積層輸出結(jié)果,用描述;在第l 層中,其偏置用Bl描述;卷積核用K描述。

      2)池化層:該層用于降低卷積層特征圖的數(shù)據(jù)維度,避免產(chǎn)生過擬合現(xiàn)象。針對(duì)濾波器內(nèi)的數(shù)據(jù),使用均值池化方法獲得其內(nèi)均值,并通過式(2)采集二次特征:

      3)全連接層:該層的計(jì)算方法為多層神經(jīng)網(wǎng)絡(luò)的權(quán)值計(jì)算法,用式(3)描述:

      式內(nèi),節(jié)點(diǎn)j至節(jié)點(diǎn)i的權(quán)值,用ωji描述,j存在于第l層,i存在于下一層。

      該模型由5個(gè)的卷積模塊、3個(gè)全連接模塊,第3 個(gè)全連接層會(huì)輸出圖像。將ReLU 函數(shù)作為兩類模塊的神經(jīng)元激活函數(shù),可優(yōu)化訓(xùn)練過程中產(chǎn)生的梯度彌散現(xiàn)象。池化層的采樣方法為最大池化。

      2.2 圖像風(fēng)格遷移技術(shù)

      圖像風(fēng)格遷移技術(shù)能夠?qū)崿F(xiàn)將一張圖片的風(fēng)格“遷移”到另外一張圖片中,生成具有其風(fēng)格的圖片。圖2 為風(fēng)格遷移的一個(gè)例子,一般用符號(hào)C 表示內(nèi)容圖片,符號(hào)S 表示風(fēng)格圖片,符號(hào)G 表示生成的圖片。

      圖2 風(fēng)格遷移案例

      圖像風(fēng)格遷移通常使用一張訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)VGG 網(wǎng)絡(luò)[13]作為算法的基礎(chǔ)。通過神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的淺層學(xué)習(xí)一些較低級(jí)的特征例如圖像的邊界和紋理等,深層學(xué)習(xí)圖像的一些復(fù)雜抽象的特征。為了學(xué)習(xí)得到圖像的特征數(shù)據(jù)比較精確但又不過于苛刻,一般選擇VGG 網(wǎng)絡(luò)的中間的隱藏層作為最后的輸出,效果較好。通常以此計(jì)算代價(jià)函數(shù),然后進(jìn)行反向傳播。

      深度學(xué)習(xí)的各種模型中,LeNet和AlexNet網(wǎng)絡(luò)模型具有較多的優(yōu)點(diǎn),VGG 網(wǎng)絡(luò)繼承了以上兩個(gè)模型中的一些優(yōu)點(diǎn),并且做了適當(dāng)?shù)母倪M(jìn),很大程度提高了其計(jì)算量和計(jì)算結(jié)果的精度。本文采用的是具有有16層的VGG-16模型,這種模型最大的特征是內(nèi)有5 個(gè)卷積組,根據(jù)不同的實(shí)驗(yàn)對(duì)象,每個(gè)卷積組中卷積層數(shù)目的不同就組成了VGG 系列模型,各模型具體結(jié)構(gòu)如圖3所示。

      圖3 VGG網(wǎng)絡(luò)結(jié)構(gòu)

      在研究采用了較為合適的VGG 模型后,便可開始進(jìn)行圖像風(fēng)格遷移[14~15]。圖像風(fēng)格遷移的主要步驟如下:

      1)加載訓(xùn)練好的VGG神經(jīng)網(wǎng)絡(luò);

      2)隨機(jī)初始化生成圖像G;

      3)在VGG 入口處輸入內(nèi)容圖像,標(biāo)記為C,進(jìn)行前向傳播,計(jì)算;再?gòu)脑赩GG 入口處輸入風(fēng)格圖像,標(biāo)記為G,進(jìn)行前向傳播,計(jì)算。最后通過content cost和style cost統(tǒng)計(jì)總的cost;

      4)根據(jù)計(jì)算出的cost,進(jìn)行反向傳播,更新生成圖像G的每個(gè)像素點(diǎn);

      5)重復(fù)3)、4)步一定的次數(shù);

      6)輸出最終的生成圖像G。

      在圖像風(fēng)格遷移中,涉及到內(nèi)容圖像、風(fēng)格圖像和添加白噪聲的圖像。模型首先生成白噪聲圖像,然后依次與指定的內(nèi)容圖像和風(fēng)格圖像之間產(chǎn)生兩個(gè)損失函數(shù),按一定的規(guī)律,將兩個(gè)損失函數(shù)結(jié)合得到總體的損失函數(shù),再通過持續(xù)迭代方法,直到總體的損失函數(shù)最小化為止,就可以得到同時(shí)具有風(fēng)格圖像的特征和內(nèi)容圖像的實(shí)質(zhì)內(nèi)容特征相結(jié)合的圖像,實(shí)驗(yàn)中風(fēng)格化簡(jiǎn)要流程如圖4 所示。

      圖4 圖像風(fēng)格遷移原理

      在構(gòu)建一個(gè)圖像風(fēng)格遷移系統(tǒng)的過程中需要定義一個(gè)代價(jià)函數(shù),通過最小化代價(jià)函數(shù),可以生成所需的風(fēng)格化圖像。圖像風(fēng)格遷移算法的代價(jià)函數(shù)[16]由內(nèi)容代價(jià)部分和風(fēng)格代價(jià)部分的適當(dāng)比例組成,如式(4)所述形式。

      式內(nèi),Jcontent(C,G)為內(nèi)容代價(jià)函數(shù),是用來表示內(nèi)容圖片C 與生成圖片G 之間的相似度,Jstyle(S,G)為風(fēng)格代價(jià)函數(shù),是用來表示風(fēng)格圖片S 與生成圖片G之間的相似度,α,β為超參數(shù),為以上兩者之間的權(quán)重。

      內(nèi)容代價(jià)函數(shù)可以使用隱藏層l來計(jì)算內(nèi)容代價(jià),通常l選擇中間層較好,然后可以比較C 和G 在l層的激活函數(shù)輸出α[l](C)與α[l](G),相應(yīng)的表達(dá)式如式(5)。α[l](C) 與α[l](G) 越相似,Jcontent(C,G) 就越小。通過采用梯度下降算法,系統(tǒng)不斷迭代并修正G的像素值,使Jcontent(C,G)減小。

      考慮風(fēng)格代價(jià)函數(shù)時(shí),研究可以從選取某一層l隱藏層入手,將這一層進(jìn)行深度測(cè)量,圖片的風(fēng)格定義就可表示為l層中各個(gè)通道之間激活項(xiàng)的相關(guān)系數(shù)。將l層的激活項(xiàng)取出,是一個(gè)nH*nH*nC的激活塊,如圖5。關(guān)于求解不同通道之間激活項(xiàng)的相關(guān)系數(shù),可以先將不同通道染成不同的顏色,通過不同顏色的通道的神經(jīng)元在具體圖片中的特定位置能否找到相同特征來判斷各個(gè)通道之間是否具有相關(guān)性,相關(guān)系數(shù)描述的就是圖片中某處出現(xiàn)的特征滿足不同通道間所具有的相同的或類似的特征的可能性。通過將以上獲得的相關(guān)系數(shù)應(yīng)用到風(fēng)格圖片S 和生成圖片G 的對(duì)應(yīng)通道上,比較就能夠得到生成的圖像的風(fēng)格與輸入的風(fēng)格圖像的相似程度。

      圖5 激活塊

      通過計(jì)算風(fēng)格矩陣,來進(jìn)一步測(cè)量風(fēng)格,風(fēng)格圖片測(cè)量過程用式(6)描述。

      式內(nèi),[l]表示第l層的隱藏層,k,k'分別表示不同通道,表示在隱藏層l 中的(i,j,k)位置的激活項(xiàng),其中i,j,k 分別代表該位置的高度、寬度以及對(duì)應(yīng)的通道數(shù),G[l](S) 是一個(gè)nC*nC的矩陣。公式可以計(jì)算第l層隱藏層不同層通道所對(duì)應(yīng)的所有激活函數(shù)輸出和。兩通道相似性高,則對(duì)應(yīng)的較大,兩通道相似性低,則對(duì)應(yīng)的較小。

      同理,生成圖片的風(fēng)格測(cè)量過程用式(7)描述。

      2.3 VGG模型優(yōu)化

      優(yōu)化VGG 模型,減少訓(xùn)練成本、時(shí)間,以及提高圖像不同特征快速識(shí)別精度,更好地實(shí)現(xiàn)風(fēng)格遷移,獲得清晰的圖像。各卷積層的卷積核數(shù)量、全連接層的神經(jīng)元數(shù)量,用{}x1,…,x5,y1,y2描述。卷積運(yùn)算Cov,可使用互相關(guān)函數(shù)進(jìn)行替換,卷積層中,l層第t個(gè)卷積核,用描述,輸入特征圖,用Il描述,二者的卷積計(jì)算過程用式(10)描述:

      式內(nèi),Il的數(shù)量,用T'描述;的規(guī)模,用M、N 描述,其偏置用描述;卷積輸出,用(i,j)描述。本文使用的ReLU函數(shù),用式(11)描述:

      式內(nèi),ReLU激活函數(shù),用f(?)描述。

      式內(nèi),池化區(qū)寬度,用wc描述;池化移動(dòng)步長(zhǎng),用s描述;并且wc大于s。

      針對(duì)卷積層,優(yōu)化其一、二層的功能層結(jié)構(gòu),以減少訓(xùn)練時(shí)間,將歸一化層設(shè)置在池化層后,對(duì)特征圖(i,j)執(zhí)行標(biāo)準(zhǔn)化處理[17],過程用式(13)描述:

      式內(nèi),超參數(shù)用α、β、k、m 描述;l層的卷積核數(shù)量用N描述。

      對(duì)于卷積層,更新第五層的特征圖,使其轉(zhuǎn)化為高維單層神經(jīng)元結(jié)構(gòu),式(14)描述了全連接層中,l層第i個(gè)神經(jīng)元的輸入:

      神經(jīng)元用Cl描述,對(duì)全連接層fc6、fc7 的Cl實(shí)施棄權(quán),以提升模型的泛化能力,過程用式(15)、式(16)描述:

      全連接層fc6、fc7 中,第i 個(gè)神經(jīng)元的ReLU 激活輸出,用表示,其求解過程用式(17)描述:

      使用softmax 函數(shù),求得的全連接層fc8 中,第i個(gè)神經(jīng)元的softmax輸出,用qi表示,其求解過程用式(18)描述:

      損失函數(shù),用L 描述,其為圖像樣本qi的交叉熵,使用Adam優(yōu)化方法訓(xùn)練圖像快速風(fēng)格化模型,式(19)描述了損失函數(shù)的計(jì)算過程:

      2.4 圖像驗(yàn)證碼生成

      通常的圖像的風(fēng)格遷移過程是將需要風(fēng)格化的內(nèi)容圖像作為內(nèi)容輸入來進(jìn)行處理,而自動(dòng)生成的驗(yàn)證碼是部分?jǐn)?shù)字和字母的組合,所以在實(shí)際的實(shí)驗(yàn)中,需要先將隨機(jī)生成的驗(yàn)證碼按一定的要求轉(zhuǎn)換為圖像,然后調(diào)入模型,對(duì)圖像驗(yàn)證碼進(jìn)行風(fēng)格化。文中實(shí)驗(yàn)中應(yīng)用的圖像驗(yàn)證碼均由5 個(gè)字符組成,所涉及的字符為數(shù)字1~9 和所有大寫英文字母,字符數(shù)達(dá)到35 個(gè)之多。通過從字符庫(kù)里任意挑選五個(gè)字符作為一組驗(yàn)證碼,再通過標(biāo)簽格式轉(zhuǎn)換,轉(zhuǎn)換后得到的字符串寫入圖像文件中,以此來獲得驗(yàn)證碼的內(nèi)容圖像,本文采用的圖像格式為PNG。

      圖6 是得到的幾張未經(jīng)過處理的驗(yàn)證碼內(nèi)容圖像,存在一些噪音,其標(biāo)簽分別為326E4、734IX和AZU23。

      圖6 未經(jīng)處理的圖像驗(yàn)證碼

      常用的圖像風(fēng)格遷移與驗(yàn)證碼圖像的風(fēng)格遷移效果會(huì)會(huì)有一些不同,利用上述的驗(yàn)證碼內(nèi)容圖像,通過圖形風(fēng)格遷移技術(shù)進(jìn)行風(fēng)格遷移,隨機(jī)選取其中一張初始的驗(yàn)證碼圖像做實(shí)驗(yàn),其內(nèi)容為AZU23,通過800 次迭代計(jì)算,具體效果如圖7(左邊是初始的驗(yàn)證碼圖像、中間是風(fēng)格特征圖像、右邊是風(fēng)格化的驗(yàn)證碼圖像的實(shí)驗(yàn)結(jié)果。)

      圖7 初始的驗(yàn)證碼圖像、風(fēng)格圖像以及實(shí)驗(yàn)結(jié)果

      因普通圖像能看出大概內(nèi)容即可,對(duì)它的識(shí)別精確度很難有具體確定的值,只是一個(gè)大致范圍,而圖像驗(yàn)證碼的內(nèi)容比較具體,識(shí)別的準(zhǔn)確度可以計(jì)算,所以導(dǎo)致實(shí)驗(yàn)結(jié)果對(duì)生成的驗(yàn)證碼圖像的內(nèi)容信息識(shí)別較弱,風(fēng)格信息較強(qiáng),圖像上的字符清晰度不高,人類識(shí)別可能會(huì)遇到較大的困難。由此說明普通圖像風(fēng)格轉(zhuǎn)換和驗(yàn)證碼風(fēng)格轉(zhuǎn)換有很大的不同,特別是驗(yàn)證碼對(duì)內(nèi)容的完整度和精確度有有一定的要求,細(xì)節(jié)信息也需要較好的保留。因此,對(duì)于驗(yàn)證碼實(shí)驗(yàn)控制迭代的次數(shù)不宜過多,并且,考慮到程序的運(yùn)行時(shí)間問題,迭代次數(shù)可控制在400次即可。

      3 圖像驗(yàn)證碼生成方案

      3.1 生成方案一

      對(duì)于運(yùn)用圖像風(fēng)格遷移技術(shù)來生成圖像驗(yàn)證碼,如果按照對(duì)圖像進(jìn)行風(fēng)格遷移的算法和流程去設(shè)計(jì)的話,內(nèi)容誤差會(huì)較大,因此可以采取對(duì)迭代過程中每次學(xué)習(xí)得到后得到的生成圖像附加一些原圖像特征的方法來影響不斷學(xué)習(xí)后得到的結(jié)果。具體來說,就是改變?cè)瓐D像風(fēng)格遷移中的算法,先對(duì)迭代循環(huán)中生成圖像的那段代碼進(jìn)行優(yōu)化,然后再優(yōu)化VGG 模型并添加系數(shù)。同時(shí),減少迭代的次數(shù),在400 次左右即可停止,以此來生成較為清晰的具有風(fēng)格遷移效果的驗(yàn)證碼。圖8 三幅圖分別為實(shí)驗(yàn)方案的內(nèi)容圖像、風(fēng)格圖像以及風(fēng)格化后的實(shí)驗(yàn)結(jié)果,對(duì)比圖7,清晰度方面有明顯的提升。

      圖8 內(nèi)容圖像、風(fēng)格圖像以及實(shí)驗(yàn)結(jié)果

      3.2 生成方案二

      傳統(tǒng)的圖像驗(yàn)證碼[18]都有一個(gè)共同的缺點(diǎn),就是其大多數(shù)風(fēng)格相似,沒有多少變化,用一種風(fēng)格圖像對(duì)內(nèi)容圖像進(jìn)行風(fēng)格遷移得到的驗(yàn)證碼圖像同樣存在這個(gè)問題。本方案打算將多種風(fēng)格融合到一張圖像上,本方案在方案一的基礎(chǔ)上采取將選取的風(fēng)格圖像利用風(fēng)格遷移技術(shù)進(jìn)行融合獲得一張風(fēng)格多樣的風(fēng)格圖片,并以此再來進(jìn)行風(fēng)格遷移。

      本方案采用雙循環(huán)的代碼設(shè)計(jì),將我們所采用的風(fēng)格圖片放入一個(gè)文件夾內(nèi),并以此開始第一個(gè)循環(huán),將所有風(fēng)格圖片通過風(fēng)格遷移技術(shù)混合生成一張多風(fēng)格的圖片,然后再對(duì)驗(yàn)證碼圖片進(jìn)行風(fēng)格遷移,迭代循壞,生成目標(biāo)圖片。實(shí)驗(yàn)采用了三張風(fēng)格圖片,具體如圖9,從上至下依次為內(nèi)容圖像C、風(fēng)格圖像S以及風(fēng)格化后實(shí)驗(yàn)結(jié)果G。

      圖9 內(nèi)容圖像、風(fēng)格圖像以及實(shí)驗(yàn)結(jié)果

      3.3 生成方案三

      在進(jìn)行圖像風(fēng)格遷移的過程中,容易產(chǎn)生大量噪音,致使圖像模糊不清,不易識(shí)別。因此本方案在方案二的基礎(chǔ)上在生成結(jié)果中再加入一種基于無(wú)監(jiān)督學(xué)習(xí)的全卷積神經(jīng)網(wǎng)絡(luò)的圖像優(yōu)化方法,該方法通過學(xué)習(xí)大量平滑圖片來生成平滑模型,然后調(diào)取模型對(duì)風(fēng)格化圖片進(jìn)行處理。該方法主要通過學(xué)習(xí)到的模型來控制邊界,以此來對(duì)圖像進(jìn)行平滑化處理,優(yōu)化圖片。實(shí)驗(yàn)結(jié)果如圖10。

      圖10 實(shí)驗(yàn)結(jié)果

      4 對(duì)比實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析

      具有良好的安全性和易用性是一個(gè)好的驗(yàn)證碼的基本條件對(duì)于上述方案中生成的驗(yàn)證碼,接下來需要對(duì)其進(jìn)行效果檢測(cè)。主要參數(shù)為兩個(gè),一個(gè)是識(shí)別率;另一個(gè)是識(shí)別效率。通過這兩個(gè)指標(biāo)就可以高效地對(duì)圖像驗(yàn)證碼的區(qū)分效果進(jìn)行整體評(píng)估。在進(jìn)行對(duì)比實(shí)驗(yàn)前需要界定一個(gè)概念,文中前述提出的識(shí)別工具的“正確識(shí)別”,應(yīng)該具有明確的要求,并且可操作性要強(qiáng)。為此本文明確提出所謂正確識(shí)別出一個(gè)圖像驗(yàn)證碼中所有的字符,才能確認(rèn)識(shí)別成功,即使在識(shí)別的過程中錯(cuò)一個(gè)字符也會(huì)被認(rèn)為識(shí)別失敗。

      本文選取兩個(gè)在實(shí)際生活中常用的文字識(shí)別工具來進(jìn)行驗(yàn)證碼的識(shí)別對(duì)比實(shí)驗(yàn)分析,分別是迅捷ocr文字識(shí)別軟件和百度通用文字識(shí)別平臺(tái)。迅捷ocr文字識(shí)別軟件采用OCR 識(shí)別技術(shù),支持JPG、PNG格式的圖像識(shí)別,并且能將識(shí)別內(nèi)容轉(zhuǎn)換為各種文檔格式。這些方面在百度的實(shí)際操作中有廣泛的應(yīng)用,通過深度學(xué)習(xí)技術(shù),并結(jié)合漢字的特點(diǎn),能對(duì)多場(chǎng)景、多語(yǔ)種、高精度的整圖文字進(jìn)行檢測(cè)和識(shí)別服務(wù),多項(xiàng)ICDAR 指標(biāo)居世界首位,特別是針對(duì)圖片模糊、傾斜、翻轉(zhuǎn)等特殊情況可以進(jìn)行合理的專項(xiàng)優(yōu)化,魯棒性強(qiáng)。

      為了體現(xiàn)實(shí)驗(yàn)的實(shí)用性,實(shí)驗(yàn)中選取了兩種已經(jīng)在實(shí)際生活中投入應(yīng)用的驗(yàn)證碼,作為實(shí)驗(yàn)對(duì)比分析參考樣本。驗(yàn)證碼一是武科大研究生管理信息系統(tǒng)平臺(tái)登陸是所顯示的圖像驗(yàn)證碼,此驗(yàn)證碼由四個(gè)數(shù)字和一些線條和圓點(diǎn)組成,圖像中的數(shù)字為黑色,線條為深灰色,圓點(diǎn)為淺灰色,人類對(duì)其識(shí)別容易。圖11 為其部分示例。驗(yàn)證碼二是知網(wǎng)注冊(cè)賬戶時(shí)所顯示的驗(yàn)證碼,驗(yàn)證碼由四個(gè)字符和一些線條組成,圖中字符的顏色從左到右顏色由藍(lán)色向金色漸變,線條為灰色,圖12為其部分示例。

      圖11 驗(yàn)證碼一

      圖12 驗(yàn)證碼二

      分別選取30個(gè)圖像驗(yàn)證碼一和30個(gè)圖像驗(yàn)證碼二,按照前面實(shí)驗(yàn)方案各分別生成30 個(gè)圖像驗(yàn)證碼用于實(shí)驗(yàn),隨后用上述中的兩種識(shí)別工具和隨機(jī)正常人員(共20 人,均為陌生成年人)分別進(jìn)行對(duì)比實(shí)驗(yàn),統(tǒng)計(jì)出它們各自的識(shí)別率和識(shí)別效率,其中人類的識(shí)別數(shù)據(jù)取所有人員的平均數(shù)據(jù)。具體情況如表1。

      表1 識(shí)別產(chǎn)品對(duì)驗(yàn)證碼的識(shí)別率

      表1 列出了各識(shí)別工具和人類對(duì)圖像驗(yàn)證碼的識(shí)別率。由表1 可知,某高校平臺(tái)的驗(yàn)證碼和知網(wǎng)注冊(cè)的驗(yàn)證碼作為現(xiàn)在市場(chǎng)上正在實(shí)際使用的圖像驗(yàn)證碼,一般人員非常易識(shí)別且平均識(shí)別率接近100%,在對(duì)比實(shí)驗(yàn)分析時(shí),這些驗(yàn)證碼對(duì)一般的文字識(shí)別平臺(tái)(迅捷和百度)來說也較好識(shí)別,識(shí)別率也不低。因此,當(dāng)網(wǎng)站受到特定襲擊時(shí),不難預(yù)測(cè),這兩種驗(yàn)證碼對(duì)所在網(wǎng)站的維護(hù)作用相比之下就非常小了。

      相反,由本文實(shí)驗(yàn)中所設(shè)計(jì)的方案通過圖像風(fēng)格化技術(shù)生成的特定的圖像驗(yàn)證碼,實(shí)際生活中一般的文字識(shí)別平臺(tái)(迅捷和百度)識(shí)別率直接幾乎降至0。從實(shí)驗(yàn)結(jié)果來看,人類對(duì)本文方案中生成的驗(yàn)證碼仍保有較高的識(shí)別率,這證明了方案中生成的驗(yàn)證碼對(duì)人類來說還是較為友好的。其中方案一針對(duì)一般的圖像風(fēng)格遷移改進(jìn)了一些算法和系數(shù),方案二則加入了多種風(fēng)格,方案三針對(duì)遷移過程中的噪音問題提出了解決方案,因此可以說明通過不斷改善方案,人類識(shí)別率有了小幅的提高,每一步都取得了一定的效果。

      對(duì)于上述數(shù)據(jù)表,為了體現(xiàn)明顯的識(shí)別率差距,將其轉(zhuǎn)化為柱狀圖,如圖13。

      圖13 識(shí)別產(chǎn)品對(duì)驗(yàn)證碼的識(shí)別率

      上面對(duì)識(shí)別率作了對(duì)比分析,在實(shí)際應(yīng)用和實(shí)驗(yàn)中識(shí)別效率也是一個(gè)關(guān)鍵的衡量標(biāo)準(zhǔn)。表2 中列出了三種識(shí)別產(chǎn)品對(duì)實(shí)驗(yàn)中的圖像驗(yàn)證碼的識(shí)別效率。為了使表格簡(jiǎn)潔便并易于觀察,以字母代替一定的含義,然后用字母替換表格中的描述。

      表2 識(shí)別產(chǎn)品對(duì)驗(yàn)證碼的識(shí)別效率

      由表2 可知,一般的文字識(shí)別平臺(tái)識(shí)別效率較低,多數(shù)情況均比人類的識(shí)別效率低,對(duì)于本文方案中生成的驗(yàn)證碼識(shí)別效率更加低下,且當(dāng)人類識(shí)別錯(cuò)誤時(shí)可以及時(shí)更改,則充分說明了在識(shí)別效率這個(gè)關(guān)鍵指標(biāo)上,由本文實(shí)驗(yàn)方案生成的圖像驗(yàn)證碼同樣擁有對(duì)人類識(shí)別率很高卻對(duì)機(jī)器識(shí)別率低這兩個(gè)重要的基本性質(zhì)。

      通過上述實(shí)驗(yàn)分析可以得出,通過本文實(shí)驗(yàn)方案生成的圖像驗(yàn)證碼,從識(shí)別率和識(shí)別效率這兩個(gè)關(guān)鍵指標(biāo)上看,可以充分證明其擁有合格驗(yàn)證碼的基本性質(zhì),從而達(dá)到了實(shí)驗(yàn)設(shè)計(jì)的各項(xiàng)目標(biāo),并且能夠很好地起到保護(hù)網(wǎng)站的作用。

      5 結(jié)語(yǔ)

      網(wǎng)站的安全問題隨著互聯(lián)網(wǎng)的快速發(fā)展尤為突出。為此,本文研究了圖像風(fēng)格遷移技術(shù),并在其基礎(chǔ)上優(yōu)化VGG 網(wǎng)絡(luò),設(shè)計(jì)多種方案來生成安全易用的驗(yàn)證碼,通過選取市面上的字符識(shí)別工具來對(duì)生成的驗(yàn)證碼進(jìn)行識(shí)別率和識(shí)別效率的檢測(cè),證明方案中生成的驗(yàn)證碼對(duì)人類友好對(duì)機(jī)器不友好,保證了方案設(shè)計(jì)的驗(yàn)證碼在具體實(shí)際應(yīng)用中的安全性。

      猜你喜歡
      風(fēng)格化識(shí)別率卷積
      基于深度神經(jīng)網(wǎng)絡(luò)的圖像風(fēng)格化方法綜述
      基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
      基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測(cè)
      從濾波器理解卷積
      電子制作(2019年11期)2019-07-04 00:34:38
      基于真耳分析的助聽器配戴者言語(yǔ)可懂度指數(shù)與言語(yǔ)識(shí)別率的關(guān)系
      提升高速公路MTC二次抓拍車牌識(shí)別率方案研究
      基于傅里葉域卷積表示的目標(biāo)跟蹤算法
      修拉的點(diǎn)的可能性與不可能性
      淺析插畫造型的風(fēng)格化表現(xiàn)
      東方教育(2016年3期)2016-12-14 20:10:11
      結(jié)合原創(chuàng)漫畫《百鬼夜行》談動(dòng)漫的教學(xué)
      戲劇之家(2016年16期)2016-09-28 18:36:29
      乐都县| 湘潭县| 海口市| 昌乐县| 佳木斯市| 台北市| 靖宇县| 长白| 塔城市| 西藏| 甘德县| 通渭县| 呼伦贝尔市| 绍兴县| 沭阳县| 梨树县| 昌平区| 凉山| 鹤庆县| 即墨市| 长岭县| 融水| 瓮安县| 江陵县| 电白县| 株洲市| 登封市| 郯城县| 休宁县| 乌鲁木齐县| 渭南市| 遂平县| 兴国县| 本溪市| 普安县| 台州市| 洛隆县| 仙居县| 华安县| 泸水县| 富锦市|