• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      面向近重復(fù)文本圖像檢索的三分支孿生網(wǎng)絡(luò)

      2022-06-19 03:23:56許柏祥劉麗邱桃榮
      智能系統(tǒng)學(xué)報(bào) 2022年3期
      關(guān)鍵詞:白化集上分支

      許柏祥,劉麗,邱桃榮

      (南昌大學(xué) 信息工程學(xué)院,江西 南昌 330031)

      隨著通信技術(shù)和圖像獲取設(shè)備的發(fā)展,圖像的數(shù)量迅猛增長(zhǎng),與此同時(shí)出現(xiàn)了大量的近重復(fù)圖像。近重復(fù)圖像是指從同一個(gè)目標(biāo)在不同條件下拍攝得到的圖像,圖像之間在光照、傾斜角度以及視角等各方面均有差異。本文主要研究目標(biāo)為近重復(fù)文本圖像檢索。文本圖像是一種特殊的圖像,其主體內(nèi)容一般為文字。近重復(fù)文本圖像檢索在文本圖像分析與理解中起著非常重要的作用,而且在很多領(lǐng)域有重要應(yīng)用,例如,在建立數(shù)字圖書(shū)館過(guò)程中,大量紙質(zhì)文檔被掃描或拍攝,并以圖像格式存儲(chǔ)。由于同一個(gè)紙質(zhì)文檔可能分散在多處,經(jīng)常出現(xiàn)將同一個(gè)紙質(zhì)文檔進(jìn)行多次掃描的情況,產(chǎn)生了近重復(fù)文本圖像。這樣一來(lái),不僅導(dǎo)致了冗余,占用了大量的磁盤(pán)空間,而且給后續(xù)建立索引等工作帶來(lái)不便。因此,研究一種有效的近重復(fù)文本圖像檢索方法至關(guān)重要。

      由于近重復(fù)文本圖像之間在視角以及光照等方面存在差異,給近重復(fù)文本圖像檢索帶來(lái)很大的挑戰(zhàn)。一般來(lái)說(shuō),近重復(fù)文本圖像檢索分為兩個(gè)步驟,即圖像特征提取以及相似度計(jì)算。其中,特征提取是關(guān)鍵,提取的特征應(yīng)對(duì)近重復(fù)文本圖像之間存在的各種變換均具有良好的魯棒性。基于所提取的特征,可以采用不同的相似度計(jì)算方法,例如歐氏距離、余弦距離等[1]。

      本文將卷積神經(jīng)網(wǎng)絡(luò)[2](convolutional neural network,CNN)應(yīng)用于近重復(fù)文本圖像檢索這一研究領(lǐng)域,提出一種基于三分支孿生卷積神經(jīng)網(wǎng)絡(luò)的近重復(fù)文本圖像檢索方法,3 個(gè)分支共享權(quán)重。訓(xùn)練時(shí)網(wǎng)絡(luò)輸入為一個(gè)三元組,包括查詢圖像、查詢圖像的近重復(fù)圖像以及查詢圖像的非近重復(fù)圖像。通過(guò)采用三元損失使得查詢圖像和近重復(fù)圖像之間的距離小于其與非近重復(fù)圖像之間的距離。本文提出的方法能夠自動(dòng)學(xué)習(xí)近重復(fù)文本圖像之間存在的各種變換,包括圖像旋轉(zhuǎn)、投影變換以及光照變化等。所提取的特征具有良好的魯棒性,在新建的兩個(gè)近重復(fù)文本圖像數(shù)據(jù)集上取得了較好的結(jié)果。

      1 研究現(xiàn)狀

      現(xiàn)有近重復(fù)文本圖像檢索方法主要采用手工特征描述圖像。早期研究通常采用文本圖像中的字符來(lái)描述圖像[3-4]。例如,Spitz[3]首先分割出文本圖像中的所有字符,接下來(lái)將字符根據(jù)其形狀進(jìn)行編碼,進(jìn)而將圖像表示為一個(gè)字符串,接下來(lái)采用Levenshtein 距離計(jì)算圖像之間的相似度。然而字符分割本身就是一個(gè)難題,經(jīng)常出現(xiàn)字符黏連或者過(guò)分割等現(xiàn)象,導(dǎo)致后續(xù)檢索失敗。為了解決該問(wèn)題,學(xué)者們直接利用文本圖像中的詞作為特征[5-7],從而避免了字符分割這一問(wèn)題。例如,Nakai 等[5]提出一種名為L(zhǎng)LAH (locally likely arrangement hashing)的近重復(fù)文本圖像檢索方法,將圖像中每個(gè)詞的中心點(diǎn)作為特征點(diǎn),對(duì)于每個(gè)特征點(diǎn),根據(jù)其與相鄰特征點(diǎn)之間的空間位置關(guān)系定義多個(gè)仿射不變量。利用詞作為特征只能應(yīng)用于印刷體文本圖像,在手寫(xiě)體文本圖像中,如何準(zhǔn)確地將詞分割出來(lái)目前仍然是個(gè)難題。除了字符和詞,文本圖像的布局由于其具有較強(qiáng)的描述能力也被用于近重復(fù)文本圖像檢索[8-9]。提取圖像的布局需要對(duì)圖像進(jìn)行分割,然而圖像分割本身是一個(gè)極具挑戰(zhàn)的問(wèn)題。此外,SIFT (scaleinvariant feature transform)等局部特征[10]由于其對(duì)圖像變換,如旋轉(zhuǎn)、縮放以及一定程度的仿射變換均具有良好的魯棒性,也被用于近重復(fù)文本圖像檢索[11]。但正如文獻(xiàn)[12]所述,文本圖像中由于部分文字經(jīng)常反復(fù)出現(xiàn)給關(guān)鍵點(diǎn)匹配帶來(lái)很大干擾。近年來(lái),CNN 迅猛發(fā)展,在很多領(lǐng)域具有廣泛應(yīng)用,例如圖像分類[13]、目標(biāo)檢測(cè)以及跟蹤[14]等。目前已有學(xué)者將CNN 應(yīng)用于解決近重復(fù)非文本圖像檢索[15-19],主要包括自然場(chǎng)景圖像以及建筑物圖像等。例如,Babenko 等[15-16]采用CNN 作為特征提取器,比較了網(wǎng)絡(luò)中不同層在描述圖像方面的差異,以及微調(diào)對(duì)近重復(fù)圖像檢索性能的影響,并且基于卷積層提出一種SPoC(sum pooling of convolutions)特征用于描述圖像。Min 等[17]設(shè)計(jì)了一個(gè)包含兩種不同損失函數(shù)的網(wǎng)絡(luò),并且提出了一個(gè)新的網(wǎng)絡(luò)層RGMP。Husain 等[18]提出了一種名為ACTNET 的網(wǎng)絡(luò),其融合了網(wǎng)絡(luò)中不同層來(lái)表示圖像。Gordo 等[19]將R-MAC[20]嵌入到孿生卷積神經(jīng)網(wǎng)絡(luò)中,最終以端到端的形式生成圖像特征。

      2 本文提出的方法

      據(jù)我們所知,目前還沒(méi)有研究將CNN 應(yīng)用于近重復(fù)文本圖像檢索這一領(lǐng)域。本文提出一種基于三分支孿生網(wǎng)絡(luò)的近重復(fù)文本圖像檢索方法,創(chuàng)新點(diǎn)主要體現(xiàn)在如下兩個(gè)方面:

      1)將CNN 應(yīng)用于近重復(fù)文本圖像檢索這一領(lǐng)域,能自動(dòng)學(xué)習(xí)近重復(fù)文本圖像之間存在的各種變換,包括圖像旋轉(zhuǎn)、投影變換以及光照變化等,進(jìn)而避免了傳統(tǒng)手工提取特征容易受到人主觀性的影響,而且通常無(wú)法考慮到近重復(fù)文本圖像之間存在的所有變換這一問(wèn)題。

      2)所提出的三分支孿生網(wǎng)絡(luò)專門(mén)針對(duì)近重復(fù)文本圖像檢索這一任務(wù)而設(shè)計(jì)。通過(guò)采用三元損失,可以保證查詢圖像和近重復(fù)圖像之間的距離小于其與非近重復(fù)圖像之間的距離。

      2.1 網(wǎng)絡(luò)結(jié)構(gòu)

      網(wǎng)絡(luò)結(jié)構(gòu)如圖1(a)所示,網(wǎng)絡(luò)輸入為一個(gè)三元組,包括查詢圖像、查詢圖像的近重復(fù)圖像以及查詢圖像的非近重復(fù)圖像。每個(gè)圖像分別經(jīng)過(guò)一個(gè)分支,每個(gè)分支由卷積層、高斯加權(quán)SPoC 池化以及后處理構(gòu)成,3 個(gè)分支共享權(quán)重。網(wǎng)絡(luò)中每個(gè)組成部分具體介紹如下。

      圖1 本文提出的三分支孿生網(wǎng)絡(luò)Fig.1 Our proposed convolutional siamese network

      2.1.1 卷積層

      每個(gè)分支首先中采用VGG-16[21]作為骨干網(wǎng)絡(luò),并且去掉VGG-16 中的全連接層,具體結(jié)構(gòu)如圖2 所示。假設(shè)輸入一個(gè)224×224×3 的圖像,則最終得到512 個(gè)大小為14×14 的特征圖。

      圖2 VGG-16 網(wǎng)絡(luò)卷積層Fig.2 Convolutional layers in VGG-16

      2.1.2 高斯加權(quán)SPoC 池化

      基于卷積層,本文采用SPoC 池化方法將其聚合為一個(gè)緊湊的特征向量。具體來(lái)說(shuō),令VGG-16 最后一個(gè)卷積層具有N個(gè)大小為H×W的特征圖Pn(n=1,2,···,N),Pn[i,j]代表第n個(gè)特征圖中第i行第j列的值(1≤i≤H,1≤j≤W)。使用SPoC 池化將得到一個(gè)N維的向量:f=[f1f2···fN],其中fn(n=1,2,···,N)定義為

      此外,鑒于文本圖像有效信息大部分都在圖像中間部分,在進(jìn)行SPoC 池化時(shí)加入高斯加權(quán),即將式(1)修改為

      其中G(i,j)定義為

      根據(jù) 3σ 準(zhǔn)則,將 σ的值設(shè)置為圖像中心和最近邊界距離的三分之一:

      2.1.3 后處理

      本文采用的后處理流程為l2歸一化、PCA 白化[22]以及再次l2歸一化,該特征后處理方法被廣泛使用并取得了良好的性能[16]。

      1)l2歸一化:給定特征向量f,進(jìn)行l(wèi)2歸一化后為f′,則:

      2)PCA 白化:可以降低特征之間的相關(guān)性,在網(wǎng)絡(luò)中可以利用減均值和全連接層來(lái)實(shí)現(xiàn)[19]。

      2.2 三元損失函數(shù)

      網(wǎng)絡(luò)訓(xùn)練時(shí)采用三元損失函數(shù),定義如下:

      式中:(I,I+,I?)為輸入的三元組,令I(lǐng)、I+、I?分別表示查詢圖像、查詢圖像的近重復(fù)圖像以及查詢圖像的非近重復(fù)圖像;f、f+、f?分別為I、I+、I?經(jīng)過(guò)網(wǎng)絡(luò)之后得到的特征;m是一個(gè)經(jīng)驗(yàn)閾值。利用該三元損失函數(shù),可以保證查詢圖像與近重復(fù)圖像之間距離小于查詢圖像與非近重復(fù)圖像之間距離。

      利用訓(xùn)練好的三分支孿生網(wǎng)絡(luò),可以提取任意圖像的特征。具體來(lái)說(shuō),將圖像輸入三分支中的任意一個(gè)分支,即可得到該圖像的特征向量,如圖1(b)所示。

      檢索時(shí),首先利用本文提出的網(wǎng)絡(luò)提取查詢圖像以及圖像庫(kù)中圖像的特征向量,接下來(lái)利用歐氏距離計(jì)算查詢圖像與圖像庫(kù)中每個(gè)圖像的相似度,距離越小則認(rèn)為相似度越高,并且按照相似度從高到低進(jìn)行排序。

      3 實(shí)驗(yàn)及結(jié)果分析

      3.1 數(shù)據(jù)集

      由于目前沒(méi)有公開(kāi)的近重復(fù)文本圖像數(shù)據(jù)集,本文自建了2 個(gè)近重復(fù)文本圖像數(shù)據(jù)集,即NDDoc_ENG 和NDDoc_CN,分別包括英文和中文文本圖像。文本圖像傳統(tǒng)獲取方式為采用掃描儀進(jìn)行掃描。隨著智能手機(jī)的普及,手機(jī)拍攝圖像越來(lái)越多。在本文自建數(shù)據(jù)集中,不僅包括掃描圖像,而且包括手機(jī)拍攝圖像。相比較掃描圖像,手機(jī)拍攝圖像經(jīng)常存在旋轉(zhuǎn),光照不均以及投影變換等問(wèn)題,給后續(xù)圖像檢索帶來(lái)很大挑戰(zhàn)。每個(gè)數(shù)據(jù)集的具體細(xì)節(jié)如下:

      1)NDDoc_ENG 數(shù)據(jù)集

      該數(shù)據(jù)集共包含2 596 個(gè)英文文本圖像,分為518 組,每組有5~6 個(gè)圖像,為近重復(fù)文本圖像。具體來(lái)說(shuō),每組第1 個(gè)圖像由PDF 版電子書(shū)中的一頁(yè)轉(zhuǎn)換得到,接下來(lái)將其打印出來(lái),用手機(jī)對(duì)其進(jìn)行不同角度的拍攝獲得3~4 個(gè)圖像。此外,利用掃描儀掃描得到1 個(gè)圖像。所有圖像均為灰度圖,格式為JPG,尺寸為750 像素×1 200 像素。圖3 給出了一組近重復(fù)英文文本圖像示例。

      人工成本是指企業(yè)在一定時(shí)期內(nèi),在生產(chǎn)、經(jīng)營(yíng)和提供勞務(wù)活動(dòng)中因使用勞動(dòng)力而支付的所有直接費(fèi)用和間接費(fèi)用的總和,是企業(yè)總成本的組成部分,范圍包括:工資總額、社會(huì)保險(xiǎn)費(fèi)用、福利費(fèi)用、教育經(jīng)費(fèi)、勞動(dòng)保護(hù)費(fèi)用、住房費(fèi)用和其他人工成本。其中,工資總額是人工成本的主要組成部分。企業(yè)做好人工成本管理,根本目的是有效控制人工成本的構(gòu)成與比例,提高人工成本的投入產(chǎn)出效率,達(dá)到企業(yè)和員工雙贏的效果。

      圖3 NDDoc_ENG 數(shù)據(jù)集上一組近重復(fù)圖像示例Fig.3 A sample group of images from NDDoc_ENG dataset

      2)NDDoc_CN 數(shù)據(jù)集

      該數(shù)據(jù)集共包含2 710 個(gè)中文文本圖像,分為542 組,每組有5 個(gè)圖像,為近重復(fù)文本圖像,圖像的獲取方式和上述近重復(fù)英文文本圖像相似。圖4 給出了一組近重復(fù)中文文本圖像示例。

      圖4 NDDoc_CN 數(shù)據(jù)集上一組近重復(fù)圖像示例Fig.4 A sample group of images from NDDoc_CN dataset

      從圖3 和圖4 中可以看出,近重復(fù)文本圖像之間在旋轉(zhuǎn)角度、光照以及視角等方面均存在差異。將每個(gè)數(shù)據(jù)集中的圖像以組為單位,按照6:2:2 的比例隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集與測(cè)試集,訓(xùn)練集主要用于訓(xùn)練本文提出的三分支孿生網(wǎng)絡(luò),驗(yàn)證集用于確定網(wǎng)絡(luò)中的學(xué)習(xí)率等超參數(shù),接下來(lái)將在驗(yàn)證集上取得最優(yōu)結(jié)果的參數(shù)應(yīng)用于測(cè)試集上。

      本文將訓(xùn)練集、驗(yàn)證集與測(cè)試集隨機(jī)劃分5 次,采用測(cè)試集上的平均mAP[23]作為評(píng)價(jià)指標(biāo)。具體來(lái)說(shuō),在測(cè)試集上,用每組的第一個(gè)圖像作為查詢圖像進(jìn)行檢索,計(jì)算該查詢圖像和其他圖像之間的相似度,根據(jù)相似度大小由高到低排序。該查詢圖像的近重復(fù)圖像排序越靠前,mAP 值越高。

      3.2 實(shí)現(xiàn)細(xì)節(jié)

      本文首先對(duì)訓(xùn)練集進(jìn)行擴(kuò)充。具體來(lái)說(shuō),針對(duì)訓(xùn)練集上的每一組圖像,通過(guò)改變光照以及視角的方式進(jìn)行數(shù)據(jù)增強(qiáng),使得每一組圖像的數(shù)量達(dá)到600~700 個(gè),訓(xùn)練集中圖像總數(shù)擴(kuò)充為20 萬(wàn)。如2.1 節(jié)所述,每個(gè)三元組包括一個(gè)查詢圖像,該圖像的近重復(fù)圖像和該圖像的非近重復(fù)圖像。為了產(chǎn)生三元組用于訓(xùn)練本文提出的三分支孿生網(wǎng)絡(luò),首先在訓(xùn)練集上隨機(jī)生成大量的三元組,并且利用式(6)計(jì)算損失,接下來(lái)根據(jù)損失大小進(jìn)行降序排序,選取前M個(gè)三元組作為網(wǎng)絡(luò)的輸入。這樣的做法可以保證在反向傳播時(shí)得到更大的梯度,加快網(wǎng)絡(luò)的訓(xùn)練。本文中,實(shí)驗(yàn)M取值為96 000。

      本文提出的三分支孿生網(wǎng)絡(luò)中,卷積層和PCA 白化層是可訓(xùn)練的。為了初始化卷積層,將訓(xùn)練集上的每一組圖像看成一類,訓(xùn)練一個(gè)用于分類的VGG-16,接下來(lái)用訓(xùn)練好的網(wǎng)絡(luò)初始化卷積層。PCA 白化層利用訓(xùn)練集上學(xué)習(xí)的PCA白化矩陣進(jìn)行初始化。本文提出的網(wǎng)絡(luò)可以接受任意尺寸的圖像,minibatch 設(shè)置為32,學(xué)習(xí)率設(shè)置為0.001,實(shí)驗(yàn)使用的GPU 顯卡型號(hào)為NVIDIA Tesla P100。

      3.3 不同池化方法對(duì)檢索性能的影響

      圖5 不同池化方法的性能比較Fig.5 Performance comparison between different pooling techniques

      3.4 PCA 白化層對(duì)檢索性能的影響

      為了驗(yàn)證本文提出網(wǎng)絡(luò)中PCA 白化層的有效性,比較了有無(wú)PCA 白化層時(shí)的檢索性能,以及有PCA 白化層時(shí)不降維與降至256 維的結(jié)果,具體如表1 所示??梢钥闯霾捎肞CA 白化層可以大大提高mAP,主要原因在于其降低了特征之間的相關(guān)性。當(dāng)降至256 維時(shí),mAP 比不降維時(shí)有所下降,但依然高于無(wú)PCA 白化層時(shí)的結(jié)果。

      表1 有無(wú)PCA 白化層的性能比較Table 1 Performance with and without PCA whitening layers %

      3.5 m 取不同值時(shí)對(duì)檢索性能的影響

      圖6 中給出了m取不同值時(shí)的檢索結(jié)果,可以看出,在數(shù)據(jù)集NDDoc_CN 上,當(dāng)m=1.4 時(shí),檢索效果最好;在數(shù)據(jù)集NDDoc_ENG 上,當(dāng)m=1.1時(shí),檢索效果最好。

      圖6 mAP 隨m 的變化曲線Fig.6 mAP w.r.t.different values of m.

      3.6 訓(xùn)練不同數(shù)目epoch 對(duì)檢索性能的影響

      圖7 中給出訓(xùn)練不同數(shù)目epoch 時(shí)檢索性能的變化,可以看出,在數(shù)據(jù)集NDDoc_CN 上,訓(xùn)練18 個(gè)epoch 時(shí)取得了最高的mAP,即98.76%。而在數(shù)據(jù)集NDDoc_ENG 上,訓(xùn)練11 個(gè)epoch 時(shí)取得了最高的mAP,即96.50%。

      圖7 mAP 隨epoch 數(shù)目的變化曲線Fig.7 mAP w.r.t.different number of epochs

      3.7 與現(xiàn)有方法比較

      為了驗(yàn)證本文提出方法的有效性,將其與現(xiàn)有近重復(fù)圖像檢索方法進(jìn)行比較。具體來(lái)說(shuō),將本文提出方法與文獻(xiàn)[5,8,11,15,17-19]中的方法進(jìn)行比較。其中文獻(xiàn)[5,8,11]采用傳統(tǒng)手工特征進(jìn)行近重復(fù)文本圖像檢索。而文獻(xiàn)[15,17-19]中均采用基于CNN 的方法。在兩個(gè)數(shù)據(jù)集上的具體比較結(jié)果如表2 所示。

      表2 本文提出方法與現(xiàn)有方法檢索性能比較Table 2 Performance comparison between our proposed approach and the other approaches %

      根據(jù)表2,可以得出如下結(jié)論:

      1)對(duì)于傳統(tǒng)基于手工特征的近重復(fù)文本圖像檢索方法:文獻(xiàn)[5,8,11]分別利用文字之間的空間位置關(guān)系、布局以及關(guān)鍵點(diǎn)來(lái)表示圖像。其中,文獻(xiàn)[5]中的方法在英文數(shù)據(jù)集NDDoc_ENG 上取得了最高的mAP,然而,在中文數(shù)據(jù)集NDDoc_CN 上的性能很差,主要原因在于對(duì)于印刷體中文文本圖像來(lái)說(shuō),文字為方塊字,大小基本一致,并且文字之間沒(méi)有空格,進(jìn)而使得文字之間的空間位置關(guān)系具有較低的區(qū)分度[24]。

      2)對(duì)于采用CNN 的方法,根據(jù)文獻(xiàn)[15,17-19]的實(shí)驗(yàn)結(jié)果可知,它們?cè)诮貜?fù)非文本圖像檢索中具有良好的性能。然而,本文提出的方法在近重復(fù)文本圖像檢索方面優(yōu)于其他幾個(gè)方法。此外,文獻(xiàn)[19]中的方法將RMAC 池化嵌入到孿生卷積神經(jīng)網(wǎng)絡(luò)中,在兩個(gè)數(shù)據(jù)集上的mAP 分別為69.62%和48.07%,遠(yuǎn)遠(yuǎn)低于本文提出方法。由此可以看出,SPoC 池化方法更適合文本圖像。

      3)本文所提出的三分支孿生網(wǎng)絡(luò)專門(mén)針對(duì)近重復(fù)文本圖像檢索這一任務(wù)而設(shè)計(jì)。所提取的特征對(duì)近重復(fù)文本圖像之間存在的旋轉(zhuǎn)、投影變換以及光照變化具有良好的魯棒性,在中英文兩個(gè)數(shù)據(jù)集上均取得了令人滿意的效果,mAP 分別達(dá)到了98.76%和96.50%。

      3.8 大規(guī)模檢索

      為了進(jìn)一步驗(yàn)證本文提出的近重復(fù)文本圖像檢索方法在大規(guī)模數(shù)據(jù)集下的性能,將測(cè)試集中分別增加10 000、20 000 以及30 000 個(gè)圖像作為干擾,這些圖像均來(lái)自RVL-CDIP 數(shù)據(jù)集[25],實(shí)驗(yàn)結(jié)果如表3 所示。從表中可以看出,隨著干擾圖像數(shù)量的增加,mAP 有所下降,但仍然具有較好的檢索效果。

      表3 測(cè)試集加入干擾后的mAPTable 3 mAP of the proposed approach after adding different quantities of distractors to the test set %

      4 結(jié)束語(yǔ)

      本文提出了一種基于三分支孿生網(wǎng)絡(luò)的近重復(fù)文本圖像檢索方法,可以自動(dòng)學(xué)習(xí)近重復(fù)文本圖像之間存在的各種變換。訓(xùn)練時(shí)網(wǎng)絡(luò)輸入為一個(gè)三元組,包括查詢圖像、查詢圖像的近重復(fù)圖像以及查詢圖像的非近重復(fù)圖像。網(wǎng)絡(luò)中每個(gè)分支包括卷積層、高斯加權(quán)SPoC 池化以及后處理,三個(gè)分支共享權(quán)重。通過(guò)采用三元損失使得查詢圖像和近重復(fù)圖像之間的距離小于其與非近重復(fù)圖像之前的距離。訓(xùn)練好后,可以將任意圖像輸入網(wǎng)絡(luò)的一個(gè)分支提取特征,所提取的特征對(duì)近重復(fù)文本圖像之間存在的各種變換具有良好的魯棒性。由于目前沒(méi)有公開(kāi)的近重復(fù)文本圖像數(shù)據(jù)集,本文新建了2 個(gè)近重復(fù)文本圖像數(shù)據(jù)集,包括不同語(yǔ)言并且近重復(fù)文本圖像之間在光照以及視角等方面均有較大的差異。本文提出的方法在兩個(gè)數(shù)據(jù)集上均取得了令人滿意的結(jié)果。

      猜你喜歡
      白化集上分支
      白化黃喉擬水龜人工培育研究①
      Cookie-Cutter集上的Gibbs測(cè)度
      最嚴(yán)重白化
      鏈完備偏序集上廣義向量均衡問(wèn)題解映射的保序性
      巧分支與枝
      一類擬齊次多項(xiàng)式中心的極限環(huán)分支
      復(fù)扇形指標(biāo)集上的分布混沌
      白化茶種質(zhì)資源分類研究
      茶葉(2015年3期)2015-12-13 06:31:06
      白化和紫化茶種質(zhì)資源開(kāi)發(fā)進(jìn)展
      生成分支q-矩陣的零流出性
      肃南| 红安县| 从化市| 盖州市| 罗甸县| 册亨县| 慈溪市| 永泰县| 长宁区| 建始县| 三河市| 萨迦县| 卓资县| 瑞安市| 油尖旺区| 河北区| 乐陵市| 顺义区| 贵南县| 天津市| 巴中市| 陕西省| 武城县| 文化| 讷河市| 星子县| 丽水市| 遵义市| 莒南县| 宣威市| 邻水| 察隅县| 龙泉市| 泗洪县| 周至县| 忻城县| 商洛市| 来宾市| 乐至县| 陵水| 台中市|