寧海濤
(長(zhǎng)春工業(yè)大學(xué)人文信息學(xué)院,吉林 長(zhǎng)春 130122)
當(dāng)前國(guó)家的科技水平和計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)處于高速發(fā)展階段,隨之發(fā)展的還有圖像等多媒體領(lǐng)域,隨之而來(lái)的就是圖像數(shù)據(jù)的激增問(wèn)題[1]。圖像數(shù)據(jù)激增后則會(huì)帶來(lái)較高的數(shù)據(jù)管理需求,目前人們面臨著如何實(shí)現(xiàn)對(duì)海量圖像數(shù)據(jù)信息進(jìn)行分析、檢索和提取等問(wèn)題,尤其是多媒體數(shù)據(jù)。相關(guān)學(xué)者針對(duì)這些問(wèn)題作出了很多研究,大體上是基于圖像內(nèi)容的視覺(jué)信息檢索,通過(guò)多媒體圖像對(duì)視覺(jué)內(nèi)容進(jìn)行檢索,例如顏色、形狀、紋理、空間分布和綜合特征等內(nèi)容[2]。在這些視覺(jué)特征中,顏色作為最明顯的圖像特征,是人對(duì)圖像識(shí)別的主要感知特征[3]。另外,該特征經(jīng)過(guò)旋轉(zhuǎn)和縮放都會(huì)保持不變,比其它特征更易獲得。在對(duì)圖像數(shù)據(jù)進(jìn)行檢索時(shí),顏色是使用率最高的特征之一。該領(lǐng)域的學(xué)者為此做了大量實(shí)驗(yàn),同時(shí)得出了很好的圖像檢索方法。
旋轉(zhuǎn)圖像檢索方法。通過(guò)設(shè)計(jì)多種具有旋轉(zhuǎn)和縮放不變性的基元結(jié)構(gòu)描述符號(hào),得到基元過(guò)度矩陣和平均矩陣,對(duì)圖像的紋理和顏色特征進(jìn)行描述,同時(shí)以這兩個(gè)矩陣為基礎(chǔ),采用統(tǒng)計(jì)學(xué)法獲得基元序列和相應(yīng)顏色出現(xiàn)的頻率,最終得到顏色基元共生矩陣作為檢索結(jié)果[4]。結(jié)合顏色特征直方圖和灰度共生矩陣的圖像無(wú)序激增數(shù)據(jù)檢索方法。該方法最終通過(guò)加權(quán)平均法計(jì)算兩個(gè)特征之間的距離,以計(jì)算的距離值為圖像檢索結(jié)果[5]。顏色和紋理特征融合的圖像無(wú)序激增數(shù)據(jù)檢索方法。該方法首先從特定的圖像網(wǎng)格區(qū)域內(nèi)提取兩個(gè)目標(biāo)特征,然后對(duì)每個(gè)顏色值的紋理特征進(jìn)行提取,得到具有旋轉(zhuǎn)和縮放不變性的混合目標(biāo)特征,最終將混合特征的分析結(jié)果視為圖像檢索結(jié)果[6]?;陬伾图y理特征的SVD圖像檢索方法。該方法采用歐幾里德距離對(duì)圖像的相似程度進(jìn)行分析計(jì)算,相似度計(jì)算結(jié)果就是圖像檢索結(jié)果[7]。
傳統(tǒng)方法通常都是將顏色特征和其它顯著特征融合,再對(duì)圖像進(jìn)行檢索。這種融合特征的圖像檢索方法,當(dāng)特征總數(shù)量過(guò)多時(shí),可能會(huì)出現(xiàn)目標(biāo)特征提取不足的情況,導(dǎo)致檢索結(jié)果較差,準(zhǔn)確度低等問(wèn)題,同時(shí)由于提取目標(biāo)特征以及將其融合的過(guò)程較為繁瑣耗時(shí),可能會(huì)影響整體運(yùn)行時(shí)間。為此,提出一種基于分塊主色法的圖像無(wú)序激增數(shù)據(jù)檢索方法。經(jīng)過(guò)仿真證明,該方法具有較好的檢索性能,且運(yùn)行時(shí)間較短,檢索準(zhǔn)確度較高。
2.1分塊主色法主要思想
基于分塊主色法對(duì)圖像進(jìn)行檢索的主要思想:依據(jù)一定策略對(duì)圖像空間進(jìn)行分塊處理,然后計(jì)算每個(gè)圖像分塊的主色調(diào),將其視為該圖像分塊的顏色特征。分塊的主顏色就是在特定分塊中所占像素?cái)?shù)量最大的顏色[8]。在對(duì)圖像進(jìn)行檢索時(shí)第一步驟就是計(jì)算相應(yīng)分塊主色之間距離,第二步采用加權(quán)法對(duì)該距離進(jìn)行累計(jì),并將最終距離視為圖像之間的實(shí)際距離。距離越小,則圖像之間的差異越微弱。
通常來(lái)說(shuō),一幅圖像可以具有大量可以代表圖像主要信息的畫(huà)面。如果在進(jìn)行操作之前沒(méi)有對(duì)圖像相應(yīng)的先驗(yàn)知識(shí)有所了解,那么檢索系統(tǒng)想要對(duì)主要內(nèi)容信息的分布和畫(huà)面尺寸進(jìn)行確定是非常困難的。為了降低圖像檢索的誤差,令多個(gè)代表圖像主要信息的區(qū)域處在一個(gè)分塊內(nèi)。為此,研發(fā)了一種圖像分塊策略:運(yùn)用多個(gè)劃分樣式、尺寸和排列方式拆分圖像,將圖像拆分成小圖像塊。圖像中主題畫(huà)面可能會(huì)包含相鄰的分塊,在劃分之前令相鄰分塊在不同方向上各有特定的重合區(qū)域,分塊的重合區(qū)域選取該分塊尺寸的四分之一或是五分之一。
選用這種分塊方式可以選擇性適應(yīng)不同粒度和不同位置的主體畫(huà)面,這點(diǎn)可以彌補(bǔ)單一分塊方式存在的問(wèn)題和不足之處。
特征選取和匹配的計(jì)算量和難度都會(huì)隨著圖像實(shí)際顏色數(shù)量增加而增大,因此在現(xiàn)實(shí)中采用真實(shí)顏色對(duì)圖像進(jìn)行檢索是不可能實(shí)現(xiàn)的。圖像中的真實(shí)顏色中很多個(gè)色彩將圖像中大部分的像素覆蓋住。如果選用這些顏色對(duì)圖像進(jìn)行表達(dá),可能會(huì)對(duì)圖像的質(zhì)量產(chǎn)生一定影響,但是不會(huì)導(dǎo)致人們對(duì)圖像信息的錯(cuò)誤判斷和分析。這時(shí)就需要通過(guò)在HSV空間中設(shè)定一個(gè)圖像顏色矢量量化公式,對(duì)色彩進(jìn)行集合,該集合應(yīng)該具備同時(shí)反映人的感知和對(duì)圖像原色彩的壓縮。
以HSV非均勻量化為參考,經(jīng)過(guò)對(duì)顏色模型和實(shí)驗(yàn)數(shù)據(jù)的分析,依據(jù)視覺(jué)特點(diǎn)對(duì)亮度Y和飽和度S進(jìn)行非均勻量化,令經(jīng)過(guò)處理的顏色比較能滿足人的視覺(jué)感知。將色調(diào)H空間拆分成11份,拆分S和量度V空間成4份;并按照色彩的不同范圍根據(jù)下式進(jìn)行量化
(1)
(2)
公式中憑借H值獲取了若干個(gè)顏色空間,其中黑色、白色和灰色是色調(diào)H自身不包含的,但圖像受到S和V的影響,會(huì)呈現(xiàn)黑色、白色和灰色,因此需要添加這三種顏色。由此可得到將整個(gè)空間壓縮成的11×4×4個(gè)子空間,用符號(hào)L表示每個(gè)子空間,L的計(jì)算公式如下
L=HQsQv+SQs+V=16H+4S+V
(3)
式中:Qs和Qv分別表示S和V的量化級(jí)數(shù);Qs=Qv=4,L∈[0,176];根據(jù)式(3)可獲得空間中圖像的顏色像素值Pi(h,s,v)所處的子空間Li;同時(shí)計(jì)算圖像中每個(gè)子空間的目標(biāo)像素值,就可得到HSV顏色直方圖。
圖像中的每個(gè)分塊,統(tǒng)計(jì)特征矢量L,并以L的直方圖為依據(jù),選取像素點(diǎn)數(shù)量最多的顏色作為小圖像塊的主顏色,這樣就會(huì)得到一個(gè)綜合空間目標(biāo)向量:L=(L1,L2,…,Ln)。
首先對(duì)小圖像塊主顏色之間的距離進(jìn)行計(jì)算,計(jì)算公式如下
Di(p,q)=|Lpi-Lqi|
(4)
式中,Lpi和Lqi分別表示小圖像塊不同主顏色的特征矢量位置。
然后計(jì)算所有小圖像塊之間距離的加權(quán)和,并將其作為圖像p和圖像q之間的測(cè)量距離,加權(quán)和計(jì)算公式如下
(5)
式中,Wi表示加權(quán)系數(shù)。
圖像顏色和邊緣均是圖像最重要的特征,通過(guò)兩者都可實(shí)現(xiàn)對(duì)圖像檢索[9-10]。如果將二者結(jié)合,將會(huì)減少圖像檢索過(guò)程中出現(xiàn)的誤差。首先對(duì)圖像進(jìn)行拆分,分成4×4的小塊,并對(duì)每個(gè)小圖像塊的權(quán)值ωij進(jìn)行自適應(yīng)設(shè)定,以經(jīng)過(guò)加權(quán)的一維顏色矢量直方圖為圖像目標(biāo)特征,并按照相似度進(jìn)行匹配,以完成圖像的檢索過(guò)程。
將圖像基于邊緣進(jìn)行分割,具體步驟如下:
1)提取圖像的邊緣特征,得到邊緣二值圖像。
2)對(duì)圖像進(jìn)行拆分處理,分成4×4的小塊。
3)對(duì)各個(gè)小塊中白色像素的比例進(jìn)行計(jì)算。
4)對(duì)各個(gè)小塊中白色像素?cái)?shù)量進(jìn)行計(jì)算。
將待檢索圖像和含有主體內(nèi)容的圖像分別用q和t進(jìn)行表示,hq和ht代表兩個(gè)圖像的一維顏色矢量直方圖。D2(q,t)代表兩者之間的歐幾里德距離。計(jì)算步驟如下:
第一步將兩幅圖像均以4×4進(jìn)行拆分,按照兩幅圖像中相應(yīng)小圖像塊的一維顏色矢量直方圖,對(duì)兩幅圖像之間的歐幾里德距離進(jìn)行計(jì)算[11-12],公式表示為
(6)
式中:hij代表經(jīng)過(guò)拆分后圖像處在i行,j列的小塊,m代表顏色經(jīng)過(guò)量化后的值。
第二步對(duì)待檢索圖像中每個(gè)小圖像塊的權(quán)值ωij進(jìn)行設(shè)定。
第三步對(duì)待檢索圖像和含有主體內(nèi)容圖像之間的加權(quán)尺度進(jìn)行計(jì)算。
經(jīng)過(guò)計(jì)算分塊對(duì)應(yīng)權(quán)值之后,可以此為基礎(chǔ),對(duì)待檢索圖像和含有主體內(nèi)容圖像時(shí)間的尺度進(jìn)行計(jì)算,公式如下
然而,跑步運(yùn)動(dòng)為何如此蔚然成風(fēng)?它映射了何種社會(huì)狀況和文化訴求?又具有什么社會(huì)文化意涵?對(duì)此我們需要跳出體育學(xué)的范疇,給予社會(huì)學(xué)的理論觀照。
(7)
對(duì)圖像無(wú)序激增數(shù)據(jù)進(jìn)行檢索的具體步驟如下:
1)將圖像的顏色值轉(zhuǎn)化為HSV空間,并隨其進(jìn)行量化;
2)對(duì)圖像進(jìn)行拆分成小塊,并提取主色調(diào)和各分塊的主色調(diào),將其余顏色進(jìn)行排序,得到各分塊的顏色特征;
3)對(duì)所有圖像和圖像分塊之間的距離進(jìn)行計(jì)算;
4)對(duì)計(jì)算所得的距離進(jìn)行分析,得到最終檢索結(jié)果。
為了驗(yàn)證本文方法具有較高的檢索性能,在設(shè)備配置為:操作系統(tǒng)Windows 10,CPU 3.5GHz,內(nèi)存8GB,運(yùn)行內(nèi)存2GB的計(jì)算機(jī)上創(chuàng)建實(shí)驗(yàn)平臺(tái),采用Matlab數(shù)據(jù)庫(kù)處理系統(tǒng),實(shí)驗(yàn)編程語(yǔ)言選用C++,采用基于MPEG7的Caliph&Emir圖像檢索軟件作為平臺(tái)支持。
實(shí)驗(yàn)對(duì)象采用某圖像數(shù)據(jù)庫(kù)中隨機(jī)挑選的五類(人、車、花、樹(shù)、兔子)圖像,每類圖像選出3張(每張圖像都有10張與之相似的圖像),組成15次檢索,然后將每次檢索的前15張最像似的圖像作為檢索結(jié)果。
C=R/N
A=R/M
(8)
式中:R表示檢索得到的激增數(shù)據(jù)量,N表示整體激增樣本數(shù)據(jù)量,N表示整體樣本數(shù)據(jù)量。
通常來(lái)說(shuō)查全率和查準(zhǔn)率這兩個(gè)值越高,說(shuō)明方法的性能越好,檢索效果越好,反之越差。
采用旋轉(zhuǎn)圖像檢索方法、圖像顏色和紋理特征融合檢索方法與本文檢索方法進(jìn)行對(duì)比實(shí)驗(yàn)(為了使實(shí)驗(yàn)結(jié)果簡(jiǎn)潔易讀取,令方法1、方法2分別代表旋轉(zhuǎn)圖像檢索方法、圖像顏色和紋理特征融合檢索方法),并對(duì)結(jié)果進(jìn)行分析,如表1所示。
表1 三種方法檢索結(jié)果對(duì)比
通過(guò)分析表1可知:在三種方法中,平均查準(zhǔn)率和查全率最低的是旋轉(zhuǎn)圖像檢索方法,該方法主要針對(duì)圖像經(jīng)過(guò)旋轉(zhuǎn)后,再進(jìn)行無(wú)序激增數(shù)據(jù)的檢索,圖像經(jīng)過(guò)旋轉(zhuǎn)后某些特征可能會(huì)發(fā)生一定程度的變化,導(dǎo)致檢索結(jié)果存在一些誤差,因此實(shí)驗(yàn)評(píng)價(jià)指標(biāo)值最低;而圖像顏色和紋理特征融合檢索方法相比,方法1表現(xiàn)得要好一些,該方法平均查準(zhǔn)率和平均查全率的最低值分別為48.6%和44.5%,均低于本文方法;本文方法由于選取特征具有旋轉(zhuǎn)不變形,以該特征為基礎(chǔ)進(jìn)行圖像檢索具有非常穩(wěn)定的結(jié)果,且本文方法將圖像進(jìn)行分塊處理,并依次檢索,該步驟很大程度上提升了方法的檢索精度。
采用三種不同方法對(duì)“人物”圖像進(jìn)行檢索,檢索效果圖如下所示,圖中a為原始圖像,b為旋轉(zhuǎn)圖像檢索方法的檢索效果圖,c為圖像顏色和紋理特征融合檢索方法,d為本文方法檢索效果圖:
圖1 不同方法檢索效果對(duì)比
通過(guò)分析圖1可知:直觀地來(lái)看,三種方法都能檢索出原圖像中的內(nèi)容,但是三種方法檢索出的效果各不相同,經(jīng)方法1處理過(guò)的圖像呈現(xiàn)過(guò)亮的狀態(tài),且顏色像素塊不明顯,存在噪聲干擾;經(jīng)方法2處理過(guò)的圖像,沒(méi)有太多的噪聲干擾,但是顏色像素塊過(guò)于清晰,使得圖像呈現(xiàn)模糊的狀態(tài);經(jīng)本文方法處理的圖像,既能清晰地觀察顏色像素塊,又可以看出圖像受到的干擾較小,由此可知,本文方法具較好的檢索性能。
為進(jìn)一步驗(yàn)證本文檢索方法的性能,對(duì)本文方法與方法1和方法2的檢索耗時(shí)進(jìn)行對(duì)比,結(jié)果如圖2所示:
圖2 檢索耗時(shí)對(duì)比
分析圖2可知,在任意實(shí)驗(yàn)次數(shù)下,本文方法的檢索耗時(shí)均低于其它兩種方法,且差距較大,表明本文基于分塊主色法的圖像無(wú)序激增數(shù)據(jù)檢索方法具有較好的檢索性能,能快速完成無(wú)序激增數(shù)據(jù)檢索。
針對(duì)傳統(tǒng)圖像檢索方法存在的顏色漏檢、檢索效率低和誤差大等問(wèn)題,提出了基于分塊主色法的圖像無(wú)序激增數(shù)據(jù)檢索方法。該方法將圖像的顏色特征作為檢索通道,將圖像分為小塊,顏色像素最多的作為目標(biāo)特征,進(jìn)行圖像無(wú)序激增數(shù)據(jù)的檢索。經(jīng)過(guò)在搭建的試驗(yàn)平臺(tái)上進(jìn)行仿真可以充分證明,所提方法具有較高的準(zhǔn)確度,且檢索效率較高、耗時(shí)短。