周占寧
【摘要】本文對電子商務(wù)中基于內(nèi)容的圖像檢索應(yīng)用進(jìn)行了分析,文章闡述了基于內(nèi)容的圖像檢索技術(shù)的應(yīng)用現(xiàn)狀,并且對基于內(nèi)容的圖像檢索技術(shù)(CBIR)進(jìn)行了研究,最后提出了特征向量提取的要點(diǎn)。
【關(guān)鍵詞】電子商務(wù);基于內(nèi)容的圖像檢索;應(yīng)用現(xiàn)狀;技術(shù);特征提取要點(diǎn)
在現(xiàn)代社會,市場經(jīng)濟(jì)體系得到了不斷的完善,各種新的經(jīng)濟(jì)形式涌現(xiàn)出來,電子商務(wù)就是非常突出的例子。在電子商務(wù)企業(yè)的發(fā)展經(jīng)營中,建立完善的商品運(yùn)營體系是非常重要的,其中要用到大量的信息技術(shù),搭建好信息傳輸、圖像檢索等平臺,使得商家和消費(fèi)者之間形成良好的溝通。
一、基于內(nèi)容的圖像檢索技術(shù)的應(yīng)用現(xiàn)狀
電子商務(wù)購物網(wǎng)站本身具有一定的特別之處,而為了更全面地展現(xiàn)出商品信息,往往是將圖片作為其基本的信息載體。因?yàn)榧夹g(shù)的原因,商品信息的檢索大多是依靠文本標(biāo)注的方法來完成的,而這種標(biāo)注方法雖然能夠獲得比較全面的信息,但是準(zhǔn)確度并不高,這最終降低了商品信息的傳輸和檢索效率。以內(nèi)容為主體的圖像檢索技術(shù)最早是運(yùn)用在一些特殊行業(yè),如公安刑偵的頭像對比、安防工作的指紋對比等等。在商務(wù)工作中,國內(nèi)發(fā)展比較先進(jìn)的圖像搜索引擎是“安圖搜”,它是集傳圖、視覺搜索為一體的全網(wǎng)比較購物搜索引擎。
二、基于內(nèi)容的圖像檢索技術(shù)(CBIR)研究
(一)CBIR技術(shù)概念界定
以內(nèi)容為基礎(chǔ)的圖像檢索技術(shù)將圖像內(nèi)容自身的特點(diǎn)當(dāng)做索引,這就避免了以文本為索引的單一、模糊問題。CBIR是合集成技術(shù),它整合了顏色、紋理、形狀等不同的特征屬性,而這些特征是用向量方式被保存數(shù)據(jù)庫中的,在檢索時,用戶只需要輸入模糊的特征,引擎自行通過匹配計算得到特征結(jié)論,并據(jù)此得到與之相關(guān)的圖像結(jié)果,按照特征相似度的高低,對其按先后進(jìn)行排序、呈現(xiàn)。
(二)商品圖像特征提取層次模型
在圖像數(shù)據(jù)庫中,對目標(biāo)特征進(jìn)行提取,而圖像特點(diǎn)的提取可以歸納為三個層次,其一是可視化層次,其中包括了商品的色彩、紋理、形狀、輪廓等直觀的外在特點(diǎn),這種提取方式最簡單、最直接,使用的頻次也最高。其二是中間對象的層次,這是將圖像的單個地區(qū)或者目標(biāo)物體當(dāng)作索引工具,在操作時技術(shù)難度會更高。其三是高級抽象層次,這是在局部特征提取的前提下所展開的抽象化描述,圖像的語義信息會更豐富,比如給圖像增添的的可以體現(xiàn)情感色彩的部分語義。
(三)組合特征提取算法分析
從電子商務(wù)商品的銷售特點(diǎn)來說,對實(shí)體圖像進(jìn)行呈現(xiàn),可以從多個方面來說,包括顏色、形狀等,所以以內(nèi)容為基礎(chǔ)的圖像搜索方法中,也往往會和多個層次的特點(diǎn)提取操作相聯(lián)系,避免用單一檢索方法所帶來的局限性。而組合特征技術(shù)就是指對顏色、形狀特征向量二者加以聯(lián)合,構(gòu)成一種綜合性的商品特征。借助這種組合性質(zhì)的特征提取方法,可以綜合調(diào)動兩種方法各自的優(yōu)勢。在圖像檢索技術(shù)中,顏色是最常見的特征類型,在確定了具有該種顏色特征的產(chǎn)品范圍后,在此基礎(chǔ)上增加形狀特征等限定詞,縮小搜索范圍,使對象更加精確化。
三、特征向量提取的要點(diǎn)
(一)顏色特征向量提取
對商品來說,顏色本身是商品外在特征上非常重要的一種,而雖然各種商品都有其特定的特點(diǎn),但顏色是圖像內(nèi)容中最基礎(chǔ)的因素之一,并且構(gòu)成了人們辨識圖像的重要感知方式。在圖像的多種特點(diǎn)中,顏色是相對具有穩(wěn)定性的一種?;趦?nèi)容的圖像檢索技術(shù)通常依據(jù)HSV顏色模型算法設(shè)計,在操作時,重點(diǎn)分析圖像的色相(huge)、飽和度(saturation)和色調(diào)(value)三個角度的情況。
(二)形狀特征提取
形狀也是商品非常關(guān)鍵的一大外在特點(diǎn),現(xiàn)在,根據(jù)商品形狀上的區(qū)別,對圖像進(jìn)行檢索,大概可以分成根據(jù)圖像局部形狀特點(diǎn)、以及根據(jù)圖像整體形狀特點(diǎn)進(jìn)行檢索兩種方法。其中,局部的檢索指的是工作人員在提取時,可以得到圖像中商品的部分形狀區(qū)域或形狀邊界等完整信息特征,并且借助該區(qū)域和相關(guān)特征得到完整的圖像內(nèi)容。而這種局部形狀的理念,需要對整個圖像內(nèi)容做細(xì)化處理和適當(dāng)切割,而檢索的范圍也會因此被細(xì)化、受到局限。與之對應(yīng)的,全局化的形狀特征檢索無省略了圖像細(xì)化這個步驟,可以直接借助體現(xiàn)圖像形狀的全局特征向量完成對應(yīng)的圖像檢索工作,這種方法的運(yùn)用,更多地出現(xiàn)在比較大型的通用圖像數(shù)據(jù)庫中。
(三)圖像相似性比對
基于內(nèi)容的圖像檢索技術(shù)主要采用比對兩幅圖像的相似性的檢索方法。在檢索過程中,采用逐步求精的辦法,在匹配需求過程中不斷與用戶進(jìn)行交互。用戶可以瀏覽系統(tǒng)反饋的查詢結(jié)果,相似度最大的商品排在前面。若需進(jìn)一步明確查詢結(jié)果,則可在前期檢索結(jié)果的基礎(chǔ)上通過調(diào)整特征提取方法重新進(jìn)行檢索匹配,直至找到自己心儀的商品為止。目標(biāo)圖像與特征庫中圖像的匹配比對方法就是采用前面計算所得的顏色特征向量和形狀特征向量與特征庫中的數(shù)據(jù)進(jìn)行相似度匹配,通常采用Euclidean距離算法計算。
四、結(jié)語
綜上所述,加強(qiáng)對電子商務(wù)中基于內(nèi)容的圖像檢索應(yīng)用問題的分析,意義重大。相關(guān)工作人員需要明確基于內(nèi)容的圖像檢索技術(shù)的應(yīng)用現(xiàn)狀;并且對基于內(nèi)容的圖像檢索技術(shù)(CBIR)進(jìn)行研究,把握CBIR技術(shù)概念界定、商品圖像特征提取層次模型、組合特征提取算法等等內(nèi)容;在此基礎(chǔ)上,探討特征向量提取的要點(diǎn),如顏色特征向量提取、形狀特征提取、圖像相似性比對等等。
參考文獻(xiàn)
[1]朱林婷,丁榮濤.基于內(nèi)容的圖像檢索在電子商務(wù)中應(yīng)用初探[J].商場現(xiàn)代化,2011(11):138~139.
[2]孫振權(quán),肖詩斌,呂學(xué)強(qiáng).基于內(nèi)容圖像檢索的特征融合技術(shù)研究[J].圖像圖形技術(shù)研究與應(yīng)用,2010(01):156~161.