李麗麗
(順德職業(yè)技術(shù)學(xué)院,順德 528300)
數(shù)據(jù)驅(qū)動下的圖像智能處理技術(shù)發(fā)展研究
李麗麗
(順德職業(yè)技術(shù)學(xué)院,順德 528300)
本文論述對數(shù)據(jù)驅(qū)動下的圖像進(jìn)行表達(dá)和分析,簡要分析圖像內(nèi)容獲取的兩個步驟,分析數(shù)據(jù)驅(qū)動的圖像智能編輯,希望為我國圖像智能處理技術(shù)的提升做出貢獻(xiàn)。
數(shù)據(jù)驅(qū)動 圖像處理 智能處理技術(shù)
近些年,隨著互聯(lián)網(wǎng)以及數(shù)字多媒體的不斷創(chuàng)新,相關(guān)技術(shù)人員將兩者相互融合,從而很大程度上擴(kuò)大了線上可視媒體規(guī)模??梢暶襟w包括圖像、視頻和數(shù)字幾何等,其中圖像作為最直觀的信息載體,可調(diào)動所有用戶的視覺,傳達(dá)出最有效的信息。然而,如何采取有效手段從大量數(shù)據(jù)信息中抓取和分析視覺內(nèi)容,是值得深入探索的問題。同時,提高圖像智能處理的技術(shù)也是我國正面對的挑戰(zhàn)。
眾所周知,互聯(lián)網(wǎng)中包含的圖像數(shù)據(jù)和信息非常多,并且大多信息沒有順序,多數(shù)信息的質(zhì)量也不高,還夾雜著大量沒有相關(guān)性的信息,給用戶尋找所需信息增加了難度。因此,急需一種智能圖像理解方法,以便從繁雜的圖像中提取和分析視覺內(nèi)容,從而對提取出的有效視覺內(nèi)容進(jìn)行處理。
1.1 圖像內(nèi)容的表達(dá)方法
一直以來,對圖像內(nèi)容進(jìn)行有效抽取和表達(dá)都是相關(guān)技術(shù)人員積極探索的問題。為了使提取出的內(nèi)容有緊湊的效果,且將圖像描述和表達(dá)地更加精準(zhǔn),相關(guān)技術(shù)人員都在針對魯棒效應(yīng)進(jìn)行探索。針對提取圖像這一方面,相關(guān)技術(shù)人員先后探索出GIST特征描述方法、基于直方圖對比度方法、基于區(qū)域?qū)Ρ榷鹊娘@著性提取方法。其中,第一種方法主要從圖像的顏色和梯度分布等特征的角度對整個圖像進(jìn)行描述,第二種方法主要利用視覺顯著性區(qū)域?qū)D像進(jìn)行描述,而第三種方法將視覺顯著性與空間關(guān)系相結(jié)合,主要用于提取出對象外形輪廓,準(zhǔn)確性更高,且具有自動提取的功能。如今,由于研究人員的不斷主動探索,研究人員Hu探索出一種新的圖像結(jié)構(gòu)表達(dá)方法,即片網(wǎng)。這種結(jié)構(gòu)表達(dá)方法可將某一區(qū)域用具有代表性的片進(jìn)行標(biāo)示,進(jìn)而將這些區(qū)域用某種方式聯(lián)系起來,形成層次結(jié)構(gòu),最終實現(xiàn)對整個圖像的描述。片網(wǎng)的結(jié)構(gòu)如圖1所示。
圖1 片網(wǎng)對于一幅圖像的表達(dá)
1.2 數(shù)據(jù)驅(qū)動的圖像內(nèi)容分析
以數(shù)據(jù)驅(qū)動方法為工具,針對傳統(tǒng)的圖像內(nèi)容分析問題,取得了較大進(jìn)展。其中,成就最大的是算法性能。例如,研究人員通過探索發(fā)現(xiàn),可利用三維模型庫將二維圖像做出并形成對比,對比內(nèi)容包括形狀與結(jié)構(gòu),從而達(dá)到對圖像深度信息進(jìn)行估算的效果。與此同時,分析圖像庫中的物體形狀和外觀特征也非常必要。針對這一問題可采用科學(xué)的方法,如在數(shù)據(jù)集中應(yīng)用機(jī)器學(xué)習(xí)的方法。該種方法可提高對象的分析能力,也可對同類物體所有外形特征的子空間進(jìn)行學(xué)習(xí),從而將其內(nèi)在視覺屬性更精準(zhǔn)地刻畫出來,且這種方法不受物體發(fā)生變形的影響。在這個互聯(lián)網(wǎng)圖像技術(shù)極其發(fā)達(dá)的年代,相關(guān)技術(shù)人員逐漸將注意力轉(zhuǎn)移到理解用戶意圖方面。因此,手繪草圖的方法應(yīng)運而生。這不但可以很好地理解用戶意圖,而且很大程度上提高了草圖交互方法的智能性。
近幾年,圖像內(nèi)容的表達(dá)和分析方法已有很大進(jìn)展,打破了傳統(tǒng)方法中的禁錮,將重點轉(zhuǎn)移至對圖像語義內(nèi)容的智能提取和對圖像庫中圖像結(jié)構(gòu)、關(guān)系的挖掘。然而,這種方法仍受到目前科學(xué)技術(shù)水平的限制,運行時分析效率不高。因此,仍需要相關(guān)技術(shù)人員不斷地挖掘和探索。
2.1 對圖像進(jìn)行檢索
對圖像進(jìn)行檢索,使用的方法大多與圖片顏色、紋理和梯度有關(guān)。例如,支持向量機(jī)的機(jī)器學(xué)習(xí)方法。從圖像檢索方法橫空出世至今,圖像檢索方法二十年的時間內(nèi)取得了非常大的進(jìn)展。例如,1995年出現(xiàn)的多尺度圖像檢索方法,后來改進(jìn)的倒排索引結(jié)構(gòu),2006年的視覺詞匯樹結(jié)構(gòu)以及后來視覺等級方法等。如今,隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,有關(guān)研究人員提出交互圖像搜索框架。該種方法操作起來非常簡便,用戶只需將圖片移動到檢索范圍內(nèi)即可。搜索系統(tǒng)可根據(jù)不完整的局部信息提取物體整體輪廓,從而根據(jù)物體輪廓在數(shù)據(jù)庫中進(jìn)行檢索。
2.2 將圖像對象進(jìn)行匹配
一般而言,互聯(lián)網(wǎng)中的圖像信息繁多,其中不乏相似度非常高的圖像。而從海量的圖像中準(zhǔn)確將圖像進(jìn)行匹配,難度相當(dāng)大,這也是圖形學(xué)與計算機(jī)視覺領(lǐng)域極其重視的問題。針對背景較簡單且對象簡易的圖像,匹配方法大多以對象的外形輪廓相似性為基礎(chǔ)。運用頻率最高的方法是上下文方法。這種方法運用采樣和二分圖匹配算法的方法,首先需要在該對象的外形輪廓上采樣,并對其周圍的采樣點分布情況進(jìn)行統(tǒng)計;而后采用二分圖匹配算法,將其中兩個采樣點進(jìn)行最優(yōu)匹配,從而得出這兩個點的相似度。而針對背景較復(fù)雜的圖像,通常運用層級過濾機(jī)制。該種機(jī)制綜合考慮對象外形輪廓、內(nèi)容以及視覺顯著性,考察其一致性,從而對與輸入對象的相似處進(jìn)行提取。近幾年,有關(guān)技術(shù)人員提出非監(jiān)督互聯(lián)網(wǎng)圖像物體聯(lián)合提取方法。這種方法通過圖像搜索引擎對用戶輸入的關(guān)鍵詞進(jìn)行搜索,然后從圖像庫中對其稠密對應(yīng)關(guān)系信息進(jìn)行提取,并根據(jù)輸入關(guān)鍵詞的語義提取前景物體。如今的匹配方法更加精確,因為該種方法加入了一種新的手段,可將物體對象的形狀信息劃分為不同小組,并結(jié)合互聯(lián)網(wǎng)對圖像物體進(jìn)行提取和匹配,從而為數(shù)據(jù)驅(qū)動的圖像編輯應(yīng)用提供多樣化的圖像內(nèi)容。
面對繁雜多樣的數(shù)據(jù)圖像信息,內(nèi)容檢索和對象匹配均是非常重要的部分。一方面可為圖像的合成提供更準(zhǔn)確的素材,另一方面大大降低用戶交互的復(fù)雜性。其中,內(nèi)容檢索主要依據(jù)輸入關(guān)鍵詞語義進(jìn)行,對象匹配主要在用戶交互的基礎(chǔ)上根據(jù)關(guān)鍵詞語義進(jìn)行。
3.1 與圖像智能編輯相關(guān)的基礎(chǔ)技術(shù)
數(shù)據(jù)驅(qū)動的圖像智能處理用到的基本技術(shù)包括許多,其中包括上文介紹過的圖像內(nèi)容自動提取技術(shù)和匹配技術(shù),還包括友好的人機(jī)交互方式。正是由于綜合了這幾種基本技術(shù),才能依據(jù)用戶輸入的關(guān)鍵詞推測出用戶意圖,并精準(zhǔn)將圖像中的對象提取出來。
3.2 數(shù)據(jù)驅(qū)動的圖像合成
數(shù)據(jù)驅(qū)動圖像處理的核心在于圖像合成環(huán)節(jié),而圖像合成環(huán)節(jié)大致可分為兩大類。這兩類的主要區(qū)別在于作為基礎(chǔ)的對象不同。一類以物體對象為基礎(chǔ),一類以區(qū)域一致性為基礎(chǔ)。其中,第一類合成方法主要從數(shù)據(jù)庫中提取對象用于合成圖像,第二類合成方法主要從數(shù)據(jù)庫中提取部分區(qū)域與用戶輸入的圖像進(jìn)行一致性合成。
縱觀圖像處理技術(shù)的發(fā)展過程,在相關(guān)技術(shù)人員的努力鉆研下,我國的圖像處理技術(shù)不斷得到提升。如今,互聯(lián)網(wǎng)技術(shù)更新速度非???,用戶對數(shù)據(jù)驅(qū)動下的圖像處理要求逐漸提高。在這個大數(shù)據(jù)時代,應(yīng)適應(yīng)潮流的發(fā)展,將圖像技術(shù)與互聯(lián)網(wǎng)技術(shù)結(jié)合,將智能化靈活運用于圖像處理技術(shù)中。
[1]汪淼,張方略,胡事民.數(shù)據(jù)驅(qū)動的圖像智能分析和處理綜述[J].計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報,2015,(11):2015-2024.
[2]戴昌達(dá),姜小光,唐伶俐.論發(fā)展遙感圖像應(yīng)用智能處理技術(shù)[J].地球信息科學(xué),2003,(4):77-82,1.
Research on the Development of Intelligent Image Processing Technology for Data Driven
LI Lili
(Shunde Polytechnic, Shunde 528300)
This paper discusses the image of data driven expression and analysis, a brief analysis of the two steps of image content acquisition, image intelligent analysis of data driven editing, hope to make a contribution to enhance the intelligent processing technology of China’s image.
data driven, image processing, intelligent processing technology