王健 崔永 趙樹林
摘要 隨著互聯(lián)網(wǎng)和多媒體技術(shù)的快速發(fā)展,人們所處理的信息已不僅僅是數(shù)字、符號,而是越來越多的圖像信息,如何對圖像進行快速、有效的檢索就變得極為迫切。針對圖像底層特征提取方法如何選擇的問題,分別分析了基于顏色、紋理、形狀特征提取方法,并對各種提取方法的優(yōu)缺點進行了歸納、總結(jié),為林業(yè)信息化建設(shè)的相關(guān)層面提供了一種新的技術(shù)。
關(guān)鍵詞 圖像信息;形狀特征;提取方法;林業(yè)信息化建設(shè)
中圖分類號 S127 文獻標識碼 A 文章編號 0517-6611(2014)05-01550-02
Abstract With the rapid development of Internet and multimedia technology,the processing of information is not just numbers,symbols,but more and more image information,how to fast,effective retrieve images becomes extremely urgent.The extraction method based on color,texture,shape features was analyzed,and the advantages and disadvantages of various extraction methods were summarized,so as to provide a new technology for the level of forestry information construction.
Key words Image information; Shape feature; Extraction method; Forestry information construction
隨著林業(yè)信息化的推進,我國林業(yè)建設(shè)正逐步由傳統(tǒng)的、人工的管理方法,向現(xiàn)代化、信息化、智能化的方向轉(zhuǎn)變。目前我國的衛(wèi)星技術(shù)已經(jīng)走在世界前列,通過衛(wèi)星拍攝傳回地球的圖片是非常珍貴,且有重要研究價值的。衛(wèi)星圖片對研究世界氣候、環(huán)境、各種生態(tài)資源、有重要的參考價值。圖像特征方法的研究是世界環(huán)境氣候、生態(tài)環(huán)境的一個重要方面,也是林業(yè)信息化建設(shè)的一個研究方向。
由于基于文本的圖像檢索所帶來的工作量巨大,如何讓計算機根據(jù)圖像的視覺特征進行快速準確的檢索成為了研究熱點,基于內(nèi)容的圖像檢索(CBIR)由此產(chǎn)生。
基于內(nèi)容的圖像檢索的關(guān)鍵問題是如何準確地反映圖像的內(nèi)容信息,這同時也是進行基于內(nèi)容的圖像檢索的前提。目前,人們主要的研究重點是如何構(gòu)建規(guī)范化的內(nèi)容特征,可以從這些底層特征來構(gòu)建高層特征。為此,筆者分別介紹了基于顏色、紋理、形狀特征提取的常用方法,并對各種特征提取方法的優(yōu)缺點進行了歸納、總結(jié)。
1 顏色特征的提取
顏色特征是描述一幅圖像最簡便而有效的特征,具有旋轉(zhuǎn)與平移不變等特點,所以很多基于顏色特征的檢索方法已被提出。通常顏色特征都采用顏色直方圖的方式對圖像進行特征描述。
1.1 顏色空間
目前常用的有RGB顏色空間和HSV顏色空間。RGB顏色空間分布不均勻,兩種顏色點之間的距離的大小不能代表其顏色的知覺差異[1]。HSV顏色模型是一種面向視覺感知的顏色模型,它更符合人的視覺感知。
1.2 顏色特征提取的研究
在顏色特征提取方法中,基于顏色直方圖的方法最為常用。Swain等最早提出了使用直方圖統(tǒng)計各種色彩在圖像中的概率,之后使用直方圖的相交算子來度量圖像的相似性,但是該方法沒有充分地考慮到圖像的空間信息[2]。為了解決此問題,stricker等提出了分塊的顏色直方圖,他認為圖像的中心部分是有意義的區(qū)域,為此他將圖像分為5塊,分析各分塊的顏色直方圖。但是該方法在計算過程中增加了時間和空間的復(fù)雜性[3]。徐果毅等提出了基于顏色直方圖熵值及分塊主色的圖像檢索,圖像的相似度通過計算圖像間的熵值距離來度量,在定義圖像的相似度距離時還引入一種新的分塊主色距離,這種方法對于檢索在相同背景下的不同顏色的相關(guān)物體時有著很好的效果[4]。為了解決分塊帶來的對旋轉(zhuǎn)敏感問題,曲培娟提出了基于同心圓顏色特征的圖像檢索算法,以圓心為準進行分塊,圖像可以任意旋轉(zhuǎn),動態(tài)加權(quán)各分塊得到圖像的綜合加權(quán)特征,然后進行圖像相似性的匹配[5],如圖1所示。
2 紋理特征的提取
2.1 紋理的定義
紋理作為任何物體的構(gòu)成成分的分布,是一種圖像中廣泛存在的特征,具有與顏色和亮度變化無關(guān)的特性。紋理特征包含了物體表面結(jié)構(gòu)組織排列的重要信息,以及和周圍的聯(lián)系。Castleman等認為,紋理是一種反映圖像中一塊區(qū)域的像素灰度級的空間分布屬性,這種空間結(jié)構(gòu)的固有屬性可以通過鄰域像素間的相關(guān)性刻畫[6]。
2.2 紋理特征提取的研究
許多學(xué)者對紋理特征提取方法展開研究并對其進行分類,常用的紋理分析方法有3種:統(tǒng)計分析方法、結(jié)構(gòu)分析方法和頻譜分析方法。
2.2.1 統(tǒng)計分析方法。
統(tǒng)計分析就是研究紋理圖像某些特征的統(tǒng)計規(guī)律,也就是使用圖像的直方圖描述紋理。在統(tǒng)計分析中,灰度共生矩陣(GLCM)是最常用的方法,此外還有灰度行程統(tǒng)計、灰度查分統(tǒng)計等方法,但由于其計算量較大,并且鑒別能力較差,并沒有被廣泛地利用。雖然灰度共生矩陣方法的鑒別能力很好,但是需導(dǎo)出14種紋理特征,這導(dǎo)致提取紋理的時間很長。于是,眾多研究者開始注重提高紋理特征的提取效率。薄華等通過研究發(fā)現(xiàn),對比度、相關(guān)性、熵3個特征對紋理有著很好的分辨能力并且不相關(guān)[7]。Ojala等提出了 LBP方法,該算法通過用一個二進制的數(shù)字來量化每個像素點與其鄰域內(nèi)其他各點的灰度值的差異[8]。為了解決灰度共生矩陣計算量大的問題,龔家強等提出了基于灰度共生混合結(jié)構(gòu)和離散傅立葉變換的方法來實現(xiàn)紋理特征的提取,對傅立葉變換后的頻譜圖進行分塊計算,降低了計算時的灰度級,提高了運算速度[9]。
2.2.2 結(jié)構(gòu)分析方法。
結(jié)構(gòu)分析就是利用模式基元和特定排列規(guī)則來描述紋理,利用紋理基元分析紋理特征,認為紋理是由紋理基元所組成,紋理基元類型的不同、方向的不同以及紋理基元的數(shù)量等,決定了紋理的不同。結(jié)構(gòu)分析方法主要有兩種:句法紋理分析,數(shù)學(xué)形態(tài)學(xué)法。然而,由于大多數(shù)紋理是不規(guī)則的,因此結(jié)構(gòu)法在使用時受到了很大的限制,導(dǎo)致了結(jié)構(gòu)分析方法沒有被廣泛地使用。
2.2.3 頻譜分析方法。
主要通過頻率來對圖像的紋理進行描述。通常人在面對一幅圖像時,會對其進行頻度分析,這很符合分析圖像的紋理特征。典型的方法有傅里葉變幻,用頻譜分布來表現(xiàn)紋理。自從1989年小波變換被提出之后,許多小波變換的方法陸續(xù)被提出用于紋理特征提取中。小波變換是通過母函數(shù)在其尺度上的伸縮和時間上的平移,得到一種能夠適應(yīng)各種頻率成分的有效信號分析的方法。小波變換最開始是二進制的小波變換,但是由于二進制小波缺乏處理多頻段的特性,多進制小波變換的方法被提出,多進制小波可以分辨出更多的頻段。除了多進制小波變換,金字塔小波變換、樹結(jié)構(gòu)小波變換等也被提出。
3 形狀特征的提取
形狀是圖像重要的可視化特征,能夠準確地刻畫物體。形狀特征不會隨圖像的顏色、紋理、背景的改變而變化,具有一定的穩(wěn)定性。定義形狀特征主要有兩個方面:①圖像中目標的分割;②形狀特征的描述。目前,圖像分割的常用方法主要有遺傳算法分割、Rorberts邊界檢測算子、幾何常量、多邊形頂點數(shù)、孔徑數(shù)、曲率等。形狀描述方法主要分為兩類:基于區(qū)域的形狀描述符和基于邊界的形狀描述符[10]。
3.1 基于區(qū)域的形狀描述方法
Hu在1962年提出了幾何矩的方法來描述形狀特征,由7個矩組成描述形狀的不變矩組[11]。該不變矩組對區(qū)別形狀起到很好的作用。它具有平移、旋轉(zhuǎn)、尺度不變性,但是計算復(fù)雜。
Teague首先提出了Zernike矩定義。Zernike矩就是以圖像的型心為原點,把坐標映射到單位圓內(nèi)得來的,使得僅僅使用一組很小的Zernike矩特征向量就可以對目標進行形狀描述。但是Zernike矩獲得的頸向特征原型特征是不一致的,這導(dǎo)致了無法對形狀進行多分辨率分析,同時由于圓形光譜特性無法在各個權(quán)值均勻獲得,會導(dǎo)致有利于對形狀進行描述的特征信息丟失[12] 。
Zhang等提出了通用傅里葉描述符(GFD),它包含了圖像像素點的灰度信息,同時具有旋轉(zhuǎn)和比例不變性,克服了Zernike的上述缺點,但是對噪聲比較敏感[13]。
章志勇等提出了把多尺度分析和通用傅里葉描述子相結(jié)合,得到多尺度通用傅里葉描述子。該方法不僅能克服圖像灰度噪聲帶來的干擾,并且具有旋轉(zhuǎn)、比例不變性,在灰度圖像檢索中取得較好的效果[14]。
3.2 基于邊界的形狀描述方法
Freeman等提出鏈碼對圖像邊界點進行表示的方法,通過一系列具有特定長度和方向的相連直線段對目標的邊界進行表示[15]。但是目標的旋轉(zhuǎn)會造成鏈碼發(fā)生變化,改進的辦法是利用鏈碼的一階差分來重新構(gòu)造一個序列,該差分通過相鄰兩個方向數(shù)相減得到。
傅里葉描述子適合描述封閉的曲線,它主要是將經(jīng)過離散傅里葉變換后的邊界作為形狀特征,具有很好的平移、旋轉(zhuǎn)、縮放等幾何不變性,非常適合于構(gòu)造形狀的邊界信息。但是它很難從直觀上對變化進行預(yù)測。
曲率尺度空間描述符根據(jù)人們在認知物體時,傾向于將物體的形狀分解成凹和凸的部分來進行比較這一特性而提出的方法。曲率尺度空間描述符具有平移、旋轉(zhuǎn)、尺度不變性,而且描述符緊湊。
4 結(jié)語
圖像特征提取是進行基于內(nèi)容的圖像檢索中重要的一步,該研究分別介紹了基于顏色、紋理、形狀的特征提取方法,并對各種提取方法的優(yōu)缺點進行了歸納、總結(jié)。隨著圖像特征提取算法研究的深入,基于內(nèi)容的圖像檢索的準確性也將逐漸提高。
參考文獻
[1] 姜蘭池,沈國強,張國煊.基于HSV分塊顏色直方圖的圖像檢索算法[J].機電工程,2009(11):54-57.
[2] SWAIN M J,BALLARD D H.Color indexing[J].Journal of Computer Vision,1991,7(1):11-32.
[3] STRICKER J,KAFRI O.A new method for density gradient measurements in compressible flows[J].AIAA,1982(20):820-823.
[4] 徐果毅,朱寧波,朱曉林,等.基于顏色直方圖熵值及分塊主色的圖像檢索[J].計算機工程與科學(xué),2008,30(9):44-46.
[5] 曲培娟.一種新的基于顏色特征的圖像檢索方法[J].蘭州理工大學(xué)學(xué)報,2010,36(2):88-92.
[6] CASTLEMAN K R.數(shù)字圖像處理[M].朱志剛,譯.北京:電子工業(yè)出版社,1999.
[7] 薄華,馬縛龍,焦李成.圖像紋理的灰度共生矩陣計算問題的分析[J].電子學(xué)報,2006,34(1):155-158.
[8] OJALA T,PIETIKAINEN M,MAENPAA T.Multire solution gray scale and rotation invariant texture classification with local binary patterns[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24:971-987.
[9] 龔家強,李曉寧.基于共生矩陣紋理特征提取的改進算法[J].計算機工程與設(shè)計,2011,32(6):2068-2071.
[10] 李鈺,孟祥萍.基于Gabor濾波器的圖像紋理特征提取[J].長春工業(yè)大學(xué)學(xué)報,2008,29(1):78-81.
[11] 肖旭光,肖剛,敬忠良.空間目標融合識別算法及實驗研究[J]. 計算機工程與應(yīng)用,2011,47(8):154-160.
[12] 聶生顯.基于形狀特征的圖像檢索研究和應(yīng)用[D].成都:電子科技大學(xué),2011.
[13] ZHANG L C,DING X M,ZHANG Y Q,et al.Embedded online palmprint verification system[C]//2nd International Congress on Image and Signal Processing.Tianjin:IEEE,2009:1-5.
[14] 章志勇,潘志庚,張明敏,等.基于多尺度通用傅里葉描述子的灰度圖像檢索[J].中國圖象圖形學(xué)報,2005,10(5):611-615.
[15] LEVIN A,SAND P,CHO T S,et al.Motion-invariant photography[J].SIGGRAPH,2008,2008,27(71):1-9.