姜文澤
摘要:計算機(jī)視覺是人工智能領(lǐng)域中的一個重要分支,更是人工智能的基礎(chǔ)。人工智能領(lǐng)域中的信息多種多樣,其中圖片信息即視覺信息比其他信息如觸覺、聽覺信息要重要得多。該文將簡要概述計算機(jī)視覺領(lǐng)域中圖像操作所要進(jìn)行的第一步——圖像特征提取時的圖像特征以及提取過程中所用到的方法。
關(guān)鍵詞:計算機(jī)視覺;圖像特征;特征提取方法
中圖分類號:TP3? ? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2019)16-0185-02
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
1? 提取方法
1.1? 直方圖
直方圖(Histogram)作為一個統(tǒng)計手段,具有一定的統(tǒng)計作用,同時其不僅可以表示一般數(shù)據(jù)的分布,也可以對圖像的數(shù)據(jù)或特征進(jìn)行統(tǒng)計,生成圖像特征分布的直方圖,譬如灰度、顏色、梯度(邊緣)、形狀、紋理、局部特征點(diǎn)等。
直方圖本質(zhì)上是對圖像的原始特征或數(shù)據(jù)進(jìn)行降維,通過對其特征進(jìn)行處理、對其數(shù)據(jù)分布進(jìn)行建模,使數(shù)據(jù)具有一定的總結(jié)性,同時可以有效節(jié)省存儲空間、簡化運(yùn)算量,更易于查看和分析,為進(jìn)一步圖像處理或分析做準(zhǔn)備。
1.2? 聚類
聚類(Clustering)是一種可以取代直方圖的特征提取方法,該方法可以通過基于數(shù)據(jù)的無監(jiān)督訓(xùn)練得到更穩(wěn)定的值。其目標(biāo)是找到混合樣本集中存在的內(nèi)在的群組關(guān)系,即對對象集合分割分塊或分組為不同的子集或類,使得類內(nèi)關(guān)聯(lián)性高,類間關(guān)聯(lián)性差。
常用的聚類方法有K-means聚類、均值漂移聚類、基于密度的聚類(DBSCAN)、基于高斯混合模型的最大期望聚類(EM)、凝聚層次聚類和圖團(tuán)體檢測等方法。
2? 圖像特征
2.1? 顏色特征
顏色特征是圖像特征中的一種全局特征,它直觀地描述了圖像中物體的表面性質(zhì)。但顏色對圖像區(qū)域的方向、大小等變化不敏感,故顏色特征不能很好表述圖像中的局部特征。
顏色特征主要的提取方法有量化顏色直方圖和聚類顏色直方圖,兩種方法的適用顏色空間不同,前者適用于RGB和HSV等均勻顏色空間,后者適用于Lab等非均勻空間。
量化顏色直方圖的操作簡單,計算高效,但存在量化問題,如果顏色相對單調(diào)還容易產(chǎn)生分布稀疏的問題。
對于Lab等非均勻空間,使用K-means聚類算法對所有像素點(diǎn)的顏色向量進(jìn)行聚類,直方圖的區(qū)間單元由聚類中心代表。
2.2? 幾何特征
常見的幾何特征有邊緣(Edge)、角點(diǎn)(Corner)以及斑點(diǎn)(Blob)。
邊緣是指梯度、亮度、顏色交界處以及面與面相交、線與線相交等像素有明顯變化的區(qū)域,即圖像中某一特性在某一方向上分布的不連續(xù)處。對于復(fù)雜圖片,可以先將彩色圖像轉(zhuǎn)化為灰度圖像,再對其某一方向的灰度值函數(shù)求一階導(dǎo)數(shù),得到的一階導(dǎo)數(shù)的高于某個閾值的極值區(qū)域即邊緣區(qū)域。該閾值也是一個超參數(shù),若閾值設(shè)置過低,邊緣提取不精確,導(dǎo)致得到的邊緣區(qū)域信息量過大,進(jìn)而可能會導(dǎo)致計算量過大;若閾值設(shè)置過高,提取到的邊緣區(qū)域過少,則會導(dǎo)致信息質(zhì)量較低。邊緣提取時一階導(dǎo)數(shù)對噪聲極為敏感,故應(yīng)先進(jìn)行高斯去噪,再使用一階導(dǎo)數(shù)獲取極值。
角點(diǎn)是一種顯著點(diǎn),即在某方面屬性特別突出的點(diǎn)。在本文中,角點(diǎn)區(qū)域被定義為在任何方向上移動某個框形區(qū)域(小觀察窗),導(dǎo)致大的像素變動的區(qū)域,可以簡單表示為以下數(shù)學(xué)模型:
對計算得到的角點(diǎn)響應(yīng)值[E(u,v)]進(jìn)行閾值化得到局部最大點(diǎn)。Harris角點(diǎn)響應(yīng)值相對于邊緣提取是更高一層的特征值,它不受光照、平移、旋轉(zhuǎn)這些尺度的影響。
斑點(diǎn)(Blob)可以理解為圓斑,通??梢岳美绽固荻惹髽O值來計算斑點(diǎn)。同樣的,斑點(diǎn)對噪聲極其敏感,需要先做高斯去噪再進(jìn)行進(jìn)一步計算。先進(jìn)行高斯濾波再進(jìn)行拉普拉斯濾波相當(dāng)于直接對其進(jìn)行二階高斯導(dǎo)數(shù)(LoG)濾波。公式表示為:
公式左側(cè)為先進(jìn)行高斯濾波,再進(jìn)行拉普拉斯濾波;公式右側(cè)為二階高斯導(dǎo)數(shù)濾波。
2.3? 紋理特征
紋理特征作為一種全局性的特征,具有可以反映物體表面的特性。紋理特征與角點(diǎn)類似,具有旋轉(zhuǎn)不變性;但又區(qū)別于角點(diǎn),具有良好的抗噪性能,同時有可能會受到光照或反射的影響。紋理特征的常用提取方法有方向梯度直方圖(HOG)、局部二值模式(LBP)和Gabor濾波器組。
基于局部方格單元的方向梯度直方圖通常適用于圖像中的人體檢測,圖像中的幾何和光學(xué)的變化不會影響圖像提取的結(jié)果。該方法的優(yōu)點(diǎn)是簡單高效且不需要做高斯模糊。
局部二值模式一般應(yīng)用于人臉特征的分析。它所計算出的二進(jìn)制模型簡單直觀。只需將圖像中每個像素點(diǎn)與周圍的像素點(diǎn)進(jìn)行比較閾值化即可得到LBP編碼。
以某個像素點(diǎn)為中心,畫出半徑為r的圓,在圓周上均勻采樣p個點(diǎn),與中心像素點(diǎn)進(jìn)行比較,將數(shù)值大小量化為0或1,當(dāng)小于中心像素點(diǎn)時量化為0,反之量化為1,將得到的多位bit按照順(逆)時針組成一個數(shù),該數(shù)即中心像素點(diǎn)的LBP編碼,同時該數(shù)值可以作為直方圖的一個bin,遍歷操作所有像素點(diǎn),每有一個相同的bin,該區(qū)間上的數(shù)值增加1,最終可以得到一個描述圖像紋理特征的直方圖。如圖2-9所示,以中心像素點(diǎn)為圓心,繪制了一個半徑為2的圓,均勻采樣8個點(diǎn),通過比較具體數(shù)值可以量化為圖2-10,從中心像素點(diǎn)正上方的像素點(diǎn)按照順時針進(jìn)行編碼,得到二進(jìn)制編碼00001101,即為其中心像素點(diǎn)的8bits的LBP編碼。
Gabor濾波器組在二維空間中本質(zhì)上是高斯核函數(shù)和正弦平面波的乘積,因此其具有高斯核的特性。與人類的視覺系統(tǒng)類似,可以用多個濾波器捕捉多尺度多方向多頻率的信息。
3? 總結(jié)
計算機(jī)視覺作為人工智能的基礎(chǔ),特征提取更是當(dāng)中的一個重要概念,即將圖像中具有不同特征的像素點(diǎn)劃分為不同的子集,使每個子集都具有不同的特性。隨著時代的發(fā)展和提取方法的改進(jìn)與優(yōu)化,提取到的圖像特征也越發(fā)精細(xì)準(zhǔn)確,為圖像處理的后續(xù)操作提供了更多的可能性。
參考文獻(xiàn):
[1] 張錫英,車鑫.圖像顏色特征提取及其分類研究[J].安徽農(nóng)業(yè)科學(xué),2014,42(07):2196-2198.
[2] 李姍姍.彩色圖像邊緣檢測相關(guān)算法研究[D].西北大學(xué),2018.
【通聯(lián)編輯:代影】