段 汕,張 曄,張彬彬
(中南民族大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)學(xué)院,武漢 430074)
圖像相似性研究在圖像識別[1]、圖像匹配[2]、圖像比較等方面有著廣泛的應(yīng)用. 在Pyt′ev的形態(tài)學(xué)圖像分析方法[3]中,將分片常函數(shù)作為二維圖像Mosaic圖像的模型空間,提出了基于投影算子的圖像比較方法,通過建立各類相關(guān)系數(shù)對圖像的相似性進(jìn)行定量描述.在分片常函數(shù)的圖像表示方式下,相關(guān)系數(shù)的各類指標(biāo)依賴于對圖像空間域的初始劃分.對大多數(shù)圖像來說,基于圖像強(qiáng)度的分割相對質(zhì)量較低,對噪聲較為敏感,對高頻噪聲的干擾不能保持足夠的穩(wěn)定,相應(yīng)算法的魯棒性較弱,對圖像相似性研究結(jié)果的準(zhǔn)確性會帶來較大的影響.
Vizilter在文獻(xiàn)[4]中引入高維數(shù)據(jù)降維技術(shù)[5]的基本原理,在對數(shù)據(jù)不進(jìn)行初始分割的情況下,對相關(guān)方法進(jìn)行改進(jìn),提出了基于擴(kuò)散映射建立相關(guān)系數(shù)的方法,通過擴(kuò)散相關(guān)系數(shù)實(shí)現(xiàn)對圖像相似性的度量,使得相關(guān)指示對于噪聲更具穩(wěn)定性.本文在以上工作的基礎(chǔ)上,將Laplacian特征映射[5]和擴(kuò)散映射[6]的方法應(yīng)用于圖像數(shù)據(jù),通過對圖像數(shù)據(jù)熱核及擴(kuò)散核相關(guān)問題的研究,提出了建立擴(kuò)散形態(tài)算子及用于圖像相似性比較的基本框架,證明了Pyt′ev形態(tài)分析理論中的投影算子及形態(tài)相關(guān)系數(shù)是擴(kuò)散形態(tài)算子及擴(kuò)散形態(tài)相關(guān)系數(shù)在馬賽克圖像模式下的特殊情形. 研究表明,在Pyt′ev形狀分析及相關(guān)算法中,運(yùn)用擴(kuò)散形態(tài)算子替代形態(tài)算子可以建立更加廣闊的擴(kuò)散形態(tài)學(xué)基礎(chǔ)理論.與此同時,文中還對相關(guān)算法具體實(shí)現(xiàn)方法和參數(shù)選擇方式進(jìn)行了適當(dāng)改進(jìn),使得圖像比較中的相關(guān)數(shù)據(jù)、實(shí)驗(yàn)結(jié)果得到一定的改善.
Pyt′ev所提出的圖像形態(tài)學(xué)分析理論[3],是一種基于圖像到形狀的圖像相似性研究方法,在這種理論下圖像被模型化為分片連續(xù)的二維函數(shù)f(x,y):Ω→R,(x,y)∈Ω?R2:
(1)
其中F={F1,F2,…,Fn}是對空間域Ω?R2的劃分,f={f1,f2,…,fn}是對應(yīng)于劃分F的圖像強(qiáng)度向量;χFi(x,y)∈{0,1}是第i個子區(qū)域Fi的特征函數(shù):
圖像f(x,y)的形狀定義為:
?f={f1,f2,…,fn}∈Rn},
(2)
且F?L2(Ω).圖像g(x,y)∈L2(Ω)在形狀F上的投影具有如下形式:
在Pyt′ev的圖像形態(tài)學(xué)分析中,圖像g(x,y)與圖像f(x,y)的相似程度通過基于投影算子PFg(x,y)的形態(tài)相關(guān)系數(shù)
(3)
進(jìn)行度量,所描述的是圖像g(x,y)與圖像f(x,y)的形狀F接近程度.
以上所給出是兩幅圖像之間的形態(tài)相關(guān)系數(shù).利用Laplacian特征映射原理[5],對于圖像f(x,y)((x,y)∈Ω?R2)的數(shù)據(jù)集合V={(x,y,f(x,y))|(x,y)∈Ω},通過設(shè)計(jì)鄰接關(guān)系準(zhǔn)則,可產(chǎn)生V中點(diǎn)的鄰接圖,準(zhǔn)則可基于圖像類型進(jìn)行設(shè)立. 一幅具有s×t個像素的圖像需要用s×t維空間中的向量來表示,同一場景在不同條件下所獲得的圖像集合就是一種高維數(shù)據(jù)集合. 為了有效地處理這些數(shù)據(jù),使用降維技術(shù)就顯得十分必要. 降維是指將樣本從高維觀測空間通過線性或非線性映射投影到一個低維特征空間,從而找出隱藏在高維數(shù)據(jù)中有意義的低維結(jié)構(gòu). 基于Laplacian特征映射的非線性降維方法旨在保持高維觀測數(shù)據(jù)局部結(jié)構(gòu)的同時,使不在同一鄰域內(nèi)的點(diǎn)之間距離變得松馳,擴(kuò)散映射通過在擴(kuò)散過程中保持?jǐn)U散距離進(jìn)行降維. 擴(kuò)散映射的主要思想是通過在數(shù)據(jù)集上構(gòu)造的擴(kuò)散圖,利用擴(kuò)散距離來描述數(shù)據(jù)間的相似度,使用一系列擴(kuò)散核進(jìn)行數(shù)據(jù)降維,從而避免高維數(shù)據(jù)矩陣進(jìn)行特征分解的不穩(wěn)定性和不可行性[7].
基于圖像f數(shù)據(jù)集合V的鄰接關(guān)系,可產(chǎn)生圖像f的熱核[4,5,8]:
hf(x,y,u,v):Ω×Ω→[0,1],
將其稱為圖像f的擴(kuò)散形狀,記為.圖像f的熱核一般具有如下特征:hf(x,y,u,v)≤hf(x,y,x,y),即自相似最大原則,且關(guān)于像素點(diǎn)具有對稱性:hf(x,y,u,v)=hf(u,v,x,y),它是對數(shù)據(jù)間相似性的一種度量. 由Laplacian特征映射原理,數(shù)據(jù)集V上存在唯一的測量函數(shù)η,使得hf(x,y,u,v)=η(f(x,y),f(u,v)),函數(shù)η所描述的是V中數(shù)據(jù)點(diǎn)(x,y,f(x,y))與(u,v,f(u,v))在像素點(diǎn)(x,y),(u,v)∈Ω具有某種鄰接關(guān)系條件下的相似程度,是對圖像f(x,y)局部特征的一種刻畫,以此信息用于表示圖像f的整體信息.
圖像f熱核hf(x,y,u,v)的主要作用是描述數(shù)據(jù)點(diǎn)之間的局部連接性,捕捉數(shù)據(jù)的局部幾何特征. 將熱核正規(guī)化形成圖像的擴(kuò)散核:
H
(4)
其滿足非負(fù)性、對稱性,且
因此可假設(shè)
利用擴(kuò)散核所包含的數(shù)據(jù)局部信息構(gòu)建數(shù)據(jù)全局形態(tài)特征需要采用擴(kuò)散映射的思想[6],定義:
D
(5)
稱D為圖像f的擴(kuò)散形態(tài)算子,且對于任意圖像g(包括圖像f)都有‖Dg‖≤‖g‖.
將形態(tài)相關(guān)系數(shù)(3)中的投影算子PF替代為圖像f的擴(kuò)散形態(tài)算子D,引入擴(kuò)散相關(guān)系數(shù):
KD(g,
它給出了圖像g與形狀的一種相似度測量指標(biāo),且0≤KD(g,)≤1.
由擴(kuò)散核H的性質(zhì),擴(kuò)散算子D具有平滑功能,而‖Df‖≤‖f‖,故D不是投影算子,因此可假設(shè)D的平滑能力滿足條件:DD(f,)≥KD(g,),這樣將擴(kuò)散相關(guān)系數(shù)的比:
KMD(g,
(6)
稱為擴(kuò)散形態(tài)相關(guān)系數(shù),這里KD(f,)(≤1)是擴(kuò)散算子D對于圖像f自平滑能力的測量值,且0≤KMD(g,)≤1. 顯然KMD是對KM的推廣,當(dāng)取為F且D取為PF時,KMD(g,)=KM(g,F),即當(dāng)(6)式中的算子取為投影算子時,擴(kuò)散形態(tài)相關(guān)系數(shù)(6)式即是形態(tài)相關(guān)系數(shù)(3)式.
若將圖像單位化,即‖f‖=‖g‖=1,則有:
KMD(g,
由此可知‖Dg‖<‖Df‖(?g≠f),即算子D對于圖像的平滑作用與目標(biāo)圖像和圖像f的相似程度相關(guān).
如果能獲得擴(kuò)散算子D的特征值{λ1,λ2,…,λn}及其所對應(yīng)的特征函數(shù){φ1(x,y),φ2(x,y),…,φn(x,y)}:
Dφi(x,y)=λiφi(x,y),i=1,2,…,n.
=span{φ1(x,y),φ2(x,y),…,φn(x,y)}.
(7)
在以上所討論的擴(kuò)散形態(tài)算子的理論框架下,依據(jù)Laplacian特征映射中0-1加權(quán)函數(shù)建立的思想,考慮圖像f熱核hf的一種簡單且特殊的形式:
由(4)式其擴(kuò)散核
且對(x,y)∈Ω,必存在1≤k≤n,使得(x,y)∈Fk,故有:
這里S(·)表示目標(biāo)對象的面積,故
或表示為:
由(5)式,其對應(yīng)的擴(kuò)散算子:
φi(x,y)=χFi(x,y),i=1,2,…,n,
=span{χF1(x,y),χF2(x,y),…,χFn(x,y)},
即由(2)式所給出的圖像f的馬賽克形狀F,圖像f則具有(1)式的形式,且
與此同時,由
對于圖像熱核的正規(guī)化處理產(chǎn)生了一個線性光滑的擴(kuò)散形態(tài)算子D,熱核的經(jīng)典形式與擴(kuò)散距離相關(guān),以下著重討論圖像熱核及擴(kuò)散核建立的基本方法.
對于二維圖像f(p),p=(x,y),擴(kuò)散形態(tài)算子D的建立可以直接從圖像數(shù)據(jù)集合中點(diǎn)間距離和熱核的經(jīng)典形式[4]
(8)
入手,其中d(p,q)是數(shù)據(jù)集中點(diǎn)p,q之間的基本距離,ε>0為控制指數(shù)函數(shù)衰減速度的調(diào)節(jié)參數(shù). 以此為基礎(chǔ)的擴(kuò)散形態(tài)算子,在Pyt′ev的形態(tài)分析方法中對應(yīng)于基本距離的一種特殊選擇:
考慮具有s×t個像素的二維圖像f(p)在像素點(diǎn)p的l×l鄰域,這里奇數(shù)l< d(p,q)=‖v(p)-v(q)‖, 或設(shè)計(jì)為平均Hausdorff距離[9]: (9) 但即使v(p)在合理的鄰域尺度設(shè)置下,范數(shù)運(yùn)算也會產(chǎn)生時間上極大的消耗. 為提高計(jì)算效率,采用局部二值模式[10]LBP特征向量(矩陣)替代v(p),對基于范數(shù)的度量方法進(jìn)行相應(yīng)的修正,以此減少時間上的消耗. 對于點(diǎn)p的鄰域v(p),利用LBP算子所產(chǎn)生的v(p)的LBP二進(jìn)制特征模式B(p),及v(p)的平均值m(p),將范數(shù)替代為: ‖v(p)-v(q)‖~β|m(p)-m(q)|2+dham(B(p),B(q)), 其中dham為漢明距離,β是一個調(diào)節(jié)權(quán)重. 由此得到平均Hausdorff距離(9)式的修正形式: 及圖像f熱核的具體形式: (10) 以此便可構(gòu)造出擴(kuò)散形態(tài)算子D. 實(shí)驗(yàn)的目的在于測試擴(kuò)散形態(tài)算子及擴(kuò)散形態(tài)相關(guān)系數(shù)在圖像比較中的作用,并將文中所提算法與已有算法和實(shí)驗(yàn)結(jié)果進(jìn)行分析比較,以說明本方法的有效性.圖1給出了二組TV和IR測試圖像.已有算法中,圖1(c)所表示的圖像和圖1(b)的表示的圖像的擴(kuò)散形態(tài)相關(guān)系數(shù)的分布如圖2所示.圖3給出了基于(10)式的擴(kuò)散算子中,ε=0.01、l=3時得到的Housdorff距離模式下的擴(kuò)散形態(tài)相關(guān)系數(shù)分布. 圖1 原始圖像及用于匹配的圖像Fig.1 The original image and the image used to match 圖1(f)所示圖像和圖1(e)所示圖像依據(jù)原有算法的擴(kuò)散形態(tài)相關(guān)系數(shù)分布如圖4所示.在取ε=0.01、l=3以(10)式為熱核的擴(kuò)散形態(tài)相關(guān)系數(shù)分布如圖5所示. 圖2 原始算法下地形圖像的分布圖Fig.2 Distribution of terrain image under the original algorithm 圖3 改進(jìn)算法后地形圖像的分布圖Fig.3 Distribution of the terrain image after improving the algorithm 圖4 原始算法下細(xì)胞圖像的分布圖Fig.4 Distribution of the cell image under the original algorithm 圖5 改進(jìn)算法后細(xì)胞圖像的分布圖Fig.5 Distribution of the cell image after improving the algorithm 上述實(shí)驗(yàn)結(jié)果,在選取不同的距離、鄰域尺度以及控制指數(shù)衰減參數(shù)ε,得到了不同的擴(kuò)散形態(tài)相關(guān)系數(shù)的分布以及不同分布中相關(guān)系數(shù)的峰值,其相似效果可以通過均方相關(guān)系數(shù)統(tǒng)計(jì)的二維相關(guān)函數(shù)C(x,y)的性噪比(SNR)和全局最大相關(guān)值C1和次最大相關(guān)值C2超越率E進(jìn)行度量: 其中μ和σ分別為相關(guān)函數(shù)的均值和方差. 圖1~圖4中的各峰值、性噪比、超越值分別見表1和表2.相關(guān)數(shù)據(jù)的比較說明,本文相關(guān)算法下所獲得的數(shù)據(jù)優(yōu)于原有結(jié)果. 表1 不同算法得到的地形圖像相關(guān)系數(shù) Tab.1 The correlation coefficient of terrain image obtained by different algorithms 相關(guān)系數(shù)K2MD(f,G)最大值性噪比超越值圖2相關(guān)系數(shù)0.003399.98094.6698圖3相關(guān)系數(shù)0.0121414.12754.8646 表2 不同算法得到的細(xì)胞圖像相關(guān)系數(shù) Tab.2 The correlation coefficient of cell image obtained by different algorithms 相關(guān)系數(shù)K2MD(f,G)最大值性噪比超越值圖4相關(guān)系數(shù)0.0010310.22863.8530圖5相關(guān)系數(shù)0.0043510.94324.7541 由表1可得,圖2和圖3相關(guān)系數(shù)的最大值(峰值)分別為0.00339和0.01214,而且性噪比的值圖3為14.1275大于圖2的9.9809,說明擴(kuò)散形態(tài)學(xué)方法的改進(jìn)算法比原始算法對于噪聲更加穩(wěn)定,更能準(zhǔn)確地度量兩幅圖像的相似度.同理表2中圖4和圖5相關(guān)系數(shù)的最大值(峰值)分別為0.00103和0.00435,而且性噪比的值圖5為10.9432大于圖4的10.2286,也說明了擴(kuò)散形態(tài)學(xué)方法的改進(jìn)算法對于相似性的研究要優(yōu)于原始算法.因此,擴(kuò)散形態(tài)學(xué)方法的改進(jìn)算法能更有效地應(yīng)用于圖像相似性研究. 本文對擴(kuò)散形態(tài)算子進(jìn)行了基礎(chǔ)性研究,通過改進(jìn)獲取熱核的相關(guān)算法,使得算子在結(jié)構(gòu)上更具一般性,在應(yīng)用上更具穩(wěn)定性,為擴(kuò)散映射在圖像相似性研究領(lǐng)域提供了一個研究方向.4 實(shí)驗(yàn)結(jié)果及分析
5 結(jié)語