李 瑩,李險(xiǎn)峰
(吉林建筑大學(xué),吉林 長春 130118)
多尺度多分辨率是人類高效工作與視覺精準(zhǔn)的重要特征之一。自然產(chǎn)生的圖像里很大一部分都具有不同尺度的信息,這些信息會(huì)同一時(shí)間出現(xiàn)在圖像里。而對(duì)圖像的使用研究,一般都會(huì)局限在某些尺度或只需要某個(gè)尺度的信息,而其他尺度信息通常會(huì)對(duì)圖像的結(jié)構(gòu)造成不好的影響,因此將圖像信息按照尺度進(jìn)行分解是較為關(guān)鍵的。多尺度圖像分解能夠刪除一些無用的圖像信息,使其不能對(duì)圖像處理結(jié)果產(chǎn)生不良影響,也能夠減少圖像處理的復(fù)雜程度與難度,其也是圖像邊緣識(shí)別與圖像檢測(cè)等處理過程的預(yù)處理算法之一。
目前較為經(jīng)典的圖像分解方法能夠大致分為兩種即:最小二乘分解法與經(jīng)驗(yàn)?zāi)J椒纸夥?,這兩種方法在圖像分解時(shí)能夠保留邊界圖像的平滑,但其較為偏向于圖像分解的單一像素分解。這就導(dǎo)致分解圖像后,只能分解出部分需要的信息,并不能將整體圖像進(jìn)行分解。
針對(duì)上述問題,本文提出一種基于特征標(biāo)記的多尺度建筑空間圖像分解方法,憑借對(duì)偶范數(shù)構(gòu)建分解模型,獲取圖像的極值點(diǎn)把圖像的坐標(biāo)垂直投射至坐標(biāo)平面內(nèi),組建包絡(luò)的上界,并迭代該流程直至產(chǎn)生包絡(luò)下界,實(shí)現(xiàn)對(duì)多尺度建筑空間圖像的分解。
特征標(biāo)記定義的視覺描述有:形狀、顏色、位置、紋理、運(yùn)動(dòng)與其他特征標(biāo)記符。
顏色即視覺表現(xiàn)力[1]最大的特征,在過去十幾年的圖像研究中被廣泛使用。特征標(biāo)記支持的顏色空間有:HSV、RGB與單色空間。擬定標(biāo)記符存在可伸縮顏色、主流色、顏色布局與顏色結(jié)構(gòu)。本文使用的顏色特征標(biāo)記符即主流色標(biāo)記符與顏色空間標(biāo)記符,依靠兩種標(biāo)記符顯示邊界,如果將兩種標(biāo)記符融合起來使用能夠更好的標(biāo)記圖像的全局顏色與局部顏色。
1)主流的標(biāo)記符
該標(biāo)記符用作標(biāo)記一幅圖像或一種隨機(jī)形狀包含的幾種主導(dǎo)顏色[2],指出了代表顏色、擬定區(qū)域內(nèi)占據(jù)的百分比、主色的空間關(guān)聯(lián)性與主色的顏色方差。
標(biāo)記符能夠被定義成
F={{ci,pi,vi},s}(i=1,2,…,N)
(1)
式中,ci代表主顏色,pi代表顏色表粉筆,vi代表一種可選量,i代表顏色方差,s代表主色在擬定區(qū)域內(nèi)的整體空間關(guān)聯(lián)性與凝聚性。
2)顏色空間標(biāo)記符
該標(biāo)記符用作標(biāo)記整幅圖像或隨機(jī)圖像區(qū)域的顏色空間分布[3]特征情況,使用的是量化至8bits的YCbCr顏色空間,其量化方程如下所示
(2)
顏色空間標(biāo)記符的標(biāo)記流程能夠分為兩個(gè)部分:基于網(wǎng)格的標(biāo)記顏色選取與DCT(Discrete Cosine Transform,離散余弦變換)的變換與量化。
具體流程如下所示:擬定一幅多尺度建筑空間圖像,首先將圖像通過顏色空間映射[4]至YCbCr空間內(nèi),隨后將圖像劃分成8×8的圖像塊,對(duì)小圖像塊的每個(gè)顏色進(jìn)行分量,并計(jì)算其顏色平均值當(dāng)做標(biāo)記顏色,最后對(duì)所有主色快的顏色分量進(jìn)行DCT轉(zhuǎn)換,獲得系數(shù)矩陣,對(duì)系數(shù)進(jìn)行量化,同時(shí)進(jìn)行掃描,獲取顏色空間標(biāo)記符的值。對(duì)主色的顏色分量進(jìn)行DCT轉(zhuǎn)換,同時(shí)把圖像標(biāo)記的特征細(xì)節(jié)部分?jǐn)?shù)據(jù)集中在左上角,越靠近反方向的數(shù)據(jù)即不明顯的高頻數(shù)據(jù)[5],便于挑選不同的精度來進(jìn)行特征標(biāo)記符的提取。
紋理與顏色相同,也是圖像內(nèi)非常關(guān)鍵的一種底層視覺特征,在圖像檢索與瀏覽應(yīng)用中起到了至關(guān)重要的作用。特征標(biāo)記擬定了三種紋理標(biāo)記符:
第一種即紋理瀏覽標(biāo)記符,其作用即標(biāo)記紋理的感知屬性,例如規(guī)則性、方向性與粗糙度等,在圖像檢索領(lǐng)域內(nèi)有著廣泛的使用,能夠進(jìn)行紋理圖像的快速檢索。
第二種即同質(zhì)紋理標(biāo)記符,其是基于紋理的局部空間頻率標(biāo)記,為相似性檢索供給了一種同質(zhì)紋理的定量標(biāo)記。最后一種即局部輪廓直方圖標(biāo)記符,在標(biāo)記紋理分布[6]不均勻的圖像時(shí)作用非常大。本文內(nèi),使用了紋理瀏覽標(biāo)記符與輪廓直方圖標(biāo)記符對(duì)多尺度建筑空間圖像的紋理特征進(jìn)行標(biāo)記。
3)紋理瀏覽標(biāo)記符
該標(biāo)記符即一種極為緊湊的標(biāo)記符,最大需要12bit來標(biāo)記紋理的方向性、粗糙度與規(guī)則性。由于多尺度建筑空間圖像的紋理可能存在多于一個(gè)的方向與粗糙程度,因此特征標(biāo)記定義內(nèi),允許存在兩種不同的粗糙度與方向。紋理的規(guī)則性在0~3之間,0即隨機(jī)或不規(guī)則的紋理,3就是具有一致性的方向性與粗糙度的周期紋理,其處于兩個(gè)值之間且具有較好的靈活性。
4)輪廓直方圖標(biāo)記符
輪廓直方圖標(biāo)記符即輪廓的空間分布,在瀏覽與檢索輪廓分布不均勻的圖像時(shí)非常有用。特征標(biāo)記定義的輪廓直方圖標(biāo)記符描述了不同種類的邊緣空間分布,包括四種方向輪廓與一種無方向輪廓。
①把圖像平均分為4×4共16種子圖,運(yùn)算所有子圖的局部輪廓直方圖。所有局部輪廓直方圖存在5種bins,這5種bins分別表示為水平、垂直、135度、45度與無特定方向的輪廓分布,因此直方圖共存在80種bins。
②進(jìn)一步將16種子圖像劃分成更小的圖像塊。圖像塊的總量是固定的,一般是2的冪,其尺寸和圖像的尺寸存在關(guān)聯(lián)。
③將所有圖像塊劃分為2×2個(gè)圖像區(qū)域,所有區(qū)域的顏色值通過區(qū)域里所有像素的顏色均值進(jìn)行運(yùn)算,隨后通過特征標(biāo)記推薦的5個(gè)輪廓檢測(cè)算法對(duì)所有圖像塊[7]進(jìn)行運(yùn)算,如果運(yùn)算出的最大輪廓強(qiáng)度超出某個(gè)閾值,那么該輪廓種類就作為圖像塊的邊緣,并應(yīng)用在直方圖的計(jì)算內(nèi),統(tǒng)計(jì)所有圖像塊的輪廓種類就能夠獲得所有子圖的局部輪廓直方圖。
④對(duì)獲得的值進(jìn)行量化與歸一化處理。對(duì)歸一化之后的80種bins的值進(jìn)行非線性量化之后,所有bin通過3bits進(jìn)行編碼,這樣就需要240bits來描述一個(gè)輪廓直方圖標(biāo)記符。
2.2.1 模型提出
為了克服全變差重組圖像時(shí)引起的階梯現(xiàn)象[8],本文提出一種新模型,基于對(duì)偶范數(shù)的多尺寸建筑空間圖像分解模型,構(gòu)建分解模型。其定義為
(3)
實(shí)際中,由于*范數(shù)求解較為困難,因此最小化式(3)是較為困難的,本文通過Meyer模型逼近式(3)能夠獲得
(4)
式(4)依賴于圖像的梯度大小,架構(gòu)成分的最小化能量介于全變差半范數(shù)與W1,2=H1范數(shù)之間,紋理成分的最小化能夠介于他們的對(duì)偶范數(shù),G范數(shù)與W-1,2=H-1范數(shù)之間。u與v之間的對(duì)偶性使得分解模型在處理圖像的輪廓與紋理時(shí)可以自適應(yīng)調(diào)節(jié),縮減了圖像內(nèi)產(chǎn)生的階梯現(xiàn)象。
2.2.2 投影算法下全變差最小化
本文通過非線性投影[10]算法最小化全變差,其需要解決的問題如下所示
(5)
針對(duì)式(5)的求解給出以下命題:
式(5)的解如下所示
u=f-PμBG(f)
(6)
擬定一種計(jì)算投影PμBG(f)的算法,該算法可用于求解以下最小化問題
(7)
擬定輸入圖像的尺寸是N×N,那么這個(gè)問題能夠通過以下固定點(diǎn)算法獲得
(8)
確保概算法Soulian的一種充分條件如下:
擬定式(8)內(nèi)的參數(shù)τ滿足τ≤1/8,那么在n→+∞時(shí),λdiv(Pn)會(huì)收斂到PμBG(f)。
多尺度建筑空間圖像數(shù)據(jù)擬定為f(i,j),極值點(diǎn)[11]的計(jì)算規(guī)則即,當(dāng)前像素點(diǎn)灰度值f(i,j)和其鄰域灰度值進(jìn)行對(duì)比,如果f(i,j)超過其鄰域灰度值該點(diǎn)就是極大值,反之即極小值。針對(duì)圖像邊界點(diǎn)只需要和其鄰域點(diǎn)對(duì)比即可。
曲面差值方法,和以往對(duì)插值漏點(diǎn)處理的算法不同。由于進(jìn)行極值點(diǎn)三角剖分差值之后,圖像信息會(huì)構(gòu)成一種凸曲面,該曲面不會(huì)覆蓋圖像的信息空間[12]這就導(dǎo)至圖像產(chǎn)生了漏點(diǎn)的情況發(fā)生,針對(duì)漏點(diǎn)的處理,會(huì)直接干擾圖像分解的準(zhǔn)確程度。本文憑借對(duì)稱處理方法,評(píng)測(cè)漏點(diǎn)灰度值。其流程如下:
1)搜索三角剖分與樣條差值曲面的邊界點(diǎn);
2)搜索距離漏點(diǎn)f(i1,j1)最近的邊界點(diǎn)u(i2,j2);
3)在差值凸曲面里搜索以邊界點(diǎn)u(i2,j2)為中心和漏點(diǎn)f(i1,j1)對(duì)稱的點(diǎn)f′(2i2-i1,2j2-j1),依靠該點(diǎn)f′(2i2-i1,2j2-j1)的灰度值當(dāng)作漏點(diǎn)f(i1,j1)灰度值的估測(cè)結(jié)果。
擬定圖像表面比作朗伯面,那么圖像能夠被認(rèn)為是一種實(shí)際物理目標(biāo)結(jié)構(gòu)模式,通過入射光調(diào)制所組成的圖像。這樣就能夠憑借經(jīng)驗(yàn)?zāi)J椒纸馑惴▽?duì)多尺度建筑空間圖像進(jìn)行分解。
首先,憑借二維圖像的實(shí)際大小標(biāo)定圖像所處平面Oxy的位置,圖像相應(yīng)像素的灰度值擬定成Z坐標(biāo),把圖像的Z坐標(biāo)垂直投射至Oxy坐標(biāo)平面內(nèi),最后在投影面內(nèi)進(jìn)行局部極值點(diǎn)的挑選、三角剖分與三角差值曲面處理。按照特征標(biāo)記定義,通過所有的局部極大值對(duì)圖像進(jìn)行平面三角剖分,組建差值曲面當(dāng)做包絡(luò)的上界,同時(shí)局部極小值迭代該流程,直至出現(xiàn)包絡(luò)的下界停止,然后采集極大值與極大值包絡(luò)曲面的代數(shù)均值,用在圖像的分解處理內(nèi)。
設(shè)定?F(x,y)代表預(yù)處理的多尺度建筑空間圖像,將極小值與極大值包絡(luò)曲面的代數(shù)均值描述成m1(x,y),標(biāo)記圖像F(x,y)和m1(x,y)的差值為h1(x,y)。
h1(x,y)=F(x,y)-m1(x,y)
(9)
其中,h1(x,y)代表F(x,y)的一種中間流程值,迭代上述流程k次,直至h1k成為一種內(nèi)稟性模式函數(shù)
h1(k-1)(x,y)-m1k(x,y)=h1k(x,y)
(10)
定義
D1(x,y)=h1k(x,y)
(11)
式中,D1(x,y)代表分離出的第一種內(nèi)稟性模式函數(shù),隨后將D1(x,y)從初始數(shù)據(jù)內(nèi)剝離,能夠得到
F(x,y)-D1(x,y)=R1(x,y)
(12)
把R1(x,y)當(dāng)做新的數(shù)據(jù),迭代上述流程n次,其迭代關(guān)聯(lián)為
R1(x,y)-D2(x,y)=R2(x,y),…,
Rn-1(x,y)-Dn(x,y)=Rn(x,y)
(13)
最后獲得的描述式即
(14)
式中,F(xiàn)(x,y)即原圖像信息,Di(x,y)表示尺度分離后獲取的尺度細(xì)節(jié)信息,Rn(x,y)表示獲取的最終大尺度趨勢(shì)項(xiàng)。
上述運(yùn)算能夠?qū)Σ灰?guī)則的圖像振幅進(jìn)行平滑,減少數(shù)據(jù)奇異性,將圖像依靠尺寸分解為一些大尺度趨勢(shì)信息。細(xì)節(jié)信息表示了騎行波與圖像紋理這類小尺度信息,基礎(chǔ)變化趨勢(shì)信息與圖像基礎(chǔ)結(jié)構(gòu)則表示了大尺度信息。分別對(duì)不同尺度信息進(jìn)行目標(biāo)識(shí)別等深入處理,就能夠獲得基于不同尺度的分解結(jié)果。
為了證明所提方法的有效性,進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)環(huán)境為:混凝土材料參考高等級(jí)公路路肩,對(duì)混凝土材料的比例與條件進(jìn)行挑選,指定成標(biāo)準(zhǔn)實(shí)驗(yàn)塊以供實(shí)驗(yàn)。數(shù)字儲(chǔ)存示波器,型號(hào)為HP5-6401A型,該儀器主要負(fù)責(zé)數(shù)據(jù)波形的采集,數(shù)字頻率計(jì)數(shù)器使用E323。
實(shí)驗(yàn)1:多尺度建筑空間圖像的特征標(biāo)記
首先需要從資源庫內(nèi)隨機(jī)提取一幅建筑圖像,作為實(shí)驗(yàn)原圖像,對(duì)其進(jìn)行特征標(biāo)記。
圖2 多尺度建筑空間特征標(biāo)記
通過圖1能夠看出,圖像的所有存在特征的點(diǎn)已經(jīng)通過白色的圓標(biāo)記出來,這些圓清晰地組成了建筑空間內(nèi)物體的大致架構(gòu),同時(shí)標(biāo)記清晰,并且這些標(biāo)記能夠被移動(dòng),因此不會(huì)對(duì)圖像造成較大的缺損,通過圖1能夠證明所提方法在多尺度建筑空間圖像分解中,的表現(xiàn)較為優(yōu)異。
實(shí)驗(yàn)2:多尺度建筑空間圖像的紋理分解
使用圖2作為圖像紋理分解的源圖像,利用所提方法對(duì)該圖像的紋理進(jìn)行分解,分解的結(jié)果如圖3所示。
圖3 所提方法分解建筑空間圖像紋理結(jié)果
通過圖3能夠看出,所提方法所標(biāo)記出的特征非常清晰,且標(biāo)記的輪廓較為完整,并不存在較大缺陷。這是因?yàn)樗岱椒?,能夠通過特征標(biāo)記定義,縮減圖像內(nèi)產(chǎn)生的階梯現(xiàn)象,使后期分解圖像時(shí)的圖像特征更為完整、明顯。
實(shí)驗(yàn)3:建筑空間圖像像素分解
通過圖4能夠看出,所提方法分解出的像素,存在較為顯著的區(qū)別性,同時(shí)像素圖內(nèi),噪聲存在量較少,不會(huì)對(duì)分解結(jié)果產(chǎn)生影響。
為了獲取建筑空間圖像內(nèi)的關(guān)鍵信息、提出冗余信息,提出一種基于特征標(biāo)記的多尺度建筑空間圖像分解方法,該方法依靠特征標(biāo)記與曲面差值,實(shí)現(xiàn)對(duì)多尺度圖像的分解。但由于所提方法只偏向于對(duì)圖像的分解,因此并沒有設(shè)計(jì)針對(duì)圖像儲(chǔ)存的數(shù)據(jù)庫,而分解出的無用圖像與分解結(jié)果,都需要直接剔除或使用,這就導(dǎo)致算法的運(yùn)行過程中,需要依靠工作人員實(shí)時(shí)協(xié)助,會(huì)消耗大量的人力資源。因此,下一步所需要研究的課題即:在所提方法的基礎(chǔ)上,增添不同種類的資源儲(chǔ)存庫,以存放分解結(jié)果與無用圖像,真正實(shí)現(xiàn)算法的自動(dòng)化運(yùn)行。