徐慶紅,方力,鐘微,蔣克華
(中國傳媒大學 媒介音視頻教育部重點實驗室,北京 100024)
隨著社交媒體的發(fā)展,近幾年網(wǎng)絡(luò)上的圖像數(shù)量呈爆炸性增長。為了有效地傳輸和存儲圖像,有必要研究高效的圖像壓縮方法。圖像壓縮編碼過程中的稀疏變換環(huán)節(jié)十分重要,通過變換可以把空間域的大量圖像數(shù)據(jù)轉(zhuǎn)換到變換域,用很少的數(shù)據(jù)來表示原始圖像,以達到“稀疏”表示原圖像的目的。常用的變換有傅立葉變換、離散余弦變換、小波變換等,其中小波變換更是被新一代圖像壓縮標準 JPEG2000[1]所采用。然而,可分離的二維小波來自一維小波的張量積,其基函數(shù)具有各向同性,因此只能表示圖像信息豎直、水平和對角線方向的直線奇異性。而自然圖像作為一種具有高維奇異曲線或曲面的特殊信號,二維小波逼近圖像中的奇異曲線時,隨著小波基尺度不斷變細,非零小波系數(shù)會以指數(shù)的形式不斷增長,重要不可忽視系數(shù)大幅增加,最終變?yōu)橛谩包c”來逼近曲線。因此,小波變換并不能為高維奇異圖像提供高效的或者最稀疏的表示。
在這種背景之下,圖像的“多尺度幾何分析(multiscale geometric analysis,MGA)”[2]理論被提出來。多尺度幾何分析是一種數(shù)學分析工具,不僅具有小波變換的多分辨率特性、時頻局部性,而且還具有多方向性和各向異性。多尺度幾何分析能夠?qū)Ω呔S奇異圖像進行稀疏展開,使變換具有更強的非線性逼近能力,彌補了小波變換在處理高維奇異圖像過程中的不足。常見的多尺度幾何分析工具中,脊波變換[3]首先利用Radon變換把圖像的線奇異映射為Radon域上的點奇異,然后再用小波變換處理點奇異頻域圖像。曲線波變換[4]是脊波變換的衍生,由濾波和多尺度脊波變換組成,其基本思想是先把圖像的曲線奇異分割成平滑的直線奇異,然后再利用脊波變換處理局部的直線奇異,分解方法較復(fù)雜。輪廓波變換[5-6]繼承了脊波和曲線波變換的優(yōu)點,它通過多尺度和多方向濾波聯(lián)合完成分解,分解過程中首先利用拉普拉斯金字塔濾波器完成多尺度分解,然后通過方向濾波器組實現(xiàn)多方向分解,其冗余度減少至33%。然而輪廓波變換不具備平移不變性,在信號去噪時會產(chǎn)生偽吉布斯現(xiàn)象。為了解決這個問題,Cunda等人[7]提出了非下采樣的輪廓波變換。剪切小波是復(fù)合小波的延伸,具有多尺度框架和各向異性,在多變量問題中能高效率變換。Kutyniok 等人[8]對剪切小波做了系統(tǒng)的介紹,并應(yīng)用到實際圖像壓縮編碼中。然而,上述這些多尺度幾何分析工具大都具有固定的子帶劃分策略,沒有考慮輸入圖像信號的頻率分布特性,由于自然圖像包含了豐富復(fù)雜的紋理信息和幾何輪廓信息,使用上述這些固定分解的方法無法實現(xiàn)高效稀疏表示。
針對上述問題,本文提出了一種基于熵準則的自適應(yīng)輪廓波變換方法。該方法能夠根據(jù)圖像的頻率分布特性,在子帶香農(nóng)能量熵的指導(dǎo)下,對圖像進行自適應(yīng)多尺度分解,并進一步對各個子帶進行自適應(yīng)方向分解,最終實現(xiàn)圖像的高效稀疏表示。實驗結(jié)果表明,使用該方法可以顯著提高圖像編碼的質(zhì)量。
論文剩余部分結(jié)構(gòu)安排如下:第二節(jié)介紹了自適應(yīng)變換的基本思想,提出了一種基于熵準則的自適應(yīng)輪廓波變換;第三節(jié)提出了一種基于自適應(yīng)輪廓波變換的圖像編碼方法,并進行實驗分析;第四節(jié)給出了結(jié)論。
自然圖像包含豐富的紋理信息和邊緣輪廓信息,不同圖像內(nèi)容差異很大,因此采用相同的分解策略難以獲得高效的稀疏表示。而采用自適應(yīng)方法,可以根據(jù)輸入圖像內(nèi)容的不同,自適應(yīng)地采用不同的分解策略,從而實現(xiàn)圖像的高效稀疏表示。
香農(nóng)能量熵(Shannon energy entropy)[9]是圖像“繁忙”程度的估計值,對于M×N的圖像信號,香農(nóng)能量熵定義如下:
(1)
(2)
(3)
其中s(n,m)、w(n,m)、x(n,m)和p分別為圖像的能量熵、圖像中各像素功率在總功率中的比率、圖像各個像素值和圖像像素總功率。
對于熵值越高的圖像(在亮度上有很多細節(jié)和變化,如有很多鵝卵石的地面,陰影對比分明),將需要更高的壓縮設(shè)置來滿足最終的目標圖像大小限制。對于熵值低的圖像,比如飄著一些云彩的天空,沒有太多的細節(jié)和變化,因而只要較少的壓縮量就能滿足目標圖像大小限制。因此,我們采用如下的自適應(yīng)子帶劃分策略:對于熵值較高的子帶,通過進一步分解,來獲得其更高效的稀疏表示;反之,對于熵值較低的子帶,則不需要再進一步分解。
由于輪廓波變換采用了樹型結(jié)構(gòu),非常符合上述由粗到細的分解策略,而且輪廓波相對于剪切波等變換冗余較小,更適用于圖像編碼。因此,我們把基于香農(nóng)能量熵的自適應(yīng)分解方法應(yīng)用到輪廓波變換中,在輪廓波變換的多尺度分解和多方向分解過程中基于圖像的頻率分布對圖像進行自適應(yīng)子帶劃分,從而實現(xiàn)圖像的高效稀疏表示。
2.2.1 輪廓波變換
輪廓波變換的基函數(shù)與小波基函數(shù)不同。輪廓波變換的基函數(shù)的緊支集支撐區(qū)間為“長方形”,為了逼近奇異曲線,隨著尺度的不斷變化,長方形的長寬比發(fā)生變化,最終會變?yōu)橛谩熬€段”的形式逼近原函數(shù),這也正是輪廓波變換的名稱由來。如圖1所示。
圖1 輪廓波逼近曲線的過程
輪廓波變換的基本結(jié)構(gòu)如圖2所示。從組成結(jié)構(gòu)來看,輪廓波變換是一種雙重濾波器組結(jié)構(gòu)[10],其核心是拉普拉斯塔形方向濾波器組,它由拉普拉斯塔式濾波器[11]和方向濾波器組[12]兩部分構(gòu)成,分別完成信號的多尺度分解和多方向分解。
圖2 輪廓波變換的結(jié)構(gòu)
2.2.2 輪廓波自適應(yīng)變換過程
雖然輪廓波變換的尺度分解和方向分解完全獨立,但是都采用了由粗到細的分解模式。另外,尺度和方向分解的等級參數(shù)完全由執(zhí)行者預(yù)先設(shè)置,沒有考慮圖像的頻率分布。為了解決這個問題,我們借助基于熵準則的自適應(yīng)分解,在尺度分解時根據(jù)低頻子帶系數(shù)的香農(nóng)能量熵自適應(yīng)確定分解級數(shù),在多方向分解時根據(jù)方向子帶系數(shù)的香農(nóng)能量熵自適應(yīng)確定方向子帶的數(shù)目,從而實現(xiàn)圖像的自適應(yīng)分解。
自適應(yīng)輪廓波分解包括以下兩步:
1)多尺度分解:用拉普拉斯金字塔濾波器對原始圖像進行低高通子帶的分解,分別得到低通子帶L1和高通子帶H1,根據(jù)公式(2)計算低通子帶L1的香農(nóng)能量熵值S1,將低通香農(nóng)能量熵值S1與閾值熵SL進行比較,香農(nóng)能量熵S1大于閾值熵SL則繼續(xù)進行二級尺度分解,同理對二級低通子帶繼續(xù)進行能量判決確定是否分解,以此類推,直到最后分解等級的低通子帶能量熵值Si小于閾值熵值SL,則停止尺度分解。圖3為拉普拉斯金字塔自適應(yīng)分解流程圖,其中i=1。
2)多方向分解:對拉普拉斯金字塔多尺度分解后的帶通子帶進行多方向濾波。多方向濾波器組對子帶頻率進行方向劃分,一級方向分解把帶通子帶分解為左右兩個方向子帶樹,計算左子樹方向子帶香農(nóng)能量熵S11,能量熵S11與閾值熵SD進行判決,當S11>SD則繼續(xù)進行二叉方向分解,對下一級方向分解使用同種判決分解方式,直到分解的方向子帶不滿足以上條件為止;對右子樹判決分解方式與左子樹分解一樣,閾值熵SD大小不變,方向分解直到最后的方向子帶能量熵不滿足條件為止。左右子樹分解完成,最終實現(xiàn)自適應(yīng)多方向濾波。圖4為自適應(yīng)多方向分解框架,其中i=1。
圖像重構(gòu)是圖像分解的逆過程。自適應(yīng)輪廓波重構(gòu)包括以下兩步:
1)方向子帶重構(gòu)。將分解得到的方向子帶系數(shù)進行反變換,得到i尺度下的帶通子帶高頻系數(shù)fi。
圖3 拉普拉斯金字塔自適應(yīng)分解
圖4 多方向自適應(yīng)濾波
依據(jù)圖像編碼框架,本文提出一種基于最小熵自適應(yīng)輪廓波變換的圖像編碼算法。編碼結(jié)構(gòu)采用JPEG2000的基本框架,自適應(yīng)輪廓波變換代替小波變換。編碼結(jié)構(gòu)如圖5所示。
圖5 自適應(yīng)輪廓波變換編碼框架
編碼過程中,首先利用自適應(yīng)變換對圖像進行尺度和方向的分解;然后對所得變換系數(shù)進行量化,考慮到不同尺度下變換系數(shù)的能量分布不同,所以對不同子帶采用不同的量化步長;最后不同尺度分等級進行編碼,實現(xiàn)圖像的編碼過程,詳細流程如下:
(1)由公式(1)計算原始圖像的香農(nóng)能量熵s(n,m),根據(jù)原始圖像的香農(nóng)能量熵值大小,分別設(shè)定多尺度分解和多方向分解的閾值SL和SD,SL=γL×s(n,m),SD=γD×s(n,m),(其中γL、γD分別為多尺度變換和多方向變換的閾值系數(shù))對原始圖像進行自適應(yīng)輪廓波分解,得到變換系數(shù);
(2)對變換后的各子帶系數(shù)根據(jù)父子關(guān)系進行重排,記錄子帶系數(shù)分布以及大小關(guān)系;
(3)同一子帶均勻量化,不同子帶根據(jù)子帶特性采用不同量化閾值。子帶系數(shù)量化,得到二進制符號流;
(4)對二進制符號流進行算術(shù)編碼,最終輸出壓縮后的比特流。
實驗采用大小為512×512像素的“man”、“l(fā)ena”和256×256像素的“object”灰度圖像作為測試圖。通過對大量圖像的測試分析,多尺度變換和多方向變換閾值系數(shù)γL和γD分別設(shè)定為1%和4%。我們將本文提出的編碼方法與基于脊波、曲線波、輪廓波等變換的編碼方法的結(jié)果進行比較,表1給出不同碼率下的PSNR值;圖6、7給出不同編碼方法在不同圖像下的PSNR曲線。
表1 Man
圖6 “l(fā)ena”圖像采用不同編碼方法的PSNR比較
圖7 “object”圖像采用不同編碼方法的PSNR比較
從表1和圖6、7中可以看出,在所有測試圖像中,本文提出的編碼算法與輪廓波變換編碼算法相比在編碼性能上均有所提升,提升約0.5-2db,其對輪廓比較復(fù)雜的圖像效果尤其好。
圖8、9所示為測試圖“man”、“l(fā)ena”采用輪廓波變換和本文方法的重構(gòu)效果圖。圖8為當碼率為0.16bpp時,兩種方法下“man”a、b重構(gòu)圖;圖9為碼率為0.07bpp時,兩種方法下重構(gòu)lena的部分展示圖像c、d。
從圖8、9中可以看出采用自適應(yīng)輪廓波變換編碼方案重構(gòu)后的圖像整體輪廓清晰,而輪廓波變換編碼重構(gòu)后的圖像中紋路模糊,視覺效果下降。因此,采用本文算法同碼率下重構(gòu)圖像的主觀視覺質(zhì)量有所提升。
本文提出了一種適用于圖像稀疏表示的基于熵準則的自適應(yīng)輪廓波變換方法,可以根據(jù)圖像頻率分布特性,實現(xiàn)尺度和方向由粗到細的自適應(yīng)分解。我們將該變換應(yīng)用于JPEG2000編碼框架,實現(xiàn)圖像的壓縮編碼。實驗結(jié)果表明本文所提編碼方法在圖像編碼中,能夠很好的提取圖像的輪廓紋理信息,與基于脊波、曲線波、輪廓波等變換的編碼方法相比,同等碼率下峰值信噪比提升約0.5-2 dB。
(a)本文算法
(b)基于輪廓波方法圖8 0.16bpp時輪廓波變換和本文方法的重構(gòu)圖
(a)本文算法
(b)基于輪廓波方法圖9 0.07bpp時輪廓波變換和本文方法的重構(gòu)圖