陳然
四川大學(xué) 電子信息學(xué)院 四川 成都 610065
我們都知道,自然界的數(shù)據(jù)大多數(shù)是稀疏的,也就是說(shuō),當(dāng)它們?cè)谀硞€(gè)域上表示時(shí),它們包含許多接近或等于零的系數(shù)。壓縮感知(CS)[1]可以以遠(yuǎn)低于采樣定理所要求的采樣速率采集壓縮數(shù)據(jù),運(yùn)用CS需要預(yù)先將圖像矩陣進(jìn)行壓縮采樣。二維離散余弦變換(2DDCT)能夠有效地濾掉圖像中不敏感的中頻和高頻分量,保留信息的本質(zhì)內(nèi)容,是常用的圖像壓縮方法,已有文獻(xiàn)將2DDCT與CS相結(jié)合應(yīng)用于人臉識(shí)別[2]。
在本文中,我們提出了利用2DDCT進(jìn)行降維,降低CS運(yùn)算量的算法結(jié)構(gòu)?;?DDCT的高頻分量較少特點(diǎn),使用2DDCT作為目標(biāo)圖像到頻域的轉(zhuǎn)換方法,過(guò)濾了目標(biāo)圖像在頻域的高頻分量,從而減輕我們結(jié)構(gòu)的運(yùn)算量。目標(biāo)圖像轉(zhuǎn)換到頻域后,可以進(jìn)行噪聲消除,更具有噪聲魯棒性。該結(jié)構(gòu)能夠在降低少量的圖像重構(gòu)能力的前提下,降低程序大量的運(yùn)算時(shí)間,并且在噪聲環(huán)境中有良好的表現(xiàn)。
圖像經(jīng)過(guò)2DDCT后,其低頻分量集中在左上角,高頻分量分布在右下角。低頻分量包含了圖像的主要信息,大多數(shù)圖像的高頻分量比較小接近于0,再加上高頻分量中只包含了圖像的細(xì)微的細(xì)節(jié)變化信息,而人眼對(duì)這種高頻成分的失真不太敏感,因此考慮將這一些高頻成分予以裁剪,從而降低計(jì)算量。操作以后,通過(guò)逆變換就可以得到原來(lái)的數(shù)據(jù),雖然這么做存在一定的失真,但人眼對(duì)這種微小的變換是不敏感的。
二維離散余弦變換表達(dá)式:
二維的離散余弦變換公式性質(zhì)可以推導(dǎo)得到二維離散余弦變換也可以寫成矩陣相乘形式:
A為離散余弦變換的變換系數(shù)矩陣,AT是A的轉(zhuǎn)置矩陣
相對(duì)于傳統(tǒng)的奈奎斯特采樣定理,壓縮感知?jiǎng)t利用數(shù)據(jù)的冗余特性,只采集少量的樣本還原原始數(shù)據(jù)。CS從比傳統(tǒng)采集方案少得多的測(cè)量數(shù)據(jù)中重構(gòu)信號(hào)。稀疏性和非相干性是CS的前提[3]。壓縮感知的核心問(wèn)題分為三個(gè)部分:第一部分,信號(hào)的稀疏表示;第二部分,采樣過(guò)程投影矩陣選擇;第三部分,信號(hào)重構(gòu)算法。
圖像中的數(shù)據(jù)量一般十分龐大,直接用于識(shí)別效率不高。在圖像中,噪聲往往屬于高頻分量,且其系數(shù)往往較小,因此,在頻域中去除噪聲往往比較容易。將CS從時(shí)域轉(zhuǎn)移到頻域中,并且過(guò)濾掉圖像的高頻分量,不僅可以去除噪聲,還可以減少計(jì)算量。整體結(jié)構(gòu)如圖1所示。
圖1 帶2DDCT的CS稀疏特征提取
為了探究2DDCT降維的CS是否實(shí)現(xiàn)增強(qiáng)圖像重構(gòu)能力與降低重構(gòu)圖像時(shí)間的目的,本小節(jié)對(duì)2DDCT降維的CS進(jìn)行試驗(yàn)仿真分析。圖像重構(gòu)后的評(píng)價(jià)指標(biāo)選用國(guó)際上最常用的峰值信噪比(PSNR),重構(gòu)時(shí)間為CPU運(yùn)行時(shí)間。
在本小節(jié)中先驗(yàn)證2DDCT的去噪能力,我們?cè)趫D像上添加高斯隨機(jī)噪聲,期望為μ,方差為σ2。我們?cè)趯?shí)驗(yàn)中通過(guò)設(shè)定不同的σ2,以驗(yàn)證不同的截取范圍對(duì)PSNR的影響。
表1 不同噪聲的截取范圍比較
從表1中,當(dāng)σ2=0.005和σ2=0.01時(shí),PSNR的值隨著w的 減小而增加。而當(dāng)σ2=0.02時(shí),PSNR的值隨著w的減小而增加。從整個(gè)模塊來(lái)看,頻域經(jīng)過(guò)截取過(guò)后的IDCT的PSNR都要大于不截取,說(shuō)明通過(guò)2DDCT后,截取一定范圍的“圖像”在去噪方面有很不錯(cuò)的效果。
本文提出先用2DDCT將圖像矩陣投映到頻域后,取左上角w×w塊作為頻域中的“圖像”,然后運(yùn)用壓縮感知模塊做稀疏特征提取,截取2DDCT是為了更好的提取圖像本質(zhì)特征,減少運(yùn)算量。接下來(lái),我們將設(shè)定兩個(gè)自變量截取范圍w和壓縮率,把PSNR和CPU運(yùn)行時(shí)間作為因變量進(jìn)行實(shí)驗(yàn)。
實(shí)驗(yàn)結(jié)果如表2到表4所示,當(dāng)壓縮率在0.7及以下時(shí),截取范圍的縮小對(duì)于PSNR參數(shù)影響不大,但是CPU耗時(shí)近似呈等差數(shù)列遞減。當(dāng)壓縮率為0.9時(shí),截取范圍的縮小對(duì)于PSNR參數(shù)有較大影響。此項(xiàng)實(shí)驗(yàn)表明,當(dāng)壓縮率≤0.7時(shí),通過(guò)截取2DDCT左上角的w×w的“圖像”,能夠有效減少運(yùn)算量,且不會(huì)對(duì)壓縮感知的圖像重構(gòu)性能造成較大的影響。
表2 壓縮率為0.9
表3 壓縮率為0.7
表4 壓縮率為0.5
本章節(jié)初步嘗試將2DDCT降維和壓縮感知整合到一個(gè)統(tǒng)一的結(jié)構(gòu)中,提出了一種更有效率的CS算法。將稀疏特征提取從時(shí)域轉(zhuǎn)換到頻域,不僅可以輕松去除噪聲,還能夠去除人眼不敏感的高頻分量。實(shí)驗(yàn)結(jié)果表明,2DDCT降維的CS模型采用的方案是有效的。與壓縮感知相比,我們提出的模型還能夠減少計(jì)算量,從而減少程序運(yùn)行時(shí)間,也使整個(gè)系統(tǒng)在嘈雜的環(huán)境下變得更加健壯。