張雷,劉叢
(上海理工大學(xué),上海 200093)
在圖像采集、傳輸?shù)冗^(guò)程中,由于采集設(shè)備和傳感設(shè)備的影響,不可避免地會(huì)產(chǎn)生噪聲圖像。這嚴(yán)重影響了圖像分割、圖像識(shí)別等后續(xù)的圖像解譯工作[1]。圖像質(zhì)量的下降會(huì)影響人們對(duì)圖像的視覺(jué)觀察效果,同時(shí)后續(xù)也會(huì)阻礙對(duì)圖像提取有用的信息[2]。圖像去噪是一種基本的圖像處理技術(shù),其通過(guò)對(duì)噪聲圖像處理以恢復(fù)原始的清晰圖像。該技術(shù)廣泛地應(yīng)用于圖像處理、信號(hào)處理以及計(jì)算機(jī)視覺(jué)等諸多領(lǐng)域。
傳統(tǒng)的圖像去噪研究利用圖像的先驗(yàn)信息進(jìn)行去噪,如梯度模型[3]、低秩模型[4]和稀疏模型[5]。在稀疏表示去噪中,原始圖像通過(guò)一個(gè)過(guò)完備字典和一組稀疏系數(shù)矩陣的線性組合映射到低維空間以去除噪聲。在該模型中,每個(gè)子圖像都是獨(dú)立的,沒(méi)有考慮到相似子圖像間的相關(guān)性。針對(duì)該問(wèn)題,低秩表示(LRR)[6-7]可以挖掘不同系數(shù)之間的相關(guān)性。LRR將整個(gè)圖像分為多個(gè)子向量,每個(gè)子向量對(duì)應(yīng)一個(gè)系數(shù),并對(duì)系數(shù)矩陣添加低秩約束以更好地捕捉數(shù)據(jù)的全局結(jié)構(gòu)。LRR 在圖像去噪中獲得了成功,但其自身仍存在一些問(wèn)題。首先,它在去噪過(guò)程中仍然將整個(gè)圖像劃分為多個(gè)圖像塊或者向量操作,不可避免地會(huì)帶來(lái)巨大的計(jì)算量。其次,該模型通常將圖像自身作為字典而缺乏有效的字典表示。針對(duì)上述問(wèn)題,Bahri等[8-9]采用了一種具有Kronecker 結(jié)構(gòu)的低秩可分離字典(SeDiL)。一方面,低秩可分離字典可以克服LRR 中無(wú)結(jié)構(gòu)良好的字典的問(wèn)題,可以很好地反映整幅圖像的低秩性。另一方面,在文獻(xiàn)[8-9]中,它可以出色地完成高水平噪聲下的去噪任務(wù)。針對(duì)該改進(jìn),文中進(jìn)一步結(jié)合可分離字典的學(xué)習(xí)和低秩表示的優(yōu)點(diǎn),設(shè)計(jì)了一種高效的去噪模型以應(yīng)對(duì)高強(qiáng)度噪聲圖像去噪,稱為基于可分離字典的稀疏和低秩表示(SLRR-SD)。該模型首先使用可分離字典代替LRR中的過(guò)完備字典,以解決LRR 無(wú)法尋找合適字典的問(wèn)題。其次,使用Frobenius 范數(shù)對(duì)2 個(gè)分離字典約束,以尋找字典內(nèi)部的低秩性。進(jìn)一步,受Zhang 提出的結(jié)構(gòu)化低秩表示(SLRR)[10-11]的啟發(fā),為了獲得更有效的表示,使用SLRR 以增加系數(shù)矩陣的稀疏性。大量的實(shí)驗(yàn)結(jié)果表明,提出的算法在面對(duì)高強(qiáng)度噪聲時(shí),獲得了較好的去噪效果。
雖然LRR 可以在一定程度上緩解SR 的行列信息丟失問(wèn)題,但并沒(méi)有從根本上解決這個(gè)問(wèn)題。在實(shí)際操作中,圖像的表示是從矩陣變?yōu)榱邢蛄俊?/p>
SLRR 是LRR 的改進(jìn)模型,它在LRR 的基礎(chǔ)上增加了稀疏表示來(lái)建立新的模型。
從這個(gè)新模型中可以看出,低秩分量揭示了全局信息,而稀疏性決定了圖像屬于哪一類[7]。此外,SLRR 還提出了一種學(xué)習(xí)字典的方法,解決了LRR沒(méi)有較好結(jié)構(gòu)字典的問(wèn)題。與LRR 類似,SLRR 仍然不能解決數(shù)據(jù)的維度問(wèn)題。
圖1 基于可分離字典表示的二維數(shù)據(jù)Fig.1 Two-dimensional data based on separable dictionary representation
此節(jié)介紹基于可分離字典的稀疏和低秩表示模型。該模型結(jié)合了SLRR 和SeDiL 的優(yōu)點(diǎn),能有效地去除高密度的噪聲。一方面,對(duì)于模型的優(yōu)化,不僅要考慮某些因素,還要考慮它們之間的相互影響。在彈性網(wǎng)絡(luò)[12-14]中,1L和2L范數(shù)作為聯(lián)合懲罰項(xiàng),解決了稀疏性和穩(wěn)定性之間的平衡問(wèn)題。壓縮感知理論表明,模型解的稀疏性和穩(wěn)定性是不能同時(shí)實(shí)現(xiàn)的,因此在模型設(shè)計(jì)過(guò)程中應(yīng)充分考慮它們之間的相互作用?;谶@個(gè)思想,1L范數(shù)和核范數(shù)被結(jié)合在文中的稀疏和低秩表示模型中。1L范數(shù)控制表示系數(shù)的稀疏性,而核范數(shù)控制其低秩性,使得表示系數(shù)更穩(wěn)健有效,恢復(fù)結(jié)果更好。此外,SLRR-SD 能夠?qū)⒄麄€(gè)圖像表示為一個(gè)低秩矩陣以克服行和列之間信息丟失的缺點(diǎn),并獲得有效的全局表示。另一方面,傳統(tǒng)的K-SVD 方法得到的字典只適用于小圖像塊,而不能處理大圖像塊甚至整幅圖像。SLRR-SD 獲得的Kronecker 結(jié)構(gòu)的可分離字典可以很好地解決這個(gè)問(wèn)題,而且可分離字典具有低秩性,圖像重建能力更強(qiáng)。通過(guò)低秩表示和低秩分離字典,可以使恢復(fù)的圖像達(dá)到理想的低秩。最后,K-SVD 方法需要通過(guò)預(yù)訓(xùn)練樣本來(lái)學(xué)習(xí)字典,這種方法會(huì)帶來(lái)沉重的計(jì)算負(fù)擔(dān),而SLRR-SD 通過(guò)在線學(xué)習(xí)字典很好地克服了這一缺陷。
LRR-SD 模型見(jiàn)式(6)。
在這里,使用交替方向乘子法(ADMM)[16]來(lái)優(yōu)化式(8)可得:
如上所述,當(dāng)優(yōu)化一個(gè)參數(shù)同時(shí)固定其他參數(shù)時(shí),式(9)的損失函數(shù)是凸的。通過(guò)交替更新每個(gè)參數(shù)來(lái)優(yōu)化它,直到達(dá)到收斂。
2.2.1 更新變量E
假設(shè)所有其他參數(shù)都是固定的,通過(guò)求解式(10)來(lái)更新噪聲矩陣E。
式中:S( )為軟閾值收縮算子[17-18]。
2.2.2 更新變量A
假設(shè)所有其他參數(shù)都是固定的,通過(guò)求解式(11)來(lái)更新可分離字典A。
2.2.3 更新變量B
假設(shè)所有其他參數(shù)都是固定的,通過(guò)求解式(13)來(lái)更新可分離字典B。
2.2.4 更新變量K
假設(shè)所有其他參數(shù)都是固定的,通過(guò)求解式(15)來(lái)更新分離變量K。
更新式(16)中的K是一個(gè)挑戰(zhàn)。其中式(16)是Stein 方程,可以用離散時(shí)間的Sylvester 方程求解,如Hessenberg-Schur 方法。
2.2.5 更新變量Z
假設(shè)所有其他參數(shù)都是固定的,通過(guò)求解式(17)來(lái)更新低秩表示Z。
式中:D( )為奇異值收縮算子[17-18]。
2.2.6 更新變量W
固定其他的變量,通過(guò)求解式(18)來(lái)更新分離變量W。
2.2.7 更新變量T
固定其他的變量,通過(guò)求解式(19)來(lái)更新分離變量T。
3.1.1 數(shù)據(jù)集
1)基準(zhǔn)圖像,即Facade 圖像[19]。這幅畫具有鮮明的特征,如黑色的十字架、窗戶,以及用墻紋裝飾的窗戶中的物體。
2)Berkeley Segmentation 數(shù)據(jù)集[20]。它由300張圖像組成,用于灰度和顏色分割。
3)Set 12 數(shù)據(jù)集。該數(shù)據(jù)集包含12 幅圖像處理中應(yīng)用最廣泛的灰度圖像,如Lena、House、Parrot等。文中測(cè)試了3 個(gè)數(shù)據(jù)集中的100 多張圖像,這里只應(yīng)用了8 張測(cè)試圖像來(lái)展示去噪結(jié)果,見(jiàn)圖2,分別為Fa?ade(202×194)、Flower(321×481)、Bear(481×321)、Ostrich(481×321)、Lena(128×128)、Barbara(256×256)、House(256×256)、Parrot(256×256)。
圖2 測(cè)試圖像Fig.2 Test images
3.1.2 對(duì)比方法
文中將2 個(gè)去噪模型與6 種相關(guān)的方法進(jìn)行比較。前 3 種比較方法是基于不同的字典[21],包括K-SVD 字典(K-SVD)、DCT 字典(DCT)和全局字典(Global);第4 個(gè)比較方法是最小權(quán)重核范數(shù)(WNNM)[22],其中奇異值被賦予不同的權(quán)重;第5種比較方法是穩(wěn)健主成分分析(RPCA)[23];第6 種比較方法是魯棒非線性矩陣分解的魯棒非線性分解方法(SNLMF)[24]。
3.1.3 參數(shù)設(shè)置
3.1.4 對(duì)比定量
峰值信噪比(PSNR)[25]可以衡量恢復(fù)圖像的平滑度,而特征相似度指數(shù)(FSIM,彩色圖像為FSIMc)[26]可以衡量恢復(fù)圖像的特征信息。
在 3 個(gè)數(shù)據(jù)集(Facade 圖像、Berkeley Segmentation 數(shù)據(jù)集和Set 12 數(shù)據(jù)集)上的實(shí)驗(yàn)結(jié)果如圖4 所示。在實(shí)驗(yàn)中使用了4 種噪聲強(qiáng)度,噪聲強(qiáng)度5%用于模擬低強(qiáng)度噪聲損傷,噪聲強(qiáng)度10%和20%用于模擬中度破壞,噪聲強(qiáng)度30%用于模擬嚴(yán)重破壞。
3.2.1 基準(zhǔn)Fa?ade 圖像
現(xiàn)在分析在Fa?ade 圖像上通過(guò)不同方法獲得的去噪結(jié)果。在噪聲強(qiáng)度5%、10%、20%和30%下,定量結(jié)果分別顯示在表1、表2、表3 和表4 的第1列中。從表1—4 中可以看出,所提出的SLRR-SD表現(xiàn)出最好的性能。在表4 中,其他模型在數(shù)值上與文中算法有很大的差距。
在噪聲強(qiáng)度10%和30%下的視覺(jué)結(jié)果如圖3 和圖4 的第1 行所示。從圖3 中可以看出,大多數(shù)比較方法都能很好地恢復(fù)圖像,噪聲去除比較干凈并保留了圖像的大部分信息。DCT、K-SVD、Global 和WNNM得到的去噪結(jié)果嚴(yán)重丟失了圖像的原始信息,如建筑物上的黑色十字、窗戶上的物體和墻上的線條,而提出的SLRR-SD 可以更好地恢復(fù)原始信息,它保留了建筑外墻的這些特點(diǎn)。
3.2.2 Berkeley Segmentation 數(shù)據(jù)集
在噪聲強(qiáng)度為5%、10%、20%和30%下,定量結(jié)果分別見(jiàn)表1、表2、表3 和表4 的第2、3、4 列中。從表1—4 中可以看到提出的SLRR-SD 在所有噪聲強(qiáng)度下仍然獲得了3 圖像的最高測(cè)量值。在表4中,其他模型在數(shù)值上與文中法有很大的差距。
在噪聲強(qiáng)度為10%和30%下的視覺(jué)結(jié)果如圖3和圖4 的第2、3、4 行所示。圖3 中的大多數(shù)方法都可以很好地恢復(fù)這3 個(gè)圖像的原始信息。在噪聲強(qiáng)度為30%下,大部分比較方法都丟失了花瓣、花瓣上的線條和中心花蕊的細(xì)節(jié)。熊頭部和周圍雜草的輪廓已經(jīng)模糊,有些甚至看不到雜草。鴕鳥的眼睛和嘴巴已經(jīng)變形或以其他方式丟失,并且背景噪聲也沒(méi)有完全消除。這表明在高強(qiáng)度噪聲條件下,文中算法在保留原圖像信息的同時(shí)能夠很好地完成去噪任務(wù)。
圖4 噪聲強(qiáng)度為30%的去噪結(jié)果Fig.4 Denoising results for 30% noise intensity
3.2.3 Set 12 數(shù)據(jù)集
在噪聲強(qiáng)度為5%、10%、20%和30%下,定量結(jié)果分別顯示在表1、表2、表3 和表4 的第1、2、3、4 列中。提出的SLRR-SD 在所有表中的值依然是最高的。
表1 噪聲強(qiáng)度為5%的PSNR/FSIM 值Tab.1 Values of PSNR/FSIM for 5% noise intensity
表2 噪聲強(qiáng)度為10%的PSNR/FSIM 值Tab.2 Values of PSNR/FSIM for 10% noise intensity
表3 噪聲強(qiáng)度為20%的PSNR/FSIM 值Tab.3 Values of PSNR/FSIM for 20% noise intensity
表4 噪聲強(qiáng)度為30%的PSNR/FSIM 值Tab.4 Values of PSNR/FSIM for 30% noise intensity
在噪聲強(qiáng)度10%和30%下的視覺(jué)結(jié)果如圖3 和圖4的第5、6、7、8 行所示。在噪聲強(qiáng)度30%下,該數(shù)據(jù)集中數(shù)值與視覺(jué)的對(duì)比更加明顯。首先,在圖4 中,大多數(shù)方法的Lena 和Barbara 人物的面部輪廓、頭發(fā)、帽子和圍巾完全看不清楚。此外,House 和Parrot 幾乎看不到圖像的輪廓,細(xì)節(jié)信息完全丟失。SLRR-SD 不僅可以保留大致的輪廓結(jié)構(gòu),還可以恢復(fù)一些原始細(xì)節(jié),例如Lena 的面部結(jié)構(gòu)和Parrot 的紋理信息。
圖5 迭代誤差Fig.5 Error of iteration
文中提出了基于可分離字典的稀疏和低秩表示算法用于圖像去噪。在SLRR-SD 中,低秩表示和低秩可分離字典用來(lái)提升整幅圖像的低秩性。將稀疏表示與低秩表示相結(jié)合,以獲得更有效的表示,進(jìn)一步增加了整幅圖像的低秩性。此外SLRR-SD 不僅能保留相鄰列之間的相關(guān)性,并且它的可分離字典優(yōu)化過(guò)程也降低了計(jì)算負(fù)擔(dān)。提出的算法在噪聲強(qiáng)度5%、10%、20%和30%下的PSNR/FSIM 的平均值分別為32.736/0.975、29.769/0.957、29.295/0.951 和26.768/0.921。仿真實(shí)驗(yàn)結(jié)果表明,提出的模型不僅可以消除噪聲,而且可以恢復(fù)更多的圖像特征信息,并且在高強(qiáng)度噪聲的破壞下SLRR-SD 依然可以獲得良好的恢復(fù)效果。在未來(lái)的工作中,將繼續(xù)深入研究圖像去噪領(lǐng)域,探索高維度、高規(guī)模的圖像去噪技術(shù)。