羅 瓊 韓 志 陳希愛 唐延?xùn)|
1(中國(guó)科學(xué)院沈陽自動(dòng)化研究所機(jī)器人學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室 遼寧 沈陽 110016) 2(中國(guó)科學(xué)院機(jī)器人與智能制造創(chuàng)新研究院 遼寧 沈陽 110016) 3(中國(guó)科學(xué)院大學(xué) 北京 100049)
真實(shí)場(chǎng)景的輻射通常遍及一個(gè)很廣泛的譜段范圍。高光譜圖像(HSI)包含特定場(chǎng)景各種譜段強(qiáng)度的積分,相比于其他圖像,HSI圖像能夠?yàn)檎鎸?shí)的場(chǎng)景提供更多有用的信息,因而有利于計(jì)算機(jī)視覺中的很多任務(wù),比如分類[1-3]、分割[4-5]、檢測(cè)[6-7]、檢索[8]。
然而,在實(shí)際情況下,HSI總會(huì)受到傳感器精度、光照條件或者大氣環(huán)境所引起的噪聲。噪聲的存在會(huì)嚴(yán)重影響高光譜圖像后續(xù)任務(wù)的性能。因此,HSI的降噪是一個(gè)備受關(guān)注的問題。
局部平滑先驗(yàn)是HSI去噪任務(wù)中使用最廣泛的先驗(yàn)之一??臻g局部平滑先驗(yàn)是指相似的目標(biāo)或者場(chǎng)景通常與相似的譜波相鄰分布;而光譜平滑性是指HSI的相鄰光譜通常是用相似的傳感器參數(shù)收集而導(dǎo)致具有相似的值。因此,HSI所持有的局部平滑先驗(yàn)等同于沿著HSI的空間和譜段維度的梯度圖的稀疏性,這也就是我們平時(shí)所聲稱的3D全變分正則或者3DTV。3DTV正則已經(jīng)在各種HSI處理問題中大放異彩[9-11],一些甚至獲得了最先進(jìn)的性能。
即使被成功地應(yīng)用HSI的各種任務(wù),3DTV正則仍然沒有充分考慮到HSI的梯度圖背后的深刻的稀疏性結(jié)構(gòu)知識(shí)。具體來說,遍及梯度圖所有頻譜的稀疏性被隱式地假設(shè)為相似的和不相關(guān)的。然而,這一點(diǎn)被Peng等[12]指出背離了事實(shí)。一方面,梯度圖的不同譜段并不是同分布的;另一方面,HSI梯度圖的不同譜段有明顯的相關(guān)性,這一點(diǎn)源于原始HSI的波段相關(guān)性。這種與實(shí)際HSI的先驗(yàn)知識(shí)偏差使得這種有用的正則化項(xiàng)的能力仍有很大的空間需要進(jìn)一步加強(qiáng)。因此,Peng等提出了增強(qiáng)版的3DTV正則E-3DTV以解決常規(guī)3DTV的不足。
進(jìn)一步,一個(gè)基于E-3DTV的去噪模型被Peng等提出,他們采用1范數(shù)來擬合實(shí)際噪聲。盡管憑借E-3DTV的優(yōu)勢(shì)取得了令人印象深刻的效果,然而,這個(gè)模型對(duì)于噪聲的處理過于粗糙,1范數(shù)的噪聲建模通常只能有效地處理拉普拉斯噪聲。而HSI中包含的實(shí)際噪聲是未知而復(fù)雜的,只針對(duì)特定類型的噪聲分布建模只能獲得次優(yōu)的結(jié)果。
為了彌補(bǔ)單一范數(shù)的噪聲擬合,已經(jīng)有一些工作在這方面做了嘗試。其中Wen等[13]提出用p范數(shù)來替代流行的1范數(shù)去擬合噪聲。相比于只適合處理拉普拉斯噪聲的1范數(shù),p范數(shù)有一個(gè)更加寬廣的適應(yīng)范圍,它把普遍應(yīng)用的1范數(shù)和2范數(shù)視為其中的一種特例,并能在其中取得較好的均衡,尤其在具有非常嚴(yán)重的拖尾分布的高度脈沖噪聲情形。令p<1可能是一種更加明智的選擇。
因此,本文針對(duì)HSI中多變而復(fù)雜的實(shí)際噪聲提出一種基于p范數(shù)的E-3DTV去噪模型,以提高模型在實(shí)際噪聲場(chǎng)合中的適應(yīng)能力。
(1)
代表在位置(i,j,k)處沿著空間高度、空間寬度和光譜維度三種不同的操作。三種在HSI上不同模式的差分運(yùn)算可被計(jì)算如下:
(2)
(3)
這個(gè)線性操作編碼了HSIX∈Rhw×s和它的梯度圖Gn∈Rhw×s之間的關(guān)系。
在梯度上最普遍使用的稀疏度量,也就是1范數(shù)標(biāo)記為:
通過這個(gè)稀疏度量,在HSI中廣泛使用的局部平滑正則項(xiàng),也就是所謂的3DTV[14-15]正則構(gòu)造如下:
為了避免3DTV中稀疏性獨(dú)立同分布的假設(shè),Peng等提出了E-3DTV。與常規(guī)3DTV相似,E-3DTV也是在長(zhǎng)度、寬度、波段三個(gè)維度上操作。不同的是,E-3DTV的稀疏約束不施加在梯度圖本身,而是施加在梯度圖的子空間基上。每一組基由梯度圖向量的線性組合來獲得:GnVn。其中Vn是尺寸為s×r的轉(zhuǎn)換矩陣,其中r<
如前所述,對(duì)于一個(gè)給定的HSI,其梯度圖Gn的稀疏性并非是獨(dú)立而是有相關(guān)性的,這意味Gn也可以表達(dá)為如下的矩陣分解形式:
Un=GnVn
(8)
E-3DTV正則每一個(gè)Gn(n=1,2,3)如下:
式中:Vn可以看作將不同梯度圖關(guān)聯(lián)在一起的一個(gè)系數(shù)矩陣。
可以看出,E-3DTV實(shí)際上度量的是Gn經(jīng)過線性轉(zhuǎn)換后的稀疏性,而轉(zhuǎn)換矩陣Vn由輸入數(shù)據(jù)自動(dòng)決策。相比于常規(guī)的3DTV,E-3DTV在度量梯度圖稀疏性同時(shí)考慮了梯度之間的相關(guān)性,充分利用了在Gn存在一些稀疏的低秩基,但是能用一個(gè)系數(shù)矩陣Vn表達(dá)Gn所有信息的事實(shí),并且當(dāng)HSI被破壞時(shí),這些基的計(jì)算比梯度圖本身更穩(wěn)定。
由于式(9)不容易被直接解出。我們重寫式(9)為如下等價(jià)形式:
Un∈Rhw×rVn∈Rs×r
通過沿著梯度圖的空間高度,寬度和光譜維度應(yīng)用式(11)的稀疏度量,E-3DTV正則項(xiàng)有如下表達(dá)式:
它有如下等價(jià)形式:
Un∈Rhw×r,Vn∈Rs×r,n=1,2,3
去噪任務(wù)是將干凈的數(shù)據(jù)和噪聲從帶噪聲的數(shù)據(jù)中分開。在許多降噪任務(wù)中,通常假定噪聲為高斯噪聲,因此經(jīng)常利用干凈數(shù)據(jù)與噪聲數(shù)據(jù)之間的2范數(shù)作為損失函數(shù)。但是,基于最小二乘的2范數(shù)對(duì)觀測(cè)值中的異常值高度敏感,當(dāng)測(cè)量結(jié)果包含較大的誤差或脈沖噪聲時(shí),1范數(shù)損失函數(shù)與2范數(shù)損失函數(shù)相比,可以顯著改善性能[16-17],因此,Peng等提出基于1范數(shù)的E-3DTV去噪模型如下:
s.t.Y=X+E
式中:Y是觀測(cè)圖像;E是觀測(cè)圖像中包含的噪聲;τ是權(quán)衡因子。
然而,在實(shí)際的高光譜場(chǎng)景中,噪聲的類型遠(yuǎn)不止高斯分布和拉普拉斯分布,例如稀疏噪聲、條紋噪聲、死線、像素缺失等[18-19]。我們因此提出基于p范數(shù)的E-3DTV去噪模型,其數(shù)學(xué)表達(dá)式如下:
s.t.Y=X+E,0≤p≤2
p范數(shù)是1范數(shù)與2范數(shù)一種推廣,它可以通過調(diào)節(jié)p值的大小而改變對(duì)異常值的敏感性,以適應(yīng)復(fù)雜多變的實(shí)際噪聲。例如,在沒有異常值或異常值較小的情況下,可能要求p≥1,而對(duì)于具有非常嚴(yán)重的拖尾分布的高度脈沖噪聲,可能要求p≤1。而固定類型的1范數(shù)與2范數(shù)都不具備這種泛化性。
為了對(duì)p范數(shù)有效地求解,Wen等通過將p范數(shù)函數(shù)的近端算子合并到增強(qiáng)拉格朗日方法的框架中,有效地解決p范數(shù)中的凸和非凸情況,并針對(duì)凸和非凸情況作了收斂性分析,本文可以直接利用其結(jié)論。考慮罰數(shù)為η的函數(shù)g(x):x∈Rm的近端操作的一般形式如下:
情形1:當(dāng)p=0,近端操作成為眾所周知的硬閾值操作:
式中:ti是向量t的第i個(gè)元素,i=1,2,…,m。
情形2:當(dāng)0
情形3:當(dāng)p=1。近端操作有閉式解:
proxg,η(t)i=Sa/η(t)i=
sign(ti)max{|ti|-a/η,0}
(18)
對(duì)于i=1,2,…,m,Sa:Rm→Rm是眾所周知的軟閾值或者收縮算子。
情形4:當(dāng)1
proxg,η(t)i=sign(ti)zi
(19)
式中:zi是式(20)的解。
h2(z)=apzp-1+ηz-η|ti|=0z≥0
(20)
注意對(duì)于z≥0,h2(z)是一個(gè)遞增的非凸函數(shù),并且當(dāng)ti≠0時(shí),h2(z)<0,h2(|ti|)>0。因此,當(dāng)ti≠0,式(20)滿足0 Wen等論證了求解噪聲E的子問題即可看成近端操作形式中的一種。接下來,我們將使用ADMM算法以及上述公式對(duì)式(14)求解。 基于式(14),我們可以有如下等價(jià)表達(dá)式: s.t.Y=X+E, Vn∈Rs×r,Un∈Rhw×r,n=1,2,3 求解這個(gè)模型等價(jià)于最小化其增廣的拉格朗日函數(shù)如: 式中:Mn(n=1,2,3)和Γ是拉格朗日乘子;μ是一個(gè)大于0的標(biāo)量。 在ADMM框架下,我們需要交替固定其他向量并優(yōu)化涉及式(23)中的每一個(gè)變量。 更新X。提取式(23)所有關(guān)于X的項(xiàng),我們能獲得如下子問題: 優(yōu)化式(24)等價(jià)于求解如下線性系統(tǒng): (26) 更新Un,n=1,2,3。提取式(23)關(guān)于Un的所有項(xiàng),我們可以得到: 這個(gè)子問題能夠使用眾所周知的軟閾值算子求解[23]。 式中:x∈R且Δ>0是閾值。然后式(28)有如下閉式解: 更新Vn,n=1,2,3。提取式(23)關(guān)于Vn的全部項(xiàng),有如下子問題: 這個(gè)子問題的全局解有閉式解[21]: 式中:B、D、C是執(zhí)行svd分解后的結(jié)果。 更新E。提取式(23)所有關(guān)于E的項(xiàng),關(guān)于E的子問題近端操作形式中的一種[13],它可以通過如下方式有效的解決: (32) 基于ADMM準(zhǔn)則,乘子的更新方式如下: 完整的ADMM求解過程如算法1所示。算法功能流程如圖1所示。 圖1 算法功能流程 算法1基于p范數(shù)的E-3DTV去噪模型 輸出:fold(X)∈Rh×w×s。 初始化:初始化X,E,Un,Vn,Mn,Γ。 循環(huán): 1.通過式(26)和式(32)更新X,E 2.通過式(27)和式(31)更新Un,Vn 3.通過式(33)更新Mn,Γ 4.i=i+1 5.核對(duì)收斂準(zhǔn)則 或者i=50 結(jié)束循環(huán) 這個(gè)部分,我們做了廣泛的實(shí)驗(yàn)論證本文方法的性能,我們把本文方法與4種經(jīng)典的HSI去噪方法相比較。它們分別是CWM[24]、LRMR[25]、LRTV[26]、E-3DTV[12]。為了全面地評(píng)價(jià)實(shí)驗(yàn)結(jié)果,我們采用三種量化指標(biāo),它們分別是PSNR、SSIM[27]、ERGAS[28]。PSNR和SSIM是兩種經(jīng)典的基于空間的圖像恢復(fù)評(píng)價(jià)指標(biāo),而ERGAS是基于光譜的評(píng)價(jià)指標(biāo)。PSNR和SSIM越大越好,而ERGAS越小越好。 案例1:每一幅圖像都加入零均值、0.1方差的高斯噪聲。 案例2:首先加入類似于案例1中的高斯噪聲到每一幅圖像上,然后從第91幅至第130幅加入條紋噪聲。 案例3:每一幅HSI加入零高斯噪聲和脈沖噪聲。高斯噪聲方差設(shè)為0.075,脈沖噪聲的百分比設(shè)為0.5。 案例4:加入像案例3一樣的高斯脈沖混合噪聲,加入像案例2一樣的條紋噪聲。 視覺質(zhì)量方面,我們?cè)趫D2展示了通過不同方法在四種不同噪聲案例下的恢復(fù)結(jié)果,其中案例1展示的圖像是第56幅,案例2展示的圖像是第112幅,案例3展示的圖像是168幅,案例4展示的圖像是第224幅??梢悦黠@地看到E-3DTV相較于其他方法不僅能使恢復(fù)的圖像殘留更少的噪聲,而且還能保持更加銳利的細(xì)節(jié)。而我們采用基于p范數(shù)的E-3DTV模型能在此基礎(chǔ)上獲得性能上的進(jìn)一步提升。這得益于p范數(shù)處理不同噪聲的靈活性。 圖2 不同方法在不同噪聲情形下的比較 在量化比較方面,我們把各種方法恢復(fù)結(jié)果的三種指標(biāo)展示在表1至表4。E-3DTV模型在其他三種競(jìng)爭(zhēng)方法面前仍然保持較大優(yōu)勢(shì)。這側(cè)面印證了E-3DTV的優(yōu)越性,然而,我們的方法在各個(gè)指標(biāo)全面超越了E-3DTV,印證了本文方法的意義和有效性。 表1 不同方法在案例1噪聲情形下的比較 表2 不同方法在案例2噪聲情形下的比較 表3 不同方法在案例3噪聲情形下的比較 表4 不同方法在案例4聲情形下的比較 由于本文重點(diǎn)考慮的是p范數(shù)相較于單純的1范數(shù)和2范數(shù)對(duì)E-3DTV去噪模型帶來的靈活性。我們重點(diǎn)觀察了p參數(shù)的設(shè)置對(duì)實(shí)驗(yàn)結(jié)果帶來的影響。以案例1和案例3為例,在保持其他參數(shù)設(shè)置不變的情況下,我們列舉當(dāng)p<1、p=1、2>p>1、p=2時(shí)對(duì)結(jié)果的影響在表5和表6,我們加粗了最好的結(jié)果。可以看到對(duì)于不同的噪聲采用不同p值對(duì)結(jié)果有較大影響,因而單純地用1范數(shù)或者2范數(shù)建模噪聲是不足夠的,此外,最好的效果均不在p剛好為1或剛好為2時(shí)取得,進(jìn)一步說明了p范數(shù)建模的意義。 表5 本文的方法在案例1噪聲情形下不同p值的比較 表6 本文方法在案例3噪聲情形下不同p值的比較 本文提出新的基于p范數(shù)的E-3DTV模型用于高光譜圖像去噪,得益于p范數(shù)在處理不同噪聲時(shí)的靈活性,本文方法具有比原E-3DTV模型更強(qiáng)大的噪聲去除能力和細(xì)節(jié)恢復(fù)能力。下一步的研究會(huì)考慮把p范數(shù)用于約束梯度圖的基矩陣Un,以期望獲得適應(yīng)性更強(qiáng)的HSI去噪模型。 此外,由于HSI采集通常有數(shù)百個(gè)頻譜,這使得HSI需要較大的存儲(chǔ)空間。在將它們發(fā)送到地面基站時(shí),這將引起低效率和高成本的嚴(yán)重問題。因此,有必要針對(duì)HSI壓縮感知設(shè)計(jì)有效的技術(shù),以滿足實(shí)時(shí)傳輸?shù)男枰?。由于p范數(shù)和E-3DTV正則的結(jié)合展現(xiàn)出了良好的重構(gòu)性能,把這個(gè)方法拓展在壓縮感知模型上也將作為我們未來研究的方向。4 ADMM算法求解
5 HSI圖像去噪實(shí)驗(yàn)
5.1 實(shí)驗(yàn)設(shè)置
5.2 實(shí)驗(yàn)結(jié)果展示
6 結(jié) 語