李 科,李 軍
(華南師范大學物理與電信工程學院,廣東廣州510006)
圖像以其形象、生動的視覺信號表達及其信息量大的特點,一直以來都是人類獲取和表達信息的重要手段之一.全息圖利用“干涉記錄,衍射再現(xiàn)”的原理,記錄了物光的相位信息,其再現(xiàn)圖像具有顯著的視覺差,可以看到逼真的三維圖像,對于三維成像技術的發(fā)展起著重要的作用.然而全息圖數(shù)據(jù)量龐大,占用了大量存儲空間和通信帶寬,因此,數(shù)字全息圖的壓縮一直是全息技術發(fā)展中的研究熱點.對于全息圖壓縮目前的研究思路主要集中在圖像壓縮前降噪和直接進行全息數(shù)據(jù)壓縮上[1-2].壓縮傳感(Compressive Sensing)理論[3-8]指出只要信號是稀疏的或在某個變換域是稀疏的,就可以用一個與變換基不相關的測量矩陣將變換所得到的高維信號投影到一個低維空間上,投影所得到的測量值含有足夠的信息來重建信號.這個理論很快產(chǎn)生了可壓縮成像、醫(yī)學成像、地球物理數(shù)據(jù)分析、高光譜成像和可壓縮雷達成像等新的研究應用.這種技術也運用到全息圖的壓縮表示及重建中[9-10].本文分析了壓縮傳感技術對于全息圖這一類包含有物體振幅和相位信息的信號進行壓縮的可行性,并研究了稀疏域及重構算法對于全息圖壓縮的影響.
傳統(tǒng)信號的獲取和處理過程主要包括采樣、壓縮、傳輸和解壓縮等4個部分,其采樣過程必須滿足奈奎斯特采樣定理,即采樣頻率不得低于模擬信號最高頻率的兩倍.該方法低效,將造成巨大的浪費.采集得到的大量數(shù)據(jù)在壓縮后絕大部分都將丟棄,并且隨著帶寬的增大,采樣速率也越來越高,對硬件造成巨大的壓力.近年來國際上出現(xiàn)的壓縮傳感理論為該問題提供了新的解決方案[3-5,8].CANDéS[3]從數(shù)學上證明了可以從部分傅里葉變換系數(shù)精確重構原始信號,為壓縮傳感奠定了理論基礎.相對于傳統(tǒng)方法,壓縮傳感理論將采樣和壓縮2個部分合并進行,首先采集信號的非自適應線性投影(測量值),通過這個過程完成了采樣同時獲得信號的壓縮表示(測量值),然后根據(jù)這些測量值由相應重構算法重構原始信號,這部分相當于傳統(tǒng)方法中的解壓縮過程.壓縮傳感理論的實現(xiàn)必須具備以下2個條件:稀疏性和非相干性,前者是針對信號本身,后者則是對于測量矩陣.壓縮傳感理論主要包括信號的稀疏表示、測量矩陣和重構算法等3個方面[6].
如果一個信號中只有少數(shù)元素是非零的,則該信號是稀疏的.通常時域內(nèi)的自然信號都是非稀疏的,但在某些變換域可能是稀疏的.根據(jù)調(diào)和分析理論,一個長度為N的一維信號f,可以表示成一組標準正交基的線性組合
其中 Ψ=[ψ1ψ2…ψN],ψi為列向量,N ×1 的列向量θ為其加權系數(shù)且θi=ψTix.如果θ中只有很少的大系數(shù),則信號f是可壓縮的.如果θ中只有K個非零元素,則稱系數(shù)向量θ為K稀疏向量.在實際運用中,CANDéS和TAO[8]指出只要變換系數(shù) θ 的值從大到小呈冪次衰減的話,即
這個信號看作是K稀疏信號,可利用壓縮傳感理論得到恢復,并且其重構誤差滿足:
其中Cr為比例常數(shù),p表示衰減的速度,0<p<1,p越小衰減速度越快,r=1/p-1/2.因此,對于信號,尋找合適的稀疏表達是壓縮傳感理論的首要任務,信號稀疏的效果直接影響信號重構的時間和效果.對于圖像信號,常用的稀疏域有傅里葉域和小波域.
把信號f變換到某個變換域得到變換系數(shù)的K稀疏表示后,只需找出其K個最大的變換系數(shù)就可以通過逆變換重構信號f.壓縮傳感理論對于信號的采集并不是直接獲得K個最大的變換系數(shù)θ,而是通過把變換系數(shù)θ投影到M×K(K<M?N)測量矩陣Φ上,得到M個測量值y,即
信號重構算法是壓縮傳感理論的核心,是指由M次測量向量y重構長度為N的稀疏信號f的過程.信號的重構過程可以通過求解最小L0范數(shù)問題加以解決,即:
其中‖θ‖0即向量θ非零元素的個數(shù).但是最小L0范數(shù)問題是一個NP-hard問題,無法求解.鑒于此,研究人員提出了一系列解決的算法,主要可歸入以下3類:以OMP算法、分段OMP算法(StOMP)及正則化OMP算法(ROMP)為代表的貪婪追蹤法;以梯度投影法、內(nèi)點法、BP算法等為代表的凸松弛算法和要求信號采樣支持分組測試快速重建的組合算法.在這些算法中具有代表性的算法是基追蹤(BP)算法[13]和正交匹配追蹤(OMP)算法[14].
根據(jù)前述壓縮傳感理論,圖像必須是稀疏的,而且其稀疏程度直接影響信號的重構時間和效果.所以尋找合適的稀疏基盡可能地稀疏表示信號是壓縮傳感的首要任務.本文使用2種常見的稀疏域來稀疏表示圖像——傅里葉域和小波域.一幅大小為M×N的圖像的離散傅里葉變換表示如下:
其中F(u,v)的值為傅里葉變換系數(shù).通過傅里葉變換把圖像分解為不同頻率復正弦函數(shù)的疊加,其中少量基函數(shù)的系數(shù)即變換系數(shù)遠遠大于其他的系數(shù),以此達到圖像稀疏的目的.在圖像采集的時候直接獲取變換系數(shù)然后通過反變換復原圖像.
與傅里葉變換不同,小波變換基于一些小型波,具有變化的頻率和有限的持續(xù)時間.給定一個基函數(shù)ψ(t),令 ,若 a,b 不斷變化,則可得到一組函數(shù)ψa,b(t).對于平方可積信號x(t),其小波變換定義為:
文中選用sym8小波函數(shù)作為離散小波分析的基函數(shù).針對2種變換域的稀疏化效果,本文做了如下研究:分別用自然圖像和全息圖像進行傅里葉變換和小波變換,然后各自使用其10%和5%最大系數(shù)進行重構,并計算峰值信噪比(表1).從表中可以看出,在同等條件下,自然圖像使用小波系數(shù)重構的峰值信噪比高于傅里葉系數(shù),而全息圖像則相反.這表明由于全息圖自身的特點,其變換域的選擇與自然圖像有所區(qū)別.在實驗研究中,本文將用小波基和正弦基這2種不同的基函數(shù)分別對圖像進行稀疏化處理,然后使用同一種重構算法在相同測量值的情況下比較重構圖像的效果,以此選取全息圖壓縮的稀疏域.
表1 全息圖與自然圖像不同變換域重構峰值信噪比Table 1 The PSNR of hologram and natural image reconstruction in different transform domains
在獲取測量值后,不同的重構算法在重構時間和重構效果上都有較大的差別.文中選取基追蹤算法(BP)和正交匹配追蹤算法(OMP)這2種經(jīng)典重構算法,研究其對全息圖重構的效果.對求解方程(4)這個欠定方程組,這2種算法采取了不同的思路.
基追蹤算法由Donoho提出,其核心思想是以方程(4)為約束條件求最小L1范數(shù)的過程,即
其中‖θ‖1即θ的L1范數(shù)表示θ中非零元素絕對值之和.對于二維圖像信號,考慮到大部分圖像梯度是稀疏的,CANDéS等[3]提出了更適合圖像重構的最小全變分法(minimization of total variation,以下簡稱TV),其本質(zhì)和最小L1范數(shù)法相同,只是把求解L1范數(shù)的過程變成求解最小梯度值的過程,即
其中,是圖像離散梯度值之和.最小全變分法也屬于基追蹤算法,是專門針對圖像信號的重構算法.問題(9)的求解可轉換為二階錐規(guī)劃問題.
OMP算法則是一種迭代貪婪算法,通過全局最優(yōu)化在正交方向上尋找非零系數(shù),其基本思想在每一次的迭代過程中,從過完備原子庫里(即測量矩陣Φ)選擇與信號最匹配的原子來構建稀疏逼近,并求出信號表示殘差,然后繼續(xù)選擇與信號殘差最為匹配的原子,經(jīng)過一定次數(shù)的迭代,信號可以由一些原子線性表示.
現(xiàn)有的研究結果表明,對于自然圖像OMP算法比TV算法更快,但是精確重構的理論保證比TV算法弱,魯棒性較差.而這2種算法對于全息圖重構的影響,實驗將通過在相同的稀疏域且相同數(shù)量的測量值條件下使用這2種算法對全息圖進行重構,分析運算時間以及重構和全息再現(xiàn)效果.
在基于壓縮傳感的全息圖壓縮實驗中,使用Mach-Zehder干涉儀獲取一幅1 024*1 024大小的“N”字母全息圖,其中波長為632.8 nm,記錄距離95 cm,壓縮重構采用 PC平臺,硬件為酷睿I7 2.6 GHz、4 G 內(nèi)存,軟件為 Windows 7、Matlab8.0版本.分別利用小波域和傅里葉域對全息圖進行稀疏表示后,使用OMP算法在相同測量值條件下重構的效果比較.圖1的4幅全息圖中(A)為全息圖原圖,(B)和(C)是在測量值個數(shù)為圖像總像素的10%條件下重構的圖像,其中(B)使用傅里葉域重構,(C)使用小波域稀疏后的全息圖重構的效果.從(B)、(C)圖可以看出使用傅里葉域稀疏的效果要明顯好于小波域稀疏的效果.圖2是4幅全息再現(xiàn)圖,分別對應圖1中的4幅全息圖,文中使用Fresnel重建方法進行全息圖再現(xiàn).從圖2(B)、(C)的再現(xiàn)效果也可以明顯看出傅里葉域稀疏的效果明顯好于小波域稀疏的效果.在進一步實驗中也表明使用小波域時測量值個數(shù)少于總像素的7%時將無法重構圖像,而在傅里葉域稀疏下僅利用1.5%的測量值還可以重構圖像,如圖1(D)及其再現(xiàn)效果(圖2(D)).實驗結果也表明,全息圖與自然圖像有較大的區(qū)別,通常自然圖像使用小波域稀疏的效果要好于傅里葉域稀疏的效果,JPEG2000壓縮算法的出現(xiàn)也證明了這一點,但是對于由干涉條紋形成的全息圖像,使用平滑的正弦波作為基函數(shù)要比不規(guī)則的小波更好.
圖1 使用不同稀疏域的全息圖重構效果Figure 1 Hologram reconstruction using different sparse domains
圖2 對應圖1中4幅全息圖的Fresnel再現(xiàn)效果Figure 2 The corresponding Fresnel holography reconstruction of four holograms in figure 1
圖3是在相同測量值個數(shù)條件下OMP算法和TV算法的重構效果,使用的稀疏域都是傅里葉變換域.其中,圖3(A)、(B)分別是使用OMP算法和TV算法的全息圖重構效果,測量值個數(shù)為總像素的10%.從這2幅圖可以看出,全息圖重構及再現(xiàn)的效果沒有太大區(qū)別.當測量值個數(shù)減少到總像素的3%時,OMP算法和TV算法重構的結果分別如圖3(C)和(D)所示,從圖4對應的再現(xiàn)效果可以看出,在如此少的測量值下還能再現(xiàn)出圖像.而從圖4(C)、(D)2幅放大后的再現(xiàn)圖也可以看出,當測量值個數(shù)較少時,使用OMP算法重構的圖4(C)字母“N”有信息丟失的情況,而圖4(D)還是相對完整(矩形白圈標注部分),TV算法的效果要稍微優(yōu)于OMP算法.但是,從計算時間來看,OMP算法要比TV算法快一個數(shù)量級.考慮計算成本的情況下貪婪追蹤算法更有優(yōu)勢,一定條件下,OMP算法要比BP算法更快,對高度稀疏的信號尤為有效,而且OMP算法在程序上更容易實現(xiàn).
圖3 使用不同重構算法的全息圖重構效果Figure 3 Hologram reconstruction using different algorithms
圖4 對應圖3中4幅全息圖的再現(xiàn)效果Figure 4 The corresponding holography reconstruction of four holograms in figure 3
結果表明,這2種算法在全息圖的重構上得出的結論與自然圖像一致,但是在稀疏域上則有所區(qū)別,從全息圖自身干涉條紋的特點出發(fā),使用傅里葉域能得到更好的稀疏化效果.
本文首次提出將壓縮傳感技術運用到全息圖的壓縮中,研究并分析了不同稀疏域和重構算法對于全息圖壓縮的影響.實驗證明壓縮傳感技術對于全息圖的壓縮是可行的,并且在傅里葉域稀疏下利用OMP算法對全息圖進行壓縮重構可以達到很高壓縮率和很快的重構速度.在后續(xù)工作中如針對稀疏表示的問題還可考慮冗余字典上的稀疏分解理論,進一步減少測量值提高重構效果.此外,對重構算法進行優(yōu)化,減少其計算復雜度也是后續(xù)工作中值得研究的問題.
[1]GARCIA-SUCERQUIA J,RAMíREZ JH,CASTANEDA R.Incoherent recovering of the spatial resolution in digital holography[J].Optics Communications,2006,260:62-67.
[2]DARAKISE,NAUGHTON T J,SORAGHAN JJ.Compression defects in different reconstructions from phaseshifting digital holographic data[J].Applied Optics,2007,46:4579-4586.
[3]CANDéS E,ROMBERG J,TAO T.Robust uncertainty principles:Exact signal reconstruction from highly incomplete frequency information[J].IEEE Transactions on Information Theory,2006,52(2):489-509.
[4]DONOHO D L.Compressed sensing[J].IEEE Transactions on Information Theory,2006,52(4):1289-1306.
[5]CANDéSE.Compressive sampling[C]∥IEEE Proceedings of International Congress of Mathematicians.Zürich,Switzerland,2006:1433-1452.
[6]BARANIUK R.Compressive sensing[J].IEEE Signal Processing Magazine,2007,24(4):118-121.
[7]CANDéS E,ROMBERG J.Sparsity and incoherence in compressive sampling[J].Inverse Problems,2007,23(3):969-985.
[8]CANDéS E,TAO T.Near optimal signal recovery from random projections:Universal encoding strategies?[J].IEEE Transactions on Information Theory,2006,52(12):5406-5425.
[9]MARIM Marcio M,ATLAN Michael,ANGELINI Elsa,et al.Compressed sensing with off-axis frequencyshifting holography[J].Optics Letters,2010,35(6):871-873.
[10]BRADY D J.Compressive holography[J].Opt Express,2009,17(15):13040-13049.
[11]CANDéS E,TAO T.Decoding by linear programming[J].IEEE Transactions on Information Theory,2005,51(12):4203-4215.
[12]CANDéSE,ROMBERG J,TAO T.Stable signal recovery from incomplete and inaccurate measurement[J].Communications on Pure and Applied Mathematics,2006,59(8):1207-1223.
[13]CHEN S B,DONOHO D L,SAUNDER M A.Atomic decomposition by basis pursuit[J].SIAM Journal on Scientific Computing,1998,20(1):33-61.
[14]TROPP J,GILBERT A.Signal recovery from random measurements via orthogonal matching pursuit[J].Transactions on Information Theory,2007,53(12):4655-4666.