羅曉梅,鄒 海
(安徽大學 計算機科學與技術(shù)學院,安徽 合肥 230601)
圖像質(zhì)量評價包括主觀圖像質(zhì)量評價和客觀圖像質(zhì)量評價,因人眼視覺系統(tǒng)(Human Visual System,HVS)是圖像處理的終端,因此主觀圖像質(zhì)量能夠得到最為準確的質(zhì)量評價結(jié)果.但是主觀圖像質(zhì)量評價操作繁瑣,費時費力,無法實時處理[1].而客觀圖像質(zhì)量評價是通過數(shù)學模型計算失真圖像和原始圖像的失真度,客觀圖像質(zhì)量評價方法可分為三類:全參考,部分參考和無參考.例如峰值性噪比(Peak Signal to Noise Ratio,PSNR)[2]和均方誤差(Mean Square Error,MSE)是最簡單的全參考圖像質(zhì)量評價算法,以及Wang等人提出的結(jié)構(gòu)相似度理論(Structure Similarity,SSIM)[3],由于該類算法具有計算復雜度低,物理意義清晰等優(yōu)點,MSE和PSNR,SSIM多年來應用最廣泛.全參考圖像質(zhì)量評價所產(chǎn)生的算法和人類視覺感知相關(guān)性良好,然而在很多場合,原始圖像無法獲取時,這時只能采用無參考圖像質(zhì)量評價方法.
傳統(tǒng)的無參考圖像質(zhì)量評價都是基于失真測量的思想,即假設(shè)失真類型及其特點已知,通過測量失真的強度得到圖像質(zhì)量.這類方法過于強調(diào)失真而忽視圖像本身的屬性,質(zhì)量評價性能往往不高,而且只適用于特定失真類型的圖像.如:JPEG[4],JPEG2000壓縮失真圖像[5,6]和高斯模糊圖像[7].為了尋找在不知道特定失真類型的情況下更為有效的無參考圖像質(zhì)量評價算法,許多學者研究了以下方法:(1)基于訓練學習的方法,這類方法首先提取圖像的感知特征,例如基于支持向量機學習的方法[8],這類方法的缺點在于它依賴于有效的特征提取算法,且需要主觀得分來訓練學習.(2)基于自然場景統(tǒng)計模型的方法,該方法即假設(shè)自然圖像或失真圖像都只是所有圖像信息的一個微小子集,試圖通過尋找兩者之間的差異來評價圖像質(zhì)量,例如樓斌,沈海斌等人提出的基于NSS(Natural Scene Statistics,NSS)與HVS的小波域線性預測方法[9].
Moorthy等人提出的先從圖像的小波域提取統(tǒng)計特征,并利用分類算法求出失真概率判斷失真類型,再根據(jù)質(zhì)量評價算法,把所有失真類型的概率和各自失真質(zhì)量結(jié)合起來,最后加權(quán)求和的BIQI(Blind Image Quality Index,BIQI)[10]失真圖像質(zhì)量評價算法.BIQI算法計算各類失真圖像概率及質(zhì)量分數(shù)分模塊進行,本文針對BIQI算法在評價JPEG2000壓縮失真圖像質(zhì)量時與人類主觀得分差距較大的問題,提出基于BIQI的JPEG2000壓縮失真圖像質(zhì)量評價算法.
BIQI算法是一個基于兩步框架,模塊化的無參考圖像質(zhì)量評價算法.該兩步框架為:圖像失真分類(JPEG2000,JPEG,WN,GBlur,FF);評估失真圖像的質(zhì)量.算法中pi{i=1,2,3,4,5}表示每個失真圖像所屬五類失真的概率,qi{i=1,2,3,4,5}表示失真圖像所屬分類的質(zhì)量分數(shù).失真圖像的最終質(zhì)量采用概率加權(quán)求和表示:
BIQI算法首先在3個尺度3個方向上使用雙正交9/7小波變換,獲得子帶因子,這些子帶因子使用廣義高斯分布(generalized Gaussian distribution,GGD)模型進行參數(shù)化.廣義高斯分布(GGD)為:
其中,μ,σ2,γ分別表示失真的均值、方差和形狀參數(shù).其中:
Γ(·)表示 gamma函數(shù)
其中分布的參數(shù)(μ,σ2,γ)使用文獻[11]提出的方法進行評估.獲得的參數(shù)σ2,γ在3個尺度,3個方向上組成一個18維的向量軆fi,表示圖像的特征向量.給定失真圖像的訓練和測試集,使用帶有徑向基函數(shù)(radial-basis,RBF)的支持向量機v-SVM聯(lián)同特征向量軆fi將失真圖像分類為5個失真類型,即JPEG2000,JPEG,WN,Blur,FF.需要注意的是,分類到特定失真類型并不表示這些失真類型不相交,事實上,這些失真類型在某種程度上是相交的,即一副失真圖像的分類是通過SVM[12]評估圖像的失真概率所確定的,值越大表示該圖像所屬的失真類型概率越大.
選用LIVE圖像質(zhì)量評價數(shù)據(jù)庫[13]中的圖像進行試驗,描述BIQI算法的性能.該數(shù)據(jù)庫中包含29副無失真的參考圖像和五類失真圖像(JPEG2000,JPEG,BLUR,WN,FF).該算法對于JPEG,高斯白噪聲,模糊失真具有良好的評價效果,且失真分類準確率達到80%以上,并且與全參考圖像質(zhì)量評價算法PSNR有著很強的競爭力.但是對于JPEG2000,F(xiàn)F圖像失真類型與人類視覺感知相關(guān)性不是很理想.由于BIQI算法評價JPEG2000壓縮失真圖像質(zhì)量分數(shù)與主觀得分DMOS差距較大,文獻[6]對于單獨評價JPEG2000壓縮失真圖像質(zhì)量有著良好的評價效果,據(jù)此,針對JPEG2000壓縮失真圖像,提出基于BIQI的JPEG2000壓縮失真圖像質(zhì)量評價算法.
采用文獻[6]的方法評價JPEG2000壓縮失真圖像質(zhì)量,并將該方法計算出的失真圖像質(zhì)量分數(shù)與BIQI算法相結(jié)合,采用概率加權(quán)求和的方式得到最終的JPEG2000壓縮失真圖像質(zhì)量.
使用文獻 [14]提出的自然場景統(tǒng)計模型構(gòu)造JPEG2000壓縮和未壓縮失真圖像的簡化模型.該方法通過量化自然圖像和失真圖像的偏離程度預測失真圖像的質(zhì)量.該方法的成功表明了人類對圖像的感知與圖像失真的感知、圖像的自然性相關(guān).
首先使用離散小波變換(discretewavelettransform,DWT)和基于小波圖像壓縮所導致的JPEG 2000壓縮標準[15]對JPEG2000失真圖像進行壓縮.再使用文獻[16],[17]中提出的統(tǒng)計模型:
其中C代表小波系數(shù)的幅度,P代表系數(shù)的線性預測的調(diào)節(jié)幅度,M,N是被假設(shè)為獨立的零均值隨機變量,系數(shù)Ci表示C在空間,尺度和方向的n個系數(shù)鄰域,li表示線性預測系數(shù).
使用簡化的二態(tài)小波域自然場景統(tǒng)計模型,獲得 4個經(jīng)驗概率,Pii,Pis,Psi,Pss,其中 Pss對于視覺質(zhì)量損失提供了最佳的適應值,可以最小化質(zhì)量預測誤差.因此從6個子帶(水平,垂直,第二最佳分辨率的對角線方向,水平,垂直,最佳分辨率的對角線方向)計算Pss的特征值,提出非線性變換每個獨立子帶特征.其中,特征轉(zhuǎn)換算法為:
其中qi表示第i個子帶的變換特征(預測圖像的質(zhì)量),pss,i表示第 i個子帶的 pss概率,Ki,Ti,μi表示第i個子帶的曲線擬合參數(shù).每個子帶特征被映射為主觀質(zhì)量.變換特征的加權(quán)平均被用來預測圖像的質(zhì)量.由于水平和垂直子帶在特定尺度的相似性,將給定規(guī)模相同方向的權(quán)重規(guī)定為相同.因此,將六維子帶質(zhì)量向量調(diào)整為四維向量,在給定規(guī)模的水平和垂直子帶預測其平均質(zhì)量.最終預測的質(zhì)量采用加權(quán)平均質(zhì)量a'表示,即:
由此得到JPEG2000壓縮失真圖像質(zhì)量為
運用以上算法計算出JPEG2000壓縮失真圖像質(zhì)量分數(shù)后,由BIQI算法得到該失真圖像的最終質(zhì)量.即q1=Q,
為了驗證本文提出的無參考圖像質(zhì)量評價算法,使用LIVE圖像質(zhì)量評價數(shù)據(jù)庫[13]進行測試,該庫有29副原始參考圖像與經(jīng)過5類失真處理后的圖像,其中JPEG2000壓縮失真圖像227(1-227)副.圖1表示經(jīng)過JPEG2000壓縮后的失真圖像.圖2表示該圖像所屬五類失真(JPEG2000,JPEK,WN,GBLUR,FF)的概率.從圖2五類失真所占概率大小可以看出該副圖像屬于JPEG2000壓縮失真.
圖1 JP2K失真圖像
圖2 JP2K圖像失真的概率
將文獻[10]原BIQI算法和PSNR算法得到的圖像質(zhì)量與圖像的主觀得分DMOS做對比得到其絕對預測誤差直方圖如圖3所示.
圖3 BIQI,PSNR與DMOS絕對預測誤差直方圖
圖3顯示,BIQI算法預測該JP2K壓縮失真圖像質(zhì)量與主觀得分DMOS之間的差距較PSNR與DMOS之間的差距要大.
采用本文改進后的算法,得到的質(zhì)量評價結(jié)果與DMOS對比,如圖4所示.
圖4 改進后的BIQI,PSNR與DMOS絕對預測誤差
圖4顯示,改進后的BIQI算法評價質(zhì)量與主觀得分DMOS之間的差距較PSNR與DMOS之間的差距要小,與人類主觀感知相關(guān)性良好.
從LIVE圖像質(zhì)量評價數(shù)據(jù)庫[13]中的JPEG2000壓縮失真圖像中選取5副失真程度不同的圖像,分別采用PSNR,文獻[10]和本文的算法進行質(zhì)量評價并將DMOS作為客觀評價的標準.其結(jié)果如表1所示.
表1 不同算法對JPEG2000失真圖像質(zhì)量的評價
從表1中可以看出,本文算法計算出的JPEG2000壓縮失真圖像質(zhì)量與文獻[10]相比,更接近主觀得分,且優(yōu)于PSNR評價算法.但該算法在評價少數(shù)JPEG2000壓縮失真圖像時,存在質(zhì)量略低于文獻[10]和PSNR的現(xiàn)象,有待于進一步改進.
本文針對BIQI算法在評價JPEG2000壓縮失真圖像質(zhì)量時與人類主觀得分差距較大的問題,采用文獻[6]中算法對JPEG2000壓縮失真圖像質(zhì)量進行預測,并將該算法計算出的失真圖像質(zhì)量分數(shù)與BIQI算法相結(jié)合,采用概率加權(quán)求和的方式得到最終的JPEG2000壓縮失真圖像質(zhì)量.實驗結(jié)果表明,改進后的算法與人類主觀得分差距要小,與人類主觀感知相關(guān)性良好.
〔1〕Viola P,Jones M,Snow D.Detecting pedestrians using paterns of motion and appearance[J].Computer Vision,2005(2):153-161.
〔2〕AVCIBAS I,SANBUR B,SAYOOD K,Statistical evaluation of image quality measures[J].Journal of Electronic Imaging,2002,11(2):206-213.
〔3〕WANG ZHOU,BOVIK A C.Modern image quality assessment[M].New York:Morgan and Claypool Publish Company,2006:20-30.
〔4〕Z.Wang,H.R.Sheikh,and A.C.Bovik,”No-reference perceptual quality assessme ment of JPEG compressed images,”in Proc.IEEE ICIP,2002,vol.1,pp.477-480.
〔5〕P.Marziliano,F.Dufaux,S.Winkler,and T.Ebrahimi,”Perceptual blur and ringingm etrics:Application to JPEG2000,”Signal Commun,vol.19,no.2,pp.163-172,2004.
〔6〕H.R.Sheikh,A.C.Bovik,and L.K.Cormack,“No-reference quality asses sment using natural scene statistics:JPEG2000,”IEEE Trans.Image Process.,vol.14,no.11,pp.1918–1927,2005.
〔7〕J.Caviedes and F.Oberti,”A newsharpnessmetric based on local kurtosis,ed geand energy information,”signal Process.:Image Commun.,vol.19,no.2,pp.14 7-161,2004.
〔8〕Charrier C,Lebrun G,Lezoray O.Amachine learning-based color image quality metric[C]//Proceedings of Third European Conference on Color in Graphic s.Leeds,UK:Imageing And Vision,2006:251-256.
〔9〕樓斌,沈海斌,趙武鋒,嚴曉浪.基于自然圖像統(tǒng)計的無參考圖像質(zhì)量評價[J].浙江大學學報(工學版),2010,44(2):248-252.
〔10〕Moorthy K A,Bovik A C.A two-step framework for constructing blind imag e quality indices [J].IEEE Signal Processing Letters,2010,17(5):513-516.
〔11〕K.Sharifi and A.Leon-Garcia,”Estination of shape parameter for generalized Gaussiandistributions in subb and decompositions of video,”IEEE Tran.Circuit s Syst.Video Technol.,vol.5,no.l,pp.52-56,Feb.1995.
〔12〕V.Vapnik,The Nature of Statistical Learning Theory.Berlin,Germany:Springer Verlag,2000.
〔13〕Sheikh H R,Wang Z,Cormack L,et al.Live image quality assessment databas e release 2[EB/OL].[2007-6-30].http://live.ece.utexas.edu/.
〔14〕A.Srivastava,A.B.Lee,E.P.Simoncelli,and S.-C.Zhu,”O(jiān)n advances in statistical modeling of natural images,”J.Math.Imag.Vis.,vol.18,pp.17-33,2003.
〔15〕D.S.Taubman and M.W.Marcellin,JPEG2000:Image Compression Fundamental s,Standards,and Practice.Norwell,MA:Kluwer,2001.
〔16〕E.P.Simoncelli,”Statistical models for images:Compression,restoration and syn thesis,”presented at the IEEEAsilomar Conf.Signals,Systems,and Computers,Nov.1997.
〔17〕R.W.Buccigrossi and E.P.Simoncelli,”Image compression via joint statistical characterization in the wavelet domain,”IEEE Trans.Image Process.,vol.8,no.12,pp.1688-1701,Dec.1999.