劉 昱,李秀清,吳俊峰
(天津大學(xué)電子信息工程學(xué)院,天津 300072)
一種H.264時(shí)域可伸縮編碼的量化參數(shù)選擇策略
劉 昱,李秀清,吳俊峰
(天津大學(xué)電子信息工程學(xué)院,天津 300072)
提出一種用于H.264 SVC時(shí)域分級(jí)編碼中的量化參數(shù)選擇方法。該方法使用H.264 SVC編碼處理中的統(tǒng)計(jì)數(shù)據(jù)完成快速視頻內(nèi)容檢測(cè)。在視頻數(shù)據(jù)出現(xiàn)場(chǎng)景變化時(shí),為較高時(shí)域級(jí)別的SVC的圖像幀設(shè)定精細(xì)的量化參數(shù),保證參考幀的圖像質(zhì)量,提高SVC編碼性能。對(duì)不同視頻序列的實(shí)驗(yàn)表明,所提出的方法在幾乎不增加計(jì)算量的條件下,可以有效地提高H.264 SVC時(shí)域伸縮編碼的性能。
H.264 SVC;視頻場(chǎng)景切換;量化策略
【本文獻(xiàn)信息】劉昱,李秀清,吳俊峰.一種H.264時(shí)域可伸縮編碼的量化參數(shù)選擇策略[J].電視技術(shù),2013,37(3).
近年來(lái),數(shù)字多媒體技術(shù)得到了快速而廣泛的應(yīng)用。2005年1月,MPEG和VCEG聯(lián)合提出了最終的H.264 SVC標(biāo)準(zhǔn)[1]。H.264 SVC是一種與H.264/AVC標(biāo)準(zhǔn)兼容并提供編碼伸縮性的新技術(shù),它的基本層完全可以被H.264/AVC解碼器所解碼。H.264 SVC采用了分級(jí)預(yù)測(cè)結(jié)構(gòu),用以提供多層次的時(shí)域伸縮性。此外,H.264 SVC還在不同分辨率間采用了自適應(yīng)的層間預(yù)測(cè)技術(shù),以便進(jìn)一步實(shí)現(xiàn)高編碼效率[2]??梢灶A(yù)見(jiàn),H.264 SVC必將被廣泛應(yīng)用于網(wǎng)絡(luò)流媒體等領(lǐng)域。
時(shí)域可伸縮技術(shù)是指視頻碼流能夠以不同的幀率進(jìn)行解碼。假設(shè)基本時(shí)域?qū)拥拇a率設(shè)置為3.75 Hz,則通過(guò)使用多個(gè)增強(qiáng)層,幀率最高可以達(dá)到60 Hz。視頻流的幀率被歸為幾個(gè)級(jí)別,級(jí)別0是基本層,級(jí)別1,2,3作為增強(qiáng)層。
H.264 SVC的分級(jí)P預(yù)測(cè)及分級(jí)B預(yù)測(cè)結(jié)構(gòu)如圖1所示。時(shí)域?qū)拥拿拷M幀均可以在層>K的幀缺失的情況下被解碼。圖1中的結(jié)構(gòu)包含4個(gè)層級(jí)分別為T0,T1,T2,T3,{T0,T1,T2,T3}是基本的幀率,{T0,T1,T2},{T0,T1}和{T0}分別是基本幀率的1/2,1/4,1/8。圖1a中的分級(jí)P預(yù)測(cè)適用于像電視會(huì)議這種低時(shí)延系統(tǒng)中。但是,由于冗余數(shù)據(jù)的存在,這可能導(dǎo)致嚴(yán)重的視頻質(zhì)量下降。因而,對(duì)于圖像質(zhì)量有嚴(yán)格要求的應(yīng)用,可以采用分級(jí)B預(yù)測(cè),如圖1b所示。
圖1 SVC時(shí)域可伸縮編碼預(yù)測(cè)結(jié)構(gòu)
在標(biāo)準(zhǔn)制定工作組所提供的H.264 SVC參考編碼器JMVM中,提供了一種用于時(shí)域可伸縮編碼的量化參數(shù)選擇策略。該策略可以考慮參考圖像的質(zhì)量,時(shí)域基本層的各幀應(yīng)采用較小的量化參數(shù)以實(shí)現(xiàn)較高的圖像質(zhì)量,而增強(qiáng)層的QP應(yīng)隨著編碼層級(jí)別而逐漸增加。不同時(shí)域?qū)拥牧炕瘏?shù)可通過(guò)下列公式得到[2-3]
式中:QPini是最初的量化參數(shù);N是時(shí)域可伸縮的總層數(shù);round()為QPx的取整操作。對(duì)于k層來(lái)說(shuō),QPk可由式(1)得到。例如,圖1所示的時(shí)域預(yù)測(cè)結(jié)構(gòu)中,如果T0量化參數(shù)為36,則T1量化參數(shù)為33。
雖然這個(gè)機(jī)制可能導(dǎo)致一個(gè)GoP中PSNR產(chǎn)生嚴(yán)重的漂移,但重建的視頻顯示,周期性的質(zhì)量漂移并沒(méi)有出現(xiàn),并且該機(jī)制已經(jīng)被證明適用于大量的測(cè)試序列。
雖然上述的時(shí)域?qū)恿炕瘷C(jī)制有很強(qiáng)的適用性,但量化參數(shù)的選擇沒(méi)有考慮到視頻內(nèi)容的變化。如圖1所示,和傳統(tǒng)的視頻編碼結(jié)構(gòu)相比,H.264 SVC中的當(dāng)前幀和參考幀之間的距離要大得多。因此,場(chǎng)景變化發(fā)生在當(dāng)前幀和參考幀之間的可能性大大增強(qiáng)。在視頻編碼中,場(chǎng)景變換產(chǎn)生大量的冗余數(shù)據(jù)。如果對(duì)于大冗余數(shù)據(jù)采用大的量化參數(shù),那么視頻將出現(xiàn)明顯的塊效應(yīng),質(zhì)量會(huì)急劇下降。在圖1b中,如果場(chǎng)景變換在第5幀(T1層)處發(fā)生,由于第5幀作為T2和T3層的直接或者間接參考幀,整個(gè)GoP的PSNR會(huì)明顯降低。為了提高在場(chǎng)景變換時(shí)的視頻編碼質(zhì)量,本文建議了一種H.264 SVC場(chǎng)景變換檢測(cè),并基于視頻內(nèi)容的場(chǎng)景變化提出了一種量化參數(shù)選擇方法。
目前有很多算法用于場(chǎng)景變換的檢測(cè),文獻(xiàn)[4]利用像素統(tǒng)計(jì)信息來(lái)進(jìn)行場(chǎng)景變換檢測(cè)。這些算法都需要很大的計(jì)算量。在視頻編碼的過(guò)程中,預(yù)測(cè)殘差數(shù)據(jù)可以用來(lái)進(jìn)行場(chǎng)景變換檢測(cè)[5-6],本文通過(guò)編碼統(tǒng)計(jì)過(guò)程中的預(yù)測(cè)殘差進(jìn)行場(chǎng)景變換檢測(cè)。
設(shè)每個(gè)宏塊的預(yù)測(cè)殘差為RMB,公式為
式中:dij為原始圖像數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)的差值,進(jìn)行絕對(duì)值求和后,用于宏塊殘差的統(tǒng)計(jì),對(duì)于I幀的總殘差為
式中:M,N分別為一幀圖像中的水平和垂直方向的宏塊數(shù)目。相應(yīng)地,對(duì)于P幀見(jiàn)式(4)
在編碼過(guò)程中,可以依據(jù)I幀的編碼數(shù)據(jù)得到RI,同時(shí)RI以GoP為單位進(jìn)行更新。在獲得RI后,對(duì)于后續(xù)的每個(gè)P幀,可以獲得RP。由于RI全部由幀內(nèi)預(yù)測(cè)殘差構(gòu)成,而RP則主要由幀間預(yù)測(cè)殘差構(gòu)成。幀間殘差為運(yùn)動(dòng)補(bǔ)償后的差值數(shù)據(jù),如果待編碼宏塊可以在參考幀中找到良好的預(yù)測(cè),殘差數(shù)據(jù)將很小,即在時(shí)域上沒(méi)有發(fā)生場(chǎng)景切換。反之,如果發(fā)生場(chǎng)景切換,則P幀中的大部分宏塊數(shù)據(jù)無(wú)法在參考中找到良好的預(yù)測(cè),殘差較大,通常來(lái)說(shuō)有RI>3RP。基于上述原理,本文提出通過(guò)計(jì)算RI與RP的比例,確定視頻內(nèi)容是否發(fā)生場(chǎng)景切換的方法,如果
則當(dāng)前P幀判斷為發(fā)生場(chǎng)景切換。
H.264 SVC編碼的GoP結(jié)構(gòu)是由編碼器預(yù)先設(shè)定的。如果視頻內(nèi)容的場(chǎng)景切換出現(xiàn)在I幀,則該幀將全部采用幀內(nèi)編碼模式進(jìn)行編碼,編碼質(zhì)量不會(huì)出現(xiàn)下降。如果場(chǎng)景切換出現(xiàn)在低層的P幀(如圖1中第5幀),則需改進(jìn)原有的量化參數(shù)(見(jiàn)表1),選擇方法為
式中:?」為向上取整處理。采用上述方法,當(dāng)P幀出現(xiàn)場(chǎng)景變換時(shí),該幀所對(duì)應(yīng)的量化參數(shù)變小,進(jìn)而保證該參考幀的編碼質(zhì)量,該幀用于后續(xù)的時(shí)域參考后,可以提高視頻碼流質(zhì)量。
表1 場(chǎng)景變換檢測(cè)及QP調(diào)整
實(shí)驗(yàn)采用常用的視頻測(cè)試序列,包括“football”,“waterfall”,“foreman”,“silent”等,并拼接成序列“football_foreman”,“mobile_tempete”,“waterfall_silent_waterfall”。“football_foreman”,“mobile_tempete”分別在第8 幀,第24幀處形成場(chǎng)景變換。在“waterfall_silent_waterfall”中,場(chǎng)景變換發(fā)生在第10幀,第20幀處。實(shí)驗(yàn)采用JSVM6.5,并設(shè)置參數(shù)如下:1幀參考圖像,快速搜索模式,CABAC編碼,GoP取32,僅采用時(shí)域可伸縮性,起始QP在24到36間,并且33幀圖像被編碼到6層。測(cè)試結(jié)果如圖2~圖5。
圖2中,根據(jù)預(yù)測(cè)相關(guān)性,“waterfall_silent_waterfall”有5幀圖像發(fā)生了場(chǎng)景變換,“opt”方法明顯提高30 Hz時(shí)域?qū)拥木幋a質(zhì)量。圖3顯示幀率為15 f/s時(shí),性能也提高了約0.25 dB。圖4、圖5顯示對(duì)于不同序列、不同幀率也有所提高。結(jié)果顯示“opt”方法明顯提高了編碼效率。
圖5 7.5 f/s football_foreman測(cè)試結(jié)果
實(shí)驗(yàn)還測(cè)試了其他大量序列。針對(duì)這些序列,本方法可以得到相似的結(jié)果。與JSVM中的量化方法相比,此方法可以實(shí)現(xiàn)0.1~0.25 dB的PSNR增益。
本文提出基于場(chǎng)景變換的量化參數(shù)選擇方法。通過(guò)檢查不同宏塊間的比例來(lái)檢測(cè)場(chǎng)景變換。每一幀的量化參數(shù)根據(jù)視頻內(nèi)容的變換進(jìn)行調(diào)整。測(cè)試結(jié)果表明,本文所提出的方法可以較為準(zhǔn)確地檢測(cè)視頻內(nèi)容的變換,并依據(jù)編碼統(tǒng)計(jì)數(shù)據(jù)動(dòng)態(tài)調(diào)整H.264時(shí)域可伸縮編碼的量化參數(shù),可以獲得0.1~0.25 dB的PSNR增益。
:
[1]JVT.Joint Draft 11:Scalable video coding[S].2007.
[2]WIEN M,SCHWARZ H,OELNAUM T.Performance analysis of SVC[J].IEEE Trans.Circuits System Video Technology,2007,17(9):1194-1203.
[3]JVT.Joint scalable video model[S].2007.
[4]LELESCU D,SCHONFELD D.Statistical sequential analysis for realtime video scene change detection on cmpressed multimedia bitstream[C]//Proc.ICME 2003.[S.l.]:IEEE Press,2003:106-117.
[5]PEI S C,CHOU Y Z.Effective wipe detection in MPEG compressed video using macro block type information[C]//Proc.ICME 2002.[S.l.]:IEEE Press,2002:309-319.
[6]SANGKEUN L,HAYES M H.Scene change detection using adaptive threshold and sub-macroblock images in compressed sequences[C]//Proc.ICME 2001.[S.l.]:IEEE Press,2001:52-55.
Novel Temporal Quantization Strategy of H.264 SVC
LIU Yu,LI Xiuqing,WU Junfeng
(School of Electronic and Information Engineering,Tianjin University,Tianjin 300072,China)
A novel quantization parameter(QP)selection strategy for each frame of different temporal layers is suggested.A method of scene change detection using statistic data derived in the coding processing is proposed.If scene change occurs in video sequence,this strategy can improve the coding performance by providing high quality reference pictures.Experiments of different video sequences show that the proposed strategy can enhance the performance of temporal scalable coding with little computation increasing.
H.264 SVC;scene change;quantization strategy
TN949.6
A
劉 昱(1976— ),副教授,碩士生導(dǎo)師,主研數(shù)字音視頻壓縮編碼、多媒體系統(tǒng)與應(yīng)用、慣性導(dǎo)航等;
李秀清(1984— ),碩士生,主研H.264 SVC編解碼;吳俊峰(1984— ),碩士,主研視頻編解碼理論。
責(zé)任編輯:時(shí) 雯
2012-07-18