陸安江,賀 松
(貴州大學(xué)計算機(jī)科學(xué)與信息學(xué)院,貴州 貴陽 550025)
隨著因特網(wǎng)業(yè)務(wù)的快速增長,在速率起伏很大的IP網(wǎng)絡(luò)及具有不同傳輸特性的異構(gòu)網(wǎng)絡(luò)上進(jìn)行視頻傳輸?shù)囊蠛蛻?yīng)用越來越多。在此背景下,視頻分級編碼的重要性日益突出,其應(yīng)用非常廣泛,且具有很高的理論研究及實際應(yīng)用價值,因此受到人們的極大關(guān)注。但現(xiàn)有的分級編碼存在諸多的不足,如算法復(fù)雜度高、計算量大、編碼效率低等,并缺乏足夠的靈活性[1,2]。基于小波變換的分級編碼雖然具有很好的可分級性,但其算法結(jié)構(gòu)復(fù)雜,與主要標(biāo)準(zhǔn)的架構(gòu)差別較大,很少在實際中得到應(yīng)用[3]。在AVS(Audio Video coding Standard)信源編碼標(biāo)準(zhǔn)體系中,通過設(shè)置特殊的碼流結(jié)構(gòu),對殘差數(shù)據(jù)進(jìn)行分級編碼,這種分級方法并不影響在變換域中進(jìn)行幀內(nèi)預(yù)測,不會造成誤差積累,可以將其很好地應(yīng)用于實際[4,5]。而目前流行的IPTV視頻播放系統(tǒng),由于其網(wǎng)絡(luò)交換環(huán)境復(fù)雜多樣,傳輸視頻質(zhì)量必然受到網(wǎng)絡(luò)環(huán)境因素的影響,特別是基于農(nóng)村的終端用戶,普遍傳輸環(huán)境條件較差,于是需要從源頭上解決制約視頻在傳輸過程中的問題。為了節(jié)省成本,同時在不影響視頻質(zhì)量的前提下,越來越多的目光將較差網(wǎng)絡(luò)環(huán)境下高質(zhì)量視頻傳輸?shù)慕鉀Q方法轉(zhuǎn)移到視頻的編碼上。
在本文介紹的系統(tǒng)設(shè)計中,由于擬將分級編碼直接應(yīng)用于適合邊遠(yuǎn)農(nóng)村信息服務(wù)體系遠(yuǎn)程多媒體視頻架構(gòu)的UT斯達(dá)康奔流系統(tǒng),系統(tǒng)通過IP網(wǎng)絡(luò)傳送廣播級視頻質(zhì)量的視頻及互動娛樂服務(wù),可以為用戶提供端到端多媒體、語音等數(shù)據(jù)業(yè)務(wù)。系統(tǒng)整體采用分布式體系架構(gòu)部署(如圖1所示),分為存儲分發(fā)平臺、內(nèi)容服務(wù)平臺、網(wǎng)絡(luò)分發(fā)平臺、運(yùn)營支撐平臺、終端服務(wù)平臺5部分。該解決方案主要包含內(nèi)容存儲、加密、分發(fā)、播放等[6]。
圖1 IPTV分布式體系架構(gòu)Fig.1 IPTV distributed system structure
在內(nèi)容分發(fā)方面,該系統(tǒng)采用靈活、高效的寬帶媒體內(nèi)容分發(fā)協(xié)議來實現(xiàn)媒體站中的流媒體內(nèi)容靈活分發(fā)。其充分利用IP服務(wù)的不保證服務(wù)質(zhì)量特性,采用AVS視頻分級編碼進(jìn)行優(yōu)化設(shè)計,支持網(wǎng)絡(luò)速率的容錯控制管理。內(nèi)容分發(fā)由媒體服務(wù)器、媒體引擎等共同完成。其中,分發(fā)策略的定制和設(shè)置主要由媒體內(nèi)容管理來完成,支持PUSH、PULL分發(fā)機(jī)制,并按照預(yù)定的策略觸發(fā)分發(fā)服務(wù),通過媒體數(shù)據(jù)位置注冊服務(wù)器記錄整個系統(tǒng)中媒體內(nèi)容的存儲位置信息,并保持實時更新。在內(nèi)容管理器的觸發(fā)下,由媒體服務(wù)器、媒體引擎共同承擔(dān)視頻內(nèi)容分發(fā)服務(wù)[7]。對于IPTV農(nóng)村信息服務(wù)系統(tǒng),視頻推送速度及壓縮質(zhì)量也成為制約農(nóng)村用戶推廣的瓶頸,而AVS分級編碼通過優(yōu)化視頻的PSNR值和碼率來解決此問題。
常用視頻壓縮標(biāo)準(zhǔn)方法如文獻(xiàn)[4,5]中所述,將圖像劃分成4×4或8×8的小塊,首先進(jìn)行幀間預(yù)測或幀內(nèi)預(yù)測,然后做離散余弦變換(DCT)變換,量化后按頻譜進(jìn)行分段,最后對整個圖像的每一個分段統(tǒng)一進(jìn)行熵編碼[8]。
針對選取的系統(tǒng)架構(gòu),在同一頻段內(nèi),將整個圖像中所有宏塊中的每一個分塊的系數(shù)進(jìn)行統(tǒng)一編碼。所有宏塊中的DC系數(shù)、宏塊頭、塊頭信息統(tǒng)一進(jìn)行編碼;針對其它層的AC系數(shù),采用游程編碼;對于DC系數(shù),則采用DPCM進(jìn)行預(yù)測編碼。開辟一個獨(dú)立的緩沖區(qū)來存放每一層編碼的碼流信息,然后將所有緩沖區(qū)聯(lián)結(jié)在一起,并且在碼流頭部加上每個緩沖區(qū)的長度[6,7]。采用這種編碼方式,解碼器就可對每個編碼層進(jìn)行相應(yīng)的解碼。
由于塊與塊之間具有相同的特性,為了簡化問題,可以只選取一個塊來進(jìn)行計算。將一個8×8像素構(gòu)成的塊記為Pix-cur[8][8],而將相應(yīng)的參考塊記為Pix-ref[8][8],記 DCT變換矩陣為 T,由于DCT變換也是線性變換,于是有:
式中,T-1表示T的轉(zhuǎn)置。記Dctxi為除第i段的系數(shù)不變其它系數(shù)為零的矩陣,則有:
在編碼器端按最高質(zhì)量進(jìn)行編碼,因此,所有8個段的系數(shù)都要進(jìn)行編碼,并需要更新所有段的DCT系數(shù)。由于DCT變換的線性特性,更新等價于在像素空間域參考圖像內(nèi)進(jìn)行,那么,就只需要在解碼器端設(shè)置變換域內(nèi)的參考塊,不必在編碼器端設(shè)置變換域的參考塊。在編碼器端沿用通常的像素空間域的參考圖像,便于進(jìn)行運(yùn)動搜索[8]。
在解碼器端,由于普通像素域內(nèi)的解碼器的參考圖像只能用部分DCT系數(shù)來重構(gòu),而分級編碼能夠只對部分較低頻段(n<8)上的系數(shù)求解,這時如果仍然采用空間域內(nèi)的參考圖像,勢必造成編解碼的參考圖像不一致。因此需要在解碼器終端增設(shè)一個位于DCT變換域內(nèi)由每一個宏塊中的相應(yīng)塊的DCT在每一個頻段上的變換系數(shù)構(gòu)成的參考圖像。其中,每個像素為16 bit量化長度。當(dāng)只有部分頻譜的系數(shù)傳過來時,將已收到的前n個(n<8)頻段的DCT系數(shù)加到相應(yīng)的參考塊的系數(shù)之上,同時需考慮運(yùn)動矢量后所對應(yīng)的參考塊,只將相應(yīng)的DCT變換域參考塊中前面8個頻段的DCT系數(shù)進(jìn)行更新。這樣,就保證了編解碼器在較低頻譜(n<8)的參考圖像的一致性。該方案有效地避免了誤差積累。接下來,通過DCT逆變換來獲得相應(yīng)的解碼圖像。當(dāng)收到所有頻段上的信息以后,就可以獲得一個質(zhì)量較高的視頻圖像。
變換域的參考圖像也是按相同的方法來劃分,因此在作逆量化和DCT逆變換之前,先根據(jù)運(yùn)動矢量信息將當(dāng)前頻段的差分系數(shù)加到相應(yīng)變換的參考頻段上,并更新參考圖像的頻段系數(shù),然后組合所有分級頻段n(n<8)的系數(shù),進(jìn)行逆量化與DCT逆變換,形成視頻緩沖區(qū)[9]。在進(jìn)行空間域變換過程中,如果使用通常的參考圖像而不保存變換域DCT系數(shù)的參考塊圖像,可以將該參考圖像相應(yīng)的塊進(jìn)行DCT變換,然后只保留前 n段的系數(shù),并設(shè)置其它系數(shù)為0。最后將接收到的前n個段的DCT系數(shù)加到變換后得到的前n個段的DCT系數(shù),再做DCT逆變換,得到相應(yīng)的解碼圖像。
通過在AVS的參考軟件最新版本 RM52K-r1的基礎(chǔ)上進(jìn)行設(shè)計,選取視頻圖像測試序列如表1所示。分微度(Mother-daughter)、輕度(News)、中度(Foreman)和劇烈(Bus)變化程度進(jìn)行仿真實驗,得到的結(jié)果如圖2所示。
表1 測試序列特性說明Tab.1 Test sample′s characteristic
圖2 AVS-QSVC各級碼率和PSNR比較Fig.2 Comparison between AVS-QSVC per-level code rate and PSNR
從圖3(I幀后的第21幀)和圖4(I幀后的第10幀)可以看到,從第0級到第8級,峰值信噪比值逐漸增大,碼率也逐漸增加。這種能力使得編碼后的碼流具有了一定的可伸縮性,從而在帶寬受限和信道不可靠等情況下能夠進(jìn)行可靠、有效的傳輸,因此可根據(jù)不同用戶的網(wǎng)絡(luò)帶寬,選擇相應(yīng)碼率的視頻流傳送給用戶終端,從而保證了用戶在不同的網(wǎng)絡(luò)帶寬下都能得到相應(yīng)質(zhì)量的視頻服務(wù)。
圖3 Foreman序列分級結(jié)果Fig.3 Scalable coding of Foreman sequence
圖4 News序列分級結(jié)果Fig.4 Scalable coding of News sequence
針對IPTV在農(nóng)村信息服務(wù)系統(tǒng)中存在的視頻帶寬受限問題,從實效的角度出發(fā),在標(biāo)準(zhǔn)框架下提出了實用的視頻可分級編碼方法。該方法與基于小波變換的分級編碼方法相比,其運(yùn)算復(fù)雜度大大改善,能夠很好地匹配AVS標(biāo)準(zhǔn)框架,可以與其它分級編碼方法組合使用,得到更加靈活的分級編碼方案,從而在實踐中得到較好應(yīng)用。另外,本方案很容易實現(xiàn)8級可調(diào),使靈活性大大提高,能較廣泛適應(yīng)不同的網(wǎng)絡(luò)交換環(huán)境。
[1] ITU-T Recommendation H.261,Video codec for audiovisual Services at p×64 kbit/s[S].
[2] ITU-T Recommendation H.263,Video coding for low bit rate communication[S].
[3] Wang Xianghai.Research on Spatial Scalable Video Coding Based on Wavelet[J].Computer Science,2002,29(7):115-117.
[4] ISO/IEC 14492-2(MPEG-4 Visual),Coding of audiovisual objects-Part 2:Visual[S].
[5] ITU-T Recommendation H.264 and ISO/IEC 14496-10(MPEG4-AVC),Advanced video coding for generic audiovisual services[S].
[6] 賀松,陸安江,張正平.農(nóng)村信息化建設(shè)中IPTV系統(tǒng)存儲技術(shù)研究與應(yīng)用[J].貴州農(nóng)業(yè)科學(xué),2009,37(6):239-240.HE Song,LU An-jiang,ZHANG Zheng-ping.Research and Applicationof IPTV Storage Technology in Rural Information Construction[J].Guizhou Agricultural Sciences,2009,37(6):239-240.(in Chinese)
[7] 劉旭,陸安江,賀松.基于流媒體的農(nóng)業(yè)信息化系統(tǒng)的設(shè)計及內(nèi)容分發(fā)的研究[J].電腦知識與技術(shù),2009,5(33):9496-9497.LIU Xu,LU An-jiang,HESong.The Design of Agricultural Information System and the Research of CDN Based on Streaming Media[J].Computer Knowledge and Technology,2009,5(33):9496-9497.(in Chinese)
[8] Luo L,Li J,Li S,et al.Motion compensated lifting wavelet and its application invideo coding[C]//Proceedings of International Conference on Multimedia and Expo.Tokyo,Japan:IEEE,2001:365-368.
[9] Secker,Taubman D.Lifting-based invertible motion adaptive transform(LIMAT)framework for highly scalable video compression[J].IEEE Transactions on Image Processing,2003,12(12):1530-1542.