王小巖
(南京熊貓電子科技發(fā)展有限公司,南京 210000)
如今,人們正處于網(wǎng)絡(luò)時(shí)代,網(wǎng)絡(luò)為人們帶來(lái)了前所未有的便利,其發(fā)展很大程度上決定了社會(huì)的發(fā)展。一直以來(lái),人們由于工作、生活等原因,無(wú)法時(shí)刻陪伴在親人身邊,因此,對(duì)圖像、視頻技術(shù)發(fā)展的期望值極高。但是在研究過(guò)程中,經(jīng)常會(huì)遇到一些問(wèn)題,如視頻中卡頓、漏洞等。只有從根本上解決問(wèn)題,才能使視頻編解碼技術(shù)更上一層樓,為人們提供更加便利的條件。
編碼與解碼均是以計(jì)算機(jī)技術(shù)為基礎(chǔ)的轉(zhuǎn)譯過(guò)程,編碼是將一組字符轉(zhuǎn)變成一個(gè)字節(jié)序列,轉(zhuǎn)碼是由一個(gè)編碼字節(jié)序列轉(zhuǎn)換成一組字符,二者是相反的。視頻是由圖像構(gòu)成,要想對(duì)視頻進(jìn)行編解碼操作,就必須從圖像開(kāi)始,圖像之間有著關(guān)聯(lián)性的特點(diǎn),但是信道資源是十分有限的,工作人員必須在保證圖像清晰的同時(shí)盡量占用較少的信道資源。解決此問(wèn)題的方式便是將其進(jìn)行數(shù)據(jù)壓縮,壓縮作為視頻編解碼技術(shù)的一項(xiàng),被廣泛應(yīng)用在各個(gè)領(lǐng)域。
實(shí)現(xiàn)視頻編解碼的前提是將其數(shù)字化,而后再壓縮,壓縮主要由數(shù)據(jù)冗余和視覺(jué)冗余兩個(gè)基本內(nèi)容構(gòu)成,前者是將相同的數(shù)據(jù)放入不同的文件中,以防數(shù)據(jù)丟失。另外,它可以加快計(jì)算機(jī)處理速度;可以用于龐大數(shù)據(jù)內(nèi)容的搜索;還可以簡(jiǎn)化數(shù)據(jù)流程等,是日常生活、工作的必需品。視覺(jué)冗余屬于數(shù)據(jù)冗余的一種,主要是相對(duì)于人的視覺(jué)而言的。眼睛作為人們感受、接受信息的器官,對(duì)圖像變化的敏感度不同,對(duì)于那些不能有效增強(qiáng)視覺(jué)敏感度的部分,被稱(chēng)為視覺(jué)冗余。要想使視頻的質(zhì)量大幅度提高,必須將視覺(jué)冗余進(jìn)行壓縮處理,此過(guò)程便是壓縮編碼內(nèi)容之一。
圖像壓縮編碼是指在不改變?cè)瓐D像的清晰度的基礎(chǔ)上,對(duì)其進(jìn)行壓縮、編碼,將多余的數(shù)據(jù)字符去掉的過(guò)程,目的是保證圖像成功保存、順利運(yùn)輸。根據(jù)不同的算法,可以將圖片壓縮編碼的方法分為三種:
預(yù)測(cè)編碼是利用離散信號(hào),即離散信號(hào)之間具有關(guān)聯(lián)性的特點(diǎn),用前一個(gè)信號(hào)預(yù)測(cè)出下一個(gè)信號(hào),再對(duì)實(shí)際值和預(yù)測(cè)值的差進(jìn)行編碼的過(guò)程。首先將完整的視頻傳輸出去,對(duì)其中的圖像進(jìn)行預(yù)測(cè),得出預(yù)測(cè)誤差后經(jīng)過(guò)編碼處理來(lái)降低碼率。如此一來(lái),數(shù)據(jù)得到壓縮但并不影響視覺(jué)效果,是一種十分有效的方式。
離散余弦變換編碼,又稱(chēng)DCT。離散余弦變換是在傅里葉性質(zhì)的基礎(chǔ)上,將圖像變換為偶函數(shù)形式,再進(jìn)行二維傅里葉變換,最終得到的圖像僅包含余弦項(xiàng)。變換編碼是將圖像上的時(shí)域信號(hào)轉(zhuǎn)變?yōu)轭l域信號(hào)的一種方式,目的是在頻域上降低量化比特?cái)?shù),從而實(shí)現(xiàn)壓縮。DCT 技術(shù)是將數(shù)據(jù)集中在少量系數(shù)上,雖然不能無(wú)損壓縮,但是在壓縮中十分重要,是壓縮國(guó)際標(biāo)準(zhǔn)JPEG的主要內(nèi)容。
長(zhǎng)度編碼,又稱(chēng)RLC。在DCT 中,圖像經(jīng)過(guò)轉(zhuǎn)變之后會(huì)出現(xiàn)許多重復(fù)的字符序列,而長(zhǎng)度編碼可以將重復(fù)的部分轉(zhuǎn)換成標(biāo)志字符,后面再次重復(fù)的字符和說(shuō)明的字符用數(shù)字表示。此方法極大地節(jié)省了時(shí)間,也減小了編碼中出現(xiàn)誤差的概率。
哈夫曼編碼,又稱(chēng)霍夫曼編碼,屬于非等長(zhǎng)編碼的一種。它是以各數(shù)據(jù)出現(xiàn)的概率為前提進(jìn)行操作,將出現(xiàn)的不同概率按照大小排序,把其中最小的兩個(gè)概率加在一起,最為一個(gè)新的概率進(jìn)入隊(duì)列排序,以此類(lèi)推,一直到最終的結(jié)果為1。將兩個(gè)最小的概率分別標(biāo)記為“0”和“1”,從起始符號(hào)一只讀取到最后一個(gè)“1”,再將讀取中全部遇到的“0”和“1”按照由低到高的順序進(jìn)行排列,便是哈夫曼編碼的過(guò)程。
運(yùn)動(dòng)補(bǔ)償。運(yùn)動(dòng)補(bǔ)償也是在圖像連續(xù)性基礎(chǔ)上進(jìn)行處理的過(guò)程,它在對(duì)比圖像前后幀之后能夠描述出物體運(yùn)動(dòng)的方式,能夠減少數(shù)據(jù)量,從而達(dá)到壓縮的目的。
信源編碼是采取壓縮圖像和空間冗余量的方法來(lái)提高存儲(chǔ)率,利用降低視頻圖像序列的比特率來(lái)提升傳輸效率,混合編碼是將此二者有效結(jié)合,用DCT 將圖像進(jìn)行壓縮,用運(yùn)動(dòng)補(bǔ)償進(jìn)行幀間壓縮,從而達(dá)到提高壓縮效率的目的。
科學(xué)技術(shù)在發(fā)展,視頻壓縮編解碼的標(biāo)準(zhǔn)也隨之變化,經(jīng)過(guò)不同時(shí)期的推陳出新之后,H.26X 系列作為實(shí)時(shí)視頻通話(huà)的主要技術(shù)。H.261是一種運(yùn)動(dòng)圖像的編碼算法,由于其編碼效率高、實(shí)時(shí)性強(qiáng)的特點(diǎn)已經(jīng)被廣泛應(yīng)用在視頻通話(huà)系統(tǒng)中。H.263是以H.261為基礎(chǔ)進(jìn)行部分改動(dòng)得出的一種編碼,與H.261不同的是,它利用低碼率傳送圖像,支持碼率較小的應(yīng)用,其應(yīng)用范圍同樣較為廣泛。H.264以簡(jiǎn)潔作為設(shè)計(jì)風(fēng)格,相比于前兩種編碼,獲得了更好的壓縮性能。另外,它能夠滿(mǎn)足不同速率、解析度的需求,適用于IP 和無(wú)線(xiàn)網(wǎng)絡(luò)中。
作為新時(shí)代的產(chǎn)物,視頻編解碼技術(shù)已經(jīng)成為人們?nèi)粘I钪胁豢苫蛉钡囊徊糠?,它以?jì)算機(jī)技術(shù)為前提,包括許多圖像編解碼的方法,無(wú)論是智能手機(jī)、數(shù)碼相機(jī)還是計(jì)算機(jī),都是由于視頻編解碼技術(shù)的發(fā)展而形成的,視頻編解碼技術(shù)影響著人們的生活,也是社會(huì)進(jìn)步的標(biāo)志。視頻通話(huà)也是編解碼的應(yīng)用領(lǐng)域之一,此技術(shù)不僅方便了人們的生活,更為互聯(lián)網(wǎng)事業(yè)增添了動(dòng)力。通過(guò)探究視頻編解碼的發(fā)展、原理以及相關(guān)技術(shù)人員不斷的創(chuàng)新,在未來(lái)的發(fā)展中,視頻編解碼技術(shù)一定會(huì)在其他領(lǐng)域?yàn)槿藗兲峁└玫姆?wù)。國(guó)家也應(yīng)該大力支持視頻編解碼技術(shù),為科研人員提供所需的材料以及必備的社會(huì)保障。