■戰(zhàn) 紅
上世紀末期,隨著計算機技術(shù)的發(fā)展,人類開始進入數(shù)字化時期。作為數(shù)字技術(shù)當中的重要構(gòu)成部分之一,數(shù)字圖像技術(shù)將我們帶入多媒體時代。各類五彩斑斕的圖像訊息得到快速傳播,特別是在信息化不斷發(fā)展的當前,圖片處理功能要求越來越多,如果只是依靠傳統(tǒng)擴大帶寬與存儲介質(zhì)容量的方式,顯然與時代發(fā)展不相適應,因此,圖像壓縮編碼技術(shù)應運而生。
基于圖像保真的前提下,對相關(guān)的圖像及數(shù)據(jù)進行壓縮、編碼與變換,以此來達到方便圖像的傳輸與存儲的目的,這種新型技術(shù)即為圖像壓縮編碼技術(shù)。本文對其發(fā)展歷程進行回顧,并在此基礎(chǔ)上,對其應用前景進行綜合分析。
自二十世紀四十年代開始,隨著電視信號數(shù)字化的提出,對于第一代圖像壓縮編碼技術(shù)的分析與研究工作也提上了日程,至今已走過了六十多年歷史。在最初階段,由于客觀條件所限,僅對亞取樣內(nèi)插復原之法與幀內(nèi)預測法進行研究與分析。在此之后的1969年,隨著首屆圖像編碼會議的成功召開,才使得其正式成為了一門獨立學科,與此同時,圖像壓縮編碼技術(shù)的研究取得了重大進步,特別是在編碼算法領(lǐng)域當中,比如量化編碼、變換編碼都成為了當時重點研究的領(lǐng)域[1]。
為了改變傳統(tǒng)圖像壓縮編碼技術(shù)存在的圖像復原質(zhì)量差、壓縮比小等缺點,Kunt 等人在1985年基于人眼當中的視覺特性,提出了新型圖像壓縮編碼概念,也即是第二代的圖像壓縮編碼技術(shù)概念。而在此之后的1987年,著名的Mallat 算法首次成功將處于計算機視覺范疇之內(nèi)的“多尺度分析思想”運用至小波變換當中,因而將此前各類小波構(gòu)建之法加以統(tǒng)一。僅過了一年,Sloan 就與Barnsley 在1988年共同提出了圖像分形編碼壓縮之法,此法具有解碼分辨率無關(guān)性與壓縮潛力大等特征,從一定程度上來講,具有很強的科學性與潛力。此后,多國學者紛紛將目光投入至此領(lǐng)域,掀起了一股分形圖像編碼研究的高潮。
二十世紀九十年代,由于在這領(lǐng)域內(nèi)的關(guān)注度不斷上升,因而在這一領(lǐng)域又取得了一系列階段性的研究成果。比如,Knowles 與A.S.Lewis 首先就提出了基于零樹編碼之法。1993年,J.M.Shapiro 提出了新型嵌入式的零樹小波變換編碼計算之法,此種算法有效地將小波系數(shù)特性進行了利用,因而使圖像可分級編碼得以實現(xiàn)。當前,圖像壓縮研究領(lǐng)域當中的一個重要方向即是基于小波變換當中的圖像壓縮編碼算法。
而在最近的幾十年里,這種技術(shù)的發(fā)展更是被廣泛運用到了各個領(lǐng)域當中,發(fā)展非常迅速,且日臻成熟。比如制定了幾個圖像編碼的國際標準,也即是活動圖像編碼相關(guān)標準MPEG-4、MPEG-2 等;靜止圖像當中的編碼標準JPEG2000 與JPEG,還有相關(guān)的視頻編碼的標準如H.264、H.263 等[2]。
隨著一系列圖像編碼國際標準的產(chǎn)生,它標志著這項技術(shù)已經(jīng)趨于成熟,它的發(fā)展與出現(xiàn)的作用已經(jīng)大到能夠使當前信息產(chǎn)業(yè)的模式與結(jié)構(gòu)產(chǎn)生巨變,同時也使計算機、廣播與通信產(chǎn)業(yè)之間的界限越來越模糊。當前,許多國家加大了數(shù)字電視的推廣力度,就我國而言,數(shù)字電視在當前的普及率已相當高,由于數(shù)字電視具備頻譜利用率高、圖像質(zhì)量高等特點,因而其可以實現(xiàn)多種不同業(yè)務間的統(tǒng)計復用與動態(tài)組合,擁有互操作性、可分組性、可擴展性、易于加密等優(yōu)點,這恰好也是傳統(tǒng)模擬機所無法達到的。然而,由于數(shù)字電視本身所傳送的數(shù)據(jù)量相當大,因此必須保證其傳輸?shù)臄?shù)量與質(zhì)量雙重要求,在這里,視頻壓縮技術(shù)就顯得尤為重要。因此,從前幾年開始,對于圖像編碼的研究就集中于視頻壓縮領(lǐng)域,以此來不斷改進當前數(shù)字電視自身的性能,拓寬其應用領(lǐng)域。隨著當前數(shù)字電視的普及,這一研究成果的意義不言而喻。將分辨率作為基礎(chǔ),可將數(shù)字電視分為高清電視、數(shù)字標清電視、會議電視、可視電話四個等級。此外,在其他領(lǐng)域圖像編碼技術(shù)同樣被廣泛應用,比如多媒體出版物,它包含電子報刊、電子圖書等;電視計算機,這是一種介于計算機與電視之間的應用,將電視與計算機融為一體,從而形成了一個多媒體的工作站[3]。
從國際相關(guān)的數(shù)據(jù)壓縮發(fā)展來看,特別是MPEG 的發(fā)展,基于內(nèi)容之上的圖像壓縮編碼方式是將來編碼發(fā)展的必然趨勢。比如,給出一幅圖像,包括汽車、房以及人臉等內(nèi)容,就可通過相關(guān)技術(shù)提取需要的內(nèi)容,運用這項技術(shù)就可實現(xiàn)對不同指定對象予以編碼,而MPEG-4 技術(shù)在這個方面特別是人面部表情與其動作層面之上就取得了許多碩果。比如利用人工與自然合成內(nèi)容當中的合并來進行編碼,MPEG-4 的引入有效解決了對于臉部與動面編碼這個問題。但值得指出的是,很多更復雜的東西需要建立一系列的編碼與模型,且不同形物體所需要建立的相關(guān)問題還未得到解決,因而嚴重制約了其運用的寬廣性。因此,筆者認為視頻編碼技術(shù)將朝著跨模式與多模式的方向發(fā)展。與此同時,通過Metadata(元數(shù)據(jù))進行編碼也可能是今后其所發(fā)展的具體方向,一般而言,詳細地將音視頻信息當中的基本元素進行描述即是元數(shù)據(jù),MPEG-7 最為主要的功能就是描述這種音視頻信息,在描述這些信息的同時,就可將編碼完成,這是由于此時的編碼對象是對圖像的描述,而并不是圖像本身了。
隨著多媒體信息自身消費方式的轉(zhuǎn)變,因而也要求必須實現(xiàn)不同網(wǎng)絡相互之間的數(shù)據(jù)交換。針對這個問題,MPEG 運用了一類與ITU-T不盡相同的標準化的格式。它將多媒體數(shù)據(jù)的具體表示方式進行了定義,試圖使大部分的數(shù)據(jù)得到充分的互動性與共享數(shù)據(jù)格式。而MPEG-4 在音頻編碼與語音層面上的工作則擴寬了多媒體服務、寬帶的應用范圍。由于它提供了一系列的MPEG-4 編碼工具的集成與新功能,因此也相當于超集了大量現(xiàn)存編碼標準自身的功能。在應用音視頻之時,因為MPEG 具有基于視音頻對象的特殊編碼方式,因此也不斷提高了MPEG 音頻自身的編碼質(zhì)量。除此之外,由于以往的ITU-T 注重實時通訊,與此相反,MPEG-4 更注重對存儲媒體的關(guān)注,其自身所攜帶的回放速度轉(zhuǎn)變于數(shù)據(jù)庫搜索當中具有相當大的作用,同時,它還提供一系列在知識產(chǎn)權(quán)保護領(lǐng)域之內(nèi)的功能支持。從某些方面來講,當前,消費者還是對服務提供端過于依賴,因而很容易導致其局限于地域性服務。由于受到特定環(huán)境之內(nèi)有限的服務供應商的所限,這也是非常自然的。然而,隨著當前交互模式寬帶網(wǎng)絡的運用,從而提供了使個人成為內(nèi)容供應商的可能性,其服務也是基于通用領(lǐng)域的基礎(chǔ)上的,從而使得廣大消費者可以在內(nèi)容供應商方面接受大范圍內(nèi)的服務。這種以消費者為中心的模式,可以從一定程度上拓寬商業(yè)機遇,隨之而來的是各種類型的服務、內(nèi)容供應商都將可能得到前所未有的機遇,達到理想的消費市場[4]。
總的來講,社會發(fā)展需求從一定程度上決定了圖像壓縮編碼發(fā)展的步伐與方向,在這一領(lǐng)域之內(nèi)的突破無論對于多媒體事業(yè)還是通信事業(yè)的發(fā)展都將帶來重大影響。也正因為如此,探索與研究新型的壓縮編碼算法也將成為未來及當前圖像處理領(lǐng)域范圍內(nèi)的重中之重。
注釋
[1]潘遠翠:《基于圖像壓縮與編碼技術(shù)的研究》[J],《數(shù)字技術(shù)與應用》,2011年第4期。
[2]查宣威、岑峰:《DC 恢復算法及其在圖像壓縮編碼中的應用》[J],《微型機與應用》,2013年第1期。
[3]任燕:《針對WMSN 圖像傳輸能耗優(yōu)化方法的技術(shù)研究》[J],《科技通報》,2013年第3期。
[4]蒲亞坤、叢爽:《基于小波變換的圖像壓縮改進方法及其應用》[J],《科技導報》,2009年第18期。