• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      電影沉浸式音頻碼流規(guī)范及功能特性研究

      2024-04-12 06:58:22
      現(xiàn)代電影技術(shù) 2024年3期
      關(guān)鍵詞:聲道碼流音頻

      王 豐

      中國電影科學(xué)技術(shù)研究所(中央宣傳部電影技術(shù)質(zhì)量檢測(cè)所),北京 100086

      1 引言

      沉浸式音頻(Immersive Audio)技術(shù)在電影中的應(yīng)用具有里程碑意義,其憑借高品質(zhì)的包容感、更加明確的位置感以及更為豐富細(xì)膩的聲音細(xì)節(jié)迅速走進(jìn)廣大觀眾的視野,成為現(xiàn)階段業(yè)界最為關(guān)注的焦點(diǎn)之一。與傳統(tǒng)影廳5.1 聲道、7.1 聲道等二維環(huán)繞聲技術(shù)相比,沉浸式音頻影廳在觀眾區(qū)上方增加了能夠展現(xiàn)聲場(chǎng)高度(維度)的音頻聲道,同時(shí)具備了基于音頻資產(chǎn)與元數(shù)據(jù)信息共同描述的音頻對(duì)象元素,每個(gè)揚(yáng)聲器都是一個(gè)獨(dú)立發(fā)聲單元,聲像定位效果更為準(zhǔn)確。

      為推動(dòng)電影沉浸式音頻技術(shù)的規(guī)范化發(fā)展,美國電影電視工程師協(xié)會(huì)(SMPTE)從2018 年起陸續(xù)發(fā)布多個(gè)技術(shù)標(biāo)準(zhǔn),對(duì)影院沉浸式音頻元數(shù)據(jù)類型、聲場(chǎng)組結(jié)構(gòu)、碼流以及素材交換格式等多個(gè)方面作出規(guī)范,其目的是通過規(guī)范沉浸式音頻系統(tǒng)的技術(shù)要求,讓技術(shù)團(tuán)隊(duì)在沉浸式音頻系統(tǒng)的研發(fā)和升級(jí)改造時(shí)有章可循,逐步提升不同品牌沉浸式音頻系統(tǒng)的互操作性,進(jìn)而改變現(xiàn)階段不同品牌系統(tǒng)互不兼容的生態(tài)環(huán)境。

      SMPTE 頒布的電影沉浸式音頻系列標(biāo)準(zhǔn)具有較強(qiáng)的前瞻性,其定義的功能特性可以從技術(shù)層面為影視聲音創(chuàng)作提供更大的表現(xiàn)空間,但當(dāng)時(shí)尚無能夠完整支持其全部功能的沉浸式音頻系統(tǒng)。為此,SMPTE 于2021年針對(duì)SMPTE ST 2098-2:2019 沉浸式音頻碼流規(guī)范(Immersive Audio Bitstream Specification)標(biāo)準(zhǔn)(以下簡(jiǎn)稱“SMPTE ST 2098-2”)發(fā)布了約束性文檔SMPTE RDD 57:2021(以下簡(jiǎn)稱“SMPTE RDD 57”),針對(duì)SMPTE ST 2098-2 的基礎(chǔ)功能提出支持建議,對(duì)一些高級(jí)功能做出了限制建議,其目的是降低沉浸式音頻碼流的復(fù)雜度,階段性推進(jìn)影院放映端的應(yīng)用普及率,未來會(huì)根據(jù)行業(yè)發(fā)展情況逐步取消相關(guān)功能性限制,直至支持完整功能特性。為促進(jìn)沉浸式音頻技術(shù)的健康發(fā)展與推廣,提升沉浸式音頻技術(shù)的優(yōu)化與普及,使研發(fā)者能夠在正確理解和遵循標(biāo)準(zhǔn)的前提下進(jìn)行技術(shù)創(chuàng)新,確保不同品牌系統(tǒng)之間具備互操作性,同時(shí)使內(nèi)容創(chuàng)作者和觀眾能夠在不同的渲染還音平臺(tái)享受盡可能一致的聽覺體驗(yàn),需要對(duì)沉浸式音頻所涉及的相關(guān)標(biāo)準(zhǔn)進(jìn)行跟蹤研究和深入分析。本文深入研究了SMPTE ST 2098-2 標(biāo)準(zhǔn)中各內(nèi)容元素參數(shù)位段的功能含義,梳理了沉浸式音頻所涉及的全部功能特性,并結(jié)合其他相關(guān)標(biāo)準(zhǔn),介紹了現(xiàn)階段電影行業(yè)沉浸式音頻技術(shù)的實(shí)際應(yīng)用情況。

      2 沉浸式音頻碼流元素分析與研究

      SMPTE ST 2098-2 是關(guān)于沉浸式音頻碼流的主要標(biāo)準(zhǔn),它從兩個(gè)部分定義了沉浸式音頻碼流(Immersive Audio Bitstream, IABitstream)結(jié)構(gòu),包括前導(dǎo)碼部分(Preamble)和沉浸式音頻幀部分(IAFrame),如圖1 所示。其中IAFrame 是IABitstream 中最重要的元素(Element),全部沉浸式音頻數(shù)據(jù)都存在于其中,包括用于揚(yáng)聲器陣列的聲床信息,以及可呈現(xiàn)到任意揚(yáng)聲器或任意虛擬位置的音頻對(duì)象信息,此外還包含多個(gè)音頻數(shù)據(jù)元素,每個(gè)元素都帶有脈沖編碼調(diào)制(Pulse Code Modulation, PCM)或數(shù)字無損壓縮編碼(Digital Losslessly-coded, DLC)音頻資產(chǎn)信息。

      圖1 沉浸式音頻碼流結(jié)構(gòu)示意圖

      IAFrame 元素是由多個(gè)子級(jí)元素組成的層次結(jié)構(gòu)。子級(jí)元素類型包括聲床定義元素(BedDefinition)、音頻對(duì)象元素(ObjectDefinition)、無損壓縮音頻元素(AudioDataDLC)、脈沖編碼調(diào)制音頻元素(AudioDataPCM)、制作工具信息元素(AuthoringTool-Info)和 用 戶 數(shù) 據(jù) 元 素(UserData),如 圖2 所示。SMPTE ST 2098-2 明確指出,IABitstream 中除上述元素外不能夠包含任何其他類型的元素。

      圖2 元素層級(jí)結(jié)構(gòu)圖

      2.1 沉浸式音頻幀(IAFrame)元素

      IAFrame 是層級(jí)最高的幀頭元素,其數(shù)據(jù)字段主要包含6類位段(圖3)。

      圖3 沉浸式音頻幀(IAFrame)元素

      起始的Version 位段用于指定沉浸式音頻碼流的版本,符合IABitstream 規(guī)范碼流版本的值應(yīng)為1,該參數(shù)位段禁止使用0 或2 的值。最后的SubElement-Count 位段表示當(dāng)前元素中包含的下級(jí)元素(子元素)總數(shù)。

      SampleRate 與BitDepth 用于規(guī)定音頻內(nèi)容的采樣頻率和量化深度,同一個(gè)IABitstream 中所有音頻內(nèi)容應(yīng)使用相同的采樣率與量化深度。SampleRate的編碼值為“0x0”表示采樣率為48kHz,編碼值為“0x1”表示采樣率為96kHz,編碼值“0x2”與“0x3”表示預(yù)留的未定義采樣率。BitDepth 編碼值為“0x0”表示16bit 的量化深度,BitDepth 編碼值為“0x1”表示24bit的量化深度,BitDepth 編碼值“0x2”與“0x3”表示預(yù)留的未定義量化深度,IAFrame 中的所有被取樣音頻內(nèi)容的量化深度取值范圍應(yīng)在(-2n-1≤量化值<2n-1)的范圍內(nèi)。

      FrameRate 用于表示IAFrame 的幀率,同時(shí)控制音頻內(nèi)容的采樣數(shù)(SampleCount),F(xiàn)rameRate 編碼值所對(duì)應(yīng)的幀率與音頻采樣數(shù)的對(duì)應(yīng)關(guān)系如表1所示。

      表1 幀率與采樣數(shù)的對(duì)應(yīng)關(guān)系

      MaxRendered 表示在單幀播放期間可同時(shí)被渲染的最大聲道數(shù)和對(duì)象數(shù)之和。例如,對(duì)于具有無條件聲床的9.1OH 聲床和無條件對(duì)象的118 個(gè)對(duì)象的IAFrame 元素,該IAFrame 的最大渲染計(jì)數(shù)為128。對(duì)于所有預(yù)設(shè)的聲道或?qū)ο?,無論是否存在音頻資產(chǎn),其數(shù)量都會(huì)包含在最大渲染計(jì)數(shù)中。2022 年底,SMPTE 對(duì)SMPTE ST 2098-2 標(biāo)準(zhǔn)進(jìn)行了修訂,對(duì)MaxRendered 位段要求做了補(bǔ)充,規(guī)定采樣頻率為48kHz 碼流的MaxRendered 值不高于128,規(guī)定采樣頻率為96kHz碼流的MaxRendered 值不高于64。

      2.2 聲床定義(BedDefinition)元素

      BedDefinition 元素包含聲床元數(shù)據(jù)和指向音頻資產(chǎn)的信息,主要包含14 類位段,其結(jié)構(gòu)如圖4所示。

      圖4 聲床定義(BedDefinition) 元素

      MetaID 用于識(shí)別幀與幀之間的元數(shù)據(jù)信息。在一個(gè)IAFrame 中相同類型的兩個(gè)元素不得具有相同的MetaID,在連續(xù)的IAFrame 中,相同類型和相同MetaID 的元素通常表示連續(xù)音頻。

      ConditionalBed 表示符合特定聲場(chǎng)環(huán)境時(shí)才會(huì)被激活的條件聲床,該位段值為0 表示BedDefinition 元素不存在條件聲床,BedDefinition 直接被激活;值為1表示BedDefinition 元素存在條件聲床,且會(huì)隨之出現(xiàn)BedUseCase 位段。從功能特性來看,條件聲床屬于沉浸式音頻的高級(jí)功能,是為特定聲場(chǎng)組環(huán)境而使用的聲床,當(dāng)該聲床元素為主元素,且條件聲床存在并被激活時(shí),條件聲床應(yīng)(與其他有效聲床元素一起)從對(duì)應(yīng)的揚(yáng)聲器中還音。當(dāng)該聲床元素為子元素,且條件聲床存在并被激活時(shí),條件聲床應(yīng)替代原聲床從對(duì)應(yīng)揚(yáng)聲器中還音。

      ChannelCount 表示BedDefinition 中的聲道總數(shù)量,ChannelID 表示聲床中的一個(gè)唯一聲道,聲道標(biāo)準(zhǔn)名稱參數(shù)及重映射路由目的地遵從SMPTE ST 428-12、ITU-R BS.2051-3 和SMPTE ST 2098-5 中的定義。一個(gè)BedDefinition 元素中的同一個(gè)ChannelID 值不能出現(xiàn)1 次以上。AudioDataID 用于識(shí)別碼流中攜帶的相關(guān)單聲道音頻資產(chǎn),當(dāng)該位段為0時(shí)表示沒有音頻資產(chǎn),IABitstream 編碼器可通過把該字段設(shè)為0 的方式表示靜音音頻資產(chǎn)。

      此外,ChannelGainPrefix 規(guī)定了聲道增益值的編碼方式;ChannelDecorInfoExists 表示是否對(duì)該聲床聲道的音頻資產(chǎn)進(jìn)行去相關(guān)處理;AudioDescription 用于提供音頻資產(chǎn)的描述信息,音頻資產(chǎn)可以描述為基本音頻類型的組合,其代碼值對(duì)應(yīng)的基本描述信息內(nèi)容如表2所示。

      表2 音頻內(nèi)容描述代碼與描述信息內(nèi)容的關(guān)系

      2.3 聲床重映射(BedRemap)元素

      BedRemap 元素是BedDefinition 元素的可選子元素,用于描述如何將聲床從原有配置轉(zhuǎn)換為不同的播放配置。例如,該元素可以提供將9.1 聲床下混到5.1 聲床的相關(guān)信息,以便在5.1 聲場(chǎng)配置的影院中播放內(nèi)容。BedRemap 元素應(yīng)具備明確的目標(biāo)環(huán)境指向,并提供混合系數(shù),從而將BedDefinition 元素中的每個(gè)通道分配到還音系統(tǒng)支持的聲道上。當(dāng)Bed-Remap 元素存在并被激活時(shí),聲音以與重映射參數(shù)一致的方式重映射到渲染器配置中,并通過該特定目標(biāo)環(huán)境所對(duì)應(yīng)的揚(yáng)聲器還音。BedRemap 元素主要包含8類位段,具體映射如圖5所示。

      圖5 聲床重映射(BedRemap)元素

      RemapUseCase 表示激活重映射元素的目標(biāo)聲場(chǎng)組類型,如5.1、7.1DS、9.1OH 等。SourceChannels 對(duì)應(yīng)的聲道數(shù)量應(yīng)為原BedDefinition 元素中指定聲床所包含的聲道數(shù)量。DestinationChannels 對(duì)應(yīng)的聲道數(shù)量應(yīng)等于重映射后所定義的實(shí)際輸出聲道數(shù)量。RemapInfoExists 出現(xiàn)在重映射子塊中,位段值應(yīng)設(shè)置為1,表示需要進(jìn)行重映射處理。DestinationChannelID 表示重映射的聲道標(biāo)識(shí),在每個(gè)BedRemap 元素子塊中具有唯一值,聲道標(biāo)識(shí)及路由目的地遵從SMPTE ST 428-12、ITU-R BS.2051-2 和SMPTE ST 2098-5 中的定義。RemapGainPrefix 規(guī)定了對(duì)重映射增益值編碼的方式,代碼值為0 表示無增益變化,代碼值為1 表示靜音,代碼值為2 表示聲道增益代碼(RemapGain)包含在IABitstream 中,根據(jù)增益代碼設(shè)置增益大小。

      2.4 對(duì)象定義(ObjectDefinition)元素

      ObjectDefinition 元素包含元數(shù)據(jù)和指向音頻資產(chǎn)的指針信息,能夠生成一個(gè)音頻對(duì)象的一幀。為了給對(duì)象元數(shù)據(jù)參數(shù)提供足夠的時(shí)間分辨率,需要將單個(gè)IAFrame 所對(duì)應(yīng)的時(shí)長(zhǎng)進(jìn)行分割,將一幀的聲音內(nèi)容按照一定的時(shí)間間隔劃分為多個(gè)子塊,子塊的數(shù)量、排列順序以及每個(gè)子塊的采樣數(shù)和持續(xù)時(shí)長(zhǎng)如表3所示。

      表3 不同幀率與音頻子塊參數(shù)的對(duì)應(yīng)關(guān)系

      在ObjectDefinition 元素中還包含著區(qū)域(Zone)信息,該信息由碼流中的代碼值來表示。對(duì)于影廳來說,區(qū)域是指影廳不同部分所包含的揚(yáng)聲器合集,一般可分為9 個(gè)區(qū)域,包括銀幕后方三區(qū)域(左中右)、左右墻二區(qū)域、后墻二區(qū)域(左右)、頂層二區(qū)域(左右)。但當(dāng)子元素ObjectZoneDefinition19 被激活時(shí),高級(jí)區(qū)域配置會(huì)取代原有的9個(gè)區(qū)域。

      ObjectDefinition 元素主要包含22 類位段,如圖6所示。該元素可以支持ObjectDefinition 和Object-ZoneDefinition19兩類子元素。

      圖6 對(duì)象定義元素(ObjectDefinition)

      ConditionalObject 表示符合特定聲場(chǎng)環(huán)境時(shí)才會(huì)被激活的音頻對(duì)象,其作用與前面的ConditionalBed基本一致。從功能特性上來看,條件對(duì)象是為特定目標(biāo)環(huán)境而使用的替代音頻對(duì)象,當(dāng)該對(duì)象為主對(duì)象元素,且條件對(duì)象被激活時(shí),條件對(duì)象應(yīng)(與其他有效對(duì)象元素一起)出現(xiàn)在對(duì)應(yīng)的位置上。當(dāng)該對(duì)象為子對(duì)象元素,且條件對(duì)象被激活時(shí),不同坐標(biāo)位置的子音頻對(duì)象將替換主音頻對(duì)象,主音頻對(duì)象應(yīng)不發(fā)聲。

      除了以上元素外,PanInfoExists 表示子塊(Sub Block)中是否存在聲象移動(dòng)信息;ObjectGainPrefix 表示對(duì)象增益值的編碼方法;ObjectPosX、ObjectPosY、ObjectPosZ 規(guī)定了移動(dòng)音頻對(duì)象在三維空間中的位置坐標(biāo);ObjectSnap 位段相當(dāng)于調(diào)整音頻音色與音頻位置優(yōu)先級(jí)關(guān)系的總開關(guān),而ObjectZoneControl 位段相當(dāng)于區(qū)域控制功能的總開關(guān);ObjectSpreadMode 指定了碼流中音頻對(duì)象的擴(kuò)散信息類型,其代碼值對(duì)應(yīng)的標(biāo)識(shí)及功能如表4 所示;ObjectDecorCoefPrefix規(guī)定了對(duì)“去相關(guān)”增益值進(jìn)行編碼的方法。

      表4 擴(kuò)散類型描述

      2.5 對(duì)象區(qū)域定義19(ObjectZoneDefinition19)元素

      ObjectZoneDefinition19 是ObjectDefinition 元素的可選子元素,定義了與ObjectDefinition 中常規(guī)9 區(qū)域定義方式不同的替代分區(qū)定義,將還音環(huán)境區(qū)域擴(kuò)展至影廳內(nèi)19 個(gè)分區(qū)。如果解碼器能夠識(shí)別ObjectZoneDefinition19 參數(shù)位段,并且支持Object-ZoneDefinition19 元素識(shí)別,應(yīng)將音頻信號(hào)區(qū)域設(shè)置關(guān)系與19 個(gè)區(qū)域位置相關(guān)聯(lián),并將主ObjectDefinition 元素中的ZoneGainPrefix 和ZoneGain 值替換為子元素(ObjectZoneDefinition19)中的ZoneGainPrefix 和ZoneGain19值。

      2.6 脈沖編碼調(diào)制音頻(AudioDataPCM)元素與無損壓縮音頻(AudioDataDLC)元素

      AudioDataPCM 與AudioDataDLC 元素都是攜帶實(shí)際音頻內(nèi)容的位段,一般來說也是數(shù)據(jù)量最大的位段。AudioDataPCM 元素主要包含了線性PCM 無壓縮音頻數(shù)據(jù)內(nèi)容,其采樣頻率支持48kHz 或96kHz,量化深度支持16bit 或24bit,該元素用于表示音頻內(nèi)容,會(huì)被聲床和音頻對(duì)象元素所引用。該元素主要包含AudioDataID、PCMData 共2 類位段。AudioDataDLC 元素由聲床元素和音頻對(duì)象元素組成,所攜帶的音頻資產(chǎn)應(yīng)符合編碼規(guī)范,該規(guī)范是為數(shù)字影院而設(shè)計(jì),采用了時(shí)域線性預(yù)測(cè)音頻壓縮方式,對(duì)音頻資產(chǎn)進(jìn)行無損編碼。每個(gè)AudioDataDLC 元素包含一幀單聲道無損壓縮編碼音頻波形,該元素不能用于非整數(shù)幀率的IAFrame。該元素主要包含AudioDataID、DLCSize、DLCSampleRate 等19 類參數(shù)位段。AudioDataPCM 和AudioDataDLC 元素僅用于表示音頻內(nèi)容,解碼過程中會(huì)被聲床和音頻對(duì)象元素所引用,元素本身不涉及功能特性內(nèi)容,在此不做過多分析與解讀。

      2.7 制作工具信息(AuthoringToolInfo)元素和用戶數(shù)據(jù)(UserData)元素

      AuthoringToolInfo 元素用于標(biāo)識(shí)創(chuàng)建沉浸式音頻的供應(yīng)廠商和制作工具(包括版本號(hào)),渲染器在解碼過程中可能會(huì)跳過這個(gè)元素,該元素包含AuthoringToolURI 參數(shù)位段。AuthoringToolURI 是一個(gè)以空字符結(jié)束的ASCII 文本字符串,每個(gè)字符包含在一個(gè)8bit 字節(jié)中。它是由國際互聯(lián)網(wǎng)工程任務(wù)組(IETF)發(fā)布的IETF RFC 2396 定義的統(tǒng)一資源標(biāo)識(shí)符組成,標(biāo)識(shí)內(nèi)容是制作工具供應(yīng)商注冊(cè)的DNS 可解析域名(大多為官方網(wǎng)址),以防止不同供應(yīng)商提供的工具標(biāo)識(shí)符之間的重復(fù)。URI 的其余部分可由制作工具供應(yīng)商以符合RFC 2396的任何方式定義。

      UserData 元素?cái)y帶使用SMPTE UL 標(biāo)識(shí)的未定義用戶數(shù)據(jù),渲染器在解碼過程中可能會(huì)跳過這個(gè)元素。該元素包含UserID、UserDataBytes 兩類參數(shù)位段。UserID 是符合SMPTE ST 298 標(biāo)準(zhǔn)的SMPTE管理通用標(biāo)簽,用于標(biāo)識(shí)創(chuàng)建UserDataBytes 的實(shí)體及其定義,與無法識(shí)別的UserID 相關(guān)聯(lián)的UserData-Bytes可能會(huì)被忽略。

      3 沉浸式音頻標(biāo)準(zhǔn)在電影行業(yè)的發(fā)展與應(yīng)用情況

      3.1 電影沉浸式音頻技術(shù)的全球發(fā)展與應(yīng)用現(xiàn)狀

      沉浸式音頻技術(shù)自2012 年在電影行業(yè)正式商用以來,迅速成為電影行業(yè)的重要發(fā)展方向,國際上有電影電視工程師協(xié)會(huì)(SMPTE)、數(shù)字電影倡導(dǎo)組織(DCI)、跨協(xié)會(huì)數(shù)字電影論壇(ISDCF)等多個(gè)組織參與了沉浸式音頻標(biāo)準(zhǔn)的商討或制定,2018 年發(fā)布的SMPTE ST 2098 系列標(biāo)準(zhǔn)較為重要。在其制定標(biāo)準(zhǔn)的過程中,眾多國際廠商展開了技術(shù)博弈,多家企業(yè)為實(shí)現(xiàn)技術(shù)互操作性和標(biāo)準(zhǔn)化發(fā)展公開并統(tǒng)一了諸如元數(shù)據(jù)類型、聲場(chǎng)組結(jié)構(gòu)、碼流規(guī)范等技術(shù)指標(biāo),同時(shí)最大限度地保留了諸如源母版格式、渲染算法等自有知識(shí)產(chǎn)權(quán)的核心技術(shù)內(nèi)容。

      ISDCF 于2019 年2 月底組織電影行業(yè)技術(shù)公司基于SMPTE ST 2098-2 實(shí)施了初步互插拔測(cè)試(Plug-Fest),測(cè)試過程中的DCP 素材均使用符合SMPTE ST 2098-2 碼流規(guī)范的MXF 數(shù)據(jù)文件來生成。巴可(Barco)、杜比(Dolby)、Xperi/DTS、D-BOX 等廠商參加了測(cè)試,測(cè)試結(jié)果表明現(xiàn)階段有條件實(shí)現(xiàn)沉浸式音頻基礎(chǔ)功能的正確渲染還音,但對(duì)一些高級(jí)功能尚不能實(shí)現(xiàn)互操作。為兼顧大多廠商音頻渲染器現(xiàn)階段的實(shí)際運(yùn)算能力,降低音頻編碼的復(fù)雜程度,控制沉浸式音頻在電影行業(yè)廣泛應(yīng)用的技術(shù)門檻,ISDCF 認(rèn)為需要制定一份約束性文檔,并于2020 年針對(duì)SMPTE ST 2098-2 發(fā)布了沉浸式音頻碼流約束-IAB 應(yīng)用簡(jiǎn)介1(Immersive Audio Bitstream Constrants-IAB Application Profile 1),該文檔包含了對(duì)數(shù)字電影數(shù)據(jù)包(DCP)和合成播放列表(CPL)標(biāo)識(shí)符、聲床聲道、音頻對(duì)象以及元數(shù)據(jù)信息等完整特性的約束建議,逐步引導(dǎo)不同廠商沉浸式音頻系統(tǒng)實(shí)現(xiàn)渲染還音的互操作。

      SMPTE 采納了ISDCF 的建議,于2021 年發(fā)布了SMPTE RDD 57 文檔,該文檔針對(duì)ST 2098-2 的基礎(chǔ)功能提出明確建議,對(duì)現(xiàn)階段用于DCP 的沉浸式音頻碼流提出多項(xiàng)約束性建議,未來會(huì)根據(jù)行業(yè)的發(fā)展情況逐步取消相關(guān)功能性限制,直至完全符合SMPTE ST 2098-2的全部功能要求。

      SMPTE RDD 57 文檔主要對(duì)沉浸式音頻碼流的以下功能做出了限制:

      (1)采樣率限制為48kHz,且不允許使用其他采樣率;

      (2)幀率僅允許是24FPS、25FPS、30FPS、48FPS和60FPS;

      (3)僅允許擁有1 個(gè)聲床,聲床最多包含10 個(gè)聲道,聲場(chǎng)組僅允許采用SMPTE ST 428-12:2013 數(shù)字電影發(fā)行母版通用音頻聲道和聲場(chǎng)組(D-Cinema Distribution Master Common Audio Channels and Soundfield Groups)標(biāo)準(zhǔn)中定義的7.1DS 聲場(chǎng)組,或SMPTE ST 2098-5:2018 數(shù)字電影沉浸式音頻聲道和聲場(chǎng)組(D-Cinema Immersive Audio Channels and Soundfield Groups)標(biāo)準(zhǔn)中定義的9.1OH 聲場(chǎng)組;

      (4)僅允許BedUseCase 參數(shù)位段被設(shè)置為Always Use 的條件聲床存在,并且BedDefinition 不擁有任何子元素,對(duì)同步聲床功能也做出了禁用建議;

      (5)ChannelGainPrefix 與ObjectGainPrefix 位段值只能為0,且不能存在ChannelGain 和ObjectGain 位段,也就是說現(xiàn)階段音頻增益控制功能暫不能包含在碼流中;

      (6)聲床內(nèi)容不允許進(jìn)行去相關(guān)處理,且不允許包 含ChannelDecorCoefPrefix 和ChannelDecorCoef 位段,在對(duì)音頻對(duì)象進(jìn)行去相關(guān)處理時(shí),ObjectDecorCoefPrefix 位段值僅允許為0 或1,不允許包含Object-DecorCoef 位段;

      (7)僅允許ObjectUseCase 參數(shù)位段被設(shè)置為Always Use 的條件對(duì)象存在,并且ObjectDefinition 不能擁有任何子元素;

      (8)如果存在ObjectSnapTolExists 位段,則該位段值應(yīng)為0,不允許包含ObjectSnapTolerance 位段;

      (9)如果存在區(qū)域增益控制信息,ZoneGainPrefix位段值僅允許為0 或1,且僅可存在11 種區(qū)域賦值方式;

      (10)區(qū)域擴(kuò)散中ObjectSpreadMode 位段值應(yīng)始終為2,不允許包含ObjectSpreadX、ObjectSpreadY 和ObjectSpreadZ 這3個(gè)位段;

      (11)不 允 許 包 含ObjectZoneDefinition19 位 段信息;

      (12)不允許包含BedRemap、AuthoringToolInfo 和UserData 這三個(gè)元素。

      3.2 我國電影沉浸式音頻技術(shù)發(fā)展情況

      目前,我國有多家從事電影沉浸式音頻技術(shù)的公司或機(jī)構(gòu),他們通過不斷技術(shù)研發(fā)和創(chuàng)新,為電影制作和放映提供了多種出色的沉浸式音頻解決方案,并在國內(nèi)外影院中得到了一定范圍的應(yīng)用與認(rèn)可。

      中國電影科學(xué)技術(shù)研究所(中央宣傳部電影技術(shù)質(zhì)量檢測(cè)所)始終積極推進(jìn)數(shù)字電影沉浸式音頻技術(shù)發(fā)展,在沉浸式音頻系列技術(shù)標(biāo)準(zhǔn)制定期間就已開始積極關(guān)注和跟蹤相關(guān)進(jìn)展,并在標(biāo)準(zhǔn)發(fā)布后第一時(shí)間對(duì)標(biāo)準(zhǔn)進(jìn)行了研究和解讀,認(rèn)為相關(guān)標(biāo)準(zhǔn)的發(fā)布,為制版和發(fā)行的統(tǒng)一、系統(tǒng)間的兼容提供了技術(shù)和標(biāo)準(zhǔn)指導(dǎo)。我單位技術(shù)研發(fā)團(tuán)隊(duì)對(duì)SMPTE ST 2098 系列標(biāo)準(zhǔn)的兼容性、技術(shù)專利壁壘、國產(chǎn)化可行性等關(guān)鍵問題進(jìn)行了深入研究和探索,為實(shí)現(xiàn)數(shù)字電影沉浸式音頻系統(tǒng)全流程國產(chǎn)化、打破國外技術(shù)壟斷并與國際技術(shù)標(biāo)準(zhǔn)實(shí)現(xiàn)兼容,推動(dòng)沉浸式音頻技術(shù)在行業(yè)制作、發(fā)行、放映等環(huán)節(jié)的應(yīng)用打下了良好的基礎(chǔ)。現(xiàn)階段正在逐步推進(jìn)《數(shù)字電影沉浸式音頻發(fā)行母版技術(shù)要求》《數(shù)字電影沉浸式音頻渲染效果主觀評(píng)價(jià)方法》等相關(guān)沉浸式音頻標(biāo)準(zhǔn)的起草,旨在形成具有我國自主知識(shí)產(chǎn)權(quán)的數(shù)字影院沉浸式音頻標(biāo)準(zhǔn)化體系,提高相關(guān)領(lǐng)域的國際話語權(quán)和行業(yè)競(jìng)爭(zhēng)力,實(shí)現(xiàn)電影還音技術(shù)的高質(zhì)量發(fā)展。

      4 結(jié)語

      沉浸式音頻技術(shù)在影視、音樂、娛樂等諸多行業(yè)的應(yīng)用愈發(fā)普及,儼然已成為當(dāng)今乃至未來一段時(shí)間音頻技術(shù)的發(fā)展方向。對(duì)于電影行業(yè)來說,沉浸式音頻系統(tǒng)已成為高端影廳的標(biāo)配,同時(shí)節(jié)目制作機(jī)構(gòu)也有越來越多的混錄棚通過升級(jí)改造具備了支持電影沉浸式音頻制作生產(chǎn)的硬件環(huán)境,與其相關(guān)的技術(shù)標(biāo)準(zhǔn)也緊隨技術(shù)與市場(chǎng)的發(fā)展不斷修訂更新。

      隨著技術(shù)標(biāo)準(zhǔn)的不斷完善,沉浸式音頻的元數(shù)據(jù)類型以及功能特性將會(huì)逐步統(tǒng)一,音頻內(nèi)容的編解碼方式也會(huì)逐步走向一致,國內(nèi)外不同廠商的沉浸式音頻設(shè)備將會(huì)逐步實(shí)現(xiàn)良好的兼容,從而有效降低影片的制作運(yùn)營成本。標(biāo)準(zhǔn)對(duì)技術(shù)發(fā)展具有規(guī)范促進(jìn)作用,在保證通用性、兼容性和可操作性方面發(fā)揮了積極作用,但同時(shí)也可能會(huì)產(chǎn)生專業(yè)技術(shù)壁壘,使有些公司不得不放棄自研技術(shù),甚至需要為制作符合標(biāo)準(zhǔn)的產(chǎn)品支付高額的專利授權(quán)費(fèi)。

      在現(xiàn)階段電影行業(yè)中,沉浸式音頻技術(shù)仍有著多元化發(fā)展空間,比如目前在母板格式和渲染算法等方面還沒有統(tǒng)一的標(biāo)準(zhǔn)規(guī)范,可以預(yù)見沉浸式音頻未來的主要技術(shù)賽道將從“功能特性創(chuàng)新”逐步轉(zhuǎn)換為“渲染算法創(chuàng)新”。相關(guān)研究人員和從業(yè)人員要找準(zhǔn)切入點(diǎn),積極提升沉浸式音頻技術(shù)領(lǐng)域多元化發(fā)展,將技術(shù)研發(fā)與市場(chǎng)應(yīng)用相結(jié)合,逐步拓展活躍用戶數(shù)量,充分發(fā)掘核心技術(shù)所蘊(yùn)含的商業(yè)價(jià)值,推動(dòng)其形成技術(shù)標(biāo)準(zhǔn),用技術(shù)實(shí)力提升市場(chǎng)博弈能力和行業(yè)競(jìng)爭(zhēng)力,進(jìn)一步推動(dòng)電影行業(yè)高質(zhì)量發(fā)展。?

      猜你喜歡
      聲道碼流音頻
      9.7.8聲道、造價(jià)250余萬 James極品影院賞析
      分布式碼流實(shí)時(shí)監(jiān)控與錄制系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
      數(shù)字電視TS碼流協(xié)議簡(jiǎn)要分析
      視聽(2021年8期)2021-08-12 10:53:42
      為發(fā)燒需求打造的11聲道后級(jí) Orisun(傲力聲)OA-S11
      必須了解的音頻基礎(chǔ)知識(shí) 家庭影院入門攻略:音頻認(rèn)證與推薦標(biāo)準(zhǔn)篇
      基于Daubechies(dbN)的飛行器音頻特征提取
      電子制作(2018年19期)2018-11-14 02:37:08
      實(shí)現(xiàn)從7.2到11.2聲道的飛躍 Onkyo(安橋)TX-RZ830
      音頻分析儀中低失真音頻信號(hào)的發(fā)生方法
      電子制作(2017年9期)2017-04-17 03:00:46
      Pro Tools音頻剪輯及修正
      人間(2015年8期)2016-01-09 13:12:42
      一種比較ASN.1碼流差異的方法
      阳信县| 汶上县| 高台县| 平顺县| 宁国市| 淮阳县| 通化市| 怀来县| 贵德县| 保靖县| 延庆县| 长阳| 齐齐哈尔市| 抚州市| 柳河县| 万全县| 尚义县| 大悟县| 年辖:市辖区| 湄潭县| 平阴县| 凌源市| 宝山区| 罗源县| 通江县| 建昌县| 新闻| 沾化县| 娱乐| 嘉义市| 肇源县| 吉林市| 琼结县| 吉安市| 富蕴县| 怀仁县| 沿河| 灌阳县| 虞城县| 威宁| 廊坊市|