董強(qiáng)國(guó)
(中央宣傳部電影技術(shù)質(zhì)量檢測(cè)所,北京100086)
2012年杜比推出了用于數(shù)字影院的基于對(duì)象的DolbyAtmos全景聲系統(tǒng),創(chuàng)造出更自然的聲場(chǎng),不僅從各個(gè)角度環(huán)繞觀眾,還可滿足人耳反射聲與頭頂?shù)穆曇?,這是5.1與7.1聲道系統(tǒng)望塵莫及的。隨后DTS和Auro3D 等公司推出自己的沉浸式音頻還音系統(tǒng)。近幾年,沉浸式音頻還音系統(tǒng)在國(guó)內(nèi)有了較為快速的增長(zhǎng),國(guó)內(nèi)音頻生產(chǎn)企業(yè)也紛紛推出了自有的沉浸聲還音系統(tǒng),如中國(guó)多維聲(13.1)、WANOS 全景聲系統(tǒng)、音王22.5.8 全景聲系統(tǒng)、飛達(dá)六面聲和Holosound全息聲等。但這些系統(tǒng)的實(shí)現(xiàn)方案各不相同,因缺乏數(shù)字電影沉浸式音頻還音系統(tǒng)還音質(zhì)量的評(píng)價(jià)標(biāo)準(zhǔn),造成數(shù)字電影沉浸聲還音質(zhì)量參差不齊,單對(duì)系統(tǒng)硬件的現(xiàn)有客觀技術(shù)指標(biāo)分析難以判斷沉浸式音頻還音系統(tǒng)整體性能好壞,影院在配置沉浸式音頻還音系統(tǒng)時(shí)難以抉擇,且市場(chǎng)上存在虛假宣傳和惡性競(jìng)爭(zhēng)等現(xiàn)象,使得國(guó)產(chǎn)沉浸式音頻還音系統(tǒng)難以在影院大范圍推廣,阻礙了我國(guó)沉浸式還音技術(shù)國(guó)產(chǎn)化的進(jìn)程。
隨著SMPTE2098系列沉浸式音頻相關(guān)標(biāo)準(zhǔn)的發(fā)布,國(guó)際主要音頻設(shè)備廠商的加入,數(shù)字電影沉浸式音頻系統(tǒng)將成為未來數(shù)字影院的典型配置,沉浸式音頻制版的相對(duì)統(tǒng)一,系統(tǒng)間的互操作和還音效果的一致性將是未來專業(yè)影院沉浸式音頻技術(shù)發(fā)展的主要趨勢(shì)。為了能夠給觀眾帶來更加逼真、震撼的沉浸式音頻還音效果,促進(jìn)行業(yè)技術(shù)發(fā)展,規(guī)范市場(chǎng),本文擬提出一套數(shù)字電影沉浸式音頻還音系統(tǒng)還音效果評(píng)測(cè)方法,希望能夠?yàn)槌两揭纛l還音系統(tǒng)的研發(fā)和影院沉浸式音頻還音系統(tǒng)選型提供技術(shù)保障,旨在推動(dòng)沉浸式音頻還音系統(tǒng)的還音效果向標(biāo)準(zhǔn)化發(fā)展。
數(shù)字電影沉浸式音頻通道應(yīng)由基礎(chǔ)層和高度層組成?;A(chǔ)層為用于5.1和7.1聲場(chǎng)配置的揚(yáng)聲器系統(tǒng)的水平層。放置在基礎(chǔ)層之上的揚(yáng)聲器系統(tǒng)為高度層,通常放置在影院天花處。。
沉浸式音頻還音系統(tǒng)由沉浸式音頻信號(hào)播放模塊、沉浸式音頻處理系統(tǒng)、聲頻功率放大器、揚(yáng)聲器系統(tǒng)和放映環(huán)境組成。沉浸式音頻播放服務(wù)器播放沉浸式音頻文件,沉浸式音頻處理器接收到來自沉浸式音頻播放服務(wù)器傳輸?shù)拇a流信息進(jìn)行解碼,通過渲染系統(tǒng)將元數(shù)據(jù)分配到相應(yīng)的沉浸聲通道。,經(jīng)過均衡和延時(shí)調(diào)節(jié),通過揚(yáng)聲器系統(tǒng)將沉浸聲還原到影廳,沉浸式音頻還音流程如圖1所示。
圖1 沉浸式音頻還音系統(tǒng)
沉浸式音頻渲染是將與畫面相關(guān)的聲道、聲床、對(duì)象和元數(shù)據(jù)適當(dāng)?shù)劁秩镜娇捎玫膿P(yáng)聲器上,使得聲音和相關(guān)的視覺元素在空間上匹配。數(shù)字電影沉浸式音頻渲染技術(shù)主要有基于對(duì)象、基于場(chǎng)景和基于聲道的渲染。
基于聲道的渲染是根據(jù)各聲道對(duì)應(yīng)揚(yáng)聲器系統(tǒng)在影廳安裝的位置信息進(jìn)行渲染的方式。在傳統(tǒng)5.1或7.1系統(tǒng)上,通過添加高度層 (如天花)揚(yáng)聲器系統(tǒng)聲道配置來呈現(xiàn)沉浸聲效果,如Auro3D(11.1)(在7.1聲道的基礎(chǔ)上添加4個(gè)高度層揚(yáng)聲器系統(tǒng))。
基于對(duì)象的渲染不同于傳統(tǒng)5.1或7.1系統(tǒng)所采用的基于錄音聲道的渲染方式,它是一種根據(jù)不同聲音對(duì)象與運(yùn)動(dòng)軌跡實(shí)時(shí)渲染到所創(chuàng)建的聲場(chǎng)中,通常采用以聲床作為基礎(chǔ),對(duì)象為輔助的多聲道實(shí)現(xiàn)方式,利用元數(shù)據(jù)從制作到放映的所有環(huán)節(jié),在影院端完成實(shí)時(shí)渲染,來呈現(xiàn)創(chuàng)作意圖。對(duì)象音頻的核心就是元數(shù)據(jù),通過位置、音量、運(yùn)動(dòng)特性等信息來描述對(duì)象音頻,元數(shù)據(jù)進(jìn)行編碼壓縮后傳輸?shù)戒秩径?,進(jìn)行對(duì)象音頻的還原。對(duì)象音頻的渲染一般是基于Panning,即為對(duì)象音頻如何通過幅度和相位的關(guān)系,通過揚(yáng)聲器系統(tǒng)在影廳還原出帶有方向感的對(duì)象音頻。
基于場(chǎng)景的渲染是指通過重建聲源所需場(chǎng)景的聲場(chǎng)來進(jìn)行的渲染方式。其描述聲場(chǎng)的數(shù)學(xué)模型稱為球面調(diào)和函數(shù),用球面上的聲源產(chǎn)生的聲場(chǎng)來擬合原來聲源產(chǎn)生的聲場(chǎng)。其核心的底層算法是HigherOrderAmbisonic(HOA),將音頻信號(hào)進(jìn)行空間編碼,是用一個(gè)球面上的音源去擬合球內(nèi)的聲場(chǎng)。
因各廠家生產(chǎn)的沉浸式還音系統(tǒng)的實(shí)現(xiàn)方案各不相同,導(dǎo)致國(guó)內(nèi)上映的商業(yè)影片的聲音格式均會(huì)制作多個(gè)沉浸聲版本,如杜比全景聲、Auro3D、中國(guó)多維聲、WANOS全景聲和Holosound全息聲等,還音系統(tǒng)的安裝方式也各不相同,使得沉浸聲還音系統(tǒng)難以在相同的環(huán)境下進(jìn)行還音效果的評(píng)測(cè)。影廳的建聲特性和電聲響應(yīng)特性直接影響影片還音效果呈現(xiàn),為了降低影廳建聲環(huán)境和電聲響應(yīng)特性對(duì)評(píng)測(cè)結(jié)果的影響,進(jìn)行沉浸聲還音系統(tǒng)評(píng)測(cè)時(shí),評(píng)測(cè)房間的建聲環(huán)境和電聲響應(yīng)特性應(yīng)控制在合理的范圍內(nèi)。
良好的聽音環(huán)境應(yīng)確保傳輸頻率特性平滑、無可覺察的聲染色、不應(yīng)出現(xiàn)回聲、顫動(dòng)回聲、聲聚焦和共振等聲學(xué)缺陷?;祉憰r(shí)間 (500Hz)和混響時(shí)間頻率特性要求應(yīng)符合GY/T311―2017 《電影院視聽環(huán)境技術(shù)要求和測(cè)量方法》中的相關(guān)規(guī)定。當(dāng)放映系統(tǒng)設(shè)備、電聲系統(tǒng)設(shè)備、空調(diào)等所有必要工作設(shè)備開啟時(shí),聽音員位置處噪聲級(jí)的限值不宜超過噪聲評(píng)價(jià)曲線NR25值的規(guī)定。室內(nèi)空氣應(yīng)滿足GB/T18883―2002 《室內(nèi)空氣質(zhì)量標(biāo)準(zhǔn)》規(guī)定的標(biāo)準(zhǔn),環(huán)境空氣污染物的濃度限值應(yīng)不高于GB 3095―2012 《環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)》中規(guī)定的二級(jí)限值標(biāo)準(zhǔn)。
數(shù)字電影沉浸式音頻技術(shù)通常是通過控制音頻信號(hào)的幅值和相位來還原出具有方位感和運(yùn)功軌跡的聲音場(chǎng)景,為了降低還音系統(tǒng)的聲壓級(jí)和頻率特性對(duì)沉浸式還音效果的影響,應(yīng)確保各沉浸式還音系統(tǒng)具有較為一致的聲壓級(jí)和頻率響應(yīng)特性,需對(duì)沉浸聲還音系統(tǒng)進(jìn)行B環(huán)調(diào)試。除次低通道外,每通道的基礎(chǔ)調(diào)試聲壓級(jí)應(yīng)為85dB (C),次低通道基礎(chǔ)調(diào)試聲壓級(jí)應(yīng)為91dB (C),電聲響應(yīng)頻率特性應(yīng)符合標(biāo)準(zhǔn)GY/T312―2017 《電影 錄音控制室、室內(nèi)影廳B環(huán)電聲響應(yīng)規(guī)范和測(cè)量》中的相關(guān)規(guī)定。
人耳對(duì)不同頻段聲音的方向感是不同的,低頻段不敏感,高頻段較為敏感,因此,沉浸聲還音效果評(píng)價(jià)時(shí),應(yīng)選擇涵蓋不同頻段、不同發(fā)聲特點(diǎn)的聲源作為評(píng)價(jià)測(cè)試源。沉浸式音頻技術(shù)的核心特征是使得聲音和相關(guān)的視覺元素在空間上匹配,沉浸聲還音需要在有限的揚(yáng)聲器通道上通過沉浸聲渲染技術(shù)擬合出虛擬的聲場(chǎng)的效果,為了評(píng)判沉浸聲還音效果是否能夠真實(shí)反映創(chuàng)作者的意圖,需要對(duì)沉浸聲還音場(chǎng)景進(jìn)行描述,所制作的聲音場(chǎng)景應(yīng)能夠反應(yīng)沉浸式音頻技術(shù)的主要特征。
為了能夠真實(shí)反應(yīng)沉浸式音頻系統(tǒng)對(duì)各種聲音還原性能的能力,沉浸式音頻音質(zhì)主觀評(píng)價(jià)測(cè)試源應(yīng)至少包括語言聲、聲樂、器樂、景觀聲等序列。
語言聲選取用漢語普通話和英語標(biāo)準(zhǔn)語速朗讀的男、女語言聲;聲樂應(yīng)選取無伴奏男低音、女高音或合唱,有傳統(tǒng)樂器伴奏的代表性戲曲唱腔一段;器樂選取應(yīng)涵蓋民樂、交響樂、電子樂、流行音樂等;景觀聲選取自然聲或人類活動(dòng)所造成的聲音,可選用蟲鳥鳴叫聲、雷聲、雨聲、機(jī)車通過的聲音、槍炮聲、玻璃破碎聲等。
制作沉浸式音頻文件所選取的評(píng)價(jià)素材的頻譜應(yīng)豐富多變、音質(zhì)清晰。制作的沉浸聲音頻文件應(yīng)包含豐富的靜態(tài)對(duì)象和動(dòng)態(tài)對(duì)象信息,如特定位置的蟲鳥鳴叫聲、雷鳴和雨聲;動(dòng)態(tài)運(yùn)動(dòng)的飛機(jī)頭頂飛過、汽車側(cè)面駛過的聲音。
沉浸式還音系統(tǒng)生產(chǎn)廠家因采用的沉浸式音頻技術(shù)各不相同,制作的沉浸式音頻文件無統(tǒng)一的技術(shù)規(guī)范,制作方式多樣,無法使用統(tǒng)一的沉浸式音頻文件進(jìn)行還音效果評(píng)測(cè)。為了降級(jí)制版環(huán)節(jié)給評(píng)價(jià)結(jié)果帶來的誤差,需要為評(píng)測(cè)廠家提供詳細(xì)和明確的聲音設(shè)計(jì)場(chǎng)景描述信息,以便沉浸聲評(píng)價(jià)文件的制作。
沉浸聲場(chǎng)景設(shè)計(jì)應(yīng)盡量涵蓋影片中常用的聲音表現(xiàn)形式,重點(diǎn)考察聲音對(duì)象定位的準(zhǔn)確性和運(yùn)動(dòng)軌跡的一致性。一套完整的沉浸聲評(píng)價(jià)場(chǎng)景和描述信息至少應(yīng)包含以下場(chǎng)景:靜止對(duì)象的空間定位是否準(zhǔn)確 (炸彈距離聽音者正前方1m 處爆炸);運(yùn)動(dòng)對(duì)象從觀眾正前方劃過 (飛機(jī)從銀幕最左側(cè)向最右側(cè)勻速飛行,聲音由弱變強(qiáng)然后變?nèi)酰贿\(yùn)動(dòng)對(duì)象從上向下墜落 (飛機(jī)在100m 的高空針對(duì)聽音者投彈,正向下快速的墜落,聲音由弱到強(qiáng));運(yùn)動(dòng)對(duì)象從聽音者側(cè)邊駛過 (汽車從影廳最前方向最后方距離聽音者5m 快速駛過,聲音由弱變強(qiáng)然后變?nèi)酰贿\(yùn)動(dòng)對(duì)象在上空勻速盤旋 (飛機(jī)在距離聽音者高度50m處的上空,圍繞半徑為100m 的圓進(jìn)行飛行,聲音大小一致)。
沉浸式音頻還音技術(shù)的目的是盡可能地還原聲音場(chǎng)景,還原影片更多的聲音細(xì)節(jié),滿足聽者對(duì)聲音的需求。數(shù)字影院沉浸式音頻還音質(zhì)量,要保證清晰度、聲像準(zhǔn)確度、聲音層次感和音畫信息一致性等。沉浸式音頻還音系統(tǒng)音質(zhì)主觀評(píng)價(jià)的目的是獲得被評(píng)價(jià)設(shè)備的某個(gè)音質(zhì)屬性在聽覺心理上的尺度,評(píng)價(jià)的基本要求是設(shè)計(jì)成可控的統(tǒng)計(jì)試驗(yàn)。評(píng)價(jià)尺度由評(píng)價(jià)數(shù)據(jù)的統(tǒng)計(jì)處理得到。
雖然音質(zhì)主觀評(píng)價(jià)本質(zhì)上是主觀的,為了確保對(duì)各種渲染技術(shù)的客觀評(píng)估,可以通過創(chuàng)建特征測(cè)試指標(biāo)以保持測(cè)試參數(shù)的客觀性,評(píng)價(jià)內(nèi)容至少應(yīng)包含解碼后的音質(zhì)、靜態(tài)對(duì)象、動(dòng)態(tài)對(duì)象等特性。
(1)音質(zhì)
音質(zhì)主要判斷聲音原始素材經(jīng)過編碼、解碼、渲染通過還音系統(tǒng)進(jìn)行還音帶來的音質(zhì)損傷程度。評(píng)價(jià)內(nèi)容主要包括音品屬性和環(huán)境聲質(zhì)量。如,音質(zhì)的豐滿度、清晰度、明亮度、柔和度、力度和平衡度和真實(shí)度等。
(2)靜態(tài)對(duì)象
靜態(tài)對(duì)象主要判別被測(cè)系統(tǒng)是否能夠準(zhǔn)確地按照靜態(tài)對(duì)象的描述信息構(gòu)建出沉浸聲的聲場(chǎng)。評(píng)價(jià)內(nèi)容主要包括目標(biāo)物體出現(xiàn)位置的重合度。評(píng)價(jià)素材應(yīng)包含來自不同方向的目標(biāo)對(duì)象,如,來自聽音者前、后、左、右、上、下的目標(biāo)對(duì)象。評(píng)價(jià)介詞易選取目標(biāo)對(duì)象的定位準(zhǔn)確性、響度的一致性和臨場(chǎng)感等。
(3)動(dòng)態(tài)對(duì)象
動(dòng)態(tài)對(duì)象主要判別被測(cè)系統(tǒng)是否能夠準(zhǔn)確地按照動(dòng)態(tài)對(duì)象的描述信息構(gòu)建出沉浸聲的聲場(chǎng)。主要的目標(biāo)是評(píng)估運(yùn)動(dòng)的平滑度和線性度。評(píng)價(jià)內(nèi)容主要包括目標(biāo)物體運(yùn)動(dòng)軌跡匯的重合度和目標(biāo)物體持續(xù)變化的重合度。評(píng)價(jià)素材應(yīng)至少包含水平運(yùn)動(dòng)、垂直運(yùn)動(dòng)和中間運(yùn)動(dòng),位置更新率根據(jù)測(cè)試項(xiàng)目的持續(xù)時(shí)間 (大約10秒)和移動(dòng)方式的長(zhǎng)度 (建議大約一半的房間)進(jìn)行相應(yīng)的選擇。評(píng)價(jià)介詞易選取目標(biāo)對(duì)象運(yùn)動(dòng)軌跡的準(zhǔn)確性、大小變化持續(xù)性、響度準(zhǔn)確性、臨場(chǎng)感、沉浸感等。
(4)對(duì)象增益
對(duì)象增益主要考察被測(cè)系統(tǒng)對(duì)目標(biāo)對(duì)象響度大小的控制能力。此指標(biāo)可以通過測(cè)量獲得。如,使用電平為―20dBFs、頻率為1000Hz的正弦波信號(hào)作為測(cè)試信號(hào),使用渲染功能電平值從0dB~35dB,步進(jìn)為0.5dB改變,在音頻處理器輸出端使用音頻分析儀測(cè)量各通道輸出電平值。
音質(zhì)主觀評(píng)價(jià)可以根據(jù)具體的評(píng)價(jià)任務(wù)設(shè)計(jì)不同的評(píng)分方法。沉浸聲音質(zhì)進(jìn)行評(píng)價(jià)時(shí),建議采用“帶隱藏參考的雙盲三刺激法”,每次只有一位評(píng)價(jià)員從三個(gè)刺激中自行選擇,根據(jù)等級(jí)評(píng)價(jià)素材的描述信息進(jìn)行評(píng)價(jià)。即評(píng)價(jià)素材中包含一個(gè)隱藏參考、一個(gè)已知參考,兩個(gè)錨點(diǎn),剩余評(píng)價(jià)素材為被測(cè)對(duì)象。錨點(diǎn)設(shè)計(jì)時(shí)建議通過對(duì)原始音頻信號(hào)進(jìn)行低通濾波的方式設(shè)計(jì)錨點(diǎn) (如,原始信號(hào)經(jīng)過截止頻率為3.5kHz的低通濾波為低質(zhì)量錨,經(jīng)過截止頻率為7.0kHz的低通濾波為中等質(zhì)量錨)。
沉浸式音頻還音系統(tǒng)對(duì)靜態(tài)對(duì)象和動(dòng)態(tài)對(duì)象表現(xiàn)性能評(píng)價(jià)時(shí),由于無法制作參考源,建議采用“等級(jí)評(píng)價(jià)法”,判斷被測(cè)對(duì)象與文字描述信息的一致性。等級(jí)評(píng)定法適用于對(duì)多個(gè)同類設(shè)備的音質(zhì)進(jìn)行綜合評(píng)價(jià)的場(chǎng)合。這是一種具有分級(jí)意義的評(píng)價(jià)方法,需要對(duì)被評(píng)價(jià)設(shè)備的音質(zhì)水平做出具有一致性的等級(jí)劃分。評(píng)價(jià)素材中包含兩個(gè)錨點(diǎn)和被測(cè)信號(hào),參考源為目標(biāo)對(duì)象的描述信息。靜態(tài)對(duì)象評(píng)測(cè)時(shí),建議通過修改揚(yáng)聲器系統(tǒng)各通道的延時(shí)的方式設(shè)計(jì)錨點(diǎn) (選取任意三組所使用的揚(yáng)聲器系統(tǒng),延時(shí)增加50ms為低質(zhì)量錨,延時(shí)增加20ms為中等質(zhì)量錨)。動(dòng)態(tài)對(duì)象評(píng)測(cè)時(shí),建議通過修改渲染對(duì)象的運(yùn)動(dòng)軌跡和位置更新率等方式設(shè)計(jì)錨點(diǎn) (如,對(duì)被測(cè)對(duì)象運(yùn)動(dòng)軌跡準(zhǔn)確性評(píng)價(jià)時(shí),可調(diào)整渲染系統(tǒng)的位置更新速率為1.5Hz作為低質(zhì)量錨,位置更新速率為1Hz作為中等質(zhì)量錨)。
沉浸聲音質(zhì)評(píng)價(jià)時(shí)要求評(píng)價(jià)員按照連續(xù)五級(jí)損傷標(biāo)度,分別評(píng)價(jià)隱藏參考和被測(cè)對(duì)象相對(duì)于已知參考的損傷程度。五級(jí)損傷標(biāo)度如圖2所示。
圖2 五級(jí)損傷評(píng)價(jià)標(biāo)度
表1 靜態(tài)對(duì)象五級(jí)評(píng)分等級(jí)標(biāo)度
20聲像定位與描述的定位信息差異可察覺,令人非常不悅;目標(biāo)對(duì)象響度的控制與描述的定位信息差異可察覺,令人非常不悅。
沉浸式音頻還音系統(tǒng)對(duì)靜態(tài)對(duì)象和動(dòng)態(tài)對(duì)象表現(xiàn)性能評(píng)價(jià)時(shí),等級(jí)的設(shè)定建議采用奇數(shù)個(gè)等級(jí),通常設(shè)立五個(gè)等級(jí),靜態(tài)對(duì)象的評(píng)分等級(jí)標(biāo)度如表1所示,動(dòng)態(tài)對(duì)象的評(píng)分等級(jí)標(biāo)度如表2所示。
表2 動(dòng)態(tài)對(duì)象五級(jí)評(píng)分等級(jí)標(biāo)度
沉浸式音頻還音系統(tǒng)音質(zhì)主觀評(píng)價(jià)時(shí),受聲學(xué)環(huán)境和揚(yáng)聲器頻率響應(yīng)特性的影響較大,為了能夠使得各被測(cè)系統(tǒng)間的評(píng)測(cè)結(jié)果具有可比性,本文針對(duì)沉浸式音頻還音系統(tǒng)的特點(diǎn)對(duì)建聲環(huán)境和B環(huán)電聲響應(yīng)特性進(jìn)行了規(guī)定,通過對(duì)沉浸式音頻技術(shù)特點(diǎn)的分析,提出了沉浸式音頻還音系統(tǒng)評(píng)價(jià)素材制作、評(píng)價(jià)指標(biāo)、評(píng)價(jià)方法和評(píng)價(jià)尺度的基本要求。希望能夠?yàn)槌两揭纛l還音系統(tǒng)的評(píng)測(cè)提供一種具有通用性、可比性和公平性的評(píng)價(jià)手段,為沉浸式音頻還音系統(tǒng)的研發(fā)和設(shè)備選型提供技術(shù)保障,旨在推動(dòng)沉浸式音頻還音系統(tǒng)的還音效果向一致化和標(biāo)準(zhǔn)化發(fā)展。