易凱靈 謝菠蓀 朱俊 趙童
(華南理工大學(xué) 物理系 聲學(xué)研究所,廣東 廣州 510640)
人類聽覺定位是多因素綜合作用下的結(jié)果。其中低頻雙耳時間差(ITD)、雙耳聲級差(ILD)是聲源側(cè)向定位的主要因素;頭部轉(zhuǎn)動引起雙耳聲壓的變化(動態(tài)因素)、頭部和耳廓等生理結(jié)構(gòu)對聲波散射引起耳道聲壓頻譜的改變是垂直和前后定位的主要因素。不同因素提供的定位信息是有冗余的,部分因素已足以提供合適的定位信息[1- 2]。
空間聲的目的是重放聲音的空間信息,以產(chǎn)生各種期望的空間聽覺事件。它在家用聲重放、虛擬現(xiàn)實等領(lǐng)域有重要應(yīng)用??臻g聲一般是將揚聲器布置在水平面或三維空間的若干離散方向上。利用多聲源合成定位的心理聲學(xué)原理,將信號同時饋給一對或多個揚聲器,通過改變揚聲器信號的關(guān)系(如相對振幅或延時),產(chǎn)生適當(dāng)?shù)穆犛X定位因素,從而產(chǎn)生非揚聲器方向上的虛擬源[3]。空間虛擬源效果由揚聲器布置和信號饋給法共同決定。給定揚聲器布置,可以有多種不同類型的信號饋給法。設(shè)計和評價一種信號饋給法的關(guān)鍵是它能否產(chǎn)生期望的聽覺定位因素,同時對聽者頭部的移動有一定的穩(wěn)定性。
近年來,三維空間聲技術(shù)快速發(fā)展,國際上已發(fā)展了多種不同的揚聲器布置方法,如9.1通路、11.1通路、22.2通路等揚聲器布置[4- 6],并發(fā)展了幾種不同類型的信號饋給法,如分立—對信號饋給法、基于振幅矢量的信號饋給法(VBAP)[7]、全局Ambisonics信號饋給法[8]等。近年所發(fā)展的面向目標(biāo)的空間聲重放技術(shù),如國際標(biāo)準(zhǔn)化組織(ISO)和國際電工委員會(IEC)的MPEG-H 3D標(biāo)準(zhǔn),其揚聲器布置和信號饋給法更是靈活和開放[9]。對現(xiàn)有的各種揚聲器布置和信號饋給法也有理論分析和實驗驗證[3,10- 12],結(jié)果表明部分揚聲器布置和信號饋給法有一定優(yōu)勢,也有一定的局限性。例如,劉陽等[10]系統(tǒng)地分析了傳統(tǒng)的全局Ambisonics聲重放系統(tǒng)的穩(wěn)定性問題,包括利用條件數(shù)分析了揚聲器布置的穩(wěn)定性,通過平均信號失真比SDR分析了信號饋給的穩(wěn)定性。
由于聽覺垂直定位的機理和水平面的側(cè)向定位機理不同,在設(shè)計和分析三維空間聲信號饋給法時必須充分考慮這一點。在最近的研究中,筆者等提出了產(chǎn)生前方垂直方向虛擬源的揚聲器信號饋給法,稱為“局域Ambisonics”信號饋給法[13],并已證明對理想傾聽位置,該方法可以產(chǎn)生期望的垂直定位動態(tài)因素,較傳統(tǒng)的分立—對信號饋給法有較大的改進(jìn);同時也避免了全局Ambisonics信號饋給法主要限制于揚聲器均勻布置的問題。
由于在實際傾聽過程中,聽者的頭部平移會導(dǎo)致雙耳聲壓及相應(yīng)的定位因素的變化,從而影響合成虛擬源的準(zhǔn)確性和穩(wěn)定性,因此有必要分析信號饋給法所產(chǎn)生的定位因素對頭部平移的穩(wěn)定性問題。為此,本文將進(jìn)一步分析局域Ambisonics信號饋給法中,頭部移動對其定位因素產(chǎn)生的影響,并用心理聲學(xué)實驗驗證該信號饋給法的穩(wěn)定性。
采用以頭部中心為原點的逆時針球坐標(biāo)系統(tǒng),空間位置用(r,θ,φ)表示,其中0 ≤r<+∞表示與頭中心間的距離;-180°<θ≤180°和-90°≤φ≤90°分別為方位角和仰角。φ=-90°、0°、90°分別表示正下方、水平、正上方。θ=0°、90°、180°分別表示前方、左方、后方。
局域Ambisonics信號饋給法適用于布置在特定垂直面的3個揚聲器合成垂直方向虛擬源的情況。與一些常用的三維空間聲的揚聲器布置如22.2通路聲的布置相吻合[5- 6]。如圖1所示,3個揚聲器布置在同一球面,具有固定的方位角θA,其中一揚聲器布置在水平面,另外兩揚聲器仰角作上下對稱布置。因而3個揚聲器的方向分別為(θA,-φA)、(θA,0°)、(θA,φA)。對于(θA,φS)方向的目標(biāo)聲源,在局域Ambisonics信號饋給法中,為了產(chǎn)生固定方位角θA、不同目標(biāo)仰角φS方向的目標(biāo)虛擬源,3個揚聲器的信號振幅或增益A0、A1、A2都表示為仰角φS的零階和一階諧波的線性組合[13]:
(1)
其中:
(2)
圖1 局域Ambisonics合成定位的揚聲器布置
是信號振幅中的總歸一化因子。Atotal與目標(biāo)仰角φS有關(guān),但由于感知虛擬源方向是由各揚聲器信號的相對振幅而不是絕對振幅決定的,所以最后的感知虛擬源方向與總歸一化因子無關(guān)。歸一化因子選擇式(2)的原因是使得三個揚聲器信號的總功率守恒:
(3)
圖2給出了式(1)的揚聲器信號振幅與目標(biāo)虛擬源仰角φS的關(guān)系。其中取φA=45°,信號振幅的最大值已歸一化為單位值。筆者等[13]最近已經(jīng)從理論和實驗上證實,對固定在中心位置的聽者,該信號饋給法可以產(chǎn)生合適的低頻雙耳時間差(ITD)及其隨頭部轉(zhuǎn)動的動態(tài)變化(ΔITD),因而產(chǎn)生合適的低頻方位角定位和垂直仰角定位因素,可產(chǎn)生3個揚聲器之間的穩(wěn)定的垂直虛擬源。在中垂面揚聲器布置θA=0°的情況下,甚至可以產(chǎn)生超出揚聲器布置范圍之外的虛擬源。所以以下將集中分析聽者偏離中心位置后定位因素及虛擬源位置的穩(wěn)定性問題。
圖2 φA= 45°時,式(1)中局域Ambisonics揚聲器信號振幅與目標(biāo)虛擬源仰角φS的關(guān)系
理想情況下,空間聲重放應(yīng)該能產(chǎn)生和目標(biāo)聲源一致的主要定位因素;并且當(dāng)聽者頭部偏離理想傾聽位置一定范圍時,這些定位因素應(yīng)具有較好的穩(wěn)定性。對文中涉及的局域Ambisonics信號饋給法產(chǎn)生垂直方向虛擬源的情況,主要涉及定位因素之一是低頻雙耳時間差(ITD),這是虛擬源側(cè)向定位的主要定位因素。另一個定位因素是動態(tài)因素,也就是頭部轉(zhuǎn)動引起的雙耳時間差的變化。過去的研究[2- 3]指出,頭部繞垂直軸轉(zhuǎn)動引起的ITD變化提供了前后定位和聲源上下偏離水平面的信息;頭部繞前后軸轉(zhuǎn)動引起的ITD變化進(jìn)一步提供了分辨上下的信息。而頭部繞左右軸轉(zhuǎn)動不會引起ITD的變化,不提供定位信息。因此,對合成定位因素穩(wěn)定性的分析,就是分析頭部偏離理想傾聽位置前后,聲重放產(chǎn)生的雙耳時間差(ITD)及其隨頭部繞垂直軸和前后軸轉(zhuǎn)動的變化,是否能夠和目標(biāo)聲源的情況保持一致或近似一致。
對于相對聽者頭中心位置為(rS,θS,φS)的目標(biāo)點聲源,雙耳聲壓由下式計算[2]:
Pα(rS,θS,φS,f)=Hα(θS,φS,f)P0(f)
(4)
式中,Hα(θS,φS,f)表示(θS,φS)方向的頭相關(guān)傳輸函數(shù)(HRTFs),α=L、R分別代表左、右耳,f表示頻率。上式已經(jīng)假定聲源距離rS>1.0 m(遠(yuǎn)場距離),HRTFs近似與距離無關(guān)。而頭部移開后原頭中心處的自由場聲壓為
(5)
對于局域Ambisonics聲重放方法,雙耳處的聲壓由所有揚聲器的聲壓線性疊加而成,有
(6)
式中:Hα(θi,φi,f)是第i個揚聲器到雙耳的一對HRTFs;(ri,θi,φi)是第i個揚聲器相對頭部中心的位置,且同樣假定揚聲器位于遠(yuǎn)場的距離;而A0、A1、A2是由式(1)、(2)所給出的揚聲器信號振幅。
當(dāng)頭部轉(zhuǎn)動后,式(4)-(6)的目標(biāo)聲源或揚聲器相對聽者的方向發(fā)生改變。頭部有三個轉(zhuǎn)動自由度,其中頭部繞上下和前后軸兩個自由度轉(zhuǎn)動引起雙耳聲壓(主要是低頻雙耳時間差)的變化是前后和垂直定位的影響因素。當(dāng)頭部平移后,式(4)-(6)的目標(biāo)聲源或揚聲器相對聽者的方向和距離也發(fā)生變化。因而在式(4)-(6)的計算中,應(yīng)改變聲源或揚聲器相對頭部中心的位置參數(shù)。當(dāng)然,可以假定頭部平移后聲源相對頭部的距離仍在遠(yuǎn)場范圍,因而HRTFs仍然與距離無關(guān)。頭部轉(zhuǎn)動或平移后雙耳聲壓變化的詳細(xì)計算方法可參考文獻(xiàn)[2,13- 14]。
無論對于目標(biāo)聲壓還是聲重放聲壓,雙耳時間差I(lǐng)TD可以從雙耳聲壓計算得到。有多種方法計算雙耳時間差I(lǐng)TD[2],這里通過最大化雙耳聲壓互相關(guān)函數(shù)進(jìn)行計算:
ψLR()=
(7)
(8)
式中,計算ITD的頻率上限F選定為1.5 kHz。
對合成定位因素穩(wěn)定性分析的方法步驟如下:
(1)對理想中心位置聽者,頭部面向正前方時,計算出目標(biāo)聲源產(chǎn)生的ITD。當(dāng)頭部分別繞z、x軸轉(zhuǎn)動一定角度后,重新計算出ITD。比較頭部轉(zhuǎn)動前后的結(jié)果,得到頭部轉(zhuǎn)動引起的目標(biāo)聲源ITD的變化,也就是目標(biāo)聲源的動態(tài)定位因素。
(2)對理想中心位置聽者,頭部面向正前方時,計算出(局域Ambisonics)聲重放產(chǎn)生的ITD。當(dāng)頭部分別繞z、x軸轉(zhuǎn)動一定角度后,重新計算出ITD。比較頭部轉(zhuǎn)動前后的結(jié)果,得到頭部轉(zhuǎn)動引起的聲重放的ITD的變化,也就是聲重放動態(tài)定位因素。
(3)比較步驟(1)、(2)得到的結(jié)果,可分析中心位置聽者的情況,了解聲重放產(chǎn)生的ITD及其隨頭部轉(zhuǎn)動的動態(tài)變化與目標(biāo)聲源的情況是否匹配。
(4)當(dāng)聽者頭部平移而偏離中心位置,但頭部仍面向前方時(注意:是面向新傾聽位置的前方),重復(fù)步驟(1)的計算,得到目標(biāo)聲源的ITD。而當(dāng)頭部分別繞z、x軸轉(zhuǎn)動一定角度后,也重復(fù)步驟(1)的計算,得到相應(yīng)的ITD。比較頭部轉(zhuǎn)動前后的結(jié)果,得到聽者頭部平移后,頭部轉(zhuǎn)動引起的目標(biāo)聲源ITD的變化,也就是聽者頭部偏離中心位置后目標(biāo)聲源的動態(tài)定位因素。
(5)當(dāng)聽者頭部平移而偏離中心位置,但頭部仍面向新傾聽位置的前方時,重復(fù)步驟(2)的計算,得到聲重放的ITD。而當(dāng)頭部分別繞z、x軸轉(zhuǎn)動一定角度后,也重復(fù)步驟(2)的計算,得到相應(yīng)的ITD。比較頭部轉(zhuǎn)動前后的結(jié)果,得到聽者頭部平移后,頭部轉(zhuǎn)動引起的聲重放ITD的變化,也就是聽者頭部偏離中心位置后聲重放的動態(tài)定位因素。
(6)比較步驟(4)、(5)得到的結(jié)果,可分析聽者頭部平移后,聲重放產(chǎn)生的ITD及其隨頭部轉(zhuǎn)動的動態(tài)變化與目標(biāo)聲源的情況是否仍然匹配。
(7)比較步驟(3)和(6)的結(jié)果,可分析頭部平移引起的聲重放定位因素的穩(wěn)定性。
必須注意,上面分析中,頭部轉(zhuǎn)動是引入動態(tài)定位因素所必須的。而頭部平移表示偏離理想傾聽位置,目的正是要分析頭部平移引起的定位因素的穩(wěn)定性。
在最近的研究[13]中,已經(jīng)分析了頭部中心處于理想傾聽位置(即坐標(biāo)原點)時,局域Ambisonics聲重放的ITD及其隨頭部轉(zhuǎn)動的動態(tài)變化與目標(biāo)聲源間的差異;結(jié)果表明兩者基本一致,因而該方法可以產(chǎn)生期望的垂直定位動態(tài)因素。下面將進(jìn)一步分析,聽者頭部平移而偏離中心位置后,局域Ambisonics聲重放的ITD及其隨頭部轉(zhuǎn)動的動態(tài)變化與目標(biāo)聲源間的差異。
在以下的分析中,3個揚聲器分別布置于前方中垂面θA=0°和前方垂直面θA=-30°,并取φA=45°。使用無軀干但包含耳廓的KAEMAR人工頭(DB-060/061)HRTF數(shù)據(jù)。HRTF由激光掃描KAEMAR人工頭的幾何表面,并通過邊界元計算得到[15]。HRTF的頻率分辨率、角度分辨率分別為50 Hz、1°。給定頭部平移方向為圖1所示的+y軸(正左)方向,平移距離為0.20 m。給定頭部繞z軸由前向右作小幅方位角旋轉(zhuǎn)Δθ=15°,繞x軸由上向右作小幅傾斜角旋轉(zhuǎn)Δγ=15°。目標(biāo)聲源的仰角以5°的間隔從-90°均勻增加至90°。
計算結(jié)果表明,對于聽者頭部向正左方向平移的情況,頭部旋轉(zhuǎn)前,局域Ambisonics聲重放和目標(biāo)聲源間的ITD絕對誤差在所有仰角范圍內(nèi)不大于39 μs??紤]對頭部平移最為敏感的正前方聲源,即使是39 μs的ITD誤差對應(yīng)的感知方位角變化也就是4°左右,不超過5°[3]。因此,局域Ambisonics聲重放合成虛擬聲源的感知方位角和目標(biāo)聲源基本一致。
圖3給出了聽者頭部向+y方向平移0.20 m后,對于局域Ambisonics聲重放和目標(biāo)聲源兩種情況,頭部轉(zhuǎn)動引起的動態(tài)定位因素隨目標(biāo)聲源仰角的變化。
圖3(a)給出了頭部繞z軸旋轉(zhuǎn)Δθ=15°時,局域Ambisonics聲重放和目標(biāo)聲源的ITD變化量(ΔITD)隨目標(biāo)聲源仰角的變化。從圖3(a)中可以看出,局域Ambisonics聲重放和目標(biāo)聲源的ΔITD隨目標(biāo)聲源仰角的變化是相一致的,分別在φS=5°、-5°附近達(dá)到最大,并隨著仰角偏離水平面而逐漸減小。因此,對于局域Ambisonics聲重放,聽者頭部向+y方向平移0.20 m后,由頭部繞z軸旋轉(zhuǎn)而引起的ΔITD與目標(biāo)聲源的情況一致,它們之間的絕對誤差不大于6 μs,小于聽覺可分辨閾值[1]。頭部繞z軸旋轉(zhuǎn)引起的ΔITD是感知虛擬源在垂直方向偏離水平面的定位因素。因而,局域Ambisonics聲重放產(chǎn)生的這種定位因素對于頭部平移是穩(wěn)定的。
圖3 前方中垂面θA=0°揚聲器布置下,局域Ambisonics合成聲源及目標(biāo)聲源的ΔITD
總體上,對于前方中垂面θA=0°的情況,頭部平移后,至少在目標(biāo)仰角-60°≤ φS≤ 60°范圍內(nèi),局域Ambisonics聲重放的ITD及其隨頭部轉(zhuǎn)動引起的ITD變化是穩(wěn)定的。對于目標(biāo)聲源仰角在-60°≤ φS≤ 60°范圍以外,由頭部繞垂直軸轉(zhuǎn)動引起ITD變化仍然與目標(biāo)聲源一致;但由頭部繞前后軸轉(zhuǎn)動引起的ITD變化與目標(biāo)聲源有差異或不一致。
計算結(jié)果表明,對于聽者頭部向正左方向平移的情況,頭部旋轉(zhuǎn)前,局域Ambisonics聲重放和目標(biāo)聲源間的ITD絕對誤差在所有目標(biāo)仰角范圍內(nèi)不大于47 μs。考慮對頭部平移最為敏感的正前方聲源,即使是47 μs的ITD誤差對應(yīng)的感知方位角變化也就是5°左右[3]。因此,局域Ambisonics合成虛擬聲源的感知方位角和目標(biāo)聲源是一致的。
圖4給出了聽者頭部向+y方向平移0.20 m后,對于局域Ambisonics聲重放和目標(biāo)聲源兩種情況,頭部轉(zhuǎn)動引起的動態(tài)定位因素隨目標(biāo)聲源仰角的變化。
圖4 前方中垂面θA=-30°揚聲器布置下,局域Ambisonics合成聲源及目標(biāo)聲源的ΔITD
圖4(a)給出了頭部繞z軸旋轉(zhuǎn)Δθ=15°時,局域Ambisonics聲重放和目標(biāo)聲源的ITD變化量(ΔITD)隨目標(biāo)聲源仰角的變化。從圖4(a)中可以看出,局域Ambisonics聲重放和目標(biāo)聲源的ΔITD隨目標(biāo)聲源仰角的變化至少在-45°≤φS≤ 60°范圍內(nèi)是相一致的,分別在φS=0°、-5°附近達(dá)到最大,并隨著仰角偏離水平面而逐漸減小。因此,對于局域Ambisonics聲重放,聽者頭部向+y方向平移0.20 m后,由頭部繞z軸旋轉(zhuǎn)而引起的ΔITD與目標(biāo)聲源的情況基本一致,它們之間的絕對誤差不大于5 μs,小于聽覺可分辨閾值[1]。因而,局域Ambisonics聲重放產(chǎn)生的這種定位因素對于頭部平移是穩(wěn)定的。
圖4(b)給出了頭部繞x軸旋轉(zhuǎn)Δγ=15°時,局域Ambisonics聲重放和目標(biāo)聲源的ITD變化量(ΔITD)隨目標(biāo)聲源仰角的變化。從圖4(b)中可以看出,局域Ambisonics聲重放和目標(biāo)聲源的ΔITD至少在-75°≤φS≤ 45°范圍內(nèi)是一致的,它們之間的絕對誤差不大于10 μs,小于聽覺可分辨閾值[1]。在水平面正前方φS=0°時它們?nèi)≈禐?,并且當(dāng)仰角上下對稱時ΔITD的正負(fù)號相反。因此,對于局域Ambisonics聲重放,聽者頭部向+y方向平移0.20 m后,由頭部繞x軸旋轉(zhuǎn)而引起的ΔITD與目標(biāo)聲源的情況一致。因而,局域Ambisonics聲重放產(chǎn)生的這種定位因素對于頭部平移也是穩(wěn)定的。
總體上,對于前方垂直面θA=-30°的情況,頭部平移后,至少在目標(biāo)仰角-45°≤φS≤ 45°范圍內(nèi),局域Ambisonics聲重放的ITD及其隨頭部轉(zhuǎn)動的變化是穩(wěn)定的。
心理聲學(xué)實驗檢驗局域Ambisonics聲重放中,聽者偏離理想傾聽位置后的虛擬源垂直定位。
實驗包括兩個部分:
(1) 揚聲器布置于前方中垂面θA=0°,3個揚聲器分別位于(0°,-45°)、(0°,0°)、(0°,45°)方向;被試的頭部相對于坐標(biāo)原點向+y方向平移0.20 m。
(2) 揚聲器布置于前方垂直面θA=-30°,3個揚聲器分別位于(-30°,-45°)、(-30°,0°)、(-30°,45°)方向;被試的頭部相對于坐標(biāo)原點向+y方向平移0.20 m。
實驗在混響時間為0.15 s、本底噪聲不大于30 dBA的聽音室內(nèi)進(jìn)行,揚聲器布置在半徑為1.45 m的球面。目標(biāo)虛擬源的仰角以15°的間隔從-90°均勻增加至90°,共13種目標(biāo)仰角。實驗信號包括可聽全頻帶粉紅噪聲、截止頻率為1.5 kHz的低通濾波粉紅噪聲以及管弦樂(節(jié)選自J Strauss的藍(lán)色多瑙河)3種信號。信號長度為10 s。重放聲壓級約為75 dB。
為了幫助被試報告感知到的虛擬源方向,在固定揚聲器的金屬框架上構(gòu)建了一組方位角間隔為5°的水平標(biāo)記和兩組分別位于中垂面θA=0°和前方垂直面θA=-30°的垂直標(biāo)記,這兩組標(biāo)記的仰角間隔均為5°。被試判斷感知到的虛擬源方向,用木棒指向感知到的虛擬聲源,然后口頭報告感知到的虛擬聲源方向。在判斷和使用木棒指向虛擬聲源的過程中,要求被試閉眼并鼓勵被試?yán)@z軸、x軸旋轉(zhuǎn)頭部,隨后允許被試睜開眼睛以確認(rèn)及報告指向的方向。與以往用電磁跟蹤儀(Polhemus FasTrak)監(jiān)測頭部旋轉(zhuǎn)的實驗相似,被試的頭部繞z軸旋轉(zhuǎn)的角度約為±10°~±25°;繞x軸旋轉(zhuǎn)的角度約為±10°~±20°[16]。共有8名被試(男5名,女3名,聽力正常)參與了本次實驗。由于所有被試均為聲學(xué)專業(yè)的研究生,且已有一定的心理聲學(xué)定位實驗的經(jīng)驗,除對被試進(jìn)行一定的指導(dǎo)外,無需對被試進(jìn)行進(jìn)一步的訓(xùn)練。對于每個被試,實驗被分成6組,分別在兩天內(nèi)完成,一天完成3組實驗。每組實驗的內(nèi)容由給定的1個垂直平面(中垂面θA=0°或前方垂直面θA=-30°)和13種目標(biāo)仰角所決定,共包括1個垂直平面×13種目標(biāo)仰角×3次重復(fù)=39個信號。在每組實驗中,實驗信號以隨機目標(biāo)仰角的順序呈現(xiàn)。因此,在每種情況下共有3次重復(fù)×8個被試=24個判斷。在一天的時間里,每組實驗之間有半個小時的休息時間。
實驗結(jié)果首先以散點圖的形式表示,最終結(jié)果被表示為所有24個判斷的平均感知方位角和仰角以及相應(yīng)的標(biāo)準(zhǔn)差。原始的感知聲源仰角中可能存在上下混亂,這里使用一種常見的方法[17]來處理。當(dāng)上下混亂率較低時,在計算感知聲源仰角的平均值和標(biāo)準(zhǔn)差之前,通過相對于水平面的反演來校正感知聲源的仰角,同時計算混亂率。觀察到的數(shù)據(jù)中,可能存在離群值。計算感知虛擬源仰角的平均值及其標(biāo)準(zhǔn)差前,先對反演后的數(shù)據(jù)作了數(shù)據(jù)檢驗及離群值剔除。離群值檢驗有多種準(zhǔn)則,文中采用格拉布斯準(zhǔn)則。
平均感知方位角介于-5°到+5°之間。因此,對于所有不同的實驗信號及不同仰角的情況,感知的虛擬聲源位于前方中垂面θA=0°附近,這里略去了平均感知方位角的實驗結(jié)果圖。
3種信號的定位實驗結(jié)果類似。以粉紅噪聲實驗信號的實驗結(jié)果為例,圖5(a)給出了其原始感知聲源仰角的散點圖。從圖5(a)中可以看出,在-60°≤φS≤60°范圍內(nèi),大多數(shù)感知聲源仰角與目標(biāo)聲源仰角遵循相同的趨勢。此外還觀察到了一些上下混亂現(xiàn)象。計算結(jié)果表明,粉紅噪聲、低通濾波粉紅噪聲和管弦樂的上下混亂百分率分別為9.6%、8.3%和8.6%。與自由場中真實聲源的定位結(jié)果相比,上下混亂率并不高[17]。離群值檢驗的結(jié)果表明,對于粉紅噪聲實驗信號,實驗數(shù)據(jù)中沒有離群值;對于低通粉紅噪聲實驗信號,僅在φS=0°時有一個離群值,為36°;對于管弦樂實驗信號,僅在φS=0°時有一個離群值,為-18°。
圖5 中垂面θA=0°揚聲器布置下感知到的虛擬聲源仰角
圖5(b)給出了3種實驗信號和不同目標(biāo)虛擬源仰角對應(yīng)的剔除離群值后感知虛擬源仰角的平均值及其標(biāo)準(zhǔn)差。從圖5(b)中可以看出,當(dāng)目標(biāo)虛擬源仰角位于-60°≤φS≤60°之外時,平均感知虛擬源仰角位于揚聲器位置(φ0=-45°、φ2=45°)附近且標(biāo)準(zhǔn)差較大,因此感知到的虛擬源仰角是沒有意義的。當(dāng)目標(biāo)虛擬源仰角在-60°≤φS≤60°范圍內(nèi)時,3種實驗信號對應(yīng)的平均感知虛擬源仰角與目標(biāo)虛擬仰角基本一致。這與3.1節(jié)中理論分析的結(jié)果相一致。當(dāng)目標(biāo)聲源仰角φS= -60°或60°時,3種實驗信號對應(yīng)的平均感知聲源仰角趨向于靠近揚聲器位置(φ0=-45°、φ2=45°),尤其是φS=-60°的情況。這與理想傾聽位置的實驗結(jié)果不同[13]。對理想傾聽位置,φS=±60°的感知虛擬源仰角與目標(biāo)仰角是一致的。由于φS=±60°已超出了揚聲器布置的范圍±45°,屬于界外虛擬源的情況。因而界外虛擬源對頭部的平移是不穩(wěn)定的。
總體上,上述實驗結(jié)果表明,在中垂面θA=0°,當(dāng)聽者偏離理想傾聽位置后,至少在揚聲器布置的±45°目標(biāo)仰角范圍內(nèi),局域Ambisonics重放的垂直虛擬源對頭部平移是穩(wěn)定的。
平均感知方位角介于-25°到-35°之間。因此,對于所有不同的實驗信號及不同仰角的情況,感知的虛擬聲源位于前方中垂面θA=-30°附近,這里略去了平均感知方位角的實驗結(jié)果圖。
3種信號的定位實驗結(jié)果類似。以粉紅噪實驗信號的實驗結(jié)果為例,圖6(a)給出了其原始感知聲源仰角的散點圖。從圖6(a)中可以看出,在-60°≤φS≤60°范圍內(nèi),大多數(shù)感知聲源仰角與目標(biāo)聲源仰角遵循相同的趨勢。此外還觀察到了一些上下混亂現(xiàn)象。計算結(jié)果表明,粉紅噪聲、低通濾波粉紅噪聲和管弦樂的上下混亂百分率分別為11.2%、9.3%和8.6%。與自由場中真實聲源的定位結(jié)果相比,上下混亂率并不高[17]。離群值檢驗的結(jié)果表明,對于粉紅噪聲實驗信號,僅在φS為-45°、-15°時各有一個離群值,分別為-40°、-31°;對于低通粉紅噪聲實驗信號,僅在φS為-45°、0°、60°時各有一個離群值,分別為-13°、-32°、0°;對于管弦樂實驗信號,僅在φS為-45°、-15°時各有一個離群值,分別為-35°、-32°。
圖6(b)給出了3種實驗信號和不同目標(biāo)虛擬源仰角對應(yīng)的剔除離群值后感知虛擬源仰角的平均值及其標(biāo)準(zhǔn)差。從圖6(b)中可以看出,當(dāng)目標(biāo)虛擬源仰角位于-60° ≤φS≤ 60°之外時,平均感知虛擬源仰角位于揚聲器位置(φ0=-45°、φ2=45°)附近且標(biāo)準(zhǔn)差較大,因此感知到的虛擬源仰角是沒有意義的。當(dāng)目標(biāo)虛擬源仰角在-45°≤φS≤ 45°范圍內(nèi)時,3種實驗信號對應(yīng)的平均感知虛擬源仰角與目標(biāo)虛擬源仰角基本一致。當(dāng)目標(biāo)聲源仰角φS=60°時,3種實驗信號對應(yīng)的平均感知聲源仰角略微趨向于揚聲器位置(φ0= 45°)。當(dāng)目標(biāo)聲源仰角φS=-60°時,3種實驗信號對應(yīng)的平均感知聲源仰角位于揚聲器位置(φ0=-45°)附近。這與3.1節(jié)中用HRTFs分析雙耳動態(tài)因素的結(jié)果基本一致。
圖6 垂直面θA=-30°揚聲器布置條件下,感知到的虛擬聲源仰角
總體上,上述實驗結(jié)果表明,在前方垂直面θA=-30°,當(dāng)聽者偏離理想傾聽位置后,至少在揚聲器布置的±45°目標(biāo)仰角范圍內(nèi),局域Ambisonics重放的垂直虛擬源對頭部平移是穩(wěn)定的。
定位因素穩(wěn)定性分析表明,至少在聽者頭部側(cè)向移動而偏離傾聽中心0.20 m的范圍內(nèi),對揚聲器布置范圍內(nèi)的目標(biāo)虛擬源,局域Ambisonics聲重放仍然能夠產(chǎn)生期望的垂直定位因素,包括ITD以及由于頭部轉(zhuǎn)動引起的ITD變化。特別地,當(dāng)揚聲器布置于前方中垂面時,此聲重放方法甚至對于揚聲器外一定范圍內(nèi)的目標(biāo)虛擬源仍然能夠產(chǎn)生準(zhǔn)確的動態(tài)定位因素。
心理聲學(xué)定位實驗的結(jié)果及分析表明,至少在聽者頭部側(cè)向移動而偏離傾聽中心0.20 m的范圍內(nèi),對揚聲器布置范圍內(nèi)的目標(biāo)虛擬源,局域Ambisonics聲重放的平均感知方向仍然與目標(biāo)聲源基本相一致,平均誤差基本不大于5°。當(dāng)目標(biāo)聲源超出揚聲器布置范圍時,局域Ambisonics聲重放的平均感知方向偏離了目標(biāo)聲源,并且平均感知方向的方差變大。
在最近的研究[13]中,筆者等人已證明局域Ambisonics聲重放對于理想傾聽位置,可以產(chǎn)生期望的垂直定位動態(tài)因素。也就是說,對于揚聲器布置范圍內(nèi)的目標(biāo)虛擬源,聽者位于理想傾聽位置時,局域Ambisonics聲重放能夠產(chǎn)生準(zhǔn)確的垂直定位因素,聽者因此能夠感知到與目標(biāo)一致的虛擬源。
本文的工作表明,聽者偏離了理想傾聽位置后,若側(cè)向移動的程度在不大于0.20 m的合理范圍內(nèi),該聲重放方法仍然能夠產(chǎn)生準(zhǔn)確的垂直定位因素,聽者因此仍能夠感知到與目標(biāo)方向一致的虛擬源,因此該聲重放方法對聽者頭部平移有一定的穩(wěn)定性,在一定程度上滿足實際應(yīng)用的要求。