肖 睿 王翠平
(西安音樂學(xué)院,陜西 西安710061)
像雞尾酒會這樣喧鬧的室內(nèi),會有許多不同的聲音來源,如說話聲、背景音樂聲以及餐具和其他物體碰撞發(fā)出的聲音等。在聲波傳輸過程中,不同聲音來源發(fā)出的聲波相互重疊,會形成復(fù)雜的混合聲波[1]。一個有趣的現(xiàn)象是:在雞尾酒會上互相交談時,人們可以完全集中在一個人的聲音上,而使其他人的聲音自動轉(zhuǎn)移到背景中去。那么,聽眾如何區(qū)分不同目標的聲音信號和他們接收到的聲波,從而理解目標者的表達呢?這就是Cherry在1953 年所提出的著名的“雞尾酒會”問題[2]。在這篇文章中,我們統(tǒng)一將目標者的表達稱為目標言語,將背景的其他聲音稱為干擾性言語。
為了能更好地理解“雞尾酒會”問題,我們首先來看看干擾性言語對目標言語能產(chǎn)生哪些掩蔽作用,這對深入認識這個問題的本質(zhì)有重要的意義。
目前的研究多數(shù)采用多音素掩蔽法來研究有音樂訓(xùn)練背景和沒有音樂訓(xùn)練背景的人的語音感知能力。Swaminathan 等人使用的是由可理解的句子組成的相互競爭的聲音,這些句子與目標句子在空間上是分開的。模擬了一個生態(tài)現(xiàn)實的情景,一個人試圖忽略旁邊的干擾句,而去理解直接面對的目標者的語意。
為了區(qū)分在這種情況下導(dǎo)致掩蔽的不同因素,分成了兩種由干擾言語引起的掩蔽:能量掩蔽和信息掩蔽。當干擾句在時間和頻率上與目標語句重疊時,就會在聽覺外圍產(chǎn)生感官干擾,即能量掩蔽。當干擾句與目標句在語義上高度相似或混淆時,就會在聽覺外圍產(chǎn)生認知干擾,即信息掩蔽。例如,使用白噪聲或語音形狀的噪聲來掩蓋目標句時,會產(chǎn)生較高的能量掩蔽,但幾乎沒有信息掩蔽,因為在競爭認知處理中沒有其他可理解的信號。而使用可以產(chǎn)生認知干擾的言語句子來掩蓋目標句時,同時存在能量掩蔽和信息掩蔽。以特定的方式操縱干擾,可以改變不同條件下的能量掩蔽和信息掩蔽的大小。
信息掩蔽的控制基于對掩蔽語言的空間位置和可解性的控制。就空間位置而言,相較于所有的干擾來自相同的位置,當干擾句在空間上與目標分開或距離較遠時,目標句的可理解性會有所提高。這似乎是由于“認知因素”產(chǎn)生釋放信息掩蔽的能力(例如,聽者只關(guān)注目標信號而抑制對于錯誤信號的認知/語言處理),而不是只由于“感覺因素”產(chǎn)生能量掩蔽的釋放。
在可解性方面,通過將掩蔽語音正向播放(在這種情況下,它是正常的和完全可解的)或通過反轉(zhuǎn)時域信號(使其不可解)來控制生成的信息掩蔽。
如圖1 所示。A:揚聲器相對于聽眾的位置;B&C:目標語句和干擾句正常和反轉(zhuǎn)時域信號后的波形和頻譜圖。目標句:“小紅拿了兩個新玩具”;干擾句1:“李華買了九本書”;干擾句2:“小紅拿了四個新玩具”。
圖1:信息掩蔽的不同情況[3]
Swaminathan 等人的研究有四種條件。在所有條件下,目標都是一個簡短易懂的句子(例如,“小紅看到了兩雙鞋”),直接從參與者前面的揚聲器播出。目標語句總是產(chǎn)生另外兩個類似的干擾語句(由不同的人發(fā)音)。在條件1 和2 中,干擾句是可理解的。在條件3 和4 中,干擾句是不可理解的(時域反轉(zhuǎn)),并且干擾句與目標句空間分離。它們有非常相似的頻譜結(jié)構(gòu)(見圖1),因此產(chǎn)生了能量掩蔽非常相似的環(huán)境,但是信息掩蔽在條件1、2、3、4 中從很高逐漸降低。
高強度的音樂訓(xùn)練對人們聽覺處理能力(如在音高、音長和音色方面對聲音進行細微的區(qū)分)和認知能力(如聽覺注意和工作記憶)方面提出了非常高的要求,這些要求并未音樂所獨有,語音感知也依賴于與工作記憶和聽覺注意相關(guān)的聽覺分析[4]。
在藝術(shù)實踐中,接受過音樂訓(xùn)練的人們憑借他們的能力,在一個音樂合奏中選擇性地聆聽單個樂器,并將注意力從一種樂器隨意地轉(zhuǎn)移到另一種樂器上。這與“雞尾酒會”問題有著驚人的相似之處,都是在幾個相互競爭的聲音中處理一個特定的聲音的問題。
但是,選擇性聽力在音樂和語言語境中也不盡相同。例如,一個樂團的成員通常演奏相同的樂曲(不同的樂器可能演奏不同的部分),而雞尾酒會的問題涉及從不同的獨立對話中選擇一個給定的說話者。然而,在某種程度上,這兩種情況下都要求在一個復(fù)雜的聽覺場景有選擇性的聽的能力,而這些要求與大腦網(wǎng)絡(luò)共享的音樂和語音處理有關(guān),因此接受過音樂訓(xùn)練的人有更強的能力選擇和參加到目標說話的語言(掩蔽)競爭。
Zuk 等人的研究顯示接受過音樂訓(xùn)練的人在聽覺認知任務(wù)上具有優(yōu)勢,更善于同時進行聲音分離,比未經(jīng)訓(xùn)練的人更不容易受到信息掩蔽的影響[5]。
音樂訓(xùn)練和語言感知的共同需求可能是由于部分重疊的大腦機制:越來越多的證據(jù)表明,涉及音樂和語音處理的大腦網(wǎng)絡(luò)并沒有完全隔離在大腦皮層中,而且事實上可能有很大程度的重疊[6]。這就提出了一個基本的問題:語言技能和音樂技能之間有很大關(guān)系嗎,它們構(gòu)成的心智能力是否相同?
解決這個問題的一種方法是將受過音樂訓(xùn)練的和未經(jīng)訓(xùn)練的個人進行語言處理任務(wù)的比較。如果前者在這些任務(wù)上表現(xiàn)出優(yōu)勢,表明音樂和語音處理之間有神經(jīng)生物學(xué)聯(lián)系。原因如下:(1)在某些聽覺和認知過程(音樂和語言共享的)中天生有優(yōu)勢的人會更多地從事音樂活動;(2)音樂訓(xùn)練可通過雙向神經(jīng)可塑性的大腦網(wǎng)絡(luò)(語言和音樂共享的)提高語音處理任務(wù)。[7]
許多研究將接受過音樂訓(xùn)練的人的表現(xiàn)與未接受過不同語言任務(wù)訓(xùn)練的人的表現(xiàn)進行了比較,發(fā)現(xiàn)音樂訓(xùn)練與語音處理能力之間存在高度相關(guān)性,包括語音語調(diào)感知[8],語音對句子的影響辨別[9]以及第二語言語音知覺[10]。
從空間聽覺的角度來說,當目標語音被兩個可理解的、空間上分離的語音掩碼所掩蓋時,受過音樂訓(xùn)練的人比沒有受過音樂訓(xùn)練的人對聲音的感知更好。干擾句在空間上分離會有助于將目標句從干擾句的聲音中分離出來,受過音樂訓(xùn)練的人的閾值比沒有接受過音樂訓(xùn)練的人低得多(差異約為6 分貝)[11]。
這可能歸因于他們抑制不相關(guān)背景聲音的能力更強,更不容易受信息掩蔽的影響,并且在聽覺注意任務(wù)上表現(xiàn)得更好。同時這也反映了接受過音樂訓(xùn)練的人們比未經(jīng)訓(xùn)練的人有更好的“分析性”聽覺能力,在產(chǎn)生信息掩蔽的干擾語音掩碼的存在下,在基本聽覺上的優(yōu)勢可以廣到語音感知[12]。當空間分離的語音掩碼存在時,未接受過音樂訓(xùn)練的聽者在空間位置密集的正向語音干擾中,不能完全將干擾與目標本身進行空間化和隔離,這種個體差異源自于的空間敏銳度的不同。
總的來說,最新的研究結(jié)果表明接受過音樂訓(xùn)練的個體比未經(jīng)訓(xùn)練的個體在空間聽覺上的能力更強。然而,也有研究報告稱,接受過音樂訓(xùn)練的個體在標準的語音噪音感知測試中獲得的優(yōu)勢不大。例如,Parbery-Clark 在兩個臨床試驗中,接受過音樂訓(xùn)練的人在噪音測試中表現(xiàn)出了很小的優(yōu)勢[13]。Ruggles和Boebinger 等人的兩項研究在噪音感知測試中發(fā)現(xiàn)接受過音樂訓(xùn)練的人沒有任何優(yōu)勢[14][15]。
鑒于這些不一致的結(jié)果,由于其潛在的理論和現(xiàn)實意義,對這一課題的進一步研究是有必要的。在基礎(chǔ)研究方面,如果接受過音樂訓(xùn)練的人在噪音中表現(xiàn)出明顯的優(yōu)勢,這將為研究人員提供一個有用的群體來探索在噪音中感知語音的機制以及上述個體差異背后的因素。從實際的角度來看,在“雞尾酒會”環(huán)境中交談,對于神經(jīng)性聽力喪失的聽者、耳蝸植入者,甚至一些臨床上聽力正常的聽者都被證明是極具挑戰(zhàn)性的。如果音樂訓(xùn)練確實能改善噪音中的聽覺能力,這將對設(shè)計訓(xùn)練計劃有重大的意義,以提高在正常和臨床人群中的這種能力。