冀 飛,劉 巖,蔡小兵,郗 昕,蒲 衛(wèi)
臨床聽力學(xué)測(cè)試材料的數(shù)字化錄音和處理
冀 飛,劉 巖,蔡小兵,郗 昕,蒲 衛(wèi)
目的:應(yīng)用數(shù)字化方法進(jìn)行臨床聽力學(xué)測(cè)試材料的開發(fā)和處理。方法:利用音頻處理軟件Cool Edit對(duì)編制好的中文言語聽力學(xué)測(cè)試材料進(jìn)行數(shù)字化的錄音以及降噪、響度均衡、建立校準(zhǔn)音等處理,以數(shù)字化的載體代替?zhèn)鹘y(tǒng)的磁帶對(duì)材料進(jìn)行儲(chǔ)存。結(jié)果:形成了一套便于標(biāo)準(zhǔn)化的言語聽力學(xué)測(cè)試材料音頻文件,包括總計(jì)30張漢語普通話單音節(jié)測(cè)試詞表,每張?jiān)~表包括25個(gè)單音節(jié)詞測(cè)試項(xiàng)。調(diào)整后,各表響度的整體均方根為(-20.7±0.13)dB。同時(shí),還摸索出了一套可行的數(shù)字化詞表開發(fā)方法。結(jié)論:數(shù)字化錄音是最佳的臨床言語聽力學(xué)測(cè)試材料錄制方法。測(cè)試材料的保真度、動(dòng)態(tài)范圍、信噪比均可通過數(shù)字化錄音和處理加以提高;錄音內(nèi)容更加容易被調(diào)取和儲(chǔ)存;信號(hào)強(qiáng)度的控制也更加靈活。使用Cool Edit進(jìn)行臨床聽力學(xué)測(cè)試材料的制作,提高了測(cè)試材料的準(zhǔn)確性和標(biāo)準(zhǔn)化。
聽力學(xué);錄音;數(shù)字化
聽力損失是影響人民生活質(zhì)量的重要疾病,由戰(zhàn)場(chǎng)或武器噪聲導(dǎo)致的聽力損傷也會(huì)嚴(yán)重影響戰(zhàn)斗指令傳達(dá)。因此,著眼于聽覺言語評(píng)估和干預(yù)、康復(fù)的臨床聽力學(xué)作為新興臨床學(xué)科在我國(guó)取得了長(zhǎng)足發(fā)展。對(duì)聽力損失程度的診斷以及干預(yù)效果的評(píng)估都需要綜合手段。傳統(tǒng)的純音聽力測(cè)試僅反映聽覺敏感程度,對(duì)言語交流的障礙程度反映不足,因此,言語測(cè)聽越來越受到重視。言語測(cè)聽必須符合受試者的語言種類。中文言語測(cè)聽起步于20世紀(jì)60年代[1-2],后續(xù)有多位學(xué)者進(jìn)行了中文聽力言語測(cè)聽材料編制的相關(guān)工作[3-5]。早期的一些中文言語測(cè)聽材料多以磁帶形式錄制和播放,物理特性上的局限使得這種方式在某種程度上限制了中文言語測(cè)聽的標(biāo)準(zhǔn)化以及對(duì)臨床結(jié)果的判讀。數(shù)字錄音和計(jì)算機(jī)技術(shù)的興起對(duì)中文語言測(cè)聽起到了推動(dòng)作用。本文將專業(yè)音頻處理方法應(yīng)用于漢語言語單音節(jié)測(cè)聽詞表的錄音和后期降噪、測(cè)試項(xiàng)分割、響度均衡等處理,形成一套標(biāo)準(zhǔn)化的言語測(cè)聽材料音頻文件。
本文所述工作在Windows XP操作系統(tǒng)下使用CoolEditpro 2.0完成。Cool Edit可完成包括錄音、后期處理、混音、多軌音頻制作等音頻處理功能。錄音之前,經(jīng)語料收集、難度均衡、音位平衡等步驟編制好單音節(jié)測(cè)聽詞表的文本[6-7]。詞表為漢語單音節(jié)測(cè)試詞表30張,每張單音節(jié)詞表包括25個(gè)單音節(jié)詞測(cè)試項(xiàng)。使用Lenovo X220計(jì)算機(jī)、Sound Blaster聲卡、B&K聲級(jí)計(jì)(A頻率計(jì)權(quán)、“快”時(shí)間計(jì)權(quán))和4 134聲場(chǎng)型傳聲器在本底噪聲不高于30 dB(A)的隔聲室內(nèi)進(jìn)行錄音。聲級(jí)計(jì)、傳聲器、播音員位于隔聲室內(nèi),其余設(shè)備位于控制室。錄音控制人員通過監(jiān)聽耳機(jī)和對(duì)講系統(tǒng)對(duì)播音員予以提示和控制。
錄音之前,首先調(diào)試Cool Editpro 2.0的錄音電平。調(diào)整混音器(windows recordingmixer)控制面板上的滑塊,使得發(fā)音時(shí)電平指示VU表顯示一格紅色標(biāo)記。正式對(duì)一個(gè)詞表錄音時(shí),新建一個(gè)立體聲波形文件(分辨率16 bit、采樣頻率44 100Hz)。點(diǎn)擊錄音按鈕開始錄音。為備后續(xù)降噪處理之需,先錄制10 s左右隔聲室本底噪聲(即空白信號(hào)),然后提示播音員開始朗讀文字材料。每張?jiān)~表錄制完成后,按編號(hào)分別保存為.wav格式文件。
原始數(shù)字音頻文件尚不能直接在臨床使用,須經(jīng)降噪、測(cè)試項(xiàng)分割、響度均衡等處理,并配以校準(zhǔn)音,方可形成依托于言語聽力計(jì)的臨床診斷與評(píng)估測(cè)試材料。
2.1 降噪
合格的言語測(cè)聽CD應(yīng)保證信噪比足夠高。除在錄音過程中保持環(huán)境本底噪聲足夠低以外,還須對(duì)音頻文件進(jìn)行后續(xù)降噪處理。本文使用Cool Edit的采樣降噪法進(jìn)行降噪,即首先對(duì)錄音環(huán)境噪聲進(jìn)行頻譜特征采樣,繼而從原始音頻信號(hào)中濾除具有該噪聲特征的信號(hào)。
首先,提取噪聲樣本的特征。在每個(gè)音頻文件開始預(yù)留的噪聲區(qū)選中一段波形最平穩(wěn)的噪聲樣本,從“效果”菜單里選擇降噪(noise reduction)功能,主要參數(shù)為:噪聲衰減量80%、精度10、平滑量10。點(diǎn)擊“獲取特征輪廓”按鈕。選中整個(gè)音頻波形,再次進(jìn)入降噪界面完成降噪。部分文件需反復(fù)進(jìn)行上述降噪過程,但為避免對(duì)原始音的破壞,噪聲衰減量和平滑量需做一定調(diào)整。
2.2 測(cè)試項(xiàng)分割
臨床上,言語測(cè)試的測(cè)算單位稱為測(cè)試項(xiàng)。根據(jù)不同內(nèi)容的材料,測(cè)試項(xiàng)可以是單音節(jié)字、雙音節(jié)詞、句子等。本研究中,測(cè)試項(xiàng)為單音節(jié)字。本文所述材料的錄音以及降噪處理是以詞為單位進(jìn)行的。每個(gè)表中包含25個(gè)單音節(jié)測(cè)試項(xiàng),各測(cè)試項(xiàng)之間的自然間隔和響度可能不一致。在進(jìn)一步的處理中,須將各測(cè)試項(xiàng)進(jìn)行分離,對(duì)測(cè)試項(xiàng)響度進(jìn)行均衡并使用等長(zhǎng)的靜音間隔重新連接,形成標(biāo)準(zhǔn)的測(cè)試材料。測(cè)試項(xiàng)分割方法如下,打開一個(gè)降噪處理后的.wav詞表文件。預(yù)先設(shè)置好有效信號(hào)的電平范圍,使用Cool Edit的“自動(dòng)標(biāo)記(auto cue)”功能,按照設(shè)置范圍自動(dòng)分析文件。然后,使用“搜索片段并標(biāo)記(find phrase andmark)”功能,根據(jù)信號(hào)電平變化將每個(gè)測(cè)試項(xiàng)識(shí)別為一個(gè)片段,標(biāo)記出開始和結(jié)束的時(shí)間位置。檢查無誤后,選中所有測(cè)試項(xiàng),采用批處理方式將各測(cè)試項(xiàng)按順序分別保存成獨(dú)立的音頻文件。所有30組測(cè)試表均作此處理。
2.3 響度均衡
國(guó)家標(biāo)準(zhǔn)GB/T 17696—1999中規(guī)定,言語測(cè)聽材料的最小測(cè)試項(xiàng)的言語級(jí)強(qiáng)度與整體材料的平均值相差應(yīng)不超過±1 dB[8]。根據(jù)實(shí)際錄音強(qiáng)度和分辨率的要求,設(shè)定本材料平均均方根強(qiáng)度為-20 dB(以采樣單位為基準(zhǔn),下同)。打開一個(gè)分割保存好的測(cè)試項(xiàng)文件,使用分析菜單下的“統(tǒng)計(jì)”功能測(cè)得該測(cè)試項(xiàng)的平均均方根強(qiáng)度。然后,使用“放大”功能,根據(jù)預(yù)先設(shè)定的統(tǒng)一強(qiáng)度值(-20 dB)和平均均方根強(qiáng)度的差值,給予測(cè)試項(xiàng)相應(yīng)的放大倍數(shù)。所有測(cè)試項(xiàng)均分別作此均衡調(diào)整。響度均衡處理結(jié)束后,使用Cool Edit“接續(xù)打開”功能,將同一測(cè)試詞表的25個(gè)測(cè)試項(xiàng)連成1個(gè)音頻文件。通過批處理方式在每個(gè)測(cè)試項(xiàng)開始和結(jié)束的位置插入2.5 s靜音,總共形成30個(gè)詞表音頻文件。測(cè)量各詞表文件的總體時(shí)長(zhǎng)平均均方根強(qiáng)度,對(duì)各測(cè)試項(xiàng)強(qiáng)度進(jìn)行微調(diào),使之與平均強(qiáng)度之差小于±3 dB。
2.4 校準(zhǔn)音的創(chuàng)建
每個(gè)測(cè)試材料之前需配以校準(zhǔn)音,以便臨床測(cè)試中依托言語聽力計(jì)控制言語信號(hào)強(qiáng)度。本材料校準(zhǔn)音信號(hào)包括:(1)1 kHz窄帶噪聲(時(shí)長(zhǎng)60 s);(2)1/3倍頻程窄帶噪聲(時(shí)長(zhǎng)15 s);(3)250Hz、500Hz、1 kHz純音(時(shí)長(zhǎng)均為60 s)。校準(zhǔn)音信號(hào)的產(chǎn)生使用Cool Edit的“產(chǎn)生信號(hào)”功能。不同頻率窄帶噪聲校準(zhǔn)音使用可視化均衡器功能,通過對(duì)給定時(shí)長(zhǎng)的白噪聲進(jìn)行1/3倍頻程濾波獲得。所有校準(zhǔn)音的均方根強(qiáng)度均依照上述響度均衡方法調(diào)整為-20 dB。
經(jīng)過上述數(shù)字化音頻處理,形成了響度均衡的音頻文件。整套漢語普通話單音節(jié)測(cè)試詞表共30張,每張單音節(jié)詞表包括25個(gè)單音節(jié)詞測(cè)試項(xiàng)。調(diào)整后,各表的整體均方根強(qiáng)度為(-20.7±0.13)dB(如圖1所示),符合國(guó)家標(biāo)準(zhǔn)規(guī)定。經(jīng)過處理的測(cè)聽文件,經(jīng)過信度和效度的檢驗(yàn)后可供臨床測(cè)試使用[9-10]。
言語測(cè)試在耳科學(xué)、聽力學(xué)中的重要性日益增大。特別是人工耳蝸植入在我國(guó)逐漸廣泛開展之后,對(duì)于植入手術(shù)后,聽力言語康復(fù)效果的評(píng)估迫切需要標(biāo)準(zhǔn)化的中文言語測(cè)聽材料。言語測(cè)試材料的標(biāo)準(zhǔn)化,涵蓋了2個(gè)方面內(nèi)容:(1)測(cè)試內(nèi)容的標(biāo)準(zhǔn)化,即測(cè)試材料應(yīng)能準(zhǔn)確且穩(wěn)定地反映測(cè)試對(duì)象的言語識(shí)別能力,具有通用參照價(jià)值。言語測(cè)聽材料的標(biāo)準(zhǔn)性主要體現(xiàn)在測(cè)試表的組織和聲學(xué)控制上。(2)測(cè)試方法的標(biāo)準(zhǔn)化,即測(cè)試材料內(nèi)各測(cè)試項(xiàng)的刺激強(qiáng)度、時(shí)間間隔等參量應(yīng)依據(jù)一定原則進(jìn)行聲學(xué)處理,以便使用量化的形式表達(dá)測(cè)試結(jié)果。
圖1 響度均衡后各詞表整體均方根強(qiáng)度
測(cè)試內(nèi)容的標(biāo)準(zhǔn)化要求測(cè)試所使用的材料的測(cè)試項(xiàng)可代表日常言語交流中最常用的字、詞、句,且各種語音元素的相對(duì)出現(xiàn)頻率均與實(shí)際交流的出現(xiàn)頻率相同或相近。本文的漢語普通話單音節(jié)測(cè)試詞表,在編寫過程中參照了漢語音位一維概率分布,總共涉及了489個(gè)音節(jié),其聲、韻、調(diào)的分布頻次與文獻(xiàn)統(tǒng)計(jì)的實(shí)際應(yīng)用頻次相對(duì)應(yīng),且全部750個(gè)測(cè)試字均在漢語普通話常用2 500字范圍內(nèi)。測(cè)試內(nèi)容標(biāo)準(zhǔn)化的另一個(gè)重要方面就是測(cè)試材料經(jīng)過臨床的測(cè)試信度測(cè)試,以保證言語測(cè)聽材料的測(cè)試穩(wěn)定性和可重復(fù)性[10]。
測(cè)試方法標(biāo)準(zhǔn)化的重要方面是測(cè)試方式和載體的標(biāo)準(zhǔn)化。測(cè)聽材料以言語聲波的形式傳遞給受試者,因此發(fā)音環(huán)節(jié)對(duì)測(cè)試結(jié)果的標(biāo)準(zhǔn)性有很大影響。常見的2種給聲方式分別是監(jiān)控下的口語發(fā)聲和播放錄音。使用傳統(tǒng)的口語發(fā)聲方法在進(jìn)行言語識(shí)別測(cè)試時(shí),發(fā)音人的發(fā)音方式、強(qiáng)度和語氣不能精確地保持穩(wěn)定,且可能隨著受試者的反應(yīng),下意識(shí)地調(diào)整發(fā)音或給出視、聽覺線索,得到的結(jié)果變異度較大。采用錄制好的材料進(jìn)行言語測(cè)聽,可以保證比較好的測(cè)試信度。錄音材料可以很好地控制所有的測(cè)試項(xiàng)以同樣的強(qiáng)度和發(fā)音方式念出,避免測(cè)試者主觀因素,具有可重復(fù)性,有利于標(biāo)準(zhǔn)化。錄音介質(zhì)很重要。乙烯唱片和模擬磁帶都曾被應(yīng)用于言語測(cè)試材料錄制,但這二者具有聲音顫抖、音質(zhì)和音調(diào)失真、不便長(zhǎng)期保存等不足?,F(xiàn)階段,CD和計(jì)算機(jī)軟件等數(shù)字化方法已被公認(rèn)為是言語測(cè)聽的最佳方法。測(cè)試材料的強(qiáng)度動(dòng)態(tài)范圍、言語信號(hào)保真度、信噪比均可通過數(shù)字方式獲得擴(kuò)展和提高。播放設(shè)備廉價(jià),錄音內(nèi)容更加容易調(diào)取和儲(chǔ)存;對(duì)測(cè)試信號(hào)強(qiáng)度的控制也更加便捷[11]。
通過計(jì)算機(jī)可以很容易調(diào)整語音材料中聲學(xué)線索的強(qiáng)弱,并能夠去除對(duì)聲學(xué)線索造成干擾的細(xì)微雜音。Nissen等報(bào)道在開發(fā)雙音節(jié)詞表時(shí),將每一個(gè)雙音節(jié)詞的RMS強(qiáng)度調(diào)整到與1 kHz校準(zhǔn)音強(qiáng)度相同,以使其可聽性盡量等價(jià)[12]。本文亦采用了數(shù)字化方式進(jìn)行臨床言語測(cè)試材料的錄音和后處理,特別是應(yīng)用專業(yè)音頻處理軟件Cool Edit在錄音、文件降噪、響度均衡、校準(zhǔn)音創(chuàng)建等幾個(gè)方面進(jìn)行了嘗試。測(cè)試項(xiàng)中包含聲學(xué)線索的多少與測(cè)試材料錄制的方式有關(guān)。錄音方式和介質(zhì)會(huì)影響測(cè)試材料所包含的聲學(xué)信息的數(shù)量,進(jìn)而影響測(cè)試材料的冗余度。錄音方式、發(fā)音人的發(fā)音狀態(tài)、聲強(qiáng)、音高和發(fā)音節(jié)奏的變化都會(huì)影響最終錄音材料的難度。錄音時(shí),可通過調(diào)整發(fā)音人距離錄音麥克風(fēng)的遠(yuǎn)近來調(diào)整錄音強(qiáng)度。測(cè)試材料的長(zhǎng)時(shí)間均方根頻譜特性則主要由發(fā)音人的發(fā)聲特性決定。一些無法在錄音過程中解決的,諸如錄制噪聲問題、測(cè)試項(xiàng)的響度均衡問題以及測(cè)試表整體強(qiáng)度的統(tǒng)一和控制問題,都通過Cool Edit進(jìn)行了統(tǒng)一的后期數(shù)字化處理。本文結(jié)果顯示,計(jì)算機(jī)化的錄音和后處理,利用計(jì)算機(jī)的快速批量運(yùn)算能力,節(jié)省了詞表的整體開發(fā)時(shí)間,提高了測(cè)聽詞表材料的準(zhǔn)確性和標(biāo)準(zhǔn)化。這表明數(shù)字化已經(jīng)成為中文言語聽力測(cè)試的發(fā)展趨勢(shì)。
[1]蔡宣猷.言語測(cè)聽法[J].中華耳鼻咽喉科雜志,1963,9(1):8-14.
[2]程錦元.漢語測(cè)聽詞表的編選[J].中華耳鼻咽喉科雜志,1966,12(2):106-111.
[3]沈曄,王書鑫.一個(gè)言語測(cè)聽材料的編制[J].心理學(xué)報(bào),1983,15(3):316-328.
[4]顧瑞,李興啟,陳桂芬.交錯(cuò)揚(yáng)揚(yáng)格詞試驗(yàn)和競(jìng)爭(zhēng)語句試驗(yàn)[J].中華耳鼻咽喉科雜志,1988,23(2):97-99.
[5]張華,曹克利,王直中.漢語最低聽覺功能測(cè)試(MACC)的編輯和初步應(yīng)用[J].中華耳鼻咽喉科雜志,1990,25(2):79-82.
[6]冀飛,郗昕.一組普通話音位平衡單音節(jié)字表的文字編撰[J].中華耳科學(xué)雜志,2007,5(4):417-426.
[7]JIFei,XIXin,CHEN Ai-ting,et al.Development of a mandarin monosyllable testmaterialwith homogenous items(I):homogeneity selection[J].Acta otolaryngologica.2011,131(9):1 012-1 016.
[8]GB/T 17696—1999 聲學(xué)測(cè)聽方法第3部分:言語測(cè)聽法[S].
[9]Stanley A G.Essentials of Audiology[M].New York:Thieme MedicalPublishers,Inc.,1997:253-286.
[10]冀飛,郗昕.影響言語測(cè)聽的若干因素[J].中華耳科學(xué)雜志,2008,6(1):50-55.
[11]Kamm C,Carterette EC,Morgan D E,etal.Use of digitized speech materials in audiological research[J].JSpeech Hear Res,1980,23(4):709-721.
[12]Nissen S L,Harris R W,Jennings L J,et al.Psychometrically equivalentmandarin bisyllabic words for speech reception threshold testing inmandarin[J].Int JAudiol,2005,44(7):379-390.
(收稿:2013-07-31 修回:2013-12-09)
Digital recording and processing of clinical speech audiometrymaterial
JIFei1,LIU Yan2,CAIXiao-bing2,XIXin1,PUWei3
(1.Departmentof Otorhinolaryngology and Head-Neck Surgery,General Hospital of the PLA,Beijing 100853,China; 2.Division of Healthcare,Security Bureau of General Staff Departmentof the PLA,Beijing 100017,China; 3.Center ofMedical Information of the PLA,Beijing 100842,China)
Objective To realize digital development and processing of clinical speech audiometry material.Methods Cool Edit audio processing software was used for digital recording and processing of Chinese speech audiometry material, involving noise reduction,loudness balancing and calibration sound determining.Then digital carrier replaced conventional tape to store the material.Results A set of audio files for speech audiometry material was developed, including 30 mandarin monosyllable thesaurus charts with 25 test items concerned in each.General RMS of the charts was-20.7±0.13 dB after adjustment.A set of feasible method for developing digital thesaurus chart was put forward. Conclusions Digital recording behaves well for clinical speech audiometry material,with the fidelity,dynamic range and SNR improved greatly.The recording contents can be accessed and stored easily,and the signal intensity can be controlled flexibly.Cool Edit can be used to process clinical speech audiometry material,with the accuracy and standardization enhanced.[Chinese Medical Equipment Journal,2014,35(7):42-44]
audiology;recording;digitalization
R318.6;R764.04
A
1003-8868(2014)07-0042-03
10.7687/J.ISSN1003-8868.2014.07.042
軍隊(duì)醫(yī)藥衛(wèi)生科研基金課題(11BJZ33);全軍軍事醫(yī)學(xué)計(jì)量科研專項(xiàng)課題(2012-JL1-028)
冀 飛(1978—),男,博士,助理研究員,主要從事臨床聽力學(xué)和醫(yī)用聲學(xué)計(jì)量方面的研究工作;劉 巖(1973—),男,副主任醫(yī)師,主要從事老年醫(yī)學(xué)方面的研究工作。
共同第一作者:冀 飛,劉 巖對(duì)本文有同等貢獻(xiàn),均為第一作者
100853北京,解放軍總醫(yī)院耳鼻咽喉-頭頸外科(冀 飛,郗昕);100017北京,解放軍總參謀部警衛(wèi)局保健處(劉 巖,蔡曉兵);100842北京,解放軍衛(wèi)生信息中心(蒲 衛(wèi))
蒲 衛(wèi),E-mail:puwei0108@sina.com