賈尚帥 潘德闊 阮沛霖 鄭 旭
(1 中車唐山機(jī)車車輛有限公司技術(shù)研究中心 唐山 063035)
(2 浙江大學(xué)能源工程學(xué)院 杭州 310027)
隨著高速列車速度的提升,車內(nèi)噪聲問題日益突出,這不僅會(huì)影響乘客的乘車體驗(yàn),甚至?xí)p害人體健康。高速列車車內(nèi)噪聲是多種復(fù)雜激勵(lì)源共同作用下的寬頻帶噪聲,且以中低頻為主[1]。傳統(tǒng)的A 計(jì)權(quán)聲壓級評價(jià)會(huì)對車內(nèi)噪聲水平造成一定的低估,導(dǎo)致結(jié)果與人的主觀感受不相符。因此,國內(nèi)外學(xué)者針對車內(nèi)包括響度、尖銳度、粗糙度和抖動(dòng)度等客觀聲品質(zhì)參數(shù)開展了大量研究。Luo 等[2]針對高速列車車內(nèi)聲品質(zhì)提出了一種自適應(yīng)Moore響度算法(AMLA),該算法有效提升了計(jì)算的精度和效率。鞠龍華等[3]定量分析了車內(nèi)強(qiáng)聲環(huán)境下的語言清晰度,研究了運(yùn)行速度與語言清晰度之間的關(guān)系。Park 等[4]研究了車內(nèi)瞬態(tài)變化噪聲的聲品質(zhì)參數(shù),得出響度值不能充分評價(jià)瞬態(tài)噪聲的結(jié)論。Li 等[5]通過語義細(xì)分方法,利用主成分分析對14個(gè)客觀指標(biāo)進(jìn)行降維,獲得了變電站噪聲的主要噪聲成分,并以此建立了主觀評價(jià)預(yù)測回歸模型。
為了進(jìn)一步提升車內(nèi)噪聲評價(jià)的準(zhǔn)確率,近年來支持向量機(jī)或人工智能算法結(jié)合主觀評價(jià)的方法先后被運(yùn)用到車內(nèi)噪聲的主客觀預(yù)測研究中。申秀敏等[6]采用基于小樣本理論的支持向量機(jī)回歸方法建立了聲品質(zhì)客觀參量與主觀評價(jià)結(jié)果的預(yù)測模型。Fang 等[7]基于支持向量機(jī)方法,通過客觀聲品質(zhì)和主觀評價(jià)來研究電動(dòng)車動(dòng)力總成的聲品質(zhì)。Liu 等[8]將支持向量機(jī)和遺傳算法結(jié)合,選擇了5 個(gè)心理聲學(xué)參數(shù),以綜合滿意度指數(shù)作為主觀評價(jià)標(biāo)準(zhǔn),分析柴油機(jī)的噪聲質(zhì)量。Xing 等[9]采用小波包變換提取的加速特征作為輸入,使用神經(jīng)網(wǎng)絡(luò)模型建立了響度和尖銳度的預(yù)測模型。Pietila等[10]比較了多元線性回歸和神經(jīng)網(wǎng)絡(luò)方法的優(yōu)缺點(diǎn),探討了魯棒方法對提高聲品質(zhì)評價(jià)模型精確度的影響。Zhang 等[11]結(jié)合神經(jīng)網(wǎng)絡(luò)和粒子群優(yōu)化算法提出了聲品質(zhì)的預(yù)測模型,解決了主觀評價(jià)結(jié)果和客觀聲品質(zhì)參數(shù)之間復(fù)雜的非線性問題。近年來,深度卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)在語聲識別和計(jì)算機(jī)視覺領(lǐng)域取得了相當(dāng)大的成功,因此Cao 等[12]將CNN 應(yīng)用于城市噪聲識別,其識別效果比傳統(tǒng)的支持向量機(jī)更好。Huang 等[13]使用具有自適應(yīng)學(xué)習(xí)速率樹的深度卷積神經(jīng)網(wǎng)絡(luò)(ALRT-CNNs)進(jìn)行純電動(dòng)汽車的非平穩(wěn)車內(nèi)噪聲的主觀評價(jià)預(yù)測,避免了固定學(xué)習(xí)率下的造成的局部最優(yōu)解,從而反映非平穩(wěn)噪聲對人主觀評價(jià)的影響。
高速列車車內(nèi)噪聲的時(shí)-頻特性是動(dòng)態(tài)變化的。然而現(xiàn)有的客觀品質(zhì)指標(biāo)或者預(yù)測模型通常旨在通過單獨(dú)考慮時(shí)域或頻域來評價(jià),很少能同時(shí)考慮聲音的時(shí)-頻變化特性,而聲學(xué)主觀評價(jià)的過程又會(huì)消耗大量的人力,因此,本文擬采用深度學(xué)習(xí)中的CNN 技術(shù),研究建立預(yù)測精度高,且節(jié)省人力的高速列車車內(nèi)聲學(xué)主觀聲品質(zhì)的預(yù)測模型。
為了獲取高速列車在350 km/h 速度下的車內(nèi)噪聲樣本,本文首先開展了高速列車車內(nèi)噪聲搭載實(shí)驗(yàn)研究。實(shí)驗(yàn)在我國徐州至南京的高速鐵路上進(jìn)行,測試車輛型號為CRH400BF。實(shí)驗(yàn)采用德國Head Acoustics 公司的聲學(xué)人工頭設(shè)備(HMS IV,以下簡稱人工頭)。人工頭考慮了人體肩膀、頭部、耳廓等對聲場造成的影響,能模擬雙耳信號采集,從而使得采集的聲音更加符合人耳的聽覺感受。
車內(nèi)噪聲測點(diǎn)及人工頭的布置根據(jù)ISO 3381:2005《鐵路應(yīng)用-聲學(xué)-軌道車輛內(nèi)部噪聲測量》來進(jìn)行。坐姿情況下,人工頭的雙耳高度放置在座椅的垂直坐標(biāo),即座椅表面與靠背表面交線以上0.75 m 的位置。站姿情況下,人工頭人耳的垂直坐標(biāo)在地面以上1.5 m 處。圖1 為一等座和二等座車廂內(nèi)人工頭測點(diǎn)。本次實(shí)驗(yàn)采集了車內(nèi)19 個(gè)測點(diǎn)的噪聲數(shù)據(jù),19個(gè)測點(diǎn)的位置如表1 所示,其中1~2為1 車,3~5為3車,6~8為4 車,9~11為4車與5車連接處,12~19為5車。每個(gè)測點(diǎn)記錄時(shí)間為30 s。
圖1 人工頭及測點(diǎn)布置示意圖Fig.1 Artificial head and measuring points
圖2(a)為高速列車車內(nèi)各測點(diǎn)的總聲壓級值,可以看出車內(nèi)噪聲強(qiáng)度較高,聲壓級普遍在65 dB(A)以上,其中10 號點(diǎn)風(fēng)擋區(qū)域幅值最大,7號點(diǎn)二等座中部幅值最小。上述兩點(diǎn)的聲壓級1/3倍頻程頻譜如圖2(b)所示,可以看出高速列車車內(nèi)不同區(qū)域的噪聲特性相差較大,在80 Hz以上,風(fēng)擋區(qū)域的噪聲均高于二等座噪聲。主要的原因是風(fēng)擋區(qū)域位于車廂的連接處,容易受到兩端轉(zhuǎn)向架噪聲的疊加影響,其高頻噪聲主要來源于轉(zhuǎn)向架區(qū)域噪聲。而車內(nèi)低頻噪聲主要來源于地板的結(jié)構(gòu)振動(dòng),因此7號點(diǎn)與10號點(diǎn)在低頻80 Hz以下噪聲幅值相差不大。
圖2 高速列車車內(nèi)噪聲特性Fig.2 Noise characteristics of high-speed train
主觀評價(jià)實(shí)驗(yàn)的主要步驟如圖3所示。
圖3 主觀評價(jià)實(shí)驗(yàn)主要步驟Fig.3 Key steps of subjective evaluation
(1)噪聲回放
從實(shí)驗(yàn)采集到的車廂內(nèi)各測點(diǎn)聲音信號中截取有代表性的樣本進(jìn)行主觀評價(jià)實(shí)驗(yàn)和客觀聲品質(zhì)分析。每段聲音樣本持續(xù)時(shí)間不宜過長,否則會(huì)引起被試者聽聲疲勞;也不宜太短,否則聽聲被試需要反復(fù)播放聲音樣本,影響主觀評價(jià)的準(zhǔn)確性。因此,本文主觀評價(jià)聲音樣本時(shí)長定為5 s,并保證實(shí)驗(yàn)過程中的人為噪聲不在所選的樣本中。聲音樣本的截取在Head Artemis 軟件中進(jìn)行,以保證無損轉(zhuǎn)換。
實(shí)驗(yàn)在專業(yè)聽聲室中進(jìn)行,使用Head LabP2均衡器進(jìn)行回放, 并搭配一對一標(biāo)定過的Sennheiser HD600 型頭戴式耳機(jī),能夠補(bǔ)償聽聲設(shè)備在回放過程中的頻響失真情況,并避免聽聲環(huán)境對評價(jià)結(jié)果產(chǎn)生影響。
(2)選擇受試者及評價(jià)方法
本次評價(jià)實(shí)驗(yàn)征集了26名受試者,其中男女比例1:1,年齡在20~60 周歲之間,體重在50~90 kg之間,全部為聽力正常者。因?yàn)槭茉囌叨加羞^較多乘坐火車和從事振動(dòng)噪聲研究工作的經(jīng)驗(yàn),主觀評價(jià)方法采用語義輔助的等級評分法,相關(guān)介紹可參考文獻(xiàn)[14]。舒適度評價(jià)等級表如表2所示。
表2 聲品質(zhì)主觀評價(jià)等級評分表Table 2 Subjective evaluation scores with explanation
評價(jià)實(shí)驗(yàn)由每位受試者在消聲室內(nèi)單獨(dú)進(jìn)行。實(shí)驗(yàn)開始前,首先對每位受試者說明實(shí)驗(yàn)的目的,以及操作設(shè)備的方法。然后讓每位受試者先進(jìn)行試聽并進(jìn)行打分練習(xí),熟悉打分過程。待受試者準(zhǔn)備充分之后,對受試者播放19 個(gè)噪聲樣本(隨機(jī)順序),由受試者做出舒適度評價(jià)并記錄。待19 個(gè)噪聲樣本播放完畢,獲得第一組評分,再重復(fù)進(jìn)行一次播放,然后獲得第二組評分。
(3)評價(jià)結(jié)果分析
每位評價(jià)者對19個(gè)樣本都進(jìn)行了兩次評價(jià),針對每個(gè)評價(jià)者兩次打分結(jié)果可以采用Spearman相關(guān)系數(shù)進(jìn)行分析[15],其計(jì)算方法如下所示:
其中,r為Spearman相關(guān)系數(shù),n是樣本數(shù),Xi和Yi分別是兩變量的秩。
表3 為每位受試者的Spearman 相關(guān)系數(shù)。理想條件下,一個(gè)評價(jià)標(biāo)準(zhǔn)不變的受試者對同一樣本應(yīng)當(dāng)做出相同評價(jià),從而每位受試者兩次評價(jià)之間的相關(guān)系數(shù)應(yīng)當(dāng)為1。根據(jù)相關(guān)文獻(xiàn)[15],一般相關(guān)系數(shù)高于0.6就被認(rèn)為具有比較強(qiáng)的相關(guān)性。其中5號、15號和22號受試者得出的評價(jià)結(jié)果相關(guān)系數(shù)低于0.6,說明其對同一樣本得出評價(jià)的結(jié)果一致性較差,其主觀評價(jià)穩(wěn)定程度不夠高,因此予以剔除。
表3 評價(jià)者Spearman 主觀評價(jià)相關(guān)系數(shù)Table 3 Spearman correlation coefficients of each listener
主觀評分結(jié)果如圖4(a)所示,評價(jià)較低的區(qū)域主要集中在車廂之間連接處區(qū)域,其中10號點(diǎn)正好位于風(fēng)擋區(qū)域,評分最低,臨近的9 號和11 號點(diǎn)評價(jià)也較差;評價(jià)最高的區(qū)域則位于7 號點(diǎn),位于二等座車廂中部。圖4(b)展示了部分測點(diǎn)的統(tǒng)計(jì)結(jié)果,可以看出大部分評價(jià)者的評價(jià)分?jǐn)?shù)都比較集中,如7 號點(diǎn)和10 號點(diǎn)。評價(jià)者的評分均較為集中,說明評價(jià)者對舒適性的評價(jià)標(biāo)準(zhǔn)較一致,但是1 號點(diǎn)司機(jī)室也存在評價(jià)相差較大的情況。對比主觀評價(jià)結(jié)果和車內(nèi)噪聲A 計(jì)權(quán)聲壓級的結(jié)果可以看出,A 計(jì)權(quán)聲壓級最大的位置的評價(jià)最差,A 計(jì)權(quán)聲壓級最小的位置評價(jià)最好,說明A 計(jì)權(quán)方法在一定程度上能夠預(yù)測主觀評價(jià)的極值。但是對于車廂內(nèi)的(如3 號點(diǎn))二等座這樣的位置卻沒有很好的預(yù)測效果,3 號點(diǎn)的A 計(jì)權(quán)聲級比1 號點(diǎn)和2 號點(diǎn)都高,但是其評價(jià)卻不是最低,甚至與1 號點(diǎn)評價(jià)相近。其主要原因可能在于3 號點(diǎn)的噪聲頻率分布特性以及動(dòng)態(tài)時(shí)-頻特性影響了受試者的評價(jià),因此導(dǎo)致A 計(jì)權(quán)聲壓級不能取得較好的評價(jià)效果。
圖4 主觀評價(jià)結(jié)果Fig.4 Results of subjective evaluation
客觀聲品質(zhì)參數(shù)有很多,但是目前有國際統(tǒng)一標(biāo)準(zhǔn)的只有響度,而尖銳度則有德國標(biāo)準(zhǔn),另外較常用的客觀參數(shù)還有粗糙度和抖動(dòng)度。為了研究聲品質(zhì)參數(shù)和聲學(xué)舒適性主觀評價(jià)的相關(guān)性,本文選取了響度(Moore-Glasberg 法)、尖銳度(DIN45692法)、粗糙度(Aures法)和抖動(dòng)度(Fastl方法)這4 個(gè)聲品質(zhì)客觀參數(shù)對車內(nèi)噪聲樣本進(jìn)行分析。響度計(jì)算使用Moore-Glasberg 方法可以直接利用快速傅里葉變換的結(jié)果,將每一個(gè)頻率點(diǎn)都用于特征響度計(jì)算,響度結(jié)果更準(zhǔn)確。尖銳度的計(jì)算需要考慮響度,因此為了減少指標(biāo)之間的相互影響,尖銳度選擇德國標(biāo)準(zhǔn)DIN45692 中的計(jì)算方法,其默認(rèn)使用Zwicker 響度進(jìn)行尖銳度計(jì)算。粗糙度和抖動(dòng)度的計(jì)算方法沒有統(tǒng)一標(biāo)準(zhǔn),因此分別選擇較為權(quán)威的Aures 方法和Fastl 的方法以減少影響。部分樣本的聲品質(zhì)客觀參數(shù)值如表4 所示。繪制出各聲品質(zhì)客觀參數(shù)與主觀評價(jià)結(jié)果的相關(guān)散點(diǎn)圖,結(jié)果如圖5所示。
表4 部分測點(diǎn)的客觀聲品質(zhì)參數(shù)Table 4 Sound quality objective parameters of some measuring points
圖5 主觀評價(jià)與聲品質(zhì)客觀參數(shù)散點(diǎn)回歸圖Fig.5 Scatterplots of subjective evaluation and sound quality objective parameters
基于Spearman 相關(guān)系數(shù)進(jìn)行分析,進(jìn)一步分析聲品質(zhì)主觀評價(jià)與客觀聲品質(zhì)參量之間的相關(guān)性,結(jié)果如表5 所示。從表5 可以看出,響度與車內(nèi)噪聲主觀舒適性的負(fù)相關(guān)值最大,達(dá)到了-0.88,說明響度對主觀評價(jià)影響較大,尖銳度和粗糙度次之,抖動(dòng)度的負(fù)相關(guān)性最小。
表5 主觀評價(jià)與各客觀指標(biāo)之間的相關(guān)性Table 5 Correlation between subjective evaluation results and sound quality objective parameters
為了建立起客觀聲品質(zhì)參數(shù)與主觀聲品質(zhì)之間的映射關(guān)系,本文采用BP 神經(jīng)網(wǎng)絡(luò),根據(jù)Spearman相關(guān)性分析的結(jié)果,選擇響度、尖銳度、粗糙度、抖動(dòng)度作為網(wǎng)絡(luò)輸入,以主觀評價(jià)結(jié)果作為輸出,研究建立基于聲品質(zhì)客觀參數(shù)的車內(nèi)聲學(xué)舒適性預(yù)測模型。
圖6 主觀評價(jià)結(jié)果與BP 神經(jīng)網(wǎng)絡(luò)預(yù)測值Fig.6 Subjective evaluation results and BP neural network model prediction value
由于響度、尖銳度等心理聲學(xué)參數(shù)只能表征噪聲品質(zhì)某個(gè)方面的特征,無法真實(shí)反映車內(nèi)噪聲的物理特性,所以基于上述參數(shù)的預(yù)測模型不能很好地指導(dǎo)車內(nèi)聲學(xué)舒適性的優(yōu)化,且主觀評價(jià)預(yù)測精度也還有待提高。
CNN 是用于圖像識別等計(jì)算機(jī)視覺任務(wù)的算法模型。使用CNN構(gòu)建主觀評價(jià)預(yù)測模型,可以將車內(nèi)噪聲信號的時(shí)-頻分布圖作為輸入?yún)?shù),相較于傳統(tǒng)使用時(shí)域或者頻域得到的評價(jià)指標(biāo),可以同時(shí)考慮聲音的時(shí)域和頻域特性,增加模型的預(yù)測準(zhǔn)確度。典型的CNN 由以下部件構(gòu)成:輸入層、卷積層、激勵(lì)層、池化層、全連接層和輸出層等。從輸入到輸出的中間進(jìn)行處理的計(jì)算層都稱之為隱含層,CNN中每個(gè)神經(jīng)元的運(yùn)算過程如下:
其中,act()表示激活函數(shù),θ是對神經(jīng)元加權(quán)值,b是加偏置。
卷積層是CNN 最重要的組成部分,通過卷積層對輸入數(shù)據(jù)進(jìn)行處理,一個(gè)卷積核能得到某一個(gè)特征。如果輸入的數(shù)據(jù)的大小為w×h,卷積核的大小為k×k,輸出的數(shù)據(jù)大小為w′×h′,步長為s,則輸出和輸入的關(guān)系如式(4)和式(5)所示:
由于經(jīng)過多個(gè)卷積操作之后,會(huì)產(chǎn)生很大的數(shù)據(jù)量,將增加網(wǎng)絡(luò)的訓(xùn)練難度。為了在減少計(jì)算量的同時(shí)防止過擬合的出現(xiàn),可通過池化層進(jìn)行降維,減少參數(shù)量。全連接層中每個(gè)神經(jīng)元和上一層中的所有節(jié)點(diǎn)相連,會(huì)將傳遞過來的數(shù)據(jù)拉伸成n×1 的列向量,因此全連接層的參數(shù)也是最多的一層。
神經(jīng)網(wǎng)絡(luò)參數(shù)的選擇并沒有固定方法。一般說來,內(nèi)核越多,過濾的類型也就越多,意味著預(yù)測效果越好;而層數(shù)越多,意味著CNN 模型更加完善。但是,內(nèi)核和層數(shù)越多,消耗的計(jì)算資源也就越多,計(jì)算的時(shí)間也就越長,因此需要綜合考慮。本文根據(jù)Ferreira 等[16]的相關(guān)文獻(xiàn)設(shè)計(jì)了如圖7 所示CNN主觀預(yù)測模型。
圖7 CNN 主觀評價(jià)預(yù)測模型Fig.7 CNN prediction model
考慮到CNN 模型所需的大量數(shù)據(jù),每個(gè)車內(nèi)噪聲樣本都分為多個(gè)1 s 的片段。因此,每個(gè)記錄的350 km/h 時(shí)速車內(nèi)噪聲信號可被分成30個(gè)噪聲樣本(每個(gè)樣本對應(yīng)相同的主觀評估得分),總共獲得570 個(gè)噪聲樣本,將所有樣本劃分為80%的訓(xùn)練樣本(456 個(gè))以及20%的檢驗(yàn)樣本(114 個(gè))。然后,將訓(xùn)練樣本輸入到CNN模型中,獲得的結(jié)果如圖8所示。從結(jié)果上看,在經(jīng)過100次迭代之后,CNN模型的準(zhǔn)確度達(dá)到了94.5%。同時(shí)表6 給出了準(zhǔn)確度矩陣,從中可以看出準(zhǔn)確度最低的地方出現(xiàn)在對于‘非常不適’的評價(jià)(91.1%)。
圖8 訓(xùn)練過程和訓(xùn)練準(zhǔn)確度Fig.8 Training progress and accuracy
表6 準(zhǔn)確度矩陣Table 6 Accuracy matrix
相比于BP 神經(jīng)網(wǎng)絡(luò),采用CNN進(jìn)行主客觀預(yù)測,準(zhǔn)確度更高。該主客觀預(yù)測模型一方面可以用于車內(nèi)噪聲主觀評價(jià)預(yù)測,從而避免組織主觀實(shí)驗(yàn)而浪費(fèi)大量的人力和物力;另一方面由于模型輸入是具有真實(shí)物理意義的聲學(xué)時(shí)-頻分布圖,因此還可以指導(dǎo)高速列車車內(nèi)聲品質(zhì)的優(yōu)化設(shè)計(jì)。
本文基于聲學(xué)人工頭設(shè)備,獲取了高速列車在350 km/h速度下不同車廂、不同區(qū)域的雙耳噪聲樣本,對車內(nèi)的主客觀聲品質(zhì)評價(jià)和預(yù)測進(jìn)行了系統(tǒng)研究,主要結(jié)論如下:
(1)高速列車車內(nèi)噪聲存在明顯的低頻特性,不同區(qū)域的噪聲幅值差別較大。噪聲幅值最高的區(qū)域在風(fēng)擋,最小的區(qū)域在客室中部。在客室內(nèi)二等座一位端的噪聲往往相對于中部以及二位端要高。
(2)根據(jù)A 計(jì)權(quán)聲壓級和主觀評價(jià)結(jié)果,A 計(jì)權(quán)聲壓級可以很好地預(yù)測主觀評價(jià)最好以及最差的區(qū)域,對于客室內(nèi)二等座區(qū)域預(yù)測效果較不佳。原因可能在于客室內(nèi)噪聲的頻率分布以及動(dòng)態(tài)時(shí)-頻特性會(huì)影響受試者的評價(jià),因此導(dǎo)致A 計(jì)權(quán)聲壓級不能取得較好的評價(jià)效果。
(3)基于Spearman 相關(guān)系數(shù)分析了客觀聲品質(zhì)參數(shù)與主觀評價(jià)結(jié)果的相關(guān)性,發(fā)現(xiàn)主觀評價(jià)分?jǐn)?shù)與車內(nèi)噪聲的響度負(fù)相關(guān)系數(shù)最大,而與抖動(dòng)度的負(fù)相關(guān)系數(shù)最小。
(4)建立了基于CNN 的聲品質(zhì)預(yù)測模型,將同時(shí)包含車內(nèi)噪聲時(shí)域和頻域信息的時(shí)-頻分布圖作為模型輸入,模型更具有真實(shí)物理意義,預(yù)測精度比BP 神經(jīng)網(wǎng)絡(luò)模型更高,更適宜用于指導(dǎo)高速列車車內(nèi)聲品質(zhì)的優(yōu)化設(shè)計(jì)。