馬志遠,王洪波,孫 晴
(湖南大學 汽車車身先進設(shè)計制造國家重點實驗室,長沙410082)
關(guān)門聲品質(zhì)是消費者對車輛最初的直觀感受之一,直接影響消費者的購車意愿。為得到準確的聲品質(zhì)評價結(jié)果,往往要進行主觀評價實驗,但該過程所花費的時間和人力較多,且評價結(jié)果隨人群差異有較大波動。為此,國內(nèi)外學者研究出了一些聲品質(zhì)預測方法。
關(guān)門聲預測主要分兩個方面研究:信號特征參數(shù)和預測模型。在信號特征參數(shù)的研究中,主要有心理學參量、小波熵系數(shù)[1]、信號能量、峰值、均值[2]等。預測模型的研究有多元非線性回歸、神經(jīng)網(wǎng)絡(luò)和支持向量機等。傳統(tǒng)心理學參量是基于頻域的計算方法得到的,對非穩(wěn)態(tài)噪聲的預測效果不佳[3]。對于同一類噪聲,不同的預測模型在預測精度和預測效率上有較大的差異。信號特征的提取與預測模型的選擇對關(guān)門聲品質(zhì)預測具有重要意義。
相比其他時頻分析方法,EEMD[4]并不涉及到任何頻域的內(nèi)容,完全由自身性質(zhì)出發(fā),克服了傅氏變換在處理非線性、非平穩(wěn)信號的不足,同時解決了EMD分解中的模態(tài)混疊問題;基于EEMD分解的樣本熵[5]能有效反映序列的復雜度,可有效表征信號特征;小波在緊支集中能任意逼近非線性連續(xù)函數(shù)的特點和它在時頻域都有分辨的特點,使得以小波分析理論為基礎(chǔ)構(gòu)造的小波神經(jīng)網(wǎng)絡(luò)更適合于學習局部非線性和快速變化的函數(shù)[6]。依據(jù)上述方法的特征,本文以汽車關(guān)門聲為研究對象,以得到準確高效的關(guān)門聲品質(zhì)預測值為目標,提出了基于EEMD 分解的樣本熵和小波神經(jīng)網(wǎng)絡(luò)的聲品質(zhì)預測模型。通過與心理學參數(shù)和BP神經(jīng)網(wǎng)絡(luò)對比,突出了本模型在關(guān)門聲品質(zhì)預測中的優(yōu)勢。
選用德國朗德公司(Head Acoustics)的數(shù)字式仿 真 人 工 頭HMS III(head manual system)以 及SQLab II多通道數(shù)據(jù)采集記錄器及前端進行關(guān)門聲樣本的采集工作。該系統(tǒng)模擬了人的整個聽覺系統(tǒng),使得其采集的聲樣本能夠準確記錄聲場環(huán)境的空間信息,從而保證所采信號用于聲品質(zhì)的主客觀分析時具有更高的準確度。關(guān)門聲品質(zhì)測量實驗對測量環(huán)境有較高的要求,由于實驗條件限制,實驗是在安靜空曠的室外進行的;在采集聲樣本時,汽車為空載,所有車窗處于關(guān)閉狀態(tài),輔助裝置停止工作;關(guān)門時,保證每輛車的關(guān)門角度為60°左右,關(guān)門速度控制在1.2±0.05 m/s。設(shè)置人工頭系統(tǒng)的采樣率為48 kHz,采樣時間為5 s。實驗選取了12輛不同類別的轎車作為研究對象,共采集得到65個關(guān)門聲樣本。聲樣本采集實驗如圖1所示。
圖1 關(guān)門聲樣本采集實驗
通過后期對比分析,從中選取26個主觀感覺不同的聲樣本作為本文的分析樣本。將樣本編號為s1-s26。其中聲樣本s1 的時域波形如圖2所示。(注:圖中只顯示了0.7 s的數(shù)據(jù))
圖2 聲樣本s1的時域波形
1.2.1 主觀評價過程
聲品質(zhì)的主觀評價以人為主體,將人工頭錄制的噪聲進行回放,評審人員依據(jù)一定的規(guī)則對聲樣本的進行評分。常用的聲品質(zhì)主觀評價方法有排序法、等級評分法、成對比較法、語義細分法等。等級評分法相比其他方法具有簡單快捷,工作量相對較小,評價結(jié)果為等級評分數(shù)值,便于后續(xù)處理分析的優(yōu)點。本文選擇等級評分法對26 個關(guān)門聲樣本進行聲品質(zhì)評分。以國際上通用的10 刻度等級作為主觀評分量化表法,評分等級如表1所示。
表1 主觀評價試驗評分等級
選取33 名聽力正常、身體健康、年齡在20-45歲之間的在校師生作為主觀評審團成員實施主觀評價實驗,其中男性23名,女性10名。在主觀評價前,先對評價者做相關(guān)聽音訓練,確保評價結(jié)果的可靠性;聽音實驗在安靜室內(nèi)進行,采用HD650 型高保真耳機對聲樣本進行回放。為保證評價結(jié)果的可靠性,對每個關(guān)門聲樣本的全部評價結(jié)果舍去最大最小值后取平均值作為該樣本的主觀聲品質(zhì)得分。部分結(jié)果如表2所示。
1.2.2 心理學客觀參數(shù)
雖然主觀評價能夠反映評價者對聲音的主觀感受,得到的評價結(jié)果更加真實,但由于主觀評價也會受到評價主體間認知、經(jīng)驗等各種因素的影響,所以很多學者期望采用和心理學相關(guān)的聲學參量來量化人們的主觀感受。常用的客觀心理學參數(shù)主要有響度、尖銳度、粗糙度、抖動度等。關(guān)門聲屬于典型的沖擊性信號,在以往對于關(guān)門聲評價有如下幾種指標[7]:主沖擊時間、低頻延續(xù)、高頻成分、峰值聲壓級。本文基于文獻[8]來選取心理聲學客觀參數(shù),主沖擊時間對應(yīng)著響度;低頻延續(xù)對應(yīng)著抖動度,反映了低頻變化;高頻成分對應(yīng)著尖銳度及粗糙度,尖銳度反映了高頻成分,粗糙度反映了高頻變化;峰值聲壓級對應(yīng)著A 計權(quán)聲壓級。應(yīng)用軟件Head Artemis7.0 對所有聲樣本的所選心理學客觀參數(shù)進行計算。部分結(jié)果如表2所示。
EEMD 是對EMD(Empirical Mode Decomposition)改進得到的一種自適應(yīng)信號處理方法,繼承了EMD 可以按照信號的局部特性實現(xiàn)相應(yīng)的時頻分解的優(yōu)點,且有效解決了模態(tài)混疊現(xiàn)象,使分解得到的IMF 分量具有更為集中的頻率信息,尤其適用于非線性、非平穩(wěn)信號的研究。EEMD 算法的核心在于利用高斯白噪聲零均值的統(tǒng)計特性,算法的具體步驟如下:
(1)確定分析信號x(t),向其添加幅值系數(shù)為ε的高斯白噪聲,設(shè)置迭代次數(shù)為N0次,即
式中:wj(t)為第j次添加的白噪聲序列;xj(t)為染噪信號。
(2)對xj(t)進行EMD分解,得到IMF分量;
(3)重復步驟(1)、(2)N0次,且每次采用不同的白噪聲序列;
(4)將所有的IMF分量按層取平均值。即
式中:IMFji為第j次分解的第i層IMF分量。
(5)得到EEMD的分解結(jié)果為
式中:rˉ為N0次分解趨勢項的均值。
樣本熵是一種量化時間序列復雜性的度量方法,計算給定時間序列條件概率的自然對數(shù)。樣本熵具有得到穩(wěn)定估計值所需的數(shù)據(jù)短、抗噪聲和干擾能力強、在參數(shù)大取值范圍內(nèi)一致性好等特點[9],非常適合工程噪聲、振動信號的分析。
對于長度為N的時間序列{u(n)|n=1,2,…,N},給定維數(shù)m及相容極限r(nóng),樣本熵的計算步驟如下:
(1)將原始數(shù)據(jù)劃分為一組m維的矢量:X(i)=[u(i),u(i+1),…,u(i+m-1)],i=1,2,…,N-m+1;
(2)定義矢量X(i)與X(j)之間的距離為兩矢量對應(yīng)元素的最大差值的絕對值,即
(3)對于給定X(i),統(tǒng)計d[X(i),X(j)]<r的數(shù)目,記為Bi,并計算其與距離總數(shù)的比值,記為Bmi(r)
i,j=1~N-m+1且i≠j
(4)計算Bmi(r)的平均值,記為Bmarg(r)
(5)維度變?yōu)閙+1,重復(1)-(4)步可得Bm+1arg(r)。這樣Bmarg(r)和Bm+1arg(r)分別為序列在給定相容極限r(nóng)下匹配m個點和匹配m+1個點的條件概率。
(6)樣本熵的定義為
當N為有限值時,可用下式估算
由樣本熵的定義式可知,當序列長度N一定時,樣本熵的大小與維度m及相容極限r(nóng)有關(guān)。根據(jù)Pincus[5]的研究結(jié)果,取m=1~2,r=(0.15~0.25)*std(std 為原始序列X(n)的標準差)時,計算得到的樣本熵具有較為合理的統(tǒng)計特性,因此本文取m=2,r=0.2*std。另外,序列長度N的大小也會影響樣本熵值,序列長度越長,樣本熵越穩(wěn)定,但計算量也會增加。關(guān)門聲是一個沖擊噪聲,由圖1的關(guān)門聲時域波形可知關(guān)門聲的持續(xù)時間在0.5 s以內(nèi),本文考慮到計算結(jié)果合理性與計算復雜度的影響,將所有聲樣本都截取成0.7 s 的數(shù)據(jù)共33 600 個數(shù)據(jù)點用于信號特征提取。
以關(guān)門聲樣本s1為例,對其截取的0.7 s數(shù)據(jù)進行信號特征提取的過程如下:
表2 聲樣本的心理學客觀參數(shù)值和主觀評分值
(1)高通濾波。由信號的頻譜可知,信號在20 Hz 以下具有較大的幅值,而20 Hz 以下的聲音不在人耳可聽聲頻率范圍內(nèi),應(yīng)予以濾除。
(2)對濾波后的信號進行EEMD 分解。根據(jù)研究經(jīng)驗[4],設(shè)置迭代次數(shù)為100 次、高斯白噪聲幅值系數(shù)為0.4;樣本的前10層分解的結(jié)果如圖3所示。
圖3 聲樣本s1的EEMD分解結(jié)果
(3)計算EEMD分解的各IMF分量的樣本熵。
(4)將各層分量按分解層順序組成一個10 維特征向量,此即為該樣本信號的基于EEMD 分解的樣本熵特征向量。
將所有研究樣本的信號特征向量提取后記錄在表3中用于后續(xù)分析。由于篇幅有限,在此只顯示部分計算結(jié)果。
小波神經(jīng)網(wǎng)絡(luò)是在BP神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,用神經(jīng)網(wǎng)絡(luò)的權(quán)值代替離散小波變換中的系數(shù)而構(gòu)成。小波網(wǎng)絡(luò)的基元和整個結(jié)構(gòu)是依據(jù)小波分析理論確定的,可以避免BP 神經(jīng)網(wǎng)絡(luò)等結(jié)構(gòu)設(shè)計的盲目性;其次小波網(wǎng)絡(luò)有更強的學習能力,精度更高;最后對同樣的學習任務(wù),小波網(wǎng)絡(luò)結(jié)構(gòu)更簡單,收斂速度更快。小波神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)如圖4所示。
圖4 小波神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)
設(shè)輸入層到隱含層的連接權(quán)值為ω1ij,隱含層到輸出層連接權(quán)值為ω2jk,輸入向量X=(X1,X2,…,Xn)輸出向量Y=(Y1,Y2,…,Ym)。則可得隱含層神經(jīng)元的輸入為
隱含層小波函數(shù)的表達式為
式中:aj、bj分別為隱含層第j個節(jié)點的小波基函數(shù)的伸縮因子與平移因子,ψ(x)為母小波函數(shù);
聯(lián)立式(9)、式(10)式得隱含層的輸出為
從而可得模型的輸出為
本文選用基于EEMD 分解的樣本熵的10 維特征向量作為模型的輸入,輸出為聲樣本的主觀評分值。即可確定輸入層節(jié)點數(shù)目為10,輸出層節(jié)點數(shù)目為1。隱含層的節(jié)點數(shù)一般按下式確定。
表3 關(guān)門聲樣本在各層IMF分量下的樣本熵值
式中:n為隱含層節(jié)點數(shù)目,m為輸入層節(jié)點數(shù)目。由此確定小波神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)為10-21-1。選用Morlet小波作為隱含層的傳輸函數(shù),其表達式為
同時,為顯示基于EEMD 分解的樣本熵特征向量及小波神經(jīng)網(wǎng)絡(luò)模型的優(yōu)勢,建立了基于EEMD分解的樣本熵的BP網(wǎng)絡(luò)預測模型、基于心理學客觀參數(shù)的小波神經(jīng)網(wǎng)絡(luò)預測模型、基于心理學客觀參數(shù)與BP 神經(jīng)網(wǎng)絡(luò)的預測模型。心理學參量如表2所列;BP網(wǎng)絡(luò)的傳輸函數(shù)選用sigmoid,隱含層神經(jīng)元數(shù)目由n=i+o+a(i、o 分別為輸入輸出層神經(jīng)元的個數(shù),a取1~10)確定。最終確定各網(wǎng)絡(luò)的結(jié)構(gòu)分別為10-12-1、5-11-1、5-8-1。從26 個聲樣本中選取前20 個樣本用于模型的訓練,剩余的6 個樣本用于模型檢測,并對輸入輸出樣本進行歸一化處理。各網(wǎng)絡(luò)訓練時采用默認Levenberg-Marquardt算法,設(shè)置訓練精度0.01 為網(wǎng)絡(luò)收斂條件。由于神經(jīng)網(wǎng)絡(luò)每次的運算結(jié)果不同,各模型預測結(jié)果取模型運行100次后的均值,如圖5和表4所示。
其中表4中的決定系數(shù)用于表征模型的預測效果,其計算公式如下
式中:yi分別為樣本i的主觀評分實際值與預測值,為實際值的均值。決定系數(shù)越大,預測越準確??梢钥闯?,模型#1 預測效果最好,平均相對誤差為2.52,均方誤差函數(shù)為0.23,決定系數(shù)為0.971 1。對比模型#1 和#3、#2 和#4,可知IMF 樣本熵較心理學參數(shù)更優(yōu);對比模型#1 和#2、#3 和#4 可知小波網(wǎng)絡(luò)較BP網(wǎng)絡(luò)預測更準確,運行時間更短。模型#1更適合于關(guān)門聲品質(zhì)預測。
對采集的關(guān)門聲樣本進行EEMD 分解,得到反映時頻特征的IMF 分量。在此基礎(chǔ)上,計算IMF 分量的樣本熵,并按順序組合成10維特征向量。由此向量預測汽車關(guān)門聲品質(zhì)的效果較心理學客觀參數(shù)更優(yōu);構(gòu)建了基于Molert 小波基的小波神經(jīng)網(wǎng)絡(luò)的關(guān)門聲品質(zhì)預測模型。并將之與BP 網(wǎng)絡(luò)構(gòu)建的模型作為對比,結(jié)果顯示基于小波神經(jīng)網(wǎng)絡(luò)的預測模型精度更高,訓練速度更快。綜上,基于EEMD分解的樣本熵與小波神經(jīng)網(wǎng)絡(luò)的聲品質(zhì)預測模型可有效應(yīng)用于汽車關(guān)門聲品質(zhì)預測。
圖5 各模型的關(guān)門聲品質(zhì)預測結(jié)果
表4 各模型的關(guān)門聲品質(zhì)預測效果對比