鄒麗媛,王 宏,宋桂秋
(1.東北大學機械工程與自動化學院,遼寧 沈陽 110819;2.遼寧水利職業(yè)學院,遼寧 沈陽 110122)
伴隨我國汽車產(chǎn)業(yè)發(fā)展速度的加快,人們越來越注重乘車的舒適度。NHV性能對乘車舒適度具有直接性影響,成為人們在購車過程中首要考慮的重點指標之一。
發(fā)動機器的尖銳度、周期和響度等都會在一定程度上對發(fā)動機噪聲煩躁度的主觀感知造成直接性影響。聲品質(zhì)評價方法應運而生,其評價流程概括如下:第一,進行評價小組的創(chuàng)立,致力于通過借助多重回歸法,就所提取的噪聲響度、尖銳度以及粗糙度等客觀物理參數(shù)進行客觀量化模型的建立,從而達到主觀進行噪聲評價的目的[1-4],心理聲學由此發(fā)展而來。由于高端轎車對車內(nèi)聲品質(zhì)的高要求,心理聲學的發(fā)展得到極大支持。
近年來,越來越多的國內(nèi)外研究人員將腦電方法用于噪聲暴露的研究,發(fā)現(xiàn)噪聲暴露可改變中樞神經(jīng)系統(tǒng),且其影響程度與噪聲的類型和聲壓級相關。一部分研究人員使用ERP時域分析方法,發(fā)現(xiàn)噪聲環(huán)境睡眠的受試Nogo的P3成分的幅值比安靜環(huán)境睡眠的受試者明顯降低[5],噪聲環(huán)境下P300的成分的幅值顯著提高[6],噪聲聲壓級升高,可導致N1成分的幅值降低、P2成分的幅值升高,額區(qū)變化最為顯著[7]。一部分研究人員研究了多種噪聲環(huán)境下,腦電節(jié)律特性的變化[8-11]。
相比與功率譜密度分析,ERP時域分析等方法,本文使用的基于圖論的腦功能連接復雜網(wǎng)絡可以反映出不同頻段各個導聯(lián)間的關系,將大腦的神經(jīng)系統(tǒng)由基于圖論的復雜功能網(wǎng)絡體現(xiàn),更能直觀地反映出噪聲對大腦功能連結性的影響[12-14]。與此同時,深度學習算法在圖像識別和語音識別等人工智能領域廣受關注。在汽車產(chǎn)業(yè)向智能檢測與制造方向發(fā)展的當下,本文將腦電研究與深度學習相結合并引入車內(nèi)噪聲評價中來。
本文主要選取某高端品牌的轎車、某中端品牌的吉普車及某型號的城市客車三款車型,每個車型各選1臺,平均車速分別控制在30 km/h,50 km/h,80 km/h和靜止但不熄火共4種狀態(tài)。就其車內(nèi)噪聲狀況進行每次時長為8 min的車內(nèi)噪聲錄制。其中噪聲采集位置均設置于駕駛員座位上的人耳所在位置。而后由10名專家組成的專家組對12個車內(nèi)噪聲進行評分,采用10級評分(0為舒適,10為煩躁)。
另外,在實驗人員選取方面,主要選取受試者22名,男女分別11名,年齡22~40歲左右。受試者均無不良身體狀況或聽力障礙。要求所有受試者在實驗之前的48 h內(nèi)不準飲酒、喝咖啡以及使用其他藥物等。實驗在一個燈光相對昏暗且較為安靜的封閉環(huán)境內(nèi)展開。各受試者均坐在舒適的靠椅上,使用雙聲道音箱隨機播放車內(nèi)噪聲,同時其采集腦電信號。
實驗具體流程如下,首先采集1 min的靜息腦電。然后,使用相同音量隨機播放每個刺激噪聲音頻,同時采集被試者的腦電信號,每次實驗中間間隔10 min供被試者休息,并消除組間影響。實驗場景如圖1所示。
圖1 實驗示意
選用Emotiv system的便攜式腦電信號采集儀Emotiv EPOC采集腦電信號,其采樣頻率為128 Hz,共14個電極,以10~20導聯(lián)系統(tǒng)國際標準放置,電極位置如圖2。其中參考電極位于雙側耳后乳突處。
圖2 Emotiv EPOC電極位置
將時間序列xk,i(k表示通道,k=1,…,M;i表示離散時間,i=1,…,N)延遲嵌入m維空間
Xk,i=(xk,i,xk,i+τ,xk,i+2τ,…,xk,i+(m-1)τ)
(1)
τ為延遲時間;m為嵌入維數(shù)。
通過以每個時間序列k與時間點i來對嵌入向量相互之間的距離加以界定,可以得出嵌入向量小于距離ε的概率為
(2)
| |表示歐幾里得距離;θ為Heaviside階梯函數(shù),當x≤0時,θ(x) =0,當x>0時,θ(x) =1;ω1和ω2則代表2個時間窗,其中,ω1表示自相關的Theiler校正,ω2代表銳步同化測量時間分辨率的時間窗,并基本滿足ω1?2?N的條件。
基于每個k和i,就臨界距離εk,i的值加以確定,εk,i由參考概率Pref確定(Pref?1)。
通過對每個成對的離散時間(i,j)進行確定后,當窗ω1< |j-i|<ω2時,嵌入向量Xk,i和Xk,j之間的距離要比臨界距離小,其通道數(shù)
(3)
Hi,j的值在0到M之間。
對于通道k和離散時間(i,j),定義同步似然系數(shù)Sk,i,j
(4)
|Xk,i-Xk,j|≥εk,i,Sk,i,j=0
(5)
對所有j取均值后,可以得到同步似然Sk,i為
(6)
對腦電信號分析時,Pref=0.05??梢越Y合數(shù)據(jù)在時間和頻率方面的特性,進行最佳延遲時間與嵌入維度的選擇。具體參數(shù)數(shù)值設置如下:延遲時間為7,嵌入維度為7;ω1為84;ω2為283。
近年來,針對深度學習的研究深受廣大學者的關注,深度學習可以學習到人工難以提取的有效特征,大大緩解機器學習模型對特征工程的依賴。特征提取過程要求對工程領域有非常深入的理解,使用特定算法提取特征。而深度學習,可以模仿人腦對特征進行逐層掃描,通過多層神經(jīng)網(wǎng)絡的特征學習,提取重構得到有意義的高階特征。此外,腦電信號是非線性信號,其中參雜大量非穩(wěn)態(tài)噪聲,本文使用基于最大相關熵的魯棒棧式稀疏自編碼器RSAE[15]提取特征,結合回歸分析算法構建噪聲煩惱度評價模型。
將delta,alpha和beta 3個頻段的腦功能網(wǎng)絡鄰接矩陣重塑為1×(30×30×3)=1×2 700的一維向量,作為RSAE的輸入,經(jīng)過4層自編碼器提取第四層高階特征作為回歸模型的輸入,輸出估計煩躁度數(shù)值。
自編碼器(autoencoder,AE),即可以使用自身的高階特征編碼自己。自編碼器也是一種神經(jīng)網(wǎng)絡,它的輸入與輸出是一致的,如圖3所示。借助稀疏編碼的思想,使用稀疏的高階特征重構自己,自編碼器的學習過程是無監(jiān)督的。假設其輸入向量為X(包含偏置bias數(shù)值),權值矩陣為W,激活函數(shù)為f(x),提取的特征向量為H。其自編碼與解碼的過程為
H=f(WX)
(7)
(8)
RSAE是多個自編碼器的級聯(lián),n個AE按順序訓練。第一個AE訓練完成后,將編碼器的輸出作為第二個AE的輸入,以此類推。如圖3所示,其中圖3a為第一個自編碼器提取得到一階特征和為第二個自編碼器提取得到二階特征。通過預訓練得到各階特征,將其堆疊如圖3b所示,此時網(wǎng)絡與神經(jīng)網(wǎng)絡相同。
圖3 SAE示意
本文使用四階RSAE,將第四階特征作為之后回歸模型的輸入。其中第一層包含2 048個元素,第二層包含1 024個元素,第三層包含512個元素,第四層包含128個元素,即最終提取128個四階特征作為回歸模型的輸入。
通過反向傳播機制使得目標輸出與輸入無限趨近。最大相關熵的損失函數(shù)J可以表示為
(9)
n為訓練集樣本個數(shù);l為每個樣本的長度;當J取最大值時,參數(shù)θ為最優(yōu)解。
為避免網(wǎng)絡過擬合,使用L2正則化,加入正則化后的損失函數(shù)
(10)
利用現(xiàn)普遍使用的心理聲學聲音品質(zhì)客觀評價模型對采集到的車內(nèi)噪聲進行評價。提取包括響度、尖銳度、粗糙度和抖動強度4項聲音品質(zhì)特征。
圖4為靜止狀態(tài)下3種車型車內(nèi)噪聲與實驗環(huán)境背景音的特征響度平均值隨臨界頻帶的變化曲線,其中實線為實驗室環(huán)境,虛線為高端轎車車內(nèi)噪聲環(huán)境,雙劃線為中端吉普車車內(nèi)噪聲環(huán)境,點實線為城市公交車。從圖4可以看出,在各個bark內(nèi)噪聲嘈雜度越高其特征響度越大。臨界頻帶較高時,中端吉普車與高端轎車較為相似。實驗室環(huán)境只在臨界頻帶較低時有較為明顯的特征響度。
圖4 不同噪聲的平均響度曲線
將各個噪聲環(huán)境下的聲音品質(zhì)參數(shù)特征值統(tǒng)計如表1所示。包括不同環(huán)境下各聲音樣本的平均聲壓級、響度、尖銳度、粗糙度和抖動度。由表1可知:在相對安靜的環(huán)境下,聲音的響度、尖銳度、粗造度和抖動度都較低;而在相對嘈雜的城市公交車車內(nèi)噪聲環(huán)境下,聲音品質(zhì)參數(shù)都較高。
進一步使用回歸模型評估指標對各個構建腦功能連接網(wǎng)絡方法進行比較?;貧w模型的評估指標包括平均絕對誤差(MAE),均方誤差(MSE),均方根誤差(RMSE)和決定系數(shù)(coefficient of determination)等。
平均絕對誤差MAE又被稱為L1范數(shù)損失,能較好地衡量回歸模型的好壞,但是絕對值的存在導致函數(shù)不光滑,在某些點上不能求導,將絕對值改為殘差的平方,即均方誤差MSE,為保證量綱一致,將MSE開方,得到均方根誤差RMSE為
(11)
決定系數(shù)又稱為R2score,其可反映因變量的全部變異能通過回歸關系被自變量解釋的比例,是一個無量綱化的評價指標。
(12)
當決策系數(shù)值為0時,說明模型不能預測因變量;當決策系數(shù)值為1時,說明是函數(shù)關系;當決策系數(shù)數(shù)值在0到1之間,表示模型的好壞程度。
表1 靜止狀態(tài)不同環(huán)境下聲音品質(zhì)參數(shù)統(tǒng)計平均值
前述指標對異常點(Outliers)較為敏感,若樣本中含有一些異常值,會對以上指標有較大影響,而MAPE是一個相對誤差值,其具有較好的魯棒性,即
(13)
結果如表2所示。從表2觀察可見,基于腦功能網(wǎng)絡的車內(nèi)噪聲評價結果好于基于傳統(tǒng)心理聲學聲音品質(zhì)的車內(nèi)噪聲評價結果。同時基于深度學習方法SAE的回歸模型評價結果均優(yōu)于SVM回歸預測結果。其中基于腦功能網(wǎng)絡和SAE的回歸預測方法表現(xiàn)最佳。
表2 不同回歸預測方法的評價指標對比
本文利用同步似然構建腦功能網(wǎng)絡,以功能腦網(wǎng)絡作為輸入基于深度學習堆疊自編碼器算法構建了一個性能良好的車內(nèi)噪聲評價模型。
a.采集不同車型下的車內(nèi)噪聲,由專家組對其進行車內(nèi)噪聲評價。采集受試者暴露于不同噪聲下的腦電信號,預處理后使用同步似然方法構建腦功能網(wǎng)絡,該方法可以計算不同導聯(lián)間線性和非線性耦合關系,反映不同腦區(qū)間信息傳遞、加工、處理的狀態(tài)。
b.使用四層SAE算法自主學習腦功能網(wǎng)絡特征,實現(xiàn)車內(nèi)噪聲評價,該SAE模型平均決定系數(shù)高達98.69%,高于SVM回歸方法。并與基于傳統(tǒng)心理聲學聲音品質(zhì)的車內(nèi)噪聲評價方法對比驗證了使用腦功能網(wǎng)絡進行車內(nèi)噪聲評價的可行性和有效性。