• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于分頻段ABAP譜減法的鳥叫聲分類研究

    2015-08-08 11:31:22張妍琰劉建芳郭力爭
    關(guān)鍵詞:鳥叫聲頻帶方差

    張妍琰,劉建芳,郭力爭

    (1.河南城建學(xué)院 計算機科學(xué)與工程學(xué)院,河南 平頂山 467036;2.平頂山學(xué)院 軟件學(xué)院,河南 平頂山 467000)

    0 引言

    鳥類是自然生物的重要成員之一,在物種演化的漫長過程中,大多鳥類都形成了具有自身特異性的鳴叫聲.通過對鳥叫聲的研究,有利于提高對鳥類資源、種類、數(shù)量、生存區(qū)域統(tǒng)計調(diào)查的準(zhǔn)確性、真實性和可靠性,同時可將其作為分析自然聲音的組成結(jié)構(gòu)和動物行為的典型樣例.

    自然環(huán)境中的鳥叫聲通常伴有雜音,為了去除噪聲,得到較為純凈的聲音信號,必須借助于各種聲音增強算法.譜減法[1]是聲音增強算法中重要的非參數(shù)方法,譜減法以其原理簡單、運算量小、性能穩(wěn)定而受到最為廣泛的關(guān)注和研究.傳統(tǒng)譜減法[2-3]采用的周期圖估計并非一致估計,方差很大,并造成“音樂噪聲”,影響譜減后聲音分類效果,尤其是鳥類聲音的分類,因為鳥叫聲中夾雜的自然環(huán)境噪聲組成復(fù)雜、種類繁多,且在頻域上分布較廣.為了抑制“音樂噪聲”,降低方差,Hendriks等人通過搜索功率譜的最長平穩(wěn)段,進行周期圖平滑,進而減小周期圖估計的方差[4].但是因果系統(tǒng)并不能得到理論上的最長平穩(wěn)段,該搜索過程還需要較大的數(shù)據(jù)存儲量和計算量,并且這種周期圖平滑利用的只是時域的平穩(wěn)性,卻沒有考慮功率譜頻域上的結(jié)構(gòu)特征,無法應(yīng)對復(fù)雜的自然聲音.Ephraim等人提出的引導(dǎo)決策(Decision-Directed, DD)算法能夠較好地估計高信噪比情況下的功率譜[5].但是當(dāng)信噪比較低時,DD算法會低估先驗信噪比,造成跟蹤延遲和聲音失真的問題[6].Gustafsson等人采用Bartlett平均周期圖(Bartlett Averaging Periodogram, BAP)方法先將信號分段估計,然后平均各個分段結(jié)果[7],以減小估計方差,平滑功率譜圖.但是該方法造成嚴重的能量泄露,影響算法性能.Welch方法引進重疊加窗改進了Bartlett法,雖然能在一定程度上抑制能量泄露,但是窗函數(shù)的選擇對估計效果影響較大,需事先針對不同信號和不同的處理目的選擇合適的窗函數(shù).實際上,噪聲功率譜的結(jié)構(gòu)特征變化復(fù)雜,既可能是平坦的連續(xù)譜,如白噪聲譜;也包括離散的線譜,如正弦信號等周期信號的功率譜;更普遍的是既包括連續(xù)譜又包括非連續(xù)譜的復(fù)雜譜.對于連續(xù)譜噪聲,應(yīng)采用頻率分辨率較低的功率譜估計以減小方差,從而減少“音樂噪聲’;而對非連續(xù)譜噪聲,則應(yīng)該采用頻率分辨率較高的功率譜計以降低噪聲譜能量泄露,減少聲音失真.因此無論哪種功率譜估計方法,都難以在方差和頻率分辨率之間取得良好的折中.

    針對上述問題,本文提出了基于噪聲譜結(jié)構(gòu)特征的自適應(yīng)Bartlett平均周期圖(Adaptive Bartlett Averaging Periodogram, ABAP)方法,根據(jù)噪聲譜的結(jié)構(gòu)特征對周期圖進行自適應(yīng)平滑.真實環(huán)境中的噪聲對整個聲音信號整個頻譜的影響并不均勻[8],因此本文將ABAP應(yīng)用于分頻段譜減法(Multi-band Spectral Subtraction,MSS)[9],對自然環(huán)境的鳥叫聲進行降噪處理,以減少音樂噪聲和聲音失真.傳統(tǒng)的Mel頻率倒譜系數(shù)(Mel Frequency Cepstrum Coefficient, MFCC)充分利用人耳聽覺感知特性,經(jīng)常被作為聲音特征用于分類識別[10],但是MFCC遇到噪聲性能驟降.因此本文將含噪聲的鳥叫聲信號經(jīng)過前端改進的降噪處理后,在傳統(tǒng)的MFCC基礎(chǔ)上加入二維離散余弦變換[11],提取更具有針對性、動態(tài)性和魯棒性的二維Mel頻率倒譜系數(shù)(Two Dimensional Mel-Frequency Cepstrum Coefficients, TDMFCC)來表征鳥叫聲信號,最后結(jié)合判決分類器支持向量機(Support Vector Machine, SVM)來對含噪聲的鳥叫聲進行分類識別.

    1 前端降噪

    1.1 ABAP法

    假設(shè)純凈聲音為s(n),噪聲為d(n),則帶噪聲音表示為y(n)=s(n)+d(n).去噪的目的就是從復(fù)雜的帶噪聲音y(n)中估計出純凈聲音s(n).

    YN(k,l)為y(n)第l幀N點快速傅里葉變換(FFT)第k個頻帶分量,其相應(yīng)的周期圖為[12]

    (1)

    直接周期圖法估計的功率譜方差過大,因此引入Bartlett平均周期圖(BAP)法,對信號進行幀內(nèi)分段估計,然后取平均值.

    YM(k,l)是第l幀M點FFT第k個頻帶分量,其相應(yīng)的Bartlett平均周期圖表示為

    (2)

    其中:N=LM,L是BAP的平均段數(shù),M是每段的樣本點數(shù).通過幀內(nèi)分段平滑,BAP有效降低功率譜方差.

    對較為平穩(wěn)的聲音功率譜,BAP法有良好的效果,能有效彌補直接周期圖法功率譜估計存在的方差過大的缺陷.而對于波峰較窄的信號,當(dāng)在頻域上變化較大時,所估計BAP分辨率過低,能量泄露較為嚴重,不能準(zhǔn)確反應(yīng)聲音信號.因此在BAP法的基礎(chǔ)上,引入自適應(yīng)頻帶結(jié)構(gòu)特性平滑機制,形成自適應(yīng)Bartlett平均周期圖(ABAP)法來進行噪聲功率譜估計.分析噪聲譜的結(jié)構(gòu)特性,根據(jù)頻帶間連續(xù)程度,將其區(qū)分為連續(xù)譜和非連續(xù)譜.判斷噪聲譜是否頻帶間連續(xù),如果是,則在譜線之間做平滑;否則,不做平滑.

    (3)

    其中,權(quán)值wi滿足:

    (4)

    引入當(dāng)前頻帶與相鄰頻帶的功率譜期望比值,作為判斷噪聲譜是否連續(xù)的依據(jù),即:

    (5)

    其中,E(PD(k))為噪聲功率譜期望.當(dāng)φ(k,l)越接近1,表示頻帶k與頻帶k+i的期望越接近,其譜結(jié)構(gòu)越相似,因此這兩頻帶間可以進行平滑以減少方差.

    但是判斷每個頻帶與周圍2Kf個頻帶的結(jié)構(gòu)連續(xù)性,所需要的運算量過大,無法滿足聲音分類實時性的要求.因此,考慮頻帶k與相鄰2Kf+1個頻帶功率譜均值的比作為判決依據(jù).

    (6)

    為了防止異常噪聲點大值的影響,利用調(diào)和平均數(shù)來代替功率譜均值的計算.

    (7)

    其中,實驗中為PD(k+i)設(shè)置下限值0.5,以排除出現(xiàn)零點時均值過小的誤差.

    計算判決依據(jù),并確定當(dāng)前頻帶的權(quán)值wk,

    (8)

    (9)

    (10)

    圖1中(a)、(b)、(c)分別展示了周期信號加帶通白噪聲的3種功率譜估計方法的效果.(a)中直接周期圖法的幀長N取32 ms的采樣點數(shù),(b)中BAP法將N劃分為L段,每段的M取4 ms的采樣點數(shù).

    (a)直接周期圖法估計結(jié)果

    (b) BAP法估計結(jié)果

    (c)ABAP法估計結(jié)果圖1 周期信號加帶通白噪聲的噪聲功率譜估計結(jié)果Fig.1 Noise power spectrum estimation result of periodic signal with band-pass white noise

    由圖1的3個對比圖可知,(a)中的直接周期圖法有較高的分辨率,能量泄露較小,對周期信號具有良好的估計特性,能有效估計窄帶噪聲,但是對像白噪聲這樣的寬帶噪聲,估計的方差很大;(b)中的BAP法雖然方差較小,但能量泄露比較嚴重,幾乎看不到譜線結(jié)構(gòu),只適用于連續(xù)譜估計;(c)中即本文提出的ABAP法,能夠根據(jù)頻帶間譜結(jié)構(gòu)的連續(xù)性來自適應(yīng)地平滑周期圖,較好地緩解了傳統(tǒng)周期圖估計中頻率分辨率與能量泄露之間的矛盾.

    1.2 分頻段ABAP譜減法

    自然環(huán)境的有色背景噪聲(風(fēng)雨聲、流水聲等)大多是非平穩(wěn)信號,其均值、功率譜、相關(guān)函數(shù)等統(tǒng)計量具有隨機性,對聲音信號功率譜各頻段的影響也具有不確定性.因此本文針對不同頻率段中噪聲譜的影響程度,引入分頻段譜減法,并將ABAP的噪聲估計方法應(yīng)用于其中,形成分頻段ABAP譜減法來對帶噪聲音進行降噪,以此提高聲音質(zhì)量.

    (11)

    (12)

    再根據(jù)SNRi(l)和實際實驗將αi(l)設(shè)定為:

    (13)

    αi(l)隨著信噪比非線性變化,對于信噪比較低的頻段αi(l)的取值較大,這使得譜減過程中的噪聲干擾被有效抑制.

    式(11)中的δi(l)代表用來設(shè)定噪聲移除特性的補償因子,根據(jù)聲音的實際情況和經(jīng)驗設(shè)置為:

    (14)

    其中:fi(l)為第l幀的第i個子頻帶的最高頻率,F(xiàn)s為聲音信號的采樣率.

    最后,對上述譜減后出現(xiàn)負值的情況進行下限修改,

    (15)

    Smin(k,l)=Smin-(1-wk)Smax,

    (16)

    其中:Smin取0.1|Yi(k,l)|2,Smin取0.9Smin.

    采用式(15)、(16)主要基于以下兩點考慮:第一,對于連續(xù)譜,保留殘留噪聲不變,利用其寬帶特性掩蔽“音樂噪聲”;第二,與連續(xù)譜相比,非連續(xù)譜往往具有更大的能量,因此需要對其進行更多抑制,使得殘留噪聲譜更加平坦,減少音調(diào)音出現(xiàn).

    1.3 分頻段ABAP譜減法性能測試

    為了測試分頻段ABAP譜減法對自然環(huán)境噪聲移除的有效性,將直接周期圖估計譜減法、BAP估計譜減法與本文提出的分頻段ABAP譜減法進行降噪性能對比實驗.對添加10 dB溪流噪聲的畫眉鳥叫聲,分別使用上述3種不同方法進行降噪處理,其效果如圖2(a)、(b)、(c)的3種聲譜圖所示,由圖2可知:(1)使用直接周期圖估計譜減法對帶溪流噪聲的畫眉鳥叫聲降噪后,依然存在大量音樂噪聲.(2)使用BAP估計譜減法對畫眉鳥叫聲降噪后,雖然沒有音樂噪聲,但是低頻段聲音被嚴重抑制,信號能量泄露嚴重,聲音失真較為嚴重.(3)使用分頻段ABAP譜減法降噪后,不但沒有殘留音樂噪聲,而且低頻段的聲音失真也較少,降噪效果較好.

    (a)直接周期圖估計譜減法降噪后的畫眉聲譜圖

    (b)BAP估計譜減法降噪后的畫眉聲譜圖

    (c)分頻段ABAP譜減法降噪后的畫眉聲譜圖

    綜上說明,本文提出的分頻段ABAP譜減法既能解決噪聲估計方差太大的問題,減少音樂噪聲,又能有效解決因能量泄露而導(dǎo)致的聲音失真問題.

    2 TDMFCC特征提取

    多頻段的頻譜結(jié)構(gòu)變化包含了聲音信號的動態(tài)特征,為了更加充分地利用聲音信號的動態(tài)和靜態(tài)特征,本文引入二維離散余弦變換[13-14]的Mel頻率倒譜系數(shù)(Two Dimensional Mel-Frequency Cepstrum Coefficients, TDMFCC).

    Mel頻率倒譜系數(shù)[15-16]是目前廣泛使用的聲音識別特征,信號的第t幀第q個MFCC系數(shù)可以表示為:

    (17)

    其中:Ei(b)表示通過第t幀第b個Mel濾波器的能量,B是Mel濾波器的總數(shù)量.經(jīng)過二次離散余弦變換(Discrete Cosine Transform, DCT)后的TDMFCC矩陣可以表示為:

    0≤q

    (18)

    其中:n是調(diào)制頻率的索引,L是聲音信號的總幀數(shù).

    TDMFCC的結(jié)構(gòu)圖如圖3所示,通過對連續(xù)對數(shù)頻譜序列進行橫向二次DCT變換,可以得到包含各序列間頻譜變化信息的TDMFCC矩陣.但是由于二次DCT變換使得頻譜信息的存儲量增加,因此需要考慮算法的計算效率.

    低維的頻率參數(shù)和時間參數(shù)能為聲音分類提供更多的全局變化信息.圖3(3)中的A、D區(qū)域主要包含隨著時間變化的局部對數(shù)譜均值信息,C區(qū)域主要體現(xiàn)頻譜結(jié)構(gòu)的細化信息,而有利于聲音分類的對數(shù)譜全局變化情況,主要體現(xiàn)于B區(qū)域.為了使用較少的空間獲得較多的頻譜變化信息,本文選取B區(qū)域的15行5列TDMFCC子矩陣作為聲音信號的主特征,用于分類識別,其表達式如下:

    TDMFCC=[c(0,0),…,c(0,4),c(1,0),…,

    c(1,4),…,c(14,0),…,c(14,4)]T.

    (19)

    圖3 TDMFCC矩陣Fig.3 The TDMFCC matrix

    3 結(jié)果與分析

    實驗中用到的鳥叫聲來自Freesound[17]聲音數(shù)據(jù)庫,具體類別如表1所示.每類聲音有50個聲音樣本,每個樣本的采樣率為11 025 kHz,量化精度為16 bits,持續(xù)時間長度為4~6 s,格式為wav,單聲道.隨機選擇20個樣本用于訓(xùn)練,另外30個樣本用于測試.為了模擬實際噪聲場景,將測試聲音樣本分別與不同背景噪聲分別按40、30、20、10、0 dB的信噪比合成.實驗所用的背景噪聲分別為高斯白噪聲、海浪噪聲、溪流噪聲,其中高斯白噪聲用噪聲發(fā)生器生成,海浪噪聲及溪流噪聲從實地采集.

    實驗直接使用LIBSVM[18]工具箱,選用徑向基核函數(shù),采用自動尋優(yōu)方式設(shè)置懲罰因子等參數(shù),利用“一對一”的多分類策略,來對聲音信號進行SVM建模分類,得出識別結(jié)果.

    表1 實驗數(shù)據(jù)Tab.1 Experimental data

    實驗旨在驗證本文所提方法對噪聲環(huán)境下的鳥叫聲分類的有效性,因此分別對MFCC、TDMFCC以及用文中所提的分頻段ABAP譜減法降噪后的MFCC(標(biāo)記為ABAP_MSS+MFCC)、分頻段ABAP譜減法降噪后的TDMFCC(標(biāo)記為ABAP_MSS+TDMFCC)進行SVM建模分類的聲音識別實驗,前3個為對照實驗,第4個為目標(biāo)實驗.針對高斯白噪聲、海浪噪聲、溪流噪聲這3種不同噪聲下不同信噪比的平均分類結(jié)果如表2所示.而針對這3種不同噪聲類型和不同信噪比所對應(yīng)的實驗結(jié)果如圖4所示.

    表2 不同噪聲類型下不同信噪比的平均分類結(jié)果Tab.2 The average classification rates of different SNRs under different types of noises

    由表2的實驗結(jié)果可以看出,雖然是在高斯白噪聲、海浪噪聲和溪流噪聲這3種不同背景噪聲類型下,但是其鳥叫聲的平均識別率具有相類似的規(guī)律:MFCC的平均識別率最低,而ABAP_MSS+TDMFCC是四個特征中識別率最高的.根據(jù)該表的數(shù)據(jù)可得,TDMFCC比MFCC的分類性能提高了至少4.35%;使用本文提出的ABAP_MSS方法降噪后的MFCC和TDMFCC,比不使用該方法的MFCC和TDMFCC的分類效果更好,其性能分別提高了至少6.07%和11.12%.由此可見,本文提出的經(jīng)過ABAP_MSS方法降噪后的TDMFCC,識別性能更好,對不同類型的噪聲更具有魯棒性.

    (b) 海浪噪聲下4種特征的分類結(jié)果

    (c) 溪流噪聲下4種特征的分類結(jié)果

    由圖4(a)、(b)、(c)的實驗結(jié)果柱狀圖可以看出,無論是平譜噪聲還是有色噪聲環(huán)境下,4種特征的識別率都隨著信噪比的減小而降低,但是下降的速度有所不同.MFCC下降的速率最快,TDMFCC次之,而經(jīng)過降噪后的ABAP_MSS+MFCC和ABAP_MSS+TDMFCC的識別率下降速度分別為次慢和最慢.說明前面兩者受噪聲干擾較大,而后面兩者對噪聲具有一定的魯棒性.當(dāng)信噪比為40 dB時,4種特征的識別率都較高,在90%以上.而當(dāng)信噪比下降到20 dB以下時,ABAP_MSS+TDMFCC的識別率與其他3種特征相比,具有顯著提高,性能明顯優(yōu)于其他.說明本文提出的ABAP_MSS+TDMFCC具有較好的抗噪功能,尤其是在低信噪比時,比如小于20 dB,效果顯著.

    4 結(jié)論

    針對噪聲環(huán)境下的鳥叫聲分類問題,提出一種經(jīng)過分頻帶自適應(yīng)Bartlett平均周期圖譜減法(ABAP_MSS)降噪后提取TDMFCC特征結(jié)合SVM分類器對帶噪鳥叫聲進行分類的方法.不同噪聲類型下和不同信噪比下的實驗結(jié)果證明,該方法的分類性能較現(xiàn)有的MFCC與降噪后的MFCC更優(yōu).ABAP_MSS降噪方法能夠有效減少音樂噪聲和聲音失真,削弱噪聲干擾.因此,當(dāng)信噪比較高時,ABAP_MSS+TDMFCC的分類效果略微優(yōu)于其他方法;但是當(dāng)信噪比較低時,該方法的分類效果具有顯著提高.由此說明,本文提出的ABAP_MSS+TDMFCC具有良好抗噪能力,且適用于帶噪鳥叫聲的分類.但是,當(dāng)信噪比處于0 dB以下時,降噪方法可能帶來音樂噪聲和失真問題,導(dǎo)致分類效果變差.更低信噪比下的分類問題,以及將分類方法推廣至其他應(yīng)用中的研究工作天在進行中.

    猜你喜歡
    鳥叫聲頻帶方差
    方差怎么算
    喜歡“你” 有道理
    概率與統(tǒng)計(2)——離散型隨機變量的期望與方差
    Wi-Fi網(wǎng)絡(luò)中5G和2.4G是什么?有何區(qū)別?
    計算方差用哪個公式
    單音及部分頻帶干擾下DSSS系統(tǒng)性能分析
    I’ve Never Thought
    雙頻帶隔板極化器
    電子測試(2017年15期)2017-12-18 07:18:51
    方差生活秀
    楚雄市| 明星| 法库县| 昔阳县| 高青县| 横山县| 银川市| 尼玛县| 繁昌县| 安义县| SHOW| 甘孜县| 揭西县| 墨脱县| 西吉县| 右玉县| 固阳县| 武陟县| 连城县| 诸暨市| 利津县| 尼木县| 保德县| 赤壁市| 锦屏县| 通辽市| 海南省| 陕西省| 曲阜市| 北川| 中阳县| 堆龙德庆县| 沈丘县| 安塞县| 边坝县| 三江| 吕梁市| 临沭县| 会泽县| 自治县| 大理市|