王曉華,屈 雷,張 超,蔣細(xì)偉
(西安工程大學(xué) 電子信息學(xué)院,陜西 西安 710048)
?
基于Fisher比的Bark小波包變換的語音特征提取算法
王曉華,屈 雷,張 超,蔣細(xì)偉
(西安工程大學(xué) 電子信息學(xué)院,陜西 西安 710048)
為解決MFCC特征參數(shù)在噪聲環(huán)境中識(shí)別率低的問題,提出一種基于Fisher比的Bark小波包變換特征提取算法.首先采用小波包變換構(gòu)造Bark濾波器代替三角形的Mel濾波器.其次采用Fisher對(duì)Bark濾波后的特征參數(shù)進(jìn)行選擇,去除大量干擾信息,節(jié)省特征匹配的時(shí)間.仿真實(shí)驗(yàn)表明,該算法明顯提高系統(tǒng)的識(shí)別率和魯棒性.
Fisher;Bark;小波包變換;MFCC;說話人識(shí)別
隨著社會(huì)發(fā)展和科學(xué)技術(shù)的提高,說話人識(shí)別技術(shù)的研究取得飛速的發(fā)展[1-3].在說話人識(shí)別流程中最重要的一個(gè)環(huán)節(jié)是特征提取,通過對(duì)說話人語音信號(hào)的個(gè)性特征進(jìn)行處理獲得特征參數(shù),是直接影響說話人識(shí)別系統(tǒng)性能的根本原因[4-5].
語音信號(hào)特征提取方法大致分為以下幾類:(1)基于時(shí)域處理方法,通過短時(shí)過零分析、短時(shí)自相關(guān)函數(shù)、平均幅度差等方法提取特征參數(shù),這些方法簡(jiǎn)單、運(yùn)算量小、物理意義明確,但不適合在噪聲環(huán)境中使用;(2)基于頻域處理的方法,通過短時(shí)傅立葉變換(STFT)[6]、小波變換[7]、Wigner分布[8]、倒譜分析[9]等方法提取特征參數(shù),這些方法與語音感知過程密切相關(guān),在安靜環(huán)境中表現(xiàn)很好,但對(duì)于噪聲環(huán)境中仍需繼續(xù)研究;(3)基于概率論方法,通過線性判別分析[10]、主成分分析[11]、獨(dú)立分量分析[12]等方法提取特征參數(shù),這些方法比較復(fù)雜,需要大量原始數(shù)據(jù)提取特征,運(yùn)算量很大,但效果不錯(cuò);(4)基于新理論的方法,通過混沌理論[13]、分形理論[14]等方法提取特征參數(shù),這些算法的運(yùn)算量大,只適用于一些特定的噪聲,具有一定的局限性.
最常用的MFCC參數(shù)在純語音下測(cè)試的識(shí)別率可以高達(dá)99.5%,但是在噪聲環(huán)境中測(cè)試的識(shí)別率僅為60%[15].文獻(xiàn)[6]對(duì)MFCC識(shí)別率低的原因進(jìn)行了深入的分析,表明純語音的特征參數(shù)和加噪語音的特征參數(shù)差異明顯,各維參數(shù)分布已經(jīng)產(chǎn)生變化,變化會(huì)隨噪聲的增強(qiáng)而加劇,識(shí)別率必然下降.在MFCC特征參數(shù)提取過程中,時(shí)頻分析采用的是STFT,它對(duì)平穩(wěn)信號(hào)進(jìn)行分析會(huì)產(chǎn)生很好的效果.但是對(duì)于非平穩(wěn)信號(hào)進(jìn)行分析時(shí),不僅要具有較高的頻率分辨率,還要具有較高的時(shí)間分辨率,STFT在這種情況下不能兼顧[6].小波變換的特點(diǎn)是多分辨率分析,適合分析復(fù)雜多變的語音信號(hào).
人耳能夠在嘈雜的環(huán)境中分辨出說話者,具有很強(qiáng)的抗噪性,因此在提取特征參數(shù)時(shí)引入人耳聽覺特征比其他特征參數(shù)有更好的魯棒性[16].通過Mel頻率構(gòu)造的Mel濾波器組在頻率上重疊,使用小波包變換直接構(gòu)造Mel濾波器組比較復(fù)雜.但可以使用另一種聽覺特征Bark尺度感知特征,結(jié)合小波包對(duì)頻帶進(jìn)行劃分,構(gòu)造出新的特征參數(shù).該特征參數(shù)維數(shù)較多,各維參數(shù)對(duì)識(shí)別效果的貢獻(xiàn)不一樣.融入概率論的方法,采用Fisher比對(duì)參數(shù)進(jìn)行選擇,獲得了新的特征參數(shù).
1.1 Bark尺度感知頻率
在1961年Eberhard Zwicker根據(jù)人耳基底膜特征提出了Bark尺度,根據(jù)人耳掩蔽效應(yīng)的實(shí)驗(yàn)結(jié)果,Heinrich Barkhausen等提出頻率群的概念,將20~220 50Hz的頻率可以劃分為25個(gè)頻率群.人耳基底膜被大腦分為很多小模塊,每個(gè)模塊都與一個(gè)頻率群相對(duì)應(yīng)并負(fù)責(zé)該頻率的語音信號(hào),每次人耳獲得一段語音信號(hào)時(shí),大腦都會(huì)對(duì)這些頻率群進(jìn)行疊加處理,成為人們所了解的語音[17].Bark尺度頻率b與實(shí)際頻率f的轉(zhuǎn)化關(guān)系為
f=600sinh(b/6).
(1)
實(shí)驗(yàn)得到的頻率群滿足公式(1),根據(jù)該頻率群的每個(gè)中心頻率、帶寬、上下限頻率設(shè)計(jì)Bark濾波器.
1.2 Bark尺度的小波包變換
小波包變換可以靈活地劃分頻率,構(gòu)造出與Bark尺度感知頻率特性相似的小波包分解結(jié)構(gòu).對(duì)于8kHz采樣頻率的語音信號(hào)(最高頻率為4kHz),共包含17個(gè)頻率群,使用小波包構(gòu)造這17個(gè)頻帶,小波包分解結(jié)構(gòu)如圖1所示.
文獻(xiàn)[18]實(shí)驗(yàn)表明,語音信號(hào)小于600Hz的低頻部分和大于3 000Hz的高頻部分?jǐn)y帶說話人特征較多,詳細(xì)地劃分這2部分的頻帶可以提高識(shí)別率.在上面的分解基礎(chǔ)上對(duì)低頻(小于625Hz)和高頻(大于3 000Hz)細(xì)分,即圖1中矩形框中的節(jié)點(diǎn)再分解一次,最后得到24個(gè)頻帶.將這些頻帶從低頻到高頻排列,獲得每個(gè)節(jié)點(diǎn)的頻率范圍如表1所示.
1.3 小波函數(shù)的選擇
在小波包變換中,小波函數(shù)的選擇會(huì)影響到計(jì)算速度和語音信號(hào)的有效性,選取合適的小波函數(shù)具有重要意義.在特征參數(shù)提取時(shí),只在Bark尺度對(duì)語音信號(hào)進(jìn)行小波包分解,不需要進(jìn)行信號(hào)重構(gòu),所以線性相位的要求不必考慮.在計(jì)算特征參數(shù)的過程中,采用每個(gè)頻帶能量作為說話人的特征信息,要求小波函數(shù)具有可以保證小波包分解過程中能量不丟失的正交性.隨著Daubechies(db)小波階數(shù)N的增加,小波函數(shù)和尺度函數(shù)的時(shí)域波形愈發(fā)平滑,頻譜成分也愈發(fā)密集,濾波器的頻率特性也就更好.在實(shí)際應(yīng)用中應(yīng)考慮時(shí)頻分辨率和計(jì)算速度的要求,采用db6小波是一種比較合理的選擇[19].
圖 1 Bark尺度小波包變換的分解結(jié)構(gòu)Fig.1 Decomposition structure diagram of Bark scale wavelet packet transform
編號(hào)頻率范圍/Hz編號(hào)頻率范圍/Hz編號(hào)頻率范圍/Hz10~6252625~1253125~187541875~2505250~312563125~3757375~427584275~5009500~5625105625~62511625~75012750~87513875~1000141000~1250151250~1500161500~1625171625~1750181750~2000192000~2500202500~3000213000~3250223250~3500233500~3750243750~4000
1.4 Fisher比的特征選擇
為保證識(shí)別效果,MFCC特征參數(shù)用于說話人識(shí)別需要20~30維特征,雖然多維特征豐富了特征信息,但各維參數(shù)對(duì)識(shí)別效果的貢獻(xiàn)不同.這樣就出現(xiàn)了大量的干擾信息,降低識(shí)別速度而且有可能降低識(shí)別效果.所以必須對(duì)特征參數(shù)進(jìn)行選擇.
在模式識(shí)別中,Fisher準(zhǔn)則是將特征向量投影到最佳方向而獲得最大的類間距離.1964年,Bell實(shí)驗(yàn)室的Pmzansky和Matllews在Fisher準(zhǔn)則的基礎(chǔ)上提出方差之比(F比),并將其作為有效的度量說話人特征參數(shù)準(zhǔn)則,定義為
(2)
F值越大,表示某一維特征更適合成為說話人的個(gè)性特征.實(shí)驗(yàn)表明,經(jīng)Fisher比選擇后的特征參數(shù)可以更有效地表征說話人的個(gè)性特征,提高識(shí)別系統(tǒng)的識(shí)別效率[10].
圖 2 MFCC和FWBCC的提取過程對(duì)比Fig.2 Comparison of extraction process of MFCC and FWBCC
圖 3 WBCC和一階差分參數(shù)各維Fisher比Fig.3 Each dimension Fisher of WBCC and first-order differential parameters
圖 4 說話人識(shí)別系統(tǒng)測(cè)試界面Fig.4 Test interface of speaker recognition system
1.5 構(gòu)造新特征參數(shù)
通過db6小波進(jìn)行Bark尺度小波包變換,將語音信號(hào)分解在24個(gè)頻帶內(nèi),之后構(gòu)造每個(gè)頻帶的特征參數(shù).將新特征參數(shù)命名為Fisher比Bark小波包倒譜系數(shù)(FWBCC),其提取流程與MFCC類似.不同之處在于:(1)使用小波包變換代替了STFT;(2)采用了Bark尺度代替了Mel尺度;(3)使用Fisher比對(duì)特征進(jìn)行選?。畧D2為MFCC和FWBCC的特征參數(shù)提取過程對(duì)比.
FWBCC提取的具體步驟描述如下:
(1) Bark尺度小波包變換,對(duì)語音信號(hào)預(yù)處理和端點(diǎn)檢測(cè)后,將獲得的每幀語音信號(hào)進(jìn)行Bark尺度小波包變換,求出24組頻帶的小波包系數(shù)(每組系數(shù)個(gè)數(shù)不同);
(2) 計(jì)算頻帶能量,第n幀第m個(gè)頻帶能量按照如下公式計(jì)算得到:
(3)
式中:Wn(m,k)表示一幀語音小波包變換系數(shù);Nm表示第m個(gè)頻帶中小波包變換系數(shù)個(gè)數(shù).
(3) 計(jì)算DCT倒譜,將24維頻帶能量通過DCT變換,一般取前12維的數(shù)據(jù)進(jìn)行計(jì)算:
(4)
(4) Fisher比選擇,特征參數(shù)中加入動(dòng)態(tài)特征,可以提升系統(tǒng)的識(shí)別性能,所以對(duì)得到的WBCC靜態(tài)特征需要進(jìn)行一階差分處理得到相應(yīng)的動(dòng)態(tài)特征.根據(jù)式(2)計(jì)算出12維WBCC和12維一階差分動(dòng)態(tài)特征中每一維的Fisher比,如圖3所示,可以發(fā)現(xiàn)特征參數(shù)每一維的貢獻(xiàn)是不同的.根據(jù)Fisher比的大小,選出WBCC的第2,3,8,10,11,12維和一階差分參數(shù)的第3,4,6,9,10,11維.
通過上述4個(gè)步驟從WBCC和一階差分參數(shù)中各選出Fisher比最大的6組,組合成12維的特征參數(shù)就是文中根據(jù)Fisher比的Bark尺度小波包變換提取的FWBCC特征參數(shù).
2.1 實(shí)驗(yàn)配置
在Matlab軟件環(huán)境下編寫測(cè)試界面如圖4所示,對(duì)特征提取算法進(jìn)行實(shí)驗(yàn)測(cè)試.
訓(xùn)練數(shù)據(jù)來自安靜環(huán)境下獲得的15人(10男5女)語音,以8kHz為采樣率,16bit量化.語音為10個(gè)數(shù)字(0~9),每個(gè)數(shù)字錄音大約是1s,共10s,錄20次語音為訓(xùn)練數(shù)據(jù),通過端點(diǎn)檢測(cè)[20]將語音信號(hào)分割后作為每個(gè)數(shù)字的訓(xùn)練模板,即每個(gè)人有10個(gè)對(duì)應(yīng)不同的數(shù)字的模板.識(shí)別測(cè)試數(shù)據(jù)是根據(jù)錄音提示在安靜環(huán)境下錄制4~9位的數(shù)字,作為說話人識(shí)別測(cè)試的原始數(shù)據(jù).
2.2 實(shí)驗(yàn)結(jié)果及分析
為了驗(yàn)證使用FWBCC特征后系統(tǒng)的準(zhǔn)確性,在實(shí)驗(yàn)室中進(jìn)行測(cè)試.根據(jù)界面文本提示錄音,先對(duì)語音信號(hào)進(jìn)行預(yù)處理和端點(diǎn)檢測(cè),獲得一幀一幀的語音信號(hào),對(duì)每一幀數(shù)據(jù)分別提取24維MFCC特征(包括一階差分參數(shù))、24維WBCC和12維的FWBCC特征參數(shù),最后使用VQ建立模型進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果如圖5所示.
為了驗(yàn)證使用FWBCC特征后系統(tǒng)的魯棒性,分別將測(cè)試的原始數(shù)據(jù)與white噪聲混合成信噪比(SNR)為20dB、10dB、5dB、0dB的帶噪語音信號(hào),進(jìn)行實(shí)驗(yàn)測(cè)試(8位數(shù)字),實(shí)驗(yàn)結(jié)果如圖6所示.
圖 5 3種特征參數(shù)的識(shí)別結(jié)果折線圖 圖6 4種SNR下的兩種特征參數(shù)的識(shí)別結(jié)果折線圖 Fig.5 The recognition results of three kinds of feature parameters Fig.6 The recognition results of the two feature parameters in four SNR
根據(jù)以上實(shí)驗(yàn)結(jié)果可以得出:
(1) 改進(jìn)的特征參數(shù)的識(shí)別效果比MFCC好,識(shí)別率有所提高.因?yàn)楦倪M(jìn)的特征參數(shù)采用了小波包變換進(jìn)行分析,可以更好獲得非平穩(wěn)性的說話人特征,具有更好區(qū)分能力.
(2) FWBCC特征參數(shù)的識(shí)別效果比WBCC略好.WBCC特征參數(shù)通過Fisher比選擇后,排除大量的干擾信息,獲得貢獻(xiàn)率更好的特征參數(shù)FWBCC,識(shí)別結(jié)果要高于WBCC參數(shù).雖然識(shí)別率提高的很小,但是特征維數(shù)壓縮了一半,提高系統(tǒng)的運(yùn)算速度.
(3) 文本位數(shù)越多識(shí)別效果越好.因?yàn)樘崾疚谋驹蕉?提取特征后信息量也越大,識(shí)別率會(huì)提高.但是識(shí)別速度會(huì)下降,當(dāng)文本位數(shù)為8位時(shí)效果最好.
(4) 隨著環(huán)境噪聲的增大,系統(tǒng)的識(shí)別率下降.使用MFCC特征參數(shù)的識(shí)別率下降20%左右,而使用FWBCC特征參數(shù)的識(shí)別率僅僅下降6%左右,所以,使用FWBCC特征參數(shù)的系統(tǒng)魯棒性較好.
對(duì)常用的MFCC提取算法進(jìn)行改進(jìn),提出基于Fisher比的Bark小波包變換特征提取算法,以人類聽覺系統(tǒng)特征為依據(jù),使用小波包變換在Bark尺度劃分頻帶,計(jì)算頻帶能量,采用Fisher比選擇出12維特征參數(shù).實(shí)驗(yàn)結(jié)果表明,使用該算法提取的FWBCC特征參數(shù)進(jìn)行識(shí)別測(cè)試,識(shí)別率和魯棒性都有所提高,對(duì)說話人識(shí)別系統(tǒng)的實(shí)際應(yīng)用具有一定的價(jià)值.
[1] LI P,TANG H.Design of a low-power coprocessor for mid-size vocabulary speech recognition systems[J].IEEE Transactions on Circuits and Systems I:Regular Papers,2011,58(5):961-970.
[2] 栗志意,張衛(wèi)強(qiáng),何亮,等.基于總體變化子空間自適應(yīng)的 i-vector 說話人識(shí)別系統(tǒng)研究[J].自動(dòng)化學(xué)報(bào),2014,40(8):1836-1840.
LI Zhiyi,ZHANG Weiqiang,HE Liang,et al.Total variability subspace adaptation based speaker recognition[J].Acta Automatica Sinica,2014,40(8):1836-1840.
[3] 李云紅,李子琳.基于DSP的語音識(shí)別系統(tǒng)設(shè)計(jì)[J].紡織高?;A(chǔ)科學(xué)學(xué)報(bào),2012,25(1):107-110.
LI Yunhong,LI Zilin.The design of voice recognition system controller based on DSP[J].Basic Sciences Journal of Textile Universities,2012,25(1):107-110.
[4] DEHAK N,KENNY P J,DEHAK R,et al.Front-end factor analysis for speaker verification[J].IEEE Transactions on Audio Speech & Language Processing,2011,19(4):788-798.
[5] 李愛平,黨幼云.VQ聲紋識(shí)別算法和實(shí)驗(yàn)[J].西安工程科技學(xué)院學(xué)報(bào),2007,21(6):848-851.
LI Aiping,Dang Youyun.Algorithm and experiment of speaker recognition system based on VQ[J].Journal of Xi′an University of Engineering Science & Technology,2007,21(6):848-851.
[6] 胡政權(quán),曾毓敏,宗原,等.說話人識(shí)別中MFCC參數(shù)提取的改進(jìn)[J].計(jì)算機(jī)工程與應(yīng)用,2014,50(7):217-220.
HU Zhengquan,ZENG Yumin,ZONG Yuan,et al.Improvement of MFCC parameters extraction in speaker recognition[J].Computer Engineering and Applications,2014,50(7):217-220.
[7] 楊麗坤,徐洋.基于小波包變換的加權(quán)語音特征參數(shù)[J].計(jì)算機(jī)應(yīng)用與軟件,2014,31(8):168-171.
YANG Likun,XU Yang.Weighted speech feature parameters based on wavelet packet transform[J].Computer Applications & Software,2014,31(8):168-171.
[8] 徐鄭丹,于鳳芹.基于SPWD時(shí)頻脊特征提取的漢語聲調(diào)識(shí)別[J].計(jì)算機(jī)應(yīng)用與軟件,2014,31(3):142-145.
XU Zhengdan,YU Fengqin.Chinese tone recognition based on SPWD time-frequency ridge feature extraction[J].Computer Applications & Software,2014,31(3):142-145.
[9] 甄斌,吳璽宏,劉志敏,等.語音識(shí)別和說話人識(shí)別中各倒譜分量的相對(duì)重要性[J].北京大學(xué)學(xué)報(bào):自然科學(xué)版,2001,37(3):371-378.
ZHEN Bin,WU Xihong,LIU Zhimin,et al.On the importance of components of the MFCC in speech and speaker recognition[J].Acta Scientiarum Naturalium Universitatis Pekinensis,2001,37(3):371-378.
[10] 鮮曉東,樊宇星.基于Fisher比的梅爾倒譜系數(shù)混合特征提取方法[J].計(jì)算機(jī)應(yīng)用,2014,34(2):558-561.
XIAN Xiaodong,FAN Yuxing.Parameter extraction method for Mel frequency cepstral coefficients based on Fisher criterion[J].Journal of Computer Applications,2014,34(2):558-561.
[11] 馬金龍,景新幸,楊海燕,等.主成分分析和K-means聚類在說話人識(shí)別中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用,2015,35(S1):127-129.
MA Jinlong,JING Xinxing,YANG Haiyan,et al.Application of principal component analysis and K-means clustering in speaker recognition[J].Journal of Computer Applications,2015,35(S1):127-129.
[12] 董治強(qiáng),劉琚,鄒欣,等.基于ICA的語音信號(hào)表征和特征提取方法[J].山東大學(xué)學(xué)報(bào):工學(xué)版,2010,40(4):19-22.
DONG Zhiqiang,LIU Ju,ZOU Xin,et al.Speech signal representation and feature extraction based on ICA[J].Journal of Shandong University:Engineering Science,2010,40(4):19-22.
[13] SONG T,LEE K,KO H.Robust visual voice activity detection using chaos theory under illumination varying environment[C]//International Conference on Consumer Electronics.IEEE:Las Vegas,2014:562-563.
[14] SHAFIEE S,ALMASGANJ F,VAZIRNEZHAD B,et al.A two-stage speech activity detection system considering fractal aspects of prosody[J].Pattern Recognition Letters,2010,31(9):936-948.
[15] SINGH L,CHETTY G.A comparative study of recognition of speech using improved MFCC algorithms and Rasta filters[J].Communication in Computer Information Science,2012,285(1):304-314.
[16] 張曉俊,陶智,吳迪,等.采用多特征組合優(yōu)化的語音特征參數(shù)研究[J].通信技術(shù),2012,45(12):98-100.
ZHANG Xiaojun,TAO Zhi,WU Di,et al.Study of speech characteristic parameters by optimized multi-feature combination[J].Communications Technology,2012,45(12):98-100.
[17] 高明明,常太華,楊國田,等.基于子帶主頻率信息的語音特征提取算法[J].計(jì)算機(jī)工程,2009,35(18):161-163.
GAO Mingming,CHANG Taihua,YANG Guotian,et al.Speech feature extraction algorithm based on subband dominant frequency information[J].Computer Engineering,2009,35(18):161-163.
[18] 陳春輝,馮剛.基于聽覺小波包自適應(yīng)語音增強(qiáng)方法[J].華南師范大學(xué)學(xué)報(bào):自然科學(xué)版,2013,45(2):55-59.
CHEN Chunhui,FENG Gang.An adaptive speech enhancement method based on hearing wavelet packet transformation[J].Journal of South China Normal University:Natural Science Edition,2013,45(2):55-59.
[19] 謝軍,李樂,劉文峰.振動(dòng)信號(hào)噪聲消除中的小波基選擇研究[J].科學(xué)技術(shù)與工程,2011,11(25):5997-6000.
XIE Jun,LI Le,LIU Wenfeng.Research on wavelet base selection for vibration signal denoising[J].Science Technology & Engineering,2011,11(25):5997-6000.
[20] 王曉華,屈雷.基于時(shí)頻參數(shù)融合的自適應(yīng)語音端點(diǎn)檢測(cè)算法[J].計(jì)算機(jī)工程與應(yīng)用,2015,51(20):203-207.
WANG Xiaohua,QU lei.Self-adaptive voice activity detection algorithm based on fusion of time-frequency parameter[J].Computer Engineering and Applications,2015,51(20):203-207.
編輯、校對(duì):孟 超
Speech feature extraction algorithm based on the Bark wavelet packet transform with Fisher
WANG Xiaohua, QU Lei, ZHANG Chao, JIANG Xiwei
(School of Electronics and Information, Xi′an Polytechnic University,Xi′an 710048, China)
In order to solve the problem of low recognition rate of MFCC parameter, a feature extraction algorithm based on the Bark wavelet packet transform with Fisher is put forward. Firstly, wavelet packet transform is used to construct Bark filter, which can replace the triangular Mel filter. According to the Fisher criterion, feature parameters filtered by Bark filter are adopted, removing the interference information and saving the time of feature matching. Simulation results show that the algorithm is able to enhance the recognition rate and robustness.
Fisher;Bark;wavelet packet transform;MFCC;speaker recognition
1674-649X(2016)04-0452-06
10.13338/j.issn.1674-649x.2016.008
2015-03-14
國家自然科學(xué)基金資助項(xiàng)目(61301276);陜西省自然科學(xué)基金資助項(xiàng)目(150518);西安工程大學(xué)學(xué)科資助項(xiàng)目(107090811);國家級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)計(jì)劃訓(xùn)練資助項(xiàng)目(201510709367)
王曉華(1972—),女,黑龍江省齊齊哈爾市人,西安工程大學(xué)副教授,研究方向?yàn)槟J阶R(shí)別、智能機(jī)器人.
E-mail:w_xiaohua@126.com
王曉華,屈雷,張超,等.基于Fisher比的Bark小波包變換的語音特征提取算法[J].西安工程大學(xué)學(xué)報(bào),2016,30(4):452-457.
WANG Xiaohua,QU Lei,ZHANG Chao,et al.Speech feature extraction algorithm based on the Bark wavelet packet transform with Fisher[J].Journal of Xi′an Polytechnic University,2016,30(4):452-457.
TN 912.3
A