潘茜茜
(信陽廣播電視大學(xué),河南 信陽 464000)
小波變換實現(xiàn)語音壓縮研究
潘茜茜
(信陽廣播電視大學(xué),河南 信陽 464000)
在確保信號質(zhì)量的條件下,為了減少存儲空間,文章提出了用小波變換實現(xiàn)語音壓縮的方法。根據(jù)信號能量高,置零系數(shù)的百分比也要高的原則,尋求最適合的壓縮方式。實驗結(jié)果表明:對自己錄制的Windows PCM格式的wav文件,在保留的信號能量達(dá)到96%以上時,用Haar小波進(jìn)行5層分解,能有效地完成語音壓縮。
語音壓縮;小波變換;能量;置零系數(shù)百分比;Haar小波
隨著通信技術(shù)的快速發(fā)展,語音信號的傳輸和應(yīng)用占據(jù)了重要的地位。語音信號需要轉(zhuǎn)換成數(shù)字信號才能存儲在數(shù)字存儲設(shè)備中,在很多情況下,由于存儲設(shè)備的存儲空間是有限的,所以對數(shù)字語音信號的壓縮變得尤為重要。
雖然人們正在探索運用自己定義的小波基函數(shù)進(jìn)行有效的語音壓縮,但對于涉及領(lǐng)域稍淺的方面,研究在常用的小波函數(shù)下,語音壓縮的效果與小波分解層之間的關(guān)系,并能通過直觀操作和實驗結(jié)果分析,找到用小波變換實現(xiàn)語音壓縮的較恰當(dāng)?shù)姆椒ň哂鞋F(xiàn)實可行性意義。
小波變換(Wavelet Transform,WT)是一種新的變換分析方法,它繼承和發(fā)展了短時傅立葉變換局部化的思想,同時又克服了窗口大小不隨頻率變化等缺點,能夠提供一個隨頻率改變的“時間-頻率”窗口,是進(jìn)行信號時頻分析和處理的理想工具。它的主要特點是通過變換能夠充分突出問題某些方面的特征,能對時間(空間)頻率的局部化分析,通過伸縮平移運算對信號(函數(shù))逐步進(jìn)行多尺度細(xì)化,最終完成高頻處時間細(xì)分,低頻處頻率細(xì)分。
小波,即小區(qū)域的波,是一種特殊的長度有限、平均值為0的波形。它有兩個特點:一是“小”,即在時域都具有緊支集或近似緊支集;二是正負(fù)交替的“波動性”,也即直流分量為零。小波分析是將信號分解成一系列小波函數(shù)的疊加,而這些小波函數(shù)都是由一個母小波函數(shù)經(jīng)過平移與尺度伸縮得來的。用不規(guī)則的小波函數(shù)來逼近尖銳變化的信號顯然要比光滑的正弦信號來逼近要好。
小波變換的定義是把某一被稱為基本小波的函數(shù)做位移后,再把不同尺度a下與待分解的信號x(t)做內(nèi)積。
一個比較規(guī)則的信號是由一個數(shù)據(jù)量很小的低頻系數(shù)和幾個高頻系數(shù)組成。對低頻系數(shù)的選擇有一個要求,需要在一個合適的分解層上選取低頻系數(shù),根據(jù)小波分析的特點可知,小波變換能實現(xiàn)信號的壓縮過程。
2.1 小波分解
信號可以利用小波變換分解為近似和細(xì)節(jié)。近似主要是系統(tǒng)大的、低頻的成分,而細(xì)節(jié)往往是信號的局部、高頻的部分。小波變換的一級分解過程是,原始信號分別進(jìn)行低通、高通濾波,再分別進(jìn)行二元下抽樣,就得到低頻、高頻兩部分系數(shù);而多級分解則是對上一級分解得到的低頻系數(shù)再進(jìn)行小波分解,是一個遞歸過程。信號的分解過程還可以反復(fù)進(jìn)行,信號的低頻部分還可以被繼續(xù)分解。
2.2 閾值選取規(guī)則
一般來說,噪聲信號多包含在具有較高頻率細(xì)節(jié)中,在小波分解之后,去噪就顯得尤為重要。因為閾值的選取直接影響去噪的質(zhì)量,所以在系數(shù)上作用閾值是去噪的核心步驟。在matlab的小波工具箱中,給出了4種閾值的選取方法,即:固定閾值(sqtwolog)、自適應(yīng)閾值(rigrsure)、啟發(fā)式閾值(heursure)和極大極小閾值(minimaxi)。
2.3 小波重構(gòu)
小波重構(gòu)是小波分解的逆過程,對高頻系數(shù)和低頻系數(shù)分別進(jìn)行上抽樣和低通、高通濾波處理。
3.1 語音信號的錄制
3.1.1 關(guān)于試麥
開始—控制面板—聲音和音頻設(shè)備—語聲—測試硬件。
3.1.2 錄音準(zhǔn)備
開始—控制面板—聲音和音頻設(shè)備—音量—設(shè)備音量—高級,如果出來的對話框里面沒有麥克風(fēng),選項—屬性—分別在“播放”和“錄音”里面選擇“麥克風(fēng)”。確定退出后回到“音量控制”的界面,分別在“播放”和“錄音”的界面里面勾選“麥克風(fēng)”,音量大小自己調(diào)節(jié)。
3.1.3 錄音
用電腦自帶的錄音功能進(jìn)行錄音,在麥克風(fēng)旁播放歌曲“最初的夢想”,進(jìn)行錄音。此錄音文件為Windows PCM格式的wav文件,保存在可移動磁盤H盤中,文件名為majuan.wav。
3.2 壓縮過程
本文采用兩種實現(xiàn)方式,其中圖形接口方式比較易于操作和實現(xiàn),具有一目了然的效果,在其圖形界面窗口中,能恰當(dāng)?shù)恼页鏊褂贸叨葦?shù)的閾值和進(jìn)行有效壓縮。本文的難點是錄音信號的調(diào)用,由于音頻信號的格式不同,需要找出適合格式的信號。對于在matlab7.0環(huán)境下,實驗表明用Windows PCM的wav格式文件,能完成在圖形接口方式中進(jìn)行信號的調(diào)用。通過仿真操作和簡單編程,掌握了根據(jù)語音壓縮與小波函數(shù)分解層之間關(guān)系,選擇合適的壓縮方式的方法。
[1]吳鎮(zhèn)揚.數(shù)字信號處理[M].北京:高等教育出版社,2004.
[2]飛思科技產(chǎn)品研發(fā)中心.Matlab 6.5輔助小波分析與應(yīng)用[M].北京:電子工業(yè)出版社,2003.
[3]蘇曉生.掌握Matlab 6.0及其工程應(yīng)用[M].北京:科學(xué)出版社,2002.
[4]陳桂明,張明照,威紅雨.應(yīng)用Matlab語言處理數(shù)字信號與數(shù)字圖像[M].北京:科學(xué)出版社,2002.
[5]何強,何英.Matlab擴(kuò)展程序[M].北京:華中理工大學(xué)出版社,2002.
[6]秦前清,楊宗凱.實用小波分析[M].西安:西安電子科技大學(xué)出版社,2002.
[7]陳亞勇.Matlab信號處理詳解[M].北京:人民郵電出版社,2001.
[8]李強,趙偉.Matlab數(shù)據(jù)處理與應(yīng)用[M].北京:國防工業(yè)出版社,2002.
[9]GOLD B, RADER C M. Digital processing of signals[M].New York:Mc Grew-Hill Book Company, 2005.
[10]關(guān)肇直,許文源,賈沛璋.信號分析處理[M].北京:科學(xué)出版社,2003.
Research on voice compression through wavelet transformation
Pan Xixi
(Xinyang Radio and TV University, Xinyang 464000, China)
Under the condition of ensuring the quality of signal, the paper proposes to realize the voice compression through wavelet transformation to reduce storage space.According to the principle that the percentage of the zero coefficient must be in line with that of the high signal energy,it finds out the most suitable compression method. The results of the experiment show that:when the reserved signal energy is over 96%,we can have the WAV document in the format of Windows PCM recorded by oneself decomposed 5 times with the help of Haar wavelet to successfully achieve the voice compression.
voice compression; wavelet transformation; energy; percentage of zero coefficient; Haar wavelet
潘茜茜(1987— ),女,河南固始,本科,助教。