吳亞文 趙家龍 侯金波 辜麗川 何嶼彤 焦俊
摘要:為了快速準(zhǔn)確地獲取生豬的音頻信息,消除無線信道的擁塞問題,提出基于普減法的壓縮感知。在信息采集端采用微處理器NanoPCT4控制的麥克風(fēng)采集音頻信號,通過基于普減法的稀疏基矩陣和測量矩陣,減小聲音傳輸量,接收端運(yùn)用OMP算法,將壓縮信號進(jìn)行恢復(fù)重構(gòu),實(shí)現(xiàn)對生豬音頻信號的快速準(zhǔn)確傳輸。結(jié)果表明,通過運(yùn)用這套壓縮-重構(gòu)系統(tǒng),重構(gòu)率提高20.75%,重構(gòu)時間縮短近0.20 s,去噪后的峰值信噪比較未去噪的峰值信噪比增大了近1.50 dB,降低了信息傳輸量,節(jié)省了信號處理、存儲和傳輸?shù)臅r間,同時也降低信號失真。
關(guān)鍵詞:聲音信號;普減法;壓縮感知;傳輸量;生豬
中圖分類號:TN912.34 ??文獻(xiàn)標(biāo)志碼: A ?文章編號:1002-1302(2020)10-0250-06
收稿日期:2019-04-26
基金項(xiàng)目:安徽省重點(diǎn)研究與開發(fā)計劃(編號:1804a07020130);國家自然科學(xué)基金(編號:31671589、31771679);安徽省科技重大攻關(guān)項(xiàng)目(編號:16030701092);農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)電子商務(wù)重點(diǎn)實(shí)驗(yàn)室開放基金(編號:AEC2018010、AEC2018003)。
作者簡介:吳亞文(1996—),男,安徽樅陽人,碩士研究生,主要從事模式識別研究。E-mail:m18256503647@163.com。
通信作者:焦 俊,博士,教授,主要從事物聯(lián)網(wǎng)研究。E-mail:jiaojun2000@sina.com。
我國是世界上最大的豬肉生產(chǎn)國和消費(fèi)國,從古至今一直把豬肉作為主要肉食品來源[1]。生豬聲音信息可以作為識別健康與否的依據(jù),因此基于多媒體傳感網(wǎng)的生豬音頻信息采集和傳輸是需要解決的主要問題,同時音頻信息也反映生豬健康狀況,是交流和表達(dá)情感的重要途徑。但是在多媒體WSN中,聲音傳輸時會出現(xiàn)信息碰撞和擁塞問題。
壓縮感知理論為數(shù)據(jù)傳輸技術(shù)帶來了革命性的突破,得到了研究人員的廣泛關(guān)注。基于壓縮感知的信號采樣速率遠(yuǎn)低于傳統(tǒng)奈奎斯特采樣方法。這些優(yōu)點(diǎn)使得其在很多領(lǐng)域有著廣闊的應(yīng)用前景,如雷達(dá)[2-4]、成像[5]、信號處理[6]、信道估計[7-8]等,并被評為2007年度十大科技進(jìn)展之一[9-10]。針對壓縮感知理論和語音信號的特點(diǎn),國內(nèi)外學(xué)者對基于壓縮感知的聲音處理進(jìn)行了多方面的研究。
Giacobell等利用稀疏線性預(yù)測技術(shù),將壓縮感知理論用于語音信號壓縮,與多脈沖激勵編碼相比在波形誤差方面具有一定的優(yōu)勢[11]。Peyre將局部余弦字典作為語音信號的稀疏變換字典,并利用樹形搜索方法實(shí)現(xiàn)語音壓縮后的重構(gòu)恢復(fù)[12]。葉蕾等在語音信號的稀疏表示和觀測矩陣等方面也做了很多分析研究,提出了基于小波變換和壓縮感知的語音編碼方式,將語音信號分為低頻系數(shù)和高頻系數(shù)分別進(jìn)行處理[13];利用主分量分析,構(gòu)造語音的冗余字典實(shí)現(xiàn)稀疏表示[14];采用K-L變換,通過訓(xùn)練學(xué)習(xí)構(gòu)造近似KLT域?qū)崿F(xiàn)語音壓縮感知[15]。
但是國內(nèi)外學(xué)者尚未涉足對豬聲音傳輸方面的研究,隨著科技進(jìn)步,急需針對豬的聲音作出研究,利用豬的聲音識別豬的一些行為特征,研究前提是解決豬聲音識別前期處理量和傳輸量大的問題。
本研究為了解決上述問題,基于壓縮感知理論,自主設(shè)計一套生豬音頻信號處理系統(tǒng),壓縮感知的工作過程:稀疏分解或壓縮的原始信號,通過與稀疏基不相干的測量矩陣的線性測量,將原始高維信號投影到低維空間,接收端運(yùn)用重建算法,高概率地重構(gòu)原始信號。而重建算法是CS理論的關(guān)鍵問題,應(yīng)該在已知測量矩陣和測量向量的前提下,高效并且精確地實(shí)現(xiàn)對原始信號的重建。目前,常用的重構(gòu)算法有重構(gòu)準(zhǔn)確的BP算法,但是算法復(fù)雜;快速重構(gòu)的MP算法,由于稀疏基準(zhǔn)確度不夠,限制了其推廣應(yīng)用。本研究設(shè)計基于普減法[16]的壓縮感知,提高了壓縮率和重構(gòu)的準(zhǔn)確度,減少傳輸時間,實(shí)現(xiàn)了聲音信號的快速傳輸和精確重構(gòu)。
1 聲音采集與傳輸
聲音采集與傳輸是運(yùn)用cortex架構(gòu)的嵌入式微處理器NanoPCT4作為主控制器,自主設(shè)計實(shí)現(xiàn)了用于聲音采集傳輸?shù)挠布到y(tǒng),外接有iTalk-02麥克風(fēng)、USB接口及USB device等接口資源。麥克風(fēng)采用Tyless公司生產(chǎn)的音頻采集模塊作為聲音數(shù)據(jù)采集設(shè)備,audio或者PCM編碼,支持raw和wav等音頻輸出格式。RAM芯片是通過UDP協(xié)議進(jìn)行網(wǎng)絡(luò)傳輸采集的語音信號,搭建采集傳輸平臺的實(shí)物見圖1,硬件平臺流程見圖2,具體步驟如下:(1)對開發(fā)板進(jìn)行上電以及USB麥克風(fēng)設(shè)備的初始化;(2)遠(yuǎn)程控制器(PC或服務(wù)器)創(chuàng)建一個麥克風(fēng)采集系統(tǒng)的線程和UDP通信協(xié)議的IP和端口號;(3)檢測USB麥克風(fēng)設(shè)備的索引號開啟設(shè)備;(4)檢測USB麥克風(fēng)設(shè)備是否開啟成功,若沒有成功的話,返回第3步重新檢測,直到檢測成功;(5)通過默認(rèn)的音頻參數(shù)值對特定的環(huán)境進(jìn)行聲音監(jiān)聽,如果聽這聲音符合采集聲音的標(biāo)準(zhǔn),就確定錄制聲音;(6)遠(yuǎn)程控制器設(shè)置音頻的錄制時長以及音頻參數(shù);(7)基于UDP協(xié)議上,使用壓縮感知技術(shù)對采集的聲音信號進(jìn)行壓縮網(wǎng)絡(luò)傳輸;(8)在接收端進(jìn)行重構(gòu)語音信號與原始的聲音信號對比分析,分析是否是音頻質(zhì)量最高的聲音對應(yīng)的聲音信號,若是即可輸出結(jié)束,若不是返回第6步重設(shè)置音頻參數(shù),直到達(dá)到最佳的語音信號質(zhì)量參數(shù)。按照這8個步驟,聲音采集到傳輸重構(gòu)一個完整的硬件平臺流程圖設(shè)計完成。
此采集硬件系統(tǒng)關(guān)鍵代碼如下:
QAudioFormat defaultAudioFormat;//定義錄制音頻格式
defaultAudioFormat.setSampleRate(m_set->sampleRate);//設(shè)置音頻采樣率
defaultAudioFormat.setChannelCount(m_set->ChannelCount);//設(shè)置音頻通道數(shù)defaultAudioFormat.setSampleSize(m_set->sampleSize);//設(shè)置音頻采樣點(diǎn)的字節(jié)大小
defaultAudioFormat.setCodec(“audio/pcm”);//設(shè)置音頻編碼格式
audioInput=new QAudioInput(curDevice,defaultAudioFormat,this);//音頻設(shè)備初始化
audioInput->start(& file);//開啟音頻采集設(shè)備
m_udpSocketMRecord->bind(QHostAddress::Any,9999);//設(shè)置IP地址和端口號
connect(m_udpSocketMRecord,SIGNAL(readyRead()),this,SLOT(MRecord()));//關(guān)聯(lián)音頻采集執(zhí)行函數(shù)
2 聲音信號的壓縮感知
壓縮感知理論的主要思想是將離散信號稀疏化后投影到設(shè)定的域的觀測值,傳輸,接收端利用少量的觀測值,把稀疏信號最大效率地恢復(fù)出原來的信號。針對聲音的壓縮感知,最基本的3個大部分,首先是信號傳輸?shù)南∈栊赞D(zhuǎn)換;再就是測量矩陣(高維轉(zhuǎn)低維)的構(gòu)建;最后是接收端信號的重構(gòu)(低維轉(zhuǎn)高維)。
本研究中設(shè)計了基于普減法的壓縮感知,普減法原理是利用采集的信號幅度譜的絕對值減去噪聲譜的幅度值,大于零的保留,小于零的作為雜音去除,再高維轉(zhuǎn)低維,傳輸,接收端把經(jīng)過前期處理的信號再利用OMP算法進(jìn)行豬的聲音信號的快速精確定量重構(gòu),實(shí)現(xiàn)原始信號的精確恢復(fù),具體流程見圖3。
2.1 普減法處理信號的稀疏化
普減法原理如下:
語音信號是短時平穩(wěn)的,信號在處理之前先對其進(jìn)行分幀加窗處理。
y(n)=x(n)+d(n)。
(1)
公式(1)某幀純凈語音信號為x(n);噪聲信號為d(n);帶噪語音為y(n)由純凈語音信號和噪聲信號組成;噪聲信號的FFT為D(n);帶噪語音的FFT為Y(n);可以將Y(ω)以極坐標(biāo)形式表示:
Y(ω)=|Y(ω)|ejΦy(ω)。
(2)
公式(2)中|Y(ω)|為幅度譜;ejΦy(ω)是帶噪信號的相位譜。噪聲譜D(ω)也可以通過其幅度和相位譜來表示:
D(ω)=|D(ω)|ejΦd(ω)。
(3)
公式(3)中噪聲的幅度譜|D(ω)|是未知的,可以通過無語音活動時的平均幅度譜的估計|D^(ω)|來代替。根據(jù)相位不會對音頻可懂度造成影響,只是可能在一定程度上影響語音質(zhì)量。公式(4)使用帶噪語音相位Фy(ω)來代替噪聲相位Фd(ω)。帶噪語音經(jīng)過譜減后得到的純凈語音頻譜的估計為
f(ω)=[|Y(ω)|-|D^(ω)|]ejΦy(ω)。
(4)
研究表明,試驗(yàn)采集的聲音信號在DCT域上表現(xiàn)很強(qiáng)的稀疏性,所以對上述普減閾值處理的信號f進(jìn)行DCT變換。
F(k)=∑n-1i=01nf(i),k=0;
(5)
F(k)=∑n-1i=02nf(i)cos(2i+1)kπ2n,k=1,2,…,n-1;
(6)
F=α·f。
(7)
公式(5)、公式(6)是對聲音信號f在α域中的DCT變換,進(jìn)而得到公式(7),公式(7)中,α為N×N標(biāo)準(zhǔn)正交基(α=[α1,α2,…,αN]),f為F在α正交基上展開的系數(shù)向量。
2.2 觀測矩陣的構(gòu)建
構(gòu)建高斯矩陣θ,測量矩陣構(gòu)造高斯隨機(jī)矩陣是壓縮感知中使用最廣泛的測量矩陣。觀測矩陣滿足約束等距條件公式(8)。
(1-ε)‖F(xiàn)‖22≤‖F(xiàn)‖22≤(1+ε)‖F(xiàn)‖22。
(8)
公式(8)中ε∈(0,1),在M×N的高斯隨機(jī)矩陣θ中,所有元素獨(dú)立服從均值為0、方差為M-1/2的高斯分布,即:θi,j~N(0,M-1/2),該矩陣的隨機(jī)性非常強(qiáng),當(dāng)信號的稀疏度為k時,重構(gòu)端在滿足約束等距條件這個式子成立,重建f信號就能以很大的概率完成信號的恢復(fù),前提是公式(9)成立:
M≥cklg(N/k)<
(9)
A=θ·F=θ·α·f。
(10)
公式(10)中的c是一個很小的常數(shù);公式(10)中的A是這個矩陣向量的觀測向量[17]。
2.3 原始信號的重構(gòu)
信號的重構(gòu)問題可以轉(zhuǎn)化為利用重構(gòu)算法求解最小L0范數(shù)優(yōu)化問題
f=arg min‖f‖0s.t.。
(11)
公式(11)得到稀疏信號f的精確或近似重構(gòu)f,進(jìn)而得到原始信號F。然而最小L0范數(shù)優(yōu)化問題是N-P hard問題,本研究主要使用OMP算法進(jìn)行信號的重構(gòu),其基本思路是在每一次的迭代過程中,從過完備字典原子庫中選擇與信號最匹配的原子來構(gòu)建稀疏逼近,遞歸地對已選擇的原子集合進(jìn)行正交化,保證迭代的最優(yōu)性,并且求出信號的殘差。迭代一定的次數(shù)后,信號可以由這些原子線性表示。
u={uj|uj=|
(12)
F=arg min‖A-θ·F‖2。
(13)
r(new)=A-θ·F。
(14)
公式(12)通過求殘差r與測量矩陣θ中各個原子之間內(nèi)積的絕對值,來計算相關(guān)系數(shù)u,公式(13)采用最小二乘法進(jìn)行信號逼近,公式(14)進(jìn)行殘差更新,這樣不斷迭代最后重構(gòu)出原信號。
3 結(jié)果與分析
本研究基于壓縮感知在聲音信號傳輸中的優(yōu)良性,分2組進(jìn)行matlab試驗(yàn)測評,第1組是在DCT域系數(shù)有普減閾值和沒有普減閾值情況下,對壓縮重構(gòu)的壓縮率、重構(gòu)率以及重構(gòu)時間等一系列因素做出對比;第2組是在有噪和去噪情況下的信號傳輸壓縮重構(gòu)的對比,包括有主觀上的聲音分辨率情況以及客觀上的峰值信噪比的對比。