• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種基于線性預(yù)測的語音認(rèn)證算法*

    2015-01-08 13:46:03夏西泉
    火力與指揮控制 2015年10期
    關(guān)鍵詞:魯棒性線性語音

    夏西泉,王 平

    (1.重慶電子工程職業(yè)學(xué)院應(yīng)用電子學(xué)院,重慶 401331;2.重慶大學(xué)輸配電裝備及系統(tǒng)安全與新技術(shù)國家重點實驗室,重慶 400044)

    一種基于線性預(yù)測的語音認(rèn)證算法*

    夏西泉1,王 平2

    (1.重慶電子工程職業(yè)學(xué)院應(yīng)用電子學(xué)院,重慶 401331;2.重慶大學(xué)輸配電裝備及系統(tǒng)安全與新技術(shù)國家重點實驗室,重慶 400044)

    針對傳統(tǒng)語音認(rèn)證算法不適用于資源受限的移動通信終端語音通信的實時性要求,提出了一種高效的基于線性預(yù)測分析的語音認(rèn)證算法。該算法基于語音信號的線性預(yù)測分析的原理對LPC系數(shù)參數(shù)進(jìn)行優(yōu)化,并對構(gòu)成的LPC系數(shù)矩陣進(jìn)行后處理、非負(fù)矩陣分解和量化,形成感知特征序列。實驗結(jié)果表明:所提算法對于內(nèi)容保持操作具有良好的魯棒性,并且運算效率沒有降低,可以滿足語音通信實時性的要求。

    語音認(rèn)證,魯棒性,線性預(yù)測系數(shù),非負(fù)矩陣分解

    0 引言

    語音信息作為人類交流信息最自然、最有效、最方便的手段,隨著移動通信和個人通信技術(shù)的發(fā)展,全球各地的人可以隨時隨地通話,相互聯(lián)系越來越緊密。另一方面,語音的存在形式也由聲波擴展到了模擬信號和數(shù)字信號,可以無限傳播和保存[1]。

    在方便人類生活的同時,隨之而來的是海量的語音信息處理、信息安全、社會安全問題[2]。語音內(nèi)容認(rèn)證技術(shù)就是一個實現(xiàn)對語音數(shù)據(jù)完整性、真實性進(jìn)行保護(hù)的有效技術(shù)手段,它可以檢測出接收到的語音數(shù)據(jù)在傳送過程中沒有經(jīng)過第三方的惡意編輯和篡改[3]。由于語音的特殊性,傳統(tǒng)的簽名認(rèn)證算法無法滿足語音的認(rèn)證要求,一是因為魯棒性的要求,語音在傳輸過程中經(jīng)常會受到各種干擾,而語音信息并不會因為內(nèi)容保持操作而影響整體的聽覺理解,因此,認(rèn)證過程中,就應(yīng)該將內(nèi)容保持操作歸納到認(rèn)證的范圍內(nèi),這就對語音認(rèn)證算法的魯棒性提出了很高的要求[4]。另一方面,語音傳輸?shù)膶崟r性和語音移動終端的資源問題,使得語音認(rèn)證算法對運算效率又有著很高的要求。而傳統(tǒng)的摘要認(rèn)證算法是將所有的數(shù)據(jù)都看成比特流,因此,原始數(shù)據(jù)的微小改動,都會使產(chǎn)生的摘要發(fā)生變化,魯棒性太差,不適用于語音認(rèn)證,并且對資源要求很高,計算量較大[5]。

    目前,對語音認(rèn)證特征值提取和處理的方法有很多,多是圍繞人類聽覺系統(tǒng)進(jìn)行優(yōu)化[6],作為再估計基本的語音參數(shù),以及用低速率傳輸或儲存語音等方面的核心技術(shù),線性預(yù)測(Linear Prediction)可用很少的參數(shù),有效而又正確地表現(xiàn)語音波形及其頻譜的性質(zhì),而且計算效率高,在應(yīng)用上靈活方便[7]。

    本文針對移動通信環(huán)境下語音通信在認(rèn)證過程中的魯棒性和實時性問題,以認(rèn)證數(shù)據(jù)量小,效率高為研究目的,提出了一種基于線性預(yù)測分析的語音認(rèn)證算法,算法具有對于內(nèi)容保持操作的魯棒性和惡意攻擊的敏感性。

    1 語音認(rèn)證相關(guān)技術(shù)

    1.1 線性預(yù)測分析

    線性預(yù)測分析是目前分析語音信號最有效的方法之一,線性預(yù)測分析在語音中應(yīng)用的基本思想是將一個語音片段(幀)的值,用過去若干個(線性預(yù)測的階數(shù))的語音片段的加權(quán)線性組合來構(gòu)成。在構(gòu)成線性預(yù)測的過程中,加權(quán)系數(shù)可以稱為預(yù)測器系數(shù),通過對線性加權(quán)構(gòu)成的語音片段與實際語音片段差值的逼近最小值,來確定一組加權(quán)系數(shù)的取值。

    設(shè)s(n),n=1,2…,n是語音信號的采樣序列,s(n)是語音信號在第n時刻的采樣值,也就是要預(yù)測的當(dāng)前采樣值。p為線性預(yù)測器的階數(shù),是根據(jù)過去的p個采樣值的加權(quán)和來預(yù)測當(dāng)前取樣值s(n)的,此時的預(yù)測器稱為p階預(yù)測器。

    根據(jù)線性預(yù)測分析的原理可知,為了得到最小的預(yù)測誤差,就要使得均方誤差最小,根據(jù)式(2)可以得到誤差e(n)的公式,因此,可以得到

    正交方程等于0,因此,式(4)可得:

    由式(6)和式(3)可以得到

    通過線性預(yù)測分析,由N幀語音可以得到N組的LPC參數(shù),每組LPC參數(shù)形成一個特征矢量,即線性預(yù)測特征參量。在線性預(yù)測編碼中,為了提高LPC系數(shù)的魯棒性,引出了許多與LPC系數(shù)等價的表示方法,可以由LPC特征參數(shù)進(jìn)一步得到很多派生參數(shù)。

    1.2 非負(fù)矩陣分解

    NMF算法具有求解收斂速度快,分解后非負(fù)矩陣存儲空間小的特點。

    以K-L散度(Kullback-LeiblerDivergence,KLD)來表示兩個矩陣的收斂距離。

    對于任意W,H,都必須滿足W>0,H>0,(VWH)2→0。

    對于任意W,H,都必須滿足W>0,H>0,D(V‖WH)→0,根據(jù)上述規(guī)則不停迭代,直到評價函數(shù)局部最小。

    2 基于線性預(yù)測分析的語音認(rèn)證算法

    線性預(yù)測產(chǎn)生的預(yù)測系數(shù)為

    其中,n為語音信號的總幀數(shù),p為線性預(yù)測器的階數(shù)。對矩陣進(jìn)行非負(fù)矩陣分解,得到系數(shù)矩陣W。

    計算新矩陣W每列的元素之和:

    對形成的系數(shù)和的行矩陣進(jìn)行量化,形成語音特征值,

    3 實驗結(jié)果與分析

    3.1 實驗環(huán)境:

    在實驗中,使用的是格式為wav的語音片段,所采用的語音參數(shù)為采樣率為16 000 Hz,比特率為256 kb/s,聲道數(shù)為單聲道,采樣精度為16 bit,幀長20 ms,幀移10 ms。

    3.2 區(qū)分性分析

    對語音產(chǎn)生的特征值進(jìn)行對比,所得的比特誤碼率的正態(tài)分布如圖1所示。

    不同內(nèi)容的語音的特征值的比特誤碼率基本服從正態(tài)分布,其概率分布參數(shù)為均值μ=0.417 2,標(biāo)準(zhǔn)差σ=0.016 7,得到算法的誤識率。

    當(dāng)閾值為0.35時算法的誤識率達(dá)到10-6,能夠滿足語音認(rèn)證的需要。

    3.3 魯棒性分析

    對語音庫中的語音進(jìn)行內(nèi)容保持操作。根據(jù)上述攻擊得到BER,繪制FRR,F(xiàn)AR曲線,如圖2所示,從內(nèi)容相同的語音中提取的特征值,BER都在閾值0.35以下,實驗結(jié)果表明,本算法具有較高的魯棒性。并且,圖中FRR-FAR曲線在圖中沒有交叉,說明本算法同時具有良好的區(qū)分性和魯棒性,可以準(zhǔn)確地識別內(nèi)容保持操作和內(nèi)容惡意操作。根據(jù)表2可知,當(dāng)閾值=0.35時,F(xiàn)AR=2.889 5e-006。

    對比以上幾種攻擊的認(rèn)證通過率在判決閾值在0.35時,能夠滿足認(rèn)證的需要。本文提出的算法針對內(nèi)容保持操作攻擊具有較強的魯棒性,尤其是回升和低通濾波的魯棒性有了比較大的提高。但重采樣魯棒性相比LPC算法較差,但在判決閾值=0.35時,還是能夠很好地區(qū)分語音是否能夠通過認(rèn)證。經(jīng)過攻擊的語音認(rèn)證通過閾值主要分布在0.25~0.35之間。因此,本文優(yōu)化后的算法對內(nèi)容保持操作具有較好的魯棒性。

    4 結(jié)束語

    本文提出了線性預(yù)測編碼與非負(fù)矩陣分解相結(jié)合的語音認(rèn)證算法。通過實現(xiàn)分析可以看出,本文提出的算法能夠有效地檢測出相同語音和不同語音,具有很好的區(qū)分性;在語音魯棒性方面,在確定閾值后,經(jīng)過檢測的語音能夠準(zhǔn)確地匹配出受到內(nèi)容保持操作的語音片段。實驗證明本文所提出的算法能夠得到區(qū)分性和魯棒性較好的折中,并且算法簡單,運算效率高,數(shù)據(jù)率低,可以很好地完成語音認(rèn)證。

    [1]吳婧.基于感知哈希技術(shù)的音頻檢索方案研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2008.

    [2]古今.語音感知認(rèn)證的關(guān)鍵技術(shù)研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2009.

    [3]焦玉華.音頻感知哈希算法研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2010.

    [4]牛夏牧,焦玉華.感知哈希綜述[J].電子學(xué)報,2008,36(7):1405-1411.

    [5]Jiao Y H,Ji L P,Niu X M.Perceptual Speech Hashing and Performance Evaluation[J],International Journal of Innovative Computing,Information and Control,2010,6(3(B)): 1447-1458.

    [6]古今,郭立,梁惠,等.一種高效魯棒的語音感知認(rèn)證算法[J].小型微型計算機系統(tǒng),2010,4(7):1461-1466.

    [7]Xue X Y,Li W,Yin Y.Towards Content-based Audio Fragment Authentication[C]//MM'11 Proceedings of the 19th ACM international Conference on Multimedia 2011,28: 1249-1252.

    A Speech Authentication Algorithm Based on Linear Prediction Analysis

    XIA Xi-quan1,WANG Ping2
    (1.Institute of Applied Electronics,Chongqing College of Electronic Engineering,Chongqing 401331,China;2.State Key Laboratory of Power Transmission Equipment&System Security and New Technology,Chongqing University,Chongqing 400044,China)

    According to the situation that traditional speech authentication algorithms does not appropriated for present speech communication,a speech authentication algorithm based on linear prediction analysis is proposed,it can satisfy the requirement of the efficiency and the robustness for speech authentication.Firstly,the LPC coefficients are optimized based on the principle of linear prediction analysis for speech signal,and make Non-negative Matrix Factorization(NMF)toward the coefficients.Finally,the formed getting Characteristics sequences is quantified.Experiments show that the proposed algorithm has good robustness for content preserving operations,and it doesn't reduce the efficiency while meeting the robustness,it can satisfy the real-time requirement of speech communication.

    speech authentication,robustness,LPC,NMF

    TN911.72

    A

    1002-0640(2015)10-0072-03

    2014-09-15

    2014-10-20

    重慶市科學(xué)技術(shù)研究基金資助項目(KJ132206)

    夏西泉(1969- ),男,重慶潼南人,副教授。研究方向:電子技術(shù),通信系統(tǒng)與信息處理。

    猜你喜歡
    魯棒性線性語音
    漸近線性Klein-Gordon-Maxwell系統(tǒng)正解的存在性
    線性回歸方程的求解與應(yīng)用
    荒漠綠洲區(qū)潛在生態(tài)網(wǎng)絡(luò)增邊優(yōu)化魯棒性分析
    魔力語音
    基于確定性指標(biāo)的弦支結(jié)構(gòu)魯棒性評價
    基于MATLAB的語音信號處理
    電子制作(2019年14期)2019-08-20 05:43:38
    基于MQ3與MP3的價廉物美的酒駕語音提醒器
    電子制作(2019年9期)2019-05-30 09:42:10
    對方正在輸入……
    小說界(2018年5期)2018-11-26 12:43:42
    二階線性微分方程的解法
    基于非支配解集的多模式裝備項目群調(diào)度魯棒性優(yōu)化
    开封县| 唐海县| 张家港市| 舞钢市| 磐石市| 乌拉特前旗| 天峨县| 东安县| 霍山县| 长寿区| 仁化县| 遵义市| 乌鲁木齐市| 三河市| 太保市| 西峡县| 敖汉旗| 辛集市| 舞阳县| 灵丘县| 太和县| 黄平县| 马山县| 台中市| 北辰区| 同德县| 芷江| 荥经县| 宁陕县| 德兴市| 江永县| 忻州市| 元阳县| 定日县| 玉门市| 英山县| 开远市| 石门县| 运城市| 惠水县| 建水县|