• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    分形理論在語音信號端點檢測及增強中的運用

    2018-02-03 14:07:38曾劍飛何律君
    電腦知識與技術(shù) 2018年2期
    關(guān)鍵詞:增強

    曾劍飛+何律君

    摘要:文章針對語音信號端點檢測與增強中分形理論的運用,從分形理論特征、實際內(nèi)容以及實驗幾個方面展開了分析,目的在于總結(jié)最為合適的端點檢測方法。

    關(guān)鍵詞:分形理論;語音信號端點檢測;增強

    中圖分類號:TP311 文獻標(biāo)識碼:A 文章編號:1009-3044(2018)02-0154-02

    近幾年,我國語音信號處理技術(shù)逐漸提升,尤其是低信噪比基礎(chǔ)上的語音信號處理,已經(jīng)在相關(guān)領(lǐng)域成為一個主要的研究課題。對于此,諸多專業(yè)人數(shù)已對其展開了研究,并且提出了一些帶噪語音信號處理技術(shù)。在語音信號處理技術(shù)發(fā)展的影響下,非線性處理方式也得到重視,對帶噪語音信號進行處理的過程中,語音信號、噪聲信號模型參數(shù)主要是以相應(yīng)的語音段、噪聲段得到明確。所以在判斷語音、非語音段方面,則成為語音處理系統(tǒng)中一個最為重要的問題,也就是所謂的帶噪語音信號端點檢測。

    1 分形理論概述

    針對分形理論,以往的理解都帶有一定的不規(guī)則性,一般是對“因為整體通過某種形式相似的部分構(gòu)成的一類形體”、“Harsdorff維數(shù)超過拓撲維數(shù)集合”進行表示[1]。但是,在某一角度來說,并沒有專業(yè)學(xué)者對分形理論進行嚴格的定義,只是簡單的提出了描述性的說法,即帶有某些性質(zhì)的集合,其中主要體現(xiàn)了以下幾個特點:第一,分形具有自相似性;第二,分形結(jié)構(gòu)的精細性:第三,分形維數(shù)大于其本身拓撲維數(shù);第四,分形可以利用迭代遞歸形成。具體如下:

    1.1 分形具有自相似性

    所謂自相似性,即整體和部分,不管是形態(tài)、作用,還是信息,都體現(xiàn)了非常強的相似性。對分形對象集合尺寸進行合理的縮小或擴大,也不會對原結(jié)構(gòu)造成改變。

    1.2 標(biāo)度帶有不變性

    標(biāo)度具有不變性,這一點是分形集獨有的特點,指不管怎么變形測量對象尺度如何改變,都不會使測量對象性質(zhì)出現(xiàn)變化[2]。然而,需要將數(shù)學(xué)模型排除在外,針對帶有實際分形集的測量對象,這種標(biāo)度不變形只能夠在一定范圍內(nèi)加以使用。通常來說,標(biāo)度不變性適用空間被成為分形體無標(biāo)度區(qū)間,相關(guān)人員需要根據(jù)研究對象所體現(xiàn)的實際性質(zhì),對判定無標(biāo)度區(qū)間切實范圍進行明確。

    1.3 分形維數(shù)

    形成分形維數(shù)主要是利用分形標(biāo)度關(guān)系,獲取實際的定量數(shù)值,這樣一來能夠?qū)⑵胀ㄍ負浼S數(shù)是整數(shù)這一問題進行拓展,使維數(shù)有整數(shù)范圍擴大到分數(shù)。同時,其中也體現(xiàn)了分形維數(shù)的其他特點,重點表現(xiàn)為以下幾個方面:第一,分形維數(shù)與尺度之間無聯(lián)系;第二,分析維數(shù)本身是相對量;第三,分析維數(shù)大小充分直接關(guān)系到空間中輪廓的不規(guī)則性、繁瑣性,以及在空間內(nèi)的滿足程度。一般來說,維數(shù)越小,那么所體現(xiàn)的細節(jié)越少,其位數(shù)也就越大。

    2 分形理論在語音信號處理中的運用

    將分形理論運用于語音信號處理,主要分為三個部分,即語音分割、語音合成和端點檢測。那么接下來就對這三個部分進行簡要分析。

    2.1 語音分割

    因為人耳的聽力在語音高頻部分所體現(xiàn)的分辨率,一般會低于低頻部分,但是清音段是語音高頻非常關(guān)鍵的構(gòu)成部分,在聽覺角度分析,其實并不存在嚴重的影響,因此,相關(guān)人員需要在語音信號處理期間,定期對語音實施清濁音分割[3]。這二者之間本身體現(xiàn)了一定的不規(guī)則性,相關(guān)人員可以對分維值進行測量,以此對清音、濁音進行分割。

    2.2 語音合成

    在語音信號處理中,語音合成也是其中必不可少的內(nèi)容之一,為未來的發(fā)展直接關(guān)系到語音編碼。因為語音信號本身帶有自相似性特點,其主要表現(xiàn)在其中某一結(jié)構(gòu)特點處于不同時間、空間尺度中,帶有相似性。盡管語音信號時域波形體現(xiàn)了分形的特點,但是卻并非是完整的分形,通常只是在某一領(lǐng)域中出現(xiàn)分形特點。根據(jù)這一點,可以按照IFS 理論、拼貼定理對其進行研究與討論,對語音信號進行劃分,使其成為不重疊小區(qū)間序列,在這之后,便可以得到隨意一幀IFS 三個參數(shù),這樣一來便可以對數(shù)據(jù)進行壓縮。相關(guān)人員對語音進行合成期間,使用已經(jīng)得到的 IFS 參數(shù),將其重復(fù)迭代,直至收斂到 IFS吸引子為止,如此便可以獲取需要的語音信號。

    2.3 端點檢測

    所謂端點檢測,即針對初始聲音信息數(shù)據(jù)中所包含的純粹語音段,對局部進行準(zhǔn)確的定位,從而獲取需要的語音單位起止點,這一點也是本文分析與討論的要點。通常,所獲取的語音單位并不局限于一點,既可以是詞,也可以是音節(jié)和音素等。對端點進行檢測時,因為其本身是語音信號處理這一工作的重點,所以需要保證其準(zhǔn)確性,這也與最后語音特征的提取、可行性的體現(xiàn)有直接關(guān)系[4]。通過實際實踐可知,其實兩個相鄰的音素分維值之間,帶有好很大的差異性,分維軌跡也可能會出現(xiàn)突變的現(xiàn)象,針對這一點,相關(guān)人員也要按照這一特點,對相對門限值進行確定。若其中一幀語音分維值相比這一相對門限要低,那么便可獲取這一幀起始語音和這一幀之前的語音,了解到這二者音素不同,這樣一來便完成了語音音素分割,進而實現(xiàn)對端點的有效檢測。

    3 語音信號短時分形維數(shù)計算

    分形維主要是對分形特點進行描述的參數(shù),同時也是分形信號中十分關(guān)鍵的特征參數(shù)。通過分形方法的運用,能夠使維數(shù)由整數(shù)擴張至分數(shù),這也將傳統(tǒng)拓撲維數(shù)是整數(shù)的限制打破。對于分形維的定義其實比較廣泛,一般比較常見的主要有以下幾種:計盒維數(shù)、關(guān)聯(lián)位數(shù)、信息維數(shù)。本文主要以計盒維數(shù)為例展開計算。

    對于計盒維數(shù)的定義,相關(guān)文獻中對其進行了規(guī)定:n維歐式空間子集F的計盒維數(shù)DB,具體定義如下:

    [DB=linδ→0lnNδ(F)ln(1/δ)],[log(Nδ(F))∝DBlog(1/δ)] (1)

    在公式(1)中,[Nδ(F)]代表以邊長為[δ]的網(wǎng)格對F需要的最小正方形數(shù)量進行覆蓋。實踐過程中,一般可以利用多點直線擬合的方式對DB進行計算。公式如下:endprint

    [DB=i=1MlogNδi(F)i=1Mlog(1/δi)-Mi=1M(logNδi(F)log(1/δi))i=1Mlog(1/δi)2-Mi=1M(log(1/δi))2] (2)

    在公式(2)中,[δi]代表M變化的尺度,i=1,2,3,…,M。

    對公式(2)進行分析,使尺度變化是[δi+1]-[δi]=[δ]([δi]=i[δ],i=1,2,3,…,M),將其帶入到公式(2)中,從而獲得公式(3):

    [DB=MI=1MlogNδilogi-i=1MlogNδii=1MlogiI=1Mlogi2-MI=1M(logi)2] (3)

    4 帶噪語音信號端點檢測

    對帶噪語音信號端點進行檢測,可以先假設(shè)x(i)為帶噪語音信號時間序列,s(i)、n(i)則是語音信號、加性白噪聲時間序列,以此便可以得出信號模型,即

    [x(i)=s(i)+n(i)] (4)

    對語音端點進行檢測主要是為了在數(shù)據(jù)x(i)的測量過程中,對語音段s(i)起止點進行判斷[5]。因為語音段中,帶噪語音信號x(i)體現(xiàn)了規(guī)則性和周期性的特點,換而言之,即語音段信號分形維維數(shù)與非語音段分形維二者相比較,前者比較小。所以,其實可以通過信號短時分形維數(shù)變化狀況對語音信號端點進行檢測。

    在實際仿真實驗中,主要使用的是之前完成錄制的語音信號“你好”,采樣頻率為22050Hz,所有樣本都是以16bit實現(xiàn)量化。在10~20ms期間,語音信號十分穩(wěn)定,因為后期需要對計算量進行簡化,所以將幀長控制在300點,所有相鄰幀之間無重疊,共計100幀,且有分幀需求時主要以矩形窗為主。通過實際實驗可知,錄制好的“你好”語音波形中,已經(jīng)被加性被噪聲所污染的語音信號所體現(xiàn)的信噪比為0db,帶噪語音信號分維值中,可以清楚地了解到,噪聲段與語音段交界處的分維軌跡有突變點。正因為如此為帶噪語音信號端點檢測提供了便利。通過試驗也可以了解到,噪聲段分維值通常要大于語音段分維值。

    5 以端點檢測為前提的譜相減語音增強方式與仿真結(jié)論

    5.1 以端點檢測為前提的譜相減語音增強方式

    在語音信號處理和識別系統(tǒng)中,語音增強是其中非常關(guān)鍵的構(gòu)成部分,進行語音增強,主要是為了將語音質(zhì)量進行提高,將語音匯總的噪聲消除,使語音更加自然。譜相減法和改進型方式因為其本身的計算量比較小,在實際計算過程中比較容易實時實現(xiàn),所以在語音增強工作中十分常見。但是使用當(dāng)前所現(xiàn)有的譜相減法對語音信號進行處理的過程中,有時信號處理的效果十分不理想,特別是信噪比低的時候,效果更差。一旦傅立葉出現(xiàn)反變換,那么便會在個別頻帶處出現(xiàn)殘留的噪聲。為了將這一問題合理解決,需要總結(jié)之前工作的經(jīng)驗,并且綜合考慮其他帶噪語音信號端點檢測方式,以此提出以端點檢測為前提的譜相減語音增強算法。

    對于語音段、噪聲段交界處可以使用分形維進行檢測,因此針對帶噪語音信號便可以實現(xiàn)分段處理。

    [|S(ejω)|γ=X(ejω)|γ-α|N(ejω)|γ,當(dāng)|X(ejω)|γ-α|N(ejω)|γ>β|N(ejω)|λ時β|N(ejω)|γ,其他] (5)

    在公式(5)中,[X(ejω)]、[S(ejω)]、[N(ejω)]是觀測信號x(i)、s(i)、n(i)在FFT變換之后,從而獲得的數(shù)據(jù),α、β使經(jīng)驗數(shù)值。針對噪聲段而言,為了能夠?qū)⒃肼曈行б种?,需要取比較大的α值,將β=0。針對語音段而言,需要在保證語音不失真的基礎(chǔ)上,盡最大可能抑制噪聲,如此一來,便要取比較小的α值,相反β值要比較大。

    5.2 仿真結(jié)論

    此次方針,依然使用之前“你好”你好,是兩個發(fā)音?

    根據(jù)譜相減法原理流程處理帶噪語音信號。選擇適當(dāng)尺寸的窗、α、β、γ,針對噪聲譜要按照之前使用的端點檢測法,對噪聲段平均值進行檢測。經(jīng)過反復(fù)幾次仿真試驗可知,對語音段進行處理時,分別將α、β、γ數(shù)值設(shè)置為1.5、0.01、1,而窗函數(shù)則依然為直角窗,將每段噪聲的長度設(shè)置為幀長度。

    通過對仿真試驗最終呈現(xiàn)的效果可知,帶噪語音信號的RSNR是0,并且通過這一實驗證明,端點檢測法體現(xiàn)了非常好的效果,增強之后的語音信號在包絡(luò)形狀上,非常完整的維持了原來的語音信號特點,并且將信噪比提升。通過處理前后語音信號信噪比的對比分析可知,一旦帶噪語音信號RSNR為-4db,那么所提出的所有方法依然適用于語音信號增強。

    5.3 實驗結(jié)論

    在低信噪比環(huán)境之下,對語音信號端點進行檢測,并且完成語音增強,是語音信號處理工作一直以來需要解決的問題之一。以往對這兩點問題進行解決時,需要是以高信噪比為前提,進行語音信號端點檢測以及增強,這種方式無法滿足現(xiàn)如今所體現(xiàn)的技術(shù)需求?;诖?,通過對傳統(tǒng)檢測方法的分析,在分形維、譜相減兩種方法的基礎(chǔ)上,提出了新的語音信號端點檢測與增強方法,并且將此方法進行仿真實驗,實驗結(jié)果表明,這一方法的可行的,且實驗過程中涉及的計算量也比較合理。所以實用價值比較高。然而這一方法在使用的過程中,需要端點檢測保證非常高的準(zhǔn)確性,一旦信噪比不足-5 dB,所體現(xiàn)的端點檢測最終效果準(zhǔn)確性可能降低,進而對增強之后的語音效果造成影響,關(guān)于這一問題還需要在日后的工作中繼續(xù)深入研究。

    6 結(jié)束語

    綜上所述,在語音信號端點檢測及增強中運用分形理論,可以有效減少計算量,但是相應(yīng)的也對準(zhǔn)確性提出了要求,要體現(xiàn)良好的運用效果,依然需要深入分析。

    參考文獻:

    [1] 劉永俊,張立飛,劉巍.面向噪聲環(huán)境下醫(yī)療語音信號端點檢測方法[J].常熟理工學(xué)院學(xué)報,2017,31(4):75-79+85.

    [2] 趙益波,蔣祎,吳禮福,等.基于麥克風(fēng)陣列自適應(yīng)非線性濾波的語音信號端點檢測方法[J].科技通報,2017,33(4):199-203.

    [3] 陳澤偉,曾慶寧,謝先明, 等.基于自相關(guān)函數(shù)的語音端點檢測方法[J/OL].計算機工程與用, 2017,03:1-6.

    [4] 王明合,張二華,唐振民, 等.基于Fisher線性判別分析的語音信號端點檢測方法[J].電子與信息學(xué)報,2015,37(6):1343-1349.

    [5] 王建元,陳鵬,欒德福.基于SVD-HHT的低信噪環(huán)境語音信號端點檢測[J].制造業(yè)自動化,2014,36(1):57-61.endprint

    猜你喜歡
    增強
    如何增強基層黨建工作的活力
    魅力中國(2016年15期)2017-02-09 23:25:04
    淺談怎樣增強語文課堂活力
    東方教育(2016年6期)2017-01-16 21:35:55
    發(fā)展增強海洋經(jīng)濟的策略
    關(guān)于小學(xué)數(shù)學(xué)教學(xué)構(gòu)建學(xué)生參與課堂的措施探討
    人力資源管理中的員工多樣化管理
    新時期強化民族大學(xué)生法律意識的對策研究
    增強新區(qū)發(fā)展的金融支持的對策
    共產(chǎn)黨員要增強信仰定力
    遼寧省企業(yè)創(chuàng)新能力增強路徑研究
    增強后進生自尊心 做好教育轉(zhuǎn)化工作
    阜新| 新竹市| 互助| 突泉县| 福贡县| 诏安县| 蒲江县| 察哈| 会东县| 什邡市| 齐齐哈尔市| 双桥区| 深水埗区| 饶阳县| 宿州市| 杭州市| 洪江市| 雅江县| 深水埗区| 乌什县| 五寨县| 河津市| 沙湾县| 手机| 万年县| 鹤峰县| 九龙坡区| 内江市| 桐柏县| 安徽省| 锦州市| 霸州市| 义乌市| 无极县| 秀山| 申扎县| 石泉县| 神木县| 嵊州市| 休宁县| 博乐市|