• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于廣義Jaccard系數(shù)的SWOMP語(yǔ)音壓縮感知重建算法

      2022-01-23 05:10:28劉建生趙茂君李忠兵段洪名蔣川東
      關(guān)鍵詞:內(nèi)積廣義準(zhǔn)則

      劉建生, 趙茂君, 李忠兵, 段洪名, 蔣川東

      (西南石油大學(xué) 電氣信息學(xué)院 四川 成都 610500)

      0 引言

      語(yǔ)音是人類最重要、最有效、最常用的交流方式之一,在生產(chǎn)生活中起著非常重要的作用。語(yǔ)音重建是指從語(yǔ)音信號(hào)的變換域或參數(shù)域重建時(shí)域信號(hào)的過程[1],在語(yǔ)音信號(hào)處理中占據(jù)非常重要的地位。

      傳統(tǒng)的語(yǔ)音信號(hào)處理是基于Nyquist采樣定理,該定理指出,對(duì)一段語(yǔ)音信號(hào)采樣時(shí),采樣頻率至少需要達(dá)到信號(hào)帶寬的兩倍,才能保證在接收端完美重建出原始信號(hào)。但隨著大數(shù)據(jù)時(shí)代的到來(lái),人與人之間的聯(lián)系更加密切,信息交互也更加頻繁,這就意味著需要傳輸、存儲(chǔ)的語(yǔ)音信號(hào)的數(shù)據(jù)量爆炸式增長(zhǎng),使得語(yǔ)音信號(hào)處理系統(tǒng)越來(lái)越難以承受。

      壓縮感知(compressed sensing,CS)[2]理論的出現(xiàn)徹底打破了傳統(tǒng)的信號(hào)采樣方式。CS理論指出,如果信號(hào)是稀疏的或在某個(gè)變換域內(nèi)是稀疏的,那么就可用一個(gè)與變換域不相關(guān)的觀測(cè)矩陣將高維信號(hào)投影到一個(gè)低維空間上,得到觀測(cè)向量,然后在重建端通過求解優(yōu)化問題從觀測(cè)向量中高概率地重建原始信號(hào)[3]。與Nyquist采樣定理不同,CS理論對(duì)信號(hào)實(shí)行邊采樣邊壓縮處理,降低了采樣率,縮減了需要存儲(chǔ)的數(shù)據(jù)量。因此壓縮感知理論被廣泛應(yīng)用于語(yǔ)音信號(hào)處理[4]、圖像信號(hào)處理[5]以及無(wú)線電信號(hào)處理。

      CS理論主要包含三部分:信號(hào)的稀疏表示、測(cè)量矩陣的設(shè)計(jì)和重建算法。其中重建算法是該理論能否實(shí)現(xiàn)的關(guān)鍵[6]。目前,重建算法主要分為貪婪類算法和凸優(yōu)化類算法[7]。由于貪婪類算法計(jì)算復(fù)雜度低、時(shí)間短,在實(shí)際工程運(yùn)用中較為廣泛。階段性弱選擇正交匹配追蹤(SWOMP)算法是Blumensath等提出的一種經(jīng)典貪婪算法[8],該算法不需要將信號(hào)的稀疏度作為先驗(yàn)條件,而是利用閾值策略篩選原子,完成信號(hào)的重建,適合應(yīng)用在語(yǔ)音信號(hào)這種稀疏度不易求得的信號(hào)中。

      SWOMP算法重建信號(hào)時(shí),采用內(nèi)積準(zhǔn)則從傳感矩陣中挑出與殘差信號(hào)最匹配的原子。內(nèi)積匹配準(zhǔn)則的實(shí)質(zhì)是通過計(jì)算兩個(gè)向量夾角的余弦值表示兩個(gè)向量的相似程度。但是使用內(nèi)積準(zhǔn)則計(jì)算向量相似度時(shí),不會(huì)放大數(shù)據(jù)對(duì)象的重要部分,在傳感矩陣中存在任意兩個(gè)相似原子都會(huì)影響匹配過程,導(dǎo)致原始信號(hào)的部分信息丟失,造成算法重建精度下降[9]。因此本文針對(duì)SWOMP算法在原子匹配過程存在原子丟失的缺點(diǎn),提出用廣義Jaccard系數(shù)相似性匹配準(zhǔn)則代替內(nèi)積準(zhǔn)則,完成原子相似性的度量,優(yōu)化原子選擇,以此提高語(yǔ)音信號(hào)重建的質(zhì)量。

      1 壓縮感知基本內(nèi)容

      壓縮感知理論指出,假設(shè)x是長(zhǎng)度為Ψ的原始信號(hào),若該信號(hào)是稀疏的或在某一稀疏基上能夠被稀疏表示,那么可以將該稀疏信號(hào)投影到滿足約束等距(restricted isometry property,RIP)[10]條件的M×N的觀測(cè)矩陣Φ(M?N)上,得到大小為M×1觀測(cè)值y,即:

      y=Φx。

      (1)

      若原始信號(hào)在時(shí)域上不稀疏,則可以通過N×N的稀疏基Ψ進(jìn)行稀疏表示,即:

      x=Ψν,

      (2)

      其中:ν是N×1的經(jīng)過稀疏表示后的稀疏系數(shù),當(dāng)ν滿足‖ν‖0=K(K≤N)時(shí),稱信號(hào)x是K稀疏的,‖ν‖0表示向量ν的零范數(shù),即向量ν中的非零元素個(gè)數(shù)。此時(shí)式(1)可寫為

      y=ΦΨν=Aθ,

      (3)

      A=ΦΨ,A為傳感矩陣。RIP描述為對(duì)于任意嚴(yán)格K稀疏的向量η,若存在常數(shù)δK∈(0,1)使得

      (4)

      成立,則稱矩陣Φ滿足K階約束等距特性。

      信號(hào)重建是壓縮感知的最重要的一個(gè)環(huán)節(jié),壓縮感知重建信號(hào)實(shí)質(zhì)就是由式(1)求解最小L0范數(shù)的優(yōu)化問題,即

      min‖ν‖0, s.t.y=Φx=ΦΨν=Aν,

      (5)

      其中:‖ν‖0是ν的L0范數(shù)。

      目前以L0范數(shù)最小化為基礎(chǔ)的經(jīng)典貪婪類算法有OMP算法[11]、ROMP算法[12]、SWOMP算法等重建算法。

      2 基于廣義Jaccard系數(shù)的SWOMP語(yǔ)音重建

      2.1 分段弱正交匹配追蹤算法

      SWOMP算法在每次迭代的過程中,首先要確定殘差信號(hào)的成分;然后以內(nèi)積準(zhǔn)則為度量手段,在傳感矩陣中選出最能逼近這些成分的原子用于更新支撐集,將支撐集內(nèi)的原子通過求最小二乘法完成信號(hào)的逼近,最后求得新的殘差值。

      假設(shè)索引集為Ω,則有

      |sim(Ai,r)|…|sim(Aj,r)|,

      (6)

      式中:sim()函數(shù)代表兩個(gè)向量之間的相似程度;r表示殘差;Ai、Aj代表傳感矩陣的列向量,將篩選的最優(yōu)原子的位置保存在索引集Ω中。

      內(nèi)積匹配準(zhǔn)則

      (7)

      是用內(nèi)積準(zhǔn)則度量相似性,計(jì)算傳感矩陣中與殘差值最相似的原子,內(nèi)積模值越大,表示原子與殘差值的相似程度也越大。ui代表當(dāng)前迭代過程中與殘差值最相似的原子。從上述分析可知,信號(hào)重構(gòu)實(shí)質(zhì)是通過最優(yōu)原子構(gòu)建的支撐集完成重構(gòu),因此最優(yōu)原子的選擇對(duì)重構(gòu)算法至關(guān)重要。但是以內(nèi)積準(zhǔn)則篩選原子的傳統(tǒng)SWOMP算法很難選出最優(yōu)的原子,造成重構(gòu)語(yǔ)音信號(hào)的質(zhì)量差。

      2.2 基于廣義Jaccard系數(shù)的分段弱正交匹配追蹤算法

      對(duì)任意兩個(gè)n維向量x、y,內(nèi)積匹配準(zhǔn)則為

      (8)

      內(nèi)積準(zhǔn)則實(shí)質(zhì)是通過計(jì)算兩個(gè)向量夾角的余弦值來(lái)表示向量的相似性,余弦值越大,夾角越小,向量就越相似。傳統(tǒng)SWOMP算法便是使用內(nèi)積準(zhǔn)則度量殘差與原子間相似性。但是該匹配準(zhǔn)則不容易區(qū)分相似向量,存在原始信號(hào)部分丟失的問題,導(dǎo)致算法的重建效果不理想。為了解決該問題,本文提出將廣義Jaccard系數(shù)引入到最佳原子匹配過程中。

      對(duì)任意兩個(gè)n維向量x、y,廣義Jaccard系數(shù)匹配準(zhǔn)則為

      (9)

      由式(8)、(9)可知,廣義Jaccard系數(shù)匹配準(zhǔn)則的分母前半部分可以看作是兩個(gè)向量平方的算數(shù)平均,而內(nèi)積準(zhǔn)則的分母是兩個(gè)向量平方的幾何平均,由數(shù)學(xué)知識(shí)可知,算數(shù)平均比幾何平均能更好地保留每個(gè)分量的原始狀態(tài),同時(shí)廣義Jaccard系數(shù)匹配準(zhǔn)則分母的后半部分可以看作是在向量算數(shù)平均的基礎(chǔ)上減去兩個(gè)向量的相同部分,進(jìn)一步凸顯了兩個(gè)向量之間的差異,使得原子不容易混淆[13]。因此,理論上廣義Jaccard系數(shù)匹配準(zhǔn)則的引入能夠選出更優(yōu)的匹配原子,進(jìn)而提高算法的重建精度。

      將廣義Jaccard系數(shù)匹配準(zhǔn)則引入SWOMP算法,提出基于廣義Jaccard系數(shù)的SWOMP算法,改進(jìn)算法的匹配準(zhǔn)則為

      u=abs[Jaccard(AT,rs-1)],

      (10)

      式中:Jaccard(AT,rs-1)為殘差和傳感矩陣列向量的廣義Jaccard匹配系數(shù)。

      基于廣義Jaccard系數(shù)的匹配準(zhǔn)則能夠突出向量的組成元素,更多地保留每個(gè)向量的原始特征,解決了內(nèi)積準(zhǔn)則度量相似性時(shí)原始信號(hào)部分丟失的問題,篩選出與殘差向量更匹配的原子,提升了算法的重建性能。

      基于廣義Jaccard系數(shù)的SWOMP算法步驟如下。

      1) 初始化:r0=y;Λ0=?;A0=?;s=1;

      2) 計(jì)算u=abs[Jaccard(AT,rs-1)];

      其中,選擇u中大于門限Th的值,Th=αmax{abs(u)},將這些值對(duì)應(yīng)的A的序列號(hào)記為J0;

      3) 令Λs=Λs-1∪J0,As=As-1∪aj,若Λs=Λs-1,則迭代停止,進(jìn)入7);

      6) 如果s≤m,則令s=s+1,返回2)繼續(xù)迭代,如果s>m或rs=0,則停止迭代,進(jìn)入7);

      其中:J0表示每次迭代找到的索引;Λs表示s次迭代索引集合;aj表示矩陣A的第j列;As表示由索引集Λs選出的矩陣A的列集合;rs-1表示殘差;〈a,b〉表示求a和b的內(nèi)積;s表示迭代次數(shù)。

      3 實(shí)驗(yàn)結(jié)果及分析

      語(yǔ)音信號(hào)是非平穩(wěn)的時(shí)變信號(hào),但在10~30 ms內(nèi)可近似認(rèn)為是平穩(wěn)的,也就是語(yǔ)音信號(hào)具有短時(shí)平穩(wěn)性。因此,在對(duì)語(yǔ)音信號(hào)重建時(shí),首先對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行分幀處理,得到時(shí)長(zhǎng)為10~30 ms的多幀信號(hào),然后對(duì)每幀語(yǔ)音信號(hào)使用離散余弦基進(jìn)行稀疏表示,再經(jīng)過觀測(cè)矩陣進(jìn)行觀測(cè),最后在重建端應(yīng)用重建算法完成對(duì)語(yǔ)音信號(hào)的重建。

      仿真實(shí)驗(yàn)所用語(yǔ)音信號(hào)來(lái)自于中科院自動(dòng)化研究所CASIA語(yǔ)音庫(kù)的男、女聲語(yǔ)音信號(hào),時(shí)長(zhǎng)為1~3 s,頻率為16 kHz。實(shí)驗(yàn)的幀長(zhǎng)取320個(gè)采樣點(diǎn)(20 ms)。實(shí)驗(yàn)均在Intel(i5-4 200 M,4 GB內(nèi)存)平臺(tái)上完成,仿真軟件為Matlab2017a。

      信號(hào)具有稀疏性是壓縮感知理論應(yīng)用的前提條件,為了驗(yàn)證語(yǔ)音信號(hào)具有稀疏性,實(shí)驗(yàn)選取男聲語(yǔ)音中一段內(nèi)容為“競(jìng)爭(zhēng)增加效益”的信號(hào),將其在DCT域下進(jìn)行稀疏表示,圖1為原始時(shí)域波形圖,圖2為DCT域圖。

      圖1 原始語(yǔ)音時(shí)域圖

      圖2 原始語(yǔ)音DCT域圖

      通過圖1和圖2對(duì)比可知,原始語(yǔ)音信號(hào)在DCT域中僅存在少數(shù)較大值,其余值都很小,甚至為零,故語(yǔ)音信號(hào)在DCT域是稀疏的,滿足壓縮感知理論應(yīng)用前提。

      3.1 主觀分析

      稀疏基采用DCT基,觀測(cè)矩陣采用隨機(jī)高斯矩陣,壓縮比(M/N)為0.5,應(yīng)用SWOMP算法和基于廣義Jaccard系數(shù)的SWOMP算法對(duì)男聲語(yǔ)音中一段內(nèi)容為“競(jìng)爭(zhēng)增加效益”的語(yǔ)音進(jìn)行重建,重建的時(shí)域結(jié)果如圖3、4所示。

      圖3 SWOMP算法重建語(yǔ)音信號(hào)的時(shí)域結(jié)果圖

      對(duì)比圖1、圖3和圖4可知,相較于SWOMP算法,基于廣義Jaccard系數(shù)的SWOMP算法重建語(yǔ)音信號(hào)的時(shí)域圖更接近原始語(yǔ)音信號(hào)的時(shí)域圖,重建效果更好。

      圖4 基于廣義Jaccard系數(shù)的SWOMP算法重建語(yǔ)音信號(hào)的時(shí)域結(jié)果圖

      3.2 客觀分析

      為了客觀評(píng)價(jià)基于廣義Jaccard系數(shù)的SWOMP算法對(duì)語(yǔ)音信號(hào)的重建性能,本文采用平均幀信噪比(average frame signal noise rate,AFSNR)和客觀語(yǔ)音質(zhì)量評(píng)估(perceptual evaluation of speech quality,PESQ)兩種客觀評(píng)價(jià)指標(biāo)比較重建語(yǔ)音信號(hào)的質(zhì)量。單位均幀信噪比rAFSNR計(jì)算為

      (11)

      PESQ得分在2001年被國(guó)際電訊聯(lián)盟(ITU)采納為一種語(yǔ)音信號(hào)評(píng)價(jià)指標(biāo),分值為-0.5~4.5分,分值越高越好。本文實(shí)驗(yàn)的PESQ得分是由PESQ程序?qū)Ρ仍颊Z(yǔ)音與重建語(yǔ)音所得出。

      以離散DCT基作為稀疏基,觀測(cè)矩陣采用隨機(jī)高斯觀測(cè)矩陣,壓縮比為0.1~0.6,對(duì)比以內(nèi)積準(zhǔn)則度量原子和殘差的相關(guān)度的SWOMP算法和基于廣義Jaccard系數(shù)的SWOMP算法為重建算法,實(shí)驗(yàn)分別選取1位男生和1位女生,每人選取50句語(yǔ)音信號(hào)進(jìn)行重建,為簡(jiǎn)化表格,基于廣義Jaccard系數(shù)的SWOMP算法以J-SWOMP算法表示,重建信號(hào)的AFSNR值如表1所示,PESQ得分的平均值如表2所示。

      表1 不同語(yǔ)音重建的AFSNR值

      表2 不同語(yǔ)音重建的PESQ得分

      由表1可知,隨著壓縮比的增大,兩種算法重建語(yǔ)音信號(hào)的AFSNR值也隨之增大,在壓縮比一定時(shí),J-SWOMP算法重建信號(hào)的AFSNR值始終大于SWOMP算法。當(dāng)壓縮比為0.1~0.6時(shí),J-SWOMP算法比SWOMP算法重建男聲信號(hào)的AFSNR值平均提高了2.869 3 dB;女聲信號(hào)的AFSNR值平均提高了2.457 8 dB。

      由表2可知,在壓縮比為0.1~0.6時(shí),J-SWOMP算法與SWOMP算法相比對(duì)男聲重建信號(hào)的PESQ平均得分提高0.605 4;對(duì)女聲重建信號(hào)則提高了0.550 2。

      取上述實(shí)驗(yàn)所用的50句短語(yǔ)中,內(nèi)容為“國(guó)家改革企業(yè)”的男聲和女聲語(yǔ)音信號(hào)進(jìn)行重建,實(shí)驗(yàn)重復(fù)100次,實(shí)驗(yàn)得到的AFSNR值如表3所示,PESQ得分如表4所示。

      表3 不同算法的重建語(yǔ)音信號(hào)的AFSNR值

      表4 不同算法的重建語(yǔ)音信號(hào)的PESQ值

      由表3可知,內(nèi)容為“國(guó)家改革企業(yè)”的語(yǔ)音信號(hào)、壓縮比為0.1~0.6時(shí),J-SWOMP算法與SWOMP算法相比,男聲信號(hào)AFSNR值平均提高了2.329 7 dB;女聲信號(hào)提高了2.612 1 dB。對(duì)于內(nèi)容為“競(jìng)爭(zhēng)增加效益”的語(yǔ)音信號(hào),在壓縮比為0.1~0.6時(shí),J-SWOMP算法比SWOMP算法的男聲的AFSNR值平均提高了2.104 3 dB;女聲平均提高了2.415 2 dB。

      對(duì)內(nèi)容不同的語(yǔ)音信號(hào)進(jìn)行分析,隨著壓縮比的增大,兩種算法重建語(yǔ)音信號(hào)的PESQ得分也隨之增大,在壓縮比一定時(shí),J-SWOMP算法重建語(yǔ)音信號(hào)的PESQ得分大于SWOMP算法。由表4可知,當(dāng)壓縮比為0.1~0.6時(shí),內(nèi)容為“國(guó)家改革企業(yè)”語(yǔ)音信號(hào),J-SWOMP算法比SWOMP算法的男聲PESQ平均得分提高了0.457 2,女聲平均提高了0.625 6;內(nèi)容為“競(jìng)爭(zhēng)增加效益”語(yǔ)音信號(hào),J-SWOMP算法比SWOMP算法的男聲PESQ平均得分提高了0.412 3;女聲平均提高了0.451 3。

      4 結(jié)論

      本文利用廣義Jaccard系數(shù)匹配準(zhǔn)則替代內(nèi)積匹配準(zhǔn)則實(shí)現(xiàn)最佳匹配原子的篩選,提出了基于廣義Jaccard系數(shù)的SWOMP算法,該算法能通過挑選出和語(yǔ)音信號(hào)殘差更匹配的原子,解決了SWOMP算法中原子丟失的不足,提高了語(yǔ)音信號(hào)重建的質(zhì)量。通過仿真實(shí)驗(yàn)可知:在相同條件下,基于廣義Jaccard系數(shù)的SWOMP算法對(duì)語(yǔ)音信號(hào)重建的AFSNR值和PESQ得分要明顯高于SWOMP算法。

      猜你喜歡
      內(nèi)積廣義準(zhǔn)則
      Rn中的廣義逆Bonnesen型不等式
      具非線性中立項(xiàng)的二階延遲微分方程的Philos型準(zhǔn)則
      從廣義心腎不交論治慢性心力衰竭
      基于矩陣的內(nèi)積函數(shù)加密
      有限群的廣義交換度
      基于Canny振蕩抑制準(zhǔn)則的改進(jìn)匹配濾波器
      關(guān)于矩陣的Frobenius內(nèi)積的一個(gè)推廣
      一圖讀懂《中國(guó)共產(chǎn)黨廉潔自律準(zhǔn)則》
      關(guān)于概率內(nèi)積空間定義的平凡性
      混凝土強(qiáng)度準(zhǔn)則(破壞準(zhǔn)則)在水利工程中的應(yīng)用
      金坛市| 武鸣县| 潍坊市| 耿马| 尉犁县| 任丘市| 米脂县| 毕节市| 阿克苏市| 襄汾县| 晋中市| 宝应县| 滕州市| 泰安市| 荃湾区| 黔南| 堆龙德庆县| 万全县| 阜新| 防城港市| 栾川县| 龙江县| 平泉县| 天峨县| 凤阳县| 长阳| 邵武市| 清徐县| 三穗县| 赤水市| 安多县| 仙桃市| 乌拉特中旗| 彩票| 巴青县| 丰宁| 武冈市| 广平县| 绥宁县| 沅陵县| 沙湾县|