• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種基于聲韻母分割的漢語(yǔ)語(yǔ)音識(shí)別方法

      2014-11-10 15:52:38鐘明輝
      科技創(chuàng)新導(dǎo)報(bào) 2014年18期

      鐘明輝

      摘 要:漢語(yǔ)語(yǔ)音識(shí)別研究中,識(shí)別單元的選取是很重要的。該文提出一種基于聲韻母分割的,以韻母為基本識(shí)別單元的大詞匯量孤立詞的語(yǔ)音識(shí)別方法,并與以漢語(yǔ)詞為基本識(shí)別單元的語(yǔ)音識(shí)別方法進(jìn)行比較識(shí)別實(shí)驗(yàn)。結(jié)果表明,基于韻母為基本識(shí)別單元的語(yǔ)音識(shí)別性能優(yōu)于以漢語(yǔ)詞為基本識(shí)別單元的語(yǔ)音識(shí)別方法。

      關(guān)鍵詞:識(shí)別單元 聲韻母分割 大詞匯量 漢語(yǔ)詞

      中圖分類(lèi)號(hào):TN912.34 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2014)06(c)-0249-01

      語(yǔ)音識(shí)別是近年來(lái)十分活躍的一個(gè)研究領(lǐng)域。在不遠(yuǎn)的將來(lái),語(yǔ)音識(shí)別技術(shù)有可能作為一種重要的人機(jī)交互手段,輔助甚至取代傳統(tǒng)的鍵盤(pán)、鼠標(biāo)等輸入設(shè)備,在個(gè)人計(jì)算機(jī)上進(jìn)行文字錄入和操作控制。按可識(shí)別詞匯的多少分,語(yǔ)音識(shí)別可分為小詞匯量語(yǔ)音識(shí)別和大詞匯量語(yǔ)音識(shí)別。兩種語(yǔ)音識(shí)別系統(tǒng)所采用的處理方法也不完全一樣。小詞匯量語(yǔ)音識(shí)別基本都是以漢語(yǔ)詞為基本識(shí)別單元,而大詞匯量語(yǔ)音識(shí)別則多以音素為基本識(shí)別單元。該文中,我們主要的研究對(duì)象是大詞匯量漢語(yǔ)語(yǔ)音識(shí)別問(wèn)題。所以,這里的音素是指漢語(yǔ)的音素,它與英語(yǔ)的音素有比較大的區(qū)別。因此,在漢語(yǔ)音素分割處理方面也有不同于通常對(duì)英語(yǔ)音素的處理方法。該文介紹了一種基于漢語(yǔ)聲韻母分割的,以韻母為識(shí)別單元的語(yǔ)音識(shí)別方法。

      1 漢語(yǔ)語(yǔ)音的聲韻母分割

      漢語(yǔ)普通話是以字為單位的。從聲學(xué)角度看,漢語(yǔ)中一個(gè)字就對(duì)應(yīng)一個(gè)音節(jié)。因此,音節(jié)是漢語(yǔ)語(yǔ)音識(shí)別中最自然的識(shí)別單位。目前,漢語(yǔ)語(yǔ)音識(shí)別逐漸向大詞匯量連續(xù)語(yǔ)音識(shí)別的方向發(fā)展,音節(jié)作為識(shí)別單元已經(jīng)慢慢被取代。這是因?yàn)楫?dāng)詞匯量增大時(shí),不可能要求在進(jìn)行語(yǔ)音數(shù)據(jù)訓(xùn)練中每個(gè)音節(jié)重復(fù)出現(xiàn)很多次,以得到可靠的結(jié)果,那么如何合理地選取語(yǔ)音識(shí)別單元,并建立相應(yīng)的聲學(xué)模型,是漢語(yǔ)語(yǔ)音識(shí)別的關(guān)鍵。因此,必須選取比音節(jié)更小的單元(音素)作為訓(xùn)練和識(shí)別的基本語(yǔ)音識(shí)別單元。

      1.1 漢語(yǔ)音節(jié)的結(jié)構(gòu)

      按照我國(guó)傳統(tǒng)音素分類(lèi)方法,漢語(yǔ)的一個(gè)字節(jié)可以看成是由聲母和韻母拼合而成,即聲—韻母結(jié)構(gòu)是漢語(yǔ)音節(jié)結(jié)構(gòu)的顯著特點(diǎn)。該結(jié)構(gòu)構(gòu)成使得漢語(yǔ)音節(jié)的聲學(xué)單元組合具有一定的規(guī)律性,在這種結(jié)構(gòu)中漢語(yǔ)音節(jié)的過(guò)渡音體現(xiàn)了音節(jié)的一種過(guò)渡性質(zhì)。即在過(guò)渡階段的起始段保留了較多的聲母特性而韻母特性較少;在過(guò)渡音末段則保留的聲母特性較少而包含較多的韻母特性。其中,核心目標(biāo)值是絕大多數(shù)音節(jié)的核心部分,具有典型的頻譜模式。也即本文提出的基于聲韻母分割的以韻母為識(shí)別單元的識(shí)別方法的理論依據(jù)。因此,將音節(jié)劃分成聲韻母音素作為識(shí)別單元是符合漢語(yǔ)特點(diǎn)的。

      1.2 漢語(yǔ)的波形特征

      漢語(yǔ)的每一個(gè)字都是一個(gè)單音節(jié)字。每個(gè)單音節(jié)又都是由聲母和韻母拼音而成。每個(gè)韻母又由若干個(gè)音節(jié)組成有多種聲調(diào)。因此共組成1200多個(gè)有調(diào)音節(jié)。從漢語(yǔ)的波形特征上看,聲母部分的變化很快,周期特性不明顯;到了過(guò)渡音段,逐漸呈現(xiàn)出周期性,而到了韻母部分,周期特性非常明顯,波形顯得穩(wěn)定而有規(guī)律;最后能量逐漸減少,但依然保持周期性的特征。因此,任何一個(gè)漢語(yǔ)音節(jié)(零聲母除外),其波形運(yùn)動(dòng)周期性呈現(xiàn)無(wú)序-基本有規(guī)律-有規(guī)律。所以只要檢測(cè)到語(yǔ)音信號(hào)波形的變化,才能夠很好地進(jìn)行聲韻母的分割了。

      2 實(shí)驗(yàn)

      本實(shí)驗(yàn)主要是驗(yàn)證基于聲韻母分割的,以韻母為識(shí)別單元的方法對(duì)于漢語(yǔ)語(yǔ)音識(shí)別的識(shí)別率和識(shí)別速度的有效性,作者進(jìn)行了特定人及非特定人的語(yǔ)音識(shí)別實(shí)驗(yàn),并與以漢語(yǔ)詞為基本識(shí)別單位的語(yǔ)音識(shí)別模型進(jìn)行比較識(shí)別實(shí)驗(yàn)。

      2.1 實(shí)驗(yàn)用語(yǔ)音庫(kù)

      實(shí)驗(yàn)采用了兩組數(shù)字語(yǔ)音庫(kù)。(1)特定人的漢語(yǔ)數(shù)字(0~9)語(yǔ)音識(shí)別時(shí),每個(gè)數(shù)字100次發(fā)音(共1000個(gè)樣本),其中30次發(fā)音(共300個(gè)樣本)用作訓(xùn)練集,另外70次發(fā)音(共700個(gè)樣本)用作測(cè)試集;(2)非特定人的漢語(yǔ)數(shù)字(0~9)語(yǔ)音識(shí)別時(shí),共10人,5男5女,每人每個(gè)數(shù)字10次發(fā)音(共1000個(gè)樣本),其中每人每個(gè)數(shù)字3次發(fā)音(共300個(gè)樣本)用作訓(xùn)練集,另外7次發(fā)音(共700個(gè)樣本)用作測(cè)試集。

      2.2 實(shí)驗(yàn)條件

      該實(shí)驗(yàn)在實(shí)驗(yàn)室環(huán)境下完成,采用Cool Edit軟件錄音,數(shù)據(jù)采樣率為16000 Hz,量化精度為16 bits,幀長(zhǎng)取32 ms(512點(diǎn)),幀移16 ms,本文將在此環(huán)境下得到的語(yǔ)音視為純凈語(yǔ)音。本實(shí)驗(yàn)是在基于連續(xù)HMM的孤立詞語(yǔ)音識(shí)別系統(tǒng)上完成。經(jīng)實(shí)驗(yàn)比較,確定HMM的最佳狀態(tài)數(shù)為4,最佳混合度為3(12階MFCC+12階△MFCC,△表示一階差分)訓(xùn)練模型。

      2.3 實(shí)驗(yàn)結(jié)果

      見(jiàn)表1。

      3 結(jié)語(yǔ)

      該文提出了基于聲韻母切割的漢語(yǔ)語(yǔ)音識(shí)別方法,對(duì)該識(shí)別單元在特定人和非特定人在漢語(yǔ)語(yǔ)音識(shí)別中的應(yīng)用進(jìn)行了實(shí)驗(yàn)分析,并與傳統(tǒng)的漢字詞為識(shí)別單元的語(yǔ)音識(shí)別方法進(jìn)行了比較。結(jié)果表明,本文提出的基于聲韻母切割的以韻母為識(shí)別單元的識(shí)別方法,盡管與傳統(tǒng)的基于漢字詞為識(shí)別單元的識(shí)別率差不多,但是,這種基于音素的識(shí)別方法能使識(shí)別基元大大減少,從而使運(yùn)算量和貯存量減少,而訓(xùn)練數(shù)據(jù)量卻能相對(duì)增多,使得識(shí)別速度得到了大大的提高。因此,這種方法應(yīng)用于大詞匯量的漢語(yǔ)語(yǔ)音識(shí)別時(shí),優(yōu)于以漢語(yǔ)詞為識(shí)別單元的語(yǔ)音識(shí)別方法。

      參考文獻(xiàn)

      [1] 何強(qiáng),何英.MATLAB擴(kuò)展編程[M].北京:清華大學(xué)出版社,2002.

      [2] 張靜亞.基于CHMM的高性能連續(xù)數(shù)字語(yǔ)音識(shí)別算法[J].常熟理工學(xué)院學(xué)報(bào),2005(3).

      [3] 何新,王曉蘭.漢語(yǔ)語(yǔ)音識(shí)別中的一種音節(jié)分割方法[J].火力與指揮控制,2004(12).

      [4] 王寧,萬(wàn)旺根.漢語(yǔ)語(yǔ)音音素分割的一種新方法[J].上海大學(xué)學(xué)報(bào)(自然科學(xué)版),2002(4).endprint

      西峡县| 黔西县| 玉屏| 库尔勒市| 朝阳县| 平湖市| 盱眙县| 林周县| 南投县| 营口市| 新沂市| 泾川县| 民和| 崇礼县| 崇文区| 温泉县| 略阳县| 罗江县| 沙坪坝区| 潮安县| 益阳市| 井冈山市| 如皋市| 呼和浩特市| 崇义县| 柏乡县| 凯里市| 南昌市| 鹤岗市| 彭阳县| 简阳市| 皮山县| 岳阳市| 安图县| 丁青县| 江永县| 怀来县| 华蓥市| 漠河县| 溆浦县| 夹江县|