• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    語音識(shí)別與HMM原理

    2017-05-16 00:44:13周正堅(jiān)
    成長(zhǎng)·讀寫月刊 2017年4期
    關(guān)鍵詞:馬爾可夫語音概率

    周正堅(jiān)

    【摘 要】本文利用“隱含馬爾可夫模型”(Hidden Markov Model)根據(jù)接收到的數(shù)字信號(hào)來推測(cè)說話者想表達(dá)的意思來研究語音識(shí)別問題。

    【關(guān)鍵詞】語言識(shí)別;隱含馬爾可夫模型

    一、語言的實(shí)質(zhì)

    人們平時(shí)在說話時(shí),腦子是一個(gè)信息源;人們的喉嚨(聲帶),空氣,就是如電線和光纜般的信道;聽眾耳朵的就是接收端(信宿),而聽到的聲音就是傳送過來的信號(hào);語言在這一過程中充當(dāng)信息載體的角色,即消息。這就是人類通過語言交流的實(shí)質(zhì)。

    二、語音識(shí)別

    語音識(shí)別是指從語音到文本的轉(zhuǎn)換,即讓計(jì)算機(jī)能夠把人發(fā)出的有意義的話音變成書面子語言。通俗地說就是讓機(jī)器能夠聽懂人說的話。所謂聽懂,有兩層意思,一是指把用戶所說的話逐詞逐句轉(zhuǎn)換成文本;二是指正確理解語音中所包含的要求,作出正確的應(yīng)答。

    三、HMM原理

    隱馬爾可夫模型(HMM)可以用五個(gè)元素來描述,包括2個(gè)狀態(tài)集合和3個(gè)概率矩陣:

    1.隱含狀態(tài)S

    是馬爾可夫模型中實(shí)際所隱含的狀態(tài),這些狀態(tài)之間滿足馬爾可夫性質(zhì)。這些狀態(tài)通常無法通過直接觀測(cè)而得到。

    2.可觀測(cè)狀態(tài)O

    在模型中與隱含狀態(tài)相關(guān)聯(lián),可通過直接觀測(cè)而得到,可觀測(cè)狀態(tài)的數(shù)目不一定要和隱含狀態(tài)的數(shù)目一致。

    3.初始狀態(tài)概率矩陣π

    表示隱含狀態(tài)在初始時(shí)刻t=1的概率矩陣,(例如t=1時(shí),P(S1)=p1、P(S2)=P2、P(S3)=p3,則初始狀態(tài)概率矩陣 π=[p1 p2 p3].

    4.隱含狀態(tài)轉(zhuǎn)移概率矩陣A。

    描述了HMM模型中各個(gè)狀態(tài)之間的轉(zhuǎn)移概率。其中Aij = P( Sj | Si ),1≤i,,j≤N.

    表示在 t 時(shí)刻、狀態(tài)為 Si 的條件下,在 t+1 時(shí)刻狀態(tài)是 Sj 的概率。

    5.觀測(cè)狀態(tài)轉(zhuǎn)移概率矩陣 B

    令N代表隱含狀態(tài)數(shù)目,M代表可觀測(cè)狀態(tài)數(shù)目,則:

    Bij=P(Oi | Sj), 1≤i≤M,1≤j≤N.

    表示在 t 時(shí)刻、隱含狀態(tài)是 Sj 條件下,觀察狀態(tài)為Oi的概率。

    總結(jié):一般的,可以用λ=(A,B,π)三元組來簡(jiǎn)潔的表示一個(gè)隱馬爾可夫模型。隱馬爾可夫模型實(shí)際上是標(biāo)準(zhǔn)馬爾可夫模型的擴(kuò)展,添加了可觀測(cè)狀態(tài)集合和這些狀態(tài)與隱含狀態(tài)之間的概率關(guān)系。

    當(dāng)人們觀測(cè)到語音信號(hào)o1,o2,o3時(shí),要根據(jù)這組信號(hào)推測(cè)出發(fā)送的句子s1,s2,s3。顯然,人們應(yīng)該在所有可能的句子中找最有可能性的一個(gè)。用數(shù)學(xué)語言來描述,就是在已知o1,o2,o3,...的情況下,求使得條件概率:

    P(s1,s2,s3,...|o1,o2,o3....)達(dá)到最大值的那個(gè)句子s1,s2,s3,...。例如,當(dāng)人們聽見(ni shi shui a),按經(jīng)驗(yàn)、語言環(huán)境就能判斷出對(duì)方所說的是“你是誰啊”的概率最大,而不是其他的句子。

    四、HMM基本步驟

    對(duì)HMM來說,有如下三個(gè)重要假設(shè),盡管這些假設(shè)是不現(xiàn)實(shí)的。

    假設(shè)1:馬爾可夫假設(shè)(狀態(tài)構(gòu)成一階馬爾可夫鏈)

    P(Xi | Xi-1…X1)=P(Xi | Xi-1)

    假設(shè)2:不動(dòng)性假設(shè)(狀態(tài)與具體時(shí)間無關(guān))

    P(Xi+1 | Xi)=P(Xj+1 | Xj),?坌i,j

    假設(shè)3:輸出獨(dú)立性假設(shè)(輸出僅與當(dāng)前狀態(tài)有關(guān))

    P(O1,…,OT | X1,…,XT)=?裝P(Ot | Xt)

    隱藏的狀態(tài)和可觀察到的狀態(tài)之間有一種概率上的關(guān)系,也就是說某種隱藏狀態(tài)H被認(rèn)為是某個(gè)可以觀察的狀態(tài)O1是有概率的,假設(shè)為 P(O1 | H)。如果可以觀察的狀態(tài)有3種,那么很顯然 P(O1 | H)+P(O2 | H)+ P(O3 | H)=1。

    這樣,我們也可以得到一個(gè)另一個(gè)矩陣,稱為混淆矩陣 (confusion matrix)。這個(gè)矩陣的內(nèi)容是某個(gè)隱藏的狀態(tài)被分別觀察成幾種不同的可以觀察的狀態(tài)的概率。

    下圖明確的表示出模型的演化,其中綠色的圓圈表示隱藏狀態(tài),紫色圓圈表示可觀察到狀態(tài),箭頭表示狀態(tài)之間的依存概率,一個(gè)HMM可用一個(gè)5元組{N,M,π,A,B}表示,其中N表示隱藏狀態(tài)的數(shù)量,我們要么知道確切的值,要么猜測(cè)該值,M表示可觀測(cè)狀態(tài)的數(shù)量,可以通過訓(xùn)練集獲得,π={πi}為初始狀態(tài)概率,A={aij}為隱藏狀態(tài)的轉(zhuǎn)移矩陣Pr(xt(i) | xt-1(j)),B={bik}表示某個(gè)時(shí)刻因隱藏狀態(tài)而可觀察的狀態(tài)的概率,即混淆矩陣,Pr(ot(i) | xt(j))。在狀態(tài)轉(zhuǎn)移矩陣和混淆矩陣中的每個(gè)概率都是時(shí)間無關(guān)的,即當(dāng)系統(tǒng)演化時(shí),這些矩陣并不隨時(shí)間改變。對(duì)于一個(gè)N和M固定的HMM來說,用λ={π,A,B}表示HMM參數(shù)。

    在正常的馬爾可夫模型中,狀態(tài)對(duì)于觀察者來說是直接可見的。這樣狀態(tài)的轉(zhuǎn)換概率便是全部的參數(shù)。而在隱馬爾可夫模型中,狀態(tài)并不是直接可見的,但受狀態(tài)影響的某些變量則是可見的。每一個(gè)狀態(tài)在可能輸出的符號(hào)上都有一概率分布。因此輸出符號(hào)的序列能夠透露出狀態(tài)序列的一些信息。

    五、向前向后算法

    下面介紹前向后向算法的參數(shù)學(xué)習(xí)過程,在學(xué)習(xí)的過程中,不斷更新HMM的參數(shù),從而使得P(O | λ)最大。我們假設(shè)初始的 HMM 參數(shù)為λ={π,A,B},首先計(jì)算前向變量?琢和后向變量 ?茁,再根據(jù)剛剛介紹的公式計(jì)算期望?孜和ζ,最后,根據(jù)下面的3個(gè)重估計(jì)公式更新HMM參數(shù)。

    參考文獻(xiàn):

    [1]張建華.基于深度學(xué)習(xí)的語音識(shí)別應(yīng)用研究[D].北京郵電大學(xué),2015.

    [2]周茉.基于HMM和ANN的漢語數(shù)字語音識(shí)別算法研究[D].華中師范大學(xué),2006.

    猜你喜歡
    馬爾可夫語音概率
    第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
    第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
    概率與統(tǒng)計(jì)(一)
    概率與統(tǒng)計(jì)(二)
    魔力語音
    基于MATLAB的語音信號(hào)處理
    電子制作(2019年14期)2019-08-20 05:43:38
    基于MQ3與MP3的價(jià)廉物美的酒駕語音提醒器
    電子制作(2019年9期)2019-05-30 09:42:10
    對(duì)方正在輸入……
    小說界(2018年5期)2018-11-26 12:43:42
    保費(fèi)隨機(jī)且?guī)в屑t利支付的復(fù)合馬爾可夫二項(xiàng)模型
    基于SOP的核電廠操縱員監(jiān)視過程馬爾可夫模型
    茌平县| 平谷区| 韩城市| 岫岩| 咸阳市| 河曲县| 新巴尔虎右旗| 疏勒县| 湘乡市| 博客| 义马市| 福贡县| 陇川县| 鄢陵县| 怀宁县| 昂仁县| 榆社县| 曲周县| 策勒县| 麻栗坡县| 德阳市| 新宁县| 登封市| 龙岩市| 舟山市| 柯坪县| 宁化县| 德惠市| 灵武市| 合川市| 陆丰市| 彭州市| 同德县| 社旗县| 西吉县| 宁国市| 依兰县| 修文县| 岫岩| 临漳县| 抚顺县|