• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種利用人工神經(jīng)網(wǎng)絡(luò)優(yōu)化語(yǔ)音識(shí)別的方法

    2017-12-21 14:15:19魏爽
    關(guān)鍵詞:語(yǔ)音識(shí)別數(shù)據(jù)挖掘神經(jīng)網(wǎng)絡(luò)

    魏爽

    摘要:語(yǔ)音識(shí)別就是利用機(jī)器通過(guò)識(shí)別和理解,將語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)槲谋荆呀?jīng)在很多行業(yè)得到了應(yīng)用。由于每個(gè)人說(shuō)話的方式都不同,其說(shuō)話的特征都不一樣。說(shuō)話人識(shí)別就是通過(guò)一段語(yǔ)音識(shí)別出說(shuō)話人的技術(shù)。結(jié)合人工神經(jīng)網(wǎng)絡(luò)對(duì)語(yǔ)音識(shí)別進(jìn)行優(yōu)化,平均準(zhǔn)確率達(dá)到了94.5%。

    關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò);人工智能;語(yǔ)音識(shí)別;數(shù)據(jù)挖掘;反向傳播

    中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2017)10-0228-02

    1 引言

    受生物神經(jīng)網(wǎng)絡(luò)啟發(fā),1943年心理學(xué)家McCulloch和數(shù)學(xué)家Pitts合作提出了形式神經(jīng)元的數(shù)學(xué)模型。人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)由大量高度互聯(lián)的信息處理單元組成,這些信息處理單元共同合作完成信息處理工作。這使得ANN特別適合于處理直覺和形象思維信息。經(jīng)過(guò)了半個(gè)世紀(jì)的發(fā)展,ANN已經(jīng)在圖像處理、語(yǔ)音處理、以及人工智能的其他領(lǐng)域得到了廣泛的應(yīng)用。語(yǔ)音識(shí)別就是利用機(jī)器通過(guò)識(shí)別和理解,將語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)槲谋?。?0年,語(yǔ)音識(shí)別領(lǐng)域得到了快速發(fā)展。市場(chǎng)上在家電、通信、消費(fèi)電子產(chǎn)品等領(lǐng)域已經(jīng)有一批語(yǔ)音識(shí)別的應(yīng)用。本文通過(guò)將ANN和數(shù)據(jù)挖掘技術(shù)應(yīng)用到語(yǔ)音識(shí)別上,優(yōu)化語(yǔ)音識(shí)別性能,平均識(shí)別準(zhǔn)確率達(dá)到了94.5%。

    2 基本概念

    2.1 人工神經(jīng)網(wǎng)絡(luò)

    ANN是一種非線性的預(yù)測(cè)模型。它模仿生物神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),經(jīng)過(guò)訓(xùn)練學(xué)習(xí),可以通過(guò)相對(duì)簡(jiǎn)單的函數(shù)組成的網(wǎng)絡(luò),以任意的精度近似任何非線性函數(shù)。經(jīng)過(guò)多年的發(fā)展,現(xiàn)在的神經(jīng)網(wǎng)絡(luò)模型有很多種,如自適應(yīng)諧振理論、反向傳播(Back-Propagation,BP)網(wǎng)絡(luò)以及Hopfield網(wǎng)等,其中BP網(wǎng)絡(luò)應(yīng)用的最為廣泛[1-3]。人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)基本上可以分為遞歸(反饋)網(wǎng)絡(luò)和前饋網(wǎng)絡(luò)兩類。

    神經(jīng)網(wǎng)絡(luò)由單個(gè)的神經(jīng)元組成。每個(gè)神經(jīng)元由多個(gè)輸入xi, i=1,2, …,n和一個(gè)輸出y組成,中間狀態(tài)e由輸入信號(hào)的權(quán)和表示如公式(1),θ為閾值。輸出y一般采用二值函數(shù)或者S形的函數(shù),如(2)、(3)所示,(3)為常用的Sigmoid函數(shù)。

    e=x1*w1+x2*w2-θ (1)

    f(x)= (2)

    f(x)= (3)

    構(gòu)造好了神經(jīng)網(wǎng)絡(luò)后,需要訓(xùn)練樣本集對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練學(xué)習(xí)。一般來(lái)講,訓(xùn)練樣本集包含了輸入信號(hào)(X1、x2)和輸出值的希望值z(mì)。神經(jīng)網(wǎng)絡(luò)的訓(xùn)練是一個(gè)迭代的過(guò)程。每一次的迭代都根據(jù)訓(xùn)練樣本集中的數(shù)據(jù)對(duì)權(quán)值進(jìn)行修正。

    2.2 數(shù)據(jù)挖掘

    數(shù)據(jù)挖掘就是從大量的數(shù)據(jù)中發(fā)現(xiàn)隱藏在數(shù)據(jù)里面的信息。使用數(shù)據(jù)挖掘,可以讓擁有大量數(shù)據(jù)的機(jī)構(gòu)將其關(guān)注的重點(diǎn)放在最重要的信息上。

    2.3 語(yǔ)音識(shí)別

    語(yǔ)音識(shí)別即是從聽到的語(yǔ)音或者音頻文件中識(shí)別出其中特定語(yǔ)言的語(yǔ)句,輸出對(duì)應(yīng)的文本。說(shuō)話人的場(chǎng)景、語(yǔ)氣以及說(shuō)話發(fā)音習(xí)慣等都會(huì)對(duì)語(yǔ)音識(shí)別的精度有較大影響。此外,從某種程度上來(lái)講,詞匯量是無(wú)限的,語(yǔ)音識(shí)別系統(tǒng)應(yīng)該具備智能識(shí)別未知詞的能力[4-6]。

    3 實(shí)驗(yàn)方法

    特征提取就是通過(guò)對(duì)原始數(shù)據(jù)進(jìn)行變換得到最能反應(yīng)分類本質(zhì)的特征。線性預(yù)測(cè)系數(shù)就是一種能夠有效表示語(yǔ)音信號(hào)的特征:通過(guò)對(duì)若干過(guò)去的語(yǔ)音采樣進(jìn)行線性組合來(lái)逼近當(dāng)前的語(yǔ)音信號(hào),可以得到一組唯一的預(yù)測(cè)系數(shù),即線性預(yù)測(cè)系數(shù)。其優(yōu)勢(shì)在于可以用極少的參數(shù)來(lái)正確地表示語(yǔ)音信號(hào)的時(shí)域和頻域特性[7,8]。

    在本文中,每一個(gè)語(yǔ)音信號(hào)樣本都用p個(gè)之前采集的語(yǔ)音樣本的權(quán)和加上一個(gè)激勵(lì)表示,如公式(4)。s[n]表示表示語(yǔ)音信號(hào)樣本,a[k]表示預(yù)測(cè)系數(shù)。在保證最小預(yù)測(cè)誤差的情況下,獲取線性預(yù)測(cè)系數(shù)。

    s[n]≈a[k]s[n-k] (4)

    總的平方預(yù)測(cè)誤差為:

    e=(∑n[s]-a[k]s[n-k] )2 (5)

    線性預(yù)測(cè)分析就是要確定a[k]的值,使得(5)的值最小??梢酝ㄟ^(guò)使(5)a[k]對(duì)應(yīng)的偏導(dǎo)數(shù)為0,獲取最終的a[k]。

    具體的實(shí)驗(yàn)步驟為:首先,從包含有預(yù)先定義好的輸入和目標(biāo)向量集的數(shù)據(jù)文件中加載數(shù)據(jù),通過(guò)數(shù)據(jù)挖掘提取特征信息并優(yōu)化,創(chuàng)建神經(jīng)網(wǎng)絡(luò),再用加載的數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,直至找到輸入和目標(biāo)之間的關(guān)系。

    4 實(shí)驗(yàn)結(jié)果

    二層前饋網(wǎng)絡(luò)是最常見的采用反向傳播算法的神經(jīng)網(wǎng)絡(luò)。反向傳播算法的主要思想是通過(guò)輸入信息經(jīng)輸入層和隱層逐層計(jì)算出各單元的輸出值,然后將輸出誤差逐層向前計(jì)算出各單元的誤差并利用此誤差修正前層的權(quán)值。文中實(shí)驗(yàn)采用的就是這種二層前饋網(wǎng)絡(luò),在其隱層使用了20個(gè)神經(jīng)元,輸出層的神經(jīng)元為1個(gè)。

    實(shí)驗(yàn)先對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。然后,采用了25個(gè)人的100組語(yǔ)音數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果如表1所示。此模型總的準(zhǔn)確率為94.5%。

    5 結(jié)語(yǔ)

    通過(guò)實(shí)驗(yàn)可以看出,采用反向傳播算法的神經(jīng)網(wǎng)絡(luò)模型適合于語(yǔ)音識(shí)別。下一步,通過(guò)優(yōu)化數(shù)據(jù)挖掘算法,進(jìn)而語(yǔ)音特征進(jìn)行進(jìn)一步的優(yōu)化,進(jìn)一步提高模型的性能。

    參考文獻(xiàn)

    [1]毛健,趙紅東,姚婧婧.人工神經(jīng)網(wǎng)絡(luò)的發(fā)展及應(yīng)用[J].電子設(shè)計(jì)工程,2011,19(24):62-65.

    [2]湯素麗,羅宇鋒.人工神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展與應(yīng)用[J].電腦開發(fā)與應(yīng)用,2009,22(10):59-61.

    [3]于俊婷,劉伍穎,易綿竹,李雪,李娜.國(guó)內(nèi)語(yǔ)音識(shí)別研究綜述[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2014,17(10):76-78.

    [4]禹琳琳.語(yǔ)音識(shí)別技術(shù)及應(yīng)用綜述[J].現(xiàn)代電子技術(shù),2013,36(13):43-45.

    [5]詹新明,黃南山,楊燦.語(yǔ)音識(shí)別技術(shù)研究進(jìn)展[J].現(xiàn)代計(jì)算機(jī)(專業(yè)版),2008,(09):43-45+50.

    [6]紀(jì)友芳,劉桂斌.一種改進(jìn)的線性預(yù)測(cè)語(yǔ)音編碼技術(shù)及實(shí)現(xiàn)[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(15):163-165.

    [7]孔俊寶.語(yǔ)音信號(hào)的線性預(yù)測(cè)編碼技術(shù)[J].電訊技術(shù),1987,(05):31-40.

    [8]王山海,景新幸,楊海燕.基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的孤立詞語(yǔ)音識(shí)別的研究[J/OL].計(jì)算機(jī)應(yīng)用研究,2015,32(08):2289-2291+2298.

    猜你喜歡
    語(yǔ)音識(shí)別數(shù)據(jù)挖掘神經(jīng)網(wǎng)絡(luò)
    探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
    神經(jīng)網(wǎng)絡(luò)抑制無(wú)線通信干擾探究
    電子制作(2019年19期)2019-11-23 08:42:00
    基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
    電力與能源(2017年6期)2017-05-14 06:19:37
    通話中的語(yǔ)音識(shí)別技術(shù)
    面向移動(dòng)終端的語(yǔ)音簽到系統(tǒng)
    基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
    一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
    復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
    農(nóng)業(yè)物聯(lián)網(wǎng)平臺(tái)手機(jī)秘書功能分析與實(shí)現(xiàn)
    基于Android手機(jī)語(yǔ)音和Arduino控制板的機(jī)器人控制系統(tǒng)
    新津县| 瑞金市| 龙南县| 郴州市| 日喀则市| 台北县| 普格县| 翼城县| 壶关县| 达拉特旗| 陈巴尔虎旗| 济宁市| 工布江达县| 井陉县| 邢台市| 体育| 临洮县| 扶风县| 镇原县| 崇左市| 出国| 遵义县| 雷州市| 靖西县| 炉霍县| 百色市| 织金县| 潢川县| 涟源市| 汉川市| 莱芜市| 内江市| 双城市| 大荔县| 石景山区| 双桥区| 延寿县| 含山县| 凤翔县| 永仁县| 晋州市|