• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      實時語音識別系統(tǒng)在家庭監(jiān)護(hù)機器人的實現(xiàn)

      2012-07-13 03:07:56郭志強徐麗娜
      電子設(shè)計工程 2012年7期
      關(guān)鍵詞:識別率監(jiān)護(hù)語音

      郭志強,徐麗娜

      (吉林大學(xué) 珠海學(xué)院,廣東 珠海 519000)

      語音是人類最常用的交流方式,也是人類和計算機交流最渴望的方式[1]。因此用語音同計算機交流也成為了最近研究的熱點,計算機對語音的理解是計算機科學(xué)中的一個引人入勝的、富有挑戰(zhàn)性的課題[2]。

      進(jìn)入90年代,隨著多媒體時代的來臨,迫切要求語音識別系統(tǒng)從實驗室走向?qū)嵱?。許多發(fā)達(dá)國家如美國、日本、韓國以及IBM、Apple、AT&T、NTT等著名公司都為語音識別系統(tǒng)的實用化開發(fā)研究投以巨資。IBM公司于1997年開發(fā)出漢語ViaVoice語音識別系統(tǒng),次年又開發(fā)出可以識別上海話、廣東話和四川話等地方口音的語音識別系統(tǒng)ViaVoice’98。目前市場上已經(jīng)出現(xiàn)了語音識別電話、語音識別記事本等產(chǎn)品,如美國VPTC公司的Voice Organizer和法國的Parrot等[3]。

      我國語音識別研究工作開始的較晚,但近年來發(fā)展得很快,一直緊跟國際水平,國家也很重視,并把大詞匯量語音識別的研究列入“863”計劃,由中科院聲學(xué)所、自動化所、清華大學(xué)電子工程系及北京大學(xué)等單位研究開發(fā),取得了高水平的科研成果,如中科院自動化所研制的非特定人、連續(xù)語音聽寫系統(tǒng)和漢語語音人機對話系統(tǒng),其字準(zhǔn)確率或系統(tǒng)響應(yīng)率可達(dá)90%以上[4]。鑒于中國未來龐大的市場,國外也非常重視漢語語音識別的研究。美國、新加坡等地聚集了一批來自大陸、臺灣、香港等地的學(xué)者,研究成果已達(dá)到相當(dāng)高水平。

      1 系統(tǒng)設(shè)計

      文中是家庭監(jiān)護(hù)機器人項目中的語音識別系統(tǒng)設(shè)計部分,設(shè)計目的是設(shè)計出一種可以識別語音的、協(xié)助監(jiān)護(hù)家庭行動不方便人員的機器人。為實現(xiàn)該語音識別系統(tǒng),設(shè)計了語音識別系統(tǒng)總體結(jié)構(gòu)框圖,如圖1所示。

      圖1 系統(tǒng)總體結(jié)構(gòu)框圖Fig.1 Overall structure of system

      1.1 硬件設(shè)計

      文中所研究和設(shè)計的功能,都是應(yīng)用在移動機器人上的。因而系統(tǒng)的研究設(shè)計需要考慮到體積小、省電、便于移動的特性,并需具有便于家庭用戶操作的友好顯示界面。對于語音識別部分,需要用到用于語音識別算法處理的處理器、語音采集電路和語音輸出電路,如圖2所示。其中語音識別算法運算的處理器主要負(fù)責(zé)算法的運算處理,相當(dāng)于機器人的大腦;語音采集電路負(fù)責(zé)采集外部的聲音信號,相當(dāng)于機器人的耳朵;語音輸出電路負(fù)責(zé)輸出話語聲音,相當(dāng)于機器人的嘴巴。

      圖2 系統(tǒng)硬件結(jié)構(gòu)圖Fig.2 Structure diagram of the hardware system

      1)語音識別算法處理器選擇

      根據(jù)系統(tǒng)設(shè)計功能的要求,目前常用的語音識別芯片種類一般有:單片機(MCU)、DSP 和 SoC(System on Circuit)。 考慮到普通單片機(MCU)資源的緊缺及運行速度較慢的缺點,因而在本系統(tǒng)設(shè)計將不考慮使用單片機(MCU)作為語音識別的處理器。DSP包含用作數(shù)字信號處理的專用部件,運算能力強、精度高,但目前DSP的價格比較高,同時考慮到本系統(tǒng)的特性,需要選擇一種既有較強的運算能力,合適于語音識別的功能,并且能實現(xiàn)較好的用戶操作界面,并帶有文件系統(tǒng)(用于識別地圖)的功能,因而選擇DSP并不是明智之舉。目前Texas Instruments公司新推出的一款芯片OMAP3530,它具有雙內(nèi)核ARM CortexTM-A8的內(nèi)核和TMS320C64+TM DSP內(nèi)核,屬于高性能的OMAP35x架構(gòu)系列產(chǎn)品,滿足了系統(tǒng)設(shè)計的各種功能特性要求。

      2)語音編解碼芯片選擇

      機器人選擇一款合適的語音處理芯片是非常重要的。考慮到系統(tǒng)中用到了各種電源,并需要對電源進(jìn)行管理,因此選擇TI公司配套的TPS65930芯片來作為系統(tǒng)語音識別部分的音頻編解碼處理功能的硬件平臺是非常合適的。該芯片是一個集成了電源管理、ADC、嵌入式電源控制(EPC)、全功能的音頻編解碼器于一體的芯片,滿足了系統(tǒng)所有電源管理和音頻編解碼的需要,為設(shè)計的PCB板節(jié)省了空間,同時減少了多電源硬件設(shè)計的負(fù)責(zé)布線煩惱。

      3)電路設(shè)計

      本文的設(shè)計是用在移動機器人上的,因而需要語音的輸入、識別處理及語音輸出的功能。對于語音的輸入采集,本文使用聲音傳感器麥克風(fēng)及外圍電路來實現(xiàn)。對于語音輸出部分,使用功率放大器結(jié)合喇叭來使用。設(shè)計語音部分原理圖如圖3所示。

      1.2 軟件設(shè)計

      HTK (Hidden Markov Model Toolkit) 是一套專門的建立和處理隱馬可夫模型(HMMs)的實驗工具包[5],由英國劍橋大學(xué)工程系 (Cambridge University Engineering Department,CUED)開發(fā)的,主要應(yīng)用于語音識別領(lǐng)域,也可以應(yīng)用于語音合成、字符識別和DNA排序等研究領(lǐng)域。HTK經(jīng)過劍橋大學(xué)、Entropic公司及 Microsoft公司的不斷增強和改進(jìn),使其在語音識別領(lǐng)域處于世界領(lǐng)先水平。

      基于HTK的語言識別時,識別結(jié)果適用只能顯示在DOS或終端上,而且不利于將結(jié)果保存、移植或者二次開發(fā)利用[6]。在本語音識別系統(tǒng)中使用了HTK接口工具ATK(An Application Toolkit for HTK)。ATK是由英國劍橋大學(xué)開發(fā)的開源語音識別工具,是對HTK的C++多線程封裝,跟HTK一樣,它支持 Linux 和 Windows[7],它包括 HTK(HTKLib)、AHTK、AGram、ANGram、ADict、AHMMs、AResource、ARMan、ARec、ACode、ASource、ATee、AComponent、ABuffer、APacket、Asyn、FLite(SYNLib)、ALog 模塊部件。

      基于ATK的語音識別軟件應(yīng)用系統(tǒng)的由語音信號采集模塊、基于DMA的雙向高速RAM存取模塊、ATK語音識別模塊、系統(tǒng)管理模塊、語音輸出模塊等模塊組成,如圖4所示。

      圖4 系統(tǒng)軟件設(shè)計結(jié)構(gòu)圖Fig.4 Schematic diagram of the software system

      在軟件設(shè)計中,系統(tǒng)管理模塊主要負(fù)責(zé)系統(tǒng)的總體管理調(diào)度,是應(yīng)用系統(tǒng)的調(diào)度中心;語音信號采集模塊主要負(fù)責(zé)控制數(shù)據(jù)采集芯片TPS65930;基于DMA的雙向RAM存取模塊主要負(fù)責(zé)實現(xiàn)DMA驅(qū)動及雙向RAM的讀寫存取,使用了通道1來實現(xiàn)高速地把語音信號采集到的數(shù)據(jù)存儲到RAM上,并使用通道2實現(xiàn)高速地把RAM的數(shù)據(jù)取出來,用于語音的識別;語音輸出模塊主要負(fù)責(zé)把相應(yīng)的音頻數(shù)據(jù)送到TPS65930,并控制TPS65930對接收到的音頻解碼輸出到功放電路,實現(xiàn)語音輸出的功能。軟件的設(shè)計流程圖如圖5所示。

      2 語音識別系統(tǒng)實驗及結(jié)果

      圖5 軟件設(shè)計流程Fig.5 Flow chart of the software design

      文中設(shè)計的語音識別系統(tǒng)如圖6所示。在實驗中總共進(jìn)行了3輪話語測試,每輪300句話語測試,其中150句為家庭監(jiān)護(hù)機器人需要識別的話語,150句話語為機器人不予置理的無關(guān)話語。本系統(tǒng)只設(shè)置10個需要識別的話語,由15名學(xué)生分別讀音進(jìn)行測試。同時對無關(guān)話語也是由該15名學(xué)生,每人10句分別隨機讀音測試。從顯示結(jié)果可以看出,第1輪中,先測試的150句無關(guān)話語中,能正確識別出無關(guān)話語數(shù)為150句,識別出無關(guān)話語率為100%,但對需識別的話語中,正確識別出148句,2句識別出錯,識別率為98.67%;在第2輪中,同樣先測試的150句無關(guān)話語中,能正確識別出無關(guān)話語數(shù)為150句,識別出為無關(guān)話語率為100%,但對需識別的話語中,正確識別出142句,8句識別出錯,識別率為94.67%;在第3輪中,同樣先測試的150句無關(guān)話語中,能正確識別出無關(guān)話語數(shù)為150句,識別出無關(guān)話語率為100%,但對需識別的話語中,正確識別出146句,識別率為97.33%。在3輪測試中,系統(tǒng)都能實時響應(yīng)所有語句,未出現(xiàn)漏句現(xiàn)象。并且在實驗測試的過程中,系統(tǒng)的響應(yīng)速度都非常快,感觀上沒有時間延遲,與真人交流速度相當(dāng)。

      從實驗測試結(jié)果可看出,對于識別10個需要識別的話語的識別率高達(dá)94.67%以上,具有較高的識別率,因而該語音識別系統(tǒng)較好達(dá)到了家庭監(jiān)護(hù)機器人使用的要求。

      圖6 系統(tǒng)實驗界面Fig.6 Interface chart of the system

      3 結(jié) 論

      文中通過DSP、DMA和ARM Cortex-A8的并行處理,利用雙緩沖的方法,在嵌入式Linux上實現(xiàn)了基于ATK的實時語音識別系統(tǒng)。該系統(tǒng)可以實時地實現(xiàn)語音識別,具有較高識別率,較快的響應(yīng)速度。可以應(yīng)用在家庭監(jiān)護(hù)機器人及其相關(guān)領(lǐng)域中。

      [1]楊行峻,遲惠生.語音信號數(shù)字處理[M].北京:電子工業(yè)出版社,1995.

      [2]蔡蓮紅,黃德智.現(xiàn)代語音技術(shù)基礎(chǔ)與應(yīng)用[M].北京:清華大學(xué)出版社,2003.

      [3]何湘智.語音識別的研究與發(fā)展 [J].計算機與現(xiàn)代化,2002(3):3-6.

      HE Xiang-zhi.The research and development of speech recognition[J].Computer and Modernization,2002(3):3-6.

      [4]王炳錫,屈丹,彭煊,等.實用語音識別基礎(chǔ)[M].北京:國防工業(yè)出版社,2005.

      [5]Young S,Evermann G,Gales M,et al.The HTK Book (for HTK Version3.4) [EB/OL].[2009-03]http://htk.eng.cam.ac.uk/.

      [6]饒耀全,吳小培,呂釗.基于HTK的漢語語音售票系統(tǒng)的設(shè)計與實現(xiàn)[J].工業(yè)控制計算機,2010,23(10):58-61.

      RAO Yao-quan,WU Xiao-pei,LV Zhao.HTK based Chinese speech ticketing system design and implementation[J].Industrial Control Computer,2010,23(10):58-61.

      [7]ATK_Manual.pdf[EB/OL]. (2011) http://htk.eng.cam.ac.uk/develop/atk.shtml.

      猜你喜歡
      識別率監(jiān)護(hù)語音
      護(hù)娃成長盡責(zé)監(jiān)護(hù) 有法相伴安全為重
      基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測
      計算機工程(2020年3期)2020-03-19 12:24:50
      魔力語音
      基于MATLAB的語音信號處理
      電子制作(2019年14期)2019-08-20 05:43:38
      基于真耳分析的助聽器配戴者言語可懂度指數(shù)與言語識別率的關(guān)系
      我國成年監(jiān)護(hù)制度之探討與展望
      基于MQ3與MP3的價廉物美的酒駕語音提醒器
      電子制作(2019年9期)2019-05-30 09:42:10
      對方正在輸入……
      小說界(2018年5期)2018-11-26 12:43:42
      提升高速公路MTC二次抓拍車牌識別率方案研究
      高速公路機電日常維護(hù)中車牌識別率分析系統(tǒng)的應(yīng)用
      双柏县| 柳林县| 阆中市| 穆棱市| 宜兴市| 泽库县| 华宁县| 沾益县| 新建县| 札达县| 富宁县| 广东省| 克拉玛依市| 仪陇县| 肇源县| 张家界市| 温宿县| 永平县| 湖北省| 綦江县| 南投市| 祁东县| 南乐县| 洛浦县| 双桥区| 托里县| 龙口市| 襄垣县| 瑞昌市| 卓尼县| 翼城县| 凤城市| 敦化市| 临漳县| 林芝县| 安宁市| 鄯善县| 庄河市| 赤壁市| 遵化市| 永嘉县|