郭川玉 吳榮茂
(1.深圳航天科創(chuàng)實業(yè)有限公司 廣東深圳 518000;2.深圳航天科創(chuàng)智能科技有限公司 廣東深圳 518000)
語音識別系統(tǒng)的設(shè)計和運行需要有較多高新技術(shù)作為支撐。神經(jīng)網(wǎng)絡(luò)的分類能力較強,能夠有效解決模式分布中復雜的分類問題,在語音識別中發(fā)揮著積極作用。神經(jīng)網(wǎng)絡(luò)語音識別活動進行中,難點在于時間規(guī)整這一方面。高度重視時間規(guī)整的內(nèi)容,能夠使神經(jīng)網(wǎng)絡(luò)語音識別設(shè)計和運行取得良好效果。
語音識別(Automatic Speech Recognition,ASR),是借助于分析和理解轉(zhuǎn)變語音信號,使其成為相應(yīng)的命令或者文本的尖端技術(shù)。語音識別技術(shù)在實際應(yīng)用過程中,本身屬于一種交叉學科,關(guān)系到概率論和信息論、人工智能、信號處理、發(fā)聲機理和聽覺機理以及模式識別等方面。在語音識別技術(shù)的支持下,有效結(jié)合語音合成技術(shù),能夠?qū)崿F(xiàn)人機語音通信。在建立語音系統(tǒng)的過程中,聽覺能力和講述能力這兩項技術(shù)是重要基礎(chǔ)。
神經(jīng)網(wǎng)絡(luò)語音識別技術(shù)的有效應(yīng)用,要具備較多應(yīng)用功能,主要是實現(xiàn)語音測聽和語音搜索兩個方面。支持語音識別活動的順利實施,主要包含以下幾個方面:
1.語音搜索。這一功能在應(yīng)用中,用戶能夠輸入多種信息,包含情緒檢測信息、關(guān)鍵詞信息以及長時靜音信息。這一功能可以快速篩選出索引文件,還能夠返回給用戶所關(guān)注到的語音,使用戶能夠反復聽這些檢索信息。語音在搜索過程中,可以搜索到任意關(guān)鍵詞,實現(xiàn)高級搜索、不同時間段搜索,并能夠測聽結(jié)果錄音流水號。
2.語音測聽。質(zhì)檢員能夠測聽語音搜索出的錄音文件。在語音測聽活動進行中,質(zhì)檢員主要使用錄音播放器,通過對話方式高亮展現(xiàn)出錄音文本內(nèi)容,使用不同顏色表示出違規(guī)類型情況。這可以支持點擊跳轉(zhuǎn)活動。
3.構(gòu)建語音語言訓練模式。神經(jīng)網(wǎng)絡(luò)語音識別系統(tǒng)進行中,涉及到多個行業(yè)的語音語言訓練模型,可以提高語音支持率。
4.數(shù)據(jù)挖掘。開展數(shù)據(jù)統(tǒng)計和分析,積極利用MapReduce并行計算框架及數(shù)據(jù)挖掘算法,全面整理和歸納好各項結(jié)果,尋找其中潛在的運行模式,給決策者提供重要的信息支持,避免決策失誤的情況發(fā)生[1]。
根據(jù)這一公式開始重復計算,從i=0開始,一直計算到i=n-N-1為止。
時間規(guī)整算法在實際應(yīng)用過程中,能夠有效避免以往算法在神經(jīng)網(wǎng)絡(luò)語音識別中出現(xiàn)的不足,可以減少語音段錯誤真正劃分的情況發(fā)生,從而有效增強后端分類器的實際識別率[3]。時間規(guī)整算法的具體應(yīng)用,具有較強的實效性。從規(guī)整次序角度出發(fā),時間規(guī)整網(wǎng)絡(luò)可以把握到語音信號的局部位置,針對各項語音信號加以合理合并,依次完成合并作業(yè)。這是針對最小幀間距離語音分析幀進行的。整個過程中,可以在各個音素段中融入語音過渡段,在這一條件下,講話人的發(fā)音特點,不會對最后識別情況產(chǎn)生不良影響,從而提升語音識別系統(tǒng)的總體應(yīng)用效果[4]。
DTW算法(Dynamic Time Warping),是針對兩個長度不同時間序列相似度的方法,能夠應(yīng)用在模板匹配之中,可以作為數(shù)據(jù)挖掘和信息檢索的重要支持。在神經(jīng)網(wǎng)絡(luò)語音識別環(huán)節(jié),DTW算法是表示數(shù)據(jù)中較為常見的形式。這是利用時間規(guī)整函數(shù)W(n),針對測試模板和參考模板的時間對應(yīng)關(guān)系加以描述,從而求解出匹配這兩個模板時最小距離所應(yīng)對的規(guī)整函數(shù),有效支持語音識別活動,保證識別率[5]。
現(xiàn)代語音識別系統(tǒng)在當前生產(chǎn)生活中占據(jù)重要地位,給人們的日常生活提供極大便利。時間規(guī)整算法在神經(jīng)網(wǎng)絡(luò)語音識別中,能夠發(fā)揮前端時間規(guī)整和動態(tài)時間規(guī)整(DTW算法)的優(yōu)勢和作用,應(yīng)用效果良好。