• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    環(huán)境聲監(jiān)控和識(shí)別系統(tǒng)設(shè)計(jì)分析

    2014-12-25 07:52:39劉薇
    電腦知識(shí)與技術(shù) 2014年33期
    關(guān)鍵詞:識(shí)別

    劉薇

    摘要:本系統(tǒng)設(shè)計(jì)主要應(yīng)用在室內(nèi)報(bào)警聲監(jiān)控與識(shí)別系統(tǒng)中,包含室內(nèi)報(bào)警聲監(jiān)控與識(shí)別系統(tǒng)的功能需求分析、報(bào)警語音的選擇、軟硬件識(shí)別系統(tǒng)的方案設(shè)計(jì)。

    關(guān)鍵詞:報(bào)警聲監(jiān)控;識(shí)別;報(bào)警語音

    中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)33-7976-03

    Abstract: The system design is mainly used in indoor alarm monitoring and identification system, including indoor alarm monitoring and identification system functional requirements analysis, program design voice alarm selection, hardware and software recognition system.

    Key words: alarm monitoring; identification; alarm voice

    1 設(shè)計(jì)背景

    隨著現(xiàn)代科學(xué)和計(jì)算機(jī)技術(shù)的發(fā)展,人機(jī)互動(dòng)形式多種多樣,語音識(shí)別技術(shù)取代傳統(tǒng)的通過鼠標(biāo)、鍵盤實(shí)現(xiàn)人機(jī)信息交流的模式,這是目前計(jì)算機(jī)、信號(hào)處理和人工智能等領(lǐng)域的重要課題。

    自動(dòng)語音識(shí)別的任務(wù)是研究如何利用計(jì)算機(jī)模擬人類的聽覺功能,從人的語音信號(hào)中提取出有用的聲學(xué)特征和語言信息,進(jìn)而確定語音信號(hào)的語言含義,實(shí)現(xiàn)人和機(jī)器之間的自然語言通信。

    近五十年來,語音識(shí)別技術(shù)開始漸漸走出實(shí)驗(yàn)室,在國(guó)防監(jiān)聽、遠(yuǎn)程會(huì)議、音頻設(shè)備、移動(dòng)通訊、身份鑒別、智能玩具、機(jī)器人等領(lǐng)域展現(xiàn)了廣闊的應(yīng)用前景,一些應(yīng)用已非常貼近人們的生活。眾人熟知的2010上海世博會(huì)吉祥物“海寶”作為“能說會(huì)道”智能玩具就是音頻識(shí)別技術(shù)的一個(gè)成功應(yīng)用。

    然而,由于語音信號(hào)的不確定性,以及周圍環(huán)境的不可控性,目前還鮮有十分可靠的語音識(shí)別系統(tǒng)大面積商用或民用的實(shí)例。從目前的語音識(shí)別理論的發(fā)展來看,非特定人的大詞匯量和連續(xù)語音識(shí)別仍然是語音識(shí)別領(lǐng)域的技術(shù)難點(diǎn)。相對(duì)而言,非特定人中小詞匯量的孤立詞語音識(shí)別的理論和實(shí)踐發(fā)展相對(duì)較成熟和完善,完全有可能應(yīng)用于一些聲環(huán)境相對(duì)穩(wěn)定,噪聲相對(duì)較小的場(chǎng)合,如室內(nèi)的語音報(bào)警、聲控家電及智能玩具等。因此,研制出具有實(shí)用價(jià)值的有限詞匯(有限指令集)的孤立詞語音識(shí)別系統(tǒng),有助于擴(kuò)大語音識(shí)別技術(shù)的應(yīng)用范圍。

    本系統(tǒng)設(shè)計(jì)側(cè)重于對(duì)環(huán)境聲識(shí)別在監(jiān)控領(lǐng)域的應(yīng)用。該領(lǐng)域在近年來發(fā)展非常迅速,尤其是經(jīng)過2008年北京奧運(yùn)會(huì)、2010年上海世博會(huì)等大型活動(dòng)的安防建設(shè),在安防監(jiān)控方面取得了前所未有的發(fā)展,使其成為保障人民生命財(cái)產(chǎn)安全、維護(hù)社會(huì)和諧穩(wěn)定的重要行業(yè)。

    2 設(shè)計(jì)目的與意義

    這里的環(huán)境聲(Environmental Sound)是指在人居環(huán)境中所接收到的各種聲音。特別地,監(jiān)控系統(tǒng)所感興趣的多是人在緊急狀況下發(fā)出的呼叫聲,咳嗽聲,巨大的撞擊聲等能起到警告作用的異音,其識(shí)別本質(zhì)上屬于孤立詞識(shí)別的范疇。

    環(huán)境聲監(jiān)控和識(shí)別是語音識(shí)別中的分支方向,目前處于發(fā)展初期,還沒有可應(yīng)用于非特定人的監(jiān)控和識(shí)別系統(tǒng)得到實(shí)際應(yīng)用,而隨著智能樓宇、大型社交活動(dòng)場(chǎng)所的安防及重要場(chǎng)所的監(jiān)控等方面的需求與日俱增,急需發(fā)展這方面的技術(shù)。在“十二五”安防產(chǎn)業(yè)發(fā)展的大趨勢(shì)下,基于中小詞匯量孤立詞識(shí)別的報(bào)警聲監(jiān)控和識(shí)別系統(tǒng)將會(huì)在未來的幾年內(nèi)取得較快發(fā)展。

    本系統(tǒng)設(shè)計(jì)以銀行、博物館、居室、室內(nèi)停車場(chǎng)等室內(nèi)應(yīng)用場(chǎng)景的監(jiān)控為設(shè)計(jì)背景,針對(duì)室內(nèi)典型的聲音(如“著火啦”、“搶劫”及玻璃破碎聲等),利用語音信號(hào)處理和聲目標(biāo)分類識(shí)別等領(lǐng)域的研究成果(包括特征提取和分類識(shí)別等),以音頻和視頻監(jiān)控的結(jié)合為應(yīng)用目標(biāo),側(cè)重于報(bào)警詞識(shí)別系統(tǒng)的軟件設(shè)計(jì),最終將應(yīng)用于報(bào)警聲監(jiān)控和自動(dòng)識(shí)別硬件系統(tǒng),為公安、消防等相關(guān)部門的決策提供關(guān)鍵信息。

    概括而言,本系統(tǒng)設(shè)計(jì)可在以下安防相關(guān)領(lǐng)域得到直接或推廣應(yīng)用:

    1) 銀行、博物館等重要場(chǎng)所的防盜報(bào)警監(jiān)控系統(tǒng);

    2) 智能樓宇安全防衛(wèi)監(jiān)控及訪客自動(dòng)識(shí)別系統(tǒng);

    3) 醫(yī)院重癥病人監(jiān)控或遠(yuǎn)程室內(nèi)老人、兒童活動(dòng)監(jiān)護(hù);

    4) 背街小巷內(nèi)的盜搶事件監(jiān)控。

    除了安防領(lǐng)域,該文涉及的核心技術(shù)在語音識(shí)別、說話人識(shí)別、智能家電、機(jī)器人等相關(guān)領(lǐng)域也具有一定的參考價(jià)值。

    3 系統(tǒng)關(guān)鍵問題分析

    通過對(duì)特定應(yīng)用場(chǎng)景的研究,本系統(tǒng)設(shè)計(jì)旨在將環(huán)境聲識(shí)別的關(guān)鍵技術(shù)運(yùn)用到這些場(chǎng)景中聲音監(jiān)控中。實(shí)際場(chǎng)景中,干擾噪聲和混響往往是比較突出的問題,不同的場(chǎng)所這兩個(gè)因素的影響程度不一,如何才能使環(huán)境聲監(jiān)控識(shí)別適應(yīng)不同的聲環(huán)境是系統(tǒng)研究的重點(diǎn)也是難點(diǎn)。具體的關(guān)鍵問題:

    1) 干擾噪聲下,系統(tǒng)自動(dòng)檢出有效語音段的問題,即端點(diǎn)檢測(cè)問題。

    2) 提取魯棒的聲音特征的問題,要求是能夠最大程度地保留話者或者聲音內(nèi)容本身的特征而去除干擾聲和通道噪聲(如混響)帶來的影響。

    3) 環(huán)境聲的匹配識(shí)別問題,在保證正確率的前提下,提高識(shí)別的效率。

    4) 特定聲環(huán)境下(混響,多個(gè)聲源等)聲線索性能精度下降問題,如混響下雙耳定位性能下降,導(dǎo)致引導(dǎo)攝像頭監(jiān)控效率降低。

    以上這些是典型的環(huán)境聲識(shí)別與監(jiān)控所面臨的問題,每一個(gè)問題的解決都是極其復(fù)雜的,本系統(tǒng)設(shè)計(jì)只能在特定條件下做局部的改進(jìn)。

    1) 針對(duì)監(jiān)控設(shè)備(錄音設(shè)備)帶來的噪聲干擾,該文提出了一種基于臨界帶功率譜方差的端點(diǎn)檢測(cè)方法,能夠有效地在含噪語音中找到語音,用于系統(tǒng)對(duì)環(huán)境聲的識(shí)別。

    2) 提出一種智能音視頻聯(lián)合的監(jiān)控思想,對(duì)聲源先進(jìn)行定位,利用定位信息引導(dǎo)攝像,提高了視頻監(jiān)控的視域范圍,同時(shí)進(jìn)行聲音的識(shí)別。

    3) 針對(duì)混響和干擾噪聲的影響,提出一種基于分類的定位方法,用于上述系統(tǒng)中,提高了系統(tǒng)的魯棒性。

    4 環(huán)境聲監(jiān)控和識(shí)別系統(tǒng)設(shè)計(jì)

    本系統(tǒng)設(shè)計(jì)以典型環(huán)境聲為識(shí)別對(duì)象,利用當(dāng)前主要的孤立詞識(shí)別方法,并對(duì)其中的主要環(huán)節(jié)加以改進(jìn),基于Matlab平臺(tái)設(shè)計(jì)一套完整的報(bào)警詞識(shí)別軟件系統(tǒng),將其轉(zhuǎn)化為C語音,以便于未來向嵌入式系統(tǒng)移植。

    4.1 應(yīng)用場(chǎng)景設(shè)計(jì)

    目前語音識(shí)別技術(shù)的研究主要集中在語音識(shí)別的特征提取、模型建立、識(shí)別算法和語音信號(hào)處理(語音降噪、增強(qiáng)等)方面。對(duì)語音識(shí)別應(yīng)用技術(shù)的研發(fā)主要集中在通信領(lǐng)域[5],如利用語音實(shí)現(xiàn)文本輸入。在其他領(lǐng)域如樓宇智能監(jiān)控、語音報(bào)警等方面的應(yīng)用技術(shù)開發(fā)相對(duì)較少,國(guó)內(nèi)現(xiàn)在還沒有真正意義上將語音識(shí)別技術(shù)應(yīng)用于這些方面的產(chǎn)品。該文將依托視頻監(jiān)控平臺(tái),設(shè)計(jì)一套室內(nèi)報(bào)警聲監(jiān)控和識(shí)別系統(tǒng),為其實(shí)際應(yīng)用打下基礎(chǔ)。

    隨著國(guó)家經(jīng)濟(jì)發(fā)展水平的不斷提高,科技水平特別是以計(jì)算機(jī)技術(shù)為代表的高科技的迅猛發(fā)展,人們對(duì)經(jīng)濟(jì)舒適、高效安全的生活環(huán)境的期望值越來越高,安全意識(shí)也與日俱增。同時(shí)由于人們生活節(jié)奏的加快,工作壓力的增大,很多時(shí)候常常需要加班,家里的一些突發(fā)狀況而得不到有效的通報(bào),容易造成安全隱患。

    現(xiàn)實(shí)生活中,尤其是在治安較差的區(qū)域常有此類報(bào)道:不法分子入室實(shí)施盜竊、搶劫、殺人等犯罪行為,即使被害人大聲疾呼,奮力反抗,也往往難以得到及時(shí)救助;或是晚上家里突然著火,濃煙彌漫,而當(dāng)事人已經(jīng)迷失方向,無法通過電話報(bào)警;或是獨(dú)居的孤寡老人,突然身體不適,自己無力打電話求救,等到監(jiān)護(hù)人員趕到時(shí)狀況往往已經(jīng)相當(dāng)糟糕。這些不利的后果主要是因?yàn)闊o法報(bào)警或報(bào)警不及時(shí)而造成的。因此,能夠及時(shí)地發(fā)出和接收?qǐng)?bào)警信息并及時(shí)達(dá)到現(xiàn)場(chǎng),想辦法解除險(xiǎn)情,這是目前生活小區(qū)安防領(lǐng)域急需解決的一個(gè)關(guān)鍵問題。

    在其他一些重要場(chǎng)所如博物館、銀行等,如果發(fā)生緊急事件(盜竊、搶劫)而沒有及時(shí)報(bào)警,也非常可能造成重大人身或財(cái)產(chǎn)的損失。

    當(dāng)然,除了報(bào)警功能外,孤立詞語音識(shí)別的核心技術(shù)還可以應(yīng)用到其他許多領(lǐng)域。如智能家電就是一種大有前途的領(lǐng)域,一旦技術(shù)發(fā)展成熟,人們即可實(shí)現(xiàn)在黑暗中通過語音來操控電視、電燈、空調(diào)等家用電器。

    上述應(yīng)用場(chǎng)景大多屬于室內(nèi)環(huán)境,具有一些的相似特點(diǎn):

    1) 往往背景噪聲較低、平穩(wěn)或種類單一;

    2) 聲源至傳聲器(安裝于監(jiān)控設(shè)備)的距離通常較近;

    3) 可能出現(xiàn)的報(bào)警語音種類有限。

    這些共同特性為本文后面的關(guān)鍵詞選取、算法設(shè)計(jì)提供了主要依據(jù)。

    4.2 功能需求設(shè)計(jì)

    在前述室內(nèi)應(yīng)用環(huán)境中,語音識(shí)別要想發(fā)揮準(zhǔn)確及時(shí)的自動(dòng)識(shí)別和報(bào)警作用,對(duì)識(shí)別系統(tǒng)有一系列要求。

    1) 保證在實(shí)際應(yīng)用環(huán)境下具有較高的正確識(shí)別率。語音識(shí)別在噪聲環(huán)境下的識(shí)別效果的下降一直是該項(xiàng)技術(shù)不能大面積商用、民用的直接原因。現(xiàn)階段,該問題暫時(shí)還沒有較完善和統(tǒng)一的解決。但是,在室內(nèi)環(huán)境中,對(duì)于小詞匯量的孤立詞語音識(shí)別,通過算法優(yōu)選和改良,識(shí)別率完全可能達(dá)到實(shí)際應(yīng)用的要求。

    2) 室內(nèi)環(huán)境聲監(jiān)控與識(shí)別系統(tǒng)需要做到實(shí)時(shí)監(jiān)控,及時(shí)報(bào)警。滿足實(shí)時(shí)要求的最簡(jiǎn)單原則便是語音識(shí)別的時(shí)間要不大于語音本身的時(shí)長(zhǎng),而語音識(shí)別的時(shí)間長(zhǎng)短主要由端點(diǎn)檢測(cè)和模板匹配算法決定。關(guān)于端點(diǎn)檢測(cè)和匹配算法本文將在下面的章節(jié)做詳細(xì)的論述,并且提出相應(yīng)的改進(jìn)算法,以提高識(shí)別正確率和識(shí)別速度。

    3) 報(bào)警與監(jiān)控系統(tǒng)不僅要及時(shí)分析處理和報(bào)警,還有必要將采集的聲音信號(hào)存儲(chǔ)備查。這對(duì)于數(shù)據(jù)接口設(shè)計(jì)和硬件存儲(chǔ)空間選擇具有明確的要求。

    4) 報(bào)警與監(jiān)控系統(tǒng)的網(wǎng)絡(luò)化。網(wǎng)絡(luò)化是監(jiān)控系統(tǒng)的基本要求,只有網(wǎng)絡(luò)化才能使不在事發(fā)現(xiàn)場(chǎng)的監(jiān)控人員了解現(xiàn)場(chǎng)的情況。這還與報(bào)警聲識(shí)別系統(tǒng)的應(yīng)用平臺(tái)相關(guān)。

    5) 能夠方便地對(duì)語音模板庫進(jìn)行編輯和更新。如實(shí)現(xiàn)語音特征模板庫的添加和刪除,這對(duì)于系統(tǒng)的推廣應(yīng)用具有重要的價(jià)值。

    4.3 系統(tǒng)基本結(jié)構(gòu)

    基于孤立詞語音識(shí)別的報(bào)警聲監(jiān)控和識(shí)別系統(tǒng)按功能分為訓(xùn)練和識(shí)別兩大階段。訓(xùn)練包含預(yù)處理、特征提取兩個(gè)模塊;識(shí)別是在訓(xùn)練的基礎(chǔ)上加一個(gè)匹配識(shí)別模塊。對(duì)不同的語音識(shí)別任務(wù)來說,盡管設(shè)計(jì)和實(shí)現(xiàn)的細(xì)節(jié)不同,但所采用的基本技術(shù)是相似的。

    其中,訓(xùn)練語音樣本的采集過程包含了對(duì)模擬信號(hào)的采樣、濾波、量化、編碼的過程;預(yù)處理包含預(yù)加重、加窗分幀、端點(diǎn)檢測(cè)。預(yù)處理模塊的功能是通過高頻預(yù)加重來平滑信號(hào)頻譜,并利用窗函數(shù)把語音數(shù)據(jù)序列分成連續(xù)的信號(hào)幀。端點(diǎn)檢測(cè)單元主要完成確定單詞的起始幀與結(jié)束幀的檢測(cè)。特征提取單元的功能是完成基于頻譜分析的特征矢量計(jì)算。當(dāng)端點(diǎn)檢測(cè)單元檢測(cè)到當(dāng)前語音信號(hào)幀為起始幀時(shí),特征提取單元開始特征提取計(jì)算,并完成對(duì)特征矢量的存儲(chǔ)。

    一個(gè)完整的孤立詞語音識(shí)別系統(tǒng),除了包括核心的模式識(shí)別程序,還應(yīng)包括語音采集、參數(shù)分析、標(biāo)準(zhǔn)聲學(xué)模型等。根據(jù)識(shí)別結(jié)果在實(shí)際環(huán)境下實(shí)現(xiàn)一定的應(yīng)用,還必須考慮耐環(huán)境技術(shù)、用戶輸入、輸出接口技術(shù)等。因此,語音識(shí)別技術(shù)加上各種外圍技術(shù)的組合,才能構(gòu)成一個(gè)完整的可實(shí)際應(yīng)用的語音識(shí)別系統(tǒng)。

    5 結(jié)束語

    “十二五”期間,數(shù)字化、網(wǎng)絡(luò)化、集成化、智能化將成為安防監(jiān)控發(fā)展的大趨勢(shì)。這對(duì)于傳統(tǒng)的以網(wǎng)絡(luò)化視頻監(jiān)控為主的監(jiān)控系統(tǒng)提出新的要求。由于圖像采集本身的特性以及場(chǎng)景障礙物的存在,傳統(tǒng)監(jiān)控系統(tǒng)常常存在盲區(qū),而如果能將音頻識(shí)別和視頻監(jiān)控相結(jié)合,將可望建立起真正具有智能監(jiān)控功能的系統(tǒng)。

    參考文獻(xiàn):

    [1] 萬兆陽.語音識(shí)別技術(shù)在呼叫中心自動(dòng)外呼應(yīng)用的研究與實(shí)現(xiàn)[D].北京郵電大學(xué),2012.

    [2] 沈崇德,童思木.醫(yī)院智能語音客戶服務(wù)系統(tǒng)的創(chuàng)新研究與應(yīng)用示范[J].中國(guó)醫(yī)學(xué)裝備,2013(1).

    [3] 劉東輝.語音識(shí)別技術(shù)探析[J].信息與電腦(理論版),2012(6).

    [4] 楊順遼.基于說話人確認(rèn)系統(tǒng)的語音處理綜合實(shí)驗(yàn)[J].高校實(shí)驗(yàn)室工作研究,2012(3).

    [5] 劉文強(qiáng).語音識(shí)別技術(shù)在智能家居中的研究與應(yīng)用[D].大連海事大學(xué),2013.

    猜你喜歡
    識(shí)別
    科技文檔中數(shù)學(xué)表達(dá)式的結(jié)構(gòu)分析與識(shí)別
    園林樹木學(xué)教學(xué)現(xiàn)存問題的探討
    玉米常見病蟲害的識(shí)別與防治
    上市公司會(huì)計(jì)舞弊識(shí)別及防范
    微表情識(shí)破謊言的發(fā)展與應(yīng)用
    法學(xué)意義上的弱者識(shí)別問題研究
    上市公司會(huì)計(jì)舞弊的識(shí)別與治理
    商(2016年35期)2016-11-24 14:15:18
    淺談哈密瓜病蟲害的防治措施
    蘋果樹常見病蟲害防治技術(shù)
    青島市中山公園園林樹木易混淆品種識(shí)別
    始兴县| 肃南| 额尔古纳市| 汉沽区| 高邑县| 武夷山市| 临海市| 皋兰县| 怀仁县| 云南省| 金山区| 慈利县| 营口市| 洞口县| 浦城县| 金堂县| 松潘县| 平陆县| 新津县| 通州市| 湖北省| 武功县| 南部县| 高陵县| 紫云| 隆尧县| 郁南县| 元氏县| 青冈县| 耒阳市| 昭觉县| 名山县| 临澧县| 吴堡县| 奎屯市| 宽城| 四川省| 东莞市| 浑源县| 兰州市| 漳州市|