趙人熳,崔 巍,王奕璇
(1.延安大學(xué) 物理與電子信息學(xué)院;2.延安大學(xué) 化學(xué)與化工學(xué)院,陜西 延安 716000)
公共事務(wù)辦公室的工作人員任務(wù)繁雜,必要的外出又造成了來訪辦事人員的等待,所以,常用的語音門鈴已經(jīng)不能滿足辦公場(chǎng)所的需求。因此,針對(duì)業(yè)務(wù)繁忙的個(gè)人辦公室設(shè)計(jì)一種智能化電子門貼秘書是實(shí)際應(yīng)用的需要。本設(shè)計(jì)不僅能夠以語音控制指令設(shè)置模式以告知客人:主人的去向以及聯(lián)系方式,而且可以在有急事的情況下給主人留言,主人回來后根據(jù)LED錄音指示燈狀態(tài)來判斷是否有客人留言,如有留言則LED錄音指示燈處于點(diǎn)亮狀態(tài),利用語音控制指令來聽取留言。本裝置可裝貼在室門上以改變普遍門鈴的單一提醒功能,為辦公場(chǎng)所來訪人員減少等待時(shí)間、提高工作和辦事效率提供便利條件。
本設(shè)計(jì)可由主人外出前通過語音控制設(shè)置模式,即人在(門鈴)模式、暫時(shí)離開(提請(qǐng)等待)模式、短時(shí)離開(急事留言)模式、長(zhǎng)時(shí)外出(聯(lián)系方式告知)模式。通過這四種模式設(shè)置方便了客人與主人的對(duì)接與聯(lián)系,使該裝置起到辦公秘書的簡(jiǎn)單作用,其有益效果是,可以在主人不在的情況下第一時(shí)間以語音和LCD文字顯示的方式告訴客人:主人的去向或聯(lián)系方式,避免了客人不必要的耗時(shí)等待,提高了辦事效率。
本設(shè)計(jì)解決其技術(shù)問題所采用的技術(shù)方案是:以低功耗單片機(jī)MSP430F6638為控制芯片,結(jié)合LD3320語音控制芯片以及ISD1760語音存儲(chǔ)芯片,以模塊化原則設(shè)計(jì)一種語音門鈴系統(tǒng)。為了解決錄音和放音相互沖突的情況,使用兩塊ISD1760語音芯片,一塊負(fù)責(zé)存儲(chǔ)提示語音信息,另一塊負(fù)責(zé)存儲(chǔ)客人錄音語音信息。系統(tǒng)主要構(gòu)成有:?jiǎn)纹瑱C(jī)控制電路、語音控制電路、語音存儲(chǔ)電路以及按鍵和一些外圍電路組成的門貼式智能化電子秘書[1]。系統(tǒng)總體框圖如下圖1所示。
圖1 系統(tǒng)總體框圖
系統(tǒng)使用MSP430F6638單片機(jī)來作為核心控制器,連接兩塊ISD1760語音存儲(chǔ)芯片和LCD液晶顯示器。第1塊ISD1760通過FT直通操作模式使用上位機(jī)串口通信方式為ISD1760錄制語音信息,然后利用ISD1760的SPI模式接口和F6638單片機(jī)的同步串行端口連接通信,實(shí)現(xiàn)語音芯片按照主控芯片發(fā)送的指令,讓語音芯片有一定的邏輯播放語音提示信息。第2塊ISD1760主要負(fù)責(zé)留言錄音,同樣使用SPI模式接口與F6638相連,可以錄音60秒。經(jīng)實(shí)驗(yàn)測(cè)試,如使用一塊芯片,即存儲(chǔ)提示音信息又存儲(chǔ)客人留言信息,經(jīng)客人錄音次數(shù)、主人擦除次數(shù)過多以后,會(huì)導(dǎo)致芯片內(nèi)部存儲(chǔ)的全部語音信息地址混亂,系統(tǒng)將無法工作。
由ICRoute公司生產(chǎn)的非特定人語音識(shí)別芯片LD3320提供單芯片語音識(shí)別技術(shù)方案,是基于“關(guān)鍵詞語列表”的識(shí)別技術(shù):ASR(Auto speech recognition)技術(shù),芯片內(nèi)部包含16-bitAD以及DA、麥克風(fēng)(MIC)接口以及支持SPI通信模式[2]。本設(shè)計(jì)采用主人使用語音控制方式來設(shè)定門鈴工作在哪一種模式并語音控制聽取及擦除留言,通過單片機(jī)F6638設(shè)置“關(guān)鍵詞語列表”,按照本設(shè)計(jì)要求,設(shè)置關(guān)鍵詞語六個(gè)即可:“人在”、“暫時(shí)離開”、“短時(shí)離開”、“長(zhǎng)時(shí)外出”、“聽取留言”、“擦除留言”。為了使系統(tǒng)待機(jī)時(shí)處于低功耗狀態(tài),防止意外語音信息誤被LD3320所識(shí)別,特設(shè)置一個(gè)語音指令按鍵,當(dāng)主人需設(shè)置門鈴工作模式及聽取擦除留言的時(shí)候按下按鍵,LD3320才開始工作,原理圖如圖2所示。
圖2 語音識(shí)別原理圖
語音識(shí)別芯片完成的工作就是:主人通過MIC輸入的聲音進(jìn)行頻譜分析,提取語音特征并和關(guān)鍵詞語列表中的關(guān)鍵詞語進(jìn)行對(duì)比匹配,進(jìn)一步找出得分最高的關(guān)鍵詞語作為識(shí)別結(jié)果輸出[3]。通過外部MIC送入語音數(shù)據(jù)流,LD3320芯片內(nèi)部的語音識(shí)別芯片通過端點(diǎn)檢測(cè)VAD(voice activity detection)檢測(cè)出用戶停止說話,把用戶開始說話到停止說話之間的語音數(shù)據(jù)進(jìn)行運(yùn)算分析后,給出識(shí)別結(jié)果[4]。將結(jié)果通過SPI傳遞給控制芯片單片機(jī)F6638,從而設(shè)定系統(tǒng)工作于哪一種模式。系統(tǒng)總體電路圖如下圖3所示。
圖3 系統(tǒng)總體電路圖
通過PC機(jī)錄音軟件ISD1700Ver2.02.exe對(duì)第一塊ISD1760(U1)進(jìn)行錄制語音提示信息,除了加入單片機(jī)與PC機(jī)串口通信的程序外,還加入ISD1760中的一些基本操作指令函數(shù),來實(shí)現(xiàn)放音、錄音、擦除、讀取語音地址等功能,最終獲取所得各段語音信息的起始地址(表1)。
表1 語音提示音地址表
使用B-LD3320開發(fā)板以及ICR_DT1.exe軟件進(jìn)行關(guān)鍵詞語列表寫入到LD3320芯片內(nèi)。在如圖4所示拼音文字框中敲入正確的拼音,LD3320芯片對(duì)于每條命令的拼音字符串的長(zhǎng)度限制為79字節(jié),但是由于ICR_DT1.exe軟件限制最多可以輸入50組[5]。根據(jù)本設(shè)計(jì)需要,特輸入六組即可:“ren zai”、“zan shi li kai”、“duan shi li kai”、“chang shi wai chu”、“ting qu liu yan”、“ca chu liu yan”,然后點(diǎn)擊“生成數(shù)據(jù)并下載”,下載完畢后,點(diǎn)擊“讀出比較”,這個(gè)功能可以對(duì)芯片內(nèi)已寫入的關(guān)鍵詞語列表進(jìn)行核對(duì)。
圖4 關(guān)鍵詞語列表
經(jīng)過以上兩步程序設(shè)計(jì),可以得到一塊存儲(chǔ)語音提示音的ISD1760(U1),以及LD3320內(nèi)部帶有關(guān)鍵詞列表的語音控制芯片,將為本系統(tǒng)的搭建做出鋪墊。
系統(tǒng)默認(rèn)處于“人在”模式,單片機(jī)F6638循環(huán)檢測(cè)“門鈴按鍵”及“語音指令按鍵”。
當(dāng)主人按下語音指令按鍵以啟動(dòng)LD3320來識(shí)別語音信息,LD3320識(shí)別語音指令以后,將結(jié)果反饋給單片機(jī)F6638執(zhí)行相應(yīng)控制命令[6]。當(dāng)客人按下“門鈴按鍵”后,單片機(jī)F6638可以向語音芯片ISD1760(U1)發(fā)送7字節(jié)帶有地址的指令,就可以實(shí)現(xiàn)提示音的播放。如:spi_set_opt(0x90,0x0010,0x0035),它會(huì)播放第一段語音信息即“您好,請(qǐng)開門”。當(dāng)主人設(shè)置系統(tǒng)工作模式為“短時(shí)離開”時(shí),客人如需留言,則客人需長(zhǎng)按錄音按鍵,F(xiàn)6638檢測(cè)按鍵按下以后啟動(dòng)ISD1760(U2)進(jìn)行錄音。主人回來后,系統(tǒng)如有錄音則指示燈常亮,主人按下語音指令按鍵后,啟動(dòng)LD3320開始輸入語音指令,通過語音識(shí)別來控制ISD1760(U2)播放及擦除留言[7]。系統(tǒng)軟件流程圖如圖5所示。
圖5 系統(tǒng)軟件流程圖
本設(shè)計(jì)采用了MSP430F6638作為核心控制器,通過I/O口與語音控制芯片LD3320以及兩塊語音儲(chǔ)存芯片ISD1760使用SPI通信模式進(jìn)行控制連接。實(shí)現(xiàn)了通過語音控制靈活設(shè)置外出模式,從而根據(jù)設(shè)置的模式為客人提供最實(shí)用的處理辦法,極大地方便了辦公,提高了辦事效率。實(shí)驗(yàn)樣機(jī)測(cè)試結(jié)果表明,系統(tǒng)的性能與功能性相對(duì)穩(wěn)定,但在嘈雜環(huán)境中使用,語音識(shí)別會(huì)出現(xiàn)無法識(shí)別的現(xiàn)象,在后續(xù)的工作中,需優(yōu)化語音識(shí)別算法以及硬件電路中加入語音信號(hào)去噪等措施。