廣東省汕尾市技工學(xué)校 聶榮順
家用電器語音控制系統(tǒng)總體架構(gòu)框圖如圖1所示,它由語音采集模塊、語音前級處理模塊、語音訓(xùn)練模塊、語音識別模塊、語音提示模塊和輸出控制模塊組成。
圖1 語音控制系統(tǒng)總體設(shè)計框圖
語音采集模塊主要完成信號采集等功能,它將原始語音信號轉(zhuǎn)換成語音脈沖序列,因此該模塊主要包括聲/電轉(zhuǎn)換、采集等信號處理過程。
語音前級處理模塊的主要功能是濾除干擾信號、提取語音特征矢量,并將提取的語音特征矢量量化成標準語音特征矢量,因此該模塊主要包括語音預(yù)處理、特征提取、矢量量化等語音信號處理過程。
語音訓(xùn)練模塊的主要功能是將多次采集、提取的語音特征標準矢量進行概率統(tǒng)計,提取說話人的最佳語音特征標準矢量,防止因說話人心情、環(huán)境等因素引起提取特征參數(shù)不準確而影響語音識別效果,因此該模塊主要包括概率統(tǒng)計、參數(shù)評估等處理過程,用隱馬爾可夫模型(HMM模型)實現(xiàn)。
語音識別模塊的主要功能是將重新采集的標準語音特征矢量與語音模塊庫中的語音模型進行比較,判斷當前語音命令功能,因此該模塊主要包括矢量比較與參數(shù)評估兩個過程。
語音提示模塊的主要功能是根據(jù)語音識別的結(jié)果提示用戶進行相關(guān)操作或說明當前完成的功能,因此該模塊主要包括調(diào)用提示語音資源文件、D/A轉(zhuǎn)換、信號放大等語音處理過程。
輸出控制模塊的主要功能是根據(jù)語音識別的結(jié)果輸出相應(yīng)的控制信號,實現(xiàn)電燈、電視、風扇等家電的語音控制功能,因此該模塊主要包括信號驅(qū)動、輸出控制器和被控制對象。
語音模塊庫的主要功能是存儲訓(xùn)練后的最佳標準語音特征矢量。
本設(shè)計以家用電器為控制對象,充分利用凌陽單片機SPCE061A提供的內(nèi)/外部硬件資源、庫函數(shù)和微機提供的錄音工具,構(gòu)建了家用電器語音控制的系統(tǒng)平臺。
本設(shè)計采用的凌陽單片機內(nèi)部資源豐富,且具有體積小、性能好、可靠性高等特點,在嵌入式語音控制系統(tǒng)得到了廣泛應(yīng)用,尤其是豐富的語音功能庫函數(shù)更是開發(fā)者的首選。
家用電器語音控制系統(tǒng)硬件構(gòu)建平臺如圖2所示。
圖2 家用電器語音控制系統(tǒng)硬件構(gòu)建平臺
本設(shè)計利用凌陽IDE2.0開發(fā)環(huán)境及其提供的C語言編寫,系統(tǒng)配套的軟件構(gòu)建平臺如圖3所示。
圖3 家用電器語音控制系統(tǒng)軟件構(gòu)建平臺
家用電器語音控制系統(tǒng)硬件電路主要由CPU及外圍電路、語音采集電路、語音提示電路及輸出控制電路組成,具體如下:
1.CPU及外圍電路
CPU及外圍電路如圖4所示。圖中SPCE061A為凌陽16位單片機,完成家用電器語音控制系統(tǒng)的所有控制功能,S1、R1、R2、C3為復(fù)位電路,為單片機提供復(fù)位信號,C1、C2、Y1為單片機的外接晶振電路。
圖4 CPU及外圍電路
2.語音采集電路
語音采集電路如圖5所示。圖中MK1為話筒,完成聲/電轉(zhuǎn)換功能,SPCE061A內(nèi)部含有緩沖放大器、語音采集器等。聲音從話筒MK1輸入,經(jīng)聲/電轉(zhuǎn)換后變成模擬語音信號,再經(jīng)內(nèi)部緩沖放大與采集后變成語音脈沖序列。放大器外接增益調(diào)整電路R7、C12,調(diào)整電路R7的阻值,可以適當調(diào)整內(nèi)部放大器的增益。
圖5 語音采集電路
3.語音提示電路
語音提示電路如圖6所示。該電路的功能主要是將語音提示信號進行放大,圖中U2為放大器,LS1為揚聲器,W9為音量開關(guān)。
圖6 語音提示電路
4.輸出控制電路
輸出控制電路如圖7所示。圖中由U1A—U1C(反相放大器74LS04),K3—K5(可控硅BT169D),J5(插頭,接220V交流),J1(外接風扇電機)共同組成風扇控制電路;由U1E(反相放大器74LS04)、K1(可控硅BT169D)、DS1(電燈)、J2(插頭,接220V交流)共同組成電燈控制電路;由U1F(反相放大器74LS04)、K2(可控硅BT169D)、J4(插頭,接電視機電源開關(guān))共同組成電視機控制電路。
圖7 輸出控制電路
本系統(tǒng)主要使用到初始化存儲器函數(shù)BSR_DeleteSDGroup(0)、播放提示語音函數(shù)PlayRespond()、語音訓(xùn)練命令函數(shù)Train Word()、識別器初始化函數(shù)BSR_InitReco ngnizer(AudioSource)和獲取語音識別結(jié)果函數(shù)BSR_GetResult(void)。
輸出控制電路是本系統(tǒng)的測試關(guān)鍵電路,具體測試如下:
在相對安靜的環(huán)境(即環(huán)境噪聲30-40dB),先訓(xùn)練,然后輸入語音命令“請開燈”與“請關(guān)燈”,再用萬用表分別測量CPU的IOA1引腳,、K1的2腳,同時觀察燈的亮暗情況,測量結(jié)果如表1所示:
表1 測量結(jié)果
從表中可以看出,系統(tǒng)能完成開燈與關(guān)燈的功能。
同理,可測試風扇與電視機的語音控制功能,也能完成預(yù)定的功能。
語音識別在人機通信中有著極其重要的意義,它能夠提高我們的生活質(zhì)量和工作效率,讓我們的生活和工作更加人性化、智能化,具有廣闊的應(yīng)用前景。本文應(yīng)用單片機語音技術(shù)及相關(guān)算法,實現(xiàn)了電燈、電視、風扇等家電的語音控制。
[1]姚文冰,姚天任.穩(wěn)健語音識別技術(shù)發(fā)展現(xiàn)狀及展望[M].中山大學(xué)出版社,2011.
[2]侯媛彬.凌陽單片機原理及其開發(fā)[M].北京科學(xué)出版社,2012-01.
[3]邱紹峰.凌陽十六位單片機原理及應(yīng)用[M].西安電子科技大學(xué)出版社,2011-01.