蘇建
摘 要:該文介紹了語音識別技術的基本原理,以現(xiàn)代智能家居為背景,將非特定語音識別技術應用于智能家居控制系統(tǒng)中。通過非特定人語音識別技術,該系統(tǒng)能夠正確地識別出人的語音控制命令,進行家電設備的智能語音控制,實現(xiàn)家電設備控制的智能化、便捷化。
關鍵詞:語音識別技術 智能家居 控制 單片機
中圖分類號:TP23 文獻標識碼:A 文章編號:1674-098X(2014)09(c)-0038-02
隨著人類社會的進步和科學技術的迅猛發(fā)展,人們逐漸開始追求智能化、便捷化的家居生活環(huán)境,因此智能家居得到迅猛崛起,并且成為一種現(xiàn)代生活消費需求,語音識別技術是智能家居控制系統(tǒng)中的一個重要應用。
當今社會,家電設備的控制主要有手動直接接觸式控制和紅外線遙控控制兩種方式,前者需要主人接觸家電設備并且人為手動直接操作,后者雖然實現(xiàn)了一定距離的紅外遙控控制,然而也離不開人為手動操作遙控器,而且紅外遙控器經常有丟失的麻煩,該文設計了一種基于非特定語音識別控制方式,能夠實現(xiàn)家電設備的非接觸式、無需手動操作的智能控制方式,從而實現(xiàn)輕松、便捷的現(xiàn)代家居生活。
1 語音識別技術概述
伴隨計算機技術發(fā)展,語音識別己成為信息產業(yè)領域的標志性技術,在人機交互應用中逐漸進入我們日常的生活,并迅速發(fā)展成為“改變未來人類生活方式的關鍵技術之一。語音識別技術以語音信號為研究對象,是語音信號處理的一個重要研究方向,其最終目標是實現(xiàn)人與機器進行自然語言通信。
1.1 語音識別系統(tǒng)分類
根據(jù)說話者與識別系統(tǒng)的相關性分:(1)特定人語音識別系統(tǒng):僅考慮對于專人的話音進行識別,與說話的語種沒有關系;(2)非特定人語音識別系統(tǒng):識別的語音與人無關,通常要用大量不同人的語音數(shù)據(jù)庫對識別系統(tǒng)進行學習,識別的語言取決于采用的訓練語音庫;(3)多人識別系統(tǒng):通常能識別一組人的語音,該系統(tǒng)通常要求對該組人的語音進行學習。
1.2 語音識別的基本方法
一般來說,語音識別的方法有三種:基于聲道模型和語音知識的方法、模板匹配的方法以及利用人工神經網(wǎng)絡的方法。由于基于神經網(wǎng)絡的訓練識別算法由于實現(xiàn)起來較復雜,目前仍只是處于實驗室研究階段。模板匹配的方法發(fā)展比較成熟,目前己達到了實用階段。
1.3 語音識別過程
語音識別過程主要包括預處理、特征提取、訓練和模式匹配四個環(huán)節(jié)。預處理部分包括語音信號的采樣、反混疊濾波、語音增強等;特征提取是從語音信號波形中提取一組或幾組能夠描述語音信號特征的參數(shù),以便訓練和識別。訓練是建立模式庫的必備過程,詞表中每個詞對應一個參考模式,它由這個詞重復發(fā)音多遍,再經特征提取和某種訓練中得到。模式匹配是整個系統(tǒng)的核心,其作用是按照一定的準則求取待測語音特征參數(shù)和語音信息與模式庫中相應模板之間的失真測度,最匹配的就是識別結果。
2 LD332X系列語音識別芯片工作原理
LD3320提供的語音識別技術,是基于“關鍵詞語列表”的識別技術:ASR(Auto Speech Recognition),該芯片基于非特定人語音識別技術,可以動態(tài)編輯識別條目列表,只需要把要識別的條目的內容,以字符串的形式傳入芯片就可以進行識別,真正實現(xiàn)了單芯片的語音識別。芯片內置固化了完整的語音識別搜索引擎和完整的語音特征庫,還集成了高精度AD和DA電路,外圍只需要用51級別的主控MCU通過并口或者SPI鏈接到LD3320的芯片PIN上,把麥克風鏈接到LD332X的AD-PIN上,就可以實現(xiàn)語音識別功能。語音識別芯片完成的工作就是:把通過MIC輸入的聲音進行頻譜分析→提取語音特征→和關鍵詞語列表中的關鍵詞語進行對比匹配→找出得分最高的關鍵詞語作為識別結果輸出。
3 語音識別智能家居控制系統(tǒng)
3.1 語音識別家居控制系統(tǒng)構成
語音識別智能家居控制系統(tǒng)由單片機作為控制中心,本系統(tǒng)由若干個子系統(tǒng)(每個房間作為一個子系統(tǒng))組成,如客廳、主臥、次臥、餐廳、廚房、衛(wèi)生間六個子系統(tǒng),每個子系統(tǒng)由若干作為被控對象的家電設備構成,如照明燈、電視機、空調等家電設備。如圖1所示為語音識別智能家居控制系統(tǒng)組成框圖,其中LD3320語音芯片作為語音控制口令信號的采樣設備,該芯片將采樣到的語音控制口令結果告訴給單片機,由單片機執(zhí)行設備控制動作。
3.2 語音控制原理與控制口令
為了提高語音識別控制口令,本系統(tǒng)將語音口令設定為三級口令格式,口令格式如下:子系統(tǒng)-控制設備-執(zhí)行動作。如需要控制餐廳電風扇打開,主人只需發(fā)出語音命令:餐廳-電風扇-打開,語音芯片采集到語音信息后與語音列表進行匹配,當匹配合格后告訴單片機執(zhí)行動作打開電風扇;如需要控制餐廳電風扇關閉,主人只需發(fā)出語音命令:餐廳-電風扇-關閉,可以執(zhí)行餐廳電風扇的關閉控制,其它設備控制方式雷同。該語音芯片基于非特定人語音識別技術,可以對家庭任何成員的語音命令執(zhí)行動作,達到家庭所有成員隨意控制的目的。
3.3 語音控制程序流程圖
該系統(tǒng)控制程序采用C語言編寫,由主程序、子程序和中斷服務程序組成。主程序負責調用子程序并協(xié)調整個系統(tǒng)的控制工作,子程序主要包括語音辨識子程序,語音播報子程序和鍵盤掃描子程序等。系統(tǒng)程序主流程及語音識別的子流程圖如圖2所示。
4 結語
本系統(tǒng)由單片機、語音識別芯片以及多路繼電開光電路等組成,通過與照明、電扇、電視機等家電設備的開關電路改造后進行實驗,系統(tǒng)能實現(xiàn)照明、電視機、電扇等家電設備的語音開啟和關閉動作,對非特定語音的識別率較高,達到了預期設計的目標,具有可靠性高、功耗低等特點。
參考文獻
[1] 羅亞非.凌陽16位單片機應用基礎[M].北京:北京航空航天大學出版社,2003.
[2] 李晶皎.嵌入式語音技術及凌陽16位單片機應用[M].北京:北京航空航天大學出版社,2003.
[3] 趙海濱,王宏,聞紹飛.嵌入式語音識別控制機械手的系統(tǒng)設計[J].儀器儀表學報,2004,25(4):621-622.endprint
摘 要:該文介紹了語音識別技術的基本原理,以現(xiàn)代智能家居為背景,將非特定語音識別技術應用于智能家居控制系統(tǒng)中。通過非特定人語音識別技術,該系統(tǒng)能夠正確地識別出人的語音控制命令,進行家電設備的智能語音控制,實現(xiàn)家電設備控制的智能化、便捷化。
關鍵詞:語音識別技術 智能家居 控制 單片機
中圖分類號:TP23 文獻標識碼:A 文章編號:1674-098X(2014)09(c)-0038-02
隨著人類社會的進步和科學技術的迅猛發(fā)展,人們逐漸開始追求智能化、便捷化的家居生活環(huán)境,因此智能家居得到迅猛崛起,并且成為一種現(xiàn)代生活消費需求,語音識別技術是智能家居控制系統(tǒng)中的一個重要應用。
當今社會,家電設備的控制主要有手動直接接觸式控制和紅外線遙控控制兩種方式,前者需要主人接觸家電設備并且人為手動直接操作,后者雖然實現(xiàn)了一定距離的紅外遙控控制,然而也離不開人為手動操作遙控器,而且紅外遙控器經常有丟失的麻煩,該文設計了一種基于非特定語音識別控制方式,能夠實現(xiàn)家電設備的非接觸式、無需手動操作的智能控制方式,從而實現(xiàn)輕松、便捷的現(xiàn)代家居生活。
1 語音識別技術概述
伴隨計算機技術發(fā)展,語音識別己成為信息產業(yè)領域的標志性技術,在人機交互應用中逐漸進入我們日常的生活,并迅速發(fā)展成為“改變未來人類生活方式的關鍵技術之一。語音識別技術以語音信號為研究對象,是語音信號處理的一個重要研究方向,其最終目標是實現(xiàn)人與機器進行自然語言通信。
1.1 語音識別系統(tǒng)分類
根據(jù)說話者與識別系統(tǒng)的相關性分:(1)特定人語音識別系統(tǒng):僅考慮對于專人的話音進行識別,與說話的語種沒有關系;(2)非特定人語音識別系統(tǒng):識別的語音與人無關,通常要用大量不同人的語音數(shù)據(jù)庫對識別系統(tǒng)進行學習,識別的語言取決于采用的訓練語音庫;(3)多人識別系統(tǒng):通常能識別一組人的語音,該系統(tǒng)通常要求對該組人的語音進行學習。
1.2 語音識別的基本方法
一般來說,語音識別的方法有三種:基于聲道模型和語音知識的方法、模板匹配的方法以及利用人工神經網(wǎng)絡的方法。由于基于神經網(wǎng)絡的訓練識別算法由于實現(xiàn)起來較復雜,目前仍只是處于實驗室研究階段。模板匹配的方法發(fā)展比較成熟,目前己達到了實用階段。
1.3 語音識別過程
語音識別過程主要包括預處理、特征提取、訓練和模式匹配四個環(huán)節(jié)。預處理部分包括語音信號的采樣、反混疊濾波、語音增強等;特征提取是從語音信號波形中提取一組或幾組能夠描述語音信號特征的參數(shù),以便訓練和識別。訓練是建立模式庫的必備過程,詞表中每個詞對應一個參考模式,它由這個詞重復發(fā)音多遍,再經特征提取和某種訓練中得到。模式匹配是整個系統(tǒng)的核心,其作用是按照一定的準則求取待測語音特征參數(shù)和語音信息與模式庫中相應模板之間的失真測度,最匹配的就是識別結果。
2 LD332X系列語音識別芯片工作原理
LD3320提供的語音識別技術,是基于“關鍵詞語列表”的識別技術:ASR(Auto Speech Recognition),該芯片基于非特定人語音識別技術,可以動態(tài)編輯識別條目列表,只需要把要識別的條目的內容,以字符串的形式傳入芯片就可以進行識別,真正實現(xiàn)了單芯片的語音識別。芯片內置固化了完整的語音識別搜索引擎和完整的語音特征庫,還集成了高精度AD和DA電路,外圍只需要用51級別的主控MCU通過并口或者SPI鏈接到LD3320的芯片PIN上,把麥克風鏈接到LD332X的AD-PIN上,就可以實現(xiàn)語音識別功能。語音識別芯片完成的工作就是:把通過MIC輸入的聲音進行頻譜分析→提取語音特征→和關鍵詞語列表中的關鍵詞語進行對比匹配→找出得分最高的關鍵詞語作為識別結果輸出。
3 語音識別智能家居控制系統(tǒng)
3.1 語音識別家居控制系統(tǒng)構成
語音識別智能家居控制系統(tǒng)由單片機作為控制中心,本系統(tǒng)由若干個子系統(tǒng)(每個房間作為一個子系統(tǒng))組成,如客廳、主臥、次臥、餐廳、廚房、衛(wèi)生間六個子系統(tǒng),每個子系統(tǒng)由若干作為被控對象的家電設備構成,如照明燈、電視機、空調等家電設備。如圖1所示為語音識別智能家居控制系統(tǒng)組成框圖,其中LD3320語音芯片作為語音控制口令信號的采樣設備,該芯片將采樣到的語音控制口令結果告訴給單片機,由單片機執(zhí)行設備控制動作。
3.2 語音控制原理與控制口令
為了提高語音識別控制口令,本系統(tǒng)將語音口令設定為三級口令格式,口令格式如下:子系統(tǒng)-控制設備-執(zhí)行動作。如需要控制餐廳電風扇打開,主人只需發(fā)出語音命令:餐廳-電風扇-打開,語音芯片采集到語音信息后與語音列表進行匹配,當匹配合格后告訴單片機執(zhí)行動作打開電風扇;如需要控制餐廳電風扇關閉,主人只需發(fā)出語音命令:餐廳-電風扇-關閉,可以執(zhí)行餐廳電風扇的關閉控制,其它設備控制方式雷同。該語音芯片基于非特定人語音識別技術,可以對家庭任何成員的語音命令執(zhí)行動作,達到家庭所有成員隨意控制的目的。
3.3 語音控制程序流程圖
該系統(tǒng)控制程序采用C語言編寫,由主程序、子程序和中斷服務程序組成。主程序負責調用子程序并協(xié)調整個系統(tǒng)的控制工作,子程序主要包括語音辨識子程序,語音播報子程序和鍵盤掃描子程序等。系統(tǒng)程序主流程及語音識別的子流程圖如圖2所示。
4 結語
本系統(tǒng)由單片機、語音識別芯片以及多路繼電開光電路等組成,通過與照明、電扇、電視機等家電設備的開關電路改造后進行實驗,系統(tǒng)能實現(xiàn)照明、電視機、電扇等家電設備的語音開啟和關閉動作,對非特定語音的識別率較高,達到了預期設計的目標,具有可靠性高、功耗低等特點。
參考文獻
[1] 羅亞非.凌陽16位單片機應用基礎[M].北京:北京航空航天大學出版社,2003.
[2] 李晶皎.嵌入式語音技術及凌陽16位單片機應用[M].北京:北京航空航天大學出版社,2003.
[3] 趙海濱,王宏,聞紹飛.嵌入式語音識別控制機械手的系統(tǒng)設計[J].儀器儀表學報,2004,25(4):621-622.endprint
摘 要:該文介紹了語音識別技術的基本原理,以現(xiàn)代智能家居為背景,將非特定語音識別技術應用于智能家居控制系統(tǒng)中。通過非特定人語音識別技術,該系統(tǒng)能夠正確地識別出人的語音控制命令,進行家電設備的智能語音控制,實現(xiàn)家電設備控制的智能化、便捷化。
關鍵詞:語音識別技術 智能家居 控制 單片機
中圖分類號:TP23 文獻標識碼:A 文章編號:1674-098X(2014)09(c)-0038-02
隨著人類社會的進步和科學技術的迅猛發(fā)展,人們逐漸開始追求智能化、便捷化的家居生活環(huán)境,因此智能家居得到迅猛崛起,并且成為一種現(xiàn)代生活消費需求,語音識別技術是智能家居控制系統(tǒng)中的一個重要應用。
當今社會,家電設備的控制主要有手動直接接觸式控制和紅外線遙控控制兩種方式,前者需要主人接觸家電設備并且人為手動直接操作,后者雖然實現(xiàn)了一定距離的紅外遙控控制,然而也離不開人為手動操作遙控器,而且紅外遙控器經常有丟失的麻煩,該文設計了一種基于非特定語音識別控制方式,能夠實現(xiàn)家電設備的非接觸式、無需手動操作的智能控制方式,從而實現(xiàn)輕松、便捷的現(xiàn)代家居生活。
1 語音識別技術概述
伴隨計算機技術發(fā)展,語音識別己成為信息產業(yè)領域的標志性技術,在人機交互應用中逐漸進入我們日常的生活,并迅速發(fā)展成為“改變未來人類生活方式的關鍵技術之一。語音識別技術以語音信號為研究對象,是語音信號處理的一個重要研究方向,其最終目標是實現(xiàn)人與機器進行自然語言通信。
1.1 語音識別系統(tǒng)分類
根據(jù)說話者與識別系統(tǒng)的相關性分:(1)特定人語音識別系統(tǒng):僅考慮對于專人的話音進行識別,與說話的語種沒有關系;(2)非特定人語音識別系統(tǒng):識別的語音與人無關,通常要用大量不同人的語音數(shù)據(jù)庫對識別系統(tǒng)進行學習,識別的語言取決于采用的訓練語音庫;(3)多人識別系統(tǒng):通常能識別一組人的語音,該系統(tǒng)通常要求對該組人的語音進行學習。
1.2 語音識別的基本方法
一般來說,語音識別的方法有三種:基于聲道模型和語音知識的方法、模板匹配的方法以及利用人工神經網(wǎng)絡的方法。由于基于神經網(wǎng)絡的訓練識別算法由于實現(xiàn)起來較復雜,目前仍只是處于實驗室研究階段。模板匹配的方法發(fā)展比較成熟,目前己達到了實用階段。
1.3 語音識別過程
語音識別過程主要包括預處理、特征提取、訓練和模式匹配四個環(huán)節(jié)。預處理部分包括語音信號的采樣、反混疊濾波、語音增強等;特征提取是從語音信號波形中提取一組或幾組能夠描述語音信號特征的參數(shù),以便訓練和識別。訓練是建立模式庫的必備過程,詞表中每個詞對應一個參考模式,它由這個詞重復發(fā)音多遍,再經特征提取和某種訓練中得到。模式匹配是整個系統(tǒng)的核心,其作用是按照一定的準則求取待測語音特征參數(shù)和語音信息與模式庫中相應模板之間的失真測度,最匹配的就是識別結果。
2 LD332X系列語音識別芯片工作原理
LD3320提供的語音識別技術,是基于“關鍵詞語列表”的識別技術:ASR(Auto Speech Recognition),該芯片基于非特定人語音識別技術,可以動態(tài)編輯識別條目列表,只需要把要識別的條目的內容,以字符串的形式傳入芯片就可以進行識別,真正實現(xiàn)了單芯片的語音識別。芯片內置固化了完整的語音識別搜索引擎和完整的語音特征庫,還集成了高精度AD和DA電路,外圍只需要用51級別的主控MCU通過并口或者SPI鏈接到LD3320的芯片PIN上,把麥克風鏈接到LD332X的AD-PIN上,就可以實現(xiàn)語音識別功能。語音識別芯片完成的工作就是:把通過MIC輸入的聲音進行頻譜分析→提取語音特征→和關鍵詞語列表中的關鍵詞語進行對比匹配→找出得分最高的關鍵詞語作為識別結果輸出。
3 語音識別智能家居控制系統(tǒng)
3.1 語音識別家居控制系統(tǒng)構成
語音識別智能家居控制系統(tǒng)由單片機作為控制中心,本系統(tǒng)由若干個子系統(tǒng)(每個房間作為一個子系統(tǒng))組成,如客廳、主臥、次臥、餐廳、廚房、衛(wèi)生間六個子系統(tǒng),每個子系統(tǒng)由若干作為被控對象的家電設備構成,如照明燈、電視機、空調等家電設備。如圖1所示為語音識別智能家居控制系統(tǒng)組成框圖,其中LD3320語音芯片作為語音控制口令信號的采樣設備,該芯片將采樣到的語音控制口令結果告訴給單片機,由單片機執(zhí)行設備控制動作。
3.2 語音控制原理與控制口令
為了提高語音識別控制口令,本系統(tǒng)將語音口令設定為三級口令格式,口令格式如下:子系統(tǒng)-控制設備-執(zhí)行動作。如需要控制餐廳電風扇打開,主人只需發(fā)出語音命令:餐廳-電風扇-打開,語音芯片采集到語音信息后與語音列表進行匹配,當匹配合格后告訴單片機執(zhí)行動作打開電風扇;如需要控制餐廳電風扇關閉,主人只需發(fā)出語音命令:餐廳-電風扇-關閉,可以執(zhí)行餐廳電風扇的關閉控制,其它設備控制方式雷同。該語音芯片基于非特定人語音識別技術,可以對家庭任何成員的語音命令執(zhí)行動作,達到家庭所有成員隨意控制的目的。
3.3 語音控制程序流程圖
該系統(tǒng)控制程序采用C語言編寫,由主程序、子程序和中斷服務程序組成。主程序負責調用子程序并協(xié)調整個系統(tǒng)的控制工作,子程序主要包括語音辨識子程序,語音播報子程序和鍵盤掃描子程序等。系統(tǒng)程序主流程及語音識別的子流程圖如圖2所示。
4 結語
本系統(tǒng)由單片機、語音識別芯片以及多路繼電開光電路等組成,通過與照明、電扇、電視機等家電設備的開關電路改造后進行實驗,系統(tǒng)能實現(xiàn)照明、電視機、電扇等家電設備的語音開啟和關閉動作,對非特定語音的識別率較高,達到了預期設計的目標,具有可靠性高、功耗低等特點。
參考文獻
[1] 羅亞非.凌陽16位單片機應用基礎[M].北京:北京航空航天大學出版社,2003.
[2] 李晶皎.嵌入式語音技術及凌陽16位單片機應用[M].北京:北京航空航天大學出版社,2003.
[3] 趙海濱,王宏,聞紹飛.嵌入式語音識別控制機械手的系統(tǒng)設計[J].儀器儀表學報,2004,25(4):621-622.endprint