嚴涵婷 杜選 孫添程 孫宇平 周瑜萱 金裕筠
摘要:利用人工智能技術(shù)和深度學習算法,設(shè)計開發(fā)了基于AI+IOT的智慧家居系統(tǒng)?;诎俣忍峁┑拿赓M的語音識別云平臺,該系統(tǒng)使用ZigBee網(wǎng)絡(luò),對家居環(huán)境數(shù)據(jù)進行采集、分析,并通過物聯(lián)網(wǎng)技術(shù)和人工智能技術(shù)實現(xiàn)遠程語音控制各種家電的功能?;谏疃葘W習,系統(tǒng)通過百度語音識別技術(shù)對自然語言進行語音識別,通過搭建系統(tǒng)編譯環(huán)境成功融合了AI技術(shù)和IOT技術(shù)實現(xiàn)了具有語音控制功能的智能家居系統(tǒng),致力于為人們提供更加便捷智能的生活。
關(guān)鍵詞:語音識別;智慧家居;機器學習;人工智能;深度學習
中圖分類號: TP18? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)09-0185-03
開放科學(資源服務(wù))標識碼(OSID):
Smart Home System Based on AI and IOT
YAN Han-ting,DU Xuan,SUN Tian-cheng,SUN Yu-ping,ZHOU Yu-xuan,JIN Yu-yun
(Jiaxing University, Jiaxing 314001, China)
Abstract:Using artificial intelligence technology and deep learning algorithm, a smart home system based on AI and IOT is designed and developed.Based on the free speech recognition cloud platform provided by Baidu, the system uses ZigBee network to collect and analyze the data of home environment, and realizes the function of remote voice control of various household appliances through Internet of things technology and artificial intelligence technology. Based on deep learning, the system uses Baidu speech recognition technology to recognize natural language. By building a system compilation environment, it successfully integrates AI technology and IOT technology to realize a smart home system with voice control function, which is committed to providing more convenient and intelligent life for people.
Key words: speech recognition; smart home; machine learning; artificial intelligence;deep learning
1 概述
目前,深度學習算法在人工智能快速發(fā)展成長的社會浪潮中脫穎而出,需求的催生和硬件的更新讓它愈加完善,被廣大開發(fā)者應(yīng)用在社會中更多的領(lǐng)域[1]。深度學習算法雖然是在機器學習的基礎(chǔ)上衍生改進的一個新技術(shù),但是它不同于機器學習的手工選取特征,深度學習通過設(shè)計建立適量的神經(jīng)元計算節(jié)點和多層運算層次結(jié)構(gòu),選擇合適的輸入層和輸出層,建立起從輸入到輸出的函數(shù)關(guān)系[2]。它的出現(xiàn)讓圖靈測試不再遙不可及,它被引入機器學習使其更接近于最初人工智能的目標,即讓計算機擁有“自我”意識[3]。利用深度學習這種強大的從少數(shù)樣本集中學習數(shù)據(jù)集本質(zhì)特征的能力,語音識別技術(shù)的發(fā)展也有了跨越式的成長。為了使人們真正做到智能生活,本系統(tǒng)將人工智能和物聯(lián)網(wǎng)結(jié)合起來,采用了目前流行的AIoT模式[3],即智能物聯(lián)網(wǎng)系統(tǒng),使用無線傳感器采集數(shù)據(jù),檢測家居環(huán)境數(shù)據(jù)和異常報警,來為人們服務(wù)。系統(tǒng)的實現(xiàn)主要依靠各類傳感器感知數(shù)據(jù)的實時獲取以及百度云識別語音技術(shù)。開發(fā)基于AIoT的新型智慧家居系統(tǒng)具有廣大的市場發(fā)展前景,對人工智能結(jié)合物聯(lián)網(wǎng)的發(fā)展也具有深刻的意義,更能滿足人們的生活需求。
2需求分析
為了讓人們享受到真正智能和便利的日常生活,本文設(shè)計開發(fā)了一個結(jié)合物聯(lián)網(wǎng)和人工智能這兩大主流技術(shù)的智慧家居系統(tǒng)。系統(tǒng)的功能主要分成三類,分別是利用硬件為用戶提供可參考的室內(nèi)環(huán)境數(shù)據(jù)、提供手動、語音兩種方式開關(guān)日用電器、提供智能安保功能。系統(tǒng)的用例示意圖如圖1所示。
現(xiàn)將本文設(shè)計的智慧家居系統(tǒng)的功能總結(jié)如下:
(1) 獲取任何時刻的室內(nèi)環(huán)境數(shù)據(jù),如PM2.5數(shù)值、氧氣濃度、光強、體感溫度等,并將其顯示在終端上。
(2) 用戶可以在手機上對各類家電進行手動控制:點擊開關(guān)按鈕操控空調(diào)、燈具、窗簾等。
(3) 通過語音指令“關(guān)閉空調(diào)”“打開風扇”等控制家電的開關(guān)。
(4) 通過下達語音指令“今天天氣如何?”、“現(xiàn)在光照強度多少?”等獲取家庭環(huán)境數(shù)據(jù)。
(5) 自動檢測有害氣體和煙霧,識別外來入侵者并自動報警,確保家居生活的安全性。
經(jīng)由用戶的語音指令來操控家用電器和檢測家庭環(huán)境是否安全,可以使人們的日常生活更加便利和智能,滿足人們提高生活品質(zhì)的需求。
3總體設(shè)計
3.1系統(tǒng)總體架構(gòu)
本項目有硬件、軟件和百度語音識別云平臺三個組成部分。其中,硬件主要有三種類別的傳感器,分別是收集數(shù)據(jù)類傳感器、控制電器類傳感器和檢測氣體、人體類傳感器,如圖3所示;軟件的開發(fā)基于android studio軟件;語音識別采用百度語音識別云平臺提供的語音識別API。
(1)三大類傳感器通過Zigbee無線模塊組合在一起,數(shù)據(jù)統(tǒng)一由無線網(wǎng)絡(luò)和協(xié)調(diào)器進行相互傳遞。
(2)協(xié)調(diào)器和網(wǎng)關(guān)通過串口組合在一起,然后再由網(wǎng)關(guān)連接互聯(lián)網(wǎng),將Zigbee網(wǎng)絡(luò)中的各類硬件獲取到的數(shù)據(jù)保存在云數(shù)據(jù)服務(wù)器。
(3)用戶端通過手機向位于互聯(lián)網(wǎng)上的數(shù)據(jù)服務(wù)器發(fā)送請求獲取信息,然后將應(yīng)答請求的結(jié)果信息返回給用戶。
(4)利用百度語音識別技術(shù)實現(xiàn)系統(tǒng)的語音控制功能,由互聯(lián)網(wǎng)將用戶的語音指令傳送給網(wǎng)關(guān),網(wǎng)關(guān)再通過協(xié)調(diào)器將指令傳送給控制類傳感器來操控家電。系統(tǒng)流程圖如圖2所示。
3.2語音識別的流程
語音識別也被稱為自動語音識別ASR,它用于將人類的語音轉(zhuǎn)換為計算機可讀的輸入,例如按鍵、二進制編碼或者字符序列[6]。語音識別的目的是讓用戶使用app更加智能,不需要手動點擊。實現(xiàn)用戶語音指令的識別、系統(tǒng)通過語音反饋環(huán)境數(shù)據(jù),并且保證一定的識別準確度,可以使系統(tǒng)更加智能化。具體的語音識別過程如圖4所示。
通過以上流程圖可以知道信號處理和特征提取是音頻數(shù)據(jù)必備的預處理部分。因為原始的聲波通常會伴隨著各種各樣的噪聲或是失真,這在一定程度上會對語音信號的質(zhì)量產(chǎn)生影響,所以需要通過消除噪聲和信道增強等技術(shù),將信號從時域轉(zhuǎn)化到頻域,為后續(xù)的聲學模型得分打下基礎(chǔ)。最后,在解碼搜索階段要做的事就是結(jié)合語言模型得分和聲學模型得分,將得分最高的詞序列作為識別結(jié)果。這便是語音識別的一般原理。
4 詳細設(shè)計與實現(xiàn)
4.1硬件設(shè)計
基于AIOT的智慧家居系統(tǒng)[4,5]采用了一個電控制器件和5種傳感器,分別用于檢測可燃的危險性氣體、采集數(shù)據(jù)和產(chǎn)生報警鳴聲。在設(shè)計系統(tǒng)時,我們利用上述這些硬件設(shè)施為用戶提供了和家庭環(huán)境相關(guān)的數(shù)據(jù)作為參考,便于用戶精準地控制家電,使家居生活的舒適度最大化[8]。鑒于系統(tǒng)中各類傳感器硬件的工作原理是類似的,下文我將以檢測、獲取空氣質(zhì)量數(shù)據(jù)的傳感器為例講解一下它的實現(xiàn)原理和應(yīng)用過程。
氣體檢測類傳感器在物聯(lián)網(wǎng)中的應(yīng)用其實非常典型,它能夠精確地監(jiān)測環(huán)境中PM2.5、PM10、TVOC等數(shù)值的變化以及氧氣(O2)、二氧化碳(CO2)、一氧化碳(CO)、甲醛(CH2O)等氣體的濃度,然后實時地反饋。通過獲取空氣質(zhì)量傳感器返回的數(shù)據(jù)集,分析環(huán)境的空氣質(zhì)量,最后能夠?qū)⒔Y(jié)果推送到 Android 移動客戶端供用戶查看。
4.2 基于baidu語音云識別平臺的功能設(shè)計
在設(shè)計實現(xiàn)系統(tǒng)的語音控制功能時,我們采用了百度公司提供的免費的語音識別服務(wù)也就是百度語音識別技術(shù),它采用深度卷積神經(jīng)網(wǎng)絡(luò)+長短時記憶模型+聯(lián)結(jié)主義時間分類器(Deep CNN+ LSTM+CTC)的語音識別架構(gòu)。利用和神經(jīng)網(wǎng)絡(luò)相似的深度學習算法,該技術(shù)改進了從前停留在淺層次的機器學習技術(shù),在大幅度提高語音識別速率的同時還降低了錯誤率。系統(tǒng)在物聯(lián)網(wǎng)的基礎(chǔ)上搭建編譯環(huán)境,由傳感器提供環(huán)境數(shù)據(jù),利用百度語音識別云服務(wù)提供的HTTP接口上傳語音數(shù)據(jù)獲取識別結(jié)果。百度云語音識別的流程圖如圖5所示。
系統(tǒng)語音識別功能的實現(xiàn)原理是編寫程序POST一段語音數(shù)據(jù)上傳到百度云服務(wù)器。首先,系統(tǒng)會讀取語音內(nèi)容,獲取訪問令牌后對其進行Base64編碼并格式化為JSON數(shù)據(jù)再進行上傳。然后接收服務(wù)器返回的JSON數(shù)據(jù),解析后可以得到語音識別的結(jié)果。 語音識別的程序流程圖如圖6所示。
5結(jié)語
本文主要是講解基于AI+IoT的智慧家居系統(tǒng)的設(shè)計思路和實現(xiàn)方法,包括系統(tǒng)用到的硬件、開發(fā)所需的各種技術(shù)和算法。系統(tǒng)主要有收集并反饋家庭環(huán)境的實時數(shù)據(jù)、語音指令操控家電、自動檢測人體和有害氣體并報警這三個功能。其中,人工智能技術(shù)方面,系統(tǒng)基于深度學習算法,利用百度云平臺提供的語音識別服務(wù)實現(xiàn)了語音控制家電功能;物聯(lián)網(wǎng)技術(shù)方面,系統(tǒng)采用Zigbee網(wǎng)絡(luò)和傳感器為系統(tǒng)提供硬件基礎(chǔ)。使用該系統(tǒng)可以滿足人們智能化生活的需求,提高生活品質(zhì)。
參考文獻:
[1] 楊煥崢.基于深度學習的中文語音識別模型設(shè)計與實現(xiàn)[J].湖南郵電職業(yè)技術(shù)學院學報,2020,19(3):24-27.
[2] 邱錫鵬.神經(jīng)網(wǎng)絡(luò)與深度學習[M].北京:機械工業(yè)出版社,2020.
[3] 周志華.機器學習[M].北京:清華大學出版社,2016.
[4] 楊耀.基于物聯(lián)網(wǎng)的智能家居系統(tǒng)的設(shè)計與實現(xiàn)[D].南京:南京郵電大學,2014.
[5] 葉劍軍,葉倩,李景廣,等.室內(nèi)環(huán)境自動監(jiān)測系統(tǒng)的數(shù)據(jù)分析研究[J].綠色建筑,2010,2(2):43-47.
[6] 卜素亮.非特定人連續(xù)語音識別技術(shù)研究與應(yīng)用[D].上海:復旦大學,2011.
[7] 王一蒙.語音識別關(guān)鍵技術(shù)研究[D].成都:電子科技大學,2015.
[8] 嚴涵婷,杜選,孫添程,等.基于語音控制的智慧家居系統(tǒng)[J].電腦知識與技術(shù),2020,16(7):213-215.
【通聯(lián)編輯:唐一東】