詹宇嫻 陳耿 凌活龍 劉常燁 許樹(shù)杰 丁凡 陳景華
摘要:該文闡述了以樹(shù)莓派作為主機(jī),以室內(nèi)遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別和室內(nèi)自主定位導(dǎo)航為技術(shù)核心,針對(duì)需陪護(hù)的居家人士的智能居家機(jī)器人設(shè)計(jì)方案。通過(guò)物聯(lián)網(wǎng)、OpenCV機(jī)器視覺(jué)、機(jī)器學(xué)習(xí)等技術(shù),拓展家電控制、健康檢測(cè)、家人通信等陪護(hù)功能。
關(guān)鍵詞:智能陪護(hù);語(yǔ)音增強(qiáng);激光雷達(dá);自主定位導(dǎo)航;樹(shù)莓派
中圖分類號(hào):TP18 ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)24-0193-02
1 引言
近年來(lái)愈來(lái)愈多智能家電產(chǎn)品涌進(jìn)了千萬(wàn)家庭,從智能電視、智能冰箱、智能空調(diào)、智能燈控系統(tǒng),到智能插座、智能門窗,再到掃地機(jī)器人、智能音箱等等,在帶來(lái)便利的同時(shí),也為老人、病人等弱勢(shì)群體增加了知識(shí)負(fù)擔(dān)。為了讓智能產(chǎn)品更好地服務(wù)于老人、病人等居家群體,同時(shí)讓老人、病人更便捷地融入這個(gè)互聯(lián)網(wǎng)的信息時(shí)代,本文設(shè)計(jì)了一個(gè)以簡(jiǎn)單語(yǔ)音交互為操作方式的智能機(jī)器人系統(tǒng),以機(jī)器人作為家庭智能中樞控制眾多家電,同時(shí)集成視頻通訊、健康檢測(cè)、備忘提醒等多種功能。
2 機(jī)器人系統(tǒng)結(jié)構(gòu)設(shè)計(jì)
機(jī)器人系統(tǒng)以樹(shù)莓派作為主機(jī),用STM32芯片拓展串口連接各個(gè)模塊,主要的模組由專門的處理核心完成數(shù)據(jù)處理并與樹(shù)莓派交互。由語(yǔ)音增強(qiáng)芯片配合麥克風(fēng)陣列板完成語(yǔ)音識(shí)別的前端處理,僅將編碼過(guò)后的音頻信息交予樹(shù)莓派處理,樹(shù)莓派通過(guò)連接云端服務(wù)完成語(yǔ)音識(shí)別的后端處理。自主定位導(dǎo)航模組由激光雷達(dá)、超聲波模塊、直流減速電機(jī)組和SLAMWARE核心板組成,由SLAMWARE核心完成機(jī)器人的定位、建圖、路徑規(guī)劃、運(yùn)動(dòng)控制等功能。此外,再拓展攝像頭模塊、遙控模塊、心率檢測(cè)模塊等完成更多的功能。
2 系統(tǒng)軟件設(shè)計(jì)
機(jī)器人軟件系統(tǒng)的運(yùn)行載體包括樹(shù)莓派、語(yǔ)音增強(qiáng)核心、自主定位導(dǎo)航核心、云端服務(wù)器、手機(jī)客戶端五大板塊。主要涉及語(yǔ)音交互和基于SLAM框架的自主定位導(dǎo)航兩個(gè)核心的程序設(shè)計(jì),并拓展其他人性化的功能,如:顯示屏交互設(shè)計(jì),家電控制,健康檢測(cè)與統(tǒng)計(jì)報(bào)告,自適應(yīng)任務(wù)、老人社交平臺(tái)建立等。
2.1 語(yǔ)音交互
語(yǔ)音交互的流程包括語(yǔ)音識(shí)別ASR、自然語(yǔ)言理解NLU、對(duì)話管理DM、自然語(yǔ)言生成NLG和語(yǔ)音合成TTS,其中語(yǔ)音識(shí)別的準(zhǔn)確率尤為關(guān)鍵。語(yǔ)音識(shí)別又包括了機(jī)器前端的語(yǔ)音采樣、語(yǔ)音激活檢測(cè)、特征提取,后端的語(yǔ)音模型構(gòu)建、語(yǔ)音解碼。在面對(duì)室內(nèi)包含各種噪聲、混響、回聲、不相關(guān)人聲等復(fù)雜的環(huán)境下,前端的語(yǔ)音采樣處理對(duì)提高語(yǔ)音識(shí)別的魯棒性十分重要。通過(guò)語(yǔ)音增強(qiáng)模塊先運(yùn)用自適應(yīng)回聲消除(AEC)算法[1]對(duì)環(huán)形麥克風(fēng)各個(gè)通道的信號(hào)進(jìn)行回波消除,然后根據(jù)時(shí)延估計(jì)算法[2]進(jìn)行聲源定位,進(jìn)而通過(guò)自適應(yīng)波束形成算法形成拾音波束,并抑制其他方向的信號(hào),再通過(guò)后置濾波算法[3]消除混響等噪聲,最后對(duì)語(yǔ)音信號(hào)進(jìn)行增益輸出,這一系列操作完成語(yǔ)音信號(hào)的前端。對(duì)前端處理過(guò)的語(yǔ)音信號(hào)進(jìn)行特征提取、喚醒詞檢測(cè)等判斷語(yǔ)音的有效性,再對(duì)語(yǔ)音信號(hào)進(jìn)行編碼。樹(shù)莓派通過(guò)接入云端語(yǔ)音交互Restful API上傳音頻編碼,在云端通過(guò)語(yǔ)音模型匹配完成語(yǔ)音識(shí)別,并通過(guò)云端的自然語(yǔ)言處理NLP進(jìn)行邏輯分析以執(zhí)行相應(yīng)功能。
但是在面對(duì)部分群體不會(huì)說(shuō)普通話、語(yǔ)速緩慢或吐詞不清等情況,傳統(tǒng)的語(yǔ)音模型識(shí)別的準(zhǔn)確率很低。若建立針對(duì)性地語(yǔ)音模型,需要大量的數(shù)據(jù)進(jìn)行模型訓(xùn)練,且面對(duì)多種情況,訓(xùn)練模型的難度和成本都很大。因此本設(shè)計(jì)采用了較為簡(jiǎn)單的語(yǔ)音音頻相似度對(duì)比的方法構(gòu)建語(yǔ)音模型,通過(guò)手機(jī)客戶端App錄入語(yǔ)音和相應(yīng)功能完成常用語(yǔ)音的識(shí)別,把針對(duì)性模型訓(xùn)練的工作交給年輕用戶。同時(shí)通過(guò)對(duì)語(yǔ)音進(jìn)行聲學(xué)特征比對(duì),進(jìn)行聯(lián)想性的語(yǔ)音識(shí)別,降低語(yǔ)速和吐詞不清帶來(lái)的影響。
2.2 自主定位導(dǎo)航
機(jī)器人的室內(nèi)自主定位導(dǎo)航[4]主要包括定位與地圖構(gòu)建(SLAM)、路徑規(guī)劃和運(yùn)動(dòng)控制與實(shí)時(shí)避障三個(gè)部分。其中SLAM[5]又包括預(yù)處理、匹配、地圖融合三個(gè)核心步驟,即通過(guò)激光雷達(dá)實(shí)時(shí)不斷地獲得數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行濾波優(yōu)化完成數(shù)據(jù)預(yù)處理,再通過(guò)點(diǎn)云匹配算法[6]將局部環(huán)境的點(diǎn)云數(shù)據(jù)匹配并拼接到上一次的點(diǎn)云數(shù)據(jù),經(jīng)過(guò)在室內(nèi)不斷的移動(dòng)和雷達(dá)掃描形成地圖。在經(jīng)過(guò)新一輪的環(huán)境掃描時(shí),把新的數(shù)據(jù)匹配拼接到先前的地圖中,不斷進(jìn)行融合更新。根據(jù)要執(zhí)行的功能通過(guò)D*算法[7]進(jìn)行路徑規(guī)劃,控制電機(jī)運(yùn)行,并在行進(jìn)過(guò)程中通過(guò)超聲波模塊、防跌落模塊檢測(cè)障礙實(shí)時(shí)避障。
2.3 手機(jī)客戶端App設(shè)計(jì)
手機(jī)客戶端主要服務(wù)于監(jiān)護(hù)人,便于其通過(guò)手機(jī)對(duì)機(jī)器人系統(tǒng)進(jìn)行配置和遠(yuǎn)程查看需陪護(hù)的居家人士的健康狀況,形成立體化的陪護(hù)系統(tǒng)??梢酝ㄟ^(guò)手機(jī)客戶端錄入自定義語(yǔ)音,進(jìn)行語(yǔ)音模型訓(xùn)練,配置家電的遙控參數(shù),根據(jù)時(shí)間、環(huán)境溫度設(shè)置特定任務(wù)時(shí)間。還可以在手機(jī)上查看其健康狀態(tài)報(bào)告,遠(yuǎn)程監(jiān)看家里的情況。
3 結(jié)語(yǔ)
本文設(shè)計(jì)的機(jī)器人系統(tǒng)通過(guò)本地簡(jiǎn)單語(yǔ)音模型與完善的在線語(yǔ)音識(shí)別方案結(jié)合,提高現(xiàn)有語(yǔ)音模型對(duì)老人、病人的適應(yīng)性,這種方案簡(jiǎn)單、成本低,可以滿足人們對(duì)智能產(chǎn)品簡(jiǎn)便實(shí)用的需求。為居家人士創(chuàng)造出一個(gè)安全,便捷,安逸休閑的智能化居家環(huán)境。相信隨著人工智能在各個(gè)領(lǐng)域的技術(shù)發(fā)展和完善,語(yǔ)音交互的適應(yīng)性會(huì)更強(qiáng),機(jī)器人系統(tǒng)也能夠通過(guò)用戶狀態(tài)、周圍環(huán)境提供更加智能的服務(wù)?,F(xiàn)下社會(huì)正在加速進(jìn)入人工智能的時(shí)代,本設(shè)計(jì)可以更好地帶領(lǐng)所有人群包括老人病人等弱勢(shì)群體無(wú)障礙地融入人工智能時(shí)代,為生活增添光彩。
參考文獻(xiàn):
[1] 馮江浩.基于自適應(yīng)濾波的聲學(xué)回聲消除算法研究[D].太原:太原理工大學(xué),2018.
[2] 宗志亞.基于麥克風(fēng)陣列的室內(nèi)聲源定位方法研究[D].重慶:重慶大學(xué),2012.
[3] 夏杰.麥克風(fēng)陣列自適應(yīng)波束形成及后置濾波技術(shù)研究[D].重慶:重慶郵電大學(xué),2017.
[4] 鄭燦濤.基于激光雷達(dá)的室內(nèi)移動(dòng)機(jī)器人自主導(dǎo)航與行人跟蹤研究[D].廣州:華南理工大學(xué),2018.
[5] 李想.基于SLAM的室內(nèi)移動(dòng)機(jī)器人導(dǎo)航技術(shù)研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2018.
[6] 李亮.基于點(diǎn)云匹配的智能車定位方法研究[D].上海:上海交通大學(xué),2018.
[7] 張希聞,肖本賢.改進(jìn)D~*算法的移動(dòng)機(jī)器人路徑規(guī)劃[J].傳感器與微系統(tǒng),2018,37(12):52-54,58.
【通聯(lián)編輯:唐一東】