• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于樹莓派的智能語音交互系統(tǒng)設(shè)計(jì)

      2023-10-09 09:41:00盧嫚陳佳悅
      科技與創(chuàng)新 2023年18期
      關(guān)鍵詞:配置文件音箱百度

      盧嫚,陳佳悅

      (西安工程大學(xué)電子信息學(xué)院,陜西西安 710048)

      隨著科技的發(fā)展和智能語音助手、智能音箱市場的逐漸成熟,人工智能浪潮下的語音交互已經(jīng)成為最被人們所接受的交互方式[1]。智能語音互動(dòng)超越了電子屏幕的局限逐漸擴(kuò)展至人們的生活中,成為了新一代用戶的主流交互方式,語音交互作為一種自然的人機(jī)交互方式,已經(jīng)融入了各個(gè)領(lǐng)域,如智能家居、車載智能語音等[2-3]。智能音箱作為語音交互的功能產(chǎn)品,帶給人們一種全新的體驗(yàn)[4]。與如今的智能手機(jī)相比,智能音箱的交互功能更加明確,使用輕松便利,提高了使用效率[5]。對于智能音箱的使用,無需用戶進(jìn)一步學(xué)習(xí),無論小孩還是老人,都可以更好地使用。用戶使用的要求降低,只需要用戶說出來問題或要求即可[6]。

      1 智能音箱功能的設(shè)計(jì)

      1.1 訓(xùn)練喚醒詞

      設(shè)置個(gè)性化的喚醒詞。首先,需要?jiǎng)?chuàng)建一個(gè)配置文件以便于配置喚醒詞,這個(gè)工作可以交給wukong-robot 輔助完成。在終端輸入指令:利用cd wukong-robot 來打開wukong-robot 文件夾,接下來在wukong-robot 的根目錄下執(zhí)行python3 wukong.py[7]。

      第一次啟動(dòng)后,提示用戶目錄下創(chuàng)建一個(gè)配置文件,輸入 y 即可。配置文件將會(huì)保存在~/.wukong/config.yml 中。

      對于設(shè)置個(gè)性化的喚醒詞,先登錄https://snowboy.hahack.com/網(wǎng)站,訓(xùn)練個(gè)性化的模型。再下載pmdl 模型并放到~/.wukong 中。最后修改config.yml 的model 配置,修改為已經(jīng)訓(xùn)練好的模型的文件名。

      個(gè)性化的snowboy 喚醒詞訓(xùn)練界面如圖1 所示,需要3 個(gè)語音示例訓(xùn)練喚醒詞,合成一個(gè).pmdl 文件,即訓(xùn)練成的上傳文件。

      圖1 個(gè)性化喚醒詞設(shè)置界面

      本文訓(xùn)練的喚醒詞為“嘿小婷”,經(jīng)過多次訓(xùn)練后,可以正常識(shí)別及運(yùn)行。

      1.2 結(jié)合語音理解NLU 的對話功能

      結(jié)合語音理解 NLU(Natural Language Understanding,自然語言理解)的對話功能,整個(gè)對話的設(shè)計(jì)流程如圖2 所示。

      UNIT(Understanding and Interaction Technology)是百度AI推出的可定制的對話開發(fā)系統(tǒng)。

      先設(shè)計(jì)一個(gè)最簡單的版本,首先通過關(guān)鍵詞“打個(gè)招呼”來觸發(fā)這個(gè)插件響應(yīng),無需任何配置項(xiàng),需處理用戶的指令,直接回復(fù)“hello world”。

      3.3 早期干預(yù)對促進(jìn)兒童語言發(fā)育和預(yù)防心理問題意義重大 正常的聽力是進(jìn)行語言學(xué)習(xí)的前提。而聽力障礙的兒童由于缺乏語言刺激和環(huán)境,不能在11個(gè)月前進(jìn)入呀呀學(xué)語期,在語言發(fā)育最重要和關(guān)鍵的2~3歲內(nèi)不能建立正常的語言學(xué)習(xí),輕者導(dǎo)致言語障礙、社會(huì)適應(yīng)能力低下、注意力缺陷和學(xué)習(xí)困難等心理行為問題,嚴(yán)重者會(huì)導(dǎo)致聾啞。本縣確診為聽力障礙的103例嬰兒均得到及時(shí)有效的干預(yù)及治療。對聽力障礙兒童均進(jìn)行了心理行為發(fā)育篩查和跟蹤隨訪,89.32%的兒童心理行為發(fā)育正常,可疑和異常兒均在進(jìn)一步的康復(fù)治療中。

      訓(xùn)練百度平臺(tái)UNIT 的技能[8],首先在百度UNIT中訓(xùn)練這個(gè)技能。注冊登錄百度UNIT 后,在“我的技能”面板中點(diǎn)擊“新建技能”按鈕,在彈出的窗口中填好信息,完成創(chuàng)建。之后創(chuàng)建一個(gè)對話意圖。

      進(jìn)入這個(gè)技能面板后,點(diǎn)擊“新建對話意圖”,新建一個(gè)名字為HELLO_WORLD 的意圖,并填好相關(guān)的信息。百度UNIT 的新建技能面板如圖3 所示。

      圖3 新建技能面板

      在上面已經(jīng)定義了一個(gè)名字為user_person 的可選詞槽,用來確定要向誰問好。在創(chuàng)建的時(shí)候,可以復(fù)用UNIT 自帶的sys_pe,其中可以是人物,包含虛擬人物在內(nèi)的各類人名的系統(tǒng)詞槽,還可以根據(jù)需要再添加一些自定義詞典。

      接下來在左側(cè)面板點(diǎn)擊“訓(xùn)練數(shù)據(jù)”的“對話樣本集”,在對話樣本集面板中點(diǎn)擊“新建對話樣本集”,創(chuàng)建樣本集。

      創(chuàng)建好對話樣本集后,訓(xùn)練UNIT 技能這一步已經(jīng)完成,完成后就可以對該技能進(jìn)行訓(xùn)練和測試,先確保模型正常工作,并且不會(huì)被誤判為其他技能。如果判斷不理想,可以繼續(xù)補(bǔ)充,直到結(jié)果符合預(yù)期為止。

      配置完成后,則實(shí)現(xiàn)了結(jié)合NLU 的對話功能,如果需要更多的對話,也可以按照這個(gè)方法,在百度UNIT 上繼續(xù)載入自己的樣本集。

      1.3 清除緩存功能

      清除緩存這個(gè)功能對于計(jì)算機(jī)來說是必不可少的,可以增加使用壽命、避免卡頓,是一個(gè)有真正用途的普通技能插件。為了節(jié)省用于語音合成所消耗的時(shí)間,wukong-robot 支持將語音文件緩存到temp 目錄中,但是如果使用時(shí)間久,目錄里的文件數(shù)量就會(huì)越來越多,會(huì)占用大量的設(shè)備存儲(chǔ)空間。另外,如果語音合成配置改了發(fā)音人的音色,沒有清理已有的緩存語音,也會(huì)導(dǎo)致wukong-robot 使用過程中混雜多種音色的奇怪體驗(yàn)。清除緩存是必不可少的,流程如圖4所示。

      圖4 清除緩存設(shè)置流程框圖

      清除緩存配置文件如圖5 所示。

      圖5 清除緩存配置文件

      本文中將此插件設(shè)計(jì)成只要指令中包含關(guān)鍵詞“清除緩存”“清空緩存”“清緩存”就可觸發(fā)這個(gè)插件響應(yīng)。且無需任何配置項(xiàng),無需處理用戶的指令,直接清除緩存,并告知用戶“緩存目錄已清空”。

      2 運(yùn)行測試

      2.1 天氣查詢技能測試

      為保證喚醒詞設(shè)置不出現(xiàn)錯(cuò)誤,先使用喚醒詞為默認(rèn)喚醒詞“孫悟空”。終端輸入指令python3 wukong-robot.py,運(yùn)行成功后,可以進(jìn)行功能測試,如進(jìn)行溝通交流,是否能理解語義及進(jìn)行反饋。語音交互對話的界面如圖6 所示,可以實(shí)現(xiàn)基本的智能音箱設(shè)計(jì)中的聊天對話功能。

      圖6 語音對話顯示

      語音接收信息無誤后,可以對前文中設(shè)計(jì)的天氣查詢技能進(jìn)行簡單的測試,對天氣查詢功能的測試如圖7 所示。經(jīng)過提問,可以準(zhǔn)確回答出天氣如何,則功能設(shè)計(jì)也基本成功,可以滿足設(shè)計(jì)需求。

      圖7 天氣查詢顯示

      2.2 管理及調(diào)試結(jié)果

      此外,wukong-robot 在運(yùn)行時(shí)默認(rèn)啟動(dòng)后臺(tái)管理終端,不僅提供遠(yuǎn)程對話和更改配置視圖,還提供日志顯示等功能。其默認(rèn)地址為http://localhost:5000,默認(rèn)賬戶名為wukong,默認(rèn)密碼為wukong@2019。后臺(tái)管理端的顯示界面如圖8 所示。

      圖8 后臺(tái)管理端

      也可以直接在終端啟動(dòng)wukong-robot 進(jìn)行運(yùn)營管理。終端關(guān)閉,wukong-robot 進(jìn)程可能會(huì)消失。要想在后臺(tái)保持運(yùn)行,可以在tmux 中運(yùn)行。

      如果出現(xiàn)wukong-robot 在運(yùn)行時(shí)反應(yīng)速度太慢的情況,反饋交互有時(shí)發(fā)生后需要2 min。經(jīng)過測試,這通常與網(wǎng)絡(luò)環(huán)境有很大關(guān)系,例如由于防火墻而無法訪問某些服務(wù)。此時(shí)可以運(yùn)行wukong-robot:python3 wukong.py profiling,在每一次交互后,顯示出當(dāng)次交互的性能數(shù)據(jù)。

      如圖9 顯示的是性能調(diào)優(yōu)數(shù)據(jù),用長方形框顯示列堆積了處理每個(gè)任務(wù)所需的時(shí)間,如果該列下降并發(fā)現(xiàn)數(shù)量突然變小,則第一行是最大的黑手。執(zhí)行python3 wukong.py help 可以了解更多命令行用法。

      圖9 性能調(diào)優(yōu)數(shù)據(jù)

      若使wukong-robot 暫時(shí)不監(jiān)聽不授權(quán),可以在配置文件中設(shè)置hotword_switch 為true,可以更好地保護(hù)用戶的隱私安全,防止被監(jiān)聽、信息泄露等。

      經(jīng)過測試,符合預(yù)期的3~5 m 的收音范圍,由于遠(yuǎn)場喚醒距離與場合的安靜與否、說話聲音大小、距離遠(yuǎn)近都有關(guān)系。在較為安靜的場合時(shí),以麥克風(fēng)為半徑的5~7 m 內(nèi)的圓內(nèi)都可以較為清晰地收音,若為較為嘈雜的場合,收音半徑小于3 m。

      3 結(jié)論

      本文設(shè)計(jì)了基于樹莓派的智能語音交互系統(tǒng),利用wukong-robot 開源庫及百度語音轉(zhuǎn)換等提供的通信協(xié)議以及采用API接口來實(shí)現(xiàn)人機(jī)交互中的語義理解、語音轉(zhuǎn)換,最終設(shè)計(jì)出一個(gè)具有個(gè)性化的智能音箱。系統(tǒng)有成本低、功能強(qiáng)大、體積小、功耗低及便于實(shí)現(xiàn)等優(yōu)點(diǎn),結(jié)合AI語音交互,制作了一款陪伴型機(jī)器人,可運(yùn)用于各個(gè)領(lǐng)域,如智能家居、智能車載等。

      猜你喜歡
      配置文件音箱百度
      提示用戶配置文件錯(cuò)誤 這樣解決
      KEF推出新一代LS50 Wireless Ⅱ音箱
      Polk(普樂之聲)推出高端Reserve系列音箱
      Robust adaptive UKF based on SVR for inertial based integrated navigation
      搭建簡單的Kubernetes集群
      互不干涉混用Chromium Edge
      小音箱,大精彩 B&W 805 D3尊貴版書架音箱
      多一對音箱,多一份驚喜Marantz AV8805
      忘記ESXi主機(jī)root密碼怎么辦
      百度年度熱搜榜
      宜宾市| 西安市| 汨罗市| 浦北县| 洛南县| 韶关市| 留坝县| 河东区| 潼关县| 科尔| 思南县| 甘泉县| 永顺县| 汉寿县| 黄石市| 社旗县| 南昌市| 财经| 牟定县| 古蔺县| 安化县| 仙游县| 兴安盟| 保定市| 洛川县| 泗洪县| 文山县| 会同县| 漠河县| 宣威市| 招远市| 平果县| 竹北市| 丹江口市| 沁水县| 紫金县| 家居| 莒南县| 华亭县| 霍林郭勒市| 北海市|