楊潔
(渭南職業(yè)技術(shù)學(xué)院 師范學(xué)院, 渭南 714000)
隨著現(xiàn)代信息技術(shù)的不斷發(fā)展,信息化和智能化成為當(dāng)前時(shí)代第一個(gè)標(biāo)志。在智能化的今天,各種智能系統(tǒng)開始不斷涌現(xiàn),如基于Android和IOS的各項(xiàng)應(yīng)用功能程序更是極大的方便了人們的生活。教育領(lǐng)域也不例外,在教育信息化的今天,涌現(xiàn)出一大批基于教育的智能開發(fā)系統(tǒng),如基于Android的教育APP,比較典型的就是基于Android的英語學(xué)習(xí),或者是英語口語軟件等等。同時(shí)在這些軟件的基礎(chǔ)上,人們開始引入學(xué)習(xí)者行為分析等智能算法,以此極大的拓展了當(dāng)前的英語教育功能。而在智能化的今天,智能機(jī)器人開始成為一個(gè)新興的研究熱點(diǎn),智能機(jī)器人的開發(fā)被廣泛研究,如基于智能機(jī)器人的電力巡檢機(jī)器人。除應(yīng)用到電力以外,人們嘗試將智能機(jī)器人應(yīng)用到英語學(xué)習(xí)中,比較典型的就是基于人機(jī)交互的智能機(jī)器人。人機(jī)交互機(jī)器人是教學(xué)領(lǐng)域中最新的智能教學(xué)系統(tǒng),該系統(tǒng)主要是將學(xué)習(xí)者與機(jī)器人進(jìn)行結(jié)合,以人機(jī)交互技術(shù)實(shí)現(xiàn)兩者之間的溝通與對話。對此,本文則嘗試采用當(dāng)前的NAO智能機(jī)器人平臺,構(gòu)建一款可用于人機(jī)交互的英語智能學(xué)習(xí)系統(tǒng),并對該系統(tǒng)進(jìn)行了詳細(xì)的設(shè)計(jì)與實(shí)現(xiàn)。
本文主要是以基于同伴交互的人機(jī)交互模型為基礎(chǔ),對英語學(xué)習(xí)機(jī)器人進(jìn)行研究與設(shè)計(jì)。設(shè)計(jì)工作主要以傳遞英語教學(xué)內(nèi)容為目標(biāo),采用語音對話方式來構(gòu)建起學(xué)習(xí)者與機(jī)器人之間溝通的橋梁,涉及聽說、肢體表達(dá)等行為方式,以此對學(xué)習(xí)者的下一步行為進(jìn)行判斷與規(guī)劃,使英語學(xué)習(xí)機(jī)器人形成閉環(huán)系統(tǒng),直至學(xué)習(xí)者主動(dòng)發(fā)起與機(jī)器人之間的交互時(shí)停止溝通與判斷。具體英語學(xué)習(xí)機(jī)器人交互系統(tǒng)實(shí)現(xiàn)框架如圖1所示。
圖1 英語學(xué)習(xí)機(jī)器人交互系統(tǒng)實(shí)現(xiàn)框架
根據(jù)圖1看出,本文所設(shè)計(jì)的英語學(xué)習(xí)機(jī)器人主要是在NAO機(jī)器人平臺上進(jìn)行設(shè)計(jì)與開發(fā),主要對系統(tǒng)的語音處理、肢體動(dòng)作以及網(wǎng)絡(luò)通信等功能進(jìn)行支撐,使該學(xué)習(xí)系統(tǒng)能夠滿足用戶各項(xiàng)功能需求。在這些系統(tǒng)基本功能中,語音處理主要由語音識別以及語音合成兩部分構(gòu)成,英語學(xué)習(xí)機(jī)器人主要通過肢體動(dòng)作結(jié)合語音的方式,來對其情感進(jìn)行表達(dá),再利用網(wǎng)絡(luò)通信功能對系統(tǒng)服務(wù)器中的語音功能進(jìn)行調(diào)用,以此實(shí)現(xiàn)與學(xué)習(xí)者之間的溝通與交互。
而透過圖1的架構(gòu)看出,本文所設(shè)計(jì)的英語學(xué)習(xí)機(jī)器人其實(shí)就是一個(gè)接受、處理、分發(fā)以及信號的工具。在實(shí)際應(yīng)用過程中,英語學(xué)習(xí)機(jī)器人能夠直接對學(xué)習(xí)者發(fā)出的語音信號進(jìn)行接收,并且在接收到該信號之后再利用語音識別功能對該信號進(jìn)行轉(zhuǎn)換,使其由語音信號轉(zhuǎn)變?yōu)槲谋拘盘枺阌诔绦驅(qū)W(xué)習(xí)者語音信號的理解。系統(tǒng)將會(huì)根據(jù)輸入信號來對服務(wù)器接口進(jìn)行調(diào)用,以此實(shí)現(xiàn)英語學(xué)習(xí)機(jī)器人的不同功能。系統(tǒng)服務(wù)器在返回接口調(diào)用結(jié)果之后,系統(tǒng)將會(huì)借助機(jī)器人自身具備的語音合成以及肢體動(dòng)作兩大基本功能將調(diào)用結(jié)果生動(dòng)的展現(xiàn)于學(xué)習(xí)者眼前。
本文主要選用NAO機(jī)器人作為本次設(shè)計(jì)的開發(fā)平臺。NAO機(jī)器人是一種由法國Aldebaran Robotic公司所設(shè)計(jì)研發(fā)的一種可編程防人機(jī)器人。該機(jī)器人高約57 cm,全身上下遍布著25個(gè)自由度及系列傳感器,具體包括紅外線傳感器、壓力傳感器等。同時(shí),NAO機(jī)器人還擁有2個(gè)攝像頭以及4個(gè)麥克風(fēng),頭部及軀干位置分別裝有一個(gè)CPU,其中,頭部的CPU主要運(yùn)行于Linux內(nèi)核之上。
圖2 NAO機(jī)器人平臺
相較于同類型的機(jī)器人平臺,NAO機(jī)器人具備基礎(chǔ)功能全面這一顯著特征,并且擁有多種傳感器以及豐富的開發(fā)接口,能夠?yàn)楸敬斡⒄Z學(xué)習(xí)機(jī)器人設(shè)計(jì)提供極大的支持。如NAO機(jī)器人內(nèi)部具備行走以及運(yùn)動(dòng)模塊,能夠?qū)C(jī)器人的運(yùn)動(dòng)控制起到支持,實(shí)現(xiàn)機(jī)器人在多種應(yīng)用場景地面行走;NAO機(jī)器人還具備PDF(語音識別技術(shù)云),能夠使開發(fā)設(shè)計(jì)完成的英語學(xué)習(xí)機(jī)器人具備19種不同的語言交流能力。另外,采用NAO機(jī)器人平臺進(jìn)行英語學(xué)習(xí)機(jī)器人設(shè)計(jì),能夠使系統(tǒng)對多種主流可開發(fā)語言以及調(diào)試控制軟件進(jìn)行支持。
英語學(xué)習(xí)機(jī)器人主要借助NAO機(jī)器人平臺的運(yùn)行環(huán)境以及服務(wù)器對語音功能進(jìn)行實(shí)現(xiàn)。在NAO機(jī)器人環(huán)境之下,引入Python語言來對機(jī)器人的語音信號處理以及接口調(diào)用兩個(gè)基本功能進(jìn)行實(shí)現(xiàn);利用Java語言來對其核心教學(xué)功能進(jìn)行實(shí)現(xiàn),比如單詞發(fā)音犯規(guī)、自由對話內(nèi)容的反饋等,能夠幫助學(xué)習(xí)者提高自身英語水平。本次設(shè)計(jì)工作主要采用Spring boot框架作為系統(tǒng)服務(wù)器程序,并且將程序發(fā)布于Nginx Web服務(wù)器上。在英語學(xué)習(xí)機(jī)器人中,NAO機(jī)器人與系統(tǒng)服務(wù)器之間主要借助RESTFUL風(fēng)格接口進(jìn)行通信,兩者同處于一個(gè)局域網(wǎng)中。
在開展英語學(xué)習(xí)機(jī)器人的單詞練習(xí)功能部分設(shè)計(jì)時(shí),本文將選用人教版七年級英語課本中的單詞作為單詞練習(xí)功能模塊的英語單詞詞庫。通過單詞練習(xí)模塊,能夠使英語學(xué)習(xí)機(jī)器人輔助學(xué)習(xí)者開展課后單詞練習(xí)。具體單詞練習(xí)功能模塊流程設(shè)計(jì)如圖3所示。
圖3 單詞練習(xí)功能模塊流程設(shè)計(jì)
如圖3所示,學(xué)習(xí)者在使用英語學(xué)習(xí)機(jī)器的單詞練習(xí)功能模塊時(shí),將會(huì)對著英語學(xué)習(xí)機(jī)器人進(jìn)行英語單詞的發(fā)音練習(xí)。英語學(xué)習(xí)機(jī)器人在接收到學(xué)習(xí)者的語音信息之后,將會(huì)對該信息進(jìn)行識別,判斷其是否存在于系統(tǒng)單詞庫中。若判斷結(jié)果為存在,則將與該語音信息對于的英語單詞釋義以及例句等信息呈現(xiàn)于學(xué)習(xí)者眼前,并且鼓勵(lì)學(xué)習(xí)者對該單詞進(jìn)行深入了解。在單詞練習(xí)功能模塊中,機(jī)器人主要借助語音信號通信與學(xué)習(xí)者之間取得溝通,并且利用網(wǎng)絡(luò)通信實(shí)現(xiàn)與服務(wù)器之間的通信。系統(tǒng)在運(yùn)行單詞練習(xí)功能時(shí),機(jī)器人、服務(wù)器以及學(xué)習(xí)者之間主要有以下兩點(diǎn)交互流程。
(1) 機(jī)器人對學(xué)習(xí)者單詞進(jìn)行識別。在單詞練習(xí)功能啟動(dòng)之后,學(xué)習(xí)者將會(huì)對著機(jī)器人進(jìn)行英語單詞發(fā)音及朗讀。此時(shí),機(jī)器人將會(huì)對學(xué)習(xí)者發(fā)出的英語單詞進(jìn)行識別,并且將識別成功的單詞發(fā)送至系統(tǒng)服務(wù)器。
(2) 服務(wù)器檢索單詞。服務(wù)器在接收到機(jī)器人發(fā)來的英語單詞之后,將會(huì)對系統(tǒng)單詞庫進(jìn)行檢索,以此獲取單詞庫中的單詞信息。若最終檢索結(jié)果為失敗,則向?qū)W習(xí)者反饋單詞不存在這一結(jié)果;反之,則將單詞庫中檢索到的單詞所有信息呈現(xiàn)于學(xué)習(xí)者眼前。
角色扮演對話功能就是將學(xué)習(xí)者與機(jī)器人劃分為兩個(gè)角色,按照課本內(nèi)容相互配合,以此開展英語學(xué)習(xí)過程中的情景對話。具體角色扮演對話功能流程設(shè)計(jì)如圖4所示。
圖4 角色扮演對話功能流程設(shè)計(jì)
如上圖所示,在使用角色扮演對話功能之前,學(xué)習(xí)者需要對本次對話扮演角色進(jìn)行選擇之后,才能實(shí)現(xiàn)與英語學(xué)習(xí)機(jī)器人之間的對話。在整個(gè)角色扮演對話過程中,英語學(xué)習(xí)機(jī)器人與學(xué)習(xí)者之阿金通過語音信號進(jìn)行信息的傳遞,與服務(wù)器之間通過約定接口實(shí)現(xiàn)通信。
具體自由對話功能設(shè)計(jì)流程如圖5所示。
如上圖所示,在自由對話功能模塊中,學(xué)習(xí)者、機(jī)器人以及服務(wù)器之間具有以下幾點(diǎn)執(zhí)行流程:
(1) 開始對話。學(xué)習(xí)者在啟動(dòng)自由對話功能模塊之后,可通過觸碰英語學(xué)習(xí)機(jī)器人身體部件的方式,來告知機(jī)器人已做好自由對話準(zhǔn)備并開始兩者之間的自由對話。機(jī)器人在接收到學(xué)習(xí)者發(fā)起的自由對話信號之后,將會(huì)向服務(wù)器發(fā)起自由對話申請,并且由服務(wù)器對自由對話信息的記錄。
圖5 自由對話功能設(shè)計(jì)流程
(2) 語音識別。在開展自由對話時(shí),機(jī)器人將會(huì)對學(xué)習(xí)者發(fā)出的語音進(jìn)行識別,若正確識別,則將該語音發(fā)送至服務(wù)器并且給出合理回應(yīng);反之,則重復(fù)上一步驟。
(3) 等待學(xué)習(xí)者應(yīng)答。機(jī)器人在向?qū)W習(xí)者發(fā)起提問后,若學(xué)習(xí)者未在1分鐘內(nèi)給出相應(yīng)的答對,機(jī)器人將啟動(dòng)自動(dòng)問答模式;反之,則重復(fù)上一步驟。
具體基于規(guī)則匹配的對話管理程序執(zhí)行流程圖如圖6所示。
圖6 基于規(guī)則匹配的對話管理程序執(zhí)行流程
如圖6所示,基于規(guī)則匹配對話管理程序主語由四大步驟構(gòu)成,分別為預(yù)處理、獲取合法規(guī)則、獲取最佳規(guī)則以及生成應(yīng)答。在此管理程序中,機(jī)器人調(diào)用接口時(shí)產(chǎn)生的參數(shù)將會(huì)被作為程序的輸入,返回應(yīng)答語句將代表著程序結(jié)束。
具體情感交互流程設(shè)計(jì)如圖7所示。
如圖7所示,機(jī)器人在接收到用戶發(fā)來的聲音信號之后,將會(huì)借助系統(tǒng)語音識別模塊對該信號進(jìn)行識別,并根據(jù)識別結(jié)果對機(jī)器人輸出內(nèi)容進(jìn)行決定。若輸出內(nèi)容中含有系統(tǒng)設(shè)定的情感關(guān)鍵字,服務(wù)器將會(huì)對動(dòng)作庫當(dāng)中與該關(guān)鍵字對于的動(dòng)作進(jìn)行調(diào)用,并伴隨語音內(nèi)容進(jìn)行輸出。
圖7 情感交互流程設(shè)計(jì)
本文構(gòu)建的英語機(jī)器人主要陪伴讓英語學(xué)習(xí)者參與課下英語學(xué)習(xí)。學(xué)習(xí)者可通過觸碰英語學(xué)習(xí)機(jī)器人身體部件的方式,來對該機(jī)器人進(jìn)行啟動(dòng)。機(jī)器人的頭頂共有三個(gè)功能區(qū),分別為單詞練習(xí)、角色扮演對話以及自由對話,學(xué)習(xí)者可自行選取相應(yīng)的功能模塊,對這些功能的實(shí)現(xiàn),則通過Choregraphe軟件實(shí)現(xiàn)。具體的開發(fā)測試界面如圖8所示。
圖8 英語學(xué)習(xí)機(jī)器人與學(xué)習(xí)者對話交互場景編程
通過上述的測試看出,無論是對話功能,還是與服務(wù)器端的鏈接方面,該英語智能機(jī)器人都可很好的連接和進(jìn)行。由此可以看出,本文構(gòu)建的這種英語學(xué)習(xí)機(jī)器人具有很強(qiáng)的交互場景和互動(dòng)功能。但是,本文在語音識別模塊和機(jī)器人的交互中,還有待進(jìn)一步的探討和設(shè)計(jì)。