卓翔+鄭巧彬+林漢平
摘要:隨著電力行業(yè)的不斷發(fā)展,人們需求的層次不斷提升,服務(wù)在電力營(yíng)銷中扮演著越來越重要的角色。本文主要介紹了以語音交互技術(shù)結(jié)合觸摸屏交互技術(shù)為基礎(chǔ)的人機(jī)交互技術(shù)在電力營(yíng)業(yè)廳中的應(yīng)用。
關(guān)鍵詞:語音識(shí)別;語義理解;觸摸屏交互
近來社會(huì)經(jīng)濟(jì)的不斷發(fā)展,對(duì)于電力的需求與日俱增,這在一定程度上推動(dòng)了電力企業(yè)的發(fā)展,也在一定程度上加劇了電力行業(yè)的競(jìng)爭(zhēng)。為了提高電力企業(yè)的競(jìng)爭(zhēng)力,提升服務(wù)品質(zhì)來完善營(yíng)銷策略是一條有效途徑。以人機(jī)交互技術(shù)為基礎(chǔ)的服務(wù)機(jī)器人出現(xiàn)在營(yíng)業(yè)大廳,協(xié)助營(yíng)業(yè)人員完成客戶對(duì)電力業(yè)務(wù)的咨詢和辦理,可以有效提升用戶的服務(wù)體驗(yàn),改善了大堂經(jīng)理的日常工作模式,實(shí)現(xiàn)了營(yíng)業(yè)廳智能化的改造與建設(shè),是電力服務(wù)自我革新、拓展電力服務(wù)空間的舉措之一。
隨著現(xiàn)代科學(xué)和計(jì)算機(jī)技術(shù)的發(fā)展,人們?cè)谂c機(jī)器的信息交流中,需要一張更加方便、自然的方式。而語言是人類最重要的、最有效的、最常用的和最方便的通信形式[1]。因此,語音作為一種普遍的人機(jī)交互接口,被廣泛應(yīng)用于人機(jī)交互系統(tǒng)中。目前大多數(shù)車載導(dǎo)航系統(tǒng)、服務(wù)機(jī)器人、教育機(jī)器人等都具備基本的語音交互功能,影視作品中的幾乎所有機(jī)器人都有此功能,可見人類對(duì)可以同一個(gè)機(jī)器進(jìn)行語音交流的渴望。語音交互可分為以下四個(gè)步驟,分別是語音識(shí)別、語義理解、語義答復(fù)以及語音合成。
語音識(shí)別。語音識(shí)別系統(tǒng)根據(jù)一個(gè)較大詞庫,將用戶的一句話拆分成零散的詞語,依次識(shí)別各個(gè)詞語。對(duì)于不同的場(chǎng)景需要建立不同的熱詞庫,以電力營(yíng)業(yè)廳為例,大部分電力業(yè)務(wù)涉及到詞語都為生僻詞,如果提前創(chuàng)建一個(gè)電力業(yè)務(wù)熱詞庫,讓搜索引擎先去搜索熱詞庫,再去搜索公共詞庫,可以加速引擎對(duì)用戶命令詞的匹配,提高語音識(shí)別效率。
語義理解。語義理解的總體流程是用戶用自然語音給出一段話,通過語音識(shí)別系統(tǒng),將語言轉(zhuǎn)換為文字,通過語義理解先對(duì)句子進(jìn)行分詞,得到一系列詞組,然后利用詞庫提取關(guān)鍵詞并且推出特征值[2]。例如“今天福州的天氣如何”,首先需要一個(gè)分詞庫,對(duì)句子進(jìn)行分詞處理,如果不進(jìn)行分詞處理,機(jī)器很難讀懂“天”、“氣”那個(gè)字和在一起是什么意思,分詞之后,可以將這句話拆分成:今天 福州 天氣 如何。然后進(jìn)行關(guān)鍵詞的提取和特征值的對(duì)應(yīng),例如關(guān)鍵詞“今天”代表的特征是日期,“福州”代表的特征是地點(diǎn),“天氣”代表的特征是應(yīng)用場(chǎng)景。接下來,可以根據(jù)這些語義結(jié)果的得出的特征值進(jìn)行語義答復(fù)等處理。
語義答復(fù)。此環(huán)節(jié)的關(guān)鍵在于上一步語義理解的結(jié)果是否正確,如果正確,再對(duì)特征值進(jìn)行判斷、分類。首先是場(chǎng)景分類,如“天氣”、“時(shí)間”、“業(yè)務(wù)”等,根據(jù)用戶不同的語言,首先定位到相應(yīng)的場(chǎng)景,在根據(jù)不同場(chǎng)景的特征值進(jìn)行相應(yīng)的答復(fù)。例如“今天福州天氣如何”這句話,先定位到天氣場(chǎng)景,此場(chǎng)景可以設(shè)置兩個(gè)特征值:時(shí)間、地點(diǎn)。如果一句話的關(guān)鍵詞不足,則可以給予應(yīng)答,讓用戶給出另一特征值。例如“今天天氣如何”或“福州天氣如何”,可以應(yīng)答“請(qǐng)問你想知道今天哪里的天氣”或“請(qǐng)問您想知道福州哪一天的天氣”。如果此場(chǎng)景特征值滿足條件,即可向云端天氣查詢接口訪問數(shù)據(jù),給出當(dāng)天實(shí)時(shí)的天氣數(shù)據(jù)。
語音合成。語音合成的基本結(jié)構(gòu)可分為語言學(xué)處理、韻律處理和聲學(xué)處理三大模塊[3]。首先要根據(jù)聲學(xué)原理提前將全部漢字的聲母和韻母進(jìn)行錄音,存放在數(shù)據(jù)庫當(dāng)中。接著對(duì)要回答的文字進(jìn)行語言學(xué)處理,拆分成聲母和韻母之后,對(duì)應(yīng)到數(shù)據(jù)庫中的音頻數(shù)據(jù)。再對(duì)要回答文字進(jìn)行情感判斷,這一步可以在語義理解中進(jìn)行。判斷出文字的感情后,對(duì)回答的文字進(jìn)行處理,例如“開心”的情感可以進(jìn)行升調(diào),“難過”的情感可以進(jìn)行降調(diào)。這樣即完成了文本到語音的轉(zhuǎn)換過程。
觸摸屏交互。在人機(jī)交互系統(tǒng)中,還有一種常見交互手段便是觸摸屏交互,可以發(fā)現(xiàn)目前市場(chǎng)上大部分手機(jī)都是使用觸摸屏交互,可見該項(xiàng)交互手段的實(shí)用價(jià)值。對(duì)于電力營(yíng)業(yè)廳的業(yè)務(wù)咨詢,如果采用語音交互與觸摸屏交互的結(jié)合,可以更好引導(dǎo)用戶進(jìn)行交互。例如用戶問“我想要裝電表”,通過語音交互技術(shù)給予用戶回答“請(qǐng)問你想咨詢新裝電表業(yè)務(wù)的哪些內(nèi)容”,接著在屏幕上給出該業(yè)務(wù)內(nèi)容的子選項(xiàng)“申請(qǐng)材料”、“辦理流程”、“相關(guān)費(fèi)用”等,可供用戶觸屏點(diǎn)擊查詢。兩種交互手段的結(jié)合,能更好提升交互效率。整體的交互流程如圖1所示。
人機(jī)交互技術(shù)目前發(fā)展火熱,應(yīng)用前景也是無限的,隨著互聯(lián)網(wǎng)的信息爆炸性增長(zhǎng),該技術(shù)將為經(jīng)濟(jì)管理、醫(yī)藥衛(wèi)生、電子銷售、網(wǎng)絡(luò)等領(lǐng)域提供極大的便利。如何將該技術(shù)應(yīng)用到各個(gè)領(lǐng)域的實(shí)踐中去也是人們需要思考和探索的一個(gè)方向。
參考文獻(xiàn):
[1] 何湘智.語音識(shí)別的研究與發(fā)展[J].計(jì)算機(jī)與現(xiàn)代化,2002(3):3-6.
[2] 陳林,楊丹,趙俊芹.基于語義理解的智能搜索引擎研究[J].計(jì)算機(jī)科學(xué),2008,35(6):152-154.
[3] 黃南川,鄧振杰,王嵬嵬,等.語音合成技術(shù)的研究與發(fā)展[J].北華航天工業(yè)學(xué)院學(xué)報(bào),2002,12(3):37-39.endprint