基于多通道交互的智能助手產(chǎn)品設(shè)計研究

2020-08-28 17:20:21陶晶馮奇

工業(yè)設(shè)計 2020年7期

陶晶　馮奇

摘要：近年來，越來越多的智能助手滲透到人們的工作和生活之中。本文從多通道交互的角度出發(fā)，分析了智能助手類產(chǎn)品的國內(nèi)外發(fā)展現(xiàn)狀，并對此類產(chǎn)品的多通道交互進行設(shè)計分析，主要從語音交互、視覺交互、手勢和體感交互的三個方式分別論述，在此基礎(chǔ)上總結(jié)并提出基于多通道交互的智能助手產(chǎn)品設(shè)計策略，旨在提升產(chǎn)品的使用體驗，期望推動智能助手產(chǎn)品的更好發(fā)展。

關(guān)鍵詞：多通道交互;智能助手;產(chǎn)品設(shè)計

中圖分類號：TB472 文獻標識碼：A

文章編碼：1672-7053（2020）07-0030-02

當前，國內(nèi)的家庭智能助手行業(yè)發(fā)展迅猛。隨著AioT（人工智能物聯(lián)網(wǎng)）技術(shù)的創(chuàng)新與發(fā)展，利用人工智能和大數(shù)據(jù)實現(xiàn)智能產(chǎn)品的主動智能，即更加主動、自然地為人們地生活提供便捷服務，提升用戶的交互體驗，進而改變?nèi)说纳罘绞剑蔀榱酥悄苤之a(chǎn)品發(fā)展的重要方向。

1多通道交互概述

多通道交互是指在人和計算機或機器之間信息傳遞的通道有兩種或兩種以上，包括了多種的交互技術(shù)，比如眼動、語音、體感等等。它基于“以人為中心”的設(shè)計思想，往往綜合使用多種信息輸入和輸出通道，以達到人機交互高效自然的目的。二十世紀八十年代以來，多通道交互已經(jīng)成為學科領(lǐng)域的重要研究對象，MIT Media Lab的“多通道自然對話”項目，就是致力于研究多個信息轉(zhuǎn)遞通道的整合，減少單一通道產(chǎn)生的指令歧義，讓用戶能夠以相對自然和高效的方式來進行人機之間的交互。俄勒岡研究院開發(fā)的“QuickSet”地圖操作系統(tǒng)，用戶可以通過語音和繪制草圖的兩種方式向系統(tǒng)輸入信息，并且可以多人系統(tǒng)操作，研究證實多種輸入技術(shù)的融合提高了交互系統(tǒng)的魯棒性。CMU交互系統(tǒng)實驗室的Interact項目主要研究人機通信交互的改善，整合了語音、手勢、眼動、表情識別等技術(shù)，在多通道交互界面方面取得了很多成果。

2國內(nèi)外智能助手產(chǎn)品現(xiàn)狀

智能助手最早可以追溯到2011年蘋果發(fā)布Siri，Siri實現(xiàn)了語音識別和理解，并做出回答和完成相應服務。之后各大公司緊隨其后，2014年11月，亞馬遜發(fā)布Echo，Echo是一款軟硬件結(jié)合的智能音箱，通過語音操作可以完成音樂播放、天氣查詢、鬧鈴等功能?！叭蚴讉€家庭社交機器人”的Jibo也于同年上線，這款產(chǎn)品能夠講故事、聊天，也可以拍照和做日程提醒。

國內(nèi)的智能助手類產(chǎn)品研究以百度、阿里等互聯(lián)網(wǎng)公司為主。比如現(xiàn)在快速進入人們生活的小度、小愛、天貓精靈等智能藍牙音箱類產(chǎn)品，它們主要是通過語音對話實現(xiàn)智能家居互聯(lián)控制、播放音樂、語音購物等功能;阿爾法蛋系列智伴型機器人則是針對兒童教育的人工智能學習助手類產(chǎn)品，主要功能有資料查詢、智能伴讀、語音提醒等等。

以上國內(nèi)外主要的智能助手類產(chǎn)品，根據(jù)產(chǎn)品的物理形態(tài)可以分為軟件式智能助手和硬件式助手，其中軟件式智能助手有Siri、小娜、Olivia等（見圖1）;硬件式助手有亞馬遜Echo智能音箱、Jibo家用機器人、天貓精靈等（見圖2）。相較于硬件助手，軟件式助手的使用場景要更廣泛，而硬件式助手的直觀性和多通道交互也是軟件式助手無法取代和超越的。

3智能助手產(chǎn)品的多通道交互分析

隨著人工智能的技術(shù)的開發(fā)應用，人機交互的發(fā)展趨向更自然和更富有情感體驗，語音交互、視覺交互、手勢交互等新型交互模型也不斷升級。

3.1語音交互

對于用戶來說，語音交互的學習成本最低，并且在很多場景下能夠解放雙手提高工作效率。在銀行、醫(yī)院、機場等公共區(qū)域，服務型機器人越來越多地出現(xiàn)在人們的視野中，主要通過語音問答的方式來向用戶提供各項服務，如百度AI（人工智能）交互設(shè)計院人機探索實驗室于2019年7月發(fā)布的NIRO-Max公共服務機器人，這款產(chǎn)品又被稱為“現(xiàn)實版大白”，主要從感官體驗層和使用體驗層這兩個方面促使用戶形成固定的使用習慣。當使用場景變換到家居室內(nèi)，智能助手類的產(chǎn)品提供的服務更加多樣，用戶可以對話產(chǎn)品來聽音樂、查天氣、完成家務等等，通過產(chǎn)品的語言能力，人們可以最直觀地感受到人工智能為生活帶來的便利。從技術(shù)層面看，語音交互的過程就是在信息輸入節(jié)點將用戶的語音信息轉(zhuǎn)化為文本，計算機對文本進行語義理解并對應觸發(fā)不同的服務、信息等，并通過語音合成模塊合成人聲反饋到用戶，對應到的交互模型就是“用戶喚醒——產(chǎn)品響應——信息輸入——信息理解——產(chǎn)品行動或者回答”。在語音交互中，用戶通過語音對話的方式來實現(xiàn)產(chǎn)品的具體功能，這就需要設(shè)計師在設(shè)計過程中積累大量功能場景中的對話腳本，應對產(chǎn)品在實際使用的過程中會遇到的各種使用狀況。對于設(shè)計師來說，如何搭建起技術(shù)與用戶之間的橋梁是首要任務，讓技術(shù)更好地服務于用戶并且使用戶獲得更好的使用體驗。

3.2視覺交互

用戶在使用產(chǎn)品的過程過，人機交互的大部分的信息是通過視覺來傳達，視覺交互是交互方式中最簡便直觀的。隨著技術(shù)發(fā)展消費升級，用戶不再滿足智能產(chǎn)品的視覺交互中僅僅呈現(xiàn)傳統(tǒng)的文字、圖像之類的實用功能信息。通過觀察發(fā)現(xiàn)，在人們與智能助手產(chǎn)品進行交互的過程中，用戶往往會走到與智能助手距離1.5米～2米時才開始說話，并且在對話過程中，人們會不自覺地觀察智能助手，特別是在喚醒或喚醒任務時，人們會期待智能助手除聲音之外的更多反饋，比如燈光或界面。如亞馬遜alexa語音助手，它在回答用戶時產(chǎn)品頂部的環(huán)形燈光也會隨之發(fā)生變化，配合音量和內(nèi)容發(fā)生變化律動。針對現(xiàn)在的交互產(chǎn)品趨勢，重視產(chǎn)品視覺設(shè)計的交互行和情感體驗，才能使產(chǎn)品與人的互動更加多元化并滿足用戶的內(nèi)在需求。

3.3手勢和體感交互

肢體語言也是自然狀態(tài)下人與人之間傳達信息的重要途徑之一。產(chǎn)品與用戶之間同樣存在動作交互，此類動作可以分為接觸式交互和非接觸式交互。接觸式交互最為常見的就是人們在手機上的點擊、滑動等等手勢操作。非接觸式交互比如墨跡空氣果，用戶通過揮手進行頁面切換，操作過程用與產(chǎn)品不發(fā)生直接接觸，這樣的交互方式相較于點擊具體的物理按鈕或者在屏幕上點觸對于用戶來是低成本的，也是更樂于接受的。產(chǎn)品的動作交互主要通過體感技術(shù)來實現(xiàn)，通過對用戶動作的精準捕捉和功能設(shè)計，帶來的式產(chǎn)品體驗的突破創(chuàng)新。

4基于多通道交互的智能助手產(chǎn)品設(shè)計策略

4.1以用戶為中心

多通道交互設(shè)計的根本內(nèi)容是通過多重信息傳輸通道使得人機交互過程更加自然和高效，智能助手產(chǎn)品的多通道交互設(shè)計的目的就是讓用戶能夠更加自然地和產(chǎn)品對話，以及來滿足生活中的不同訴求，讓智能助手更加貼心好用。這就需要設(shè)計師在設(shè)計智能助手產(chǎn)品時運用定性定量結(jié)合的方法進行用戶研究，定性研究主要通過用戶訪談、焦點小組的方式直接收集用戶在使用同類助手產(chǎn)品時的使用行為和體驗反饋，定量研究則是通過問卷調(diào)查、數(shù)據(jù)分析之類的方法間接收集用戶的使用行為和體驗反饋。在調(diào)研中從“用戶做了什么”分析用戶行為，從“用戶說了什么”分析用戶的態(tài)度，通過對細分用戶繪制用戶畫像及用戶旅程圖，通過用戶的情感曲線發(fā)現(xiàn)痛點并提取需求，總結(jié)出設(shè)計的可能性。

4.2重塑人與環(huán)境的適應關(guān)系

從交互設(shè)計發(fā)展的三階段來看，最早的命令用戶界面需要用戶記住復雜繁多的代碼指令，而后發(fā)展到用戶使用鼠標點擊隱喻的圖形界面訪問目標內(nèi)容，再到自然界面的多通道交互。AI（人工智能）技術(shù)不斷發(fā)展、感應設(shè)備技術(shù)也不斷升級，智能產(chǎn)品設(shè)計的趨勢從用戶的主動學習轉(zhuǎn)向環(huán)境的主動調(diào)整。多通道交互意味著技術(shù)的進步并不是為了提高用戶使用產(chǎn)品的學習成本和負擔，而是給用戶更真實的體驗感。

4.3細分場景和操作任務

多通道交互過程中，用戶可以通過語音、手勢、表情等等向產(chǎn)品表達信息，同樣產(chǎn)品可以通過音頻、燈光、圖形界面等等反饋信息給用戶，每個信息傳遞的通道都有各自的特點和信息傳遞的上限，所以真正的多通道交互一定是整合的，這個時候細分場景和操作任務就成了多通道交互設(shè)計的關(guān)鍵。在不同的場景下，具體完成某個操作任務的過程中，運用哪個通道的信息傳遞效率最高、用戶的學習成本最低，還是結(jié)合哪幾個通道能夠更有效率的完成任務，是多通道交互設(shè)計的重要研究內(nèi)容，細分場景和操作任務能夠有效地滿足信息傳遞的指派性和互補性。

5結(jié)語

將多通道交互引入到智能助手的設(shè)計中，通過具體分析視覺、聽覺、觸覺等多通道的交互模型有助于提升產(chǎn)品的可用性，彌補當下智能產(chǎn)品市場中以功能需求為導向而對用戶體驗的忽視。在新技術(shù)背景下對智能助手的交互系統(tǒng)的探索與發(fā)展，為技術(shù)更好地服務人們生活提供更新、更優(yōu)的設(shè)計方案。