張承業(yè) 張憲民
摘要:首先回顧了人機(jī)交互模式的變革史,并從5個方面討論了人工智能對人機(jī)交互的影響,分析了智能人機(jī)交互形式、技術(shù)缺陷及應(yīng)用挑戰(zhàn),提出人工智能時(shí)代對人機(jī)交互未來發(fā)展的討論和思考。
關(guān)鍵詞:人機(jī)交互;人工智能;自然交互;技術(shù)挑戰(zhàn)
中圖分類號:TH122;TP274 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2018)05-0206-02
人機(jī)交互技術(shù)作為人與計(jì)算機(jī)之間信息交流的接口,是推動計(jì)算機(jī)產(chǎn)業(yè)發(fā)展的關(guān)鍵因素之一。智能化時(shí)代,交互無處不在,人的智能與機(jī)器智能共同發(fā)展,擴(kuò)展了交互設(shè)計(jì)的廣度和維度,對人機(jī)交互能力提出了新的挑戰(zhàn)。由于缺少與新時(shí)期智能交互需求相適應(yīng)的、高效的交互界面,及成熟統(tǒng)一的交互技術(shù)[1],目前人機(jī)交互能力和交互效率仍停留在較低的水平,并沒有隨著人工智能時(shí)代的發(fā)展得到相應(yīng)的提高。為了應(yīng)對智能時(shí)代的挑戰(zhàn),把握智能時(shí)代人機(jī)交互技術(shù)發(fā)展的新機(jī)遇,實(shí)現(xiàn)交互技術(shù)的跨越式發(fā)展。本文首先回顧了人機(jī)交互模式的發(fā)展變革史,分析了人工智能對人機(jī)交互的影響,總結(jié)了智能人機(jī)交互的技術(shù)缺陷及應(yīng)用挑戰(zhàn),最后對人工智能時(shí)代人機(jī)交互未來發(fā)展進(jìn)行了討論和思考。
1 人機(jī)交互模式的變革
人機(jī)交互關(guān)注用戶與系統(tǒng)(計(jì)算機(jī))之間的信息交換,包括用戶到系統(tǒng)和系統(tǒng)到用戶的信息交換兩部分。人機(jī)交互模式的發(fā)展史,是“以計(jì)算機(jī)為中心”到“以用戶為中心”的發(fā)展過程,就交互形式而言共經(jīng)歷了以下幾個階段:
(1)基于鍵盤與命令語言交互階段。交互界面采用命令語言驅(qū)動操作,專業(yè)性強(qiáng),只能通過操作鍵盤來輸入數(shù)據(jù)和命令信息,界面輸出為靜態(tài)字符。交互邏輯與流程復(fù)雜,拷貝粘貼等關(guān)鍵操作未簡化,易出錯,只能完成單線程的單一任務(wù)。這一階段確定了QWERTY的鍵盤布局并沿用至今。(2)基于鼠標(biāo)和圖形用戶界面的交互階段。伴隨著圖形界面技術(shù)的發(fā)展,逐漸形成了WIMP界面,并引入鼠標(biāo),解決了精確定位、快速切換的難題。以超文本標(biāo)記語言HTML及超文本傳輸協(xié)議HTTP的網(wǎng)絡(luò)瀏覽器為特征,所形成的網(wǎng)絡(luò)用戶界面,成為當(dāng)前Internet的支柱。(3)基于多點(diǎn)觸控技術(shù)的觸屏交互。伴隨著移動互聯(lián)網(wǎng)及微型電腦產(chǎn)品的普及,基于圖形用戶界面的多點(diǎn)觸控交互技術(shù)的出現(xiàn)豐富了交互場景,解決了小屏設(shè)備界面利用率及隨時(shí)隨地交互的問題。此時(shí)交互設(shè)計(jì)以功能為中心,關(guān)注用戶體驗(yàn)和用戶情感。(4)多通道、多模態(tài)的自然交互階段。物聯(lián)網(wǎng)的發(fā)展,人機(jī)交互形式多樣并出現(xiàn)融合交叉,逐漸回歸“以用戶為中心”的初心,參與式設(shè)計(jì)與眾創(chuàng)模式成為主流,交互界面依賴于大數(shù)據(jù)、物聯(lián)網(wǎng)及人工智能進(jìn)行創(chuàng)新與精簡[2],并出現(xiàn)了多種形式,如NUI自然交互界面、TUI實(shí)體交互界面[4]、可穿戴計(jì)算等。
人機(jī)交互及交互界面技術(shù)的發(fā)展伴隨著人工智能波動與繁榮直至爆發(fā),但受限于計(jì)算機(jī)科學(xué)發(fā)展水平,在很長一段時(shí)間內(nèi),人機(jī)交互以適應(yīng)機(jī)器為主,各種編程語言、輸入法、數(shù)據(jù)輸入設(shè)備等就是例證。隨著技術(shù)和情境的發(fā)展變化,現(xiàn)存交互形式已不再適應(yīng)要求,人們越來越追求體驗(yàn)和高效、自然和無感,回歸人機(jī)交互技術(shù)的初心,讓計(jì)算機(jī)服務(wù)并適應(yīng)人類的需要,而不是強(qiáng)求人類去適應(yīng)計(jì)算機(jī)。人工智能的繁榮與爆發(fā),為人機(jī)交互技術(shù)的更迭提供了可能。
2 人工智能對人機(jī)交互的影響
人工智能的出現(xiàn)促進(jìn)了傳統(tǒng)人機(jī)“輸入-反饋”循環(huán)向“推薦-選擇”循環(huán)的過渡。人機(jī)交互關(guān)系由“單向從屬”向“雙向訓(xùn)練”過渡。這種改變將重寫交互設(shè)計(jì)的設(shè)計(jì)思維、架構(gòu)、形式、流程、規(guī)范等。
(1)對交互設(shè)計(jì)思維的突破。人工智能連接工程師、設(shè)計(jì)師和用戶的心智模型,能夠靈活根據(jù)交互的方式與內(nèi)容,在目標(biāo)、動機(jī)、條件與結(jié)果之間達(dá)成最優(yōu)解決方案。根據(jù)功能目標(biāo)確定交互行為模式,映射匹配出各種人機(jī)、人際、人事、人境的交互場景,達(dá)到場景化的目標(biāo)最優(yōu)路徑。而后根據(jù)用戶的體驗(yàn)反饋,分析優(yōu)化和測試改進(jìn)交互流程與交互體驗(yàn)結(jié)果,形成新的人機(jī)共生關(guān)系[2]。(2)對信息架構(gòu)的優(yōu)化。GUI時(shí)代,信息架構(gòu)由頁面和流程決定。當(dāng)信息量不斷增加,信息的展現(xiàn)需要更多的頁面來承載,導(dǎo)致了信息架構(gòu)的層級和流程變得復(fù)雜,增加了用戶的使用成本。人工智能時(shí)代,可以利用語音輸入以特定關(guān)鍵詞進(jìn)行信息搜索和功能觸發(fā),使信息流獲取的準(zhǔn)確性大幅度提高,產(chǎn)品不再需要復(fù)雜的架構(gòu)來承載不同內(nèi)容,可極大提高用戶的交互效率,并具有高兼容性和擴(kuò)展性,為原有信息架構(gòu)賦予了活力和流動性。(3)對交互界面的擴(kuò)展。隨著可穿戴設(shè)備和物聯(lián)網(wǎng)技術(shù)的發(fā)展,萬物得以數(shù)字化形式展現(xiàn),并均可能作為人機(jī)交互界面的一部分,成為人機(jī)交互的媒介,交互界面不再局限于GUI,會呈現(xiàn)不同的形式,實(shí)現(xiàn)從“有形”設(shè)計(jì)到“無形”設(shè)計(jì)的改變。(4)對交互流程的改變。一個完整的交互設(shè)計(jì)過程中的步驟主要分為:用戶調(diào)研、概念設(shè)計(jì)、創(chuàng)建用戶模型、創(chuàng)建界面流程、開發(fā)原型以及用戶測試、實(shí)現(xiàn)、統(tǒng)測試。人工智能可以分析設(shè)計(jì)過程及各階段的任務(wù),尋求符合科學(xué)規(guī)律和設(shè)計(jì)效率的最優(yōu)解,通過深入剖析人的思維模式,能夠以直接、精確的方式獲得符合人類體驗(yàn)愿景的交互設(shè)計(jì)。(5)對交互形式的顛覆。當(dāng)前人機(jī)交互多屬于近場、接觸式實(shí)體交互,用戶通過移動、點(diǎn)擊、觸控等實(shí)體操作形式進(jìn)行信息的輸入,當(dāng)脫離計(jì)算機(jī)或輸入設(shè)備時(shí)信息輸入則無法完成。人工智能技術(shù)的發(fā)展拓展了信息輸入的距離和空間,如近場交互中,除了實(shí)體操作,語音、圖像等形式同樣有效;而在中遠(yuǎn)場景的交互中,語音、動作成為了信息輸入的第一選擇,并逐漸成為重要的輸入方式之一。
人機(jī)交互趨勢,是從無序到有序、從數(shù)據(jù)到語義、從線下到線上、從精確到非精確、從機(jī)械到自然。人工智能技術(shù)的應(yīng)用,可以將一些模糊和用戶行為習(xí)慣識別為具體、準(zhǔn)確的交互意圖,隨著人工智能技術(shù)的進(jìn)步,人類可以用自然的方式和機(jī)器進(jìn)行交互,而不是被迫去適應(yīng)機(jī)器,重新建立一套與機(jī)器對話的語言。
3 智能人機(jī)交互技術(shù)缺陷及應(yīng)用挑戰(zhàn)
3.1 智能人機(jī)交互技術(shù)形式
智能人機(jī)交互技術(shù)簡言之是能夠?qū)崿F(xiàn)類人的“能聽會說、自然交互、有問必答”能力的綜合技術(shù),涉及自然語言處理、語義分析和理解、知識構(gòu)建和自學(xué)習(xí)能力、大數(shù)據(jù)處理和挖掘等技術(shù)領(lǐng)域,同時(shí)包括整合多種信息承載形式(如文字、語音、體感等)的通信和識別等能力。
就表現(xiàn)形式而言,可概括為多通道、多媒體的智能人機(jī)交互,如手勢識別、姿勢識別、語言識別、表情識別、眼部識別、情感識別等。是一種依靠人類本能與機(jī)器進(jìn)行“無感”交互的技術(shù)形式,以人為中心,關(guān)注體驗(yàn)和意識。
盡管智能人機(jī)交互技術(shù)已逐漸在智能硬件、可穿戴設(shè)備、智能家居、物聯(lián)網(wǎng)等領(lǐng)域展開應(yīng)用,但總體來說仍存在很多的不足。
3.2 當(dāng)前智能人機(jī)交互的技術(shù)現(xiàn)狀
深度神經(jīng)網(wǎng)絡(luò)的應(yīng)用使得語音識別、人機(jī)對話、機(jī)器翻譯、手勢檢測與跟蹤、等領(lǐng)域技術(shù)得到了快速發(fā)展和應(yīng)用,如情感識別的結(jié)果僅比專業(yè)人士相差10%,語音識別的準(zhǔn)確率已接近人類水平,而圖像目標(biāo)識別已超過普通人類辨識水平。但要像人一樣“能聽會說,善解人意”,仍有大量技術(shù)難題待攻破。如在完全自然的口語識別及方言識別方面,語音識別準(zhǔn)確率還很不理想;智能硬件產(chǎn)品存在“沒聽清、聽不懂、不聰明”問題;智能家居不“智能”,用戶激活率不足20%;而被認(rèn)為最直觀、自然的多通道人機(jī)交互,由于其信息表達(dá)的豐富性和模糊性,很難準(zhǔn)確映射為人機(jī)交互的界面操作,導(dǎo)致能以準(zhǔn)確理解用戶的意圖。究其原因,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、自然語言理解、語義理解、人機(jī)對話、需求預(yù)測、數(shù)據(jù)挖掘等技術(shù)尚處于早期,在足夠智能之前,智能水平與用戶體驗(yàn)、可靠性存在矛盾。
3.3 應(yīng)用挑戰(zhàn)
(1)使用范圍有限。盡管有新興交互方式的嘗試,但大多數(shù)交互方式的使用率不高,未形成普及化的商業(yè)應(yīng)用,更沒有達(dá)到無障礙、隨心所欲溝通的水平。如體感交互目前只應(yīng)用于游戲領(lǐng)域,動作捕捉交互方式更多應(yīng)用于電影制作領(lǐng)域。(2)仍未擺脫界面交互,體驗(yàn)性差。雖然觸摸交互漸成主流,但仍需用戶精確輸入,對用戶而言費(fèi)神費(fèi)力。如特斯拉配備的中控大屏在操作時(shí)易造成開車過程中的分心。同時(shí)多數(shù)智能人機(jī)交互產(chǎn)品的用戶界面仍未脫離GUI的思維束縛,而超越傳統(tǒng)GUI、能與用戶及環(huán)境進(jìn)行主動感知和交互的界面設(shè)計(jì)仍未出現(xiàn)。(3)改變用戶習(xí)慣較困難。應(yīng)用新技術(shù)開發(fā)新的交互平臺具備其合理性,但忽視與已建立操作習(xí)慣的一致性,或增加用戶的學(xué)習(xí)成本,會給用戶帶來極大的困擾。如代碼界面到圖像界面,單點(diǎn)觸控到多點(diǎn)觸控等的習(xí)慣跨越歷程。
4 未來人機(jī)交互的發(fā)展趨勢及應(yīng)用熱點(diǎn)
當(dāng)前移動互聯(lián)網(wǎng)、虛擬現(xiàn)實(shí)、普適計(jì)算等飛速發(fā)展,對人機(jī)交互技術(shù)提出了新的調(diào)整和更高的要求,人機(jī)交互研究內(nèi)容也從精確到非精確、從功能到場景、從交互轉(zhuǎn)向?qū)嵺`。未來的人機(jī)交互,將會演變成“交互人”和“智能機(jī)”在物理空間、數(shù)字空間及社會空間等不同空間上的交互[5]。人作為人機(jī)交互的核心,將隨著技術(shù)的發(fā)展與交互設(shè)備融為一體。計(jì)算機(jī)的主要交互行為將變成感知行為,感知場景、人的行為及相關(guān)屬性,形成物理世界的“直覺”,從而實(shí)現(xiàn)為人類服務(wù)。
未來,人與機(jī)器的交互,將從外在互動轉(zhuǎn)向情感交流,所有操作性設(shè)備融入智能空間內(nèi),傳感與交互無處不在,而融合人工智能、大數(shù)據(jù)的云計(jì)算平臺使得人機(jī)交互系統(tǒng)越來越聰明、越來越人性化,會是一種沒有交互的“交互”。
5 結(jié)語
人機(jī)交互技術(shù)是當(dāng)前信息產(chǎn)業(yè)競爭的焦點(diǎn),各國紛紛將其列為重點(diǎn)發(fā)展的信息技術(shù)之一。人工智能時(shí)代,以人為中心、自然、高效等特征將是下一代人機(jī)交互系統(tǒng)的主要目標(biāo)特性。隨著技術(shù)的突破,人機(jī)交互領(lǐng)域必將實(shí)現(xiàn)跨越式發(fā)展,也必將影響整個人類發(fā)展史。
參考文獻(xiàn)
[1]Hewett T T, Baccker R, Card S, etal. ACM SIGCHI Curricula for Human-Computer Interaction. New York: ACM, 1992.
[2]覃京燕.人工智能對交互設(shè)計(jì)的影響研究[J].包裝工程,2017,38(20):27-31.
[3]郝凝輝,魯曉波.實(shí)體交互界面設(shè)計(jì)的方法思辨[J].裝飾,2014,(2):34-37.
[4]林應(yīng)明,董士海.多通道融合算法和軟件平臺的實(shí)現(xiàn)[J].計(jì)算機(jī)學(xué)報(bào),2000,23(1):90-94.
[5]范俊君,田豐,杜一,等.智能時(shí)代人機(jī)交互的一些思考[J].中國科學(xué),2018,48(4):361-375.