(北京市第五十七中學,北京 100036)
隨著時代的發(fā)展,越來越多的人選擇獨居,中國獨居人口已經(jīng)到達2億。同時人口老齡化問題也在加劇,這使得家庭陪伴型機器人需求量大,希望它有更強的功能,甚至可以媲美人類,來解決更多人孤獨的問題。
但是當今的家庭陪伴型機器人的能力不足,僅僅能夠與人一問一答,甚至有時“所答非所問”。這使得人們對于家庭陪伴型機器人的發(fā)展更加迫切?,F(xiàn)在的機器人沒有達到能真實了解人類情感并做出反應,以達到解決人類心理問題的水平。
本文主要是整合了現(xiàn)存相關(guān)的部分資料,設想了理想的家庭陪伴型機器人的模型,由于現(xiàn)存的家庭陪伴型機器人的技術(shù)發(fā)展與預期水平存在一定的差距,故本文分析比較了部分急需發(fā)展的技術(shù)方向,提出了家庭陪伴機器人未來的應用需要,最后本文聚焦于智能情感陪護機器人,對未來這類機器人的技術(shù)發(fā)展表達了美好的愿景,展望了未來理想智能機器人的發(fā)展。
機器人的研究早在20世紀就已經(jīng)開始。從1920年提出“robot”這個單詞,再到1950年的阿西莫夫機器人三定律,機器人似乎早就進入人類的世界。第一屆機器人學術(shù)會議于1967年日本召開,對于機器人人們形成了以下兩類基本定義。第一是以森政弘以及合田周平給出的機器人定義:指出機器人是一種能夠自由移動的,具備智能性和通用性的半人半機器的物理個體,并提出了該定義下機器人應當符合的7個典型特征。隨著人們對機器人認識的不斷加深,森政弘在上述機器人定義的基礎(chǔ)上將原本機器人的特征擴展為10個,并強調(diào)了機器人的作業(yè)性和信息性,是對機器人認識的一大飛躍;關(guān)于早期機器人的第二類定義是由日本學者加藤一郎提出,從機器人的組成上對機器人的特征進行了概括:提出了機器人應當具備人類所具有的手、腳以及大腦等肢體結(jié)構(gòu),還應具備傳感器以回傳外界感知信號。加藤一郎所提出的機器人定義重點關(guān)注了機器人的仿生結(jié)構(gòu),即機器人應當具備與人類相似的肢體器官、感受器官和決策器官。例如,裝設于機器人上的各類傳感器相當于人的感受器官,用以獲得外界的環(huán)境信號。而機器人的平衡覺是機器人對自身認識的關(guān)鍵,這也與后來機器人概念發(fā)展的感知、規(guī)劃、行動類似[1]。但是當時的機器人也只簡單的機械臂,與現(xiàn)在的機器人也有一定的差距。關(guān)于機器人情感的研究始于麻省理工學院,該院Picard教授于1997年首次提出了情感計算的相關(guān)概念,實現(xiàn)了情感這一心理學定義的量化分析。此外,我國也早已開始了對于機器人情感的研究,中國科學院自動化研究所在機器人情感計算方面取得了一系列豐碩成果。指出情感計算是賦予計算機理解人類情感的關(guān)鍵,早期關(guān)于情感計算的研究也為后來的情感機器人奠定了基礎(chǔ)。
日本在20世紀末便開展了關(guān)于情感信息的理論研究,作為國家重點項目涵蓋了眾多大學以及研究院等相關(guān)組織和單位,將現(xiàn)代信息科學融入到純粹的心理學當中,進而發(fā)展出一系列新思想、新理論。此外,日本作為亞洲為數(shù)不多的工業(yè)體系發(fā)達的國家之一,其在情感信息產(chǎn)業(yè)化方面走在了世界前列。具備情感能力的個人機器人成為日本機器人企業(yè)的研發(fā)和推廣重點。例如,SONY公司生產(chǎn)的AIBO、QRIO型以及SDR-4X型情感機器人一時間成為機器人行業(yè)的翹楚,也令SONY公司收獲了巨大的商業(yè)回報。此外,一款名為“小IF”的機器人能夠從使用者聲音中挖掘出其中包含的情感信息,再通過與使用者對話過程中的微妙表情來進行相應的情感反饋。除日本外,美國麻省理工學院在情感計算研究方面也有作為,例如,以IBM公司 “藍眼計劃”及其開發(fā)出的“情感鼠標”就是情感計算的實際應用成果;2008年MIT的科學家們展示了一款能夠讀懂人類語言并且解讀出其中所包含的情感的機器人,它能夠通過一些面部表情以及肢體動作來向使用者反饋自身情感。上述情感功能的實現(xiàn)離不開使用者當前表情的獲取,工程師們使用了CCD(電荷耦合器件)攝像機,使得機器人能夠“看見”使用者微妙的面部表情以及肢體動作中蘊含的情感信息并進行簡單的語言識別。
現(xiàn)階段的機器人在宣傳上聲稱已經(jīng)開發(fā)完成了完全理解人類的機器人,但是目前開始面向群眾銷售的機器人也都存在一些問題。例2014年軟銀集團對外展示了和人類具備相同外形的機器人Pepper,在視頻展示中機器人準確的解讀了人類的情感信息,獲得了很好的應用效果。但是實際操作卻反映出,Pepper會規(guī)避問題,同時將話題轉(zhuǎn)移到自己已經(jīng)輸入好的對話模型中。實際就會表現(xiàn)為“所答非所問”。這也與其宣傳的自然交流有所不同?,F(xiàn)在的市場上的機器人,大部分的問題也主要是這種利用“規(guī)避問題”來解決問題。這就與人們期望中的家庭陪伴型機器人相差甚遠。這樣的機器人想通過圖靈測試確實是一件不可能完成的事情。它和人相差的太多,有時候完全理解不了人類的語言,也就無法完成家庭陪伴型機器人的目標。
情感機器人存在的目的就是為了幫助需要的人來解決心理上的問題,像前文中提到孤獨問題。它不僅能夠在日常生活中與人類正常的交流,還可以在人類存在心理問題時準確的判斷并解決。例如在悲傷時機器人可以自動地來安慰你,憤怒時幫助你壓住心中的怒火,或是消極時給予你自信。這樣才能叫做真正的情感機器人。顯然現(xiàn)在的機器人與這個理想的完美機器人差距甚大,要達到理想機器人的程度,至少要具備一下的能力:
現(xiàn)在的自然語言理解,主要是提取一句話中的關(guān)鍵字,在大數(shù)據(jù)庫中進行搜索,從而做出回答。但是事實上這句話可能與這個詞的本意毫無關(guān)聯(lián),機器人無法分析上下文與語境,導致輸出結(jié)果大相徑庭。如果在大數(shù)據(jù)庫中無法識別出類似的語言,機器人便會“規(guī)避問題”,將話題轉(zhuǎn)移到自己設定的程序中。這種投機取巧的方式看似可以與人正常自然交流,卻是毫無用處。理想中的機器人,應該能夠理解整句話的意思,通過上下文和語音語調(diào)來分析人的本意。只有擁有這樣的功能,才能夠滿足人們的需求。家庭陪伴型機器人最主要的功能是能與人交流,并且能夠達到讓擁有者不會體會到是機器人的僵硬。達到了真正的與人相同的機器人才能解決人類的孤獨感,或是給予人類心理的安慰這些高難度看似不可能的任務。這樣的機器人才能夠讓人感受到與自己交流的不是機器人,而是一個活生生的真人。
面部識別可以幫助語言的理解,從而分析人的情感,做出更準確的判斷。同一句話,在不同的情感中說出,也具有不同的意義,這時候單純的分析語言就會顯得遜色。目前到底機器人可以識別出人的6種基本表情,但是人類不會刻意的去擺出那六種基本表情來表達自己的情感。相反,人類會用更復雜更細微的表情來反映內(nèi)心,這就使現(xiàn)在的機器人略顯遜色。同樣的,機器人也只能通過識別面部的關(guān)鍵點來判斷肌肉的運動并從數(shù)據(jù)庫中找到相應的數(shù)據(jù)分析。每個人的面貌本身也有一定的區(qū)別,面部肌肉的運動程度也不盡相同,這也就表明了他的局限性之大,分析準確度便會大大降低。理想中的機器人應該能快速的識別出人類所有的表情,無論是簡單還是復雜,并且能夠應用于所有人。情感機器人的重中之重就是分析情感,家庭機器人的情感方面更不能少了情感的分析。他的目的就在于分析清楚人類的情感,判斷用什么方式來幫助人類解決情感上的問題。
要想能判斷出人類的行為意義,就需要先識別人類的肢體動作。與面部表情一樣,肢體動作的識別也是通過關(guān)鍵點的識別來分析動作。理解肢體語言能夠更好的幫助機器人判斷人類的情感狀態(tài),完成自己的工作。當人類不說話或是不露臉的情況下,機器人通過肢體動作也能完成一整套的分析加判斷,這也就是肢體動作的重要之處。
要想真正的融入人類的社會,完成預設的目標,機器人需要在各方面都與人無異。例如在語言交流方面,簡單的一問一答現(xiàn)在的機器人已經(jīng)可以初步完成。但是要想像人類一樣和人交流,那么就需要了解人類交流的具體習慣、方式、語氣等細微的方面。人類之間的交流當然不是簡單的一問一答,可能會根據(jù)聊天內(nèi)容延申,探討最近發(fā)生的事或是身邊的東西。目前的機器人也只是會強硬突兀的改變話題以達到自己“規(guī)避問題”的目的。也可能會使用復雜的語言形式,或是流行用語等。這些都需要機器人自主去學習,真正的了解人類交流的方式。
理想機器人所應該具有至少這些的能力。家庭陪伴型機器人主要的任務就是陪伴人類,幫助解決人類心理上的孤獨。所以其最重要的功能就是要識別人類的語言,然后像人與人之間交流一樣能夠讓人感受到與他對話的不是機器人,這也是最基本的要求。面部識別和肢體動作識別來輔助機器人,讓它有更好的判斷能力,以完成任務。而自我學習能力則完全能夠幫助機器人達到成為真正的人,能夠和人正常的交流。所以自主學習能力事重中之重。有了自主學習能力,機器人便能更好的做出自己的判斷和行動、可以在任何時間地點做出最合適的方案用于實施。
機器人在與人類交流時,需要通過語言識別、面部識別、肢體動作識別來判斷人類的情感和需要自己如何去做。這一系列的任務被細化為感知、規(guī)劃、行動3個步驟。我也將把3種識別分條論述。
(1)在語言交流中,機器人首先需要通過麥克風來感知人類的語言,判斷出人類的指令和目的。接下來規(guī)劃自己的回答語言和方式,選擇最合適的答案。行動就是將選擇好的回答方案說出。這樣的感知、規(guī)劃、行動的多次循環(huán)就成了完整的交流。但是如果僅僅是簡單的一問一答,那就又會變成最初的簡單機器人。機器人在語言方面中最重要的就是規(guī)劃能力,通過自主學習人類的對話后,能夠做出延伸話題,反問,或是利用比喻等高級的語言形式。這樣的機器人才能夠達到我們預設的目的。
(2)在面部識別中,最重要的則是感知模塊。因為每個人的臉型都不盡相同,所以感知的難度也大大增加。相同的,如果人戴上帽子或是口罩的話,難度就有會提升。所以在感知之前就需要先給對象進行面部掃描,減少臉型帶來的影響。而有遮擋物的情況下,可以識別的區(qū)域減少,這時候可能就需要此人之前的面部表情來對比,以增加精準度。在識別完成后,判斷出人類的心情,行動反饋給語言模塊,讓語言更加的合適。
(3)肢體動作識別與面部識別相似,其目的也是為了能夠更好的識別出人類的心理活動,從而達到合適的交流。感知人類的位置和四肢的活動。可能人類突然上前,其心理有可能是憤怒,可能是喜悅。這就需要加上四肢的活動來判斷人類的真實情感。
當前機器人與理想機器人之間還是有很大差距。當前機器人在語言方面上主要問題在于無法準確識別出人類的語言。其表現(xiàn)為不能理解人類的問題,導致回答錯誤的答案。或是直接強硬的轉(zhuǎn)移話題,將對話轉(zhuǎn)移到自己固有的程序上面。這樣的機器人肯定無法完成和人正常的交流。面部識別和肢體動作識別同樣也有不準確的問題,導致機器人整體實力不如理想的機器人。例如pepper機器人,它可以與你進行程序上設定好的語言交流,卻不能完成程序外的語言交流任務。并且會生硬的將話題轉(zhuǎn)移到自己設定的程序上面,體現(xiàn)出機器人的自我規(guī)劃能力的缺失。就如同一臺會說話的電腦一般,只有人類向他輸入設定的程序,他才會按照程序給予反饋。這樣的家庭陪伴型機器人顯然與理想的機器人有很大的差距。
家庭陪伴型機器人有著良好的前景,它不僅可以與人類交流,也可以幫助人們解決心理上的問題。陪護型機器人占比已經(jīng)達到了機器人中的最高,同時機器人的發(fā)展也會向家庭陪伴型機器人靠攏。家庭陪伴型機器人有廣大的前景在于它可以開發(fā)加入更多的功能來服務人類。例如攝影,教育,規(guī)劃日程等功能。最大的可能便是成為家庭的健康助手,幫助人們完成健康管理。這樣,家庭陪伴型機器人不僅在硬實力方面可以做好人類的科技助手,在軟實力方面也可以與人類交流談心。但是在軟實力方面,當前的機器人確實不夠強大,難以達到我們所預想的程度,所以發(fā)展更好的語言識別、分析等技術(shù)十分迫切。
情感機器人有著廣大的發(fā)展空間,在現(xiàn)有的技術(shù)上還應更加精確、更加細化。雖然現(xiàn)在的機器人技術(shù)還未達到理想的效果,但是在充分研究了機器人的漏洞和缺點后,我相信在不久的將來能夠研發(fā)出我們理想中的機器人。未來的機器人不僅僅在外貌上與人無異,同時在交流上也可以達到人類的水平。甚至你在和別人面對面的交流過程中根本發(fā)現(xiàn)不了對面是機器人的事實。未來的機器人可以察言觀色,一點細微的動作機器人就能理解你心中的想法,幫助你完成目標。這就是未來機器人的雛形,他與人無異,可以說就是一個真正的人。