李之齊 浙江理工大學(xué)
在《人工智能標(biāo)準(zhǔn)化白皮書(2018)》中人工智能是這樣定義的人工智能是利用數(shù)字計算機或者數(shù)字計算機控制的機器模擬、延伸和擴(kuò)展人的智能,感知環(huán)境、獲取知識并使用知識獲得最佳結(jié)果的理論、方法、技術(shù)及應(yīng)用系統(tǒng)。人工智能學(xué)者們致力于設(shè)計更加先進(jìn)的算法和系統(tǒng)以模擬甚至延展人腦的智能,借助傳感器等器件產(chǎn)生對外界環(huán)境(包括人類)進(jìn)行感知,甚至可以像人一樣通過聽覺、視覺、嗅覺、觸覺等接收來自環(huán)境的各種信息,對外界輸入產(chǎn)生文字、語音、表情、動作(控制執(zhí)行機構(gòu))等必要的反應(yīng)。借助于按鈕、鍵盤、鼠標(biāo)、屏幕、手勢、體態(tài)、表情、力反饋、虛擬現(xiàn)實/ 增強現(xiàn)實等方式,人與機器間可以產(chǎn)生交互與互動,使機器設(shè)備越來越“理解”人類乃至與人類共同協(xié)作、優(yōu)勢互補。而心理學(xué)則是在研究人類本身的知覺,感覺,記憶,情緒,情感等心理機制,探討意識與行為的之間的聯(lián)系,從某個角度來看,心理學(xué)在研究人類行為的心理機制,而人工智能在研究智能系統(tǒng)運作的心理機制。
從心理學(xué)的角度來講,人類的心理行為機制是一個黑箱,由于神經(jīng)科學(xué)的局限我們不能直接的認(rèn)識到大腦運行的機制,只能通過操作外部環(huán)境觀察行為反饋來理解心理。同樣的深度學(xué)習(xí)的層級越來越深,任務(wù)和網(wǎng)絡(luò)結(jié)構(gòu)越來越復(fù)雜,人工智能的運行方式對我們來說也是一個黑箱(Bornstein,2016;Lipton,2016)這種不透明性阻礙了尋求改進(jìn)這些模型的基礎(chǔ)研究,以及這些模型在現(xiàn)實世界問題中的應(yīng)用(Caruana et al.,2015)。既然目前人工智能的視覺不但能夠識別物體,理解物體間的關(guān)系,甚至通過體會情感,這樣就有能力完成一些以前人類才能完成的心理學(xué)任務(wù),利用心理學(xué)實驗來探究人工智能的“黑箱”并對其進(jìn)行改進(jìn),下面兩個例子就會展示人工智能完成心理學(xué)任務(wù)。
(一)人工智能心理學(xué)實驗室。DeepMind公司的就專門為人工智能開設(shè)了一個虛擬3D游戲世界中的心理學(xué)實驗室―Psychlab(Leibo, J.Z., D'Autume, C.D.M.,2018),人工智能能夠在這個實驗室像正常人一樣環(huán)顧四周,而試驗給予的視頻圖像刺激顯示在實驗室中的顯示器中,給人工智能一個相應(yīng)的任務(wù),如果完成任務(wù)智能體會獲得獎勵。JoelZ.Leibo在他的論文中展示了8種任務(wù),如圖4所示,分別為:1.連續(xù)識別:判斷面前的物品是否曾經(jīng)出現(xiàn)過。2.變化檢測,判斷前后出現(xiàn)的兩組圖,是否發(fā)生了變化。3.任意的視覺映射,面前出現(xiàn)一個物體和四個標(biāo)簽,標(biāo)簽中只有一個是綠色。下次這個物體再出現(xiàn)的時候,要判斷出對應(yīng)的綠色標(biāo)簽在哪個位置。4.隨機點運動方向判斷:畫面中間的圓形區(qū)域,會出現(xiàn)大量的隨機點,人工智能需要指出主要的運動方向。5.視覺搜索:在一堆物體中發(fā)現(xiàn)要尋找的目標(biāo)。6.玻璃圖案測試:要判斷兩個圖案中,哪一個是同心的玻璃圖案。7.視敏度測試:測量人工智能在不同對比度下的視敏度。8.多對象追蹤:畫面中有一組兩種顏色的小球,隨后全部變成統(tǒng)一顏色并開始移動,最后指定一個小球,人工智能要判斷原來這個球的顏色是什么。實驗者利用人工智能的試驗結(jié)果與人類進(jìn)行相同試驗的試驗結(jié)果進(jìn)行比較,來對人工智能進(jìn)行改進(jìn)。
(二)心理學(xué)實驗改進(jìn)人工智能。以Jaderberg等人2016年提出智能體UNREAL為例(Jaderbe rg et al,2016),在指向目標(biāo)任務(wù)中,UNREAL與人相比,對目標(biāo)和誘餌的大小非常敏感,目標(biāo)大時學(xué)習(xí)速度要快得多,誘餌大時最終性能不太理想(如圖1),這種發(fā)現(xiàn)也帶來了對一個簡單的中央凹視覺模型的具體改進(jìn),顯著提高了UNREAL在其他Psychlab任務(wù)上的表現(xiàn)。
因為研究任務(wù)的相似性,心理物理學(xué)與認(rèn)知心理學(xué)的研究范式正不斷應(yīng)用在人工智能領(lǐng)域,不止在視覺領(lǐng)域。例如,將大量關(guān)于情景記憶的研究應(yīng)用到情景記憶體系結(jié)構(gòu)的最近的人工智能研究中(Blundell et al,2016),并應(yīng)用技術(shù)從語義認(rèn)知研究到概念信息的最新模型(Raposo et al,2016)。
圖1 (1)連續(xù)識別(2)變化檢測(3)任意的視覺映射(4)隨機點運動方向判斷(5)視覺搜索(6)玻璃圖案測試(7)視敏度測試(8)多對象追蹤
(三)人工智能形狀偏好。人對看到的不認(rèn)識的東西與語義概念進(jìn)行匹配的時候,會通過采用歸納偏好來消除許多不正確的推理,比如:1.整體偏好,概念指向完整物體。2.分類偏好,概念指向意見食物的基本類別。3.形狀偏好,概念基于意見是我的形狀顏色或材質(zhì)。SamuelRitte(2017)的團(tuán)隊證明了人工智能在小樣本的情況下認(rèn)識對象時同樣存在偏好,他們向深度神經(jīng)網(wǎng)絡(luò)展示了三個物體的圖形:一個測試物體,一個與測試物體顏色相同但形狀不同的物體,一個與測試物體形狀相同但顏色不同的物體(如圖2)。之后通過記錄測試物體和和形狀相同物體而非顏色相同物體被做出同樣標(biāo)注的次數(shù)占比來測量形狀偏好。發(fā)現(xiàn)他們的神經(jīng)網(wǎng)絡(luò)如同人類一樣對物體的形狀有更強的偏好(相比較對物體的顏色或質(zhì)地而言)。換言之,它們也具備形狀偏好。并且同人類偏好形成的過程相同,形狀偏好在神經(jīng)網(wǎng)絡(luò)訓(xùn)練時也是逐步顯現(xiàn)的。
圖2 人工智能的歸納偏好
綜上所述,心理學(xué)已經(jīng)滲透到人工智能視覺的方方面面,借助于注意力機制,長短時記憶機制等心理機制的幫助,人工智能已經(jīng)不僅僅在感覺上認(rèn)知看到的內(nèi)容,更能從知覺上理解它。甚至我們還可以讓它們做人類的心理學(xué)實驗來認(rèn)知人工智能的心理構(gòu)造,為改善智能體能力提供了參照。盡管如此,現(xiàn)在的人工智能距離真正的強人工智能還有很長的路要走,學(xué)習(xí)效率低,通用性差,動機獎勵函數(shù)設(shè)計困難,都是當(dāng)前道路上遇到的問題,只有利用好計算機視覺才能更好的完成人類的工作。