謝祺旭
在城市人因工程學(xué)[1]中,空間認(rèn)知機(jī)制研究是理解人的空間體驗(yàn)的基礎(chǔ)工作之一。人腦通過學(xué)習(xí),能夠借助感官實(shí)時(shí)獲取局部信息,并結(jié)合自身的記憶和經(jīng)驗(yàn)建立整體空間關(guān)系的抽象認(rèn)知。這一過程幫助我們?cè)诔鞘泻徒ㄖ羞M(jìn)行定位與尋路,是支撐我們?nèi)粘?臻g使用的基礎(chǔ)。
空間認(rèn)知是一個(gè)廣闊的交叉研究領(lǐng)域,一直是建筑學(xué)、心理學(xué)、神經(jīng)科學(xué)、計(jì)算機(jī)科學(xué)等學(xué)科的共同話題。1940 年代,心理學(xué)研究在行為層面提出了認(rèn)知地圖(cognitive map)概念[2];1960 年代,建筑學(xué)研究從城市設(shè)計(jì)層面提出了城市意象的理論[3];1970 年代到21 世紀(jì)初,神經(jīng)科學(xué)研究在神經(jīng)層面發(fā)現(xiàn)認(rèn)知地圖在位置細(xì)胞和網(wǎng)格細(xì)胞上的編碼方式[4-5],相關(guān)成果也獲得了2014 年諾貝爾生理學(xué)或醫(yī)學(xué)獎(jiǎng);到今天,計(jì)算機(jī)科學(xué)研究中空間導(dǎo)航和自主尋路的算法實(shí)現(xiàn)仍然是重要的研究話題,以DeepMind 為代表的人工智能研究團(tuán)隊(duì)基于深度網(wǎng)絡(luò)對(duì)網(wǎng)格細(xì)胞導(dǎo)航功能的實(shí)現(xiàn)也是該交叉領(lǐng)域近年來的重要突破之一[6]。隨著對(duì)神經(jīng)機(jī)制了解的不斷深入和不同學(xué)習(xí)模型的發(fā)展,面向復(fù)雜現(xiàn)實(shí)環(huán)境的空間認(rèn)知過程的計(jì)算建模已成為該交叉領(lǐng)域未來的關(guān)鍵科學(xué)問題之一。一方面,完整的計(jì)算模型能夠幫助我們建立對(duì)空間認(rèn)知過程的科學(xué)認(rèn)知,測(cè)試我們的理論假設(shè);另一方面,經(jīng)過實(shí)際數(shù)據(jù)檢驗(yàn)的模型能夠幫助我們進(jìn)行空間設(shè)計(jì)的測(cè)試和迭代。因此,本文希望通過綜述不同學(xué)科在這一問題上的研究進(jìn)展,為未來的空間認(rèn)知計(jì)算建模提供啟發(fā)。
空間認(rèn)知難以被描述和測(cè)量??臻g認(rèn)知研究最有趣也是最困難的一點(diǎn)在于:主觀方面,我們難以直接報(bào)告空間在我們大腦中形成的具體結(jié)構(gòu)和建立這些結(jié)構(gòu)的過程;客觀方面,盡管神經(jīng)影像和顱內(nèi)腦電等技術(shù)已經(jīng)可以讓我們?cè)诰植磕X區(qū)或單個(gè)細(xì)胞的水平上觀測(cè)空間認(rèn)知相關(guān)的神經(jīng)活動(dòng),但在短期內(nèi),我們依然難以測(cè)得空間認(rèn)知的完整過程及其在腦內(nèi)的完整表征(representation)。我們無法簡(jiǎn)單地通過收集證據(jù)或測(cè)量得到理想的模型。因此,空間認(rèn)知計(jì)算建模最大的挑戰(zhàn)來自于如何綜合行為和神經(jīng)層面的局部證據(jù),結(jié)合研究者的認(rèn)識(shí)和判斷提出整體機(jī)制的合理假設(shè)。
空間認(rèn)知具有不同尺度的時(shí)間序列屬性。一方面,相較于局部信息的感知,空間認(rèn)知發(fā)生在人的持續(xù)移動(dòng)過程中,人腦需要組織時(shí)間序列上接收到的不同信息;另一方面,更長(zhǎng)時(shí)間尺度上的信息,即人過去經(jīng)歷的空間記憶以及形成的空間經(jīng)驗(yàn)也會(huì)極大地影響當(dāng)前空間的認(rèn)知過程。因此,空間認(rèn)知的本質(zhì)不是對(duì)靜態(tài)信息的反映,而是人腦如何處理和組織時(shí)間序列信息[7]。我們需要在空間認(rèn)知的計(jì)算模型中引入時(shí)間維度,但同時(shí)又要保證引入后的計(jì)算復(fù)雜度不會(huì)過高。這不僅是為了算法的實(shí)現(xiàn)和運(yùn)行,也因?yàn)檫^度復(fù)雜的計(jì)算模型可能會(huì)超出大腦實(shí)際所具有的處理能力。
空間認(rèn)知具有明顯的個(gè)體差異。既有研究顯示,不同成長(zhǎng)環(huán)境和職業(yè)背景都會(huì)導(dǎo)致人的空間認(rèn)知能力差異[8-9]。因此,除了對(duì)實(shí)際認(rèn)知過程的建模以外,還需要找到合適的方法來建模人群的個(gè)體差異。例如,如何將個(gè)體的成長(zhǎng)環(huán)境記憶納入模型的框架。否則,在實(shí)際工程應(yīng)用時(shí)將難以成立。城市和建筑設(shè)計(jì)實(shí)踐都需要計(jì)算模型根據(jù)所在地域和面向群體的不同來進(jìn)行相應(yīng)人群空間認(rèn)知的模擬。
目前已知存在的有關(guān)空間認(rèn)知的眾多理論假設(shè)可大致基于和現(xiàn)有計(jì)算建模關(guān)聯(lián)歸納為相關(guān)性較高的兩類:認(rèn)知地圖和預(yù)測(cè)地圖。這兩類理論假設(shè)分別對(duì)應(yīng)認(rèn)知科學(xué)中關(guān)于大腦功能的兩種范式[10]:(1)大腦從感官信息中提取知識(shí);(2)大腦主動(dòng)推理外部環(huán)境變化。
認(rèn)知地圖指人借助感官接收的空間局部信息,在大腦內(nèi)部建立空間不同局部間關(guān)系的表征。這一概念最早由Tolman 根據(jù)哺乳動(dòng)物的尋路行為提出[2],其后大腦中海馬體的位置細(xì)胞、內(nèi)嗅皮層的網(wǎng)格細(xì)胞等特殊神經(jīng)細(xì)胞的發(fā)現(xiàn)也支撐了認(rèn)知地圖在大腦中的存在[4-5,11]。
需要注意的是,認(rèn)知地圖不單指每個(gè)空間在大腦里存在相應(yīng)表征,而是其背后有一個(gè)結(jié)構(gòu)性的抽象[12]來反映空間的共同模式,支撐人認(rèn)知不同空間。對(duì)每個(gè)外部環(huán)境都建立特定的完整認(rèn)知地圖的計(jì)算復(fù)雜度高,對(duì)于人腦來說可能是難以實(shí)現(xiàn)的理想狀態(tài);靜態(tài)的認(rèn)知地圖也無法解釋人在新的環(huán)境中快速建立空間認(rèn)知、找到合適路徑的過程。尤其是近年來,海馬體—內(nèi)嗅皮層通路與認(rèn)知地圖相關(guān)的機(jī)制被擴(kuò)展到了更一般化的認(rèn)知過程[13-15],因此需要以一種抽象化的知識(shí)結(jié)構(gòu)來理解認(rèn)知地圖機(jī)制。人腦構(gòu)建新空間的認(rèn)知地圖可能更接近于將感官收集的信息組織到大腦中既有的結(jié)構(gòu)上[16]。這種結(jié)構(gòu)既包括像Lynch K.所提出的城市意象元素這類相對(duì)具象的組成[3],也包括更抽象的圖結(jié)構(gòu)(graph)[16]以及圖式(schema)[17]等。
預(yù)測(cè)地圖(predictive map)理論將人腦中的空間認(rèn)知理解為一個(gè)主動(dòng)推理的模型,即不斷依賴當(dāng)前的信息推測(cè)后續(xù)狀態(tài)的概率分布[18-19]。這和認(rèn)知科學(xué)中大腦進(jìn)行預(yù)測(cè)編碼(predictive coding)的理論相一致[20-22],該理論認(rèn)為大腦的核心功能是存在一個(gè)世界模型,并通過行動(dòng)和觀察不斷縮小這個(gè)模型對(duì)外部環(huán)境未來狀態(tài)的預(yù)測(cè)誤差。預(yù)測(cè)地圖的假設(shè)也得到了實(shí)驗(yàn)證據(jù)的支持,一些針對(duì)海馬體的觀測(cè)顯示,相較于只表征當(dāng)前位置,位置細(xì)胞的激活更有可能是在表征后續(xù)位置出現(xiàn)的概率[23-24]。
預(yù)測(cè)地圖比認(rèn)知地圖具有更少的假設(shè)和簡(jiǎn)潔的框架。認(rèn)知地圖需要有不同的抽象結(jié)構(gòu)假設(shè)來支撐不同空間認(rèn)知任務(wù)的實(shí)現(xiàn),而預(yù)測(cè)地圖只用一個(gè)統(tǒng)一的主動(dòng)推理框架來建模不同任務(wù)下共通的空間認(rèn)知機(jī)制[19]。這一機(jī)制本身不包含空間結(jié)構(gòu)的假設(shè),基于此構(gòu)建的計(jì)算模型如果能夠支撐空間任務(wù),會(huì)具有更高的說服力??梢哉f,相較于認(rèn)知地圖顯式表達(dá)空間認(rèn)知的結(jié)果,預(yù)測(cè)地圖則更像用方程進(jìn)行隱式表達(dá)。盡管犧牲了認(rèn)知結(jié)果表達(dá)的直觀性,但借助現(xiàn)代的人工神經(jīng)網(wǎng)絡(luò),這個(gè)方程可以取得很高的準(zhǔn)確度。
人腦中和空間認(rèn)知最直接相關(guān)的部分是內(nèi)嗅皮層和海馬體通路[25]。生物啟發(fā)式模型嘗試對(duì)該通路中的神經(jīng)活動(dòng)進(jìn)行計(jì)算建模。這類建模關(guān)注模型在神經(jīng)機(jī)制上的可解釋性。模型除了需要能夠基于原始的外部信息進(jìn)行空間認(rèn)知以外(行為層面上的相似性),模型內(nèi)部的表征應(yīng)該有和相應(yīng)神經(jīng)細(xì)胞相似的激活模式(生物層面上的合理性),以提升模型的說服力[26]。常采用的神經(jīng)細(xì)胞除了位置細(xì)胞、網(wǎng)格細(xì)胞,還包括頭部朝向細(xì)胞[27]、邊界細(xì)胞[28]、地標(biāo)細(xì)胞[29]等空間認(rèn)知相關(guān)的神經(jīng)細(xì)胞,這些細(xì)胞的活動(dòng)都具有高度的空間規(guī)律。
既有的神經(jīng)科學(xué)研究支持網(wǎng)格細(xì)胞作為相對(duì)底層的細(xì)胞,貢獻(xiàn)于位置細(xì)胞對(duì)空間的編碼[30-31]。因此,如果模型能夠基于外部環(huán)境和自身活動(dòng)輸入的信息實(shí)現(xiàn)和網(wǎng)格細(xì)胞類似的功能,那就有可能從底層向上構(gòu)建空間認(rèn)知系統(tǒng)。在2005 年網(wǎng)格細(xì)胞被發(fā)現(xiàn)后,眾多的計(jì)算模型被提出用于解釋網(wǎng)格細(xì)胞活動(dòng)規(guī)律形成的機(jī)制[32-34]。Banino 等人[6]進(jìn)一步將這種建模用來支撐具體的空間導(dǎo)航行為,通過循環(huán)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)哺乳動(dòng)物依靠自身每個(gè)時(shí)刻的速度推測(cè)所處位置和頭部朝向的過程,模型成功地出現(xiàn)了和哺乳動(dòng)物網(wǎng)格細(xì)胞相似的空間激活特征,進(jìn)一步地,該模型在更大的網(wǎng)絡(luò)架構(gòu)中,對(duì)智能體的導(dǎo)航起到了重要作用。Whittington 等人[16]提出了更完整的模仿海馬體—內(nèi)嗅皮層通路的計(jì)算模型(Tolman-Eichenbaum Machine,TEM)。該模型分模塊復(fù)現(xiàn)了海馬體整合內(nèi)嗅皮層中感官信息和抽象結(jié)構(gòu)的過程[31],成功觀察到與更多類型神經(jīng)細(xì)胞相似的激活模式,并且將任務(wù)泛化到了除了空間關(guān)系以外的知識(shí)關(guān)系結(jié)構(gòu)認(rèn)知。
這類模型復(fù)現(xiàn)的更多是在實(shí)驗(yàn)室環(huán)境下的實(shí)驗(yàn)結(jié)果。簡(jiǎn)單的實(shí)驗(yàn)環(huán)境和近乎完美的神經(jīng)細(xì)胞激活模式是否能夠解釋復(fù)雜現(xiàn)實(shí)環(huán)境下的人類行為還有待進(jìn)一步研究。近年來,來自建筑學(xué)領(lǐng)域的研究已經(jīng)開始逐漸縮小這一落差。Bongiorno 等人[35]在大規(guī)模的GPS 數(shù)據(jù)上,發(fā)現(xiàn)了人群在城市中基于所處位置和目標(biāo)間的矢量的導(dǎo)航機(jī)制,并構(gòu)建了行人在城市中路徑規(guī)劃的數(shù)學(xué)模型,成功解釋了人實(shí)際路徑?jīng)Q策相較于最短路徑的偏移現(xiàn)象。這一現(xiàn)實(shí)環(huán)境下發(fā)現(xiàn)的宏觀機(jī)制已經(jīng)十分符合神經(jīng)科學(xué)和認(rèn)知科學(xué)上的微觀原理[36],展示了在統(tǒng)一的框架下實(shí)現(xiàn)計(jì)算模型、神經(jīng)細(xì)胞活動(dòng)和現(xiàn)實(shí)環(huán)境行為三者一致性的可能。
越來越多的證據(jù)表明,人類和動(dòng)物的大腦可能在執(zhí)行與強(qiáng)化學(xué)習(xí)相類似的算法[37-38]??臻g認(rèn)知中所包含的探索、學(xué)習(xí)、規(guī)劃等過程都能很好的在強(qiáng)化學(xué)習(xí)的框架下得到實(shí)現(xiàn)。強(qiáng)化學(xué)習(xí)較早就被用來進(jìn)行位置細(xì)胞和網(wǎng)格細(xì)胞支持動(dòng)物導(dǎo)航過程的計(jì)算建模[39-41]。在強(qiáng)化學(xué)習(xí)中,基于模型的強(qiáng)化學(xué)習(xí)(model-based reinforcement learning)的環(huán)境模型與認(rèn)知地圖理論具有極高的相似性,它包含兩部分:(1)動(dòng)作對(duì)狀態(tài)影響的預(yù)期;(2)每個(gè)狀態(tài)或狀態(tài)—?jiǎng)幼鲗?duì)的獎(jiǎng)勵(lì)期望[37]。如果將“狀態(tài)”理解為我們所處的位置,“動(dòng)作”理解為我們的路徑選擇,“獎(jiǎng)勵(lì)”對(duì)應(yīng)實(shí)際尋路中找到目標(biāo)位置,那這兩部分就對(duì)應(yīng)我們實(shí)際在空間中尋路時(shí),對(duì)每個(gè)路徑選擇導(dǎo)致的位置變化預(yù)期和每個(gè)位置距離我們目的地的距離預(yù)期。
但在實(shí)際建模中,尤其是面向復(fù)雜的現(xiàn)實(shí)環(huán)境,基于模型的強(qiáng)化學(xué)習(xí)由于需要對(duì)狀態(tài)空間極大的未來狀態(tài)建模,仍然受到算力的局限。近年來的研究更多采用的是Dayan 提出的Successor Representation(SR)[42]強(qiáng)化學(xué)習(xí)算法。這一算法兼具基于模型強(qiáng)化學(xué)習(xí)的靈活性,和無模型強(qiáng)化學(xué)習(xí)(model-free reinforcement learning)的較低計(jì)算復(fù)雜度。Stachenfeld 等人[43]發(fā)現(xiàn)SR 算法可以較好地解釋預(yù)測(cè)表征在大腦中建立并支持空間導(dǎo)航任務(wù)的過程,并在此基礎(chǔ)上以SR 算法作為統(tǒng)一框架復(fù)現(xiàn)了海馬體和內(nèi)嗅皮層的多種激活模式[18];Cothi 等人[44]則基于該算法進(jìn)行了尋路建模,通過實(shí)驗(yàn)證明該模型在迷宮中的尋路路徑和人、小鼠具有一致性。
除了依賴尋路這樣的外在價(jià)值驅(qū)動(dòng),我們認(rèn)為可能存在更具普遍性的內(nèi)在價(jià)值來加速空間認(rèn)知的強(qiáng)化學(xué)習(xí)過程:一方面尋路這樣的空間任務(wù)存在強(qiáng)化學(xué)習(xí)領(lǐng)域中的稀疏獎(jiǎng)勵(lì)問題,需要有內(nèi)在價(jià)值來幫助模型更好地學(xué)習(xí)[45-49];另一方面是因?yàn)閷?shí)際空間中,認(rèn)知不僅驅(qū)動(dòng)行為,行為的策略(探索哪部分空間)也會(huì)反過來影響認(rèn)知。例如,人在探索一個(gè)新環(huán)境時(shí),滿足自我的好奇心和消除環(huán)境里的未知都會(huì)是很重要的驅(qū)動(dòng)力[45,50]。如果能合理地量化這種策略,有可能能夠加速模型的學(xué)習(xí)過程。Pathak 等人[48]以下一狀態(tài)的預(yù)測(cè)誤差作為獎(jiǎng)勵(lì),鼓勵(lì)模型對(duì)未知環(huán)境的探索,并在其后將預(yù)測(cè)誤差修正為尋找預(yù)測(cè)不確定性最高的后續(xù)狀態(tài)的動(dòng)作選擇策略[51],這與OpenAI 借助信息論建立的信息增益最大化探索策略相近[46]。基于這些策略的模型已經(jīng)在游戲領(lǐng)域中取得了顯著的效果[52],如果能夠檢驗(yàn)其與人的實(shí)際行為策略具有一致性,這類模型可以被應(yīng)用到空間認(rèn)知的計(jì)算建模中。
借助任務(wù)型的強(qiáng)化學(xué)習(xí),計(jì)算模型在特定任務(wù)表現(xiàn)出與人相近的行為,但是如果改變?nèi)蝿?wù),模型往往無法順利遷移。而在實(shí)際的人腦中,空間認(rèn)知可以支撐我們完成不同的任務(wù)。因此,基于特定任務(wù)的強(qiáng)化學(xué)習(xí)可能并未學(xué)習(xí)到人腦空間認(rèn)知中對(duì)環(huán)境真正的表征?;陬A(yù)測(cè)編碼和預(yù)測(cè)地圖理論的假設(shè),模型可以完全脫離任務(wù),通過不斷預(yù)測(cè)后續(xù)狀態(tài),學(xué)習(xí)到通用的空間表征。
這一假設(shè)在其他基于視覺的規(guī)劃—控制任務(wù)的強(qiáng)化學(xué)習(xí)中也得到支持,通過單獨(dú)訓(xùn)練一個(gè)卷積網(wǎng)絡(luò)將時(shí)間上相鄰的觀察聯(lián)系起來就能夠有效提升模型的性能[53-54]。針對(duì)空間認(rèn)知,Penny等人[19]通過建立后續(xù)狀態(tài)的概率推斷模型,實(shí)現(xiàn)了多種空間任務(wù);DeepMind 通過在強(qiáng)化學(xué)習(xí)的框架中,引入一個(gè)預(yù)測(cè)型的變分自動(dòng)編碼器,有效地表征了空間認(rèn)知中的長(zhǎng)期空間記憶,實(shí)現(xiàn)了傳統(tǒng)強(qiáng)化學(xué)習(xí)難以實(shí)現(xiàn)的空間任務(wù)[55];隨后又實(shí)現(xiàn)了基于對(duì)比學(xué)習(xí)的表征學(xué)習(xí),僅通過讓模型區(qū)分后續(xù)狀態(tài)和隨機(jī)抽取的其他狀態(tài),模型所學(xué)習(xí)到的表征就能夠完成基本的空間定位和記憶任務(wù)[56]。這些研究驗(yàn)證了通過預(yù)測(cè)學(xué)習(xí)到的表征能支撐空間認(rèn)知,但認(rèn)知結(jié)果和支撐的行為是否與人一致同樣有待檢驗(yàn)。
預(yù)測(cè)型的表征學(xué)習(xí)模型還能夠解釋一些潛在的空間認(rèn)知過程。重映射(remapping)是外部背景環(huán)境變化時(shí)海馬體內(nèi)位置細(xì)胞和新環(huán)境重新建立聯(lián)系的過程[57]。不同于實(shí)驗(yàn)室實(shí)驗(yàn),現(xiàn)實(shí)環(huán)境中人會(huì)連續(xù)地體驗(yàn)不同的空間,需要不斷地切換大腦中的認(rèn)知地圖。但如何定義和量化判斷什么是背景環(huán)境變化是其中的難點(diǎn)[58]。前述的兩類模型大部分只針對(duì)實(shí)驗(yàn)室中的單一場(chǎng)景實(shí)驗(yàn),無法反映大腦中認(rèn)知地圖切換的過程,而預(yù)測(cè)型模型可以直接通過預(yù)測(cè)誤差(predictive error)來量化這個(gè)過程的發(fā)生。Fuhs 等人[59]將每個(gè)背景環(huán)境量化為一個(gè)隱馬爾可夫模型,基于不同模型對(duì)后續(xù)狀態(tài)預(yù)測(cè)準(zhǔn)確性的比較,建模大腦判斷所處背景環(huán)境的過程;在此基礎(chǔ)上,Sanders 等人[58]通過建立表征預(yù)測(cè)模型,以預(yù)測(cè)誤差來衡量重映射出現(xiàn)的概率。與重映射相伴隨的是人對(duì)不同空間之間邊界的認(rèn)知,預(yù)測(cè)誤差因此也可以被用于建??臻g邊界的形成過程[60]。
1 探索—預(yù)測(cè)的空間認(rèn)知模型框架
結(jié)合空間認(rèn)知計(jì)算建模既有研究進(jìn)展,面向未來,有兩個(gè)方向可能帶來新的突破。一個(gè)是以自回歸模型作為基礎(chǔ)模型,習(xí)得空間視覺特征通用的表征。在自然語言領(lǐng)域我們已經(jīng)看到,自回歸模型通過擴(kuò)大參數(shù)不斷提升學(xué)習(xí)大規(guī)模數(shù)據(jù)知識(shí)的能力,并成功將這些知識(shí)遷移到不同任務(wù)的實(shí)現(xiàn)上[61-62]。已經(jīng)有研究者利用大語言模型的預(yù)測(cè)誤差來模擬大腦接收文本信息的過程,成功用預(yù)測(cè)誤差建模了人對(duì)文本的分段認(rèn)知[63-64]。文本的上下文補(bǔ)全和空間認(rèn)知中的后續(xù)狀態(tài)預(yù)測(cè)都可以納入預(yù)測(cè)編碼的范疇,看作是模擬大腦進(jìn)行主動(dòng)推理的過程。這意味著我們有可能通過與自然語言類似的路徑,在大規(guī)模的視頻數(shù)據(jù)中訓(xùn)練模型的序列預(yù)測(cè)能力[65-66],模型所學(xué)習(xí)到的表征有可能就是空間認(rèn)知的基礎(chǔ),并能支撐不同空間任務(wù)的建模。
另一個(gè)是將預(yù)測(cè)型的表征學(xué)習(xí)模型與探索型的強(qiáng)化學(xué)習(xí)相結(jié)合(圖1)。盡管自回歸模型能夠以互聯(lián)網(wǎng)上大規(guī)模的現(xiàn)實(shí)影像作為訓(xùn)練數(shù)據(jù),但其可能面臨的問題包括:(1)學(xué)習(xí)過程中模型被動(dòng)接收影像,缺乏動(dòng)作—狀態(tài)關(guān)系的學(xué)習(xí),而讓模型能夠?qū)W習(xí)到不同動(dòng)作帶來的狀態(tài)改變是建立不同空間狀態(tài)間關(guān)系的重要步驟;(2)在傳統(tǒng)的數(shù)據(jù)集中能夠提供深度這一重要空間信息的深度圖、雙目視圖等數(shù)據(jù)類型規(guī)模很小?;谔摂M環(huán)境的強(qiáng)化學(xué)習(xí)則可以在空間中采取動(dòng)作、觀察環(huán)境、自行采樣獲得大規(guī)模的動(dòng)作—狀態(tài)數(shù)據(jù)。未來研究的關(guān)鍵在于構(gòu)建一條合適的路徑生成大規(guī)模的三維環(huán)境作為訓(xùn)練環(huán)境。有趣的是,預(yù)測(cè)型的表征學(xué)習(xí)模型是讓模型通過學(xué)習(xí)不斷提高對(duì)下一狀態(tài)預(yù)測(cè)的準(zhǔn)確度,而探索型的強(qiáng)化學(xué)習(xí)則通過策略不斷去選擇預(yù)測(cè)不確定性最高的動(dòng)作,如果能找到穩(wěn)定的訓(xùn)練框架,兩者的相互對(duì)抗可能能夠較好地加速空間認(rèn)知的學(xué)習(xí)過程。
從過去80 年間空間認(rèn)知研究進(jìn)展中我們可以看到,一方面,我們?cè)谏窠?jīng)細(xì)胞上觀測(cè)到了令人驚訝的規(guī)律性激活模式;另一方面,對(duì)空間認(rèn)知背后一個(gè)理性的神經(jīng)機(jī)制存在的堅(jiān)信,推動(dòng)著我們通過計(jì)算模型去理解這一人類自身重要的智力過程。通過不斷追問“空間對(duì)于大腦來說究竟意味著什么”[7],我們期待未來交叉學(xué)科的研究能夠借助計(jì)算模型來建立一個(gè)從神經(jīng)細(xì)胞機(jī)制到復(fù)雜現(xiàn)實(shí)環(huán)境中行為規(guī)律的統(tǒng)一框架,以更準(zhǔn)確地進(jìn)行設(shè)計(jì)干預(yù)滿足我們?nèi)粘I畹目臻g需求。