編譯 李升偉
一種稱為深度學(xué)習(xí)的人工智能技術(shù)目前正在用來模擬空間導(dǎo)航,這種人工智能系統(tǒng)建立了一種空間的表現(xiàn),類似于在哺乳動物大腦內(nèi)發(fā)現(xiàn)的網(wǎng)格細(xì)胞。
深度學(xué)習(xí)是一種人工智能方法,它的靈感來自大腦神經(jīng)網(wǎng)絡(luò)。由于這種技術(shù)的貢獻(xiàn),催生了一系列的技術(shù),從自動化視頻分析到語言翻譯。在《自然》雜志的一篇在線論文中,巴尼諾(Banino)等人使用這種框架獲得了關(guān)于真實生命神經(jīng)網(wǎng)絡(luò)的新認(rèn)識,尤其是關(guān)于空間的幾何常規(guī)表示方法是如何促進(jìn)靈活的導(dǎo)航策略的。
可以訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)怎樣從輸入得到特定的輸出,例如,學(xué)會從許多張不同人的照片中識別一幅特定的臉形。深度學(xué)習(xí)網(wǎng)絡(luò)由重復(fù)計算單元的連續(xù)層次組成,每個單元接收來自前一個層次的相似單元的輸入,然后向下一個層次發(fā)送輸出。從數(shù)學(xué)上來說,這樣一個網(wǎng)絡(luò)可以被視為一種高維函數(shù),可以通過改變一層的輸出在下一層的加權(quán)情況來調(diào)節(jié)。
在訓(xùn)練階段,網(wǎng)絡(luò)對函數(shù)進(jìn)行了調(diào)整,這通常依賴于一組輸入-輸出示例。例如,一個深度學(xué)習(xí)系統(tǒng)可能瀏覽了一系列相片,并知道哪張相片包含有它想要識別的臉形。深度學(xué)習(xí)系統(tǒng)的權(quán)重可以通過優(yōu)化算法自動調(diào)整,直到其學(xué)會正確識別。深度學(xué)習(xí)網(wǎng)絡(luò)具有驚人的能力:能認(rèn)出和利用在例圖中重復(fù)出現(xiàn)的最有用的容貌特征和模式,能區(qū)別不同的臉形。但深度學(xué)習(xí)網(wǎng)絡(luò)的一個缺點(diǎn)是:最終的網(wǎng)絡(luò)往往是一個黑箱,在訓(xùn)練過程形成的計算方案經(jīng)常不能從各層之間分配的無數(shù)權(quán)重中得到解釋。
深度學(xué)習(xí)網(wǎng)絡(luò)可以成功地執(zhí)行感知任務(wù),但對如同導(dǎo)航這樣的復(fù)雜行為任務(wù)還研究甚少?,F(xiàn)實生活中導(dǎo)航的一個關(guān)鍵方面是通過根據(jù)方位和旅行距離計算每一步的位移來估計每一步之后的位置,這個過程稱之為路徑整合。神經(jīng)科學(xué)家、認(rèn)知科學(xué)家和計算機(jī)科學(xué)家認(rèn)為,這個過程對生成環(huán)境的認(rèn)知地圖至關(guān)重要。有幾種神經(jīng)元與大腦的認(rèn)知地圖相關(guān)聯(lián),包括位置細(xì)胞和頭部方向細(xì)胞,前者在生物體占領(lǐng)了環(huán)境中一個特定位置時會激活,后者標(biāo)志著頭的方向。
第三種神經(jīng)元,即網(wǎng)格細(xì)胞,當(dāng)動物處于環(huán)境中形成六角形網(wǎng)格模式的任何一個點(diǎn)時,它就會發(fā)出信號。一般認(rèn)為:網(wǎng)格細(xì)胞是具有幾何屬性的認(rèn)知地圖,有助于規(guī)劃和跟蹤軌跡。這些細(xì)胞存在于大腦的海馬體,在人腦內(nèi),海馬體負(fù)責(zé)空間學(xué)習(xí)、自身記憶和關(guān)于世界的一般事實的認(rèn)知。
巴尼諾等人期望在深度學(xué)習(xí)網(wǎng)絡(luò)中生成路徑整合。因為路徑整合涉及到記住以前處理步驟的輸出,將其作為下一個處理步驟的輸入,作者使用了一個包含反饋回路的網(wǎng)絡(luò)。他們通過模擬覓食鼠類路徑來訓(xùn)練網(wǎng)絡(luò)。此系統(tǒng)接收了如下的信息:模擬鼠類的線性速度和角速度,關(guān)于位置細(xì)胞和方向細(xì)胞的模擬活動;后者可以看作鼠類目前位置和頭部方向的“預(yù)言”。
作者發(fā)現(xiàn),在訓(xùn)練期間,類似網(wǎng)格細(xì)胞的活動模式自發(fā)地出現(xiàn)在網(wǎng)絡(luò)中間層內(nèi)的計算單元內(nèi),盡管網(wǎng)絡(luò)或訓(xùn)練協(xié)議內(nèi)沒有明確這類模式。類似網(wǎng)格單元的出現(xiàn)是令人印象深刻的例子,說明深度學(xué)習(xí)在做其最擅長的事情,即發(fā)明一個原始、經(jīng)常是不可預(yù)測的內(nèi)部表示來幫助解決任務(wù)。
人工智能系統(tǒng)學(xué)會走捷徑 在哺乳動物大腦中,位置細(xì)胞在動物處于某環(huán)境內(nèi)特定位置時激活,頭部方向細(xì)胞在頭部處于某個特定方向時激活,而網(wǎng)格細(xì)胞則在動物在環(huán)境中形成六邊形網(wǎng)格時激活。巴尼諾等人訓(xùn)練了一種稱為“深度學(xué)習(xí)網(wǎng)絡(luò)”的人工智能系統(tǒng)來進(jìn)行導(dǎo)航,通過向其提供鼠類覓食方式的模擬來訓(xùn)練,包括訓(xùn)練位置細(xì)胞和頭部方向細(xì)胞的活動。網(wǎng)絡(luò)內(nèi)的一些計算單元建立起了類似網(wǎng)格細(xì)胞的激活方式(沒有顯示)。a,當(dāng)學(xué)習(xí)向某個目標(biāo)進(jìn)行導(dǎo)航時,使用網(wǎng)格細(xì)胞的系統(tǒng)(黑線表示一種樣本路徑)和使用位置細(xì)胞和頭部方向細(xì)胞的系統(tǒng)(灰線)采用的是相同的路徑。b,但是當(dāng)導(dǎo)入捷徑時,例如打開了以前關(guān)閉的門時,只有使用網(wǎng)格細(xì)胞的系統(tǒng)發(fā)現(xiàn)了較短的路線,彰顯了類似網(wǎng)格細(xì)胞的活動改善靈活導(dǎo)航策略的能力
類似網(wǎng)格的單元可以使網(wǎng)絡(luò)在路徑整合的基礎(chǔ)上保持對位置的跟蹤,這樣的單元能否幫助深度學(xué)習(xí)系統(tǒng)學(xué)會有效地從其目前位置導(dǎo)航到目標(biāo)位置呢?為了解決這個問題,巴尼諾等人添加了一個強(qiáng)化學(xué)習(xí)元件,使得深度學(xué)習(xí)網(wǎng)絡(luò)學(xué)會賦值給特定位置的特定動作。作為獎勵,更高的值賦與使模擬鼠類更接近目標(biāo)的動作。類似網(wǎng)格的表示顯著改善了網(wǎng)絡(luò)解決目標(biāo)定向任務(wù)的能力,優(yōu)于起始和目標(biāo)位置由位置細(xì)胞和方向細(xì)胞編碼的對照模擬。當(dāng)諸如關(guān)閉的門等障礙物被移除時,經(jīng)過訓(xùn)練的網(wǎng)絡(luò)會發(fā)現(xiàn)捷徑,甚至能夠在以前未被探索過的熟悉環(huán)境的附件內(nèi)推測達(dá)到目標(biāo)的路徑。這些結(jié)果支持這樣的觀念:網(wǎng)格細(xì)胞使大腦能夠執(zhí)行矢量計算(關(guān)于路徑的長度和方向的計算),以幫助在以前未被探索的環(huán)境中進(jìn)行路徑規(guī)劃。
將來,作者的深度學(xué)習(xí)網(wǎng)絡(luò)可用來探索網(wǎng)格細(xì)胞和位置細(xì)胞之間相互作用的后果。在目前的網(wǎng)絡(luò)內(nèi),模擬的位置層在訓(xùn)練期間并不發(fā)生改變。但是,在大腦內(nèi),網(wǎng)格細(xì)胞和位置細(xì)胞彼此相互影響,其途徑還未被充分認(rèn)識。盡管在缺乏網(wǎng)格細(xì)胞輸入的情況下,真實生命的位置細(xì)胞可以保持對空間的選擇;但是,當(dāng)動物遠(yuǎn)離可用于定義位置的外部標(biāo)志時,這些輸入似乎會很重要。在這些情況下,位置細(xì)胞依賴路徑整合,而網(wǎng)格細(xì)胞則保持對位置的精確估計。通過建立這樣的網(wǎng)絡(luò),使得位置細(xì)胞層可以受到類似網(wǎng)格輸入的調(diào)控,我們可以開始認(rèn)識位置細(xì)胞與網(wǎng)格細(xì)胞的關(guān)系。
從更廣義的視角來看,如下的方面是非常有趣的,即深度學(xué)習(xí)網(wǎng)絡(luò)可以發(fā)現(xiàn)類似大腦的路徑整合的解決方案,該解決方案來自非常普通的計算假定,不考慮特定的生物學(xué)機(jī)制。網(wǎng)絡(luò)集中于這樣一種解決方案是令人信服的證據(jù),表明網(wǎng)格細(xì)胞活動模式存在一些特殊之處,支持路徑整合。但是,深度學(xué)習(xí)系統(tǒng)的黑箱特性意味著可能會很難確定那些特殊之處是什么。
同樣地,網(wǎng)格表示增強(qiáng)了目標(biāo)定向的事實,令人信服地證明了大腦內(nèi)網(wǎng)格細(xì)胞的作用的概念。但是,作者必須使用相關(guān)性分析,以定性的直覺為指導(dǎo),間接推斷出網(wǎng)絡(luò)正在進(jìn)行向量計算。由于在模型內(nèi)無法直接操作這些計算,使得研究網(wǎng)格細(xì)胞成為有效導(dǎo)航方案的計算原理、算法和編碼策略變得困難。因此,理論家最終陷入了與實驗主義者同樣的困境:試圖將一個不太為人所了解的復(fù)雜體系拆開來理解它。使深度學(xué)習(xí)系統(tǒng)更能理解人類推理是未來一項令人興奮的挑戰(zhàn)。
資料來源 Nature