人工智能模擬大腦導(dǎo)航密碼

2018-09-26 08:05:54編譯李升偉

世界科學(xué) 2018年9期

編譯李升偉

一種稱為深度學(xué)習(xí)的人工智能技術(shù)目前正在用來模擬空間導(dǎo)航，這種人工智能系統(tǒng)建立了一種空間的表現(xiàn)，類似于在哺乳動物大腦內(nèi)發(fā)現(xiàn)的網(wǎng)格細(xì)胞。

深度學(xué)習(xí)是一種人工智能方法，它的靈感來自大腦神經(jīng)網(wǎng)絡(luò)。由于這種技術(shù)的貢獻(xiàn)，催生了一系列的技術(shù)，從自動化視頻分析到語言翻譯。在《自然》雜志的一篇在線論文中，巴尼諾（Banino）等人使用這種框架獲得了關(guān)于真實生命神經(jīng)網(wǎng)絡(luò)的新認(rèn)識，尤其是關(guān)于空間的幾何常規(guī)表示方法是如何促進(jìn)靈活的導(dǎo)航策略的。

可以訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)怎樣從輸入得到特定的輸出，例如，學(xué)會從許多張不同人的照片中識別一幅特定的臉形。深度學(xué)習(xí)網(wǎng)絡(luò)由重復(fù)計算單元的連續(xù)層次組成，每個單元接收來自前一個層次的相似單元的輸入，然后向下一個層次發(fā)送輸出。從數(shù)學(xué)上來說，這樣一個網(wǎng)絡(luò)可以被視為一種高維函數(shù)，可以通過改變一層的輸出在下一層的加權(quán)情況來調(diào)節(jié)。

在訓(xùn)練階段，網(wǎng)絡(luò)對函數(shù)進(jìn)行了調(diào)整，這通常依賴于一組輸入-輸出示例。例如，一個深度學(xué)習(xí)系統(tǒng)可能瀏覽了一系列相片，并知道哪張相片包含有它想要識別的臉形。深度學(xué)習(xí)系統(tǒng)的權(quán)重可以通過優(yōu)化算法自動調(diào)整，直到其學(xué)會正確識別。深度學(xué)習(xí)網(wǎng)絡(luò)具有驚人的能力：能認(rèn)出和利用在例圖中重復(fù)出現(xiàn)的最有用的容貌特征和模式，能區(qū)別不同的臉形。但深度學(xué)習(xí)網(wǎng)絡(luò)的一個缺點(diǎn)是：最終的網(wǎng)絡(luò)往往是一個黑箱，在訓(xùn)練過程形成的計算方案經(jīng)常不能從各層之間分配的無數(shù)權(quán)重中得到解釋。

深度學(xué)習(xí)網(wǎng)絡(luò)可以成功地執(zhí)行感知任務(wù)，但對如同導(dǎo)航這樣的復(fù)雜行為任務(wù)還研究甚少?，F(xiàn)實生活中導(dǎo)航的一個關(guān)鍵方面是通過根據(jù)方位和旅行距離計算每一步的位移來估計每一步之后的位置，這個過程稱之為路徑整合。神經(jīng)科學(xué)家、認(rèn)知科學(xué)家和計算機(jī)科學(xué)家認(rèn)為，這個過程對生成環(huán)境的認(rèn)知地圖至關(guān)重要。有幾種神經(jīng)元與大腦的認(rèn)知地圖相關(guān)聯(lián)，包括位置細(xì)胞和頭部方向細(xì)胞，前者在生物體占領(lǐng)了環(huán)境中一個特定位置時會激活，后者標(biāo)志著頭的方向。

第三種神經(jīng)元，即網(wǎng)格細(xì)胞，當(dāng)動物處于環(huán)境中形成六角形網(wǎng)格模式的任何一個點(diǎn)時，它就會發(fā)出信號。一般認(rèn)為：網(wǎng)格細(xì)胞是具有幾何屬性的認(rèn)知地圖，有助于規(guī)劃和跟蹤軌跡。這些細(xì)胞存在于大腦的海馬體，在人腦內(nèi)，海馬體負(fù)責(zé)空間學(xué)習(xí)、自身記憶和關(guān)于世界的一般事實的認(rèn)知。

巴尼諾等人期望在深度學(xué)習(xí)網(wǎng)絡(luò)中生成路徑整合。因為路徑整合涉及到記住以前處理步驟的輸出，將其作為下一個處理步驟的輸入，作者使用了一個包含反饋回路的網(wǎng)絡(luò)。他們通過模擬覓食鼠類路徑來訓(xùn)練網(wǎng)絡(luò)。此系統(tǒng)接收了如下的信息：模擬鼠類的線性速度和角速度，關(guān)于位置細(xì)胞和方向細(xì)胞的模擬活動；后者可以看作鼠類目前位置和頭部方向的“預(yù)言”。

作者發(fā)現(xiàn)，在訓(xùn)練期間，類似網(wǎng)格細(xì)胞的活動模式自發(fā)地出現(xiàn)在網(wǎng)絡(luò)中間層內(nèi)的計算單元內(nèi)，盡管網(wǎng)絡(luò)或訓(xùn)練協(xié)議內(nèi)沒有明確這類模式。類似網(wǎng)格單元的出現(xiàn)是令人印象深刻的例子，說明深度學(xué)習(xí)在做其最擅長的事情，即發(fā)明一個原始、經(jīng)常是不可預(yù)測的內(nèi)部表示來幫助解決任務(wù)。

人工智能系統(tǒng)學(xué)會走捷徑在哺乳動物大腦中，位置細(xì)胞在動物處于某環(huán)境內(nèi)特定位置時激活，頭部方向細(xì)胞在頭部處于某個特定方向時激活，而網(wǎng)格細(xì)胞則在動物在環(huán)境中形成六邊形網(wǎng)格時激活。巴尼諾等人訓(xùn)練了一種稱為“深度學(xué)習(xí)網(wǎng)絡(luò)”的人工智能系統(tǒng)來進(jìn)行導(dǎo)航，通過向其提供鼠類覓食方式的模擬來訓(xùn)練，包括訓(xùn)練位置細(xì)胞和頭部方向細(xì)胞的活動。網(wǎng)絡(luò)內(nèi)的一些計算單元建立起了類似網(wǎng)格細(xì)胞的激活方式（沒有顯示）。a,當(dāng)學(xué)習(xí)向某個目標(biāo)進(jìn)行導(dǎo)航時，使用網(wǎng)格細(xì)胞的系統(tǒng)（黑線表示一種樣本路徑）和使用位置細(xì)胞和頭部方向細(xì)胞的系統(tǒng)（灰線）采用的是相同的路徑。b,但是當(dāng)導(dǎo)入捷徑時，例如打開了以前關(guān)閉的門時，只有使用網(wǎng)格細(xì)胞的系統(tǒng)發(fā)現(xiàn)了較短的路線，彰顯了類似網(wǎng)格細(xì)胞的活動改善靈活導(dǎo)航策略的能力

類似網(wǎng)格的單元可以使網(wǎng)絡(luò)在路徑整合的基礎(chǔ)上保持對位置的跟蹤，這樣的單元能否幫助深度學(xué)習(xí)系統(tǒng)學(xué)會有效地從其目前位置導(dǎo)航到目標(biāo)位置呢？為了解決這個問題，巴尼諾等人添加了一個強(qiáng)化學(xué)習(xí)元件，使得深度學(xué)習(xí)網(wǎng)絡(luò)學(xué)會賦值給特定位置的特定動作。作為獎勵，更高的值賦與使模擬鼠類更接近目標(biāo)的動作。類似網(wǎng)格的表示顯著改善了網(wǎng)絡(luò)解決目標(biāo)定向任務(wù)的能力，優(yōu)于起始和目標(biāo)位置由位置細(xì)胞和方向細(xì)胞編碼的對照模擬。當(dāng)諸如關(guān)閉的門等障礙物被移除時，經(jīng)過訓(xùn)練的網(wǎng)絡(luò)會發(fā)現(xiàn)捷徑，甚至能夠在以前未被探索過的熟悉環(huán)境的附件內(nèi)推測達(dá)到目標(biāo)的路徑。這些結(jié)果支持這樣的觀念：網(wǎng)格細(xì)胞使大腦能夠執(zhí)行矢量計算（關(guān)于路徑的長度和方向的計算），以幫助在以前未被探索的環(huán)境中進(jìn)行路徑規(guī)劃。

將來，作者的深度學(xué)習(xí)網(wǎng)絡(luò)可用來探索網(wǎng)格細(xì)胞和位置細(xì)胞之間相互作用的后果。在目前的網(wǎng)絡(luò)內(nèi)，模擬的位置層在訓(xùn)練期間并不發(fā)生改變。但是，在大腦內(nèi)，網(wǎng)格細(xì)胞和位置細(xì)胞彼此相互影響，其途徑還未被充分認(rèn)識。盡管在缺乏網(wǎng)格細(xì)胞輸入的情況下，真實生命的位置細(xì)胞可以保持對空間的選擇；但是，當(dāng)動物遠(yuǎn)離可用于定義位置的外部標(biāo)志時，這些輸入似乎會很重要。在這些情況下，位置細(xì)胞依賴路徑整合，而網(wǎng)格細(xì)胞則保持對位置的精確估計。通過建立這樣的網(wǎng)絡(luò)，使得位置細(xì)胞層可以受到類似網(wǎng)格輸入的調(diào)控，我們可以開始認(rèn)識位置細(xì)胞與網(wǎng)格細(xì)胞的關(guān)系。

從更廣義的視角來看，如下的方面是非常有趣的，即深度學(xué)習(xí)網(wǎng)絡(luò)可以發(fā)現(xiàn)類似大腦的路徑整合的解決方案，該解決方案來自非常普通的計算假定，不考慮特定的生物學(xué)機(jī)制。網(wǎng)絡(luò)集中于這樣一種解決方案是令人信服的證據(jù)，表明網(wǎng)格細(xì)胞活動模式存在一些特殊之處，支持路徑整合。但是，深度學(xué)習(xí)系統(tǒng)的黑箱特性意味著可能會很難確定那些特殊之處是什么。

同樣地，網(wǎng)格表示增強(qiáng)了目標(biāo)定向的事實，令人信服地證明了大腦內(nèi)網(wǎng)格細(xì)胞的作用的概念。但是，作者必須使用相關(guān)性分析，以定性的直覺為指導(dǎo)，間接推斷出網(wǎng)絡(luò)正在進(jìn)行向量計算。由于在模型內(nèi)無法直接操作這些計算，使得研究網(wǎng)格細(xì)胞成為有效導(dǎo)航方案的計算原理、算法和編碼策略變得困難。因此，理論家最終陷入了與實驗主義者同樣的困境：試圖將一個不太為人所了解的復(fù)雜體系拆開來理解它。使深度學(xué)習(xí)系統(tǒng)更能理解人類推理是未來一項令人興奮的挑戰(zhàn)。

資料來源 Nature