當前人工智能的一個困境是處理“部分與整體”之間的關(guān)系。一個人工智能系統(tǒng)的創(chuàng)建需要依賴有效的算法,但往往只有將系統(tǒng)建立好之后,我們才能知道具體需要哪些核心算法。為了解決這個“雞和蛋”的問題,必須同時研究兩者。在這個過程大量探索可能不會有結(jié)果,但這又是不可避免的。
近日,人工智能公司開設(shè)的首個非英國研究實驗室,發(fā)表了一篇題為《為了AI研究的阿爾伯塔計劃》的文章,并提交在arXiv上。該篇文章的三位作者里奇·薩頓、邁克爾·鮑林和帕特里克·皮拉爾斯基,是Deep Mind Alberta的領(lǐng)導(dǎo)者,并都在加拿大阿爾伯塔大學(xué)擔任教授職位。
本次DeepMind Alberta將其人工智能研究方法,稱為阿爾伯塔計劃。
它主要針對未來5年~10年計算智能的基本理解問題,旨在填補目前研究的空白領(lǐng)域,并不關(guān)注現(xiàn)有方法的立即應(yīng)用。
文章主要對該機構(gòu)的人工智能愿景和這些愿景可能實現(xiàn)的方向,以及將探索的研究問題和項目進行了說明。雖然這些愿景還有著不確定性,但研究人員盡可能具體地描繪了未來的道路。
按照阿爾伯塔計劃,研究人員試圖理解和創(chuàng)造一個富有生命力的計算代理。該文章還提到,代理的初始設(shè)計往往盡可能簡單,且具有通用性和可擴展能力。但它們在不斷與外界交互過程中,逐漸變得復(fù)雜。
從左至右分別為里奇·薩頓、邁克爾·鮑林和帕特里克·皮拉爾斯基
為了適應(yīng)世界的變化,它們必須持續(xù)學(xué)習,用一個“博學(xué)”的模式來做理解和規(guī)劃。文章中還提到:“智能是一段時間內(nèi)的信號處理。”
該研究愿景的第一個特點是強調(diào)普通經(jīng)驗,而不是特殊培訓(xùn)集或人力干預(yù)。盡管有許多方法可以使用人為輸入和領(lǐng)域知識來提高人工智能的性能,但這些方法通常不能適應(yīng)計算資源,因此并不是本次研究的優(yōu)先事項。
第二個顯著特征可以概括為時間一致性。這意味著關(guān)于在代理上運行算法的所有時間都是相同的。時間統(tǒng)一問題涉及非平穩(wěn)、持續(xù)的環(huán)境與學(xué)習算法。
保持所有東西在時間上的統(tǒng)一可以減少自由度,并縮小代理設(shè)計空間。不過,文章也提到,在某些情況下,最好是背離絕對的時間一致性。但當這樣做的時候,可能會脫離原來的研究領(lǐng)域。
研究愿景的第三個顯著特征體現(xiàn)在它對計算因素的考慮。
目前,計算機的能力雖然仍呈指數(shù)級增長,但并不會永遠持續(xù)下去。計算能力越強,有效地使用它越就顯得重要。因為這是決定代理績效的重要因素。
此外,計算方面的考慮還體現(xiàn)在智能代理設(shè)計的各個方面。例如,通常一個智能代理能夠?qū)ζ溆^察結(jié)果的變化做出快速反應(yīng)是很重要的。但是,考慮到計算的限制,反應(yīng)時間和決策質(zhì)量之間總是存在權(quán)衡。
研究愿景的第四個顯著特點是,它包括一個聚焦環(huán)境中含有其他智能代理的特殊情況。
在這種情況下,主要代理可以學(xué)會與環(huán)境溝通、合作和競爭,并能認識到環(huán)境可能對其行為做出不同的反應(yīng)。這個案例被研究為人機交互的一個子領(lǐng)域智能放大。
阿爾伯塔計劃將人工智能問題描述為通過持續(xù)地感知和行動、有限的計算,在其他代理存在的情況下,在線最大化獎勵。這種描述可能看起來很合理,但它與當前的實踐相反。
現(xiàn)實中,通常集中于離線學(xué)習、準備好的訓(xùn)練集、人工輔助和無限計算。所以以上研究愿景既是經(jīng)典的,也是逆向的,甚至是激進的。
本次提到的研究計劃更多是為了就現(xiàn)有的工作達成共識,從而能進行更有效地溝通和合作。
值得一提的是,研究團隊主要圍繞基礎(chǔ)代理進行設(shè)計,其本身是基于“智能代理的通用模型”,該模型也被認為是人工智能、神經(jīng)科學(xué)等多領(lǐng)域的共同模型。如上圖所示。
基本代理有4個主要的內(nèi)部組件,分別是“感知、反應(yīng)性策略、過渡模型和價值函數(shù)”。它們也由感知組件構(gòu)造的狀態(tài)信號相互連接。所有四個組件都是通過在前臺運行的學(xué)習過程來做更新。
最后,文章中還描述了人工智能原型的路線圖,總共涉及12個步驟。從開發(fā)核心能力(表示、預(yù)測、規(guī)劃和控制)的新算法,到將這些算法結(jié)合起來,為連續(xù)的、基于模型的人工智能生成完整的原型系統(tǒng)。
對計算智能的理解,或會影響到社會每一個角落,包括每個人的生活。盡管它有被濫用的可能性,但其存在總體上將對世界有利。
研究團隊還在文章中表示,阿爾伯塔計劃具有臨時、草稿性質(zhì),未來或會繼續(xù)完善編輯它們。特別是最后的步驟還不夠具體,隨著不斷地研究,該部分會取得更多進展。同時,他們也正在考慮關(guān)于智能放大和機器人技術(shù)的研究。