南露
假如,有一天,在每個(gè)家庭,都有一個(gè)機(jī)器人,洗碗做飯,收拾房間,承擔(dān)所有的家務(wù);在每個(gè)公司,大部分工作都由機(jī)器人來做,人類可以完全擺脫苦力勞動(dòng)。這樣的未來,會(huì)不會(huì)對(duì)你很有吸引力?但要想進(jìn)入這樣一個(gè)夢想中的人工智能時(shí)代,我們得先教會(huì)機(jī)器學(xué)習(xí)。
讓機(jī)器自我學(xué)習(xí)
就像每個(gè)人在獲得技能前,必須經(jīng)歷過學(xué)習(xí)訓(xùn)練一樣,機(jī)器要實(shí)現(xiàn)智能化,也只能通過學(xué)習(xí)。機(jī)器學(xué)習(xí)起源于人工智能的一個(gè)分支,在這一領(lǐng)域,計(jì)算機(jī)科學(xué)試圖創(chuàng)造計(jì)算機(jī)的類人智慧。
真正的機(jī)器學(xué)習(xí)與我們所認(rèn)為的傳統(tǒng)編程有本質(zhì)的不同。當(dāng)提到電腦程序時(shí)(或者一個(gè)程序里用到的運(yùn)算法則),我們一般會(huì)認(rèn)為是工程師為電腦下達(dá)了一系列指令,告訴他們怎么樣去處理一系列的輸入,然后產(chǎn)生相應(yīng)的輸出。一個(gè)瀏覽器會(huì)跟蹤被瀏覽的網(wǎng)頁,然后對(duì)于用戶的輸入通過一種確定的可預(yù)料的方法進(jìn)行回應(yīng)。但這些都是由人類事先編碼好的,而非機(jī)器主動(dòng)學(xué)習(xí)的結(jié)果。
機(jī)器學(xué)習(xí),就是機(jī)器自己編程,這些機(jī)器經(jīng)過培訓(xùn),也能像人類一樣進(jìn)行編程。谷歌公司2015年發(fā)布了一款名為“深夢”的圖片識(shí)別應(yīng)用軟件,這款軟件不僅可以識(shí)別圖像,而且可以利用圖像制造一些出人意料的奇幻景象。例如,你呈現(xiàn)一幅風(fēng)景圖時(shí),軟件會(huì)根據(jù)你的圖片進(jìn)行分析,輸出一幅計(jì)算機(jī)眼中的風(fēng)景圖。
這是怎么做到的呢?谷歌深夢的運(yùn)作原理是通過模擬人類的神經(jīng)元網(wǎng)絡(luò),建立起計(jì)算機(jī)自己的神經(jīng)網(wǎng)絡(luò)系統(tǒng),通過神經(jīng)元獲得物體的信息,從而進(jìn)行分析。計(jì)算機(jī)的神經(jīng)元網(wǎng)絡(luò)系統(tǒng)包含了上千個(gè)互動(dòng)的神經(jīng)元,以實(shí)現(xiàn)數(shù)學(xué)上的精密運(yùn)算。
當(dāng)然,為了讓機(jī)器能識(shí)別物體信息,在過去四年里,研究者們一直用大量圖片訓(xùn)練電腦神經(jīng)網(wǎng)絡(luò),例如給“深夢”軟件看許多圖片,并告訴每張圖片中的主體是什么,一旦“深夢”從上百個(gè)角度看過上百個(gè)狗頭一千次之后,它就能學(xué)會(huì)自己輸出圖像。
在實(shí)驗(yàn)中,“深夢”產(chǎn)生出了混合著鳥、眼睛和狗頭輪廓的模糊圖像,雖然它們并不那么栩栩如生,但是也揭示了電腦處理圖像時(shí)的一種創(chuàng)造性,它已經(jīng)不用人類監(jiān)督指導(dǎo)地學(xué)會(huì)了識(shí)別小貓、小狗的臉。
神經(jīng)網(wǎng)絡(luò)的機(jī)器構(gòu)造模仿了人類大腦,也充分發(fā)揮了計(jì)算機(jī)超強(qiáng)的記憶功能,在生活中有更普遍地應(yīng)用。谷歌的搜索引擎、亞馬遜的推薦目錄、臉書的好友動(dòng)態(tài)和垃圾郵件的過濾,還有軍事、金融、科研、比人類駕車更靠譜的自動(dòng)駕駛等重要工作,都是神經(jīng)網(wǎng)絡(luò)運(yùn)作的具體應(yīng)用。
今天,機(jī)器學(xué)習(xí)已經(jīng)被成功地應(yīng)用于更多領(lǐng)域,從檢測信用卡交易欺詐的數(shù)據(jù)挖掘程序,到獲取用戶閱讀興趣的信息過濾系統(tǒng),再到能在高速公路上自動(dòng)行駛的汽車。可以說,我們的智能生活,都是機(jī)器學(xué)習(xí)的結(jié)果。
研究機(jī)器人學(xué)習(xí)的算法
機(jī)器學(xué)習(xí)能追溯到上世紀(jì)40年代二戰(zhàn)結(jié)束前后,得益于戰(zhàn)時(shí)交戰(zhàn)雙方的科學(xué)精英殫精竭慮,計(jì)算機(jī)理論在那一時(shí)期得到突飛猛進(jìn)的發(fā)展。當(dāng)時(shí),控制論研究者們設(shè)想有一個(gè)神經(jīng)元計(jì)算機(jī)模型,能夠大致模擬生物神經(jīng)元,并且可以用一種簡潔和明確的數(shù)學(xué)形式來表示。
但是,面對(duì)一個(gè)不確定性和多樣性的世界,人工預(yù)先制定的數(shù)學(xué)形式根本就難以應(yīng)付?;蛘哒f,人工編程的世界,與現(xiàn)實(shí)的人類世界偏差太遠(yuǎn),現(xiàn)實(shí)的世界不會(huì)那么有秩序和守規(guī)則。
例如,計(jì)算機(jī)預(yù)先以數(shù)學(xué)形式來表達(dá)馬有四條腿,但這會(huì)產(chǎn)生兩個(gè)問題。首先,電腦怎么樣去學(xué)會(huì)理解這個(gè)事實(shí);其次,對(duì)于那些因意外而失去了一條腿的馬怎么辦。這些看似是很愚蠢的問題,卻是人工編程時(shí)遇到的最大障礙。這就是為什么至今搜索引擎還不能回答問題、僅僅能搜索關(guān)鍵詞的原因所在。
但如果機(jī)器學(xué)習(xí)創(chuàng)造了自我編程系統(tǒng),就可以對(duì)于他們自己的錯(cuò)誤做出反應(yīng),并且不斷更新他們的內(nèi)部狀態(tài)。人工編程中的漏洞在發(fā)布之前需要被檢查出來,而機(jī)器學(xué)習(xí)的運(yùn)算法則能在過程之中不斷糾錯(cuò),比人工智能更加靈活、有智慧。
但怎么能讓機(jī)器學(xué)習(xí)呢?這就涉及到算法??梢哉f,算法是構(gòu)建互聯(lián)網(wǎng)的核心,現(xiàn)在許多網(wǎng)絡(luò)搜索和溝通方式,都是基于設(shè)定好的數(shù)學(xué)公式構(gòu)建起來的,比如谷歌搜索引擎、蘋果語音系統(tǒng)、Facebook。在信息時(shí)代,我們的生活實(shí)際上是被一些數(shù)學(xué)公式引導(dǎo)著,在醫(yī)學(xué)方面,已經(jīng)有了公式能算出糖尿病和瘧疾。今天,我們也在讓學(xué)習(xí)公式的機(jī)器查看胸透時(shí)的X線量。
連接學(xué)習(xí)、符號(hào)推演法、貝葉斯學(xué)習(xí)、類比學(xué)習(xí)是4個(gè)當(dāng)代計(jì)算機(jī)學(xué)習(xí)范式。其中,連接學(xué)習(xí)就是模仿人腦神經(jīng)系統(tǒng),建立起計(jì)算機(jī)人工神經(jīng)網(wǎng)絡(luò);符號(hào)推演法就是將問題或知識(shí)表示成某種邏輯網(wǎng)絡(luò),采用符號(hào)推演的方法來學(xué)習(xí);貝葉斯學(xué)習(xí)理論就是通過概率規(guī)則來實(shí)現(xiàn)學(xué)習(xí)和推理過程;類比學(xué)習(xí)就是通過對(duì)相似事物進(jìn)行比較來學(xué)習(xí)。這4種學(xué)習(xí)范式還是過于復(fù)雜了,因此,華盛頓大學(xué)教授佩德羅·多明戈斯提供了一個(gè)更大膽的假設(shè),即在未來,能將現(xiàn)有的算法公式統(tǒng)一成一個(gè)萬能算法。
萬能算法下的世界
多明戈斯構(gòu)思了這樣一個(gè)萬能算法,它能將物理學(xué)、生物學(xué)上已經(jīng)發(fā)現(xiàn)的理論和標(biāo)準(zhǔn)模型或者中心法則統(tǒng)一起來,同時(shí),可以從數(shù)據(jù)中發(fā)現(xiàn)所有的知識(shí),所有的人類現(xiàn)有的知識(shí),也包括所有的未來的知識(shí)。例如,萬能算法可以從第谷·布拉赫的太空觀察中,推出牛頓定律,即使它沒有相關(guān)的基礎(chǔ)知識(shí)。
大腦皮層可能就是這樣一個(gè)萬能算法的典型例子。一些神經(jīng)學(xué)家認(rèn)為在所有領(lǐng)域,大腦皮層只用到了一個(gè)相同的公式,就能不斷調(diào)整皮層下各級(jí)腦部及脊髓的機(jī)能,使他們能根據(jù)環(huán)境不斷學(xué)習(xí)調(diào)整,聽見、看見或者是弄懂周圍世界的意思。
在信息時(shí)代,萬能算法也將發(fā)揮類似大腦皮層的作用。它能在數(shù)據(jù)云的基礎(chǔ)上,學(xué)習(xí)和利用信息,改變現(xiàn)在呆板的計(jì)算機(jī)被動(dòng)執(zhí)行模式,主動(dòng)改進(jìn)功能和完善輸出,這將給人類信息生活帶來革命性的轉(zhuǎn)變。
例如,現(xiàn)在的網(wǎng)絡(luò)信息量龐雜,打幾個(gè)關(guān)鍵字,卻得到了上百萬網(wǎng)頁,常常令人無法抉擇。但有了萬能算法,電腦將變成百科全書,只要問幾個(gè)問題,就能很迅速地給出準(zhǔn)確答案。
同時(shí),今天的推薦系統(tǒng)也將得到徹底更新?,F(xiàn)在,每個(gè)人會(huì)遇到許多的推薦信息?;诿總€(gè)人留下的碎片化的數(shù)據(jù),上百萬個(gè)推薦系統(tǒng)每天會(huì)為你推薦不同的東西:暴風(fēng)影音從你開始看他們的電影時(shí),就為你推薦電影;亞馬遜根據(jù)你買了什么和沒買什么為你推薦書本;新浪會(huì)在你注冊時(shí)推薦上百個(gè)興趣群。但大多數(shù)人可能更需要的是一個(gè)更聰明的系統(tǒng),能根據(jù)你上網(wǎng)產(chǎn)生的所有的數(shù)據(jù)和信息,來進(jìn)行更具針對(duì)性的推薦服務(wù)。例如,它能在你生活的每個(gè)階段推薦相應(yīng)的東西,不僅是書和電影,還有房子、工作等。為了能達(dá)成這樣的效果,首先就需要來自你日常生活所產(chǎn)生的數(shù)據(jù),但另一方面,也需要萬能算法,因?yàn)槊鎸?duì)大量的數(shù)據(jù),沒有公式也無法處理這些數(shù)據(jù)。
假如真能成功找到萬能算法,人工智能將真正實(shí)現(xiàn)。但對(duì)于未來這一智能圖景,還是不免會(huì)讓人擔(dān)憂。比如,機(jī)器學(xué)習(xí)能夠處理大多數(shù)的工作,世界將會(huì)有一個(gè)很大的失業(yè)群體,他們將怎么生存呢?會(huì)成為社會(huì)不穩(wěn)定之源嗎?假如人工智能被居心叵測的政治家們利用,世界還會(huì)太平嗎?
對(duì)于這些問題,萬能算法的倡導(dǎo)者佩德羅·多明戈斯并不擔(dān)憂,反而十分樂觀。他認(rèn)為計(jì)算機(jī)不會(huì)具備生物進(jìn)化的能力,也不會(huì)自己發(fā)明東西,因此,將不會(huì)對(duì)人類具有威脅性。相反,呆板的工作將由機(jī)器人承擔(dān),人類則去做更有趣的工作。地球的環(huán)境也會(huì)變得越來越好,人類將會(huì)活的更久更快樂,也更有創(chuàng)造性。同時(shí),人們不會(huì)出現(xiàn)在戰(zhàn)場上,機(jī)器人會(huì)親自出征,這些會(huì)防止人類因戰(zhàn)爭而致的傷殘。