□文/余 凱
?
人工智能將讓每個(gè)平凡人更偉大
□文/余凱
過(guò)去60年的大部分時(shí)間,人工智能一直基于規(guī)則的系統(tǒng)進(jìn)行發(fā)展。從上世紀(jì)80年代末以來(lái)數(shù)據(jù)驅(qū)動(dòng)的人工智能成為主流,一旦將數(shù)據(jù)導(dǎo)入機(jī)器,機(jī)器就可通過(guò)消化和吸收生成對(duì)世界認(rèn)知的模型。而未來(lái),所有設(shè)備最終都將成為廣義的機(jī)器人,可以進(jìn)行感知、理解、決策。這將為人類發(fā)展提供更多可能性。人工智能的偉大之處不在于讓機(jī)器更偉大,而在于開(kāi)發(fā)智能機(jī)器來(lái)輔助人,讓每個(gè)平凡的人變得更偉大。
1956年,人工智能(artificial intelligence)這個(gè)詞匯誕生于Dartmouth會(huì)議,參會(huì)學(xué)者提出了非常有遠(yuǎn)見(jiàn)的思考,如何讓機(jī)器仿真實(shí)現(xiàn)智能。當(dāng)然,這樣的思想,更早甚至可以追溯到十七世紀(jì)末的哲學(xué)家、數(shù)學(xué)家萊布尼茨,他最早提出通過(guò)數(shù)學(xué)演算來(lái)模擬智能。參加Dartmouth會(huì)議的先賢們雖然有遠(yuǎn)見(jiàn),但有些過(guò)分樂(lè)觀,他們認(rèn)為人工智能的基本問(wèn)題可以在一個(gè)夏天解決,但是這些問(wèn)題至今也沒(méi)有完全解決。
人工智能首先應(yīng)具有感知的能力,通過(guò)傳感器能夠感知到環(huán)境的變化;其次是理解力,從感知階段上升到對(duì)世界的理解;第三是決策能力,通過(guò)理解之后做出決策。
人工智能最簡(jiǎn)單的形式是通過(guò)觀測(cè)到的現(xiàn)象、數(shù)據(jù)、知識(shí),映射成預(yù)測(cè)、判斷。例如,輸入圖像輸出“物體”的名字的映射,就是圖像識(shí)別;輸入語(yǔ)音訊號(hào)輸出“文本序列”,就是語(yǔ)音識(shí)別;輸入一段話輸出“解析的樹(shù)狀結(jié)構(gòu)”,就是云儲(chǔ);輸入車輛行使周邊路況情況輸出“控制決策”,就是自動(dòng)駕駛。
過(guò)去基于規(guī)則的人工智能系統(tǒng),多以演繹的方式來(lái)建立系統(tǒng),其概念類似“一生二,二生三,三生萬(wàn)物”。從一個(gè)基本法則出發(fā),推導(dǎo)出一個(gè)紛繁復(fù)雜的系統(tǒng)。這種方法主要受自然科學(xué)的方法論的影響,通常從不言自明的公理出發(fā),但從這一思維出發(fā)所得到的人工智能系統(tǒng),常常會(huì)過(guò)于簡(jiǎn)單。
傳統(tǒng)基于規(guī)則的人工智能系統(tǒng),沒(méi)有取得積極的成果,但卻得到了很多教訓(xùn)。其一是這個(gè)世界是紛繁的,存在著很多因素和要素,彼此之間有復(fù)雜的影響,形成復(fù)雜的網(wǎng)絡(luò)和系統(tǒng),難以用一個(gè)公式來(lái)描述;其二是有很多因素和參量不能觀測(cè)到,所以系統(tǒng)具備不確定性;如果用確定性的規(guī)則,無(wú)法掌握這樣的復(fù)雜系統(tǒng),要采用基于統(tǒng)計(jì)的概念;其三是現(xiàn)實(shí)世界紛繁復(fù)雜很難完整描述,只有從數(shù)據(jù)中不斷地學(xué)習(xí)、加深對(duì)問(wèn)題的理解,同時(shí)跟隨數(shù)據(jù)的演化和進(jìn)化,才是關(guān)鍵。這也是“大數(shù)據(jù)”的重要意義,數(shù)據(jù)在本質(zhì)上,為人提供了了解世界的可能。
如果說(shuō)2000年以來(lái),由于互聯(lián)網(wǎng)帶來(lái)的數(shù)據(jù)極大豐富,人工智能在搜索、推薦、廣告等互聯(lián)網(wǎng)的應(yīng)用上扮演了關(guān)鍵角色,人工智能處于“潤(rùn)物細(xì)無(wú)聲”的萌芽期。那么在2010年以來(lái),人工智能所處的階段,筆者稱之為“于無(wú)聲處聽(tīng)驚雷”的發(fā)展階段,因?yàn)槲覀冞€是能隱約聽(tīng)到“轟隆隆的雷聲”。人類一直在思考,是否可以通過(guò)技術(shù)的手段復(fù)制人類非凡的大腦和智力,這也是人工智能令人著迷之處?;仡櫺畔⒓夹g(shù)的發(fā)展歷程,從信息理論到圖靈測(cè)試、通信技術(shù)發(fā)展、計(jì)算機(jī)信息科學(xué)等發(fā)展都是為了一個(gè)結(jié)果,即通過(guò)計(jì)算讓機(jī)器具有智能。
現(xiàn)在提到人工智能,一個(gè)頗具浪漫主義的觀點(diǎn)認(rèn)為,“強(qiáng)人工智能”擁有跟人一樣的智能,有強(qiáng)大的學(xué)習(xí)能力。偉大科學(xué)家圖靈的圖靈測(cè)試,提出如果人類分辨不出幕布背后是機(jī)器人還是人,其幕布背后的機(jī)器就具有“強(qiáng)人工智能”。今天的“人工智能”離真正意義上的“強(qiáng)人工智能”還差得很遠(yuǎn)。另一種觀點(diǎn)認(rèn)為,機(jī)器人具備部分的人工智能,我們稱之為“弱人工智能”,它在某個(gè)不確定的環(huán)境下,完成某類特定任務(wù)。
對(duì)人工智能,大家也常常有哲學(xué)思辨的熱情。曾經(jīng)有一個(gè)叫做“思想實(shí)驗(yàn)”的例子:如果一個(gè)房間里關(guān)著一個(gè)不懂中文的英國(guó)人,但是在房間的桌子上有一本中文書(shū)需要他來(lái)進(jìn)行認(rèn)知。而這時(shí)從門外遞進(jìn)一張英文說(shuō)明,需要他按照說(shuō)明查閱書(shū)里內(nèi)容后寫出一份中文翻譯,結(jié)果是他寫出來(lái)了。這看起來(lái)很智能,但是這個(gè)英國(guó)人并不懂中文,他寫出翻譯的表象行為是否是他的智能呢?其實(shí)行為方面表現(xiàn)的智能,并不是真正的智能。有一種解釋是這個(gè)英國(guó)人不懂中文,所以體現(xiàn)不出他的智能,但是“英國(guó)人+書(shū)+房間”,這個(gè)系統(tǒng)是智能的。
在紛繁復(fù)雜的世界里,為解釋人和世界的關(guān)系,孔子提出了“仁”,宗教提出了“彼岸世界”,互聯(lián)網(wǎng)提出了“人和世界的連接”。人和世界的連接包括人和信息、人和商品、人和人、人和服務(wù)的連接,這也催生了一系列行業(yè)機(jī)會(huì),創(chuàng)造了巨大的社會(huì)價(jià)值。互聯(lián)網(wǎng)帶來(lái)的重要啟示,就是高效連接非常重要。
網(wǎng)絡(luò)索引的趨勢(shì)是從無(wú)序到有序,讓無(wú)結(jié)構(gòu)化的信息變得有序,更加方便人們獲取信息;從數(shù)據(jù)到語(yǔ)義,方便人們了解數(shù)據(jù)背后的內(nèi)容;從線下到線上,檢索虛擬信息、商品信息、線下服務(wù)信息。
搜索引擎就是一個(gè)人工智能系統(tǒng),因?yàn)樗幸粋€(gè)非常精致的結(jié)構(gòu):其擁有感知能力,借助免費(fèi)服務(wù),用戶都在為搜索引擎提供數(shù)據(jù),真實(shí)的信息也因此在不斷分層,即外顯信息(在社交上曬出的)、部分信息(在特定地方分享)、隱私信息?;ヂ?lián)網(wǎng)最精巧的商業(yè)模式之一,就是拿著用戶信息實(shí)現(xiàn)商業(yè)價(jià)值。正因?yàn)閷?duì)用戶的了解足夠正確,就可以推出符合用戶當(dāng)下的廣告或商品,這就是一個(gè)強(qiáng)大的基于大數(shù)據(jù)的人工智能系統(tǒng)。
一切的連接都需要通過(guò)媒介,互聯(lián)網(wǎng)通過(guò)個(gè)人電腦、手機(jī)、智能硬件等延展人的能力,使人和世界的連接更加緊密。通過(guò)大數(shù)據(jù)的支撐,人可以用自然的方式和機(jī)器交互,而機(jī)器可以更好地索引世界。未來(lái)交互的終極形態(tài)將是“心靈感應(yīng)”和“腦機(jī)交互”。
所有這些,都與機(jī)器的進(jìn)化息息相關(guān),即從個(gè)人電腦到智能手機(jī),再分化出智能硬件,最后的趨勢(shì)是發(fā)展出“智能助手”,類似人的助理幫助人完成任何事情。未來(lái)通過(guò)無(wú)處不在的傳感器和強(qiáng)大的計(jì)算能力,人和機(jī)器將完全融為一體,機(jī)器將變成在計(jì)算機(jī)控制下,具有自主行為的機(jī)器,它完全懂得人的想法,并能夠自主完成人們想做的事。
機(jī)器變聰明后其在很多方面將超越人類。如對(duì)機(jī)器而言,學(xué)習(xí)將是一瞬間可完成的事,只需通過(guò)光纖網(wǎng)絡(luò)傳輸。而人要學(xué)習(xí)知識(shí)則需要通過(guò)語(yǔ)言、交流以及很長(zhǎng)的時(shí)間記憶,才能真正地理解。機(jī)器卻能在極短的時(shí)間內(nèi)復(fù)制知識(shí)、交流知識(shí),其對(duì)人類將可能產(chǎn)生威脅。而規(guī)避這個(gè)威脅的方式,是在交互上取得突破性進(jìn)展,使人和機(jī)器的交互變成零距離。這樣,人也可以具有機(jī)器的能力,例如將小型芯片植入人體內(nèi)。
余凱 地平線機(jī)器人科技創(chuàng)始人、CEO
目前人工智能面臨的問(wèn)題是,如何從數(shù)據(jù)中學(xué)習(xí)映射函數(shù),形成訓(xùn)練樣本。例如將多個(gè)圖片定義為“長(zhǎng)頸鹿”這個(gè)標(biāo)簽,系統(tǒng)通過(guò)訓(xùn)練學(xué)習(xí),然后自動(dòng)再將類似新圖片打上這個(gè)標(biāo)簽。
從有限推導(dǎo)無(wú)限是不可能的,除非設(shè)定了假設(shè),如果沒(méi)有假設(shè)就無(wú)法做出判斷。“近朱者赤,近墨者黑”就蘊(yùn)涵了一個(gè)樸素的智慧,即在判斷的時(shí)候一定要隱含假設(shè):兩個(gè)在某些方面相似的人,在其它方面具有相似的特征和特性。
這就反映人工智能的本質(zhì)問(wèn)題,即假設(shè)的合理性。人們希望從數(shù)據(jù)得出的結(jié)論是簡(jiǎn)單的、光滑的,而不是復(fù)雜的。所以哲學(xué)上有一個(gè)詞匯——剃刀原理,它指在能夠同時(shí)解釋某個(gè)現(xiàn)象的幾條規(guī)律中,我們喜歡選擇其中最簡(jiǎn)單的規(guī)律。總而言之,我們希望能夠找到一個(gè)規(guī)律,既能找到觀測(cè)樣本,又能得出簡(jiǎn)單的結(jié)果。
從紛繁復(fù)雜的樣本中抽取并總結(jié)規(guī)律的最好機(jī)制,就是人類的大腦。它能夠舉一反三、不斷地學(xué)習(xí)。在學(xué)習(xí)中,最簡(jiǎn)單的單元就是神經(jīng)元,它有很多神經(jīng)簇,這些神經(jīng)簇和其它的神經(jīng)元相連,神經(jīng)元接收到外部的信息輸入后,把對(duì)信息信號(hào)的反應(yīng)通過(guò)神經(jīng)末梢傳到其它神經(jīng)元,這個(gè)構(gòu)造可以用感知機(jī)模型這個(gè)簡(jiǎn)單的數(shù)學(xué)公式描述?;趩蝹€(gè)神經(jīng)元構(gòu)造具有學(xué)習(xí)能力的人工智能系統(tǒng),像神經(jīng)元一樣,從外界獲得輸入后,傳遞到中央處理的地方,通過(guò)簡(jiǎn)單的運(yùn)算再向外輸出。
今天,這個(gè)簡(jiǎn)單的模型正向幾個(gè)維度擴(kuò)展,其將從線性的輸入/輸出,發(fā)展到深度神經(jīng)網(wǎng)絡(luò),最后形成具備學(xué)習(xí)功能的人工智能系統(tǒng)。
模擬人類大腦的分層結(jié)構(gòu)以及行為
今天已經(jīng)發(fā)現(xiàn)了基于視覺(jué)的神經(jīng)網(wǎng)絡(luò)(科學(xué)家在研究過(guò)程中受到了大腦內(nèi)視覺(jué)信息分層表述的啟發(fā)。隨著視覺(jué)輸入流從視網(wǎng)膜傳輸?shù)匠跫?jí)視皮層,再到下顳葉皮質(zhì),在識(shí)別物體前,每層都會(huì)進(jìn)行處理,從而準(zhǔn)確地識(shí)別物體)。因此,可以用數(shù)據(jù)訓(xùn)練系統(tǒng),讓系統(tǒng)能夠反映出視覺(jué)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和行為。為了模擬這一過(guò)程,神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)者們?cè)谀P椭性O(shè)計(jì)了幾層計(jì)算。剛開(kāi)始,最底層的神經(jīng)元對(duì)顏色不敏感,對(duì)邊界和朝向敏感,它能復(fù)原出物體的輪廓,把輪廓提取出來(lái);上面一層的神經(jīng)元具備一些更有意思的行為,對(duì)物體的部位很敏感;更高一層的神經(jīng)元對(duì)物體開(kāi)始敏感,它是一個(gè)逐層的、從局部到整體的敏感過(guò)程。這就是從數(shù)據(jù)開(kāi)始呈現(xiàn)的視覺(jué)網(wǎng)絡(luò)行為。
在聽(tīng)覺(jué)神經(jīng)系統(tǒng)中也有類似現(xiàn)象,我們用數(shù)據(jù)的深度訓(xùn)練也得到類似的結(jié)果。
深度學(xué)習(xí)特別適合大數(shù)據(jù)
過(guò)去的模型和方法對(duì)大數(shù)據(jù)的處理存在許多問(wèn)題,通常衡量一個(gè)模型的優(yōu)劣是用推廣誤差進(jìn)行測(cè)試。通過(guò)推廣誤差找到原因并得到控制,從而找到一個(gè)更好的學(xué)習(xí)辦法。推廣誤差來(lái)自于以下幾方面:
其一是對(duì)模型進(jìn)行假設(shè),但模型假設(shè)會(huì)存在誤差。在概率統(tǒng)計(jì)學(xué)中有一個(gè)著名的說(shuō)法:你所有的模型都是錯(cuò)的,但有些模型是有用的;
其二是數(shù)據(jù)的不完美,因?yàn)闃颖居邢?、或有噪聲、或有偏差。這幾種情況都會(huì)帶來(lái)誤差,因?yàn)榈湫偷慕y(tǒng)計(jì)學(xué)范疇忽略了一點(diǎn),即假設(shè)了無(wú)限的計(jì)算資源;
其三是計(jì)算機(jī)完成的實(shí)際問(wèn)題也會(huì)導(dǎo)致計(jì)算的不完美,會(huì)導(dǎo)致誤差。所以要盡量讓假設(shè)完美、讓假設(shè)足夠?qū)挿?、收集大量的?shù)據(jù)并尋求算法處理大數(shù)據(jù)。
傳統(tǒng)人工智能算法不能處理更大規(guī)模的數(shù)據(jù),因?yàn)槿绻惴ǖ膹?fù)雜性和樣本是立方的關(guān)系,當(dāng)計(jì)算機(jī)設(shè)備數(shù)量和樣本成同比立方增長(zhǎng)時(shí),將意味著數(shù)據(jù)增加算法更難,這就是為什么深度學(xué)習(xí)應(yīng)該受到重視,它特別適應(yīng)于大數(shù)據(jù),數(shù)據(jù)越大,算法越好。
深度學(xué)習(xí)是一套靈活的建模語(yǔ)言
寫出一篇好文章和做出一個(gè)好的人工智能系統(tǒng)是相通的,即對(duì)語(yǔ)言有足夠靈活的駕御能力、需要對(duì)所面臨的生活和問(wèn)題有深刻的感悟和思考,靈活的建模語(yǔ)言和內(nèi)在洞察相結(jié)合,才能夠做好。
深度學(xué)習(xí)是歷史上第一次出現(xiàn)的端到端學(xué)習(xí),不管是語(yǔ)音識(shí)別還是從感知、預(yù)處理到預(yù)測(cè)、判斷,過(guò)去絕大部分的工作是做最后一個(gè)部分,而沒(méi)有完成前面的幾個(gè)動(dòng)作。從計(jì)算上來(lái)講,在沒(méi)有深度學(xué)習(xí)之前,上面幾個(gè)步驟是消耗計(jì)算資源的、人工手動(dòng)的,但深度學(xué)習(xí)是一氣呵成的,減少人工手動(dòng)。這個(gè)變化是革命性的,今天這已經(jīng)成為共識(shí)了。
人類大腦是通用處理器嗎?人從猴子到現(xiàn)在的人類,人之所以能夠從物種中脫穎而出,是因?yàn)榇竽X對(duì)人類所需要的特殊能力在不斷進(jìn)行優(yōu)化。從本質(zhì)上說(shuō),大腦是專用處理器,并非通用處理器。
大腦的計(jì)算過(guò)程較慢,但是人腦對(duì)諸如開(kāi)車、打乒乓球等行為進(jìn)行了加速處理,從結(jié)構(gòu)上做了專門的優(yōu)化。
圖2 深度學(xué)習(xí)特別適合大數(shù)據(jù)
人工智能大規(guī)模的應(yīng)用,伴隨著互聯(lián)網(wǎng)的發(fā)展。
2000年-2009年,是人工智能重新起步的發(fā)展階段,其最大的應(yīng)用在于PC互聯(lián)網(wǎng)領(lǐng)域,如搜索、廣告等。
2010年-2019年,語(yǔ)音、圖像、機(jī)器人操作,將獲得突飛猛進(jìn)的發(fā)展。同時(shí),傳統(tǒng)行業(yè)不斷地被顛覆,這是一個(gè)“于無(wú)聲處聽(tīng)驚雷”的時(shí)代。
2020年-2029年將是一個(gè)“陽(yáng)光燦爛”的時(shí)代。交互將無(wú)處不在,人與機(jī)器的操作距離越來(lái)越短,生產(chǎn)線的工人將會(huì)被替代。簡(jiǎn)單、重復(fù)性的工作將被解放,從萬(wàn)物互聯(lián)到萬(wàn)物智能,數(shù)據(jù)將成為商品。但我們也無(wú)需對(duì)機(jī)器有太多的擔(dān)心,2029年的機(jī)器仍是沒(méi)有好奇心、沒(méi)有情感、沒(méi)有自我意識(shí)的。
筆者認(rèn)為,智能不等于智慧。在未來(lái),從萬(wàn)物互聯(lián)到萬(wàn)物智能將有幾大趨勢(shì),即所有設(shè)備都有智能傳感器;所有設(shè)備都與云端結(jié)合;所有設(shè)備都連接人和服務(wù);所有設(shè)備最終都成為廣義的機(jī)器人,可以進(jìn)行感知、理解和決策。
(經(jīng)余凱本人審閱,根據(jù)近期公開(kāi)發(fā)言整理)