在一場(chǎng)令世人矚目的人機(jī)圍棋大戰(zhàn)后,AlphaGo以勝利者的姿態(tài)告訴人們,人工智能真的來(lái)了,它不再只是電影中的場(chǎng)景,而是現(xiàn)實(shí)世界里正在上演的又一輪產(chǎn)業(yè)變革。與此同時(shí),有專家擔(dān)憂人工智能將超越人類智能的潛力和控制,迅速改變?nèi)祟愇拿鳌?/p>
前不久,一場(chǎng)圍棋大戰(zhàn)吸引了全世界的目光。這場(chǎng)大戰(zhàn)在韓國(guó)首爾上演,共5輪。大戰(zhàn)之所以舉世矚目,是因?yàn)閷?duì)戰(zhàn)的雙方是韓國(guó)九段棋手李世石與圍棋人工智能程序AlphaGo。令人驚嘆的是,整個(gè)比賽過(guò)程中,AlphaGo的表現(xiàn)都堪稱完美,最終以4:1擊敗李世石。
這個(gè)戰(zhàn)勝人類世界圍棋冠軍的AlphaGo程序到底是何方神圣?它為什么如此厲害?人工智能對(duì)人類來(lái)說(shuō)到底意味著什么?
人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解人類智能的實(shí)質(zhì),并生產(chǎn)出一種新的、能以與人類智能相似的方式做出反應(yīng)的智能機(jī)器。人工智能是對(duì)人的意識(shí)、思維的信息過(guò)程的模擬,使得機(jī)器能像人那樣思考,甚至超過(guò)人的智能。自1956年這個(gè)概念被提出并確立以來(lái),該領(lǐng)域就被視為人類最高的夢(mèng)想之一。
1997年,IBM的超級(jí)計(jì)算機(jī)“深藍(lán)”以2勝1負(fù)3平的成績(jī)戰(zhàn)勝了當(dāng)時(shí)世界排名第一的國(guó)際象棋大師加里·卡斯帕羅夫,一時(shí)間全球轟動(dòng),而“深藍(lán)”的設(shè)計(jì)者們當(dāng)時(shí)就暢想:何時(shí)計(jì)算機(jī)也能下圍棋呢?
而現(xiàn)在無(wú)疑又是一個(gè)人工智能歷史上最重要的時(shí)刻。圍棋和國(guó)際象棋在復(fù)雜程度上不屬于一個(gè)量級(jí),圍棋是一種變數(shù)極多、充滿不確定的競(jìng)技,每一步棋的可能性都是一個(gè)幾乎無(wú)法窮盡的量級(jí),一回合有250種可能,而一盤棋可以多達(dá)150回合。
此外,下圍棋的過(guò)程中還會(huì)出現(xiàn)“吃子”情況,加劇了其復(fù)雜性。曾任職谷歌公司的李開復(fù)說(shuō),當(dāng)年“深藍(lán)”與卡斯帕羅夫的對(duì)局,實(shí)際上使用的是人工調(diào)整的評(píng)估函數(shù),并用特殊設(shè)計(jì)的硬件和“暴力”的搜索征服了國(guó)際象棋級(jí)別的復(fù)雜度,圍棋則不行。“因?yàn)樗乃阉魈珡V,每一步的選擇有幾百而非幾十;也太深,一盤棋有幾百步而非幾十步?!崩铋_復(fù)在知乎上如此回答。
此外,圍棋問(wèn)題與現(xiàn)實(shí)生活中的問(wèn)題相通,國(guó)人甚至將下圍棋視為洞悉人性、參悟人生的過(guò)程。然而,現(xiàn)在下圍棋的卻是一個(gè)機(jī)器,意味著這個(gè)機(jī)器除了擁有超強(qiáng)的記憶能力、邏輯思維能力,還要擁有創(chuàng)造力甚至個(gè)性。
“感覺(jué)就像一個(gè)有血有肉的人在下棋一樣,該棄的地方會(huì)棄,該退出的地方退出,非常均衡的一個(gè)棋風(fēng),真是看不出出自程序之手?!眹迮琶澜绲谝坏目聺嵳f(shuō),AlphaGo有好幾次落子極其“非常規(guī)”,許多專業(yè)棋手都表示看不懂。而“棋圣”聶衛(wèi)平甚至表示自己想要對(duì)AlphaGo的“驚人一手”脫帽致敬,因?yàn)樗坝貌豢伤甲h的下法辟立了圍棋常識(shí)之外的新天地”。也就是說(shuō),這不是AlphaGo從既往棋局中復(fù)制過(guò)來(lái)的,而是自己創(chuàng)造的戰(zhàn)術(shù)打法。
實(shí)際上,AlphaGo是通過(guò)蒙特卡洛樹搜索算法和兩個(gè)深度神經(jīng)網(wǎng)絡(luò)合作來(lái)完成下棋。在與李世石對(duì)陣之前,谷歌首先用人類對(duì)弈的近3000萬(wàn)種走法來(lái)訓(xùn)練AlphaGo的神經(jīng)網(wǎng)絡(luò),讓它學(xué)會(huì)預(yù)測(cè)人類專業(yè)棋手怎么落子。然后更進(jìn)一步,讓AlphaGo自己跟自己下棋,從而又產(chǎn)生規(guī)模龐大的全新棋譜。谷歌工程師曾宣稱AlphaGo每天可以嘗試百萬(wàn)量級(jí)的走法。
“它們的任務(wù)在于合作‘挑選出那些比較有前途的棋步,拋棄明顯的差棋,從而將計(jì)算量控制在計(jì)算機(jī)可以完成的范圍內(nèi)。在本質(zhì)上,這和人類棋手所做的一樣?!敝锌圃鹤詣?dòng)化研究所博士研究生劉加奇說(shuō)。
“傳統(tǒng)的棋類軟件一般采用暴力搜索,包括深藍(lán)計(jì)算機(jī),它是對(duì)所有可能結(jié)果建立搜索樹,根據(jù)需要進(jìn)行遍歷搜索。這種方法在國(guó)際象棋、跳棋等方面還具有一定可實(shí)現(xiàn)性,但對(duì)于圍棋就無(wú)法實(shí)現(xiàn)。”中科院自動(dòng)化研究所研究員易建強(qiáng)說(shuō),“ AlphaGo利用深度學(xué)習(xí)的方法降低了搜索樹的復(fù)雜性,搜索空間得到有效降低。比如,策略網(wǎng)絡(luò)負(fù)責(zé)指揮計(jì)算機(jī)搜索出更像人類高手該落子的位置,而估值網(wǎng)絡(luò)負(fù)責(zé)指揮計(jì)算機(jī)搜索出后續(xù)更有可能獲勝的一個(gè)落子位置?!?/p>
劉加奇進(jìn)一步解釋,深度神經(jīng)網(wǎng)絡(luò)最基礎(chǔ)的一個(gè)單元就類似人類大腦的神經(jīng)元,很多層連接起來(lái)就好比是人類大腦的神經(jīng)網(wǎng)絡(luò)。AlphaGo的兩個(gè)神經(jīng)網(wǎng)絡(luò)“大腦”分別是策略網(wǎng)絡(luò)和估值網(wǎng)絡(luò)。
“策略網(wǎng)絡(luò)主要用來(lái)生成落子策略。在下棋的過(guò)程中,它不是考慮自己應(yīng)該怎么下,而是想人類的高手會(huì)怎么下。也就是說(shuō),它會(huì)根據(jù)輸入棋盤當(dāng)前的一個(gè)狀態(tài),預(yù)測(cè)人類下一步棋會(huì)下在哪里,提出最符合人類思維的幾種可行的下法。”
然而,策略網(wǎng)絡(luò)并不知道自己要下出的這步棋到底下得好還是不好,它只知道這步棋是否跟人類下的一樣,這時(shí)就需要估值網(wǎng)絡(luò)來(lái)發(fā)揮作用。
劉加奇說(shuō):“估值網(wǎng)絡(luò)會(huì)為各個(gè)可行的下法評(píng)估整個(gè)盤面的情況,然后給出一個(gè)勝率。這些值會(huì)反饋到蒙特卡洛樹搜索算法中,通過(guò)反復(fù)如上過(guò)程推演出勝率最高的走法。蒙特卡洛樹搜索算法決定了策略網(wǎng)絡(luò)僅會(huì)在勝率較高的地方繼續(xù)推演,這樣就可以拋棄某些路線,不用一條道算到黑?!?/p>
AlphaGo利用這兩個(gè)工具來(lái)分析局面,判斷每種下子策略的優(yōu)劣,就像人類棋手會(huì)判斷當(dāng)前局面以及推斷未來(lái)的局面一樣。在利用蒙特卡洛樹搜索算法分析了比如未來(lái)20步的情況下,就能判斷在哪里下子贏的概率會(huì)高。
人工智能越來(lái)越近。顯然,它并不會(huì)只用來(lái)下棋,實(shí)際上它正掀起一輪輪產(chǎn)業(yè)變革、經(jīng)濟(jì)變革甚至社會(huì)變革。
“人工智能將有助于人類解決疾病、醫(yī)療、氣候、能源、數(shù)據(jù)、游戲等多個(gè)領(lǐng)域的問(wèn)題,我們將與各領(lǐng)域最頂級(jí)的研究人員合作,促進(jìn)人工智能與創(chuàng)業(yè)、產(chǎn)業(yè)領(lǐng)域的有機(jī)結(jié)合?!?AlphaGo開發(fā)者德米什·哈薩比斯表示。
哈薩比斯當(dāng)然不想把人工智能局限于棋盤上,他將目光投向了更為廣闊的世界,力爭(zhēng)開發(fā)出可以用于多個(gè)領(lǐng)域的通用型學(xué)習(xí)機(jī)器,制造出可以像人類一樣從白紙狀態(tài)通過(guò)自主學(xué)習(xí)找到問(wèn)題解決方案的人工智能。他將這一目標(biāo)比喻為實(shí)現(xiàn)人類登月夢(mèng)想的“阿波羅計(jì)劃”。哈薩比斯還說(shuō),未來(lái)將開發(fā)在任何地方都能使用的通用人工智能。也就是說(shuō),從硬件到軟件、從個(gè)別商品到系統(tǒng)的統(tǒng)合,這種趨勢(shì)將會(huì)改變產(chǎn)業(yè)和人們的日常生活。
同哈薩比斯一樣,全球頂級(jí)企業(yè)也將“賭注”壓在了人工智能之上。全球科技商業(yè)預(yù)言家、暢銷書《失控》作者凱文·凱利認(rèn)為,未來(lái)20年,全球最重要的技術(shù)就是人工智能。英國(guó)帝國(guó)理工學(xué)院的人工智能學(xué)者馬克·戴森羅克說(shuō):“如果人工智能以這種速度發(fā)展下去,我們或許在未來(lái)10年到20年里就能看到電影《鋼鐵俠》中那個(gè)人工智能助手賈維斯?!?/p>
韓國(guó)《中央日?qǐng)?bào)》的報(bào)道稱,人工智能的威力正在進(jìn)入實(shí)用階段,因?yàn)橄窆雀?、IBM、微軟、蘋果、Facebook這種世界級(jí)的信息通信技術(shù)企業(yè),把與大數(shù)據(jù)相結(jié)合的人工智能技術(shù)陸續(xù)在醫(yī)療、金融、體育、社交網(wǎng)絡(luò)領(lǐng)域?qū)崿F(xiàn)實(shí)用化。人工智能技術(shù)與制造業(yè)的接軌也在變快。有人預(yù)測(cè),如果人工智能與無(wú)人駕駛汽車接軌,那么將沒(méi)有交通事故,保險(xiǎn)公司也將無(wú)需存在。如果讓人工智能與無(wú)人機(jī)接軌,毫無(wú)疑問(wèn)這將使得商業(yè)化如虎添翼,也將給武器系統(tǒng)帶來(lái)影響。
此外,2015年,專注于初創(chuàng)企業(yè)的市場(chǎng)調(diào)查公司“風(fēng)險(xiǎn)掃描”追蹤分析了全球855家人工智能初創(chuàng)企業(yè),發(fā)現(xiàn)這些企業(yè)橫跨13個(gè)門類,總估值超過(guò)87億美元,其中計(jì)算機(jī)深度學(xué)習(xí)和視覺(jué)圖像識(shí)別兩個(gè)方向最受投資者青睞。
在科幻電影《超驗(yàn)駭客》中,約翰尼·德普飾演的科學(xué)家因?yàn)檠邪l(fā)人工智能而被恐怖組織暗殺,臨死之前倉(cāng)促地將自我意識(shí)上傳至電腦。最后,這名科學(xué)家成為一個(gè)能夠不斷進(jìn)化的結(jié)合生物智慧和人工智能的“超級(jí)計(jì)算機(jī)”。
AlphaGo戰(zhàn)勝李世石之后,人工智能通過(guò)自我進(jìn)化增加智慧已變?yōu)楝F(xiàn)實(shí)。搜狗CEO王小川認(rèn)為,人工智能能做到隨著時(shí)間推移變得越來(lái)越聰明,正如金庸小說(shuō)中老頑童讓自己的左手和右手“互搏”,從而練就絕世武功。
“在下棋這個(gè)領(lǐng)域,AlphaGo這樣一臺(tái)在算法上沒(méi)有天花板的機(jī)器,將有機(jī)會(huì)登峰造極。”王小川評(píng)價(jià)說(shuō)。
并非所有人都對(duì)人工智能抱以樂(lè)觀的態(tài)度。早在1993年,美國(guó)科幻作家弗諾·文奇在《即將到來(lái)的技術(shù)奇點(diǎn)》一文中寫道:“在未來(lái)30年間,我們將有技術(shù)手段來(lái)創(chuàng)造超人的智慧。不久后,人類的時(shí)代將結(jié)束?!痹谒拿枋鲋?,所謂“技術(shù)奇點(diǎn)”是指在未來(lái)的某個(gè)時(shí)期,當(dāng)機(jī)器達(dá)到“強(qiáng)人工智能”時(shí),智商將超過(guò)人類,從而對(duì)人類社會(huì)造成巨大沖擊。
而自稱美國(guó)未來(lái)學(xué)家的庫(kù)茲韋爾則在他2005年出版的《奇點(diǎn)臨近》一書中,把“技術(shù)奇點(diǎn)”進(jìn)一步轉(zhuǎn)述為“奇點(diǎn)理論”。他描述道:“2045年將出現(xiàn)‘奇點(diǎn)時(shí)刻,人類文明走到終點(diǎn),生物人將不復(fù)存在,取而代之的是一個(gè)叫做‘奇點(diǎn)人的新物種。”
霍金也對(duì)人工智能表示極度擔(dān)憂:“人工智能開發(fā)成功將會(huì)是人類歷史上最大的事件。但不幸的是,這可能也會(huì)是最后一個(gè)大事件?!比ツ辏艚疬€與特斯拉創(chuàng)始人伊隆·馬斯克、蘋果計(jì)算機(jī)共同創(chuàng)辦人史蒂夫·沃茲尼克等數(shù)百名頂尖精英發(fā)表聯(lián)署公開信,表示人工智能對(duì)人類生存的威脅更甚于核武器。
霍金認(rèn)為,特別是高科技軍事裝備的普及,如美軍在戰(zhàn)場(chǎng)上大量使用無(wú)人機(jī)遠(yuǎn)程殺敵,或多或少印證了這種憂慮。
不過(guò),人工智能研究者則認(rèn)為,這多半屬于杞人憂天。中科院計(jì)算所副研究員陳天石表示,AlphaGo雖然展示了非凡的才能,但人工智能不大可能像人們想象的那樣進(jìn)步神速。早在上世紀(jì)八十年代,人工神經(jīng)網(wǎng)絡(luò)的算法基礎(chǔ)就已經(jīng)基本構(gòu)建好,但那時(shí)處理器的運(yùn)算能力上不去,使人工神經(jīng)網(wǎng)絡(luò)的威力不能完全發(fā)揮。AlphaGo的成功展示了處理器芯片運(yùn)算能力的進(jìn)步。
“隨著芯片摩爾定律的終結(jié),處理器芯片的運(yùn)算能力不再高速增長(zhǎng),人工智能也很可能會(huì)進(jìn)入一個(gè)瓶頸?!标愄焓f(shuō),“我們距離真正的強(qiáng)人工智能還差得很遠(yuǎn),也許五十年,也許一百年或者更久?!保ū究C合)