許天燊
戲劇性、精彩、震撼、刺激、受激發(fā),看完5場“人機大戰(zhàn)”,朋友圈里的工程師們無不撫掌贊嘆,意猶未盡。
比賽開始之前,李世石九段認(rèn)為應(yīng)該是5:0擊敗AlphaGo,有人建議他找搞AI的人了解一下機器圍棋,做一些準(zhǔn)備,他覺得沒有太大必要。
第一局,AlphaGo的棋風(fēng)和人類棋手就不太一樣,走出一些“創(chuàng)新”下法,李世石由于輕敵,過早地展開了短兵相接的戰(zhàn)法,布局出現(xiàn)弱點,而AlphaGo穩(wěn)扎穩(wěn)打,全局幾無失誤,以吃掉人類棋手一條大龍的戰(zhàn)績,獲得了輝煌勝利。隨即繼續(xù)連勝兩局,下完了第三局,李世石九段的目標(biāo)改為“希望盡力贏一局”。第四局,戲劇性的反轉(zhuǎn)出現(xiàn)!人類的自尊暫時得到了挽回,AlphaGo走下了神壇。第五局,就在大家都認(rèn)為人類將獲勝的時候,李世石又顯示了人性脆弱的一面,在局面占優(yōu)的情況下沒有擴大戰(zhàn)果,只下出幾步緩手,即被抓住機會,以微弱優(yōu)勢取得勝利。總的來說,AlphaGo已經(jīng)達到了頂尖棋手的水平,但是還沒有達到遠(yuǎn)超人類的程度。
從AlphaGo的原理可以看出,計算機離替代人腦還很遙遠(yuǎn)。這次對戰(zhàn)只是說明,在對等完全信息博弈領(lǐng)域,計算機接近了人類大腦。它的算法主要基于蒙特卡洛搜索(MCTS)和人工神經(jīng)網(wǎng)絡(luò),簡單地說,是從當(dāng)前局面出發(fā),選擇一些概率大的分支進行窮盡試算,向下試25步。AlphaGo比Zen、Crazystone等之前的程序棋力大增,主要是加入了人工神經(jīng)網(wǎng)絡(luò),能從巨量的歷史棋局和自我對弈中學(xué)習(xí),了解到哪些分支的勝率大。和機器相比,人有直覺和經(jīng)驗,即使不怎么懂圍棋的人,從棋子的擺放經(jīng)常也能感覺出哪方占優(yōu),人類依據(jù)棋理、定式,剪掉大部分無效分支,極大減少了計算量,好比人能從一群人中直接認(rèn)出熟人。但機器只能逐個比對,計算機的長處是計算,而短板也是計算。面對大于全宇宙原子數(shù)量的棋局變化,用上再多的機群和云,也不夠窮盡一切變化,計算機注定也無法成為“圍棋上帝”,目前的算法只計算25步,復(fù)雜狀態(tài)下,機器可能會剪掉正確的分支。
要達到真正的人腦思考,處理真實社會中占絕大多數(shù)的非完全信息,還存在兩個巨大障礙:一是對自然語言的理解;二是對人類知識體系的理解,尤其是第二點,目前幾乎還沒有把人文知識,系統(tǒng)地抽象出來的算法,期待下一個技術(shù)飛躍,將人工智能帶進上新的高度。
佩服Google,設(shè)計出這么有趣的人機對戰(zhàn),讓大眾一起分享前沿科技突破所帶來的全新視野和欣喜。這對人工智能的發(fā)展、對圍棋的普及都將起到巨大的推動作用,非常值得借鑒。信息技術(shù)從業(yè)人員,應(yīng)該學(xué)習(xí)Google的精神,別只在各自行業(yè)的小空間中埋頭工作,不妨用心設(shè)計一些有意思的環(huán)節(jié),與社會共賞其工作成果,也讓自己的工作在公眾面前經(jīng)受考驗,能經(jīng)過這一關(guān),含金量那才是真的高。