揚(yáng)州職業(yè)大學(xué) 林 革
提起“人機(jī)大戰(zhàn)”,想必許多人都記憶猶新、耳熟能詳。那是指兩位圍棋世界冠軍(韓國(guó)圍棋九段棋手李世石、中國(guó)圍棋九段棋手柯潔)分別與谷歌出品的人工智能?chē)宄绦颉鞍柗ü贰保ˋlphaGo)之間的巔峰對(duì)弈。第一場(chǎng)為2016 年3 月9 日至15 日在韓國(guó)首爾進(jìn)行的五番棋比賽,“阿爾法狗”以總比分4 比1 戰(zhàn)勝李世石;第二場(chǎng)為2017 年5 月23 日至27 日在中國(guó)嘉興烏鎮(zhèn)進(jìn)行的三番棋比賽,“阿爾法狗”以總比分3 比0 戰(zhàn)勝世界排名第一的柯潔,一時(shí)間在全球引起巨大反響和震動(dòng)。人們紛紛提出同樣的問(wèn)題:究竟是人腦強(qiáng)于電腦,還是電腦將會(huì)超越人腦?
事實(shí)上,在圍棋人機(jī)大戰(zhàn)之前,電腦程序與人類(lèi)棋手的對(duì)抗在其他棋類(lèi)游戲中就一直在上演。比如,共有24 枚棋子的西洋跳棋一直是數(shù)世紀(jì)以來(lái)西方人消遣的首選,這個(gè)可追溯到古埃及時(shí)期的游戲,玩法比較簡(jiǎn)單,但要贏得勝利也并非輕而易舉。加拿大計(jì)算機(jī)科學(xué)家在經(jīng)過(guò)18 年的深入研究后,已經(jīng)證明:如果兩個(gè)勢(shì)均力敵的游戲者比賽,游戲結(jié)果必定是平局。
就總體而言,西洋跳棋是一種策略游戲,完全無(wú)法靠運(yùn)氣取勝。因此,計(jì)算機(jī)科學(xué)家選中這個(gè)游戲,來(lái)測(cè)試依靠自身能力直觀掌握情況和做出決策的人腦,是否優(yōu)于在數(shù)十億種可能解答中尋找制勝策略的計(jì)算機(jī)。
1989 年,加拿大阿爾伯塔大學(xué)計(jì)算機(jī)科學(xué)家喬納森·謝弗(Jonathan Schaeffer),研制出名為“奇努克”(Chinook)的計(jì)算機(jī)程序,并邀請(qǐng)當(dāng)時(shí)的頂尖棋手與之展開(kāi)較量。在第一場(chǎng)西洋跳棋人機(jī)大戰(zhàn)中,身為數(shù)學(xué)家的西洋跳棋世界冠軍馬里恩·廷斯利(Marion Tinsley),以微弱優(yōu)勢(shì)險(xiǎn)勝“奇努克”。但兩年之后,結(jié)果發(fā)生了變化。一生只輸過(guò)7 場(chǎng)比賽的廷斯利教授,和“奇努克”連續(xù)打成7 場(chǎng)平局,絞盡腦汁、身心俱疲的數(shù)學(xué)家不得不選擇退出比賽。這完全可以理解,因?yàn)樗臋C(jī)器對(duì)手可不知道什么叫疲勞。自此之后,關(guān)于在西洋跳棋比賽中,電腦是否優(yōu)于人腦的爭(zhēng)論,一直不絕于耳。
于是,謝弗繼續(xù)完善他的程序,這是令人咋舌的艱難任務(wù)。因?yàn)橛螒蜻^(guò)程中會(huì)出現(xiàn)5×1020種可能的情況。數(shù)據(jù)量是如此巨大,以至于計(jì)算機(jī)的“暴力法”(也叫窮舉算法——依賴(lài)于計(jì)算機(jī)的計(jì)算能力來(lái)窮盡每一種可能的游戲情況,從中篩選出最佳走法的策略)也難以奏效,這就要求人腦思考出更聰明的算法。
謝弗和他的團(tuán)隊(duì)建立相應(yīng)數(shù)據(jù)庫(kù),用于分析棋盤(pán)上剩10 子或更少棋子時(shí)的殘局。把需要分析的可能情況數(shù)量減少到只有390 億種,然后根據(jù)黑棋贏、白棋贏和平局這三種不同的結(jié)果,對(duì)這些殘局進(jìn)行分類(lèi)。一直到1996 年,他們花了7 年時(shí)間將8 子或更少棋子的殘局進(jìn)行了分類(lèi)。然后團(tuán)隊(duì)暫停了工作,等待處理能力更強(qiáng)、速度更快的計(jì)算機(jī)問(wèn)世。當(dāng)更為高級(jí)的計(jì)算機(jī)出現(xiàn)之后,研究團(tuán)隊(duì)又開(kāi)始分析9 子和10子的殘局情況,為此常常需要多達(dá)200 臺(tái)的臺(tái)式計(jì)算機(jī)同時(shí)工作。
除此之外,研究團(tuán)隊(duì)還分析了開(kāi)局后走3 步會(huì)出現(xiàn)的各種情況。一個(gè)專(zhuān)門(mén)研發(fā)的程序給出了參賽雙方都有獲勝機(jī)會(huì)的最佳走法。也就是說(shuō),如果兩位選手以此進(jìn)行布局和比賽,最終一定會(huì)以平局收?qǐng)觥?/p>
截至目前,除了西洋跳棋接受了計(jì)算機(jī)程序的挑戰(zhàn)外,對(duì)局?jǐn)?shù)高達(dá)1040、局勢(shì)更為復(fù)雜的國(guó)際象棋也和電腦對(duì)弈過(guò)。最著名的國(guó)際象棋人機(jī)大戰(zhàn),當(dāng)數(shù)1996 年和1997 年國(guó)際象棋世界冠軍加里·卡斯帕羅夫(Garry Kasparov)對(duì)陣IBM 的計(jì)算機(jī)程序“深藍(lán)”(Deep Blue)的兩場(chǎng)比賽。在各賽6盤(pán)的比賽中,棋王卡斯帕羅夫以4 比2 的總比分贏得1996 年的人機(jī)大戰(zhàn),但“深藍(lán)”亦首次對(duì)陣頂尖棋手獲得勝局;而在1997 年的人機(jī)大戰(zhàn)中,經(jīng)過(guò)改進(jìn)的“深藍(lán)”首次以總比分3.5 比2.5 獲勝。后來(lái),國(guó)際象棋大師們不斷挑戰(zhàn)國(guó)際象棋的頂級(jí)人工智能,但最多只能獲得平局或個(gè)別勝局,在總比分上再也不能取勝。
接下來(lái),電腦程序開(kāi)始向人類(lèi)智力游戲僅存的高地——圍棋發(fā)起沖擊。這個(gè)過(guò)程可謂舉步維艱,因?yàn)閲逍枰?jì)算的變化數(shù)量實(shí)在太大,遠(yuǎn)遠(yuǎn)超過(guò)已經(jīng)觀測(cè)到的宇宙中原子的數(shù)量,采用計(jì)算機(jī)進(jìn)行暴力破解完全不可行。但人類(lèi)可以憑借某種難以復(fù)制的算法或直覺(jué),一眼看到棋盤(pán)走勢(shì)的本質(zhì),這就不難理解起步的圍棋程序甚至不能打敗業(yè)余棋手。而當(dāng)“深度學(xué)習(xí)”漸漸進(jìn)入人工智能研究領(lǐng)域,電腦程序的圍棋技藝獲得空前的極速提升,“阿爾法狗”正是基于深度學(xué)習(xí)技術(shù)開(kāi)發(fā)的產(chǎn)品,不斷完善后終于贏得萬(wàn)眾矚目的圍棋人機(jī)大戰(zhàn)。
棋類(lèi)游戲一直被視為頂級(jí)人類(lèi)智力及人工智能的試金石。盡管人工智能程序已經(jīng)在各種棋類(lèi)游戲中全面占據(jù)優(yōu)勢(shì),但就此斷言,人類(lèi)智力將臣服于人工智能,似乎還為時(shí)尚早。唯一可以肯定的是,兩者的發(fā)展和博弈仍將在相當(dāng)長(zhǎng)的時(shí)間內(nèi)繼續(xù),讓我們拭目以待吧!