苑天舒
《棋經(jīng)·十三篇》里講:“棋者,以正合其勢(shì),以權(quán)制其敵?!边@句古老的話在今天人工智能的時(shí)代依然可以綻放出智慧的光芒。7年前,人類和AI上演的圍棋人機(jī)大戰(zhàn),至今仍讓人記憶猶新,也將圍棋這項(xiàng)歷史悠久的智力運(yùn)動(dòng)帶入AI時(shí)代。之后,每一場(chǎng)“人機(jī)大戰(zhàn)”都牽人心弦。作為一個(gè)圍棋愛(ài)好者,我也很關(guān)注這一領(lǐng)域,2017年曾就“人機(jī)大戰(zhàn)”發(fā)表自己的觀點(diǎn),提到了一個(gè)理論——“坍塌理論”。
先簡(jiǎn)單介紹一下“坍塌理論”。圍棋的棋盤(pán)隨著棋子數(shù)量越下越多,棋盤(pán)上能夠落子的地方也就越來(lái)越少,結(jié)果是棋盤(pán)看起來(lái)好像變小了一樣。那么,這個(gè)“越來(lái)越小”是以什么方式變小的呢?
一塊圍棋棋盤(pán)縱橫各19條線,形成361個(gè)交叉點(diǎn)。此時(shí)開(kāi)始下棋,第一個(gè)子從理論上說(shuō)可以放在361個(gè)點(diǎn)的任何一處,也就是說(shuō)第一個(gè)棋子可以有361種可能性。然后是第二個(gè)、第三個(gè)、第四個(gè)棋子的落子可選性分別為360、359、358……理論上講整個(gè)棋盤(pán)的棋局變化可能性就是361的階乘。對(duì)于一張空棋盤(pán),其變化可能性是10的768次方那么大,形象說(shuō)也就是1后面跟著768個(gè)“0”。毫無(wú)疑問(wèn),這是一個(gè)天文數(shù)字。表面上看每落一個(gè)棋子,棋盤(pán)上剩余的空間是按照“361、360、359、358……”遞減。但事實(shí)上,隨著一個(gè)一個(gè)落子,棋盤(pán)上的變化可能性是以兩到三個(gè)數(shù)量級(jí)衰減的,呈現(xiàn)坍塌狀態(tài)——當(dāng)棋盤(pán)上還剩下99個(gè)空之后,則按照每一步衰減一到兩個(gè)數(shù)量級(jí),每下一個(gè)棋子,這盤(pán)棋還有可能的變化是以1的后面抹去兩到三個(gè)“0”的速度衰減的,這就是坍塌。
按照此推算,我們來(lái)看看“人機(jī)大戰(zhàn)”。
想一想1后面跟著768個(gè)“0”,這個(gè)數(shù)怎么讀?過(guò)去,保持世界最快運(yùn)算記錄的計(jì)算機(jī)是我國(guó)的天河二號(hào),其運(yùn)算速度是每秒33.86千萬(wàn)億次。7年前,中國(guó)展出了“神威太湖之光”計(jì)算機(jī),其運(yùn)算速度達(dá)到每秒10億億次,即10的17次方(1后面跟著17個(gè)“0”)。若運(yùn)算一個(gè)小時(shí)(3600秒),其運(yùn)算量的數(shù)量級(jí)也不過(guò)是10的20次方;一天有24個(gè)小時(shí),計(jì)算機(jī)“長(zhǎng)考”一天,也就等于又增加一個(gè)“0”達(dá)到10的21次方;計(jì)算機(jī)“長(zhǎng)考”一年,等于在一天的基礎(chǔ)上增加兩到三個(gè)“0”,達(dá)到10的23次方或者10的24次方。這距離10的768次方是天文差距。可見(jiàn),強(qiáng)大的計(jì)算機(jī)在沒(méi)有落子的棋盤(pán),甚至在走了100手之后的圍棋盤(pán)的面前,都是小巫見(jiàn)大巫,運(yùn)算能力幾乎不足為道。
會(huì)下圍棋的人工智能計(jì)算機(jī)阿爾法狗在對(duì)弈的開(kāi)局、中盤(pán)、收官這幾個(gè)階段里,開(kāi)局到中盤(pán)都是壓力巨大的。隨著“棋盤(pán)坍塌”,它越來(lái)越應(yīng)對(duì)輕松自如。如果人類應(yīng)對(duì)得法,在開(kāi)局到中盤(pán)就可能讓計(jì)算機(jī)累得發(fā)熱冒煙。但是,計(jì)算機(jī)程序的設(shè)計(jì)者采用了一種讓計(jì)算機(jī)擺脫面對(duì)天文級(jí)運(yùn)算量的捷徑,即輸入大量圍棋定式以及各種人類下過(guò)的棋局棋譜,這樣就把開(kāi)局到中盤(pán)的運(yùn)算量大大降低了。只要人類棋手按照定式,或者“類似定式”下棋,或者棋譜行棋,計(jì)算機(jī)都會(huì)捂著嘴偷偷樂(lè)。
等到人類很靠譜地走完布局和中盤(pán),計(jì)算機(jī)便捂著嘴偷樂(lè)著走完了它最擔(dān)心的兇險(xiǎn)之旅,它沒(méi)有發(fā)熱,也沒(méi)有急得冒煙兒,一切都是在計(jì)算機(jī)預(yù)設(shè)程序的掌控之中。接著走下去,越往后計(jì)算機(jī)越輕松。
在我們有生之年,計(jì)算機(jī)的運(yùn)算速度想要達(dá)到10的768次方是不可能的,也就是我們都不會(huì)看到珠穆朗瑪峰變成宇宙天文量級(jí)的高度,但是,在我們和計(jì)算機(jī)下一盤(pán)棋的這一瞬間,因?yàn)槲覀兒芸孔V地按照符合人類倫理的棋理行棋,導(dǎo)致“棋盤(pán)宇宙”坍塌成了珠穆朗瑪峰,最后坍塌到一敗涂地。綜上所述,從運(yùn)算速度來(lái)看,似乎戰(zhàn)勝計(jì)算機(jī)是非常樂(lè)觀的。但是因?yàn)槠灞P(pán)變化存在著“坍塌”問(wèn)題,隨著下棋的手?jǐn)?shù)增加(每落一子,坍塌兩個(gè)0),樂(lè)觀就漸漸走向悲觀,距離戰(zhàn)勝計(jì)算機(jī)就越來(lái)越遠(yuǎn),勝利的愿望從充滿希望坍塌到失望和絕望。
其實(shí),換一個(gè)角度看問(wèn)題,計(jì)算機(jī)的每一步都是不連續(xù)的,都是單獨(dú)計(jì)算的。阿爾法狗并沒(méi)有和對(duì)弈人在下棋,它是在和棋盤(pán)下棋。當(dāng)棋盤(pán)上的變化可能性越多時(shí),計(jì)算機(jī)越“弱”。反之,隨著棋盤(pán)上可以落子的空間越少,棋盤(pán)越來(lái)越小,可選擇變數(shù)越來(lái)越低,計(jì)算機(jī)就漸漸“強(qiáng)大起來(lái)”。其實(shí)計(jì)算機(jī)沒(méi)有變,只不過(guò)是棋盤(pán)上的坍塌式復(fù)雜性降低了。因此,人類對(duì)弈計(jì)算機(jī)的策略就是要擾亂計(jì)算機(jī),不能按照棋譜進(jìn)招,不讓計(jì)算機(jī)按照其內(nèi)設(shè)的捷徑程序運(yùn)算,要最大限度地、在盡可能長(zhǎng)的對(duì)弈過(guò)程中使計(jì)算機(jī)處于超大計(jì)算量狀態(tài),這種飽和運(yùn)算足以讓它體溫升高,器件發(fā)熱甚至冒煙兒,人類就有可能“亂中取勝”。人類不能用與生物人下棋的思維去和計(jì)算機(jī)下棋。
越是對(duì)定式熟悉,越是對(duì)定式的變化熟悉,越是對(duì)名局名譜熟悉,可能就越離不開(kāi)與人類對(duì)弈的固有思維,然而,這恰恰“促進(jìn)”了棋盤(pán)天然本性的更加坍塌?!叭祟愐凰伎迹系劬桶l(fā)笑!” 能不能離開(kāi)人類對(duì)弈的固有思維范式,站在圍棋棋盤(pán)的角度去和計(jì)算機(jī)下棋?
當(dāng)很多人失去戰(zhàn)勝計(jì)算機(jī)的信心時(shí),當(dāng)超一流棋手被阿爾法狗打倒在地的時(shí)候,或許人類能夠輕松地躺在地上,仰望星空,然后丟掉禁錮自己的固有范式,下出完全沒(méi)有機(jī)心機(jī)巧,卻是符合自然天性的一步一步棋,笑著看計(jì)算機(jī)在那里長(zhǎng)時(shí)間思考。所以,人在和阿爾法狗下棋的時(shí)候,不要做自己,要把自己變成棋盤(pán)的“代言人”,用“棋盤(pán)的思路”去和阿爾法狗下棋。
“棋者,以正合其勢(shì),以權(quán)制其敵。”下棋如兩軍對(duì)壘,黑白子即敵我雙方。斗爭(zhēng)的勝敗,有人認(rèn)為就是戰(zhàn)勝敵人。其實(shí)這不全面,也需要戰(zhàn)勝自己。老子曰:“知人者智,知己者明。勝人者有力,勝己者強(qiáng)。”所謂:用“正”克己,用“權(quán)”制敵。