最近被各種社交媒體狂刷屏的事件大概要數(shù)李世石大戰(zhàn)“阿爾法圍棋”(AlphaGo)了。“阿爾法圍棋”是谷歌公司研發(fā)的圍棋程序。Go是“圍棋”的意思,而Alpha則來自谷歌的母公司Alphabet(字母表)的名稱。由此看來,谷歌在下一盤很大的棋,在“阿爾法圍棋”之后還會推出一系列人工智能程序挑戰(zhàn)人類智慧。
據(jù)“阿爾法圍棋”研發(fā)者介紹,這款圍棋程序包含兩個“大腦”:一個是對每一步棋進行概率分析的“策略網(wǎng)絡(luò)”,即“策略大腦”;另一個是進行全局判斷的“價值網(wǎng)絡(luò)”,即“價值大腦”。
其實,按照現(xiàn)有的科技發(fā)展規(guī)律,擁有“策略大腦”的計算機贏棋并不是很難。因為任何棋類游戲的落子位置是有限的,只要計算機的計算能力足夠強大,用窮舉法把每一步棋的位置變化都算出來,做到每下一步棋的贏棋概率接近甚至達到100%,這個擁有“策略大腦”的“阿爾法圍棋”就可以成為當(dāng)之無愧的世界第一棋王。和常人對決不同的是,人機對決的關(guān)鍵是前期的幾手棋,人類棋手一旦前期出現(xiàn)失誤,后期再怎么精于算計也贏不了機器。而且每名棋手前期的習(xí)慣走棋方式也是可以根據(jù)歷史數(shù)據(jù)獲取的,這些都大大降低了計算的難度。
“阿爾法圍棋”的設(shè)計師透露,在挑戰(zhàn)李世石之前,他們的內(nèi)部測試概率就是5∶0完勝。這真的不見得是吹牛。1965年,英特爾公司創(chuàng)始人摩爾提出了“摩爾定律”,也就是當(dāng)價格不變時,集成電路上的元器件數(shù)目每隔18?24個月便會增加一倍,性能也會提升一倍。如今,多核中央處理器的出現(xiàn)和云計算技術(shù)使計算機的整體運算速度仍然保持突飛猛進的發(fā)展。2015年10月,“阿爾法圍棋”就以5∶0完勝歐洲圍棋冠軍、職業(yè)二段選手樊麾。
而這次人機大戰(zhàn)最有意思的亮點其實是“阿爾法圍棋”的“價值大腦”。1997年5月,當(dāng)時IBM的超級電腦“深藍”在經(jīng)過六盤對決后,戰(zhàn)勝了國際象棋世界冠軍卡斯帕羅夫?!吧钏{”當(dāng)時只有一個“策略大腦”。而如今“阿爾法圍棋”所擁有的“價值大腦”則會根據(jù)對局的需要做出“價值判斷”。如果一步棋即便會對局部造成損失,但是對全局有價值,計算機也會加以判斷后果斷出招。例如“阿爾法圍棋”對陣李世石第二局中的第37手黑棋,這步棋當(dāng)時被看作是不顧自己左下角損失的“爛”棋,但卻成為后來連聶衛(wèi)平都要“脫帽致敬”的關(guān)鍵一步,體現(xiàn)出“阿爾法圍棋”所具有的“價值判斷”的威力。
不過,贏幾盤棋顯然并不是“阿爾法圍棋”的終極目標(biāo)。谷歌推出圍棋程序的目的還是為了測試人工智能的程度。3月13日,李世石終于扳回一盤,表示“這一勝太有價值,我不會用任何東西來換”。在李世石看來,這盤贏棋的價值在于終于挽回了自己和人類的面子。而擁有“價值大腦”的“阿爾法圍棋”憑借這盤輸棋名正言順地獲得國際圍棋排名的正式積分,成為世界排名第四的正式棋手,因為如果沒有輸棋記錄將不會被記分。不管什么棋,本質(zhì)上還是游戲。對于人類來說,真正的游戲不僅僅在于輸贏,更在于給每一名參與者和旁觀者帶來快樂。從這點來看,能否熟練進行價值判斷才是實現(xiàn)人工智能的關(guān)鍵。
早在古希臘,亞里士多德就提出“人是理性的動物”,也正是在得與失的價值判斷中,人才產(chǎn)生了自我意識,并以此為出發(fā)點開始進行改造外部世界的科學(xué)實踐。與之相應(yīng)的則是感性,它是根據(jù)人的情感好惡對理性價值觀的修訂。理性與感性的共同作用構(gòu)成了人類獨有的智慧和價值體系。從這點來看,“阿爾法圍棋”要想模擬人類的智慧,其實是非常困難的。機器人可以精確計算出自己的利益得失,甚至能掌握人類所具有的知識,卻無法理解人類為崇高的信念而做出自我犧牲、為了尊嚴寧可放棄優(yōu)厚待遇的做法。人工智能的最大難點是如何從“機器性”過渡到“人性”。因此,我們不懼怕贏棋的“阿爾法圍棋”,但可能會懼怕經(jīng)過深思熟慮后主動輸棋以討絕大多數(shù)人喜歡的“阿爾法圍棋”。因為后者可能已經(jīng)進化出人的感情和價值觀,成為真正能與人類匹敵的對手了。
對于這一點,很多影視作品都進行過探討。當(dāng)施瓦辛格扮演的T-800機器人在電影《終結(jié)者5》中說出充滿感情色彩的臺詞“我老了,但是還沒有過時”,你還會認為他是臺只知道打打殺殺的機器嗎?