張力平
棋牌游戲?qū)θ藖碚f是益智游戲,對人工智能來說是其“智力開發(fā)”的重要手段。棋牌游戲一直被用作人工智能的開發(fā)、測試工具。
過去20年,許多棋牌游戲在人工智能面前紛紛“淪陷”。如中國象棋軟件把頂尖棋手玩得團團轉,“深藍”攻陷國際象棋,“阿爾法狗”在與圍棋高手的“番棋賽”及連續(xù)對戰(zhàn)中獲勝,最近又有人工智能系統(tǒng)擊敗德州撲克高手。至此,頂級人工智能系統(tǒng)都創(chuàng)造了戰(zhàn)勝頂級人類大師的記錄。
人工智能能夠戰(zhàn)勝圍棋棋手可謂登頂成功,人工智能在德州撲克上勝出如征服一座奇峰,也具有重要意義。中國象棋、國際象棋和圍棋都是“完美信息”游戲,玩家在游戲中能獲得公開和對稱的確定性信息,人類玩家的每一步落棋都能被算出所有可能性,人類玩家每個決策點都能被人工智能獨立得出最優(yōu)解。然而,德州撲克是包含很多隱藏信息的“不完美信息”游戲,玩家只能掌握不對稱的信息。由于人工智能系統(tǒng)不具備欺騙對手和體察到對手在欺騙自己等人類獨具的心理能力,雖然一局德州撲克中的決策點數(shù)量少于圍棋,但在每個決策點都需要全盤復雜推理,計算量難以想象,這對人工智能更具挑戰(zhàn)。
機器學習技術是人工智能進步神速的關鍵。在運用深度學習反復自我博弈后,人工智能系統(tǒng)學會了在每一個具體情境出現(xiàn)時進行推理。這非常接近人類玩家的“牌感”。開發(fā)者還會將其與超級計算機聯(lián)網(wǎng)改進算法,使之總能在人類對手制衡自己前搶先一步。
無論是在圍棋上的“明爭”,還是在德州撲克上的“暗斗”,人工智能在“戰(zhàn)勝人類”的道路上銜枚疾行。掌握博弈論的人工智能應用,絕不只是簡單地下棋打牌。人類生活中有許多“不完美信息”的場景。所以,人工智能攻克德州撲克后,其未來還能應用在金融、證券、拍賣、政治和商業(yè)談判、軍事、網(wǎng)絡安全等那些需要人工智能在“不完美信息”的情景中做出決策的領域。人工智能發(fā)展速度,正史無前例地不斷刷新行業(yè)的預期和人類的認知,催生新的以互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算等信息通信技術為核心的行業(yè),幫助人們創(chuàng)新未來。