• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      棋王竟是機器人

      2016-05-06 09:30:58葉子
      當代工人·精品C 2016年2期
      關鍵詞:走棋哈薩走法

      葉子

      在大多數(shù)用來考察人類智慧的游戲中,如國際象棋、拼字游戲、奧賽羅棋、甚至《絕境邊緣》(一個益智問答游戲節(jié)目)中,機器都能毫不費力地擊敗人類。但圍棋一直是一個例外。這款游戲有著2500年的歷史,比國際象棋要艱深復雜得多,即使是最機敏的計算機系統(tǒng),也比人類圍棋大師要差了一大截。就在本月初,一些業(yè)內頂尖的人工智能專家還質疑近期內我們能否在這方面取得突破。去年更有很多人認為,還要再過10年,機器才可能在圍棋比賽中取得上風。

      但谷歌卻先人一步成功了?!斑@比我想象的要快得多?!狈▏芯咳藛T雷米·科隆說道。他研發(fā)的人工智能系統(tǒng)曾是世界上最出色的機器圍棋選手。

      谷歌DeepMind團隊自稱“人工智能領域的阿波羅計劃”。2015年10月,他們在倫敦組織了一場機器與人類之間的對決。該團隊研發(fā)的系統(tǒng)名叫AlphaGo,它要對付的人類選手是歐洲圍棋冠軍樊麾。在《自然》雜志的一名編輯和英國圍棋聯(lián)合會的一名權威人士的監(jiān)督下,他們連續(xù)進行了5輪較量,AlphaGo均取得了勝利?!盁o論是作為一名研究人員還是編輯,這都算是我職業(yè)生涯中最令人激動的時刻之一。”《自然》雜志編輯唐吉·肖爾德博士在一次記者會上說道。

      英國時間1月27日早晨,《自然》雜志發(fā)表了一篇論文,詳細介紹了DeepMind團隊研發(fā)的系統(tǒng)。該系統(tǒng)采用了一種名叫“深度學習”的人工智能技術,這種技術在該領域的地位正變得越來越重要。DeepMind的研究人員從專業(yè)棋手那里收集了大量走棋方法,總步數(shù)多達3000萬次,并利用這些數(shù)據(jù)對AlphaGo系統(tǒng)進行了訓練。但這還只是第一步而已。從理論上來說,這樣的訓練方式頂多能讓計算機系統(tǒng)和最優(yōu)秀的人類選手達到同等水平,不可能超越人類。因此研究人員先讓該系統(tǒng)自己和自己比賽,在這一過程中產生更多的走棋方法,然后再用這些方法訓練新的人工智能系統(tǒng),逐步提高其圍棋水平。

      “最重要的是,AlphaGo不僅僅是一個出色的人工智能系統(tǒng),只知道實行人工植入的規(guī)則”,負責監(jiān)管DeepMind團隊的德米斯·哈薩比斯說道,“它還采用了目前普遍使用的機器學習技術,從而在圍棋比賽中取勝?!?/p>

      這次勝利其實并沒有那么新奇。谷歌、Facebook和微軟等線上服務提供商已經(jīng)使用了深度學習技術,用于辨認圖像、識別語音、以及理解自然語言等。DeepMind將深度學習與一種名為“增強學習”的技術和其他方法結合起來,說明在未來的世界中,機器人能夠學會執(zhí)行各種動作,還能對周圍環(huán)境做出反應。“對于機器人來說,這是順理成章的事情。”哈薩比斯說道。

      他還認為這些手段能加速科學研究的進展。在他的想象中,科學家有一天會和人工智能系統(tǒng)一起工作,而這些人工智能系統(tǒng)將會被運用到可能取得豐碩成果的研究領域中去?!坝嬎銠C系統(tǒng)能夠處理大量數(shù)據(jù),揭露數(shù)據(jù)結構特征,工作效率遠比人類專家要高——有些事情人類甚至根本做不到?!惫_比斯解釋道,“這些計算機系統(tǒng)甚至能為人類專家指明研究方向,引領他們取得突破?!?/p>

      但就目前來看,圍棋仍然是哈薩比斯最關注的領域。讓AlphaGo在辦公室中打敗人類選手之后,哈薩比斯及其團隊希望能在公開的競技場上,和世界頂級圍棋選手一決高下。今年3月中旬,AlphaGo將挑戰(zhàn)韓國棋手李世[石][乙],后者贏得的國際大獎數(shù)居世界第二,是過去10年中獲勝次數(shù)最多的棋手。哈薩比斯將他視為“圍棋世界中的費德勒”。

      2014年年初,科隆研發(fā)的圍棋軟件Crazystone在日本的一次錦標賽中向圍棋大師依田紀基發(fā)起了挑戰(zhàn),并取得了勝利。但這次對決并不公平,因為機器可以先走4步,占據(jù)了巨大的優(yōu)勢。當時科隆預言稱,人工智能至少要再過10年才能在無讓子的圍棋比賽中取勝。

      這項挑戰(zhàn)的難度是由圍棋本身的特點決定的。即使是最強大的超級計算機,也缺乏在合理的時間內分析出每種走法可能的結果的能力。1997年,“深藍”擊敗了世界頂級象棋棋手加里·卡斯帕羅夫,它使用的算法名叫“蠻力窮舉法”。它分析了每一種可能的走法將產生的結果,而人類是不可能考慮這么多的。但這種方法對圍棋就無效了。在國際象棋中,平均每回合有35種走棋方式。而圍棋每回合有250種可能的走棋方式,250種中的每一種又有250種,以此類推。哈薩比斯指出,圍棋棋盤上可能的布棋方式總和比宇宙中所有原子的數(shù)量還多。

      利用一種名叫蒙特卡洛樹的搜索算法,像Crazystone這樣的程序可以提前算出很多步走棋結果。再配合其他技術,它們還可以逐步去除需要分析的走法。這樣一來,它們遲早會打敗一些出色的棋手——但無法擊敗最出色的棋手。對于棋類大師來說,走棋很多時候靠的都是直覺。棋手會根據(jù)棋子的整體分布來選擇走法,而不會細致地分析每一步的結果?!昂玫奈恢每雌饋砭秃芎?,”哈薩比斯說道,他本身就是一名圍棋棋手,“圍棋似乎也遵循一定的審美原則,所以這種游戲才得以延續(xù)數(shù)千年?!?/p>

      但在2014和2015年之交,一些人工智能專家,包括愛丁堡大學、Facebook、以及DeepMind團隊的研究人員,開始采用深度學習法解決圍棋問題。他們的想法是,這種技術能模擬人類的直覺,而直覺正是下圍棋時必不可少的東西。“圍棋是一種含蓄的游戲,講究圖案的配合,”哈薩比斯說道,“而那正是深度學習法所擅長的領域?!?/p>

      深度學習需要依賴所謂的“神經(jīng)網(wǎng)絡”,即由硬件和軟件組成的、模擬人類大腦中神經(jīng)網(wǎng)的網(wǎng)絡。這些網(wǎng)絡采用的不是蠻力窮舉法,也不依靠人工植入的行動準則。它們會對大量數(shù)據(jù)進行分析,試圖“學會”執(zhí)行某個特定的任務。如果讓神經(jīng)網(wǎng)絡看大量的袋鼠照片,它就能學會認出一只袋鼠。如果讓它聽大量的單詞,你再讀出這個單詞時,它就能聽出來你說的是什么。如果讓它了解大量的圍棋走棋方法,它就能學會下圍棋。

      DeepMind團隊、愛丁堡大學和Facebook的研究人員希望,神經(jīng)網(wǎng)絡能夠通過“觀察”棋子位置掌握下圍棋的方法,和人類差不多。Facebook近日在一篇論文中指出,這一技術使用起來相當不錯。他們將深度學習法和蒙特卡洛樹搜索方法結合起來,成功讓計算機打敗了一些人類圍棋棋手。不過他們還沒有擊敗Crazystone和其他頂尖的人工智能系統(tǒng)。

      但DeepMind成功將這一概念向前推動了一大步。在接受了3000萬步人類的圍棋走法訓練之后,DeepMind神經(jīng)網(wǎng)絡能夠以57%的成功率預測人類下一步的走棋方法。這個成功率可謂十分驚人,因為此前的記錄只是44%。接下來,哈薩比斯及其團隊采用增強學習法,讓這個神經(jīng)網(wǎng)絡和另一個與之稍有不同的網(wǎng)絡進行比拼。在兩個神經(jīng)網(wǎng)絡比賽的同時,系統(tǒng)會追蹤哪種走法帶來的效益最大。利用這種方法,該系統(tǒng)越來越能夠識別出哪種走法能夠取得成功,哪種走法則會導致失敗。

      “AlphaGo的神經(jīng)網(wǎng)絡和自己比賽了上百萬次,在這一過程中不斷改進,全靠自己學會了新的走棋策略?!?DeepMind團隊的一名研究人員戴維·希爾佛說道。

      據(jù)希爾佛稱,這種方法使AlphaGo在眾多會下圍棋的人工智能系統(tǒng)中脫穎而出,其中也包括Crazystone系統(tǒng)。然后研究人員將上一步得到的結果輸入二級神經(jīng)網(wǎng)絡中。該網(wǎng)絡使用一級網(wǎng)絡建議的走棋方法,使用了很多相同的方法來預測每一步的結果。這和“深藍”下象棋時的方法類似,只不過AlphaGo系統(tǒng)會邊下邊學,分析更多數(shù)據(jù),而不是通過蠻力窮舉法探索每種可能的結果。利用這種方法,AlphaGo不僅學會了如何打敗現(xiàn)有的人工智能系統(tǒng),還擊敗了頂級的人類棋手。

      和大多數(shù)先進神經(jīng)網(wǎng)絡一樣,DeepMind系統(tǒng)使用的機器也配備了圖形處理器(GPU)。這些芯片最初是用來為游戲和其他對圖形敏感的程序處理圖像的,但研究人員發(fā)現(xiàn),GPU也很適合用來開展深度學習。哈薩比斯表示,只需要用一臺裝配了大量GPU芯片的計算機,DeepMind就能夠運行得很好。但在與樊麾對戰(zhàn)時,研究人員使用了規(guī)模更大的計算機網(wǎng),共裝載了170枚GPU芯片和1200臺標準處理器(CPU)。該系統(tǒng)在訓練時和實際作戰(zhàn)時,使用的都是這一大規(guī)模計算機網(wǎng)。

      等AlphaGo前往韓國挑戰(zhàn)世界冠軍李世[石][乙]時,哈薩比斯的團隊將使用同樣的裝置,不過他們會對其進行不斷改進。這意味著,他們需要聯(lián)網(wǎng)才能和李世[石][乙]作戰(zhàn)?!拔覀冋阡佋O自己需要的網(wǎng)絡光纖?!惫_比斯說道。

      據(jù)科隆和其他專家稱,打敗世界冠軍李世[石][乙]比打敗樊麾要難得多。但科隆對DeepMind團隊寄予厚望。在過去的10年中,他一直在努力打造能擊敗世界頂級棋手的圍棋系統(tǒng),而他現(xiàn)在認為,這樣的系統(tǒng)已經(jīng)被研發(fā)出來了?!拔椰F(xiàn)在買GPU買得不亦樂乎?!彼f道。

      AlphaGo具有極其重要的意義。它采用的技術不僅能用于機器人和科研領域,從類似Siri的移動數(shù)碼助手,到進行金融投資,這一技術在很多任務中都能助人一臂之力?!澳憧梢杂盟鼇斫鉀Q各種棘手的問題,處理任何需要用到策略的、類似于游戲的事情?!鄙疃葘W習初創(chuàng)公司Skymind的創(chuàng)始人克里斯·尼克爾森說道,“比如戰(zhàn)爭或商業(yè)交易等。”

      有些人對此感到有些擔憂,尤其是當他們想到DeepMind系統(tǒng)是通過自學學會圍棋的時候。該系統(tǒng)不僅僅是通過人類提供的數(shù)據(jù)來學習的,它還會產生自己的數(shù)據(jù),做到自己教自己。就在前幾個月,特斯拉創(chuàng)始人伊隆·馬斯克和其他人紛紛表達了自己的擔憂,認為這樣的人工智能系統(tǒng)遲早會超越人類,并脫離我們的掌控。

      但DeepMind系統(tǒng)還處在哈薩比斯等研究人員的嚴密控制之下。雖然他們正在使用該系統(tǒng)破解一款極為復雜的游戲,但游戲到底只是游戲而已。的確,要想媲美真正的人類智慧,AlphaGo還有很長的一段路要走,還遠稱不上超級智能。“眼下的情況非常規(guī)范,”人工智能法律教授、華盛頓大學的技術政策實驗室創(chuàng)始人雷恩·卡羅說道,“該系統(tǒng)的理解能力并未真正達到人類的水平?!钡撓到y(tǒng)指明的方向的確如此。如果DeepMind的人工智能系統(tǒng)能理解圍棋的玩法,也許它遲早會明白更多的東西?!皶粫麄€宇宙都僅僅是一盤巨大的圍棋呢?”卡羅問道。

      猜你喜歡
      走棋哈薩走法
      數(shù)出不同的走法
      數(shù)出不同的走法
      烏干達男子:12 個妻子、102 個孩子、568 個孫輩
      新傳奇(2023年3期)2023-02-18 02:04:56
      《金鏟鏟之戰(zhàn)》火熱自走棋品類該如何下料?
      不同的走法
      “自走棋”競技化到底行不行?
      戴密斯·哈薩比斯:AlphaGo背后的超強大腦
      杰米斯·哈薩比斯:“阿爾法狗”背后的男人
      看世界(2016年8期)2016-04-29 20:57:42
      AlphaGo創(chuàng)始人:8歲編程,14歲AI,哈佛&麻省雙博士后……
      一共有多少種走法
      元朗区| 钟山县| 澄城县| 岚皋县| 平遥县| 曲水县| 原平市| 钟祥市| 高碑店市| 巴塘县| 临西县| 宿州市| 广灵县| 舟山市| 安龙县| 观塘区| 舟山市| 洛川县| 文水县| 临漳县| 洛川县| 板桥市| 双流县| 彭山县| 滁州市| 汾阳市| 阜新市| 镇原县| 祁门县| 贵溪市| 顺义区| 崇阳县| 高台县| 浦东新区| 盈江县| 磐安县| 宁蒗| 平阳县| 安顺市| 永平县| 东乡|