• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    阿爾法狗是只什么“狗”

    2017-08-23 04:26:44御風(fēng)
    知識(shí)窗 2017年8期
    關(guān)鍵詞:走法勝率阿爾法

    御風(fēng)

    2017年5月,千年水鄉(xiāng)烏鎮(zhèn)迎來(lái)了一場(chǎng)舉世矚目的圍棋峰會(huì),世界第一的中國(guó)九段棋手柯潔以0︰3輸給了阿爾法狗。中國(guó)圍棋協(xié)會(huì)向阿爾法狗授予中國(guó)職業(yè)九段稱號(hào),這是中國(guó)迄今為止最年輕的九段。早些時(shí)候,聶衛(wèi)平曾評(píng)價(jià)阿爾法狗的圍棋水平相當(dāng)于職業(yè)圍棋二十段。

    阿爾法狗是什么?它是由英國(guó)谷歌深度學(xué)習(xí)部門(mén)開(kāi)發(fā)出來(lái)的圍棋人工智能程序,是迄今為止最強(qiáng)大的圍棋棋手,讓我們看看它是如何下圍棋的。

    圍棋的難在于如何分析看似無(wú)限的信息與可能。在一局圍棋中,平均每一步圍棋的下法大約有200種可能,棋盤(pán)上可能出現(xiàn)的局面總數(shù)遠(yuǎn)大于宇宙中原子的總數(shù)。要想通過(guò)暴力、直接手段預(yù)測(cè)所有情況,并從中篩選出最優(yōu)走法的思路并不可行。阿爾法狗在圍棋中取勝的秘訣有三個(gè):深度神經(jīng)網(wǎng)絡(luò)、監(jiān)督/強(qiáng)化學(xué)習(xí)、蒙特卡羅樹(shù)搜索。

    深度神經(jīng)網(wǎng)絡(luò)是一種模擬人類思維方式的計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò),它可以通過(guò)大量數(shù)據(jù)信息,尋找到最合適的解決方式和算法。阿爾法狗包含兩種深度神經(jīng)網(wǎng)絡(luò):數(shù)值網(wǎng)絡(luò)和策略網(wǎng)絡(luò)。數(shù)值網(wǎng)絡(luò)是對(duì)于盤(pán)面優(yōu)勢(shì)的判斷機(jī)制,它計(jì)算預(yù)測(cè)每種不同下法帶來(lái)的勝率變化。如果在試走兩三步棋后,發(fā)現(xiàn)勝率不足,就會(huì)放棄這個(gè)走法,改試其他可能。這使得阿爾法狗能夠明晰局勢(shì)判斷,左右全局“戰(zhàn)略”,拋棄不合適的路線,可有效減少分析深度;而策略網(wǎng)絡(luò)則是學(xué)習(xí)人類的棋譜,通過(guò)分析數(shù)十萬(wàn)個(gè)棋譜,選出20個(gè)勝率最高的下一步走法。這使得阿爾法狗能夠優(yōu)化每一步落子,減少失誤,有效地減少分析廣度。兩者結(jié)合,使阿爾法狗在有限時(shí)間內(nèi)做出更多棋步運(yùn)算,從而不需要過(guò)于龐大的計(jì)算也能夠走出精妙的棋局。

    監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)方式的兩種不同種類。監(jiān)督學(xué)習(xí)是指機(jī)器通過(guò)人類輸入信息進(jìn)行學(xué)習(xí);強(qiáng)化學(xué)習(xí)是指機(jī)器對(duì)自身收集環(huán)境中的相關(guān)信息作出判斷,并成為自己的“經(jīng)驗(yàn)”,這有些類似于人類的思維方式。在初始階段,阿爾法狗收集大量棋局?jǐn)?shù)據(jù),學(xué)習(xí)人類棋手的下法,形成自己的判斷。之后,在自己與自己不計(jì)其數(shù)的模擬對(duì)弈,以及每一次與人類棋手的對(duì)弈中,阿爾法狗都能根據(jù)結(jié)果總結(jié)分析生成新范式,實(shí)現(xiàn)自我下棋技能的提升。

    蒙特卡洛樹(shù)是一種搜索算法。人工智能在利用它進(jìn)行決策時(shí),會(huì)從根結(jié)點(diǎn)開(kāi)始不斷選擇分支子結(jié)點(diǎn),通過(guò)不斷決策使游戲局勢(shì)向人工智能預(yù)測(cè)的最優(yōu)點(diǎn)移動(dòng),直到模擬游戲勝利。人工智能每一次的選擇都會(huì)同時(shí)產(chǎn)生多個(gè)可能,它會(huì)進(jìn)行仿真運(yùn)算,推斷出可能的結(jié)果,再選擇出最優(yōu)方案。

    依靠這三大“武器”,阿爾法狗成為目前人類制造出來(lái)的最優(yōu)秀的圍棋“棋手”。

    不過(guò),比賽結(jié)果出來(lái)后,除了對(duì)阿爾法狗的贊揚(yáng)外,也有另外一種聲音。有一些人,甚至包括科技界的大佬,認(rèn)為阿爾法狗和人類比賽其實(shí)并沒(méi)有太大意義,就好像開(kāi)著汽車和人賽跑一樣,失去了比賽的樂(lè)趣。事實(shí)上,從競(jìng)技的角度上來(lái)講,阿爾法狗的獲勝意義也許不大,但從科學(xué)技術(shù)這個(gè)角度來(lái)說(shuō),它卻有著深遠(yuǎn)意義:阿爾法狗的誕生意味著人們對(duì)人工智能的探索已經(jīng)到達(dá)了一個(gè)新階段,而阿爾法狗的學(xué)習(xí)模式,將被推廣到各種已知領(lǐng)域,譬如面孔識(shí)別、語(yǔ)音識(shí)別等,并且將來(lái)也許還能在其他未探索領(lǐng)域中,帶來(lái)顛覆性的革命。

    猜你喜歡
    走法勝率阿爾法
    數(shù)出不同的走法
    數(shù)出不同的走法
    極狐阿爾法S HI版
    汽車觀察(2022年12期)2023-01-17 02:19:24
    一種生成殘局?jǐn)?shù)據(jù)庫(kù)的倒推算法
    “螢火蟲(chóng)-阿爾法”小型火箭首飛概述
    ARCFOX極狐阿爾法S
    汽車觀察(2021年11期)2021-04-24 18:04:58
    基于預(yù)期收益策略與UCT的德州撲克算法
    不同的走法
    2014—2015年中國(guó)女子籃球職業(yè)聯(lián)賽單節(jié)得失分與比賽結(jié)果相關(guān)性分析
    阿爾法磁譜儀(AMS)
    太空探索(2014年5期)2014-07-12 09:53:44
    偃师市| 定南县| 沧州市| 延吉市| 曲水县| 阳城县| 蒙城县| 德阳市| 福泉市| 青海省| 奎屯市| 丰宁| 台湾省| 屏边| 疏附县| 太保市| 额济纳旗| 肇源县| 日喀则市| 江门市| 衢州市| 兴城市| 肃宁县| 乳源| 酒泉市| 南丹县| 马关县| 延津县| 临湘市| 铜梁县| 交口县| 彭山县| 宁化县| 霸州市| 铜陵市| 永清县| 沂源县| 衡水市| 垦利县| 会同县| 丰县|