• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      OpenAI 推出一對(duì)虛擬機(jī)械臂,可通過(guò)相互訓(xùn)練變得更智能

      2021-04-14 12:10:36克珂)
      海外星云 2021年1期
      關(guān)鍵詞:多任務(wù)謎題國(guó)際象棋

      克珂)

      近日,兩個(gè)由 OpenAI 的研究人員開(kāi)發(fā)的一模一樣的機(jī)械臂——愛(ài)麗絲和鮑勃,可以在模擬情景中通過(guò)對(duì)弈互相學(xué)習(xí),而不需要人為輸入文本。

      其中一個(gè)虛擬機(jī)械臂已經(jīng)學(xué)會(huì)解決各種不同的難題——堆積木、擺放桌子、排列國(guó)際象棋棋子,并且每項(xiàng)任務(wù)不需要進(jìn)行再訓(xùn)練。這一切通過(guò)與另一個(gè)機(jī)械臂對(duì)弈得以實(shí)現(xiàn)。據(jù)了解,另一個(gè)機(jī)械臂經(jīng)過(guò)訓(xùn)練后,會(huì)給原本的機(jī)械臂臂帶來(lái)越來(lái)越難的挑戰(zhàn)。

      這些機(jī)器人采用的是強(qiáng)化學(xué)習(xí)算法,即在不同情況下,通過(guò)試錯(cuò)來(lái)訓(xùn)練人工智能,并采取不同行動(dòng)來(lái)實(shí)現(xiàn)目標(biāo)。游戲包括在虛擬桌面上移動(dòng)物體。例如,通過(guò)以特定的方式排列物體,愛(ài)麗絲試圖設(shè)置對(duì)鮑勃來(lái)說(shuō)很難解決的謎題,而鮑勃會(huì)試圖解決愛(ài)麗絲的謎題。隨著它們的學(xué)習(xí),愛(ài)麗絲會(huì)設(shè)置更復(fù)雜的謎題,而鮑勃也會(huì)越來(lái)越會(huì)解謎。

      經(jīng)過(guò)愛(ài)麗絲設(shè)置的積木謎題的訓(xùn)練后,鮑勃便可以通用于一系列任務(wù),包括擺放桌子和排列象棋棋子。

      通常在多重任務(wù)處理中,深度學(xué)習(xí)模型必須在任務(wù)間進(jìn)行再訓(xùn)練。例如,AlphaZero (一款棋類 AI,可以通過(guò)自我博弈來(lái)學(xué)習(xí))會(huì)使用單一算法教自己下國(guó)際象棋、將棋和圍棋——但每次只能下一盤(pán)棋。例如,下國(guó)際象棋的時(shí) AlphaZero 不能下圍棋,下圍棋時(shí)的 AlphaZero 不能下將棋。因此,造出真正能同時(shí)處理多任務(wù)的機(jī)器,是走向更通用的人工智能道路上的一大未解難題。

      訓(xùn)練 AI 同時(shí)執(zhí)行多重任務(wù)時(shí)會(huì)遇到一個(gè)問(wèn)題,即需要大量的例子。OpenAI 則通過(guò)訓(xùn)練愛(ài)麗絲為鮑勃生成例子,用一個(gè) AI 訓(xùn)練另一個(gè) AI 來(lái)避免這個(gè)問(wèn)題。經(jīng)過(guò)訓(xùn)練,愛(ài)麗絲學(xué)會(huì)了設(shè)定目標(biāo),比如建造一座積木塔,然后把它撿起來(lái)并加以平衡。鮑勃學(xué)會(huì)了利用虛擬環(huán)境的屬性,如通過(guò)摩擦力來(lái)抓取和旋轉(zhuǎn)物體。

      截至目前,虛擬現(xiàn)實(shí)的訓(xùn)練只在虛擬環(huán)境中進(jìn)行,但 OpenAI 和其他機(jī)構(gòu)的研究人員正在將虛擬環(huán)境中訓(xùn)練的模型轉(zhuǎn)移到物理環(huán)境中,且越來(lái)越有起色。據(jù)悉,模擬環(huán)境可以讓 AI 在短時(shí)間內(nèi)處理大型數(shù)據(jù)集,然后研究人員會(huì)根據(jù)現(xiàn)實(shí)世界的環(huán)境再對(duì)其進(jìn)行微調(diào)。

      該團(tuán)隊(duì)的研究人員表示,他們的最終目標(biāo)是訓(xùn)練這些機(jī)械臂去解決人類可能要求它做的任何任務(wù)。與 GPT-3 一樣(GPT-3 是一個(gè)能以各種不同方式使用語(yǔ)言的語(yǔ)言模型),這些機(jī)器人手臂是 OpenAI 打造多任務(wù)人工智能整體目標(biāo)的一部分,而使用一個(gè) AI 來(lái)訓(xùn)練另一個(gè) AI 也許是其中的關(guān)鍵所在。 (摘自美《深科技》)

      猜你喜歡
      多任務(wù)謎題國(guó)際象棋
      國(guó)慶謎題猜猜猜
      俄羅斯為什么被稱為“國(guó)際象棋王國(guó)”
      怪獸謎題
      基于中心化自動(dòng)加權(quán)多任務(wù)學(xué)習(xí)的早期輕度認(rèn)知障礙診斷
      下國(guó)際象棋
      關(guān)于鯨的謎題
      謎題與真相
      基于判別性局部聯(lián)合稀疏模型的多任務(wù)跟蹤
      電測(cè)與儀表(2016年5期)2016-04-22 01:13:46
      河北小學(xué)榮獲“國(guó)際象棋特色學(xué)校”榮譽(yù)稱號(hào)
      札达县| 霍城县| 庐江县| 德格县| 霞浦县| 河北区| 昌平区| 松潘县| 江源县| 玉溪市| 贡觉县| 三河市| 济南市| 玉屏| 锦州市| 罗定市| 深圳市| 吉隆县| 略阳县| 冕宁县| 北流市| 定结县| 得荣县| 柳州市| 和硕县| 乐东| 应用必备| 永修县| 华坪县| 革吉县| 石城县| 上高县| 灵石县| 和田县| 白沙| 呼玛县| 河北省| 玛纳斯县| 比如县| 仁寿县| 泗阳县|