• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      機器閱讀真的超過人類了嗎?還不一定

      2018-02-11 19:33:48
      海外星云 2018年3期
      關(guān)鍵詞:斯坦福大學測試者阿里巴巴

      2018年1月13日,微軟和阿里巴巴同時宣布已開發(fā)出“在閱讀上勝過人類”的人工智能軟件。隨后,媒體的發(fā)酵更是讓這項技術(shù)突破承載了“奪走數(shù)百萬份人類工作”的可能。不過用理性的眼光看,該技術(shù)還遠不能在閱讀方面與人類真正達到同等水平。

      兩家科技巨頭的信心來源于自家AI軟件在一項閱讀理解測試上得分超過普通人類的表現(xiàn)。但是,開發(fā)該測試的斯坦福大學科研人員表示,這兩家公司用于與機器數(shù)值對比的人類平均水平值,并不能反映英語母語人群的實際閱讀能力,所以“機器比人類更會閱讀”一說有失偏頗。一位直接參與此項目的微軟研究人員也表示:只有人才能充分理解語言中的細節(jié)和含義,而機器確實還差得遠。

      過往科技公司在AI上的技術(shù)突破,尤其是豪言“超越人類”的突破,大多都值得商榷。2015年,谷歌和微軟同時宣布自家的算法在圖像辨別方面已勝過人類。事實上,當時作為評判依據(jù)的那項測試,要求被測試者將圖像分為1000類,其中120類是不同狗的品種。自然,這對于普通人類的難度,要遠遠高于能預先通過大量樣本學習的機器。

      另一方面,人類在真正理解圖像上的能力仍遠勝于機器,因為后者不具有常識性的認知能力:谷歌目前仍在特意審查“大猩猩”詞條的搜索結(jié)果,以防自家的圖像搜索引擎將其與黑人圖像相混淆。

      類似地,2016年微軟宣布已開發(fā)出“歷史性的”、能真正達到人類水準的語音識別軟件。而幾個月后,IBM重新評估了人類在微軟所用評測中的平均水平,并發(fā)現(xiàn)人類的表現(xiàn)遠比微軟先前所取的數(shù)值高。到目前為止,機器還遠不能像人類一樣“聽懂”在嘈雜環(huán)境中的閑聊內(nèi)容、口語化或含糊的言談、抑或是不同口音的對話。

      無獨有偶,微軟和阿里巴巴近日提出的關(guān)于軟件在閱讀理解方面超越人類的宣言也是建立在很多附加條件之上。這次用于橫向比較機器和人類的測試叫SQuAD,由斯坦福大學開發(fā),形式類似于大家以前上學做的閱讀理解題。機器學習軟件就從維基百科上摘錄的文段答一萬個問題,例如“水滴與冰晶碰撞形成降水的地方在哪里?”,作答形式是將答案(“云層中”)從原文中找出來并高亮。參與測試前,軟件制作者可以通過分析九萬個附有答案的樣本題來搭建軟件。

      在一月早些時候,微軟和阿里巴巴向斯坦福大學提交了模型并分別做到在測試中準確高亮出82.65%和82.44%的答案,而斯坦福大學所取用的代表人類水平的數(shù)值是82.304%。阿里巴巴的官方報道中稱自家軟件“在最具難度的閱讀理解測試中超越人類”,微軟也自詡“已做出可以像真人一樣閱讀文件并答題的軟件?!?/p>

      SQuAD的創(chuàng)造者之一、斯坦福大學教授PercyLiang表示自己在2016年設(shè)計該測試時的初衷并非為了精準比較機器和人類的能力,而且從設(shè)計原理上看,這項測試對機器更有利,因為機器和人類的評分標準是不一樣的:微軟和阿里巴巴使用的人類成績來自Mechanical Terk,每道題目會選出三個答案,一個是所謂的“測試者答案”,兩個是用來對比的答案,只用兩個對比答案降低了“測試者答案”答對的幾率,讓人類和機器相比落了下風。

      學界對科技行業(yè)這種結(jié)論也提出了質(zhì)疑。以色列巴伊蘭大學的一位高級講師瑤夫·戈德伯格就表示,該測試用Amazon Mechanical Turk上的普通勞動力資源答題,本質(zhì)上就不能代表人類的真實水平。首先,眾包平臺上的勞動力水平參差不齊,其次這些一小時掙9美金的人在接這種科研性質(zhì)的“活”時也不太可能認真閱讀那些wiki文段或者在乎答案的對錯。82.304%這個數(shù)字更多代表的是一群AMT worker答題的統(tǒng)一性,而非人類閱讀理解的實際平均水平。

      就此次“宣言”接受美國《連線》雜志詢問時,微軟科研經(jīng)理高建峰(音譯)也通過一封公開信表示:“目前我們所做的研發(fā)和測試仍有很多限制和紕漏??偟膩砜?,人類確實在理解語言這種復雜且微妙的事物時,遠遠強于機器。”

      不過,微軟和阿里巴巴借此展現(xiàn)出的在AI領(lǐng)域取得的突破是有目共睹的。參與SQuAD的斯坦福大學科研團隊成員普拉納夫·拉普卡就對兩家公司的科研團隊大加贊賞。同時,他表示SQuAD團隊要繼續(xù)優(yōu)化測試的機制,從而讓SQuAD繼續(xù)做衡量機器學習軟件在閱讀理解領(lǐng)域成功與否的標尺。前文提到的SQuAD創(chuàng)始人之一梁教授也評論說:“[SQuAD]現(xiàn)有的評估機器能力的方法太過側(cè)重于表面上的內(nèi)容連線,而非考察真正的對文字含義的理解?!?/p>

      美國西雅圖艾倫人工智能研究所的CEO,奧倫·埃奇奧尼對AI領(lǐng)域頻頻出現(xiàn)的突破既感到激動,又保持審慎:“看到機器學習已能在一些單一任務(wù)上趕超人類,我感到很高興。開發(fā)專門應對某項任務(wù)的軟件,比如廣告定向、家用音響,將會是很實用且賺錢的行業(yè)?!辈贿^同時,AI還有很長的路要走——“人類在進化中培養(yǎng)出的這種自然性的語言交流和理解,仍給AI留了很深遠的探索空間?!卑F鎶W尼補充道。(摘自美《深科技》)(編輯/小文)

      猜你喜歡
      斯坦福大學測試者阿里巴巴
      斯坦福大學 超神的凡人之軀
      看電影,選大學 斯坦福大學的畢業(yè)生真的不愁找不到工作
      阿里巴巴與四十大盜
      搜救犬幼犬挑選測試
      指紋收集器
      可監(jiān)測腦電波的智能燈
      斯坦福大學研發(fā)出安全性更高的鋰離子電池
      阿里巴巴:股大大,權(quán)大大,還是錢大大?
      很多英國人不會拼常用詞
      為什么是阿里巴巴?
      平顺县| 保德县| 资溪县| 阿合奇县| 牟定县| 嵩明县| 曲阳县| 丹寨县| 墨竹工卡县| 漳州市| 内黄县| 广河县| 广汉市| 仪陇县| 汉源县| 泸定县| 梁河县| 乃东县| 云龙县| 鄄城县| 池州市| 康保县| 新田县| 永嘉县| 建湖县| 罗城| 独山县| 揭东县| 六安市| 方山县| 西吉县| 忻城县| 卓资县| 清远市| 如皋市| 蒲江县| 兴安盟| 米易县| 龙里县| 贵南县| 嵊泗县|