• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      破解“巴別塔魔咒”

      2015-07-16 04:16:26
      時間線 2015年3期
      關鍵詞:巴別機器語音

      倘若語言不再是人類交流的壁壘,會發(fā)生什么?

      長久以來,人類都有一個共同夙愿:發(fā)明一個機器,實現全人類之間毫無障礙的自由交談。而毫無疑問,自由交談在一個宣稱自由連接的互聯網時代更能彰顯它的價值——畢竟,同是地球人,同住地球村,當你我覓得彼此,卻聽不懂彼此語言,實在有些尷尬。

      事實上,與那些讓生活變得復雜的“智能產品”不同,實時語音翻譯是那種讓人在直覺上認為理應擁有的技術,正因如此,它也一直存在于《星際迷航》、《神秘博士》以及《銀河系漫游指南》等科幻作品中。好消息是,人類似乎離這個夙愿越來越近了。

      不久前,微軟旗下的Skype宣布,具備實時語音翻譯技術的Skype Translator中文預覽版正式在中國市場推出。其實不同母語間的人直接對話,讓機器實時翻譯,這些技術微軟早在去年就已與公眾見面,只是那時還不支持中文——你知道,哪怕是對于機器,有大約一萬個常用漢字以及各種語音語調的中文也頗具挑戰(zhàn)性。但如今,包括微軟和谷歌在內的科技巨頭的發(fā)力,使得地球上使用人數最多的語言和使用最廣泛的語言能直接展開對話。

      那么問題來了,作為不同文化之間的擺渡者,倘若實時翻譯真能實現人類的自由交談,這一切意味著什么?

      作為一項長久愿望,在此前數十年時間,實時語音翻譯的發(fā)展一直受到錯誤率高、麥克風敏感度差異、噪音環(huán)境等因素阻礙。但近些年來,由于大數據的涌現,這項技術取得了不錯的進展。而Skype Translator更是凝聚了微軟在語音識別、自動翻譯和機器學習等多領域的成果。

      簡單地說,Skype Translator的翻譯邏輯主要分為三步:將你的實時語音轉成文字;將文字翻譯成另一種語言的文字;將文字轉成語音。其中,識別實時語音并轉成文字是最棘手的部分。

      如你所知,精確的實時語音翻譯有賴于強大的機器學習——也就是軟件學習訓練數據的能力。這些訓練數據包括翻譯的網頁,配有字幕的視頻,以及預先翻譯且轉錄成文字的一對一談話。事實上,已有不少人分享了他們過去的對話記錄。Skype Translator通過記錄對話來分析文本并訓練系統(tǒng)更好地“學習”語言——當準備好的數據錄入系統(tǒng)后,機器學習軟件會在這些對話和環(huán)境涉及到的單詞中搭建一個統(tǒng)計模型,當你說話時,軟件會在統(tǒng)計模型中尋找相似內容,然后應用到預先“學到”的轉化程序中,得以讓語音轉換為文本,再從文本轉換成另一種語言。

      值得一提的是,與程序設定一般的朗誦不同,人會一邊思考一邊說話,會犯錯,這種犯錯在口語表達中的體現就是打磕巴、停頓、重復或者頻頻出現如“嗯”“啊”“呃”之類的語氣助詞,而Skype Translator的機器翻譯模型則會處理這些停頓。在預覽版中,用戶可以看到部分語氣詞停頓被移除,未被移除的部分則可能通過用戶反饋進行再優(yōu)化。

      不過,作為一項不斷優(yōu)化的技術,無論是微軟的Skype Translator還是“老對手”谷歌的Google Translate,至少在現階段,實時語音翻譯技術應該還談不上完美,系統(tǒng)對語音的識別準確率也有待完善——你知道,語言如一只野獸,時刻都在變化,哪怕同一國家,因地域不同也有不同口音與俚語文化。有人就非常期待機器實時翻譯以下對話:

      “約嗎?我在火車站等你?!?/p>

      “我去!太遠了!我不去!”

      這些問題可以通過更大范圍的數據解決嗎?也許能,但還需要時間。無論怎樣,就像一位評測者所言:“(如今實時語音翻譯)整個體驗就像是兩名電話銷售員在使用對講機,不過在使用過程中,這樣的抱怨將會被‘奇跡帶來的震驚所取代?!?/p>

      當然了,在時間線君看來,這樣的“震驚”或許可以更近一步。實時語音翻譯的聲音在現階段還略顯冰冷,沒什么生命感可言,那么在未來語音翻譯是否能像某款地圖一樣讓志玲姐姐曼妙的聲音為你服務?或者可以下載電影《Her》里斯嘉麗·約翰遜那般令人沉醉的聲線?

      在微軟亞洲研究院,微軟研究院戰(zhàn)略總監(jiān)及技術顧問Vikram Dendi向《時間線》記者解釋道:“Skype Translator和導航應用不太相同,后者詞匯量很有限,語句有許多重復。而且,關于使用其他人的聲音也可能引起一些社會討論,譬如我能不能用斯嘉麗的聲音來嘲笑別人?當然,在這個領域我們還有許多工作可以做,也有能力做好,我們需要對系統(tǒng)進行訓練來讓它像一個人的聲音。不過我們最初研發(fā)Skype Translator的目標是不讓它占用用戶太多時間,我們希望用戶只要運行程序,點擊一下對話者,就可以開始說話了。這個技術已經很復雜了,現在系統(tǒng)就有一點延遲,因為需要等機器翻譯,所以目前我們不想再給它加一層復雜度了。”

      在《圣經·創(chuàng)世紀》中記載,曾有一個時代,人類擁有共同的語言,于是有人想在巴比倫造一座通天塔——巴別塔,以便直接跟上帝對話。

      為了懲罰人類的傲慢與虛榮,上帝讓這些人說不同的語言,導致人們無法溝通,雞同鴨講,人類計劃失敗,自此各散東西。

      那么技術能解除“巴別塔魔咒”嗎?倘若語言不再是人類交流的壁壘,會發(fā)生什么?

      讓我們先來談談語言的意義。在全球7000多種語言中(盡管有不少“小語種”已日漸枯萎),除了詞匯和語法的表層差異,不同的語言是否能使人類產生不同的思維方式——譬如對時間與空間概念的認知,或者對因果關系的認知,幾千年來就一直是學者們爭論的主題。神圣羅馬帝國的查理曼大帝就曾在科技還不甚昌明的時代宣稱:“掌握第二種語言就是擁有第二個靈魂?!?/p>

      當然,從科學的角度,斯坦福大學教授Lera Boroditsky也曾頗具詩意地表達過語言的意義:“每種語言都包含著一種獨特的世界觀,反映了使用者數千年來的思想、傾向和認知方式。一種語言就像一個完整的宇宙,人類有7000多個平行宇宙,有的彼此相似,有的大相徑庭。這種巨大的多樣性是人類頭腦靈活性和精致性創(chuàng)造出的奇跡。我相信,對人類認知世界的認識越深刻,就越能更好地理解人類的本質?!?/p>

      假如互聯網發(fā)展的底層邏輯是將全人類更好地連接在一起,形成一個巨大村落,那么語言也許就是最后一個技術障礙。在此之前,圖片作為全世界的通用語言,在社交應用上發(fā)揮了巨大作用——無論在哪個國家,笑容就是笑容,哭泣就是哭泣。當然,表情符號也發(fā)揮了類似作用——你知道嗎,真的有人曾用表情符號聊了45分鐘。

      所以,可以肯定的是,當人類連接在一起,打破語言的壁壘,更好地理解彼此,勢必將開啟“地球村”的新篇章。

      好吧,最后,還是善意地提醒一下那些外語不太好的同學吧。在可以想見的未來,語音翻譯的技術一定會闊步向前,但這并不意味著從現在開始就徹底不用學外語啦。“我認為這項技術不會取代學習一門語言的價值。”Vikram Dendi告訴時間線君,“如果我是個年輕人,喜歡上一個中國姑娘,我可不敢想象自己一輩子靠翻譯技術來和她交流。”

      嗯,無力反駁。

      猜你喜歡
      巴別機器語音
      機器狗
      麗江青年作家黃立康散文集《巴別塔的磚》研討會
      壹讀(2022年12期)2022-04-06 10:08:19
      一種特別的尋找現代人“存在”的詩意——評黃立康散文集《巴別塔的磚》
      壹讀(2022年12期)2022-03-24 06:47:18
      機器狗
      魔力語音
      基于MATLAB的語音信號處理
      電子制作(2019年14期)2019-08-20 05:43:38
      基于MQ3與MP3的價廉物美的酒駕語音提醒器
      電子制作(2019年9期)2019-05-30 09:42:10
      對方正在輸入……
      小說界(2018年5期)2018-11-26 12:43:42
      天衣本非針線為巴別塔亦難通天
      中國自行車(2018年8期)2018-09-26 06:53:28
      未來機器城
      電影(2018年8期)2018-09-21 08:00:06
      灵寿县| 祁东县| 霞浦县| 新龙县| 和林格尔县| 南郑县| 会昌县| 泽库县| 中卫市| 栖霞市| 博湖县| 马鞍山市| 无极县| 阳原县| 广灵县| 墨竹工卡县| 亳州市| 榕江县| 温泉县| 扶绥县| 阳西县| 鹤壁市| 洛宁县| 全州县| 安多县| 韶山市| 宣威市| 兖州市| 巩义市| 织金县| 杭州市| 宁陕县| 霍州市| 城口县| 宽城| 靖安县| 建水县| 东辽县| 咸阳市| 扶风县| 防城港市|