印度《經(jīng)濟(jì)時報》網(wǎng)站2023年3月7日消息,谷歌已經(jīng)分享了更多關(guān)于通用語音模型(USM)的信息,該公司將這個系統(tǒng)描述為實現(xiàn)其目標(biāo)的“關(guān)鍵的第一步”。2022年11月,該公司宣布計劃創(chuàng)建一個支持世界上1000種最常用語言的語言模型以擊敗ChatGPT,同時也公布了USM模型,現(xiàn)在距離其目標(biāo)更近了一步。
谷歌聲稱,目前USM支持100多種語言,并將作為一個更大系統(tǒng)的“基礎(chǔ)”。谷歌公司將USM描述為一組最先進(jìn)的語音模型,具有20億個參數(shù),訓(xùn)練了1200萬小時的語音和280億個文本句子,涵蓋了300多種語言。谷歌在一篇博客文章中表示,USM用于優(yōu)兔時,不僅可以對英語和普通話等廣泛使用的語言進(jìn)行自動語音識別(ASR),還可以對像阿姆哈拉語、宿務(wù)語、阿薩姆語和阿塞拜疆語等資源匱乏的語言進(jìn)行識別。與此同時,谷歌預(yù)計將在不久的將來為其產(chǎn)品引入一系列人工智能功能。