涂君軍
阿里和小米智能音箱背后的語(yǔ)音交互解決方案提供商
“你們這個(gè)技術(shù),先封閉一段時(shí)間,等我們的產(chǎn)品發(fā)布了,再開(kāi)放給別的客戶(hù)。”龍夢(mèng)竹在思必馳負(fù)責(zé)市場(chǎng)的這些年里,總能聽(tīng)到客戶(hù)類(lèi)似的要求。而作為一家技術(shù)公司的CMO,她也很清楚公司的技術(shù)不能等。
今年7月,阿里和小米先后發(fā)布了各自的智能音箱“天貓精靈”和小米“AI音箱”,其背后的語(yǔ)音交互解決方案提供商正是思必馳。
思必馳創(chuàng)立于2007年,當(dāng)時(shí)人工智能的概念還沒(méi)普及,做語(yǔ)音交互的思必馳已經(jīng)把自己定義為一家人工智能公司。隨著公司業(yè)務(wù)的發(fā)展,人工智能熱度逐漸攀升,尤其是亞馬遜Echo智能音箱在國(guó)外大獲成功,這讓思必馳開(kāi)始考慮:能不能把語(yǔ)音交互的能力完全開(kāi)放給客戶(hù)?
內(nèi)置在Echo中的Alexa可以被看成是亞馬遜版的Siri語(yǔ)音助手。同時(shí),“Alexa”也是Echo的喚醒詞。2015年6月,亞馬遜宣布第三方開(kāi)發(fā)者可以在Alexa平臺(tái)上開(kāi)發(fā)基于語(yǔ)音的技能(Skill),而這些技能可以通過(guò)Echo智能音箱被用戶(hù)使用。
簡(jiǎn)單來(lái)說(shuō),開(kāi)發(fā)者在Alexa平臺(tái)上為音箱編寫(xiě)提醒、天氣、查詢(xún)、日歷等功能供用戶(hù)使用,而Alexa平臺(tái)就像是“音箱的App Store”。
“現(xiàn)在Alexa平臺(tái)上面有15000多個(gè)技能,但是活躍的技能不到1%?!饼垑?mèng)竹對(duì)創(chuàng)業(yè)邦(微信搜索:ichuangyebang)談道,“關(guān)聯(lián)信用卡、配置語(yǔ)音賬號(hào)已經(jīng)是一個(gè)不小的門(mén)檻。”
技能開(kāi)發(fā)這一塊會(huì)耗費(fèi)廠商大量的精力、人力和財(cái)力,所以國(guó)內(nèi)廠商都紛紛發(fā)布了自己的技能開(kāi)放平臺(tái):騰訊發(fā)布了小微,百度做了DuerOS,科大訊飛有AIUI,Rokid在推全棧語(yǔ)音開(kāi)放平臺(tái),出門(mén)問(wèn)問(wèn)也發(fā)布了自己的AI開(kāi)放平臺(tái)。據(jù)不完全統(tǒng)計(jì),目前國(guó)內(nèi)約有40余家企業(yè)開(kāi)放了“語(yǔ)音平臺(tái)”。
小微Skill開(kāi)放平臺(tái)開(kāi)放語(yǔ)義分析能力給第三方,由小微提供設(shè)備控制、內(nèi)容資源、服務(wù)能力,其內(nèi)置Skill以QQ音樂(lè)、騰訊視頻等騰訊系產(chǎn)品為主。百度的DuerOS已經(jīng)與國(guó)內(nèi)外百余家家電、芯片和服務(wù)提供商建立了生態(tài)合作關(guān)系,并聯(lián)合小魚(yú)在家推出了視頻通話(huà)機(jī)器人“分身魚(yú)”。小米也為AI音箱發(fā)布了開(kāi)放平臺(tái),呼吁開(kāi)發(fā)者為“小愛(ài)同學(xué)”開(kāi)發(fā)更多技能。
思必馳在推出開(kāi)放平臺(tái)上錯(cuò)過(guò)了最佳時(shí)機(jī),但勝在走了一條“接地氣”的路線(xiàn)。
9月初思必馳正式發(fā)布DUI開(kāi)放平臺(tái),而在這之前,思必馳已經(jīng)針對(duì)開(kāi)發(fā)者舉辦過(guò)多次開(kāi)發(fā)者沙龍。
思必馳VP、DUI負(fù)責(zé)人趙恒藝在和合作伙伴打磨產(chǎn)品的過(guò)程中發(fā)現(xiàn)了很多痛點(diǎn)需求,比如:“客戶(hù)希望自行定義喚醒詞,實(shí)時(shí)在線(xiàn)更新,而有些熱詞識(shí)別錯(cuò)誤或語(yǔ)義解析錯(cuò)誤在當(dāng)前需要重新訓(xùn)練模型(才能解決),效率很低。還有一些客戶(hù)想做出有更大差異化的產(chǎn)品,對(duì)交互流程的各個(gè)環(huán)節(jié)也都有自己的想法?!?/p>
基于對(duì)痛點(diǎn)需求的分析,思必馳團(tuán)隊(duì)將DUI平臺(tái)的可定制化范圍擴(kuò)及全鏈路,平臺(tái)的每個(gè)功能模塊均可自定義,包括喚醒詞定制及參數(shù)設(shè)置、語(yǔ)音識(shí)別、語(yǔ)言模型、語(yǔ)義解析、多輪對(duì)話(huà)、自然語(yǔ)言生成和語(yǔ)音合成等。
相對(duì)Alexa的門(mén)檻,開(kāi)發(fā)者在思必馳DUI平臺(tái)一經(jīng)注冊(cè)即可體驗(yàn)可視化組件操作、網(wǎng)頁(yè)在線(xiàn)編輯、快速生成Demo等功能。
每個(gè)客戶(hù)都需要自己個(gè)性化的東西,而在針對(duì)客戶(hù)需求進(jìn)行定制化適配的過(guò)程中,思必馳也有了自己的思考,比如如何回復(fù)回話(huà)、對(duì)話(huà)的邏輯、圖形用戶(hù)界面等同樣可以定制。此外,聲音在DUI平臺(tái)也可以定制,用戶(hù)可以自己上傳自己的聲音,生成一個(gè)專(zhuān)屬于自己的TTS個(gè)性合成音。也就是說(shuō),在取得授權(quán)的情況下,用戶(hù)可以聽(tīng)到吳亦凡的Freestyle、鹿晗的“大家好,介紹一下……”這種個(gè)性化的語(yǔ)音。
在此前,客戶(hù)使用思必馳的平臺(tái)實(shí)現(xiàn)落地需要花費(fèi)兩三個(gè)月,而在DUI平臺(tái)上,通過(guò)縮減客戶(hù)在前端設(shè)備的調(diào)試時(shí)間,只需要一周即可。
除了提供智能語(yǔ)音語(yǔ)言交互技術(shù)以外,思必馳DUI開(kāi)放平臺(tái)還具有多種優(yōu)秀特性以幫助減輕開(kāi)發(fā)者的運(yùn)營(yíng)壓力,例如:多版本管理,不同產(chǎn)品可對(duì)接不同分支;增量熱更新,在線(xiàn)秒級(jí)更新,用戶(hù)無(wú)感知;可視化大數(shù)據(jù),提供用戶(hù)畫(huà)像和運(yùn)營(yíng)數(shù)據(jù)支持,更可自定義數(shù)據(jù)維度,讓開(kāi)發(fā)者快速優(yōu)化產(chǎn)品體驗(yàn)。
趙恒藝總結(jié),DUI平臺(tái)是一整套技術(shù)模塊,而他們則將這些技術(shù)模塊全部轉(zhuǎn)化成了產(chǎn)品側(cè)的解決方案。比如針對(duì)車(chē)載解決方案、故事機(jī)、機(jī)器人等家居解決方案,DUI平臺(tái)都匹配了不同的場(chǎng)景。而思必馳會(huì)在實(shí)現(xiàn)交互的整個(gè)過(guò)程中把這些鏈條都打散,使其變得更加靈活,因而能讓客戶(hù)更好地實(shí)現(xiàn)定制。平臺(tái)上集成了百度地圖、高德地圖、騰訊音樂(lè)、酷愛(ài)音樂(lè)、大眾點(diǎn)評(píng)、美團(tuán)等,匹配后端的資源后,平臺(tái)可以做到用戶(hù)級(jí)的自適應(yīng)。
據(jù)悉,思必馳為DUI平臺(tái)專(zhuān)設(shè)了2億人民幣基金,用以扶持平臺(tái)上優(yōu)秀的開(kāi)發(fā)者、應(yīng)用案例和創(chuàng)業(yè)項(xiàng)目。
從亞馬遜的Echo,谷歌的Google Home,到蘋(píng)果的Home Pod,再到Rokid、天貓精靈、小米AI音箱,在人工智能的火熱之下,智能音箱“百箱大戰(zhàn)”中比拼的除了硬件和工業(yè)設(shè)計(jì)層面的差異性,更重要的是各廠商提供資源和服務(wù)的能力。
訊飛、思必馳、出門(mén)問(wèn)問(wèn)等公司在提供語(yǔ)音交互解決方案的同時(shí)也會(huì)與內(nèi)容提供商進(jìn)行資源合作,把內(nèi)容商的資源打包輸出給中小型廠商。
以有聲讀物為例,喜馬拉雅和凱叔講故事兩者的體量、定位并不相同,為兒童、早教打造的智能家居產(chǎn)品更偏向與凱叔講故事合作,因?yàn)槠涫鼙姼悠ヅ浜途珳?zhǔn)。
而在“百箱大戰(zhàn)”的背后,廠商、技術(shù)提供方、內(nèi)容商的競(jìng)合關(guān)系對(duì)產(chǎn)品的體驗(yàn)有著不可忽視的影響。