霍娜
“我想聽一首激昂的歌” ——汪峰《飛得更高》歌聲響起;“我想聽成龍的《男兒當自強》”——原唱歌聲響起;“請打開一盞燈,將燈光調成白色”——燈亮了,變成白色光;“請打開窗簾,并煮一杯咖啡”——窗簾打開,咖啡壺工作燈亮起……2014年8月20日,在京舉行的“語音點亮生活——科大訊飛智能家庭語音產品發(fā)布會”上,科大訊飛董事長劉慶峰現(xiàn)場演示了用語音遙控各種家用電器的情景。智能家居已成現(xiàn)實。
科大訊飛在會上發(fā)布了面向智能家庭領域的語音產品,包括新版本語音助手靈犀3.0、以語音交互為特色的訊飛智能音箱、面向智能電視交互的“未來遙控”等,并為開發(fā)者構建了更可靠、更多交互模式和更具商業(yè)化的新一代自然語音交互平臺——訊飛語音云3.0,同時啟動 “訊飛超腦”計劃,攜手共贏人工智能時代。
智能家庭新“聲”活
劉慶峰現(xiàn)場演示的是與中國移動聯(lián)合推出的最新升級版語音助手靈犀3.0。他介紹,靈犀作為手機上的操控入口、信息搜索入口和移動特色服務三大語音入口,升級后的3.0版本更具實用、樂用、易用、通用四大特性。該產品在原有的語音撥號、發(fā)短信、本地查詢、聲紋鎖屏等基礎功能之上,又增加了秒呼、語音喚醒、音樂隨心聽、有聲“悅”讀、男女聲識別等個性化功能,同時面向用戶開放300萬首正版歌曲、40萬冊正版圖書訪問。
讓記者記憶深刻的是其哼唱搜索功能。現(xiàn)場觀眾對著手機哼唱了一段旋律“在我心中,曾經(jīng)有一個夢,要用歌聲讓你忘了所有的痛”,靈犀立即搜索出“您要聽的是《真心英雄》”,并開始播放原聲歌唱版。
在有聲“悅”讀方面,靈犀整合了40萬冊正版圖書的優(yōu)勢內容資源,圖書種類多樣,可以用多語種多音色、特色語言個性化音庫、音色轉換等語音合成技術,包括單田芳似的評書、《舌尖上的中國》配音員似的紀錄片等多種語音風格滿足用戶興趣喜好。據(jù)介紹,高德地圖中林志玲的嗲嗲的聲音就是科大訊飛語音合成提供給高德的。
除了音樂、有聲“悅”讀,劉慶峰介紹,靈犀還能做到“聽聲識人”,靈犀可以根據(jù)你的聲音來辨別你的性別,進而提供有針對性的服務。比如,男生向靈犀咨詢“我要給愛人買個禮物”,靈犀通過男女聲識別后就建議“聽你的聲音一定是位事業(yè)有成的高富帥,快為她買一條鉆石項鏈,她一定會很幸福的”;如果女生向靈犀咨詢“我要給愛人買個禮物”,靈犀通過男女聲識別后就提供另外的建議“聽你的聲音一定是位窈窕淑女,快為他買一只新款手表吧,讓他顯得品味十足”等?!办`犀會越來越懂你,通過聲音識別性別,基于語音大數(shù)據(jù)提供更加個性化的服務。”劉慶峰說。
劉慶峰還展示了靈犀3.0與智能家庭硬件之間的互動,包括對電視、電燈、空調、熱水器等家電的語音操控。比如,對靈犀說“中央一套”,電視頻道就會自動切換到中央一套;對靈犀說“幫我煮杯咖啡”,咖啡機開始工作;對靈犀說“我五分鐘之后到家”,靈犀會回復“好的,按照您的習慣,空調已經(jīng)調到26度,熱水器調到35度”……
目前,靈犀已經(jīng)與創(chuàng)維、長虹、海信、TCL、康佳、海爾、邁樂機頂盒、海爾、美的、智能手表Z-Watch等垂直門戶和終端廠商建立了廣泛合作關系,OVS開放平臺與200多個垂直領域最優(yōu)質的信源展開合作。同時,語音助手也開始走向汽車領域,與奧迪、寶馬、奔馳、福特、長安、上汽、廣汽、江淮、奇瑞等汽車制造廠商都已展開深度合作。
讓機器人考上大學
發(fā)布會上,科大訊飛還發(fā)布了新一代訊飛語音云3.0。訊飛語音云3.0由“云+端+后臺大數(shù)據(jù)分析”組成,具備方言語音識別、高抗噪語音識別、個性化識別、人臉識別、手勢識別、聲紋識別等創(chuàng)新功能。自2010年推出全球首個智能語音交互的語音云平臺開始,四年來科大訊飛不斷突破智能語音技術極限,開放平臺接口,語音云合作伙伴和用戶規(guī)模一直飛速增長。目前,訊飛語音云平臺合作伙伴已超過40000家,其中包括騰訊QQ、小米手機、新浪微博、58同城、攜程旅行、高德地圖等各類主流應用,支撐用戶數(shù)達百萬級以上應用超過1000多個,覆蓋移動終端超5億。
訊飛語音云通過智能語音基礎功能、個性化語音功能、語音定制服務、數(shù)據(jù)分析、增值服務等吸引開發(fā)者共同創(chuàng)業(yè)。語音云已經(jīng)有4萬個項目,每天有150個新項目。發(fā)布會也對“訊飛語音云創(chuàng)新應用大賽”的獲獎開發(fā)者進行了頒獎,其中盲人應用爭渡讀屏獲得大賽金獎,高德地圖、Glass x分別獲得了用戶體驗獎和創(chuàng)業(yè)團隊獎。值得一提的是,訊飛語音云3.0將以更開放的姿態(tài)面向開發(fā)者,將逐步上線語音喚醒、離線命令詞識別、人臉識別等前沿技術。
在車載領域,科大訊飛通過技術攻堅突破高噪環(huán)境下語音識別率低的“魔咒”,2013年,科大訊飛分別在奔馳汽車和通用汽車全球語音識別抗噪評測中獲得第一名。在車窗全開、時速100公里的情況下,只有科大訊飛的技術達到使用要求。未來,內置訊飛語音技術的汽車,可以讓你一邊開車一邊用語音操控打電話、開導航、聽音樂、查路線等。
同時,科大訊飛還宣布啟動人工智能計劃——“訊飛超腦”,讓機器像人腦一樣做到學習和思考,進而實現(xiàn)機器從“能聽會說”到“能理解會思考”的跨越。“訊飛超腦”計劃聚集了來自語音及語言國家工程實驗室、清華大學、加拿大約克大學等的十多位人工智能領域頂級專家,致力于人工智能的探索和應用,讓機器能聽話,更能懂你,甚至考上大學,讓人工智能深度應用于生活的方方面面。
鏈接:中國人能做頂級的原創(chuàng)技術
科大訊飛董事長劉慶峰邀請自己中科大的校友、現(xiàn)香港中文大學教授湯曉鷗來發(fā)布會做題為《生活中的計算視覺》的演講。湯曉鷗及其團隊在計算機視覺領域,包括人臉識別、圖像檢索、智能視頻分析處理等方面有非常前瞻的研究創(chuàng)新。人臉識別技術的國際標準測試集上前三名的算法都是他們實驗室做出來的,包括高斯臉技術和基于深度學習的臉部器官定位技術和深分證的技術等。手勢識別領域,其對手掌的全自由度的跟蹤識別技術在電視的遙控、手機遙控、汽車導航等各種交互領域都有很大應用價值。而他們的另一研究方向——大規(guī)模人群的視頻監(jiān)控與智能分析,可以做人數(shù)估計、擁堵分析、目標跟蹤、異常檢測等,也是世界領先。湯曉鷗說自己的每次演講都會從兒子的照片開始。幸福的生活狀態(tài)與卓越的工作成績兼?zhèn)湓谒砩媳憩F(xiàn)得淋漓盡致。而湯曉鷗在演講最后也感慨地說:“我想跟大家說,中國人也是可以做原創(chuàng)技術的,而且是可以做頂級的原創(chuàng)技術!”
鏈接:數(shù)說訊飛
訊飛語音云平臺合作伙伴超過40000家,支撐用戶數(shù)達百萬級以上應用超過1000多個,終端用戶數(shù)量超5億。
靈犀3.0增加了秒呼、語音喚醒、音樂隨心聽、有聲“悅”讀、男女聲識別等個性化功能,同時面向用戶開放300萬首正版歌曲、40萬冊正版圖書訪問。
科大訊飛與香港中文大學湯曉鷗教授及其團隊合作,將國際頂尖人臉識別技術應用于訊飛語音云,識別率達99.15%。
科大訊飛聯(lián)合CNTV旗下未來電視發(fā)布了面向智能電視的“未來遙控”,用語音實現(xiàn)遙控器的交互,比如換頻道、調音量等,電視都可以理解并立即執(zhí)行,交互過程僅需0.5秒,準確度高達95%。