殷曉磊
圖像識別技術(shù)的興起標(biāo)志著“讀圖”時代的來臨,它可以發(fā)掘圖片內(nèi)容信息,提取用戶所需的信息。當(dāng)你看到一幅電影海報時,拍個照片,就能了解它的相關(guān)信息、觀看片花;當(dāng)你為不會安裝家具而犯愁時,拍個照片,立即就能獲得安裝視頻。亮風(fēng)臺利用海訊圖像識別技術(shù),提供移動新媒體解決方案,實現(xiàn)“天”與“地”——線上線下的無縫連結(jié)。
隨著寬帶網(wǎng)和智能手機的普及,世界已進入“讀圖”時代,圖片不僅僅停留在“看”的層面,而進入到“讀”和“用”的階段。所謂“讀圖”、“用圖”,就是對圖片內(nèi)容進行檢索與挖掘。目前的潮流,就是用計算機圖像識別技術(shù)自動“讀圖”,提取用戶所需要的信息。比如2011年,美國第一大報U.S. Today 用圖像識別在橄欖球 Super Bowl 決賽報道文章上播放錄像 ,同年,澳洲主要銀行之一 CommonWealth 銀行用圖像識別把虛擬3D模型疊加于房產(chǎn)廣告手冊上 。亮風(fēng)臺(上海)信息科技有限公司(以下簡稱“亮風(fēng)臺”)就是應(yīng)運這個“讀圖”時代而產(chǎn)生的。
亮風(fēng)臺成立于2012年,雖然成立時間不長,但其厚積薄發(fā),致力于成為圖像識別和增強現(xiàn)實領(lǐng)域的互聯(lián)網(wǎng)高科技領(lǐng)頭企業(yè)。公司擁有具備自主知識產(chǎn)權(quán)的圖像識別和增強現(xiàn)實核心技術(shù),專注于相關(guān)技術(shù)研究與應(yīng)用,提供廣告營銷、教育出版、娛樂、電商、旅游等行業(yè)解決方案。
亮風(fēng)臺的聯(lián)合創(chuàng)始人廖春元是圖像識別、增強現(xiàn)實和人機交互領(lǐng)域的專家。早年,畢業(yè)于清華大學(xué)計算機系,之后赴美留學(xué),獲得博士學(xué)位。2008年至2012年,他在富士施樂硅谷Palo Alto研究院任正研究員,是該院迄今唯一在工作前四年內(nèi)就三次獲得年度杰出成就獎的華人科學(xué)家。期間他主持的多個研究項目獲得世界范圍內(nèi)同行的高度評價,并在國際計算機協(xié)會ACM主辦的ACM IUI和ACM Multimedia兩個業(yè)內(nèi)頂級會議上分別獲得最佳論文和最佳論文入圍獎。2012年,廖春元放棄國外的優(yōu)厚待遇,回國聯(lián)合唐榮興、王迅和韓磊等聯(lián)合創(chuàng)立了亮風(fēng)臺,海訊圖像識別也就此誕生。說起最初歸國創(chuàng)業(yè)的動因,廖春元笑稱,一切為了理想。
記者:能說說“亮風(fēng)臺”的由來嗎?當(dāng)初為公司取名字的時候有何構(gòu)想?
廖春元:亮風(fēng)臺是我們家鄉(xiāng)一座山的名字。我和亮風(fēng)臺的聯(lián)合創(chuàng)始人唐榮興、王迅和韓磊都是高中同學(xué)。當(dāng)時我們經(jīng)常組織活動去爬山。亮風(fēng)臺海拔有三千多米,我們必須在山上過夜,雖然夜晚的山林很冷很黑,但第二天卻可以看到很美的云海日出。公司的核心技術(shù)——海訊圖像識別的英語譯名HiScene的出處也來自這里,HiScene意為Highland Scene (高地風(fēng)景),意為只有爬到高處,才能看到最美的風(fēng)景,我們希望圖像識別技術(shù)可以為用戶帶來如美麗風(fēng)景一般的美好體驗。HiScene代表了“高度”、“視野”和“團隊”三方面的理念。公司雖然成立的時間不長,但我們的核心團隊成員由世界級計算機視覺、機器學(xué)習(xí)和人機交互領(lǐng)域科學(xué)家、國內(nèi)頂尖移動開發(fā)團隊以及傳媒專家組成。亮風(fēng)臺推出的“HiScene海訊”圖像識別解決方案應(yīng)用平臺,致力于把技術(shù)和商業(yè)相結(jié)合,以“識別圖像價值,超越媒介體驗”為目標(biāo),目前已經(jīng)在新媒體、電子商務(wù)、廣電視訊等領(lǐng)域為合作伙伴提供快捷接入、擴展豐富的圖像識別整體應(yīng)用解決方案。
記者:圖像識別在國內(nèi)還屬于比較新鮮的事物,能否介紹一下圖像識別技術(shù)?
廖春元:所謂圖像識別技術(shù),簡單的來說,就是計算機通過對圖像進行特定處理,理解其內(nèi)容,從而找到用戶所需要的信息。這些信息可能是一段文字,也可能是一段視頻。公司的圖像識別技術(shù)是基于HiScene互聯(lián)新媒體發(fā)布管理平臺實現(xiàn)的,這個管理平臺是我們技術(shù)的關(guān)鍵所在,能識別的圖像內(nèi)容有多少,取決于這個后臺數(shù)據(jù)庫有多大。只要用戶上傳圖片,系統(tǒng)就會自動將圖片與后臺數(shù)據(jù)庫中的圖片做對比,選出相似度最高的,然后自動回復(fù)相關(guān)信息。以圖書為例,用戶對著圖書封面的任何一個區(qū)域拍照,然后通過我們的App或微信公共賬號上傳至云端,就可以識別出所拍圖書的相關(guān)信息,如背景資料、相關(guān)介紹、版本等。我將圖像識別技術(shù)稱為“天”與“地”的連結(jié)紐帶,“天”是在云端的多媒體數(shù)據(jù)庫,“地”是線下媒體或?qū)嶋H的物體,而圖像識別將兩者很好地結(jié)合在了一起。
海訊圖像識別技術(shù)的技術(shù)優(yōu)勢在于,首先我們有可以處理百萬級以上的海量數(shù)據(jù)圖片庫,而且擁有高識別率。HiScene自有的技術(shù)可以在像素級別提取圖片特征,用多種方法去除噪聲,并用領(lǐng)域知識加以驗證,多管齊下,提高識別率。對測試集識別正確率為 99%以上。另外,在手機本地優(yōu)化以后,可以實現(xiàn)對圖片進行實時處理,在手機上識別速度可以達到每秒10幀以上。最后,我們專門對移動設(shè)備進行優(yōu)化:支持手機用戶的各種操作姿勢,比如不同角度、距離、光照條件,實現(xiàn)自然的用戶交互體驗。
記者:提取相關(guān)數(shù)據(jù),使用戶獲得所需要的信息,這些都讓人聯(lián)想到現(xiàn)在很火的二維碼識別技術(shù),您認(rèn)為圖像識別技術(shù)與二維碼相比,有哪些優(yōu)勢?
廖春元:二維碼技術(shù)必須事先將每條待識別的信息制作成黑白相間的方塊格子,你可以想象,在一張海報或是一本書上,有很多可識別區(qū)域的話,二維碼的做法是在每一個可識別區(qū)域做一個二維碼,這樣會破壞原圖的美感;另外,任何可以識別的物體必須加上二維碼,這使得可被識別的物體具有很大的局限性。而海訊圖像識別只需要一張沒有做過任何特殊處理圖片就能完成。我們的技術(shù)是基于最原始的數(shù)據(jù),提取圖片的特征,然后快速地在將數(shù)據(jù)庫里的圖片一一比對,最后將匹配圖片的相關(guān)信息發(fā)送給用戶。我們的圖像識別技術(shù)識別力強,允許周邊有物體遮擋物,并且識別面廣,即使是早年發(fā)行的電影海報、圖書或CD,只要在我們的數(shù)據(jù)庫中有過注冊,就能夠被識別。
記者:圖像識別是一個滲透性很強的技術(shù),可以應(yīng)用于很多領(lǐng)域,那么公司目前與哪些企業(yè)合作,發(fā)揮圖像識別技術(shù)在該領(lǐng)域的作用?
廖春元:圖像識別確實用途很廣,可以被用于教育、廣告、營銷、會展、娛樂等各個領(lǐng)域。首先,我們利用海訊圖像識別技術(shù),提供移動AR新媒體解決方案,所謂AR,即Augmented Reality,意為增強現(xiàn)實,它通過突破性的多媒體展示方式,連結(jié)線上線下媒體。
公司與炫動傳媒(以制作和發(fā)行《喜洋洋和灰太狼》聞名的國內(nèi)兒童動漫龍頭企業(yè))結(jié)成戰(zhàn)略合作伙伴,跟它旗下的《哈哈畫報》等雜志合作開發(fā)創(chuàng)新的互動雜志。《哈哈畫報》是一份集“視、聽、聞”等多感官閱讀的互動兒童讀物。我們通過圖像識別技術(shù),將平面雜志與視頻、動畫、游戲結(jié)合在一起,提供全新的兒童娛樂和教育體驗。孩子們只需下載 “哈哈探寶器”App,在有探索標(biāo)示的頁面移動攝像頭,攝像頭一旦移動到與所識別內(nèi)容相匹配的畫面上,手機就會播放相關(guān)多媒體動畫。這種把對小孩子知識的灌輸模擬成新奇探索的寓教于樂方式,對孩子來說更容易被接受。除了平面媒體之外,我們還與炫動傳媒合作開發(fā)互動電視節(jié)目。只要孩子們在炫動卡通頻道上酷地帶節(jié)目播放期間,通過專用App掃描臺標(biāo)簽到,就證明他這個時候確實是坐在電視機前,然后可以參與抽獎。
同時,公司還與政府合作,配合宣傳。例如今年“五四”青年節(jié)前后,公司為共青團上海市委做了一個名叫“文明家族”的App,只需通過App掃描他們的宣傳畫,就可以播放相關(guān)文明公約的宣傳視頻。
另外,我們?yōu)橹囆g(shù)院校的教授設(shè)計了個性化名片,只要掃描名片上的指定logo,就能展現(xiàn)3D立體動畫,并全面展示它在空間中的位置。這個應(yīng)用可以被運用在房產(chǎn)宣傳冊和其他產(chǎn)品的營銷當(dāng)中,這種將虛實疊加在一起的方式,增強了現(xiàn)實效果。
除了為第三方提供圖像識別解決方案,我們還擁有自己的產(chǎn)品,如“海訊識圖”App和微信圖像識別機器人——“圖答應(yīng)”。特別是“圖答應(yīng)”,將圖像識別技術(shù)與方興未艾的微信公共賬戶結(jié)合起來,能對用戶上傳的圖片進行及時的回復(fù),大大擴展了微信公共賬號目前僅對關(guān)鍵字進行回復(fù)的功能,可以讓商家很快開展更具交互性的網(wǎng)絡(luò)營銷。比如我們給宜家家居的微信賬號裝上了“圖答應(yīng)”之后,用戶只需拍攝照片上傳至宜家微信公共賬號,即可獲得家具安裝視頻。化妝品牌可以讓用戶拍新推產(chǎn)品的照片,參加抽獎活動,引導(dǎo)用戶對品牌的關(guān)注。鑒于微信平臺的數(shù)億龐大用戶數(shù),圖答應(yīng)的應(yīng)用前景極具想象空間。
無論是解決方案、“圖答應(yīng)”還是“海訊識圖”App,其核心都是HiScene互聯(lián)新媒體發(fā)布管理平臺,關(guān)鍵技術(shù)和算法都融于其中,我們只是以此把它包裝成不同的產(chǎn)品而已。
記者:目前,亮風(fēng)臺運營得很不錯,前期推廣也獲得了一定的成功,那么您對于公司下一步的發(fā)展有什么規(guī)劃?
廖春元:公司下一步發(fā)展的關(guān)鍵是繼續(xù)完善HiScene互聯(lián)新媒體發(fā)布管理平臺,不斷豐富平臺的數(shù)據(jù),隨著云計算日益成熟,算法不斷發(fā)展,以前難以處理的數(shù)據(jù)變得容易。
另外,公司希望通過宣傳,讓更多的用戶知道和了解望風(fēng)臺和海訊圖像識別。公司目前正和一些行業(yè)龍頭,諸如安卓手機制造商合作,探討如何將圖像識別技術(shù)置入他們的攝像頭??梢韵胍姡瑢淼陌沧渴謾C攝像頭不僅有攝影攝像的功能,還有識別功能,不需要下載圖像識別App,只需這樣打開攝像頭的圖像識別模式,就可以識別任何在管理平臺注冊過的商品或平媒。
此外,公司下一步打算和云南省旅游局合作,共同推動深度游。通過我們的圖像識別技術(shù),游客只需掃一掃,就能夠通過文字、圖片甚至視頻全方位了解一塊碑、一口古井、一座宮殿等等古跡背后蘊含的深厚歷史積淀。
總之,亮風(fēng)臺將會始終專注于核心技術(shù)的研發(fā),保持圖像識別核心技術(shù)在業(yè)內(nèi)領(lǐng)先,不斷推動人機交互、視覺識別搜索技術(shù)以及產(chǎn)品的改進完善,為媒介、通信、電商、娛樂等行業(yè)帶來變革,讓人機交互體驗更加立體、互動、智慧、寬廣。我們利用圖像識別的領(lǐng)先技術(shù)推動行業(yè)變革、為合作伙伴創(chuàng)造最大價值,實現(xiàn)“天”與“地”——線上線下的無縫連結(jié)。