李佳師
近日,谷歌設備與服務高級副總裁Rick Osterloh以發(fā)布官方博客方式宣布:谷歌正式收購North。North是一家增強現(xiàn)實公司,其產(chǎn)品與谷歌眼鏡類似。這不是一樁普通的AR收購,它與谷歌的一個重要計劃“環(huán)境計算”提速有關(guān)。
也是在最近,英特爾高級院士、英特爾研究院院長Rich Uhlig在撰文解析英特爾的2030計劃時,談及“沉浸式臨場感技術(shù)”如何通過陣列攝像頭技術(shù)、計算聲學和多模型信號語義理解來改善虛擬和遠程工作體驗,談到了英特爾的環(huán)境計算。
6月16日,在2020國際計算機視覺與模式識別大會上,微軟CEO薩提亞和微軟前執(zhí)行副總裁沈向洋的爐邊對話中談到了“4D理解”,并準備將它發(fā)展成“現(xiàn)實即服務”,利用實時的計算機視覺技術(shù),對八、地、物等要素進行推理以確保安全,提供給醫(yī)院或工廠車間等。還談到了“全息瞬移”以及背后的神經(jīng)網(wǎng)絡文本、運營TTS、全息計算等。這些技術(shù)與環(huán)境計算有關(guān)。
當谷歌、英特爾、微軟等不約而同地談到環(huán)境計算時,意味著什么?環(huán)境計算究竟是廠商們打造的新“噱頭”還是有可能改變我們認知的“新世界”?其中有哪些難點有待業(yè)界共同破解?創(chuàng)造新產(chǎn)業(yè)有哪些方法可尋?
廠商紛紛加碼環(huán)境計算
在去年10月舉辦的2019谷歌制造大會上,RickOsterloh公布了谷歌的新使命、新愿景:“讓你的設備和服務與AI一起協(xié)作,在你需要的任何時侯過來幫助你,在你不需要的時候自動隱身?!逼浜?,Osterloh撰寫博客解釋了谷歌推出的“環(huán)境計算”概念——在你的一天中,設備會消失在背景中,人工智能和軟件則將一起工作來幫助你。在谷歌宣布了這一大概念之后,谷歌就將其諸多的服務納入了其設備中。
在谷歌的概念里有幾個關(guān)鍵:其一,人是中心而非以設備為中心。其二,它是設備+服務+AI的大集成,是一個大系統(tǒng)。其三,具有不可見性,召之即來、揮之即去。環(huán)境計算是眾多的技術(shù)組合在一起,創(chuàng)建一個可以滿足個人需求的環(huán)境。從本質(zhì)上看,環(huán)境計算是物聯(lián)網(wǎng)與人工智能等互聯(lián)概念的演變。
環(huán)境與計算的融合,計算的維度將發(fā)生改變。比如客廳中的語音驅(qū)動揚聲器和智能恒溫器,虛擬坐席和聊天機器人都是環(huán)境計算的組成部分。當你走進客廳.房間傳感器感應到你的身影,揚聲器會自動朗讀當天的新聞。在商務會議室,人工智能技術(shù)則自動收集對話信息并做筆記,自動調(diào)節(jié)攝像頭與麥克風,提高畫面質(zhì)量,減少環(huán)境噪音,以便我們將更多注意力集中于對話與交流,而忽略環(huán)境影響。
當然,環(huán)境計算的概念并非谷歌首創(chuàng)。早在上世紀80年代末90年代初,尚在施樂帕克研究中心擔任首席技術(shù)專家的MarkWeiser就創(chuàng)造了環(huán)境計算這個詞條,并與施樂帕克研究中心的董事和首席科學家John Seely Brown撰寫了大量論文來描述這個概念,主要關(guān)注計算環(huán)境中出現(xiàn)的界面和交互問題。之后有很多研究和學術(shù)項目都是圍繞這個課題進行的。眾多的前人研究為這一概念的落地做了大量積累和鋪墊,到這個時間點,巨頭們讓它的產(chǎn)業(yè)化腳步越來越快。就像觸摸式操作系統(tǒng)并非蘋果發(fā)明,但是蘋果將其用在iPad、iPhone上,開啟了移動計算的黃金十年一樣。
在今年花1.8億美元收購North之前,谷歌已將諸多的服務納入了其設備中,比如在Pixel手機上,加入了“Soli”運動雷達感應技術(shù),用戶無需接觸,用手勢即可操作手機;比如改良其入耳式耳塞PixelBuds,搭載的“自適應聲音”技術(shù)可根據(jù)用戶所在的環(huán)境自動調(diào)節(jié)音量;又比如對Nest智能家居部門進行了大量更新等。
事實上,不同的巨頭對于環(huán)境與計算融于一體有不同的定義和理解。微軟中國有限公司首席技術(shù)官韋青在接受《中國電子報》記者采訪時表示,真正的環(huán)境計算是讓你感受不到任何設備、任何計算,它通過眼、耳、鼻、舌、身五官來感知信息、交互信息,或許到更高階段時,信息的呈現(xiàn)不是通過設備而是通過光。當然,它的發(fā)展不是一蹴而就,而是不斷迭代的。
就在7月9日,微軟協(xié)作工具Teatns宣布上線Together模式,這個模式能夠?qū)⒁曨l會議中的人物從背景中摳出來,然后放到虛擬的大禮堂背景中。目前Teams最多支持49人同時在線,整體效果就像是坐在一起聽課。Together Mode的初衰是幫助遠程工作者,尤其是被迫待在家中的孩子減輕和克服長期社交隔離的落差和心理壓力。
“環(huán)境計算是英特爾的中長期研究計劃,也就是3-5年時間的研究計劃。目前美國的團隊已經(jīng)做了一段時間,現(xiàn)在已經(jīng)開始進行現(xiàn)場實驗了。主要特色是用環(huán)境里部署的多種傳感器來感知人的活動和與物體的交互,然后進行語意理解,再通過與環(huán)境融合的投影方式跟參與者互動?!庇⑻貭栔袊芯吭涸洪L宋繼強對《中國電子報》記者透露。
環(huán)境計算多久會成熟?
就在谷歌去年宣布環(huán)境計算計劃之時,很多人包括媒體以及科技知名博主們都對其新計劃的落地、商業(yè)模式以及用戶接受度等提出了質(zhì)疑。而事實上這樣的計劃并不是一下子鋪開的,它是一個遠景。如韋青所言,會“迭代式”往前推進,迭代會成為未來世界創(chuàng)新發(fā)展很重要的特征。
所以,關(guān)于環(huán)境計算,巨頭們一方面會在原有的產(chǎn)品線中不斷注入新的能力、新的體驗,另一方面不斷創(chuàng)造和豐富新的維度,它是長中短期結(jié)合的計劃,并不是一個孤注一擲的商業(yè)冒險。
衍生與迭代會成為巨頭們將長中短期相結(jié)合的行走方式。有個例子來自微軟。21世紀初,微軟開始用計算機視覺研究骨架追蹤和人體感知的基礎科學;在2010年它推出了第一個商業(yè)產(chǎn)品Kinec;在此基礎上,微軟劍橋研究院做出了能夠完全重構(gòu)3D環(huán)境,讓人與環(huán)境融為一體的Kinect Fusion、HoloDesk: 2015年,微軟推出了HoloLens; 2019年,它推出了Ho-loLens 2。
我們完全沒有必要為巨頭們的商業(yè)落地和商業(yè)模式操心。就像這次微軟在Teams中上線的Together模式,它是在微軟原有的產(chǎn)品Teams中加以改進,增加了多人協(xié)同的真實感和交互感。就像谷歌在其Pixel手機上,是將“Soli”運動雷達感應技術(shù)加入一樣。谷歌和微軟走的是兩條不一樣的路線,微軟聚焦“生產(chǎn)力”維度,所以它的環(huán)境計算場景會最先選擇像辦公、開會等體驗的改進,像醫(yī)院病人起身跌倒等行為異常的檢測,以及預防工廠環(huán)境下重物跌落傾倒等場景的應用。而谷歌更關(guān)注消費與娛樂的人群,你在家、在路上、在娛樂等更多維度所需要的服務,以及與智能家居和環(huán)境的互動等。
有人認為,環(huán)境計算市場究竟多久能夠從量變到質(zhì)變的一個信號通常是看蘋果,但這次蘋果似乎沒有大張旗鼓地談論環(huán)境計算,這與其一向只喜歡“蘋果成熟時”才向市場宣戰(zhàn)的習慣有關(guān)。不過,近日蘋果申請的一項專利顯示,除了眼鏡和耳機,蘋果還在為其VR(虛擬現(xiàn)實)戰(zhàn)略研發(fā)一款專用手套。專利中提到,該手套支持檢測各種手勢動作,適用于筆記本電腦、平板電腦和智能手機等多個場景,還可應用到壘息投影模組、聯(lián)動PC和打印機等設備的場景,讓用戶在虛擬中體驗真實的觸感。如果這個市場的發(fā)展是漸進式的,各個巨頭都已經(jīng)往前走了,屆時蘋果還是那個市場成熟的風向標嗎?也未必。
環(huán)境計算中的關(guān)鍵痛點
巨頭企業(yè)總是比其他人更早感受到窘境和焦慮,就像這次因為疫情的發(fā)生,“線上化”成為常態(tài)。當越來越多的人待在“線上”比“線下”的時間長很多時,如何減少線上辦公、線上開會、線上沉浸的焦慮感、不真實感,用環(huán)境計算創(chuàng)造新的舒適安全體驗,就成了巨頭企業(yè)們思考的新維度。
“現(xiàn)在大家都在講,世界不會再回到疫情以前的狀態(tài),會產(chǎn)生很大的變化。具體有什么變化?在我看來,過去大量通過‘人一人(人和人接觸)的方式來完成的事情,以后很多會被‘人一信息一人(人和人不直接接觸)的方式取代。”中國工程院院士潘云鶴認為,“當大量的會議遠程化之后,從我個人的使用體驗來看,大部分遠程會議系統(tǒng)都有待完善?!?/p>
最突出的問題在于網(wǎng)絡會議難以進行充分和及時的討論,線下開會那種“你一言,我一語”的互動很難有效實現(xiàn)。這意味著中間的調(diào)度器不夠靈活,不能遠程、及時并善解人意地開關(guān)、切換話筒和鏡頭。潘云鶴這樣談及其中的挑戰(zhàn),并認為問題就是動力,企業(yè)應該瞄準這個其中的商機,研究更智能的產(chǎn)品,占領(lǐng)各個山頭。
問題就是動力,尋著現(xiàn)實問題進行研發(fā)也是科技巨頭的解題方法。英特爾研究院院長Rich Uhlig透露,目前其研究院研究創(chuàng)新的沉浸式臨場感技術(shù),用于支持仿真交互,應對許多人因長時間虛擬工作而出現(xiàn)的“虛擬疲勞”綜合癥。這些技術(shù)在現(xiàn)有直播解決方案中集成了多攝像頭,并整合實現(xiàn)仿真交互,可用于視頻通話及在線直播內(nèi)容。他們經(jīng)過人類學研究發(fā)現(xiàn),人們使用注視、手勢、姿勢、體態(tài)、話語、行動及其他提示來實現(xiàn)對某一領(lǐng)域和所指之物的共同關(guān)注,從而建立起有效的互動。他們正在探索如何通過陣列攝像頭技術(shù)、計算聲學和多模型信號語義理解實現(xiàn)沉浸式互動,從而減少全虛擬環(huán)境中的摩擦和認知負荷。
在環(huán)境計算推進過程中哪些難點是巨頭們關(guān)注的?宋繼強認為:“環(huán)境計算的挑戰(zhàn),一是如何從多模態(tài)的感知到形成個性化的對用戶理解,二是怎樣把交互內(nèi)容跟沉浸式技術(shù)形式很好地結(jié)合起來?!?/p>
從多模態(tài)感知到形成個性化對用戶的理解,韋青認為其中的難點是建模。他表示:“當我們利用傳感器收集了大量的數(shù)據(jù),我們?nèi)绾螌⑦@些數(shù)據(jù)進行建模,形成我們對事物的認知,這其中很關(guān)鍵的挑戰(zhàn)在于,目前我們的建模能力還很弱,還不夠高效、不夠全面,還是單點的。而圖計算是破解這一難點的重要突破方向?!?/p>
圖計算( Gnph)最近很熱,包括在剛剛舉行的世界人工智能大會上,它也是熱門的技術(shù)。Rich Uhlig在此前接受《中國電子報》記者采訪時表示,圖計算也將是非常重要的一種新型計算方式。計算主要是發(fā)現(xiàn)數(shù)據(jù)之間的內(nèi)在關(guān)系,尤其是大規(guī)模的數(shù)據(jù)之間的內(nèi)在關(guān)系。今天,現(xiàn)有的計算系統(tǒng)運行圖計算所涉及的數(shù)據(jù)庫效率非常低。因為這些關(guān)系型數(shù)據(jù)本身就非常稀疏,在內(nèi)存訪問模式上具有不穩(wěn)定性,所以貝葉斯算法無法應用。圖計算可以有效提升稀疏數(shù)據(jù)的處理效率。
尋找更多更有效解決這個世界難題的技術(shù),創(chuàng)造更多讓我們更舒適的技術(shù)。在接受采訪時,韋青多次強調(diào)不要設限。他認為:“我們需要從更大的維度看待挑戰(zhàn),看待技術(shù)的發(fā)展,當技術(shù)和產(chǎn)業(yè)走到今天這樣的一個節(jié)點,我們看待世界、研究世界的方法,以及創(chuàng)新的方法已經(jīng)和原來不一樣。從還原論到系統(tǒng)論,從單一到復雜,從瀑布式到敏捷式開發(fā),從產(chǎn)品有版本到無版本,這代表什么?代表我們對這個世界變化的認知能力與改造能力和過去不一樣?!?/p>
從設備到AI到服務,我們?nèi)绾巍安辉O限”地進行創(chuàng)新,又如何圍繞人、圍繞場景進行最佳的組合,有著巨大的空間以及巨大的商業(yè)機會,等待產(chǎn)業(yè)更大維度攜手創(chuàng)新。