胡曉琛 鄧冰
[摘要]AR雖然是由虛擬現(xiàn)實技術(shù)發(fā)展而來的,但是在概念、特征和硬件設(shè)備需求方面都與VF《虛擬現(xiàn)實技術(shù)》有著相當大的差異。AR的關(guān)鍵技術(shù)在于將現(xiàn)實與虛擬、實時互動、三維注冊等一一對應(yīng)。AR的發(fā)展符合當今的時代潮流。能夠輔助虛擬互動應(yīng)用的設(shè)計和研發(fā),大大地激發(fā)了設(shè)計師的靈感,豐富了設(shè)計作品。
[關(guān)鍵詞]增強現(xiàn)實;虛擬互動;輔助設(shè)計;三維注冊
增強現(xiàn)實(Augmented Reality,下文簡稱AR),作為先進的三維交互技術(shù),誕生于19世紀60年代,當移動互聯(lián)網(wǎng)時代的智能手機平臺iOS和Android系統(tǒng)出現(xiàn)后,針對AR技術(shù)的研究和應(yīng)用出現(xiàn)了突破性的進展。曾經(jīng)出現(xiàn)在科幻電影中的情節(jié)可能真實地被還原到現(xiàn)實生活中,人們可以在空氣中通過手勢對智能設(shè)備發(fā)出指令。
一、增強現(xiàn)實技術(shù)
(一)發(fā)展趨勢
未來的一個時期內(nèi)社會發(fā)展的特征主要由技術(shù)發(fā)展趨勢所決定。美國巴特爾研究所的研究報告中列舉了10項最具有戰(zhàn)略意義的技術(shù)趨勢,其中增強現(xiàn)實技術(shù)名列第10位。全球知名的咨詢公司Gartner在分析行業(yè)數(shù)據(jù)的基礎(chǔ)上指出:增強現(xiàn)實技術(shù)將在未來五年內(nèi)進入商用市場,成為主流科技產(chǎn)品的普遍功能。
Gartner公司從1995年起就繪制技術(shù)成熟度曲線圖用來描繪創(chuàng)新技術(shù)所經(jīng)歷的過熱期待期、幻覺破滅期和回歸現(xiàn)實的過程。通過這種方式分析并指出了這些技術(shù)采用的最佳時間和地點,從而獲得最大化價值和技術(shù)影響力。技術(shù)成熟度曲線大致可以分為五個階段“技術(shù)萌芽階段(Technology Trigger)、期望峰值階段(Peak of Jnflated Expectations)、泡沫化谷底階段(Trough of Disillusionment)、穩(wěn)步攀升階段(Slope of Enlightenment)、實際生產(chǎn)高峰階段(Plateau of productivity)(見圖1-1 Gartner曲線)。
(二)虛擬現(xiàn)實與增強現(xiàn)實
隨著二維交互限制被三維交互打破,人機交互的方式提供了一種自然而直觀的交互行為方式,主要的實現(xiàn)技術(shù)包括虛擬現(xiàn)實技術(shù)(Virtual Reality,簡稱VR)和增強現(xiàn)實技術(shù)(AR)。增強現(xiàn)實和虛擬現(xiàn)實同樣具有“虛擬-真實連續(xù)性”的特征,就是把虛擬環(huán)境與真實環(huán)境分別作為兩端,處于兩端中間的區(qū)域則被稱為“混合實境(Mixed ReaIity)”,靠近真實環(huán)境一端的是增強現(xiàn)實,靠近虛擬環(huán)境一端的是虛擬現(xiàn)實(圖1-2混合實境)。簡而言之,混合現(xiàn)實是一種新型的可視化環(huán)境,融合了現(xiàn)實世界和虛擬世界兩個部分,允許真實存在的物理對象與虛擬的數(shù)字對象同時存在并且實時互動。
與增強現(xiàn)實相比較,虛擬現(xiàn)實創(chuàng)造的是一個全新的虛擬世界,而增強現(xiàn)實則通過將真實環(huán)境與虛擬環(huán)境相結(jié)合把人們拉回到真實世界的互動中來,同時在真實世界上輔以虛擬的數(shù)字信息,進行數(shù)據(jù)信息或可視化信息的增強和擴展。AR可以使真實環(huán)境與虛擬現(xiàn)實結(jié)合,它是以假設(shè)性和互動性為基本特征的人機交互系統(tǒng)的高級形態(tài)。而VR更專注于沉浸式的特征,促使用戶在三維構(gòu)建的虛擬空間中活動。由于此特征上的差異,從而導(dǎo)致了增強現(xiàn)實與虛擬現(xiàn)實所使用的硬件設(shè)備也有所不同:VR采用的頭盔顯示器具有浸沒式的特點(圖1-3),而AR采用的頭盔顯示器具有透視式的特點(圖1-4視頻透視顯示器)。
(三)系統(tǒng)要求
增強現(xiàn)實系統(tǒng)主要由廣電現(xiàn)實技術(shù)、交互技術(shù)、計算機圖形技術(shù)和可視化技術(shù)等創(chuàng)造出一個或數(shù)個在現(xiàn)實中并不存在的虛擬對象,并通過三維注冊技術(shù)將虛擬對象精確地放置在現(xiàn)實環(huán)境中,使用戶產(chǎn)生一種虛擬與現(xiàn)實融合的感覺,從而無法區(qū)分物體是真實還是虛擬的屬性。因此增強現(xiàn)實系統(tǒng)可以“將現(xiàn)實帶入虛擬,讓虛擬增強現(xiàn)實”。虛擬互動系統(tǒng)中的增強現(xiàn)實功能具有兩方面的要求:其一,功能性要求,既包括視頻捕捉、實物跟蹤、虛擬信息、信息現(xiàn)實等;其二,非功能要求,包括可移動性、系統(tǒng)平臺需求、用戶需求、設(shè)備需求和環(huán)境需求等。
從軟件和硬件角度入手,能滿足上述具體功能的設(shè)備主要包括:硬件設(shè)備,如攝像頭、傳感器、控制設(shè)備、顯示器和存儲傳輸設(shè)備。其中最關(guān)鍵的設(shè)備是顯示設(shè)備,比如能夠使用戶直接透過顯示屏(或透明鏡片)看到真實世界的影像,同時又能提供將虛擬影像投射到顯示屏(或透明鏡片)上的裝置,從而使用戶看到由電腦合成好的虛實結(jié)合的影像(圖1-5)。
一套AR系統(tǒng)包括了計算機輔助系統(tǒng)、視頻輸入輸出轉(zhuǎn)換系統(tǒng)、人機交互系統(tǒng)、動態(tài)捕捉系統(tǒng)、視頻現(xiàn)實系統(tǒng)和傳感系統(tǒng)。這套系統(tǒng)除了符合高質(zhì)量要求的硬件外,還需要一套與之配合的成熟的軟件。只有當軟件與硬件系統(tǒng)同時達到要求,并且在實際設(shè)計、應(yīng)用過程中具有豐富的經(jīng)驗,才能設(shè)計并產(chǎn)出一套符合用戶完美需求的系統(tǒng)。
二、核心技術(shù)
虛擬互動系統(tǒng)中的增強現(xiàn)實技術(shù)主要包括三方面的核心技術(shù):顯示成像技術(shù)、跟蹤定位注冊技術(shù)、交互技術(shù)。
(一)顯示成像技術(shù)
增強現(xiàn)實系統(tǒng)中使用的顯示器可以分為頭盔式顯示器和非頭盔式顯示器。后者包括了DRT平面LCD顯示器,投影式顯示器(Projection Displays)和手持式顯示器(Hand-held Displays)。下面將以目前最新的谷歌眼鏡(Google Glass)作為案例來說明頭盔顯示器的工作原理,并通過iOS應(yīng)用軟件來探討手持式顯示器。
1.谷歌眼鏡
特工佩戴著特制的隱形眼鏡走入大街,就能夠?qū)崟r掃描并識別人的臉部信息,從而迅速的從人群中發(fā)現(xiàn)目標,獲取機密(圖2-1)。這是在電影《碟中諜4》里面出現(xiàn)的科幻鏡頭,科學(xué)家稱這樣的設(shè)備真實應(yīng)用將出現(xiàn)在一二十年后。目前谷歌發(fā)布的GoogleGlass(谷歌眼鏡)已經(jīng)初步實現(xiàn)了這項功能。谷歌眼鏡于2012年4月發(fā)布,是一款可穿戴式智能眼鏡,其提供了增強現(xiàn)實技術(shù)服務(wù)。它集成智能手機、GPS、相機于一身,用戶可以通過它擴展眼前的實時信息數(shù)據(jù),包括眨眨眼拍照上傳、處理文字信息、查詢天氣路況等,同時支持藍牙功能和智能手機同步(圖2-2)。谷歌眼鏡代表了未來科技的發(fā)展方向,實現(xiàn)了人與機器、現(xiàn)實與虛擬、互聯(lián)網(wǎng)與人際間交流方式的革新。它的工作原理具有以下特征:endprint
(1)空間計算
全球知名軟件公司Occipital的研究數(shù)據(jù)表明,相機已經(jīng)成為采集信息使用率最高的傳感器之一,目前受到計算機圖形算法和移動智能設(shè)備硬件的限制,增強現(xiàn)實技術(shù)的潛力還遠沒有發(fā)揮出來。
(2)互動游戲
Kinect是2010年1月4日時微軟推出的體感捕捉設(shè)備。它成功的將多余的外置設(shè)備去除,以全新的方式將體感互動融入到游戲生活中,廣泛的進入商用市場。這款設(shè)備不僅能識別玩家的身體動作,同時可以辨識語音,成功地使用戶的身體成為游戲的控制器(圖2-3)。
(3)人腦感知
人腦感知技術(shù)與增強現(xiàn)實的結(jié)合可以使設(shè)備更好的理解用戶的行為,比如通過智能方式感知人類的腦電波,從而使用意識控制信息的顯示或者根據(jù)心情給予生活的建議。這些想法已經(jīng)不再是酷炫的科學(xué)幻想,例如InteraXon(圖2-4)就推出了一款通過腦電波來控制窗簾及燈光的“腦電波感應(yīng)式頭帶”。
(4)交互提升
運用增強現(xiàn)實技術(shù)設(shè)計內(nèi)容和動畫,能夠有效地降低交互過程中的障礙,從而更好地提升自然的交互過程。
2.iOS應(yīng)用程序
從iPhone、iPad不斷更新的iOS系統(tǒng)中,我們可以看到很多新的應(yīng)用程序。其中一些正在運用增強現(xiàn)實技術(shù)為人們的生活、工作提供便利,而AR技術(shù)的應(yīng)用正在朝著“隱形”方向發(fā)展??纱┐髟O(shè)備的技術(shù)發(fā)展使我們不再局限于使用4英寸顯示器去觀察生活,也不用時時刻刻關(guān)注手機,而是讓設(shè)備關(guān)注我們。例如:在實體桌子上向一個虛擬籃球筐里投擲虛擬的籃球(圖2-5)。Find Your Car在你把車停好之后,使用手機給停車位置加上標簽,當你想開車回家的時候,就能夠借助Find Your Car快速找到自己的車子(圖2-6)。
(二)定位(跟蹤、注冊)技術(shù)
目前從增強現(xiàn)實和移動位置服務(wù)結(jié)合的發(fā)展趨勢來看,越來越多的餐館服務(wù)、旅游服務(wù)、天氣服務(wù)等最大的特征就是在屏幕上提供和可見實景相關(guān)的信息,并通過獲取數(shù)據(jù)庫中的地圖信息向用戶提供更大距離范圍的相關(guān)信息。注冊的主要目的是使虛擬物體與標識物能夠按照設(shè)計意圖在真實場景中準確顯示,同時具有相同的位置信息和狀態(tài)。目前,定位技術(shù)包括全球衛(wèi)星定位系統(tǒng)GPS、視頻監(jiān)測、光學(xué)系統(tǒng)、超聲波、磁場、機械裝置等。
AR系統(tǒng)通過大量標定測量值來生成精確定位,包括:攝像機參數(shù)、視域參數(shù)、對象定位及變形參數(shù)、傳感器偏移參數(shù)等。采用的技術(shù)包括:攝像機標定、手動AR標定及開發(fā)自有的標定繪制器。衡量定位技術(shù)的標準主要是:精確性、實時性和操作范圍。通常需要的精確度越高,容易導(dǎo)致錯誤的源就越多。但是隨著計算機視覺圖像算法和硬件設(shè)備的改善,攝像頭的信息采集精確度將越來越高,逐漸成為最終要的AR系統(tǒng)傳感器和輸入設(shè)備,這不僅是AR技術(shù)的發(fā)展趨勢,也是整個計算機產(chǎn)業(yè)的發(fā)展趨勢。
(三)交互技術(shù)
人機交互指人與計算機之間的對話語言或行為方式,從而完成信息的交換過程。它包含了計算機圖形圖像學(xué)、心理學(xué)、人工智能等跨學(xué)科的技術(shù)。隨著傳感器、力反饋等硬件設(shè)備的發(fā)展,科學(xué)家對于人類個體差異、體感認知的研究不斷發(fā)展,人機交互成為了信息產(chǎn)業(yè)競爭的關(guān)鍵技術(shù),其設(shè)計理念也實現(xiàn)了向“以用戶為中心”的轉(zhuǎn)變。在人機交互中的用戶界面(User Interface,簡稱U1)是人機間信息交換和傳遞是否成功的重要端口,一個用戶界面設(shè)計的優(yōu)劣直接影響到人機交互的效果。交互設(shè)計的過程包括:“用戶研究”、“設(shè)計分析”、“原型制作”、“查證評估”四個步驟(圖2-7),關(guān)鍵技術(shù)包括:頭盔式顯示器、光學(xué)透視式顯示器、定位系統(tǒng)和移動計算。
1.用戶界面的演變過程(圖2-8)
2.以用戶為中心
以用戶為中心是指設(shè)計必須是滿足用戶需求的、可行的,能夠產(chǎn)生商業(yè)價值的設(shè)計。交互設(shè)計之父Alan Cooper提出的以目標為導(dǎo)向的設(shè)計,提倡將用戶的需求放到第一位。而增強現(xiàn)實技術(shù)在虛擬互動中的運用,則可以滿足用戶的特殊體驗要求。用戶作為最終的使用者,決定了界面設(shè)計的功能與形態(tài),用戶在使用過程中的滿意度直接決定了交互界面設(shè)計的成功與否。
三、虛擬互動設(shè)計中的應(yīng)用
增強現(xiàn)實輔助設(shè)計順應(yīng)了時代的發(fā)展潮流,能夠豐富數(shù)字時代設(shè)計作品的展現(xiàn)方式,并為交互設(shè)計帶來新的活力。它把‘用戶體驗”的概念導(dǎo)入到交互設(shè)計中,融合了虛擬互動應(yīng)用的特點和“感官交互”、“行為交互”和“反思交互”設(shè)計方法。以用戶需求為前提進行技術(shù)選擇及內(nèi)容制作,盡可能達到人、機器和環(huán)境的自然交互。
1)感官交互:圖像、聲音等計算機生成的數(shù)字信息通過人的視覺、聽覺、味覺、觸覺等感官層面的感受變化進行互動,產(chǎn)生實時的圖像或聲音信息的互動交流。
2)行為交互:增強現(xiàn)實中實現(xiàn)的虛擬物體與人在行為上進行互動。但是無論交互實現(xiàn)的多么完美,由于缺少了圖像中物體重量、軟硬、速度等多角度的感官體驗,給人的感覺仍然是“虛擬”的圖像。
3)反思交互:通過人的思想直接控制現(xiàn)實世界中展示物的變化,通過增強現(xiàn)實技術(shù)實現(xiàn)對人在交互行為過程中精神反思層面信息的捕捉。采用最新的腦機接口(Brain-Computer Interface,簡稱BCI)技術(shù)可以達到用人的意念控制真實物體移動的效果。
比如來自美國的一個三人團隊在四周時間內(nèi)開發(fā)了一款名叫Ikea Now的免費應(yīng)用(圖3-1),通過AR讓買家具的過程變得更加直觀。用戶用智能手機打開這款軟件時,攝像頭就會打開,并呈現(xiàn)現(xiàn)實的畫面,在APP里選擇一款家具,這個家具的圖像就會插入到現(xiàn)實場景中。
(一)界面設(shè)計
在增強現(xiàn)實的界面設(shè)計中,真實世界將按照設(shè)計意圖作為背景圖層疊加虛擬物體出現(xiàn),設(shè)計人員不僅可以看到顯示窗口中的全部元素,同時還要確保所有的元素都放置在準確的位置上。除了能夠整合圖形軟件中計算機生成的信息和設(shè)計作品時的真實圖像,系統(tǒng)還允許設(shè)計人員添加注釋、評論和誤差等信息。
增強現(xiàn)實系統(tǒng)采用的是基于任務(wù)的多通道用戶界面模型設(shè)計方法,通過整合多個通道的信息來源,使用自然的方式完成界面的操作。系統(tǒng)的層次框架為:交互任務(wù)整合器和場景管理器兩大部分。交互任務(wù)整合器負責(zé)將多個通道輸入的信息進行轉(zhuǎn)換,形成特定的交互任務(wù)。交互設(shè)備則包括了鼠標、攝像頭和語音設(shè)備等,交互設(shè)備需要根據(jù)具體的交互需求來增加或減少。場景管理器,負責(zé)管理場景中的虛擬物體,通過分析交互任務(wù)整合器發(fā)來的指令,修改場景中虛擬物體的屬性,進行相應(yīng)的計算機算法和語義的反饋。場景管理器負責(zé)生成圖像和語音信息,并分別交給顯示器和語音設(shè)備進行處理。
(二)情感設(shè)計
隨著增強現(xiàn)實技術(shù)的不斷發(fā)展,許多設(shè)計奧秘逐步被揭開。正如英國的增強現(xiàn)實設(shè)計師James Alliban所說,“人們依靠各種信息被準確無誤的添加從而做出決策。”“情感設(shè)計”的理念正在當代“以用戶為中心”的交互設(shè)計中被廣泛應(yīng)用。蘋果公司\前副總裁Don Norman博士在《Emotional Design:Why We love(or Hate)Everyday Things》中倡導(dǎo)設(shè)計從實用性到美學(xué)的轉(zhuǎn)變,“一個好的有凝聚力的產(chǎn)品開發(fā),應(yīng)該看上去美觀,用起來舒心”,這就是在交互設(shè)計中被廣泛應(yīng)用到的情感設(shè)計的最好總結(jié)。endprint