趙斯曼
[摘 要]手勢交互是人機交互的重要組成部分,而基于計算機視覺的三維手勢交互因其自由度高、體驗自然的特點,逐漸成為研究熱點。本文對基于計算機視覺的三維手勢信息采集技術(shù)進行了專利數(shù)據(jù)分析,對該領(lǐng)域的專利申請量年趨勢、國別分布、重要申請人等情況做了分析總結(jié),希望能為行業(yè)發(fā)展提供參考。
[關(guān)鍵詞]手勢;計算機視覺;雙目成像
doi:10.3969/j.issn.1673 - 0194.2018.12.069
[中圖分類號]TP391.41 [文獻標識碼]A [文章編號]1673-0194(2018)12-0-03
0 引 言
基于計算機視覺的手勢交互技術(shù)是指將圖像采集設(shè)備拍攝到的包含手勢的圖像信息傳輸給計算機,通過計算機視覺技術(shù)進行處理識別。這種交互方式僅需使用者徒手進行操作,提供了更高的交互自由度和更自然的交互體驗,因而逐漸成為手勢交互的發(fā)展趨勢。
采集三維手勢信息的重點是采集手勢深度信息,目前,主流的三維手勢信息采集技術(shù)包括雙目/立體成像、結(jié)構(gòu)光和光飛時間。雙目/立體成像,使用兩個以上攝像頭拍攝對象,匹配圖像,根據(jù)對象在不同畫面中的位置來計算手勢深度信息。結(jié)構(gòu)光通過向?qū)ο笸渡浣Y(jié)構(gòu)光圖樣,然后根據(jù)圖樣在對象表面產(chǎn)生的變化獲取深度信息。光飛時間通過向?qū)ο蟀l(fā)射激光,測量反射返回時間確定手勢深度信息。
1 數(shù)據(jù)分析概況
本次檢索時間截至2017年12月,最終確定涉及的全球?qū)@暾埞灿?87項,其來自41個國家或地區(qū)的總計90位申請人,總體發(fā)展趨勢呈增長狀態(tài)。
1.1 申請量分析
國外基于計算機視覺的三維手勢信息采集技術(shù)起步較早,萌芽于20世紀90年代,于2003年之后開始平穩(wěn)上漲,但受限于當時應(yīng)用平臺較少,二維手勢交互即可滿足多數(shù)應(yīng)用場景下的控制要求,且其技術(shù)難度和成本相對較高,因此發(fā)展較為緩慢。2009年起,增強/虛擬現(xiàn)實成為研究熱點,自此,基于計算機視覺的三維手勢交互技術(shù)因其空間自由度高、交互體驗自然的優(yōu)點,在增強/虛擬現(xiàn)實領(lǐng)域得到了廣泛應(yīng)用,其專利申請量逐年遞增,呈井噴式增長趨勢,進入高速發(fā)展期。國內(nèi)外申請量年趨勢如圖1所示,
相比之下,國內(nèi)基于計算機視覺的三維手勢信息采集技術(shù)起步較晚,整體發(fā)展趨勢曲線有所延遲,如圖1所示,國內(nèi)直到2004年起才開始關(guān)注這一領(lǐng)域的研究,但隨著全球范圍內(nèi)對該領(lǐng)域的研究熱度不斷提升,國內(nèi)也迅速增加了研究投入,自2009年起申請量也出現(xiàn)了明顯增長,體現(xiàn)了全球市場的巨大需求也刺激了國內(nèi)開始重視該領(lǐng)域。
1.2 國別分析
1.2.1 原創(chuàng)國/目標國排名
圖2以申請數(shù)對原創(chuàng)國進行排名,顯示了不同國家或地區(qū)在該領(lǐng)域的技術(shù)儲備和研究實力,而目標國以受理數(shù)排名,代表了該國家或地區(qū)的市場需求。
從原創(chuàng)國排名來看,美國高居首位,顯示出明顯的技術(shù)領(lǐng)先地位,中國緊隨其后,同樣擁有不可小覷的專利申請量,另外,韓日也在該領(lǐng)域進行了一定的專利布局。從目標國排名來看,美國和中國的受理數(shù)量明顯超出了其申請數(shù)量,證明美國和中國擁有著龐大的消費市場,因此除本國申請之外,全球范圍內(nèi)的申請人也紛紛以這兩個國家為目標進行了較多的專利申請。
1.2.2 美中專利法律狀態(tài)對比
從圖3可以看出,美國和中國的專利申請量明顯超出其他國家地區(qū)。然而,申請量往往只能表現(xiàn)出該國家地區(qū)的研究熱度,專利的有效比例更能反映出真正的研究實力。因此,針對申請量最高的美國和中國,統(tǒng)計其專利的法律狀態(tài)。從圖3中可知,美國的專利有效/無效比達到了6.5,遠遠超出了中國的1.5,證明其專利申請不僅量多,且質(zhì)優(yōu),進一步證明了美國在該領(lǐng)域具有雄厚的研究實力。中國雖然擁有較多的專利申請量,但專利的有效/無效比例相對偏低,一方面是由于中國對該領(lǐng)域的研究起步較晚,失去了一些專利布局的先機,另一方面也是因中國在該領(lǐng)域的技術(shù)實力相對薄弱,核心專利數(shù)量不足所致。
1.3 申請人分析
1.3.1 全球重要申請人排名
通過對各申請人的申請量進行統(tǒng)計,得到前十名申請人的申請量排名情況。從圖4可以看出,微軟公司的申請量高居首位,除此之外,亞馬遜、英特爾、蘋果、谷歌等大型企業(yè)均榜上有名,顯示了美國廠商強勁的綜合研究實力。其中,微軟的Kinect、英特爾的RealSense等,均為應(yīng)用了基于計算機視覺的三維手勢交互技術(shù)的體感產(chǎn)品,而除這些傳統(tǒng)大型科技企業(yè)之外,亞馬遜公司也開始投入三維手勢交互研發(fā)領(lǐng)域,為推出自家的智能購物和智能手機產(chǎn)品做相應(yīng)的準備。其次,韓國企業(yè)在基于計算機視覺的三維手勢信息采集領(lǐng)域也具有一定的實力,領(lǐng)先企業(yè)三星、LG均出現(xiàn)在前十排名中,在針對電視、手機的交互控制之外,也積極進軍AR/VR領(lǐng)域。最后,結(jié)合之前的原創(chuàng)國排名、法律狀態(tài)分布和這張重要申請人排名圖可以看出,中國雖然在該領(lǐng)域申請量總數(shù)較多,但申請人相對分散,尚未成為有競爭力的核心企業(yè),這說明中國在三維手勢交互領(lǐng)域還亟待投入發(fā)展。
1.3.2 重要申請人的技術(shù)分布
在列出基于計算機視覺的三維手勢信息采集領(lǐng)域的重要申請人之后,接下來將反映重要申請人在各技術(shù)分支的研究側(cè)重。圖5對比了重要申請人排名中前三位申請人在各分支的申請量分布,從圖中可以看出,各大公司都有其相對側(cè)重的研究點,其中,基于雙目/立體成像的三維手勢采集在三家公司的申請中都有著較高的采用占比;然而,與三星專注于使用雙目/立體成像技術(shù)不同,微軟和亞馬遜對基于結(jié)構(gòu)光和基于光飛時間的三維手勢信息采集也投入了相當比例的研究和申請保護。總體來說,雙目/立體成像技術(shù)應(yīng)用較廣,而結(jié)構(gòu)光和光飛時間技術(shù)受到目前手勢交互領(lǐng)軍企業(yè)的研發(fā)關(guān)注,具有很好的發(fā)展前景。
2 結(jié) 語
本文詳細梳理了基于計算機視覺的三維手勢信息采集技術(shù)的各技術(shù)分支的發(fā)展情況,有助于行業(yè)全面了解基于計算機視覺的三維手勢信息采集技術(shù)的基本發(fā)展態(tài)勢,希望本文的研究成果能夠為行業(yè)發(fā)展提供借鑒。
主要參考文獻
[1]武霞,張崎,許艷旭.手勢識別研究發(fā)展現(xiàn)狀綜述[J].電子科技,2013(6).
[2]譚同德,郭志敏.基于雙目視覺的人手定位與手勢識別系統(tǒng)研究[J].計算機工程與設(shè)計,2012(1).
[3]白明明.基于結(jié)構(gòu)光的手勢識別技術(shù)魯棒性研究[D].沈陽:東北大學(xué),2014.