韋 宇
(廣州海格通信集團(tuán)股份有限公司,廣東 廣州 510663)
隨著人類科技發(fā)展和社會(huì)分工精細(xì)化,一些自然災(zāi)害救援、惡劣地質(zhì)環(huán)境科考等不適宜人類身處一線的工作,可以交給機(jī)器人完成。目前的機(jī)器人已經(jīng)能夠勝任精確、重復(fù)性的工作,根據(jù)使用環(huán)境特點(diǎn)設(shè)計(jì)的機(jī)器人,可以很好地彌補(bǔ)人類自身生理的短板。但很多時(shí)候,機(jī)器人還不能夠靈活地為新任務(wù)進(jìn)行自我調(diào)整,也不能應(yīng)付一個(gè)不熟悉的或不確定的情景。因?yàn)槟壳皩?duì)人腦智能機(jī)理尚未研究清楚,從技術(shù)上要賦予機(jī)器類人級(jí)別的人工智能還有很長(zhǎng)的路要走。本文的主要研究方向是如何利用目前發(fā)展快速的技術(shù)短周期內(nèi)實(shí)現(xiàn)機(jī)器人勝任惡劣環(huán)境下智能作業(yè)。
機(jī)器人的技術(shù)按照通常的理解分為3個(gè)部分:感知、認(rèn)知和行為控制。感知部分主要是基于視覺(jué)、聽(tīng)覺(jué)及各種傳感器的信息處理;認(rèn)知部分則負(fù)責(zé)更高層的信息處理,如記憶、學(xué)習(xí)、推理、決策等。計(jì)算機(jī)在數(shù)據(jù)存儲(chǔ)和深度學(xué)習(xí)方面可以勝任,推理和決策方面尚有不足仍須人為介入;行為控制部分是針對(duì)機(jī)器人的行為進(jìn)行控制。
引入了遙感的概念,機(jī)器人部署在現(xiàn)場(chǎng),后臺(tái)和操作者利用機(jī)器人的采集信息達(dá)到無(wú)接觸遠(yuǎn)程探測(cè)現(xiàn)場(chǎng)環(huán)境,在現(xiàn)場(chǎng)之外實(shí)時(shí)地感知現(xiàn)場(chǎng),并有效地進(jìn)行某種操作。整個(gè)感知和行為控制過(guò)程就是人機(jī)的信息交互過(guò)程。遠(yuǎn)程呈現(xiàn)人機(jī)交互技術(shù),是一種讓操作者穿戴動(dòng)作捕捉設(shè)備,操作者的肢體動(dòng)作轉(zhuǎn)換成動(dòng)作指令傳遞給機(jī)器人,機(jī)器人完成動(dòng)作所采集的視音頻等傳感信息及指令閉環(huán)反饋給后臺(tái)。后臺(tái)還需要獲取機(jī)器人現(xiàn)場(chǎng)的定位信息和現(xiàn)場(chǎng)地圖數(shù)據(jù),機(jī)器人定位信息采用機(jī)器人集成定位導(dǎo)航模塊獲取,現(xiàn)場(chǎng)地圖由后臺(tái)調(diào)用商用地圖云服務(wù)獲取,服務(wù)覆蓋不到區(qū)域通過(guò)租用測(cè)繪衛(wèi)星來(lái)獲取實(shí)時(shí)現(xiàn)場(chǎng)衛(wèi)星影像后繪制地圖。最后后臺(tái)對(duì)視頻、音頻數(shù)據(jù)進(jìn)行全景縫合和聲場(chǎng)復(fù)原,并對(duì)所有數(shù)據(jù)進(jìn)行分析形成輔助信息,全景縫合視頻數(shù)據(jù)、聲場(chǎng)復(fù)原數(shù)據(jù)和輔助信息通過(guò)操作者的虛擬現(xiàn)實(shí)頭顯和耳機(jī)反饋,進(jìn)而實(shí)現(xiàn)信息鏈路的閉環(huán),如圖1所示。
接下來(lái)就要根據(jù)該系統(tǒng)的特點(diǎn)設(shè)計(jì)通信系統(tǒng),惡劣地質(zhì)環(huán)境多處人跡罕至,自然災(zāi)害形式和地點(diǎn)都不固定,有線通信從建設(shè)成本和可執(zhí)行性上都不可能,唯有無(wú)線通信技術(shù)可以勝任。當(dāng)前流行的無(wú)線通信技術(shù)有4GLte,UMTS/3GPPw/HSDPA,CDMA2000,GSM,Infrared(IR),ZigBee,Bluetooth,RFID,WiFi,微波通信等。先分析本系統(tǒng)需要通信的數(shù)據(jù)量,后臺(tái)或操作者發(fā)送給機(jī)器人的上行鏈路數(shù)據(jù)包括動(dòng)作指令數(shù)據(jù)、音頻數(shù)據(jù)、機(jī)器人系統(tǒng)指令數(shù)據(jù)。機(jī)器人發(fā)送給后臺(tái)和操作者的下行鏈路數(shù)據(jù)包括動(dòng)作反饋數(shù)據(jù)、音視頻數(shù)據(jù)、機(jī)器人狀態(tài)數(shù)據(jù)。其中動(dòng)作指令數(shù)據(jù)是由動(dòng)作捕捉設(shè)備產(chǎn)生,穿戴式動(dòng)作捕捉設(shè)備采用慣性導(dǎo)航式動(dòng)作捕捉,在操作者可活動(dòng)的部位處部署陀螺儀、加速計(jì)、磁力計(jì),測(cè)量該關(guān)節(jié)的活動(dòng)旋轉(zhuǎn)、運(yùn)動(dòng)距離、運(yùn)動(dòng)方向等信息[1]。假設(shè)機(jī)器人根據(jù)人體可活動(dòng)關(guān)節(jié)數(shù)量對(duì)稱設(shè)計(jì),人體可活動(dòng)部位包括頭部、肩部、大臂、小臂、手、胸口、尾椎、大腿、小腿、腳踝、指骨等總計(jì)45個(gè),每顆陀螺儀/加速計(jì)/磁力計(jì)采用I2C接口數(shù)據(jù),I2C總線最大碼率為400 kbps,音頻數(shù)據(jù)采用AAC編碼,碼率192 kbps,機(jī)器人系統(tǒng)指令數(shù)據(jù)按照10 Mbps預(yù)計(jì),那么,上行鏈路的數(shù)據(jù)吞吐量如公式1所述。
上行鏈路數(shù)據(jù)吞吐量=動(dòng)作指令數(shù)據(jù)+音頻數(shù)據(jù)+機(jī)器人系統(tǒng)指令數(shù)據(jù)=45×3×400 kbps+1×192 kbps+10 Mbps≈65 Mbps (1)
同理,下行鏈路的動(dòng)作反饋數(shù)據(jù)等同于動(dòng)作指令數(shù)據(jù)量,機(jī)器人狀態(tài)數(shù)據(jù)量(含定位數(shù)據(jù))等同于機(jī)器人系統(tǒng)指令數(shù)據(jù)。機(jī)器人按照人的視聽(tīng)覺(jué)生理結(jié)構(gòu)的雙目雙耳設(shè)計(jì),視覺(jué)按照800萬(wàn)像素(約4 K高分辨率)計(jì)算,一路4K音視頻數(shù)據(jù)采用H.265編碼碼流約為22 Mbps,那么,下行鏈路的數(shù)據(jù)吞吐量如公式2所述:
下行鏈路數(shù)據(jù)吞吐量=動(dòng)作反饋數(shù)據(jù)+音視頻數(shù)據(jù)+機(jī)器人系統(tǒng)狀態(tài)數(shù)據(jù)=45×3×400 kbps+2×22 Mbps+10 Mbps≈108 Mbps (2)
上下行鏈路各自吞吐量不應(yīng)低于108 Mbps,從數(shù)據(jù)吞吐量的要求和信號(hào)抗干擾能力的要求只剩下微波通信技術(shù)能滿足。本系統(tǒng)機(jī)器人同后臺(tái)通信采用分組微波通信技術(shù),采用鏈?zhǔn)街欣^組網(wǎng)方式,56 MHz信道256QAM調(diào)制,空口吞吐量366 Mbps,有效載荷345 Mbps遠(yuǎn)大于上下行各自的數(shù)據(jù)吞吐量要求[2]。
圖1 系統(tǒng)示意
本系統(tǒng)由機(jī)器人系統(tǒng)、遠(yuǎn)程呈現(xiàn)遙感兩大系統(tǒng)組成,采用基礎(chǔ)支撐層、應(yīng)用支撐層、系統(tǒng)應(yīng)用層、平臺(tái)訪問(wèn)層的縱向分層架構(gòu)思路設(shè)計(jì)(見(jiàn)圖2)[3]。
圖2 系統(tǒng)架構(gòu)
1.2.1 基礎(chǔ)支撐層
機(jī)器人側(cè)部署多目攝像頭(內(nèi)含穩(wěn)像光學(xué)系統(tǒng))、拾音器、體感采集器、擴(kuò)聲器、音視頻編碼設(shè)備、微波通信設(shè)備、導(dǎo)航設(shè)備。
通信系統(tǒng)部署移動(dòng)微波中繼終端、微波通信設(shè)備、衛(wèi)星(用于定位和測(cè)繪)及衛(wèi)星通信設(shè)備。
操作者側(cè)部署穿戴式動(dòng)作捕捉設(shè)備、體感反饋設(shè)備(機(jī)器人側(cè)提供的體感數(shù)據(jù)反饋)、擴(kuò)聲陣列(耳機(jī))、虛擬現(xiàn)實(shí)頭顯。
后臺(tái)側(cè)部署解碼設(shè)備、服務(wù)器、操作終端、顯示單元、存儲(chǔ)陣列。
1.2.2 應(yīng)用支撐層
機(jī)器人側(cè)提供機(jī)器人設(shè)備管理功能、機(jī)器人體感控制功能。
通信系統(tǒng)提供信道加密功能。
后臺(tái)側(cè)提供授權(quán)管理功能、地圖功能(既有城市地圖、衛(wèi)星測(cè)繪地圖)、數(shù)據(jù)分析功能、操作者設(shè)備管理功能、操作者體感采集功能、體感處理功能、全景視頻縫合功能(機(jī)器人多目攝像頭的影像縫合),全景聲場(chǎng)復(fù)原功能(機(jī)器人拾音器采集音源復(fù)原)、虛擬置入、人機(jī)同步等功能。
1.2.3 系統(tǒng)應(yīng)用層
機(jī)器人系統(tǒng)包括仿人關(guān)節(jié)機(jī)理的機(jī)械系統(tǒng)、仿人視覺(jué)聽(tīng)覺(jué)生理機(jī)理的信息采集系統(tǒng)、微波通信系統(tǒng)。
遠(yuǎn)程呈現(xiàn)遙感系統(tǒng)包括管理系統(tǒng)、通信系統(tǒng)(微波和衛(wèi)星)、人工智能系統(tǒng)、虛擬現(xiàn)實(shí)系統(tǒng)。
1.2.4 平臺(tái)訪問(wèn)層
提供管理終端和操作者終端接入功能,管理終端提供整個(gè)平臺(tái)設(shè)備管理功能、數(shù)據(jù)分析和決策功能。操作者終端提供遠(yuǎn)程呈現(xiàn)遙感操作功能。
本系統(tǒng)是個(gè)涉及學(xué)科繁多的大系統(tǒng),囊括了機(jī)器人、人工智能、無(wú)線通信、遠(yuǎn)程呈現(xiàn)、傳感技術(shù)、遙感技術(shù)等。方案有些環(huán)節(jié)還留有遺憾,例如如何優(yōu)化機(jī)器人側(cè)的無(wú)線通信的終端和天線設(shè)備的尺寸、如何延長(zhǎng)機(jī)器人的電池續(xù)航能力等技術(shù)問(wèn)題。
[參考文獻(xiàn)]
[1]鄧杏杏,朱大明,楊袁聰.基于全景圖的虛擬現(xiàn)實(shí)系統(tǒng)研究與探討[J].地礦測(cè)繪,2009(1):26-28.
[2]趙正旭,戴歡,趙文彬,等.基于慣性動(dòng)作捕捉的人體運(yùn)動(dòng)姿態(tài)模擬[J].計(jì)算機(jī)工程,2012(5):5-8.
[3]張乃平,李亭,李國(guó)潤(rùn).利用遠(yuǎn)程呈現(xiàn)技術(shù)構(gòu)建“三華”調(diào)度會(huì)商系統(tǒng)[J].電力系統(tǒng)通信,2011(3):17-20.