任立敏,譚益松,張海波
(東北電力大學(xué) 機(jī)械工程學(xué)院,吉林 132012)
若要實(shí)現(xiàn)編隊(duì)控制,需要編隊(duì)群體中的智能移動(dòng)機(jī)器人個(gè)體首先能夠通過(guò)一定的手段獲取其在空間中的位置、方向,并能夠?qū)ζ涔ぷ骺臻g內(nèi)的環(huán)境信息進(jìn)行足夠的理解和描述。因而,環(huán)境感知問(wèn)題是編隊(duì)控制研究中基礎(chǔ)而又重要的問(wèn)題,這個(gè)問(wèn)題的研究是編隊(duì)控制技術(shù)的前提。環(huán)境感知是指機(jī)器人通過(guò)自身攜帶的傳感器獲取工作空間內(nèi)的環(huán)境信息并建立環(huán)境模型的過(guò)程,有效而可靠的環(huán)境建模方法是機(jī)器人能夠在未知環(huán)境下實(shí)現(xiàn)自主控制的關(guān)鍵。此外,機(jī)器人在工作空間內(nèi)環(huán)境建模方法的實(shí)時(shí)性及定位的準(zhǔn)確性直接影響著編隊(duì)及導(dǎo)航的質(zhì)量。
文獻(xiàn)中有關(guān)環(huán)境建模的方法很多,包括柵格法、幾何法、拓?fù)鋱D法以及四叉樹(shù)方法等[1]。其中,柵格法以其應(yīng)用簡(jiǎn)單的特性備受研究者的青睞[2,3]。柵格法的基本思想將機(jī)器人周圍的工作空間劃分成一系列具有二值信息的網(wǎng)格單元,利用傳感器探測(cè)障礙物的位置信息,并將其映射到相應(yīng)的網(wǎng)格單元上。每個(gè)柵格具有一個(gè)置信值CV,該值由考慮了傳感器特性的概率函數(shù)更新,用于描述在此方位中存在障礙物的可信度。網(wǎng)格中的CV值越高,表示存在障礙物的可能性越大。機(jī)器人在未知環(huán)境中的導(dǎo)航問(wèn)題就可以轉(zhuǎn)化為在這些大小不等的網(wǎng)格中尋找起始點(diǎn)到目標(biāo)點(diǎn)的通路。此外,文獻(xiàn)中也有應(yīng)用徑向扇形柵格表示法實(shí)現(xiàn)機(jī)器人的運(yùn)動(dòng)規(guī)劃[4]。柵格法將環(huán)境量化為具有一定分辨率的柵格,并通過(guò)二維笛卡爾矩陣單元來(lái)描述機(jī)器人周圍的工作空間,柵格的大小、形狀及分辨率等因素直接影響著環(huán)境信息存儲(chǔ)量及安全路徑的搜索時(shí)間。由此可見(jiàn),柵格法存在的問(wèn)題是當(dāng)感知區(qū)域較大時(shí),為了獲得機(jī)器人的運(yùn)動(dòng)行為需要消耗大量的內(nèi)存資源及計(jì)算時(shí)間,因而不利于實(shí)時(shí)應(yīng)用。
除上述環(huán)境建模方法,基于瞬時(shí)目標(biāo)的方法也在實(shí)際中應(yīng)用廣泛[5~9],即在每個(gè)采樣點(diǎn)都根據(jù)測(cè)距傳感器信息建立一個(gè)瞬時(shí)目標(biāo)點(diǎn),機(jī)器人跟蹤這一系列瞬時(shí)目標(biāo)點(diǎn)實(shí)現(xiàn)定點(diǎn)導(dǎo)航。該方法要求機(jī)器人具有360°障礙檢測(cè)范圍而且可以區(qū)分遇到的障礙物邊緣是屬于新的障礙物還是已碰到過(guò)的障礙物。此外,還有一種是跟蹤墻壁的方法[10,11],即控制機(jī)器人在移動(dòng)過(guò)程中與墻面保持恒定距離,這種方法不要求機(jī)器人具有360°探測(cè)范圍,但是這種方法不適用于障礙物邊緣輪廓突變等復(fù)雜情況。洪偉等[12]利用超聲波傳感器基于柵格地圖和滾動(dòng)視窗的控制方法, 提出了一種提取機(jī)器人局部障礙物群環(huán)境特征的數(shù)據(jù)融合新方法,該方法在多個(gè)級(jí)別對(duì)原始數(shù)據(jù)進(jìn)行不同程度的抽象和壓縮,但由于超聲波傳感器本身的局限性,使該方法只在仿真環(huán)境下進(jìn)行了驗(yàn)證。
對(duì)機(jī)器人工作空間內(nèi)局部環(huán)境適當(dāng)?shù)拿枋鍪菣C(jī)器人執(zhí)行運(yùn)動(dòng)控制行為的關(guān)鍵,但由于機(jī)器人只有有限的存儲(chǔ)空間,只能用來(lái)存儲(chǔ)有限的關(guān)鍵信息點(diǎn)。例如對(duì)于環(huán)境中任意形狀的障礙物,如果以增量式地圖的形式對(duì)環(huán)境進(jìn)行建模,往往會(huì)引起存儲(chǔ)空間的不足,難以滿足實(shí)時(shí)性的需求。為此,本文用2-D激光測(cè)距儀來(lái)獲取編隊(duì)過(guò)程中領(lǐng)航機(jī)器人周圍的環(huán)境信息,并提出一種面向編隊(duì)控制的機(jī)器人隨機(jī)障礙群環(huán)境建模方法來(lái)描述機(jī)器人周圍的工作環(huán)境。該方法將機(jī)器人攜帶的傳感器獲得的數(shù)據(jù)信息以極坐標(biāo)矢量圖的形式存儲(chǔ),并將機(jī)器人工作空間內(nèi)的環(huán)境建模為隨機(jī)數(shù)量的障礙群,大大節(jié)省了環(huán)境信息的存儲(chǔ)量,為多機(jī)器人實(shí)現(xiàn)合作編隊(duì)和編隊(duì)避障等關(guān)鍵技術(shù)奠定了基礎(chǔ)
本文選擇激光測(cè)距儀作為機(jī)器人環(huán)境感知的傳感器,安裝在機(jī)器人前端,可以提供Ns個(gè)相等角度空間讀數(shù),其掃描數(shù)據(jù)模型如圖1所示,虛線的圓表示傳感器的最大可探測(cè)范圍。
圖1 2-D激光測(cè)距儀及其數(shù)據(jù)模型
由于激光傳感器坐標(biāo)系的形式為極坐標(biāo)系統(tǒng),Ns束激光讀數(shù)是以逆時(shí)針?lè)较蜻M(jìn)行標(biāo)號(hào),且第一束激光與機(jī)器人坐標(biāo)系的XR軸相差90°,則2-D激光測(cè)距儀測(cè)得的第j個(gè)激光束方向上的位置點(diǎn)可以表示為:
其中,dj為第j束激光方向上測(cè)得的距離值,而jφ為激光束方向和Xs軸之間的方位角。由于對(duì)每個(gè)激光束而言,下標(biāo)和光束角之間的關(guān)系是確定的,因此測(cè)得的位置點(diǎn)也可以方便地表示成如下形式:
本文以激光測(cè)距儀的坐標(biāo)原點(diǎn)為中心,在機(jī)器人運(yùn)動(dòng)的前方設(shè)置半徑為Rd的半圓作為滾動(dòng)窗口,當(dāng)傳感器探測(cè)的距離值dj>Rd時(shí),則令dj=Rd。隨著機(jī)器人的運(yùn)動(dòng),滾動(dòng)窗口也一同向前移動(dòng)。在每個(gè)采樣時(shí)刻,根據(jù)機(jī)器人當(dāng)前的位置信息和傳感器所獲取的最新數(shù)據(jù),對(duì)窗口內(nèi)的環(huán)境及障礙物狀況進(jìn)行更新。同時(shí),將滾動(dòng)視窗內(nèi)的區(qū)域以角度δ為步長(zhǎng)劃分為個(gè)矢量方向δ的選取原則是保證視窗邊緣處的每一個(gè)柵格至少映射到一個(gè)矢量方向上,即,其中S為單個(gè)柵格對(duì)角線的長(zhǎng)度,則視窗內(nèi)的環(huán)境由如下的極坐標(biāo)矢量來(lái)表示:
圖2 極坐標(biāo)矢量法描述局部環(huán)境
設(shè)Gρ表示機(jī)器人與目標(biāo)點(diǎn)之間的距離,jG為與目標(biāo)點(diǎn)方向角Gθ最接近的激光束的下標(biāo)。當(dāng)機(jī)器人滾動(dòng)窗口內(nèi)檢測(cè)到障礙物時(shí),返回機(jī)器人與障礙物之間的距離Rj,對(duì)于機(jī)器人導(dǎo)航而言,機(jī)器人并不關(guān)心目標(biāo)點(diǎn)之后的障礙信息,基于此,用一種變更的局部環(huán)境向量來(lái)描述機(jī)器人周圍的局部環(huán)境,的第j個(gè)元素表示如下:
這種新的局部環(huán)境描述方法稱為極坐標(biāo)矢量圖法,該模型具有以下優(yōu)點(diǎn):1)該模型可以由測(cè)距傳感器獲得的測(cè)量信息直接建立;2)相比于柵格描述法及徑向扇形柵格法,極坐標(biāo)矢量法極大地節(jié)省了存儲(chǔ)空間。極坐標(biāo)矢量存儲(chǔ)法描述環(huán)境信息本質(zhì)上類似于傳感器數(shù)據(jù)的分布,該方法適合于超聲波、激光測(cè)距儀等測(cè)距傳感器,便于機(jī)器人的環(huán)境感知及行為決策。為了滿足實(shí)際的需要并考慮實(shí)時(shí)性,本文選擇的HOKUYO URG-04LX激光測(cè)距儀的角度分辨率為0.36°,其掃描區(qū)域?yàn)?40°,一共可以獲得Ns=671束激光數(shù)據(jù)。為了便于直觀描述,下面以Ns=9束激光為例,將極坐標(biāo)矢量環(huán)境描述法與柵格法進(jìn)行比較,如圖1所示機(jī)器人攜帶激光測(cè)距儀感知的局部環(huán)境實(shí)例,則可以得到矢量,而徑向扇形柵格圖將需要用如式(6)所示的維矩陣來(lái)描述相同的局部空間,其中Nd為沿著距離方向上的柵格的維數(shù)。
其中,“0”和“1”值分別表示相應(yīng)的單元格為自由空間或者被障礙物占據(jù),“×”表示相應(yīng)位置的單元格是不確定的。由此可見(jiàn),采用本文提出的極坐標(biāo)矢量法存儲(chǔ)環(huán)境信息只需要個(gè)數(shù)為Ns的向量即可,而對(duì)于柵格表示法在相同元素大小的情況下則需要Ns×Nd的矩陣來(lái)描述同一環(huán)境,這表明本文提出的極坐標(biāo)矢量法可以極大地節(jié)省機(jī)器人的內(nèi)存空間,提高了機(jī)器人響應(yīng)的實(shí)時(shí)性。
前面介紹的激光傳感器掃描數(shù)據(jù)模型沒(méi)有考慮測(cè)量的不確定性,然而這些不確定性對(duì)于機(jī)器人的安全導(dǎo)航是十分必要的。測(cè)距傳感器的距離不確定性通常是距離的函數(shù),文獻(xiàn)[13]根據(jù)實(shí)際實(shí)驗(yàn)測(cè)量獲得了激光傳感器距離誤差曲線:,測(cè)距誤差由距離誤差的方差來(lái)確定。最大的測(cè)距誤差出現(xiàn)在測(cè)量距離Rd周圍,用dRσ表示。當(dāng)由激光傳感器獲得環(huán)境信息的極坐標(biāo)矢量后,在滾動(dòng)視窗內(nèi),如果距離值(考慮測(cè)距不確定性的距離閾值),則認(rèn)為滾動(dòng)窗口內(nèi)的第j個(gè)矢量方向上存在障礙物,若不滿足上述條件則該方向上不存在障礙物。這樣,可以將極坐標(biāo)矢量劃分為如下的障礙點(diǎn)集合和非障礙點(diǎn)集合:
式中On為機(jī)器人周圍工作空間內(nèi)障礙物的數(shù)目。
機(jī)器人在運(yùn)動(dòng)過(guò)程中,其工作空間內(nèi)朝向目標(biāo)點(diǎn)的行進(jìn)方向上有沒(méi)有障礙物對(duì)機(jī)器人的行為決策至關(guān)重要。如果行進(jìn)方向上存在障礙物,則機(jī)器人只關(guān)心最先遇到的障礙物,而不關(guān)心位于已探測(cè)障礙物后方的障礙信息。為了加快機(jī)器人障礙檢測(cè)的處理速度,本文根據(jù)數(shù)據(jù)聚類的思想,在障礙物密集的環(huán)境中通過(guò)檢測(cè)連續(xù)的兩個(gè)物體之間的距離,將相鄰的機(jī)器人無(wú)法通過(guò)的障礙物進(jìn)行分群處理,最終將機(jī)器人工作的局部環(huán)境用隨機(jī)數(shù)量的障礙物群來(lái)描述。
圖3 障礙物輪廓模型
根據(jù)前面獲得的障礙點(diǎn)的集合,當(dāng)由激光傳感器獲得的極坐標(biāo)矢量中連續(xù)不等于時(shí),則有兩種可能:1)這些來(lái)源于同一個(gè)障礙物;2)這些由兩個(gè)或兩個(gè)以上的障礙物前后重疊產(chǎn)生,如圖4所示。
圖4 環(huán)境中的障礙物識(shí)別與合并
對(duì)于圖4所示的兩種情況的辨別可以從j=0開(kāi)始,通過(guò)對(duì)極坐標(biāo)矢量圖中的兩個(gè)相鄰矢量和之間的距離進(jìn)行比較,如果小于預(yù)先設(shè)定的安全閾值Dth,即滿足:
綜上所述,利用2-D激光測(cè)距儀的原始掃描數(shù)據(jù)獲得了機(jī)器人工作空間內(nèi)所有的障礙物群,本文用這種隨機(jī)數(shù)量的障礙物群來(lái)描述機(jī)器人工作空間內(nèi)的局部環(huán)境,并利用下一時(shí)刻的激光掃描數(shù)據(jù)對(duì)當(dāng)前環(huán)境地圖進(jìn)行更新。相比于柵格法,這種環(huán)境建模方法極大的節(jié)省了環(huán)境信息的存儲(chǔ)量,為后續(xù)多移動(dòng)機(jī)器人編隊(duì)控制技術(shù)研究奠定了基礎(chǔ)。
為了驗(yàn)證上述提出的基于隨機(jī)障礙群的環(huán)境地圖建立算法的有效性,本節(jié)將該算法應(yīng)用于實(shí)際的移動(dòng)機(jī)器人實(shí)驗(yàn)平臺(tái)HR-I,該機(jī)器人上安裝日本HOKUYO公司生產(chǎn)的URG-04LX 2D激光掃描測(cè)距儀作為主要的環(huán)境感知傳感器。
環(huán)境感知實(shí)驗(yàn)是在實(shí)驗(yàn)室內(nèi)進(jìn)行,環(huán)境信息對(duì)于機(jī)器人來(lái)說(shuō)不是全局已知的,需要利用傳感器實(shí)時(shí)感知并建模。實(shí)際環(huán)境中的障礙物可以任意放置,圖5(a)給出了實(shí)驗(yàn)中的兩幅實(shí)際環(huán)境照片,實(shí)驗(yàn)環(huán)境中障礙物形狀各異,具體包含了桌子、椅子,水桶等常用物品。實(shí)驗(yàn)環(huán)境B相對(duì)于環(huán)境A的主要變化是人為的將環(huán)境中的椅子向水桶方向移動(dòng),縮小了二者之間的距離,使之小于機(jī)器人本體的寬度,同時(shí)將桌子向水桶的方向移動(dòng)。圖5(b)給出了機(jī)器人平臺(tái)上實(shí)際程序運(yùn)行過(guò)程中實(shí)時(shí)得到的隨機(jī)障礙群識(shí)別結(jié)果。
從上述結(jié)果可以看出:隨著實(shí)際環(huán)境的變化,障礙物和障礙群的分布情況是不同的,并且最終獲得了具體環(huán)境對(duì)應(yīng)的障礙物及障礙群的個(gè)數(shù),充分驗(yàn)證了本文所提出的環(huán)境建模方法的有效性和適用性。
圖5 實(shí)驗(yàn)環(huán)境及機(jī)器人平臺(tái)程序運(yùn)行結(jié)果
本文針對(duì)編隊(duì)控制研究中的基礎(chǔ)而又重要的問(wèn)題——環(huán)境感知問(wèn)題開(kāi)展了相關(guān)研究工作:基于2-D激光測(cè)距儀建立了隨機(jī)障礙群環(huán)境模型,該模型將激光傳感器獲得的掃描數(shù)據(jù)以極坐標(biāo)矢量圖的形式存儲(chǔ),并將機(jī)器人工作空間內(nèi)的環(huán)境建模為隨機(jī)數(shù)量的障礙群,大大節(jié)省了環(huán)境信息的存儲(chǔ)量。最后,將所提出的隨機(jī)障礙群環(huán)境建模方法運(yùn)用于移動(dòng)機(jī)器人實(shí)驗(yàn)平臺(tái)上,通過(guò)實(shí)際的兩組不同的實(shí)驗(yàn)環(huán)境獲得的實(shí)驗(yàn)結(jié)果,驗(yàn)證了本文所提出的環(huán)境建模方法的有效性.
[1] Hwang Y K, Ahuja N. Gross motion planning—a survey[J].ACM Computing Surveys (CSUR),1992,24(3):219-291.
[2] 袁曾任,高明.在動(dòng)態(tài)環(huán)境中移動(dòng)機(jī)器人導(dǎo)航和避碰的一種新方法[J].機(jī)器人,2000,22(2).
[3] Zhao-Qing M,Zengren Y.Real time navigation and obstacle avoidance based on grids method for fast mobile robot[J]. Robot,1996,18(6):344-348.
[4] Malkin P K,Addanki S. Lognets: A hybrid graph spatial representation for robot navigation[C].Proceedings of Eighth National Conference on Artif i cial Intelligence.1990,2:1045-1050.
[5] S. S. Ge, Y. J. Cui, and C.Zhang,“Instant-goal-driven methods for behavior-based mobile robot navigation,”in Proc.2003 IEEE Int.Symp Intelligent Control,Oct.2003:269-274.
[6] S. S. Ge,Lai Xuecheng and Abdullah Al Mamun,“Boudary following and globally convergent path planning using instant goals. IEEE Trans.on Systems.Man.and Cybernetics-Part B:Cybernetics,2005,35(2):240-254.
[7] F.G. Pin,S.R. Bender,Adding memory processing behavior to the fuzzy behaviorist approach: Resolving limit cycle problems in mobile robot navigation, Intelligent Automation and Soft Computing 1999,5(1).
[8] W.L. Xu, A virtual target approach for resolving the limit cycle problem in navigation of a fuzzy behavior-based mobile robot,Robotics and Autonomous Systems 2000,30(4):315-324.
[9] W.L. Xu, S.K. Tso, Sensor-based fuzzy reactive navigation for a mobile robot through local target switching, IEEE Transactions on SMC 1999,29(3):451-459.
[10] Toibero, J.M.; Carelli, R.;Kuchen, B.,“Stable switching contourfollowing controller for wheeled mobile robots,”Proceedings of IEEE International Conference on Robotics and Automation,2006:3724-3729.
[11] Juan Marcos Toibero, Flavio Roberti , Ricardo Carelli and Paolo Fiorini,“Switching control approach for stable navigation of mobile robots in unknown environments,”Robotics and Computer-Integrated Manufacturing,2011,27(3):558-568.
[12] 洪偉,田彥濤,董再勵(lì),等.智能機(jī)器人系統(tǒng)中局部環(huán)境特征的提取[J].機(jī)器人,2003,25(3):264-269.
[13] Castellanos J A,Tardos J D.Mobile robot localization and map building:A multisensor fusion approach[M].Kluwer academic publishers,2000.