張旭 賈磊磊 李玲
[摘要]多機(jī)器人追捕一逃跑問題一直是人工智能研究的一個典型問題。當(dāng)存在多個機(jī)器人時,他們可以通過實(shí)時通信和協(xié)商來提高追捕效率,即機(jī)器人協(xié)調(diào)合作問題。因此,多機(jī)器人圍捕問題具有一定的代表性,已成為目前研究多個智能體合作與協(xié)調(diào)系統(tǒng)的理想研究平臺。本文通過對多機(jī)器人圍捕問題的研究與分析,采用模糊控制的圍捕協(xié)調(diào)策略,成功的完成了圍捕任務(wù)。
[關(guān)鍵詞]多機(jī)器人;圍捕;模糊控制;協(xié)調(diào)策略
0引言
近年來,多機(jī)器人系統(tǒng)研究因其自身的復(fù)雜性和并行性,以及廣泛的應(yīng)用領(lǐng)域,受到越來越多專家和學(xué)者的關(guān)注。多機(jī)器人協(xié)調(diào)與對抗是多機(jī)器人系統(tǒng)研究中的基本問題,而多機(jī)器人圍捕問題是多機(jī)器人系統(tǒng)研究的一個典型問題。隨著機(jī)器人技術(shù)的不斷發(fā)展。多機(jī)器人系統(tǒng)的研究成果已經(jīng)廣泛應(yīng)用于工業(yè)、航天、軍事和民用服務(wù)業(yè)等各個領(lǐng)域。多機(jī)器人圍捕是指在多機(jī)器人追捕過程中,不僅要順利完成追逃任務(wù),同時在特定的條件下保持一定的追捕隊(duì)形實(shí)現(xiàn)最終的一種“包圍”狀態(tài)Ⅲ。能夠有效應(yīng)用于多機(jī)器人圍捕問題的協(xié)調(diào)策略,經(jīng)過簡化后同樣能夠適用于一般的追捕任務(wù)。因此,本文主要針對多機(jī)器人圍捕問題的協(xié)調(diào)策略進(jìn)行分析研究,更加具有典型的意義。
本文主要討論的多機(jī)器人圍捕問題是基于局部信息感知的,即在追捕過程中,雙方并不能完全感知周圍的所有信息。因?yàn)樵趯?shí)際應(yīng)用中,追逃雙方往往不能完全探測到周圍的復(fù)雜地形以及對抗雙方的實(shí)時位置信息。
1基于虛擬力預(yù)測的逃逸機(jī)器人策略
文中主要討論多機(jī)器人圍捕單機(jī)器人的策略分析問題,對于單個逃逸者而言,在速度固定的情況下,需要躲避所有的追捕者以防止被圍捕,因此只需要討論對抗策略,不涉及自身的協(xié)調(diào)問題。根據(jù)圖1分析可知,距離逃逸者最近的追捕者pk對逃逸者的威脅最大,反之距離越遠(yuǎn)的追捕者對逃逸者的威脅越小。根據(jù)每個追捕者與逃跑者的位置距離的遠(yuǎn)近,設(shè)置反比例權(quán)系數(shù),對于逃逸者當(dāng)前的虛擬目標(biāo)點(diǎn)預(yù)測計算如圖1所示。
根據(jù)傳感器反饋的位置信息,找出距離逃逸者最遠(yuǎn)的追捕者i,其距離逃逸者的距離設(shè)為depi,令它對逃逸者的威脅系數(shù)設(shè)為λd,即距離最大的追捕者相對于逃逸者的反矢量距離,則其他追捕者對逃逸者的威脅分別取為(仿真中令λd=3):
(1)
(2)
則求得逃逸者到虛擬目標(biāo)的矢量為:
(3)
由式(3)結(jié)合當(dāng)前逃逸者的位置可得到逃逸者的虛擬目標(biāo)點(diǎn)pgoal。若最終無法找到合適的逃逸者的虛擬目標(biāo)點(diǎn),即沒有可以選擇的可行方向,或者逃逸機(jī)器人與每個追捕機(jī)器人之間的距離均小于某一確定閾值時,則圍捕任務(wù)結(jié)束。
2基于模糊控制的追捕機(jī)器人協(xié)調(diào)策略
模糊集合理論的概念是L.A.Zadeh教授在1965年在Information&Control雜志中首次提出,隨后得到了不斷的擴(kuò)展與完善,逐漸由數(shù)學(xué)領(lǐng)域應(yīng)用推廣到工業(yè)及信息等領(lǐng)域的應(yīng)用。模糊邏輯控制就是在模糊集合的應(yīng)用與發(fā)展中提出的一個新的分析方法及控制策略。
在本文中。假設(shè)一共有三個圍捕機(jī)器人。通過模糊邏輯進(jìn)行分析,對每一個追捕機(jī)器人的每一步運(yùn)動方向及夾角進(jìn)行控制,通過實(shí)時在線檢測。每一步確定距離逃逸者最近的追捕機(jī)器人為pk,距離最近的追捕機(jī)器人在追捕過程中直接奔向逃跑者的下一步的虛擬目標(biāo)點(diǎn)。此時對于追捕機(jī)器人pk而言,其每一步的追捕效率是最高的。對于其它兩個距離逃逸者較遠(yuǎn)的追捕機(jī)器人,采用模糊邏輯控制,來確定其每一步的運(yùn)動方向。即對于除pk以外的兩個追捕機(jī)器人,輸入為每一個追捕機(jī)器人與pk的夾角大小,輸出為追捕機(jī)器人的追捕運(yùn)動的方向角。以逃跑機(jī)器人為中心,實(shí)時檢測任意一個追捕機(jī)器人與pk的夾角大小θ1(θ1是指追捕機(jī)器人與p。之間較小的小于180~的夾角)。將θ1量化為三個論域(0°,90°),(60°,120°),(90°,180°),并按照一定的隸屬度關(guān)系使論域與模糊變量{小(s),中(M),大(L)}湘對應(yīng)。
進(jìn)一步的,通過解模糊來確定兩個追捕機(jī)器人每一步的運(yùn)動方向及夾角θ2。將θ2量化為三個論域:(擴(kuò)大與pk夾角即反向旋轉(zhuǎn)60°),(不旋轉(zhuǎn)即保持原有運(yùn)動方向)和(縮小與pk夾角即正向旋轉(zhuǎn)60°),并按照一定的隸屬度關(guān)系使該論域與模糊變量的三個語言取值{F,Z,N}相對應(yīng)。
三個追捕者最終的運(yùn)動狀態(tài)為追上逃跑者,同時呈120°夾角包圍逃跑者的狀態(tài),此時追捕任務(wù)結(jié)束。
模糊控制規(guī)則如下:
規(guī)則1:if θ1 is S then θ2 is F;
規(guī)則2:if θ1 is M then θ2 is Z;
規(guī)則3:if θ1 is L then θ2 is N……
3確定障礙物環(huán)境中機(jī)器人運(yùn)動方向
本文仿真環(huán)境為mobotsim軟件,該軟件包含傳感器信息,可以自由定義傳感器個數(shù)。本文在分析研究過程中,選擇傳感器的個數(shù)為三個,設(shè)定傳感器的有效范圍為三米。當(dāng)傳感器的當(dāng)前測量返回值為3時,說明此傳感器探測到障礙物的距離為3m或當(dāng)前狀態(tài)下障礙物相距相對較遠(yuǎn)沒有探測到障礙物,因此默認(rèn)3m以外的障礙物對機(jī)器人的影響忽略不計。
根據(jù)當(dāng)前追捕機(jī)器人與逃逸機(jī)器人分別的傳感器輸入測量值的大小,按照一定的比例,對避障行為與追逃雙方根據(jù)圍捕策略確定的運(yùn)動方向進(jìn)行矢量和計算,最后確定各個追逃機(jī)器人的每一步的最終運(yùn)動方向,
根據(jù)“木桶原理”,對于任意一個機(jī)器人的三個傳感器輸入值,找出其最小值設(shè)為λmin,λmin∈(0,3m)。根據(jù)λmin值的大小,進(jìn)而分別確定圍捕任務(wù)時目標(biāo)策略與避障策略的權(quán)系數(shù)ω1和ω2,其中ω1+ω2=1。當(dāng)λmin∈(0,1)時,ω1取值為0.2,ω2取值為0.8;當(dāng)λmin∈[1,2]時,ω1取值為0.4,ω2取值為0.6;當(dāng)λmin∈(2,3)時,ω1取值為0.8,ω2取值為0.2。設(shè)任意時刻機(jī)器人根據(jù)目標(biāo)選擇運(yùn)動方向的轉(zhuǎn)角為θF,避障策略的轉(zhuǎn)角為θZ,則機(jī)器人每一步最終的運(yùn)動方向角θ為:
θ=ω1θF-ω2θZ (4)
4設(shè)置追捕者優(yōu)先級
在圍捕過程中,若追捕機(jī)器人追捕速度遠(yuǎn)大于逃逸者的速度,或者多個機(jī)器人運(yùn)動到障礙物較復(fù)雜且距離較近區(qū)域時,根據(jù)當(dāng)前的策略選擇運(yùn)動方向后,由于追捕機(jī)器人之間的互相影響,可能會導(dǎo)致兩個追捕者停滯運(yùn)動而導(dǎo)致最終的圍捕失敗的結(jié)果。由于傳感器的感應(yīng)范圍限制在0到3m之間,因此當(dāng)機(jī)器人的運(yùn)動速度過大時,可能會造成雙方位置距離較小的狀態(tài),或是此時若兩邊存在類似對稱的障礙物,則可能陷入局部極小永遠(yuǎn)無法繼續(xù)運(yùn)動。而且,當(dāng)機(jī)器人的速度過大時,對仿真的有效性驗(yàn)證也有影響,且在一定程度上會影響避障和路徑選擇策略的效果。因此本文在仿真時選擇比較接近的追逃機(jī)器人速度,即盡量保證追捕者與逃逸者在速度上不存在優(yōu)劣,以便更加直觀有效的對追逃協(xié)調(diào)策略的性能進(jìn)行驗(yàn)證。
同時,在多機(jī)器人圍捕過程中,對追捕機(jī)器人分別設(shè)置優(yōu)先級別,設(shè)RI>R2>R3(1、2、3為仿真中機(jī)器人的編號),即1號追捕機(jī)器人優(yōu)先級最高,3號優(yōu)先級最小。若是出現(xiàn)了上述可能的陷入局部運(yùn)動失敗的情況,根據(jù)優(yōu)先級判斷,優(yōu)先級別高的機(jī)器人根據(jù)當(dāng)前策略繼續(xù)前進(jìn),優(yōu)先級別較低的機(jī)器人稍作停頓,等待下一周期策略選擇后再繼續(xù)運(yùn)動,這樣就能夠在不影響策略整體效果的情況下及時的轉(zhuǎn)化僵局保證圍捕任務(wù)的順利進(jìn)行。
5仿真實(shí)驗(yàn)
本文的仿真環(huán)境為mobotsim移動機(jī)器人仿真軟件,仿真環(huán)境為用網(wǎng)格表示的二維坐標(biāo)平面,其中一個單位網(wǎng)格表示實(shí)際lm的距離。除初始位置不同外,各個機(jī)器人的其它性能參數(shù)均相同,即追捕機(jī)器人與逃逸機(jī)器人分別具有相同的傳感器探測范圍,大小體積相等。
基于模糊控制的多機(jī)器人圍捕仿真結(jié)果如圖3所示。由圖可知,仿真結(jié)果達(dá)到了良好的協(xié)調(diào)圍捕效果,同時驗(yàn)證了本文中所研究圍捕策略的有效性及穩(wěn)定性。
[責(zé)任編輯:楊玉潔]