陳俊
(安徽機電職業(yè)技術(shù)學(xué)院電氣工程系,安徽蕪湖241000)
足球機器人守門員的動作設(shè)計與研究
陳俊
(安徽機電職業(yè)技術(shù)學(xué)院電氣工程系,安徽蕪湖241000)
以FIRA仿真足球機器人為研究目標(biāo),以守門員的動作策略為主要研究對象,基于FIRA仿真平臺SimuroSot,對守門員的動作進行設(shè)計,并以防守狀態(tài)為重點,提出了一種將“盯球”和“盯人”相結(jié)合的優(yōu)化算法,實驗結(jié)果表明,該策略可提高守門員的防守能力。
機器人;FIRA仿真;守門員;優(yōu)化算法
機器人技術(shù)是一項綜合性極強的實用型技術(shù),跨專業(yè)、跨行業(yè)、多領(lǐng)域交叉、難以壟斷,故機器人研究成果呈百花齊放百家爭鳴的情形。當(dāng)下機器人技術(shù)的研究主要包括三個研究流派:基于符號的機器人學(xué)[1]、基于行為的機器人學(xué)以及生物機器人學(xué)。機器人足球?qū)儆诨诜柕臋C器人學(xué)流派中的多機器人系統(tǒng)的運動、規(guī)劃和控制,其最初想法由加拿大大不列顛哥倫比亞大學(xué)的教授Alan Mackworth在1992年的一次國際人工智能會議上提出,日本學(xué)者立即對此想法進行了系統(tǒng)調(diào)研和可行性分析,1993年,RobotCuP被提出,得到全球?qū)W者的響應(yīng),并于1997年舉行了第一屆比賽。國際機器人足球聯(lián)合會FIRA由韓國人創(chuàng)立于1997年。這兩項比賽均為一年一度的機器人足球盛典[2],但他們的技術(shù)規(guī)范不同,RobotCuP要求采用分布式控制方式,相當(dāng)于每個足球機器人都擁有獨立的“大腦”,而FIRA采用集中控制方式,相當(dāng)于全隊統(tǒng)一思想,受一個大腦控制[3]。
隨著足球機器人技術(shù)的發(fā)展和推廣,目前,F(xiàn)IRA機器人足球賽分為仿真型(SimuroSot)、類人型(HuroSot)、半自主型(MiroSot)、全自主型(RoboSot)、超小型半自主型(NaroSot)以及超小型全自主型(KhePeraSot)等幾種類型[4]。本文將以仿真型機器人足球賽SimuroSot 5∶5為平臺,對球員行動進行設(shè)計,并重點針對每個隊5個機器人中最為特殊的守門員的動作進行設(shè)計和優(yōu)化。
守門員是防守策略中最為重要的一環(huán),穩(wěn)妥可靠的守門員行為可瓦解對方的攻擊,而低級的失誤會不斷葬送進攻策略的努力。本文通過對傳統(tǒng)的守門員策略中只“盯球”的策略進行改善,將“盯球”和“盯人”相結(jié)合,從而提高守門員的防守能力。
SimuroSot仿真平臺幾乎脫離硬件約束,為模擬機器人足球賽提供了可能。此系統(tǒng)采用Director設(shè)計界面,使用3DMax建模,建立了賽場、球員、比賽規(guī)則以及在此平臺環(huán)境內(nèi)實現(xiàn)比賽效果的動力學(xué)模型,平臺底層是由游戲引擎公司提供的碰撞處理引擎,可以極高程度模擬小球碰撞的真實情景,通過統(tǒng)一的坐標(biāo)標(biāo)的,將場上所有球員以及球的位置、速度以及運動方向等信息實時采集和反饋,為系統(tǒng)策略的設(shè)計提供了基礎(chǔ)。FIRA仿真比賽采用的是Client/Server方式,Server為FIRA提供的標(biāo)準(zhǔn)系統(tǒng),各參賽隊伍編寫各自的Client程序,在理論上完全公平的平臺上進行較量。每個仿真周期,Server會從Client讀取下一個仿真周期隊員要執(zhí)行的命令,同時在一定的周期內(nèi)為每個隊員發(fā)送其響應(yīng)的感知信息[5]。
為了讓球隊陣型能夠根據(jù)比賽情況實時的轉(zhuǎn)換,需要根據(jù)球所處的位置和方向,對陣型進行調(diào)整,對場上球員進行角色的分配,所以,場地的劃分是策略選擇的依據(jù)[6]。場地的劃分如圖1所示。
圖1場地劃分
當(dāng)小球處于D1~D3區(qū)域時,球門面臨危險,采用防守陣型,當(dāng)小球處于D4區(qū)域時,采用較保守的平衡陣型,當(dāng)小球處于D5~D7區(qū)域時,球門較安全,采用進攻陣型。在此過程中,場上唯獨守門員的角色分配不變,其他隊員都可能在不同陣型中承擔(dān)不同的任務(wù)。仿真平臺的比賽節(jié)奏非???,場上形勢瞬息萬變,守門員只在球門線上作直線上下運動,在一般的策略中不承擔(dān)進攻任務(wù)。守門員的任務(wù)看似最“簡單”,實則最難。因為守門員不容有錯,其他位置的球員即便跑錯位置,還有補救機會,而守門員一旦失誤,將很可能導(dǎo)致丟球。
傳統(tǒng)的守門員策略是只“盯球”不“盯人”,其移動方向和速率完全取決于球的坐標(biāo)、速率和方向。但足球機器人比賽中的球不是勻速的,它在不斷受到球員和場地的碰撞造成速率和方向的變化,所以,己方的球門是否遭到威脅,球的速率和方向固然很重要,而對方進攻球員的速度也非常重要,對“盯人”的忽視,會導(dǎo)致守門員“反應(yīng)不及”的情形?;诖耍疚奶岢鲆环N新的守門員動作設(shè)計策略,將“盯球”和“盯人”綜合考慮,以期提高守門員的防守能力。
根據(jù)平臺提供的小球坐標(biāo)變化,分析小球的運動方向,當(dāng)小球向己方球門方向運動,且進入D1~D4區(qū)域,此時,守門員就要進入防守模式;當(dāng)小球向?qū)Ψ角蜷T方向運動,且處于D4~D7區(qū)域,己方球門相對安全,守門員只需“盯球”運動即可?;诖?,守門員需考慮以下幾個方面的能力:(1)預(yù)測自身應(yīng)處位置。這是最重要的功能,只有在正確的時機出現(xiàn)在正確的位置,守門員才能起到防守的作用;(2)運動方式。球員運動分為直線和曲線兩種,守門員應(yīng)采取哪種運動方式較適合防守;(3)運動速度。仿真平臺運動速度很快,但并非最快的速度就是最合適的,需根據(jù)小球預(yù)測點和自身位置來決策。
2.1 守門員防守位置的預(yù)測
這里,可以分兩種情況(圖2)。當(dāng)球向己方球門運動時,根據(jù)小球坐標(biāo)信息的變化,預(yù)測小球的運動軌線與守門員所在的直線交點Q,小球與Q點的距離記為DBQ,平均速度為B,守門員與Q點距離記為DGQ,平均速度為G,那么,守門員的動作應(yīng)滿足:
其中,ε在這里是一個很小的量,越小越精確。當(dāng)然,式(1)是針對Q點處于球門范圍內(nèi)的情況,若Q點在球門范圍外,則守門員只需移到Q點所在側(cè)即可,不能超過球門范圍。若小球處于D1~D3區(qū)域,因為離球門較近,守門員始終跟蹤小球的位置,以Q點為最終目標(biāo)點,若小球處于D4區(qū)域,因為離球門有一定距離,此時可綜合考慮小球和對方球員的速度,尋找平分小球與球門兩端連線夾角,并且偏向于對方離球最近的球員的速度方向的位置,這樣可以使守門員的位置始終處于危險點或離危險點較近的位置,并具備預(yù)判能力。
2.2 守門員的運動方式
守門員的位置在所有的足球機器人中最為特殊,其它球員在運動中一般采用曲線運動方式,這是因為,球員的運動范圍覆蓋整個場地,且球員的運動不及小球的運動,當(dāng)球員鎖定一個目標(biāo)點去拿球時,在此過程中,小球仍在做運動,所以,若以直線方式運動,就需要不斷的調(diào)整方向,這樣反而使運動速度下降,而曲線方式邊運動邊調(diào)整,效率更高。但這種理論并不適用于守門員,因為守門員一般都站在門線上起到防守大門的作用,一般不像實際比賽中那樣輕易的出擊,它在門線上的運動均采取直線運動方式,這樣速度最快,且不用考慮轉(zhuǎn)向問題,站位的合理性成為首要問題(圖3)。
圖2守門員防守位置預(yù)測點
圖3守門員的站位選擇
當(dāng)小球處于危險區(qū)外時,如圖3(a)所示,守門員的站位應(yīng)處于小球與倆門柱的夾角平分線上,這樣,無論小球射向哪里,守門員均處于較近的位置;當(dāng)小球處于危險區(qū)內(nèi)時,如圖3(b)所示,應(yīng)綜合考慮小球和對方球員的運動方向,即既要“盯球”也要“盯人”,這樣可更好的優(yōu)化守門員的站位。
2.3 守門員的運動速度
當(dāng)守門員根據(jù)小球和對方球員的運動速度及方向預(yù)測出小球達(dá)到球門線上的位置Q點后,若Q點在球門范圍外,守門員只需按運動方式站位即可;若Q點在球門范圍內(nèi),假設(shè)守門員當(dāng)前位置為G點,小球當(dāng)前處于B點,根據(jù)每個周期小球的運動方向、速度和加速度,計算出下個周期小球所處的位置B',再根據(jù)圖3方式計算出本周期的最佳站位位置G'點,根據(jù)當(dāng)前GG'之間的距離即可得出本周期守門員的運動速度G。這樣的運動速度計算方法[7],既能成功防守住小球的既定運行路線,同時,當(dāng)小球的運行軌跡發(fā)生變化時,也能夠第一時間做出調(diào)整,設(shè)計方案全面。
由于本文僅針對于守門員進行策略研究,故只考慮防守狀態(tài)。使用常規(guī)防守策略,即僅“盯球”的守門員防守策略和本文提出的“盯人”與“盯球”相結(jié)合的方法做比較,通過仿真平臺5V5環(huán)境,針對同樣的策略對手,進行模擬6場比賽,丟球數(shù)比較如圖4所示。
可以看到,優(yōu)化后的守門員防守策略從站位上更加合理,面對突然的來球具有更好的反映速度,丟球率下降,防守效果更好。
本文以FIRA仿真足球機器人平臺中的守門員為對象,詳盡研究了守門員的動作策略和實時決策分析,以防守狀態(tài)為重點,提出了一種將“盯球”和“盯人”相結(jié)合的優(yōu)化算法。
通過對整個仿真平臺SimuroSot模擬環(huán)境的場地進行分塊編號,根據(jù)對方球員和小球所處區(qū)域坐標(biāo)位置的不同,以及對方球員的速度和小球的速度等信息,計算守門員的合理站位區(qū)。實驗結(jié)果表明,此優(yōu)化算法顯著提高了守門員的站位合理性,增強了防守能力,具有較好的推廣應(yīng)用價值。
[1]Marsella A S.Using an explicit teamwork model and learning in RoboCup:an extended abstract[D].USA: University of Southern California,2000.
[2]薛方正,徐心和,馮挺.集控式足球機器人決策與控制系統(tǒng)設(shè)計與開發(fā)[J].機器人,2005,27(5):431_435.
[3]Harvey J,Cheng C,M ichaelson D.High_level design of a M iroSot simulator[J].M icro_Robot WorldCup Soccer Tournament Proceedings,1996,10(3):8_l0.
[4]Xu Xinhe.Six_step reasoningmodel for robot_soccer[J]. Journal of Harbin Institute of technology,2001,8(8):244_ 248.
[5]王進戈,王強,姚進.基于模糊評判的機器人足球比賽策略研究[J].哈爾濱工業(yè)大學(xué)學(xué)報,2005,37(7): 943_946.
[6]張小川,李祖樞.足球機器人決策子系統(tǒng)的分析與設(shè)計[J].華中科技大學(xué)學(xué)報,2004,10(32):146_149.
[7]陳俊.新型動態(tài)粒子群算法在工業(yè)控制中的應(yīng)用[J].四川理工學(xué)院學(xué)報:自然科學(xué)版,2011,24(5):534_ 536.
Action Design and Research for Soccer Robot Goalkeeper
CHEN Jun
(DePartment of Electrical Engineering,Anhui Technical Institute of Mechanical and electrical Engineering,Wuhu 241000,China)
This PaPer takes the fira simulation soccer robotas the investigative objectand the action strategy of goalkeePer as themain research target,designs the goalkeePer's action based on fira simulation Platform SimuroSot,and focuses on the defense status,Presents an oPtimization algorithm of combining“staring ball”and“staring man”.The exPerimental result shows that this strategy can enhance the goalkeePer's defense ability.
robot;Fira simulation;goalkeePer;oPtimization algorithm
TP1S1
A
1673_1549(2014)02_0047_04
10.11863/j.suse.2014.02.10
2013_11_29
安徽省高等學(xué)校省級自然科學(xué)基金項目(KJ2012Z043);安徽機電職業(yè)技術(shù)學(xué)院院級科研項目(201133)
陳俊(19S2_),男,安徽蕪湖人,講師,碩士,主要從事智能控制和自動檢測方面的研究,(E_mail)cj1l@163.com