易嗣力 華南師范大學
在當代機器人應用領域中,多機器人系統(tǒng)路徑規(guī)劃一直屬于關鍵性問題,不但要把單體機器人路徑規(guī)劃任務處理好,而且對多個機器人間的系統(tǒng)合作問題也需要處理。對此量子博弈論在其中就發(fā)揮了重要作用。
對策率即所謂的博弈論,屬于運籌學的重要分支,在現(xiàn)代教學中也屬重要教學內(nèi)容。博弈論主要對擁有個體競爭特征的一些現(xiàn)象進行研究,并且,把競爭體之間的關系用公式的形式表述出來,判斷研究,并對其實際行為與理想行為等進行優(yōu)化。通過在多機器人系統(tǒng)內(nèi)應用,有著合作與競爭的關系存在于機器人個體之間,所以,可以通過相互博弈的雙方來看待它,所以,我們可以從博弈論出發(fā),規(guī)劃多機器人系統(tǒng)路徑。
在當代移動機器人應用中,路徑規(guī)劃屬于其中的一個重要的問題,到目前為止,研究成果在不斷增多,并且,多機器人可以在很多復雜的環(huán)境下進行路徑規(guī)劃。按照多樣化的規(guī)劃內(nèi)容,進行多途徑的設計規(guī)劃,例如,規(guī)劃局部路徑與規(guī)劃全局路徑,按照工作環(huán)境判斷能否跟著時間而改變,還可以分為動態(tài)路徑規(guī)劃以及靜態(tài)路徑規(guī)劃。
而在增加了工作任務難度以及環(huán)境復雜度以后,在某種程度上擴大了多機器人系統(tǒng)的應用,而且,在當前形勢下,多機器人系統(tǒng)的路徑規(guī)劃已經(jīng)成為了熱點研究問題。在動態(tài)的空間中,要求集體與單個機器人間能夠互相合作,所以,多機器人簡單的避障與協(xié)調(diào)前進是多機器人路徑規(guī)劃的難點,在研究實施路徑規(guī)劃時期發(fā)展空間也很大
我們從博弈論入手,制定規(guī)劃路徑的方案,我們可以用一個整體來看待多機器人系統(tǒng),也就是想任務目標點處發(fā)展所有機器人,這樣認定為路徑規(guī)劃完全完成,只有部分或者一個完成,不可以視為完成了整體。在規(guī)劃路徑時,規(guī)定機器人間既不能和其他機器人相撞,也不能和障礙物碰撞到一起。因此,我們可以這樣定義最優(yōu)解,在有障礙物的環(huán)境內(nèi)規(guī)劃各個機器人的運行路徑,規(guī)定每方間要系統(tǒng)工作,從而用最少的時間將機器人運送到目的地。
我們可以按照以下步驟設計博弈模型:
第一、用博弈的N個參與者來定義數(shù)量為N的機器人。而且,是在參與游戲者之間形成的博弈關系,然而,我們應該在整體的角度內(nèi)控制路徑的最優(yōu)解。所以,我們需要用博弈參與者來看待各個機器人,而不可用整體的眼光看待它。
第二、各個參與方都有屬于自身的方法空間,含有自身可行的方法行為。并且盡量選擇最短的路徑,幾乎不會有困難選擇的情況發(fā)生。就選擇困難而言指的是有太多的可以選擇策略,造成參與者有著較長的選擇時間,或者在選擇的死循環(huán)內(nèi)無法掙脫從,從而造成無法正確的選擇。
第三、收益函數(shù)的建立。參與方選擇的策略行為和所獲取利益的映射關系即為收益函數(shù),在向此問題內(nèi)深入,即為選擇的機器人可行性路徑和達到目標任務時間大小的映射。
第四、參與方的自利情況。當前我們所見到的機器人可以說越來越智能化,所以,固化其路徑時也會變的也來越復雜,所以,對于機器人的自利性必須要認真的進行考慮,也就參與者總是按照本身最大的收益進行執(zhí)行的。因此,對于參與方的自利因素必須要進行充分的考慮。因為自利性的存在就會誘發(fā)相應的沖突,造成最優(yōu)的個體沖突出現(xiàn),這是要進行展開相應的博弈,然后將某個參與方的最優(yōu)放棄掉,從而將整體最優(yōu)創(chuàng)造出來。
第五、設立約束條件。因為在規(guī)劃路徑時不可將障礙物穿過,因此,可以清晰的界定可視圖內(nèi)的約束條件,而且,保證各個路徑不可從障礙物穿過,應該及時避開。
第六、建立數(shù)學模型。為例在博弈問題基礎上規(guī)劃多機器人路徑,首先應該將此博弈問題的數(shù)學模型建立起來。
建立環(huán)境地圖:
在平面直角坐標系XOY中防止多機器人工作環(huán)境,然后利用坐標標準出各個機器人的位置。用(x,y)表示工作環(huán)境中任意一個點的坐標,然后坐標變化第i個機器人的路徑,用xioiyi表示新的坐標,其中,機器人的i的起始點用此坐標原點表示,m為目標點,其中,目標點m和起始點i的連線用xi軸表示。平均劃分m,其中,xij(j=1,2...m-1)為等分點坐標,直線Lij經(jīng)過點Xij且與xi軸垂直,并且,把點pij設置在Lij軸上,并且用Yij記做該點和Xij的距離,這樣在整個工作環(huán)境中我們就可以通過(Xij,Yij)表示第i個機器人的第j個路徑點。
第七、注意的事項分析。在規(guī)劃多機器人路徑時,洪不會自利的智能體來看待機器人,刨除機器人的理性和自利性。在規(guī)劃的路徑中將理性智能化機器人作為嚴重重點,所以,必須要時刻關注它的自利性與理性特征,更多對個體意志進行表達,從而就會導致有很多復雜的內(nèi)容出現(xiàn)在機器人路徑規(guī)劃工作中,不斷加大其協(xié)調(diào)難度,計算變的更加復雜。此種強烈表現(xiàn)個體意志性與理性的博弈參與方,將會把本身收益最大的策略行為選擇出來,從而更好的完成相應的目標任務。個體最優(yōu)表現(xiàn)在博弈中,并不能代表具有最優(yōu)化的集體,所以,應該科學的在兩者之間展開權衡和選擇,然而因為博弈參與者的自利性與理性存在,所以,往往在納什均衡中促使參與者運行和工作,這樣更改起來也會比較困難,從而會產(chǎn)生較多的問題。為了實現(xiàn)集體與個體利益的統(tǒng)一,我們可以基于經(jīng)典博弈展開拓展,把相應的量子博弈模型建立起來,從而達到集體利益與個體利益統(tǒng)一的目的,從而把經(jīng)典博弈內(nèi)無法處理的問題有效的解決掉。
我們從路徑劃分入手對多機器人研究領域的重要性問題進行了研究分析,并且對此問題的重要研究內(nèi)容進行了芻議,通過與發(fā)展現(xiàn)狀相結合,選擇出最優(yōu)的算取方式,與量子博弈論的學習研究相結合,在對大量文獻進行閱讀的前提下,對量子博弈論下多機器人路徑規(guī)劃的內(nèi)容進行了細致的剖析,并且,對理性與自利性下博弈論的發(fā)展內(nèi)容進行了分析,從而為更好研究人員在實際工作中提供一定的理論與技術支撐。