楊 茂,李成鳳,田彥濤,2
(1.吉林大學(xué)通信工程學(xué)院,吉林長春 130025;2.吉林大學(xué)工程仿生教育部重點(diǎn)實(shí)驗(yàn)室,吉林長春 130025)
群體機(jī)器人同步問題的分布式協(xié)同控制及優(yōu)化
楊 茂1,李成鳳1,田彥濤1,2
(1.吉林大學(xué)通信工程學(xué)院,吉林長春 130025;2.吉林大學(xué)工程仿生教育部重點(diǎn)實(shí)驗(yàn)室,吉林長春 130025)
主要研究群體機(jī)器人系統(tǒng)協(xié)同適應(yīng)性,通過局部信息交互下的分布式控制實(shí)現(xiàn)群體對復(fù)雜環(huán)境的適應(yīng).以同步現(xiàn)象為研究對象,結(jié)合虛擬力、最近鄰居原則以及環(huán)境因素,提出了一種可以解釋該現(xiàn)象的分布式控制器.并證明該控制器能夠使所有的群體成員在誤差允許的范圍內(nèi)收斂到一個(gè)共同速度,其優(yōu)點(diǎn)是僅需要局部信息就能夠?qū)崿F(xiàn)穩(wěn)定的群體行為.此外,在上述分布式控制器設(shè)計(jì)的基礎(chǔ)上進(jìn)行了參數(shù)優(yōu)化,利用粒子群優(yōu)化算法實(shí)現(xiàn)能量消耗最少的目標(biāo).通過仿真實(shí)驗(yàn)驗(yàn)證了控制器及算法的可行性和有效性.
群體機(jī)器人;同步;協(xié)同控制;分布式控制器;粒子群優(yōu)化算法
在眾多生物群體中,如編隊(duì)遷徙的鳥群、結(jié)隊(duì)巡游的魚群、協(xié)同工作的蟻群、聚集而生的細(xì)菌菌落等,不存在協(xié)調(diào)者來協(xié)調(diào)大量自主個(gè)體,但整個(gè)系統(tǒng)卻呈現(xiàn)協(xié)調(diào)有序的狀態(tài).這使生物群體在覓食生存、逃避天敵等方面獲得單獨(dú)個(gè)體難以實(shí)現(xiàn)的優(yōu)勢,完成復(fù)雜、有一定目的或功能的活動(dòng)[1].群體機(jī)器人學(xué)受社會(huì)性昆蟲及群居動(dòng)物群體行為的啟發(fā),主要研究如何使大量相對簡單的機(jī)器人通過局部交互,涌現(xiàn)出智能群體行為.如何制定一定的規(guī)則,從系統(tǒng)論與控制學(xué)的觀點(diǎn)出發(fā)解釋這些現(xiàn)象,并對控制器參數(shù)進(jìn)行優(yōu)化,可能對相關(guān)工程應(yīng)用有潛在效益.
1986年C.W.Reynolds在文獻(xiàn)[2]中建立了一個(gè)協(xié)調(diào)運(yùn)動(dòng)的行為模型.他將模擬的通用實(shí)體命名為“boids”,并且他的工作開啟了計(jì)算機(jī)圖形學(xué)中一個(gè)名為“人工生命”的新的研究課題.文獻(xiàn)[3]中Vicsek等人提出了基于最近鄰居原則的仿真模型,仿真結(jié)果表明所有粒子的速度能夠收斂到一個(gè)共同的值.盡管是分別提出的,但Vicsek模型是boids模型的一個(gè)特例.為了從數(shù)學(xué)上證明Vicsek的結(jié)果,Jadbabaie等人[4]提出了離散的運(yùn)動(dòng)學(xué)模型和依據(jù)最近鄰居原則的分布式控制器.他們使用了一些源自代數(shù)圖論的概念證明所有個(gè)體速度的收斂性,在他們后續(xù)的工作中[5-7],對于固定的和動(dòng)態(tài)的群體拓?fù)浣Y(jié)構(gòu)提出了一個(gè)連續(xù)的動(dòng)態(tài)模型和一個(gè)分布式控制器.控制器包括基于最近鄰居的狀態(tài)的航向和速度調(diào)節(jié)成分,通過代數(shù)圖論和不連續(xù)穩(wěn)定性理論,證明控制器能夠引導(dǎo)所有機(jī)器人的航向收斂到一個(gè)公共值,并且所有的速度收斂到相同的值.Gazi和Passino[8]提出了群體成員的一個(gè)連續(xù)的一階運(yùn)動(dòng)學(xué)模型,并且運(yùn)用虛擬作用的觀點(diǎn)提出用于分析n維空間中群體集聚的分布式控制器.文獻(xiàn)[8]表明個(gè)體能夠在有限的時(shí)間內(nèi)形成內(nèi)聚群體,并且其中也得到了群體大小的一個(gè)明確約束.文獻(xiàn)[9]中一類更廣泛的虛擬力函數(shù)是文獻(xiàn)[8]結(jié)論的擴(kuò)展.在其后續(xù)工作中[10-12],使用相同的方法證明了在某種特定環(huán)境中群體聚集行為的存在性.Liu等人[12]利用一個(gè)二階動(dòng)力學(xué)模型來研究在某種具有噪聲的特定環(huán)境下的穩(wěn)定的群體覓食行為.然而,文獻(xiàn)[8-13]提出的所有控制器要求每個(gè)機(jī)器人知道所有其他機(jī)器人的狀態(tài),這對于自然生物是不可能的.文獻(xiàn)[14]中Reif和Wang首先提出了超大規(guī)模機(jī)器人系統(tǒng)(very large scale robotic system)的概念,并提出一種使用人工勢場(artificial potential field)作為控制律的分布式控制方案.但是以上控制方法僅限于全局交互機(jī)制或者是無環(huán)境信息反饋的情況,且均未考慮控制器性能參數(shù)的優(yōu)化問題.本文針對群體機(jī)器人系統(tǒng)在復(fù)雜環(huán)境下的同步問題,利用鄰接矩陣的方法,設(shè)計(jì)了基于局部信息交互的分布式控制器,并進(jìn)行了群體穩(wěn)定性分析,證明了該控制器無論是在切換拓?fù)溥€是固定拓?fù)潢P(guān)系下都能夠使得系統(tǒng)中的所有個(gè)體在環(huán)境信息反饋下實(shí)現(xiàn)同步.同時(shí)還對控制器進(jìn)行了參數(shù)優(yōu)化,以實(shí)現(xiàn)能量優(yōu)化的目標(biāo).
群體機(jī)器人系統(tǒng)是一類特殊的多機(jī)器人系統(tǒng),其特殊性體現(xiàn)在如下幾方面:首先,在控制方式方面,多機(jī)器人系統(tǒng)可以是集中控制也可以是分布式控制,而群體機(jī)器人系統(tǒng)一定是分布式控制;其次,在系統(tǒng)規(guī)模方面,多機(jī)器人系統(tǒng)一般個(gè)體數(shù)量較少,而群體機(jī)器人系統(tǒng)數(shù)量很多;再次,在個(gè)體能力方面,多機(jī)器人系統(tǒng)中的個(gè)體一般較為復(fù)雜,而群體機(jī)器人系統(tǒng)的個(gè)體相對簡單;最后也是最重要的,在通信機(jī)制方面,多機(jī)器人系統(tǒng)一般是全局通信,而群體機(jī)器人系統(tǒng)是以局部通信為主要特征.以上特征決定了群體機(jī)器人系統(tǒng)具有魯棒性、可擴(kuò)展性和適應(yīng)性等特點(diǎn).
本文首次提出了群體機(jī)器人系統(tǒng)的協(xié)同適應(yīng)性的概念.
定義復(fù)雜動(dòng)態(tài)環(huán)境中,機(jī)器人如何通過個(gè)體與個(gè)體之間以及個(gè)體與環(huán)境之間的交互,優(yōu)化控制策略并調(diào)整自身行為,以適應(yīng)環(huán)境和任務(wù)的動(dòng)態(tài)變化的特性叫做群體機(jī)器人系統(tǒng)的協(xié)同適應(yīng)性.
具體地從數(shù)學(xué)上可以描述為:
設(shè)群體機(jī)器人系統(tǒng)中有N個(gè)機(jī)器人,r為機(jī)器人鄰居半徑;令ε(i,t)為第i個(gè)機(jī)器人在時(shí)間t時(shí)刻的局部環(huán)境狀態(tài)(i=1,2,…,N); ξ(i,t)為第i個(gè)機(jī)器人在時(shí)間t時(shí)刻其他鄰居機(jī)器人反饋的狀態(tài)信息;ω為滿足運(yùn)動(dòng)及環(huán)境約束的機(jī)器人動(dòng)作集合;η(t)對應(yīng)t時(shí)刻的群體行為;E(η)表示對于群體行為的性能評估;V為群體機(jī)器人系統(tǒng)集體任務(wù)性能標(biāo)準(zhǔn).則群體機(jī)器人系統(tǒng)為
協(xié)同適應(yīng)性的目的是max(E)(或min(E)).
同步問題是群體機(jī)器人系統(tǒng)的研究中的經(jīng)典問題之一,是多機(jī)器人利用分布式感知能力通過控制器的作用最終達(dá)到速度(包含速率與方向)一致,該控制器通常是分布式控制器.而在實(shí)體機(jī)器人中,機(jī)器人通常依靠電池提供能量,其運(yùn)行往往受限于電池容量,因此如何有效地使用有限的電池能量,對提高機(jī)器人的續(xù)航能力至關(guān)重要.這對于大量個(gè)體能量消耗問題尤為突出,因此,將優(yōu)化技術(shù)應(yīng)用群體機(jī)器人中是具有理論意義和實(shí)際工程價(jià)值的.
考慮在n維空間中運(yùn)動(dòng)的機(jī)器人群體,假設(shè)個(gè)體同時(shí)運(yùn)動(dòng)并視為質(zhì)點(diǎn),個(gè)體之間無通信延遲.對個(gè)體建模如下:
式中:i=1,2,…,N,xi∈Rn、vi∈Rn、mi和ui分別是機(jī)器人i的位置、速度、質(zhì)量和控制輸入.假設(shè)沒有擾動(dòng)力作用在個(gè)體上,且mi已知.顯然,式(1)為典型的拉格朗日動(dòng)態(tài)模型.
如果滿足‖xi-xj‖≤d0,稱2個(gè)不同機(jī)器人i和j(i≠j)為彼此的鄰居,其中d0是給定的正數(shù),通常由機(jī)器人的通信范圍決定.i?{j:‖xi-xj‖≤d0,j≠i,j=1,2,…,N}代表機(jī)器人i所有鄰居的集合.
可見,機(jī)器人的鄰域結(jié)構(gòu)是運(yùn)動(dòng)空間中分布的圓,半徑等于機(jī)器人的通信半徑,見圖1.若機(jī)器人的通信距離與運(yùn)動(dòng)空間相比足夠大,局部信息交互將會(huì)演化為全局交互.
圖1 機(jī)器人的鄰域結(jié)構(gòu)Fig.1 Robots’neighborhood
為簡化群體速度收斂的證明,本文運(yùn)用代數(shù)圖論中鄰接矩陣來代表機(jī)器人的鄰居.對于機(jī)器人數(shù)目為N的群體,定義鄰接矩陣A=[aij]N×N,其中
假設(shè)群體在具有特定勢能函數(shù)ρ(x)的環(huán)境中運(yùn)動(dòng),并且此函數(shù)具有有限斜率,即ρ(x)在xi的梯度(ρ(x))已知,通過在生物系統(tǒng)中的觀察可以證明此假設(shè)是正確的.
對每個(gè)機(jī)器人提出分布式控制器如下:
式中:kp、kv和kr是給定的正常數(shù),g:Rn→Rn代表個(gè)體之間的吸引排斥函數(shù).
函數(shù)g(·)的類型為
式中:ga:R+→R+代表吸引項(xiàng)的大小,gr:R+→R+代表排斥項(xiàng)的大小.以向量y為例,所以實(shí)際的吸引、排斥分別是-yga‖y‖和ygr‖y‖,假設(shè)g(·)滿足下列條件:
1)g(·)是一個(gè)在相反方向運(yùn)動(dòng)的吸引排斥項(xiàng)的奇函數(shù),也就是,g(y)=-g(-y).
2)存在惟一的距離δ使得ga(δ)=gr(δ).此外,
3)存在相應(yīng)的函數(shù)Ja:R+→R+和Jr:R+→R+,使得▽yJa(‖y‖)=yga‖y‖,▽yJr(‖y‖)=ygr‖y‖.
假設(shè)條件1)、2)、3)是由 Gazi和 Passino介紹的[15].本文考慮吸引排斥函數(shù)由線性吸引項(xiàng)和有界排斥項(xiàng)組成:
式中:a、b是給定的正常數(shù).
假設(shè)群體在對每個(gè)機(jī)器人產(chǎn)生相同作用的一致性環(huán)境中運(yùn)動(dòng),即ρ(x)= ▽xjρ(x),?i≠j,從而有 -
并且定義誤差狀態(tài)為=xi-=vi-,則有
定理對于如式(1)所示的群體機(jī)器人系統(tǒng)數(shù)學(xué)模型,若吸引排斥函數(shù)如式(4)所示,那么當(dāng)t→∞時(shí),vi→ˉ,所有個(gè)體將收斂到一個(gè)超球()={x:‖x-‖≤δ}),式中:
因?yàn)閷θ我饩仃嘢=ST>0和向量x,有λmin(S)xT·x≤xTx≤xTSx≤λmax(S)xTx,其中 λmin(S)和λmax(S)分別代表S的最小和最大的特征值.并由式(2)定義的鄰接矩陣AN×N得
式中:d=max{‖xi-xj‖|i=1,2,…,N;j=1,2,…,N}.所以對于一致性環(huán)境有
推論群體同步收斂所需時(shí)間可估計(jì),即
從上述函數(shù)中計(jì)算出時(shí)間:
注意上述證明是在沒有任何關(guān)于群體拓?fù)浣Y(jié)構(gòu)的特定條件下進(jìn)行的,即無論拓?fù)浣Y(jié)構(gòu)是固定的還是變化的,該分布式控制器都能夠?qū)崿F(xiàn)穩(wěn)定的群體同步運(yùn)動(dòng).
PSO算法隨機(jī)地初始化為目標(biāo)函數(shù)的一個(gè)解群體,群體中的每個(gè)個(gè)體稱為一個(gè)粒子.每個(gè)粒子模仿鳥類的覓食行為,通過跟蹤2個(gè)“極值”來實(shí)現(xiàn)在搜索空間尋找最優(yōu)解的目的:一個(gè)是每個(gè)粒子當(dāng)前已搜索到的最優(yōu)位置(適應(yīng)度最大),稱為個(gè)體極值Pbest;另一個(gè)是整個(gè)粒子群當(dāng)前已搜索到的最優(yōu)位置,稱為全局極值Gbest.PSO算法可描述如下:假設(shè)在D維搜索空間有m個(gè)粒子,粒子i在搜索空間的位置用向量Xi=[xi1xi2…xiD]T表示,其個(gè)體極值記為Pi=[pi1pi2…piD]T,而全局極值記為Pg=[pg1pg2…pgD]T.在迭代過程中,粒子i以速度v在搜索空間飛行.每個(gè)粒子的飛行速度及位置按下式進(jìn)行修正:
式中:c1、c2為正常數(shù),稱為加速因子,通常取c1=c2=2.0;r1,r2為[0,1]之間的隨機(jī)數(shù);w為慣性因子.在迭代過程中,粒子的速度向量被限制在[-Vmax,Vmax]范圍內(nèi),以降低例子飛出搜索空間的概率;而粒子的位置向量被限制在[Xmin,Xman]范圍內(nèi).
在仿真中,假設(shè)所有群體成員同構(gòu)并且質(zhì)量已知.本文選擇設(shè)計(jì)常數(shù)為kp=3.5,kv=2.3,kr=2.0,d0=10.隨機(jī)給定機(jī)器人的初始速度,在[-10,10]內(nèi)隨機(jī)給定初始位置.在下述圖形中星形和圓形分別代表機(jī)器人的初始位置和最終位置.
圖2和圖3分別顯示機(jī)器人個(gè)數(shù)為10個(gè)的群體在二維空間中的運(yùn)動(dòng)軌跡和速度收斂曲線,可以看出群體中所有機(jī)器人收斂到一個(gè)相同的速度,并且它們的間隔幾乎保持為常數(shù),實(shí)現(xiàn)了穩(wěn)定的群體同步行為.
圖2 二維空間中機(jī)器人的運(yùn)動(dòng)軌跡(N=10)Fig.2 Robots’trajectories in 2-D environment(N=10)
圖3 二維空間中機(jī)器人的速度(N=10)Fig.3 Robots’velocity in 2-D environment(N=10)
圖4和圖5分別顯示機(jī)器人個(gè)數(shù)為100的群體在二維空間中的運(yùn)動(dòng)軌跡和速度曲線,群體的速度仍收斂,機(jī)器人間的間距仍基本恒定.此外,圖2和圖4所具有的環(huán)境信息不同,即初始化的環(huán)境梯度方向相反,因此機(jī)器人的運(yùn)動(dòng)方向也相反.
圖4 二維空間中機(jī)器人的運(yùn)動(dòng)軌跡(N=100)Fig.4 Robots’trajectories in 2-D environment(N=100)
圖5 二維空間中機(jī)器人的速度(N=100)Fig.5 Robots’velocity in 3-D environment(N=100)
圖6 三維空間中機(jī)器人的運(yùn)動(dòng)軌跡(N=15)Fig.6 Robots’trajectories in 3-D environment(N=15)
圖7 三維空間中機(jī)器人的速度(N=15)Fig.7 Robots’velocity in 3-D environment(N=15)
圖6和圖7分別是群體機(jī)器人(數(shù)量為15個(gè))在三維空間中的運(yùn)動(dòng)軌跡和速度變化曲線,同樣,群體仍然能夠達(dá)到速度收斂和保持恒定間距的目的.
表1是群體機(jī)器人系統(tǒng)中每個(gè)個(gè)體運(yùn)動(dòng)角度隨時(shí)間變化情況(即協(xié)同適應(yīng)性中的性能評價(jià)指標(biāo)),可知隨時(shí)間的推移每個(gè)個(gè)體的角度最終趨于一致.
表1 二維空間中機(jī)器人運(yùn)動(dòng)的角度隨時(shí)間的變化Table 1 Robots’angle experimental results with time in 2-D environment (°)
通過上述仿真結(jié)果及分析,可見群體機(jī)器人的運(yùn)動(dòng)不僅不受群體中個(gè)體數(shù)量的限制,且能根據(jù)環(huán)境信息的變化自動(dòng)調(diào)整運(yùn)動(dòng)方向和速度大小,實(shí)現(xiàn)了穩(wěn)定的群體同步行為.
在機(jī)器人運(yùn)動(dòng)過程中,利用粒子群優(yōu)化算法對控制器的性能參數(shù)k=[kpkvkr]進(jìn)行優(yōu)化,達(dá)到能量消耗最小的目的.
圖8表示參數(shù)k取不同值時(shí),群體所消耗的能量的對比.可見,控制器的性能參數(shù)能夠影響系統(tǒng)消耗能量的大小,進(jìn)而可以對控制器的性能參數(shù)進(jìn)行優(yōu)化,達(dá)到能量消耗最小的目的.圖9顯示粒子對k值的尋優(yōu)過程,可以看出,利用粒子群優(yōu)化算法能夠使控制器的性能參數(shù)k經(jīng)過一段時(shí)間的調(diào)整達(dá)到了最優(yōu)值.
圖8 優(yōu)化前不同參數(shù)對應(yīng)能量曲線對比Fig.8 Comparisons of energy for different parameters before optimization
圖9 k最優(yōu)值的變化曲線Fig.9 Optimal k values with the iteration of PSO
圖10顯示相應(yīng)的優(yōu)化后的群體同步行為所消耗的能量,與圖8所示優(yōu)化前的能量相比,減小了3個(gè)數(shù)量級,得到了很好的優(yōu)化效果.
圖10 優(yōu)化后能量消耗曲線Fig.10 Curve of energy consumption after optimization
本文提出了群體機(jī)器人系統(tǒng)的協(xié)同適應(yīng)性的概念,針對于同步現(xiàn)象,在充分考慮環(huán)境信息及機(jī)器人之間的局部信息交互的前提下,設(shè)計(jì)了群體機(jī)器人系統(tǒng)的分布式控制以實(shí)現(xiàn)穩(wěn)定的同步運(yùn)動(dòng),并對于完成時(shí)間進(jìn)行了估計(jì).利用粒子群優(yōu)化算法來優(yōu)化控制器中的相應(yīng)參數(shù),進(jìn)而解決同步過程中的能量優(yōu)化問題,仿真結(jié)果證明了方法的有效性.進(jìn)一步的工作包括對于動(dòng)態(tài)環(huán)境下的控制器設(shè)計(jì);提出通用性強(qiáng)的吸引排斥函數(shù),實(shí)現(xiàn)將時(shí)間、能量等相結(jié)合的綜合優(yōu)化目標(biāo),從而得到更為理想的效果.
[1]胡中功,李靜.群智能算法的研究進(jìn)展[J].自動(dòng)化技術(shù)與應(yīng)用,2008,27(2):13-15.
HU Zhonggong,LI Jing.The progress of swarm intelligence algorithms[J].Techniques of Automation and Application,2008,27(2):13-15.
[2]REYNOLDS C W.Flocks,birds,and schools:a distributed behavioral model[C]//Proceedings of ACM Computer Graphics(SIGGRAPH’87).New York,USA:ACM,1987:25-34.
[3]VICSEK T,CZIROK A,Ben-JACOB E,COHEN I,SHOCHET O.Novel type of phase transition in a system of self-driven particles[J].Physical Reviews Letter,1995,75(6):1226-1229.
[4]JADBABIE A,LIN J,MORSE A S.Coordination of groups of mobile autonomous agents using nearest neighborhood rules[J].IEEE Transaction on Automatic Control,2003,48(6):988-1001.
[5]TANNER H G,JABABAIE A,PAPPAS G J.Flocking in fixed and switching networks[J].IEEE Transaction on Automatic Control,2007,52(5):863-868.
[6]TANNER H G,JABABAIE A,PAPPAS G J.Stable flocking of mobile agent,part I:fixed topology[C]//Proceedings of Conference on Decision Control.Maui,HI,USA,2003:2010-2015.
[7]TANNER H G,JABABAIE A,PAPPAS G J.Stable flocking of mobile agent,part II:dynamic topology[C]//Proceedings of Conference on Decision Control.Maui,Hawaii,2003:2016-2021.
[8]GAZI V,PASSINO K M.Stability analysis of swarms[J].IEEE Transaction on Automatic Control,2003,48:692-697.
[9]GAZI V,PASSINO K M.A class of attraction/repulsion functions for stable swarm aggregations[C]//Proceedings of Conference on Decision Control.Los Vegas,USA,2002:2842-2847.
[10]GAZI V,PASSINO K M.Stability analysis of swarms in an environment with an attractant/repellent profile[C]//Proceedings of American Control Conference.Anchorage,USA,2002:1819-1824.
[11]GAZI V,PASSINO K M.Stability analysis of social foraging swarms:combined effects of attractant/repellent profiles[C]//Proceedings of Conference on Decision Control.Las Vegas,USA,2002:114-123.
[12]GAZI V,PASSINO K M.Stability analysis of social foraging swarm[J].IEEE Transaction on Systems,Man,and Cybernetics-Part B:Cybernetics,2004,34(1):539-557.
[13]LIU Yanfei,PASSINO K M.Stable social foraging swarms in a noisy environment[J].IEEE Transaction on Automatic Control,2004,49(1):30-44.
[14]REIF J H,WANG Hongyan.Social potential fields:a distributed behavioral control for autonomous robots[J].Robotics and Autonomous Systems,1999,27:171-194.
楊 茂,男,1982年生,博士研究生,主要研究方向?yàn)槿后w機(jī)器人系統(tǒng)、強(qiáng)化學(xué)習(xí).
李成鳳,女,1986年生,碩士研究生,主要研究方向?yàn)槿后w機(jī)器人系統(tǒng)、分布式優(yōu)化.
田彥濤,男,1958年生,教授、博士生導(dǎo)師、博士.吉林大學(xué)自動(dòng)化研究所所長,兼任中國自動(dòng)化學(xué)會(huì)理事、中國自動(dòng)化學(xué)會(huì)機(jī)器人專業(yè)委員會(huì)常務(wù)委員、吉林省自動(dòng)化學(xué)會(huì)理事長、吉林省通信學(xué)會(huì)副理事長、吉林省電機(jī)工程學(xué)會(huì)常務(wù)理事,中科院沈陽自動(dòng)化研究所先進(jìn)制造技術(shù)實(shí)驗(yàn)室學(xué)術(shù)委員會(huì)委員,中國自動(dòng)化學(xué)會(huì)《機(jī)器人》學(xué)報(bào)編委、《吉林大學(xué)學(xué)報(bào)(信息科學(xué)版)》副主編.主要研究方向?yàn)閺?fù)雜系統(tǒng)建模、優(yōu)化與控制、分布式智能系統(tǒng)與網(wǎng)絡(luò)控制.近五年,完成國家“863”計(jì)劃項(xiàng)目1項(xiàng)、國家自然科學(xué)基金項(xiàng)目1項(xiàng)、吉林省科技發(fā)展計(jì)劃項(xiàng)目3項(xiàng)、國家“863”計(jì)劃智能機(jī)器人網(wǎng)點(diǎn)實(shí)驗(yàn)室基金項(xiàng)目1項(xiàng);目前負(fù)責(zé)承擔(dān)國家“863”計(jì)劃項(xiàng)目和國家自然科學(xué)基金項(xiàng)目等國家級科研項(xiàng)目3項(xiàng)、吉林省科技發(fā)展計(jì)劃重點(diǎn)項(xiàng)目3項(xiàng).曾被評為國家機(jī)械部“優(yōu)秀科技青年”、機(jī)械部和教育部跨世紀(jì)學(xué)科帶頭人,2004年評為吉林省拔尖創(chuàng)新人才.發(fā)表學(xué)術(shù)論文70余篇,其中被SCI、EI、ISTP 檢索36篇.
Distributed coadaptive control and optimization of swarm robot synchronization
YANG Mao1,LI Cheng-feng1,TIAN Yan-tao1,2
(1.School of Communication Engineering,Jilin University,Changchun 130025,China;2.Key Laboratory of Bionic Engineering(Jilin University),Ministry of Education,Changchun 130025,China)
Co-adaptive control mechanisms for swarm robot systems were investigated to see if swarms could adapt to complex environments by using distributed control with local information exchange.The phenomenon of synchronization was studied,and on that basis a decentralized controller was proposed.It combined the ideas of a virtual force,the nearest neighborhood law,and environmental factors.It was proven that this controller can enable all swarm members to converge to a common velocity with bounded errors,whether the swarm topology is fixed or dynamic.The advantage of this controller is that it just needs local information to provide stable group behavior.In addition,parameters were optimized on the basis of the proposed controller to achieve the goal of minimum energy consumption.To deal with particle swarm optimization algorithms(PSO)easily falling into local optimums and having low accuracy,an improved algorithm was put forward.This was used to solve the energy optimization problem.Simulation results are included that verified the controller and algorithm.
swarm robot;synchronization;cooperative control;distributed controller;PSO algorithms
TP18
A
1673-4785(2010)03-0247-07
10.3969/j.issn.1673-4785.2010.03.007
2009-11-12.
國家自然科學(xué)基金資助項(xiàng)目(60675057);吉林大學(xué)研究生創(chuàng)新基金資助項(xiàng)目(20091020).
田彥濤.E-mail:tianyt@jlu.edu.cn.
book=3,ebook=27