滿艷鵬,孟慶浩,王佳瑛,羅 冰,曾 明(天津大學(xué)電氣與自動化工程學(xué)院機(jī)器人與自主系統(tǒng)研究所,天津300072)
計(jì)算與測試
用于二維源搜索的梯度自適應(yīng)極值搜索算法*
滿艷鵬,孟慶浩,王佳瑛,羅冰,曾明
(天津大學(xué)電氣與自動化工程學(xué)院機(jī)器人與自主系統(tǒng)研究所,天津300072)
基于正弦擾動的二維源極值搜索算法存在著適應(yīng)性差和快速性與準(zhǔn)確性相互制約的缺點(diǎn)。針對這一問題,提出一種基于梯度估計(jì)的參數(shù)自適應(yīng)極值搜索算法,該算法在傳統(tǒng)極值搜索算法基礎(chǔ)上,通過三個(gè)歷史采樣點(diǎn)估計(jì)當(dāng)前區(qū)域的梯度,并依據(jù)當(dāng)前區(qū)域梯度值自適應(yīng)調(diào)整反饋增益參數(shù)。此外,利用平均值理論對所提算法進(jìn)行了理論分析和收斂性證明。不同環(huán)境下的仿真對比表明本方法提高了源搜索效率和對復(fù)雜梯度環(huán)境的適應(yīng)性。
極值搜索;源搜索;梯度自適應(yīng)
極值搜索算法是一種不依賴對象數(shù)學(xué)模型的自適應(yīng)控制算法[1]。20世紀(jì)80年代,線性自適應(yīng)控制理論取得突破之后,極值搜索算法以其優(yōu)越的極值搜索能力而受到人們的重視[2]。基于滑模的極值搜索控制[3]曾成功應(yīng)用于ABS中。1999年,Krstic M[4]提出了快速自適應(yīng)極值搜索算法理論,通過加入動態(tài)補(bǔ)償裝置,提高系統(tǒng)的反應(yīng)速度和動態(tài)性能。左斌等人[5]將多變量極值搜索與神經(jīng)網(wǎng)絡(luò)相結(jié)合,推廣了極值搜索算法的應(yīng)用范圍。Sahneh F D等人[6]對時(shí)變的極值情況進(jìn)行了研究,郭曉軍等人[7]提出了多單元半全局極值搜索算法。
Ghods N等人[8]將極值搜索算法應(yīng)用到了二維源搜索中。極值搜索算法相對于其他搜索算法具有僅依靠檢測的信號強(qiáng)度,不需要自機(jī)器人位置信息優(yōu)勢。基于擾動的極值搜索可采用正弦擾動和隨機(jī)擾動[9]。文獻(xiàn)[10]中則采用角速度不變與控制線速度的方式,用基于正弦擾動的極值搜索算法來搜索源位置,并在顏色漸變信號場中進(jìn)行了實(shí)驗(yàn)。
但文獻(xiàn)[10]中機(jī)器人向源趨近速度受信號場梯度的影響,對梯度復(fù)雜情況適應(yīng)性較差。本文在其算法即定值極值搜索算法基礎(chǔ)上,根據(jù)梯度估計(jì)值對反饋增益進(jìn)行自適應(yīng)調(diào)整,提出了梯度自適應(yīng)極值搜索算法,并進(jìn)行了理論分析和收斂性證明。最后進(jìn)行了仿真實(shí)驗(yàn)對比,新算法提高了梯度小情況下快速性和復(fù)雜梯度適應(yīng)性。
梯度自適應(yīng)極值搜索算法的結(jié)構(gòu)如圖1所示,其中,v為機(jī)器人的線速度,ω為擾動信號的角頻率,h為洗出濾波器的特征常量,J代表測得的信號場強(qiáng)度值,代表將高通濾波器應(yīng)用于傳感器的測量值,a為擾動信號幅值,c為反饋增益。其中,非完整性機(jī)器人模型[10],可描述為
式中(xc,yc)為機(jī)器人的位置,θ為方向角,ω0為機(jī)器人的角速度。參數(shù)c隨著估計(jì)梯度自動調(diào)整,其表示如下
式中Q為定值,決定整體收斂速度(分析由下文給出),G(·)為低通濾波,Δ為估計(jì)梯度的大小。
梯度通過兩個(gè)歷史位置與當(dāng)前位置的信息進(jìn)行估計(jì)。z軸的值代表信號強(qiáng)度差,(x,y)為兩個(gè)歷史點(diǎn)相對于當(dāng)前點(diǎn)的坐標(biāo),從而得到兩個(gè)向量(x1,y1,z1)和(x2,y2,z2),則這兩個(gè)向量確定一個(gè)三維平面的梯度大小為其中
此梯度估計(jì)方法僅需知道最近三個(gè)采樣點(diǎn)的相對位置信息和信號強(qiáng)度,相對位置信息可通過機(jī)器人航位推算得到且無累積誤差。這種梯度推算方法保持了傳統(tǒng)極值搜索方法無需復(fù)雜定位系統(tǒng)的優(yōu)勢。
圖1 梯度自適應(yīng)極值搜索算法框圖Fig 1 Block diagram of gradient adaptive extremum seeking algorithm
不失一般性,令目標(biāo)函數(shù)為單極值連續(xù)函數(shù),同時(shí)在點(diǎn)(x*,y*)鄰域內(nèi),J=f(x,y)有到n+1階連續(xù)偏導(dǎo)數(shù),對此鄰域內(nèi)任一點(diǎn)(xe,ye)進(jìn)行泰勒展開并且忽略高次項(xiàng)有
式中(x*,y*)為機(jī)器人在信號場中的參考位置,f(x*,y*)為參考位置的信號強(qiáng)度;(xe,ye)為測量位置,在(x*,y*)的鄰域內(nèi),J為測量位置信號強(qiáng)度。
以極大值信號場為例,當(dāng)(x*,y*)為極大值點(diǎn)時(shí),f*= f(x*,y*)為信號場極大值,有
假設(shè)(x*,y*)為機(jī)器人的當(dāng)前位置,(x1,y1),(x2,y2)為兩個(gè)歷史位置相對于當(dāng)前位置的坐標(biāo),由式(4)可得
式中ξx∈(x*,x*+x1),ξy∈(y*,y*+y1)。z2,e2同理,將式(7)代入式(3)可以得到
作如下坐標(biāo)轉(zhuǎn)換,其中由于角速度一定,有θ1≠θ2
采用文獻(xiàn)[10]類似方法,對式(4)坐標(biāo)變換如下
令ω=kω0(k為大于等于3的正整數(shù)),τ=ωt,式(11)對τ求導(dǎo)可得
同理可以得到
以周期為2πk應(yīng)用均值理論,其中,c(t)低通濾波后變化頻率遠(yuǎn)小于ω0,在2πk的周期內(nèi)約為定值,用表示
同理,可得
這里,分兩種情況討論:(1)當(dāng)(x*,y*)為信號場中非極大值的參考位置時(shí),由于(xe,ye)在(x*,y*)的鄰域內(nèi),相對于一階偏導(dǎo)較小,由式(17),式(18)可得
梯度自適應(yīng)極值搜索算法趨近速度主要受參數(shù)a,Q影響,約為常數(shù),所以,算法能夠以較一致的速度向極值點(diǎn)趨近。
2)當(dāng)(x*,y*)為極大值點(diǎn)時(shí),函數(shù)的一階偏導(dǎo)數(shù)為0,二階偏導(dǎo)數(shù)小于0。唯一平衡點(diǎn)為。選擇李雅普諾夫函數(shù),對其求導(dǎo)有
第一項(xiàng)趨于0,第二項(xiàng)為O(1/ω),第三項(xiàng)為O(a),所以
可以看出:極值搜索控制算法可以收斂到極值點(diǎn)的一個(gè)很小的鄰域內(nèi),收斂區(qū)域大小受擾動幅值等影響。
本文分別在二次解析信號場(具有一般性)和簡化的Rosenbrock函數(shù)信號場(有較復(fù)雜梯度環(huán)境)中進(jìn)行了仿真。二次解析場公式為f(x,y)=1-((xc-x*)2+(ycy*)2/k,其中,k=1,(xc,yc)為測量點(diǎn)位置,(x*,y*)為源位置。簡化Rosenbrock函數(shù)為f(x,y)=-(1-x)2-10(yx2)2。
實(shí)驗(yàn)的終止條件為機(jī)器人到達(dá)極值點(diǎn)附近超過1000次迭代(成功)或迭代次數(shù)超過30000仍未接近極值點(diǎn)(失?。?。
在二次解析信號場中,極值搜索算法參數(shù)為a=0.05,h=0.1,ω0=ω/5=0.02π,Q=900。為滿足穩(wěn)定性要求,機(jī)器人應(yīng)按照近似五角星型軌跡前進(jìn)。由圖2(a),(b)看出,定值(c=3,c=5)極值搜索算法隨著梯度變小收斂緩慢,圖2(b)在起點(diǎn)處因參數(shù)過大產(chǎn)生軌跡發(fā)散現(xiàn)象;而圖2(c)梯度自適應(yīng)極值搜索算法基本以一致的收斂速度向氣味源靠近,圖2(d)為參數(shù)隨迭代步數(shù)(代表時(shí)間)的自適應(yīng)變化曲線。由表1可看出同樣條件下,本文的算法用時(shí)較短,提高了整體效率。
表1 兩種極值搜索算法效率對比Tab 1 Efficiency contrast of two kinds of extremum seeking algorithms
在簡化的Rosenbrock函信號場中,其中,a=0.01其他參數(shù)與二次解析場中相同。圖3(a),(b),(c)對比可得出與二次場中相同的結(jié)論。定值的極值搜索都未能在有限迭代時(shí)間內(nèi)到達(dá)極值點(diǎn)附近,而梯度自適應(yīng)極值搜索算法成功。
圖3 簡化的Rosenbrock函數(shù)中實(shí)驗(yàn)對比Fig 3 Experimental contrast in simplified Rosenbrock function
實(shí)驗(yàn)對比可以得出:梯度自適應(yīng)極值搜索算法克服了定值極值搜索方法在梯度較大時(shí)易發(fā)散,梯度小時(shí)收斂緩慢與效率低的不足。同時(shí),梯度自適應(yīng)極值搜索算法增強(qiáng)了對于梯度較復(fù)雜的函數(shù)的適應(yīng)性。
本文在基于正弦擾動的二維極值搜索方法基礎(chǔ)上,提出了基于梯度估計(jì)的參數(shù)自適應(yīng)極值搜索方法。同時(shí),應(yīng)用平均值理論對改進(jìn)算法進(jìn)行了理論分析,尤其針對非極值點(diǎn)鄰域內(nèi)的情況,得到改進(jìn)算法有較一致趨近速度的結(jié)論,并通過李雅普諾夫法證明了算法的收斂性。最終通過在對稱二次解析信號場和簡化Rosenbrock函數(shù)信號場兩種環(huán)境下的仿真對比,說明該方法提高了源搜索效率,并且增強(qiáng)了對于梯度相對較復(fù)雜環(huán)境的適應(yīng)性。
[1]Astrom K J,Wittenmark B.Adaptive control[M].2nd ed.北京:科學(xué)出版社,2003.
[2]左斌,胡云安,施建洪.極值搜索算法的研究與進(jìn)展[J].海軍航空工程學(xué)院學(xué)報(bào),2006,21(6):611-617.
[3]Drakunov S,Ozguner U,Dix P,et al.ABS control using optimum search via sliding mode[J].IEEE Transactions on Control Systems Technology,1995,3(1):79-85.
[4]Krstic M.Toward faster adaptation in extremum seeking control[C]∥Proceeding of the 39th IEEE Conference on Decision and Control,Phoenix,1999:4766-4771.
[5]左斌,李靜.控制增益未知的多變量極值搜索系統(tǒng)神經(jīng)網(wǎng)絡(luò)自適應(yīng)協(xié)同控制[J].控制理論與應(yīng)用,2013,30(4):405-416.
[6]Sahneh F D,Hu G,Xie L.Extremum seeking control for systems with time-varying extremum[C]∥2012 31st Chinese Control Conference(CCC),IEEE,2012:225-231.
[7]郭曉軍,胡云安,張雷.單變量多單元半全局極值搜索算法仿真研究[J].系統(tǒng)仿真學(xué)報(bào),2013(8):1901-1905,1911.
[8]Ghods N.Extremum seeking for mobile robots[D].Sandiego:University of California,2011.
[9]Liu S J,F(xiàn)rihauf P,Krstic M.Stochastic source seeking with tuning of forward velocity[C]∥Proceedings of the 31st Chinese Control Conference,2012:4424-4429.
[10]Zhang C,Arnold D,Ghods N,et al.Source seeking with non-holonomic unicycle without position measurement and with tuning of forward velocity[J].Systems&Control Letters,2007,56(3):245-252.
控制,氣味源搜索,機(jī)器人控制。
Gradient adaptive extremum seeking algorithm for 2D source searching*
MAN Yan-peng,MENG Qing-hao,WANG Jia-ying,LUO Bing,ZENG Ming
(Institute of Robotics and Autonomous Systems,School of Electrical Engineering and Automation,Tianjin University,Tianjin 300072,China)
Sinusoidal-perturbation-based two-dimensional source extremum searching methods have the drawbacks of poor adaptability and mutual restriction between rapidity and accuracy.Aiming at this problem,a gradientestimation-based parameter adaptive extremum seeking algorithm is proposed.On the basis of traditional extremum seeking algorithm,this algorithm estimates gradient of the local area with three historical sample points and adjusts feedback gain parameter adaptively according to the gradient value.Moreover,the average value theory is used to theoretically analyze and prove the convergence of the proposed algorithm.Simulation comparison in different environments show that the proposed algorithm increase source search efficiency and adaptability to complicated gradient environments.
extremum-seeking;source searching;gradient adaptive
TP273.2
A
1000—9787(2016)06—0109—04
10.13873/J.1000—9787(2016)06—0109—04
2015—10—09
國家自然科學(xué)基金資助項(xiàng)目(61271321,61473207,61401303);教育部博士點(diǎn)基金資助項(xiàng)目(20120032110068);天津市科技支撐計(jì)劃資助項(xiàng)目(14ZCZDSF00025)
滿艷鵬(1990-),男,天津人,碩士研究生,研究方向?yàn)樽赃m應(yīng)