肖遙 冮鐵強(qiáng)
摘? 要:該文結(jié)合了變分法和離散力學(xué),提出一種新的半直接追逃問題的數(shù)值求解方法。首先利用變分法將微分對策問題轉(zhuǎn)化為含約束的最優(yōu)控制問題,再結(jié)合離散力學(xué)理論將最優(yōu)控制問題轉(zhuǎn)化為非線性規(guī)劃問題,最后使用序列二次規(guī)劃(SQP)方法進(jìn)行數(shù)值求解。以小車追逃模型作為算例驗(yàn)證了該方法的正確性。
關(guān)鍵詞:追逃問題? 變分法? 離散力學(xué)
中圖分類號:O3 ? ?文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2020)02(c)-0213-02
20世紀(jì)50年代,Isaacs 等人首先提出了用微分對策求解追逃問題。但是微分對策問題的求解一直是一個(gè)難題,很多學(xué)者對于追逃問題的數(shù)值求解方法進(jìn)行了大量的研究。徐光延等人[1]使用變分法將微分對策問題轉(zhuǎn)化為最優(yōu)控制問題,再用偽譜法和SNOPT求解器計(jì)算最優(yōu)解;針對三維無人機(jī)追逃問題,Conway等人使用間接法和遺傳算法求解[2],而對于導(dǎo)彈攔截問題,他們則提出了一種半直接非線性規(guī)劃算法(semi-DCNLP)進(jìn)行了數(shù)值求解[3]。該文提出一種半直接的數(shù)值求解方法,先把問題轉(zhuǎn)化為最優(yōu)控制問題,再結(jié)合離散力學(xué)理論將最優(yōu)控制問題轉(zhuǎn)化為非線性規(guī)劃問題,最后使用序列二次規(guī)劃(Sequential Quadratic Programming,SQP)方法進(jìn)行數(shù)值求解。
1? 微分對策問題的轉(zhuǎn)化
使用文獻(xiàn)[1]中的轉(zhuǎn)化形式,將微分對策問題轉(zhuǎn)化為最優(yōu)控制問題。
(1)
s.t.
(2)
(3)
(4)
(5)
其中:下標(biāo)P和E分別表示追方和逃方;ΦE和DE分別為目標(biāo)函數(shù)的末值項(xiàng)和代價(jià)函數(shù),為連續(xù)可微的標(biāo)量函數(shù); qE,qP∈Rn和uE,uP∈Rm分別為追逃雙方的狀態(tài)變量和控制變量;式(3)和式(4)為追逃雙方的狀態(tài)方程;t0和tf分別為給定的初始時(shí)刻終端時(shí)刻。
2? 離散力學(xué)和最優(yōu)控制
離散力學(xué)最優(yōu)控制方法(DMOC)[4]是求解最優(yōu)控制問題的一種數(shù)值方法。
在離散的情況下,我們將固定時(shí)間間隔[t0,tf]以時(shí)間間隔h劃分為N個(gè)小區(qū)間[t0,t0+h],[t0+h,t0+2h],…,[t0+(N-1)h,t0+Nh],系統(tǒng)運(yùn)動狀態(tài)q也每隔時(shí)間步長h進(jìn)行采樣從而得到一系列的采樣點(diǎn)qk(t0+kh),k=0,1,2,…,N,使用中點(diǎn)法代替廣義坐標(biāo)q,使用采樣點(diǎn)的差商代替廣義坐標(biāo)。使用文獻(xiàn)[4]中的方法,將式(1)和(2)構(gòu)成的最優(yōu)控制問題轉(zhuǎn)化為:
(6)
(7)
(8)
(9)
其中f-k=f+k為統(tǒng)中含有摩擦力、耗散力或額外控制力等非有勢力的離散形式k=1,2,…,N-1。此時(shí),式(6)~(9)就構(gòu)成一個(gè)非線性規(guī)劃問題,利用計(jì)算機(jī)軟件很容易數(shù)值求解。
3? 基于離散力學(xué)的追逃問題的半直接數(shù)值解法
將追方極值條件式(4)~(5)離散:
(10)
(11)
其中HP,k為離散的哈密頓函數(shù),F(xiàn)P,d為離散的狀態(tài)方程,k=1,2,…,N-1。此時(shí),式(8)~(11)構(gòu)成一個(gè)與微分對策問題(1)~(5)等價(jià)的非線性規(guī)劃問題。
4? 算例
考慮如圖1中的小車追逃模型。其中,下標(biāo)P和E分別表示追方和逃方;F為小車的最大推力,θ為小車推力方向與X軸的夾角,(x,y)為小車位置坐標(biāo)。
取qP=[xp,yp]T和qE=[xE,yE]T作為追逃兩只小車的狀態(tài)變量,取up=θp和uE=θE作為控制量;給定初始參數(shù)xp=0,yp=0,xe=500,ye=1000,θp=0,;為保證追方一定能追上逃方,則必有追方推重比大于逃方推重比,即,取=8,=3.5;采樣周期h=1,采樣次數(shù)N=100。使用第3節(jié)的方法建立模型,使用MATLAB軟件進(jìn)行數(shù)值仿真(使用Control Toolbox中的fmincon函數(shù),算法選擇SQP),數(shù)值仿真結(jié)果如圖2所示??梢钥闯?,逃方采用轉(zhuǎn)向機(jī)動躲避追擊,而擁有速度優(yōu)勢的追方做出相同的轉(zhuǎn)向機(jī)動并最終追上逃方,雙方的策略都是非常合理的。
5? 結(jié)語
該文創(chuàng)新提出使用基于離散力學(xué)的半直接數(shù)值解法求解了追逃問題。首先使用間接法將微分對策問題轉(zhuǎn)化為最優(yōu)控制問題,再結(jié)合離散力學(xué)理論將問題轉(zhuǎn)化為非線性規(guī)劃問題進(jìn)行直接優(yōu)化求解。為了驗(yàn)證方法的有效性,在第4節(jié)給出一個(gè)小車追逃的算例,在MATLAB中應(yīng)用SQP方法進(jìn)行數(shù)值求解和仿真。對仿真結(jié)果的分析表明,雙方都采用了合理的策略進(jìn)行博弈。仿真結(jié)果表明了該文提出的方法是正確的、有效的。
參考文獻(xiàn)
[1] 徐光延,史光普.無人機(jī)三維追逃問題的半直接法求解[J].電光與控制,2017,24(10):27-31.
[2] CONWAY B A, PONTANI M. Numerical solution of the three-dimensional orbital pursuit-evasion game[J].Journal of Guidance, Control, and Dynamics,2009,32(2):474-487.
[3] CONWAY B A, PONTANI M. Optimal interception of evasive missile warheads: Numerical solution of the differential game[J].Journal of Guidance, Control, and Dynamics,2008,31(4):1111-1122.
[4] OBER-BLOBAUM S. Discrete Mechanics and Optimal Control[J].IAFC Proceedings Volumes,2005,38(1):538-543.