陳必露, 劉春生, 袁斐然
(南京航空航天大學(xué),南京 211000)
導(dǎo)彈作為一種精確制導(dǎo)武器,在現(xiàn)代化戰(zhàn)爭(zhēng)中意義重大,其制導(dǎo)控制系統(tǒng)由制導(dǎo)和控制兩部分組成,其中,控制部分主要體現(xiàn)在自動(dòng)駕駛儀的設(shè)計(jì)。隨著現(xiàn)代戰(zhàn)場(chǎng)呈現(xiàn)出的高度信息化、復(fù)雜化特征,導(dǎo)彈控制系統(tǒng)的穩(wěn)定性和魯棒性亟待提高。因此,相應(yīng)的現(xiàn)代控制理論和先進(jìn)控制方法也被應(yīng)用于導(dǎo)彈自動(dòng)駕駛儀的設(shè)計(jì)。文獻(xiàn)[1]針對(duì)導(dǎo)彈自動(dòng)駕駛儀的縱向動(dòng)力學(xué)問題,在設(shè)計(jì)非線性干擾觀測(cè)器(NDO)觀測(cè)部分未知干擾的基礎(chǔ)上,結(jié)合滑模控制(SMC)理論提出了不依賴于干擾上界的自適應(yīng)反饋控制方法并進(jìn)行自動(dòng)駕駛儀設(shè)計(jì),從而提高了系統(tǒng)的魯棒性;文獻(xiàn)[2]針對(duì)BTT導(dǎo)彈的抗干擾自動(dòng)駕駛儀問題,設(shè)計(jì)了一種抗尖峰滑模控制器,有效抑制了高觀測(cè)增益造成的系統(tǒng)性能下降現(xiàn)象。
此外,隨著導(dǎo)彈的智能化發(fā)展需求,其控制過程中的一些最優(yōu)特性(如最小耗能等)也值得考慮。但是,導(dǎo)彈等非線性系統(tǒng)的控制問題需要求解復(fù)雜的非線性偏微分方程,一般的解析方法在進(jìn)行求解時(shí)會(huì)陷入“維數(shù)災(zāi)難”現(xiàn)象。為解決該問題,自適應(yīng)動(dòng)態(tài)規(guī)劃(ADP)算法被提出,并成為非線性最優(yōu)控制領(lǐng)域的研究熱點(diǎn)[3-4]。文獻(xiàn)[5]針對(duì)導(dǎo)彈自動(dòng)駕駛儀的縱向動(dòng)力學(xué)控制問題,通過結(jié)合NDO,SMC和最優(yōu)控制方法,基于ADP算法實(shí)現(xiàn)了系統(tǒng)狀態(tài)受限下的魯棒最優(yōu)控制,有效抑制了非匹配干擾帶來的不利影響。
微分對(duì)策作為控制論的重要分支,是處理雙方最優(yōu)控制的理論。本文受文獻(xiàn)[6-7]啟發(fā),設(shè)計(jì)了一種復(fù)合控制方案。首先利用超螺旋干擾觀測(cè)器(STDO)觀測(cè)匹配輸入干擾,并結(jié)合積分滑??刂破?ISMC)方法設(shè)計(jì)滑??刂破餮a(bǔ)償匹配輸入干擾;其次,將自動(dòng)駕駛儀的控制輸入和外界非匹配干擾看作是博弈雙方,基于ADP算法求解出微分對(duì)策控制器;最后,仿真表明,所設(shè)計(jì)的復(fù)合控制方案有效提高了導(dǎo)彈縱向動(dòng)力學(xué)系統(tǒng)的魯棒性。
考慮一類受時(shí)變干擾影響的連續(xù)時(shí)間仿射非線性系統(tǒng)
(1)
式中:x∈Rn,為系統(tǒng)狀態(tài);u∈Rm,為控制輸入;ud∈Rm,d∈Rk,分別表示匹配干擾和非匹配干擾;f(x),g(x)和k(x)為連續(xù)可微的系統(tǒng)矩陣,假定f(x)+g(x)u是Lipchitz連續(xù),且f(0)=0。
為了便于下文觀測(cè)器和控制器設(shè)計(jì),做如下假設(shè)[8]。
假設(shè)1f(·),g(·)和k(·)為已知連續(xù)有界函數(shù)。
針對(duì)式(1)系統(tǒng),目標(biāo)為設(shè)計(jì)一種復(fù)合魯棒控制方案來補(bǔ)償干擾對(duì)系統(tǒng)的不利影響,同時(shí)保證系統(tǒng)狀態(tài)最終一致有界(UUB)穩(wěn)定。其中,復(fù)合控制器由兩部分組成,即
u=us+ua
(2)
式中:滑??刂破鱱s通過選取STDO獲得對(duì)輸入干擾的估計(jì),并結(jié)合積分滑??刂品椒ㄟM(jìn)行設(shè)計(jì)以補(bǔ)償干擾ud;自適應(yīng)控制器ua針對(duì)干擾補(bǔ)償后的標(biāo)稱系統(tǒng),利用微分對(duì)策理論和ADP算法設(shè)計(jì)來補(bǔ)償非匹配干擾d。
首先,設(shè)計(jì)STDO為
(3)
根據(jù)設(shè)計(jì)的觀測(cè)器式(3),為消除輸入干擾對(duì)系統(tǒng)的影響,結(jié)合滑??刂品椒ǎO(shè)計(jì)滑模面
(4)
式中:G(x)∈Rm,為積分滑??刂浦性O(shè)計(jì)的矩陣向量;▽G(x)=?G(x)/?x,為其關(guān)于狀態(tài)x的偏導(dǎo)數(shù)。
針對(duì)滑模面式(4),設(shè)計(jì)自適應(yīng)滑??刂坡蔀?/p>
(5)
式中,c為可調(diào)增益。
定理1針對(duì)系統(tǒng)式(1),設(shè)計(jì)STDO式(3)觀測(cè)輸入干擾ud,分別設(shè)計(jì)滑模面式(4)和滑模控制器式(5),則系統(tǒng)的狀態(tài)量將收斂并維持在滑模面上。
證明 取Lyapunov函數(shù)Ls(t)=0.5STS,求導(dǎo)
(6)
因此,根據(jù)Lyapunov穩(wěn)定性理論,系統(tǒng)狀態(tài)將收斂并維持在S=0,即滑模面上。
本節(jié)結(jié)合滑??刂评碚摚O(shè)計(jì)自適應(yīng)滑??刂破鲗?duì)匹配干擾進(jìn)行了補(bǔ)償,將對(duì)原式(1)系統(tǒng)的控制問題轉(zhuǎn)化為標(biāo)稱系統(tǒng)的最優(yōu)控制問題。
考慮標(biāo)稱系統(tǒng)
(7)
對(duì)于系統(tǒng)式(7),定義性能指標(biāo)函數(shù)為
(8)
式中:Q1為半正定矩陣;R1和R2均為正定矩陣。
定義系統(tǒng)式(7)的哈密頓(Hamilton)函數(shù)為
(9)
式中,▽J(x)=?J(x)/?x。
根據(jù)Hamilton-Jacobi-Isaacs(HJI)理論,最優(yōu)性能指標(biāo)函數(shù)▽J*(x)滿足
(10)
假設(shè)式(10)的解存在且唯一,則系統(tǒng)式(7)的最優(yōu)策略滿足?H(·)/?u=0,?H(·)/?d=0,解得
(11)
由式(10)和式(11)發(fā)現(xiàn),獲得最優(yōu)控制策略需要求解HJI方程,而此非線性偏微分方程很難用解析方法求解。因此,將結(jié)合ADP算法求解該HJI方程并設(shè)計(jì)最優(yōu)控制器。
在設(shè)計(jì)控制器之前,基于文獻(xiàn)[10]做如下假設(shè)。
(12)
成立。采用單評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)逼近最優(yōu)性能指標(biāo)函數(shù)及其梯度分別為
(13)
式中:WJ∈Rl,為理想權(quán)值向量;φJ(rèn)(x)∈Rl,為激勵(lì)函數(shù);l表示評(píng)價(jià)網(wǎng)絡(luò)中的神經(jīng)元個(gè)數(shù);εJ(x)表示神經(jīng)網(wǎng)絡(luò)的逼近誤差。
將式(11)和式(13)代入式(10)得到
(14)
(15)
通過式(11)和式(15),近似最優(yōu)控制策略為
(16)
將式(16)代入式(10),得近似Hamilton函數(shù)為
(17)
(18)
(19)
根據(jù)設(shè)計(jì)的最優(yōu)控制策略式(16)和權(quán)值更新律式(18),在穩(wěn)定性分析之前,給出如下假設(shè)與定理。
假設(shè)4 評(píng)價(jià)網(wǎng)絡(luò)的理想權(quán)值與逼近誤差εJ(x)的偏導(dǎo)數(shù)▽?duì)臞(x)均有界,界值分別滿足‖WJ‖≤bW,‖▽?duì)臞(x)‖≤bε,bW和bε為大于零的常數(shù)。
證明 結(jié)合Lyapunov穩(wěn)定性理論,選取Lyapunov函數(shù)
(20)
對(duì)式(20)求導(dǎo),可得
(21)
(22)
泡沫混凝土應(yīng)符合《泡沫混凝土》[4]的標(biāo)準(zhǔn)要求,28 d抗壓強(qiáng)度不小于2.0 MPa;所使用的外加劑(水泥強(qiáng)度激發(fā)劑、減水劑和發(fā)泡劑等)亦應(yīng)滿足規(guī)范要求。
(23)
式中,λ表示M矩陣的最小特征值。
(24)
此時(shí),只要不等式
(25)
(26)
(27)
或者
(28)
考慮以上兩種情況,結(jié)合Lyapunov穩(wěn)定性理論可知定理2成立。
基于上述復(fù)合控制方案,選取導(dǎo)彈自動(dòng)駕駛儀的縱向動(dòng)力學(xué)方程
(29)
式中:xT=[αqδ],α,q和δ分別表示導(dǎo)彈的攻角、俯仰角和尾翼偏轉(zhuǎn)角;d表示由建模誤差或外部風(fēng)力等因素產(chǎn)生的擾動(dòng)項(xiàng);f1(α),f2(α),b1和b2是由氣動(dòng)系數(shù)決定的非線性函數(shù);t1表示尾翼執(zhí)行器的時(shí)間常數(shù)。不失一般性,上述函數(shù)滿足[5]
(30)
式中:η1=180gQs/πmv,η2=1.03×10-4,η3=9.45×10-3;η4=180QDs/πIyy,η5=2.15×10-4,η6=1.95×10-2。假設(shè)輸入干擾ud為
(31)
此外,各項(xiàng)參數(shù)為:導(dǎo)彈的質(zhì)量m=4410 kg,速度v=947.6 m/s,俯仰慣性矩Iyy=247.44 kg·m2,導(dǎo)彈所受動(dòng)壓Q=293.638 N/m2,其參考面積為s=0.040 87 m2,參考直徑D=0.229 m,尾翼執(zhí)行器的時(shí)間常數(shù)t1=0.1 s,重力加速度g=9.8 m/s2。
根據(jù)自動(dòng)駕駛儀模型式(30),選取各項(xiàng)參數(shù)如下。
圖1 系統(tǒng)狀態(tài)x的軌跡Fig.1 The trajectories of system state x
圖2 STDO實(shí)現(xiàn)干擾ud估計(jì)Fig.2 Estimation of udby STDO
圖3 評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)的權(quán)值Fig.3 Weights of critic NN
從圖2可以看出,設(shè)計(jì)的STDO在經(jīng)過一段時(shí)間后實(shí)現(xiàn)了對(duì)輸入干擾的可靠估計(jì);圖3反映了評(píng)價(jià)網(wǎng)絡(luò)的輸出最終收斂至理想權(quán)值;圖4為基于上述有效信息得到的復(fù)合控制輸入;結(jié)合該復(fù)合控制,系統(tǒng)狀態(tài)逐漸收斂并穩(wěn)定,如圖1所示。
圖4 復(fù)合控制策略Fig.4 Composite control strategies
其次,為驗(yàn)證提出的微分對(duì)策控制律對(duì)一般干擾的魯棒性,選取非匹配干擾為d1,即
(32)
調(diào)整參數(shù)Y2=10.5I6,Y1=200·[111111]T,系統(tǒng)式(30)的初始狀態(tài)滿足x0=[-1-1.6-0.5]T,其他參數(shù)不變,得到圖5和圖6所示系統(tǒng)的動(dòng)態(tài)響應(yīng)和權(quán)值變化曲線。
圖5 d=d1時(shí)系統(tǒng)狀態(tài)x的軌跡Fig.5 Trajectories of system state x when d=d1
圖6 d=d1時(shí)評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)的權(quán)值Fig.6 Weights of critic NN when d=d1
由圖6可知,評(píng)價(jià)網(wǎng)絡(luò)輸出由于非匹配干擾的改變,在前期的學(xué)習(xí)過程中波動(dòng)較大,但是當(dāng)t=10 s后迅速收斂至理想權(quán)值;圖5表明自動(dòng)駕駛儀系統(tǒng)狀態(tài)最終收斂至穩(wěn)定狀態(tài)。因此,仿真結(jié)果表明,上述提出的復(fù)合控制策略是有效的。
本文針對(duì)導(dǎo)彈自動(dòng)駕駛儀的抗干擾問題,提出了一種滑模微分對(duì)策控制策略,構(gòu)造了超螺旋干擾觀測(cè)器(STDO),并將其用于滑??刂坡?SMC)的設(shè)計(jì)來抑制輸入干擾帶來的不利影響;同時(shí),為了處理非匹配干擾,結(jié)合微分對(duì)策理論和ADP算法在線求解并獲得了近似最優(yōu)控制器以實(shí)現(xiàn)對(duì)該干擾的補(bǔ)償,進(jìn)一步增強(qiáng)了系統(tǒng)的魯棒性。通過Lyapunov穩(wěn)定性理論證明了閉環(huán)系統(tǒng)的穩(wěn)定性。最后,仿真驗(yàn)證了本文所提算法的有效性,對(duì)處理一類非線性系統(tǒng)的抗干擾最優(yōu)控制器設(shè)計(jì)有良好的參考價(jià)值。