王文娟,李 俊
(江西應(yīng)用科技學(xué)院人工智能學(xué)院,江西 南昌 330100)
軌跡跟蹤問(wèn)題一直是飛行器制導(dǎo)控制領(lǐng)域研究的熱點(diǎn)和難點(diǎn),結(jié)合不同的問(wèn)題背景,應(yīng)用不同的控制方法,可以形成不同形式的軌跡跟蹤控制律[1]。針對(duì)運(yùn)動(dòng)模型的非線性和高度耦合特性,對(duì)此問(wèn)題的處理思路大致可分為兩類(lèi),一類(lèi)是基于小擾動(dòng)線性化[2]或鄰域最優(yōu)控制理論[3]對(duì)模型進(jìn)行近似線性化,然后采用線性控制方法設(shè)計(jì)控制律。該類(lèi)方法設(shè)計(jì)過(guò)程簡(jiǎn)便,工程上易于實(shí)現(xiàn)。但當(dāng)干擾與模型不確定性造成的實(shí)際彈道與標(biāo)稱(chēng)軌跡偏差較大時(shí),其跟蹤精度較差。
另一類(lèi)思路是直接采用非線性方法進(jìn)行控制律設(shè)計(jì)[4-5],該類(lèi)方法的設(shè)計(jì)過(guò)程復(fù)雜,控制律的實(shí)現(xiàn)需用信息多,工程應(yīng)用較困難。針對(duì)上述問(wèn)題,采用滑模變結(jié)構(gòu)的策略設(shè)計(jì)控制律,該方法與其它非線性方法相比無(wú)須在線系統(tǒng)辨識(shí),物理實(shí)現(xiàn)較簡(jiǎn)單,且其對(duì)參數(shù)攝動(dòng)和干擾不靈敏,良好的魯棒性利于工程應(yīng)用[6]。但是滑??刂破鲀?nèi)在不連續(xù)的開(kāi)關(guān)特性會(huì)造成抖振現(xiàn)象,對(duì)抖振的削弱一直是滑模控制理論的研究熱點(diǎn),國(guó)內(nèi)外學(xué)者針對(duì)此問(wèn)題提出了不同的解決方法,如設(shè)計(jì)邊界層[7]、濾波方法[8]、干擾觀測(cè)器方法[9]等。這些方法從不同的角度提出了解決思路,每一種都有其相應(yīng)的優(yōu)點(diǎn)與局限性。將徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)與滑??刂葡嘟Y(jié)合,通過(guò)RBF 網(wǎng)絡(luò)對(duì)非線性系統(tǒng)的自適應(yīng)逼近來(lái)降低切換增益,削弱抖振。且其能以任意精度逼近任何非線性函數(shù),具有唯一最佳逼近特性。另一方面,RBF 網(wǎng)絡(luò)構(gòu)簡(jiǎn)單,收斂速度很快,非常適合在線的實(shí)時(shí)控制[10]。
以戰(zhàn)術(shù)導(dǎo)彈中制導(dǎo)段的運(yùn)動(dòng)模型為研究對(duì)象,因其朝向預(yù)測(cè)命中點(diǎn)飛行,在實(shí)際飛行的過(guò)程中,由隨機(jī)干擾產(chǎn)生的側(cè)向運(yùn)動(dòng)參數(shù)的變化量都是小量,其飛行彈道與縱向平面內(nèi)的彈道差別不大,因此可以將縱向運(yùn)動(dòng)和側(cè)向運(yùn)動(dòng)分開(kāi)來(lái)研究。主要考慮縱向平面軌跡跟蹤系統(tǒng)的設(shè)計(jì),其質(zhì)點(diǎn)運(yùn)動(dòng)模型為:
式中:v—導(dǎo)彈速度;θ—彈道傾角;x—橫程;h—縱程;α—攻角作為控制量;P,Cx,Cy,q,S 等參數(shù)的表達(dá)式均參考文獻(xiàn)[2]。
在戰(zhàn)術(shù)導(dǎo)彈設(shè)計(jì)階段,一般先進(jìn)行速度特性設(shè)計(jì),從而確定發(fā)動(dòng)機(jī)參數(shù),所以導(dǎo)彈速度近似認(rèn)為是不可控量。另一方面,設(shè)計(jì)中制導(dǎo)律的目的是引導(dǎo)導(dǎo)彈沿基準(zhǔn)彈道飛向預(yù)測(cè)命中點(diǎn),對(duì)導(dǎo)彈的速度大小沒(méi)有必要進(jìn)行精確跟蹤。對(duì)于剩余三個(gè)狀態(tài)變量,只要能對(duì)θ,h 穩(wěn)定跟蹤,即可實(shí)現(xiàn)對(duì)基準(zhǔn)彈道的穩(wěn)定跟蹤,所以取θ,h 為系統(tǒng)狀態(tài)變量。此外,由于戰(zhàn)術(shù)導(dǎo)彈主動(dòng)段發(fā)動(dòng)機(jī)造成的誤差較大,通常不對(duì)彈道進(jìn)行精確跟蹤,而是采用方案飛行,對(duì)于無(wú)動(dòng)力段即中制導(dǎo)段,可以對(duì)運(yùn)動(dòng)模型進(jìn)行如下簡(jiǎn)化,系統(tǒng)狀態(tài)方程變換為:
根據(jù)式(5),對(duì)高度求二階導(dǎo),并令x1=h,可以將上述模型可以轉(zhuǎn)換為如下的一個(gè)非線性二階系統(tǒng):
考慮上節(jié)得到的二階非線性系統(tǒng)式(6),只要實(shí)現(xiàn)對(duì)x1,x2的精確跟蹤即可實(shí)現(xiàn)對(duì)彈道的精確跟蹤。選擇如下的滑模面:
式中:hr—標(biāo)稱(chēng)彈道的飛行高度,c=[c 1]滿(mǎn)足赫爾維茲條件。
對(duì)式(8)進(jìn)行求導(dǎo):
滑??刂破鞯脑O(shè)計(jì)通常由兩種思路,一種思路是設(shè)計(jì)趨近律,通過(guò)趨近律與所選擇的滑模面聯(lián)立推導(dǎo)得到控制律;另一種思路如下:
定理1 對(duì)于式(6)所示的非線性系統(tǒng)和式(9)所選擇的滑模面,滿(mǎn)足(fx),g(x)為光滑函數(shù)設(shè)計(jì)如下的理想滑??刂破鳎?/p>
證明:導(dǎo)彈沿標(biāo)稱(chēng)彈道飛行,其實(shí)際軌跡應(yīng)在標(biāo)稱(chēng)軌跡的鄰域內(nèi),此時(shí)顯然f(x),g(x)是光滑函數(shù),g(x)有界;在無(wú)動(dòng)力段,彈道傾角的變化范圍屬于且不接近 0,不會(huì)產(chǎn)生奇異現(xiàn)象。
取Lyapunov 函數(shù)為:
對(duì)式(11)求導(dǎo),可得:
將式(9)代入式(11),可得:
將式(10)設(shè)計(jì)的滑模控制器代入式(13),可得:
綜上,采用式(10)設(shè)計(jì)的滑??刂破?,彈道跟蹤系統(tǒng)是穩(wěn)定的。
在實(shí)際飛行中,參數(shù)攝動(dòng)及各種隨機(jī)干擾造成f(x),g(x)難以精確獲得,采用滑??刂评碚撛O(shè)計(jì)跟蹤控制律時(shí),這種建模的不確定性會(huì)產(chǎn)生較大的切換增益,進(jìn)而造成較大的抖振。針對(duì)此問(wèn)題,本節(jié)采用自適應(yīng)RBF 神經(jīng)網(wǎng)絡(luò)逼近第二節(jié)所設(shè)計(jì)的滑??刂破?。
RBF 神經(jīng)網(wǎng)絡(luò)是一種局部逼近的神經(jīng)網(wǎng)絡(luò),其基函數(shù)通常選取為如下的高斯基函數(shù):
式中:下標(biāo) j—第 j 個(gè)基函數(shù);cj—基函數(shù)中心點(diǎn);σj—基寬參數(shù);φj—徑向?qū)ΨQ(chēng)函數(shù)。
RBF 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)由輸入層和輸出層兩層組成,輸入層實(shí)現(xiàn)輸入信號(hào)到隱含層節(jié)點(diǎn)的非線性映射,輸出層實(shí)現(xiàn)隱含層節(jié)點(diǎn)到輸出信號(hào)的線性映射。為了實(shí)現(xiàn)對(duì)滑??刂破鱱 的逼近,選擇如下的網(wǎng)絡(luò)輸入:
將控制器作為神經(jīng)網(wǎng)絡(luò)的輸出,其映射關(guān)系結(jié)構(gòu)圖,如圖1 所示。圖中隱含層節(jié)點(diǎn)向量為H=[h1,h2,…h(huán)9]T,相應(yīng)的中心點(diǎn)向量和基寬參數(shù)向量分別為:C=[c1,c2,…c9]T,σ=[σ1,σ2,…σ9]T。
圖1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)Fig.1 Structure of Neural Networks
神經(jīng)網(wǎng)絡(luò)輸出的表達(dá)式為:
RBF 網(wǎng)絡(luò)具體的學(xué)習(xí)過(guò)程可以分為兩個(gè)階段。第一個(gè)階段是無(wú)監(jiān)督學(xué)習(xí),其作用是根據(jù)輸入的樣本確定隱含層的高斯基函數(shù)的中心點(diǎn)向量cj與基寬參數(shù)σj。采用K-均值聚類(lèi)算法實(shí)現(xiàn)中心向量的調(diào)整,具體步驟如下:
(1)首先初始化隱含層各個(gè)節(jié)點(diǎn)的中心向量值cj(0)(j=1,2,…,9),學(xué)習(xí)步長(zhǎng) β(0),(0<β(0)<1)及誤差閾值 δ。
(2)根據(jù)輸入樣本X(k),計(jì)算歐氏距離,確定與樣本距離最小的隱含節(jié)點(diǎn)。計(jì)算公式如下:
式中:k—輸入樣本的序號(hào);r—與樣本距離最小的隱含節(jié)點(diǎn)序號(hào)。
(3)進(jìn)行中心調(diào)整。
由式(22)可知,隨著輸入樣本的增多,學(xué)習(xí)步長(zhǎng)逐漸減小,最后趨于0。
(4)對(duì)于所有的輸入樣本重復(fù)進(jìn)行步驟(2)和(3),直至樣本總誤差小于所設(shè)定的誤差閾值。
基寬參數(shù)由所選取的中心向量的最大距離確定,具體算法如下:
式中:D—中心向量之間的最大距離。
第二個(gè)階段是有監(jiān)督學(xué)習(xí),該階段訓(xùn)練隱含層到輸出層之間的權(quán)值。由于隱含層到輸出層為線性映射,所以訓(xùn)練連接權(quán)值W 是一個(gè)線性?xún)?yōu)化問(wèn)題,其解是唯一的,不存在局部極小值。連接權(quán)值的學(xué)習(xí)算法設(shè)計(jì)為:
式中:η—學(xué)習(xí)效率,為了保證學(xué)習(xí)算法的收斂性,通常取0<η<1;ud,u(l)—網(wǎng)絡(luò)的期望輸出與實(shí)際輸出。
當(dāng)樣本離中心向量較遠(yuǎn)時(shí),hj非常小,可以當(dāng)作0 處理。只有當(dāng)hj大于某一數(shù)值(如0.05)時(shí)才會(huì)對(duì)權(quán)值進(jìn)行相應(yīng)修改。因此隱含層節(jié)點(diǎn)向量H 中只有個(gè)別元素為1,其余為0,每次訓(xùn)練時(shí)只有少數(shù)幾個(gè)權(quán)值需要調(diào)整,從而保證了RBF 較快的學(xué)習(xí)速度。
對(duì)于圖1 所示的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其理想的輸出為:
式中:μl—逼近誤差,且 μl有界,即|μl|≤μ0。W*—理想的連接權(quán)值:
連接權(quán)值的魯棒更新算法設(shè)計(jì)如下:
式中:Γ=ΓT>0—自適應(yīng)增益矩陣;σ—大于零的常值,當(dāng)存在神經(jīng)網(wǎng)絡(luò)逼近誤差及外界干擾時(shí),σ—修正能夠提升自適應(yīng)控制器的魯棒性。
將式(28)代入式(9),可得:
將式(26)代入式(30),可得:
將式(10)代入式(31),可得:
在設(shè)計(jì)Lyapunov 函數(shù)時(shí)考慮包含滑模面與魯棒自適應(yīng)律,為了使自適應(yīng)律中不出現(xiàn)g(x)項(xiàng),將Lyapunov 函數(shù)中的項(xiàng)用代替,具體表達(dá)式如下:
對(duì)式(32)求導(dǎo),可得:
在式(34)中:
引理 1 對(duì)于半正定函數(shù) V 的不等式方程組V˙≤-αV+f,α 為任意常數(shù),在任意的t≥t0≥0 上的解為:
微分方程的解為:
又因?yàn)閷?duì)任意的 t≥t0≥0,有 φ(τ)≤0,即:
綜上,引理得證。
對(duì)于式(37),令 t0=0,根據(jù)引理 1 可得:
定義如下的初始緊集:
因?yàn)槌跏紶顟B(tài)必須包含在緊集Ω0里,所以控制器是局部穩(wěn)定的。這樣定義是合理的,因?yàn)橹挥性谝粋€(gè)緊集內(nèi),神經(jīng)網(wǎng)絡(luò)近似才是有效的[10]。
對(duì)于所有的x(0)∈Ω0,設(shè)計(jì)參數(shù)值的大小由如下表達(dá)式?jīng)Q定:
為了保證x∈Ω,?t≥0,選取控制器參數(shù)時(shí)應(yīng)滿(mǎn)足M≤M*,ε≤ε*
為了所設(shè)計(jì)控制律的有效性,仿真工況條件設(shè)置如下:分別給定三組初始誤差,加入等效攻角為(-1~1)deg 的隨機(jī)風(fēng)干擾,并對(duì)氣動(dòng)參數(shù)施加30%的攝動(dòng),采用所設(shè)計(jì)的控制律驗(yàn)證能否有效消除跟蹤誤差,實(shí)現(xiàn)軌跡精確跟蹤。模型中各參數(shù)的取值參考文獻(xiàn)[2],三種情景的具體參數(shù),如表1 所示。
表1 仿真條件Tab.1 Simulation Conditions
圖2 情景1 跟蹤誤差Fig.2 Tracking Errors of Case 1
圖3 情景2 的跟蹤誤差Fig.3 Tracking Errors of Case 2
圖4 情景3 跟蹤誤差Fig.4 Tracking Errors of Case 3
由圖2~圖4 可知,當(dāng)存在隨機(jī)干擾和參數(shù)攝動(dòng)的情況下,無(wú)論是給彈道傾角和高度狀態(tài)量的其中之一施加初始誤差,還是給兩者同時(shí)施加初始誤差,其都能有效消除跟蹤誤差,實(shí)現(xiàn)軌跡的精確跟蹤。同時(shí)在三種情景下,誤差曲線都較為光滑,說(shuō)明了引入RBF 神經(jīng)網(wǎng)絡(luò)可以有效削弱由滑??刂撇贿B續(xù)的開(kāi)關(guān)特性造成的抖振現(xiàn)象。為了驗(yàn)證所設(shè)計(jì)的控制律對(duì)不同初始誤差的適應(yīng)性,分別將高度誤差設(shè)置為[-50,50]m 內(nèi)的隨機(jī)值,將彈道傾角誤差設(shè)置為[-0.3,0.3]deg 內(nèi)的隨機(jī)值,進(jìn)行20 次蒙特卡洛仿真,仿真結(jié)果,如圖5 所示。由圖可知,該控制律在不同初始誤差組合下,都能夠有效消除誤差,實(shí)現(xiàn)對(duì)軌跡的精確跟蹤。
圖5 跟蹤誤差的蒙特卡洛仿真Fig.5 Tracking Errors of Monte Carlo Simulation
基于直接自適應(yīng)RBF 神經(jīng)網(wǎng)絡(luò)與滑模控制理論研究了存在隨機(jī)干擾和參數(shù)攝動(dòng)情況下的魯棒軌跡跟蹤問(wèn)題。
(1)采用物理實(shí)現(xiàn)較為簡(jiǎn)單的滑??刂撇呗钥朔朔蔷€性控制方法結(jié)構(gòu)復(fù)雜的問(wèn)題,通過(guò)RBF 神經(jīng)網(wǎng)絡(luò)自適應(yīng)逼近降低了切換增益。
(2)所設(shè)計(jì)的控制器具有較好的魯棒性,在隨機(jī)風(fēng)等效干擾攻角與參數(shù)攝動(dòng)的影響下,無(wú)論是給彈道傾角和高度狀態(tài)量的其中之一施加初始誤差,還是給兩者同時(shí)施加初始誤差,其都能有效消除跟蹤誤差,實(shí)現(xiàn)軌跡的精確跟蹤。