梁紅利,孟中杰
(西北工業(yè)大學(xué)航天學(xué)院,西安 710072)
在空間通信任務(wù)中,為保證天線有效傳輸信號(hào),帶有大型天線的通信衛(wèi)星需要保持姿態(tài)穩(wěn)定[1]。但是天線振動(dòng)與衛(wèi)星姿態(tài)運(yùn)動(dòng)緊密耦合,給衛(wèi)星姿態(tài)穩(wěn)定控制造成了極大的困難[2]。
文獻(xiàn)[3]將天線振動(dòng)視為外界干擾,通過(guò)狀態(tài)觀測(cè)器對(duì)擾動(dòng)進(jìn)行預(yù)估和前饋補(bǔ)償實(shí)現(xiàn)衛(wèi)星姿態(tài)穩(wěn)定。文獻(xiàn)[4]采用動(dòng)態(tài)補(bǔ)償器抵消天線振動(dòng)帶來(lái)的未知干擾,設(shè)計(jì)了一種基于輸出反饋的多目標(biāo)魯棒極點(diǎn)配置方法。文獻(xiàn)[5]將天線振動(dòng)視為外界干擾,利用變結(jié)構(gòu)控制對(duì)擾動(dòng)不敏感的優(yōu)點(diǎn)實(shí)現(xiàn)姿態(tài)穩(wěn)定。以上方法均有效削弱了天線振動(dòng)對(duì)姿態(tài)的影響,但是沒有兼顧控制性能的需求。
最優(yōu)控制能夠兼顧響應(yīng)快、超調(diào)小、抗干擾能力強(qiáng)、控制輸入能量少等多種性能需求,實(shí)現(xiàn)衛(wèi)星姿態(tài)穩(wěn)定[6]。文獻(xiàn)[7]采用動(dòng)態(tài)規(guī)劃求解衛(wèi)星單軸姿態(tài)最優(yōu)穩(wěn)定控制問(wèn)題。文獻(xiàn)[8]融合動(dòng)態(tài)規(guī)劃、自適應(yīng)控制和強(qiáng)化學(xué)習(xí),解決了衛(wèi)星姿態(tài)最優(yōu)穩(wěn)定控制問(wèn)題??紤]外界干擾和系統(tǒng)不確定性,文獻(xiàn)[9]設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)算法估計(jì)外界干擾,構(gòu)建性能指標(biāo)函數(shù)實(shí)現(xiàn)最優(yōu)控制。文獻(xiàn)[10]基于干擾估計(jì)建立非線性擾動(dòng)的上界函數(shù),設(shè)計(jì)了基于神經(jīng)網(wǎng)絡(luò)的最優(yōu)控制方法??紤]外界干擾引起系統(tǒng)不確定性,文獻(xiàn)[11]基于神經(jīng)網(wǎng)絡(luò)模型建立性能指標(biāo)函數(shù)并求解哈密頓-雅各比-貝爾曼(Hamilton Jacobi Bellman,HJB)方程實(shí)現(xiàn)最優(yōu)控制。以上方法都通過(guò)構(gòu)建基于干擾估計(jì)的性能指標(biāo)函數(shù)實(shí)現(xiàn)最優(yōu)控制,但需要假設(shè)外界干擾滿足與控制輸入相關(guān)的匹配條件。文獻(xiàn)[12]針對(duì)具有非匹配干擾的非線性不確定系統(tǒng),設(shè)計(jì)了基于干擾觀測(cè)器的最優(yōu)滑??刂品椒?。文獻(xiàn)[13]設(shè)計(jì)非線性觀測(cè)器在線估計(jì)非匹配干擾,提出一種魯棒最優(yōu)滑??刂品椒āN墨I(xiàn)[14]針對(duì)具有非匹配擾動(dòng)的非線性不確定系統(tǒng),設(shè)計(jì)了基于干擾估計(jì)的最優(yōu)保性能滑??刂品椒ā_@些方法不需要假設(shè)外界干擾滿足匹配條件,但是需要提前預(yù)知干擾的上界信息。
帶有大型天線的衛(wèi)星在軌運(yùn)行時(shí)會(huì)受熱環(huán)境干擾。尤其當(dāng)它進(jìn)出地球軌道陰影區(qū)時(shí),環(huán)境溫度劇烈變化使天線產(chǎn)生熱變形與熱應(yīng)力并激發(fā)熱振動(dòng),這會(huì)給衛(wèi)星姿態(tài)控制系統(tǒng)帶來(lái)上界未知的非匹配干擾[15-18]。針對(duì)上述難題,本文重點(diǎn)考慮外界干擾的未知非匹配特性,設(shè)計(jì)一種基于滑模面的自適應(yīng)近似最優(yōu)控制方法,實(shí)現(xiàn)熱環(huán)境影響下帶大型天線衛(wèi)星的姿態(tài)穩(wěn)定控制。
本文的研究對(duì)象是由3顆衛(wèi)星和2個(gè)大型桁架式的天線組合而成的天線衛(wèi)星系統(tǒng)。由于天線具有類似于梁的動(dòng)力學(xué)特性,基于能量互等原理[1]可將天線等效為連續(xù)梁,將衛(wèi)星視為剛體。此時(shí),系統(tǒng)可簡(jiǎn)化為“剛體—撓性梁”模型[19-20],如圖1所示。
圖1 帶大型天線衛(wèi)星的簡(jiǎn)化模型Fig.1 Simplified model of the satellite with large antenna
設(shè)oxyz為慣性系,原點(diǎn)o位于中心剛體質(zhì)心,ox軸指向初始時(shí)刻梁的伸展方向,oy軸垂直于初始時(shí)刻梁的伸展方向,oz軸按右手定則確定。ox1y1z1為梁上的浮動(dòng)坐標(biāo)系,原點(diǎn)o位于中心剛體與梁的連接點(diǎn),ox1軸指向梁的伸展方向,oy1軸垂直于梁的伸展方向,oz1軸按右手定則確定。為了便于建立系統(tǒng)動(dòng)力學(xué)模型,提出以下4個(gè)假設(shè)。
假設(shè)1.忽略軌道運(yùn)動(dòng),將兩端衛(wèi)星視為剛體,以中心衛(wèi)星姿態(tài)代表系統(tǒng)整體姿態(tài)[1]。
假設(shè)2.圍繞oz軸的偏航運(yùn)動(dòng)和圍繞ox軸的滾轉(zhuǎn)運(yùn)動(dòng)耦合不明顯,忽略耦合作用,重點(diǎn)研究偏航運(yùn)動(dòng)[2,21]。
假設(shè)3.由于梁的彎曲剛度遠(yuǎn)小于軸向剛度和扭轉(zhuǎn)剛度,重點(diǎn)研究彎曲運(yùn)動(dòng)[19]。
假設(shè)4.由于系統(tǒng)為對(duì)稱構(gòu)型,建模與分析時(shí)只考慮右半部分[19,22]。
假設(shè)右側(cè)衛(wèi)星控制力為fc(t),中心衛(wèi)星控制力矩為2T(t),右側(cè)等效梁的熱應(yīng)力為dc(x1,t)。梁的長(zhǎng)度、線密度和抗彎剛度分別為l0,ρA和EI。梁橫向變形位移為w(x1,t),衛(wèi)星質(zhì)量為m,半徑為r0。中心衛(wèi)星轉(zhuǎn)動(dòng)慣量為2J,繞oz軸轉(zhuǎn)角為θ。等效梁上的任意點(diǎn)P在浮動(dòng)坐標(biāo)系的位置矢量為r1,它在慣性系的位置矢量為rg。浮動(dòng)坐標(biāo)系原點(diǎn)o在慣性系的位置矢量為ro。
在軌道熱環(huán)境影響下,溫度的劇烈變化會(huì)激發(fā)天線產(chǎn)生熱應(yīng)力與熱振動(dòng),給系統(tǒng)帶來(lái)未知干擾。參考文獻(xiàn)[15],考慮軌道熱環(huán)境影響,利用Hamilton變分法建立系統(tǒng)的剛?cè)狁詈蟿?dòng)力學(xué)模型。其姿態(tài)動(dòng)力學(xué)方程和撓性振動(dòng)方程分別為:
fcφ(l0)ηsinθ+s9χcosθ-χTs10η·
sinθ+T
(1)
(φ(l0))T+s11χ+s11χcosθ
(2)
聯(lián)立式(1)和(2),將撓性動(dòng)力學(xué)視為姿態(tài)動(dòng)力學(xué)的外界干擾,衛(wèi)星姿態(tài)動(dòng)力學(xué)模型為:
(3)
(4)
將式(3)整理為如下形式:
(5)
(6)
由于控制輸入矩陣和干擾輸入矩陣不相等,控制量u和干擾Δ(x)不匹配,該衛(wèi)星的姿態(tài)控制問(wèn)題是一個(gè)具有未知非匹配干擾和不確定性的非線性系統(tǒng)控制問(wèn)題。
sTQs+uTPu)dτ
(7)
最優(yōu)性能指標(biāo)即為J(s)的極小值:
(8)
式中:ψ是容許控制集合。
根據(jù)Bellman最優(yōu)控制理論[17],最優(yōu)性能指標(biāo)J*(s)和最優(yōu)控制律u*(x)滿足HJB方程,求解HJB方程可得最優(yōu)控制律為:
(9)
但是非匹配干擾Δ(x)的上界α(t)未知和系統(tǒng)模型不確定,導(dǎo)致HJB方程不確定,無(wú)法直接獲得最優(yōu)解u*(x)。
針對(duì)上述姿態(tài)最優(yōu)控制問(wèn)題,本文設(shè)計(jì)一種基于滑模面的自適應(yīng)近似最優(yōu)控制方法。首先采用基于滑模面的單層評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)[17]逼近最優(yōu)性能指標(biāo)函數(shù),解決HJB方程求解困難的問(wèn)題;然后設(shè)計(jì)基于狀態(tài)觀測(cè)器的干擾估計(jì)算法在線估計(jì)非匹配干擾的上界α(t),解決未知非匹配干擾問(wèn)題;最后與滑??刂坡山Y(jié)合提高響應(yīng)速度??刂瓶驁D如圖2所示。
圖2 基于滑模面的自適應(yīng)近似最優(yōu)控制器Fig.2 Adaptive approximate optimal controller based on sliding mode surface
利用神經(jīng)網(wǎng)絡(luò)的萬(wàn)能逼近性,最優(yōu)性能指標(biāo)函數(shù)J*(s)可表示為
(10)
式中:W*∈Rm,σ(s)∈Rm和ε(s)分別為理想權(quán)重矢量、激活函數(shù)矢量和神經(jīng)網(wǎng)絡(luò)逼近誤差。m是隱含層神經(jīng)元個(gè)數(shù)。
J*(s)關(guān)于滑模變量s的偏導(dǎo)數(shù)為:
(11)
HJB方程可表示為:
(12)
由于沒有逼近誤差項(xiàng)ε(s)的信息,無(wú)法確定理想權(quán)重矢量W*。
(13)
(14)
HJB方程可表示為:
(15)
(16)
其中,εα范數(shù)有界,即||εα||≤εM,εM是未知非負(fù)常數(shù)。
(17)
(18)
式中:k1>0是學(xué)習(xí)率??梢钥闯?更新律(17)、(18)是一組嵌套更新律。
定理1.針對(duì)該衛(wèi)星系統(tǒng)的姿態(tài)最優(yōu)控制問(wèn)題,采用基于滑模面的單層評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)逼近HJB方程的最優(yōu)解,若網(wǎng)絡(luò)權(quán)重更新律為嵌套更新律(17)、(18),則權(quán)重矢量的逼近誤差動(dòng)力學(xué)漸近穩(wěn)定。
證.定義李雅普諾夫函數(shù)為
(19)
對(duì)式(19)求導(dǎo),再將嵌套更新律(17)、(18)代入,得:
(20)
式中:|·|為矩陣的1范數(shù)。
聯(lián)立式(14)和式(9),得到近似最優(yōu)控制律為
(21)
但是非匹配干擾上界α(t)未知,導(dǎo)致該近似最優(yōu)控制律無(wú)法獲得。
本節(jié)主要通過(guò)設(shè)計(jì)狀態(tài)觀測(cè)器估計(jì)非匹配干擾的上界α(t)。
(22)
(23)
式中:lη>0是學(xué)習(xí)率。
聯(lián)立式(22)和式(5),得到狀態(tài)觀測(cè)誤差系統(tǒng)為
(24)
由于α在線更新,根據(jù)式(7)可知,性能指標(biāo)函數(shù)J(s)可根據(jù)干擾實(shí)時(shí)在線更新。
為了加快響應(yīng)速度,引入滑??刂坡?設(shè)計(jì)基于滑模面的自適應(yīng)近似最優(yōu)控制律為:
(25)
(26)
定理2.針對(duì)系統(tǒng)(5),基于滑模面的自適應(yīng)近似最優(yōu)控制律(25)和魯棒項(xiàng)更新律(26)可以保證閉環(huán)系統(tǒng)(5)最終一致有界。
(27)
對(duì)上式求導(dǎo),再聯(lián)立式(5)、(25)和(26)得:
(28)
式中:0<||B(x)||≤Dg,Dg是未知正常數(shù);κ=||Λ||Dg;λmin(K1)是矩陣K1的最小特征值。
根據(jù)式(7)和式(5)可得:
(29)
聯(lián)立式(28)和式(29),得:
(30)
選擇控制參數(shù)K1,Q,P使得:
(31)
那么根據(jù)李雅普諾夫穩(wěn)定判據(jù)可知該系統(tǒng)的狀態(tài)最終一致有界。證畢。
為了驗(yàn)證設(shè)計(jì)方法的有效性,本節(jié)在典型應(yīng)用場(chǎng)景下同時(shí)利用兩種方法進(jìn)行仿真。1) 本文設(shè)計(jì)的方法;2) 基于自適應(yīng)動(dòng)態(tài)規(guī)劃的魯棒最優(yōu)滑模控制[23]。
dc(x,t)=Θ(x)β(t)
(32)
式中:函數(shù)Θ(x)反映了熱應(yīng)力沿天線軸線的分布情況;x是天線上的點(diǎn)沿軸線的位置坐標(biāo);函數(shù)β(t)反映了熱應(yīng)力隨時(shí)間的變化趨勢(shì)。文獻(xiàn)[18]采用有限元軟件模擬了天線在該溫度變化情況下函數(shù)Θ(x)和β(t)的變化情況,如圖3所示。
圖3 天線熱應(yīng)力的變化趨勢(shì)Fig.3 Changing trend of the antenna thermal stresses
在上述仿真場(chǎng)景下進(jìn)行仿真,系統(tǒng)仿真結(jié)果如圖4~7所示。
圖4 衛(wèi)星姿態(tài)運(yùn)動(dòng)Fig.4 Satellite attitude motion
圖4是衛(wèi)星姿態(tài)運(yùn)動(dòng)曲線,可以看出:兩種方法均可實(shí)現(xiàn)衛(wèi)星姿態(tài)穩(wěn)定,且穩(wěn)態(tài)誤差相當(dāng)。但是,利用本文方法,姿態(tài)角和角速度的收斂時(shí)間都明顯小于方法2,因此本文設(shè)計(jì)的方法具有更好的快速性。圖5是天線彈性振動(dòng)曲線,可以看出:利用本文方法,天線中間位置的振動(dòng)位移和末端的振動(dòng)位移都明顯小于方法2。但由于未對(duì)天線振動(dòng)實(shí)施主動(dòng)控制,天線殘余振動(dòng)主要依靠自身阻尼衰減。由于空間天線極小的振動(dòng)阻尼,殘余振動(dòng)衰減很慢。圖6是該系統(tǒng)的控制力與控制力矩曲線,可以看出:本文設(shè)計(jì)方法的控制力與力矩都小于方法2。說(shuō)明本文方法的控制輸入能量更少。同樣,由于天線的殘余振動(dòng),衛(wèi)星姿態(tài)仍受到一定影響。為保持衛(wèi)星姿態(tài),在仿真末端仍需要輸出一定的控制力與力矩,以抵消天線殘余振動(dòng)對(duì)姿態(tài)運(yùn)動(dòng)的干擾。圖7是性能指標(biāo)函數(shù)曲線,可以看出:本文方法的性能指標(biāo)函數(shù)值遠(yuǎn)小于方法2,由于性能指標(biāo)反映了外界未知非匹配干擾對(duì)姿態(tài)控制系統(tǒng)的影響,可知本文方法使外界未知非匹配干擾對(duì)姿態(tài)控制的影響更小,體現(xiàn)了更好的抗干擾能力。
圖5 天線彈性振動(dòng)Fig.5 Antenna flexible vibration
圖6 控制力與控制力矩Fig.6 Control force and control torque
圖7 性能指標(biāo)函數(shù)J(s)Fig.7 Performance index function J(s)
針對(duì)地球軌道熱環(huán)境下帶大型天線衛(wèi)星的姿態(tài)穩(wěn)定問(wèn)題,本文設(shè)計(jì)了一種基于滑模面的自適應(yīng)近似最優(yōu)控制方法。首先考慮外界未知非匹配干擾,構(gòu)造了基于干擾估計(jì)、具有在線更新能力的性能指標(biāo)函數(shù)。然后考慮系統(tǒng)不確定性,采用基于滑模面的單層評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)逼近HJB方程最優(yōu)解,并與滑??刂平Y(jié)合加快響應(yīng)速度。仿真結(jié)果表明:在衛(wèi)星從軌道陰影區(qū)向日照區(qū)運(yùn)行,溫度大幅變化的任務(wù)場(chǎng)景中,本文方法能以較少的控制能量更快速地實(shí)現(xiàn)衛(wèi)星的姿態(tài)穩(wěn)定控制。但由于天線阻尼較小且本文未對(duì)天線進(jìn)行主動(dòng)控制,在控制末期,天線仍然保持小幅振動(dòng),給衛(wèi)星姿態(tài)帶來(lái)一定影響,這也是下一步研究工作的重點(diǎn)。