柴 源,羅建軍,韓 楠,謝劍鋒
(1. 西北工業(yè)大學航天學院,西安 710072;2. 西北工業(yè)大學航天飛行動力學技術重點實驗室,西安 710072;3. 北京航天飛行控制中心,北京 100094)
近年來,航天器在軌服務受到世界各國的重視。服務航天器與失效航天器形成組合體后通過自身執(zhí)行機構可接管失效航天器姿軌控系統(tǒng),實現(xiàn)穩(wěn)定控制,失效航天器的接管控制作為一種急需的在軌服務受到廣泛關注[1-2]。由于目前在軌運行的多數(shù)航天器事先未進行可服務和可維修設計,無交會對接輔助設備,因此,采用傳統(tǒng)的交會對接方法進行接管控制存在困難。文獻[3]研究了空間機械臂的失效航天器姿態(tài)接管控制,但空間機械臂難以對失效航天器進行長周期姿態(tài)調整。文獻[4]研究了繩系空間機器人對非合作目標進行抓捕的問題,但是存在繩索被割斷的可能性。此外,針對不同任務定制相應的空間機械臂和繩系機器人,也需要消耗巨大的成本和時間。近年來,微小衛(wèi)星技術得益于微電子技術的進步而快速發(fā)展,具有發(fā)射成本低、研制周期短、可批量生產(chǎn)等優(yōu)勢。鳳凰計劃項目[5]和iboss系列任務[6]利用多顆微小衛(wèi)星來實現(xiàn)空間飛行器的部件再利用和新衛(wèi)星的在軌組裝,是微小衛(wèi)星應用的新方向。文獻[7]通過多顆納星協(xié)同,設計辨識和控制一體化方法,實現(xiàn)失效衛(wèi)星的低成本姿態(tài)接管控制。其中多顆微衛(wèi)星如何通過分布式協(xié)同來實現(xiàn)失效航天器的姿態(tài)接管和長期的姿軌協(xié)同控制,仍有很多理論和方法問題需要解決。
多顆微衛(wèi)星對失效航天器姿態(tài)接管控制問題的解決方案包括集中式控制和分布式控制等[8]。文獻[9]通過任務分配方法實現(xiàn)了多機器人的集中式控制,但是集中式控制依賴中央控制個體,容錯性差,更適合控制中心可靠的場合。分布式控制通過個體之間信息的交互實現(xiàn)運動行為的協(xié)同,具有靈活性好、容錯性高和容易拓展等優(yōu)勢。傳統(tǒng)的分布式協(xié)同控制[10-12]基于相對運動模型來設計控制器,更適合編隊、集群等空間任務;文獻[13]利用分布式控制分配方法實現(xiàn)空間細胞機器人的姿態(tài)接管,但是頻繁不斷進行的控制分配增加了機器人計算負擔。
微分博弈方法研究了多個參與者的最優(yōu)決策與控制問題,其中每個個體通過優(yōu)化各自性能指標函數(shù)可得到各自的控制策略[14]。該方法可以視為一種特殊的分布式控制,其通信拓撲結構為可切換的全連通拓撲,允許個體的加入與退出,具有容錯性和靈活性。文獻[15]將微分博弈方法用于多智能體的一致性控制問題中;文獻[16]研究了在軌衛(wèi)星的追逃博弈問題;文獻[17]將二人非零和微分博弈方法用于航天器對接任務中。
本文將失效航天器姿態(tài)接管控制問題轉化為多顆微衛(wèi)星的微分博弈問題,從而通過微衛(wèi)星的自主決策實現(xiàn)分布式姿態(tài)接管控制。該問題的關鍵在于求解耦合的HJ(Hamilton-Jacobi)方程得到多顆微衛(wèi)星的納什均衡策略[18],但是由于HJ方程的非線性及耦合性,很難得到解析解。傳統(tǒng)的解法大多采用離線計算[19],近年來提出的基于策略迭代的求解算法,利用神經(jīng)網(wǎng)絡近似值函數(shù),但是權值的調整依賴于經(jīng)驗[20]。本文采用狀態(tài)相關黎卡提方程(State-dependent Riccati equation, SDRE)方法,引入狀態(tài)相關系數(shù)(State-dependent coefficient, SDC)矩陣[19-20]將非線性模型轉化為狀態(tài)相關線性模型,從而得到狀態(tài)相關線性二次型微分博弈[21],通過對耦合的狀態(tài)相關黎卡提方程組進行求解,得到微分博弈的納什均衡,從而得到微衛(wèi)星控制策略的閉環(huán)表達式。
為了實現(xiàn)對失效航天器的姿態(tài)接管控制,N顆微衛(wèi)星需要通過自身的執(zhí)行機構實現(xiàn)組合航天器的姿態(tài)穩(wěn)定,如圖1所示。本文采用基于SDRE的微分博弈方法進行姿態(tài)接管控制?;炯僭O如下:
1)微衛(wèi)星和失效航天器均為剛體。
2)微衛(wèi)星已貼附在失效航天器上,且在姿態(tài)穩(wěn)定過程中,各顆微衛(wèi)星的相對位置保持不變。
3)失效航天器的姿控系統(tǒng)完全失效,所需控制力矩僅由微衛(wèi)星提供。
4)微衛(wèi)星上安裝有三軸正交的反作用飛輪。
5)組合航天器的轉動慣量已辨識且保持不變。
圖1 微衛(wèi)星姿態(tài)接管控制示意圖
所涉及的坐標系定義如下:
1)微衛(wèi)星i(i∈N)本體坐標系Oixiyizi:Oi表示微衛(wèi)星i的質心,xi,yi,zi分別表示微衛(wèi)星i的三個慣量主軸,在三個慣量主軸上各安裝一個反作用飛輪。
2)參考坐標系Oxyz:用來描述每顆微衛(wèi)星的方位。選取微衛(wèi)星1的本體坐標系為參考坐標系,則其他微衛(wèi)星相對于微衛(wèi)星1的方位可由各自的本體坐標系與參考坐標系之間的轉換矩陣來描述。
假設微衛(wèi)星和失效航天器均為剛體,因此姿態(tài)接管控制過程,由N顆微衛(wèi)星和失效航天器形成的組合航天器的姿態(tài)運動可由剛體航天器的姿態(tài)運動學方程來描述。本文采用修正羅德里格斯參數(shù)(Modified Rodrigues parameters, MRPs)描述姿態(tài),以避免奇異。組合航天器的姿態(tài)運動學方程為[7]
(1)
式中:σ∈R3×1是以MRPs表示的組合航天器姿態(tài)角;ω∈R3×1為組合航天器的姿態(tài)角速度。M(σ)為可逆矩陣,有
(2)
式中:σ×=[0,-σ3,σ2;σ3,0,-σ1;-σ2,σ1,0];I3為3×3的單位對角陣。
組合航天器的姿態(tài)動力學方程為
(3)
式中:J∈R3×3是組合航天器在參考坐標系Oxyz中的轉動慣量矩陣;N是微衛(wèi)星的個數(shù);Cj∈R3×3是從微衛(wèi)星j的本體坐標系Ojxjyjzj到參考坐標系Oxyz的轉換矩陣,用來表示微衛(wèi)星j的方位[7];uj∈R3×1為微衛(wèi)星j在本體坐標系Ojxjyjzj的三軸姿態(tài)控制力矩;ω×=[0,-ω3,ω2;ω3,0,-ω1;-ω2,ω1,0]。
根據(jù)組合航天器的姿態(tài)運動學模型和姿態(tài)動力學模型,可得多顆微衛(wèi)星接管失效航天器姿態(tài)運動的微分博弈模型為
(4)
式中:x=[σT,ωT]T∈R6×1,且
(5a)
(5b)
式中:03為3×3的全0矩陣。
微衛(wèi)星的性能指標函數(shù)定義為
(6)
定義1.可行控制策略集[17]:若反饋控制策略ui(x)在緊集Ω上連續(xù),ui(0)=0,反饋控制策略集u(x)={u1(x),…,uN(x)}在Ω上能夠穩(wěn)定式(4),且式(6)對于任意的x0∈Ω是有限的,則u(x)在Ω上相對于式(6)定義為可行的,記作ui(x)∈Ψ(Ω)。
對于給定的可行控制策略,微衛(wèi)星的值函數(shù)可表示為
(7)
并滿足Vi(x)>0,Vi(0)=0且連續(xù)可微。
(8)
多顆微衛(wèi)星的微分博弈可以由下式來描述
(9)
微衛(wèi)星的值函數(shù)的微分等價形式為
(10)
定義哈密爾頓函數(shù)為
(11)
(12)
將式(12)代入式(10)中可以得到N個耦合的HJ方程
(13)
(14)
式中:A(x)=[03,M(σ);03,-J-1ω×J]∈R6×6是與狀態(tài)相關的狀態(tài)矩陣,且(A(x),Bj)滿足能控性秩判據(jù)。根據(jù)上述分析,將非線性微分博弈問題轉化為由式(14)和式(6)描述的狀態(tài)相關線性二次型微分博弈問題,能夠在保留了原模型的非線性特性的同時,使得微分博弈問題更加易于求解[19]。
針對狀態(tài)相關線性模型(14),獨立優(yōu)化每顆微衛(wèi)星的性能指標函數(shù)(6),可以得到每顆微衛(wèi)星的控制策略,實現(xiàn)失效航天器的姿態(tài)接管控制。
定理1. 對于狀態(tài)相關線性二次型微分博弈問題,在系統(tǒng)(A(x),Bi)完全能控的條件下,線性狀態(tài)反饋控制策略為
(15)
對稱正定矩陣Pi(x)∈R6×6為下面耦合狀態(tài)相關黎卡提方程組的解
(16)
證. 為了方便推導,在證明中將Pi(x)記為Pi,將A(x)記為A。
假設最優(yōu)值函數(shù)(9)在狀態(tài)x(t)下有線性二次型形式的解
(17)
則可得
(18)
忽略式(18)中的高階項,則微衛(wèi)星i(?j≠i)對應的反饋控制為
(19)
將其代入式(10)中可得
(20)
整理為二次型形式得
(21)
(22)
將其代入式(21)得
(23)
整理得
0=xT(Qi+PiA+ATPi-
(24)
由于存在下式關系
(25)
則可以得到
(26)
(27)
取i=1,2,…,N,可以得到耦合的狀態(tài)相關黎卡提方程組(16),對其求解可以得到矩陣Pi,從而得到狀態(tài)反饋控制策略(15)。
根據(jù)上述分析,系統(tǒng)模型可以表示為如下形式
(28)
(29)
式中:ψ(x)是高階展開項,且滿足
(30)
因此,在原點的鄰域內,常系數(shù)矩陣Acl(0)的穩(wěn)定,保證了系統(tǒng)的局部漸近穩(wěn)定性。
注1.要求系統(tǒng)完全能控是為了保證系統(tǒng)的穩(wěn)定性。由于控制區(qū)間為無限時域,若出現(xiàn)狀態(tài)不能控,無論采取任何控制策略,性能指標都會趨于無窮大。
注2.上述定理得到的狀態(tài)反饋控制律,在每一時刻更新狀態(tài)x(t),得到對應的狀態(tài)矩陣A(x),并通過求解耦合狀態(tài)相關黎卡提方程組(16)得到對稱正定矩陣Pi(x),在下一時刻重復上述過程,得到時變的狀態(tài)反饋調節(jié)器,能方便地實現(xiàn)閉環(huán)控制,這在工程應用中具有十分重要的意義。
對于耦合的狀態(tài)相關黎卡提方程組(16),要求在每一步求解耦合的代數(shù)黎卡提方程組。目前對于耦合代數(shù)黎卡提方程組的求解有很多研究成果[14,21],本文采用李雅普諾夫迭代法進行計算。該方法將耦合的代數(shù)黎卡提方程組降階并解耦為李雅普諾夫方程來獨立運算,算法速度快,準確性高。本文將文獻[21]中針對二人微分博弈得到的迭代算法進行歸納,給出一般性的李亞普諾夫迭代公式。
迭代算法:
k=0,1,2,…;i= 1,…,N
(31)
初值選擇:
(32)
通過迭代求解李亞普諾夫方程(31)可以得到狀態(tài)x(t)下的矩陣Pi(x)(i∈N)。
為了驗證對失效航天器姿態(tài)接管的SDRE微分博弈控制方法的有效性和容錯性,對組合航天器的姿態(tài)穩(wěn)定控制過程進行仿真研究。
假設采用三顆微衛(wèi)星對失效航天器進行姿態(tài)接管控制,微衛(wèi)星可提供的控制力矩滿足|u|≤0.25 N·m,其各自的本體坐標系到參考坐標系的轉換矩陣為
組合航天器的轉動慣量矩陣為
組合航天器以MRPs表示的初始姿態(tài)角為σ0=[0.015,0.009,0.013]T,初始姿態(tài)角速度為ω0=[0,0,0]T。取兩個微衛(wèi)星的權重矩陣分別為Q1=5I6,Q2=5I6,Q3=5I6,R11=R12=R13=0.01I3,R21=R22=R23=0.01I3,R31=R32=R33=0.01I3。取仿真步長為dt=0.01s。在上述參數(shù)下,仿真驗證SDRE微分博弈控制的有效性。
圖2和圖3是組合航天器分別以MRPs和歐拉角表示的姿態(tài)角變化曲線,圖4是組合航天器的姿態(tài)角速度變化曲線。從圖中可以看出,組合航天器在40 s到達穩(wěn)定狀態(tài),精度為1×10-5量級,在仿真結束時,可以達到更高的精度。因此,基于微分博弈的姿態(tài)控制器可以實現(xiàn)失效航天器的姿態(tài)穩(wěn)定。
圖2 姿態(tài)角σ曲線
圖3 姿態(tài)角歐拉角曲線
圖4 姿態(tài)角速度ω曲線
圖5是姿態(tài)接管控制階段三顆微衛(wèi)星的控制力矩隨時間變化曲線。在初始控制階段,由于狀態(tài)量幅值較大,因此所需的控制力矩也較大,隨著狀態(tài)量幅值的不斷減小,所需控制力矩也逐漸減小。
圖5 微衛(wèi)星控制力矩曲線
為了驗證該方法的容錯性,設計如下仿真場景。采用三顆微衛(wèi)星對失效航天器進行姿態(tài)接管控制時,微衛(wèi)星2在第6 s執(zhí)行機構失效,無法提供控制力矩,則前6 s姿態(tài)接管控制所需控制力矩由三顆微衛(wèi)星提供,在6 s之后僅由微衛(wèi)星1和微衛(wèi)星2提供。其他仿真參數(shù)與4.1節(jié)仿真參數(shù)相同。
圖6為以歐拉角表示的姿態(tài)角和角速度隨時間變化曲線,圖7為三顆微衛(wèi)星的控制力矩變化曲線。從圖6可以看出,在存在一顆微衛(wèi)星失效的情況,其他的微衛(wèi)星將失效微衛(wèi)星視為不參與,更新參與者個數(shù),解算控制力矩使組合航天器的狀態(tài)趨于穩(wěn)定。從圖7可以看出,前6 s的仿真結果和4.1節(jié)中前6 s的仿真結果一致。在第6 s,微衛(wèi)星3無法提供控制力矩,微衛(wèi)星1和微衛(wèi)星2在更新參與者個數(shù)后計算各自的控制力矩,因此在圖7中可以看到6 s時微衛(wèi)星1和微衛(wèi)星2的控制力矩會有突變。6 s之后的微衛(wèi)星3的控制力矩為0,微衛(wèi)星1和微衛(wèi)星2的控制力矩逐漸趨于0。仿真結果表明本文提出的微分博弈方法具有容錯性。
圖6 部分微衛(wèi)星失效的姿態(tài)角和角速度變化曲線
圖7 部分微衛(wèi)星失效的微衛(wèi)星控制力矩曲線
本文采用SDRE微分博弈方法研究了多顆微衛(wèi)星接管姿態(tài)控制系統(tǒng)失效的航天器的控制問題,通過引入SDC矩陣將多顆微衛(wèi)星的非線性微分博弈轉化為狀態(tài)相關線性二次型微分博弈。多顆微衛(wèi)星通過獨立優(yōu)化各自的性能指標函數(shù)得到各自的控制策略,實現(xiàn)了多顆微衛(wèi)星接管姿態(tài)控制失效的航天器的分布式控制。該方法在保留非線性特性的同時,通過推導得到耦合的狀態(tài)相關黎卡提方程組來逼近微分博弈的納什均衡并得到控制策略的閉環(huán)表達式,采用李亞普諾夫迭代法進行求解,簡化了納什均衡的求解過程。數(shù)值算例的結果表明,SDRE微分博弈方法可以實現(xiàn)多顆微衛(wèi)星對失效航天器的分布式姿態(tài)接管控制,具有較高的控制精度和容錯性。