張廣勇 楊小龍 付維賢
北京宇航系統(tǒng)工程研究所,北京 100076
?
基于神經(jīng)網(wǎng)絡(luò)的再入自適應(yīng)軌跡跟蹤方法
張廣勇 楊小龍 付維賢
北京宇航系統(tǒng)工程研究所,北京 100076
針對升力式再入飛行器的再入制導(dǎo)問題,根據(jù)設(shè)計得到的參考阻力加速度剖面,對動態(tài)逆阻力加速度跟蹤原理進行分析,利用單隱層神經(jīng)網(wǎng)絡(luò)良好的非線性逼近能力,采用在線神經(jīng)網(wǎng)絡(luò)對逆誤差進行補償,并考慮氣動參數(shù)偏差情況下的跟蹤效果進行對比。針對參考阻力加速度變化劇烈而導(dǎo)致控制輸入飽和的問題,本文引入PCH(Pseudo-control Hedging)思想,通過修正參考模型把參考信號限制在控制輸入可實現(xiàn)的范圍之內(nèi)。仿真結(jié)果表明,該方法跟蹤精度較高,可一定程度上緩解控制輸入飽和。
再入制導(dǎo);阻力加速度;神經(jīng)網(wǎng)絡(luò);PCH
升力式再入飛行器再入制導(dǎo)分為縱向制導(dǎo)和側(cè)向制導(dǎo)2個部分[1]。其中縱向制導(dǎo)主要通過航程預(yù)測來生成參考阻力加速度剖面,并通過跟蹤參考阻力加速度得到控制量,阻力加速度的跟蹤精度決定了飛行器的縱向制導(dǎo)精度。阻力加速度狀態(tài)方程是一個強非線性的快時變系統(tǒng),采用動態(tài)逆方法[2]設(shè)計跟蹤控制律,可以跟蹤參考阻力加速度得到傾側(cè)角指令,且控制律對于環(huán)境參數(shù)變化有一定的自適應(yīng)性,但是存在2個問題:1)魯棒性較差,由于飛行參數(shù)的未知偏差以及不可預(yù)知的外部干擾,使跟蹤效果變差;2)由于飛行器建模本身會存在誤差,動態(tài)逆方法對模型的精確性依賴較強,逆誤差會導(dǎo)致跟蹤精度不高。
為了彌補上述不足,文獻[3]考慮了常規(guī)的PID補償,并分析了各型干擾下的跟蹤誤差,大幅提升了跟蹤精度,但在文中提到了輸入飽和導(dǎo)致跟蹤誤差的問題。文獻[4-5]均采用神經(jīng)網(wǎng)絡(luò)對逆誤差進行補償,仿真結(jié)果表明該方法跟蹤誤差較小,但其參考阻力加速度均較光滑,并未遇到文獻[3]中提到的問題。參考阻力加速度一般是離線設(shè)計或者在線規(guī)劃得到的,無論哪種方式均有可能出現(xiàn)參考阻力加速度劇烈變化的情況,所以在設(shè)計跟蹤控制律時必須考慮輸入飽和的問題。PCH[6-8](Pseudo-control Hedging)思想是根據(jù)輸入飽和狀態(tài)修正參考模型使指令信號適應(yīng)控制輸入約束,達到緩解輸入飽和的目的。
本文在基于動態(tài)逆阻力加速度跟蹤的基礎(chǔ)上,引入神經(jīng)網(wǎng)絡(luò)對動態(tài)逆誤差進行補償,并通過在線更新神經(jīng)網(wǎng)絡(luò)權(quán)值的方法來確保其動態(tài)補償效果,最后采用PCH方法通過修正參考模型來防止控制機構(gòu)進入飽和狀態(tài)。仿真結(jié)果表明,基于神經(jīng)網(wǎng)絡(luò)的阻力加速度跟蹤方法跟蹤精度較高,魯棒性能較好,PCH方案在一定程度上緩解了控制輸入飽和問題。
再入過程中,假設(shè)地球為圓球形,飛行器為剛體,僅受升力、阻力和重力的作用,飛行器運動方程組可表示為[9]
(1)
式中:r是飛行器地心徑向距離,r=R0+h,h是飛行器當(dāng)前高度,R0是地球平均半徑;θ和φ分別是飛行器當(dāng)前的經(jīng)度、緯度;V是當(dāng)前的速度;γ表示彈道傾角,ψ是航跡偏角;L和D分別是飛行器的升力加速度和阻力加速度;α和σ分別是攻角和傾側(cè)角,作為控制輸入量。
升力加速度和阻力加速度的表達式如下
(2)
(3)
再入過程中射程的變化率為
(4)
由式(1)可得
(5)
再入初期,由于飛行器的速度較大,速度傾角較小,故可認(rèn)為γ為小量,有cosγ≈1,sinγ≈0,則
(6)
由式(6)可知,根據(jù)指定的射程要求,同時考慮再入過程中的熱流、動壓、過載、平衡滑翔等約束條件,可以在線給出參考的阻力加速度剖面,跟蹤阻力加速度即可實現(xiàn)對射程的精確控制。
對式(3)求二階導(dǎo)數(shù)
(7)
(8)
由式(1)可得
(9)
(10)
整理得
(11)
其中
一般攻角α是根據(jù)飛行任務(wù)和再入約束事先給定的,因此控制量只有傾側(cè)角σ。也可以將攻角α和側(cè)滑角σ同時作為控制量進行協(xié)同控制,本文不對這種方法進行研究。考慮到建模過程中各項誤差的存在,式(11)更準(zhǔn)確的表達式應(yīng)該為
(12)
圖1 基于神經(jīng)網(wǎng)絡(luò)的動態(tài)逆控制結(jié)構(gòu)圖
根據(jù)動態(tài)逆控制原理,對式(11)的控制律可取為
u=b-1(υ-a)
(13)
其中,υ為偽控制量,代表系統(tǒng)期望的動態(tài)響應(yīng),與狀態(tài)量之間有如下關(guān)系
(14)
υ=υc+υk-υad
(15)
(16)
圖2 參考模型結(jié)構(gòu)圖
(17)
通過合理選擇系數(shù)Kp,Kd,使矩陣A成為Hurwitz矩陣。理想情況下,若自適應(yīng)項能夠完全補償逆誤差,則系統(tǒng)跟蹤誤差以指數(shù)收斂于0。
單隱層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖如圖3所示。隱含層激勵函數(shù)選擇Sigmoid函數(shù):
(18)
其中,W和V是相應(yīng)維數(shù)的權(quán)值矩陣。
圖3 單隱層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
定義矩陣Z和誤差向量
其中,P為Lyapunov方程ATP+PA=-2I的正定解。選擇魯棒項為
(19)
為保證神經(jīng)網(wǎng)絡(luò)的實時控制特性,文獻[8]采用在線更新神經(jīng)網(wǎng)絡(luò)權(quán)值方法,權(quán)值更新規(guī)則如下
(20)
PCH的概念最早是由Johnson提出的,旨在對于由控制機構(gòu)位置限幅、速率限幅以及線性輸入動態(tài)等輸入特性引起的參考模型的不適應(yīng)性進行修正來抑制或消除控制機構(gòu)的飽和問題。PCH的一個優(yōu)勢是可使動態(tài)逆系統(tǒng)的相對階降低一階。動態(tài)逆方法可以對系統(tǒng)求逆,但是無法對以舵機為代表的輸入特性求逆,PCH相當(dāng)于給系統(tǒng)提供了一個額外的逆回路。
PCH方法的原理如下。對于動態(tài)系統(tǒng)動態(tài)逆控制律如下
δcomm=b-1(v-a)
得
其中v為偽控制量。
(21)
最終,可得PCH輸出信號
(22)
該信號作為補償信號反饋到參考模型中,則參考模型輸出的指令信號變成
由上式可以發(fā)現(xiàn),當(dāng)控制指令在可實現(xiàn)范圍內(nèi)時,即vh=0,參考模型的輸出會按照指定的動態(tài)性能跟蹤指令信號;當(dāng)控制指令超出可實現(xiàn)的范圍時,通過PCH補償可以對參考模型輸出進行調(diào)整,將其控制在可實現(xiàn)的范圍內(nèi)。
以X-33飛行器為對象進行再入制導(dǎo)仿真,以驗證所研究方法的有效性。本文對僅含有PD補償方案、含有PD和神經(jīng)網(wǎng)絡(luò)補償方案以及含有PD、神經(jīng)網(wǎng)絡(luò)和PCH控制方案3種情況進行仿真。初始條件如下[r,θ,φ,V,ψ,γ]=[65km,0°,0°,6000m/s,0°,0°]。
式中,αmax,αmaxL/D分別為最大攻角和最大升阻比攻角;V0,Vf分別為再入點和滑翔段終點的速度;Va1,Va2為設(shè)計參數(shù),由熱約束與機動性權(quán)衡給出,文中選擇Va1=5000m/s,Va2=3500m/s。
參考阻力加速度曲線如圖4所示,其中細(xì)實線分別為動壓、熱流、過載和準(zhǔn)平衡滑翔約束邊界,粗實線為參考阻力加速度。容易看出,參考阻力加速度在3000m/s處有突變,此突變作用是驗證PCH控制律的有效性。PD控制器的增益系數(shù)取為Kp=0.1,Kd=0.5。
圖4 參考阻力加速度曲線
不考慮氣動偏差時仿真曲線如圖5~7所示。圖5為阻力加速度跟蹤誤差曲線1(Dm-D),圖6為阻力加速度跟蹤誤差曲線2(Dr-D),圖7為相應(yīng)的傾側(cè)角變化曲線。可以看出,加入神經(jīng)網(wǎng)絡(luò)補償后,跟蹤誤差明顯減小,但是在3000m/s處誤差突然增大導(dǎo)致控制輸入飽和,這是由于參考阻力加速度的突變造成的。加入PCH控制方案后圖5中跟蹤誤差一直保持較小,圖6中的跟蹤誤差變大,由于PCH在一定程度上修正參考模型的輸出信號適應(yīng)了控制輸入的實際控制能力,但這是以犧牲跟蹤精度為代價來換取控制機構(gòu)的有效性和系統(tǒng)的穩(wěn)定性。需要說明的是,本文考慮了初始誤差,仿真結(jié)果也表明了所研究的方法收斂速度較快。
圖6 阻力加速度跟蹤誤差曲線2
圖7 傾側(cè)角變化曲線
考慮氣動參數(shù)40%的偏差,不考慮大氣密度偏差的影響,仿真曲線如圖9~10所示。其中圖8為氣動參數(shù)偏差情況下阻力加速度跟蹤誤差曲線1(Dm-D),圖9為氣動參數(shù)偏差情況下阻力加速度跟蹤誤差曲線2(Dr-D),圖10為氣動參數(shù)偏差下相應(yīng)的傾側(cè)角變化曲線。
圖8 氣動參數(shù)偏差下阻力加速度跟蹤誤差曲線1
圖9 氣動參數(shù)偏差下阻力加速度跟蹤誤差曲線2
圖10 氣動參數(shù)偏差下傾側(cè)角變化曲線
研究了升力式再入飛行器的再入制導(dǎo)問題,針對動態(tài)逆方法依賴精確模型的問題,研究了基于神經(jīng)網(wǎng)絡(luò)的動態(tài)逆控制結(jié)構(gòu),利用神經(jīng)網(wǎng)絡(luò)對非線性函數(shù)的逼近能力和相應(yīng)的控制律,實現(xiàn)了對參考阻力加速度的跟蹤。針對參考阻力加速度劇烈變化而導(dǎo)致的控制輸入飽和問題,本文引入了PCH控制方法。通過對X-33再入飛行器的阻力加速度跟蹤制導(dǎo)仿真計算,結(jié)果表明本文所研究方法跟蹤精度較高,PCH方案在一定程度上緩解了控制輸入飽和問題。對于文中所提到的傾側(cè)角出現(xiàn)高頻振蕩的問題,在后續(xù)的研究中需要更多關(guān)注神經(jīng)網(wǎng)絡(luò)輸入項的選擇。
[1] 趙漢元.再入飛行器動力學(xué)和制導(dǎo)[M].長沙:國防科技大學(xué)出版社,1997.(Zhao H Y. Dynamics and Guidance of Reentry Vehicle[M]. Changsha: National University of Defense Technology Press,1997.)
[2] Hall C E, Leavitt J A, Chen D T, et al. Design and Evaluation of an Acceleration Guidance Algorithm for Entry [J]. Journal of Spacecraft and Rockets, 2004, 41(6): 986-996.
[3] Yang Xiao-long,Mease K D.Entry Guidance and Trajectory Tracking Error Analysis[J].Journal of Astronautics, 2004, 25(3): 283-288.
[4] 鄭總準(zhǔn),王永驥,等.基于FCMAC干擾觀測器的動態(tài)逆再入制導(dǎo)[J].華中科技大學(xué)學(xué)報(自然科學(xué)版),2010,38(1): 96-100.(Zheng Z Z, Wang Y J, et al. Dynamic Inversion Reentry Guidance Based on FCMAC Disturbance Observer for Lift Vehicle[J]. Journal of Huazhong University of Science & Technology (Natural Science Edition), 2010, 38(1): 96-100.)
[5] 吳浩,楊業(yè).基于RCMAC網(wǎng)絡(luò)的動態(tài)逆再入制導(dǎo)方法研究[J].空間控制技術(shù)與應(yīng)用,2011,37(4): 49-53.(Wu H, Yang Y. Dynamic Inversion Reentry Guidance Based on RCMAC Network[J]. Aerospace Control and Application,2011, 37(4): 49-53.)
[6] Johnson E N, Calise A J. Pseudo-control Hedging: A New Method for Adaptive Control [C]. Advances in Navigation, Guidance and Control Technology Workshop, 2000.
[7] Johnson E N,Calise A J,J.Eric Corban.Adaptive Guidance and Control For Autonomous Launch Vehicles [J].IEEE,2001,(6): 2669-2682.
[8] Johnson E N,Calise A J.Neural Network Adaptive Control of Systems with Input Saturation [C].Proceedings of the American Control Conference, Arlington, Virginia,June 25-27, 2001: 3527-3532.
[9] Lu P and Hanson J M.Entry Guidance for the X-33 Vehicle [J].Journal of Spacecraft and Rockets, 1998, 35(3): 342-349.
[10] Lewis F L, Yesidirek A, Liu K. Multilayer Neural-net Robot Controller with Guaranteed Tracking Performance [J].IEEE Transactions on Neural Networks, 1996, 7(2): 388-399.
An Adaptive Reentry Trajectory Tracking Method Based on Neural Network
ZHANG Guangyong YANG Xiaolong FU Weixian
Beijing Institute of Space System Engineering,Beijing 100076,China
Aimingatthereentryguidanceproblemofliftreentryvehicle,thedynamicinversiondragaccelerationtrackingtheoryisanalyzedrestingonareferencedragacceleration-velocityprofiledesignedinadvance.Then,bytakingadvantageofthenonlinearapproximationability,onlineneuralnetworkisintegratedinthedynamicinversionmethodtocompensatetheinversionerror.Thetrackingabilityiscontrastedwiththatinthesituationofaerodynamiccoefficientdeviation.Byconsideringtheinputsaturationcausedbyabruptvariationofreferencedragacceleration-velocityprofile,thepseudo-controlhedging(PCH)methodisresearchedinthepaper.ThePCHcanhedgethereferencesignaldowntoalevelthatisachievablebytheactuatordynamics.Thesimulationresultsshowthatthismethodcantrackthereferencesignalpreciselyandhedgetheinputsaturationonacertainextent.
Reentryguidance;Dragacceleration;Neuralnetwork;PCH
2013-07-30
張廣勇(1989-),男,河北邢臺人,碩士研究生,主要研究方向為制導(dǎo)與控制系統(tǒng)總體設(shè)計;楊小龍(1967-),男,山西陽泉人,主要研究方向為飛行器總體設(shè)計;付維賢(1960-),女,北京人,研究員,主要研究方向為飛行器總體設(shè)計、控制系統(tǒng)總體設(shè)計與仿真。
V448.235
A
1006-3242(2014)01-0073-06