李依彤 劉曉東 張惠平 王曉東
1.北京航天自動控制研究所,北京 100854
2.宇航智能控制技術(shù)國家級重點實驗室,北京 100854
3.中國運載火箭技術(shù)研究院,北京 100076
PID控制器以其結(jié)構(gòu)簡單易于實現(xiàn)的優(yōu)點被廣泛應用于各種實際工程中,飛行器姿態(tài)控制也不例外[1]。飛行器的控制參數(shù)設(shè)計通常是采用增益調(diào)度的方法:首先由設(shè)計人員針對不同的特征點設(shè)計出多組PID控制參數(shù),然后再將這些參數(shù)裝載于飛行器上,并按照一定的準則調(diào)度進行提取,實現(xiàn)控制參數(shù)的變化。這種方法對設(shè)計人員的經(jīng)驗能力有很高的要求,且設(shè)計繁瑣,耗費資源。因此迫切需要能夠自適應調(diào)整飛行器姿態(tài)控制的參數(shù)。
自適應控制被提出以來,各種控制方法層出不窮,而模型參考自適應是其中一個重要且發(fā)展較為成熟的分支[2]。模型參考自適應控制是以理想模型的輸出狀態(tài)為參照來調(diào)整自適應機構(gòu),進而使被控對象的輸出跟蹤理想模型輸出。另外這種控制方法能夠平緩系統(tǒng)過渡過程,降低系統(tǒng)響應超調(diào)量,降低控制量,在一定程度上減小了控制能量的浪費。近年來,得益于計算機技術(shù)的發(fā)展,模型參考自適應控制技術(shù)逐漸成熟,不僅能夠與其他控制技術(shù)相結(jié)合[3],在機械手臂控制[4-5]、電動汽車充電[6]和航空發(fā)動機[7]等領(lǐng)域都有相關(guān)研究和應用。
神經(jīng)網(wǎng)絡出現(xiàn)以來,就成為了各界學者的研究熱點,主要是因為其能夠通過學習逼近任意復雜的非線性關(guān)系,具有較強的容錯性和魯棒性,在某種程度上能夠處理系統(tǒng)的不確定性。在控制領(lǐng)域,神經(jīng)網(wǎng)絡的出現(xiàn)更加促進了自適應控制的發(fā)展。文獻[8]和文獻[9]均是用神經(jīng)網(wǎng)絡實現(xiàn)了對被控對象不確定性和擾動部分的逼近,并與傳統(tǒng)算法相結(jié)合。在飛行器姿態(tài)控制方向,雖然也有一些神經(jīng)網(wǎng)絡整定控制參數(shù)的相關(guān)研究[1,10],但大多是針對某一特征點進行設(shè)計,未將研究對象擴展到整個飛行段。
本文提出了一種基于模型參考自適應控制框架的神經(jīng)網(wǎng)絡PID姿態(tài)控制方法。神經(jīng)網(wǎng)絡選用了結(jié)構(gòu)簡單的BP神經(jīng)網(wǎng)絡,網(wǎng)絡輸入選擇能夠表征助推段飛行狀態(tài)的視速度和參考模型與被控對象輸出之差,對PID控制參數(shù)增益進行整定。引入視速度后可以提高控制器的適用范圍,從而實現(xiàn)全飛行包絡的自適應控制。為保證系統(tǒng)抗干擾性,加入了兩階線性擴張狀態(tài)觀測器(Extended State Observer,ESO),并對其進行了誤差分析,從理論上證明兩階LESO能夠較為準確的對系統(tǒng)狀態(tài)進行估計。最后以某導彈主動飛行段俯仰通道為研究對象進行仿真驗證,仿真結(jié)果表明本文的姿態(tài)控制方法能夠較好地實現(xiàn)姿態(tài)控制指令的跟蹤。
以某導彈主動飛行段俯仰通道為研究對象,該導彈俯仰與偏航通道采用擺動噴管進行姿態(tài)控制,滾轉(zhuǎn)通道采用空氣舵進行姿態(tài)控制,因此各通道可以獨立設(shè)計,建立其俯仰通道的小偏差線性化數(shù)學模型為
(1)
(2)
其中,Δθ為彈道傾角偏差,單位為rad;Δα為攻角偏差,單位為rad;Δφ為俯仰角偏差,單位為rad;Δδφ為俯仰通道姿控噴管擺角,單位為rad。c1f為俯仰通道與推力和升力有關(guān)的動力系數(shù),單位為1/s;c2f為俯仰通道重力系數(shù),單位為1/s;c3f為俯仰通道控制力系數(shù),單位為1/s;b1f為俯仰通道氣動阻尼力矩系數(shù),單位為1/s;b2f為俯仰通道氣動力矩系數(shù),單位為1/s2;b3f為俯仰通道控制力矩系數(shù),單位為1/s2。
(3)
在模型參考自適應控制框架的基礎(chǔ)上,系統(tǒng)控制框圖設(shè)計如圖1所示。俯仰角程序指令φcx同時作用于參考模型和原俯仰通道閉環(huán)控制系統(tǒng),輸出分別為φm和φ,二者之差為φe。BP神經(jīng)網(wǎng)絡輸入選擇φe、視速度WX1以及偏置值1(未在框圖中畫出)。在此條件下,通過訓練網(wǎng)絡實現(xiàn)PID控制參數(shù)的自適應調(diào)節(jié)。
圖1 模型參考自適應控制方案框圖
選用了三層BP神經(jīng)網(wǎng)絡,包含輸入層I,隱含層H和輸出層O,網(wǎng)絡結(jié)構(gòu)如圖2所示。
圖2 BP神經(jīng)網(wǎng)絡結(jié)構(gòu)
輸入層I的神經(jīng)元節(jié)點輸入與輸出相同,表示為:
(4)
式中:上標in和out分別指神經(jīng)元的輸入和輸出,k指當前時刻,M為輸入層神經(jīng)元的個數(shù)。顯然,本文中M取3。
隱含層H的輸入、輸出分別為:
(5)
(6)
式中:wih為輸入層和隱含層之間的網(wǎng)絡權(quán)重,N為隱含層神經(jīng)元的個數(shù);隱含層神經(jīng)元的激活函數(shù)一般選用關(guān)于原點正負對稱的Tan-Sigmoid函數(shù):
(7)
輸出層O的輸入、輸出分別為:
(8)
(9)
式中:who為隱含層和輸出層之間的網(wǎng)絡權(quán)重。神經(jīng)網(wǎng)絡輸出為PID參數(shù),也可以表示為:
(10)
(11)
(12)
PID參數(shù)的輸出系數(shù)為2.5、0.01和0.25。由于PID參數(shù)不能為負數(shù),因此輸出層神經(jīng)元的激活函數(shù)為非負的Log-Sigmoid函數(shù):
(13)
選取性能指標函數(shù)為:
(14)
式中:yd(k)為期望輸出,y(k)為實際輸出,取二者之差的平方作為網(wǎng)絡訓練的性能指標,訓練的最終目標是使J(k)收斂到最小值。采用最速下降法來對各層神經(jīng)網(wǎng)絡權(quán)重進行調(diào)制。訓練時,沿著性能指標減小的方向,從輸出層開始逐層向前進行修正。因此應計算J(k)對who的梯度,輸出層和隱含層之間的網(wǎng)絡權(quán)重的增量為:
(15)
式中:η3>0為學習速率,α3>0為動量因子,α3Δwho(k-1)為慣性項。上式表示網(wǎng)絡權(quán)重系數(shù)的修正和2部分有關(guān):1)當前時刻J(k)對who的梯度值;2)前一時刻權(quán)值更新的方向和幅度,這樣一定程度上增加了權(quán)值更新的慣性,使網(wǎng)絡訓練具有了一定的抗震蕩能力,同時也能加速網(wǎng)絡的收斂。
然后根據(jù)鏈式求導法則和誤差反向傳播算法即可求出神經(jīng)網(wǎng)絡權(quán)值更新率,文獻[2]中有詳細原理推導,在此不再贅述,最終得到輸出層和隱含層之間的權(quán)值更新率為:
(16)
(17)
隱含層到輸入層之間的權(quán)值更新率為:
(18)
(19)
式中,η2>0為學習速率,α2>0為慣性系數(shù)。
擴張狀態(tài)觀測器是自抗擾控制的核心組成部分,它將被控對象的輸入量和輸出量作為輸入,能夠?qū)?nèi)部不確定性和外部擾動擴張為新的變量估計出來,并實現(xiàn)對控制量的補償[11]。將非線性ESO簡化為LESO,降低了需要調(diào)整的參數(shù)的數(shù)量,因此也被推廣到實際工程應用中。圖3為加入LESO后的模型參考自適應控制方案框圖,圖中的觀測器為三階,若為兩階觀測器,則觀測器輸出為z1和z2,b的取值與系統(tǒng)特性有關(guān),此時b=b3f。那么補償后的控制量可以用式(20)表示:
圖3 加入LESO后的模型參考自適應控制方案框圖
δφ=uφ-ub
(20)
(21)
(22)
上式的擴張狀態(tài)觀測器可建立如下:
(23)
式中:z1和z2是LESO的輸出,z1是被控對象俯仰角速度的估計值,y1是被控對象俯仰角速度輸出值,z2是總干擾ξ的估計值。l1和l2是擴張狀態(tài)觀測器的增益值。
對式(23)進行拉式變換并整理可以分別得到由觀測器輸入u,y1到z1和z2的傳遞函數(shù):
(24)
式中,特征方程為Δ=s2+l1s+l2。
下面對LESO進行誤差分析,首先定義估計誤差為:
(25)
結(jié)合式(23)和(25),可以得到:
(26)
(27)
結(jié)合式(24)和(25),可以得到:
(28)
顯然觀測器的輸入u和y1必然是有界的,則可以得到觀測器的穩(wěn)態(tài)誤差為:
(29)
從理論上可以證明兩階的線性擴張狀態(tài)觀測器能夠較為準確的跟蹤系統(tǒng)狀態(tài)和干擾項。
分別按照圖1和3所示的控制方案,在MATLAB的Simulink工具箱中搭建控制系統(tǒng)框架進行仿真,仿真步長設(shè)置為5ms。參考模型選取如式(30)[2]:
(30)
BP神經(jīng)網(wǎng)絡選取3-10-3的結(jié)構(gòu),學習速率0.5,動量因子0.05,神經(jīng)網(wǎng)絡初值選取[-0.5,0.5]之間的隨機數(shù)。在導彈飛行過程中,其彈體模型在不斷變化,因此對式(3)中各個小偏差方程的系數(shù)按照時間做插值處理,即自變量為導彈飛行時間,因變量為各個小偏差系數(shù),具體變化范圍:b1f為0,b2f為[-0.439,-1.671],b3f為[28.045,101.093],b2f為負數(shù)說明導彈在此飛行過程中一直處于靜不穩(wěn)定狀態(tài)。導彈二級主動段飛行時間為35s,姿控噴管最大擺角為4.2°。在本文設(shè)計的控制方案下,BP神經(jīng)網(wǎng)絡根據(jù)網(wǎng)絡輸入進行權(quán)值更新,經(jīng)過多次前向計算和誤差反向傳播,最后獲得一組收斂的權(quán)值。仿真時,將收斂后的網(wǎng)絡權(quán)值送入網(wǎng)絡,進行一次前向計算得到仿真結(jié)果。
圖4和5中,導彈的俯仰角輸出曲線和俯仰角指令具有良好的一致性,剛開始跟蹤誤差較大,但很快誤差下降到0.5°以內(nèi),屬于可接受范圍。圖6是俯仰通道姿控噴管擺角曲線,在最大限幅以內(nèi)。圖7是PID控制參數(shù)自適應調(diào)整曲線,其參數(shù)變化規(guī)律和實際工程較為相似,并且由圖8的開環(huán)系統(tǒng)伯德圖和表1中的裕度統(tǒng)計可以看出,此時控制系統(tǒng)的相位裕度均大于30°,幅值裕度均大于4dB,滿足工程實際需求。
圖4 俯仰角指令跟蹤曲線
圖5 俯仰角跟蹤誤差曲線
圖6 噴管擺角曲線
圖7 控制參數(shù)曲線
圖8 開環(huán)系統(tǒng)伯德圖
表1 裕度統(tǒng)計表
為了進一步提高姿控系統(tǒng)在干擾條件下的魯棒性,按照式(23)搭建LESO,ω0取10rad/s,加入觀測器后的仿真結(jié)果如下:
在運行1s時分別加入外部常值干擾fd=2/57.3×1(t)和正弦變化干擾fd=2/57.3sin(0.2t),圖9是在加入干擾后不同情況下俯仰角誤差曲線的收斂情況??梢钥闯?,未加入擴張狀態(tài)觀測器之前,只在PID控制器的作用下,系統(tǒng)的抗干擾性能極差,無法抵抗外界擾動。加入LESO后,系統(tǒng)能夠快速抑制外界干擾帶來的影響,提高姿態(tài)控制系統(tǒng)的魯棒性,動態(tài)性能較好。并且通過對比加入兩階和加入三階觀測器的曲線可以發(fā)現(xiàn),在加入相同常值干擾的情況下,二者的俯仰角跟蹤誤差最大值分別為0.93°和0.68°,而加入相同正弦變化干擾時的跟蹤誤差最大值分別為0.21°和0.16°。兩階LESO更能夠減小擾動對姿態(tài)角跟蹤的影響,這是因為擴張狀態(tài)觀測的階數(shù)越高,相位滯后越嚴重,降低系統(tǒng)的快速性[13]。
圖9 不同情況下俯仰角的跟蹤誤差曲線
圖10~13是常值干擾下加入兩階LESO的仿真結(jié)果。在1s時加入常值干擾后,俯仰角會有突變,但在很短時間內(nèi)重新跟蹤俯仰角指令,俯仰角跟蹤誤差在0.5s內(nèi)快速收斂,并在±0.2°以內(nèi)浮動,觀測器輸出的干擾估計量與理論值會有一定偏差,但是俯仰角速度估計值與理論值一致性較好,能夠?qū)崿F(xiàn)較為準確的指令跟蹤。
圖10 常值干擾下加入兩階LESO的俯仰角指令跟蹤曲線
圖14~17是在正弦變化干擾后加入兩階LESO的仿真結(jié)果。在1s時加入正弦波變化的干擾,和加入常值干擾時類似,姿態(tài)角會產(chǎn)生突變但在很短時間內(nèi)重新跟蹤指令,在0.5s內(nèi)快速收斂,并在±0.3°的誤差以內(nèi)浮動,擴張狀態(tài)觀測器對姿態(tài)角速度的估計會受正弦波干擾的影響,但影響不大,同樣能夠?qū)崿F(xiàn)較為準確的指令跟蹤。
圖11 常值干擾下加入兩階LESO的噴管擺角曲線
圖12 常值干擾下兩階LESO的俯仰角速度估計曲線
圖13 常值干擾下兩階LESO的干擾項估計曲線
圖14 正弦干擾下加入兩階LESO俯仰角指令跟蹤曲線
圖15 正弦干擾下加入兩階LESO的噴管擺角曲線
圖16 正弦干擾下兩階LESO的俯仰角速度估計曲線
圖17 正弦干擾下兩階LESO的干擾項估計曲線
提出了一種基于模型參考自適應控制的神經(jīng)網(wǎng)絡姿態(tài)控制方法,并加入兩階線性擴張狀態(tài)觀測器,最終實現(xiàn)了姿態(tài)角指令的穩(wěn)定跟蹤。主要結(jié)論如下:
1) 將表征導彈飛行狀態(tài)的視速度加入神經(jīng)網(wǎng)絡輸入進行訓練,獲得的PID控制參數(shù)自適應調(diào)整規(guī)律和工程實際較為相近,實現(xiàn)了由計算機代替人工調(diào)參、提高了設(shè)計過程的智能化,且系統(tǒng)的開環(huán)傳遞函數(shù)的相角裕度均大于30°,幅值裕度均大于4dB,姿控噴管擺角未超出限制,滿足工程需求;
2) 在加入相同常值干擾的情況下,加入三階LESO和兩階LESO的俯仰角跟蹤誤差最大值分別為0.93°和0.68°,而加入相同正弦變化干擾時的跟蹤誤差最大值分別為0.21°和0.16°,兩階的觀測器更能夠降低外界擾動對系統(tǒng)的影響。而且無論是加入常值干擾還是正弦變化干擾,經(jīng)過兩階LESO的控制量補償,姿態(tài)角指令能夠在0.5s內(nèi)很快地重新跟蹤指令,實現(xiàn)了擾動的快速抑制,提高了系統(tǒng)的魯棒性能。