陳志明,???,李磊,吳云華,華冰
南京航空航天大學(xué) 微小衛(wèi)星研究中心,南京 210016
近年來,隨著人工智能以及航空電子技術(shù)的快速發(fā)展,無人機(jī)控制技術(shù)獲得越來越多人的關(guān)注[1]。四旋翼無人機(jī)以體積小、控制方便等優(yōu)點(diǎn),在目標(biāo)搜索、環(huán)境監(jiān)測(cè)、以及森林防火等等方面得到了廣泛的研究與應(yīng)用[2-3]。與固定翼飛機(jī)相比,四旋翼無人機(jī)不僅具有垂直起降的優(yōu)點(diǎn),同時(shí)還可以在任意方向進(jìn)行大角度機(jī)動(dòng)且對(duì)起降場(chǎng)地要求較低。然而,四旋翼無人機(jī)具有非線性、欠驅(qū)動(dòng)、強(qiáng)耦合的特點(diǎn)[4-5],因此如何設(shè)計(jì)一個(gè)完善的飛控系統(tǒng)對(duì)其進(jìn)行控制,同時(shí)對(duì)期望的軌跡進(jìn)行跟蹤已成為一個(gè)具有挑戰(zhàn)性的研究領(lǐng)域。
針對(duì)無人機(jī)軌跡跟蹤與控制問題,先后很多研究學(xué)者提出了不同的方法,例如:比例-積分-微分(PID),線性二次型調(diào)節(jié)器(LQR),雙閉環(huán)軌跡跟蹤與控制方法等[6-8]。以上方法雖然在無人機(jī)的軌跡跟蹤與控制方面取得了很好的效果,但是當(dāng)無人機(jī)進(jìn)行大速度、大角度機(jī)動(dòng)時(shí)軌跡跟蹤誤差會(huì)明顯增大。另外,在文獻(xiàn)[9]中提出采用信號(hào)補(bǔ)償方法,以提高無人機(jī)在大機(jī)動(dòng)飛行情況下姿態(tài)控制性能,但是該方法將無人機(jī)滾轉(zhuǎn)和偏航通道簡(jiǎn)化為帶有特定干擾的單輸入-輸出的線性系統(tǒng),并未考慮無人機(jī)的俯仰通道和飛行過程中干擾的不確定性;文獻(xiàn)[10]提出采用變?cè)鲆?LQT)軌跡跟蹤控制方法,但是該方法以犧牲無人機(jī)軌跡跟蹤誤差為前提,來解決四旋翼無人機(jī)在大角度轉(zhuǎn)彎飛行時(shí)的能量消耗最優(yōu)的問題,其次該方法整個(gè)過程中采用離線計(jì)算,而無人機(jī)的飛行相對(duì)來說對(duì)實(shí)時(shí)性的要求較高;文獻(xiàn)[11]提出采用反饋線性化將無人機(jī)系統(tǒng)分解為位置控制和姿態(tài)控制的兩個(gè)全驅(qū)動(dòng)系統(tǒng),該方法優(yōu)點(diǎn)在于將四旋翼欠驅(qū)動(dòng)系統(tǒng)變?yōu)槿?qū)動(dòng)控制系統(tǒng),但是在獲取控制增益時(shí)依然采用LQR進(jìn)行離線計(jì)算;文獻(xiàn)[12]提出采用基于圖像的方法來解決移動(dòng)目標(biāo)的跟蹤問題,該方法設(shè)計(jì)了在沒有外界干擾情況下的有界自適應(yīng)平移控制器,但是該方法建立在特定的圖像特征情況下;文獻(xiàn)[13]采用統(tǒng)計(jì)增益調(diào)度方法提高無人機(jī)的控制性能,該方法以多元多項(xiàng)式作為變量調(diào)度機(jī)制來解決最近鄰法和雙線性插值法存在的缺點(diǎn);文獻(xiàn)[14]采用具有指令濾波的Backstepping方法完成無人機(jī)的軌跡跟蹤控制,通過建立含有二階濾波器四元數(shù)來獲得期望的角速度矢量;文獻(xiàn)[15]采用自適應(yīng)反步滑膜控制技術(shù)完成四旋翼無人機(jī)的姿態(tài)跟蹤控制,該方法雖然可以降低一階固定增益滑膜控制的震顫現(xiàn)象,但是對(duì)大角度的跟蹤效果并不理想;文獻(xiàn)[16-17]采用積分反步(IB)方法即在四旋翼無人機(jī)的姿態(tài)和位置控制中引入跟蹤誤差積分項(xiàng)來完成無人機(jī)軌跡跟蹤控制,雖然該方法可以有效降低跟蹤誤差,但是系統(tǒng)在跟蹤過程中抗干擾能力較差;文獻(xiàn)[18-19]采用在無人機(jī)進(jìn)行軌跡跟蹤控制時(shí),在位置控制中引入含有積分的狀態(tài)反饋控制器來確保迅速跟蹤參考軌跡,但是該方法在跟蹤開始時(shí)由于跟蹤誤差較大,無人機(jī)會(huì)產(chǎn)生嚴(yán)重的跟蹤抖動(dòng);文獻(xiàn)[20]提出采用基于區(qū)間矩陣的四旋翼無人機(jī)魯棒跟蹤控制,該方法在無人機(jī)的跟蹤過程中引入?yún)^(qū)間矩陣對(duì)內(nèi)外環(huán)系統(tǒng)的系統(tǒng)參數(shù)進(jìn)行描述,并設(shè)計(jì)相應(yīng)的魯棒H∞反饋控制策略來抑制有界外部擾動(dòng),但是該方法對(duì)引入的區(qū)間矩陣有嚴(yán)格的要求,適用性較差。關(guān)于神經(jīng)網(wǎng)絡(luò)在無人機(jī)控制的應(yīng)用中,比較典型的有文獻(xiàn)[21]采用經(jīng)典BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)算法在無人機(jī)建模和控制時(shí)對(duì)進(jìn)行數(shù)據(jù)進(jìn)行訓(xùn)練,但是并沒有對(duì)無人機(jī)的軌跡跟蹤進(jìn)行應(yīng)用和研究;文獻(xiàn)[22-23]采用神經(jīng)網(wǎng)絡(luò)對(duì)傳感器數(shù)據(jù)進(jìn)行迭代完成了無人機(jī)的姿態(tài)控制和懸??刂?,但是該方法對(duì)無人機(jī)進(jìn)行軌跡跟蹤控制并沒有進(jìn)行相應(yīng)的研究;文獻(xiàn)[24]通過將期望誤差引入神經(jīng)網(wǎng)絡(luò)進(jìn)行迭代建立了基于PID神經(jīng)網(wǎng)絡(luò)無人機(jī)控制方法,但是該方法在進(jìn)行仿真的時(shí)候?qū)ι窠?jīng)元迭代層數(shù)的要求較高計(jì)算效率低;文獻(xiàn)[25]將各無人機(jī)的信息進(jìn)行神經(jīng)元迭代設(shè)計(jì)了基于BP神經(jīng)網(wǎng)絡(luò)逆控制器,建立的相應(yīng)的無人機(jī)編隊(duì)控制方法。相比較于直接將神經(jīng)網(wǎng)絡(luò)應(yīng)用于無人機(jī)的控制和軌跡跟蹤研究則相對(duì)較少。
在無人機(jī)的軌跡跟蹤控制過程中如何讓系統(tǒng)具有良好的抗干擾性能,同時(shí)在較短的時(shí)間內(nèi)完成對(duì)期望軌跡的跟蹤是整個(gè)問題的重點(diǎn)。因此,本文結(jié)合Sigma-Pi神經(jīng)網(wǎng)絡(luò)和Backstepping,提出基于BSP-ANN的無人機(jī)軌跡跟蹤控制方法。該方法在Backstepping的基礎(chǔ)上通過引入Sigma-Pi神經(jīng)網(wǎng)絡(luò),既保證了軌跡跟蹤的跟蹤精度同時(shí)又可以提高系統(tǒng)的抗干擾性能。
在坐標(biāo)系定義之前,本文首先作以下假設(shè):
1) 四旋翼無人機(jī)為質(zhì)量不變且結(jié)構(gòu)對(duì)稱的剛體。
2) 四旋翼無人機(jī)的重心與體坐標(biāo)系的原點(diǎn)重合。
3) 重力加速度不隨高度的變化而變化。
為了描述四旋翼無人機(jī)的運(yùn)動(dòng)學(xué)關(guān)系,建立兩個(gè)右手坐標(biāo)系如圖1所示,即基于地球的慣性坐標(biāo)系SE和基于機(jī)體坐標(biāo)系SB。
圖中:[xeyeze]和[xbybzb]分別表示慣性坐標(biāo)系SE和機(jī)體坐標(biāo)系SB各軸正方向的單位向量,其中(Oe,xe)指向北方,(Oe,ye)指向東,(Oe,ze)指向地心的相反方向。(Ob,xb)指向前向電機(jī),(Ob,yb)指向左側(cè)電機(jī),(Ob,zb)滿足右手定則。F1、F2、F3和F4分別為4個(gè)電機(jī)產(chǎn)生的升力,T1、T2、T3和T4分別為4個(gè)電機(jī)產(chǎn)生的力矩。
圖1 四旋翼無人機(jī)參考坐標(biāo)系Fig.1 Reference frames for quadrotor UAV
如圖1所示,本文在建模的時(shí)候僅考慮四旋翼無人機(jī)在飛行過程中受到的重力Mg、旋翼拉力Fi以及氣動(dòng)阻力的作用。采用牛頓運(yùn)動(dòng)學(xué)定律推導(dǎo)可得,四旋翼無人機(jī)的運(yùn)動(dòng)學(xué)方程的表達(dá)式為
(1)
式中:m為四旋翼無人機(jī)質(zhì)量;g為重力加速度;φ、θ和ψ為歐拉角;fx、fy和fz為氣動(dòng)阻力;Ui(i=1,2,3,4)為四旋翼無人機(jī)的控制輸入;Ix、Iy和Iz為四旋翼無人機(jī)的轉(zhuǎn)動(dòng)慣量;ux、uy和uz的表達(dá)式分別為
ux=cosφsinθcosψ+sinφsinψ
(2)
uy=cosφsinθsinψ-sinφcosψ
(3)
uz=cosφcosθ
(4)
第1節(jié)給出了典型四旋翼無人機(jī)的運(yùn)動(dòng)學(xué)模型。在進(jìn)行軌跡跟蹤時(shí)與控制時(shí),本文結(jié)合Backstepping和Sigma-Pi 神經(jīng)網(wǎng)絡(luò)建立了基于(BSP-ANN)的控制方法。本文在引入Sigma-Pi 神經(jīng)網(wǎng)絡(luò)后,分別對(duì)四旋翼無人機(jī)的姿態(tài)控制率和位置控制率進(jìn)行設(shè)計(jì)。
基于BSP-ANN的四旋翼無人機(jī)姿態(tài)控制回路結(jié)構(gòu)如圖2 所示,由指令濾波模塊、反步控制模塊和Sigma-Pi神經(jīng)網(wǎng)絡(luò)模塊結(jié)構(gòu)組成Uang=[u2u3u4]T。
圖2 BSP-ANN姿態(tài)控制結(jié)構(gòu)Fig.2 Structure for BSP-ANN attitude control
在考慮四旋翼無人機(jī)的建模誤差以及外界擾動(dòng),結(jié)合式(1)將四旋翼無人機(jī)的運(yùn)動(dòng)學(xué)方程轉(zhuǎn)換成狀態(tài)空間下可得
(5)
本文采用單層Sigma-Pi神經(jīng)網(wǎng)絡(luò)補(bǔ)償誤差,神經(jīng)網(wǎng)絡(luò)補(bǔ)償值為
UANN=WTβ
(6)
式中:WT為權(quán)重系數(shù)矩陣;β為基函數(shù)向量,其定義為
β=kron[kron(C1,C2),C3]
(7)
在姿態(tài)控制中C1、C2、C3的定義分別為
(8)
式中:V為角加速度的偏差。
定義U*為某種最優(yōu)情況下的最優(yōu)神經(jīng)網(wǎng)絡(luò)補(bǔ)償值,則可得
U*=W*Tβ
(9)
(10)
(11)
本文以滾轉(zhuǎn)通道為例,設(shè)計(jì)滾轉(zhuǎn)通道的反步控制率和Sigma-Pi神經(jīng)網(wǎng)絡(luò)控制率并進(jìn)行穩(wěn)定性分析。
首先,定義四旋翼無人機(jī)的x1(φ)滾轉(zhuǎn)角跟蹤誤差為z1=x1d-x1。
(12)
(13)
z2=x2d-x2
(14)
定義關(guān)于z1、z2的Lyapunov函數(shù)為
(15)
對(duì)式(15)求一階偏導(dǎo)數(shù)可得
(16)
由式(1)、式(5)和式(16)可得
(17)
將式(29)代入式(28) 可得
(18)
α1>0,α2>0
(19)
(20)
將式(20)、式(19)代入式(18)可得
(21)
四旋翼無人機(jī)的位置控制外回路同樣采用基于BSP-AN的自適應(yīng)控制方法,其位置控制的結(jié)構(gòu)如圖3所示。
圖3 位置控制的結(jié)構(gòu)Fig.3 Structure for BSP-ANN position control
與姿態(tài)控制內(nèi)回路相比較,Sigma-Pi神經(jīng)網(wǎng)絡(luò)控制率的基函數(shù)為
β=kron[kron(Ca1,Ca2),Ca3]
(22)
位置控制中Ca1、Ca2、Ca3的定義為
(23)
式中:D為加速度偏差。
為了驗(yàn)證所提方法的有效性,本文將給出仿真實(shí)驗(yàn)來驗(yàn)證本文所提方法在提高跟蹤精度、縮短跟蹤時(shí)間和提高抗干擾能力方面的提升。
仿真實(shí)驗(yàn)中四旋翼無人機(jī)的初始位置、目標(biāo)曲線參數(shù)如表1所示,四旋翼無人機(jī)參數(shù)和控制參數(shù)如表2和表3所示,仿真結(jié)果分別如圖4和圖5所示。
表1 四旋翼無人機(jī)初始位置與期望軌跡Table 1 Initial position of quadrotor UAV and desired trajectory
表2 四旋翼無人機(jī)參數(shù)Table 2 Quadrotor UAV parameters
表3 算法參數(shù)配置Table 3 Algorithm parameter configuration
注:α3~α12為采用相同方法其他通道的控制參數(shù),γ*為對(duì)應(yīng)各自由度的神經(jīng)網(wǎng)絡(luò)系數(shù)。
圖4 BSP和BSP-ANN方法跟蹤結(jié)果Fig.4 Results of trajectory tracking with BSP and BSP-ANN method
圖4為采用文獻(xiàn)[26]中的方法(BSP方法)和本文提出的BSP-ANN方法對(duì)3D螺旋線跟蹤的結(jié)果。對(duì)比可以看出:采用本文提出的BSP-ANN對(duì)3D螺旋線跟蹤效果更好。
圖5(a)為四旋翼無人機(jī)軌跡跟蹤誤差曲線,可以看出:采用BSP-ANN方法的軌跡跟蹤誤差明顯較小。還可以看出,大約在10 s時(shí)四旋翼無人機(jī)在x、y、z3個(gè)方向上的跟蹤誤差都趨近于0,說明采用本文提出的BSP-ANN方法可明顯縮短跟蹤時(shí)間。
圖5(b)為四旋翼無人機(jī)的姿態(tài)角變化曲線。對(duì)比可以看出:在5 s之前,BSP-ANN方法的姿態(tài)角的抖動(dòng)明顯降低。其次,對(duì)比BSP方法在32 s左右時(shí),采用BSP-ANN方法的無人機(jī)姿態(tài)角變化規(guī)律平滑且沒有突變產(chǎn)生。
圖5 軌跡跟蹤誤差姿態(tài)角變化曲線Fig.5 Curves of trajectory tracking error and attitude angle
四旋翼無人機(jī)在飛行過程中總會(huì)受到外界各種的預(yù)想不到的干擾外力。因此,為了驗(yàn)證提出的BSP-ANN方法的抗干擾能力,在四旋翼無人機(jī)進(jìn)行軌跡跟蹤時(shí)加入干擾外力。因此,四旋翼無人機(jī)的線運(yùn)動(dòng)模型可以寫為
(24)
式中:disx、disy和disz分別為在x、y和z方向上的干擾外力。
在系統(tǒng)抗干擾測(cè)試仿真中將仿真結(jié)果與文獻(xiàn)[10]中的方法進(jìn)行對(duì)比。其中,四旋翼無人機(jī)的初始位置、目標(biāo)跟蹤曲線參數(shù)和干擾外力曲線如表4和圖6所示。
為了凸顯本文方法的有效性,將z軸方向上的變化周期縮短為文獻(xiàn)[10]中的1/2以增加四旋翼無人機(jī)在俯仰通道上的跟蹤難度。
在受持續(xù)干擾情況下采用BSP-ANN方法進(jìn)行仿真可得四旋翼無人機(jī)對(duì)期望軌跡的跟蹤效果、四旋翼無人機(jī)的姿態(tài)角曲線、跟蹤誤差曲線分別如圖7~圖8所示。
由圖8可以看出,整個(gè)仿真過程中分別在x、y和z方向上均加入大小不等的干擾外力。特別在5、10和15 s時(shí)干擾外力突然加劇。在此情況下,實(shí)現(xiàn)四旋翼無人機(jī)對(duì)期望軌跡的有效跟蹤。
表4 四旋翼無人機(jī)跟蹤期望軌跡的仿真參數(shù)Table 4 Tracking desired trajectory simulation parameters for quadrotor UAV
圖6 干擾外力曲線Fig.6 Curves of external disturbing force
圖7 x、y和z方向上軌跡跟蹤結(jié)果Fig.7 Results of trajectory tracking in x, y and z directions
圖8 無人機(jī)姿態(tài)角和跟蹤誤差曲線Fig.8 Curves of UAV attitude angle and tracking errors
圖7為四旋翼無人機(jī)在x、y、z各方向上對(duì)期望軌跡的跟蹤效果。通過結(jié)果可以看出,雖然減小了四旋翼無人機(jī)在俯仰曲線的周期,增加了跟蹤難度且提高了干擾外力,但是四旋翼無人機(jī)在5 s之前就可以順利完成對(duì)期望軌跡的有效跟蹤且保持良好的跟蹤效果。
圖8(a)為干擾外力作用下四旋翼無人機(jī)姿態(tài)角變化曲線。在相同坐標(biāo)范圍下與文獻(xiàn)[10]中的方法進(jìn)行對(duì)比可以看出,整個(gè)過程中在強(qiáng)干擾出現(xiàn)的情況下四旋翼無人機(jī)會(huì)出現(xiàn)短時(shí)的抖動(dòng),然后迅速恢復(fù)穩(wěn)定狀態(tài)。
圖8(b)為含有干擾外力的情況下四旋翼無人機(jī)軌跡跟蹤誤差曲線。在相同坐標(biāo)范圍下與文獻(xiàn)[10]進(jìn)行對(duì)比可以看出,在5 s之后四旋翼無人機(jī)的跟蹤誤差已經(jīng)接近于0,并且整個(gè)過程中在強(qiáng)干擾的情況下軌跡跟蹤誤差會(huì)出現(xiàn)的抖動(dòng)較小,并迅速趨近于0。
1) 將Sigma-Pi神經(jīng)網(wǎng)絡(luò)與Backstepping結(jié)合提出了基于BSP-ANN的四旋翼無人機(jī)軌跡跟蹤算法。
2) 設(shè)計(jì)Sigma-Pi神經(jīng)網(wǎng)絡(luò)控制率,并采用基于李雅普諾夫方法證明了其穩(wěn)定性。
3) Sigma-Pi神經(jīng)網(wǎng)絡(luò)的引入使得無人機(jī)軌跡跟蹤系統(tǒng)在跟蹤速度、軌跡跟蹤誤差、跟蹤時(shí)間以及系統(tǒng)的抗干擾能力都有了很大的提升。
4) 采用了典型的仿真例子并與其他文獻(xiàn)的結(jié)果進(jìn)行對(duì)比分析,驗(yàn)證了提出方法的有效性。
5) 設(shè)計(jì)了Sigma-Pi神經(jīng)網(wǎng)絡(luò)控制率并仿真驗(yàn)證了系統(tǒng)的抗干擾能力,具有很好的工程應(yīng)用前景。但是在移植工程應(yīng)用中可能存在建模誤差、神經(jīng)網(wǎng)絡(luò)控制率參數(shù)難以選取等問題,這也是論文下一步要做的工作。