夏國鋒, 向鳳紅, 楊立煒
(昆明理工大學(xué)信息工程與自動化學(xué)院,昆明 650000)
板球系統(tǒng)是一個具有非線性、強(qiáng)耦合、參數(shù)不確定性和未知干涉的二維控制對象[1],幾乎包含了復(fù)雜系統(tǒng)的所有特征,是控制理論研究的理想實(shí)驗(yàn)平臺,優(yōu)化其控制算法可有效提高軌跡跟蹤的控制精度。經(jīng)典的板球控制算法都是基于PID進(jìn)行研究和改進(jìn)的,針對PID控制器參數(shù)的整定問題,常用的算法有臨界比例度法、模糊整定法、神經(jīng)網(wǎng)絡(luò)PID等。
為解決常規(guī)PID參數(shù)整定的不足之處,相關(guān)學(xué)者做了以下改進(jìn):文獻(xiàn)[2]提出了模糊PID控制器,雖然板球的動靜性能有所改善,但響應(yīng)速度慢和超調(diào)較大;文獻(xiàn)[3]提出Backstepping方法和H∞控制理論控制板球,跟蹤誤差較大;文獻(xiàn)[4]為解決RBF-PID算法響應(yīng)速度慢而引入加速率,但是系統(tǒng)跟蹤精度較差;文獻(xiàn)[5]設(shè)計嵌入式自適應(yīng)PID系統(tǒng),雖然能夠自整定參數(shù),但是小球在平板邊緣處滑出平板;文獻(xiàn)[6]為解決非線性系統(tǒng)不確定性和復(fù)雜性,將小波神經(jīng)網(wǎng)絡(luò)(WNN)辨識與PID控制器相結(jié)合,獲得了很好的辨識性能;文獻(xiàn)[7]為了抑制次同步共振(SSR),利用WNN自整定PID,獲得了很好的魯棒性;文獻(xiàn)[8]針對電機(jī)伺服系統(tǒng)非線性和不確定性,提出WNN控制器,獲得了良好的頻率響應(yīng)和跟蹤精度。
以上常規(guī)PID改進(jìn)策略存在控制響應(yīng)慢、穩(wěn)定性差和魯棒性差的問題,本文結(jié)合小波神經(jīng)網(wǎng)絡(luò)收斂快、穩(wěn)定性和魯棒性好等優(yōu)點(diǎn),首次提出了一種基于板球系統(tǒng)的WNN辨識和WNN-PID控制相結(jié)合的策略,該策略結(jié)合小波理論和BP神經(jīng)網(wǎng)絡(luò),基于動量梯度和AdaDec動態(tài)學(xué)習(xí)速率,更新權(quán)值參數(shù)尋最優(yōu)的PID參數(shù),實(shí)現(xiàn)了PID參數(shù)的自整定。
由于板球系統(tǒng)存在復(fù)雜非線性[1],為此,假設(shè)具有以下約束條件:1) 不考慮所有摩擦力的影響;2) 球與板之間沒有滑動和跳動(任何時刻小球r=ωR,r為小球速度,ω為球板角速度,R為球板中心到小球的距離(即小球半徑),滿足系統(tǒng)可積條件); 3) 任何情況下球與板都接觸;4) 球繞Z軸及其平行軸的旋轉(zhuǎn)忽略不計; 5) 平板質(zhì)量分布均勻?qū)ΨQ,板在X和Y方向關(guān)于中心點(diǎn)對稱,兩個軸機(jī)械條件相同。
板球系統(tǒng)二維結(jié)構(gòu)如圖1所示。
圖1 板球系統(tǒng)二維結(jié)構(gòu)Fig.1 Two-dimensional structure of ball and plate system
板球系統(tǒng)基于能量的拉格朗日方程[9]推導(dǎo),即
(1)
式中:T是拉格朗日參數(shù);q=(qX,qY,qθ,qβ)T,代表4個自由度方向的坐標(biāo);V為勢能;L為耗散函數(shù);u(t)為作用于系統(tǒng)的外力向量。根據(jù)歐拉—拉格朗日方程,可分別推導(dǎo)出X和Y方向、θ和β方向的平衡方程為
(2)
從式(2)可以求得板球的狀態(tài)方程為
(3)
(4)
一般情況下,小球運(yùn)動速度很低,θ,β很小[1,10-11],不超過6°[2,12]可做近似處理,sinθ≈θ,sinβ≈β[13],將系統(tǒng)分解成X方向和Y方向2個解耦后的子系統(tǒng),其模型可分別表示為
(5)
由Ib=0.4mR2,整理可得
(6)
經(jīng)分析,通過拉格朗日方程建立了由兩部分組成的板球系統(tǒng)模型,可得X方向和Y方向的獨(dú)立系統(tǒng)。
設(shè)計的WNN-PID控制器系統(tǒng)結(jié)構(gòu)如圖2所示。其中,rin表示輸入,yout表示輸出。
圖2 WNN控制方案的總體控制框圖Fig.2 Overall control block diagram of WNN control scheme
其中被控對象由PID直接對其控制,控制器的3個參數(shù)Kp,Ki,Kd由WNN整定,WNN辨識器對系統(tǒng)辨識,調(diào)整WNN的參數(shù)。
本文所設(shè)計的WNN-PID控制器采用3層結(jié)構(gòu),各層節(jié)點(diǎn)數(shù)為3-5-3,結(jié)構(gòu)如圖3所示,其中,m為輸入層節(jié)點(diǎn)數(shù),p為隱含層節(jié)點(diǎn)數(shù),n為輸出層節(jié)點(diǎn)數(shù)。
圖3 小波神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)Fig.3 Structure of wavelet neural network
隱含層的輸入為
(7)
隱含層輸出為
(8)
選擇小波基函數(shù)為
h(x)=cos(1.75x)e-x2/2
(9)
輸出層激勵函數(shù)
(10)
輸出層輸入算式為
(11)
則可得網(wǎng)絡(luò)的輸出為
(12)
式中:K=[KpKiKd]T;xi=[rin(k)yout(k)e(k)]T;yn(k)=rin(k),為小球目標(biāo)位置;y(k)=yout(k),為小球位置;e(k)為誤差;φl j為輸出層的第l個神經(jīng)元與隱含層第j個神經(jīng)元的連接權(quán)值;ωi j為隱含層的第j個神經(jīng)元與輸入層第i個神經(jīng)元的連接權(quán)值;θj為隱含層第j個神經(jīng)元的閾值;βl為輸出層第l個神經(jīng)元的閾值。
為了推導(dǎo)WNN的權(quán)值更新規(guī)律,利用核最小均方(Kernel Least Mean Square,KLMS)算法定義WNN的誤差函數(shù)指標(biāo)E(k)[14]為
E(k)=0.5(yn(k)-y(k))2。
(13)
應(yīng)用動量梯度下降法,得到權(quán)值的更新規(guī)律為
(14)
式中:η為學(xué)習(xí)速率,0<η<1;α為動量,0<α<1;
(15)
(16)
(17)
(18)
(19)
通過WNN與PID控制器相結(jié)合,實(shí)現(xiàn)對模型的跟蹤控制。增量式PID控制規(guī)律為
Δu(k)=(Kp+Ki+Kd)e(k)-(Kp+2Kd)e(k-1)+Kde(k-2)。
(20)
WNN辨識部分采用2-5-1結(jié)構(gòu),如圖4所示。
圖4 三層WNN辨識結(jié)構(gòu)Fig.4 Three-layer WNN identification structure
辨識部分的小波函數(shù)和WNN-PID所用一樣,其正向傳播算法如下所述。
隱含層輸入輸出
(21)
(22)
輸出層輸出
(23)
其中,xi=[u(k)y(k)]T。
定義誤差指標(biāo)函數(shù)為
(24)
其反向傳播權(quán)值調(diào)整算法為
(25)
式中:0<ηI<1,0<αI<1;
(26)
(27)
算法穩(wěn)定性分析如下。
取Lyapunov函數(shù)為
(28)
則
(29)
另外,令P=[wi jwjσjdj],則
(30)
所以
(31)
神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速率要求,剛開始初始學(xué)習(xí)速率η(0)較大;隨著學(xué)習(xí)次數(shù)的增加,η(k)逐漸減小直到網(wǎng)絡(luò)更新到最優(yōu)解。指數(shù)衰減學(xué)習(xí)公式為
η(k)=η(0)(10)-k/r0。
(32)
AdaDec[15]是基于AdaGrad的改進(jìn)形式,原理如下
p(k)=η(0)(1+k/r0)-s
(33)
G(k)=γf2(k-1)+f2(k)
(34)
(35)
其中:r0為常數(shù);p(k)為初始學(xué)習(xí)速率;G(k)為中間變量;s為無關(guān)常數(shù),通常取1或0.75;c=1,以確保學(xué)習(xí)速率有界;f(k)=?E(k)/?w(k),代表誤差函數(shù)對權(quán)值的導(dǎo)數(shù);γ為調(diào)整量。
根據(jù)系統(tǒng)性能指標(biāo)E(k),在反向傳播方向上調(diào)整隱含層和輸出層的權(quán)重系數(shù)。構(gòu)造Lyapunov函數(shù)
V(k)=0.5(yn(k)-y(k))2=0.5e2(k)
(36)
通過梯度下降法進(jìn)而可得
(37)
(38)
假設(shè)式(38)滿足以下條件:1) 0<η(k)<2;2)V(k)趨于V*;(3)g(0)=0。那么
(39)
如果z(k)是有界的,那么
(40)
定義V*=[v1v2v3]T=[KpKiKd]T,結(jié)合式(22)有
(41)
(42)
(43)
因此,可得
(44)
結(jié)合條件1)、式(39)和式(40)可知,ΔV(k)≤0,因此系統(tǒng)是穩(wěn)定的。
為了驗(yàn)證WNN-PID控制方案的可行性和有效性,本文引用文獻(xiàn)[16]中采用BP神經(jīng)網(wǎng)絡(luò)辨識和BP神經(jīng)網(wǎng)絡(luò)整定PID參數(shù)相結(jié)合(BP-PID)策略作為對比,分別對常規(guī)PID,BP-PID和所提策略進(jìn)行了仿真實(shí)驗(yàn)。
選取c=1,η(0)=0.2,s=1,γ=0.9,r0=6.6×108,α=0.01;ωi j,φl j,wj,wi j在[-1,1]隨機(jī)初始化,aj,bj,σj,dj在[0,1]隨機(jī)初始化。對單位階躍、正弦信號和圓形軌跡分別進(jìn)行跟蹤仿真。
圖5所示為單位階躍響應(yīng)曲線。
圖5 單位階躍響應(yīng)曲線Fig.5 Unit step response curve
由圖5 (a)可以看出,常規(guī)PID算法存在超調(diào)大、調(diào)節(jié)難、響應(yīng)慢的問題,相比于此,在超調(diào)和響應(yīng)速度指標(biāo)上,BP-PID策略更優(yōu);相比于BP-PID算法,本文所提策略幾乎沒有超調(diào),且穩(wěn)定性好,能快速跟蹤給定指令信號(Demand)。通過對比圖5(a)和圖5(b),在響應(yīng)速度和穩(wěn)定性方面,以動態(tài)學(xué)習(xí)速率訓(xùn)練神經(jīng)網(wǎng)絡(luò)的算法都優(yōu)于固定學(xué)習(xí)速率,進(jìn)一步可以看出所提策略具有更好的收斂性和魯棒性。
圖6所示為正弦跟蹤及誤差曲線。
圖6 正弦跟蹤曲線和誤差曲線Fig.6 Sinusoidal tracking curve and error curve
如圖6所示,在兩種PID控制器自整定的仿真結(jié)果中,輸出均能夠跟蹤輸入的變化。相較于此,常規(guī)PID和BP-PID在穩(wěn)定性和誤差上都不如WNN-PID控制策略。
圖7所示為WNN-PID正弦跟蹤誤差對比曲線。
圖7 WNN-PID正弦跟蹤誤差對比曲線Fig.7 Error comparison curve of WNN-PID sinusoidal tracking
由圖7可知,固定學(xué)習(xí)速率由于η固定,不能及時根據(jù)性能指標(biāo)函數(shù)調(diào)整大小,容易陷入局部最優(yōu),所以在穩(wěn)定性上不如動態(tài)學(xué)習(xí)速率。
圖8所示為WNN-PID圓形軌跡跟蹤。
圖8 WNN-PID圓形軌跡跟蹤Fig.8 WNN-PID circular trajectory tracking
由圖8的X和Y方向的圓形軌跡跟蹤可發(fā)現(xiàn),動態(tài)學(xué)習(xí)速率響應(yīng)和魯棒控制特性優(yōu)于固定學(xué)習(xí)速率。
本文針對板球系統(tǒng)非線性、PID控制效果差等問題,首次提出了WNN-PID控制策略應(yīng)用于板球系統(tǒng)。該策略利用WNN辨識板球系統(tǒng)模型,獲得Jacobian信息,然后利用辨識得到的?y(k)/?u(k)在線訓(xùn)練WNN辨識和WNN控制器的參數(shù),WNN進(jìn)一步整定了PID參數(shù)。此外,為了加快網(wǎng)絡(luò)收斂速度,引入動量梯度和AdaDec動態(tài)學(xué)習(xí)速率更新WNN的參數(shù)。同時,結(jié)合Lyapunov驗(yàn)證了板球控制系統(tǒng)的穩(wěn)定性,從而保證了誤差的收斂性。
經(jīng)拉格朗日建模仿真實(shí)驗(yàn)表明,本文策略與傳統(tǒng)PID和BP-PID相比,具有較好穩(wěn)定性和魯棒性,并且?guī)缀鯖]有超調(diào)。在后續(xù)研究中,可結(jié)合模型參考以及結(jié)合模糊小波神經(jīng)網(wǎng)絡(luò),進(jìn)一步研究板球系統(tǒng)的強(qiáng)耦合和未知干擾等特性。