侯小秋, 李麗華
(黑龍江科技大學(xué) 電氣與控制工程學(xué)院, 哈爾濱 150022)
自校正控制器算法有諸多學(xué)者研究,張婧[1]提出一種基于非均勻采樣系統(tǒng)的自校正控制方法。胡成才[2]針對新型灰箱系統(tǒng)模型,給出了新型切換自校正控制算法。趙櫟等[3]研究了確定性多變量系統(tǒng)的自校正控制器算法的收斂性﹑魯棒性及穩(wěn)定性。諸多學(xué)者研究傳統(tǒng)NARMA-L2模型的神經(jīng)網(wǎng)絡(luò)控制的應(yīng)用,汪權(quán)等[4]應(yīng)用NARMA-L2控制地震作用下高層建筑結(jié)構(gòu)的振動。閆召洪等[5]將NARMA-L2模型應(yīng)用于控制航空發(fā)動機(jī)推力衰退緩解。劉仕兵等[6]指出了NARMA-L2模型的弓網(wǎng)系統(tǒng)振動主動控制效果較好。筆者提出一種改進(jìn)NARMA-L2模型,研究其神經(jīng)網(wǎng)絡(luò)自校正控制器。
非線性NARMA模型為
y(t+d)=f[y(t),y(t-1),…,y(t-ny),
u(t),u(t-1),…,(t-nu)],
(1)
式中:y(t)——系統(tǒng)輸出;
u(t)——控制輸入;
f(·)——非線性函數(shù);
ny、nu——階數(shù);
d——時(shí)滯。
令
M=[y(t),y(t-1),…,y(t-ny),
u(t-1),u(t-2),…,u(t-nu)]。
將式(1)在零工作點(diǎn)處一階泰勒展開
f[M,u(t)]=f(M,0)+
式中,R[M,u(t)]——泰勒展開余項(xiàng)。
因u(t)有界,故R[M,u(t)]較大,文中提出一自適應(yīng)濾波動態(tài)工作點(diǎn),
u0(t)=θ(q-1)u(t-1),
式中:u0(t)——自適應(yīng)濾波動態(tài)工作點(diǎn);
θ(q-1)——加權(quán)網(wǎng)絡(luò)。
θ(q-1)=θ0+θ1q-1+…+θnθq-nθ。
滿足約束條件
0≤θ(1)≤1。
在u0(t)處對式(1)進(jìn)行一階泰勒展開
f[M,u(t)]=f[M,u0(t)]+
R[M,u(t)-u0(t)],
(2)
則
在系統(tǒng)運(yùn)行的多數(shù)時(shí)刻
R[M,u(t)-u0(t)] 式(2)可寫成改進(jìn)的帶誤差補(bǔ)償?shù)腘ARMA-L2模型為 y(t+d)=f0(M)+g0(M)· [u(t)-u0(t)]+ye(t+d,M), f0(M)=f[M,u0(t)], ye(t+d,M)=R[M,u(t)-u0(t)]。 (3) 式中:W、V、H——BP神經(jīng)網(wǎng)絡(luò)的連接權(quán)重值向量; 選取廣義目標(biāo)函數(shù) (4) 式中:r(t) ——參考輸入; λ(q-1) ——加權(quán)網(wǎng)絡(luò)。 λ(q-1)=λ0+λ1q-1+…+λnλq-nλ, 式中,nλ——階數(shù)。 (5) [u(t)-u0(t)], (6) 則可調(diào)參數(shù)向量 ηT=[WT,VT]。 式(5)兩邊對W的分量wi求偏導(dǎo)得 (7) (8) 式(5)兩邊對V的分量vj求偏導(dǎo)得 (9) (10) 式(6)兩邊對wi求偏導(dǎo)得 (11) 式(6)兩邊對vj求偏導(dǎo)得 (12) (13) 式(7)兩邊對vj求偏導(dǎo)得 (14) 式(9)兩邊對wi求偏導(dǎo)得 (15) 式(9)兩邊對vi求偏導(dǎo)得 (16) 式(11)兩邊對wj求偏導(dǎo)得 (17) 將式(11)兩邊對vj求偏導(dǎo)得 (18) 將式(12)兩邊對wi求偏導(dǎo)得 (19) 將式(12)兩邊對vi求偏導(dǎo)得 (20) 參考文獻(xiàn)[7]的直接極小化指標(biāo)函數(shù)的自適應(yīng)優(yōu)化算法,可得W、V的在線學(xué)習(xí)算法,選取目標(biāo)函數(shù)為 式中:α——加權(quán)因子; g*(·)——目標(biāo)函數(shù)。 W、V的在線學(xué)習(xí)算法為 λ2(t)-Q(t-1)}, ρ(t)——收斂因子; Q(t)——Hessian矩陣; λ(t)——權(quán)重對角矩陣。 Q(t)求逆及克服算法病態(tài)的權(quán)重對角矩陣λ(t)的確定,可參考文獻(xiàn)[8]的算法。 估計(jì)誤差 目標(biāo)函數(shù)為 λe(t)——權(quán)重對角矩陣; ge(H)——目標(biāo)函數(shù)。 參考文獻(xiàn)[7]的直接極小化指標(biāo)函數(shù)的自適應(yīng)優(yōu)化算法,可得H的在線學(xué)習(xí)算法為 式中,QH(t)——Hessian矩陣。 QH(t)=QH(t-1)+ρ(t)· QH(t)求逆及克服算法病態(tài)的權(quán)重對角矩陣λe(t)的確定,可參見文獻(xiàn)[8]的算法。 0.7sign[u(t-5)]u2(t-5), 式中,sign(·)——符號函數(shù)。 參考輸入r(t)=(-1)^r(nóng)ound(t/100),自適應(yīng)濾波動態(tài)工作點(diǎn)u0(t)=0.9u(t-1),飽和限幅Umax=0.8。加權(quán)網(wǎng)絡(luò)為 λ(q-1)=0.5-0.25q-1-0.24q-2。 H尋優(yōu)時(shí)的目標(biāo)函數(shù)的QH(0)=103.5I,采用Matlab7語言編程實(shí)現(xiàn)算法的仿真研究,結(jié)果如圖1~3所示。 圖1 不同模型的響應(yīng)曲線Fig. 1 Response curve of diffevent model 圖2 傳統(tǒng)NARMA-L2模型的參數(shù)曲線Fig. 2 Parameter curve of original NARMA-L2 model 圖3 改進(jìn)NARMA-L2模型的參數(shù)曲線Fig. 3 Parameter curve of modified NARMA-L2 model (1)針對NARMA-L2模型存在的誤差項(xiàng)值較大的問題,提出一自適應(yīng)濾波動態(tài)工作點(diǎn),在該工作點(diǎn)處由一階泰勒展開逼近NARMA模型,建立了改進(jìn)的NARMA-L2模型,其誤差值較傳統(tǒng)NARMA-L2模型小,其逼近NARMA模型的性能更優(yōu)。 (2)利用多層BP神經(jīng)網(wǎng)絡(luò)能逼近任意非線性函數(shù)的性能,獲得了BP神經(jīng)網(wǎng)絡(luò)辨識改進(jìn)的NARMA-L2模型的參數(shù)。 (3)基于廣義目標(biāo)函數(shù),根據(jù)改進(jìn)的NARMA-L2模型,提出非線性系統(tǒng)的隱式自校正控制器算法,通過直接極小化指標(biāo)函數(shù)的自適應(yīng)優(yōu)化算法尋優(yōu)了BP神經(jīng)網(wǎng)絡(luò)的連接權(quán)重值,通過在線學(xué)習(xí),給出了一種新的在線學(xué)習(xí)算法。2 神經(jīng)網(wǎng)絡(luò)自校正控制器
3 神經(jīng)網(wǎng)絡(luò)連接權(quán)重值的學(xué)習(xí)算法
3.1 梯度表達(dá)式
3.2 二階導(dǎo)數(shù)矩陣
3.3 W、V的學(xué)習(xí)算法
3.4 H的學(xué)習(xí)算法
4 仿真研究
5 結(jié) 論