侯潤民,方安國,胡 達,侯遠龍
(1 南京理工大學機械工程學院,南京 210094; 2 湖北江山重工有限責任公司,湖北襄陽 441057)
火箭滅火車是一種利用火藥燃氣將裝有滅火粉劑的滅火彈送入火場的消防設備?;鸺郎缁疖囁欧寗酉到y(tǒng)的動態(tài)數(shù)學模型是一個具有負載高度變化、時變、非線性和存在不確定性擾動等特點的復雜系統(tǒng)。伺服系統(tǒng)性能會受到飽和特性、外部負載突變和實際系統(tǒng)中的未建模特性等各種因素的影響[1-2]。為了對以上不確定性和非線性進行補償,對智能控制策略的研究成為了伺服系統(tǒng)研究領域的重點。
隨著技術發(fā)展,神經(jīng)網(wǎng)絡(NNs)已經(jīng)被廣泛用于動態(tài)系統(tǒng)的系統(tǒng)辨識和控制[3-5]。但是傳統(tǒng)BP神經(jīng)網(wǎng)絡存在容易陷入局部最小值和難以學習到映射規(guī)則的缺點,因此在實時任務中難以直接應用。
小波神經(jīng)網(wǎng)絡是一種基于小波分析的前饋網(wǎng)絡,將神經(jīng)網(wǎng)絡的結構模型與信號的多分辨率和多尺度分析相結合,通過可靠的理論基礎避免結構設計的盲目性;不同于在傳統(tǒng)神經(jīng)網(wǎng)絡中被使用的Sigmoid函數(shù),小波函數(shù)具有空間局部化性質,使得WNN相比傳統(tǒng)神經(jīng)網(wǎng)絡在系統(tǒng)辨識及控制方面擁有更強的學習能力[6-8]。
Levenberg-Marquardt(LM)算法具有優(yōu)良局部學習性質。通過引入隨時間的正向積分調節(jié)RNN的參數(shù)提出了一種新穎的LM算法[9]。文中將LM算法和WNN相結合,對WNN中輸出權值、伸縮因子和平移因子采用LM算法進行優(yōu)化,并與傳統(tǒng)的WNN算法進行了仿真實驗比較。Matlab仿真結果和樣機試驗表明,用LM算法優(yōu)化WNN,可以提高WNN的學習能力以及系統(tǒng)的控制精度。
滅火車伺服系統(tǒng)是一個強耦合、多變量的不確定非線性系統(tǒng)。設備在運行過程中,可能激發(fā)系統(tǒng)的未建模動態(tài)。此外,系統(tǒng)還受到飽和、測量噪聲和溫度等因素影響[10-11]。文中主要考慮系統(tǒng)負載變化參數(shù)攝動等不確定性所引起的非線性,因此做如下假設:1)無飽和效應;2)電動機氣隙磁場均勻分布,感應反電動勢呈正弦波狀;3)磁滯及渦流損耗不計;4)轉子上無勵磁繞阻。
基于兩相旋轉坐標系(d-q坐標系)的動態(tài)轉換得到數(shù)學模型:
(1)
式中:ud、uq為d-q軸定子電壓分量;id、iq為d-q軸定子電流分量;Ld、Lq為d-q軸定子電感分量;ψf為轉子永磁體磁鏈;R為定子電阻;p為極對數(shù);J為轉動慣量;B為摩擦系數(shù);ωr為轉子角速度;Te為電磁轉矩;TL為負載轉矩。
使用id=0的矢量控制方法來進行數(shù)學模型的線性化解耦。式(1)可得電機的機械方程為:
(2)
式中:ωb為機械角速度,且ωr=pωm;Te為電磁轉矩,它可以表示為:
(3)
式中:Kt為轉矩常數(shù)。
(4)
神經(jīng)網(wǎng)絡具有對復雜系統(tǒng)的高度非線性能力從而得到良好的發(fā)展。用小波函數(shù)取代Sigmoid激活函數(shù)后,由于小波在緊支集中可以任意逼近非線性連續(xù)函數(shù)的特性以及在時頻域都有分辨的特點,使得小波神經(jīng)網(wǎng)絡更適合于學習局部非線性和快速變化的函數(shù)。小波神經(jīng)網(wǎng)絡的模型如圖1所示。
圖1 小波神經(jīng)網(wǎng)絡結構圖
設輸入層為K個節(jié)點,輸入向量為x=[x1,x2,…xK], 隱含層有M個節(jié)點,Wkm和Wm分別表示輸入層第i個節(jié)點到隱含層第j個節(jié)點的連接權和第M個節(jié)點到輸出層的連接權,bm為小波函數(shù)平移參數(shù),am為小波函數(shù)伸縮變量,輸出關系式如下:
(5)
(6)
性能函數(shù)定義為:
(7)
使用遞推梯度下降法調節(jié)網(wǎng)絡參數(shù),迭代公式為:
(8)
(9)
(10)
(11)
式中:η為學習速率,其中:
(12)
(13)
(14)
(15)
針對基于三層WNN的滅火車伺服系統(tǒng)估計模型,假設P組輸入輸出數(shù)據(jù)的總輸出均方誤差為:
(16)
L-M算法可以被重新寫成:
(17)
其中,J(h)是雅可比矩陣:
(18)
其中:
(19)
eP=Od(p)-OFWNN(p)(p=1,2,…,P)
(20)
(21)
λ(h)=μ(h)λ(h-1)
(22)
μ(h)=λ(h-1)/(τ(h)+1)
(23)
h=[ω11,ω12,…,ω1m,…,ωk1,ωk2,…,ωkm,
ω1,ω2,…,ωm,…,a1,a2,…,am,b1,b2,…,bm]
(24)
式中:λ(h)為學習率0<λ(h)<1;τ(h)為最大特征值;滅火車伺服系統(tǒng)控制框圖如圖2所示。
圖2 滅火車交流伺服系統(tǒng)控制框圖
整個LM-WNN學習算法對每個迭代進程進行如下操作:
1)前向傳播輸入使用式(5)~式(7);
2)通過式(17)~式(24)計算等效誤差雅可比矩陣;
3)按照式(8)~式(15)進行參數(shù)的更新;
4)當單次迭代增加了V(h)時,跳轉到第3步。當單次迭代減少了V(h)時,開始下次迭代操作直至達到最大迭代次數(shù)。
MATLAB/Simulink仿真實驗的主要參數(shù):負載折算至電機輸出軸的轉動慣量J=5 239 kg·m2;輸出軸的不平衡力矩與摩擦力矩TL=9 320 N·m;粘滯摩擦系數(shù)B=1.43×10-4N·m/(rad·s-1);減速比i=1 039。LM學習參數(shù)λ=0.04。
文中采用基于LM-WNN快速算法,將與WNN算法進行比較。輸入信號為控制電壓u(t),其范圍為-5~+5 V;輸出信號取帶負載電機輸出軸的轉速,取值范圍為-650~650 mil/s。采樣時間設為20 s,每10 ms采樣一次,共采集數(shù)據(jù)2 000對,首先取前1 000組數(shù)據(jù)對作為辨識數(shù)據(jù)進行模型辨識,然后用后1 000組進行模型驗證。采用加權取平均值的濾波方法來消除隨機誤差。該系統(tǒng)由于樣本的數(shù)據(jù)實際量綱不同,數(shù)量級大小也差別較大從而影響了網(wǎng)絡性能,因此,辨識前對數(shù)據(jù)歸一化處理可提高辨識精度。處理后的系統(tǒng)辨識數(shù)據(jù)如圖3、圖4。
圖3 歸一化輸入數(shù)據(jù)
圖4 歸一化輸出數(shù)據(jù)
為了比較不同辨識算法的優(yōu)劣性,文中采用兩種性能指標,定義如下:
1)均方根誤差(root mean square error, RMSE):
(25)
2)信號間方差比(variance accounted for, VAF):
(26)
圖5是前1 000組用于訓練的WNN輸出與系統(tǒng)實際輸出的比較和誤差圖。圖6是后1 000組用于檢驗的WNN輸出與系統(tǒng)實際輸出的比較和誤差圖。通過計算得到RMS為0.041,VAF為97.704%。
圖5 用于訓練的WNN辨識結果與誤差曲線圖
圖6 用于檢驗的WNN辨識結果與誤差曲線圖
圖7和圖8為基于LM-WNN算法的模型輸出和期望輸出。RMS為0.002 9,VAF為99.875%。
圖7 用于訓練的LM-WNN辨識結果與誤差曲線圖
圖8 用于檢驗的LM-WNN辨識結果與誤差曲線圖
對比可知,基于LM-WNN學習辨識算法提高了傳統(tǒng)學習算法的收斂速度,且具有較高的辨識精度。
圖9為在3 s時加入一個350 N·m的階躍擾動的位置響應曲線。從圖9可以看出,當負載出現(xiàn)擾動時,采用WNN控制算法的位置響應出現(xiàn)較大的偏移,并且需要1.7 s才能恢復到目標位置。而采用LM-WNN控制算法時,系統(tǒng)具有較強的抗干擾能力,需要0.45 s達到目標位置。
圖9 負載擾動時的階躍響應曲線
圖10給出了訓練誤差隨迭代次數(shù)的變化曲線。
圖10 兩種不同訓練誤差隨進化代數(shù)變化圖
可以看到,LM-WNN神經(jīng)網(wǎng)絡訓練誤差在迭代次數(shù)為240次時可以達到0.008左右,而傳統(tǒng)的小波神經(jīng)網(wǎng)絡訓練誤差當?shù)螖?shù)為300次時只能達到0.03左右,因此LM-WNN的收斂速度明顯高于傳統(tǒng)的小波神經(jīng)網(wǎng)絡算法。
文中研究的基于LM-WNN控制策略在火箭滅火車交流伺服系統(tǒng)控制中的應用,在北方某靶場進行了試驗?;鸺跍缁疖嚱涣魉欧到y(tǒng)設計指標:1)射界范圍為高低:0°~57°;方向:-102°~102°;2)靜態(tài)誤差不大于0.5 mil(“mil”為軍事上角度測量單位,其和度的轉換關系表達式為:360°=6 000 mil);3)振蕩次數(shù)不超過1次。
靶場試驗主要分析系統(tǒng)的穩(wěn)態(tài)誤差等性能指標。因此,輸入高低750 mil,方向不變,得到的數(shù)據(jù)與采用經(jīng)典PID控制進行比較,其系統(tǒng)在高低向位置的滿載階躍響應曲線如圖11~圖12所示。
圖11 滿載時俯仰系統(tǒng)向上750 mil階躍響應曲線
圖12 滿載時俯仰系統(tǒng)向上750 mil階躍響應曲線
由圖11~圖12所示,經(jīng)典PID控制系統(tǒng)時,俯仰滿載調炮時最大誤差1.27 mil,并伴有振蕩,不能滿足系統(tǒng)性能指標;而基于LM-WNN控制系統(tǒng)時,俯仰滿載調炮時穩(wěn)態(tài)誤差為0.21 mil,滿足系統(tǒng)性能指標,且能夠更好的抑制系統(tǒng)外部的擾動。
文中是以火箭滅火車交流伺服系統(tǒng)為背景,提出了一種基于LM-WNN的優(yōu)化算法。通過數(shù)值仿真及靶場試驗可見,該算法的泛化能力好、模型辨識精度高;并且有效地提高了整個系統(tǒng)的跟蹤穩(wěn)定性和響應快速性以及射擊精度。