葉金鑫,謝麗蓉,王宏偉
(1.新疆大學(xué),烏魯木齊 830000;2.大連理工大學(xué),遼寧 大連 116000)
隨著現(xiàn)代工業(yè)的飛速發(fā)展,非線性系統(tǒng)也變得越來(lái)越復(fù)雜,然而由于不同條件的限制,系統(tǒng)采用不同的頻率進(jìn)行工作,因而形成了多率采樣數(shù)據(jù)系統(tǒng)(簡(jiǎn)稱多率系統(tǒng)),因此想要建立系統(tǒng)精確的數(shù)學(xué)模型,并對(duì)其模型進(jìn)行控制相當(dāng)困難[1]。
在輸入非均勻刷新和輸出周期采樣系統(tǒng)中,許多學(xué)者進(jìn)行了系統(tǒng)辨識(shí)[1-3]和控制[4-9]方面的研究,雖然在非均勻系統(tǒng)控制方面取得了很多成果,但大多數(shù)仍集中在線性系統(tǒng)上。近年來(lái),對(duì)于非均勻采樣的非線性系統(tǒng)辨識(shí)[10-13]已經(jīng)獲得許多研究成果,但是對(duì)于非線性系統(tǒng)的控制方法卻并不多。在現(xiàn)實(shí)生活中,大多數(shù)系統(tǒng)具備非線性、大時(shí)滯強(qiáng)耦合特性,且存在建模困難、難以設(shè)計(jì)高精度的控制器等問(wèn)題。侯忠生等[14-15]針對(duì)這類系統(tǒng)問(wèn)題,提出了一類無(wú)模型自適應(yīng)控制,該方法的特點(diǎn)是:一種通過(guò)線性化設(shè)計(jì)的控制器,在離散非線性系統(tǒng)的等效數(shù)據(jù)點(diǎn)上使用了一種新的動(dòng)態(tài)方法,該方法設(shè)計(jì)簡(jiǎn)單,易于實(shí)現(xiàn)。在設(shè)計(jì)控制器時(shí),不需知道系統(tǒng)的確切模型,只需知道系統(tǒng)的輸入和輸出數(shù)據(jù)即可。對(duì)于非線性系統(tǒng)的無(wú)模型自適應(yīng)控制有很多研究成果,包括無(wú)模型自適應(yīng)魯棒控制[16-17]、無(wú)模型自適應(yīng)積分終端滑??刂芠18]、自適應(yīng)積分滑??刂芠19-20]、無(wú)模型自適應(yīng)預(yù)測(cè)控制[21-22]、無(wú)模型自適應(yīng)滑模矢量控制[23-24]、無(wú)模型自適應(yīng)迭代控制[25]及無(wú)模型參數(shù)迭代尋優(yōu)控制[26-27]。但對(duì)于非均勻采樣非線性系統(tǒng),文獻(xiàn)[28]提出了一種利用支持向量回歸建模,設(shè)計(jì)了預(yù)測(cè)控制算法;文獻(xiàn)[29]利用在當(dāng)前輸入輸出數(shù)據(jù)平衡點(diǎn)處建立線性化數(shù)據(jù)模型,在投影算法計(jì)算下,對(duì)偽雅可比矩陣(Pseudo Jacobian Matrix,PJM)在線實(shí)時(shí)估計(jì),設(shè)計(jì)出了無(wú)模型自適應(yīng)控制器,并取得了很好的控制效果;文獻(xiàn)[30]對(duì)非均勻采樣系統(tǒng)利用余弦項(xiàng)展開(kāi),提出了一種采用非線性模型預(yù)測(cè)控制,取得了較好的效果。綜上所述,常規(guī)的非均勻采樣非線性離散系統(tǒng)的無(wú)模型自適應(yīng)控制中存在著兩個(gè)問(wèn)題:其一,未考慮輸出采集數(shù)據(jù)受擾動(dòng)誤差帶來(lái)的影響,所設(shè)計(jì)的控制器控制精度會(huì)受到影響;其二,懲罰因子主要根據(jù)經(jīng)驗(yàn)來(lái)選擇,并且不能自動(dòng)將其調(diào)整為最佳值,懲罰因子會(huì)影響系統(tǒng)的收斂速度、超調(diào)量等整體系統(tǒng)的性能。
本文主要?jiǎng)?chuàng)新點(diǎn)為:采用跟蹤-微分器[31-32]對(duì)輸出數(shù)據(jù)進(jìn)行濾波,利用輸入數(shù)據(jù)和輸出濾波數(shù)據(jù)在等價(jià)動(dòng)態(tài)平衡點(diǎn)處建立動(dòng)態(tài)化模型,并設(shè)計(jì)一種新的無(wú)模型自適應(yīng)控制器;利用最速下降法對(duì)控制律和PJM估計(jì)公式中的懲罰系數(shù)迭代優(yōu)化,并對(duì)該控制方法穩(wěn)定性進(jìn)行分析。
考慮如下連續(xù)非線性系統(tǒng)[29]
(1)
式中,y(t)∈R1,u*(t)∈R1,x(t)∈Rn,Γ(·)分別為系統(tǒng)輸出、輸入、狀態(tài)向量和非線性函數(shù),R表示實(shí)數(shù)集。式(1)中的系統(tǒng)輸入信號(hào)u*(t)滿足
(2)
(3)
采用提升技術(shù),提升變量構(gòu)造如下
(4)
此時(shí),可將系統(tǒng)式(3)轉(zhuǎn)換成如下離散系統(tǒng),即
(5)
設(shè)連續(xù)過(guò)程的線性狀態(tài)空間模型為
(6)
式中,Ac,Bc,C為適當(dāng)維數(shù)的矩陣,Ac∈Rn×n,Bc∈Rn×p。
由1.1節(jié)可知,非均勻采樣輸入數(shù)據(jù)和均勻采樣輸出數(shù)據(jù)分別為u*(kT+ti),y(kT),并且i=1,2,…,p-1。所以對(duì)一個(gè)幀周期T內(nèi)離散化系統(tǒng)式(6),即
(7)
將式(6)~(7)整理得到如下離散狀態(tài)空間模型
(8)
(9)
令I(lǐng)n是n階單位矩陣,系統(tǒng)式(8)可等價(jià)為
(10)
也可表示為一般形式
(11)
式中,
{
a(z-1)=z-ndet[zIn-Α]=1+a1z-1+a2z-2+…+anz-n
b0(z-1)=b00z0+b01z-1+b02z-2+…+b0nz-n
?
bi(z-1)=bi1z-1+bi2z-2+…+binz-n,
i=1,2,…,n。
在文獻(xiàn)[29]中,非線性系統(tǒng)式(5)與線性系統(tǒng)式(8)的關(guān)系是:非線性系統(tǒng)Sp可以看作是在多個(gè)工作點(diǎn)的局部線性模型式(11)經(jīng)過(guò)非線性加權(quán)組合得到,即
(12)
式中,φ(kT)=[y(kT-T),…,y(kT-nT),u*(kT-T),…,u*(kT-nT),u*(kT+t1-T),…,u*(kT+t1-nT),u*(kT+tp-1-T),…,u*(kT+tp-1-nT)]T。
模型式(12)是fl[φ(kT)]在第l個(gè)非線性加權(quán)函數(shù)和gl[φ(kT)]在第l個(gè)工作點(diǎn)處的局部線性函數(shù)。因此模型式(12)進(jìn)一步表示為
y(kT)=f(φ(kT))。
(13)
可將系統(tǒng)式(13)看作是多輸入單輸出(MISO)系統(tǒng),表示為
y(kT+T)=f(y(kT),…,y(kT-nyT),u(kT),…,u(kT-nuT))
(14)
式中:
(15)
假設(shè) 1[14-15]函數(shù)f(·)是關(guān)于系統(tǒng)控制輸入信號(hào)u(kT)的偏導(dǎo)數(shù),是連續(xù)的。
假設(shè) 2[14-15]非線性函數(shù)式(14)滿足廣義Lipschitz條件,即對(duì)于任意時(shí)刻k1≠k2,k1≥0,k2≥0和u(k1T)≠u(k2T),均有
||
y(k1T+T)-y(k2T+T)||
≤a||
u(k1T)-u(k2T)||
(16)
式中:y(kiT+T)=f(y(kiT),…,y(kiT-nyT);u(kiT),…,u(kiT-nuT)),i=1,2;常數(shù)a>0。
定理1[14-15]若非線性系統(tǒng)泛模型式(14)滿足假設(shè)1和假設(shè)2,且對(duì)所有時(shí)刻kT,有||
Δu(kT)||
=||
u(kT)-
u(kT-T)||≠0,一定存在一個(gè)被稱為PJM的時(shí)變參數(shù)Φ(kT)∈Rp×1,使得泛模型系統(tǒng)式(14)等價(jià)于如下緊格式動(dòng)態(tài)線性化(CDFL)的一類泛模型
Δy(kT+T)=ΦT(kT)Δu(kT)
(17)
Φ(kT)||
≤b,常數(shù)b>0。
本文算法中加入跟蹤-微分器[31-32],目的是對(duì)非均勻采樣非線性系統(tǒng)輸出數(shù)據(jù)y(kT)進(jìn)行濾波,提高算法對(duì)系統(tǒng)的擾動(dòng)或噪聲的抗干擾能力。跟蹤-微分器原理是:對(duì)于一個(gè)跟蹤微分系統(tǒng),給定一個(gè)非均勻采樣系統(tǒng)的輸出信號(hào)v(t),它將會(huì)輸出產(chǎn)生兩個(gè)信號(hào)x1和x2,其中,x1是v(t)所要的輸出跟蹤信號(hào),x2是v(t)的近似輸出微分信號(hào)。
二階離散的跟蹤-微分器公式為
(18)
式中:p為離散化采樣步長(zhǎng);h和r分別為濾波因子和速度因子。定義非線性函數(shù)f(·)為
{f(x1(kT),x2(kT),v(kT),r,h)=-rsat(g(kT),δ)y(kT)=x1(kT)-v(kT)+hx2(kT)δ=hr,δ1=hδ
(19)
(20)
(21)
考慮如下控制準(zhǔn)則函數(shù)
(22)
式中,懲罰因子λ>0,用于調(diào)節(jié)輸入量過(guò)大的變化。將式(17)代入準(zhǔn)則函數(shù),并對(duì)其極小化,即
(u(kT)-u(kT-T)))+2λ(u(kT)-u(kT-T))=0
(23)
求得控制器
u(kT)=u(kT-T)+(λI+Φ(kT)ΦT(kT))-1·
Φ(kT)(y*(kT+T)-y(kT))
(24)
式中,I為單位矩陣。
由于每次實(shí)施控制算法計(jì)算時(shí),矩陣都要求逆運(yùn)算,當(dāng)系統(tǒng)輸入信號(hào)的維數(shù)很大時(shí),求逆非常耗時(shí)間,不利于現(xiàn)實(shí)中的運(yùn)用,因此對(duì)控制算法進(jìn)行簡(jiǎn)化,得到不含求逆的改進(jìn)控制算法
(25)
式中,步長(zhǎng)因子ρ∈(0,1],它的加入使算法更具靈活性,且將在穩(wěn)定性和收斂性分析中用到。
對(duì)于一般系統(tǒng)來(lái)說(shuō),即使是簡(jiǎn)單的線性系統(tǒng),偽偏導(dǎo)數(shù)Φ(kT)一般也是未知的、時(shí)變的。因此,為實(shí)施控制算法式(25),采用如下性能指標(biāo)在線估計(jì)偽偏導(dǎo)數(shù)Φ(kT)的值
(26)
式中,懲罰因子μ>0,它的加入是為了限制PJM的估計(jì)值產(chǎn)生過(guò)大的變化。
對(duì)準(zhǔn)則函數(shù)進(jìn)行求偏導(dǎo),令其導(dǎo)數(shù)等于零,得
(27)
由于PJM辨識(shí)算法需要求逆運(yùn)算,當(dāng)系統(tǒng)輸入維數(shù)很大時(shí),求逆是非常麻煩的,不利于實(shí)際運(yùn)用,因此對(duì)辨識(shí)算法進(jìn)行簡(jiǎn)化得
。
(28)
懲罰因子λ和μ具有兩個(gè)主要功能:1)限制控制量和PJM輸入變化,這些變化會(huì)影響系統(tǒng)響應(yīng)速度和超調(diào)量,同時(shí)減少系統(tǒng)穩(wěn)態(tài)誤差并確??刂戚斎胄盘?hào)的平滑性;2)防止式(25)和式(28)出現(xiàn)分母為零的特殊情況,選擇合適的λ和μ值可確保系統(tǒng)穩(wěn)定性,并在閉環(huán)系統(tǒng)中優(yōu)化響應(yīng)速度和超調(diào)量之間的平衡?,F(xiàn)有方法主要根據(jù)經(jīng)驗(yàn)來(lái)選擇λ和μ,并且不能自動(dòng)將其調(diào)整為最佳值。本文采用最速下降法進(jìn)行優(yōu)化,提出了懲罰因子在線迭代自適應(yīng)的改進(jìn)方法,迭代尋找能使控制律和偽偏導(dǎo)數(shù)達(dá)到最優(yōu)的懲罰因子值。
1)對(duì)控制律中的懲罰因子改進(jìn)。
對(duì)式(25)的懲罰因子做迭代改進(jìn),即
λ(kT+T)=λ(kT)-β1▽J(u(kT))
(29)
式中,β1為學(xué)習(xí)率。
(30)
2)對(duì)PJM中的懲罰因子改進(jìn)。
對(duì)式(28)的懲罰因子做迭代改進(jìn),即
(31)
式中,β2為學(xué)習(xí)率。
(32)
因此就有PJM辨識(shí)算法
(33)
對(duì)于式(33)引入如下參數(shù)重置機(jī)制
(34)
Δu(kT-T)||
式中,ε是一個(gè)充分小的正數(shù)。參數(shù)重置機(jī)制的引入是為了使PJM辨識(shí)算法具有更強(qiáng)大的功能來(lái)跟蹤時(shí)變參數(shù)。
得到控制器算法為
(35)
最后,將整個(gè)改進(jìn)無(wú)模型自適應(yīng)控制算法總結(jié)如下:
1)設(shè)置系統(tǒng)輸入、輸出初值和PJM初值,以及參數(shù)η∈(0,2],μ(1)>0,ρ∈(0,1],λ(1)>0;
2)采集非均勻采樣非線性系統(tǒng)當(dāng)前實(shí)際輸出y(kT)和期望輸出yr(kT+T);
3)設(shè)置參數(shù)離散化采樣步長(zhǎng)p、濾波因子h、速度因子r,由式(18)~(21)得到輸出數(shù)據(jù)y(kT)的跟蹤數(shù)據(jù)x1(kT);
5)利用式(35)計(jì)算并實(shí)施u(kT);
6)設(shè)置參數(shù)學(xué)習(xí)率β1,β2,根據(jù)式(29)和式(31)分別對(duì)λ(kT),μ(kT)進(jìn)行迭代更新;
7)返回2),k=k+1,繼續(xù)循環(huán)。
為了分析所得新設(shè)計(jì)的MFAC閉環(huán)系統(tǒng)收斂性,做如下引理。
限于篇幅,證明略。
引理2定義
(36)
限于篇幅,證明略。
定理2對(duì)于非均勻采樣非線性系統(tǒng)(14),在假設(shè)1和假設(shè)2滿足的條件下,MFAC方案式(33)~(35)具有如下性質(zhì):當(dāng)y*(kT+T)=y*,為常數(shù)時(shí),存在一個(gè)正數(shù)λmin>0,使得當(dāng)λ*(kT)>λmin時(shí)有:
2)閉環(huán)系統(tǒng)是BIBO穩(wěn)定收斂的,即輸出序列{y(kT)}和輸入序列{u(kT)}是有界的。
限于篇幅,證明略。
考慮如下非均勻非線性非仿射離散系統(tǒng)
y(kT+T)=[y(kT)y(kT-T)y(kT-2T)·
(u*(kT+t1-T)(y(kT)-1)+u*(kT))]/
[1+y2(kT)+y2(kT-T)+y2(kT-2T)]
(37)
該非均勻采樣非線性系統(tǒng)的采樣方案為:幀周期T=1 s,p=2,t1=0.4 s,被控系統(tǒng)的參數(shù)、階數(shù)都是時(shí)變的。
期望輸出信號(hào)yr(kT+T)=0.5×(-1)round(kT/50)。
為了驗(yàn)證本文控制方法的優(yōu)越性,使用本文控制方法與MFAC方法分別對(duì)輸入刷新和輸出周期采樣非線性系統(tǒng)的控制仿真圖進(jìn)行比較。MFAC方法的懲罰因子選取為λ=1,μ=1;本文控制方法的懲罰因子λ(1)=1,μ(1)=1,步長(zhǎng)因子選為β1=0.01,β2=0.5,仿真結(jié)果見(jiàn)圖1-圖3。
圖1 非均勻采樣系統(tǒng)的跟蹤曲線對(duì)比圖(仿真1)Fig.1 Comparison of tracking curves of non-uniform sampling system(Simulation 1)
圖2 控制輸入曲線對(duì)比圖(仿真1)Fig.2 Comparison of control input curves(Simulation 1)
圖3 絕對(duì)值誤差曲線對(duì)比圖(仿真1)Fig.3 Comparison of absolute value error curves(Simulation 1)
由圖1可知,本文提出的控制方法明顯優(yōu)于MFAC方法,該方法雖然有超調(diào)量,但是超調(diào)過(guò)后能夠很好地貼近跟蹤曲線,收斂速度快。由圖2可知,本文的控制輸入量波動(dòng)小。
此外,通過(guò)絕對(duì)值誤差曲線對(duì)本文所設(shè)計(jì)的控制方法與MFAC方法進(jìn)行仿真以及性能對(duì)比。平均絕對(duì)值誤差為
(38)
均方根誤差為
(39)
由圖3可知,本文控制方法的絕對(duì)值誤差明顯小于MFAC方法的絕對(duì)值誤差。
表1所示為仿真1中2種方法性能指標(biāo)比較。
表1 2種方法性能指標(biāo)比較(仿真1)Table 1 Comparison of performance indexes of two methods(Simulation 1)
由表1可知,性能指標(biāo)明顯增大,綜合而言,本文控制方法具有更優(yōu)的控制性能。
為了進(jìn)一步說(shuō)明本文方法的有效性,采用非均勻非線性非仿射離散系統(tǒng)[29],即
(40)
期望輸出信號(hào)
(41)
該非均勻采樣非線性系統(tǒng)是由兩個(gè)子系統(tǒng)組成,采樣方案為:幀周期T=1 s,p=2,t1=0.6 s,被控系統(tǒng)的參數(shù)、階數(shù)都是時(shí)變的。
文獻(xiàn)[29]控制方法的懲罰因子選取為λ=0.6,μ=0.5,本文控制方法的懲罰因子選取為λ(1)=0.6,μ(1)=0.5,步長(zhǎng)因子選取為β1=0.05,β2=0.1,仿真結(jié)果見(jiàn)圖4-圖6。
圖4 非均勻采樣系統(tǒng)的跟蹤曲線對(duì)比圖(仿真2)Fig.4 Comparison of tracking curves of non-uniform sampling system(Simulation 2)
圖5 控制輸入曲線對(duì)比圖(仿真2)Fig.5 Comparison of control input curves(Simulation 2)
圖6 絕對(duì)值誤差曲線對(duì)比圖(仿真2)Fig.6 Comparison of absolute value error curves(Simulation 2)
通過(guò)與文獻(xiàn)[29]仿真對(duì)比,由圖4可知,本文控制方法跟蹤曲線超調(diào)量小、波動(dòng)小,能夠很好地貼近曲線。由圖5可知,本文控制輸入曲線波動(dòng)大,但能夠很好地跟蹤系統(tǒng)輸出。由圖6可知,本文控制方法的絕對(duì)值誤差小于文獻(xiàn)[29]控制方法的絕對(duì)值誤差。
表2所示為仿真2中2種方法性能指標(biāo)比較。
表2 2種方法性能指標(biāo)比較(仿真2)Table 2 Comparison of performance indexes of two methods(Simulation 2)
由表2可知,無(wú)論是平均絕對(duì)值誤差還是均方根誤差,本文控制方法都比文獻(xiàn)[29]控制方法要小,因此,本文控制方法具有更好的控制性能。
對(duì)于非均勻采樣離散時(shí)間非線性系統(tǒng),本文提出一種新的無(wú)模型自適應(yīng)控制方法。該方法利用跟蹤-微分器對(duì)系統(tǒng)的輸出數(shù)據(jù)進(jìn)行濾波,設(shè)計(jì)無(wú)模型自適應(yīng)控制器,并且使用最速下降法對(duì)控制律和PJM估計(jì)中的懲罰系數(shù)進(jìn)行迭代優(yōu)化。仿真結(jié)果表明:實(shí)際曲線能夠很好地貼近期望曲線,減少擾動(dòng)誤差帶來(lái)的影響,控制精度高,說(shuō)明了本文所設(shè)計(jì)控制方法的可行性和有效性。對(duì)于輸入非均勻周期刷新和輸出非均勻周期采樣非線性系統(tǒng),下一步工作對(duì)其進(jìn)行探討和研究。