高艷芳,賀興時(shí),耿 燕
(西安工程大學(xué) 理學(xué)院,陜西 西安 710048)
迭代學(xué)習(xí)控制 (iterative learning control,ILC)是智能控制的一個(gè)重要分支,是跟蹤控制領(lǐng)域一種高效的控制策略,適用于具有重復(fù)運(yùn)動(dòng)特性的被控系統(tǒng)[1-3]。ILC策略的機(jī)理是通過(guò)應(yīng)用先前實(shí)驗(yàn)獲得的輸入-輸出數(shù)據(jù)和系統(tǒng)跟蹤誤差不斷修正當(dāng)前次的控制輸入,以改善跟蹤性能,最終實(shí)現(xiàn)有限區(qū)間上的完全跟蹤[4-5]。自1984年Arimot等針對(duì)機(jī)械手在某一有限時(shí)間區(qū)間內(nèi)重復(fù)跟蹤給定的期望軌跡,首次提出ILC算法以來(lái),該算法被廣泛應(yīng)用到半連續(xù)化學(xué)反應(yīng)堆、感應(yīng)電動(dòng)機(jī)、鏈板輸送機(jī)系統(tǒng)和快速熱處理過(guò)程等[6-10].
學(xué)習(xí)律的研究是ILC的核心內(nèi)容,目前常見(jiàn)的控制律有D-型(derivative-type)、P-型 (proportional-type)、PI-型(proportional-integral-type)、PD-型、PID-型[11-16]等傳統(tǒng)的學(xué)習(xí)控制律,范數(shù)最優(yōu)、參數(shù)最優(yōu)、梯度型、擬牛頓型等最優(yōu)學(xué)習(xí)控制律[17-20],以及自適應(yīng)控制律[21-23]等。文獻(xiàn)[11]研究了具有非重復(fù)不確定因素的離散線性系統(tǒng)的D-型ILC的魯棒性問(wèn)題。理論分析表明,如果所有的不確定性因素是收斂的,那么ILC的跟蹤誤差也是收斂的。這里收斂性條件依賴于精確的系統(tǒng)參數(shù)。文獻(xiàn)[18]針對(duì)一類線性離散時(shí)不變系統(tǒng),分別研究了2種具有確定學(xué)習(xí)增益和通過(guò)參數(shù)最優(yōu)化方法獲得的非線性學(xué)習(xí)增益的基于梯度的ILCs策略,所提的基于梯度的ILCs算法具有單調(diào)性和魯棒性;文獻(xiàn)[19]討論了基于逆模型的ILC算法的穩(wěn)定性、單調(diào)性和魯棒性。但是,如果文獻(xiàn)[11,18-19]中系統(tǒng)參數(shù)未知或者不確定,那么基于矩陣模型或者逆模型的ILCs算法將不可再用,且收斂性條件不可獲取。
本文針對(duì)參數(shù)未知的線性離散時(shí)變系統(tǒng),提出一種基于偽逆模型的自適應(yīng)迭代學(xué)習(xí)控制 (adaptive interative learning control based on pseudo inverse model,PIM-AILC) 策略。利用范數(shù)原理分析了該算法的收斂性,通過(guò)數(shù)值仿真驗(yàn)證了控制策略的可行性和有效性.
考慮如下重復(fù)性單輸入單輸出線性時(shí)變系統(tǒng):
(1)
式中:t∈S={0,1,…,N-1},t∈S+={1,2,…,N}代表離散時(shí)間點(diǎn),N是離散點(diǎn)的總個(gè)數(shù);k=1,2,…表示系統(tǒng)重復(fù)指標(biāo),即迭代次數(shù);xk(t)∈Rn,uk(t)∈R,yk(t)∈R分別表示n維狀態(tài)向量,單輸入和單輸出變量;矩陣A(t)表示未知的且具有適當(dāng)維數(shù)的矩陣;B(t)和C(t)分別表示具有適當(dāng)維數(shù)的列向量與行向量。
假設(shè)1對(duì)于任意給定期望軌跡yd(t),t∈S+,存在期望控制信號(hào)ud(t)和恰當(dāng)?shù)钠谕麪顟B(tài)xd(t),滿足
假設(shè)2對(duì)于重復(fù)系統(tǒng) (1),初始狀態(tài)是可以重置的。不失一般性,令xk(0)=0,k=1,2,…。
輸入uk∈RN,輸出yk∈RN和期望軌跡yd∈RN的超向量形式表示如下:
uk=(uk(0),uk(1),…,uk(N-1))Τ
yk=(yk(1),yk(2),…,yk(N))Τ
yd=(yd(1),yd(2),…,yd(N))Τ
因此,系統(tǒng) (1) 可改寫(xiě)為
yk=Huk
(2)
其中,H∈RN×N是由系統(tǒng)的參數(shù)形成的下三角矩陣:
由于系統(tǒng)參數(shù)矩陣A(t),列向量B(t)和行向量C(t)是未知且有界的,因此下三角參數(shù)矩陣H是未知且有界的。
為了進(jìn)一步研究算法,擬對(duì)系統(tǒng)下三角參數(shù)矩陣H給出自適應(yīng)估計(jì)算法,將矩陣H左下角的每一行表示為維數(shù)可變的向量的形式,hi∈Ri,t∈S+,即
所以系統(tǒng) (2) 被改寫(xiě)為
(3)
(4)
(5)
(6)
因此,一種基于梯度技術(shù)的自適應(yīng)估計(jì)算法構(gòu)造如下:
(7)
(8)
式中:λmin(·)是最小特征值,σ1和σ2是2個(gè)比較小的正數(shù)。
基于偽逆模型的自適應(yīng)迭代學(xué)習(xí)控制策略設(shè)計(jì)如下:
(9)
顯然,基于偽逆模型的線性系統(tǒng)自適應(yīng)迭代學(xué)習(xí)控制策略,即PIM-AILC,實(shí)際上是系統(tǒng)參數(shù)矩陣的自適應(yīng)估計(jì)算法(7),重置算法(8)和控制律(9)的一個(gè)結(jié)合體。
(10)
式(10)兩邊取范數(shù),得
(11)
根據(jù)向量的2-范數(shù)理論,可得
(12)
式(3)減去式(4),可得
(13)
將式(13)帶入到式(12),有
(14)
(15)
因此,由重置算法(8)、式(13)和式(14)易知,存在常數(shù)0<θ<1,使如下不等式成立:
所以有
(16)
即
(17)
定理2將基于偽逆模型的自適應(yīng)迭代學(xué)習(xí)控制算法,即式(9),應(yīng)用到系統(tǒng)(2)或(3)中,通過(guò)適當(dāng)?shù)剡x取參數(shù)ε,滿足
(18)
則跟蹤誤差ek+1單調(diào)收斂到零。
證明由式(2)和式(9)可以推出
(19)
(20)
不等式(20)右邊第一項(xiàng)為
(21)
由于ε>0,顯然存在最小的εmin,當(dāng)ε>εmin時(shí),有如下不等式成立:
(22)
其中,0<τ1<1。
從式(17)可推出,對(duì)于任意充分小的τ2>0,存在正整數(shù)N1,當(dāng)k>N1時(shí),使得
‖ΔHk‖2<τ2
(23)
(24)
其中,0<τ2<1-τ1。
式(22)加上式(24),可以得到
(25)
其中,K=max{N1,N2}。
由式(19)和(25)可推出
‖ek+1‖2≤τ‖ek‖2
(26)
其中,τ1+τ2=τ<1。表明
(27)
即證得跟蹤誤差ek+1單調(diào)收斂到零。
雖然定理的單調(diào)收斂條件(18)看似與系統(tǒng)參數(shù)矩陣H有關(guān),但是,從證明過(guò)程中的式(21)~(25)可以看出,PIM-AILC算法的收斂性條件與系統(tǒng)參數(shù)矩陣H并無(wú)關(guān)系。這是PIM-AILC算法與傳統(tǒng)的和P-型ILC的不同之處。
為了驗(yàn)證基于偽逆模型的線性系統(tǒng)自適應(yīng)迭代學(xué)習(xí)控制(PIM-AILC)的有效性和理論分析的正確性,引入文獻(xiàn)[24]中一個(gè)間歇性快速熱處理過(guò)程的實(shí)例,該離散時(shí)間系統(tǒng)模型如下:
(28)
其中S={0,1,…,99},S+={1,2,…,100},迭代時(shí)間最大值N=100。
則收斂性條件為
將PIM-AILC算法應(yīng)用到線性系統(tǒng)(28)中,并與式(29)表示的P-ILC算法作對(duì)比,仿真結(jié)果如圖1~3所示。
uk+1=uk+λek
(29)
其中λ是常數(shù)學(xué)習(xí)增益。
圖1給出了PIM-AILC算法和P-ILC算法的跟蹤誤差對(duì)比,其中P-ILC的學(xué)習(xí)增益分別為γ=0.2和γ=0.6。從圖1可以看出,PIM-AILC算法和P-ILC算法都是有效的且跟蹤誤差的2-范數(shù)均單調(diào)收斂到零,但是PIM-AILC有較快的收斂速度。
圖 1 PIM-AILC算法和P-ILC算法的跟蹤誤差Fig.1 Tracking error of PIM-AILC algorithm and P-ILC algorithm
圖2描述了PIM-AILC算法的輸出結(jié)果。從圖2可看出第4次迭代輸出軌跡與期望軌跡吻合,表明隨著迭代次數(shù)的增加,實(shí)際輸出軌跡會(huì)和期望軌跡重合。
圖 2 PIM-AILC算法的輸出Fig.2 Output of PIM-AILC algorithm
圖3(a)~(b)分別給出了算法PIM-AILC和算法P-ILC (γ=0.6)的跟蹤誤差ek(t)沿迭代方向和時(shí)間方向的三維立體圖。通過(guò)對(duì)比可發(fā)現(xiàn),PIM-AILC的收斂性比P-ILC的收斂性好。
(a) PIM-AILC跟蹤誤差
(b) P-ILC跟蹤誤差(γ=0.6)圖 3 PIM-AILC與P-ILC跟蹤誤差Fig.3 Tracking error of PIM-AILC and P-ILC
本文針對(duì)一類參數(shù)未知的單輸入、單輸出離散線性時(shí)變系統(tǒng),利用估計(jì)的系統(tǒng)矩陣的逆矩陣,提出基于偽逆模型的自適應(yīng)迭代學(xué)習(xí)控制策略。通過(guò)范數(shù)理論分析所提算法的收斂性。引入一個(gè)間歇性快速熱處理過(guò)程測(cè)試該策略,結(jié)果表明PIM-AILC算法是有效的、可行的。