杜莉莉, 傅 勤*, 顧盼盼, 李向東
(1.蘇州科技大學(xué) 數(shù)理學(xué)院,江蘇 蘇州 215009;2.華南理工大學(xué) 自動化科學(xué)與工程學(xué)院,廣東 廣州 510640)
自從Arimoto 等人[1]首次提出完整的控制算法以來,迭代學(xué)習(xí)控制(Iterative Learning Control,簡稱ILC)已成為近年來控制理論研究的熱點問題,并引起人們的廣泛關(guān)注[2-3]。迭代學(xué)習(xí)控制適用于在有限時間區(qū)間內(nèi)具有重復(fù)運動性質(zhì)的受控系統(tǒng),通過反復(fù)迭代修正,使得系統(tǒng)的輸出軌跡沿迭代軸方向收斂于給定的期望軌跡。
廣義系統(tǒng)是一類較正常系統(tǒng)形式更為一般化的動力系統(tǒng),被廣泛應(yīng)用于電子網(wǎng)絡(luò)、經(jīng)濟系統(tǒng)、社會系統(tǒng)、生物系統(tǒng)等領(lǐng)域中[4-7]。近年來,許多具有重復(fù)運動性質(zhì)的實際問題,例如工業(yè)機器人等[8-9],都是由廣義系統(tǒng)模型來刻畫的,由此,研究廣義系統(tǒng)的迭代學(xué)習(xí)控制問題是有意義的。由于廣義系統(tǒng)含有正常系統(tǒng)所不具有的脈沖項,對其學(xué)習(xí)控制設(shè)計時,會較正常系統(tǒng)困難些。借助于廣義系統(tǒng)的正則性條件,文獻[10-13]討論了線性廣義系統(tǒng)的迭代學(xué)習(xí)控制問題,并給出相應(yīng)的收斂性條件。最近,文獻[14-15]基于矩陣奇異值分解,將廣義系統(tǒng)轉(zhuǎn)化為等價的微分代數(shù)系統(tǒng),并在通常的初值假設(shè)條件下,給出一種由D 型算法和P 型算法混合而成的新型學(xué)習(xí)律(稱之為D-P 型),有效地解決了線性廣義系統(tǒng)的狀態(tài)跟蹤問題。這種新算法無需依賴系統(tǒng)的正則性條件,因而使用起來也較為簡單實用。
大型互聯(lián)系統(tǒng)是由互相關(guān)聯(lián)的子系統(tǒng)組成的一個復(fù)合系統(tǒng),在許多實際控制問題中,系統(tǒng)模型都具有大系統(tǒng)形式。由于其實現(xiàn)的可靠性、實時性和經(jīng)濟性,分散控制已成為大型系統(tǒng)理論中一個活躍分支[16]。在這種分散控制方案中,每個子系統(tǒng)的控制器僅依賴于該子系統(tǒng)的狀態(tài)變量,不需要與其他子系統(tǒng)交換信息,利于工程實現(xiàn)。近年來,大型互聯(lián)線性系統(tǒng)的分散控制設(shè)計得到了較為深入的研究[17-18]。最近,基于迭代學(xué)習(xí)控制的大型互聯(lián)系統(tǒng)的分散控制問題引起了大家的關(guān)注,文獻[19-23]研究了大型互聯(lián)系統(tǒng)的分散迭代學(xué)習(xí)控制問題。
廣義大型互聯(lián)系統(tǒng)是由廣義系統(tǒng)互聯(lián)而成的一類復(fù)合系統(tǒng)。文獻[24-25]借助于分散控制方法,討論了廣義大型互聯(lián)系統(tǒng)的穩(wěn)定性和鎮(zhèn)定設(shè)計問題。然而,由于廣義大型互聯(lián)系統(tǒng)的復(fù)雜性,就迭代學(xué)習(xí)控制設(shè)計而言,尚未涉及到廣義大型互聯(lián)系統(tǒng)。筆者提出廣義大型互聯(lián)線性系統(tǒng)的迭代學(xué)習(xí)控制問題,研究一類廣義大型互聯(lián)線性系統(tǒng)的分散迭代學(xué)習(xí)控制,借助于文獻[14-15]中采用的矩陣奇異值分解方法,將該類廣義大型互聯(lián)線性系統(tǒng)轉(zhuǎn)化為等價的微分代數(shù)系統(tǒng),再將轉(zhuǎn)化后的系統(tǒng)輸入與狀態(tài)寫成矩陣形式,通過構(gòu)建分散型的D-P 型學(xué)習(xí)控制算法,說明迭代系統(tǒng)的狀態(tài)沿迭代軸方向一致收斂于給定的期望軌跡。
文中給出如下符號約定:對矩陣Bi∈Rmi×ni,B=blockdiag(B1,B2,…,BN)表示塊對角矩陣;對矩陣A∈Rn×n,記||A||為矩陣A 的2-范數(shù),即其中ρ(ATA)為矩陣ATA 的譜半徑;對向量定義x(t)的上確界范數(shù)這里||x(t)||為x(t)的2-范數(shù);對給定的λ>0,定義x(t)的λ-范數(shù)由文獻[26]可知,范數(shù)||x(t)||S與||x(t)||λ是等價的,即可用其中任一種范數(shù)證明收斂性結(jié)果。記I 為單位矩陣。
考慮如下具有重復(fù)運動性質(zhì)的廣義大型互聯(lián)線性系統(tǒng)[24-25]
這里i=1,2,…,N 表示各個子系統(tǒng),t∈[0,T]。xik(t)∈Rni,uik(t)∈Rmi分別為第i 個子系統(tǒng)在第k 次重復(fù)運動時的狀態(tài)、控制輸入,Ei∈Rni×ni是奇異矩陣,且rank(Ei)=ri<ni,Ai∈Rni×ni,Bi∈Rni×mi,Dij∈Rni×nj是實矩陣。記
對于給定時間區(qū)間t∈[0,T]上的期望軌跡xid(t),學(xué)習(xí)控制的目的是設(shè)計適當(dāng)?shù)膶W(xué)習(xí)律,使得當(dāng)?shù)螖?shù)k→∞時,系統(tǒng)的狀態(tài)序列xik(t)在t∈[0,T]上收斂于理想的狀態(tài)xid(t),即其中eik(t)=xid(t)-xik(t),i=1,2,…,N。
對系統(tǒng)(1)作出如下假設(shè)條件:
假設(shè)1對于給定的期望軌跡xid(t),存在uid(t),使得
成立,i=1,2,…,N。
假設(shè)2每次迭代時,系統(tǒng)的初始狀態(tài)取為固定值xid(0),即
其中,k 為迭代次數(shù),i=1,2,…,N。
注1假設(shè)1、2 是研究迭代學(xué)習(xí)控制問題的常用假設(shè)條件。
價形式式中i=1,2,…,N。將上式寫成矩陣形式,有
其中
文中采用如下形式的D-P 型迭代學(xué)習(xí)控制算法[14]
記Δuik(t)=uid(t)-uik(t),由(4)式可得
再記Δuk(t)=(Δu1k(t)TΔu2k(t)T…ΔuNk(t)T)T,則
注意到系統(tǒng)(1)與(3)等價,下面對系統(tǒng)(3)給出文中的主要結(jié)論及相應(yīng)證明。
定理1假設(shè)1、2 及(4)式成立,若可逆且存在增益矩陣Γ1、Γ2使得
證明因為可逆,系統(tǒng)(3)中第二式可化為
(7)式與(9)式相減,可得
(8)式與(10)式相減,可得
將(11)、(12)式代入(5)式,有
對(13)式兩端取λ-范數(shù),可得
將(8)式和(10)式兩端都對變量t由0到t積分,有
兩式相減,并利用假設(shè)2 得
上式兩端取2-范數(shù),有
上式兩端同乘e-λt,則
由λ-范數(shù)的定義知
結(jié)合(15)式和(16)式,可以得到
由于
即
從而
由2-范數(shù)和上確界范數(shù)的定義,可得
另一方面,(11)式結(jié)合(16)、(17)式,有
類似于(18)式的推導(dǎo),有
結(jié)合(18)、(19)式,可知
證畢。
考慮如下形式的廣義大型互聯(lián)線性系統(tǒng)
對給定的期望軌跡
取初始控制u10(t)=u20(t)=0。在學(xué)習(xí)算法(4)式的作用下,利用Mathematica 軟件進行仿真分析,得到圖1 和圖2。
圖1 x1k 的跟蹤誤差
圖2 x2k 的跟蹤誤差
圖1 和圖2 分別表示子系統(tǒng)1 和2 的狀態(tài)跟蹤誤差隨迭代次數(shù)變化曲線,從圖中可以看出,隨著迭代次數(shù)的增加,廣義大型互聯(lián)線性系統(tǒng)的各個子系統(tǒng)的狀態(tài)跟蹤誤差在學(xué)習(xí)算法(4)式的作用下沿迭代軸方向趨近于零。
文中研究一類廣義大型互聯(lián)線性系統(tǒng)的狀態(tài)跟蹤問題。利用矩陣奇異值分解的方法,將廣義大型互聯(lián)線性系統(tǒng)轉(zhuǎn)化為等價的微分代數(shù)系統(tǒng)。針對微分代數(shù)系統(tǒng),構(gòu)建得到一種D-P 型的迭代學(xué)習(xí)控制算法。理論分析表明,所給算法在一定條件下是收斂的,經(jīng)過不斷迭代,系統(tǒng)的狀態(tài)能漸近的跟蹤期望軌跡。同時,仿真算例也說明了算法的有效性。