余志同, 傅文淵
(1. 華僑大學(xué) 信息科學(xué)與工程學(xué)院, 福建 廈門 361021; 2. 華僑大學(xué) 廈門市專用集成電路系統(tǒng)重點實驗室, 福建 廈門 361008; 3. 華僑大學(xué) 福建省電機控制與系統(tǒng)優(yōu)化調(diào)度工程技術(shù)研究中心, 福建 廈門 361021)
迭代學(xué)習(xí)控制(ILC)是針對有限時間內(nèi)具有重復(fù)運行特性被控系統(tǒng)的一種有效控制方法[1].經(jīng)過三十余年的發(fā)展,ILC已成功應(yīng)用于單輪式移動機器人[2]、機器人操縱器[3]、工業(yè)打印機[4]、原子力顯微鏡[5]和柔性微型飛行器[6]等研究領(lǐng)域.目前,ILC的研究成果多集中于整數(shù)階控制系統(tǒng)或整數(shù)階的ILC學(xué)習(xí)算法[7-14].然而, 在實際工業(yè)生產(chǎn)中,分?jǐn)?shù)階控制系統(tǒng)更符合實際要求[15],故研究分?jǐn)?shù)階的迭代學(xué)習(xí)控制(FO-ILC)具有理論意義和現(xiàn)實意義.Li等[16]針對線性時變系統(tǒng),提出帶有初始狀態(tài)更新的FO-ILC算法,通過Dα型分?jǐn)?shù)階學(xué)習(xí)律更新每次迭代的初始狀態(tài),實現(xiàn)變初始狀態(tài)迭代學(xué)習(xí)控制.Zhao等[17]針對線性時變系統(tǒng),提出帶有初始狀態(tài)更新和系統(tǒng)輸入更新的FO-ILC算法,該方法有效提高了ILC誤差收斂速度.Lü等[18]針對分?jǐn)?shù)階多智能體系統(tǒng)的協(xié)同一致性跟蹤問題,提出分布式FO-ILC算法.Li[19]針對分?jǐn)?shù)階線性時不變系統(tǒng),提出一階和二階的分?jǐn)?shù)階PID型ILC策略.Liu等[20]對分?jǐn)?shù)階微分系統(tǒng)提出脈沖補償ILC.FO-ILC與其他控制策略結(jié)合的混合控制方法取得了較大的研究進展[21-24].
在ILC設(shè)計中,被控系統(tǒng)容易出現(xiàn)高頻段的相位滯后[25].為了解決該問題,文獻[26-27]提出基于連續(xù)系統(tǒng)和離散系統(tǒng)的相位超前迭代學(xué)習(xí)控制(LPL-ILC)方案,通過引入簡單的線性相位超前補償環(huán)節(jié),解決被控系統(tǒng)出現(xiàn)高頻段相位滯后的問題,擴大了系統(tǒng)可學(xué)習(xí)的帶寬.Moore等[28]針對離散系統(tǒng)引入可變增益.潘雪等[29]提出一種分?jǐn)?shù)線性相位超前補償?shù)鷮W(xué)習(xí)控制方法,將線性相位超前補償環(huán)節(jié)由整數(shù)冪改為分?jǐn)?shù)冪,并在算法實現(xiàn)過程中利用拉格朗日插值法近似逼近分?jǐn)?shù)冪.這類基于分?jǐn)?shù)階ILC的設(shè)計方法是間接的[30-31],ILC離散化算法的引入會增大ILC設(shè)計的復(fù)雜度.為了進一步提高控制效果,本文提出一種基于線性離散時不變系統(tǒng)的分?jǐn)?shù)階相位校正迭代學(xué)習(xí)控制(FOPC-ILC)算法.
Grünwald-Letnikov分?jǐn)?shù)階積分定義為
(1)
Grünwald-Letnikov分?jǐn)?shù)階微分定義為
(2)
式(1),(2)中:t0為初始時刻;t為隨機時刻;h為時間步長;j=1,2,…;Dα(·)為α階微分,α∈(0,1);[·]表示取整.
由式(2)可推導(dǎo)出分?jǐn)?shù)階微分?jǐn)?shù)值表達式為
(3)
式(3)的Z域表達式為
.
(4)
式(3)中:F(z)為f(t)的Z域表達式;z-jh為j次頻域分量.
迭代學(xué)習(xí)控制的主要目的是通過ILC學(xué)習(xí)律修正系統(tǒng)輸入,使系統(tǒng)輸出能跟蹤到期望輸出.文中討論的單輸入單輸出(SISO)線性離散時不變系統(tǒng)方程為
(5)
式(5)中:n為系統(tǒng)運行時間,n∈[0,N];k為迭代次數(shù);xk(n),uk(n),yk(n)分別為系統(tǒng)第k次迭代的狀態(tài)、輸入和輸出;wk(n)為系統(tǒng)第k次迭代的隨機干擾;A~D均為系數(shù)矩陣.
對式(5)兩邊同時進行Z變換,可得系統(tǒng)在Z域上表達式,即
(6)
式(6)中:z為頻域分量;Xk(z),Uk(z),Yk(z)分別為系統(tǒng)第k次迭代的狀態(tài)、輸入和輸出的Z域表達式;Wk(z)為 第k次迭代的隨機干擾Z域表達式.
線性離散時不變系統(tǒng)滿足以下3個假設(shè).
1) 假設(shè)1.每一次迭代的初始狀態(tài)都相同,且xk(0)=0.
2) 假設(shè)2.|ΔWk(z)|=|Wk+1(z)-Wk(z)|≤δ,δ為一常數(shù).
3) 假設(shè)3.對于系統(tǒng)(5),(6),存在唯一的期望系統(tǒng)狀態(tài),分別為xd(n),Xd(z),存在唯一的期望系統(tǒng)輸入,分別為ud(n),Ud(z),有
(7)
(8)
式(7),(8)中:yd(n)為期望系統(tǒng)輸出;Yd(z)為期望系統(tǒng)輸出的Z域表達式.
定義ILC跟蹤誤差表達式為
ek(n)=yd(n)-yk(n).
(9)
式(9)的Z域表達式為
Ek(z)=Yd(z)-Yk(z).
(10)
根據(jù)分?jǐn)?shù)階微分?jǐn)?shù)值算法給出分?jǐn)?shù)階相位校正開環(huán)ILC的收斂條件及其證明過程.根據(jù)式(3),(4),提出時域開環(huán)學(xué)習(xí)律,即
(11)
式(11)中:L為ILC學(xué)習(xí)增益;λ為超前拍次.
對式(11)進行Z變換,可得其Z域?qū)W習(xí)律,即
(12)
定理1針對線性離散時不變系統(tǒng)(式(5),(6)),在假設(shè)1~3的條件下,采用FOPC-ILC開環(huán)學(xué)習(xí)律(式(11),(12)),如果ILC學(xué)習(xí)增益L滿足
(13)
證明:由式(8)可得
Yk(z)=(C(z-A)-1B+D)Uk(z)+C(zI-A)-1Wk(z)=Hp(z)Uk(z)+C(zI-A)-1Wk(z).
(14)
式(14)中:
Hp(z)=C(z-A)-1B+D.
(15)
聯(lián)合式(8),(10),可得
(16)
將式(12)代入式(16),可得
(17)
對式(17)兩邊同時取模,并由復(fù)數(shù)模的性質(zhì)可得
(18)
對式(18)進行k次迭代,可得
(19)
則ILC誤差收斂于隨機擾動界,定理1得證.
閉環(huán)學(xué)習(xí)律為
(20)
式(20)的Z域表達式為
(21)
定理2針對線性離散時不變系統(tǒng)(式(6),(7)),在假設(shè)1~3的條件下,采用FOPC-ILC閉環(huán)學(xué)習(xí)律(式(20),(21)),如果滿足
(22)
那么,
證明:與定理1的證明過程相同,將式(21)代入式(16),可得
(23)
對式(23)兩邊同時取模,可得
(24)
對式(24)進行k次迭代,可得
(25)
則ILC跟蹤誤差收斂于隨機擾動,定理2得證.
通過實例,仿真驗證文中算法的有效性.被控系統(tǒng)的傳遞函數(shù)為
(26)
期望系統(tǒng)輸出為
yd(n)=1-exp(-n).
(27)
相關(guān)參數(shù)設(shè)置如下:初始輸入u0(n)=0;wk(t)采用隨機數(shù)模擬隨機擾動;相位校正階數(shù)γ=2.5;根據(jù)定理1,2,確定ILC學(xué)習(xí)增益L=0.6.采用誤差均方根(RMS)量化跟蹤誤差,有文中算法和文獻[29]的開、閉環(huán)學(xué)習(xí)律的跟蹤軌跡和跟蹤誤差的仿真結(jié)果,如圖1~8所示.圖1~8中:y(n)為系統(tǒng)輸出;y5(n)為系統(tǒng)迭代5次的輸出,其他表示類似.
圖1 文中算法開環(huán)學(xué)習(xí)律的跟蹤軌跡 圖2 文中算法開環(huán)學(xué)習(xí)律的跟蹤誤差 Fig.1 Tracking trajectory of open loop learning law of proposed algorithm Fig.2 Tracking error of open looplearning law of proposed algorithm
圖3 文中算法閉環(huán)學(xué)習(xí)律的跟蹤軌跡 圖4 文中算法閉環(huán)學(xué)習(xí)律的跟蹤誤差 Fig.3 Tracking trajectory of closed loop learning law of proposed algorithm Fig.4 Tracking error of closed loop learning law of proposed algorithm
圖5 文獻[29]開環(huán)學(xué)習(xí)律的跟蹤軌跡 圖6 文獻[29]開環(huán)學(xué)習(xí)律的跟蹤誤差Fig.5 Tracking trajectory of open loop learning law of reference [29] Fig.6 Tracking error of open loop learning law of reference [29]
圖7 文獻[29]閉環(huán)學(xué)習(xí)律的跟蹤軌跡 圖8 文獻[29]閉環(huán)學(xué)習(xí)律的跟蹤誤差Fig.7 Tracking trajectory of closed loop learning law of reference [29] Fig.8 Tracking error of closed loop learning law of reference [29]
(28)
由圖1~8可知:無論采用文中算法開、閉環(huán)學(xué)習(xí)律,還是采用文獻[29]開、閉環(huán)學(xué)習(xí)律(LPL-ILC),在一定的迭代次數(shù)后,都能使系統(tǒng)輸出跟蹤到期望軌跡(期望輸出),從而保證跟蹤誤差的單調(diào)收斂.由圖2可知:文中算法開環(huán)學(xué)習(xí)律跟蹤誤差約穩(wěn)定收斂于0.009 0,誤差波動范圍為0.007 5~0.009 8.由圖4可知:文中算法閉環(huán)學(xué)習(xí)律跟蹤誤差約穩(wěn)定收斂于0.005 8,誤差波動范圍為0.005 0~0.006 4.由圖6,8可知:文獻[29]開、閉環(huán)學(xué)習(xí)律跟蹤誤差約穩(wěn)定收斂于0.010 0,誤差波動范圍分別為0.008 0~0.011 9,0.008 4~0.012 0.由圖2,4,6,8可知:文中算法的跟蹤誤差收斂精度更高,且誤差波動范圍更小.由圖1,3,5,7可知:采用文中算法開環(huán)學(xué)習(xí)率、文中算法閉環(huán)學(xué)習(xí)率、文獻[29]開環(huán)學(xué)習(xí)律、文獻[29]閉環(huán)學(xué)習(xí)律,分別在迭代次數(shù)為第50,5,50,40次時,跟蹤誤差達到穩(wěn)定狀態(tài),系統(tǒng)輸出達到期望軌跡;采用閉環(huán)學(xué)習(xí)律的收斂速度快于開環(huán)學(xué)習(xí)律的;采用文中算法閉環(huán)學(xué)習(xí)律的收斂速度最快.
綜上可知,文中算法不僅解決了系統(tǒng)跟蹤過程無法單調(diào)收斂的問題,而且提高了跟蹤誤差的收斂速度和收斂精度,其中,文中算法閉環(huán)學(xué)習(xí)律對跟蹤誤差的收斂速度和收斂精度的提高效果更為顯著.
基于線性離散時間系統(tǒng),提出一種分?jǐn)?shù)階相位校正迭代學(xué)習(xí)控制算法.相較于FO-ILC算法,文中算法避免了ILC算法的離散化過程,可保證算法理論分析和實現(xiàn)過程的一致性.由仿真結(jié)果可知,文中算法具有先進性和有效性,可提高跟蹤誤差的收斂速度和收斂精度,特別地,F(xiàn)OPC-ILC閉環(huán)學(xué)習(xí)律對跟蹤誤差的收斂速度和收斂精度的提高效果更為顯著.