何之煜,徐 寧
(中國鐵道科學研究院集團有限公司通信信號研究所,北京100081)
高速列車自動駕駛系統(tǒng)(Automatic Train Operation,ATO)是未來智能高速鐵路發(fā)展的關(guān)鍵技術(shù)之一[1],然而,高速列車運行速度快,運行環(huán)境復雜多變,系統(tǒng)受內(nèi)部和外部未知擾動影響,呈現(xiàn)出快時變、強非線性的特征,控制器的設(shè)計仍然是一個難點.
列車自動駕駛研究已取得大量成果,現(xiàn)有控制方法多以反饋思想構(gòu)造控制律,通過列車運行狀態(tài)信息的偏差產(chǎn)生控制輸入,忽略了高速列車運行過程中的一個重要的特征——高度重復性,具體體現(xiàn)在運行環(huán)境的重復性,運行計劃的重復性,運行目標的重復性和列車動力學模型的重復性.如何有效利用這些重復性信息處理時變、非線性的不確定系統(tǒng)的跟蹤控制問題,是目前亟待解決的問題.
迭代學習控制(Iterative Learning Control,ILC)是解決重復運動系統(tǒng)的跟蹤控制問題的最有效方法之一,基本原理是通過前一次或幾次的跟蹤誤差來修正當前迭代次的控制輸入,更精確地跟蹤期望運行軌跡.在列車自動運行控制領(lǐng)域:文獻[2]首次將迭代學習控制引入列車自動駕駛系統(tǒng)控制問題的研究中;文獻[3]將終端迭代學習控制用于列車進站停車的控制中,根據(jù)前次迭代終端停車誤差更新當前迭代次的控制輸入,最終跟蹤誤差收斂到一個很小的鄰域內(nèi);文獻[4]設(shè)計了反饋—前饋迭代學習控制器,利用反饋控制在時域?qū)Ω櫿`差的修正,提高了跟蹤的收斂速度和精度.以上研究考慮了系統(tǒng)初態(tài)擾動和執(zhí)行器控制輸入飽和的情況,但沒有考慮列車復雜運行環(huán)境導致阻力參數(shù)的不確定性,以及在高速運行狀態(tài)下列車等效重量變化對列車控制性能的影響.
列車運行速度不斷提高,其實際運行的動態(tài)環(huán)境也越來越復雜.時變非線性的外部擾動導致列車動力學模型參數(shù)發(fā)生攝動,對控制器的設(shè)計帶來困難.高速列車的控制研究中,通常將阻力參數(shù)系數(shù)視為恒值[3-5],這顯然不符合控制器高精度跟蹤控制的要求.此外,列車運行阻力參數(shù)系數(shù)的估計也有大量的研究[6-7].文獻[8]考慮速度延時和輸入受限的情況,建立列車動力學模型,借助Lyapunov-Krasovskii函數(shù),設(shè)計了自適應(yīng)迭代學習控制器.文獻[9]設(shè)計了一個動態(tài)建模的迭代學習控制算法,通過遞推最小二乘法辨識阻力系數(shù),利用范數(shù)最優(yōu)理論,實現(xiàn)模型辨識誤差和跟蹤控制誤差的2-范數(shù)收斂.
基于以上分析,針對高速列車自動駕駛系統(tǒng)這一快時變、強非線性的復雜控制系統(tǒng),同時存在外部擾動、輸入受限等因素的影響,根據(jù)系統(tǒng)對期望軌跡的跟蹤誤差,用迭代學習控制理論更新阻力參數(shù)系數(shù),用飽和函數(shù)約束系統(tǒng)控制輸入在合理的范圍內(nèi),在迭代域上對期望參數(shù)實現(xiàn)漸進逼近,控制系統(tǒng)最終能夠完全跟蹤上期望軌跡.基于Lyapunov函數(shù)設(shè)計迭代學習控制律,并對其收斂性進行證明,通過計算機仿真,驗證所提出算法的有效性.
不失一般性,連續(xù)時間的非線性系統(tǒng)模型為
式中:i為系統(tǒng)重復運行次數(shù),i∈N-;t為時間變量;xk,i(t)為系統(tǒng)第i次迭代k階的狀態(tài)信息;,i(t)為系統(tǒng)狀態(tài)信息xk,i(t)的一階導數(shù);K為系統(tǒng)的階數(shù);θi(t)為系統(tǒng)模型系數(shù)向量;ξi(t)是系統(tǒng)模型參數(shù)向量;b(t)是系統(tǒng)的未知輸入增益;ui(t)是控制輸入量;di(t)是未知時變的外部擾動.
為方便控制器設(shè)計,給出以下假設(shè):
假設(shè)1系統(tǒng)在每次運行前滿足相同的初態(tài)條件.
假設(shè)2非線性連續(xù)函數(shù)b(·)滿足
式中:g(·)為非負連續(xù)函數(shù);α1,α2分別為函數(shù)b(·)的兩個狀態(tài)信息變量
假設(shè)3存在一個最優(yōu)的控制序列ud,使得系統(tǒng)在有限時間t∈[ 0,T](T為給定的系統(tǒng)運行時間)內(nèi),可以完全跟蹤期望的運行軌跡.
本文控制目標是,對于給定的系統(tǒng)期望運行曲線xd,在初態(tài)一致的情況下,利用迭代學習控制方法,找到一個最優(yōu)的控制輸入序列ud,當i趨于無窮時,跟蹤誤差能夠收斂到0.
定義系統(tǒng)跟蹤誤差為
式中:xk,d(t)為系統(tǒng)k階向量期望的狀態(tài)信息.
定義擴展誤差為
式中:c1,c2, …為Hurwitz多項式的系數(shù),為正實數(shù);c為多項式系數(shù)集合的向量;ei(t)為系統(tǒng)跟蹤誤差向量ek,i(t)集合的向量.
為處理非線性系統(tǒng)輸入受限問題,將式(1)改寫為
為方便控制器收斂性分析,給出以下性質(zhì):
性質(zhì) 1[9]對于a,b∈Rm,如果參數(shù)a滿足,那么,有
對于時變、非線性復雜系統(tǒng)式(6),給出所設(shè)計控制律的收斂性分析,下述定理是本文的主要結(jié)論.
定理1針對非線性系統(tǒng)式(6)執(zhí)行重復運行任務(wù)時,基于迭代學習控制理論,應(yīng)用所設(shè)計的控制律和參數(shù)更新律,當?shù)螖?shù)i趨于無窮時,對于t∈[ 0,T],跟蹤誤差逐漸趨于0,閉環(huán)系統(tǒng)狀態(tài)xi有界.
證明定義類Lyapunov的復合能量函數(shù)為
對式(14)的第1項Lyaounov函數(shù)進行求解,結(jié)合迭代學習控制律式(10),將函數(shù)重寫為
由系統(tǒng)模型式(1)和擴展誤差式(4)可知
從而,證明了復合能量函數(shù)Ei沿迭代軸的差分負定性.接下來,若是證明了E0(t)是有界的,那么Ei(t)也是有界的.
令i=0,對式(14)關(guān)于時間t求導,并結(jié)合式(16)和式(17)的結(jié)論,得
即系統(tǒng)跟蹤誤差隨迭代軸逐漸收斂到0.
迭代學習控制目標的可達性可以描述為存在一系列的控制輸入ud(t),使得系統(tǒng)可以完全跟蹤上期望運行曲線.那么,對于t∈[0 ,T],系統(tǒng)狀態(tài)xd(t)是有界的.又由于系統(tǒng)實際的控制狀態(tài)可以描述為xi=xd+ei,根據(jù)ei的有界性,可知,系統(tǒng)狀態(tài)xi(t)也是有界的.
對所提出的自適應(yīng)迭代學習控制算法進行仿真驗證,充分考慮外部擾動、系統(tǒng)受限,以及等效質(zhì)量攝動的情況.仿真線路長度為183.2 km,列車計劃運行時間為2 700 s,列車滿載重量為530 t,時變外部擾動在有界域內(nèi)隨機分布,其上界設(shè)置為0.03 N/kg.如圖1所示,給出列車區(qū)間運行的期望速度和期望位移曲線圖.
圖1 列車運行期望速度和距離曲線圖Fig.1 Desired speed and distance profiles of train operation
根據(jù)式(1),列車動力學模型可以表示為
式中:x1,i為列車運行距離(km);x2,i是列車運行速度(km/h);θi是列車阻力模型系數(shù);ξi是列車阻力模型參數(shù)向量,;M是列車的質(zhì)量(t);γ(t)是列車時變的回轉(zhuǎn)質(zhì)量系數(shù);ui是列車輸入的牽引/制動力(kN);di是外部時變的未知擾動(N/kg).
本文提出的自適應(yīng)迭代學習控制算法參數(shù)設(shè)置如下:Γ=[0.002,0.000 4,0.000 000 4]T,η=2.4,阻力系數(shù)上界
為便于說明,將PID控制算法和D型迭代學習控制算法對列車運行期望曲線跟蹤性能與本文提出的算法進行比較,如圖2~圖4所示.可以看出:PID控制是基于時間域的反饋控制,在目標曲線工況轉(zhuǎn)換時,出現(xiàn)較大的暫態(tài),不利于列車平穩(wěn)運行;D型迭代學習控制則是基于迭代域的反饋控制,雖然能夠?qū)W習列車運行的重復性信息,速度曲線隨迭代次數(shù)逐漸逼近參考曲線,但收斂速度較慢,跟蹤誤差較大;本文提出的自適應(yīng)迭代學習算法,既能基于迭代域?qū)W習列車運行的重復性信息,也能在時間域上對列車進行反饋控制,實現(xiàn)對期望曲線的精確跟蹤.
圖2 PID控制曲線圖Fig.2 PID control profile
圖3 D型迭代學習控制曲線圖Fig.3 D-type iteration learning control profiles
圖4 自適應(yīng)迭代學習控制曲線圖Fig.4 Adaptive iteration learning control profiles
圖5和圖6給出3種算法的距離和速度跟蹤均方根誤差曲線圖.可以看出,本文所提出的自適應(yīng)迭代學習控制算法具有較高的跟蹤精度和較快的收斂速度,能夠快速實現(xiàn)對期望速度曲線的精確跟蹤.
為進一步驗證算法的有效性,基于實驗室CTCS-3+ATO仿真測試環(huán)境,選取京沈客運專線(遼寧段)中的阜新站—新民北站線路,以實際運營的某車型作為仿真對象.線路總長97.9 km,計劃運行時間1 320 s,其中,設(shè)置了一段長度為4 km的250 km/h的固定限速路段.執(zhí)行上述任務(wù),重復迭代40次,算法的設(shè)置參數(shù)與4.1節(jié)內(nèi)容相同.
圖5 3種算法的距離跟蹤誤差對比圖Fig.5 Comparison of distance tracking error profiles
圖6 3種算法的速度跟蹤誤差對比圖Fig.6 Comparison of speed tracking error profiles
圖7給出所提出算法在第10、20次迭代與現(xiàn)有算法對期望曲線的跟蹤性能對比.可以看出,現(xiàn)有算法在列車由牽引工況進入巡航工況時,會出現(xiàn)較大的暫態(tài),而本文提出的自適應(yīng)迭代學習控制算法通過對列車運行參數(shù)的學習,能夠控制列車的運行逐漸收斂到期望曲線上.
圖7 所提算法與現(xiàn)有算法在跟蹤曲線上的對比Fig.7 Comparison of tracking profiles between proposed and existing algorithms
圖8和圖9給出實驗中列車對期望軌跡跟蹤的速度和距離誤差隨迭代域變化的曲線與現(xiàn)有算法的對比,以均方根誤差表征.可以看出:所提算法在速度和距離的跟蹤性能上均具有較高的精度和收斂速度;在第15次迭代時,速度跟蹤誤差達到0.01 m/s,距離跟蹤誤差則降到1 m.
圖8 兩種算法的距離跟蹤誤差對比圖Fig.8 Comparison of distance tracking error profile
圖9 兩種算法的速度跟蹤誤差對比圖Fig.9 Comparison of speed tracking error profiles
本文以高速列車自動駕駛系統(tǒng)作為研究對象,考慮其受到外部擾動、系統(tǒng)受限的情況,設(shè)計自適應(yīng)迭代學習控制律和參數(shù)更新律,通過迭代域的學習和時間域的反饋共同作用輸出系統(tǒng)的控制輸入,并基于Lyapunov函數(shù)構(gòu)造復合能量函數(shù),證明了所提算法的收斂性和穩(wěn)定性.仿真結(jié)果表明,本文提出的自適應(yīng)迭代學習控制算法對列車期望曲線的跟蹤具有較快的收斂速度和較高的跟蹤精度,具有魯棒性強、穩(wěn)定性高、實現(xiàn)方便等優(yōu)勢,有較好的工程應(yīng)用參考意義.