張玉振,李 擎,張維存,楊宇航
北京科技大學自動化學院,北京 100083
魯棒和自適應兩個性能是控制理論追求的最高境界[1?2],多模型方法是實現(xiàn)魯棒自適應控制的一個重要途徑,多模型自適應控制主要包括切換和加權兩大類綜合方式,其不同的綜合策略關系著多模型的分解以及系統(tǒng)框架的構建.考慮到切換多模型自適應控制的研究已經(jīng)比較成熟,比如穩(wěn)定性分析、鎮(zhèn)定控制設計等方面[3?5],均取得了豐富的研究成果[6].相較而言,加權多模型自適應控制仍然存在較多問題,所以本文只關注加權多模型自適應控制.多模型的思想最初于20世紀60年代由Magill提出[7]并被應用于含不確定參數(shù)的隨機系統(tǒng)的狀態(tài)估計,即加權多模型自適應估計(multiple model adaptive estimation,MMAE).隨后,Lainiotis和Athans等[8?10]提出用多模型方法進行自適應控制,即加權多模型自適應控制(multiple model adaptive control,MMAC),其局部控制器采用線性二次高斯(linear quadratic Gaussian,LQG)控制.之后其應用范圍不斷擴大,包括在故障診斷[11]、醫(yī)療[12]、目標跟蹤[13]、航空[14]、過程控制[15]等領域的應用,且又不斷有一些相關的理論研究成果出現(xiàn)[16?18].近年來加權多模型自適應控制的研究又越來越多地受到人們的關注,比如,通過設計魯棒控制器作為其局部控制器,進而構成魯棒多模型自適應控制方法[1,19](包括收斂性分析[20]、模型集[21]、性能指標[22]以及應用[23]等方面研究),以及采用模糊規(guī)則的多模型自適應融合控制[24?25],等等.從國內(nèi)來講,學者們對加權多模型自適應控制的理論及相關應用的研究比較晚,特別是80年代以前幾乎是空白,1988年以后才有相關研究成果出現(xiàn)[26],后續(xù)不斷有相關應用成果[27?29]及理論研究進展[30?32].
加權多模型自適應控制,作為一種對切換型方法的延展,即“軟切換”,其與增益調(diào)度控制或基于Takagi-Sugeno(T-S)模型的模糊控制在某種程度上相類似.該方法對于存在有限多個參數(shù)不確定的隨機系統(tǒng)的控制非常適宜,并逐漸在各種領域開展研究,尤其是在航空領域的飛行控制,汽車領域的主動懸架控制和醫(yī)療領域的藥物輸入控制等方面應用,比如通過對輸入藥物速率進行加權多模型自適應控制,以達到調(diào)節(jié)患者平均動脈壓以及心輸出量的目的,并在動物試驗中獲得比早先采用的多重藥物控制器更佳的性能[12].此外,在復雜多變的太空環(huán)境下,空間機器人是具有高度非線性、強耦合和大范圍不確定性的復雜系統(tǒng),通過對柔性機械臂的加權多模型自適應控制,實現(xiàn)對運動位置的精確跟蹤以及柔性結構的振動抑制,滿足其精確靈活、強適應性的現(xiàn)實需求.
加權型多模型自適應控制系統(tǒng)的穩(wěn)定性問題曾經(jīng)是一個公認的難題,相關論述見文獻[1, 25?28, 31, 33].2010年以來,各種加權多模型自適應控制系統(tǒng)的穩(wěn)定性結果相繼出現(xiàn),尤其是基于虛擬等價系統(tǒng)理論的一般意義下的穩(wěn)定性分析,取得了一些進展.
關于經(jīng)典加權算法收斂性的理論研究見文獻[34?36],Lainiotis分割算法收斂性能分析見文獻[37],但由于經(jīng)典加權算法是基于Kalman濾波、動態(tài)假設檢驗以及貝葉斯后驗概率公式進行遞推計算的,因此分析復雜且要求條件比較苛刻,可以大致歸納為:各個模型所產(chǎn)生的輸出誤差信號需要滿足平穩(wěn)性、遍歷性,以及模型輸出誤差之間可以區(qū)分,細節(jié)見文獻[1].
本文首先介紹加權多模型自適應控制的發(fā)展歷史,然后給出最新的相關研究進展及其代表性工作,最后指出需要繼續(xù)研究的一些問題.
經(jīng)典多模型自適應控制(classical multiple model adaptive control,CMMAC)指的是早期出現(xiàn)的加權多模型自適應控制,其采用LQG策略設計局部控制器.其最主要的特點是系統(tǒng)狀態(tài)估計與控制是綁定的,具體而言,其局部控制器乃至全局控制器都要依賴于狀態(tài)估計進行設計.具體的系統(tǒng)原理[1]如圖1所示.
圖中KFi(Kalman filter)代表卡爾曼濾波器,i=1,···,N.由各局部的卡爾曼濾波器給出各自的狀態(tài)估計而整體的狀態(tài)估計為各個局部控制器按照線性二次增益計算各自的局部控制量?Gi為線性二次增益.而整體控制量為系統(tǒng)輸出為y(t).后驗概率估計器(posterior probability estimator,PPE)用于計算加權值Pi(t)[1,7].圖1中,Si為離線計算得到的第i個卡爾曼濾波器的穩(wěn)態(tài)殘差ri(t)的方差矩陣.實際上,經(jīng)典多模型自適應控制的加權算法完全繼承了加權多模型自適應估計的加權算法.
圖1 經(jīng)典加權多模型自適應控制系統(tǒng)框圖Fig.1 Block diagram for CMMAC
魯棒多模型自適應控制(robust multiple model adaptive control,RMMAC)仍然屬于加權多模型自適應控制,具體來說,它是在CMMAC的基礎上,結合了現(xiàn)代魯棒控制系統(tǒng)設計方法(包括H∞魯棒控制器設計方法,μ綜合法魯棒控制器設計方法等最新成果,其中H∞為定義在Hardy空間上的范數(shù),μ為結構奇異值)并利用MATLAB的相關工具來設計局部控制器,并對CMMAC的結構做了如下修改:CMMAC的局部控制器采用的是狀態(tài)反饋來產(chǎn)生局部控制量,而RMMAC的局部控制器采用的是基于μ綜合法設計的動態(tài)輸出反饋來產(chǎn)生局部控制量,從另一個方面來說,CMMAC中的卡爾曼濾波器既用于權值的計算(利用其產(chǎn)生的殘差序列),也用于局部控制器的狀態(tài)反饋控制(利用其狀態(tài)估計結果),而RMMAC中的卡爾曼濾波器只用于加權值的計算,而與局部控制器無關,這樣一來使得估計(辨識)子系統(tǒng)與控制部分隔離開來.RMMAC系統(tǒng)的原理[1]如圖2所示,圖中,Ki(t)為 局部控制器,i=1,···,N.
值得指出的是,RMMAC的加權算法與CMMAC的加權算法是完全一樣的,當然也和MMAE的加權算法完全一致.
文獻[1]的RMMAC結構圖及相關論述中,都忽略了一點:加權值只能在離散時刻進行計算得到Pi(k),必須經(jīng)過(零階)保持器才能得到連續(xù)的加權值Pi(t).
RMMAC和經(jīng)典加權自適應控制一樣,存在以下問題:
(1)由于采用了多個卡爾曼濾波器,使得計算過程繁瑣,并且需依賴于初始條件;
(2)閉環(huán)穩(wěn)定性難以分析;
(3)加權算法的收斂條件苛刻.
加權算法的收斂性難以分析并且要求條件較多,這并非RMMAC獨有的缺點,而是只要采用經(jīng)典加權算法都會有此問題存在.
為了克服基于Kalman濾波器、動態(tài)假設檢驗以及貝葉斯后驗概率公式的權值算法中存在的上述缺點,Kuipers和Baldi等提出采用模糊規(guī)則取代基于Kalman濾波和動態(tài)假設檢驗來計算權值的辦法,直接依據(jù)隸屬度函數(shù)來計算權值[24?25],此類方法實質(zhì)上是多個控制器間的“模糊融合(Fuzzy Fusion)”,其計算量相對減少,易于實現(xiàn).
該類方法根據(jù)參數(shù)辨識結果和模糊規(guī)則計算出加權值,再將加權值與各個局部控制器產(chǎn)生的局部控制信號進行加權融合,得到全局的控制輸出.每個局部控制器的設計與RMMAC一樣,也是基于H∞魯棒控制器設計方法或 μ綜合法魯棒控制器設計方法來設計的動態(tài)輸出補償器(控制器).采用模糊融合方法的MMAC系統(tǒng)原理[24]如圖3所示,圖中,θ(t)為系統(tǒng)辨識參數(shù).
圖2 魯棒多模型自適應控制系統(tǒng)框圖Fig.2 Block diagram for RMMAC
圖3 采用模糊融合的多模型自適應控制系統(tǒng)框圖Fig.3 Block diagram for MMAC using fuzzy fusion
但是,此類方法也有一定的問題存在,首先是離線獲取準確的模糊規(guī)則隸屬度函數(shù)并非易事;其次是該方法需要在線參數(shù)估計,因此為了參數(shù)估計的一致收斂性,需要附加持續(xù)激勵信號,這是控制系統(tǒng)所不希望的.
近年來,Zhuo和Narendra提出了在被控對象的多個模型參數(shù)上進行加權融合(凸組合),這可以理解為第一層自適應;然后根據(jù)融合后的模型設計自適應控制器,這是第二層自適應.這類方法實際上是在參數(shù)估計的層面上引進了加權思想,也取得了很好的理論和仿真實驗結果[38].文獻[39]在此基礎上設計了若干個在線辨識的模型和一個固定的模型,通過仿真研究驗證了控制系統(tǒng)的優(yōu)異性.此外,文獻[40?42]針對含有參數(shù)大范圍不確定性的隨機系統(tǒng)提出了新的加權算法和相應的加權多模型自適應控制系統(tǒng),并在文獻[43?44]中對該控制系統(tǒng)的穩(wěn)定性進行了分析,取得了令人滿意的仿真效果.同時,文獻[45]給出了相應獲得的實際應用成果.
隨著多模型和神經(jīng)網(wǎng)絡的不斷發(fā)展,文獻[46]提出了一種基于多模型和神經(jīng)網(wǎng)絡的非線性控制系統(tǒng)框架,但該系統(tǒng)全局輸入輸出有界的穩(wěn)定性條件較為苛刻,文獻[47?48]拓展了此類多模型自適應控制的適用范圍,文獻[49?50]針對一類非線性離散時間系統(tǒng),基于魯棒控制方法和神經(jīng)網(wǎng)絡設計相應的非線性自適應控制器,形成一種新型的多模型自適應控制,放寬了系統(tǒng)非線性項的條件.此外,文獻[51?53]給出了采用不同的神經(jīng)網(wǎng)絡結構設計相應的多模型自適應控制系統(tǒng),通過神經(jīng)網(wǎng)絡辨識未知動態(tài)系統(tǒng),建立自適應模型,然后將其與固定模型進行不同形式的組合,組成模型集,經(jīng)仿真實驗對比,體現(xiàn)了控制性能的提高.在上述的多模型自適應控制系統(tǒng)中,神經(jīng)網(wǎng)絡基本都被用于辨識,然后據(jù)此設計控制器,取得了一定的研究成果.然而,當神經(jīng)網(wǎng)絡直接作為控制器時,控制系統(tǒng)也能獲得良好性能,因此,通過對局部模型設計相應的神經(jīng)控制器,以加權和的形式進行融合,構成多神經(jīng)網(wǎng)絡自適應控制,雖然該方法仍然存在一些問題,但其是多模型自適應控制解決更加復雜的非線性系統(tǒng)的一種重要方法.
對于自適應容錯控制而言,當故障發(fā)生時,保證瞬態(tài)性能的良好是其控制系統(tǒng)的挑戰(zhàn)性問題.多模型自適應容錯控制系統(tǒng)是一種改善系統(tǒng)瞬態(tài)性能的重要方法[54],其通過適當?shù)募訖嗨惴ɑ蚯袚Q規(guī)則,確保故障后獲得最適宜的控制器[55?57],有效補償各種故障造成的不良影響,并不斷在飛行器控制中得到應用[58?59].文獻[60]提出了一種多層級多模型自適應方法,當故障發(fā)生時進行補償控制,通過不同層級覆蓋不同的故障模式(結構),參數(shù)區(qū)間和局部控制器的自適應增益更新,并在波音747系統(tǒng)的仿真中獲得了優(yōu)良的控制性能.文獻[61]針對直升機飛行操控系統(tǒng),采用基于多模型思想的直接自修復方法,保證了系統(tǒng)性能,并且在數(shù)值仿真和試驗平臺上取得了較好的控制效果.
加權多模型自適應控制系統(tǒng)主要由模型集、加權算法以及局部控制器三部分組成.其中,局部控制策略經(jīng)歷了從早期的LQG控制策略到現(xiàn)在的魯棒控制策略,實際上任意具有一定魯棒性的控制策略都可以被采用,鑒于涉及內(nèi)容太過廣泛,此部分不做過多闡述.對于模型集的選擇,其屬于建模問題,對此問題的研究主要涉及到模型差異度的度量問題[62].另外,簡單實用的加權算法和一般意義下的穩(wěn)定性分析也是系統(tǒng)的重要研究內(nèi)容.
(1)模型集.
關于模型集的建立,其構成形式由全部固定模型發(fā)展到含有自校正模型的模型庫,其建立策略也從根據(jù)先驗數(shù)據(jù)離線建模發(fā)展到通過在線學習動態(tài)優(yōu)化模型庫,從而在不斷更新模型庫的同時,有效控制模型數(shù)量,防止模型冗余[63].其中,利用模糊聚類學習算法是建立局部模型的一類重要方法[64?66],在此基礎上,文獻[67]利用在線數(shù)據(jù)進而實現(xiàn)局部模型參數(shù)的修正.此外,文獻[68]采用自適應混沌差分進化算法對模型數(shù)量和模型參數(shù)同時優(yōu)化,文獻[69]基于參數(shù)定位思想設計最優(yōu)參數(shù)子集,從而達到降低模型數(shù)量的目的.上述各種策略,實際上都是為了使模型集能夠有效地覆蓋并逼近被控對象而不斷發(fā)展的.
(2)加權算法.
在加權算法方面,從早期的加權算法[1,7]到后來的模糊融合算法[24?25],以及不斷改進的算法[70?71]都可以被采用,文獻[40]提出了新的加權算法,不再依靠Kalman濾波器和貝葉斯后驗概率公式,而是直接依據(jù)各個“局部”模型的在線“表現(xiàn)”(即模型輸出誤差)來計算權值,基本上克服了經(jīng)典加權算法的一些缺點,其簡單結構如圖4所示.圖中,yr(t)為系統(tǒng)參考輸入,w(t)為系統(tǒng)擾動.計算權值pi(t)的加權算法細節(jié)見文獻[40],每個局部控制器Ki(s)針對其相應的局部模型按極點配置或魯棒控制等方法進行設計.在此基礎上,文獻[41]在加權算法中迭代計算的快速收斂方面進行了改進,提高了加權算法的時效性.
圖4 加權多模型自適應控制系統(tǒng)框圖Fig.4 Block diagram for WMMAC
加權多模型自適應控制與基于T-S模型的模糊控制(采用并行補償算法)相比,二者都是根據(jù)若干局部模型相應地設計多個控制器,而全局控制器則由各個局部控制器加權得到,但基于TS模型的模糊控制系統(tǒng)多一個隸屬度函數(shù)的問題,而隸屬度函數(shù)的最終目的只是為了確定加權值,相比較而言,新型的加權多模型自適應控制方法更為直接且便于實施;另一方面,由于其采用的加權算法是根據(jù)每個模型“在線”表現(xiàn)的優(yōu)劣來決定相應控制器的權重,故而有理由相信這樣得到的權重值比基于T-S模型的模糊控制中依靠“離線”方法確定的隸屬度函數(shù)計算出來的權重值更加準確.當然,還應該指出,模糊控制的權重計算不是遞推的,對于被控對象的參數(shù)突變,其反應更快,并且避免了權值重置問題.因此,對于參數(shù)慢變且有隨機噪聲的控制問題,加權多模型自適應控制較為適宜,而對于參數(shù)快變且噪聲干擾較小或沒有噪聲的控制問題,切換多模型控制或者模糊控制更為合適.
(3)穩(wěn)定性分析.
加權多模型自適應控制系統(tǒng)的全閉環(huán)穩(wěn)定性分析一直以來是研究的難題.近些年來,該問題取得了一定的進展,文獻[72]針對離散時間隨機系統(tǒng),基于引入“駐留”時間的加權算法,取得了一些初步的穩(wěn)定性結果.但由于其策略的修改,使得系統(tǒng)整體結構已發(fā)生改變.此外,文獻[24?25]針對采用模糊融合方法的多模型自適應控制系統(tǒng),分析了穩(wěn)定性,文獻[38]給出了關于在參數(shù)估計層面上進行加權的控制系統(tǒng)的閉環(huán)穩(wěn)定性結果,但都從某方面改變了原始的加權多模型自適應控制系統(tǒng)結構,而原始系統(tǒng)的閉環(huán)穩(wěn)定性問題一直懸而未決.
最近,通過設計新的加權算法,并且采用一種新的自適應控制系統(tǒng)分析方法——虛擬等價系統(tǒng)方法,取得了一些成果.虛擬等價系統(tǒng)是一種輸入輸出意義上與原系統(tǒng)等價的系統(tǒng),將非線性主導(結構非線性)問題轉化為線性主導(結構線性,補償信號非線性).該方法最初在分析自校正控制系統(tǒng)的穩(wěn)定性[73?75]中提出,后來也在切換型多模型控制的系統(tǒng)分析中獲得滿意結果[76].文獻[40]首次給出了加權多模型自適應控制的穩(wěn)定性證明(針對線性時不變離散隨機被控對象),隨后,又不斷在各個方面對文獻[40]的結果進行了擴展,包括加權算法改進[41],被控對象范圍擴大[42?44](參數(shù)跳變系統(tǒng),連續(xù)系統(tǒng),有色噪聲系統(tǒng),非精確建模系統(tǒng)等).鑒于其中的加權多模型自適應控制僅是針對模型集由固定模型構成的情形,當模型集中不包含真實被控對象模型時,該控制系統(tǒng)的性能則有待提高.因此,通過構建含有自校正模型的加權多模型自適應控制系統(tǒng)[77],放寬了對模型集構建形式的約束,擴大了保證系統(tǒng)穩(wěn)定性、收斂性的理論適用范圍,從而為加權多模型控制的穩(wěn)定性分析提供了統(tǒng)一框架下的方法.
本文主要梳理了加權多模型自適應控制的發(fā)展歷程和研究現(xiàn)狀,概述了模型集構建、加權算法以及穩(wěn)定性分析的工作進展.考慮多模型系統(tǒng)涉及內(nèi)容太過廣泛和作者研究工作的興趣方向,綜述內(nèi)容難免不全面.對于加權多模型自適應控制而言,雖然已經(jīng)取得了不少研究成果,尤其是初步給出了全閉環(huán)系統(tǒng)的穩(wěn)定性證明,但是仍然有很多問題需要進一步解決.該領域未來研究方向包括以下幾個方面:
(1)模型集問題.現(xiàn)有針對模型集構建的研究成果中,若系統(tǒng)模型不確定參數(shù)向量是高維的且系統(tǒng)性能要求比較高,則模型數(shù)量會很大,造成系統(tǒng)的冗雜,難以滿足系統(tǒng)的期望性能和實用性.比如,文獻[1]采用依據(jù)性能指標相對于非自適應控制系統(tǒng)的改進程度(百分比)來確定模型數(shù)量,而文獻[62]采用了Vinnicombe測度[78]來決定模型數(shù)量.如何設計適當準則合理地構建精確模型集,是系統(tǒng)研究的難點所在,對提高系統(tǒng)性能、降低運行成本有著廣闊的研究前景.
(2)權值計算問題.當權值收斂以后,若系統(tǒng)發(fā)生變化,需要重置加權值,那么如何保證權值的重置既簡單快速又準確無誤,有待進一步研究;另外一種方法是設置權值的“死區(qū)”,即當權值達到某個閾值時,保持權值不變,避免權值重置,但是閾值的設置也缺乏相應的理論指導.如何科學設計快速準確的加權算法,使其滿足控制性能要求,對完善系統(tǒng)理論有著重要的現(xiàn)實意義.
(3)抗干擾問題.雖然文獻[40?41]等給出的最新加權算法有比較好的抗噪聲能力,但是從本質(zhì)上說,在算法所依據(jù)的指標函數(shù)中還是不可避免的引入了噪聲干擾,影響系統(tǒng)性能.如何設計簡單有效的指標函數(shù)乃至加權算法,對系統(tǒng)的實用性有著重要意義.
(4)穩(wěn)定性問題.現(xiàn)有穩(wěn)定性研究結果并不完善,需要擴展到時變非線性被控對象、多變量被控對象以及上述對象中含有一般噪聲的情形,諸多問題尚未解決,是未來研究的重點難點所在.