侯曉秋,陳志學(xué)
(1.黑龍江科技學(xué)院電氣與信息工程學(xué)院,黑龍江哈爾濱150027;2.中國(guó)兵器工業(yè)第205研究所,陜西西安710065)
自 1982 年 Billings等提出 NARMAX 模型[1]以來(lái),針對(duì)于NARMAX模型的辨識(shí)和控制問(wèn)題的研究已形成Billings學(xué)派,因人工神經(jīng)網(wǎng)絡(luò)可逼近任意非線性系統(tǒng),已提出許多控制算法,采用多模型逼近NARMAX模型的多模型自適應(yīng)控制算法,我國(guó)學(xué)者韓志剛,侯忠生提出的無(wú)模型控制,各種采用時(shí)變線性模型逼近NARMAX模型的控制算法,采用動(dòng)態(tài)切平面逼近NARMAX模型的控制算法等。文獻(xiàn)[2]給出的基于一步時(shí)滯情形的NARMAX模型的最小預(yù)測(cè)誤差自適應(yīng)預(yù)測(cè)控制器的準(zhǔn)則函數(shù)具有局限性,致使算法存在穩(wěn)態(tài)偏差,文獻(xiàn)[3]對(duì)文獻(xiàn)[2]的準(zhǔn)則函數(shù)進(jìn)行改進(jìn),所提出的控制算法無(wú)穩(wěn)偏,文獻(xiàn)[4]研究了NARMAX模型的多重時(shí)滯情形,文獻(xiàn)[2-4]的算法只適用于確定性情形,本文研究多重時(shí)滯隨機(jī)性NARMAX模型的自適應(yīng)預(yù)測(cè)控制問(wèn)題。
Billings等提出NARMAX模型:
其中:y(t)為系統(tǒng)輸出,y(t)∈R1;U(t)為系統(tǒng)的m 維輸入,U(t)∈Rm;ξ(t)為系統(tǒng)干擾量,ξ(t)∈R1;Y(t+d-1)為系統(tǒng) t+1 時(shí)刻至 t+d-1 時(shí)刻輸出的集合;Y(t)為系統(tǒng)到t時(shí)刻為止的輸出的集合,U(t-1)為系統(tǒng)到t-1時(shí)刻為止的輸入的集合;ξ(t+d)為系統(tǒng)止t+d時(shí)刻的干擾量的集合;θ為未知參數(shù);d為系統(tǒng)時(shí)滯,f(…)表示一般的非線性函數(shù)。因ξ(t)一般是無(wú)法測(cè)量的,故其在f(…)中出現(xiàn)的形式難以確定,所以上式NARMAX模型實(shí)用性差,這里將NARMAX模型的各種隨機(jī)干擾等效在系統(tǒng)的輸出端,當(dāng)?shù)刃У母蓴_為平穩(wěn)隨機(jī)序列時(shí),基于文獻(xiàn)[5]線性濾波和譜分解定理及成型濾波器原理構(gòu)成一非線性隨機(jī)系統(tǒng)模型:
其中:η(t)為平穩(wěn)隨機(jī)序列,且
其中:e(t)為零均值,方差為 σ2的白噪聲序列,而
這里假設(shè)n2,nc已知,A2(q-1)和C(q-1)為穩(wěn)定多項(xiàng)式。
假設(shè)1:系統(tǒng)(1)式輸入輸出可觀測(cè)的,可控制的,即對(duì)某一系統(tǒng)有界的期望輸出信號(hào),存在有界的可行控制輸入信號(hào),使得系統(tǒng)在此控制輸入信號(hào)的驅(qū)動(dòng)下,其輸出等于系統(tǒng)的期望輸出。
假設(shè)2:f(…)關(guān)于Y(t+d-1)及U(t)的偏導(dǎo)數(shù)是連續(xù)的,且各偏導(dǎo)數(shù)有界。
假設(shè)3:由泰勒展開(kāi)公式,在工作點(diǎn)Y0(t+d-1),U0(t)處用線性的動(dòng)態(tài)切平面去逼近一般的非線性系統(tǒng)式(1)時(shí),假設(shè)有:
其中:
這里,假設(shè)3中的y0(t),U0(t)一般可為:
假設(shè) 4:d、n2、nc,已知。
假設(shè)1-3對(duì)多數(shù)非線性系統(tǒng)成立的分析見(jiàn)文獻(xiàn)[4]。
在工作點(diǎn)Y0(t+d-1),U0(t)處對(duì)式(1)的非線性系統(tǒng)用動(dòng)態(tài)切平面逼近,由一階泰勒展開(kāi)公式得:
其中:
而
整理寫(xiě)成,
其中:
而
這里,D(t)在t時(shí)刻是一個(gè)已知的量。
將式(2)代入式(8)整理得:
其中:
對(duì)于式(12),定義輔助輸出 s(t+d)為,
其中:
可用如下引理闡述廣義最優(yōu)預(yù)測(cè):
引理1:廣義最優(yōu)預(yù)測(cè),滿足預(yù)測(cè)誤差方差,
其中:G(q-1)、F(q-1)滿足以下阿斯特羅姆恒等式,
式中:
證明:參考文獻(xiàn)[6]可證。
控制輸入準(zhǔn)則函數(shù)為,
而
且
定理1:對(duì)于非線性隨機(jī)系統(tǒng)式(1),滿足假設(shè)條件1-4,基于式(24)控制輸入準(zhǔn)則函數(shù)的預(yù)測(cè)控制器算法為:
其中
證明:參考文獻(xiàn)[2、3、4、6]證明如下:
上式等價(jià)于如下準(zhǔn)則函數(shù):
由 J*[U(t)]對(duì) U(t)求偏導(dǎo),
由式(19)得:
整理得:
得:
可得:
[7]的矩陣反演公式得:
式(34)代入式(33)即得式(28)算法。
當(dāng)式(1)模型參數(shù)未知時(shí),可采用文獻(xiàn)[8]的非線性參數(shù)估計(jì)算法估計(jì)其值,結(jié)合引理1的廣義最優(yōu)預(yù)測(cè)算法和定理1的預(yù)測(cè)控制算法,構(gòu)成自適應(yīng)預(yù)測(cè)控制。
已知系統(tǒng)的形式為:
其中:θ1,θ2,a1的真值為:
U0(t),y0(t)選取如下:
參考輸入為:
結(jié)合現(xiàn)階段工程造價(jià)工作的信息化發(fā)展,雖然已經(jīng)得到了絕大部分企業(yè)的認(rèn)同,也積極進(jìn)行了多方面的嘗試,但是在具體落實(shí)中卻同樣也存在著多方面的缺陷和不足,具體問(wèn)題表現(xiàn)如下。
u1(t)及u2(t)的限幅為:
白噪聲,
參考文獻(xiàn)[3,4]的魯棒控制策略,使系統(tǒng)無(wú)穩(wěn)偏,且控制輸入收斂于以原點(diǎn)為中心的變化域內(nèi),
采用文[8]的參數(shù)估計(jì)算法,仿真結(jié)果如圖1、圖2、圖3所示。由圖1可知系統(tǒng)的輸出響應(yīng)曲線在0≤t≤100時(shí)不理想,這是由于算法開(kāi)始時(shí)系統(tǒng)未知參數(shù)偏離其真值過(guò)大造成的,但系統(tǒng)能穩(wěn)定運(yùn)行,說(shuō)明算法的魯棒性好。
圖1 輸出響應(yīng)曲線
圖2 控制信號(hào)u1(t)的變化曲線
圖3 控制信號(hào)u2(t)的變化曲線
文中研究了一類(lèi)非線性隨機(jī)系統(tǒng)的控制問(wèn)題,所提出的模型較Billings等提出NARMAX模型具有實(shí)用性,控制算法適用于時(shí)變隨機(jī)系統(tǒng),且系統(tǒng)無(wú)穩(wěn)態(tài)偏差,控制輸入收斂于以原點(diǎn)為中心的變化域內(nèi),具有應(yīng)用參考價(jià)值,進(jìn)一步可研究其自適應(yīng)廣義預(yù)測(cè)控制算法和多變量情形。
參考文獻(xiàn):
[1]Billings,S.A.,and Leontaritis,I.J.Parmeter estimation techniques for nonlineat systems [J],6th IFAC Symp.Ident,and Syst.Par.Est.,1982:427-433.
[2]侯忠生.非參數(shù)模型及其自適應(yīng)控制[M].北京:科學(xué)出版社,1999,98-101.
[3]侯曉秋.非線性確定性系統(tǒng)的魯棒自適應(yīng)控制器[J].黑龍江科技學(xué)院學(xué)報(bào),2003,13(2):54-57.
[4]侯曉秋.多重時(shí)滯非線性系統(tǒng)的自適應(yīng)預(yù)測(cè)控制[J].黑龍江科技學(xué)院學(xué)報(bào),2008,18(2):137-139.
[5]韓曾晉.自適應(yīng)控制[M].北京:清華大學(xué)出版社,1995.70-76.
[6]Clarke D W ,Gawthrop P J.Self-tuning controller[J].Proc.IEE,1975,122(9):929-934.
[7]方崇智,蕭德云.過(guò)程辨識(shí)[M].北京:清華大學(xué)出版社,1994.146-147.
[8]侯曉秋.非線性隨機(jī)系統(tǒng)的具有遺忘因子的遞推最小二乘法[J].黑龍江科技學(xué)院學(xué)報(bào),2008,18(4):306-309.