龔正鋒,李麗娟
(南京工業(yè)大學 電氣工程與控制科學學院,江蘇 南京 211816)
模型預測控制(model predictive control,MPC)是在過程控制領域得到大量推廣應用的控制策略,一直被高度關注和廣泛研究[1]。預測控制系統(tǒng)投運后一定時期內(nèi)由于設備老化、催化劑失活等問題都會出現(xiàn)控制性能衰減。控制器參數(shù)整定是控制器性能衰減的主要解決方法,控制器參數(shù)對閉環(huán)性能有重要影響。學者們通過對參數(shù)之間的關系,參數(shù)對系統(tǒng)性能的影響,參數(shù)整定的準則、方法等方面的分析,逐步推動了參數(shù)整定研究的進展?,F(xiàn)有的關于控制器參數(shù)整定方法超過200種[2]。谷澤坤等、丁寶蒼等[3-7]給出了一些控制器參數(shù)整定的方法與原則。這些研究方法和原則均是針對離線參數(shù)整定,它的優(yōu)勢在于提高了系統(tǒng)在投運初期的控制性能,參數(shù)整定的效率大大提高,但是在系統(tǒng)投運后,若存在自身變化以及環(huán)境等問題的影響,原本的控制器參數(shù)將會導致系統(tǒng)閉環(huán)性能衰減。
針對上述控制器參數(shù)整定文獻存在的問題,本文提出一種針對惡化源的控制器參數(shù)整定方法,通過推導分析系統(tǒng)的最優(yōu)控制律,引出與其相關的各項系統(tǒng)性能并給出對應的性能診斷指標,構造各項性能指標對應的控制器參數(shù)整定的目標優(yōu)化函數(shù)。通過評估結(jié)果判斷出惡化源,選擇對應的目標函數(shù),用粒子群算法實現(xiàn)控制器參數(shù)整定。為了防止算法陷入局部最優(yōu)以及實現(xiàn)控制器參數(shù)中整型參數(shù)P、M的整定,本文改進了算法中的慣性因子和位置參數(shù)。構造的目標函數(shù)和改進的粒子群算法實現(xiàn)了在得到性能診斷結(jié)果后針對惡化源的控制器參數(shù)整定。
多變量模型預測控制是一種優(yōu)化策略算法,原理如圖1所示。
算法通過優(yōu)化指標確定未來的控制增量,使預測輸出接近期望值。優(yōu)化性能指標為[8]
(1)
針對圖1所示的無約束動態(tài)矩陣控制系統(tǒng),假設其為一個包含p個被控輸出,m個控制輸入,預測時域為P, 控制時域為M的多變量過程,式(1)可寫為如下矩陣形式
J(k)=(GΔuM(k)+s(k)-r(k))TQ(GΔuM(k)+s(k)-r(k))+ΔuM(k)TRΔuM(k)
(2)
式中:G為預測模型,s(k)=y0(k)+He(k), 由?J(k)/?ΔuM(k)=0可得
ΔuM(k)=(GTQG+R)-1GTQ(r(k)-s(k))
(3)
令dT=L(GTQG+R)-1GTQ, 其中L表示取后面矩陣的第1、第M+1、 …、 第 (m-1)M+1行
則k時刻的最優(yōu)控制律可表示為
Δu(k)=dT[r(k)-y0(k)-He(k)]
(4)
式中:y0(k) 為與過去時刻相關的預測輸出分量,H為反饋系數(shù)矩陣。
由圖1可知
e(k)=y(k)-ym(k)=G0(q)u(k-1)+d0(k)-Gm(q)u(k-1)
(5)
將式(5)代入式(4)可得
Δu(k)=dT[r(k)-y0(k)]-dTH[G0(q)-Gm(q)]u(k-1)-dTHd0(k)
(6)
其中,G0(q) 與Gm(q) 分別表示實際過程對象模型和預測控制模型,u(k-1) 為k-1時刻系統(tǒng)控制輸入,d0(k) 為干擾量。
在式(6)中,最優(yōu)控制律Δu(k) 由3項組成,第一項可以實現(xiàn)設定值變化時的目標跟蹤;第二項dTH[G0(q)-Gm(q)]u(k-1) 是與預測模型相關的項,可以平衡預測誤差,在預測模型匹配的情況下為0;第三項dTHd0(k) 是與擾動量相關的項,可以抵消擾動。3項中,僅有控制器參數(shù)dT、H為可調(diào)項,因此,當3項中任意一項出現(xiàn)變化,而dT、H不做調(diào)整,都將直接影響最優(yōu)控制律Δu(k), 從而導致系統(tǒng)性能下降。如果能夠檢測到3項的變化并適時調(diào)整控制器參數(shù),則控制系統(tǒng)可以保持良好的性能。
本文中,用動態(tài)矩陣A代表預測模型G做預測輸出計算,其表現(xiàn)形式如下
其中,aij表示單位階躍響應系數(shù),反饋系數(shù)矩陣H以及控制器參數(shù)dT中各參數(shù)的具體表現(xiàn)形式如下
在實際應用過程中,一般取權系數(shù)qi(1)=qi(2)=…qi(P),rj(1)=rj(2)=…rj(M)。 由于p和m為系統(tǒng)固定不可調(diào)參數(shù),因此,針對dT和H的參數(shù)整定可認為是針對可調(diào)參數(shù)P,M,Q,R,H的參數(shù)整定。
在以往的系統(tǒng)性能評估描述中,通常以正常歷史數(shù)據(jù)計算的基準值與系統(tǒng)運行的實時值的比值來評價系統(tǒng)性能,系統(tǒng)的劇烈惡化源自于系統(tǒng)跟蹤性能的惡化或者是模型失配,其性能指標無法直接評價系統(tǒng)的跟蹤性能,因此,定義如下跟蹤性能評價指標
(7)
式(7)中,N為數(shù)據(jù)長度,r1(k)-y1(k) 表示基準情況下設定值與系統(tǒng)輸出的差值之和,r2(k)-y2(k) 表示設定值變化時系統(tǒng)輸出與設定值的差值之和。當系統(tǒng)跟蹤性能指標θ遠小于1時,表明此時原本的系統(tǒng)控制器參數(shù)已經(jīng)不再適用,預測控制的主要目標變成對輸出設定值的跟蹤。由圖1可知,過程實際輸出可表示為
y(k)=G0(q)u(k)+H0(q)e0(k)
(8)
故優(yōu)化目標函數(shù)可表示為采用最優(yōu)控制律的情況下應使用過程實際輸出與設定值之間的偏差最小
(9)
其中,u(k)=u(k-1)+Δu(k), Δu(k) 取式(6)最優(yōu)控制律。
根據(jù)楊世品等的理論[9],模型性能的高低取決于預測誤差e(k) 和干擾輸入e0(k), 通過模型質(zhì)量指標(MQI)來診斷模型性能,即
(10)
式中:N為數(shù)據(jù)長度,當預測模型失配時,模型的預測誤差增大,由最優(yōu)控制律式(6)中相應的平衡誤差項
ue(k)=dTH[G0(q)-Gm(q)]u(k-1)
(11)
應相應增加才能在控制輸出中平衡誤差,如果預測模型不改變,可通過調(diào)節(jié)控制器參數(shù)來實現(xiàn)。因此在模型失配導致性能嚴重下降的情況下可以進行以平衡誤差為目標的控制器參數(shù)優(yōu)化。輸出中與平衡誤差的控制輸入對應的分量為
ye(k)=G0(q)ue(k)=G0(q)dTH[G0(q)-Gm(q)]u(k-1)
(12)
則優(yōu)化目標為該項與實際模型預測誤差e(k) 間的差值的平方最小,即
(13)
在利用子空間辨識技術辨識擾動模型時,由閉環(huán)輸入輸出數(shù)據(jù)估計得到的馬爾科夫參數(shù)可作為性能評估的分析依據(jù),因此本文根據(jù)文獻[10]中馬爾科夫參數(shù)推導方法提出擾動特性診斷指標,即
(14)
yd(k)=G0(q)ud(k)=G0(q)dTHd0(k)
(15)
則克服擾動特性變化的目標為該分量與系統(tǒng)擾動特性變化后的擾動量d0(k)=H′0(q)e0(k) 之差最小,即
(16)
若系統(tǒng)性能指標、模型質(zhì)量指標、擾動特性診斷指標同時給出了系統(tǒng)惡化的結(jié)論,此時應以3個目標優(yōu)化函數(shù)聯(lián)合建立新的目標優(yōu)化函數(shù),即
(17)
式中:以跟蹤性能為目標的優(yōu)化函數(shù)JSET、 以平衡模型誤差為目標的優(yōu)化函數(shù)JMIS和以克服擾動特性變化為目標的優(yōu)化函數(shù)JDIS的可調(diào)參數(shù)同為P,M,Q,R,H, 因此通過調(diào)節(jié)控制器參數(shù)P,M,Q,R,H綜合目標優(yōu)化函數(shù)J盡可能的小,從而實現(xiàn)系統(tǒng)跟蹤性能、模型性能、擾動特性的提高。
基本粒子群算法[4]源于對鳥群捕食行為的研究,利用群體中的個體對信息的共享從而使整個群體的運動在問題求解空間中產(chǎn)生從無序到有序的演化過程,以此獲得最優(yōu)解。在算法中,由N個粒子組成的種群X=(x1,x2,x3,x4,x5)T, 連續(xù)變量Q,R,H和離散整型變量P和M構成了5維搜索空間,在種群中第i個粒子的位置xi=[x1i,x2i,x3i,x4i,x5i],x1i,x2i,x3i為連續(xù)量,x4i,x5i為離散整型量,速度為vi=[v1i,v2i,v3i,v4i,v5i], 連續(xù)變量所對應的粒子將根據(jù)式(18)來更新位置和速度,即
(18)
式中:c1和c2為加速常數(shù),前者一般稱為個體學習因子,后者一般稱為全體學習因子,常取c1=c2=2;r1和r2為區(qū)間[0,1]之間的隨機數(shù);pji(t) 表示第i個粒子的第j維在迭代第t次時候的最佳位置,即局部最優(yōu)點;gji(t) 表示種群在第t次迭代時的全局最優(yōu)點;ω為慣性因子,適當?shù)摩氐娜≈翟谝欢ǔ潭壬峡梢钥朔玖W尤核惴ㄈ菀紫萑刖植孔顑?yōu)的缺點,因此構建ω-PSO算法,引入一個位置參數(shù)為0,尺度參數(shù)為1的標準柯西分布隨機變量,對稱積分區(qū)間與迭代次數(shù)有關,該隨機變量在對稱變化區(qū)間上的積分與在對稱T區(qū)間上的比例作為概率值,ω的可取長度作為系數(shù),兩者的乘積作為改進的慣性因子ω,即
(19)
式中:t表示當前迭代次數(shù);T表示最大迭代次數(shù);ωmax、ωmin為慣性因子的最大值和最小值。
為了確保離散整型變量所對應的粒子在位置和速度在每次迭代后仍然為整型變量,需進行取整操作,為此定義以下判別式:
(1)當 |xji(t)-yik|<0.5時
xji(t)=yik
(20)
(2)當 |xji(t)-yik|=0.5時
(21)
步驟1 根據(jù)性能評估結(jié)果,選取式(17)相應的目標優(yōu)化函數(shù),定義目標搜索空間維度,本文中維度為5;定義種群規(guī)模;選取預測時域P、 控制時域M、 輸出輸入權矩陣Q,R以及反饋系數(shù)矩陣H的初始范圍;定義改進粒子群算法中的參數(shù)c1,c2,ω; 隨機產(chǎn)生初始種群,設定每個粒子的初始位置和速度,每個粒子中P和M所對應維度的初始位置設定為整數(shù)值; 設定最大迭代次數(shù);
步驟2 計算每個粒子的適應度值,將每個粒子的當前初始位置設置為個體最佳位置pi, 將所有粒子中適應度值最小的粒子所在位置設定為全體最佳位置gi。
步驟3 根據(jù)式(18)、式(20)、式(21)更新每個粒子的位置;通過式(19)更新慣性因子ω, 計算更新后每個粒子的函數(shù)值,求出當前個體和全體最優(yōu)值。
步驟4 判斷算法是否達到終止條件,若是則輸出最優(yōu)解P,M,Q,R,H, 否則跳到步驟3。
以過程控制領域標準研究對象Wood-Berry精餾塔過程為例進行實驗,如圖2所示就是Wood-Berry精餾塔的示意圖。
圖2 Wood-Berry精餾塔
它是甲烷和水反應的精餾過程,是模型預測控制領域的經(jīng)典實驗仿真系統(tǒng),特點是塔頂與塔底之間的相互影響較嚴重。控制系統(tǒng)具有兩輸入兩輸出,其傳遞函數(shù)為
(22)
其中,塔頂回流量u1(s), 再沸器蒸汽流量u2(s) 為系統(tǒng)輸入,塔頂甲醇濃度y1(s) 和甲醇餾出物濃度y2(s) 為系統(tǒng)輸出,進料流量ω(s) 為擾動。
過程的傳遞函數(shù)轉(zhuǎn)換為離散傳遞函數(shù)為
(23)
干擾離散傳遞函數(shù)為
(24)
系統(tǒng)輸出y1、y2的設定出值分別為90%、5%。在系統(tǒng)正常的情況下,選取文獻[5]中給出的目標函數(shù)作為被優(yōu)化函數(shù),采用文中算法去尋優(yōu)獲得初始動態(tài)矩陣控制參數(shù):P=100,M=10,Q=diag{1,50},R=diag{1,2},H=diag{1,1}。
本文的仿真實驗算法中均采用初始參數(shù):ω=1,c1=c2=2, 種群個數(shù)為500,最大迭代次數(shù)為500。數(shù)據(jù)段的長短并不會影響最終的評估結(jié)果,為了保證實驗的嚴謹性,下文實驗中各階段的采樣點數(shù)均為200。
假定系統(tǒng)的第一階段和第二階段的控制器參數(shù)為系統(tǒng)輸出y1,y2分別跟蹤90%,5%設定值,模型精確,擾動特性不變時的數(shù)值,若系統(tǒng)在第二階段設定值從90%減小到70%,5%增長到20%,輸出通道1和2同時出現(xiàn)子模型失配,擾動模型的增益增長10%,模型失配情況如式(25)所示
(25)
系統(tǒng)輸出曲線如圖3(a)、圖3(b)所示,虛線為設定值;第二階段兩條實線中震蕩最為劇烈的實線為系統(tǒng)實際輸出;另一條實線為系統(tǒng)預測輸出。
圖3 系統(tǒng)輸出曲線
由圖3(a)、圖3(b)可以看出,在控制的第一階段(0-200采樣點),此時為系統(tǒng)正常運行階段,3種性能指標計算結(jié)果見表1。從第200個采樣點開始,系統(tǒng)出現(xiàn)設定值變化,模型失配,擾動特性變化,此時的系統(tǒng)輸出曲線如圖3(a)、圖3(b)第二階段(200-400采樣點),y1和y2的實際輸出和預測輸出曲線之間偏差較大且出現(xiàn)劇烈震蕩,在到第400個采樣點時仍無法很好跟蹤變化后的設定值,第二階段的各性能指標值計算結(jié)果見表1。
表1 各階段各項性能指標
從表1中可以看出,第二階段的各項性能指標都大幅度下降,系統(tǒng)原本的控制器參數(shù)已經(jīng)無法克服性能的嚴重惡化,因此需要重新設定控制器參數(shù)。
上文中的各項仿真實驗均是在單獨性能惡化的情況下展開的,若是選取其上任意一個目標優(yōu)化函數(shù)去求解最優(yōu)控制器參數(shù),其參數(shù)可提高對應的性能指標,但是其余兩項性能指標得不到優(yōu)化。因此選取式(17)為目標優(yōu)化函數(shù),選擇控制器參數(shù)P的范圍為1~200,M的范圍為1~30,qi的范圍為0~60,rj的范圍為0~50,hii的范圍為0~5,通過改進后的粒子群算法求解目標函數(shù)的最優(yōu)值J=0.0014。 最優(yōu)值對應的參數(shù)的最優(yōu)解,結(jié)果見表2。將優(yōu)化后的參數(shù)設定成第三階段控制器參數(shù),第三階段系統(tǒng)輸出曲線如圖3(a)、圖3(b)所示。
表2 系統(tǒng)各階段控制器參數(shù)
由圖3(a)、圖3(b)第三階段曲線可知,在第400個采樣點處,y1和y2的曲線快速跟上設定值,并且在第三階段能夠很好跟蹤設定值,實際輸出和預測輸出的擬合度很高并且劇烈震蕩完全消失,系統(tǒng)整體性能恢復正常。這也驗證了目標函數(shù)選取的有效性以及最優(yōu)控制器參數(shù)的準確性。計算第三階段的各項性能指標,結(jié)果見表2,相比于第二階段都更接近于1。
本文針對系統(tǒng)設定值變化引起的跟蹤性能指標惡化狀況、模型失配引起的模型質(zhì)量指標惡化情況、擾動特性變化引起的擾動特性診斷指標惡化情況,分別構造對應的目標優(yōu)化函數(shù),系統(tǒng)同時存在3種指標惡化時,提出一種兼顧3個目標的優(yōu)化函數(shù)。針對基本粒子群算法無法優(yōu)化控制器參數(shù)中整型量P、M以及容易陷入局部最優(yōu)的缺點,提出一種可以同時整定連續(xù)量和整型量的改進粒子群算法,將該算法引入到Wood-Berry精餾塔實驗,計算參數(shù)調(diào)整前與參數(shù)調(diào)整后的性能指標,通過比較驗證了各項性能指標對應目標函數(shù),綜合3種性能指標的目標函數(shù)選取的有效性以及參數(shù)整定方法的可行性。