陳浩廣,王銀河
(廣東工業(yè)大學(xué) 自動化學(xué)院,廣州 510006)
基于擴(kuò)展BP神經(jīng)網(wǎng)絡(luò)的一類非線性系統(tǒng)自適應(yīng)控制設(shè)計
陳浩廣*,王銀河
(廣東工業(yè)大學(xué) 自動化學(xué)院,廣州 510006)
(*通信作者電子郵箱haoguang_chen@sina.cn)
針對單輸入單輸出非線性系統(tǒng)的不確定性問題,提出了一種新型的基于擴(kuò)展反向傳播(BP)神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制方法。首先,采用離線數(shù)據(jù)來訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)的權(quán)值向量;然后,通過在線調(diào)節(jié)伸縮因子和逼近精度估計值的更新律,從而來達(dá)到控制整個系統(tǒng)的目的。在控制器的設(shè)計過程中,利用李亞普諾夫穩(wěn)定性分析原理,保證了閉環(huán)系統(tǒng)的所有狀態(tài)一致終極有界(UUB)。相比傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制,所提方法能有效地減少在線調(diào)節(jié)的參數(shù)數(shù)目、減輕計算負(fù)擔(dān)。仿真結(jié)果表明,該方法能夠使閉環(huán)系統(tǒng)的所有狀態(tài)都趨于零,即系統(tǒng)達(dá)到穩(wěn)定狀態(tài)。
非線性系統(tǒng);自適應(yīng)控制;反向傳播神經(jīng)網(wǎng)絡(luò);一致終極有界;穩(wěn)定性
近年來,神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制已成為控制理論與工程應(yīng)用領(lǐng)域中的一個研究熱點,其研究成果為解決非線性不確定系統(tǒng)控制設(shè)計問題提供了重要方法[1-6]。這些成果的共同特點是:基于神經(jīng)網(wǎng)絡(luò)的萬能逼近性能,利用神經(jīng)網(wǎng)絡(luò)逼近非線性系統(tǒng)中的未知不確定函數(shù),然后采用自適應(yīng)控制技術(shù)設(shè)計系統(tǒng)的控制器。在控制器的設(shè)計過程中,反向傳播(Back Propagation, BP)神經(jīng)網(wǎng)絡(luò)因其強大的逼近性能、并行處理能力和強的魯棒特性而被廣泛采用。如文獻(xiàn)[7]利用BP神經(jīng)網(wǎng)絡(luò)對被控對象進(jìn)行在線辨識和控制,并結(jié)合常規(guī)的比例積分微分(Proportion Integration Differentiation, PID)控制器,提出了一種基于BP神經(jīng)網(wǎng)絡(luò)的自適應(yīng)PID控制器。文獻(xiàn)[8] 采用BP神經(jīng)網(wǎng)絡(luò)來逼近非線性離散系統(tǒng)中的未知動態(tài)項,通過結(jié)合一個死區(qū)算法來更新網(wǎng)絡(luò)中的權(quán)值向量,保證了整個控制系統(tǒng)的穩(wěn)定性和收斂性。文獻(xiàn)[9]針對一類帶有未知動態(tài)項或者噪聲干擾項的仿射非線性系統(tǒng),利用BP神經(jīng)網(wǎng)絡(luò)的萬能逼近性能,提出了一種新型的控制律,并應(yīng)用到氣動伺服系統(tǒng)的位置跟蹤控制,取得了良好的控制效果。雖然上述文獻(xiàn)在自適應(yīng)控制方面取得了不少突破,但它們?nèi)耘f沒辦法解決BP神經(jīng)網(wǎng)絡(luò)收斂速度慢的問題[10],特別是當(dāng)神經(jīng)元的數(shù)目較多時,在線調(diào)節(jié)的自適應(yīng)參數(shù)數(shù)目將大量增加,這樣容易導(dǎo)致學(xué)習(xí)時間過長,使得控制效果不佳。另外,BP神經(jīng)網(wǎng)絡(luò)是一種局部尋優(yōu)方法,權(quán)值是沿著局部改善的方向逐漸調(diào)整的。當(dāng)它要解決一個全局的復(fù)雜非線性自適應(yīng)控制問題時,很容易陷入局部極小值[11],從而導(dǎo)致控制的失敗。
為解決以上問題,不少學(xué)者針對BP神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制作了很多研究。文獻(xiàn)[12]利用BP神經(jīng)網(wǎng)絡(luò)的誤差反向傳播機制,解決了控制器中的權(quán)值修正問題,使得該控制器具有良好的控制效果。文獻(xiàn)[13]結(jié)合粒子群優(yōu)化算法和BP神經(jīng)網(wǎng)絡(luò)的萬能逼近特性,提出了一種新型的自適應(yīng)控制方法。該方法不僅可以提高全局搜索能力,而且能夠加快收斂。文獻(xiàn)[14]提出了一種混合訓(xùn)練算法,其中輸入層和隱層的權(quán)值訓(xùn)練采用的是自組織學(xué)習(xí)算法,隱層和輸出層的權(quán)值訓(xùn)練采用的是梯度下降法,這種混合算法能夠起到減少網(wǎng)絡(luò)訓(xùn)練時間的作用。盡管以上方法在一定程度上減少自適應(yīng)控制過程中參數(shù)的在線調(diào)節(jié)時間,但目前仍舊沒有給出一種統(tǒng)一的、有規(guī)律可循的方法來解決這個問題。因此,本文提出了一種具有普遍性,能夠適合任何一種神經(jīng)網(wǎng)絡(luò)類型(本文以BP神經(jīng)網(wǎng)絡(luò)為例)的解決方法。該方法在神經(jīng)網(wǎng)絡(luò)的輸入輸出端加載伸縮器和飽和器,先利用離線數(shù)據(jù)來訓(xùn)練神經(jīng)網(wǎng)絡(luò)的權(quán)值向量,再通過調(diào)節(jié)在線的自適應(yīng)參數(shù),最后實現(xiàn)了控制整個系統(tǒng)的目的。伸縮器和飽和器的加入,使得該方法在控制器的設(shè)計過程中,只需要調(diào)節(jié)伸縮因子和神經(jīng)網(wǎng)絡(luò)的逼近精度估計值,這樣可以有效地減少在線的調(diào)節(jié)參數(shù)、減輕計算負(fù)擔(dān),并且能夠保證整個閉環(huán)系統(tǒng)的所有狀態(tài)一致終極有界。
定義3 在一個BP神經(jīng)網(wǎng)絡(luò)的輸入端加載一個伸縮器和一個飽和器,并在其輸出端加載一個伸縮器,結(jié)構(gòu)如圖1所示,稱之為k階擴(kuò)展的BP神經(jīng)網(wǎng)絡(luò)系統(tǒng)(k-order extended BP neural network system),記為ENS(N,k)。
圖1 擴(kuò)展的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
圖1中,擴(kuò)展的BP神經(jīng)網(wǎng)絡(luò)ENS(N,k)的輸出為:
(1)
當(dāng)‖z/ξ‖≤?時,有:
(2)
BP神經(jīng)網(wǎng)絡(luò)的輸出為:
(3)
引理1 考慮在Rn上連續(xù)的k次齊次函數(shù)γ(z),也即對于任意正實數(shù)λ滿足γ(λz)=λkγ(z)。如果存在一個BP神經(jīng)網(wǎng)絡(luò)N和正實數(shù)M,在緊致域z∈{z|‖z‖≤?}上滿足:
(4)
那么擴(kuò)展的BP神經(jīng)網(wǎng)絡(luò)ENS(N,k)的輸出滿足:
(5)
證明 由齊次函數(shù)的定義有γ(z)-ξkγ(z/ξ)=0,因此當(dāng)z∈{z|‖z‖≤|ξ|?}時,以下不等式成立:
|γ(z)-ξkN(z/ξ)|=|γ(z)-ξkγ(z/ξ)+ξk[γ(z/ξ)-N(z/ξ)]|= |ξ|k|γ(z/ξ)-N(z/ξ)|≤|ξ|kM
(6)
考慮如下非線性系統(tǒng):
(7)
假定1 矩陣(A,B)是可控的,因此存在1×n階矩陣K使A+BK是Hurwitz矩陣,并且對于任意給定的正定矩陣Q,下列Lyapunov方程有唯一正定矩陣解P:
(A+BK)TP+P(A+BK)=-Q
(8)
(9)
由引理1和假定3,可以得到下面不等式:
j=0,1,…,s
(10)
(11)
(12)
(13)
(14)
情況a 當(dāng)‖z‖>|ξ|?時,利用神經(jīng)網(wǎng)絡(luò)Nj逼近連續(xù)齊次函數(shù)Δj,同時采用如下的控制輸入和更新律:
u=0
(15)
(16)
(17)
其中:λ和β是可調(diào)的正常數(shù)。
(18)
根據(jù)文獻(xiàn)[15]和式(18),可以知道閉環(huán)系統(tǒng)的狀態(tài)能在有限的時間內(nèi)到達(dá)曲面s=0,即{Z|s=0}?D。
引理2得證。
情況b 當(dāng)‖z‖≤|ξ|?時,設(shè)計控制器:
u=u1+u2
(19)
(20)
(21)
伸縮因子和逼近精度估計值的更新律分別是:
(22)
(23)
(24)
(25)
由式(25)得到不等式:
(26)
(27)
(28)
(29)
引理3得證。
結(jié)合以上兩種情況,可以得出下面定理。
整個神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制的設(shè)計流程如圖2所示。
圖2 神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制設(shè)計流程
考慮如下二階系統(tǒng):
(30)
根據(jù)假定2~3,需要離線數(shù)據(jù)訓(xùn)練三個BP神經(jīng)網(wǎng)絡(luò)N0、N1、N2來逼近未知的連續(xù)齊次函數(shù)Δ0=-Kz、Δ1=h1(z)、Δ2=h2(z),其中K=(-3,-4)。在訓(xùn)練過程中,采用的算法是梯度下降法。神經(jīng)網(wǎng)絡(luò)的層數(shù)是3層,隱層的神經(jīng)元個數(shù)為6,網(wǎng)絡(luò)結(jié)構(gòu)是:1—6—1。訓(xùn)練完成后,將可以得到相應(yīng)的網(wǎng)絡(luò)權(quán)值,并保持這些權(quán)值不變。
圖3 不同參數(shù)的時間相應(yīng)曲線
本文利用李亞普諾夫穩(wěn)定性分析原理,設(shè)計了一種基于擴(kuò)展BP神經(jīng)網(wǎng)絡(luò)的自適應(yīng)穩(wěn)定控制器。該控制器結(jié)合了離線訓(xùn)練與在線調(diào)節(jié),很好地解決了傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)收斂速度慢的缺點,并通過在線調(diào)節(jié)伸縮因子和逼近精度估計值的更新律,來保證閉環(huán)系統(tǒng)的所有狀態(tài)達(dá)到一致終極有界。但是,該控制器在設(shè)計過程中,需要假定被控系統(tǒng)的未知函數(shù)能分解成連續(xù)的齊次函數(shù)。因此,其應(yīng)用范圍受到了一定的限制。在今后的研究中,可以考慮是否通過引進(jìn)Lipschitz條件,來消除這個局限。
)
[1] 吳玉香,王聰.不確定機器人的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制與學(xué)習(xí)[J].控制理論與應(yīng)用,2013,30(8):990-997.(WUYX,WANGC.Adaptiveneuralnetworkcontrolandlearningforuncertainrobot[J].ControlTheoryandApplications, 2013, 30(8): 990-997.)
[2]ZUOY,WANGYN,LIUXZ.NeuralnetworkrobustH∞-trackingcontrolstrategyforrobotmanipulators[J].AppliedMathematicalModeling, 2010, 34(7):1823-1838.
[3]CHANGYC,YENHM.Robusttrackingcontrolforaclassofuncertainelectricallydrivenrobots[J].IETControlTheory&Applications, 2009, 3(5): 519-532.
[4]CHENB,ZHANGHG,LINC.Observer-basedadaptiveneuralnetworkcontrolfornonlinearsystemsinnonstrict-feedbackform[J].IEEETransactionsonNeuralNetworksandLearningSystems, 2016, 27(1): 89-98.
[5]SAHOOA,XUH,JAGANNATHANS.Adaptiveneuralnetwork-basedevent-triggeredcontrolofsingle-inputsingle-outputnonlineardiscrete-timesystems[J].IEEETransactionsonNeuralNetworksandLearningSystems, 2016, 27(1): 151-164.
[6]GAOSG,DONGHR,NINGB,etal.NeuraladaptivecontrolforuncertainMIMOsystemswithconstrainedinputviainterceptedadaptationandsinglelearningparameterapproach[J].NonlinearDynamics, 2015, 82(3): 1109-1126.
[7] 譚永紅.基于BP神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制[J].控制理論與應(yīng)用,1994,11(1):84-88.(TANYH.AdaptivecontrolbasedonBPneuralnetwork[J].ControlTheoryandApplications, 1994, 11(1): 84-88.)
[8]LIXL,LIUDX,LIJY,etal.Robustadaptivecontrolfornonlineardiscrete-timesystemsbyusingmultiplemodels[J].MathematicalProblemsinEngineering, 2013(8): 1-10.
[9]LUL,LIUFG,SHIWX.Neural-networkadaptivecontrollerfornonlinearsystemsanditsapplicationinpneumaticservosystems[J].JournalofControlTheoryandApplications, 2008, 6(1): 97-103.
[10] 張昭昭,喬俊飛,楊剛.一種功能分區(qū)的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計方法[J].控制與決策,2011,26(11):1659-1664.(ZHANGZZ,QIAOJF,YANGG.Structuremodeloffunction-dividingdesignforBPneuralnetwork[J].ControlandDecision, 2011, 26(11): 1659-1664.)
[11] 馮立穎.改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)算法及其應(yīng)用[J].計算機仿真,2010,27(12):172-175.(FENGLY.OptimizedBPneuralnetworksalgorithmanditsapplication[J].ComputerSimulation, 2010, 27(12): 172-175.)
[12] 沈瑛,張翠芳.基于BP神經(jīng)網(wǎng)絡(luò)的模型參考自適應(yīng)控制[J].西南交通大學(xué)學(xué)報,2001,36(5):553-556.(SHENY,ZHANGCF.ModelreferenceadaptivecontrolbasedonBPneuralnetworks[J].JournalofSouthwestJiaotongUniversity, 2001, 36(5): 553-556.)
[13]ZHANGJR,ZHANGJ,LOKTM,etal.Ahybridparticleswarmoptimization-back-propagationalgorithmforfeedforwardneuralnetworktraining[J].AppliedMathematicsandComputation, 2007, 185(2): 1026-1037.
[14]NASRMB,CHTOUROUM.Neuralnetworkcontrolofnonlineardynamicsystemsusinghybridalgorithm[J].AppliedSoftComputing, 2014, 24: 423-431.
[15]SLOTINEJE,LIW.AppliedNonlinearControl[M].UpperSaddleRiver,NJ:Prentice-Hall, 1991: 251-253.
[16]WANGM,WANGC,LIUXP.Dynamiclearningfromadaptiveneuralcontrolwithpredefinedperformanceforaclassofnonlinearsystems[J].InformationSciences, 2014, 279: 874-888.
ThisworkispartiallysupportedbytheNationalNaturalScienceFoundationofChina(61273219, 61673120),theSpecializedResearchFundfortheDoctoralProgramofHigherEducationofChina(20134420110003).
CHEN Haoguang, born in 1986, Ph. D. candidate. His research interests include neural network, fuzzy control.
WANG Yinhe, born in 1962, Ph. D., professor. His research interests include complex network, nonlinear control.
Adaptive control design for a class of nonlinear systems based on extended BP neural network
CHEN Haoguang*, WANG Yinhe
(SchoolofAutomation,GuangdongUniversityofTechnology,GuangzhouGuangdong510006,China)
Aiming at the uncertainty of Single-Input-Single-Output (SISO) nonlinear systems, a novel adaptive control design based on extended Back Propagation (BP) neural network was proposed. Firstly, the weight vectors of BP neural network were trained via the offline data. Then, the scaling factor and estimation parameter of approximate accuracy were adjusted online to control the whole system by update law. In the design process of controller, with the Lyapunov stability analysis, the adaptive control scheme was proposed to guarantee that all the states of the closed-loop system were Uniformly Ultimately Bounded (UUB). Compared with the traditional adaptive control method of BP neural network, the proposed method can effectively decrease the parameter number of online adjustment and reduce the burden of computation. The simulation results show that the proposed method can make all the states of the closed-loop system tend to be zero, which means the system reaches the steady state.
nonlinear system; adaptive control; Back Propagation (BP) neural network; uniformly ultimately bounded; stability
2016- 12- 05;
2017- 03- 02。
國家自然科學(xué)基金資助項目(61273219,61673120); 教育部高等學(xué)校博士學(xué)科點專項科研基金資助項目(20134420110003)。
陳浩廣(1986—),男,廣東汕頭人,博士研究生,主要研究方向:神經(jīng)網(wǎng)絡(luò)、模糊控制; 王銀河(1962—),男,內(nèi)蒙古包頭人,教授,博士,主要研究方向:復(fù)雜網(wǎng)絡(luò)、非線性控制。
1001- 9081(2017)06- 1670- 04
10.11772/j.issn.1001- 9081.2017.06.1670
TP183; TP273
A