史婷娜,張宇,許衛(wèi),方紅偉
(1.天津大學 電氣與自動化工程學院,天津 300072;2.天津市大陸制氫設備有限公司,天津 301609)
盡管網絡控制技術日趨成熟,但網絡延時、丟包以及多包傳輸等仍是亟待解決的關鍵問題。為了克服網絡延時對系統(tǒng)的影響,目前,國內外學者主要從確定性、隨機性和智能控制方法3個角度來對網絡控制器進行設計。文獻[1]將網絡延時看作對系統(tǒng)的擾動,并利用頻域魯棒控制理論來設計控制器。文獻[2]把網絡時延對系統(tǒng)的影響看作LQG問題,并設總時延小于采樣周期,利用時延的Markov特性,最終給出最優(yōu)控制律。文獻[3]基于Lyapunov-Razum ikhin方法,將隨機過程用于網絡延時,設計了狀態(tài)反饋控制器,并證明了控制器的存在性。為了抵消網絡延時的不確定性對系統(tǒng)性能的影響,文獻[4]給出了一種基于Smith預估器的網絡控制設計方法,一定程度上補償了傳感器到控制器的時間延遲。文獻[5]采用基于平均延時窗的時延預測模糊免疫PI算法來控制網絡上的直流伺服系統(tǒng),得到了很好的控制效果。考慮到網絡時延的復雜性及對象參數的時變性,本文先用最小二乘支持向量機(LSSVM)對網絡時延進行預測,降低了網絡時延對Smith預估器控制效果的影響,增強了自適應能力。在此基礎上,用基于 PSD(proportional,summation,derivative)算法的單神經元自適應PID控制對時延預測及系統(tǒng)參數變化造成的模型誤差進行彌補。
支持向量機(SVM)是Vapnik等人提出的一類新型機器學習方法,它較好地解決了傳統(tǒng)模型的小樣本、非線性、高維數、局部極小點等問題。LS-SVM是SVM的擴展,采用LS-SVM算法求解線性方程,其收斂速度較快,預測較為精確,在時間預測中得到廣泛應用[6,7]。網絡時延復雜多變,但仍有章可循。在一定時間范圍內,其值是有上下界的,而且其均值呈一定趨勢變化。本文為了使用LS-SVM對網絡時延進行預測,首先把網絡時延看作高度非線性的時間序列[7]。
設過去所有觀測到的N個網絡時延為{d(k),k=1,2,…,N},則基于嵌入維為m的N個時間序列的SVM預測模型的輸入矢量為
假設存在以下網絡時延樣本集合
則時延估計可轉化為以下優(yōu)化問題
式中:φ(Di)為Di在高維特征空間的非線性映射;W為權向量;c為正則化參數;ξi為誤差松弛變量;hi是誤差的權值;b為偏差;1/2‖W‖為模型的復雜度。其中誤差權值h的選取為:在最近的N個網絡時延中,設第1個數據的權值h1=θ,(0<θ≤1),則其他數據的權值為 hi=θ+i(1-θ)/N,i=2, …,N 。
用拉格朗日方法求解上述優(yōu)化問題如下
式中:ai(i=1,…,N)是拉格朗日乘子。
分別對W,b,ξ及a求偏導數,則優(yōu)化問題轉化為求解如下方程:
式中:K(Di,Dj)為核函數,K(Di,Dj)=〈φ(Di),φ(Dj)〉,〈° ,°〉代表內積。
這里采用徑向基函數(RBF)作為核函數
解線性方程(5),得到網絡時延預測值為
應用基于滾動時間窗 LS-SVM算法對網絡時延進行預測。該方法構造的滾動時間窗對其內的數據優(yōu)化建模,模型隨著時間窗的滾動在線更新,而且對時間窗內的數據分配不同的權值以充分利用數據信息,既能保證估計精度,又能兼顧實時性。基于滾動時間窗的LS-SVM的回歸估計方法的建模步驟如下:1)在k時刻,選取過去測量到的N+1個網絡時延;2)應用基于滾動時間窗的LS-SVM回歸估計算法,建立模型,估計k+1時刻時延,用于Smith補償器;3)在k+1時刻,數據窗進行滾動,加入新的測量數據d(k+1)進控制器存儲單元,丟棄距離當前時刻最遠的數據d(k-N+2),返回 2)。
利用LS-SVM對網絡時延τ進行預測,然后根據預測時延建立Smith預估器,便可得到預估模型,提高Smith預估器W s(s)的補償性能。如圖1所示。這里τ≤d T,其中d為正整數,T為采樣周期。
圖1 時延預測Smith預估器框圖Fig.1 Diagram of the Smith predictor for time-delay
考慮到實際網絡控制系統(tǒng)當中,不單時延是時變的,其他參數也易發(fā)生變化,因此需要設計一種自適應控制器,本文采用具有自適應能力的單神經元Smith預估控制器來對時延進行預測補償控制。
傳統(tǒng)單神經元PID控制器結構簡單,能適應環(huán)境的變化,具有較強的魯棒性,但其增益K一般不具備自動調整功能[8]。為了增強增益K的自適應性,將PSD算法與單神經元PID控制器相結合,形成一種增益自調整單神經元 PID控制器[9]。其結構如圖2所示。
圖2 改進的單神經元PID控制系統(tǒng)Fig.2 The imp roved single neuron PID control system
圖2中y r和y o分別為系統(tǒng)的設定值和輸出值,經轉換器后轉換成神經元的輸入量分別為
設wi(i=1,2,3)為對應于xi(k)輸入的加權系數,K為增益,K>0。單神經元自適應控制算法為
采用有監(jiān)督Hebb學習規(guī)則,則權系數的規(guī)范化處理方法為
式中 :0.025≤c≤0.05,0.05≤L*≤0.1;η1,η2,η3分別為積分、比例、微分的學習速率。
學習速率與K值的選取關系著單神經元PID控制算法的運行效果,然而學習速率的取值對系統(tǒng)的控制品質影響不大。從式(9)可看出,增益K的變化,相當于P,I,D 3項同時變化。此改進方法可降低K的敏感程度,增強系統(tǒng)的魯棒性和自適應性。
用改進的單神經元自適應PID控制器替換圖1中的控制器Wc(s),得到如圖3所示的單神經元Smith預估網絡控制系統(tǒng)結構圖??刂七^程中,通過Smith預估模型來消除網絡時延對控制系統(tǒng)的影響,改進的單神經元PID控制器主要用來控制系統(tǒng)對象,能夠根據其他參數的變化自動調整控制參數,極大地降低了模型誤差的影響,提高系統(tǒng)的響應速度和穩(wěn)態(tài)性能。
圖3 單神經元Smith預估控制系統(tǒng)結構圖Fig.3 Structure of the single neuron Smith control system
根據圖3,利用T ruetime-1.5工具箱搭建網絡控制系統(tǒng)。仿真中,使用以太網(CSMA/CDE-thernet)進行通訊,系統(tǒng)由4個節(jié)點(控制器節(jié)點、執(zhí)行器節(jié)點、傳感器節(jié)點、干擾節(jié)點)組成,每個節(jié)點內部都包含1個TrueTime內核。時間驅動的傳感器節(jié)點周期性地對被控對象的輸出信號進行采樣,并將采樣信號通過網絡傳送到控制器節(jié)點??刂破鞴?jié)點接收由LS-SVM預測的網絡時延并傳遞給Smith預估器,通過改進的單神經元PID算法計算出當前控制量,再通過網絡將其送到事件驅動的執(zhí)行器節(jié)點。干擾節(jié)點則用于模擬網絡負載變化。仿真的被控對象為一伺服系統(tǒng),其傳遞函數為
取K1=1440,T1=1,將其離散化,采樣周期T=10 ms,并考慮到網絡時延均值τ≤d T,d為正整數,則離散化模型為
通過調節(jié)網絡干擾節(jié)點對帶寬的占有率,得到不同的網絡時延均值,分別在小時延(均值為7 ms)和大時延(均值為 40 ms)情況下,對傳統(tǒng)S mith補償PID控制和基于LS-SVM的Smith補償的PID控制進行階躍響應,仿真實驗如圖4所示。
圖4 兩種控制方法的比較Fig.4 Comparison of two control methods
圖4表明,傳統(tǒng)Smith補償器在小時延下超調近 60%,大時延下則不穩(wěn)定。這說明傳統(tǒng)S mith補償器中的固定時延補償不能完全等價于網絡的真實時延,這種模型的失配導致了系統(tǒng)的性能惡化。當用基于LS-SVM的預測時延時,系統(tǒng)的響應時間基本保持不變,系統(tǒng)超調降至20%左右,穩(wěn)定性也得到較大改善,但是時延預測畢竟存在誤差,導致調節(jié)時間較長。
為克服時延預測產生的誤差,并考慮實際系統(tǒng)參數的變化,用改進型單神經元PID來代替?zhèn)鹘y(tǒng)PID。仿真時,K1和 T1在各自給定值的±10%范圍內做周期性變化,以模擬系統(tǒng)參數的變化 。參數 η1=0.0001,η2=0.3,η3=6,w1(0)=0,w2(0)=0.4,w3(0)=0.9,PSD算法初始值K(0)=0.94,T v(0)=10,在0.5 s和1.5 s分別施加幅值為-0.5和0.5的階躍擾動,則系統(tǒng)在大、小時延下的階躍響應如圖5所示。
圖5表明,采用改進的單神經元Smith控制策略后,系統(tǒng)既能保證響應時間基本不變,還使超調明顯減小,并且當系統(tǒng)受到外界干擾時,能夠快速對擾動進行調節(jié),系統(tǒng)抗干擾能力較好。
圖5 基于LS-SVM的單神經元Smith控制Fig.5 Sing le neu ron S mith control based on LS-SVM
針對網絡時延問題,本文提出了一種基于LSSVM的Smith預估控制方法來消除網絡時延對系統(tǒng)的影響。在此基礎上,又給出了一種基于時延預測的單神經元Smith控制策略,很好地解決了網絡控制系統(tǒng)參數變化問題,尤其是Smith預估模型的失配問題。仿真表明,所設計的控制器對具有網絡時間延遲的控制系統(tǒng)有較強的自適應性和魯棒性。
[1]于之訓,陳輝堂,王月娟.基于H∞和 μ綜合的閉環(huán)網絡控制系統(tǒng)設計[J].同濟大學學報,2001,29(3):308-311.
[2]Nilsson J,Bernhardssont B,Wittenmark B.Stoch astic A-nalysis and Con trol of Real-time S ystem s with Ran dom Time Delays[J].Au tomatica,1998,34(1):57-64.
[3]Dan Huang,Sing K N.State Feedback Control of Uncertain Networked Control Systems with Random Time Delays[J].IEEE Trans.Atom.Control,2008,53(3):829-834.
[4]Zhang W,Branicky M S,Phillips S M.Stability of Networked C on trol Sy stems[J].IEEE Control Systems Magazine,2001,21(1):84-99.
[5]Shi Ting-na,Wang Su-juan,Fang Hong-w ei,et a l.Fuzzy Im mune PI Control of Networked Control System Based on ADW Time-delay Prediction[C]∥T he Fifth International Conference on Fuzzy System s an d Kn ow ledge Discovery,2008,3(18-20):76-80.
[6]S uykens J A K,Vande walle J.Least Squares Support Vector Machines Classifiers[J].Neural Processing Letters,1999,9(3):293-300.
[7]李春茂,肖建.基于LS-S VM的網絡化控制系統(tǒng)自適應預測控制[J].系統(tǒng)仿真學報,2007,19(15):3494-3498.
[8]王興貴,張明智,李慶玲.單神經元 PID控制器在直接矢量控制中的應用研究[J].微電機,2007,40(12):52-55.
[9]M arsik J,S trejc V.A New Conception of Digital Adap tive PSD Control[J].Problems of Controlan d Information T heory,1983,12(4):264-279.