張國鳴
(神華北電勝利能源有限公司,內(nèi)蒙古錫林浩特 026015)
帶式輸送機[1-3]相對于其他運輸方式,具有運輸效率高的特點,因而廣泛應(yīng)用于中短途散裝固體物料的搬運和輸送系統(tǒng)中。帶式輸送機是煤礦的主要運輸設(shè)備,其傳動系統(tǒng)的控制效果直接影響著煤炭生產(chǎn)的安全性、可靠性和成本。同時,皮帶輸送機工作過程中會消耗大量的電力能源,考慮到經(jīng)濟(jì)效益和成本的因素,如何降低帶式輸送機的能源消耗的研究十分必要。
帶式輸送機是一種典型的電能—機械能轉(zhuǎn)換系統(tǒng)。其能源效率可分為4 個部分:性能效率、運行效率、設(shè)備效率和技術(shù)效率。對大多數(shù)能源系統(tǒng)來說,提高能源效率可以很容易地提高運行效率和設(shè)備效率,帶式輸送機也是如此。
速度控制[4-6]是提高帶式輸送機運行效率和降低能耗的有效途徑之一。傳統(tǒng)的電傳動系統(tǒng)由于啟動速度不平穩(wěn),導(dǎo)致皮帶脫軌或斷裂,甚至發(fā)生安全事故。因此,將一種新型的智能控制方法引入帶式輸送機的速度控制中,對解決以上這些問題具有重要的理論和實踐意義。
帶式輸送機的速度控制有兩種方式:被動控制和主動控制[7]。被動速度控制是根據(jù)未來幾分鐘或幾小時內(nèi)物料流量的潛在峰值來選擇合適的帶速。根據(jù)某一時間段內(nèi)作業(yè)卸料機的數(shù)量,可以確定該時間段內(nèi)料流的勢峰。然后調(diào)整輸送機的速度,使其與物料流量的潛在峰值相匹配,或與可用卸料機的數(shù)量相匹配。主動速度控制能夠?qū)崟r監(jiān)控物料流動,根據(jù)實際料率的變化自動調(diào)整輸送機的速度,保證輸送帶上散裝物料的截面面積最大。被動速度控制根據(jù)未來時間間隔內(nèi)料流來選擇一個固定的運行速度。因此,物料流動的微小或暫時的變化不會導(dǎo)致皮帶速度的變化,因此被動速度控制是一種半最優(yōu)的方法。而在主動速度控制中,物料流動的變化是一個主要的速度調(diào)節(jié)指標(biāo)。如果偏差較大,則調(diào)整輸送機速度以減小偏差。因此,與被動速度控制相比,主動速度控制的帶速平均值較低。因此,主動速度控制有望實現(xiàn)好的節(jié)能效果。
最優(yōu)控制[8]通常被認(rèn)為是一種離線控制策略,它試圖在一定的約束條件下使性能指標(biāo)達(dá)到最大值或最小值。在設(shè)計最優(yōu)控制器時,需要知道系統(tǒng)的全部動態(tài)。動態(tài)規(guī)劃是求解最優(yōu)控制問題的一種有效方法,是一種基于貝爾曼最優(yōu)性原理求解優(yōu)化決策過程的數(shù)學(xué)方法。在實際應(yīng)用中,動態(tài)規(guī)劃方法通常在離線情況下使用,并且在處理復(fù)雜系統(tǒng)優(yōu)化控制時容易受到“維數(shù)災(zāi)”問題的影響,導(dǎo)致無法應(yīng)用動態(tài)規(guī)劃得到最優(yōu)解。
為了克服這一問題,自適應(yīng)評價設(shè)計及其相關(guān)研究取得了許多令人振奮的成果,該方法基于強化學(xué)習(xí)和行為評價體系結(jié)構(gòu)獲得近似最優(yōu)控制策略。自適應(yīng)評價設(shè)計方法是一種求解最優(yōu)控制問題的有效方法,近年來備受關(guān)注。一般來說,自適應(yīng)評價設(shè)計兩個部分組成:一個是執(zhí)行部分能夠根據(jù)被控系統(tǒng)生成控制輸入,另一個是評價部分用于評估當(dāng)前控制作用的性能,并更新控制行為以提高性能。
因此,利用自適應(yīng)評價設(shè)計算法來實現(xiàn)帶式輸送機的速度控制,具有良好的應(yīng)用前景。首次嘗試將自適應(yīng)評價設(shè)計應(yīng)用于帶式輸送機的速度控制器設(shè)計,通過迭代結(jié)構(gòu)逐步求解出最優(yōu)速度控制,為提高帶式輸送機的運輸效率、延長其使用壽命提供一種可行的解決方案。
考慮一類具有以下形式的離散系統(tǒng):
其中,x(k)是系統(tǒng)的狀態(tài),y(k)是系統(tǒng)的輸出,u(k)是系統(tǒng)的輸入。
為了便于算法的設(shè)計,假設(shè)離散系統(tǒng)是能觀和能控的??紤]的參考軌跡動力學(xué)特性為:
定義變量z(k)滿足:
根據(jù)狀態(tài)方程(1)和參考軌跡系統(tǒng)(3),可定義增廣離散系統(tǒng)為
最優(yōu)跟蹤控制問題的核心是找到最優(yōu)控制策略u(k),使目標(biāo)系統(tǒng)的輸出y(k)跟蹤參考軌跡r(k),同時其性能指標(biāo)達(dá)到最小。本研究的跟蹤控制問題的指標(biāo)函數(shù)具有如下形式:
其中,γ 是折扣因子,Q 和R 都是對稱正定矩陣。
根據(jù)動態(tài)規(guī)劃的思想,上述跟蹤控制問題也可以表示為
對于任意的可容許控制u,其對應(yīng)的貝爾曼方程為
其中,U(z(k))=(y(k)-r(k))TQ(y(k)-r(k))+u(k)TRu(k)。
根據(jù)貝爾曼最優(yōu)原理,跟蹤控制問題的最優(yōu)性能指標(biāo)為
對應(yīng)的最優(yōu)控制策略為
動態(tài)規(guī)劃方法的核心是貝爾曼最優(yōu)原理,對于跟蹤控制問題,其過程是對每一步的控制策略u(k),求解性能指標(biāo)函數(shù)(8),然后確定出滿足最優(yōu)性能指標(biāo)函數(shù)(9)的最優(yōu)控制,從而得到一個最優(yōu)控制策略(10)。然而,對于動態(tài)規(guī)劃方法,隨著系統(tǒng)維度的增加,其計算復(fù)雜度會顯著增加,即“維數(shù)災(zāi)”問題。為了克服這個問題,近年來自適應(yīng)評價設(shè)計方法以其自適應(yīng)學(xué)習(xí)的特點,被眾多研究者廣泛關(guān)注,成為了一個研究熱點。
對于所要研究的跟蹤控制問題,假設(shè)系統(tǒng)狀態(tài)x(k)和參考軌跡r(k)組成的二次型性能指標(biāo)函數(shù):J(k)=V(k)=。將其代入式(8),可以得到zT(k)Pz(k)=(yk-rk)TQ(yk-rk)++γzT(k+1)Pz(k+1)。
將目標(biāo)系統(tǒng)狀態(tài)方程代入到上式,可以得到代數(shù)黎卡提方程。
自適應(yīng)評價設(shè)計算法是一種基于貝爾曼最優(yōu)性原理的迭代算法。當(dāng)使用自適應(yīng)評價設(shè)計算法求解最優(yōu)控制問題時,通常是通過迭代求解代數(shù)黎卡提方程(11)和反饋控制策略來得到最優(yōu)控制。
(1)自適應(yīng)評價設(shè)計算法。從任意狀態(tài)z(k),選取一個初始容許的控制,進(jìn)行如下兩步迭代直至收斂。
(2)策略評價。求解矩陣Pi+1。
本文研究的自適應(yīng)評價設(shè)計算法是通過迭代求解李雅普諾夫方程(13)來得到最優(yōu)控制。自適應(yīng)評價設(shè)計算法作為一種近似算法,在迭代過程中得到的控制策略制ui(k)和性能指標(biāo)函數(shù)Vi(k)通常不是實際系統(tǒng)的最優(yōu)值。然而,當(dāng)?shù)笖?shù) 趨于無窮時,它們最終收斂于相應(yīng)的最優(yōu)值。
考慮如下帶式輸送機模型:
通過使用自適應(yīng)評價設(shè)計算法的策略評價方程(13),可以迭代求解出性能指標(biāo)函數(shù)P,通過使用策略改進(jìn)方程(14),可以迭代地得到輸送機的優(yōu)化控制策略u。
該系統(tǒng)的最優(yōu)性能指標(biāo)函數(shù)P*為
通過使用自適應(yīng)評價設(shè)計算法(16),迭代求解得到性能指標(biāo)函數(shù)P*。
從仿真圖1 中可以看出,使用自適應(yīng)評價設(shè)計算法,隨著迭代過程的進(jìn)行,策略評價方程(13)能夠迭代求解出性能指標(biāo)函數(shù)P。從圖2 可以看出,隨著迭代學(xué)習(xí)的進(jìn)行,通過自適應(yīng)評價設(shè)計算法所獲得的控制策略(14),能夠使帶式輸送機系統(tǒng)的速度輸出最終跟蹤物料加載的參考軌跡。
為了保證自適應(yīng)評價設(shè)計算法能夠?qū)W習(xí)到系統(tǒng)的全部模態(tài),就需要在仿真中引入一個探測噪聲信號。迭代學(xué)習(xí)過程中的探測噪聲如圖3 所示,在300 步之后,探測噪聲從控制策略u(k)中移除。
圖1 矩陣P 的收斂過程
圖2 算法學(xué)習(xí)過程
圖3 外加擾動信號
通過利用自適應(yīng)評價設(shè)計算法的自適應(yīng)迭代學(xué)習(xí)能力,設(shè)計了一種用于帶式輸送機的速度控制優(yōu)化方案,得到了以下3 個結(jié)論。
(1)將自適應(yīng)評價設(shè)計應(yīng)用于帶式輸送機的速度控制器設(shè)計,通過迭代結(jié)構(gòu)逐步求解出最優(yōu)速度控制。
(2)基于自適應(yīng)評價設(shè)計算法的速度控制方法,能夠根據(jù)來料的變化自適應(yīng)地調(diào)節(jié)帶式輸送機的運行速度,提高運輸效率。
(3)由于自適應(yīng)評價設(shè)計算法具有較好的學(xué)習(xí)速度,能夠有效延長帶式輸送機使用壽命。