• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于Elman模型的動態(tài)障礙物運(yùn)動狀態(tài)估計(jì)*

      2019-12-11 02:23:28趙久國
      通信技術(shù) 2019年12期
      關(guān)鍵詞:障礙物時刻軌跡

      趙久國,石 韜

      (1.渤海造船廠集團(tuán)有限公司,遼寧 葫蘆島 125004;2武漢哈船導(dǎo)航技術(shù)有限公司,湖北 武漢 430070)

      0 引 言

      學(xué)習(xí)是人類具備的重要能力,目前計(jì)算機(jī)已經(jīng)擁有進(jìn)一步學(xué)習(xí)的能力。機(jī)器學(xué)習(xí)借助主動學(xué)習(xí)過去眾多數(shù)據(jù)信息中所蘊(yùn)含規(guī)律的手段,可以得到新信息與新經(jīng)驗(yàn),進(jìn)一步增強(qiáng)計(jì)算機(jī)的智能性,最終讓與人類相近的決策能力在計(jì)算機(jī)上體現(xiàn)[1]。隨著大數(shù)據(jù)和硬件技術(shù)的計(jì)算和存儲能力的發(fā)展,機(jī)器學(xué)習(xí)的研究也在飛速發(fā)展。機(jī)器學(xué)習(xí)屬于新興領(lǐng)域,當(dāng)前依舊處于基礎(chǔ)研究過程,因此同人的大腦相比,計(jì)算機(jī)在解決問題方面依然存在一定的不足[2]。借助大量數(shù)據(jù)自動獲取對應(yīng)結(jié)論是機(jī)器學(xué)習(xí)最重要的目標(biāo),這主要是一個借助數(shù)學(xué)與統(tǒng)計(jì)學(xué)手段獲得待解決問題的最優(yōu)答案的過程[3]。

      本文的預(yù)測模型以Elman在1990年提出的Elman神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),結(jié)合預(yù)測控制模型,以障礙物當(dāng)前的位置推斷得到其運(yùn)動改變數(shù)據(jù),并且經(jīng)過長時域的改進(jìn),最終得到障礙物與實(shí)際情況最相似的運(yùn)動狀態(tài)數(shù)據(jù)。

      1 Elman預(yù)測控制結(jié)構(gòu)的設(shè)計(jì)

      模型預(yù)測控制是一種新型計(jì)算機(jī)控制算法,模型預(yù)測控制算法因?yàn)榻柚硕嗖筋A(yù)測、滾動優(yōu)化和反饋校正等控制思想,所以具有較好的控制效果、較強(qiáng)的魯棒性、對模型精確性沒有較高要求等優(yōu)勢[4]。

      對于預(yù)測控制來說,最重要的部分是構(gòu)造出一個契合真實(shí)情況的模型進(jìn)行預(yù)測。這部分需要借助歷史數(shù)據(jù)作為樣本,然后才可以使用構(gòu)造的模型預(yù)測未來數(shù)據(jù)[5]。使用預(yù)測控制模型并進(jìn)行長時域優(yōu)化,可實(shí)現(xiàn)根據(jù)歷史數(shù)據(jù)預(yù)測得出與障礙物實(shí)際運(yùn)動最相似的運(yùn)動數(shù)據(jù)。本節(jié)使用預(yù)測控制模型與Elman神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法,具有預(yù)測模型、滾動優(yōu)化和反饋校正3個特點(diǎn)[6]。Elman網(wǎng)絡(luò)預(yù)測模型的預(yù)測控制組成如圖1所示。

      圖1 神經(jīng)網(wǎng)絡(luò)預(yù)測控制結(jié)構(gòu)

      設(shè)輸入歷史樣本數(shù)據(jù)為r,通過參考軌跡環(huán)節(jié)后獲得預(yù)測數(shù)據(jù)yr,預(yù)測數(shù)據(jù)和期望數(shù)據(jù)之間的誤差為:

      ec=yr-yk(1)

      通過滾動優(yōu)化環(huán)節(jié)得到控制信號u,將其使用在受控目標(biāo)上獲取系統(tǒng)輸出y,ym表示Elman網(wǎng)絡(luò)預(yù)測模型輸出,yp表示經(jīng)由改正后的輸出。借助Elman網(wǎng)絡(luò)推斷出將來k(k≥1)步的輸出,隨后把這個推斷數(shù)據(jù)應(yīng)用在反饋校正裝置后傳遞給滾動優(yōu)化控制器改進(jìn),得到接下來步驟的控制量,以實(shí)現(xiàn)更有效的實(shí)時搜尋障礙物數(shù)據(jù)信息。Elman預(yù)測模型的輸出與系統(tǒng)輸出之間的誤差為em=y-ym,此誤差用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的的連接權(quán)值,且按照ec和反饋的梯度信息?ym/?u滾動改進(jìn)非線性系統(tǒng),進(jìn)而優(yōu)化計(jì)算后續(xù)步驟的控制量。

      算法實(shí)現(xiàn)的主要過程:第一步使用Elman神經(jīng)網(wǎng)絡(luò)識別非線性系統(tǒng),解決人工神經(jīng)網(wǎng)絡(luò)不能對受控目標(biāo)進(jìn)行多步建模并實(shí)時預(yù)測的難點(diǎn);第二步構(gòu)造Elman網(wǎng)絡(luò)模型進(jìn)行預(yù)測,實(shí)現(xiàn)滾動優(yōu)化控制非線性系統(tǒng)。

      2 建立Elman預(yù)測模型

      使用Elman預(yù)測并通過加入內(nèi)部反饋信號表現(xiàn)非線性運(yùn)動學(xué)問題,可以解決由于障礙物的非線性運(yùn)動產(chǎn)生的傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)不能解決的動態(tài)信息處理問題。由Elman神經(jīng)網(wǎng)絡(luò)構(gòu)建的單層網(wǎng)絡(luò)可很好地描述復(fù)雜的動態(tài)系統(tǒng)。

      構(gòu)建預(yù)測模型過程中,將滯后的正確系統(tǒng)的輸入輸出數(shù)據(jù)作為樣本應(yīng)用到預(yù)測網(wǎng)絡(luò)模型,可得到未來k時刻的輸出數(shù)據(jù)。所構(gòu)建的Elman網(wǎng)絡(luò)模型為:

      式中,預(yù)測模型的輸出值為ym,預(yù)測步長為k,系統(tǒng)t時刻的輸出為yt,系統(tǒng)t時刻的輸入為u(t),系統(tǒng)輸入和輸出的滯后時間由m和n表示且n≥m,Elman的網(wǎng)絡(luò)權(quán)值為W。

      模型的輸入為:

      模型的輸出為:

      式中Hjm(t)為隱層低j個神經(jīng)元在t時刻的輸出,具體形式如下:

      f代表隱層的激活函數(shù),其表達(dá)式為:

      Elman預(yù)測網(wǎng)絡(luò)的誤差模型為:

      令a=y(t+p)-ym(t+p),網(wǎng)絡(luò)權(quán)值的調(diào)節(jié)量為:

      式中:ηm表示學(xué)習(xí)率,αm表示動量因子。于是,可以得到網(wǎng)絡(luò)權(quán)值大小的調(diào)整由網(wǎng)絡(luò)計(jì)算誤差決定,調(diào)節(jié)程度跟隨網(wǎng)絡(luò)誤差同時增加或減少。為了解決系統(tǒng)y(t+k)時刻的輸出數(shù)據(jù)不能在t時刻得出的問題,使用時間差分法(簡稱TD法)實(shí)現(xiàn)用相鄰預(yù)測輸出間的誤差代替預(yù)測與實(shí)際輸出間的誤差。作為強(qiáng)化學(xué)習(xí)方法中的一種,它為克服此難點(diǎn)提供解決途徑。

      TD算法的原理是指臨近兩次的網(wǎng)絡(luò)輸出不針對相同時刻輸出的預(yù)測,參考式(1)和式(2)能夠得到在t時刻網(wǎng)絡(luò)的輸入表示為xm(t),相應(yīng)的輸出是ym(t+k),用Ykt表示;在t+1時刻的輸入表示為xm(t+1),對應(yīng)的輸出為ym(t+1+k),用Ykt+1表示。說明兩個輸出之間不存在必然的期望關(guān)系,得到的規(guī)律為:

      當(dāng)前網(wǎng)絡(luò)的誤差性能指標(biāo)表示為:

      把系統(tǒng)實(shí)際輸出y(t+p)與網(wǎng)絡(luò)預(yù)測輸出ym(t+p)之間的偏差描述成當(dāng)前時刻t之后的預(yù)測變化之和[7]是TD法求解問題的重點(diǎn),表示為:

      式(11)中系統(tǒng)t時刻的真實(shí)輸出由Yt0表示。通過上述說明在把式(7)代入式(10),令:

      獲得的Elman網(wǎng)絡(luò)的學(xué)習(xí)方法為:

      3 反饋校正模型及參考軌跡的建立

      在預(yù)測控制模型中,動態(tài)預(yù)測問題可分為模型輸出的預(yù)測數(shù)據(jù)和根據(jù)偏差所產(chǎn)生的校正數(shù)據(jù)兩部分。在真實(shí)條件下,不能排除時變性、非線性以及隨機(jī)干擾等問題所帶來的影響,因此輸出數(shù)據(jù)與系統(tǒng)實(shí)際輸出相比具有較大偏差。想要使系統(tǒng)更加精準(zhǔn),可以借助反饋校正環(huán)節(jié)實(shí)現(xiàn)[8]。

      期望輸出與模型預(yù)測輸出之間的誤差,由預(yù)測控制模型實(shí)時計(jì)算得出,模型的學(xué)習(xí)能力使用誤差信號進(jìn)行改進(jìn),逐漸提高預(yù)測能力。因?yàn)閠時刻的預(yù)測誤差會影響t+1,t+2,…,t+p-1時刻的預(yù)測誤差,所以應(yīng)用反饋校正借助誤差修正因子,線性改進(jìn)預(yù)測模型未來的輸出預(yù)測值。反饋校正可在線進(jìn)行也可離線進(jìn)行,模型預(yù)測值為[9]:

      式中,誤差修正加權(quán)因子為h。因?yàn)樵撓禂?shù)補(bǔ)償了偶然因素的誤差,所以大多數(shù)情況下選擇經(jīng)驗(yàn)試湊法選擇h,并不能精確地表達(dá)數(shù)學(xué)模型。

      參考軌跡可使輸出信號按照規(guī)定軌跡到達(dá)設(shè)定大小,使系統(tǒng)不產(chǎn)生過量控制。參考軌跡yc的數(shù)學(xué)模型為:

      式中,平滑因子為αc∈[0,1),設(shè)定值由r(t)表示。由式(15)可知,系統(tǒng)的魯棒性和平滑性將隨著平滑因子的增大而變好,但系統(tǒng)的處理速度會變的相對緩慢。所以,選出合適的平滑因子,對平衡系統(tǒng)性能尤為重要。

      4 滾動優(yōu)化算法設(shè)計(jì)

      為實(shí)現(xiàn)最優(yōu)控制,選擇優(yōu)化算法,針對每一步數(shù)據(jù)的將來有限步進(jìn)行優(yōu)化計(jì)算,其模型為時間t的滾動優(yōu)化模型。t時刻的預(yù)測指標(biāo)模型為:

      式中,q為控制時域,k為預(yù)測時域,λj>0是加權(quán)系數(shù),通常情況下k≥q≥1。

      當(dāng)Jc值最小即令?Jc(t)對u的偏導(dǎo)數(shù)等于0時,目前數(shù)據(jù)以及將來要采取控制的序列便可滿足約束條件,同時還可以求出未來q個控制變量u(t),u(t+1),…,u(t+q-1)。

      根據(jù)式(17),最優(yōu)控制量可以用yk(t+k)來計(jì)算,即未來k步的預(yù)測輸出yk中的第k步預(yù)測值。這種方法的好處為改變控制量的時刻為t時刻,其他步并不需要改變,控制量將會在t+1時刻被重新計(jì)算。

      式(17)中,令 ?Jc(t)/?u=0,可得:

      由 式(14), 可 用 ?ym(t+k)/?u(t)近 似 取 代?yk(t+k)/?u(t)。

      5 實(shí)驗(yàn)結(jié)果

      使用Matlab對Elman預(yù)測模型方法的動態(tài)障礙物運(yùn)動狀態(tài)預(yù)測的有效性進(jìn)行仿真驗(yàn)證。假設(shè)障礙物運(yùn)動軌跡為隨機(jī)路線,圖2是使用Elman模型預(yù)測的障礙物運(yùn)動軌跡圖,圖3是預(yù)測軌跡局部放大圖,圖4和圖5是經(jīng)度和緯度預(yù)測誤差圖。

      由圖2任意路線的軌跡預(yù)測可知,基于Elman預(yù)測模型算法能夠較好地預(yù)測動態(tài)障礙物的運(yùn)動軌跡。由圖3可以看出,預(yù)測軌跡對于任意軌跡的擬合都有較好的效果。由圖4經(jīng)度方向預(yù)測誤差和圖5緯度方向預(yù)測誤差得出結(jié)論,預(yù)測軌跡經(jīng)度方向、緯度方向最大誤差分別為0.75 m、0.62 m。

      圖2 任意路線軌跡和預(yù)測路線

      圖3 任意路線軌跡預(yù)測局部放大

      圖4 經(jīng)度方向預(yù)測誤差

      圖5 緯度方向預(yù)測誤差

      綜上可以得出結(jié)論:Elman神經(jīng)網(wǎng)絡(luò)能夠?qū)⒔?jīng)度、緯度方向的預(yù)測誤差控制在0.8 m以內(nèi),當(dāng)障礙物運(yùn)動軌跡為轉(zhuǎn)彎時,可以較為平滑地處理運(yùn)動軌跡,沒有出現(xiàn)大角度轉(zhuǎn)向情況,與實(shí)際情況較為吻合。作為預(yù)測控制的預(yù)測模型,Elman神經(jīng)網(wǎng)絡(luò)能夠較好地預(yù)估動態(tài)障礙物的運(yùn)動軌跡,為無人艇的避碰行為提供有效的幫助。

      6 結(jié) 語

      本文針對動態(tài)障礙物利用基于Elman神經(jīng)網(wǎng)絡(luò)作為預(yù)測模型組成預(yù)測控制系統(tǒng)的方法對其進(jìn)行運(yùn)動狀態(tài)預(yù)測,使無人艇能夠準(zhǔn)確判斷障礙物的方位及運(yùn)動軌跡的信息。首先設(shè)計(jì)控制系統(tǒng)預(yù)測模型結(jié)構(gòu),確定輸入輸出以及各參數(shù)之間的關(guān)系;其次設(shè)計(jì)算法模型,對各參數(shù)之間建立定量分析;最后通過任意路線曲線實(shí)例進(jìn)行仿真,得出經(jīng)緯度誤差都在0.8 m以內(nèi)的結(jié)論,驗(yàn)證預(yù)測模型的可行性。本文對未來無人艇動態(tài)障礙物的軌跡預(yù)測研究打下了堅(jiān)實(shí)基礎(chǔ)。

      猜你喜歡
      障礙物時刻軌跡
      冬“傲”時刻
      捕獵時刻
      軌跡
      軌跡
      高低翻越
      SelTrac?CBTC系統(tǒng)中非通信障礙物的設(shè)計(jì)和處理
      軌跡
      進(jìn)化的軌跡(一)——進(jìn)化,無盡的適應(yīng)
      中國三峽(2017年2期)2017-06-09 08:15:29
      街拍的歡樂時刻到來了
      一天的時刻
      罗源县| 盈江县| 东丽区| 隆化县| 攀枝花市| 陈巴尔虎旗| 阳朔县| 常山县| 昌宁县| 东辽县| 丰都县| 静海县| 项城市| 茶陵县| 高密市| 潞西市| 常熟市| 宣恩县| 平阳县| 郸城县| 普兰店市| 铜鼓县| 茶陵县| 固原市| 横峰县| 岳阳县| 绥芬河市| 桐柏县| 饶阳县| 沁源县| 固安县| 博湖县| 罗甸县| 保山市| 信宜市| 昌图县| 遵化市| 宁陕县| 夏邑县| 新晃| 夹江县|