• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      無線網(wǎng)絡(luò)環(huán)境下移動機(jī)器人軌跡跟蹤的認(rèn)知控制分析與設(shè)計(jì)

      2021-01-08 06:18:54徐君鵬尹遜和
      控制理論與應(yīng)用 2020年12期
      關(guān)鍵詞:重傳包率移動機(jī)器人

      徐君鵬,尹遜和

      (北京交通大學(xué)電子信息工程學(xué)院,北京 100044)

      1 引言

      網(wǎng)絡(luò)控制系統(tǒng)是由各個智能節(jié)點(diǎn)(傳感器節(jié)點(diǎn)、控制器節(jié)點(diǎn)和執(zhí)行器節(jié)點(diǎn))通過共享的通信網(wǎng)絡(luò)連接構(gòu)成的分布式控制系統(tǒng).與傳統(tǒng)的點(diǎn)對點(diǎn)控制系統(tǒng)相比,通信網(wǎng)絡(luò)的引入降低了控制系統(tǒng)的維護(hù)成本,提高了控制系統(tǒng)的靈活性.因此網(wǎng)絡(luò)控制系統(tǒng)廣泛地應(yīng)用在工業(yè)控制、智能電網(wǎng)、汽車等實(shí)際系統(tǒng)中[1-3].通信網(wǎng)絡(luò)為控制系統(tǒng)帶來便利的同時(shí)也引入了網(wǎng)絡(luò)誘導(dǎo)時(shí)延、數(shù)據(jù)包丟失、數(shù)據(jù)包亂序等問題.這些問題降低了控制系統(tǒng)的性能,甚至讓控制系統(tǒng)不穩(wěn)定.

      對于通信網(wǎng)絡(luò)帶來的時(shí)延、丟包等問題,現(xiàn)有的文獻(xiàn)已經(jīng)提出了很多方法.文獻(xiàn)[4]針對網(wǎng)絡(luò)環(huán)境的丟包問題,使用改進(jìn)的模型預(yù)測控制算法來控制焦炭爐的燃燒室壓力,但是沒有考慮網(wǎng)絡(luò)時(shí)延對控制系統(tǒng)的影響.文獻(xiàn)[5]假設(shè)網(wǎng)絡(luò)的連續(xù)數(shù)據(jù)包丟失數(shù)量小于預(yù)先設(shè)定的上界,設(shè)計(jì)預(yù)測控制器來處理網(wǎng)絡(luò)的丟包問題.文獻(xiàn)[6]假設(shè)無線網(wǎng)絡(luò)的時(shí)延小于設(shè)定的采樣周期,設(shè)計(jì)模糊滑??刂破骺刂茩C(jī)器人跟蹤給定的參考軌跡.文獻(xiàn)[7]假設(shè)網(wǎng)絡(luò)時(shí)延為常數(shù),設(shè)計(jì)了自適應(yīng)模糊控制器來控制非線性的被控對象.文獻(xiàn)[8]假設(shè)網(wǎng)絡(luò)時(shí)延小于設(shè)定的上界,使用切換控制方法設(shè)計(jì)了控制器,但是沒有考慮網(wǎng)絡(luò)的丟包問題.文獻(xiàn)[9-10]把網(wǎng)絡(luò)的丟包和數(shù)據(jù)包亂序考慮為往返時(shí)延(round trip time),假設(shè)網(wǎng)絡(luò)的往返時(shí)延小于一個設(shè)定的上界,使用預(yù)測控制方法對往返時(shí)延進(jìn)行補(bǔ)償.

      上述文獻(xiàn)首先對網(wǎng)絡(luò)環(huán)境的時(shí)延和丟包特性進(jìn)行理想性假設(shè),然后設(shè)計(jì)對應(yīng)的控制算法,所以能夠較好地控制被控對象.然而無線網(wǎng)絡(luò)環(huán)境的時(shí)延和丟包特性具有不確定性,在控制系統(tǒng)運(yùn)行過程中難以保證所做的假設(shè)得到滿足.在2012年,Simon Haykin提出了工程意義下的認(rèn)知控制思想[11].他認(rèn)為傳統(tǒng)的控制方法在結(jié)構(gòu)化的環(huán)境(structured environment)中,可以很好地完成控制任務(wù),但是在非結(jié)構(gòu)化的環(huán)境(unstructured environment)中,傳統(tǒng)的控制方法的性能不夠好,而認(rèn)知控制能夠更好地在非結(jié)構(gòu)化的環(huán)境中控制被控對象[11].

      在本文中,如果網(wǎng)絡(luò)的時(shí)延和丟包特性滿足預(yù)先設(shè)定的理想性假設(shè),例如,網(wǎng)絡(luò)的時(shí)延總是小于一個采樣周期或者總是小于設(shè)定的上界、網(wǎng)絡(luò)連續(xù)丟包數(shù)量一定小于提前設(shè)定的上界,那么稱這樣的網(wǎng)絡(luò)環(huán)境為結(jié)構(gòu)化的網(wǎng)絡(luò)環(huán)境;如果網(wǎng)絡(luò)的時(shí)延和丟包特性不滿足預(yù)先設(shè)定的理想性假設(shè),例如,網(wǎng)絡(luò)環(huán)境的時(shí)延和丟包特性是未知的,無法設(shè)置一個合理的上界來說明網(wǎng)絡(luò)的時(shí)延和丟包特性,那么這樣的網(wǎng)絡(luò)環(huán)境為非結(jié)構(gòu)化的網(wǎng)絡(luò)環(huán)境.

      到目前為止,工程領(lǐng)域的認(rèn)知控制處于剛剛起步的階段.文獻(xiàn)[12-14]使用認(rèn)知控制方法調(diào)節(jié)雷達(dá)發(fā)射的電波的波形參數(shù),提高了雷達(dá)追蹤目標(biāo)的精度.文獻(xiàn)[15-16]把認(rèn)知控制思想應(yīng)用到基于通信的列車控制系統(tǒng)中,提高了列車的控制性能,降低了列車的能耗.文獻(xiàn)[17]以認(rèn)知車為應(yīng)用背景,概述了環(huán)境認(rèn)知、駕駛員認(rèn)知及駕駛員的刺激-反應(yīng)過程、決策-動作過程的建模方法,突出了人在控制系統(tǒng)中的作用.文獻(xiàn)[18]把無人機(jī)與環(huán)境的交互過程建模為脈沖微分包含(impulse differential inclusions)模型,導(dǎo)出了認(rèn)知無人機(jī)-環(huán)境系統(tǒng)的防碰撞穩(wěn)定性條件,驗(yàn)證了該條件的有效性.文獻(xiàn)[19]提出了基于認(rèn)知博弈制導(dǎo)的無人機(jī)防碰撞方法,并通過仿真驗(yàn)證了所提方法的有效性.

      與通常的設(shè)計(jì)控制算法的思路不同,本文是在沒有預(yù)先對網(wǎng)絡(luò)環(huán)境的時(shí)延和丟包特性進(jìn)行理想性假設(shè)的條件下進(jìn)行控制算法設(shè)計(jì)的.借鑒Simon Haykin提出的認(rèn)知控制思想,本文定義了無線網(wǎng)絡(luò)環(huán)境的狀態(tài)(請見第5 部分),并使用網(wǎng)絡(luò)的狀態(tài)表示信息間隙(information gap);然后在無線網(wǎng)絡(luò)控制系統(tǒng)(wireless networked control system,WNCS)中加入了認(rèn)知控制器,用認(rèn)知控制器來調(diào)節(jié)無線網(wǎng)絡(luò)的媒體接入控制(media access control,MAC)層的重傳次數(shù)上限和物理控制器的命令序列長度.目的是通過調(diào)節(jié)MAC 層的重傳次數(shù)上限來減小WNCS的信息間隙,降低非結(jié)構(gòu)化的網(wǎng)絡(luò)環(huán)境的時(shí)延和丟包對控制系統(tǒng)的影響.通過調(diào)節(jié)物理控制器的命令序列長度(請見第6部分),來提高控制系統(tǒng)對非結(jié)構(gòu)化的網(wǎng)絡(luò)環(huán)境的時(shí)延和丟包的承受能力.

      與現(xiàn)有的認(rèn)知控制相關(guān)的工作[15-16]相比,本文的創(chuàng)新點(diǎn)為:在無線網(wǎng)絡(luò)控制系統(tǒng)中應(yīng)用認(rèn)知控制思想,把模型預(yù)測控制器(本文中稱為物理控制器)的命令序列長度的調(diào)節(jié)和無線網(wǎng)絡(luò)MAC層重傳次數(shù)上限參數(shù)的調(diào)節(jié)加入到基于認(rèn)知控制的WNCS的設(shè)計(jì)中,提高了WNCS對網(wǎng)絡(luò)環(huán)境的時(shí)延和丟包的承受能力.

      本文的結(jié)構(gòu)如下:第2部分介紹了認(rèn)知控制思想的基本內(nèi)容;第3部分概括地描述了本文設(shè)計(jì)的WNCS的工作過程,它的工作細(xì)節(jié)在第4部分到第6部分給出;第4部分介紹了全向輪移動機(jī)器人的動態(tài)特性數(shù)學(xué)模型及其工作過程;第5部分描述了來自于無線網(wǎng)絡(luò)環(huán)境的感知過程;第6部分展示了WNCS的控制部分;第7部分分析了基于認(rèn)知控制思想設(shè)計(jì)的WNCS的仿真結(jié)果;第8部分對本文進(jìn)行了總結(jié).

      2 認(rèn)知控制思想簡介

      認(rèn)知控制起源于神經(jīng)科學(xué)和心理學(xué)[20].在2012年,Simon Haykin提出了工程意義下的認(rèn)知控制思想[11].在文獻(xiàn)[11]中,Simon Haykin 指出當(dāng)傳統(tǒng)的控制系統(tǒng)在非結(jié)構(gòu)化的或者高度不確定的環(huán)境中運(yùn)行時(shí),人類對控制系統(tǒng)的調(diào)節(jié)是必不可少的.如果把“認(rèn)知能力”整合到控制系統(tǒng)中,那么這個“認(rèn)知能力”可以替代或者減少人類對控制系統(tǒng)的干預(yù).因此,在控制系統(tǒng)中加入認(rèn)知控制器,代替人類對控制系統(tǒng)的調(diào)節(jié)作用,會使得在非結(jié)構(gòu)化的環(huán)境中運(yùn)行的控制系統(tǒng)的性能更好.

      與傳統(tǒng)的以控制被控對象的狀態(tài)為目標(biāo)的控制算法不同,認(rèn)知控制思想的目標(biāo)是通過對系統(tǒng)有向信息流的調(diào)整,來減小由具體任務(wù)定義的信息間隙[11].通過減小信息間隙,提高在非結(jié)構(gòu)化的環(huán)境中運(yùn)行的控制系統(tǒng)的性能.認(rèn)知控制系統(tǒng)的結(jié)構(gòu)框圖如圖1所示.認(rèn)知控制系統(tǒng)由感知部分、控制部分、工作記憶(working memory)、系統(tǒng)和環(huán)境組成[11].為避免混淆,認(rèn)知控制系統(tǒng)中的“系統(tǒng)”在本文中稱為廣義的被控對象.值得注意的是,圖1中的認(rèn)知控制系統(tǒng)是一個抽象的框架,其中的箭頭及結(jié)構(gòu)可以根據(jù)具體的應(yīng)用進(jìn)行裁剪[11].圖1所示的認(rèn)知控制系統(tǒng)的工作過程概述如下:感知部分的感知器聯(lián)合感知記憶,對來自于廣義的被控對象和環(huán)境的感知測量信息進(jìn)行處理,然后把處理后的信息反饋給認(rèn)知控制系統(tǒng)的控制部分.控制部分中的認(rèn)知控制器利用感知部分反饋的信息進(jìn)行學(xué)習(xí),并對環(huán)境、廣義的被控對象及物理控制器產(chǎn)生認(rèn)知作用(cognitive action).物理控制器產(chǎn)生物理作用(physical action)作為廣義的被控對象的輸入.廣義的被控對象和環(huán)境由于認(rèn)知控制器和物理控制器的激勵而產(chǎn)生變化.此時(shí),認(rèn)知控制系統(tǒng)完成了一個感知-作用循環(huán)(perception-action cycle).認(rèn)知控制器在不斷的感知-作用循環(huán)中學(xué)習(xí)產(chǎn)生認(rèn)知作用的策略.

      圖1 Simon Haykin提出的認(rèn)知控制系統(tǒng)框架[11]Fig.1 The cognitive control framework proposed by Simon Haykin[11]

      3 基于認(rèn)知控制思想設(shè)計(jì)的WNCS架構(gòu)

      本文把認(rèn)知控制思想應(yīng)用到WNCS中,設(shè)計(jì)的WNCS如圖2所示.圖2中的WNCS由全向輪移動機(jī)器人(簡稱移動機(jī)器人,即圖1 中的“廣義的被控對象”)、無線網(wǎng)絡(luò)環(huán)境、感知部分和控制部分組成.WNCS 的工作過程分為2 個子過程:①感知過程;②控制過程.這2個子過程構(gòu)成了WNCS的基本工作過程:感知-作用循環(huán).

      在概述WNCS的感知-作用循環(huán)之前,首先說明WNCS使用的時(shí)間戳機(jī)制.設(shè)控制系統(tǒng)的當(dāng)前時(shí)刻k為傳感器發(fā)送的數(shù)據(jù)包的時(shí)間戳,k=0,ΔT,2ΔT,···,其中ΔT是傳感器的采樣間隔.由于無線網(wǎng)絡(luò)中存在時(shí)延和丟包的現(xiàn)象,到達(dá)感知部分的數(shù)據(jù)包并不是傳感器在當(dāng)前時(shí)刻k發(fā)送的,而是在時(shí)刻k之前的某個觸發(fā)時(shí)刻k′發(fā)送的,所以感知部分收到的數(shù)據(jù)包的時(shí)間戳為k′,且有k′<k.同理,設(shè)移動機(jī)器人的緩存模塊收到的數(shù)據(jù)包的時(shí)間戳為k′′,則有k′′<k′.最后k,k′,k′′三者的關(guān)系為:k >k′>k′′.

      圖2 基于認(rèn)知控制思想設(shè)計(jì)的WNCSFig.2 WNCS designed based on the idea of cognitive control

      以時(shí)間戳機(jī)制為基礎(chǔ),WNCS的感知-作用循環(huán)過程概述如下:①感知過程:在觸發(fā)時(shí)刻k,傳感器把SEN(k)={ub(k),x(k),p(k)}送入網(wǎng)絡(luò),其中:ub(k)為執(zhí)行器的輸入信號,x(k)為移動機(jī)器人的離散動態(tài)模型式(3)中的狀態(tài)(請見第4部分),p(k)為移動機(jī)器人的位置及姿態(tài).傳感器之所以發(fā)送信號ub(k),是因?yàn)槲锢砜刂破餍枰眯盘杣b(k)和狀態(tài)x(k)計(jì)算移動機(jī)器人下一時(shí)刻的狀態(tài)(請見第6.3節(jié)).由WNCS的時(shí)間戳機(jī)制可知,感知部分收到的數(shù)據(jù)包的時(shí)間戳為k′,所以設(shè)感知部分收到的數(shù)據(jù)包中的信息為SEN(k′).在感知部分收到信息SEN(k′)后,它聯(lián)合感知記憶存儲的歷史信息MEM,利用時(shí)間戳k′得到網(wǎng)絡(luò)的狀態(tài)snet和信息間隙h(請見第5.2 節(jié)).感知器把SEN(k′)中的移動機(jī)器人的狀態(tài)x(k′)、執(zhí)行器在時(shí)刻k′的輸入信號ub(k′)送入物理控制器,把移動機(jī)器人的位置及姿態(tài)p(k′)傳給參考信號產(chǎn)生器;②控制過程:認(rèn)知控制器由信息間隙h、網(wǎng)絡(luò)的狀態(tài)snet產(chǎn)生認(rèn)知作用,來調(diào)節(jié)物理控制器的命令序列長度al、無線網(wǎng)絡(luò)MAC層的重傳次數(shù)上限ar.參考信號產(chǎn)生器產(chǎn)生速度參考信號Rv(k′)并把它傳給物理控制器,物理控制器由信號Rv(k′),x(k′),ub(k′),al產(chǎn)生控制命令序列U(k′)并把它發(fā)送到網(wǎng)絡(luò)中.由WNCS的時(shí)間戳機(jī)制可知,移動機(jī)器人的緩存模塊收到的數(shù)據(jù)包的時(shí)間戳為k′′,所以這里使用U(k′′)表示移動機(jī)器人收到的信息.在移動機(jī)器人的緩存模塊收到U(k′′)后,把其中的控制命令ub(k)傳給執(zhí)行器,執(zhí)行器驅(qū)動移動機(jī)器人運(yùn)動.

      本文設(shè)計(jì)的WNCS的工作細(xì)節(jié)在第4部分到第6部分給出,其中:第4部分介紹了移動機(jī)器人的動態(tài)特性數(shù)學(xué)模型及其工作細(xì)節(jié);第5部分描述了感知部分的工作細(xì)節(jié);第6部分展示了控制部分的工作細(xì)節(jié).

      4 全向輪移動機(jī)器人

      本部分首先介紹全向輪移動機(jī)器人的動態(tài)特性數(shù)學(xué)模型,然后給出全向輪移動機(jī)器人的緩存模塊及傳感器的工作過程.

      本文使用文獻(xiàn)[21]中的三輪移動機(jī)器人作為被控對象.圖3為移動機(jī)器人的結(jié)構(gòu)示意圖,v(t)和vn(t)分別表示全向輪移動機(jī)器人的前進(jìn)速度和側(cè)向速度的大小,w(t)為轉(zhuǎn)動角速度的大小.

      圖3 三輪全向輪移動機(jī)器人的結(jié)構(gòu)示意圖[21]Fig.3 The structure of omnidirectional three wheels mobile robot[21]

      圖3中:σ為移動機(jī)器人側(cè)向速度與其中心點(diǎn)P到第3個車輪所在射線的夾角,σ固定為30°.xp(t),yp(t)表示移動機(jī)器人中心點(diǎn)P的橫坐標(biāo)和縱坐標(biāo),θp(t)表示移動機(jī)器人與地面坐標(biāo)系x軸之間的夾角,移動機(jī)器人的位置及姿態(tài)用p(t)=[xp(t) yp(t) θp(t)]T表示.全向輪移動機(jī)器人的動態(tài)特性數(shù)學(xué)模型由式(1)給出[21]:

      其中:x(t)=[v(t) vn(t) w(t)]T,u(t)=[u1(t) u2(t)u3(t)]T為移動機(jī)器人3 個馬達(dá)的輸入電壓,y(t)=x(t)是移動機(jī)器人的模型的輸出,sgn(·)是符號函數(shù),矩陣A,B,K的具體數(shù)值以及移動機(jī)器人的各個參數(shù)的數(shù)值請見文獻(xiàn)[21].由于移動機(jī)器人的動態(tài)特性模型式(1)中帶有非線性項(xiàng)sgnx(t),可令u(t)=uf(t)+ub(t)進(jìn)行反饋線性化[21],其中uf(t)=-B-1K·sgnx(t).把u(t)代入式(1)可得

      進(jìn)而可以把式(2)變換為如式(3)所示的離散形式:

      移動機(jī)器人的緩存模塊用新得到的物理控制器的命令序列覆蓋原本存儲于其中的命令序列.執(zhí)行器為時(shí)間驅(qū)動,在執(zhí)行器的觸發(fā)時(shí)刻k,設(shè)緩存模塊中的命令序列為U(k′′)={ub(k′′+1|k′′),ub(k′′+2|k′′),···,ub(k′′+al|k′′)},其中al是物理控制器的命令序列長度(控制命令的計(jì)算過程請見第6.3節(jié)).緩存模塊根據(jù)以下方法取出控制命令序列U(k′′)中的命令:①如果k′′+al<k,即U(k′′)中不存在時(shí)刻k的命令,那么使用零輸入策略,即ub(k)=0;②如果k′′+al≥k,即U(k′′)中存在時(shí)刻k的命令,則ub(k)=ub(k|k′′).緩存模塊取出命令ub(k)后,把它送給執(zhí)行器來驅(qū)動移動機(jī)器人運(yùn)動.需要強(qiáng)調(diào)的是,本文設(shè)計(jì)的WNCS的目標(biāo)是控制移動機(jī)器人跟蹤給定的正弦參考軌跡,緩存模塊采取“零輸入策略”比“保持策略”具有更好的控制效果.因?yàn)樵跓o線網(wǎng)絡(luò)環(huán)境的時(shí)延和丟包比較嚴(yán)重時(shí),零輸入策略會讓移動機(jī)器人失去動力,它會停在參考軌跡附近,而保持策略會繼續(xù)驅(qū)動移動機(jī)器人運(yùn)動.這會使它嚴(yán)重地偏離正弦參考軌跡,所以本文采用了零輸入策略.

      設(shè)移動機(jī)器人的傳感器可以測得其位置及姿態(tài)信號p(k)=[xp(k) yp(k) θp(k)]T.在觸發(fā)時(shí)刻k,傳感器得到執(zhí)行器的輸入信號ub(k)、移動機(jī)器人的狀態(tài)x(k)及移動機(jī)器人的位置及姿態(tài)p(k)后,把信息SEN(k)={ub(k)x(k)p(k)}送入網(wǎng)絡(luò).

      5 來自無線網(wǎng)絡(luò)環(huán)境的感知過程

      由于感知部分需要測量無線網(wǎng)絡(luò)的丟包率及時(shí)延,本部分首先介紹無線網(wǎng)絡(luò)的丟包率和數(shù)據(jù)包重傳機(jī)制的關(guān)系,然后描述感知部分對無線網(wǎng)絡(luò)環(huán)境的感知過程.

      5.1 無線網(wǎng)絡(luò)環(huán)境

      本文使用的無線網(wǎng)絡(luò)協(xié)議符合IEEE 802.11g 標(biāo)準(zhǔn).與有線網(wǎng)絡(luò)相比,雖然無線網(wǎng)絡(luò)的丟包現(xiàn)象比較嚴(yán)重,但是無線網(wǎng)絡(luò)的MAC層的重傳機(jī)制可以有效地降低WNCS的丟包率.因?yàn)橐坏?shù)據(jù)包在MAC層傳輸失敗,MAC層會對丟失的數(shù)據(jù)包進(jìn)行重傳,直到數(shù)據(jù)包傳輸成功或者重傳次數(shù)達(dá)到設(shè)定的上界.如果MAC層成功地重傳了數(shù)據(jù)包,那么對于WNCS而言,相當(dāng)于這個數(shù)據(jù)包沒有丟失,所以MAC層重傳數(shù)據(jù)包的機(jī)制會減小無線網(wǎng)絡(luò)的丟包率.

      但是MAC層的重傳次數(shù)上限不是越高越好.如果MAC層的重傳次數(shù)上限過高,那么MAC層會對丟失的數(shù)據(jù)包進(jìn)行大量地重傳,這會增加網(wǎng)絡(luò)的負(fù)擔(dān),并有可能造成網(wǎng)絡(luò)的擁塞.如果網(wǎng)絡(luò)產(chǎn)生了擁塞,那么網(wǎng)絡(luò)控制系統(tǒng)將會癱瘓.大量地重傳數(shù)據(jù)包還會增加數(shù)據(jù)包的時(shí)延,而這對實(shí)時(shí)性要求較高的控制系統(tǒng)而言是無價(jià)值且不利的.

      5.2 感知過程

      感知部分的感知器只接收最新的數(shù)據(jù)包.假設(shè)新得到的數(shù)據(jù)包中的信息為SEN(k′)={ub(k′),x(k′),p(k′)}.在接收到數(shù)據(jù)包后,感知器由現(xiàn)在的時(shí)間tc及時(shí)間戳k′計(jì)算數(shù)據(jù)包從傳感器到感知器的時(shí)延τsp=tc-k′,并把時(shí)間戳k′傳給感知記憶.感知記憶中存儲的時(shí)間戳集合用PM表示.在感知部分收到數(shù)據(jù)包后,感知記憶把時(shí)間窗口N中的時(shí)間戳的集合MEM={i|kc-N+1≤i≤kc,i∈PM}傳給感知器(若kc-N+1<0,則MEM={i|0 ≤i ≤kc,i ∈PM}),其 中kc為與現(xiàn)在的時(shí)間tc最近且小于tc的傳感器觸發(fā)時(shí)刻.感知器利用MEM由式(4)計(jì)算WNCS的丟包率

      其中I(i)用來指示時(shí)間戳i是否屬于MEM;若屬于,則I(i)=1,否則I(i)=0.

      有了估算的WNCS的丟包率ploss及時(shí)延τsp,就可以對網(wǎng)絡(luò)環(huán)境的狀態(tài)進(jìn)行表示.設(shè)網(wǎng)絡(luò)的狀態(tài)為snet=f(ploss,τsp),其中函數(shù)f是一個非減函數(shù),且有理想的網(wǎng)絡(luò)狀態(tài)=f(0,0)=0,這里使用函數(shù)

      把ploss和τsp映射到范圍在0和1之間的網(wǎng)絡(luò)狀態(tài)snet.一般地,丟包率越高,時(shí)延越長代表網(wǎng)絡(luò)的狀態(tài)越差.式(5)表示的是時(shí)延、丟包到網(wǎng)絡(luò)狀態(tài)的映射關(guān)系,意在表示網(wǎng)絡(luò)的狀態(tài)越好,其對應(yīng)的時(shí)延和丟包率越小;網(wǎng)絡(luò)的狀態(tài)越差,對應(yīng)的時(shí)延和丟包率越大.如果考慮網(wǎng)絡(luò)其他的不利因素,可以根據(jù)經(jīng)驗(yàn)或者其他依據(jù)設(shè)計(jì)式(5),表達(dá)網(wǎng)絡(luò)的狀態(tài)和不利因素的關(guān)系.

      定義1信息間隙h為感知器得到的通信網(wǎng)絡(luò)的狀態(tài)snet和理想的網(wǎng)絡(luò)的狀態(tài)之間的差,即h=

      這里定義的信息間隙本質(zhì)上代表了網(wǎng)絡(luò)環(huán)境的優(yōu)劣.信息間隙h越大,它所代表的網(wǎng)絡(luò)環(huán)境越惡劣.為了提高網(wǎng)絡(luò)控制系統(tǒng)的控制效果,根據(jù)第5.1節(jié)對無線網(wǎng)絡(luò)環(huán)境的分析,可以通過認(rèn)知控制器調(diào)節(jié)MAC層的重傳次數(shù)上限來減小WNCS的丟包率和時(shí)延.這樣就減小了本部分定義的信息間隙,而認(rèn)知控制的目標(biāo)即是減小由具體任務(wù)定義的信息間隙.認(rèn)知控制器的細(xì)節(jié)在第6.1節(jié)給出.

      最后,感知部分把執(zhí)行器的輸入ub(k′)、移動機(jī)器人的狀態(tài)x(k′)傳給物理控制器,把移動機(jī)器人的位置及姿態(tài)p(k′)傳給參考信號產(chǎn)生器,把網(wǎng)絡(luò)狀態(tài)snet和信息間隙h發(fā)送給認(rèn)知控制器.

      6 控制過程

      本部分首先描述認(rèn)知控制器的工作過程,參考信號產(chǎn)生器的工作細(xì)節(jié)在第6.2節(jié)給出.第6.3節(jié)展示了物理控制器的工作過程.

      6.1 認(rèn)知控制器

      本文采用Q學(xué)習(xí)算法作為認(rèn)知控制器的算法.認(rèn)知控制器的輸入是感知部分傳來的網(wǎng)絡(luò)的狀態(tài)snet和信息間隙h,其中:信息間隙h用來計(jì)算認(rèn)知控制器的回報(bào),網(wǎng)絡(luò)的狀態(tài)snet用來確定認(rèn)知控制器的狀態(tài).認(rèn)知控制器產(chǎn)生的認(rèn)知作用為a=(ar,al).

      由式(5)可知,snet越大表示網(wǎng)絡(luò)的時(shí)延及丟包越嚴(yán)重.本文把snet的取值范圍劃分為4個區(qū)間,每個區(qū)間對應(yīng)認(rèn)知控制器的一個狀態(tài),如表1所示.認(rèn)知控制器可以根據(jù)其狀態(tài)產(chǎn)生相應(yīng)的認(rèn)知作用,調(diào)節(jié)WNCS的MAC層重傳次數(shù)上限和物理控制器的命令序列長度,提高WNCS對網(wǎng)絡(luò)的時(shí)延和丟包的承受能力.

      表1 網(wǎng)絡(luò)的狀態(tài)snet所在的區(qū)間、網(wǎng)絡(luò)的時(shí)延和丟包的嚴(yán)重程度定性描述、認(rèn)知控制器的狀態(tài)的對應(yīng)關(guān)系Table 1 The relationship between the interval of network state snet,qualitative description of severity of the network delay and packet loss and the state of cognitive controller

      認(rèn)知控制器產(chǎn)生的認(rèn)知作用集合為Ac={(al,ar)|al∈AL,ar∈AR},其中:AR={2,4,6,8},AL={2,4,8,16}.這樣設(shè)計(jì)的原因是:①Q(mào) 學(xué)習(xí)算法的動作空間應(yīng)該盡量的小,這有利于認(rèn)知控制器快速地學(xué)習(xí)產(chǎn)生認(rèn)知作用的策略;②對于實(shí)時(shí)性要求較高的控制系統(tǒng)而言,MAC層的重傳次數(shù)上限不宜過高;③物理控制器的命令序列長度過長會增加物理控制器的計(jì)算負(fù)擔(dān),過短則難以起到預(yù)測的效果.為了減小動作空間的大小,集合AR中的重傳次數(shù)上限采用偶數(shù)次.為了使MAC層的重傳次數(shù)上限不至于過高,設(shè)定最大的重傳次數(shù)上限為8次.由于物理控制器的命令序列過長會增加物理控制器的計(jì)算負(fù)擔(dān),所以設(shè)置它的命令序列長度最長為16.同樣為了減小動作空間的大小,AL中的物理控制器命令序列長度為2的指數(shù)次.

      使用Q學(xué)習(xí)算法實(shí)現(xiàn)認(rèn)知控制器的目的是減小第5.2節(jié)定義的信息間隙,所以設(shè)計(jì)Q學(xué)習(xí)算法的回報(bào)為

      其中:h′表示認(rèn)知控制器在上一個感知-作用循環(huán)中得到的信息間隙;μ的值為0.1,用來防止當(dāng)h接近0時(shí),回報(bào)的絕對值變得很大.這樣設(shè)計(jì)回報(bào)的原因是:可以通過回報(bào)的符號(即,正:獎勵;負(fù):懲罰)使認(rèn)知控制器產(chǎn)生合適的認(rèn)知作用.

      對于認(rèn)知控制器在狀態(tài)s做出的每個動作a=(al,ar),認(rèn)知控制器可由式(6)得到相應(yīng)的回報(bào)r、由表1的對應(yīng)關(guān)系得到狀態(tài)s′,認(rèn)知控制器利用式(7)[22]來更新Q(s,a):

      其中:α是學(xué)習(xí)率,γ是折扣因子,α′是使Q(s′,a′)的值最大的認(rèn)知作用.最后,認(rèn)知控制器由式(8)產(chǎn)生認(rèn)知作用:

      其中Ac為認(rèn)知控制器的認(rèn)知作用的集合.

      6.2 參考信號產(chǎn)生器

      顧名思義,參考信號產(chǎn)生器的功能是由移動機(jī)器人的位置及姿態(tài)p(k′)產(chǎn)生適合的物理控制器的速度參考信號Rv(k′).

      參考信號產(chǎn)生器中預(yù)先設(shè)定的正弦軌跡參考點(diǎn)如式(9)所示.

      圖4 參考信號產(chǎn)生器選擇軌跡參考點(diǎn)Fig.4 Reference signal generator choosing trajectory reference points

      需要注意的是,在下一次參考信號產(chǎn)生器選擇軌跡參考點(diǎn)時(shí),它是接著從第nk′個軌跡參考點(diǎn)開始判斷移動機(jī)器人與軌跡參考點(diǎn)的距離是否小于ls的.按照這種方法選出的軌跡參考點(diǎn)會在移動機(jī)器人的前方引導(dǎo)它前進(jìn).使用閾值ls是由于網(wǎng)絡(luò)的時(shí)延和丟包現(xiàn)象導(dǎo)致參考信號產(chǎn)生器得到的信息p(k′)不是實(shí)時(shí)信息.因?yàn)樵趨⒖夹盘柈a(chǎn)生器得到信息p(k′)時(shí),移動機(jī)器人已經(jīng)向前走了小段的距離,所以在選擇軌跡參考點(diǎn)時(shí),應(yīng)該留有一定的裕量.在選定Np個軌跡參考點(diǎn)后,參考信號產(chǎn)生器用式(10)和式(11)[21]來計(jì)算物理控制器的參考信號

      6.3 物理控制器

      物理控制器中運(yùn)行的控制算法是模型預(yù)測控制算法[23],預(yù)測模型為式(3).在得到反饋的狀態(tài)x(k′)和k′時(shí)刻執(zhí)行器的輸入ub(k′)后,物理控制器首先利用式(3)求出k′+1時(shí)刻的移動機(jī)器人的狀態(tài)x(k′+1).這是因?yàn)橐苿訖C(jī)器人在k′時(shí)刻已經(jīng)輸入了ub(k′),計(jì)算k′時(shí)刻的控制命令已經(jīng)沒有意義.

      在得到信號Rv(k′),x(k′),ub(k′),al后,物理控制器使用模型預(yù)測控制算法計(jì)算它的命令序列.模型預(yù)測控制算法中預(yù)測時(shí)域(predictive horizon)的長度(即參考信號序列的長度)為Np;控制時(shí)域(control horizon)的長度(即物理控制器命令序列的長度al)由認(rèn)知控制器調(diào)節(jié).模型預(yù)測控制算法表示為[23]

      其中:Q=100I,R=I.式(12)是一個二次規(guī)劃問題,可以通過“內(nèi)點(diǎn)法”進(jìn)行求解.最后,物理控制器得到的控制命令序列為U(k′)={ub(k′+1|k′),ub(k′+2|k′),···,ub(k′+al|k′)}.

      在無線網(wǎng)絡(luò)的時(shí)延和丟包較輕時(shí),使用較短的物理控制器命令序列可以減小物理控制器的計(jì)算負(fù)擔(dān);在無線網(wǎng)絡(luò)的時(shí)延和丟包比較嚴(yán)重時(shí),增加物理控制器的命令序列長度對網(wǎng)絡(luò)的時(shí)延和丟包具有一定的補(bǔ)償作用.所以,物理控制器的命令序列長度需要認(rèn)知控制器根據(jù)網(wǎng)絡(luò)的狀態(tài)來進(jìn)行調(diào)節(jié).

      7 仿真結(jié)果及分析

      本部分使用70%,80%,90%的MAC層丟包率及相應(yīng)的網(wǎng)絡(luò)時(shí)延來近似地表示非結(jié)構(gòu)化的無線網(wǎng)絡(luò)環(huán)境.在此網(wǎng)絡(luò)環(huán)境下,對比兩種配置的WNCS的仿真結(jié)果,這兩種配置為:①使用固定的MAC層重傳次數(shù)上限和固定的物理控制器命令序列長度(請見第7.1節(jié));②使用認(rèn)知控制器調(diào)節(jié)MAC層重傳次數(shù)上限和物理控制器命令序列長度(請見第7.2節(jié)).通過第7.1節(jié)和第7.2節(jié)中移動機(jī)器人跟蹤正弦參考軌跡的控制效果及相對應(yīng)的網(wǎng)絡(luò)狀態(tài)的比較,展示了在WNCS中加入認(rèn)知控制器的有效性,即通過調(diào)節(jié)MAC層重傳次數(shù)上限和物理控制器的命令序列長度,減小了第5.2節(jié)定義的信息間隙,降低了非結(jié)構(gòu)化的網(wǎng)絡(luò)環(huán)境對WNCS的控制性能的影響,提高了WNCS對非結(jié)構(gòu)化的網(wǎng)絡(luò)環(huán)境的時(shí)延和丟包的承受能力.

      本文使用Truetime工具箱進(jìn)行WNCS的仿真.在仿真中,移動機(jī)器人的初始位置是世界坐標(biāo)系的原點(diǎn).移動機(jī)器人與世界坐標(biāo)系x軸的夾角初始值為0°.傳感器的采樣間隔ΔT為0.01 s.關(guān)于移動機(jī)器人的參數(shù)請見文獻(xiàn)[21].無線網(wǎng)絡(luò)的數(shù)據(jù)率為54 Mb/s.感知器估計(jì)丟包率的時(shí)間窗口N為50.參考信號產(chǎn)生器中預(yù)先設(shè)定的參考軌跡為式(9)所示的正弦參考軌跡,其中:Δ d 為0.005 m;參考信號產(chǎn)生器中的閾值ls為0.05 m;選取的軌跡參考點(diǎn)的個數(shù)Np為20;式(7)中的學(xué)習(xí)率α為0.1;折扣因子γ為0.9.

      由于運(yùn)動控制系統(tǒng)要求較高的采樣率,而符合IEEE 802.11g 標(biāo)準(zhǔn)的無線網(wǎng)絡(luò)的數(shù)據(jù)率可以達(dá)到54 Mb/s,這為傳感器0.01 s的采樣間隔提供了保障.在感知部分估計(jì)網(wǎng)絡(luò)的丟包率時(shí),采用過長的時(shí)間窗口會使估計(jì)過程變慢;如果時(shí)間窗口過短則導(dǎo)致估計(jì)的丟包率不準(zhǔn)確,所以選擇N為50.由于在參考軌跡上取足夠多的軌跡參考點(diǎn)才能讓這些參考點(diǎn)逼近連續(xù)的參考軌跡,所以式(9)中Δd為0.005 m.移動機(jī)器人在一個采樣周期中前進(jìn)的距離d≈vnavΔT=0.005 m.由第6.2節(jié)所述,這里選擇ls為0.05 m大約可以預(yù)留10個采樣周期中移動機(jī)器人前進(jìn)距離的裕量,目的是保持軌跡參考點(diǎn)在移動機(jī)器人的前方引導(dǎo)它前進(jìn).如果ls選擇的過大,則在參考軌跡曲率較大的轉(zhuǎn)角處,移動機(jī)器人無法精確地跟蹤參考軌跡;Np的數(shù)值過大會增加模型預(yù)測控制算法的計(jì)算負(fù)擔(dān),又因?yàn)樵谀P皖A(yù)測控制算法中,Np需要大于最長的控制時(shí)域的長度,即al的最大值16,所以這里選擇Np為20.在Q學(xué)習(xí)算法中,折扣因子γ的取值范圍是0到1,γ越大,未來的回報(bào)的權(quán)重越大.如果選擇的學(xué)習(xí)率α的值過大,會使Q學(xué)習(xí)算法不穩(wěn)定[22],所以這里選擇γ為0.9,α為0.1.

      7.1 使用固定的al,ar

      因?yàn)镸AC層的重傳機(jī)制可以降低WNCS的丟包率,但是重傳次數(shù)過大會增大網(wǎng)絡(luò)的時(shí)延、負(fù)荷,所以在集合AR中選擇ar為6;物理控制器的命令序列長度過長會增大控制器的計(jì)算量,過短則難以起到預(yù)測的效果,所以在集合AL中選擇al為8.

      下面將結(jié)合表2和圖5-7,按照MAC層丟包率增大的順序分析WNCS的仿真結(jié)果.

      表2 MAC層丟包率、WNCS的丟包率、移動機(jī)器人與參考軌跡的距離均值的對應(yīng)關(guān)系(al=8,ar=6)Table 2 The relationship between packet loss probability of MAC layer,packet loss probability of WNCS and average distance between the mobile robot and reference trajectory(al=8,ar=6)

      圖5 移動機(jī)器人跟蹤正弦參考軌跡的仿真結(jié)果(al=8,ar=6,MAC層的丟包率設(shè)為70%)Fig.5 Simulation result that the mobile robot tracking sinusoidal reference trajectory(al=8,ar=6,and packet loss probability of the MAC layer is set as 70%)

      圖6 移動機(jī)器人跟蹤正弦參考軌跡的仿真結(jié)果(al=8,ar=6,MAC層的丟包率設(shè)為80%)Fig.6 Simulation result that the mobile robot tracking sinusoidal reference trajectory(al=8,ar=6,and packet loss probability of the MAC layer is set as 80%)

      圖7 移動機(jī)器人跟蹤正弦參考軌跡的仿真結(jié)果(al=8,ar=6,MAC層的丟包率設(shè)為90%)Fig.7 Simulation result that the mobile robot tracking sinusoidal reference trajectory(al=8,ar=6,and packet loss probability of the MAC layer is set as 90%)

      從表2可以看出:在MAC層丟包率為70%時(shí),MAC層的重傳機(jī)制可以把WNCS的丟包率降至12.59%;移動機(jī)器人與參考軌跡的距離均值為0.0226 m.

      在圖5(a)中,移動機(jī)器人可以令人滿意地跟蹤給定的正弦參考軌跡.在圖5(b)中,傳感器到感知器的時(shí)延低于0.07 s.在圖5(c)中,移動機(jī)器人的橫坐標(biāo)xp(t)和縱坐標(biāo)yp(t)可以較好地跟蹤它們的參考值和,沒有出現(xiàn)由于時(shí)延和丟包使移動機(jī)器人停止前進(jìn)的情況.在圖5(c)的第3個子圖中,在參考軌跡的轉(zhuǎn)角處,變化很快,移動機(jī)器人與世界坐標(biāo)系x軸的夾角θp(t)跟蹤需要一定的時(shí)間.在圖5及之后的仿真圖中,在正弦參考軌跡曲率較大的轉(zhuǎn)角處,移動機(jī)器人與參考軌跡的距離有所增加.這是由第6.2節(jié)中參考信號產(chǎn)生器產(chǎn)生速度參考信號的機(jī)制造成的,即為了防止由于網(wǎng)絡(luò)的時(shí)延或丟包造成移動機(jī)器人的軌跡參考點(diǎn)位于其后方,使用移動機(jī)器人前方ls=0.05 m的軌跡參考點(diǎn)來引導(dǎo)移動機(jī)器人前進(jìn).而這0.05 m的裕量,導(dǎo)致了在參考軌跡轉(zhuǎn)角處,移動機(jī)器人與參考軌跡的距離的增加.

      在MAC層的丟包率為80%時(shí),由表2可知,固定為6的MAC層重傳次數(shù)上限雖然也可以降低WNCS的丟包率,但是WNCS的丟包率已經(jīng)達(dá)到了46.14%,移動機(jī)器人與參考軌跡的距離均值也相應(yīng)地增大到0.0392 m.從圖6(a)可以看出,移動機(jī)器人依然可以跟蹤參考軌跡.由圖6(b)可知,大約在1 s附近、2 s到4 s、9 s到11 s,無線網(wǎng)絡(luò)的時(shí)延增加.在圖6(c)中相應(yīng)的時(shí)間段,xp(t),yp(t),θp(t)的數(shù)值保持不變.這說明因?yàn)闊o線網(wǎng)絡(luò)狀態(tài)變差,導(dǎo)致移動機(jī)器人得不到物理控制器的命令,使移動機(jī)器人停止了前進(jìn).由圖6的仿真結(jié)果可以看出,無線網(wǎng)絡(luò)MAC層丟包率增加到80%,導(dǎo)致WNCS控制移動機(jī)器人跟蹤參考軌跡的性能下降,但WNCS依然可以完成移動機(jī)器人的控制任務(wù).

      在無線網(wǎng)絡(luò)的MAC層丟包率為90%時(shí),由表2可知,WNCS的丟包率達(dá)到了96.84%.這是由于大量的數(shù)據(jù)包的丟失使MAC層大量地重傳丟失的數(shù)據(jù)包,最終導(dǎo)致了網(wǎng)絡(luò)的擁塞.由圖7(a)可以看出,WNCS已經(jīng)無法控制移動機(jī)器人跟蹤參考軌跡.在圖7(b)中,網(wǎng)絡(luò)的時(shí)延呈現(xiàn)出不可接受的線性增長.圖7(c)表明,移動機(jī)器人在大約0.5 s時(shí),由于網(wǎng)絡(luò)的擁塞而停止了運(yùn)動.所以,對于MAC層丟包率為90%的情形,MAC層重傳次數(shù)上限固定為6次、物理控制器命令序列長度固定為8的配置顯然是不合適的.

      綜合分析表2和圖5-7的仿真結(jié)果,可以看出在無線網(wǎng)絡(luò)MAC層的丟包率為70%時(shí),設(shè)置ar固定為6可以顯著地降低WNCS的丟包率.但是在無線網(wǎng)絡(luò)MAC層的丟包率為80%時(shí),設(shè)置al為6會導(dǎo)致WNCS對丟失的數(shù)據(jù)包進(jìn)行大量地重傳,這加重了無線網(wǎng)絡(luò)的負(fù)擔(dān).長度固定為8的物理控制器命令序列不能有效地克服網(wǎng)絡(luò)的時(shí)延和丟包,導(dǎo)致移動機(jī)器人多次失去動力.MAC層丟包率為90%時(shí),使用固定配置的WNCS產(chǎn)生了網(wǎng)絡(luò)擁塞.所以,使用固定的MAC層重傳次數(shù)上限和物理控制器命令序列長度具有局限性.

      7.2 使用認(rèn)知控制器調(diào)節(jié)al,ar

      為了克服WNCS使用固定的MAC層重傳次數(shù)上限和固定的物理控制器命令序列長度的缺點(diǎn),本文在WNCS中加入認(rèn)知控制器來調(diào)節(jié)MAC層的重傳次數(shù)上限和物理控制器的命令序列長度.

      本文依然按照MAC層丟包率增大的順序,結(jié)合圖8-10和表3對WNCS的仿真結(jié)果進(jìn)行分析.首先,由表3 中的數(shù)據(jù)可以看出,在MAC 層的丟包率為70%,80%,90%情形下,WNCS沒有出現(xiàn)網(wǎng)絡(luò)擁塞的狀況.這說明認(rèn)知控制器通過調(diào)節(jié)MAC層重傳次數(shù)上限和物理控制器命令序列長度避免了網(wǎng)絡(luò)的擁塞.

      在MAC層的丟包率為70%時(shí),表3中的WNCS的丟包率大于表2中的相應(yīng)的丟包率.表3中的移動機(jī)器人與參考軌跡的距離均值要比表2中相應(yīng)的距離均值小0.0085 m.對比圖8(a)和圖5(a)、圖8(c)和圖5(c)可以看出,兩種配置的WNCS控制移動機(jī)器人跟蹤正弦參考軌跡的控制效果相差很小.圖8(b)中傳感器到感知器的時(shí)延小于圖5(b)中的時(shí)延;圖8(d)是認(rèn)知控制器調(diào)節(jié)MAC層重傳次數(shù)上限ar和物理控制器命令序列長度al的過程.從圖8(d)可以看出,在認(rèn)知控制器的調(diào)節(jié)下,大部分時(shí)間al的值為4,ar的值為4,可見物理控制器的命令序列長度al為4足夠克服WNCS的70%的MAC層丟包率及對應(yīng)的時(shí)延.

      圖8 移動機(jī)器人跟蹤正弦參考軌跡的仿真結(jié)果(使用認(rèn)知控制器調(diào)節(jié)ar和al,MAC層丟包率為70%)Fig.8 Simulation result that the mobile robot tracking sinusoidal reference trajectory(ar and al are adjusted by cognitive controller,and packet loss probability of the MAC layer is set as 70%)

      在MAC 層的丟包率為80%時(shí),表3 中WNCS 的丟包率為35.03%,而表2 中對應(yīng)的WNCS的丟包率為46.14%.可見使用認(rèn)知控制器調(diào)節(jié)MAC層的重傳次數(shù)上限和物理控制器的命令序列長度,可以使WNCS的丟包率降低11%左右.表3中的移動機(jī)器人與參考軌跡的距離均值比表2中相應(yīng)的值小0.0255 m.圖9(a)和圖6(a)中,移動機(jī)器人都可以跟蹤正弦參考軌跡.對比圖9(b)和圖6(b)可以看出,圖9(b)的時(shí)延要明顯小于圖6(b)的時(shí)延.從圖9(c)可以看出,移動機(jī)器人沒有出現(xiàn)因?yàn)槭恿ΧV骨斑M(jìn)的情況;而圖6(c)中,移動機(jī)器人出現(xiàn)了多次失去動力的情形.由圖9(d)可知,ar大部分時(shí)間為4,al大部分時(shí)間為16.圖9和圖6的仿真結(jié)果表明:對于高達(dá)80%的MAC層丟包率,MAC層重傳大量的數(shù)據(jù)包不但沒有顯著地減小WNCS的丟包率,還增加了網(wǎng)絡(luò)的時(shí)延.這是因?yàn)橹貍鞔罅康臄?shù)據(jù)包會增加網(wǎng)絡(luò)的負(fù)擔(dān).認(rèn)知控制器選擇ar為4,al為16,一方面減小了數(shù)據(jù)包的重傳次數(shù),這減小了網(wǎng)絡(luò)的負(fù)荷;另一方面增加了物理控制器的命令序列長度,這提高了WNCS對網(wǎng)絡(luò)時(shí)延和丟包的承受能力.由仿真結(jié)果可以看出,認(rèn)知控制器通過調(diào)節(jié)MAC層的重傳次數(shù)上限和物理控制器的命令序列長度,改善了網(wǎng)絡(luò)的狀態(tài),進(jìn)而減小了第5.2 節(jié)定義的信息間隙,提高了WNCS控制移動機(jī)器人跟蹤參考軌跡的性能.

      圖9 移動機(jī)器人跟蹤正弦參考軌跡的仿真結(jié)果(使用認(rèn)知控制器調(diào)節(jié)ar和al,MAC層丟包率為80%)Fig.9 Simulation result that the mobile robot tracking sinusoidal reference trajectory(ar and al are adjusted by cognitive controller,and packet loss probability of the MAC layer is set as 80%)

      表3 MAC層的丟包率、WNCS的丟包率及移動機(jī)器人與參考軌跡的距離均值的對應(yīng)關(guān)系(使用認(rèn)知控制器)Table 3 The relationship between packet loss probability of MAC layer,packet loss probability of WNCS and average distance between the mobile robot and reference trajectory(using cognitive controller)

      對于無線網(wǎng)絡(luò)更加嚴(yán)酷的90%的MAC層丟包率,由第7.1節(jié)可知:使用固定配置的WNCS的網(wǎng)絡(luò)發(fā)生了擁塞,WNCS無法控制移動機(jī)器人運(yùn)動.表3中的WNCS的丟包率為60.19%,可見認(rèn)知控制器的調(diào)節(jié)作用大幅降低了WNCS的丟包率.圖10表明,在WNCS中加入認(rèn)知控制器可以避免這一問題.從圖10(a)和圖10(c)可以看出,控制系統(tǒng)依然可以控制移動機(jī)器人跟蹤參考軌跡.圖10(b)中的時(shí)延沒有出現(xiàn)線性增長.由圖10(d)可以看出,在WNCS運(yùn)行過程中,ar的值大部分時(shí)間是4,al大部分時(shí)間為16.與MAC層丟包率為80%的情形相同,這一方面減小了網(wǎng)絡(luò)的負(fù)荷,另一方面提高了WNCS對時(shí)延和丟包的承受能力.圖10的仿真結(jié)果表明,在MAC層丟包率為90%的情形下,認(rèn)知控制器調(diào)節(jié)MAC層重傳次數(shù)上限和物理控制器命令序列長度,改善了WNCS的無線網(wǎng)絡(luò)環(huán)境,減小了信息間隙,提高了WNCS對無線網(wǎng)絡(luò)環(huán)境的時(shí)延和丟包的承受能力.

      圖10 移動機(jī)器人跟蹤正弦參考軌跡的仿真結(jié)果(使用認(rèn)知控制器調(diào)節(jié)ar和al,MAC層丟包率為90%)Fig.10 Simulation result that the mobile robot tracking sinusoidal reference trajectory(ar and al are adjusted by cognitive controller,and packet loss probability of the MAC layer is set as 90%)

      綜合第7.1節(jié)和第7.2節(jié)的仿真結(jié)果可以看出:在WNCS中加入認(rèn)知控制器調(diào)節(jié)MAC層的重傳次數(shù)上限和物理控制器的命令序列長度,增強(qiáng)了WNCS對網(wǎng)絡(luò)時(shí)延和丟包的承受能力,降低了WNCS的丟包率和時(shí)延,進(jìn)而改善了第5.2節(jié)定義的網(wǎng)絡(luò)狀態(tài),減小了信息間隙.這為WNCS控制移動機(jī)器人運(yùn)動提供了較好的網(wǎng)絡(luò)環(huán)境,有利于提高WNCS控制移動機(jī)器人跟蹤參考軌跡的性能.

      8 結(jié)論

      本文受啟發(fā)于Simon Haykin提出的認(rèn)知控制思想,用70%,80%,90%的MAC層丟包率及相應(yīng)的網(wǎng)絡(luò)時(shí)延來近似非結(jié)構(gòu)化的無線網(wǎng)絡(luò)環(huán)境.按照Simon Haykin提出的認(rèn)知控制系統(tǒng)框架,設(shè)計(jì)了包含認(rèn)知控制器的WNCS.通過對比使用固定配置的WNCS 的仿真結(jié)果和加入認(rèn)知控制器的WNCS的仿真結(jié)果,得出認(rèn)知控制器通過調(diào)節(jié)MAC層的重傳次數(shù)上限和物理控制器的命令序列長度,增強(qiáng)了WNCS對無線網(wǎng)絡(luò)環(huán)境的時(shí)延和丟包的承受能力,降低了WNCS的丟包率和時(shí)延,改善了網(wǎng)絡(luò)的狀態(tài),減小了本文定義的信息間隙,提高了WNCS控制移動機(jī)器人跟蹤給定正弦參考軌跡的性能.

      然而,網(wǎng)絡(luò)控制系統(tǒng)面臨的不僅僅是網(wǎng)絡(luò)環(huán)境的時(shí)延和丟包問題.如何應(yīng)用認(rèn)知控制思想來同時(shí)處理更多的網(wǎng)絡(luò)的不理想的特性,如量化誤差、時(shí)序錯亂、時(shí)延及丟包,是一個挑戰(zhàn)性的問題.

      猜你喜歡
      重傳包率移動機(jī)器人
      移動機(jī)器人自主動態(tài)避障方法
      支持向量機(jī)的船舶網(wǎng)絡(luò)丟包率預(yù)測數(shù)學(xué)模型
      一種基于噴泉碼的異構(gòu)網(wǎng)絡(luò)發(fā)包算法*
      一種新的VANET網(wǎng)絡(luò)鏈路丟包率估計(jì)算法
      面向異構(gòu)網(wǎng)絡(luò)的多路徑數(shù)據(jù)重傳研究?
      基于Twincat的移動機(jī)器人制孔系統(tǒng)
      TCN 協(xié)議分析裝置丟包率研究
      數(shù)據(jù)鏈路層的選擇重傳協(xié)議的優(yōu)化改進(jìn)
      極坐標(biāo)系下移動機(jī)器人的點(diǎn)鎮(zhèn)定
      基于引導(dǎo)角的非完整移動機(jī)器人軌跡跟蹤控制
      佳木斯市| 辉县市| 山东省| 察哈| 蒙自县| 河北省| 孝义市| 玛曲县| 哈密市| 封开县| 长寿区| 贺兰县| 新巴尔虎左旗| 北川| 阳原县| 广汉市| 伊金霍洛旗| 师宗县| 木兰县| 达孜县| 交口县| 沾化县| 黔西县| 石棉县| 新乡县| 卫辉市| 姚安县| 金乡县| 营山县| 沅江市| 宜春市| SHOW| 勐海县| 崇阳县| 渝中区| 大英县| 博客| 枣庄市| 武威市| 林西县| 祁门县|