王方雨
(宜春學院 體育學院,江西 宜春 336000)
機器人是集機械、計算機、仿生學等眾多學科于一體的產(chǎn)物,在各個領域都有著重要的用途。機器人以應用領域區(qū)分為服務機器人和工業(yè)機器人:工業(yè)機器人操作比較簡單,在工業(yè)生產(chǎn)中用于一些重復性的工作;服務機器人在有普通服務機器人和特殊服務機器人,普通服務機器人在現(xiàn)今家庭中應用非常多,特殊服務機器人在一些特殊領域中應用,如軍事領域、醫(yī)學領域、農(nóng)業(yè)生產(chǎn)領域等[1]。在人工智能的快速發(fā)展中,機器人的控制開始應用智能技術進行設計,為傳統(tǒng)的機器人帶來轉(zhuǎn)型。智能化的機器人為農(nóng)業(yè)生產(chǎn)帶來技術性的改革,為生產(chǎn)企業(yè)節(jié)約了成本,提高了農(nóng)戶的收益。移動機器人自主設計是指機器人在沒有人類干預可自主行進至目的地。為實現(xiàn)自主避障,機器人需要根據(jù)工作環(huán)境實時地規(guī)劃路徑。為此,本文采用模糊控制法研究了障礙物檢測和路徑規(guī)劃方法,障礙物的檢測則采用安裝在采摘機器人上的傳感器來實現(xiàn)[2]。
足球比賽運動中,球員的目的是帶球通過對方球員的干擾阻擾踢進球門。在這個過程中,球員需要自主判斷對方的運動軌跡,及時規(guī)劃可行的路徑通過對方,在多名對手來攔球時需要控制自己前進的速度避開對方,及時調(diào)整路徑到達最佳位置進行射門。移動機器人就相當于前進的球員,需要到達的目的地就是對方的球門,球員帶球前進的過程就是移動機器人自主避障過程。自主避障設計方法中有格柵法、行為控制法、人工勢場法、氣泡帶方法、模糊算法等[3-4],本文研究的農(nóng)用移動機器人自主避障設計采用模糊邏輯控制法[5-16]。避障能力的高低取決于機器人的智能水平,而避障能力則主要表現(xiàn)在環(huán)境感應和路徑規(guī)劃兩方面。保證機器人在陌生復雜工作環(huán)境中的自主避障能力,需要提高采摘機器人的工作環(huán)境的快速識別檢測和避障算法的魯棒性。采摘移動機器人在實際工作中經(jīng)常會出現(xiàn)意外情況,如感應錯誤、路徑規(guī)劃不及時等,在進行避障設計需要考慮到這些情況的發(fā)生,確保機器人在異常情況下還可執(zhí)行程序。
為此,基于足球比賽運動的移動機器人自主避障設計,以傳感器識別工作環(huán)境,以模糊邏輯控制算法進行路徑規(guī)劃,以實現(xiàn)移動機器人的自主避障。
移動機器人避障過程的前提工作就是采集環(huán)境信息,利用傳感器進行信息采集,并將采集的信息經(jīng)過處理算法后輸出,根據(jù)輸出信息制定行進路徑,達到自主避障的目的。本文采用的信息采集設備為傳感器。最早將傳感器應用在機器人的是視覺傳感器,到目前研究人員已經(jīng)研發(fā)出了各種類型的傳感器,如紅外線傳感器、激光傳感器及超聲波傳感器等。其中,超聲波傳感器是通過發(fā)射一種振動頻率比較高的機械波來檢測距離的,工作原理是通過電壓激勵換能晶片,使晶片振動產(chǎn)生機械波。這種機械波的穿透力很好,遇到障礙物的反射現(xiàn)象也很明顯,當檢測到的障礙物處于移動狀態(tài)時,超聲波會在移動障礙物上發(fā)送多普勒效應。超聲波傳感器在檢測距離較大,而激光傳感器的需要具備激光發(fā)射器。激光傳感器對于檢測距離、速度等特性比較有優(yōu)勢,特別是遇到移動狀態(tài)的障礙物時,可以實時檢測。紅外傳感器以紅外線為介質(zhì),可調(diào)節(jié)檢測靈敏度,檢測盲區(qū)小,不易受作業(yè)環(huán)境的影響。視覺傳感器的成本低和易用性被人們廣泛應用。本文研究的自主避障設計采用激光傳感器、紅外傳感器與視覺傳感器融合技術。
信息采集的過程是將工作環(huán)境信息進行數(shù)字化,通過激光傳感器、紅外傳感器和視覺傳感器采集信息,并將采集的信息進行融合。融合的信息可得到工作環(huán)境的兩種信息:一種是障礙物的距離信息;另一種是障礙物的分布情況。
采用視覺傳感器采集的圖像信息會存在一些噪聲等,為了精確避障,需要將將圖像進行處理,精確確定障礙物的位置。圖像信息處理手段有光流法及平滑、分割等算法。光流法計算量比較大,但可以計算物體發(fā)送移動導致的在圖像上物體的位置與實際物體位置的差別;圖像進行平滑主要是消除圖像的噪聲;圖像分割則是在復雜圖像中將障礙物的形狀提取出來,確保移動機器人可以避開。
工作環(huán)境未知的情況下,移動機器人路徑規(guī)劃方法根據(jù)建?;蛩阉鞑呗钥梢苑譃樗拇箢悾夯诳臻g幾何結(jié)構(gòu)、前向圖搜索法、基于行為的規(guī)劃法和智能法。在四大類的規(guī)劃方法中,還可分出許多不同的路徑規(guī)劃方法。
1)基于空間幾何結(jié)構(gòu)的路徑規(guī)劃方法是通過建筑圖形來描述檢測環(huán)境空間,并在圖上找到最佳路徑,在這種方法中圖形的建筑比較重要。
可視圖法是通過將移動機器人的起點、終點和障礙物頂點用直線段連接建立可視圖(見圖1),保證直線不會與障礙物接觸。可視圖中不是所有的直線對最優(yōu)路徑的規(guī)劃都有幫助,應將可視圖進行簡化,清除掉無用的直線,保留對最優(yōu)路徑規(guī)劃有幫助的直線。簡化的可視圖終點(見圖2)可以縮短路徑規(guī)劃使用的時間,提高自主避障的實時性。
Voronoi圖法是根據(jù)已檢測到的障礙物圖形建立障礙物的分布圖,將移動機器人的起點與終點連接于障礙物分布圖中,通過算法在圖中找到機器人移動最短路徑,實時性比較好,但不能確保是最優(yōu)路徑。
柵格分解法是目前應用最多的方法之一,它是將移動機器人作業(yè)環(huán)境采集圖像分割多個格柵,在單個格柵中找到無碰撞路徑連接,用圖像中的柵格編號來組成。柵格分解法又可分為兩種:一種是確切柵格分解法,分解的柵格與原空間大小是一樣的,在障礙物頂點開始畫平行線,碰到其他邊或線就停止,形成一系列的梯形,并將梯形依次編號;另一種是不確切柵格分解法,將控制分解為預定的性狀,每個圖形都是相連的,將分解過的圖形再進行分解,重復分解后達到解的界限。
基于幾何構(gòu)造的規(guī)劃方法不能很好地滿足設定的約束條件,但比較完備。
圖1 可視圖
圖2 簡化可視圖
2)前向圖搜索算法在環(huán)境結(jié)構(gòu)圖建筑出來后,趨向目標搜索路徑。比較多使用的有廣度優(yōu)化算法、深度優(yōu)化算法及人工勢場法等。
(1)廣度優(yōu)化算法是指廣度優(yōu)先搜索路徑,橫向搜索出最優(yōu)路徑,可以保證優(yōu)先搜索到路徑是最優(yōu)路徑。
(2)深度優(yōu)化算法可以快速的搜索到一條路徑,但快速搜索到的路徑都是比較長的路徑,故在應用時會把深度優(yōu)化算法和廣度優(yōu)化算法結(jié)合使用。
(3)人工勢場法是通過引入勢場函數(shù)來描述移動機器人的運行空間,再搜索勢場的下降規(guī)則來進行路徑規(guī)劃。勢場又分為吸引勢和排斥勢,吸引勢是針對目的地的,排斥勢是針對障礙物的。將兩種勢場疊加,就可規(guī)劃出最優(yōu)路徑,該方法適用于局部路徑規(guī)劃。
3)基于行為的規(guī)劃方法的重點工作是建模,設計一系列行為,且每種行為可以達到不同的作用。趨向行為是達到目的地,避障行為則是避開障礙物,行為融合則是將不同的行為融合同時作用,即在趨向目標的同時避開障礙物。該方法的研究重點是信息采集、機器人行為及行為控制結(jié)構(gòu)等。
4)智能化規(guī)劃法有遺傳算法、模糊控制算法及神經(jīng)網(wǎng)絡法等,結(jié)合多種算法進行路徑規(guī)劃,易于實現(xiàn)路徑自主規(guī)劃。
(1)遺傳算法是通過初始化群體進行選擇、交叉、變異等操作,并將群體遺傳進化出最優(yōu)個體,該最優(yōu)個體就是最優(yōu)路徑個體。
(2)模糊控制算法適用于機器人作業(yè)環(huán)境未知的情況,路徑規(guī)劃時間快,而且對于移動機器人行走的方向和速度可以很好地推理決策,輸入障礙物信息,輸出路徑、轉(zhuǎn)向、速度等信息,消除數(shù)據(jù)處理時的不確定性。
(3)神經(jīng)網(wǎng)絡法是將傳感器采集的障礙物信息作為輸入層信息,經(jīng)控制器分析處理后,輸出決策信息(如移動機器人的轉(zhuǎn)向與速度等),從而保證機器人避開障礙物并達到終點。該方法路徑規(guī)劃效率高,但需要建立規(guī)則庫。
(4)智能化規(guī)劃方法利于實現(xiàn)移動機器人的自主避障設計,更大程度地提高路徑規(guī)劃效率。
基于模糊邏輯控制的動態(tài)行為路徑規(guī)劃可歸于智能化規(guī)劃法中,控制中心是模糊邏輯控制器。模糊控制器包括以下4部分:
1)模糊化。選定輸入量,將輸入量進行處理為模糊控制可用的輸入量或語言值,同時確定其取值與合適的隸屬度函數(shù)。
3)知識庫。由數(shù)據(jù)庫與規(guī)則庫組成,由專家或根據(jù)自己的經(jīng)驗來建立,包含了隸屬度函數(shù)的定義、規(guī)則論域的離散化和量子化等。
3)推理。模糊控制核心,根據(jù)輸入量和規(guī)則推理出模糊關系方程,求解出模糊輸出量,其基礎是模糊概念。
4)去模糊化。模糊化的逆運算,變換輸出量。在模糊控制法的實際應用中,需要有確定值才能輸入控制執(zhí)行機構(gòu)。常用去糊化方法有最大隸屬度法、重心法及系數(shù)加權平均法等。
模糊邏輯控制算法實現(xiàn)過程如圖3所示。
模糊邏輯控制器的使用改善了過度依賴系統(tǒng)參數(shù)來設計避障結(jié)構(gòu)的方式,其建立的知識庫可在無法建模時直接從規(guī)則庫中提取模型使用;知識庫中的規(guī)則是由人們的經(jīng)驗匯集而成,不需要太多的計算,不同領域的規(guī)則庫可由領域內(nèi)的專家輸入,適用性強。
基于模糊邏輯控制的動態(tài)行為采摘機器人路徑規(guī)劃的核心是控制邏輯與推理,針對農(nóng)用機器人在復雜作業(yè)環(huán)境中的控制問題,以自適應的控制理念來實現(xiàn)。該理念原理如下:
1)以反射式理論在控制結(jié)構(gòu)中將行為分解為兩個層次,即避障層次和趨向目標層次。
2)借鑒生物群落遺傳自自適應性,實現(xiàn)避障行為與趨向目標行為的融合。
在模糊控制體系結(jié)構(gòu)中(見圖4),感應層負責采集外界信息,控制層則控制行為。模糊控制器通過將傳感器采集的信息作為輸入,并輸出采摘機器人期望的轉(zhuǎn)向與速度,實現(xiàn)信息輸入與輸出的映射。這種方法對于環(huán)境復雜且未知的作業(yè)環(huán)境,可以快速地規(guī)劃出局部最優(yōu)路徑。
圖4 模糊控制體系結(jié)構(gòu)
多傳感器融合結(jié)構(gòu)根據(jù)信息處理方式可分為集中型、分散型、反饋型和混合型。
1)集中型是指由信息融合中心直接接受傳感器采集的信息,這時使用的傳感器只是信息采集沒有后期進行處理,適用于規(guī)模小的融合結(jié)構(gòu)。
2)分散型的信息融合系統(tǒng)是先將采集的信息進行處理后再輸送至融合中心,融合中心再進行組合推理得出結(jié)果,容量要求低,計算負荷小,但在傳感器分散處理信息時易造成信息丟失。
3)反饋型的融合結(jié)構(gòu)信息融合速度快,更利于實現(xiàn)避障系統(tǒng)的實時性。
4)混合型是結(jié)合集中型和分散型的優(yōu)點,適用于數(shù)量多且規(guī)模大的傳感器系統(tǒng)。
移動機器任務是到達目的地,在達到目的地的過程中會存在許多未知狀況,因此需要采取不同的措施。機器人的行為基本可分為避障行為及趨向行為等。在避障設計時,可根據(jù)需要設定優(yōu)先級,當行為發(fā)生碰撞時,可根據(jù)優(yōu)先級的高低執(zhí)行。
3.2.1 趨向行為
趨向行為是移動機器人執(zhí)行任務的基本條件。在機器人檢測到前面路面沒有障礙物時,機器人會直線進行到達目的地;在有障礙物時,移動機器人的行進方向及機器人與目的地之間夾角決定了機器人的行進方向,如圖5所示。
圖5 趨向行為的坐標示意圖
設c(x1,y1)為機器人位置,b(x2,y2)表示目的地,ca為機器人移動方向,θ1表示行進方向與坐標軸的夾角,θ為前進方向與距離目的地方向的夾角,則
tanθ1=y1/x1
tanθ=y2/x2
θ=arctan((y2-y1)/(x2-x1)- θ1
當θ<0時,機器人右轉(zhuǎn);當θ>0時,機器人左轉(zhuǎn)。
3.2.2 避障行為
在機器人檢測到障礙物時,根據(jù)傳感器采集的作業(yè)環(huán)境中障礙物信息,決定采取何種避障措施。避障行為會影響機器人的行走速度,也決定趨向行為的壓制時機,以模糊控制算法控制。在避障過程中,無論哪個方向有障礙物,當傳感器檢測到障礙物的距離時,將檢測數(shù)據(jù)作為模糊控制器的輸入量,觸發(fā)相應的行為,實現(xiàn)自主避障。
3.2.3 沿墻壁走行為
在移動機器人前進時,當傳感器感應到機器人兩側(cè)存在墻壁、趨向行為或避障行為不能避開障礙物且前方行走的寬度小于機器人本身寬度時,采取沿墻壁走行為;在工作環(huán)境障礙物比較多且大時,易出現(xiàn)前面所說的這種情況,采取沿墻壁走行為可以避免機器人碰撞到障礙物。
在傳感器檢測到兩側(cè)有障礙物時,根據(jù)傳感器檢測到機器人與障礙物的距離,控制器決定機器人的轉(zhuǎn)向角度和速度,對其他行為則采取壓制;當障礙物避開時,則根據(jù)傳感器檢測的情況決定采取何種行為。
3.2.4 緊急避障行為
當傳感器檢測到機器人前進方向有移動障礙物且障礙物距離機器人的距離非常近時,控制器采取緊急避障行為,即停止前進等障礙物離開再行進。緊急避障行為使得移動機器人在工作環(huán)境中遇到動態(tài)障礙物時可以安全避開。本文基于足球比賽運動的移動機器人自主避障設計中,足球比賽運動中遇到的對方球員是不停移動的,故緊急避障行為設計是必不可少的。
3.2.5 行為融合
當趨向行為和避障行為同時激活時,需要對兩種行為進行融合,將路徑進行二次規(guī)劃。趨向行為與避障行為決定機器人的轉(zhuǎn)向和行走速度,當兩種行為同時激活時,將兩者進行融合輸出一個指令。當接近障礙物時,機器人應進行避障,則執(zhí)行避障行為;但趨向行為也在執(zhí)行,不過作用力度小于避障行為,在繞過障礙物后且前面沒有障礙物時,機器人執(zhí)行趨向行為。
仿真試驗采用移動機器人為實驗對象,機器人的每個輪子可驅(qū)動也可轉(zhuǎn)向。車體安裝紅外傳感器、視覺攝像頭、激光傳感器及無線網(wǎng)卡天線等,操作系統(tǒng)采用WindowsXP。機器人后面有緊急停止按鈕和控制面板,機器人內(nèi)部則由電源驅(qū)動模塊、運動控制器、上位機、圖像采集卡和傳感器分析模塊組成。紅外傳感器安裝8個 ,機器人兩側(cè)各安裝1個,后方安裝2個,另外4個安裝在機器人前面。試驗在有無障礙物的情況下進行,試驗場所為一個10m×6m平面空間。
在沒有障礙物的情況下,機器人直接采取趨向目標行為,如圖6所示。在存在障礙物的情況下(見圖7),一是移動機器人的自主避障行為;二是緊急避障行為,即遇到動態(tài)障礙物且距離很近時停止前進,等障礙物離開再行進;三是沿墻壁走行為,這時遇到的障礙物比較大,行走路徑比較小。
圖6 機器人趨向目標行為
圖7 機器人自主避障仿真試驗
在有障礙物和無障礙物的情況下,各進行30次試驗,檢測機器人是否行走了最優(yōu)路徑。
試驗結(jié)果如表1所示。
表1 機器人自主避障試驗結(jié)果
實驗結(jié)果表明:本文設計的移動機器人自主避障系統(tǒng)可以完全避開障礙物,在路徑規(guī)劃中機器人規(guī)劃出的行走最優(yōu)路徑次數(shù)達28次,表明該機器人的自主避障系統(tǒng)有效,驗證了該自主避障設計的實時性和有效性。
基于足球比賽運動的自主避障原理,參考球員帶球避開對方球員的阻攔和搶奪到達對方球門進行射門及球員根據(jù)現(xiàn)場實際情況進行自主避開并趨向目標的方式,設計了采摘機器人自主避障系統(tǒng)。自主避障系統(tǒng)根據(jù)傳感器采集的作業(yè)環(huán)境的信息,將信息處理后輸入控制器,得到環(huán)境中障礙物分布信息,根據(jù)障礙物的分布情況采取相應行為,實現(xiàn)避障并趨向目標的要求。具有自主避障能力的移動機器人可以適應農(nóng)業(yè)生產(chǎn)中的復雜作業(yè)環(huán)境,實時有效地避開障礙物,完成作業(yè)任務。