吳 濤 張 泰
井下探測機器人運動控制與局部路徑規(guī)劃
吳 濤1 張 泰2
1西安石油大學地球科學與工程學院 2長慶油田第三輸油處
井下探測機器人主要是在出現(xiàn)井下安全事故時進入事故現(xiàn)場,獲取井下狀況信息。其控制系統(tǒng)包括決策控制層、傳感及信息處理層、動作執(zhí)行層等三大層次。井下探測機器人局部路徑規(guī)劃選擇Q—learning算法。機器人借助自身所配置的專屬傳感器可以主動收集探測工作所需要的所有數(shù)據(jù),并以所收集到的環(huán)境數(shù)據(jù)為依據(jù)對工作環(huán)境做出判斷,在此基礎(chǔ)之上提出規(guī)避障礙物的最佳方案。
井下探測機器人;運動控制;局部路徑規(guī)劃;模型
井下探測機器人主要是在出現(xiàn)井下安全事故時進入事故現(xiàn)場,獲取井下狀況信息。在其開展探測的過程中會涉及大量數(shù)據(jù)處理分析工作[1],單純依賴某種類型機器人無法實現(xiàn),對井下探測機器人混合型控制系統(tǒng)進行深入分析和研究具有重要現(xiàn)實意義。
1.1 控制系統(tǒng)
為了更好地滿足油田井下事故情況探測需求,機器人控制系統(tǒng)應(yīng)具備良好的環(huán)境判斷力、決策規(guī)劃力以及環(huán)境適應(yīng)力,因此井下探測機器人應(yīng)配置環(huán)境傳感器、操作狀態(tài)傳感器以及導航信息傳感器等傳感設(shè)備,以及能夠?qū)崿F(xiàn)信息融合、決策及運動控制的計算機。其控制系統(tǒng)包括決策控制層、傳感及信息處理層、動作執(zhí)行層等三大層次。
1.2 機器人姿態(tài)控制
井下探測機器人在運行過程中必須確保姿態(tài)平穩(wěn)性及高效性,借助其姿態(tài)運動學模型,能夠獲取機器人運行姿態(tài)信息,以該信息為依據(jù)來評價判斷機器人運行狀態(tài)的平穩(wěn)性。機器人運行姿態(tài)穩(wěn)定性評價主要包括靜態(tài)穩(wěn)定性及動態(tài)穩(wěn)定性兩方面,其中靜態(tài)穩(wěn)定性主要從幾何層面進行評價[2],而動態(tài)穩(wěn)定性主要從能量層面進行評價。機器人井下探測操作的姿態(tài)控制及路徑規(guī)劃主要以其姿態(tài)穩(wěn)定性評價結(jié)果為依據(jù)。
依據(jù)邏輯規(guī)則規(guī)劃機器人行為,動作解析器所發(fā)出的解析命令傳輸?shù)絼幼鲌?zhí)行器,由后者負責具體執(zhí)行。油田井下探測機器人行為協(xié)調(diào)控制過程如圖1所示。
圖1 井下探測機器人行為協(xié)調(diào)控制過程
行為協(xié)調(diào)邏輯規(guī)則的作用是對激活基本行為作出判斷,該評價機制主要是以環(huán)境傳感器所收集到的油田井下環(huán)境數(shù)據(jù)為依據(jù)的。行為協(xié)調(diào)邏輯規(guī)則可以歸結(jié)為以下6點:①在實現(xiàn)既定目標的情況下,全部行為則被禁止;②在機器人自身并未出現(xiàn)傾斜的情況下,姿態(tài)控制行為、越障行為以及路徑規(guī)劃行為也不會被啟動;③在機器人自身傾角出現(xiàn)較為明顯的波動情況下,越障行為及路徑規(guī)劃行為是被禁止的;④在機器人自身傾角存在,但并未發(fā)生較為顯著變化的情況之下,路徑規(guī)劃行為是被禁止的,此時會對坡道子行為進行調(diào)??;⑤如果機器人依據(jù)所收集的相關(guān)數(shù)據(jù)判斷存在地形顯著變化的情況,驅(qū)動行為及路徑規(guī)劃行為被禁止;⑥機器人探測到障礙的情況下,越障行為被禁止。
2.1 算法選擇
井下探測機器人局部路徑規(guī)劃選擇Q—learning算法[3]。使用Q—learning算法環(huán)境模型并非必備條件,其規(guī)劃主要是借助異步動態(tài)法來實現(xiàn),簡單的說,Q—learning算法在不具備初始條件的前提下依然能夠取得決定決策。使用Q—learning算法無需過多地關(guān)注環(huán)境模型,只需要在確定可以實現(xiàn)迭代運算的Q函數(shù)下便可以進行優(yōu)化。此處的Q函數(shù)可以在既定條件St之下,執(zhí)行動作αt,并且之后會默認依據(jù)最優(yōu)動作序列完成強化值計算。Q—learning算法公式表達式為
之所以選擇Q—learning算法來進行井下探測機器人局部路徑優(yōu)化設(shè)計,主要是考慮到該算法可以在初始環(huán)境不明確的情況之下,借助算法優(yōu)化來確保探測機器人花費最短的時間完成路徑優(yōu)化。
2.2 局部路徑規(guī)劃
選擇Q—learning算法開展井下探測機器人路徑規(guī)劃,探測機器人在處于實際環(huán)境時可以主動收集相關(guān)環(huán)境數(shù)據(jù),從而最大限度地確保環(huán)境數(shù)據(jù)與實際吻合度,有效避免了因?qū)Τ跏辑h(huán)境數(shù)據(jù)進行更新所付出的費用。機器人借助自身所配置的專屬傳感器可以主動收集探測工作所需要的所有數(shù)據(jù),并以所收集到的環(huán)境數(shù)據(jù)為依據(jù)對工作環(huán)境做出判斷,在此基礎(chǔ)之上提出規(guī)避障礙物的最佳方案。對于一般的障礙物而言,井下探測機器人要成功規(guī)避需依靠通常具有八個方向的測距傳感器,環(huán)境數(shù)據(jù)借助這些傳感器向核心芯片進行傳輸,由后者負責計算障礙物與機器人的距離,并以該計算結(jié)果為依據(jù),推導出安全路徑。
井下探測機器人主要是用來對較為復雜的油田井下環(huán)境數(shù)據(jù)進行收集,在實踐操作當中,機器人會根據(jù)具體工作的地形環(huán)境來選擇最適宜的行為方式,但對于地形較為復雜的環(huán)境而言,就需要組合使用數(shù)種行為方式。依據(jù)邏輯規(guī)則規(guī)劃機器人行為便會生成數(shù)個基本行為所構(gòu)成的動作,動作解析器所發(fā)出的解析命令傳輸?shù)絼幼鲌?zhí)行器,由后者負責具體執(zhí)行。
[1]李曉鵬.煤礦探測機器人空間建模分析及避障路徑規(guī)劃[J].煤炭科學技術(shù),2013,12(1):123-124.
[2]田海波,馬宏偉,魏娟.礦井搜救機器人移動系統(tǒng)的研究與發(fā)展[J].機床與液壓,2012,45(10):234-235.
[3]Oscar Castillo,Leonardo Trujillo,Patricia Melin.Multiple Objective Genetic Algorithms for Path-planning Optimization in Autonomous Mobile Robots[J].Soft Computing,2007,45(3):56-57.
(欄目主持 楊 軍)
10.3969/j.issn.1006-6896.2014.3.016
基金論文:黑龍江省教育廳科學技術(shù)研究項目(12511006)(12531075);863計劃項目(2012AA061303)。