劉晨霞,朱大奇,2?,周 蓓,顧 偉
(1.上海海事大學(xué)智能海事搜救與水下機(jī)器人上海工程技術(shù)研究中心,上海 201306;2.上海理工大學(xué)機(jī)械工程學(xué)院,上海 200093)
多自主式水下機(jī)器人(autonomous underwater vehicle,AUV)系統(tǒng)的任務(wù)分配與路徑規(guī)劃是指在復(fù)雜且多變的海洋環(huán)境中合理地分配水下作業(yè)任務(wù)給一組AUV,同時使每個獲得任務(wù)的AUV都能規(guī)劃出一條無碰撞且消耗能源最少的路徑.多AUV系統(tǒng)多目標(biāo)任務(wù)分配與路徑規(guī)劃在海底資源探索、軍事偵查、水下搜救等方面有廣泛應(yīng)用前景,是近年來海洋工程領(lǐng)域的研究熱點.
目前,任務(wù)分配方法研究主要分為3大類:基于行為的任務(wù)分配方法、基于市場競爭機(jī)制的任務(wù)分配方法和主從式任務(wù)分配方法.典型的研究成果如早期M.J.Mataric和L.Parker[1-2]提出基于人類社會行為的多AUV任務(wù)分配算法,主要是模仿人類工作的跟蹤、傳播、集成、命令的過程進(jìn)行任務(wù)分配與路徑規(guī)劃;90年代后期,R.Akkiraju和R.Turner[3-4]等提出基于市場競爭機(jī)制的多AUV任務(wù)分配策略,它的基本原理是最小成本付出最大效益收獲的市場競爭規(guī)則;近期S.Yoon[5]等針對多AUV水下搜索任務(wù)分配問題,首先指定一個主AUV,由它與水面母船通信交換信息,其他AUV與鄰近AUV采用等待方式依次交流信息,最后將水下搜救及機(jī)器人自身信息傳輸?shù)街鰽UV,由主AUV集中處理,并以鄰近傳遞的方式發(fā)送命令給其他AUV系統(tǒng),以多AUV編隊形式完成水下全覆蓋協(xié)作搜尋.
上述任務(wù)分配方法均假定水下環(huán)境已知且靜態(tài)不變的,并以此為依據(jù)建立水下任務(wù)分配或跟蹤圍捕模型,雖然能夠進(jìn)行多AUV任務(wù)分配,簡化了跟蹤圍捕方法的難度,但這種已知的靜態(tài)模型與實際的水下環(huán)境存在相當(dāng)大的距離.在實際水下作業(yè)中,AUV位置是不斷變化的,同時海流的大小對AUV的運(yùn)動影響也較大,因此,多AUV任務(wù)分配是一個動態(tài)多次分配過程,而不是一次性靜態(tài)分配過程;另外,上述AUV任務(wù)分配方法大多只研究分配問題,未討論水下機(jī)器人路徑規(guī)劃.由于任務(wù)分配與路徑規(guī)劃問題相互耦合,規(guī)劃以分配為基礎(chǔ),分配又直接受規(guī)劃結(jié)果的影響,僅僅研究任務(wù)分配而回避路徑規(guī)劃,其結(jié)果難以滿足實際作業(yè)需要.因此,不僅需要探索復(fù)雜水下環(huán)境下動態(tài)任務(wù)分配方法,而且需要進(jìn)一步研究多AUV任務(wù)分配與路徑規(guī)劃的集成與關(guān)聯(lián).
近年來,許多研究者將多傳感器信息融合、人工神經(jīng)網(wǎng)絡(luò)等智能信息處理算法引入到多AUV任務(wù)分配與路徑規(guī)劃研究中.典型的研究成果如B.Chow[6]提出一個改進(jìn)的K-均值算法,用來解決常值海流環(huán)境下的多AUV系統(tǒng)任務(wù)分配和路徑規(guī)劃問題,這個算法通過Dubins模型、AUV動態(tài)模型以及海流模型的結(jié)合,綜合考慮多水下機(jī)器人系統(tǒng)的任務(wù)分配與路徑規(guī)劃問題.但是,該算法存在的問題是:K-均值在完成多任務(wù)作業(yè)時,對移動目標(biāo)物不敏感,另外,算法僅研究了二維海流模型和無障礙物的水下環(huán)境,對實際的多障礙物水下環(huán)境來說,降低了算法的難度與適用性.
J.J.Ni[7]等將生物啟發(fā)神經(jīng)網(wǎng)絡(luò)模型引入多地面移動機(jī)器人協(xié)作圍捕中,提出多機(jī)器人智能圍捕、自動避障策略,并給出了二維平面上機(jī)器人搜索、避障追蹤、合作圍捕的仿真結(jié)果,但該算法仍然假設(shè)所有移動機(jī)器人能無條件感知逃逸目標(biāo)和障礙物,與實際環(huán)境和機(jī)器智能仍有較大差距,也沒有考慮機(jī)器人的運(yùn)動約束問題.
受任務(wù)分配與自組織神經(jīng)網(wǎng)絡(luò)原理相似性的啟發(fā),近些年來有學(xué)者將自組織神經(jīng)網(wǎng)絡(luò)(self-organizing map,SOM)模型應(yīng)用到多機(jī)器人任務(wù)分配與路徑規(guī)劃研究中.H.Huang[8-9]等利用SOM神經(jīng)網(wǎng)絡(luò)的自組織競爭實現(xiàn)多任務(wù)自適應(yīng)動態(tài)分配,通過獲勝神經(jīng)元的權(quán)值更新實現(xiàn)AUV的路徑規(guī)劃,未考慮三維的水下實際環(huán)境和AUV的運(yùn)動能力.對此D.Q.Zhu[10-11]將水下環(huán)境地圖與SOM任務(wù)分配算法結(jié)合,進(jìn)一步考慮AUV實際運(yùn)動能力問題(每次僅航行一個地圖單元),提出一種新的集成多AUV自組織任務(wù)分配與路徑規(guī)劃算法,使得多AUV任務(wù)分配與規(guī)劃方法更接近實際情況,但該方法是通過目標(biāo)物與AUV之間的歐式直線距離大小來分配任務(wù),無法適應(yīng)障礙物環(huán)境的任務(wù)分配.M.Z.Chen[12-14]等將生物啟發(fā)神經(jīng)網(wǎng)絡(luò)與SOM模型結(jié)合,設(shè)計了一種新的任務(wù)分配與路徑規(guī)劃算法,應(yīng)用SOM自組織性質(zhì)進(jìn)行任務(wù)分配,應(yīng)用生物啟發(fā)模型自適應(yīng)輸出機(jī)制實現(xiàn)安全避障,但沒有考慮水下環(huán)境中海流的實際影響,與水下現(xiàn)實環(huán)境仍有一定差距.
本文聚焦水下多障礙物與海流環(huán)境,提出一種生物啟發(fā)神經(jīng)網(wǎng)絡(luò)與速度矢量合成的自主任務(wù)分配與路徑規(guī)劃算法.將生物啟發(fā)神經(jīng)網(wǎng)絡(luò)(biologically inspired neural network,BINN)中的每一個神經(jīng)元與水下環(huán)境柵格地圖中的位置單元一一對應(yīng),計算比較每個目標(biāo)物在BINN地圖中所有AUV的活性值,并選取某個目標(biāo)物中活性值最大的AUV作為它的獲勝AUV,實現(xiàn)多AUV任務(wù)分配;針對常值海流的影響,利用矢量合成算法確定AUV實際的航行方向,實現(xiàn)AUV路徑規(guī)劃與避障.
多AUV系統(tǒng)的任務(wù)分配與路徑規(guī)劃是指在多障礙物水下環(huán)境中合理地分配水下作業(yè)任務(wù)給一組AUV,同時使每個獲得任務(wù)的AUV都能規(guī)劃出一條無碰撞的最短路徑.為了完成對工作環(huán)境中所有目標(biāo)的訪問,將每個任務(wù)目標(biāo)分配給不同的AUV,AUV在得到目標(biāo)任務(wù)后進(jìn)行路徑規(guī)劃,自主航行到任務(wù)目標(biāo)點,保證AUV航行路徑最短,同時滿足AUV航行速度的運(yùn)動學(xué)約束和安全避障.本文提出的多AUV多目標(biāo)生物啟發(fā)自主任務(wù)分配與路徑規(guī)劃算法,包括4部分內(nèi)容:一是水下環(huán)境的BINN建模;二是基于BINN模型的多目標(biāo)任務(wù)分配;三是基于BINN模型的AUV自主路徑規(guī)劃與避障;四是AUV海流環(huán)境下路徑規(guī)劃.流程圖如圖1所示.
圖1 生物啟發(fā)自主任務(wù)分配與路徑規(guī)劃算法流程Fig.1 Biologically inspired autonomous task assignment and path planning algorithm flow
在水下環(huán)境柵格地圖的基礎(chǔ)上,建立生物啟發(fā)神經(jīng)網(wǎng)絡(luò)模型,用該模型表示AUV工作環(huán)境,神經(jīng)網(wǎng)絡(luò)中的每一個神經(jīng)元與柵格地圖中的位置單元一一對應(yīng),如圖2所示,根據(jù)神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的在線活性輸出值分布情況,確定目標(biāo)任務(wù)分配給哪個AUV,且使AUV自主規(guī)劃出一條無碰撞且節(jié)省能量的航行路徑.
圖2 二維生物啟發(fā)神經(jīng)網(wǎng)絡(luò)與環(huán)境地圖映射Fig.2 Mapping between two dimensional biologically inspired neural network and environmental map
本文中BINN[15-16]算法是一種離散的生物啟發(fā)神經(jīng)網(wǎng)絡(luò),它的基本思想是目標(biāo)不斷向外傳遞激勵,而障礙物則對激勵有抑制作用,通過迭代計算出每個位置的活性值.BINN模型具有記憶特性,也就是說從地圖上的任何一點都可以通過不斷迭代求解回到激勵發(fā)出點,也就是路徑規(guī)劃問題中的目標(biāo)點.BINN模型數(shù)學(xué)描述如下:
其中:vi代表神經(jīng)元i的輸出活性值,w是連接系數(shù)矩陣,它的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,由它的網(wǎng)絡(luò)結(jié)構(gòu)易知接系數(shù)矩陣w是一個對稱的矩陣.wij表示第i個神經(jīng)元與第j個神經(jīng)元之間連接系數(shù).|qi-qj|表示第i個神經(jīng)元與第j個神經(jīng)元之間歐式距離,A,B,D是正常數(shù),A代表第i個神經(jīng)元活性值的衰減率,B和D第i個神經(jīng)元活性值的上限與下限,vi∈[-D,B].[Ii]++是激勵輸入,[Ii]-是外部抑制輸入,[Ii]+的數(shù)值是max{[Ii,0]},[Ii]-的數(shù)值min{[Ii,0]},Ii的數(shù)值由式(3)計算,由地圖柵格單元性質(zhì)決定.R表示與第i個神經(jīng)元鏈接的神經(jīng)元數(shù)量,二維為8,三維為26.
外部輸入信號由障礙物與目標(biāo)物產(chǎn)生,從式(1)-(3)可以看出,神經(jīng)元輸入激勵主要來自于外部目標(biāo)激勵與內(nèi)部神經(jīng)元之間的活性值;神經(jīng)元的輸入抑制主要來自外部障礙物.當(dāng)Ii≤0時,神經(jīng)元的激勵信號主要來源是內(nèi)部傳遞的活性值,由此可見生物啟發(fā)神經(jīng)網(wǎng)絡(luò)中目標(biāo)物具有全局吸引,而障礙物只有局部抑制.
多目標(biāo)物的任務(wù)分配問題可以拆分成多個單目標(biāo)物的問題.目標(biāo)物的BINN地圖是指將一個目標(biāo)物作為神經(jīng)網(wǎng)絡(luò)的輸入神經(jīng)元,所有的AUV作為輸出神經(jīng)元,然后利用生物啟發(fā)式動力學(xué)模型計算出柵格地圖中各個位置的活性值.因此,可以得到每個目標(biāo)物的BINN地圖中活性值最大的AUV.如果多個目標(biāo)物將同一個AUV作為獲勝AUV,則需要比較分析該AUV在這幾個目標(biāo)物的BINN地圖中的活性值,AUV在哪個目標(biāo)物的BINN地圖中活性值最大就視作是哪個目標(biāo)物的獲勝AUV.式(4)中的矩陣V表示的是每個目標(biāo)物的BINN地圖中的所有AUV的活性值.利用式(5)可以選擇出每個目標(biāo)物的BINN地圖中活性值最大的AUV.
其中:m表示目標(biāo)物的數(shù)量,n表示AUV的數(shù)量.vij表示為目標(biāo)i(i=1,2,···,m)的BINN地圖中第j(j=1,2,···,n)個AUV所處位置的活性值,定義vimax是矩陣V中第i行的最大值.也就是說,與其他AUV相比,第i個目標(biāo)物的BINN地圖中第imax個AUV具有最高的活性值.
整個任務(wù)分配過程如下:
1)利用式(1)-(3)計算每個目標(biāo)物的BINN地圖中所有AUV的活性值vij(i=1,2···,m;j=1,2,···,n);
2)矩陣第i行的最大值是位于第imax列的viimax,第k行的最大值是位于第kmax列的vkkmax,其中i和k的值不相等.表示第i(i=1,2,···,m)個目標(biāo)在BINN地圖中第imax個AUV活性值最大,第k(k=1,2,···,m)個目標(biāo)在BINN地圖中的第kmax個AUV活性值最大.
對獲得具體目標(biāo)任務(wù)的AUV來說,需要針對水下多障礙物與海流環(huán)境,規(guī)劃一條從AUV起始點到目標(biāo)點的無碰最優(yōu)航行路徑.障礙物對路徑規(guī)劃的影響主要是規(guī)劃的路徑不能穿過障礙物,而海流對路徑規(guī)劃的影響主要是在海流影響下如何使得AUV能夠沿著預(yù)設(shè)的最優(yōu)路徑行駛.
2.3.1 生物啟發(fā)AUV路徑規(guī)劃與安全避障
對于路徑規(guī)劃與安全避障問題,將AUV的運(yùn)動路徑進(jìn)行離散化,路徑規(guī)劃問題演變?yōu)閷ふ褹UV的下一個行駛位置,只有準(zhǔn)確找出該位置,才能使AUV自主規(guī)劃出一條無碰撞的行駛路徑.具體來說,AUV進(jìn)行路徑選擇時,先根據(jù)式(1)-(3)計算當(dāng)前位置周圍所有神經(jīng)元的輸出值,然后選擇周圍輸出最大的單元作為下一步的航行選擇,到達(dá)下一位置后再如此反復(fù)執(zhí)行,直到最終完成所有待搜索單元的訪問.由于障礙物單元的抑制作用,其對應(yīng)神經(jīng)元輸出小,目標(biāo)單元對神經(jīng)元輸入激勵作用,其對應(yīng)神經(jīng)元輸出大,AUV根據(jù)神經(jīng)元輸出大小,朝著輸出最大的臨近地圖單元航行,從而自適應(yīng)地避開障礙物,到達(dá)目標(biāo)單元,實現(xiàn)AUV路徑規(guī)劃與安全航行.
2.3.2 海流環(huán)境下生物啟發(fā)AUV路徑規(guī)劃
深水海流對水下機(jī)器人路徑規(guī)劃的影響,可以通過海流模型進(jìn)行補(bǔ)償.海流是海水相對穩(wěn)定的非周期性流動,隨季節(jié)、氣候、海域、地形、深度變化而變化,是時間和空間的復(fù)雜函數(shù),目前很難用精確的數(shù)學(xué)表達(dá)式描述其運(yùn)動規(guī)律.但海流隨時間和空間的變化是在較大范圍內(nèi)發(fā)生的,而在有限的特定海域和特定時間段內(nèi),特別是深海水下機(jī)器人的深海環(huán)境,海流的強(qiáng)度(流速)和流向都是比較穩(wěn)定的;同時考慮水下機(jī)器人的航行能力有限,只能在特定的時間段和海域內(nèi)作一定距離航行,因此,可將海流的運(yùn)動簡化為變化較緩慢的流動,即考慮海流的流速與方向.
海流對路徑規(guī)劃的影響主要是在海流影響下如何使得AUV能夠沿著預(yù)設(shè)的最優(yōu)路徑行駛.此處引入矢量合成算法來解決,主要是通過海流速度與AUV預(yù)設(shè)航行速度合成,使其合成速度方向保持在規(guī)劃的方向上,如圖3顯示的是AUV在海流影響下運(yùn)動方向的變化情況.在常值海流的影響下,AUV的行駛方向與海流的方向通過矢量合成得到AUV的實際移動方向;對時變海流環(huán)境下,可以看作不同常值海流的組合,在特定的時間段和海域內(nèi)可以將海流當(dāng)作流速與方向一定的常值海流處理.
圖3 在海流影響下矢量合成Fig.3 Vector synthesis under the in fluence of ocean currents
AUV在行駛過程中受海流的影響會偏離既定的航道,為了使AUV按照原來的航線前進(jìn),引入方向信度加權(quán)算法將海流對AUV路徑選擇的影響盡量降低.該算法的核心思想是在計算AUV鄰域的活性值時減去海流對AUV轉(zhuǎn)向矢量的影響,在消除海流的影響之后,再比較活性值的大小從而選擇AUV的最優(yōu)路徑.AUV的路徑選擇如式(6)所示:
其中:vij表示的是第i個AUV的第j個鄰域位置處的活性值,其中R在二維環(huán)境下的值小于等于8,在三維環(huán)境下的值小于等于26.k在[0,1]范圍內(nèi)取值,本文中k為0.05,用來控制海流對AUV轉(zhuǎn)向矢量的影響程度.Pp是AUV的上一步的坐標(biāo)位置,Pc是AUV的當(dāng)前坐標(biāo)位置,Pn是AUV的下一坐標(biāo)位置,yj表示的是在海流作用下,AUV所產(chǎn)生的的轉(zhuǎn)向矢量,它是一個與AUV艏向角度有關(guān)的函數(shù),具體的表達(dá)式為式(7).式(7)中的Δθ是θ和φl之間的差值絕對值,定義為式(8).θ表示的是無海流情況下AUV的轉(zhuǎn)向角度,定義為式(9).φl表示的是有海流情況下AUV的轉(zhuǎn)向角度,定義為式(10).其中轉(zhuǎn)向角度表示的是與x軸方向的夾角.
其中(xPc,yPc)和(xPn,yPn)分別表示的是無海流環(huán)境下AUV所處的當(dāng)前位置坐標(biāo)以及下一位置的坐標(biāo).(xPl,yPl)表示的是在有海流環(huán)境下AUV下一位置的坐標(biāo).
圖4所示的是在海流環(huán)境下AUV的轉(zhuǎn)向圖.如果海流的方向與AUV原始的行駛方向一致時,即Δθ的值為0時,此時海流對AUV的行駛方向沒有產(chǎn)生影響.如果海流的方向與AUV的行駛方向是完全相反的,即Δθ的值為180°時,則AUV在行駛的過程會受到海流反向作用力的影響.利用方向決策算法中的系數(shù)k將海流的影響進(jìn)行了削減,使得AUV行駛的方向能夠朝著既定方向前進(jìn)而不發(fā)生偏移.因此,方向決策算法不僅可以幫助AUV系統(tǒng)在海流環(huán)境下能完成預(yù)定的任務(wù),而且能夠消除海流的影響,節(jié)約能源損耗.
圖4 AUV在海流影響下的轉(zhuǎn)向Fig.4 AUV steering under the in fluence of ocean currents
本文通過柵格法將環(huán)境地圖離散化,將環(huán)境中包含障礙物的區(qū)域設(shè)置為障礙柵格,其他的設(shè)置自由柵格.符號T表示仿真環(huán)境中的目標(biāo),符號R表示AUV,仿真圖中的紅色圓點是目標(biāo)、綠色圓點是AUV、藍(lán)色連線是AUV的規(guī)劃路徑,黑色方塊代表障礙物;BINN模型的控制參數(shù)見表1.為了表明BINN模型運(yùn)用于AUV路徑規(guī)劃與安全避障中的可行性和有效性,在MATLAB 2016b中針對障礙物環(huán)境、海流環(huán)境進(jìn)行任務(wù)分配與路徑規(guī)劃仿真實驗.
表1 算法控制參數(shù)Table 1 Algorithm control parameters
圖5 AUV系統(tǒng)在45°常值海流環(huán)境下的初始狀態(tài)Fig.5 Initial state of AUV system in45°constant current environment
應(yīng)用式(1)-(4)計算每個目標(biāo)物的BINN地圖中活性值,比較T1在BINN地圖中的R1,R2,R3和R4的活性值,發(fā)現(xiàn)R3在T1的BINN地圖中具有最大的活性值,因此,R3作為目標(biāo)T1的獲選AUV;通過比較目標(biāo)T2在BINN地圖中R2的活性值最大,因此R2是目標(biāo)T2的獲選AUV;R4在T3和T4的BINN地圖中具有最大的活性值,因此,R4作為目標(biāo)T3和T4的獲選AUV.最終,R3分配給T1,R2分配給T2,R4分配給T3和T4,R1未分配目標(biāo).所有目標(biāo)都有了相應(yīng)的獲勝AUV,即T1-R3,T2-R2,T3-R4,T4-R4.
為了驗證方向決策算法對消除海流影響是可行且有效的,圖6和圖7分別顯示的是未添加方向決策算法和添加了該算法的實驗結(jié)果圖.通過對比發(fā)現(xiàn),雖然存在方向和速度固定的常值海流,兩者均能合理地分配AUV系統(tǒng)且能為每個AUV規(guī)劃出一條無碰撞且無速度跳變的路徑,但是可以明顯發(fā)現(xiàn)AUV在未使用方向決策算法時受海流的影響相對較大,導(dǎo)致AUV系統(tǒng)行駛的距離有較大增加.如圖6所示,在未使用方向決策算法的情況下,以R3為例,它為了繞開障礙物到達(dá)目標(biāo)物T1,R3本可以向軸的正向行駛,但是由于45°的海流作用,AUV偏離了原來的航向,導(dǎo)致R3需要航行更遠(yuǎn)的距離才能夠到達(dá)目標(biāo)物T1;R4同樣受到海流的影響使得它的路線發(fā)生了偏移,增加了R4航行到目標(biāo)物T4的距離.
圖6 無方向決策算法任務(wù)分配與路徑規(guī)劃Fig.6 Task assignment and path planning without direction decision making algorithm
圖7 有方向決策算法任務(wù)分配與路徑規(guī)劃Fig.7 Task assignment and path planning with direction decision making algorithm
而加入了方向決策算法之后,如圖7所示,在生物啟發(fā)神經(jīng)網(wǎng)絡(luò)模型的活性值計算中將海流的影響盡量降低,速度合成以后各個AUV能夠沿著最優(yōu)的路徑到達(dá)對應(yīng)的目標(biāo)物.圖8顯示的是存在方向為45°常值海流的場景下,未使用方向決策算法與使用方向決策算法的各個AUV實際航行距離對比柱形圖.可以發(fā)現(xiàn),雖然未使用方向決策算法的多AUV系統(tǒng)也能夠到達(dá)對應(yīng)目標(biāo)物的位置,但是各個AUV的行駛距離卻有所增加.在完成整個任務(wù)后,未使用方向決策算法的AUV系統(tǒng)總距離為48.799 m,而使用了方向決策算法AUV系統(tǒng)的總距離為44.5563 m,減少了8.7%.上述情況可以證明使用方向決策算法能夠有效消除海流對多AUV系統(tǒng)路徑偏移的影響.
圖8 常值海流下是否使用方向決策的距離對比Fig.8 Comparison of the distance made by direction decision making algorithm in45°constant current environment
為了驗證不同方向海流的影響,設(shè)計海流方向為180°,強(qiáng)度為柵格每秒,進(jìn)一步研究海流對AUV規(guī)劃航行的影響.初始狀態(tài)和圖5相同,有4個目標(biāo)需要4個AUV去訪問,4個AUV的初始坐標(biāo)分別是R1(8,1),R2(8,14),R3(6,22),R4(18,10),4個目標(biāo)物的坐標(biāo)分別是T1(4,19),T2(6,4),T3(23,15),T4(26,22).
通過對比未使用方向決策算法和使用方向決策算法的仿真實驗圖,同樣說明了方向決策算法的有效性.圖9是未使用方向決策算法的仿真結(jié)果圖.可以看出,水下環(huán)境中充滿了與x軸正向呈180°的藍(lán)色箭頭,表示的是常值海流.圖中4個藍(lán)色方塊表示的是4個AUV,4個紅色方塊表示的是目標(biāo)物.綠色的圓點表示的是AUV行駛到對應(yīng)目標(biāo)物的路線.
圖9 無方向決策算法任務(wù)分配與路徑規(guī)劃Fig.9 Task assignment and path planning without direction decision making algorithm
圖10是結(jié)合了方向決策算法的仿真結(jié)果圖.對兩種仿真實驗結(jié)果圖進(jìn)行分析比較,以R3這個AUV為例,可以發(fā)現(xiàn)在不加入方向決策算法時,海流對其路徑選擇影響比較大,航行路線呈鋸齒狀,增加了R3到目標(biāo)物T1的距離.而使用方向決策算法則會減弱海流對AUV航行方向的副作用,R3沒有行駛多余的距離,減少了能源的損耗.而對于R4這個AUV,在避開障礙物的時候受到海流的影響,它的路線就會發(fā)生了偏移,但是在使用方向決策算法修正AUV鄰域的活性值后,R4可以更加高效地完成任務(wù).
圖10 有方向決策算法任務(wù)分配與路徑規(guī)劃Fig.10 Task assignment and path planning with direction decision making algorithm
圖11顯示的是存在方向為180°海流場景下是否使用方向決策算法的實際航行距離對比柱形圖.從圖中可以發(fā)現(xiàn)AUV系統(tǒng)在未使用方向決策算法時行駛的總路程49.0416 m,而在使用了方向決策算法總路程為44.5563 m,總路程減少了9.15%.海流的影響使得AUV行駛的方向發(fā)生偏移,所以AUV系統(tǒng)為了避開障礙物以及克服海流的阻力會調(diào)整整體的航行方向,導(dǎo)致航行距離有所增加.但是加入方向決策算法之后,削減了海流影響,AUV系統(tǒng)就可以規(guī)劃出更加優(yōu)化、消耗能量更少的路徑.
圖11 180°常值海流下是否使用方向決策的距離對比Fig.11 Comparison of the distance made by direction decision making algorithm in180°constant current environment
本文在已經(jīng)構(gòu)建好AUV水下柵格地圖的基礎(chǔ)上,應(yīng)用BINN模型研究多AUV多目標(biāo)的自主任務(wù)分配與路徑規(guī)劃.該模型結(jié)構(gòu)簡單、無需樣本學(xué)習(xí)與訓(xùn)練,使得多AUV得任務(wù)分配更合理,路徑規(guī)劃更高效.為了消除海流對AUV航行方向的影響,結(jié)合方向決策算法削減了海流的影響,AUV行駛的方向能夠和無海流時的方向保持一致,減少了海流對AUV系統(tǒng)的能源損耗.