• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于MADDPG的多無人機協(xié)同任務(wù)決策

    2021-08-13 00:27:30越凱強甘志剛高佩忻
    宇航學(xué)報 2021年6期
    關(guān)鍵詞:網(wǎng)絡(luò)結(jié)構(gòu)威脅決策

    李 波,越凱強,甘志剛,高佩忻

    (西北工業(yè)大學(xué)電子信息學(xué)院,西安 710114)

    0 引 言

    近年來,無人機不但在房地產(chǎn)[1]、農(nóng)業(yè)[2]、安保[3]、搜索救援[4]、地面勘探[5]、特殊物流[6]等許多商業(yè)領(lǐng)域取得了不俗的成績[7],而且在軍事領(lǐng)域也大放異彩,出色的完成了許多有人駕駛飛機難以完成的任務(wù)。然而,單個無人機受其飛行距離、飛行范圍、彈載能力和應(yīng)對突發(fā)狀況能力的制約,難以發(fā)揮出其應(yīng)有的作戰(zhàn)效能。因此現(xiàn)有的研究都是基于多無人機系統(tǒng)[8]開展的,相比于單個無人機,多無人機系統(tǒng)具有更強的作戰(zhàn)優(yōu)勢。對于多無人機系統(tǒng)而言,任務(wù)決策問題是重中之重,各國軍事專家都在為如何解決無人機的任務(wù)決策問題而不斷努力。

    各國學(xué)者對于多無人機任務(wù)決策的研究都在如火如荼的進行,在多無人機協(xié)同搜索[9]、跟蹤[10]、任務(wù)分配[11-12]、航跡規(guī)劃[13]和編隊控制[14]等研究中,都已取得了不俗的成果。同時,深度學(xué)習(xí)和強化學(xué)習(xí)的快速發(fā)展,也極大地加快了無人機系統(tǒng)智能化[15]的發(fā)展進程。賴俊和饒瑞[16]提出了一種基于空間位置標注的好奇心驅(qū)動的深度強化學(xué)習(xí)方法,解決了室內(nèi)無人機隨機目標搜索效率不高、準確率低等問題。Xu等[17]設(shè)計了一種新型仿生變形無人機模型,并采用了深度確定性策略梯度(Deep deterministic policy gradient,DDPG)算法作為仿生變形無人機的控制策略,可以使無人機在不同任務(wù)和飛行條件下完成快速的自主變形和空氣動力學(xué)性能優(yōu)化。王濤等[18]提出了一種基于強化學(xué)習(xí)方法暨模糊Q學(xué)習(xí)的多約束條件下自主導(dǎo)航控制算法,提高了復(fù)雜環(huán)境下無人機器人自主導(dǎo)航控制系統(tǒng)的自適應(yīng)性和魯棒性,通過對非完整性約束移動機器人運動模型的仿真,證明了該算法具有可移植性和通用性,可應(yīng)用于無人機的空中躲避和攔截。Zhu等[19]以深度學(xué)習(xí)中的行動家-評論家(Actor-Critic)架構(gòu)為基礎(chǔ),并結(jié)合預(yù)訓(xùn)練的ResNet網(wǎng)絡(luò),完成了無人機在離散3D環(huán)境中進行自主導(dǎo)航到達目的地的任務(wù)。

    結(jié)合現(xiàn)有的研究成果進行分析可以發(fā)現(xiàn),現(xiàn)有研究的不足有以下幾點:

    1) 大部分基于強化學(xué)習(xí)的無人機問題的研究都是針對靜態(tài)任務(wù)展開的,且以DDPG為代表的智能算法具有學(xué)習(xí)和收斂速度慢,精度不高的缺陷。

    2)相比于單架無人機,多無人機的相關(guān)問題研究過少?,F(xiàn)在多數(shù)的多無人機協(xié)同任務(wù)決策依然使用DDPG算法[20],傳統(tǒng)DDPG等智能算法在單架無人機相關(guān)領(lǐng)域表現(xiàn)優(yōu)異,但是在多無人機環(huán)境下,由于涉及到的智能體數(shù)量多且復(fù)雜,收斂速度慢和精度不高的缺陷被放大,且隨著無人機數(shù)量的增多,其適用能力下降。

    2017年,多智能體深度確定性策略梯度(Multi-agent deep deterministic policy gradient,MADDPG)算法由OpenAI發(fā)表于NIPS,主要應(yīng)用于多智能體的協(xié)同圍捕、競爭[21-23]等場景,但MADDPG算法在多無人機協(xié)同任務(wù)決策作戰(zhàn)應(yīng)用中,特別是作戰(zhàn)環(huán)境未知的情況下存在空白。為提高多無人機協(xié)同任務(wù)決策作戰(zhàn)能力,本文提出了將深度強化學(xué)習(xí)中的MADDPG算法引入到多無人機系統(tǒng)中,設(shè)計一種能夠符合多無人機系統(tǒng)特點的任務(wù)決策方法。

    1 無人機任務(wù)決策與數(shù)學(xué)建模

    1.1 任務(wù)決策分類

    在解決多無人機任務(wù)決策問題時,首先要考慮戰(zhàn)場環(huán)境的特殊背景。戰(zhàn)場環(huán)境的多變性在一定程度上決定了任務(wù)決策的方法和難度。根據(jù)對戰(zhàn)場環(huán)境的理解狀況,可以將任務(wù)決策分為以下幾種情況。任務(wù)決策分類如圖1所示。

    圖1 任務(wù)決策分類Fig.1 Task decision classification

    1)在開始任務(wù)之前已經(jīng)掌握所有的戰(zhàn)場環(huán)境。目標位置和戰(zhàn)場中的防空雷達、防空導(dǎo)彈等一系列威脅區(qū)域均已被提前探測到,并且在無人機執(zhí)行任務(wù)過程中不再發(fā)生改變,這一類戰(zhàn)場情況對于無人機任務(wù)決策來說是最簡單的,同時也是目前研究最為成熟的。只需要在任務(wù)開始執(zhí)行之前,運用相關(guān)算法規(guī)劃出最為合理且高效的航路,給無人機分配目標等任務(wù)信息,并加載給無人機,無人機就能夠按照預(yù)定任務(wù)決策方案完成作戰(zhàn)任務(wù)。

    2)在任務(wù)開始前,只知道目標的位置,但是對作戰(zhàn)區(qū)域的具體火力和威脅情況并未全部探測到或者只探測到一部分。這時就需要無人機一邊執(zhí)行任務(wù)一邊進行探測,在執(zhí)行任務(wù)的過程中對航路進行再規(guī)劃,必要時對目標進行重分配。

    3)還有一種情況更為復(fù)雜,目標區(qū)域的情況并未全部探測到,而且目標的位置也不是固定的,會隨著時間移動。這是一種動態(tài)的戰(zhàn)場環(huán)境,這種環(huán)境對無人機的智能化有著極高的挑戰(zhàn),需要無人機在復(fù)雜多變的環(huán)境中協(xié)同作戰(zhàn),動態(tài)實現(xiàn)規(guī)劃航路以及目標任務(wù)分配,這也是最為復(fù)雜且最為困難的情況。

    本文主要針對第二類情況做出任務(wù)決策,即目標和威脅源位置只進行一次初始化且均固定不變,作戰(zhàn)區(qū)域的具體火力和威脅情況并未探測到。

    1.2 無人機模型和威脅模型

    1.2.1無人機建模

    由于多無人機任務(wù)決策問題本身就具有高維度、高復(fù)雜性的特點,所以為簡化研究問題,做出假設(shè):認為多無人機為同構(gòu)機型,具有相同的物理特性,并且在研究過程中不考慮無人機的形狀大小等物理特性,將無人機簡化為質(zhì)心運動。則無人機質(zhì)點在二維空間的簡化運動模型定義為:

    (1)

    無人機在飛行過程中,由于慣性原因無法毫無約束的進行飛行轉(zhuǎn)彎,在進行轉(zhuǎn)彎飛行時會有一個最小轉(zhuǎn)彎半徑Rmin。如果航跡決策中的轉(zhuǎn)彎半徑Ruav小于無人機的最小轉(zhuǎn)彎半徑,則實際環(huán)境中無人機無法完成此動作決策。

    1.2.2威脅建模

    無人機在執(zhí)行任務(wù)時,不但會遭遇來自地形和自然氣候的威脅,而且還會遭遇來自敵方防空雷達、防空導(dǎo)彈等一系列防御措施的威脅,將這一系列對無人機安全能夠造成危險的事物稱為無人機威脅源。一般情況下,將無人機威脅分為自然威脅和軍事威脅。本文在無人機攻擊任務(wù)決策時,將環(huán)境因素理想化,忽略來自環(huán)境對無人機的威脅,主要考慮無人機的軍事威脅,并且軍事威脅以敵方雷達威脅和導(dǎo)彈威脅為主要威脅源。

    雷達威脅主要是指無人機在敵方空域飛行時,能夠探測并且對無人機造成影響的防空雷達。本文假設(shè)敵方防空雷達的探測范圍是360度,在二維空間環(huán)境中等效為以雷達位置為中心,雷達水平方向探測最遠距離Rmax為半徑的圓周,定義為:

    (2)

    因此雷達威脅的數(shù)學(xué)模型為:

    (3)

    式中:UR是無人機當前位置與雷達位置的相對距離。

    導(dǎo)彈威脅主要是指可以影響無人機正常飛行的防空導(dǎo)彈。和雷達威脅相同,導(dǎo)彈威脅在二維空間環(huán)境中也可以等效為圓周。但是不同的是,無人機與導(dǎo)彈的距離越近越容易被擊中,無人機被擊中的概率與無人機和導(dǎo)彈的距離成一定比例,因此導(dǎo)彈威脅數(shù)學(xué)模型如式(4)所示。

    (4)

    其中:UR是無人機當前位置與導(dǎo)彈位置的距離;dMmax為導(dǎo)彈所能攻擊的最遠距離,dMmin為導(dǎo)彈攻擊允許的最近距離,一旦無人機與導(dǎo)彈的距離小于dMmin,則無人機一定會被擊中。

    無人機執(zhí)行任務(wù)過程中,無論是靜態(tài)任務(wù)還是動態(tài)任務(wù)都需要通過機載雷達設(shè)施對任務(wù)區(qū)域進行探測,以確定防空導(dǎo)彈等無人機威脅源的位置信息或者確保能夠及時探測到突發(fā)威脅源的狀況。這種探測行為可以更好的決策飛機的機動動作,規(guī)避危險,提高無人機的存活率。在無人機飛行探測過程中,將以機載雷達最大探測距離作為探測范圍。

    2 基于MADDPG的多無人機任務(wù)決策問題研究

    2.1 DDPG算法

    DDPG算法是Actor-Critic框架和DQN(Deep Q network)算法的結(jié)合體,解決了DQN算法收斂困難的問題。根據(jù)DDPG算法的特點可以將其分為D(Deep)和DPG(Deterministic policy gradient)兩個部分。其中第一部分的D是指DDPG算法具有更深層次的網(wǎng)絡(luò)結(jié)構(gòu),該算法繼承了DQN中經(jīng)驗池和雙層網(wǎng)絡(luò)的結(jié)構(gòu),能夠更有效的提高神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)效率。第二部分的DPG是指DDPG算法采用了確定性策略,Actor不再輸出每個動作的概率,而是一個具體的動作。相比隨機性策略,DPG大大減少了算法的采樣數(shù)據(jù)量,提高了算法的效率,更有助于網(wǎng)絡(luò)在連續(xù)動作空間中的學(xué)習(xí)。

    DDPG算法從網(wǎng)絡(luò)結(jié)構(gòu)上來說應(yīng)用了Actor-Critic的框架形式,所以具有兩個網(wǎng)絡(luò):行動家(Actor)網(wǎng)絡(luò)和評論家(Critic)網(wǎng)絡(luò)。同時,Actor和Critic也都具備雙網(wǎng)絡(luò)結(jié)構(gòu),擁有各自的目標(Target)網(wǎng)絡(luò)和估計(Eval)網(wǎng)絡(luò)。DDPG的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。

    圖2 DDPG的網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Network structure of DDPG

    2.2 MADDPG算法模型

    在多無人機的環(huán)境當中,傳統(tǒng)的強化學(xué)習(xí)算法受到極大的挑戰(zhàn)。在多無人機系統(tǒng)中每一個無人機都是獨立的智能體,都需要不斷的學(xué)習(xí)來達到改進其策略的目的。這樣就導(dǎo)致從每一個無人機的角度來看,環(huán)境從靜態(tài)轉(zhuǎn)變?yōu)閯討B(tài)。這與傳統(tǒng)強化學(xué)習(xí)收斂的條件大不相同,在一定程度上導(dǎo)致無法僅僅通過改變單個智能體自身的策略來適應(yīng)不穩(wěn)定的環(huán)境,并且傳統(tǒng)策略梯度算法中方差大的問題會因為智能體數(shù)量的增多而被放大。而MADDPG算法就是針對這類問題而提出的一種基于多智能體環(huán)境的強化學(xué)習(xí)算法。

    MADDPG算法基于Actor-Critic和DDPG進行了一系列的改進,并且采用集中式學(xué)習(xí)和分布式應(yīng)用的原理,使其能夠適用于傳統(tǒng)強化學(xué)習(xí)算法無法處理的復(fù)雜多智能體環(huán)境。傳統(tǒng)強化學(xué)習(xí)算法在學(xué)習(xí)和應(yīng)用時都必須使用相同的信息數(shù)據(jù),而MADDPG算法允許在學(xué)習(xí)時使用一些額外的信息(即全局信息),但是在應(yīng)用決策的時候只使用局部信息。相對于傳統(tǒng)Actor-Critic算法,MADDPG算法環(huán)境中共有M個智能體,第i個智能體的策略用πi表示,且其策略參數(shù)為θi,則可以得到M個智能體的策略集為π=π1,π2,…,πM,策略參數(shù)集合為θ=θ1,θ2,…,θM。第i個智能體的累計期望收益為:

    (5)

    其中:ri表示第i個智能體的獎勵。

    則針對隨機策略,可以得到策略梯度公式為:

    (6)

    P(s′|s,a1,…,aM,π1,…,πM)=P(s′|s,a1,…,

    aM)=P(s′|s,a1,…,aM,π′1,…,π′M)

    (7)

    同樣可以將AC算法延伸到確定性策略μθi上,其回報期望梯度為:

    (8)

    (9)

    其中,y由式(10)得到:

    (10)

    (11)

    只要最小化上述代價函數(shù),就能得到其他智能體策略的逼近。因此y可變?yōu)椋?/p>

    (12)

    算法整體框架圖如圖3所示,根據(jù)算法整體框架圖可知,針對單個智能體,首先將其狀態(tài)輸入到自身的策略網(wǎng)絡(luò)當中,得到一個動作后輸出并作用于環(huán)境中,此時會得到一個新的狀態(tài)和回報值,最后將狀態(tài)轉(zhuǎn)移數(shù)據(jù)存入到智能體自身的經(jīng)驗池當中。所有智能體都會和環(huán)境進行不斷的交互,不斷的產(chǎn)生數(shù)據(jù)并存儲到各自的經(jīng)驗池當中。

    圖3 MADDPG算法框架Fig.3 Algorithm framework of MADDPG

    在更新網(wǎng)絡(luò)的過程中,隨機從每個智能體的經(jīng)驗池中取出同樣時刻的一批數(shù)據(jù),并將其拼接得到新的經(jīng)驗。其中S和S′是相同時刻所有智能體的狀態(tài)組合,A是所有智能體在相同時刻做出的動作集合,R選用第i個智能體的回報值。最后將S′輸入到第i個智能體的目標策略網(wǎng)絡(luò)中得到動作A′,隨后將A′和S′一起輸入到第i個智能體的目標評價網(wǎng)絡(luò)中,得到對下一時刻估計的目標Q值,根據(jù)公式計算當前時刻目標Q值。

    yi=ri+γQ′(si+1,μ′(si+1|Qμ′)|θQ′)

    (13)

    實際的Q值通過使用評價網(wǎng)絡(luò)得到,再利用TD偏差[24]來更新評價網(wǎng)絡(luò),用Q值的策略梯度來更新策略網(wǎng)絡(luò)。所有智能體依照相同的方法來更新自身的網(wǎng)絡(luò),只是每一個智能體的輸入有所差別,而在其它方面的更新流程相同。策略網(wǎng)絡(luò)與價值網(wǎng)絡(luò)的具體結(jié)構(gòu)如圖4所示。

    圖4 網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Network structure

    2.3 多無人機任務(wù)決策算法模型設(shè)計

    本文主要基于二維平面環(huán)境開展研究,共有k架無人機分別為: UAV1,UAV2,…,UAVk。其中每一架無人機自身狀態(tài)Suavi包含當前時刻的速度矢量(vuavi,x,vuavi,y)和在環(huán)境中的坐標位置(puavi,x,puavi,y)。環(huán)境狀態(tài)Senv包含了環(huán)境中N個威脅區(qū)的坐標位置、威脅半徑和M個目標的坐標位置。其中第i個威脅區(qū)的坐標位置和威脅半徑分別表示為(Wi,x,Wi,y)和i,y,第i個目標在環(huán)境中的坐標位置可以表示為(Mi,x,Mi,y)。

    在MADDPG算法中,每一架無人機的狀態(tài)包括了自身的狀態(tài)、其它無人機的狀態(tài)和環(huán)境狀態(tài)。針對無人機UAV1在t時刻的狀態(tài)定義為:

    St,uav1=(Suav1,Suav2,…,Suavk,Senv)

    (14)

    最終每架飛機在t時刻的狀態(tài)定義為:

    St,uavi=(vuav1,x,vuav1,y,puav1,x,puav1,y,…,

    vuavk,x,vuavk,y,puavk,x,puavk,y,

    Wi,x,Wi,y,i,y,Mi,x,Mi,y)

    (15)

    (16)

    并且,無人機的動作輸出,受到最小轉(zhuǎn)彎半徑的約束,如果不符合約束條件,則被視為不合理動作輸出,需要進行重新選擇。

    本文主要從以下三個方面來設(shè)計獎勵函數(shù)。

    1)針對躲避威脅區(qū)設(shè)定一個威脅獎勵,當無人機進入威脅區(qū)后,會被給予一個負獎勵。即Rf=-1,(DW

    2)在無人機的飛行過程中,每一架無人機都應(yīng)和其它無人機保持安全距離,一旦無人機的位置過近,就會互相產(chǎn)生飛行威脅甚至發(fā)生碰撞,所以為了避免無人機發(fā)生碰撞,應(yīng)當設(shè)定一個碰撞獎勵Rp,當無人機間的距離小于安全距離時,就會給予其負獎勵。即Rp=-1,(Ddij

    3)為了在開始訓(xùn)練時,能夠準確的引導(dǎo)無人機的動作選擇,并且讓無人機每一步都擁有一個密集獎勵,在這里設(shè)計了一個距離獎勵Rr,計算每一時刻,無人機與目標的最近距離,以距離的負值作為獎勵值,距離越近,獎勵值越大。即Rr=-dmin,其中dmin是各個目標和各架無人機之間最小距離的和。

    最終無人機的獎勵函數(shù)設(shè)計為:

    Ri=Rf+Rp+Rr

    (17)

    3 實驗及分析

    3.1 參數(shù)設(shè)計

    本文設(shè)計了MADDPG算法模型,采用了確定性動作策略,即a=πθ(s)。網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計為:策略網(wǎng)絡(luò)結(jié)構(gòu)為[39;56;56;2]的全連接神經(jīng)網(wǎng)絡(luò);價值網(wǎng)絡(luò)的結(jié)構(gòu)是[123;118;78;36;1]的全連接神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)隱藏層都采用RELU函數(shù)作為激活函數(shù),網(wǎng)絡(luò)結(jié)構(gòu)表示輸入層、隱藏層和輸出層對應(yīng)的節(jié)點數(shù)。在訓(xùn)練時的mini-batch大小為1024,最大回合數(shù)(max episode)為30000,輔助網(wǎng)絡(luò)的更新率0.01,價值網(wǎng)絡(luò)的學(xué)習(xí)率為0.01,策略網(wǎng)絡(luò)的學(xué)習(xí)率為0.001,兩個網(wǎng)絡(luò)都采用了Adam Optimizer優(yōu)化器進行學(xué)習(xí),經(jīng)驗池的大小為1×106,一旦經(jīng)驗池的數(shù)據(jù)超過最大數(shù)值,將會丟掉原始的經(jīng)驗數(shù)據(jù)。

    表1 MADDPG網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)Table 1 Network structure parameters of MADDPG

    3.2 結(jié)果分析

    初始化仿真環(huán)境包含三架無人機的初始位置、三個目標的位置和7個威脅區(qū)的分布情況。具體初始環(huán)境如圖5所示。

    圖5 初始環(huán)境Fig.5 Initial environment

    通過建立DDPG和MADDPG兩種模型結(jié)構(gòu)進行訓(xùn)練。最終得到獎勵函數(shù)如圖6所示。

    圖6為訓(xùn)練過程中,三架無人機在每一回合(episode)訓(xùn)練時的獎勵變化圖。橫坐標表示訓(xùn)練的回合數(shù)(episodes),縱坐標表示每一回合訓(xùn)練時三架無人機的累計獎勵??梢钥闯鲭S著訓(xùn)練次數(shù)的增多,獎勵的絕對值減小,但是獎勵逐漸增大,由于訓(xùn)練過程中存在隨機噪聲,所以訓(xùn)練時無論是哪個時刻都存在振蕩現(xiàn)象,但從圖6中依然可以看出,在訓(xùn)練回合數(shù)達到10000回合后,兩種算法的獎勵曲線趨于平緩,總體呈收斂趨勢。

    圖6 訓(xùn)練獎勵收斂曲線Fig.6 Reward convergence curve of single step training

    圖7是三架無人機網(wǎng)絡(luò)參數(shù)變化曲線圖,表示每架無人機網(wǎng)絡(luò)結(jié)構(gòu)中Actor網(wǎng)絡(luò)和Critic網(wǎng)絡(luò)的Q值(狀態(tài)動作值)和損失值(Q估計值和Q實際值之間差距的平方)的變化規(guī)律。圖7(a)是DDPG算法模型三架無人機網(wǎng)絡(luò)參數(shù)的變化曲線圖,圖7(b)是MADDPG算法模型三架無人機網(wǎng)絡(luò)參數(shù)的變化曲線圖??梢钥闯觯瑑煞N算法隨著訓(xùn)練次數(shù)的增加,Actor網(wǎng)絡(luò)的Q值逐漸增大,直到收斂。Critic網(wǎng)絡(luò)中損失值隨著訓(xùn)練的次數(shù)增加而逐漸減少,直到收斂。對比DDPG和MADDPG兩種算法中每架無人機網(wǎng)絡(luò)Q值和損失值的變化曲線,可以發(fā)現(xiàn)DDPG算法在訓(xùn)練過程中,每架無人機網(wǎng)絡(luò)的Q值在訓(xùn)練到5000回合之后有明顯的下降趨勢,而MADDPG算法整體呈上升收斂趨勢,沒有明顯的波動變化趨勢。且MADDPG算法中每架無人機網(wǎng)絡(luò)的初始損失值明顯小于DDPG算法中的初始損失值,而且在兩種算法收斂后,MADDPG算法中的損失值要明顯小于DDPG算法中的損失值。說明了MADDPG比DDPG算法具有更強的穩(wěn)定性和更快的收斂性。最終兩種算法模型的軌跡圖如圖8所示。

    圖7 不同算法無人機網(wǎng)絡(luò)參數(shù)變化Fig.7 Changes of UAV network parameters based on different algorithms

    圖8(a)為DDPG算法模型經(jīng)過訓(xùn)練后得到的無人機軌跡圖。圖8(b)為MADDPG算法模型訓(xùn)練后得到的無人機軌跡圖。對比兩種算法模型的無人機飛行軌跡可以看出,DDPG算法最終的飛行軌跡

    圖8 不同算流下的無人機軌跡Fig.8 Flight path of UAV based on different algorithms

    并沒有完全進入目標區(qū)域,相對目標有一定的距離,而且第二架無人機的軌跡還進入了威脅區(qū)內(nèi)。而MADDPG算法模型的飛行軌跡全都進入了目標區(qū)域,而且躲避了所有的威脅區(qū)。綜合分析兩種算法的獎勵曲線變化圖和飛行軌跡圖,可以得出結(jié)論:在該環(huán)境下,MADDPG算法優(yōu)于DDPG算法。

    4 結(jié)束語

    針對現(xiàn)有多無人機任務(wù)決策研究中的缺點,進行了基于MADDPG算法的多無人機任務(wù)決策問題的研究,詳細闡述了MADDPG算法的原理和特點,并且基于多無人機任務(wù)背景,分別從網(wǎng)絡(luò)結(jié)構(gòu)、狀態(tài)空間、動作空間和獎勵函數(shù)設(shè)計了MADDPG算法的模型結(jié)構(gòu),將MADDPG算法和多無人機任務(wù)決策問題相結(jié)合,實驗證明MADDPG算法不僅可以解決多無人機任務(wù)決策問題,并且相對DDPG算法,針對傳統(tǒng)算法學(xué)習(xí)效率并不高的缺陷,本文提出的方法具有更快的收斂速度和學(xué)習(xí)效率。

    猜你喜歡
    網(wǎng)絡(luò)結(jié)構(gòu)威脅決策
    為可持續(xù)決策提供依據(jù)
    人類的威脅
    決策為什么失誤了
    受到威脅的生命
    面對孩子的“威脅”,我們要會說“不”
    家教世界(2017年11期)2018-01-03 01:28:49
    基于互信息的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
    知識網(wǎng)絡(luò)結(jié)構(gòu)維對于創(chuàng)新績效的作用機制——遠程創(chuàng)新搜尋的中介作用
    滬港通下A+ H股票網(wǎng)絡(luò)結(jié)構(gòu)演化的實證分析
    Why Does Sleeping in Just Make Us More Tired?
    復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)比對算法研究進展
    夜夜爽天天搞| 亚洲一区二区三区不卡视频| 我的老师免费观看完整版| 国产真人三级小视频在线观看| av有码第一页| 99久久国产精品久久久| 看黄色毛片网站| 一级黄色大片毛片| 一a级毛片在线观看| 亚洲无线在线观看| 很黄的视频免费| 成人一区二区视频在线观看| 免费在线观看视频国产中文字幕亚洲| 免费看日本二区| 国产高清有码在线观看视频 | 精品国产乱码久久久久久男人| 美女黄网站色视频| 99久久精品热视频| 亚洲精品一区av在线观看| 日本黄色视频三级网站网址| 国语自产精品视频在线第100页| 黄色毛片三级朝国网站| 最新美女视频免费是黄的| 国产成人欧美在线观看| 中文字幕精品亚洲无线码一区| 国产亚洲欧美98| 午夜免费激情av| 啪啪无遮挡十八禁网站| 亚洲欧美日韩高清专用| 可以在线观看的亚洲视频| 国产麻豆成人av免费视频| 精品久久久久久久末码| 日本 欧美在线| 在线观看午夜福利视频| 一边摸一边抽搐一进一小说| 两性夫妻黄色片| 国产成人aa在线观看| 久久久久性生活片| 精品日产1卡2卡| 美女 人体艺术 gogo| 国产成年人精品一区二区| 亚洲国产欧美人成| 精品免费久久久久久久清纯| cao死你这个sao货| 高清毛片免费观看视频网站| 国产真实乱freesex| 精品免费久久久久久久清纯| 性色av乱码一区二区三区2| 久久久久久久久久黄片| av在线天堂中文字幕| 色播亚洲综合网| 国模一区二区三区四区视频 | 两个人视频免费观看高清| 一个人观看的视频www高清免费观看 | 日韩精品中文字幕看吧| 婷婷精品国产亚洲av| 久久婷婷成人综合色麻豆| 久久欧美精品欧美久久欧美| 在线观看一区二区三区| 国产真人三级小视频在线观看| 国产成年人精品一区二区| 国产伦人伦偷精品视频| 男人的好看免费观看在线视频 | 国产精品久久久av美女十八| 精品国产美女av久久久久小说| 国产精品 国内视频| 狂野欧美激情性xxxx| 日本熟妇午夜| 久久天堂一区二区三区四区| av福利片在线| 免费一级毛片在线播放高清视频| 在线视频色国产色| 久久精品影院6| 丝袜人妻中文字幕| 真人一进一出gif抽搐免费| 久久久久久大精品| 成年人黄色毛片网站| 精品久久蜜臀av无| 亚洲在线自拍视频| 一本大道久久a久久精品| 国产爱豆传媒在线观看 | 欧美黑人巨大hd| 桃色一区二区三区在线观看| 国产久久久一区二区三区| 美女扒开内裤让男人捅视频| 男男h啪啪无遮挡| 又黄又粗又硬又大视频| 熟女电影av网| 91字幕亚洲| 麻豆国产97在线/欧美 | 91九色精品人成在线观看| 又粗又爽又猛毛片免费看| 九色成人免费人妻av| 久久午夜亚洲精品久久| 50天的宝宝边吃奶边哭怎么回事| av福利片在线观看| 久久99热这里只有精品18| 精品久久久久久久末码| 黄色丝袜av网址大全| 变态另类成人亚洲欧美熟女| 婷婷六月久久综合丁香| 欧美成人性av电影在线观看| 久久久久久亚洲精品国产蜜桃av| 中文资源天堂在线| 欧美日本亚洲视频在线播放| 丝袜美腿诱惑在线| 桃色一区二区三区在线观看| 国产亚洲精品一区二区www| 欧美又色又爽又黄视频| 国产精品免费一区二区三区在线| 在线观看美女被高潮喷水网站 | cao死你这个sao货| www.www免费av| 成熟少妇高潮喷水视频| 波多野结衣巨乳人妻| 亚洲电影在线观看av| 亚洲自拍偷在线| 女生性感内裤真人,穿戴方法视频| 亚洲精品中文字幕一二三四区| 黄色片一级片一级黄色片| 黄色丝袜av网址大全| 一本大道久久a久久精品| 日韩欧美国产一区二区入口| 老汉色av国产亚洲站长工具| 免费搜索国产男女视频| 好男人在线观看高清免费视频| 久久草成人影院| 精品国产乱子伦一区二区三区| 好看av亚洲va欧美ⅴa在| 一区二区三区激情视频| 国产真人三级小视频在线观看| 亚洲国产欧美人成| 日韩高清综合在线| 精品午夜福利视频在线观看一区| 男女那种视频在线观看| 欧美激情久久久久久爽电影| 身体一侧抽搐| 国产精品香港三级国产av潘金莲| 国产午夜精品久久久久久| 两个人视频免费观看高清| 97超级碰碰碰精品色视频在线观看| 男女那种视频在线观看| 欧美 亚洲 国产 日韩一| 亚洲中文字幕一区二区三区有码在线看 | 成人欧美大片| 国产精品亚洲一级av第二区| 国产成人系列免费观看| 亚洲精品美女久久久久99蜜臀| 亚洲黑人精品在线| 亚洲成a人片在线一区二区| 欧美一级a爱片免费观看看 | aaaaa片日本免费| 欧美日本视频| 人人妻人人澡欧美一区二区| 久久久精品欧美日韩精品| 久久精品91无色码中文字幕| 欧美日韩乱码在线| 国产亚洲欧美98| 午夜日韩欧美国产| 国产午夜福利久久久久久| 国产私拍福利视频在线观看| 日韩av在线大香蕉| 久99久视频精品免费| 成人18禁在线播放| 国产精品国产高清国产av| 91九色精品人成在线观看| 国产午夜福利久久久久久| 国产精品久久久人人做人人爽| 免费看美女性在线毛片视频| 毛片女人毛片| 国产av一区在线观看免费| 欧美不卡视频在线免费观看 | 日韩有码中文字幕| 天堂影院成人在线观看| 手机成人av网站| 国产野战对白在线观看| 亚洲熟妇中文字幕五十中出| 亚洲aⅴ乱码一区二区在线播放 | 成人三级黄色视频| 久久香蕉国产精品| 好男人在线观看高清免费视频| 国产精品电影一区二区三区| 两个人的视频大全免费| 欧美日韩乱码在线| 窝窝影院91人妻| 一级a爱片免费观看的视频| 精品久久久久久久末码| 成人永久免费在线观看视频| 日韩三级视频一区二区三区| 精品久久久久久久久久久久久| 999久久久国产精品视频| 51午夜福利影视在线观看| 欧美大码av| 日韩欧美国产一区二区入口| 两性夫妻黄色片| 波多野结衣巨乳人妻| 一区福利在线观看| av片东京热男人的天堂| 免费在线观看影片大全网站| 亚洲精华国产精华精| 麻豆一二三区av精品| 久久亚洲精品不卡| e午夜精品久久久久久久| 国产99久久九九免费精品| 三级国产精品欧美在线观看 | 久久精品成人免费网站| 欧美一级a爱片免费观看看 | 日日爽夜夜爽网站| 1024香蕉在线观看| 亚洲一区高清亚洲精品| 国内少妇人妻偷人精品xxx网站 | 一本精品99久久精品77| 巨乳人妻的诱惑在线观看| 精品欧美国产一区二区三| 国产成+人综合+亚洲专区| 美女黄网站色视频| 国产激情久久老熟女| 日本免费一区二区三区高清不卡| 丝袜人妻中文字幕| 欧美日韩瑟瑟在线播放| 嫩草影院精品99| 亚洲天堂国产精品一区在线| 一a级毛片在线观看| 日本一区二区免费在线视频| 国产午夜福利久久久久久| 男女之事视频高清在线观看| 精品久久久久久久人妻蜜臀av| 久久亚洲精品不卡| 欧美色欧美亚洲另类二区| 国产视频一区二区在线看| 舔av片在线| 观看免费一级毛片| 亚洲精品久久成人aⅴ小说| 三级毛片av免费| 在线观看免费视频日本深夜| cao死你这个sao货| 欧美乱色亚洲激情| 久久久水蜜桃国产精品网| 欧美成人免费av一区二区三区| 动漫黄色视频在线观看| 国产黄色小视频在线观看| 怎么达到女性高潮| 欧美午夜高清在线| 美女扒开内裤让男人捅视频| 欧美av亚洲av综合av国产av| 最近在线观看免费完整版| 老熟妇乱子伦视频在线观看| 免费看美女性在线毛片视频| 男男h啪啪无遮挡| 免费电影在线观看免费观看| 99久久综合精品五月天人人| 18禁观看日本| 在线观看免费日韩欧美大片| av福利片在线观看| 欧美在线一区亚洲| 欧美 亚洲 国产 日韩一| 国产午夜精品久久久久久| 成人18禁在线播放| 国产精品香港三级国产av潘金莲| 国产单亲对白刺激| 男女午夜视频在线观看| 久久久精品国产亚洲av高清涩受| 日本黄色视频三级网站网址| 一边摸一边抽搐一进一小说| 国语自产精品视频在线第100页| 成在线人永久免费视频| 人妻丰满熟妇av一区二区三区| 色噜噜av男人的天堂激情| 中文字幕精品亚洲无线码一区| 亚洲中文字幕日韩| 18美女黄网站色大片免费观看| 成人18禁高潮啪啪吃奶动态图| 女同久久另类99精品国产91| 一个人观看的视频www高清免费观看 | 99在线视频只有这里精品首页| 国产精品1区2区在线观看.| 99国产综合亚洲精品| 欧美一级a爱片免费观看看 | 一级毛片高清免费大全| 19禁男女啪啪无遮挡网站| 天堂影院成人在线观看| 国产蜜桃级精品一区二区三区| 欧美黄色淫秽网站| 伊人久久大香线蕉亚洲五| 亚洲五月天丁香| 特级一级黄色大片| 日韩欧美免费精品| 91在线观看av| 黄色视频不卡| 啦啦啦观看免费观看视频高清| 国产主播在线观看一区二区| 国产亚洲欧美98| 精品电影一区二区在线| 俺也久久电影网| 曰老女人黄片| 99国产精品一区二区蜜桃av| 国产精品乱码一区二三区的特点| 制服丝袜大香蕉在线| 一级毛片高清免费大全| 久久久久久久午夜电影| 国产99久久九九免费精品| 亚洲激情在线av| 国产精品av久久久久免费| 欧美国产日韩亚洲一区| 日韩精品免费视频一区二区三区| 午夜福利成人在线免费观看| 国产三级在线视频| 最新在线观看一区二区三区| 亚洲精品一区av在线观看| 欧美日韩一级在线毛片| 老司机靠b影院| a在线观看视频网站| 亚洲一区中文字幕在线| 免费人成视频x8x8入口观看| 在线十欧美十亚洲十日本专区| 淫秽高清视频在线观看| 亚洲欧美日韩高清在线视频| 国产高清视频在线观看网站| 午夜精品一区二区三区免费看| 日韩欧美一区二区三区在线观看| 99热这里只有精品一区 | av在线播放免费不卡| 少妇的丰满在线观看| 日本五十路高清| 黄色片一级片一级黄色片| 麻豆久久精品国产亚洲av| 又大又爽又粗| 黑人巨大精品欧美一区二区mp4| 免费人成视频x8x8入口观看| 免费无遮挡裸体视频| 国产亚洲精品久久久久5区| 国产1区2区3区精品| 日韩欧美三级三区| 国产成人av激情在线播放| 亚洲美女视频黄频| 成人18禁在线播放| 久久精品国产清高在天天线| 久久热在线av| 亚洲18禁久久av| 欧美久久黑人一区二区| 99热只有精品国产| 夜夜躁狠狠躁天天躁| 久久中文看片网| 成人18禁在线播放| 国产私拍福利视频在线观看| 男女那种视频在线观看| 亚洲熟妇中文字幕五十中出| 成人一区二区视频在线观看| 久久久久久久午夜电影| 久久精品国产综合久久久| 欧美日韩中文字幕国产精品一区二区三区| 看黄色毛片网站| 欧美一区二区国产精品久久精品 | 国产精品一及| 日本在线视频免费播放| 国产私拍福利视频在线观看| 最新美女视频免费是黄的| 国产一区二区在线观看日韩 | 男女视频在线观看网站免费 | 成人av在线播放网站| 999久久久精品免费观看国产| 黄片大片在线免费观看| 老汉色∧v一级毛片| 国产亚洲av嫩草精品影院| 亚洲专区国产一区二区| a在线观看视频网站| 熟女电影av网| 国产欧美日韩一区二区精品| 午夜福利高清视频| 美女 人体艺术 gogo| 国产三级中文精品| x7x7x7水蜜桃| 亚洲国产精品sss在线观看| 女人被狂操c到高潮| 亚洲成人精品中文字幕电影| 成人亚洲精品av一区二区| 一a级毛片在线观看| 国产激情久久老熟女| 久久精品aⅴ一区二区三区四区| 亚洲男人的天堂狠狠| 在线观看一区二区三区| 亚洲欧洲精品一区二区精品久久久| 国产免费av片在线观看野外av| 日韩欧美在线二视频| 久久亚洲精品不卡| 91大片在线观看| 深夜精品福利| 国产av麻豆久久久久久久| 色综合站精品国产| 精品久久久久久久人妻蜜臀av| 久久久久久大精品| 熟妇人妻久久中文字幕3abv| 国产成人精品无人区| 午夜激情av网站| 久久天躁狠狠躁夜夜2o2o| 777久久人妻少妇嫩草av网站| 中亚洲国语对白在线视频| 在线观看66精品国产| 十八禁人妻一区二区| 精品国产亚洲在线| 一进一出抽搐动态| 欧美日本亚洲视频在线播放| 亚洲av电影不卡..在线观看| 国产精品久久久久久精品电影| 国产av一区在线观看免费| 18禁国产床啪视频网站| 国产探花在线观看一区二区| 中文字幕熟女人妻在线| 亚洲最大成人中文| 日本 欧美在线| 日本成人三级电影网站| 91国产中文字幕| 老司机靠b影院| 国产成人aa在线观看| 99国产极品粉嫩在线观看| 国产69精品久久久久777片 | 久久久久国内视频| 亚洲成人久久性| 三级毛片av免费| 亚洲美女黄片视频| 成人三级做爰电影| 一a级毛片在线观看| 国产av一区在线观看免费| 欧美黄色片欧美黄色片| 99国产精品99久久久久| 搡老妇女老女人老熟妇| 国产精品98久久久久久宅男小说| 香蕉国产在线看| 日韩免费av在线播放| 一区二区三区高清视频在线| 亚洲av熟女| 亚洲专区国产一区二区| 麻豆成人午夜福利视频| 免费看a级黄色片| 特大巨黑吊av在线直播| 国产成人系列免费观看| 欧美日韩亚洲国产一区二区在线观看| 日韩成人在线观看一区二区三区| 三级毛片av免费| 神马国产精品三级电影在线观看 | 久久婷婷人人爽人人干人人爱| 久久人妻av系列| 午夜免费观看网址| 午夜成年电影在线免费观看| 国产真人三级小视频在线观看| 国产精品永久免费网站| 国产蜜桃级精品一区二区三区| 精品久久蜜臀av无| 男人舔女人下体高潮全视频| 久久人妻av系列| 亚洲国产欧美人成| 欧美性长视频在线观看| 99riav亚洲国产免费| 老汉色∧v一级毛片| x7x7x7水蜜桃| 99re在线观看精品视频| 中文在线观看免费www的网站 | 少妇熟女aⅴ在线视频| 男女视频在线观看网站免费 | 国产亚洲欧美98| 男女下面进入的视频免费午夜| 最近最新中文字幕大全电影3| 亚洲国产欧洲综合997久久,| 人人妻人人看人人澡| 性色av乱码一区二区三区2| 国产黄片美女视频| 午夜精品久久久久久毛片777| 午夜福利在线在线| 欧美中文综合在线视频| 亚洲男人天堂网一区| 精品高清国产在线一区| 叶爱在线成人免费视频播放| 婷婷精品国产亚洲av| 亚洲欧美日韩高清专用| 精品久久久久久,| 丰满人妻熟妇乱又伦精品不卡| 长腿黑丝高跟| 老司机深夜福利视频在线观看| 1024视频免费在线观看| 日本免费一区二区三区高清不卡| 国产精品亚洲av一区麻豆| www.www免费av| 午夜福利高清视频| 精品日产1卡2卡| 久久天堂一区二区三区四区| 日日摸夜夜添夜夜添小说| 国产伦人伦偷精品视频| 日本黄色视频三级网站网址| 久久这里只有精品19| 美女免费视频网站| 亚洲av成人精品一区久久| 国产精品自产拍在线观看55亚洲| 欧美绝顶高潮抽搐喷水| 这个男人来自地球电影免费观看| 999久久久国产精品视频| 精品欧美一区二区三区在线| 国产精品免费一区二区三区在线| 日韩欧美在线乱码| 色精品久久人妻99蜜桃| 日韩欧美 国产精品| 可以免费在线观看a视频的电影网站| 久久天堂一区二区三区四区| 精品高清国产在线一区| 欧美黑人巨大hd| 成人av一区二区三区在线看| 久久精品国产99精品国产亚洲性色| 午夜免费观看网址| 亚洲成av人片在线播放无| 一级片免费观看大全| 亚洲精品中文字幕在线视频| 成人国语在线视频| 宅男免费午夜| 国产熟女xx| 欧美成人一区二区免费高清观看 | 视频区欧美日本亚洲| 婷婷亚洲欧美| 日韩有码中文字幕| 久久亚洲精品不卡| 麻豆一二三区av精品| 色播亚洲综合网| 身体一侧抽搐| 亚洲欧美激情综合另类| 一进一出好大好爽视频| 91在线观看av| 免费人成视频x8x8入口观看| 一进一出抽搐gif免费好疼| 99久久国产精品久久久| 两个人免费观看高清视频| 啦啦啦韩国在线观看视频| 亚洲欧美一区二区三区黑人| 精品一区二区三区视频在线观看免费| 首页视频小说图片口味搜索| 国产91精品成人一区二区三区| 人人妻人人看人人澡| 午夜福利在线观看吧| 日本免费一区二区三区高清不卡| 亚洲精品国产一区二区精华液| 床上黄色一级片| 曰老女人黄片| 国产麻豆成人av免费视频| 国产主播在线观看一区二区| 一级毛片高清免费大全| 午夜福利在线观看吧| 亚洲精品在线观看二区| 正在播放国产对白刺激| 最近视频中文字幕2019在线8| 在线观看免费视频日本深夜| 亚洲成a人片在线一区二区| 亚洲成人国产一区在线观看| 国产伦在线观看视频一区| 国产精华一区二区三区| 国产在线观看jvid| 啦啦啦观看免费观看视频高清| 狠狠狠狠99中文字幕| 成人av一区二区三区在线看| 欧美中文综合在线视频| 露出奶头的视频| 日本成人三级电影网站| 欧美丝袜亚洲另类 | 黄片大片在线免费观看| 日韩欧美精品v在线| 国内精品久久久久精免费| 亚洲一码二码三码区别大吗| 亚洲全国av大片| 日本三级黄在线观看| 嫩草影院精品99| 日本黄色视频三级网站网址| 久久久久国产一级毛片高清牌| 床上黄色一级片| 亚洲精品一卡2卡三卡4卡5卡| aaaaa片日本免费| 99热只有精品国产| 欧美精品啪啪一区二区三区| 国产成人aa在线观看| 国产欧美日韩一区二区三| 国产成+人综合+亚洲专区| 国产欧美日韩一区二区精品| 久久亚洲精品不卡| 91在线观看av| 久久午夜亚洲精品久久| avwww免费| 色综合婷婷激情| 俺也久久电影网| 国产精品久久久av美女十八| 日日摸夜夜添夜夜添小说| 午夜福利在线观看吧| 午夜福利18| 久久久精品大字幕| 国产精品久久久久久人妻精品电影| 波多野结衣高清无吗| 观看免费一级毛片| 最近最新中文字幕大全免费视频| 大型黄色视频在线免费观看| 日韩欧美国产在线观看| 在线观看美女被高潮喷水网站 | 欧美在线一区亚洲| 午夜福利在线在线| 久久热在线av| 亚洲狠狠婷婷综合久久图片| 天天一区二区日本电影三级| 麻豆av在线久日| 精品少妇一区二区三区视频日本电影| 中亚洲国语对白在线视频| 老汉色∧v一级毛片| 夜夜夜夜夜久久久久| 国产精品av视频在线免费观看| 久久国产精品人妻蜜桃| 国产亚洲欧美在线一区二区| 欧美日韩瑟瑟在线播放| 一级片免费观看大全| 国产午夜福利久久久久久| 18禁黄网站禁片午夜丰满| 伊人久久大香线蕉亚洲五| 欧美黄色淫秽网站| 国产高清激情床上av|