• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    多要素多目標(biāo)武器裝備協(xié)同規(guī)劃系統(tǒng)?

    2024-04-17 07:28:06史繼筠連賀揚(yáng)陳杰浩張美慧
    關(guān)鍵詞:全局調(diào)度規(guī)劃

    史繼筠 張 馳 連賀揚(yáng) 陳杰浩 張美慧

    (1.北京理工大學(xué)計(jì)算機(jī)學(xué)院 北京 100081)(2.中國工業(yè)互聯(lián)網(wǎng)研究院 北京 100016)

    1 引言

    隨著信息化技術(shù)的快速發(fā)展,未來戰(zhàn)爭的作戰(zhàn)形式將會(huì)發(fā)生巨大變革。單一作戰(zhàn)已經(jīng)無法適用復(fù)雜多變戰(zhàn)場態(tài)勢,多軍兵種聯(lián)合作戰(zhàn)將成為未來戰(zhàn)場的主要作戰(zhàn)形式[1]。為了達(dá)成聯(lián)合作戰(zhàn)目標(biāo),需要根據(jù)戰(zhàn)場態(tài)勢對武器裝備進(jìn)行實(shí)時(shí)協(xié)同規(guī)劃。武器裝備協(xié)同規(guī)劃是指根據(jù)戰(zhàn)場環(huán)境、武器及作戰(zhàn)平臺(tái)狀態(tài)等多種限制元素,將指揮系統(tǒng)下達(dá)的作戰(zhàn)任務(wù)通過智能決策分解至各個(gè)可調(diào)配的任務(wù)執(zhí)行單元,依據(jù)火力卡片為各發(fā)射平臺(tái)及保障資源制定任務(wù)準(zhǔn)備-機(jī)動(dòng)-待機(jī)隱蔽-發(fā)射-波次轉(zhuǎn)換等全流程的行動(dòng)規(guī)劃,縮短作戰(zhàn)單元暴露時(shí)間,降低敵方探測和打擊風(fēng)險(xiǎn)。當(dāng)前如遺傳算法[2]、蟻群算法[3]、整數(shù)規(guī)劃[4]等傳統(tǒng)算法已經(jīng)廣泛應(yīng)用于武器裝備協(xié)同規(guī)劃任務(wù)中,但是存在一定缺陷和不足。例如,遺傳算法運(yùn)行時(shí)間過長、容易陷入局部最優(yōu)解;整數(shù)規(guī)劃只能處理小規(guī)模問題;傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法依賴于訓(xùn)練數(shù)據(jù),容易受到噪聲和干擾的影響,導(dǎo)致預(yù)測結(jié)果不準(zhǔn)確。

    隨著強(qiáng)化學(xué)習(xí)[5]的飛速發(fā)展與應(yīng)用,為武器裝備的協(xié)同規(guī)劃問題提出了新的解決方案。強(qiáng)化學(xué)習(xí)相比于傳統(tǒng)算法更具有自主學(xué)習(xí)能力和適應(yīng)性,通過選擇動(dòng)作與環(huán)境進(jìn)行交互獲得反饋,以最小化誤差和代價(jià)函數(shù)為目標(biāo)從而實(shí)現(xiàn)更加高效的決策制定。綜上所述,針對當(dāng)前武器裝備領(lǐng)域協(xié)同規(guī)劃問題現(xiàn)存缺陷,提出了一套基于強(qiáng)化學(xué)習(xí)的多要素多目標(biāo)武器裝備協(xié)同規(guī)劃方案,通過基于深度強(qiáng)化學(xué)習(xí)的武器裝備調(diào)度算法和基于注意力機(jī)制的多車輛全局路徑規(guī)劃算法,實(shí)現(xiàn)導(dǎo)彈發(fā)射場景下的武器裝備協(xié)同控制。

    2 問題描述

    以導(dǎo)彈裝備的部署發(fā)射作為主要的實(shí)驗(yàn)場景,導(dǎo)彈裝備在進(jìn)行發(fā)射任務(wù)之前,都會(huì)在各自的戰(zhàn)略隱蔽點(diǎn)進(jìn)行待命準(zhǔn)備,當(dāng)指揮系統(tǒng)收到導(dǎo)彈發(fā)射的任務(wù)和指令之后,指揮系統(tǒng)會(huì)根據(jù)任務(wù)需要的導(dǎo)彈種類、導(dǎo)彈數(shù)量、任務(wù)優(yōu)先級(jí)等要素信息,對整個(gè)戰(zhàn)區(qū)的戰(zhàn)備導(dǎo)彈進(jìn)行全局調(diào)度,趕往任務(wù)地點(diǎn)進(jìn)行導(dǎo)彈發(fā)射。在這個(gè)過程中我們需要盡可能地縮短暴露時(shí)間,減少路徑?jīng)_突,因此要對作戰(zhàn)單元進(jìn)行全方位的協(xié)同規(guī)劃。因?yàn)檎麄€(gè)作戰(zhàn)場景過于復(fù)雜,優(yōu)化目標(biāo)多樣,直接對整個(gè)問題進(jìn)行建模和最優(yōu)方案求解,往往使得算法無法很好收斂。因此我們對整個(gè)場景進(jìn)行兩階段求解,先根據(jù)預(yù)儲(chǔ)的導(dǎo)彈資源,戰(zhàn)備位置,任務(wù)需求等要素,對戰(zhàn)備導(dǎo)彈資源和導(dǎo)彈發(fā)射任務(wù)進(jìn)行全局分配調(diào)度,再根據(jù)整體的分配情況,對所有車輛進(jìn)行一個(gè)全局路徑規(guī)劃減少路徑?jīng)_突,進(jìn)而形成一整套的協(xié)同規(guī)劃方案。

    3 基于SAC的武器裝備調(diào)度算法

    本章將重點(diǎn)介紹武器裝備調(diào)度分配階段的算法內(nèi)容。詳細(xì)介紹了強(qiáng)化學(xué)習(xí)中狀態(tài)空間、動(dòng)作空間、獎(jiǎng)勵(lì)函數(shù)、決策網(wǎng)絡(luò)模型以及算法訓(xùn)練過程等重要內(nèi)容。

    3.1 馬爾可夫決策建模

    3.1.1 狀態(tài)空間

    在基于SAC(Soft Actor Critic)[9]的集中式武器裝備調(diào)度算法中,由于將整個(gè)中央決策中心當(dāng)作一個(gè)智能體進(jìn)行訓(xùn)練,因此觀測到的狀態(tài)空間應(yīng)該是包括全局所有武器裝備狀態(tài)以及目標(biāo)任務(wù)等狀態(tài)的空間。那么通過上文問題定義可以確定,整個(gè)狀態(tài)空間由三部分組成其中,Otc表示所有武器裝備的相關(guān)狀態(tài)信息,Otr表示所有目標(biāo)任務(wù)的相關(guān)狀態(tài)信息,Ot d表示所以資源補(bǔ)給點(diǎn)的相關(guān)狀態(tài)信息。對于單個(gè)武器裝備所具有的屬性包括:經(jīng)度屬性,維度屬性,攜帶資源分布屬性,發(fā)射成功率屬性,剩余油儲(chǔ)量;對于單個(gè)目標(biāo)任務(wù)所具有的屬性包括:經(jīng)度屬性,維度屬性,需求資源分布屬性,任務(wù)的重要程度;最后是資源補(bǔ)給點(diǎn)的相關(guān)屬性主要包括經(jīng)度屬性和維度屬性。

    3.1.2 動(dòng)作空間

    首先,對于一個(gè)武器裝備執(zhí)行單元來說,能夠進(jìn)行方案選擇有:任務(wù)出派、隱蔽待敵、資源補(bǔ)給。而任務(wù)出派的目標(biāo)則有m個(gè)任務(wù)目標(biāo)可以選擇,資源補(bǔ)給也有k個(gè)資源補(bǔ)給點(diǎn)可以選擇,再加上原地隱蔽待敵,因此總共有m+k+1 中選擇,因此對于一個(gè)武器裝備來說其動(dòng)作空間是一個(gè)大小為m+k+1 的離散動(dòng)作空間。其次,由于本算法是將整個(gè)中央決策系統(tǒng)當(dāng)作一整個(gè)智能體,其輸出應(yīng)該是全局武器裝備的整體決策方案,因此對于N個(gè)武器裝備來說,中央決策中心智能體的動(dòng)作選擇空間應(yīng)該是一個(gè)多維離散動(dòng)作空間,其表示如式(1)所示:

    3.1.3 獎(jiǎng)勵(lì)函數(shù)

    最后一部分是方案分配的最大距離懲罰q如式(4)所示,表示的是方案分配中最遠(yuǎn)的武器裝備到目標(biāo)地點(diǎn)的距離,這個(gè)指標(biāo)影響著整個(gè)方案的最終響應(yīng)時(shí)間。

    因此,最終的一個(gè)單步獎(jiǎng)勵(lì)rt如式(5)所示,其中α,ω為超參數(shù),用于平衡各個(gè)獎(jiǎng)勵(lì)目標(biāo)和懲罰目標(biāo)之間的權(quán)重。

    3.2 Actor-Critic模型設(shè)計(jì)

    該算法的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)主要有兩個(gè)分別是Q-Critic網(wǎng)絡(luò)和Actor策略網(wǎng)絡(luò)。在該網(wǎng)絡(luò)結(jié)構(gòu)中,Actor 網(wǎng)絡(luò)和Q-Critic 網(wǎng)路共用一個(gè)狀態(tài)特征提取層。特征提取層操作很簡單,將執(zhí)行單元和任務(wù)單元分別進(jìn)行一個(gè)線性變化獲得基礎(chǔ)編碼,再將整個(gè)狀態(tài)編碼展開為一個(gè)一維向量,在多要素多目標(biāo)武器裝備調(diào)度問題中,其輸出是一個(gè)15360 維的一維向量。整體結(jié)構(gòu)如下圖1所示。

    圖1 網(wǎng)絡(luò)結(jié)構(gòu)圖

    3.3 SAC算法訓(xùn)練

    SAC 算法訓(xùn)練過程中,首先初始化并設(shè)置策略網(wǎng)絡(luò)、Q 網(wǎng)絡(luò)和目標(biāo)函數(shù)網(wǎng)絡(luò)參數(shù)。為了增強(qiáng)訓(xùn)練效果,引入熵[10]正則化項(xiàng)鼓勵(lì)策略保持多樣性,避免局部最優(yōu)問題,同時(shí)使用自適應(yīng)溫度參數(shù)平衡探索和利用。在收集樣本階段,使用當(dāng)前策略從環(huán)境中收集經(jīng)驗(yàn)樣本,并存儲(chǔ)到回放緩沖器中。在訓(xùn)練過程中,隨機(jī)抽取并重要性采樣樣本來更新策略網(wǎng)絡(luò)和Q網(wǎng)絡(luò),并可以動(dòng)態(tài)調(diào)整學(xué)習(xí)率。策略遷移可在學(xué)習(xí)到的策略網(wǎng)絡(luò)上探索新狀態(tài)并繼續(xù)訓(xùn)練。訓(xùn)練會(huì)在達(dá)到預(yù)設(shè)的停止條件時(shí)停止。

    4 基于注意力機(jī)制的全局路徑規(guī)劃算法

    本章介紹了基于注意力機(jī)制[6]的全局路徑規(guī)劃算法的設(shè)計(jì)過程,包括獎(jiǎng)勵(lì)函數(shù)、多頭注意力模型、貪婪滾動(dòng)基線訓(xùn)練等各個(gè)強(qiáng)化學(xué)習(xí)訓(xùn)練模塊。

    4.1 馬爾可夫決策建模

    4.1.1 狀態(tài)空間

    在這個(gè)全局路徑規(guī)劃問題中,狀態(tài)空間由三部分組成:全局節(jié)點(diǎn)集合狀態(tài)、多車輛初始節(jié)點(diǎn)狀態(tài)、當(dāng)前所在節(jié)點(diǎn)狀態(tài)、目標(biāo)節(jié)點(diǎn)狀態(tài)。具體表現(xiàn)如式(6)所示,其中vN={v1,v2,v3…,vN}表示整個(gè)戰(zhàn)場道路網(wǎng)絡(luò)分布及路口車流量特征,vM={v1,v2,v3…,vM}表示所以執(zhí)行單元初始位置分布特征,vi表示當(dāng)前規(guī)劃路徑的車輛起始節(jié)點(diǎn)i,vj表示當(dāng)前規(guī)劃路徑的車輛目標(biāo)地節(jié)點(diǎn)j。

    4.1.2 動(dòng)作空間

    在路徑規(guī)劃問題中常用地圖節(jié)點(diǎn)集合當(dāng)作動(dòng)作空間,這種方式被稱為節(jié)點(diǎn)選擇問題。這種節(jié)點(diǎn)選擇問題的動(dòng)作空間,因?yàn)楣?jié)點(diǎn)的數(shù)量很大,在進(jìn)行動(dòng)作選擇時(shí),通過還需要屏蔽機(jī)制(Mask),限制節(jié)點(diǎn)的數(shù)量,以確保智能體只能選擇與當(dāng)前節(jié)點(diǎn)存在地圖道路的下一個(gè)節(jié)點(diǎn)。通過不斷地選擇下一個(gè)節(jié)點(diǎn),最終就能形成由一組地圖節(jié)點(diǎn)所組成的行駛路徑。

    4.1.3 獎(jiǎng)勵(lì)函數(shù)

    獎(jiǎng)勵(lì)函數(shù)用于評估代理執(zhí)行一個(gè)動(dòng)作的好壞。在路徑規(guī)劃問題中,為了找到最短路徑,可以定義獎(jiǎng)勵(lì)函數(shù)為選擇的節(jié)點(diǎn)到當(dāng)前節(jié)點(diǎn)路徑長度的相反數(shù)。同時(shí)通過設(shè)置一個(gè)懲罰因子,對智能體選擇過于擁擠的節(jié)點(diǎn)進(jìn)行懲罰,來指導(dǎo)智能體做出更好的決策。具體的獎(jiǎng)勵(lì)函數(shù)表示如式(8)所示:

    rt=-path_length-penalty*invalid_action(8)

    其中,pat?_lengt? 表示路徑長度,penalty是一個(gè)懲罰因子,用于懲罰智能體選擇擁擠的節(jié)點(diǎn),懲罰因子的大小隨著擁擠程度的提升而提升,而invalid_action是一個(gè)指示函數(shù),如果智能體選擇的節(jié)點(diǎn)不符合要求,則為1,否則為0。

    4.2 注意力模型設(shè)計(jì)

    本章方法的模型結(jié)構(gòu)源于傳統(tǒng)的Encoder-Decoder 結(jié)構(gòu)。在這個(gè)路勁規(guī)劃問題中,每一個(gè)輸入Xi都是一個(gè)維度為2 的向量。編碼器首先會(huì)通過一個(gè)線性變化將每個(gè)xi編碼為維度是128 的特征向量(node embeding),表示為?0i。接著會(huì)經(jīng)過一個(gè)循環(huán)N層的網(wǎng)絡(luò)結(jié)構(gòu),每一層里面都由一個(gè)多頭注意力機(jī)制層(multi-head attention)和一個(gè)前饋反饋層(feed forward)兩個(gè)子層組成,每一個(gè)子層會(huì)經(jīng)過一個(gè)殘差網(wǎng)絡(luò)[7]進(jìn)行傳播,其結(jié)構(gòu)如圖2所示。

    圖2 編碼器結(jié)構(gòu)

    解碼器結(jié)構(gòu)主要由兩個(gè)部分組成,一部分同樣是一個(gè)多頭注意力機(jī)制,用于將解碼器輸出的圖特征編碼以及其他特征進(jìn)行融合,變成一個(gè)整體上下文特征編碼。接著是另一部分,是一個(gè)基于單注意力機(jī)制的概率計(jì)算層,通過計(jì)算每個(gè)節(jié)點(diǎn)對上一層輸出的上下文特征編碼的重要程度,再將其轉(zhuǎn)化為概率值。根據(jù)概率值,就可以根據(jù)不同的策略來選取下一個(gè)節(jié)點(diǎn),重復(fù)多次這個(gè)過程,就可以得到智能體的路徑規(guī)劃。具體的解碼器結(jié)構(gòu)如圖3所示。

    圖3 解碼器結(jié)構(gòu)

    4.3 REINFORCE算法訓(xùn)練

    模型采用REINFORCE[8]算法訓(xùn)練,同時(shí)采用貪戀基線進(jìn)行更新。該思想?yún)⒖剂薉QN 算法中Target 網(wǎng)絡(luò)的思想。創(chuàng)建兩個(gè)結(jié)構(gòu)完全一樣的網(wǎng)絡(luò),一套擁有最新的參數(shù),一套則固定為老的參數(shù)。在每個(gè)epoch 結(jié)束后,對比兩個(gè)當(dāng)前策略和基線策略的結(jié)果,如果當(dāng)前策略的累計(jì)獎(jiǎng)勵(lì)期望比基線策略有顯著的提升時(shí),將當(dāng)前策略參數(shù)復(fù)制給基線策略,以此不斷提升當(dāng)前策略網(wǎng)絡(luò)的效果。

    5 實(shí)驗(yàn)

    5.1 實(shí)驗(yàn)設(shè)計(jì)

    為了驗(yàn)證算法的有效性和先進(jìn)性,我們進(jìn)行了以下三個(gè)方面的實(shí)驗(yàn)設(shè)置:環(huán)境設(shè)置、武器裝備調(diào)度實(shí)驗(yàn)、全局路徑規(guī)劃實(shí)驗(yàn)。

    5.1.1 實(shí)驗(yàn)環(huán)境

    本課題采用PyCharm 作為開發(fā)工具,使用的語言為python3.9,采用了pytorch 深度學(xué)習(xí)框架構(gòu)建深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)。實(shí)驗(yàn)的運(yùn)行環(huán)境及軟硬件配置如表1所示。

    表1 實(shí)驗(yàn)運(yùn)行環(huán)境及軟硬件設(shè)置

    5.1.2 仿真環(huán)境

    本節(jié)針對武器裝備調(diào)度問題和多車輛路徑規(guī)劃問題,構(gòu)建戰(zhàn)場仿真環(huán)境以便訓(xùn)練DRL 算法。整個(gè)仿真環(huán)境是城市地理環(huán)境,以廣州大學(xué)為中心,作戰(zhàn)區(qū)域?yàn)?000km2,其中北緯23.0985 以北為備戰(zhàn)區(qū)域,北緯22.0575 以南為發(fā)射區(qū)域。本實(shí)驗(yàn)包含三個(gè)不同規(guī)模的仿真環(huán)境:env20、env50、env100。env20 為20 個(gè)執(zhí)行單元和4 個(gè)任務(wù)單元,env50為50個(gè)執(zhí)行單元和10個(gè)任務(wù)單元,env100為100 個(gè)執(zhí)行單元和20 個(gè)任務(wù)單元。其他仿真環(huán)境的參數(shù)如表2所示。

    表2 仿真環(huán)境參數(shù)設(shè)置

    5.2 武器裝備調(diào)度實(shí)驗(yàn)

    5.2.1 評價(jià)指標(biāo)

    本小節(jié)重點(diǎn)介紹在多要素多目標(biāo)武器裝備調(diào)度實(shí)驗(yàn)中用到的性能評價(jià)指標(biāo)如表3 所示。這些指標(biāo)由合作單位某航天研究院提供,通過任務(wù)完成度表示戰(zhàn)備資源分配效果;最大行駛距離和平均行駛距離表示部隊(duì)響應(yīng)速度;算法時(shí)間復(fù)雜度表示部隊(duì)調(diào)度的實(shí)時(shí)性和敏捷性。

    表3 武器裝備調(diào)度實(shí)驗(yàn)評價(jià)指標(biāo)

    5.2.2 收斂性實(shí)驗(yàn)

    本節(jié)所有的實(shí)驗(yàn)結(jié)果是基于上一小節(jié)中env100的環(huán)境進(jìn)行訓(xùn)練,具體的累計(jì)獎(jiǎng)勵(lì)曲線和損失曲線如圖4 所示。從累計(jì)獎(jiǎng)勵(lì)曲線可以看出算法在60000 步的時(shí)候開始進(jìn)入穩(wěn)定期,算法開始收斂,最終每輪訓(xùn)練的平均累計(jì)獎(jiǎng)勵(lì)穩(wěn)定在80 上下(理論累計(jì)獎(jiǎng)勵(lì)最大值為200)。這些實(shí)驗(yàn)結(jié)果說明該算法最終都能夠成功收斂。

    圖4 基于SAC的武器裝備調(diào)度算法結(jié)果圖

    5.2.3 對比試驗(yàn)

    對于多要素多目標(biāo)武器裝備調(diào)度問題,其主要的評價(jià)指標(biāo)有四個(gè),分別是:任務(wù)完成度、最大行駛距離、平均行駛距離和以及算法時(shí)間復(fù)雜度。進(jìn)行對比的算法有四種:隨機(jī)選擇、貪心算法、最優(yōu)強(qiáng)化學(xué)習(xí)算法、遺傳算法。其中隨機(jī)選擇算法通過完全隨機(jī)的方式生成決策方案,這個(gè)算法作為基礎(chǔ)參照指標(biāo)。貪心算法則是對任務(wù)進(jìn)行重要程度排序,優(yōu)先完成重要程度高的任務(wù),同時(shí)對執(zhí)行單元的距離進(jìn)行排序,優(yōu)先調(diào)度最近的執(zhí)行單元前去完成任務(wù)。最優(yōu)強(qiáng)化學(xué)習(xí)算法,則是調(diào)度算法經(jīng)過調(diào)參訓(xùn)練后的最優(yōu)模型。遺傳算法則是根據(jù)遺傳規(guī)律,以啟發(fā)式搜索的形式在解空間中搜索出一個(gè)相對最優(yōu)解。最終這四種算法關(guān)于四個(gè)指標(biāo)在不同規(guī)模數(shù)據(jù)集上的表現(xiàn)如圖5 所示。從結(jié)果可以看出,隨著問題規(guī)模的增加,該調(diào)度算法在任務(wù)完成度、算法時(shí)間復(fù)雜度上的優(yōu)勢越來越明顯。同時(shí)在最長行駛距離和平均行駛距離與貪心算法的差距也在不斷變小。

    圖5 多種武器裝備調(diào)度算法對比結(jié)果圖

    在任務(wù)完成度方面,因?yàn)樵趩栴}規(guī)模較小的時(shí)候,遺傳搜索算法能夠在較小的解空間中找出優(yōu)秀的解,但隨著問題規(guī)模增大,在有限時(shí)間內(nèi)搜索出一個(gè)優(yōu)秀解就越來越困難,而強(qiáng)化學(xué)習(xí)基于概率的特性在數(shù)據(jù)規(guī)模大的時(shí)候就逐漸顯現(xiàn)出優(yōu)勢。在路徑長度方面,貪心算法以最短路徑為貪心目標(biāo),所以在路徑方面具備優(yōu)勢,強(qiáng)化學(xué)習(xí)算法則更具綜合優(yōu)勢。在算法時(shí)間復(fù)雜度,其他算法隨著問題規(guī)模的增長而增長,但強(qiáng)化學(xué)習(xí)則基本穩(wěn)定不變。

    5.3 全局路徑規(guī)劃實(shí)驗(yàn)

    5.3.1 評價(jià)指標(biāo)

    本節(jié)重點(diǎn)介紹在多車輛全局路徑規(guī)劃實(shí)驗(yàn)中用到的性能評價(jià)指標(biāo)。路徑?jīng)_突次數(shù)、最大行駛時(shí)間、平均行駛時(shí)間、算法時(shí)間復(fù)雜度指標(biāo)將在對比試驗(yàn)作為主要的對比指標(biāo),證明所提出算法的先進(jìn)性。這些指標(biāo)同樣由合作單位給出,路徑?jīng)_突次數(shù)表示全局規(guī)劃的平衡性;最大行駛時(shí)間和平均行駛時(shí)間表示路徑規(guī)劃的先進(jìn)性;算法時(shí)間復(fù)雜度表示規(guī)劃的實(shí)時(shí)性和敏捷性。具體介紹如表4所示。

    表4 全局路徑規(guī)劃實(shí)驗(yàn)評價(jià)指標(biāo)

    5.3.2 收斂性實(shí)驗(yàn)

    本節(jié)所有的實(shí)驗(yàn)結(jié)果是基于上一小節(jié)中env100的環(huán)境進(jìn)行訓(xùn)練,具體的累計(jì)獎(jiǎng)勵(lì)曲線和損失曲線如圖6 所示。因?yàn)槁窂揭?guī)劃中獎(jiǎng)勵(lì)函數(shù)都是懲罰機(jī)制,最終的結(jié)果是最小化懲罰,所以平均累計(jì)獎(jiǎng)勵(lì)為負(fù)值。從實(shí)驗(yàn)結(jié)果可以看到最終在500000 步的時(shí)候,累計(jì)獎(jiǎng)勵(lì)穩(wěn)定到了-60 的位置,證明了該算法最終可以成功收斂。

    圖6 基于注意力機(jī)制的全局路徑規(guī)劃算法結(jié)果圖

    5.3.3 對比試驗(yàn)

    對于全局多車輛路徑規(guī)劃問題,其主要的評價(jià)指標(biāo)有四個(gè),分別是:平均行駛時(shí)間、最長行駛時(shí)間按、路徑?jīng)_突次數(shù)、算法時(shí)間復(fù)雜度。進(jìn)行對比的算法有兩種:注意力模型、Dijkstra。其中注意力模型算法是基于注意力模型的路徑規(guī)劃算法;Dijkstra 是單源最短路徑算法。最終這兩種算法關(guān)于四個(gè)指標(biāo)在不同規(guī)模數(shù)據(jù)集上的表現(xiàn)如圖7 所示。整體來看,隨著問題規(guī)模的增加,Dijkstra 算法的路徑?jīng)_突次數(shù)急劇上升,導(dǎo)致,進(jìn)而導(dǎo)致行駛時(shí)間急劇上升,表現(xiàn)越來越差。而基于注意力機(jī)制的路徑規(guī)劃算法則表現(xiàn)越來越好,且在算法時(shí)間復(fù)雜度上,也優(yōu)于傳統(tǒng)算法。

    圖7 多種全局路徑規(guī)劃算法對比結(jié)果圖

    6 結(jié)語

    該研究通過強(qiáng)化學(xué)習(xí)的方法設(shè)計(jì)了一套多要素多目標(biāo)武器裝備協(xié)同規(guī)劃算法。希望通過協(xié)同規(guī)劃算法能夠輔助我軍指揮官更好的進(jìn)行科學(xué)有效的規(guī)劃決策,適應(yīng)信息化聯(lián)合作戰(zhàn)趨勢。研究將該問題分解為了兩個(gè)子問題:多要素多目標(biāo)武器裝備調(diào)度問題和多車輛全局路徑規(guī)劃問題。并針對兩個(gè)階段的問題分別提出了基于SAC 的武器裝備調(diào)度算法和基于注意力機(jī)制的全局路徑規(guī)劃算法。最后通過和傳統(tǒng)算法的對比試驗(yàn),證明了提出方法的有效性和先進(jìn)性。這項(xiàng)研究為武器裝備協(xié)同規(guī)劃問題提供了新的思路和解決方案,也為算法的優(yōu)化和改進(jìn)提供了有益的參考。相信這些算法的思路有很大的潛力在未來的應(yīng)用中會(huì)繼續(xù)得到完善和發(fā)展。

    猜你喜歡
    全局調(diào)度規(guī)劃
    Cahn-Hilliard-Brinkman系統(tǒng)的全局吸引子
    量子Navier-Stokes方程弱解的全局存在性
    《調(diào)度集中系統(tǒng)(CTC)/列車調(diào)度指揮系統(tǒng)(TDCS)維護(hù)手冊》正式出版
    一種基于負(fù)載均衡的Kubernetes調(diào)度改進(jìn)算法
    虛擬機(jī)實(shí)時(shí)遷移調(diào)度算法
    落子山東,意在全局
    金橋(2018年4期)2018-09-26 02:24:54
    規(guī)劃引領(lǐng)把握未來
    快遞業(yè)十三五規(guī)劃發(fā)布
    商周刊(2017年5期)2017-08-22 03:35:26
    多管齊下落實(shí)規(guī)劃
    迎接“十三五”規(guī)劃
    色94色欧美一区二区| 又紧又爽又黄一区二区| 久久精品熟女亚洲av麻豆精品| 成人亚洲欧美一区二区av| 观看av在线不卡| 国产高清国产精品国产三级| 精品少妇一区二区三区视频日本电影| 国产91精品成人一区二区三区 | 人人妻,人人澡人人爽秒播 | 丰满迷人的少妇在线观看| 国产老妇伦熟女老妇高清| 欧美少妇被猛烈插入视频| 精品卡一卡二卡四卡免费| 亚洲av综合色区一区| 国产一卡二卡三卡精品| 亚洲精品久久久久久婷婷小说| 一本色道久久久久久精品综合| 亚洲 欧美一区二区三区| 手机成人av网站| 无遮挡黄片免费观看| 久久国产精品大桥未久av| 捣出白浆h1v1| 免费女性裸体啪啪无遮挡网站| 精品一区二区三区四区五区乱码 | 欧美黑人精品巨大| 国产成人精品久久久久久| 日韩一卡2卡3卡4卡2021年| 啦啦啦在线免费观看视频4| 久久久精品区二区三区| 成人午夜精彩视频在线观看| 最新的欧美精品一区二区| 多毛熟女@视频| 男人爽女人下面视频在线观看| 国产野战对白在线观看| 亚洲av日韩在线播放| 爱豆传媒免费全集在线观看| 丝袜脚勾引网站| 国产在线观看jvid| 天天操日日干夜夜撸| 自拍欧美九色日韩亚洲蝌蚪91| 中文字幕精品免费在线观看视频| 国产日韩欧美亚洲二区| 久久99一区二区三区| 狂野欧美激情性xxxx| 日韩免费高清中文字幕av| 国产日韩欧美亚洲二区| 国产福利在线免费观看视频| 午夜激情久久久久久久| 一边摸一边做爽爽视频免费| 国产一区二区三区综合在线观看| 亚洲五月婷婷丁香| 真人做人爱边吃奶动态| 丝袜喷水一区| 国产精品 国内视频| 日本猛色少妇xxxxx猛交久久| 男人爽女人下面视频在线观看| 欧美97在线视频| 在线看a的网站| 大码成人一级视频| 亚洲欧美日韩另类电影网站| 亚洲精品美女久久av网站| 日本午夜av视频| 日本av手机在线免费观看| 亚洲精品中文字幕在线视频| 午夜福利免费观看在线| 久久久久视频综合| 久久久久国产精品人妻一区二区| 免费在线观看完整版高清| 男的添女的下面高潮视频| 午夜久久久在线观看| 欧美日韩精品网址| 午夜免费观看性视频| 日韩av不卡免费在线播放| 国产成人欧美在线观看 | 十八禁人妻一区二区| 国产高清国产精品国产三级| 飞空精品影院首页| 成在线人永久免费视频| 美女扒开内裤让男人捅视频| 亚洲熟女毛片儿| 亚洲,欧美精品.| 欧美精品一区二区免费开放| 中文字幕av电影在线播放| 亚洲国产欧美日韩在线播放| 免费高清在线观看日韩| 国产精品人妻久久久影院| 久久久久网色| 男人添女人高潮全过程视频| 亚洲人成电影观看| 亚洲精品久久午夜乱码| 成人国产一区最新在线观看 | 丝袜脚勾引网站| 一区二区日韩欧美中文字幕| 丝袜人妻中文字幕| 亚洲,一卡二卡三卡| 久久人人97超碰香蕉20202| 免费高清在线观看日韩| 成人三级做爰电影| 激情视频va一区二区三区| 捣出白浆h1v1| 国产麻豆69| 美国免费a级毛片| 搡老岳熟女国产| 在线看a的网站| 国产精品三级大全| 国产精品久久久久久精品古装| 亚洲国产日韩一区二区| 狂野欧美激情性xxxx| 成年人午夜在线观看视频| 久久精品aⅴ一区二区三区四区| 亚洲精品自拍成人| 在线观看免费高清a一片| 极品少妇高潮喷水抽搐| 麻豆av在线久日| 精品一区二区三区av网在线观看 | 国产1区2区3区精品| 亚洲图色成人| 国产精品久久久久久人妻精品电影 | 久久精品熟女亚洲av麻豆精品| 高清黄色对白视频在线免费看| www.精华液| 建设人人有责人人尽责人人享有的| 免费在线观看完整版高清| 一区在线观看完整版| 在线观看免费高清a一片| 女人高潮潮喷娇喘18禁视频| 亚洲激情五月婷婷啪啪| 丝袜美足系列| 赤兔流量卡办理| 欧美日韩成人在线一区二区| 久久精品久久精品一区二区三区| 国产成人系列免费观看| 久久99一区二区三区| 最黄视频免费看| 精品卡一卡二卡四卡免费| 国产日韩欧美在线精品| 男人操女人黄网站| 亚洲一区中文字幕在线| 啦啦啦 在线观看视频| 51午夜福利影视在线观看| 欧美国产精品一级二级三级| 亚洲精品国产区一区二| 在线看a的网站| 国产日韩一区二区三区精品不卡| 中文字幕亚洲精品专区| 精品福利永久在线观看| 精品少妇内射三级| 久久毛片免费看一区二区三区| 波多野结衣一区麻豆| 精品国产国语对白av| 美女中出高潮动态图| 大香蕉久久成人网| 一区二区三区乱码不卡18| h视频一区二区三区| 欧美精品一区二区免费开放| 久久精品亚洲熟妇少妇任你| 国产伦理片在线播放av一区| 中文欧美无线码| 好男人视频免费观看在线| 国产在线观看jvid| 国产熟女午夜一区二区三区| 亚洲国产精品成人久久小说| 五月开心婷婷网| 大码成人一级视频| 丝袜在线中文字幕| av网站免费在线观看视频| 欧美久久黑人一区二区| 免费黄频网站在线观看国产| 亚洲熟女精品中文字幕| 欧美精品啪啪一区二区三区 | 亚洲欧美日韩高清在线视频 | 日韩 亚洲 欧美在线| 国产xxxxx性猛交| 嫁个100分男人电影在线观看 | 男的添女的下面高潮视频| 黄色a级毛片大全视频| 国产日韩欧美亚洲二区| 欧美日韩视频精品一区| 黄色毛片三级朝国网站| 国产欧美日韩一区二区三 | 中文精品一卡2卡3卡4更新| 国产亚洲一区二区精品| 国产高清不卡午夜福利| 黄色a级毛片大全视频| 精品亚洲乱码少妇综合久久| 成年人黄色毛片网站| 人妻人人澡人人爽人人| 另类亚洲欧美激情| 亚洲精品乱久久久久久| 纯流量卡能插随身wifi吗| 在线看a的网站| 色视频在线一区二区三区| 久久久久久免费高清国产稀缺| 99精国产麻豆久久婷婷| 欧美精品av麻豆av| 亚洲第一av免费看| 亚洲av成人精品一二三区| 欧美日韩av久久| 在线天堂中文资源库| 777米奇影视久久| 2021少妇久久久久久久久久久| 亚洲成人免费av在线播放| 电影成人av| 黄色毛片三级朝国网站| a级片在线免费高清观看视频| 国产福利在线免费观看视频| 亚洲精品国产一区二区精华液| 建设人人有责人人尽责人人享有的| avwww免费| 国产黄频视频在线观看| 人妻人人澡人人爽人人| www.av在线官网国产| 亚洲国产欧美在线一区| 亚洲av成人不卡在线观看播放网 | 一边亲一边摸免费视频| 午夜免费成人在线视频| 国产一区二区三区av在线| 丰满少妇做爰视频| 亚洲人成网站在线观看播放| 最新在线观看一区二区三区 | 天天操日日干夜夜撸| 一区二区三区四区激情视频| 免费看不卡的av| 午夜老司机福利片| 欧美成人午夜精品| 男女下面插进去视频免费观看| 国产99久久九九免费精品| 精品国产一区二区三区四区第35| 亚洲欧洲国产日韩| 国产精品久久久久久精品古装| 国产亚洲精品久久久久5区| 欧美日韩视频高清一区二区三区二| 亚洲欧美色中文字幕在线| 男人操女人黄网站| 99热全是精品| 99香蕉大伊视频| 亚洲一区中文字幕在线| 精品国产一区二区三区久久久樱花| 成人18禁高潮啪啪吃奶动态图| 精品亚洲成国产av| 最黄视频免费看| 国产精品一区二区精品视频观看| 精品免费久久久久久久清纯 | 精品国产乱码久久久久久男人| 黑人欧美特级aaaaaa片| 国产av一区二区精品久久| 精品久久久久久电影网| 999精品在线视频| 亚洲黑人精品在线| 不卡av一区二区三区| 国产欧美亚洲国产| www.熟女人妻精品国产| 国产xxxxx性猛交| 一区在线观看完整版| 丝袜脚勾引网站| 天天添夜夜摸| av在线播放精品| 国产av一区二区精品久久| 免费不卡黄色视频| 欧美日韩黄片免| 久久久久久久久久久久大奶| 日韩免费高清中文字幕av| 精品人妻熟女毛片av久久网站| 久久久国产一区二区| 三上悠亚av全集在线观看| 最新的欧美精品一区二区| 我要看黄色一级片免费的| 九草在线视频观看| 校园人妻丝袜中文字幕| 尾随美女入室| av又黄又爽大尺度在线免费看| 狠狠精品人妻久久久久久综合| 丝袜人妻中文字幕| 亚洲国产精品成人久久小说| 国产伦人伦偷精品视频| 欧美乱码精品一区二区三区| 午夜福利免费观看在线| 国产成人av激情在线播放| 日韩精品免费视频一区二区三区| 精品久久蜜臀av无| 亚洲成人免费av在线播放| 最黄视频免费看| 精品少妇一区二区三区视频日本电影| 高清黄色对白视频在线免费看| 精品卡一卡二卡四卡免费| 在线精品无人区一区二区三| 亚洲国产中文字幕在线视频| 国产一区有黄有色的免费视频| 久久久国产精品麻豆| 久久热在线av| 久久久欧美国产精品| 亚洲国产欧美在线一区| 国产亚洲av片在线观看秒播厂| 成人黄色视频免费在线看| 亚洲精品一卡2卡三卡4卡5卡 | 汤姆久久久久久久影院中文字幕| 国产精品久久久久久精品电影小说| 99精国产麻豆久久婷婷| 9191精品国产免费久久| av有码第一页| 国产1区2区3区精品| 尾随美女入室| 亚洲国产精品一区三区| 1024香蕉在线观看| 亚洲欧洲日产国产| 一区福利在线观看| 国产男女内射视频| av欧美777| 一本色道久久久久久精品综合| 国产爽快片一区二区三区| 免费高清在线观看视频在线观看| 欧美成人午夜精品| 亚洲精品久久久久久婷婷小说| 中文乱码字字幕精品一区二区三区| 黑丝袜美女国产一区| 亚洲精品av麻豆狂野| 深夜精品福利| 黄色a级毛片大全视频| 久久毛片免费看一区二区三区| 91麻豆av在线| 国产亚洲av片在线观看秒播厂| 久久久精品国产亚洲av高清涩受| 韩国精品一区二区三区| 国产精品秋霞免费鲁丝片| 悠悠久久av| 51午夜福利影视在线观看| av国产久精品久网站免费入址| 国产精品九九99| 高潮久久久久久久久久久不卡| 免费看不卡的av| 亚洲欧洲日产国产| 考比视频在线观看| 国产视频首页在线观看| a级片在线免费高清观看视频| √禁漫天堂资源中文www| 国产真人三级小视频在线观看| 最新在线观看一区二区三区 | 国产一区二区三区av在线| 精品少妇一区二区三区视频日本电影| 亚洲精品日韩在线中文字幕| 日韩一区二区三区影片| 在线观看免费日韩欧美大片| 久久国产精品影院| 国产成人影院久久av| 国产精品免费视频内射| 久久久久久久久久久久大奶| 一级a爱视频在线免费观看| 最近最新中文字幕大全免费视频 | 国产成人影院久久av| 九色亚洲精品在线播放| 久久精品成人免费网站| 亚洲成人免费电影在线观看 | 好男人电影高清在线观看| 婷婷色综合大香蕉| 亚洲专区中文字幕在线| 亚洲国产av新网站| videos熟女内射| 亚洲国产av新网站| 91成人精品电影| 久久这里只有精品19| 久久人人97超碰香蕉20202| 操出白浆在线播放| 乱人伦中国视频| 一区二区av电影网| 亚洲精品国产av蜜桃| 欧美日韩福利视频一区二区| 中文字幕制服av| av福利片在线| 国产在线一区二区三区精| 精品熟女少妇八av免费久了| 亚洲av成人不卡在线观看播放网 | 色播在线永久视频| 国产精品av久久久久免费| 人妻人人澡人人爽人人| 国产免费福利视频在线观看| a 毛片基地| 一级片免费观看大全| 水蜜桃什么品种好| 国产成人影院久久av| 亚洲中文字幕日韩| 成人黄色视频免费在线看| 老汉色∧v一级毛片| 亚洲天堂av无毛| 亚洲国产欧美日韩在线播放| 少妇人妻 视频| 久久精品国产a三级三级三级| 亚洲国产av影院在线观看| 久久精品国产a三级三级三级| 国产精品秋霞免费鲁丝片| 亚洲伊人色综图| 操美女的视频在线观看| 国产免费又黄又爽又色| 多毛熟女@视频| av视频免费观看在线观看| 国产片内射在线| 18禁国产床啪视频网站| 久久青草综合色| 国产在线免费精品| 一级毛片我不卡| 国产精品av久久久久免费| 高清欧美精品videossex| 国产免费福利视频在线观看| 欧美精品亚洲一区二区| 91国产中文字幕| 亚洲精品中文字幕在线视频| bbb黄色大片| 乱人伦中国视频| 七月丁香在线播放| 天天影视国产精品| 午夜久久久在线观看| 国产又色又爽无遮挡免| 久久久久久久精品精品| 午夜福利在线免费观看网站| 日本欧美国产在线视频| 麻豆av在线久日| 一区二区三区激情视频| 99热国产这里只有精品6| 99久久人妻综合| 桃花免费在线播放| 成年动漫av网址| 又粗又硬又长又爽又黄的视频| 国产主播在线观看一区二区 | 黄色一级大片看看| 亚洲av片天天在线观看| 久久精品国产亚洲av高清一级| 手机成人av网站| 婷婷色麻豆天堂久久| 亚洲精品中文字幕在线视频| 精品一区二区三区四区五区乱码 | 国产欧美日韩综合在线一区二区| 新久久久久国产一级毛片| 大码成人一级视频| 人妻 亚洲 视频| 久久热在线av| 久久久国产精品麻豆| 国语对白做爰xxxⅹ性视频网站| 国产成人精品久久久久久| 一本大道久久a久久精品| 黄频高清免费视频| 国产精品一区二区精品视频观看| 成年人黄色毛片网站| 18禁观看日本| 成年女人毛片免费观看观看9 | 国产成人91sexporn| 亚洲国产毛片av蜜桃av| 婷婷丁香在线五月| 午夜免费男女啪啪视频观看| 日日夜夜操网爽| 色网站视频免费| 老司机影院成人| 丝袜人妻中文字幕| 999久久久国产精品视频| 国产成人免费观看mmmm| 国产精品香港三级国产av潘金莲 | 精品久久久久久久毛片微露脸 | 亚洲中文字幕日韩| 人人妻人人澡人人看| 天天躁狠狠躁夜夜躁狠狠躁| 精品一区在线观看国产| 成年人免费黄色播放视频| 丝袜美足系列| 欧美精品一区二区大全| 亚洲av综合色区一区| 亚洲欧美成人综合另类久久久| 亚洲成人免费电影在线观看 | 久久久久久久大尺度免费视频| av片东京热男人的天堂| 考比视频在线观看| 丁香六月欧美| 大话2 男鬼变身卡| 在线观看www视频免费| 又粗又硬又长又爽又黄的视频| 国产又色又爽无遮挡免| 少妇猛男粗大的猛烈进出视频| 黄频高清免费视频| 亚洲中文字幕日韩| 极品人妻少妇av视频| 精品视频人人做人人爽| 校园人妻丝袜中文字幕| 精品国产乱码久久久久久男人| 九色亚洲精品在线播放| 日韩伦理黄色片| 在线观看一区二区三区激情| 青春草亚洲视频在线观看| 亚洲av日韩精品久久久久久密 | 国产一区二区激情短视频 | 国产淫语在线视频| 精品少妇久久久久久888优播| 国产av精品麻豆| 亚洲欧美一区二区三区国产| 免费在线观看黄色视频的| 搡老岳熟女国产| 成人18禁高潮啪啪吃奶动态图| 久久精品人人爽人人爽视色| 丝袜脚勾引网站| 后天国语完整版免费观看| 国产野战对白在线观看| 搡老乐熟女国产| 女人久久www免费人成看片| 老司机影院成人| 成年人黄色毛片网站| 男女午夜视频在线观看| 国产精品 欧美亚洲| www.av在线官网国产| 免费日韩欧美在线观看| 亚洲色图 男人天堂 中文字幕| 91成人精品电影| 搡老乐熟女国产| 亚洲av电影在线进入| 国产精品一区二区精品视频观看| 在线观看免费午夜福利视频| 日本欧美视频一区| 黄色a级毛片大全视频| 中文字幕另类日韩欧美亚洲嫩草| 国产精品一二三区在线看| 少妇人妻 视频| 国产主播在线观看一区二区 | 在线看a的网站| 婷婷色av中文字幕| xxx大片免费视频| 国产av一区二区精品久久| 一级毛片女人18水好多 | 性色av一级| 亚洲免费av在线视频| 1024香蕉在线观看| 咕卡用的链子| 亚洲五月婷婷丁香| 丝袜喷水一区| 我的亚洲天堂| 大话2 男鬼变身卡| 蜜桃国产av成人99| 亚洲综合色网址| 成年人免费黄色播放视频| 色婷婷久久久亚洲欧美| 美女主播在线视频| h视频一区二区三区| 久久 成人 亚洲| 久久久久久久久久久久大奶| 成人国产一区最新在线观看 | 国产精品九九99| 亚洲午夜精品一区,二区,三区| 婷婷色综合大香蕉| 久久亚洲精品不卡| 黄色毛片三级朝国网站| 久久久亚洲精品成人影院| av天堂久久9| 黑丝袜美女国产一区| 麻豆乱淫一区二区| 99热网站在线观看| 亚洲男人天堂网一区| 欧美人与性动交α欧美软件| 成人黄色视频免费在线看| 欧美在线黄色| 亚洲 欧美一区二区三区| 永久免费av网站大全| 狠狠精品人妻久久久久久综合| 亚洲欧洲日产国产| 久久女婷五月综合色啪小说| 国产日韩欧美视频二区| 国产成人欧美在线观看 | 亚洲欧美一区二区三区久久| 欧美日韩成人在线一区二区| 亚洲国产毛片av蜜桃av| av在线播放精品| 伊人亚洲综合成人网| 亚洲图色成人| 丰满迷人的少妇在线观看| 男女之事视频高清在线观看 | 亚洲精品久久久久久婷婷小说| 男女午夜视频在线观看| 国产精品一区二区在线不卡| 中文字幕另类日韩欧美亚洲嫩草| 欧美亚洲日本最大视频资源| www.精华液| 人人妻人人爽人人添夜夜欢视频| 91精品国产国语对白视频| 狠狠婷婷综合久久久久久88av| 久久久精品区二区三区| 首页视频小说图片口味搜索 | av电影中文网址| 制服诱惑二区| 国产又爽黄色视频| 欧美另类一区| 久久久久精品人妻al黑| 超碰成人久久| 日韩伦理黄色片| 日韩精品免费视频一区二区三区| 日本猛色少妇xxxxx猛交久久| 亚洲av美国av| 欧美 亚洲 国产 日韩一| 亚洲熟女精品中文字幕| 久久亚洲精品不卡| 欧美乱码精品一区二区三区| 亚洲色图 男人天堂 中文字幕| av欧美777| 午夜91福利影院| 后天国语完整版免费观看| 成年动漫av网址| 久久精品国产综合久久久| 一区二区三区精品91| 精品国产一区二区三区四区第35| 热re99久久国产66热| 91国产中文字幕| 国产精品香港三级国产av潘金莲 | 日韩av不卡免费在线播放| 新久久久久国产一级毛片| 一级毛片女人18水好多 | 亚洲专区中文字幕在线| 搡老乐熟女国产| 久久99一区二区三区| 乱人伦中国视频| 50天的宝宝边吃奶边哭怎么回事| 母亲3免费完整高清在线观看| videos熟女内射| 国精品久久久久久国模美|