基于多智能體深度強(qiáng)化學(xué)習(xí)的體系任務(wù)分配方法

2023-04-24 11:26:48林萌龍任棒棒張萌萌陳洪輝

指揮與控制學(xué)報(bào) 2023年1期

林萌龍陳濤任棒棒張萌萌陳洪輝

1.國防科技大學(xué)信息系統(tǒng)工程重點(diǎn)實(shí)驗(yàn)室湖南長沙 410073

馬賽克戰(zhàn)[1]、聯(lián)合全域指揮控制[2]等新型作戰(zhàn)概念所構(gòu)想的未來作戰(zhàn)場景中,傳統(tǒng)的多任務(wù)平臺(tái)被分解為了眾多的小型作戰(zhàn)單元,這些小型作戰(zhàn)單元通常具備更高的靈活性,能夠根據(jù)戰(zhàn)場環(huán)境的變化快速對(duì)自身所承擔(dān)的任務(wù)進(jìn)行調(diào)整,以實(shí)現(xiàn)更好的整體作戰(zhàn)效果. 在未來的新型作戰(zhàn)場景中,傳統(tǒng)的集中式指揮控制模式存在著指揮鏈路過長、決策復(fù)雜度過高等問題,從而導(dǎo)致決策時(shí)效性和決策質(zhì)量難以滿足要求[3]. 近年來,邊緣指揮控制等新型指揮控制模式應(yīng)運(yùn)而生,邊緣節(jié)點(diǎn)也即各作戰(zhàn)實(shí)體將具備一定程度的自主決策能力[4]. 由于戰(zhàn)場環(huán)境的復(fù)雜多變特性,以及作戰(zhàn)實(shí)體的小型化、智能化發(fā)展趨勢,分布式?jīng)Q策的模式將在未來的戰(zhàn)場決策中發(fā)揮越來越重要的作用.

作戰(zhàn)體系是為了完成特定的作戰(zhàn)任務(wù)由一系列具備各項(xiàng)能力的作戰(zhàn)單元?jiǎng)討B(tài)構(gòu)建而成,在以往的集中式?jīng)Q策模式下,體系設(shè)計(jì)人員會(huì)根據(jù)作戰(zhàn)任務(wù)的能力需求以及作戰(zhàn)單元所具備的各項(xiàng)能力,以最大化作戰(zhàn)效能或最小化作戰(zhàn)單元的使用成本等為目標(biāo),來統(tǒng)一地對(duì)各作戰(zhàn)任務(wù)和作戰(zhàn)單元進(jìn)行匹配. 作戰(zhàn)體系的“作戰(zhàn)任務(wù)—作戰(zhàn)單元”匹配問題可以建模為一個(gè)優(yōu)化問題,當(dāng)問題規(guī)模較小時(shí),可以采用集中式?jīng)Q策的模式運(yùn)用整數(shù)線性規(guī)劃等運(yùn)籌學(xué)方法快速得到全局最優(yōu)解[5],而當(dāng)問題規(guī)模較大時(shí)可以采用遺傳算法等啟發(fā)式算法[6]或者強(qiáng)化學(xué)習(xí)算法[7],得到問題的近似最優(yōu)解. 采用集中式?jīng)Q策的一個(gè)重要前提條件是中心決策節(jié)點(diǎn)和作戰(zhàn)單元葉節(jié)點(diǎn)之間的通信暢通,因?yàn)槿~節(jié)點(diǎn)需要將自身的狀態(tài)信息和觀測信息發(fā)送給中心決策節(jié)點(diǎn),而中心節(jié)點(diǎn)需要將決策命令發(fā)送給葉節(jié)點(diǎn). 然而在未來的作戰(zhàn)場景中,由于敵方的通信干擾等原因,中心節(jié)點(diǎn)和葉節(jié)點(diǎn)之間的通信鏈接很難保證連續(xù)暢通,同時(shí)頻繁的信息交互會(huì)造成一定的通信負(fù)載和通信延遲,因此,在未來很多的任務(wù)場景中,需要作戰(zhàn)單元根據(jù)自身的狀態(tài)信息和觀測到的信息獨(dú)立地進(jìn)行決策.

強(qiáng)化學(xué)習(xí)是一種利用智能體與環(huán)境的交互信息不斷地對(duì)智能體的決策策略進(jìn)行改進(jìn)的方法,隨著深度強(qiáng)化學(xué)習(xí)技術(shù)的快速發(fā)展,強(qiáng)化學(xué)習(xí)算法在無人機(jī)路徑規(guī)劃[8]、無線傳感器方案調(diào)度[9]等領(lǐng)域都取得了非常成功的應(yīng)用,同時(shí)近年來多智能體強(qiáng)化學(xué)習(xí)算法在StarCraftⅡ[10]等環(huán)境中也取得了很好的效果. 在作戰(zhàn)體系任務(wù)分配場景中,可以將各作戰(zhàn)單元視為多個(gè)決策智能體,那么“作戰(zhàn)任務(wù)—作戰(zhàn)單元”的匹配任務(wù)可以視為一個(gè)多智能體強(qiáng)化學(xué)習(xí)任務(wù).而當(dāng)前尚未有將多智能體強(qiáng)化學(xué)習(xí)方法應(yīng)用到類似作戰(zhàn)體系的任務(wù)分配環(huán)境中的先例. 本文的主要工作如下: 1）建立一個(gè)通信受限情況下的作戰(zhàn)體系“作戰(zhàn)任務(wù)—作戰(zhàn)單元”匹配的任務(wù)場景；2）提出了一個(gè)基于多智能體強(qiáng)化學(xué)習(xí)技術(shù)的作戰(zhàn)體系任務(wù)分配算法；3）通過實(shí)驗(yàn)驗(yàn)證了采用上述算法訓(xùn)練的各智能體,可以在通信受限的場景下,實(shí)現(xiàn)一定程度的自主協(xié)同,在沒有中心決策節(jié)點(diǎn)的情況下依然能夠?qū)崿F(xiàn)作戰(zhàn)體系任務(wù)的有效分配.

1 背景

1.1 集中式?jīng)Q策VS 分布式?jīng)Q策

集中式?jīng)Q策模式下存在一個(gè)中心決策節(jié)點(diǎn)來負(fù)責(zé)全局的任務(wù)決策,如圖1 所示,各作戰(zhàn)單元通過通信鏈接將自身的狀態(tài)信息和觀測信息發(fā)送給中心決策節(jié)點(diǎn),中心決策節(jié)點(diǎn)進(jìn)行全局的決策后,將決策命令發(fā)送給各作戰(zhàn)單元去執(zhí)行. 與集中式?jīng)Q策不同,分布式?jīng)Q策模式下將不存在一個(gè)中心決策節(jié)點(diǎn)來協(xié)調(diào)各實(shí)體間的行動(dòng),而是由各實(shí)體根據(jù)自身所擁有的信息,獨(dú)立地進(jìn)行決策. 采用分布式?jīng)Q策一般是為了應(yīng)對(duì)兩種情形,一種是采用集中式?jīng)Q策需要考慮的要素過多,決策復(fù)雜度過大難以進(jìn)行有效的決策；另一種是由于決策節(jié)點(diǎn)與葉節(jié)點(diǎn)之間的通信受限或通信成本過高難以進(jìn)行有效的通信,導(dǎo)致各葉節(jié)點(diǎn)需要獨(dú)立地進(jìn)行決策.

圖1 集中式?jīng)Q策示意圖Fig.1 Schematic diagram of centralized decision-making

集中式?jīng)Q策具有分析簡單、可靠性高等優(yōu)點(diǎn),然而并不是所有的決策問題都適合采用集中式?jīng)Q策,例如在有些任務(wù)場景中不具備進(jìn)行集中式?jīng)Q策的通信條件或者通信成本過高. 在分布式系統(tǒng)中,如果不存在中心節(jié)點(diǎn)進(jìn)行全局協(xié)調(diào),那么該分布式系統(tǒng)就被稱為是自組織系統(tǒng)[11],自組織系統(tǒng)是各個(gè)子模塊根據(jù)有限的自身感知和一些預(yù)定的規(guī)則,獨(dú)立地進(jìn)行思考、決策并采取相應(yīng)的動(dòng)作,共同完成分布式系統(tǒng)的任務(wù). 典型的狼群系統(tǒng)、蟻群系統(tǒng)都屬于自適應(yīng)系統(tǒng),傳統(tǒng)的自適應(yīng)系統(tǒng)大多采用基于規(guī)則的方法進(jìn)行研究,但是這些規(guī)則的制定往往需要領(lǐng)域?qū)＜疫M(jìn)行深度參與,并且是一個(gè)不斷試錯(cuò)的過程.

強(qiáng)化學(xué)習(xí)作為一種端到端（end-to-end）的學(xué)習(xí)訓(xùn)練方法不需要領(lǐng)域?qū)＜业倪^多參與,而是通過智能體與環(huán)境的動(dòng)態(tài)交互來不斷改進(jìn)自身的決策策略.采用強(qiáng)化學(xué)習(xí)方法來解決分布式?jīng)Q策問題已經(jīng)在多個(gè)領(lǐng)域得到了成功應(yīng)用,在定向傳感器最大目標(biāo)覆蓋問題（maximum target coverage）中,XU 等將該問題抽象為一個(gè)兩層決策問題[12],其中,上層決策為各傳感器分配檢測目標(biāo),下層決策為各傳感器調(diào)整角度,之后每層決策問題均使用單智能體強(qiáng)化學(xué)習(xí)算法來進(jìn)行求解,實(shí)驗(yàn)結(jié)果表明,該方法能有效解決定向傳感器最大目標(biāo)覆蓋問題；SYKORA 基于圖神經(jīng)網(wǎng)絡(luò)和注意力機(jī)制,提出了一個(gè)用來解決多車輛路徑規(guī)劃問題（multi vehicle routing problem,MVRP）的深度神經(jīng)網(wǎng)絡(luò)模型[13],并采用強(qiáng)化學(xué)習(xí)方法對(duì)模型進(jìn)行訓(xùn)練,該模型包含一個(gè)價(jià)值迭代模塊和通信模塊,各車輛根據(jù)自身觀測信息和通信信息獨(dú)立進(jìn)行決策,結(jié)果顯示該模型可以有效解決MVRP 問題.

1.2 多智能體強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)技術(shù)已經(jīng)在多個(gè)領(lǐng)域得到了成功應(yīng)用,并取得了非常顯著的效果,包括Atari 游戲[14]、圍棋[15]等,然而上述場景多針對(duì)的是單智能體在靜態(tài)環(huán)境中的應(yīng)用,而現(xiàn)實(shí)中的很多場景都是多個(gè)智能體在動(dòng)態(tài)環(huán)境中的應(yīng)用,涉及到智能體間的復(fù)雜交互. 與單智能體強(qiáng)化學(xué)習(xí)任務(wù)相比,多智能體強(qiáng)化學(xué)習(xí)任務(wù)需要同時(shí)對(duì)多個(gè)智能體的策略進(jìn)行優(yōu)化,優(yōu)化難度顯著增強(qiáng),總結(jié)來看,多智能體強(qiáng)化學(xué)習(xí)任務(wù)主要在以下幾個(gè)方面與單智能體強(qiáng)化學(xué)習(xí)任務(wù)存在顯著區(qū)別:

1）觀測范圍的變化.在單智能體強(qiáng)化學(xué)習(xí)所解決的馬爾可夫決策過程（Markov decision problem,MDP）中,通常假定環(huán)境完全可觀測的,智能體直接從環(huán)境那里得到全局的狀態(tài)信息；而多智能體強(qiáng)化學(xué)習(xí)任務(wù)通常被建模為部分可觀測馬爾可夫決策過程（partially observable Markov decision problem,POMDP）,智能體不再擁有全局視野,而是根據(jù)一個(gè)觀測函數(shù)從全局狀態(tài)中得到自身的觀測數(shù)據(jù). 部分可觀測的假定與現(xiàn)實(shí)世界中的場景更加契合,但同時(shí)也增加了模型訓(xùn)練的難度.

2）環(huán)境的不穩(wěn)定特性（non-stationarity）. 多智能體強(qiáng)化學(xué)習(xí)的一個(gè)重要特點(diǎn)就是各智能體通常是同時(shí)進(jìn)行學(xué)習(xí)的,導(dǎo)致每個(gè)智能體所面臨的環(huán)境是非靜止的,因此,導(dǎo)致了環(huán)境的不穩(wěn)定特性. 具體地說,就是一個(gè)智能體所采取的行動(dòng)會(huì)影響其他智能體所能獲得的獎(jiǎng)勵(lì)以及狀態(tài)的變化. 因此,智能體在進(jìn)行學(xué)習(xí)時(shí)需要考慮其他智能體的行為. 環(huán)境的不穩(wěn)定特性,違背了單智能體強(qiáng)化學(xué)習(xí)算法中環(huán)境狀態(tài)的馬爾科夫特性,即個(gè)體的獎(jiǎng)勵(lì)和當(dāng)前狀態(tài)只取決于之前的狀態(tài)和所采取的行動(dòng),這也就使得在多智能體強(qiáng)化學(xué)習(xí)任務(wù)中使用傳統(tǒng)的單智能體強(qiáng)化學(xué)習(xí)算法,可能會(huì)存在算法難以收斂等問題.

多智能體強(qiáng)化學(xué)習(xí)的相關(guān)研究已經(jīng)成為了機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)研究熱點(diǎn),其中,獨(dú)立Q 學(xué)習(xí)算法（independent Q-learning,IQL）[16]是最早應(yīng)用于多智能體強(qiáng)化學(xué)習(xí)任務(wù)的算法之一,IQL 算法為每一個(gè)智能體都設(shè)置一個(gè)Q 價(jià)值函數(shù),并進(jìn)行獨(dú)立的訓(xùn)練,由于將其他的智能體視為環(huán)境中的一部分,而其他智能體又是在不斷學(xué)習(xí)進(jìn)化的,導(dǎo)致了環(huán)境的不穩(wěn)定性,因此,當(dāng)智能體的數(shù)量超過2 個(gè)時(shí),IQL 算法的性能表現(xiàn)通常較差.

近來有很多研究采用集中式訓(xùn)練和分散式執(zhí)行的模式來解決多智能體強(qiáng)化學(xué)習(xí)任務(wù),有很多研究采用Actor-Critic 算法來訓(xùn)練模型,其中,Critic 網(wǎng)絡(luò)在訓(xùn)練階段可以利用全局的狀態(tài)信息來輔助Actor網(wǎng)絡(luò)的訓(xùn)練,而在模型執(zhí)行階段,智能體的Actor 網(wǎng)絡(luò)再根據(jù)自身的觀測信息獨(dú)立地作出動(dòng)作選擇. 例如Lowe 提出的多智能體深度確定性策略算法（multi-agent deep deterministic policy gradient,MADDPG）算法[17],為每一個(gè)智能體都提供一個(gè)集中式的Critic 網(wǎng)絡(luò),這個(gè)Critic 網(wǎng)絡(luò)可以獲得所有智能體的狀態(tài)和動(dòng)作信息,然后采用深度確定性策略算法（deep deterministic policy gradient,DDPG）訓(xùn)練智能體的策略網(wǎng)絡(luò). FOERSTER 提出的基準(zhǔn)多智能體算法（counterfactual multi-agent,COMA）[18]也采用一個(gè)集中式的Critic 網(wǎng)絡(luò),此外還設(shè)計(jì)了一個(gè)基準(zhǔn)優(yōu)勢函數(shù)（counterfactual advantage function）,來評(píng)估各智能體對(duì)總體目標(biāo)的貢獻(xiàn)程度,以此解決多智能體任務(wù)的信用分配（credit assignment）問題. SUNEHAG 提出的價(jià)值分解網(wǎng)絡(luò)算法（value-decomposition networks,VDN）[19],將集中式的狀態(tài)-動(dòng)作價(jià)值函數(shù)分解為各智能體的價(jià)值函數(shù)之和,然而該方法是假定多智能體系統(tǒng)的總體價(jià)值函數(shù)可以用各智能體的價(jià)值函數(shù)之和來進(jìn)行表示,然而在大多數(shù)的任務(wù)場景中該約束條件并不能得到滿足,因此,限制了該方法的適用范圍. 針對(duì)VDN 模型所存在的問題,RASHID 提出的Q-Mix算法[20]在此基礎(chǔ)上進(jìn)行了改進(jìn),去除了集中式critic網(wǎng)絡(luò)的價(jià)值函數(shù)相加性要求,而只是對(duì)各智能體的狀態(tài)-動(dòng)作價(jià)值函數(shù)施加了單調(diào)性約束.

2 問題描述

作戰(zhàn)體系是為了完成特定的使命任務(wù)而動(dòng)態(tài)建立的. 通常,作戰(zhàn)體系的使命任務(wù)可以分解為一系列的子任務(wù),而每項(xiàng)子任務(wù)的實(shí)現(xiàn)又都需要一系列能力的支持,同時(shí)不同類型的任務(wù)對(duì)能力的需求也不同,例如對(duì)敵方目標(biāo)的打擊任務(wù)所需要的火力打擊能力的支持較多,而對(duì)敵方目標(biāo)的偵察任務(wù)所需要的偵察能力支持較多. 在通常情況下,體系設(shè)計(jì)人員會(huì)根據(jù)己方的任務(wù)能力需求,以及自身所擁有的作戰(zhàn)單元所能提供的能力值,來為各作戰(zhàn)任務(wù)分配合適的作戰(zhàn)資源,這是一種集中式的決策方法. 集中式?jīng)Q策方法的優(yōu)點(diǎn)是可以獲取全局信息,能根據(jù)已有的信息對(duì)整體作出合理的決策,集中式?jīng)Q策的方法通常能得出全局最優(yōu)解. 然而隨著馬賽克戰(zhàn)等新型作戰(zhàn)概念的應(yīng)用,未來的戰(zhàn)場環(huán)境下,由于敵方的通信干擾等因素,以及決策時(shí)效性的要求等原因,傳統(tǒng)的集中式?jīng)Q策的方式可能難以實(shí)現(xiàn),因此,需要根據(jù)各作戰(zhàn)單元根據(jù)戰(zhàn)場環(huán)境和自身狀態(tài)信息獨(dú)立地進(jìn)行決策. 由集中式?jīng)Q策向分布式?jīng)Q策方式的轉(zhuǎn)變,也更加符合邊緣作戰(zhàn)等新型作戰(zhàn)場景的構(gòu)想,邊緣節(jié)點(diǎn)將具備更高的自主決策權(quán),可以更加獨(dú)立地根據(jù)戰(zhàn)場環(huán)境的狀態(tài)調(diào)整自身的動(dòng)作.

2.1 場景描述

在一個(gè)通信受限的聯(lián)合作戰(zhàn)場景中,如圖2 所示,幾個(gè)作戰(zhàn)單元分別位于戰(zhàn)場空間中的不同位置,每個(gè)作戰(zhàn)單元都具備一定的能力,由于通信受限,作戰(zhàn)單元不能與中心決策節(jié)點(diǎn)進(jìn)行有效通信,而各實(shí)體間只能進(jìn)行有限的通信或者不能通信,因此,在進(jìn)行決策時(shí)每個(gè)作戰(zhàn)單元都只能根據(jù)自身所能獲取到的信息獨(dú)立地進(jìn)行決策. 這種分布式的決策方式可能會(huì)帶來一系列的問題,例如由于沒有中心決策節(jié)點(diǎn)來協(xié)調(diào)任務(wù)分配,各實(shí)體在進(jìn)行獨(dú)立決策時(shí)可能會(huì)出現(xiàn)多個(gè)作戰(zhàn)單元都選擇去完成同一個(gè)任務(wù),從而造成某些任務(wù)沒有作戰(zhàn)單元來完成的現(xiàn)象. 因此,希望能夠利用多智能體強(qiáng)化學(xué)習(xí)技術(shù),來為每一個(gè)作戰(zhàn)單元都訓(xùn)練出來一個(gè)能夠進(jìn)行獨(dú)立的分布式?jīng)Q策的策略網(wǎng)絡(luò),并且根據(jù)這些策略網(wǎng)絡(luò)得到的智能體策略,能夠?qū)崿F(xiàn)一定程度上的自協(xié)同.

圖2 分布式?jīng)Q策場景下的體系任務(wù)分配Fig.2 SoS task assignment in decentralized decision

2.2 狀態(tài)空間、動(dòng)作空間與獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)

上述場景中的作戰(zhàn)單元決策過程,可以被建模為一個(gè)部分可觀測的馬爾可夫決策過程. 場景中的每一個(gè)作戰(zhàn)單元都可以被視為一個(gè)決策智能體,智能體的狀態(tài)空間也即觀測空間包含自身的位置信息和能力值信息、其他智能體的位置信息,以及任務(wù)節(jié)點(diǎn)的位置信息和能力需求信息. 智能體的動(dòng)作是選擇哪一個(gè)任務(wù)節(jié)點(diǎn)作為自己的目標(biāo),因此,智能體的動(dòng)作空間是離散的.

在利用強(qiáng)化學(xué)習(xí)解決此類優(yōu)化問題時(shí),優(yōu)化目標(biāo)函數(shù)的取值,通常就可以作為強(qiáng)化學(xué)習(xí)中智能體的獎(jiǎng)勵(lì)值,確定優(yōu)化問題目標(biāo)函數(shù)的過程也就是確定強(qiáng)化學(xué)習(xí)獎(jiǎng)勵(lì)函數(shù)的過程. 在上述作戰(zhàn)體系的任務(wù)分配場景中,體系任務(wù)分配的目標(biāo)是體系中所有的任務(wù)節(jié)點(diǎn)都被分配了合適的作戰(zhàn)單元來完成,因此,該場景是一個(gè)合作型的多智能體強(qiáng)化學(xué)習(xí)任務(wù),各智能體共享一個(gè)相同的獎(jiǎng)勵(lì)值,相關(guān)獎(jiǎng)勵(lì)函數(shù)的設(shè)計(jì)可以根據(jù)任務(wù)節(jié)點(diǎn)的覆蓋程度以及任務(wù)的完成效果來進(jìn)行設(shè)計(jì):

1）如果有任意一個(gè)任務(wù)節(jié)點(diǎn)沒有被分配作戰(zhàn)單元來完成,那么獎(jiǎng)勵(lì)值-5,任務(wù)節(jié)點(diǎn)的覆蓋程度越低,則智能體所獲得的獎(jiǎng)勵(lì)值越低.

2）任務(wù)完成的效果可以根據(jù)作戰(zhàn)單元與任務(wù)節(jié)點(diǎn)的距離,以及作戰(zhàn)單元的能力取值與任務(wù)實(shí)體的能力需求的匹配程度來確定. 作戰(zhàn)單元與任務(wù)節(jié)點(diǎn)的距離越小,任務(wù)完成的時(shí)效性越高,智能體獲得的獎(jiǎng)勵(lì)值相應(yīng)也越高,同時(shí)任務(wù)節(jié)點(diǎn)的能力需求與作戰(zhàn)單元所能提供的能力值匹配度越高,則任務(wù)完成的效果越好,相應(yīng)地智能體所能獲得的獎(jiǎng)勵(lì)值越多.

智能體i 所包含的信息可以用一個(gè)元組進(jìn)行表示＜（xi,yi,hi）,ci1,ci2,…,cin＞,其中,（xi,yi,hi）表示智能體i 當(dāng)前所處的位置坐標(biāo),ci1則表示智能體i 在能力1 上的取值,n 為能力類型的數(shù)量. 同時(shí)任務(wù)節(jié)點(diǎn)j包含的信息也可以用一個(gè)元組來表示＜（xi,yi,hi）,ci1′,ci2′,…,cin′＞,（xi,yi,hi）表示任務(wù)節(jié)點(diǎn)j 的位置坐標(biāo),ci1′表示任務(wù)節(jié)點(diǎn)j 對(duì)能力1 的需求. 那么智能體i 與任務(wù)節(jié)點(diǎn)j 之間的距離可以根據(jù)兩者的坐標(biāo)計(jì)算得到,如式（1）所示,智能體與任務(wù)節(jié)點(diǎn)j 的能力匹配值effij也可以根據(jù)式（2）計(jì)算得到,其中,cij表示能力匹配系數(shù). 對(duì)于任意一項(xiàng)能力來說,智能體i 所能提供的能力值與任務(wù)節(jié)點(diǎn)j 的能力需求值之間的比值越大,說明采用智能體來完成任務(wù)在該項(xiàng)能力上取得的效果越好,將各項(xiàng)能力的效果進(jìn)行累加,可以得到完成該任務(wù)的整體效果評(píng)估結(jié)果,累加得到的取值越大,則該項(xiàng)任務(wù)的整體完成效果越好；同時(shí)考慮如果智能體所提供的所有能力值都大于該任務(wù)節(jié)點(diǎn)的需求值,那么表示該任務(wù)節(jié)點(diǎn)的所有需求都得到了較好的滿足,則將上述累加得到的匹配值乘以一個(gè)系數(shù)2,而如果有一項(xiàng)智能體所提供的能力值小于任務(wù)節(jié)點(diǎn)的需求值,則認(rèn)為任務(wù)節(jié)點(diǎn)的需求沒有得到很好的滿足,因此,將上述累加得到的匹配值乘以一個(gè)系數(shù)1/2,如式（3）所示.

各智能體獨(dú)立地進(jìn)行決策后輸出的決策結(jié)果共同構(gòu)成一個(gè)完整的體系任務(wù)分配方案a=（a1,a2,…,aN）,其中,ai表示智能體i 的決策結(jié)果,也即該智能體的目標(biāo)任務(wù)節(jié)點(diǎn)的索引,N 為智能體的數(shù)量.

各智能體獎(jiǎng)勵(lì)函數(shù)的設(shè)計(jì)如式（4）所示,其中,rewd為各智能體與任務(wù)節(jié)點(diǎn)距離的倒數(shù),rewe為各智能體與任務(wù)節(jié)點(diǎn)的能力匹配之和,n0為沒有被分配對(duì)應(yīng)的作戰(zhàn)單元任務(wù)節(jié)點(diǎn)的數(shù)量.

在上述作戰(zhàn)體系任務(wù)分配場景中,所有的智能體共享同一個(gè)獎(jiǎng)勵(lì)值,各智能體的決策目標(biāo)就是使得該獎(jiǎng)勵(lì)值最大化.

3 基于MADDPG 算法的作戰(zhàn)體系任務(wù)分配模型

依據(jù)生成數(shù)據(jù)的策略和進(jìn)行評(píng)估的策略是否相同,強(qiáng)化學(xué)習(xí)算法可以分為在線（on-policy）算法和離線（off-policy）算法,on-policy 算法例如優(yōu)勢動(dòng)作評(píng)論算法（advantage actor critic,A2C）、置信域策略優(yōu)化算法（trust region policy optimization,TRPO）中,用于生成數(shù)據(jù)的策略和進(jìn)行評(píng)估的策略是相同的,每個(gè)批次用于評(píng)估的數(shù)據(jù)都是由當(dāng)前最新的策略網(wǎng)絡(luò)新生成的并且數(shù)據(jù)用完就丟棄,而off-policy 算法例如DDPG 算法、軟演員-評(píng)論家算法（soft actor-critic,SAC）算法,則是將智能體每次與環(huán)境的交互數(shù)據(jù)存放在一個(gè)名為經(jīng)驗(yàn)回放池（replay buffer）的結(jié)構(gòu)中,模型每次進(jìn)行訓(xùn)練時(shí),就從數(shù)據(jù)經(jīng)驗(yàn)回放池中取出一定數(shù)量的訓(xùn)練樣本進(jìn)行參數(shù)更新. 由于采用經(jīng)驗(yàn)回放機(jī)制在每次訓(xùn)練時(shí)是隨機(jī)抽取不同訓(xùn)練周期的數(shù)據(jù),因此,可以消除樣本之間關(guān)聯(lián)性的影響,同時(shí)在強(qiáng)化學(xué)習(xí)任務(wù)中,訓(xùn)練交互數(shù)據(jù)通常是比較寶貴的,如果每條數(shù)據(jù)只能被利用一次則是對(duì)訓(xùn)練數(shù)據(jù)的嚴(yán)重浪費(fèi),采用經(jīng)驗(yàn)回放機(jī)制還能夠提高樣本的利用效率,加快模型的訓(xùn)練速度,尤其是在多智能體的強(qiáng)化學(xué)習(xí)訓(xùn)練任務(wù)中,各智能體與環(huán)境的交互數(shù)據(jù)更顯寶貴. 因此,在多智能體強(qiáng)化學(xué)習(xí)中多采用offpolicy 算法進(jìn)行模型訓(xùn)練,例如著名的MADDPG 算法及其諸多變種,都屬于多智能體領(lǐng)域的off-policy強(qiáng)化學(xué)習(xí)算法.

但是經(jīng)典的MADDPG 算法并不能直接應(yīng)用到體系的“作戰(zhàn)任務(wù)—作戰(zhàn)單元”匹配任務(wù)中來,主要是兩個(gè)原因,一個(gè)是MADDPG 算法,它是專門為連續(xù)動(dòng)作空間任務(wù)所設(shè)計(jì)的,而體系的任務(wù)分配場景中各智能體都是離散型的動(dòng)作空間,因此,需要對(duì)算法進(jìn)行一定的修改,使得修改后的算法可以應(yīng)用于離散型動(dòng)作空間的問題；另一個(gè)原因是當(dāng)前MADDPG算法所解決的問題都是多步?jīng)Q策問題,也即每個(gè)智能體最后輸出的是一個(gè)動(dòng)作序列ai=（ai1,ai2,…,ait）,這樣在進(jìn)行網(wǎng)絡(luò)參數(shù)訓(xùn)練時(shí)智能體i 就可以利用數(shù)據(jù)組（si,ai,ri,si′）進(jìn)行梯度計(jì)算,而體系“作戰(zhàn)任務(wù)—作戰(zhàn)單元”匹配任務(wù),是屬于單步?jīng)Q策問題每個(gè)智能體最終輸出的動(dòng)作只有一個(gè)而非一個(gè)序列,智能體所生成的訓(xùn)練數(shù)據(jù)組為（si,ai,ri）缺少了智能體的下一步狀態(tài)si′,因此,需要對(duì)智能體的策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)的損失函數(shù)計(jì)算方法進(jìn)行一定的修改,使得該方法可以應(yīng)用到單步?jīng)Q策問題中來.

MADDPG 算法是用來解決連續(xù)動(dòng)作空間的強(qiáng)化學(xué)習(xí)任務(wù)的,當(dāng)智能體的動(dòng)作空間是離散時(shí),通常采用的是利用argmax 函數(shù)將具備最大輸出概率的動(dòng)作節(jié)點(diǎn)作為神經(jīng)網(wǎng)絡(luò)的輸出,但是由于argmax 函數(shù)不滿足多元函數(shù)連續(xù)且具有偏導(dǎo)數(shù)的條件,因此,argmax 函數(shù)是不可導(dǎo)的,這樣神經(jīng)網(wǎng)絡(luò)就無法計(jì)算梯度并采用反向傳播的機(jī)制進(jìn)行參數(shù)學(xué)習(xí),此外argmax 函數(shù)的輸出不具備隨機(jī)性,函數(shù)的輸出每次都是將最大值的節(jié)點(diǎn)輸出,忽略了該數(shù)據(jù)作為概率的屬性. 采用Gumbel-softmax 方法可以根據(jù)輸入向量生成一組離散的概率分布向量[21],以此來解決上述問題.

采用Gumbel-softmax 方法生成離散的概率分布向量的算法流程如下所示.

1）給定的神經(jīng)網(wǎng)絡(luò)輸出為一個(gè)n 維的向量v,首先生成n 個(gè)服從均勻分布U（0,1）的獨(dú)立樣本ε1,ε2,…,εn.

2）之后通過Gi=-log（-log（εi））計(jì)算得到Gi.

3）將向量v 中的元素與對(duì)應(yīng)的隨機(jī)向量Gi相加后得到新的值向量v′=[v1+G1,v2+G2,…,vn+Gn].

4）通過softmax 函數(shù)計(jì)算得到各類別的選擇概率,如式（7）所示,其中,為溫度參數(shù),該參數(shù)控制著softmax 函數(shù)的soft 程度,溫度越高所生成的分布越平滑（探索性越強(qiáng)）,溫度越低則生成的分布越接近離散的one-hot 分布,因此,在訓(xùn)練過程中,可以逐步降低該溫度的大小,以逐步逼近真實(shí)的離散分布.

MADDPG 算法在解決多步?jīng)Q策的強(qiáng)化學(xué)習(xí)任務(wù)時(shí),利用一個(gè)價(jià)值網(wǎng)絡(luò)來計(jì)算智能體i 在當(dāng)前狀態(tài)的Q 值Qsi和下一步狀態(tài)的Q 值Qsi′,并利用ri+Qsi與Qsi′進(jìn)行對(duì)比來計(jì)算策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)的損失值,在單步?jīng)Q策中,由于沒有下步狀態(tài)si′的存在,將價(jià)值網(wǎng)絡(luò)的評(píng)估值從Q 值估計(jì)值轉(zhuǎn)變?yōu)楠?jiǎng)勵(lì)值ri的估計(jì)值,那么可以用ri與Qsi進(jìn)行對(duì)比來計(jì)算策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)的損失值,以此來對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行更新.

3.1 基于MADDPG 體系任務(wù)分配算法框架

采用修改后的MADDPG 算法來解決體系的“任務(wù)—作戰(zhàn)單元”匹配任務(wù)時(shí),每個(gè)智能體都有一個(gè)策略（actor）網(wǎng)絡(luò)和一個(gè)價(jià)值（critic）網(wǎng)絡(luò),其中,策略網(wǎng)絡(luò)可以根據(jù)智能體的觀測信息,快速輸出一個(gè)能夠使得智能體獲得最大預(yù)期收益的動(dòng)作,而智能體的價(jià)值網(wǎng)絡(luò)則只在模型訓(xùn)練階段出現(xiàn),用來對(duì)智能體策略網(wǎng)絡(luò)輸出的動(dòng)作進(jìn)行評(píng)價(jià),并以此來輔助智能體策略網(wǎng)絡(luò)參數(shù)的訓(xùn)練. 模型訓(xùn)練階段的總體框架如圖3 所示,圖中實(shí)線表示產(chǎn)生訓(xùn)練數(shù)據(jù)的過程,虛線表示模型訓(xùn)練的過程,在產(chǎn)生訓(xùn)練數(shù)據(jù)階段,智能體i 從環(huán)境中獲得自身的觀測數(shù)據(jù)oi并輸入給策略網(wǎng)絡(luò)πi,策略網(wǎng)絡(luò)根據(jù)輸入的信息生成一個(gè)動(dòng)作ai作為智能體i 的輸出,之后所有的智能體都將自身的動(dòng)作輸入到環(huán)境中,環(huán)境反饋給各智能體一個(gè)獎(jiǎng)勵(lì)值r=（r1,r2,…,rN）,然后各智能體將生成的數(shù)據(jù)組（si,ai,ri）存儲(chǔ)到經(jīng)驗(yàn)回放池中供下一步的模型訓(xùn)練,其中,si表示智能體i 的狀態(tài),包含智能體i 自身的信息以及從環(huán)境中觀測到的信息；在進(jìn)行模型訓(xùn)練時(shí),從經(jīng)驗(yàn)回放池中抽取一定數(shù)量的數(shù)據(jù),并利用抽取的數(shù)據(jù)計(jì)算各智能體價(jià)值網(wǎng)絡(luò)Qi的梯度,并根據(jù)采樣數(shù)據(jù)和價(jià)值網(wǎng)絡(luò)的取值計(jì)算各智能體策略網(wǎng)絡(luò)的梯度,之后根據(jù)所計(jì)算得到的網(wǎng)絡(luò)梯度對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行更新.

圖3 基于MADDPG 的體系任務(wù)分配算法框架Fig.3 SoS task assignment algorithm based on MADDPG

值得注意的是,采用集中式訓(xùn)練的方法,在訓(xùn)練階段的價(jià)值網(wǎng)絡(luò),能夠獲取全局的狀態(tài)信息和動(dòng)作信息作為網(wǎng)絡(luò)的輸入,在體系任務(wù)分配的場景中就是將所有智能體的觀測信息和動(dòng)作信息一并作為各價(jià)值網(wǎng)絡(luò)的輸入信息,如圖4 所示,智能體1 的價(jià)值網(wǎng)絡(luò)1 就是將智能體1～N 的觀測信息和動(dòng)作信息作為輸入信息,并輸出智能體1 在觀測數(shù)據(jù)為o1時(shí)采取動(dòng)作a1的Q 值Q1.

當(dāng)模型訓(xùn)練完之后,智能體的價(jià)值網(wǎng)絡(luò)就被丟棄了,在模型應(yīng)用階段,智能體可以利用自身的策略網(wǎng)絡(luò)根據(jù)從環(huán)境中觀測到的信息,快速得到一個(gè)能夠使自身獲得最大預(yù)期收益的動(dòng)作,各智能體的動(dòng)作構(gòu)成了體系“任務(wù)—作戰(zhàn)單元”匹配任務(wù)的聯(lián)合動(dòng)作a=（a1,a2,…,aN）,如圖5 所示,將該聯(lián)合動(dòng)作輸入到環(huán)境中后,各智能體可以得到一個(gè)獎(jiǎng)勵(lì)值來對(duì)自身所采取的動(dòng)作進(jìn)行評(píng)價(jià).

3.2 actor 網(wǎng)絡(luò)結(jié)構(gòu)

智能體的策略網(wǎng)絡(luò)結(jié)構(gòu)如圖6 所示,智能體i 的策略網(wǎng)絡(luò)的輸入是該智能體的觀測信息oi,包含智能體i 自身的位置信息、狀態(tài)信息、其他智能體相對(duì)于智能體i 的位置距離,以及任務(wù)節(jié)點(diǎn)的位置信息和能力需求信息,輸入信息經(jīng)過多層神經(jīng)網(wǎng)絡(luò)處理后輸出一個(gè)維度為任務(wù)節(jié)點(diǎn)個(gè)數(shù)的向量,之后經(jīng)過Gumbel-softmax 方法處理后得到各任務(wù)節(jié)點(diǎn)的選擇概率,最后選擇概率最大的節(jié)點(diǎn)作為智能體i 在觀測信息為oi時(shí)的動(dòng)作選擇結(jié)果.

圖6 actor 網(wǎng)絡(luò)結(jié)構(gòu)Fig.6 Actor network structure

3.3 critic 網(wǎng)絡(luò)結(jié)構(gòu)

智能體的價(jià)值網(wǎng)絡(luò)結(jié)構(gòu)如圖7 所示,智能體i 的價(jià)值網(wǎng)絡(luò)的輸入包含所有智能體的觀測信息o=（o1,o2,…,oN）和動(dòng)作選擇信息a=（a1,a2,…,aN）,同樣的,策略網(wǎng)絡(luò)的輸入信息經(jīng)過多層神經(jīng)網(wǎng)絡(luò)處理后輸出一個(gè)維度為1 的向量,該向量的取值就是各個(gè)智能體在觀測信息為o 且動(dòng)作選擇結(jié)果為a 時(shí)的獎(jiǎng)勵(lì)估計(jì)值.

圖7 critic 網(wǎng)絡(luò)結(jié)構(gòu)Fig.7 Critic network structure

基于MADDPG 的體系任務(wù)分配算法如算法1 所示. 當(dāng)模型訓(xùn)練完成后,各智能體就可以獨(dú)立地根據(jù)自身的觀測信息對(duì)體系任務(wù)進(jìn)行高效的分配.

4 實(shí)驗(yàn)

4.1 對(duì)比算法設(shè)置

算法1 基于MADDPG 的體系“任務(wù)-作戰(zhàn)單元”匹配任務(wù)強(qiáng)化學(xué)習(xí)訓(xùn)練算法輸入: 初始化各智能體策略網(wǎng)絡(luò)的參數(shù)θ=（θ1,…,θN）和價(jià)值網(wǎng)絡(luò)參數(shù)?=（?1,…,?N）輸出: 訓(xùn)練后的最優(yōu)參數(shù)θ*,?*1: for iep←1,2,…maxeposide do 2: 重置環(huán)境,得到每個(gè)智能體的觀測向量o=（o1,o2,…,oN）3: 根據(jù)各智能體的策略網(wǎng)絡(luò)得到各智能體的動(dòng)作ai～πi（·|oi）4: 將聯(lián)合動(dòng)作a=（a1,a2,…,aN）輸入到環(huán)境中,得到反饋的獎(jiǎng)勵(lì)值r=（r1,r2,…,rN）5: 將各智能體的數(shù)據(jù)元組（si,ai,ri）存儲(chǔ)到數(shù)據(jù)池D 中6: if iep ＞最小參數(shù)更新間隔:7:從D 中采樣出一個(gè)批次的數(shù)據(jù)樣本B 8:for agent i=1 to N:9:計(jì)算各智能體的策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)的梯度值:10:dθi←1 aiQiπ（ok,a）11:d?i←1 k=1E o～D,a～πΔ n ∑n θiπi（oik）Δ n ∑n k=1E（o,a,r）～D（rik-Qi?（o,a））2 12:for agent i=1 to N:13:更新各智能體的策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)的參數(shù):14:θi←（1-η）θi+η*Adam（dθi）15:?i←（1-η）?i+η*Adam（d?i）16: end for

為了驗(yàn)證集中式訓(xùn)練模式下的多智能體強(qiáng)化學(xué)習(xí)算法在分布式?jīng)Q策環(huán)境下,面對(duì)體系“作戰(zhàn)任務(wù)—作戰(zhàn)單元”匹配任務(wù)時(shí)的有效性,選擇分布式訓(xùn)練的多智能體強(qiáng)化學(xué)習(xí)算法作為對(duì)比算法. 集中式訓(xùn)練的多智能體強(qiáng)化學(xué)習(xí)算法與分布式訓(xùn)練的智能體強(qiáng)化學(xué)習(xí)算法最大的不同就是,集中式訓(xùn)練的多智能體強(qiáng)化學(xué)習(xí)算法是采用集中式訓(xùn)練分布式執(zhí)行的模式,智能體的價(jià)值網(wǎng)絡(luò)在訓(xùn)練階段可以獲取全局狀態(tài)信息來輔助智能體策略網(wǎng)絡(luò)的訓(xùn)練；而分布式訓(xùn)練的多智能體強(qiáng)化學(xué)習(xí)算法則是采用分布式訓(xùn)練分布式執(zhí)行的模式,各智能體都將其他智能體視為環(huán)境的一部分,無論是在模型訓(xùn)練階段還是模型執(zhí)行階段,都是獨(dú)立地根據(jù)自身的觀測信息進(jìn)行獨(dú)立決策.

4.2 實(shí)驗(yàn)環(huán)境

本文設(shè)計(jì)了一個(gè)通信受限條件下的體系“任務(wù)—作戰(zhàn)單元”匹配的任務(wù)場景,在該任務(wù)場景中,設(shè)計(jì)體系中擁有相同數(shù)量的作戰(zhàn)單元節(jié)點(diǎn)和作戰(zhàn)任務(wù)節(jié)點(diǎn),各作戰(zhàn)單元和作戰(zhàn)任務(wù)節(jié)點(diǎn)分別位于場景中一個(gè)隨機(jī)生成的位置上,該位置的坐標(biāo)在[-1,+1]×[-1,+1]×[-1,+1]范圍內(nèi)隨機(jī)生成,此外每個(gè)作戰(zhàn)單元都擁有3 種類型能力,各能力的取值采用均勻分布的形式在一定的數(shù)據(jù)范圍內(nèi)隨機(jī)生成,同樣的每個(gè)任務(wù)目標(biāo)也有一定的能力需求對(duì)應(yīng)于作戰(zhàn)單元所能提供的3 種能力,任務(wù)目標(biāo)的能力需求也采用均勻分布的形式在一定的數(shù)據(jù)范圍內(nèi)隨機(jī)生成. 由于敵方通信干擾等因素的影響,各作戰(zhàn)單元間不能進(jìn)行通信,同時(shí)場景中也不存在一個(gè)中心決策節(jié)點(diǎn)來協(xié)調(diào)各作戰(zhàn)單元的決策,因此,各作戰(zhàn)單元需要根據(jù)自身的狀態(tài)信息和觀測信息獨(dú)立地進(jìn)行決策,決策內(nèi)容是選擇哪一個(gè)任務(wù)目標(biāo)作為自己的目標(biāo)節(jié)點(diǎn). 由于所設(shè)計(jì)的體系任務(wù)分配場景屬于是合作型的任務(wù),各作戰(zhàn)單元希望通過合作達(dá)到體系總體決策效果最優(yōu),因此,將各作戰(zhàn)單元的任務(wù)分配整體效果作為各智能體的獎(jiǎng)勵(lì)值.

所有算法都采用Python 進(jìn)行實(shí)現(xiàn),并在同一臺(tái)配置了Geforce RTX3090 顯卡、Intel 16-Core i9-11900K CPU 的計(jì)算機(jī)上運(yùn)行. 基于MADDPG 算法的體系任務(wù)分配模型網(wǎng)絡(luò)主要超參數(shù)如表1 所示,為了保證一致,對(duì)比算法DDPG 采用相同的網(wǎng)絡(luò)參數(shù).

表1 模型網(wǎng)絡(luò)超參數(shù)Table 1 Hyperparameters of model network

4.3 實(shí)驗(yàn)結(jié)果分析

集中式訓(xùn)練的多智能體強(qiáng)化學(xué)習(xí)算法和分布式訓(xùn)練的多智能體強(qiáng)化學(xué)習(xí)算法,在解決體系的“任務(wù)—作戰(zhàn)單元”匹配任務(wù)時(shí)的模型訓(xùn)練曲線如圖8 和圖9 所示,橫坐標(biāo)表示訓(xùn)練的回合數(shù),縱坐標(biāo)表示智能體得到的平均獎(jiǎng)勵(lì)值. 可以看到,隨著訓(xùn)練進(jìn)程的推進(jìn),采用集中式訓(xùn)練的多智能體強(qiáng)化學(xué)習(xí)算法進(jìn)行訓(xùn)練的智能體所得到的獎(jiǎng)勵(lì)值不斷增大,最終穩(wěn)定在0.6 左右的水平,曲線收斂. 在模型訓(xùn)練剛開始的時(shí)候,智能體所得到的獎(jiǎng)勵(lì)值是小于0 的,也就是智能體還沒有學(xué)會(huì)與其他智能體進(jìn)行任務(wù)協(xié)同分配,導(dǎo)致體系的任務(wù)分配出現(xiàn)有的任務(wù)被多個(gè)智能體選擇,而有的任務(wù)沒有被選擇的現(xiàn)象,而隨著訓(xùn)練進(jìn)程的推進(jìn),由于環(huán)境反饋?zhàn)饔玫挠绊?智能體逐漸學(xué)會(huì)了與其他智能體進(jìn)行任務(wù)協(xié)同分配,即使在沒有中心決策節(jié)點(diǎn)進(jìn)行協(xié)調(diào)的情況下,各智能體依然能夠根據(jù)自身的狀態(tài)信息和觀測到的信息,采用分布式?jīng)Q策的方式獨(dú)立地作出使得體系的效能最大的任務(wù)分配方案. 相對(duì)應(yīng)地,采用分布式訓(xùn)練的多智能體強(qiáng)化學(xué)習(xí)算法得到的獎(jiǎng)勵(lì)值始終為負(fù)數(shù),表示智能體沒有學(xué)會(huì)上述任務(wù)協(xié)同分配策略,隨著訓(xùn)練進(jìn)程的推進(jìn),各智能體沒有學(xué)會(huì)如何與其他智能體合作任務(wù)分配,主要原因是分布式訓(xùn)練模式下的多智能體強(qiáng)化學(xué)習(xí)算法中,智能體是將其他智能體視為環(huán)境的一部分,由于智能體的決策策略是在不斷改進(jìn)變化的,從而導(dǎo)致了環(huán)境的不穩(wěn)定性,而采用集中式訓(xùn)練分布式執(zhí)行模式的多智能體強(qiáng)化學(xué)習(xí)算法,在一定程度上緩解了環(huán)境不穩(wěn)定性所帶來的影響. 從上述實(shí)驗(yàn)結(jié)果來看,采用集中式訓(xùn)練分布式執(zhí)行模式的多智能體強(qiáng)化學(xué)習(xí)算法,來訓(xùn)練智能體在通信受限的場景下進(jìn)行分布式?jīng)Q策是有效的.

圖8 集中式訓(xùn)練的多智能體強(qiáng)化學(xué)習(xí)算法訓(xùn)練的智能體平均獎(jiǎng)勵(lì)曲線Fig.8 Mean reward curve of agent trained by centralized training multi-agent reinforcement learning algorithm

圖9 分布式訓(xùn)練的多智能體強(qiáng)化學(xué)習(xí)算法訓(xùn)練的智能體平均獎(jiǎng)勵(lì)曲線Fig.9 Mean reward curve of agent trained by decentralized training multi-agent reinforcement learning algorithm

5 結(jié)論

隨著軍事裝備的快速發(fā)展,以及戰(zhàn)場環(huán)境的復(fù)雜多變,傳統(tǒng)的集中式?jīng)Q策模式越來越難以適應(yīng)未來戰(zhàn)爭的需求,邊緣作戰(zhàn)單元根據(jù)自身的狀態(tài)信息和觀測信息獨(dú)立地進(jìn)行決策將更加常見.

本文設(shè)計(jì)了一個(gè)在通信受限的場景下,作戰(zhàn)體系的“任務(wù)—作戰(zhàn)單元”匹配體系設(shè)計(jì)任務(wù),并基于多智能體強(qiáng)化學(xué)習(xí)技術(shù),提出了一個(gè)基于MADDPG算法的體系任務(wù)分配模型,該模型針對(duì)體系設(shè)計(jì)場景中的離散動(dòng)作空間,以及單步?jīng)Q策等問題進(jìn)行了相應(yīng)改進(jìn),并采用集中式訓(xùn)練和分布式執(zhí)行的模式,在模型訓(xùn)練階段各智能體的價(jià)值網(wǎng)絡(luò)將能夠獲取全局狀態(tài)信息來輔助策略網(wǎng)絡(luò)的訓(xùn)練,而在模型運(yùn)行階段,各智能體只需要根據(jù)自身的觀測信息就能快速獨(dú)立地進(jìn)行決策. 實(shí)驗(yàn)結(jié)果顯示,與分布式訓(xùn)練的多智能體強(qiáng)化學(xué)習(xí)算法相比,采用集中式訓(xùn)練的多智能體強(qiáng)化學(xué)習(xí)算法訓(xùn)練出來的各智能體,在進(jìn)行分布式?jīng)Q策時(shí)具備更高的協(xié)同能力,所作出的體系任務(wù)分配方案效率更高.

猜你喜歡

集中式決策節(jié)點(diǎn)

CM節(jié)點(diǎn)控制在船舶上的應(yīng)用

機(jī)械工業(yè)標(biāo)準(zhǔn)化與質(zhì)量(2022年6期)2022-08-12 02:07:42

為可持續(xù)決策提供依據(jù)

紡織科學(xué)研究(2021年9期)2021-10-14 08:52:10

Analysis of the characteristics of electronic equipment usage distance for common users

國際眼科雜志(2021年9期)2021-09-15 03:24:42

基于AutoCAD的門窗節(jié)點(diǎn)圖快速構(gòu)建

裝備制造技術(shù)(2020年2期)2020-12-14 03:09:16

決策為什么失誤了

中學(xué)生數(shù)理化·七年級(jí)數(shù)學(xué)人教版(2019年6期)2019-06-25 01:01:34

光伏：分布式新增裝機(jī)規(guī)模首次超越集中式

能源(2018年8期)2018-09-21 07:57:16

組串式、集中式逆變器的評(píng)估選定淺析

電子測試(2017年23期)2017-04-04 05:07:46

接觸網(wǎng)隔離開關(guān)集中式控制方案研究

電氣化鐵道(2016年5期)2016-04-16 05:59:55

光伏集中式逆變器與組串式逆變器

工業(yè)設(shè)計(jì)(2016年10期)2016-04-16 02:44:12

抓住人才培養(yǎng)的關(guān)鍵節(jié)點(diǎn)

中國衛(wèi)生(2015年12期)2015-11-10 05:13:34

指揮與控制學(xué)報(bào)2023年1期

指揮與控制學(xué)報(bào)的其它文章: 專題導(dǎo)讀軍事智能時(shí)代的集成科學(xué); 基于空間分塊的CGF注意力感知方法; 飛機(jī)檢查單的OPM軍事概念模型; 基于知識(shí)圖譜的仿真想定智能生成方法; 基于可計(jì)算任務(wù)樹的人機(jī)混合智能任務(wù)規(guī)劃新范式; 一種基于人機(jī)融合的態(tài)勢認(rèn)知模型

感谢您访问我们的网站，您可能还对以下资源感兴趣：

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看网站地图

亚洲中文字幕一区二区三区有码在线看 22中文网久久字幕搞女人的毛片 18禁动态无遮挡网站免费大片18禁欧美潮喷喷水亚洲色图av天堂亚洲三级黄色毛片 18禁裸乳无遮挡免费网站照片国产av不卡久久亚洲国产欧美在线一区老师上课跳d突然被开到最大视频啦啦啦啦在线视频资源国产免费福利视频在线观看午夜视频国产福利国产精品久久电影中文字幕十八禁国产超污无遮挡网站蜜桃久久精品国产亚洲av 十八禁国产超污无遮挡网站成人亚洲欧美一区二区av av国产免费在线观看乱码一卡2卡4卡精品亚洲国产欧美人成日本色播在线视频国产精品一区二区在线观看99 好男人在线观看高清免费视频男的添女的下面高潮视频噜噜噜噜噜久久久久久91 日日摸夜夜添夜夜爱黄色日韩在线色综合亚洲欧美另类图片超碰av人人做人人爽久久国产在视频线在精品淫秽高清视频在线观看尾随美女入室神马国产精品三级电影在线观看国产69精品久久久久777片综合色丁香网色视频www国产美女cb高潮喷水在线观看日韩在线高清观看一区二区三区禁无遮挡网站秋霞在线观看毛片日韩欧美精品免费久久国产又色又爽无遮挡免午夜老司机福利剧场精品国产三级普通话版国产淫语在线视频国产淫语在线视频国产一区有黄有色的免费视频 26uuu在线亚洲综合色少妇猛男粗大的猛烈进出视频 91av网一区二区大又大粗又爽又黄少妇毛片口 .国产精品久久七月丁香在线播放亚洲国产欧美人成国产极品天堂在线久久99热这里只有精品18 午夜福利成人在线免费观看久久久久久久久久久免费av 免费av毛片视频搡老妇女老女人老熟妇 97超碰精品成人国产 a级毛色黄片国产一区二区亚洲精品在线观看边亲边吃奶的免费视频亚洲不卡免费看国产又黄又爽又无遮挡在线国产精品1区2区在线观看. 婷婷六月久久综合丁香欧美变态另类bdsm刘玥国产精品福利在线免费观看国产精品精品国产色婷婷免费观看精品视频网站国产国拍精品亚洲av在线观看免费观看的影片在线观看 1000部很黄的大片简卡轻食公司亚洲人成网站在线播亚洲美女搞黄在线观看五月伊人婷婷丁香亚洲精品乱码久久久久久按摩 22中文网久久字幕 99在线视频只有这里精品首页一边摸一边抽搐一进一小说亚洲久久久久久中文字幕一级爰片在线观看 av天堂中文字幕网 91精品伊人久久大香线蕉国产av不卡久久 99在线人妻在线中文字幕成人午夜高清在线视频欧美三级亚洲精品亚洲欧美精品综合久久99 国模一区二区三区四区视频亚洲精品,欧美精品三级国产精品欧美在线观看欧美人与善性xxx 欧美3d第一页 18禁在线无遮挡免费观看视频美女cb高潮喷水在线观看身体一侧抽搐国产精品久久久久久精品电影国产黄片视频在线免费观看日韩成人伦理影院欧美zozozo另类高清午夜精品一区二区三区好男人视频免费观看在线国产伦一二天堂av在线观看男的添女的下面高潮视频女人被狂操c到高潮赤兔流量卡办理一区二区三区四区激情视频麻豆av噜噜一区二区三区国产伦在线观看视频一区国产精品福利在线免费观看午夜亚洲福利在线播放秋霞在线观看毛片国产黄a三级三级三级人在线免费观看不下载黄p国产国产成人精品一,二区天天躁日日操中文字幕边亲边吃奶的免费视频亚洲性久久影院国产在线一区二区三区精免费不卡的大黄色大毛片视频在线观看熟妇人妻久久中文字幕3abv 99久久九九国产精品国产免费直男gayav资源 91在线精品国自产拍蜜月国产视频首页在线观看成年版毛片免费区亚洲人成网站在线观看播放久久99热这里只有精品18 久久久久久久久久久丰满国产乱人偷精品视频久久久久精品久久久久真实原创 av在线蜜桃九九在线视频观看精品国产真实乱freesex 一个人观看的视频www高清免费观看国产成人精品婷婷人人妻人人澡人人爽人人夜夜干丝袜人妻中文字幕欧美成人精品欧美一级黄精品99又大又爽又粗少妇毛片欧美精品一区二区大全国产av在哪里看 99视频精品全部免费在线亚洲在线自拍视频好男人视频免费观看在线在线播放国产精品三级联通29元200g的流量卡 a级毛色黄片 kizo精华嫩草影院入口久久久色成人亚洲av成人精品一区久久 99热这里只有是精品50 99久久精品国产国产毛片欧美bdsm另类精品国产一区二区三区久久久樱花精品一区二区三区视频在线免费观看性生交大片5 亚洲国产高清在线一区二区三 18禁裸乳无遮挡免费网站照片色吧在线观看欧美zozozo另类 99久久精品一区二区三区精品一区二区三区人妻视频热99在线观看视频国产黄色小视频在线观看久久久久免费精品人妻一区二区中文在线观看免费www的网站国产精品人妻久久久久久国产精品.久久久男女国产视频网站高清毛片免费看国产成人福利小说国产乱人视频国产伦精品一区二区三区视频9 国产精品无大码特级一级黄色大片午夜激情福利司机影院淫秽高清视频在线观看精品不卡国产一区二区三区国产午夜精品一二区理论片级片在线观看亚洲久久久久久中文字幕最近中文字幕2019免费版女人十人毛片免费观看3o分钟午夜亚洲福利在线播放 av在线天堂中文字幕变态另类丝袜制服亚洲av二区三区四区日韩一区二区视频免费看免费看a级黄色片成人二区视频禁无遮挡网站麻豆成人午夜福利视频欧美激情国产日韩精品一区一级黄色大片毛片能在线免费观看的黄片久久精品国产亚洲av涩爱精品不卡国产一区二区三区午夜福利网站1000一区二区三区 videossex国产久久热精品热久久精品国产亚洲av涩爱亚洲精品乱码久久久久久按摩国产成人a区在线观看日本与韩国留学比较熟女人妻精品中文字幕免费无遮挡裸体视频一个人免费在线观看电影午夜激情欧美在线 99久久中文字幕三级久久日本又粗又爽又猛毛片免费看精品一区二区免费观看亚洲欧美一区二区三区国产亚洲高清免费不卡视频联通29元200g的流量卡国产精品久久久久久久久免国产一区欧美日韩成年版毛片免费区日韩av在线大香蕉日韩国内少妇激情av av在线天堂中文字幕桃色一区二区三区在线观看一区二区三区免费毛片 18禁动态无遮挡网站午夜福利高清视频麻豆乱淫一区二区午夜a级毛片国产精品久久久久久久电影在线天堂最新版资源欧美日韩精品成人综合77777 免费人成在线观看视频色亚洲在线自拍视频久久精品久久精品一区二区三区亚洲无线观看免费亚洲国产精品成人综合色男女视频在线观看网站免费色哟哟·www 久久鲁丝午夜福利片搡女人真爽免费视频火全软件欧美+日韩+精品精品一区二区三区视频在线午夜精品在线福利亚洲欧美精品专区久久亚洲av男天堂我的老师免费观看完整版 www.av在线官网国产久久久久久九九精品二区国产欧美变态另类bdsm刘玥最近最新中文字幕大全电影3 女人被狂操c到高潮日本免费在线观看一区欧美激情久久久久久爽电影 99热精品在线国产色噜噜av男人的天堂激情 2022亚洲国产成人精品成人亚洲精品av一区二区搡女人真爽免费视频火全软件熟女人妻精品中文字幕国产在线一区二区三区精 a级毛片免费高清观看在线播放欧美区成人在线视频噜噜噜噜噜久久久久久91 午夜视频国产福利精品酒店卫生间中文字幕免费在线视频6 18禁动态无遮挡网站人体艺术视频欧美日本欧美三级亚洲精品国产成人a∨麻豆精品午夜爱爱视频在线播放成人亚洲精品av一区二区一边摸一边抽搐一进一小说亚洲av成人av av专区在线播放噜噜噜噜噜久久久久久91 欧美一区二区精品小视频在线水蜜桃什么品种好国产伦一二天堂av在线观看女的被弄到高潮叫床怎么办国产亚洲91精品色在线 99在线人妻在线中文字幕国产精品国产三级专区第一集 99久久人妻综合少妇丰满av 女人久久www免费人成看片成人一区二区视频在线观看毛片一级片免费看久久久久菩萨蛮人人尽说江南好唐韦庄狂野欧美白嫩少妇大欣赏 ponron亚洲 av女优亚洲男人天堂狂野欧美白嫩少妇大欣赏欧美激情在线99 晚上一个人看的免费电影美女高潮的动态插逼视频在线观看热99在线观看视频精品久久国产蜜桃成人二区视频深夜a级毛片国产亚洲av片在线观看秒播厂欧美丝袜亚洲另类国产高清三级在线国产亚洲5aaaaa淫片日本免费在线观看一区久久久午夜欧美精品国产成人91sexporn 人妻夜夜爽99麻豆av 身体一侧抽搐一级av片app 黄片无遮挡物在线观看日本五十路高清 99热6这里只有精品亚洲图色成人 97超视频在线观看视频中文字幕亚洲精品专区婷婷色av中文字幕直男gayav资源成年女人看的毛片在线观看精品久久久久久成人av 国产综合懂色 av天堂中文字幕网亚洲怡红院男人天堂免费看日本二区永久免费av网站大全国产精品久久久久久精品电影国产色婷婷99 色哟哟·www 亚洲精华国产精华液的使用体验日本-黄色视频高清免费观看国产精品国产三级国产专区5o 九九热线精品视视频播放 ponron亚洲最近最新中文字幕免费大全7 极品教师在线视频亚洲精华国产精华液的使用体验久久精品久久久久久噜噜老黄看免费成人av毛片亚洲真实伦在线观看精品国产一区二区三区久久久樱花国产不卡一卡二亚洲av成人精品一二三区看黄色毛片网站在线天堂最新版资源熟妇人妻久久中文字幕3abv 日产精品乱码卡一卡2卡三 av线在线观看网站十八禁国产超污无遮挡网站午夜亚洲福利在线播放婷婷色麻豆天堂久久免费av不卡在线播放国产精品国产三级国产专区5o 欧美高清性xxxxhd video 欧美性感艳星久久久精品大字幕三级男女做爰猛烈吃奶摸视频色噜噜av男人的天堂激情成人鲁丝片一二三区免费亚洲精品自拍成人 av在线观看视频网站免费久久久a久久爽久久v久久亚洲国产欧美在线一区中文资源天堂在线亚洲经典国产精华液单亚洲av成人精品一区久久国产熟女欧美一区二区非洲黑人性xxxx精品又粗又长久久精品国产亚洲av涩爱一级二级三级毛片免费看亚洲国产高清在线一区二区三男人舔女人下体高潮全视频精品无人区乱码1区二区国国产精品蜜臀av免费色综合色国产高清日韩中文字幕在线亚洲欧美精品自产自拍午夜免费激情av 成年av动漫网址少妇熟女欧美另类日韩亚洲欧美综合久久国内精品自在自线图片亚洲三级黄色毛片免费在线观看成人毛片一级二级三级毛片免费看国产视频内射国产av码专区亚洲av 免费看美女性在线毛片视频国产精品永久免费网站成人三级黄色视频国产探花极品一区二区国产欧美另类精品又又久久亚洲欧美国产精品女同一区二区软件校园人妻丝袜中文字幕欧美不卡视频在线免费观看国产精品爽爽va在线观看网站中文字幕av成人在线电影我的女老师完整版在线观看免费看日本二区赤兔流量卡办理九九在线视频观看精品国产精品久久久久久久久免又粗又爽又猛毛片免费看免费搜索国产男女视频日韩一区二区视频免费看婷婷六月久久综合丁香 97超碰精品成人国产亚洲一区高清亚洲精品 av在线天堂中文字幕我的女老师完整版在线观看精品人妻熟女av久视频少妇丰满av 精品一区二区三区视频在线夫妻性生交免费视频一级片天美传媒精品一区二区欧美精品一区二区大全乱码一卡2卡4卡精品大香蕉97超碰在线一个人免费在线观看电影精品久久久久久成人av 欧美性猛交黑人性爽久久精品夜夜夜夜夜久久蜜豆深爱激情五月婷婷 99在线人妻在线中文字幕亚洲av电影不卡..在线观看 av专区在线播放亚洲精品日韩av片在线观看亚洲国产最新在线播放 av播播在线观看一区 18+在线观看网站欧美xxxx性猛交bbbb 亚洲国产精品国产精品亚洲av电影在线观看一区二区三区永久免费av网站大全亚洲人成网站在线播亚洲婷婷狠狠爱综合网久久亚洲精品不卡亚洲精品日韩av片在线观看 91精品伊人久久大香线蕉亚洲,欧美,日韩国产伦一二天堂av在线观看日韩精品青青久久久久久一区二区三区乱码不卡18 成人午夜精彩视频在线观看午夜福利网站1000一区二区三区免费观看精品视频网站久久久久久大精品日韩精品有码人妻一区亚洲人成网站在线播在线观看美女被高潮喷水网站高清日韩中文字幕在线老司机福利观看丰满人妻一区二区三区视频av 老师上课跳d突然被开到最大视频日韩亚洲欧美综合久久99热这里只有精品18 精品一区二区免费观看亚洲精品乱码久久久v下载方式国产亚洲精品久久久com 欧美另类亚洲清纯唯美男女啪啪激烈高潮av片 97热精品久久久久久大话2 男鬼变身卡一本一本综合久久 a级毛片免费高清观看在线播放亚洲av免费在线观看久久亚洲国产成人精品v 美女xxoo啪啪120秒动态图中文天堂在线官网色5月婷婷丁香 91精品一卡2卡3卡4卡自拍偷自拍亚洲精品老妇色吧在线观看日韩三级伦理在线观看国产黄色视频一区二区在线观看久久久久性生活片天堂√8在线中文国产成人精品久久久久久亚洲av日韩在线播放色综合站精品国产国产免费福利视频在线观看精品欧美国产一区二区三一个人免费在线观看电影 av卡一久久亚洲av熟女最近手机中文字幕大全免费av不卡在线播放免费观看的影片在线观看亚洲人成网站高清观看中文精品一卡2卡3卡4更新亚洲18禁久久av 夜夜看夜夜爽夜夜摸 18禁动态无遮挡网站亚洲最大成人av 精品一区二区免费观看国产在视频线在精品日日摸夜夜添夜夜爱婷婷色麻豆天堂久久你懂的网址亚洲精品在线观看 97在线视频观看国产精品综合久久久久久久免费国语自产精品视频在线第100页久久精品国产亚洲网站久久久久久九九精品二区国产欧美不卡视频在线免费观看纵有疾风起免费观看全集完整版国产精品爽爽va在线观看网站草草在线视频免费看真实男女啪啪啪动态图午夜a级毛片久久久亚洲精品成人影院国产精品乱码一区二三区的特点最后的刺客免费高清国语热99re8久久精品国产欧美极品一区二区三区四区高清在线视频一区二区三区成人综合一区亚洲 .国产精品久久国产精品蜜桃在线观看国产片特级美女逼逼视频成人二区视频久99久视频精品免费国产高清不卡午夜福利亚洲内射少妇av 你懂的网址亚洲精品在线观看国产亚洲5aaaaa淫片色噜噜av男人的天堂激情欧美日韩精品成人综合77777 免费av观看视频一区二区三区四区激情视频国产精品久久视频播放亚洲天堂国产精品一区在线亚洲在线观看片国产精品无大码听说在线观看完整版免费高清亚洲国产日韩欧美精品在线观看欧美成人一区二区免费高清观看 22中文网久久字幕亚洲五月天丁香 91午夜精品亚洲一区二区三区日韩大片免费观看网站 a级毛片免费高清观看在线播放 18+在线观看网站亚洲欧美中文字幕日韩二区国产色爽女视频免费观看搡女人真爽免费视频火全软件韩国高清视频一区二区三区午夜爱爱视频在线播放日日干狠狠操夜夜爽国产高清三级在线亚洲在久久综合麻豆乱淫一区二区天堂中文最新版在线下载精品人妻一区二区三区麻豆一级爰片在线观看国内揄拍国产精品人妻在线免费人成在线观看视频色精品人妻熟女av久视频欧美成人午夜免费资源乱码一卡2卡4卡精品亚洲精品乱码久久久v下载方式在线播放无遮挡少妇猛男粗大的猛烈进出视频色吧在线观看国产精品一区二区在线观看99 亚洲美女视频黄频亚洲欧美日韩高清专用中文乱码字字幕精品一区二区三区一级毛片电影观看秋霞伦理黄片国产不卡一卡二国产亚洲91精品色在线久久国产乱子免费精品麻豆久久精品国产亚洲av 亚洲av福利一区成人性生交大片免费视频hd 两个人的视频大全免费全区人妻精品视频毛片一级片免费看久久久久久久久久久久久久久免费av 国产免费一级a男人的天堂美女内射精品一级片tv 国产精品一及搡老妇女老女人老熟妇 99久久精品热视频热99re8久久精品国产国产亚洲一区二区精品国产美女午夜福利看片在线看免费视频亚洲精品aⅴ在线观看国产一区二区在线观看日韩国产精品国产高清国产av 简卡轻食公司七月丁香在线播放午夜激情福利司机影院 a级毛色黄片日本猛色少妇xxxxx猛交久久国产精华一区二区三区亚洲aⅴ乱码一区二区在线播放国产亚洲精品av在线欧美最新免费一区二区三区国产v大片淫在线免费观看 97在线视频观看国产精品蜜桃在线观看欧美zozozo另类午夜老司机福利剧场久久6这里有精品国产亚洲精品av在线中文资源天堂在线欧美bdsm另类国产精品熟女久久久久浪国产一区二区在线av高清观看高清在线视频一区二区三区国内精品宾馆在线特大巨黑吊av在线直播男女国产视频网站男插女下体视频免费在线播放啦啦啦观看免费观看视频高清少妇丰满av 国产激情偷乱视频一区二区建设人人有责人人尽责人人享有的亚洲av成人精品一区久久五月玫瑰六月丁香亚洲四区av 男人舔女人下体高潮全视频国产精品一区二区三区四区免费观看国产伦理片在线播放av一区身体一侧抽搐亚洲国产色片午夜a级毛片 videos熟女内射少妇的逼水好多成人国产麻豆网乱系列少妇在线播放男人狂女人下面高潮的视频婷婷色麻豆天堂久久美女xxoo啪啪120秒动态图 videos熟女内射久久精品熟女亚洲av麻豆精品精品久久久久久成人av 91久久精品国产一区二区成人麻豆一二三区av精品十八禁国产超污无遮挡网站少妇的逼好多水尤物成人国产欧美一区二区三区搞女人的毛片日韩av在线大香蕉舔av片在线久久精品国产亚洲av天美人人妻人人澡人人爽人人夜夜国产精品国产三级国产专区5o 国产精品久久久久久精品电影亚洲av电影在线观看一区二区三区亚洲综合色惰成年免费大片在线观看 av卡一久久亚洲国产精品合色在线国产av一区在线观看免费免费观看a级毛片全部你懂的网址亚洲精品在线观看国产精品电影一区二区三区我要看日韩黄色一级片日韩精品有码人妻一区午夜福利在线在线亚洲av成人精品一二三区成人综合一区亚洲国产精品99久久久久久久久久久精品综合一区二区三区少妇高潮的动态图看免费成人av毛片 97超碰精品成人国产午夜精品国产一区二区电影在线免费观看的www视频欧美极品一区二区三区四区九九在线视频观看精品亚洲图色成人国产美女午夜福利 97在线视频观看亚洲婷婷狠狠爱综合网亚洲自拍偷在线中国国产av一级久久久精品欧美日韩精品国产在视频线在精品国产亚洲av嫩草精品影院亚洲精品久久久久久婷婷小说欧美一区二区亚洲超碰av人人做人人爽久久日韩国内少妇激情av 欧美变态另类bdsm刘玥亚洲最大成人av 狂野欧美白嫩少妇大欣赏亚洲国产精品专区欧美免费一级毛片在线播放高清视频美女被艹到高潮喷水动态国产亚洲午夜精品一区二区久久国产精品久久久久久精品电影小说国产精品野战在线观看亚洲欧美清纯卡通最近2019中文字幕mv第一页日韩欧美国产在线观看中国国产av一级 99在线视频只有这里精品首页乱码一卡2卡4卡精品午夜激情欧美在线久久精品久久久久久久性亚洲成人中文字幕在线播放色综合站精品国产久久久久久伊人网av 国产老妇女一区中文字幕av成人在线电影插阴视频在线观看视频男人舔女人下体高潮全视频 2021少妇久久久久久久久久久 99热6这里只有精品在线免费观看的www视频国产精品国产三级专区第一集色网站视频免费爱豆传媒免费全集在线观看婷婷色av中文字幕 99热网站在线观看午夜av观看不卡成人毛片60女人毛片免费亚洲国产av影院在线观看国产精品秋霞免费鲁丝片咕卡用的链子免费看av在线观看网站欧美精品一区二区大全免费黄网站久久成人精品日韩,欧美,国产一区二区三区久久久久久久久久久免费av 熟女电影av网午夜精品国产一区二区电影久久久久久久亚洲中文字幕女性被躁到高潮视频又大又黄又爽视频免费夜夜骑夜夜射夜夜干国产精品无大码 18+在线观看网站男女边吃奶边做爰视频亚洲图色成人免费观看无遮挡的男女亚洲欧美色中文字幕在线 97在线人人人人妻亚洲av电影在线观看一区二区三区亚洲人成网站在线观看播放考比视频在线观看亚洲五月色婷婷综合制服诱惑二区亚洲精品美女久久av网站中国美白少妇内射xxxbb 亚洲av综合色区一区少妇人妻久久综合中文我要看黄色一级片免费的日本vs欧美在线观看视频亚洲精品日韩在线中文字幕久久精品国产a三级三级三级 tube8黄色片一级黄片播放器 av女优亚洲男人天堂伦理电影大哥的女人热99国产精品久久久久久7 男男h啪啪无遮挡国国产精品蜜臀av免费性色avwww在线观看国产乱人偷精品视频亚洲av.av天堂看十八女毛片水多多多免费大片18禁亚洲天堂av无毛 av黄色大香蕉亚洲精品国产av蜜桃国产极品天堂在线亚洲精品久久成人aⅴ小说国产色爽女视频免费观看 99re6热这里在线精品视频又黄又爽又刺激的免费视频. 在线观看人妻少妇 videossex国产免费在线观看完整版高清中文字幕人妻丝袜制服在线观看一区二区三区激情亚洲精品第二区麻豆精品久久久久久蜜桃大话2 男鬼变身卡午夜免费观看性视频中文乱码字字幕精品一区二区三区亚洲精品av麻豆狂野国产乱人偷精品视频男女下面插进去视频免费观看精品国产一区二区三区四区第35 最新的欧美精品一区二区亚洲精品视频女赤兔流量卡办理侵犯人妻中文字幕一二三四区国产成人精品婷婷久久久久久久大尺度免费视频两个人看的免费小视频男女高潮啪啪啪动态图秋霞伦理黄片亚洲欧洲国产日韩 90打野战视频偷拍视频久久这里有精品视频免费国产免费视频播放在线视频亚洲精品色激情综合 a 毛片基地两个人看的免费小视频国产成人av激情在线播放蜜臀久久99精品久久宅男老女人水多毛片亚洲精品av麻豆狂野 97在线人人人人妻 91午夜精品亚洲一区二区三区 97人妻天天添夜夜摸自线自在国产av 国产成人免费无遮挡视频黄色一级大片看看午夜久久久在线观看欧美国产精品va在线观看不卡国产国语露脸激情在线看国产精品不卡视频一区二区久久精品国产自在天天线免费大片黄手机在线观看婷婷色av中文字幕一二三四在线观看免费中文在日本91视频免费播放国产黄色视频一区二区在线观看国产精品麻豆人妻色哟哟久久 1024视频免费在线观看色婷婷久久久亚洲欧美婷婷色综合www 成人亚洲欧美一区二区av 另类亚洲欧美激情 av福利片在线 90打野战视频偷拍视频伦精品一区二区三区 99热国产这里只有精品6 黑丝袜美女国产一区国产男人的电影天堂91 精品久久久久久电影网多毛熟女@视频在线观看国产h片丝袜喷水一区国产亚洲精品久久久com 国产精品欧美亚洲77777 免费看光身美女亚洲欧美中文字幕日韩二区国产成人91sexporn 久久亚洲国产成人精品v 欧美激情国产日韩精品一区成人二区视频有码亚洲区边亲边吃奶的免费视频午夜日本视频在线高清不卡的av网站国产高清三级在线 18在线观看网站 av女优亚洲男人天堂国内精品宾馆在线美女视频免费永久观看网站亚洲精品乱久久久久久日韩av免费高清视频精品少妇内射三级免费黄网站久久成人精品热99国产精品久久久久久7 免费人妻精品一区二区三区视频男女国产视频网站国产日韩欧美视频二区中文乱码字字幕精品一区二区三区日日摸夜夜添夜夜爱精品卡一卡二卡四卡免费日韩伦理黄色片国产精品熟女久久久久浪亚洲综合精品二区男人添女人高潮全过程视频 9191精品国产免费久久国产男人的电影天堂91 国产永久视频网站国产成人91sexporn 日韩,欧美,国产一区二区三区中文字幕另类日韩欧美亚洲嫩草国产精品久久久久久av不卡欧美日本中文国产一区发布国产无遮挡羞羞视频在线观看两个人免费观看高清视频在线观看www视频免费大香蕉97超碰在线 99热这里只有是精品在线观看日韩人妻精品一区2区三区欧美人与性动交α欧美软件成人毛片a级毛片在线播放久久韩国三级中文字幕色网站视频免费少妇被粗大猛烈的视频精品少妇黑人巨大在线播放桃花免费在线播放亚洲av男天堂久热这里只有精品99 在线 av 中文字幕国产免费福利视频在线观看中文字幕人妻熟女乱码国产伦理片在线播放av一区久久国产精品大桥未久av 国产男女超爽视频在线观看 √禁漫天堂资源中文www 熟女人妻精品中文字幕看非洲黑人一级黄片久久久精品94久久精品男的添女的下面高潮视频色吧在线观看日韩欧美精品免费久久制服诱惑二区国精品久久久久久国模美亚洲精华国产精华液的使用体验满18在线观看网站婷婷色av中文字幕欧美亚洲国产日韩一国产av精品麻豆在线观看免费视频网站a站日韩av不卡免费在线播放女性被躁到高潮视频一区二区三区精品91 丝袜人妻中文字幕国产男人的电影天堂91 最新中文字幕久久久久亚洲色图男人天堂中文字幕久久青草综合色国产欧美日韩一区二区三区在线 26uuu在线亚洲综合色国产精品一区www在线观看美女大奶头黄色视频天堂中文最新版在线下载国产一区亚洲一区在线观看男女午夜视频在线观看国产精品免费大片亚洲,一卡二卡三卡免费黄色在线免费观看亚洲国产日韩一区二区久久久精品区二区三区 av在线app专区 99热全是精品在线免费观看不下载黄p国产少妇被粗大的猛进出69影院 9色porny在线观看 kizo精华成人亚洲欧美一区二区av 一区在线观看完整版精品一品国产午夜福利视频亚洲精品乱久久久久久波多野结衣一区麻豆国产精品偷伦视频观看了一本一本久久a久久精品综合妖精国产伦在线观看视频一区亚洲av日韩在线播放 a级片在线免费高清观看视频色婷婷av一区二区三区视频精品99又大又爽又粗少妇毛片波多野结衣一区麻豆熟女av电影日本免费在线观看一区成人影院久久国产精品蜜桃在线观看中文字幕精品免费在线观看视频久久这里只有精品19 av播播在线观看一区久久99一区二区三区性高湖久久久久久久久免费观看 2018国产大陆天天弄谢成人午夜精彩视频在线观看搡老乐熟女国产国产老妇伦熟女老妇高清亚洲精品日韩在线中文字幕水蜜桃什么品种好亚洲国产欧美日韩在线播放日韩制服骚丝袜av 久久免费观看电影 1024视频免费在线观看久久久a久久爽久久v久久日韩一区二区三区影片晚上一个人看的免费电影欧美精品人与动牲交sv欧美 18禁在线无遮挡免费观看视频男女无遮挡免费网站观看啦啦啦中文免费视频观看日本免费看av在线观看网站少妇人妻视频 av在线app专区免费日韩欧美在线观看性高湖久久久久久久久免费观看搡女人真爽免费视频火全软件少妇猛男粗大的猛烈进出视频久久av网站午夜日本视频在线人人妻人人爽人人添夜夜欢视频男女下面插进去视频免费观看日本免费在线观看一区国产亚洲精品第一综合不卡日本91视频免费播放欧美3d第一页国产精品国产av在线观看自拍欧美九色日韩亚洲蝌蚪91 久久久精品94久久精品久久99热6这里只有精品日本黄色日本黄色录像最近的中文字幕免费完整午夜影院在线不卡国产免费一区二区三区四区乱码免费黄网站久久成人精品日韩一本色道免费dvd 国产精品99久久99久久久不卡丝袜在线中文字幕久久av网站精品一区二区三卡丝袜脚勾引网站精品卡一卡二卡四卡免费 99久久人妻综合国产日韩欧美视频二区亚洲精品成人av观看孕妇视频在线观看一区二区三区亚洲精品久久午夜乱码狠狠精品人妻久久久久久综合国产精品99久久99久久久不卡一级a做视频免费观看欧美激情极品国产一区二区三区晚上一个人看的免费电影国产成人91sexporn 亚洲精品456在线播放app 午夜影院在线不卡 av.在线天堂国产又色又爽无遮挡免国产精品国产三级国产av玫瑰宅男免费午夜亚洲av福利一区国产精品偷伦视频观看了国产av一区二区精品久久 18禁观看日本亚洲丝袜综合中文字幕 91久久精品国产一区二区三区丰满饥渴人妻一区二区三 999精品在线视频免费观看性生交大片5 av黄色大香蕉少妇精品久久久久久久国产免费视频播放在线视频欧美精品亚洲一区二区久久这里只有精品19 国产一区二区激情短视频黑人欧美特级aaaaaa片久久久久久久大尺度免费视频国产在线免费精品飞空精品影院首页国产精品1 老女人水多毛片亚洲精品久久久久久婷婷小说在线观看免费日韩欧美大片最近的中文字幕免费完整日韩视频在线欧美美女内射精品一级片tv 制服丝袜香蕉在线免费大片黄手机在线观看免费不卡的大黄色大毛片视频在线观看久久女婷五月综合色啪小说精品人妻熟女毛片av久久网站天天操日日干夜夜撸欧美精品av麻豆av 18禁国产床啪视频网站夫妻性生交免费视频一级片妹子高潮喷水视频成人国产麻豆网 av播播在线观看一区在线观看人妻少妇免费大片18禁狠狠婷婷综合久久久久久88av 91精品三级在线观看亚洲欧美中文字幕日韩二区亚洲丝袜综合中文字幕亚洲四区av 人妻人人澡人人爽人人亚洲一码二码三码区别大吗国产av国产精品国产五月开心婷婷网午夜福利,免费看成人二区视频 av一本久久久久啦啦啦在线观看免费高清www 日日爽夜夜爽网站激情视频va一区二区三区美女内射精品一级片tv 五月开心婷婷网在线亚洲精品国产二区图片欧美欧美xxⅹ黑人日本猛色少妇xxxxx猛交久久 91精品伊人久久大香线蕉大香蕉97超碰在线免费高清在线观看日韩欧美国产精品一级二级三级丝袜脚勾引网站 www日本在线高清视频伦精品一区二区三区国产精品久久久久成人av 午夜影院在线不卡精品卡一卡二卡四卡免费国产日韩欧美在线精品亚洲国产精品专区欧美国产午夜精品一二区理论片肉色欧美久久久久久久蜜桃美女主播在线视频 av在线老鸭窝女人被躁到高潮嗷嗷叫费观黑丝袜美女国产一区超碰97精品在线观看国产男女内射视频欧美日本中文国产一区发布亚洲性久久影院欧美成人午夜免费资源大码成人一级视频国产精品人妻久久久影院国产成人午夜福利电影在线观看日韩亚洲欧美在线看免费成人av毛片色网站视频免费九九爱精品视频在线观看 99国产综合亚洲精品黄色怎么调成土黄色亚洲欧美成人精品一区二区五月开心婷婷网五月伊人婷婷丁香大香蕉久久网国产白丝娇喘喷水9色精品人妻少妇偷人精品九色国产免费视频播放在线视频啦啦啦视频在线资源免费观看桃花免费在线播放亚洲第一区二区三区不卡九色成人免费人妻av 国产精品一区www在线观看国产淫语在线视频人妻一区二区av 国产欧美日韩一区二区三区在线免费看光身美女精品一区二区三区视频在线国产成人精品在线电影欧美人与性动交α欧美软件日韩在线高清观看一区二区三区国产成人精品在线电影我要看黄色一级片免费的国产69精品久久久久777片在线亚洲精品国产二区图片欧美亚洲欧美一区二区三区国产亚洲精华国产精华液的使用体验久久精品国产鲁丝片午夜精品一级片'在线观看视频欧美激情高清一区二区三区 91精品国产国语对白视频久久久久久久久久久久大奶天堂中文最新版在线下载日韩成人av中文字幕在线观看 av免费在线看不卡 freevideosex欧美久久狼人影院国产一区亚洲一区在线观看在线观看免费日韩欧美大片亚洲av福利一区久热这里只有精品99 一级片'在线观看视频女的被弄到高潮叫床怎么办久久亚洲国产成人精品v 欧美bdsm另类宅男免费午夜国产一区亚洲一区在线观看 a级毛色黄片欧美日韩视频精品一区男女下面插进去视频免费观看国产精品女同一区二区软件午夜激情av网站国产极品天堂在线久久精品国产a三级三级三级一本一本久久a久久精品综合妖精国产伦在线观看视频一区高清视频免费观看一区二区国产片内射在线十分钟在线观看高清视频www 国产精品国产三级专区第一集日韩,欧美,国产一区二区三区欧美激情国产日韩精品一区母亲3免费完整高清在线观看男女啪啪激烈高潮av片 av天堂久久9 91国产中文字幕 80岁老熟妇乱子伦牲交日本av手机在线免费观看 90打野战视频偷拍视频国产深夜福利视频在线观看亚洲欧美色中文字幕在线一本一本久久a久久精品综合妖精国产伦在线观看视频一区性色av一级视频中文字幕在线观看超色免费av 宅男免费午夜女人被躁到高潮嗷嗷叫费观国产免费又黄又爽又色国产一区精品欧美国产精品va在线观看不卡亚洲在久久综合亚洲第一av免费看女人精品久久久久毛片一区二区三区四区激情视频一边亲一边摸免费视频午夜激情av网站久久99蜜桃精品久久日韩成人av中文字幕在线观看一区二区三区四区激情视频国产成人a∨麻豆精品国产亚洲一区二区精品国产日韩欧美在线精品 97超碰精品成人国产建设人人有责人人尽责人人享有的秋霞在线观看毛片国产精品一国产av 国产片特级美女逼逼视频国产精品久久久久久精品古装美女国产高潮福利片在线看 99热这里只有是精品在线观看国产精品久久久久久精品电影小说国产有黄有色有爽视频亚洲精品第二区日韩在线高清观看一区二区三区国产精品蜜桃在线观看乱码一卡2卡4卡精品亚洲精品自拍成人成年人午夜在线观看视频亚洲精品第二区欧美人与性动交α欧美精品济南到免费久久久久久久精品成人欧美视频亚洲精品第二区日日爽夜夜爽网站欧美少妇被猛烈插入视频丰满乱子伦码专区男女午夜视频在线观看 97人妻天天添夜夜摸成人无遮挡网站一边摸一边做爽爽视频免费 91国产中文字幕亚洲色图综合在线观看满18在线观看网站国产欧美另类精品又又久久亚洲欧美久久久精品区二区三区久久久久精品久久久久真实原创久久人人爽av亚洲精品天堂国产免费福利视频在线观看嫩草影院入口国产在线一区二区三区精男女边摸边吃奶国产亚洲精品第一综合不卡少妇在线观看黄色视频在线播放观看不卡大片电影免费在线观看免费你懂的网址亚洲精品在线观看一级爰片在线观看国产成人精品无人区高清视频免费观看一区二区 av黄色大香蕉国产精品人妻久久久影院亚洲精品一二三男女下面插进去视频免费观看天天影视国产精品久久精品久久久久久噜噜老黄插逼视频在线观看精品午夜福利在线看成年人免费黄色播放视频 videosex国产 av线在线观看网站成人亚洲欧美一区二区av 久久婷婷青草少妇的逼好多水 18禁动态无遮挡网站日韩不卡一区二区三区视频在线两个人看的免费小视频热99久久久久精品小说推荐精品国产国语对白av 女人被躁到高潮嗷嗷叫费观少妇人妻久久综合中文 av电影中文网址国产一区二区在线观看av 51国产日韩欧美亚洲精品一区蜜桃国产淫语在线视频亚洲经典国产精华液单亚洲欧洲国产日韩国产成人a∨麻豆精品欧美日韩av久久黄色一级大片看看午夜av观看不卡国内精品宾馆在线夫妻性生交免费视频一级片乱人伦中国视频亚洲,一卡二卡三卡日本wwww免费看又黄又粗又硬又大视频另类精品久久黑人高潮一二区久久精品国产亚洲av天美老司机亚洲免费影院亚洲色图综合在线观看欧美日韩视频精品一区久热这里只有精品99 国精品久久久久久国模美亚洲欧美精品自产自拍热re99久久国产66热成人亚洲精品一区在线观看熟妇人妻不卡中文字幕亚洲三级黄色毛片视频在线观看一区二区三区国产不卡av网站在线观看狠狠精品人妻久久久久久综合丰满饥渴人妻一区二区三亚洲精品久久久久久婷婷小说在线观看一区二区三区激情久久久久久人人人人人亚洲国产成人一精品久久久亚洲精品第二区 av.在线天堂久久青草综合色男女无遮挡免费网站观看 99国产综合亚洲精品 av在线老鸭窝亚洲精品456在线播放app 美女大奶头黄色视频亚洲av欧美aⅴ国产亚洲精品美女久久av网站久久久国产欧美日韩av 亚洲色图综合在线观看 999精品在线视频最近最新中文字幕大全免费视频欧美日韩精品国产亚洲国产欧美在线一区欧美精品人与动牲交sv欧美一二三四在线观看免费中文在亚洲精品国产av成人精品午夜av观看不卡国产成人午夜福利电影在线观看亚洲精品国产av成人精品亚洲四区av 久久婷婷青草 18在线观看网站免费久久久久久久精品成人欧美视频日韩一区二区视频免费看国产激情久久老熟女免费观看a级毛片全部哪个播放器可以免费观看大片性色av一级 videosex国产亚洲av中文av极速乱色网站视频免费国产国语露脸激情在线看亚洲三级黄色毛片 h视频一区二区三区欧美日韩亚洲高清精品亚洲国产色片日韩精品有码人妻一区咕卡用的链子久久人人爽av亚洲精品天堂 9色porny在线观看巨乳人妻的诱惑在线观看 99热全是精品不卡视频在线观看欧美国产欧美日韩一区二区三区在线国产麻豆69 免费看av在线观看网站久久狼人影院视频在线观看一区二区三区国产一区二区在线观看av 制服诱惑二区极品人妻少妇av视频国产伦理片在线播放av一区亚洲欧美成人综合另类久久久欧美国产精品一级二级三级青春草亚洲视频在线观看一区二区三区四区激情视频 18禁在线无遮挡免费观看视频日韩中文字幕视频在线看片蜜桃在线观看.. 日韩精品免费视频一区二区三区精品一区在线观看国产久久久久国产网址大香蕉久久成人网国产精品国产三级专区第一集人人妻人人澡人人看久久久久精品久久久久真实原创欧美精品一区二区免费开放午夜激情久久久久久久精品少妇黑人巨大在线播放中文字幕精品免费在线观看视频一区二区三区四区激情视频亚洲成人av在线免费 99re6热这里在线精品视频国产成人91sexporn 91成人精品电影午夜影院在线不卡建设人人有责人人尽责人人享有的亚洲第一av免费看亚洲,欧美,日韩日韩中字成人亚洲av免费高清在线观看国产精品人妻久久久久久大码成人一级视频伦理电影免费视频久久久精品区二区三区看免费av毛片日本免费在线观看一区在线精品无人区一区二区三亚洲综合色网址婷婷成人精品国产国产又色又爽无遮挡免最近最新中文字幕大全免费视频中文乱码字字幕精品一区二区三区天美传媒精品一区二区大陆偷拍与自拍午夜福利视频在线观看免费亚洲精华国产精华液的使用体验少妇人妻视频韩国高清视频一区二区三区久久久久精品性色欧美精品一区二区大全国产1区2区3区精品亚洲av免费高清在线观看亚洲av免费高清在线观看日日爽夜夜爽网站亚洲人成网站在线观看播放 av国产精品久久久久影院 2021少妇久久久久久久久久久 av网站免费在线观看视频日本黄大片高清人妻系列视频国产免费又黄又爽又色丰满少妇做爰视频久久99热6这里只有精品国产欧美另类精品又又久久亚洲欧美人人澡人人妻人久久久久精品性色免费黄网站久久成人精品一级,二级,三级黄色视频国产乱人偷精品视频国产精品女同一区二区软件男人添女人高潮全过程视频午夜激情久久久久久久一区二区三区精品91 涩涩av久久男人的天堂午夜老司机福利剧场国产激情久久老熟女狂野欧美激情性xxxx在线观看国产69精品久久久久777片男女高潮啪啪啪动态图国产精品秋霞免费鲁丝片美女国产视频在线观看 91成人精品电影欧美亚洲日本最大视频资源中文天堂在线官网男女国产视频网站亚洲中文av在线午夜视频国产福利狠狠婷婷综合久久久久久88av 国产精品一国产av 国产精品一二三区在线看中文字幕精品免费在线观看视频一区二区三区四区激情视频 51国产日韩欧美日本欧美国产在线视频 av在线播放精品 av不卡在线播放亚洲av在线观看美女高潮在现免费观看毛片有码亚洲区日韩一区二区三区影片国产亚洲一区二区精品人妻少妇偷人精品九色成人手机av 亚洲第一区二区三区不卡夫妻午夜视频 www.熟女人妻精品国产国产成人91sexporn 成人毛片a级毛片在线播放亚洲av福利一区亚洲国产精品一区二区三区在线自拍欧美九色日韩亚洲蝌蚪91 欧美丝袜亚洲另类久久久久久人人人人人麻豆乱淫一区二区亚洲精品美女久久久久99蜜臀婷婷色综合www 91aial.com中文字幕在线观看男女下面插进去视频免费观看久久免费观看电影欧美精品一区二区免费开放亚洲av在线观看美女高潮日本猛色少妇xxxxx猛交久久少妇人妻久久综合中文少妇精品久久久久久久国产爽快片一区二区三区中文字幕人妻熟女乱码精品一品国产午夜福利视频极品少妇高潮喷水抽搐涩涩av久久男人的天堂欧美日韩视频精品一区中文字幕人妻丝袜制服国产精品久久久av美女十八一级a做视频免费观看亚洲综合色惰 97人妻天天添夜夜摸久久精品aⅴ一区二区三区四区亚洲,欧美精品. 国产一区二区三区综合在线观看免费人成在线观看视频色多毛熟女@视频久久久久人妻精品一区果冻亚洲欧美成人精品一区二区国产一区二区在线观看av 国产一区精品亚洲欧美清纯卡通 97精品久久久久久久久久精品国产精品国内视频免费观看在线日韩午夜福利在线观看免费完整高清在天美传媒精品一区二区久久久久网色 www.av在线官网国产我的女老师完整版在线观看成年人午夜在线观看视频婷婷色麻豆天堂久久欧美日韩精品国产性色avwww在线观看免费黄网站久久成人精品日韩精品免费视频一区二区三区成年美女黄网站色视频大全免费久久精品久久久久久噜噜老黄男男h啪啪无遮挡日韩欧美精品免费久久亚洲久久久国产精品日日摸夜夜添夜夜爱亚洲综合色网址 18禁观看日本午夜福利影视在线免费观看一区二区三区四区激情视频成人漫画全彩无遮挡欧美精品一区二区大全久久韩国三级中文字幕亚洲国产毛片av蜜桃av 日韩在线高清观看一区二区三区久热这里只有精品99 日日爽夜夜爽网站中文字幕最新亚洲高清亚洲精品美女久久久久99蜜臀久久人人爽人人爽人人片va 精品人妻偷拍中文字幕中文字幕免费在线视频6 色94色欧美一区二区亚洲四区av 丝袜脚勾引网站国精品久久久久久国模美久久久精品免费免费高清 freevideosex欧美少妇被粗大猛烈的视频国产成人午夜福利电影在线观看十八禁高潮呻吟视频国产一区亚洲一区在线观看久久久国产一区二区久久久久久久久久久久大奶国产午夜精品一二区理论片一本色道久久久久久精品综合超色免费av 男人添女人高潮全过程视频成年动漫av网址中文字幕人妻熟女乱码在现免费观看毛片婷婷色av中文字幕精品熟女少妇av免费看另类精品久久伊人久久国产一区二区免费久久久久久久精品成人欧美视频国产片内射在线精品久久国产蜜桃久久久精品94久久精品天堂中文最新版在线下载韩国av在线不卡 99热这里只有是精品在线观看日本黄色日本黄色录像 9热在线视频观看99 啦啦啦在线观看免费高清www 欧美成人午夜精品在线亚洲精品国产二区图片欧美日本黄色日本黄色录像 80岁老熟妇乱子伦牲交色婷婷av一区二区三区视频日本av手机在线免费观看成人影院久久国产综合精华液一本久久精品欧美日韩av久久麻豆精品久久久久久蜜桃久久久久久伊人网av 免费高清在线观看视频在线观看亚洲高清免费不卡视频 18禁裸乳无遮挡动漫免费视频热99国产精品久久久久久7 一级毛片黄色毛片免费观看视频搡老乐熟女国产亚洲欧美日韩卡通动漫高清av免费在线又粗又硬又长又爽又黄的视频激情视频va一区二区三区欧美日韩视频高清一区二区三区二久久青草综合色久久久久国产精品人妻一区二区女性生殖器流出的白浆国产精品女同一区二区软件亚洲第一区二区三区不卡国产精品国产三级国产av玫瑰欧美人与性动交α欧美软件久久热在线av 美女xxoo啪啪120秒动态图熟女av电影精品久久久久久电影网大码成人一级视频人人妻人人添人人爽欧美一区卜 av.在线天堂日本wwww免费看 av有码第一页日本黄大片高清日韩一本色道免费dvd 少妇精品久久久久久久最后的刺客免费高清国语午夜福利视频在线观看免费 av网站免费在线观看视频免费av不卡在线播放热re99久久精品国产66热6 久久久a久久爽久久v久久性色av一级国产淫语在线视频国产精品久久久久成人av 欧美日韩一区二区视频在线观看视频在线日韩视频在线欧美内地一区二区视频在线 99久久综合免费亚洲人与动物交配视频亚洲av.av天堂国产精品一国产av 国产极品天堂在线欧美最新免费一区二区三区中文精品一卡2卡3卡4更新韩国av在线不卡超碰97精品在线观看日日爽夜夜爽网站亚洲av电影在线观看一区二区三区亚洲av男天堂校园人妻丝袜中文字幕国产一区二区在线观看日韩久久99热6这里只有精品日本午夜av视频亚洲欧美日韩另类电影网站亚洲国产av新网站亚洲成av片中文字幕在线观看亚洲少妇的诱惑av 色哟哟·www 自拍欧美九色日韩亚洲蝌蚪91 欧美国产精品一级二级三级国产在线一区二区三区精欧美亚洲国产日韩一男男h啪啪无遮挡亚洲av男天堂午夜老司机福利剧场少妇高潮的动态图曰老女人黄片午夜福利网站1000一区二区三区亚洲经典国产精华液单最近中文字幕高清免费大全6 久久精品国产鲁丝片午夜精品国产女主播在线喷水免费视频网站美女脱内裤让男人舔精品视频两个人免费观看高清视频亚洲熟女精品中文字幕久久精品国产亚洲av天美国产极品天堂在线 97超碰精品成人国产国语对白做爰xxxⅹ性视频网站男人爽女人下面视频在线观看曰老女人黄片香蕉丝袜av 免费黄网站久久成人精品青春草视频在线免费观看亚洲第一区二区三区不卡综合色丁香网交换朋友夫妻互换小说国产精品熟女久久久久浪午夜免费观看性视频久久久久精品久久久久真实原创欧美变态另类bdsm刘玥亚洲精品乱码久久久久久按摩国产熟女欧美一区二区男女啪啪激烈高潮av片曰老女人黄片 51国产日韩欧美高清欧美精品videossex 热re99久久精品国产66热6 亚洲精品美女久久av网站九色成人免费人妻av 男人添女人高潮全过程视频精品酒店卫生间久久久久国产网址久久精品aⅴ一区二区三区四区国产高清三级在线国产av国产精品国产女人久久www免费人成看片国产成人精品婷婷亚洲精品色激情综合人妻亚洲视频十八禁高潮呻吟视频欧美精品国产亚洲国产黄色免费在线视频 99热6这里只有精品午夜精品国产一区二区电影毛片一级片免费看久久久久 a级毛色黄片午夜激情av网站国产精品一区二区在线不卡亚洲美女搞黄在线观看日本猛色少妇xxxxx猛交久久 av天堂久久9 xxxhd国产人妻xxx 色网站视频免费人妻一区二区av 国产高清三级在线黄网站色视频无遮挡免费观看久久精品aⅴ一区二区三区四区国产色婷婷99 女的被弄到高潮叫床怎么办一级毛片黄色毛片免费观看视频欧美xxⅹ黑人精品熟女少妇av免费看 av电影中文网址 9191精品国产免费久久 18+在线观看网站黄色视频在线播放观看不卡十八禁网站网址无遮挡欧美激情高清一区二区三区大片免费播放器马上看亚洲第一av免费看久久国产亚洲av麻豆专区 av电影中文网址亚洲欧洲国产日韩中文字幕另类日韩欧美亚洲嫩草日韩欧美一区视频在线观看日韩一本色道免费dvd 伊人亚洲综合成人网 69精品国产乱码久久久精品人妻一区二区三区麻豆 2018国产大陆天天弄谢国产在线一区二区三区精十分钟在线观看高清视频www 国产乱人偷精品视频国产极品天堂在线亚洲国产最新在线播放天美传媒精品一区二区免费看光身美女国产精品99久久99久久久不卡日本爱情动作片www.在线观看亚洲图色成人精品久久久久久电影网亚洲人成77777在线视频男女下面插进去视频免费观看宅男免费午夜 99热这里只有是精品在线观看精品99又大又爽又粗少妇毛片最近最新中文字幕免费大全7 久久热在线av 午夜福利网站1000一区二区三区国产成人午夜福利电影在线观看人人妻人人澡人人爽人人夜夜两个人免费观看高清视频亚洲欧洲国产日韩国产精品一区二区在线不卡狂野欧美激情性xxxx在线观看成人手机av 欧美精品人与动牲交sv欧美九色成人免费人妻av 久久精品aⅴ一区二区三区四区国产精品嫩草影院av在线观看色视频在线一区二区三区 2022亚洲国产成人精品日日撸夜夜添街头女战士在线观看网站九色亚洲精品在线播放一级黄片播放器成人漫画全彩无遮挡国产成人午夜福利电影在线观看欧美日韩亚洲高清精品你懂的网址亚洲精品在线观看日韩av在线免费看完整版不卡欧美亚洲丝袜人妻在线精品国产乱码久久久久久小说男女下面插进去视频免费观看国产精品熟女久久久久浪男女午夜视频在线观看性色avwww在线观看 av线在线观看网站最黄视频免费看国产精品1 最近手机中文字幕大全国产色婷婷99 久久久久精品性色 √禁漫天堂资源中文www 国产免费视频播放在线视频国产日韩欧美在线精品少妇高潮的动态图国产精品久久久久成人av 好男人视频免费观看在线日韩制服丝袜自拍偷拍免费女性裸体啪啪无遮挡网站精品国产露脸久久av麻豆 freevideosex欧美 av片东京热男人的天堂天堂8中文在线网国产白丝娇喘喷水9色精品 av在线观看视频网站免费 99久久中文字幕三级久久日本日本黄色日本黄色录像丝袜美足系列男人操女人黄网站亚洲av在线观看美女高潮伦精品一区二区三区 97在线视频观看一级毛片电影观看一级,二级,三级黄色视频国产综合精华液日本欧美国产在线视频久久久久国产网址国产爽快片一区二区三区久久久欧美国产精品久久99热这里只频精品6学生久久久久久久久久久免费av 精品一区二区三区四区五区乱码亚洲精品美女久久av网站国产一区亚洲一区在线观看中文字幕精品免费在线观看视频成年动漫av网址欧美老熟妇乱子伦牲交国产乱人偷精品视频久久精品国产综合久久久日韩亚洲欧美在线久久99热6这里只有精品成人亚洲精品一区在线观看国产成人免费无遮挡视频草草在线视频免费看欧美bdsm另类 97在线人人人人妻欧美激情国产日韩精品一区如日韩欧美国产精品一区二区三区亚洲图色成人国产精品女同一区二区软件国语对白做爰xxxⅹ性视频网站免费观看无遮挡的男女亚洲国产毛片av蜜桃av 女人精品久久久久毛片大香蕉久久网久久精品久久精品一区二区三区 99久国产av精品国产电影日韩在线高清观看一区二区三区中文精品一卡2卡3卡4更新 26uuu在线亚洲综合色人体艺术视频欧美日本高清av免费在线 91精品伊人久久大香线蕉午夜视频国产福利国产成人欧美久久精品国产鲁丝片午夜精品亚洲国产欧美日韩在线播放久久99热这里只频精品6学生咕卡用的链子成人午夜精彩视频在线观看久久久精品免费免费高清黄网站色视频无遮挡免费观看最近中文字幕2019免费版国产无遮挡羞羞视频在线观看少妇人妻久久综合中文亚洲精品美女久久av网站精品第一国产精品国产免费一区二区三区四区乱码飞空精品影院首页中文字幕av电影在线播放国产亚洲精品第一综合不卡一级爰片在线观看午夜影院在线不卡亚洲精品久久久久久婷婷小说日韩,欧美,国产一区二区三区乱码一卡2卡4卡精品亚洲人成网站在线观看播放国产一区精品亚洲av日韩在线播放天天影视国产精品人人妻人人澡人人爽人人夜夜女人被躁到高潮嗷嗷叫费观国产精品久久久久久av不卡综合色丁香网香蕉精品网在线国产精品久久久久成人av 久久精品人人爽人人爽视色亚洲熟女精品中文字幕亚洲欧美日韩卡通动漫 av在线老鸭窝欧美性感艳星国产男女超爽视频在线观看日韩成人伦理影院狂野欧美激情性xxxx在线观看少妇被粗大猛烈的视频 av在线app专区男女边摸边吃奶国产免费福利视频在线观看色吧在线观看亚洲精品乱久久久久久国产精品国产三级国产av玫瑰久久这里只有精品19 色婷婷久久久亚洲欧美欧美精品人与动牲交sv欧美免费女性裸体啪啪无遮挡网站久久99精品国语久久久国产欧美日韩综合在线一区二区欧美精品人与动牲交sv欧美中文字幕人妻熟女乱码久久久a久久爽久久v久久亚洲内射少妇av 如何舔出高潮亚洲婷婷狠狠爱综合网日本黄色日本黄色录像天天影视国产精品人人妻人人澡人人看看非洲黑人一级黄片青青草视频在线视频观看 2022亚洲国产成人精品纯流量卡能插随身wifi吗美女主播在线视频日日爽夜夜爽网站精品99又大又爽又粗少妇毛片色哟哟·www 久久久久久人人人人人欧美3d第一页国产极品粉嫩免费观看在线午夜福利乱码中文字幕内地一区二区视频在线国产精品.久久久久久精品久久久久久久性伦理电影免费视频一本—道久久a久久精品蜜桃钙片 91精品国产国语对白视频国产片特级美女逼逼视频免费观看性生交大片5 日本wwww免费看日本欧美国产在线视频国产免费视频播放在线视频只有这里有精品99 菩萨蛮人人尽说江南好唐韦庄人妻一区二区av 欧美日韩综合久久久久久亚洲国产毛片av蜜桃av 最近2019中文字幕mv第一页岛国毛片在线播放色网站视频免费亚洲综合色惰国产亚洲一区二区精品国产亚洲精品久久久com 久久久久精品久久久久真实原创国产精品人妻久久久久久在线亚洲精品国产二区图片欧美一级片'在线观看视频伦理电影大哥的女人欧美xxⅹ黑人日韩成人av中文字幕在线观看国产在线免费精品久久99精品国语久久久在线观看免费日韩欧美大片久久久久久人妻不卡视频在线观看欧美日韩亚洲欧美在线中文字幕精品免费在线观看视频亚洲色图综合在线观看日韩一本色道免费dvd 国产在线视频一区二区国产午夜精品一二区理论片国产在视频线精品免费黄色在线免费观看精品久久久精品久久久国产成人a∨麻豆精品校园人妻丝袜中文字幕 xxx大片免费视频免费观看无遮挡的男女人人妻人人添人人爽欧美一区卜人妻亚洲视频岛国毛片在线播放