• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于深度強化學(xué)習(xí)的智能決策方法*

    2023-01-18 00:47:40熊蓉玲段春怡冉華明馮旸赫
    電訊技術(shù) 2023年1期
    關(guān)鍵詞:掩膜決策深度

    熊蓉玲,段春怡,冉華明,楊 萌,馮旸赫

    (1.中國西南電子技術(shù)研究所,成都 610036;2.西南交通大學(xué) 數(shù)學(xué)學(xué)院,成都 611756;3.國防科技大學(xué) 系統(tǒng)工程學(xué)院,長沙 410003)

    0 引 言

    強化學(xué)習(xí)通過智能體和環(huán)境不斷試錯交互的方式學(xué)習(xí)到能夠使獎勵最大化的最優(yōu)策略[1]。深度強化學(xué)習(xí)結(jié)合神經(jīng)網(wǎng)絡(luò)強大的表征能力來擬合智能體的策略模型和價值模型,求解復(fù)雜問題的能力大幅提升,近年來在各類智能決策問題上取得了巨大的進步,成為人工智能領(lǐng)域發(fā)展迅猛的一個分支[2]。實時策略類游戲作為典型的時序決策問題,成為國內(nèi)外學(xué)者研究深度強化學(xué)習(xí)的試金石。Mnih 等[3]提出深度Q網(wǎng)絡(luò)(Deep Q Network,DQN)算法解決Atari2600游戲,在6個游戲中的表現(xiàn)優(yōu)于以前的方法,在3個游戲中的表現(xiàn)優(yōu)于人類專家。但Atari2600游戲的任務(wù)場景較為簡單,決策時序較短,決策空間較小,問題復(fù)雜性不高。Vinyals等[4]針對星際爭霸游戲問題,采用了強化學(xué)習(xí)和模仿學(xué)習(xí)相結(jié)合的方式,解決了非完全信息下的即時策略游戲問題。Jaderberg等[5]針對雷神之錘游戲問題,利用雙層流程來優(yōu)化智能體的內(nèi)部獎勵機制,再通過這些獎勵來優(yōu)化強化學(xué)習(xí)模型,通過并行訓(xùn)練多個不同的智能體集群相互配合,實現(xiàn)了完全無監(jiān)督的自學(xué)機制。與Atari2600游戲相比,星際爭霸和雷神之錘的任務(wù)場景復(fù)雜,決策難度大幅提升,文中設(shè)計的算法架構(gòu)復(fù)雜,計算資源需求大,訓(xùn)練時間長,難以應(yīng)用到其他任務(wù)場景中。

    針對傳統(tǒng)深度強化學(xué)習(xí)方法難以快速解決長時序復(fù)雜任務(wù)的問題,本文提出一種引入歷史信息和人類知識的深度強化學(xué)習(xí)方法。

    1 背景介紹

    1.1 深度強化學(xué)習(xí)

    強化學(xué)習(xí)主要關(guān)注智能體如何在環(huán)境中采取不同的行動,以最大限度地提高累積獎勵。強化學(xué)習(xí)主要由智能體、環(huán)境、狀態(tài)、動作、獎勵組成[6]。其中,狀態(tài)空間用狀態(tài)集合S表示,動作空間用動作集合A表示,則智能體與環(huán)境的交互過程為:當給定環(huán)境的某個狀態(tài)s∈S,智能體將根據(jù)當前的策略π(a|s)執(zhí)行某個動作a∈A,環(huán)境遷移到新的狀態(tài)s′∈S,同時智能體從環(huán)境獲得獎勵r(s,a)。智能體根據(jù)環(huán)境反饋的獎勵,對自身的策略模型進行更新,以學(xué)會最佳決策序列。

    為了表示累積獎勵,通常使用折扣累積獎勵來代替:

    (1)

    式中:γ為折扣系數(shù)。

    當執(zhí)行到某一步時,需要評估當前智能體在該時間步狀態(tài)的好壞程度,主要由值函數(shù)來完成,包括狀態(tài)值函數(shù)Vπ(s)和動作-狀態(tài)值函數(shù)Qπ(s,a)兩類,分別如公式(2)和(3)所示:

    Vπ(s)=E[Rt|st=s],

    (2)

    Qπ(s,a)=E[Rt|st=s,at=a]。

    (3)

    強化學(xué)習(xí)的核心思想是使用值函數(shù)找到最優(yōu)的策略,通常采用求解貝爾曼方程的方法,即

    (4)

    或者

    (5)

    式中:p(s′,r|s,a)為狀態(tài)轉(zhuǎn)移概率。

    深度學(xué)習(xí)通過神經(jīng)網(wǎng)絡(luò)的逐層組合,最終提取能夠代表數(shù)據(jù)最本質(zhì)的高維抽象特征,具有極強的表征能力。深度強化學(xué)習(xí)使用強化學(xué)習(xí)定義問題和優(yōu)化目標,使用深度學(xué)習(xí)求解策略函數(shù)或者價值函數(shù),充分利用了強化學(xué)習(xí)的決策優(yōu)勢和深度學(xué)習(xí)的感知優(yōu)勢,近年來在很多任務(wù)上取得了巨大的成功。

    1.2 近端策略優(yōu)化

    深度強化學(xué)習(xí)算法大體上可分為三類,即值函數(shù)方法、策略搜索方法和混合型的行動者-執(zhí)行者(Actor-Critic,AC)算法。典型的深度強化學(xué)習(xí)算法包括DQN[7]、優(yōu)勢行動者-執(zhí)行者(Advantage Actor-Critic,A2C)[8]、確定性策略梯度(Deterministic Policy Gradient,DPG)[9]、置信區(qū)域策略優(yōu)化(Trust Region Policy Optimization,TRPO)[10]、近端策略優(yōu)化(Proximal Policy Optimization,PPO)[11]等。經(jīng)過實驗對比發(fā)現(xiàn),PPO算法的整體表現(xiàn)更優(yōu),常作為深度強化學(xué)習(xí)應(yīng)用中的首選算法。

    PPO算法是在TRPO算法的基礎(chǔ)上,使用截斷的方式構(gòu)建目標函數(shù),以保證新策略和舊策略的差異控制在一定范圍內(nèi),提高算法模型訓(xùn)練的穩(wěn)定性。

    1+ε)A(st,at))。

    (6)

    式中:ε為截斷系數(shù);rt(θ)為新策略和舊策略的比率,

    (7)

    變量A(st,at)為優(yōu)勢函數(shù),有助于在保持無偏差的情況下,盡可能地降低方差值,表達式為

    A(st,at)=Q(st,at)-V(st)。

    (8)

    (9)

    2 深度強化學(xué)習(xí)決策模型

    2.1 問題建模

    本文考慮經(jīng)典飛行射擊類游戲的任務(wù)場景,對抗雙方的智能體在模擬環(huán)境中各操控一架飛機從基地起飛,在飛行過程中智能體根據(jù)飛機傳感器探測到的對手信息和自身平臺的信息進行控制決策,以對飛機進行全方位的操控,包括飛行控制、雷達控制、電子戰(zhàn)控制、武器控制,最終達到擊落對方飛機的目的。

    針對上述飛行射擊類游戲場景,本文采用深度強化學(xué)習(xí)方法對其進行問題建模,明確深度強化學(xué)習(xí)算法模型的狀態(tài)空間、動作空間和獎勵。首先,在強化學(xué)習(xí)決策模型中,引入歷史狀態(tài)和動作信息作為狀態(tài)輸入,讓智能體進行游戲決策時可以顯式地獲取歷史信息。其次,將游戲過程中對最終勝負有貢獻的關(guān)鍵事件作為中間獎勵,以顯式引導(dǎo)智能體如何獲勝。這樣設(shè)計可以帶來以下三方面的好處:

    一是可以讓智能體更準確地掌握對手的狀態(tài)信息。在游戲過程中,對方飛機如果進入我方傳感器的探測范圍內(nèi),我方智能體只能獲得對手飛機的位置信息,無法獲得其航向和速度信息。通過引入上一時刻對手飛機的位置,智能體可以隱式獲得其航向和速度信息,可以幫助智能體更準確地進行飛行航向和速度控制決策。

    二是可以幫助智能體保持控制決策的一致性。飛行射擊類游戲?qū)儆诘湫偷拈L時序連續(xù)決策問題,引入歷史動作信息可以讓智能體顯式獲得過往動作,有利于其保持決策的一致性,在游戲過程中避免無意義的動作頻繁變更,比如無意義的大幅機動、連續(xù)發(fā)彈、雷達頻繁開關(guān)機等。

    三是可以幫助智能體更快地掌握獲勝方法。現(xiàn)有的強化學(xué)習(xí)方法通常只根據(jù)游戲的勝負設(shè)置獎勵,但飛行射擊類游戲單局游戲的時長通常為20 min左右,只根據(jù)最終的勝負進行獎勵反饋屬于典型的稀疏回報問題,智能體很難學(xué)習(xí)到有效策略。將游戲過程中對最終勝負有貢獻的關(guān)鍵事件作為中間獎勵,比如發(fā)現(xiàn)目標、武器發(fā)射等,可以引導(dǎo)智能體更快地學(xué)習(xí)到獲勝策略。

    本文采用PPO算法構(gòu)建飛行射擊類游戲智能決策模型,狀態(tài)空間來源于飛機傳感器探測到的對手信息和自身平臺的信息,包括飛機位置、傳感器狀態(tài)、武器狀態(tài)等共20項,動作空間包括飛機飛行控制、雷達控制、電子戰(zhàn)控制、武器控制共8項控制項,狀態(tài)空間、動作空間和獎勵的詳細信息分別如表1、表2和表3所示。

    智能體在每個時間步根據(jù)最新的環(huán)境狀態(tài)以及歷史環(huán)境狀態(tài)和動作進行動作決策,考慮到過多引入歷史信息會加大狀態(tài)空間,從而影響訓(xùn)練效率,本文在最新環(huán)境狀態(tài)的基礎(chǔ)上只引入上一步的歷史狀態(tài)和動作信息作為狀態(tài)輸入進行動作決策,游戲環(huán)境接收到?jīng)Q策動作進行環(huán)境狀態(tài)更新并反饋獎勵。重復(fù)上述過程直到游戲結(jié)束。

    表1 狀態(tài)空間詳細信息

    表2 動作空間詳細信息

    表3 獎勵詳細信息

    為了緩解智能體與游戲環(huán)境頻繁通信交互導(dǎo)致的訓(xùn)練時間過長的問題,以及智能體頻繁決策動作變更導(dǎo)致的前后決策不一致的問題,智能體的1個時間步對應(yīng)游戲環(huán)境中的10個推進周期,即1次動作指令在10個游戲推進周期內(nèi)執(zhí)行。

    2.2 無效動作掩膜

    在強化學(xué)習(xí)中,智能體在探索階段可以在整個動作空間內(nèi)進行試錯探索。但是,針對特定的環(huán)境狀態(tài),可能存在無效或者不合理的動作。智能體一旦探索到這些無效或者不合理的動作,會導(dǎo)致模型訓(xùn)練收斂的時間變長。通常,任務(wù)場景的動作空間越大,其中無效或不合理的動作越多。

    針對飛行射擊類游戲而言,其中存在的無效或者不合理的動作包括尚未發(fā)現(xiàn)對方飛機卻大幅機動轉(zhuǎn)彎;雷達尚未探測到對方飛機卻發(fā)射武器;對方雷達尚未探測到我方飛機(對方雷達狀態(tài)為關(guān)機或掃描)卻電子戰(zhàn)開機干擾。因此,本文采用無效動作掩膜[12]的方式避免智能體進行無效或不合理的探索,以提高模型的訓(xùn)練收斂速度。

    在PPO算法中,策略網(wǎng)絡(luò)輸出為未歸一化的概率(logits),然后經(jīng)過softmax操作轉(zhuǎn)變?yōu)闅w一化的概率值,根據(jù)不同動作的概率分布來進行動作選擇。

    (10)

    當某個動作是無效或不合理時,只需要將對應(yīng)策略網(wǎng)絡(luò)輸出(logits)替換為無窮小的值(如-1×108),則經(jīng)過softmax操作后該動作被選擇的概率趨近于0,以此來實現(xiàn)該動作的禁用。

    同時,當某個時間步智能體采用了無效動作掩膜禁用某個動作時,對應(yīng)的策略梯度為0,從而保證了替換操作不會給策略網(wǎng)絡(luò)參數(shù)帶來負面影響。證明如下。

    (11)

    式中:N為樣本數(shù)據(jù)總量;Rk是第k條樣本的累積獎勵。

    針對式(11)中的梯度計算部分進行公式推導(dǎo):

    (12)

    (13)

    (14)

    假設(shè)在某個時間步,智能體采用無效動作掩膜禁用了動作a0,并按照動作概率分布選擇執(zhí)行動作a1,則在式(14)中,i=1,無效動作a0對應(yīng)的梯度為

    (15)

    因此,證明得到無效動作掩膜對應(yīng)的策略梯度為0,策略網(wǎng)絡(luò)參數(shù)的更新不受動作掩膜的影響,從而保證了替換操作不會給策略網(wǎng)絡(luò)參數(shù)帶來負面影響。

    為了驗證上述計算過程的正確性,在接收到最新的環(huán)境狀態(tài)時,人為將對方飛機的信息屏蔽來模擬尚未發(fā)現(xiàn)對方飛機的情況,在此情況下,智能體輸出的機動決策均為保持直飛,證明無效動作掩膜確實屏蔽了無效的大幅機動。同時,對比了該情況下策略網(wǎng)絡(luò)模型更新前后的網(wǎng)絡(luò)參數(shù)值,發(fā)現(xiàn)網(wǎng)絡(luò)參數(shù)值未發(fā)生改變,證明無效動作掩膜對應(yīng)的策略梯度確實為0,不會給策略網(wǎng)絡(luò)參數(shù)帶來負面影響。

    3 仿真結(jié)果及分析

    3.1 仿真場景設(shè)置

    本文所提的PPO智能決策算法模型是在Stable Baselines[13]中PPO2算法源代碼的基礎(chǔ)上增加無效動作掩膜實現(xiàn)的,并調(diào)用該算法庫中的矢量化環(huán)境模塊(Subproc Vec)實現(xiàn)多進程并行采樣。矢量化環(huán)境是一種將多重獨立環(huán)境堆疊成單一環(huán)境的方法,可以實現(xiàn)同時在多個環(huán)境上進行并行交互采樣,以提高智能體的探索效率。

    游戲環(huán)境則是基于OpenAI Gym框架[14]對飛行射擊類游戲進行封裝。智能體與游戲平臺之間采用用戶數(shù)據(jù)包協(xié)議(User Datagram Protocol,UDP)通信,通過最基本的套接字的方式進行信息交互,以減少網(wǎng)絡(luò)堵塞,縮短通信時間。

    本文中設(shè)定的任務(wù)區(qū)域如圖1所示,分為待戰(zhàn)區(qū)和自由交戰(zhàn)區(qū),待戰(zhàn)區(qū)的大小為15 km×25 km,自由交戰(zhàn)區(qū)的大小為150 km×25 km。對抗雙方的初始經(jīng)緯度可在各自待戰(zhàn)區(qū)內(nèi)任意選擇,雙方飛機初始航向為東西方向?qū)︼w,初始高度均為8 000 m,初始速度均為1Ma。

    圖1 游戲任務(wù)區(qū)域場景示意圖

    決策智能體的訓(xùn)練集為3個固定場景,采用相對態(tài)勢的思路,敵方飛機的初始經(jīng)緯度保持在其待戰(zhàn)區(qū)的中心位置,我方飛機的初始經(jīng)緯度分別在其待戰(zhàn)區(qū)的上方(-12.5 km)、中間(0 km)、下方(12.5 km)。測試集為100個隨機場景,對抗雙方飛機的初始經(jīng)緯度在各自待戰(zhàn)區(qū)內(nèi)隨機生成。

    3.2 訓(xùn)練結(jié)果

    在深度強化學(xué)習(xí)算法模型的訓(xùn)練中,超參數(shù)的設(shè)置對模型訓(xùn)練的影響較大,尤其是學(xué)習(xí)率的合理設(shè)置尤為重要。本文通過對比不同學(xué)習(xí)率情況下的損失函數(shù)收斂曲線和隨機測試場景對抗勝率收斂曲線來進行學(xué)習(xí)率的選擇。其中,隨機測試場景對抗勝率用于驗證決策智能體對不同任務(wù)場景的適應(yīng)性,采用100個隨機場景,每訓(xùn)練10個回合測試一次,從而展現(xiàn)訓(xùn)練過程中決策智能體對抗勝率的變化。

    圖2為學(xué)習(xí)率分別設(shè)置為10-5、10-4、10-3時決策智能體損失函數(shù)的收斂曲線。從圖中可以看出,隨著學(xué)習(xí)率的不斷增大,損失函數(shù)收斂得更快,損失值更小。當學(xué)習(xí)率設(shè)置為10-3時,損失函數(shù)收斂到0.000 5附近。

    圖2 損失函數(shù)收斂曲線

    圖3為學(xué)習(xí)率分別設(shè)置為10-5、10-4、10-3時決策智能體隨機測試場景對抗勝率的收斂曲線。從圖中可以看出,當學(xué)習(xí)率為10-5時,智能體幾乎不能找到有效的策略,平均勝率在15%左右;當學(xué)習(xí)率為10-4時,智能體在訓(xùn)練150個回合后平均勝率在50%左右;當學(xué)習(xí)率為10-3時,決策智能體在訓(xùn)練150個回合后可以穩(wěn)定達到80%左右的對抗勝率。

    圖3 決策智能體測試勝率收斂曲線

    本文中算法模型的訓(xùn)練超參數(shù)設(shè)置如表4所示。

    表4 超參數(shù)設(shè)置

    為了驗證引入歷史狀態(tài)和動作信息以及無效動作掩膜對模型訓(xùn)練的影響,對比了只引入歷史狀態(tài)和動作信息、只引入無效動作掩膜情況下的回報收斂曲線,如圖4所示??梢钥闯觯コ龤v史狀態(tài)和動作信息或者去除無效動作掩膜均無法獲得高回報,智能體無法學(xué)習(xí)到有效的策略。以上結(jié)果表明,通過在PPO算法模型的基礎(chǔ)上引入歷史狀態(tài)和動作信息以及無效動作掩膜可以引導(dǎo)智能體更容易學(xué)習(xí)到獲勝策略,可以顯著提高模型收斂效果。

    圖4 游戲回報變化曲線對比

    4 結(jié)束語

    針對傳統(tǒng)深度強化學(xué)習(xí)算法難以快速解決長時序復(fù)雜任務(wù)的問題,本文在經(jīng)典PPO算法的基礎(chǔ)上提出了一種引入歷史信息和人類知識的深度強化學(xué)習(xí)方法。首先,在輸入狀態(tài)中引入歷史狀態(tài)和動作信息,讓智能體可以顯式獲取歷史信息,以幫助智能體更準確掌握對手狀態(tài)和保持自身決策的一致性。其次,在策略模型中引入無效動作掩膜,避免智能體進行無效或不合理的探索,以提升探索效率。本文通過仿真試驗驗證了所提方法的有效性,對比試驗結(jié)果表明所提方法可顯著提升智能體的探索效率,可引導(dǎo)智能體學(xué)習(xí)到有效策略。

    與其他深度強化學(xué)習(xí)模型一樣,由于神經(jīng)網(wǎng)絡(luò)的高度擬合性導(dǎo)致智能體的行為決策機理難以解釋,后續(xù)將對智能體行為的可解釋性進行研究。

    猜你喜歡
    掩膜決策深度
    利用掩膜和單應(yīng)矩陣提高LK光流追蹤效果
    一種結(jié)合圖像分割掩膜邊緣優(yōu)化的B-PointRend網(wǎng)絡(luò)方法
    為可持續(xù)決策提供依據(jù)
    深度理解一元一次方程
    決策為什么失誤了
    深度觀察
    深度觀察
    深度觀察
    光纖激光掩膜微細電解復(fù)合加工裝置研發(fā)
    多層陰影掩膜結(jié)構(gòu)及其制造和使用方法
    科技資訊(2016年21期)2016-05-30 18:49:07
    在线观看免费日韩欧美大片 | 精品一区二区三卡| 一级片'在线观看视频| 秋霞伦理黄片| 日韩精品有码人妻一区| 九九在线视频观看精品| 国产精品99久久久久久久久| 国产日韩欧美视频二区| 国产精品久久久久成人av| 亚洲av电影在线观看一区二区三区| 男人舔奶头视频| 精品久久久噜噜| 国产色婷婷99| 最后的刺客免费高清国语| 老司机影院毛片| 色5月婷婷丁香| 国产精品伦人一区二区| 日韩三级伦理在线观看| 少妇高潮的动态图| 中文字幕久久专区| 久久久久精品性色| 国产伦精品一区二区三区视频9| 26uuu在线亚洲综合色| 99视频精品全部免费 在线| 内射极品少妇av片p| 欧美老熟妇乱子伦牲交| 日韩电影二区| 国产日韩欧美在线精品| 精品99又大又爽又粗少妇毛片| 日韩精品有码人妻一区| 看免费成人av毛片| 久久久久久久大尺度免费视频| 简卡轻食公司| 男男h啪啪无遮挡| 搡老乐熟女国产| 国产精品免费大片| 日韩精品有码人妻一区| 黄片无遮挡物在线观看| 欧美xxⅹ黑人| 国产免费又黄又爽又色| 国产91av在线免费观看| 亚洲国产毛片av蜜桃av| 国产伦理片在线播放av一区| 国产免费福利视频在线观看| 欧美日韩精品成人综合77777| 日韩av不卡免费在线播放| 日本午夜av视频| 色吧在线观看| 精品久久久久久久久av| 国产成人a∨麻豆精品| 精品一区二区三区视频在线| 免费看av在线观看网站| 久久精品熟女亚洲av麻豆精品| 国产一区二区三区综合在线观看 | 亚洲一区二区三区欧美精品| 久久精品久久久久久噜噜老黄| 一本—道久久a久久精品蜜桃钙片| av一本久久久久| 少妇猛男粗大的猛烈进出视频| 下体分泌物呈黄色| 久久久久久久大尺度免费视频| 久久这里有精品视频免费| 欧美激情国产日韩精品一区| 国产精品一区二区性色av| av播播在线观看一区| 桃花免费在线播放| 少妇猛男粗大的猛烈进出视频| 最近的中文字幕免费完整| 蜜桃久久精品国产亚洲av| 久久婷婷青草| 男女免费视频国产| 我的女老师完整版在线观看| 在线观看免费高清a一片| 亚洲欧美清纯卡通| 三上悠亚av全集在线观看 | 免费大片黄手机在线观看| 精品国产露脸久久av麻豆| 亚洲精品亚洲一区二区| 国产精品国产三级国产av玫瑰| 偷拍熟女少妇极品色| 国产在视频线精品| 久久久久久久国产电影| 国产伦理片在线播放av一区| 在线观看av片永久免费下载| 五月玫瑰六月丁香| 国产精品福利在线免费观看| 亚洲国产欧美在线一区| 国产免费视频播放在线视频| 一级av片app| 午夜影院在线不卡| 中文字幕久久专区| 精品人妻熟女毛片av久久网站| 老司机影院毛片| 国产亚洲5aaaaa淫片| 777米奇影视久久| 午夜免费鲁丝| 免费看日本二区| 久久狼人影院| 夜夜看夜夜爽夜夜摸| 日本av免费视频播放| 爱豆传媒免费全集在线观看| 少妇猛男粗大的猛烈进出视频| 51国产日韩欧美| 中文字幕亚洲精品专区| 国产精品99久久久久久久久| 国产欧美亚洲国产| 国产高清不卡午夜福利| 最新中文字幕久久久久| 噜噜噜噜噜久久久久久91| 成人无遮挡网站| 性色av一级| 精品一区二区三卡| 99视频精品全部免费 在线| 国产真实伦视频高清在线观看| av又黄又爽大尺度在线免费看| 久久6这里有精品| 亚洲精品成人av观看孕妇| 国产色爽女视频免费观看| 欧美激情极品国产一区二区三区 | 一本一本综合久久| av线在线观看网站| 久久鲁丝午夜福利片| 一区二区三区精品91| 七月丁香在线播放| 91久久精品国产一区二区成人| 97精品久久久久久久久久精品| av黄色大香蕉| 欧美日本中文国产一区发布| 99国产精品免费福利视频| 777米奇影视久久| 男女边摸边吃奶| 色网站视频免费| 国产精品99久久久久久久久| 欧美成人精品欧美一级黄| 国产精品久久久久成人av| 国产成人免费无遮挡视频| 日本爱情动作片www.在线观看| 老司机影院成人| 国产精品久久久久久精品古装| 久久精品国产a三级三级三级| 精品99又大又爽又粗少妇毛片| 嘟嘟电影网在线观看| 97精品久久久久久久久久精品| 韩国av在线不卡| 国产美女午夜福利| 最近2019中文字幕mv第一页| 99热6这里只有精品| 欧美xxxx性猛交bbbb| 久久久a久久爽久久v久久| 99国产精品免费福利视频| 亚洲av国产av综合av卡| 自拍欧美九色日韩亚洲蝌蚪91 | 中文字幕亚洲精品专区| 久久国产精品大桥未久av | 一级毛片我不卡| 三级国产精品片| 婷婷色av中文字幕| 国产成人精品一,二区| 看十八女毛片水多多多| 一区二区三区精品91| 97在线视频观看| 插阴视频在线观看视频| 18禁动态无遮挡网站| av专区在线播放| 国产成人精品久久久久久| 成年美女黄网站色视频大全免费 | 日产精品乱码卡一卡2卡三| 极品人妻少妇av视频| av国产精品久久久久影院| 曰老女人黄片| 久久久国产精品麻豆| 色吧在线观看| 18禁动态无遮挡网站| 国产成人精品久久久久久| 久久久久人妻精品一区果冻| 国产在线一区二区三区精| 国产熟女欧美一区二区| 观看美女的网站| 狠狠精品人妻久久久久久综合| .国产精品久久| 街头女战士在线观看网站| 欧美另类一区| 建设人人有责人人尽责人人享有的| 日韩欧美一区视频在线观看 | 亚洲精品亚洲一区二区| 狂野欧美激情性xxxx在线观看| 男女边吃奶边做爰视频| 水蜜桃什么品种好| 91成人精品电影| 美女脱内裤让男人舔精品视频| 我的老师免费观看完整版| 少妇被粗大猛烈的视频| 日韩中字成人| 亚洲激情五月婷婷啪啪| 黄色配什么色好看| 欧美老熟妇乱子伦牲交| 久久毛片免费看一区二区三区| 自线自在国产av| 18禁动态无遮挡网站| 色视频www国产| 女的被弄到高潮叫床怎么办| 51国产日韩欧美| 极品教师在线视频| 水蜜桃什么品种好| 欧美少妇被猛烈插入视频| 黑人高潮一二区| 精品久久久久久电影网| av在线观看视频网站免费| 老司机影院毛片| 亚洲国产精品国产精品| 中文乱码字字幕精品一区二区三区| 久久97久久精品| 欧美丝袜亚洲另类| 久久久久久久大尺度免费视频| 麻豆成人av视频| 成人综合一区亚洲| 国产毛片在线视频| 大又大粗又爽又黄少妇毛片口| 成人美女网站在线观看视频| 免费人成在线观看视频色| 国产av一区二区精品久久| 亚洲三级黄色毛片| 久久精品国产a三级三级三级| 丝袜喷水一区| 黄色欧美视频在线观看| 赤兔流量卡办理| 女人久久www免费人成看片| 国产在线视频一区二区| 日韩av不卡免费在线播放| 国产精品成人在线| 亚洲天堂av无毛| 国产伦精品一区二区三区视频9| 少妇的逼好多水| 9色porny在线观看| 在线观看三级黄色| 成人18禁高潮啪啪吃奶动态图 | 亚洲国产精品成人久久小说| 自拍偷自拍亚洲精品老妇| 男女无遮挡免费网站观看| 免费看光身美女| 日本黄色日本黄色录像| 午夜福利在线观看免费完整高清在| 老司机影院毛片| 免费看不卡的av| 日本91视频免费播放| 日韩欧美一区视频在线观看 | 亚洲丝袜综合中文字幕| 亚洲av在线观看美女高潮| 国产中年淑女户外野战色| 免费黄频网站在线观看国产| 亚洲精品国产av蜜桃| 欧美精品高潮呻吟av久久| a级一级毛片免费在线观看| 少妇被粗大的猛进出69影院 | 一级片'在线观看视频| 有码 亚洲区| 少妇人妻久久综合中文| 这个男人来自地球电影免费观看 | 国产一级毛片在线| 国产深夜福利视频在线观看| 亚洲成人av在线免费| 久久久久人妻精品一区果冻| av专区在线播放| 日本vs欧美在线观看视频 | 日本-黄色视频高清免费观看| 久久久久久久精品精品| 亚洲精品一二三| 国产一区亚洲一区在线观看| 免费黄网站久久成人精品| 亚洲av国产av综合av卡| 国产 精品1| 在线播放无遮挡| 国产女主播在线喷水免费视频网站| 成人午夜精彩视频在线观看| freevideosex欧美| 成人18禁高潮啪啪吃奶动态图 | 国产极品天堂在线| 2018国产大陆天天弄谢| 国产老妇伦熟女老妇高清| 亚洲av成人精品一区久久| 国产av精品麻豆| 亚洲欧洲国产日韩| 国产免费视频播放在线视频| 国产在线一区二区三区精| 亚洲欧美清纯卡通| 蜜桃在线观看..| 国内揄拍国产精品人妻在线| 亚洲婷婷狠狠爱综合网| 中文字幕久久专区| 色吧在线观看| 丁香六月天网| 中国三级夫妇交换| 又爽又黄a免费视频| 精品国产乱码久久久久久小说| 最近的中文字幕免费完整| 国产成人精品久久久久久| 好男人视频免费观看在线| 一个人看视频在线观看www免费| 国产精品三级大全| 美女中出高潮动态图| 99久久中文字幕三级久久日本| 嘟嘟电影网在线观看| 免费高清在线观看视频在线观看| 秋霞在线观看毛片| 男女啪啪激烈高潮av片| 国产 精品1| 国产成人精品久久久久久| 亚洲国产最新在线播放| 亚洲av二区三区四区| 免费观看性生交大片5| 尾随美女入室| 青青草视频在线视频观看| 国产精品国产av在线观看| 一级片'在线观看视频| 久久久国产欧美日韩av| 97超视频在线观看视频| 日本91视频免费播放| 99久久精品热视频| 又爽又黄a免费视频| 最新中文字幕久久久久| 亚洲不卡免费看| 日本色播在线视频| 亚洲av不卡在线观看| 自拍偷自拍亚洲精品老妇| 久久久久国产精品人妻一区二区| 纵有疾风起免费观看全集完整版| 在线 av 中文字幕| 中文天堂在线官网| 欧美xxxx性猛交bbbb| 成人毛片60女人毛片免费| 久久国内精品自在自线图片| 日本黄大片高清| 性色avwww在线观看| 女性生殖器流出的白浆| 91久久精品国产一区二区成人| 免费看光身美女| 欧美日韩视频高清一区二区三区二| 欧美变态另类bdsm刘玥| 国产精品一区二区在线不卡| 国产毛片在线视频| 国产黄片视频在线免费观看| 麻豆成人av视频| 在线观看国产h片| 两个人免费观看高清视频 | 不卡视频在线观看欧美| 国产av国产精品国产| 国产成人freesex在线| 色视频在线一区二区三区| 亚洲无线观看免费| 日本爱情动作片www.在线观看| 国产成人一区二区在线| 国产日韩一区二区三区精品不卡 | 伦精品一区二区三区| 亚洲精品国产色婷婷电影| av视频免费观看在线观看| 少妇的逼好多水| 日韩精品免费视频一区二区三区 | 国产熟女欧美一区二区| 大香蕉97超碰在线| 精品国产露脸久久av麻豆| 能在线免费看毛片的网站| 久久国产精品大桥未久av | 亚洲精品亚洲一区二区| 99热这里只有是精品在线观看| 一级,二级,三级黄色视频| 最近2019中文字幕mv第一页| 久久99精品国语久久久| 香蕉精品网在线| 美女主播在线视频| 老熟女久久久| 免费不卡的大黄色大毛片视频在线观看| 91成人精品电影| 亚洲一级一片aⅴ在线观看| 观看免费一级毛片| 少妇的逼好多水| 国产乱人偷精品视频| 肉色欧美久久久久久久蜜桃| 插逼视频在线观看| 国产一区亚洲一区在线观看| a 毛片基地| 国产白丝娇喘喷水9色精品| 亚洲内射少妇av| 久久久久久人妻| freevideosex欧美| 一本大道久久a久久精品| 国产成人freesex在线| 免费久久久久久久精品成人欧美视频 | 国语对白做爰xxxⅹ性视频网站| 18+在线观看网站| 18禁裸乳无遮挡动漫免费视频| 如何舔出高潮| 亚洲av国产av综合av卡| 色婷婷久久久亚洲欧美| 黄色配什么色好看| 噜噜噜噜噜久久久久久91| 另类亚洲欧美激情| 黄色怎么调成土黄色| 久久精品国产亚洲av涩爱| 黄色怎么调成土黄色| 国产成人精品福利久久| 一本久久精品| 午夜福利网站1000一区二区三区| 久久久久精品性色| 日产精品乱码卡一卡2卡三| 日本黄色片子视频| 成人国产麻豆网| av在线app专区| 十分钟在线观看高清视频www | 菩萨蛮人人尽说江南好唐韦庄| 91成人精品电影| 自拍欧美九色日韩亚洲蝌蚪91 | 久久99热这里只频精品6学生| 国产一区二区三区综合在线观看 | 午夜免费鲁丝| av天堂中文字幕网| 国内精品宾馆在线| 国产永久视频网站| 国产视频内射| 视频区图区小说| 久久精品国产鲁丝片午夜精品| 亚洲av.av天堂| 夜夜爽夜夜爽视频| 亚洲国产精品一区三区| 日韩熟女老妇一区二区性免费视频| 能在线免费看毛片的网站| 国产免费福利视频在线观看| 少妇 在线观看| 如日韩欧美国产精品一区二区三区 | 国产精品嫩草影院av在线观看| 伊人亚洲综合成人网| 国产精品国产三级国产专区5o| 亚洲欧美精品专区久久| 国产91av在线免费观看| av免费在线看不卡| 80岁老熟妇乱子伦牲交| 天堂8中文在线网| 欧美日本中文国产一区发布| 日韩欧美精品免费久久| 欧美xxⅹ黑人| 在线免费观看不下载黄p国产| 一区二区三区精品91| 中文字幕亚洲精品专区| 爱豆传媒免费全集在线观看| 久久久欧美国产精品| 人人澡人人妻人| 国产精品一区二区三区四区免费观看| 性色avwww在线观看| 午夜福利网站1000一区二区三区| 国产69精品久久久久777片| 亚洲精品日韩av片在线观看| 中文在线观看免费www的网站| 啦啦啦在线观看免费高清www| 80岁老熟妇乱子伦牲交| 亚洲欧洲国产日韩| 国产69精品久久久久777片| 久久99蜜桃精品久久| 成人二区视频| 我的女老师完整版在线观看| 80岁老熟妇乱子伦牲交| av天堂久久9| 久久久久久久久久成人| 最后的刺客免费高清国语| 成人毛片a级毛片在线播放| 性色av一级| 亚洲怡红院男人天堂| 成人综合一区亚洲| 国产综合精华液| 老司机影院毛片| av女优亚洲男人天堂| 在线观看免费日韩欧美大片 | 国产成人精品福利久久| 热99国产精品久久久久久7| 日日啪夜夜撸| av线在线观看网站| 男女边吃奶边做爰视频| 九草在线视频观看| 色婷婷久久久亚洲欧美| 日本av免费视频播放| 十八禁高潮呻吟视频 | 亚洲久久久国产精品| 男男h啪啪无遮挡| 亚洲av日韩在线播放| 国产亚洲一区二区精品| 99热网站在线观看| 99久久精品一区二区三区| 免费大片18禁| 亚洲成人av在线免费| 国产成人aa在线观看| 婷婷色综合大香蕉| 久久国产精品男人的天堂亚洲 | 欧美少妇被猛烈插入视频| 成年人免费黄色播放视频 | 色94色欧美一区二区| 2021少妇久久久久久久久久久| 日产精品乱码卡一卡2卡三| 自线自在国产av| 精品久久久久久久久av| www.av在线官网国产| 高清欧美精品videossex| 日韩av在线免费看完整版不卡| 久热久热在线精品观看| 丰满人妻一区二区三区视频av| kizo精华| 精品少妇内射三级| 欧美精品人与动牲交sv欧美| 狠狠精品人妻久久久久久综合| 自拍欧美九色日韩亚洲蝌蚪91 | 最近手机中文字幕大全| 久久99精品国语久久久| 丁香六月天网| 美女xxoo啪啪120秒动态图| 色网站视频免费| 亚洲欧美日韩另类电影网站| 日韩不卡一区二区三区视频在线| 久热这里只有精品99| 91久久精品国产一区二区成人| 两个人的视频大全免费| 中文字幕制服av| 一级片'在线观看视频| 国产在线视频一区二区| 国产片特级美女逼逼视频| 黄片无遮挡物在线观看| 久久久久久久亚洲中文字幕| 成人漫画全彩无遮挡| 夫妻性生交免费视频一级片| 秋霞在线观看毛片| 亚洲av男天堂| 在线播放无遮挡| 人妻人人澡人人爽人人| 久久99蜜桃精品久久| 久久久国产欧美日韩av| 在线观看美女被高潮喷水网站| 欧美日韩一区二区视频在线观看视频在线| 色视频www国产| 一本—道久久a久久精品蜜桃钙片| 久久av网站| 插阴视频在线观看视频| 中文欧美无线码| 一级爰片在线观看| av国产精品久久久久影院| 国产成人精品无人区| 国产一级毛片在线| 国产亚洲欧美精品永久| 国产精品.久久久| 狂野欧美激情性bbbbbb| 亚洲综合色惰| 国产成人一区二区在线| 男人和女人高潮做爰伦理| 国产熟女午夜一区二区三区 | 亚洲精品自拍成人| av黄色大香蕉| 国产综合精华液| 男女免费视频国产| 狠狠精品人妻久久久久久综合| 夫妻午夜视频| 成人亚洲欧美一区二区av| 97精品久久久久久久久久精品| 国产成人91sexporn| 国产精品人妻久久久久久| 一本久久精品| 亚洲天堂av无毛| 国产淫语在线视频| av国产精品久久久久影院| 美女大奶头黄色视频| 国产爽快片一区二区三区| √禁漫天堂资源中文www| av福利片在线观看| 在线观看www视频免费| 自拍欧美九色日韩亚洲蝌蚪91 | 曰老女人黄片| 九九久久精品国产亚洲av麻豆| 亚洲欧美成人精品一区二区| 免费观看的影片在线观看| av免费观看日本| 人妻 亚洲 视频| 美女内射精品一级片tv| 国产黄频视频在线观看| 久久久久久久亚洲中文字幕| 亚洲欧美日韩卡通动漫| 亚洲一区二区三区欧美精品| 日本91视频免费播放| 国产高清有码在线观看视频| 男的添女的下面高潮视频| 久久久久久久久久久丰满| 久久久久人妻精品一区果冻| 制服丝袜香蕉在线| 成年av动漫网址| 亚洲精品国产成人久久av| 国产av精品麻豆| 美女视频免费永久观看网站| 国产精品欧美亚洲77777| 国产精品一区二区在线观看99| 色视频www国产| 高清av免费在线| 久久国产精品大桥未久av | 免费不卡的大黄色大毛片视频在线观看| 久久精品国产亚洲av涩爱| 国产精品99久久99久久久不卡 | 日本欧美国产在线视频| 视频区图区小说| 亚洲无线观看免费| 亚洲国产精品成人久久小说| 亚洲综合色惰| 人妻制服诱惑在线中文字幕| 日韩 亚洲 欧美在线| 国产成人91sexporn| 伊人久久精品亚洲午夜| 少妇 在线观看| 国产一区亚洲一区在线观看| 国产精品.久久久| 久久99热6这里只有精品| 久久人人爽人人爽人人片va| 黑丝袜美女国产一区| 如何舔出高潮| 国产精品一区二区在线不卡|