• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于優(yōu)先級經(jīng)驗回放的SAC強化學習算法

    2021-04-22 09:19:06劉慶強劉鵬云
    吉林大學學報(信息科學版) 2021年2期
    關鍵詞:經(jīng)驗誤差樣本

    劉慶強, 劉鵬云

    (東北石油大學 電氣信息工程學院, 黑龍江 大慶 163318)

    0 引 言

    相對于有監(jiān)督學習需要人工標注數(shù)據(jù)集標簽進行學習, 強化學習算法通過自行與環(huán)境(Environment)交互, 嘗試最大化從環(huán)境中得到的獎勵(Reward)獲得最優(yōu)的策略。在DQN(Deep Q-Learning)算法[1]之后, 強化學習與深度神經(jīng)網(wǎng)絡相結合, 使強化學習算法能處理更復雜, 維度更高的問題, 其表現(xiàn)效果得到了迅速提升, 并在圍棋[2-3]、 游戲[4-5]、 投資交易[6-8]、 推薦系統(tǒng)[9-10]以及導航規(guī)劃[11-12]上得到了廣泛應用。

    強化學習算法[13]總體可被分為三大類: Actor方法, Critic方法和Actor-Critic方法。Actor方法直接嘗試學習出最優(yōu)決策過程; Critic方法通過評估當前狀態(tài)采取不同動作可得到的累計回報期望, 選擇期望最大的動作間接學習最優(yōu)策略; Actor-Critic是兩種算法的結合, 算法的Critic部分學習以更好的誤差擬合值函數(shù), Actor與環(huán)境交互并根據(jù)Critic的反饋迭代自身參數(shù), 嘗試學習出最優(yōu)策略。

    近期, 深度強化學習領域獲得了顯著的研究進展, OpenAI提出基于隱式課程學習模式[14]的強化學習算法, 使智能體可以不斷找到新任務, 學習新策略。Mendonca等[15]提出基于監(jiān)督學習的元強化學習算法, 能有效幫助探索, 利于在稀疏獎勵環(huán)境中有效學習。Efroni等[16]提出基于有限時域前瞻策略(Finite-Horizon Lookahead Policies)的強化學習算法, 利用最佳樹路徑返回值備份根節(jié)點后代值, 取得了良好的效果。Ciosek等[17]提出OAC(Optimistic Actor Critic)算法, 使用兩個置信區(qū)間估計value值, 高的指導探索, 低的防止過擬合。Haarnoja等[18]提出SAC(Soft Actor Critic)算法, 通過引入最大熵增強了Actor Critic算法的探索能力和穩(wěn)定性, 并在隨后的升級算法[19]中加入了熵權重的自動調(diào)整, 在訓練前期熵部分的權重較大, 引導Agent更主動探索環(huán)境, 并在后期逐漸衰減熵的權重, 讓Agent收斂更加穩(wěn)定。

    針對SAC算法中經(jīng)驗池所有樣本都以等概率隨機采樣, 忽略不同樣本具有不同重要性的信息, 造成訓練速度慢, 訓練過程不穩(wěn)定的缺點, 筆者提出基于優(yōu)先級經(jīng)驗采樣的SAC算法(PER-SAC: Prioritized Experience Replay Soft Actor Critic), 通過在訓練過程中引入優(yōu)先級經(jīng)驗采樣機制, 同時根據(jù)Critic和Actor的誤差計算TD(Temporal-Difference)誤差, 使TD誤差較大的樣本有更大的概率被采樣及訓練, 并使網(wǎng)絡優(yōu)先訓練估值誤差較大和策略表現(xiàn)不好的樣本。實驗結果表明, 所提PER-SAC(Prioritized Experience Replay Soft Actor Critic)算法訓練效率和穩(wěn)定性相較于原始SAC算法有明顯提升, 具有較好的性能。

    1 強化學習, SAC算法及優(yōu)先經(jīng)驗回放

    1.1 強化學習

    (1)

    其動作值Qπ(s,a)=E[Rt|st=s,a], 則最優(yōu)策略為始終選擇當前狀態(tài)下Q值最大的動作, 可表示為

    (2)

    通過Bellman方程迭代動作值函數(shù)可表示為

    Q*(st,at)=E[rt+γmaxQ*(st+1,at+1)]

    (3)

    在引入深度神經(jīng)網(wǎng)絡后, 強化學習算法中動作值函數(shù)Q和狀態(tài)值函數(shù)V都可以使用多層神經(jīng)網(wǎng)絡近似, 深度神經(jīng)網(wǎng)絡理論上可以擬合任意復雜度的函數(shù), 該特性使強化學習算法能被用于解決更加復雜的控制和決策問題。但神經(jīng)網(wǎng)絡具備的“黑盒”復雜特性, 也使深度強化學習算法面臨訓練效率低, 穩(wěn)定性差, 對超參數(shù)敏感等問題。

    1.2 SAC算法

    SAC算法通過在原有的直接最大化獎勵期望的基礎上, 引入了最大熵, 此時算法的目標變成同時最大化獎勵期望和熵, 可表示如下

    (4)

    其中H是策略π在狀態(tài)st時的動作的熵,α是權重系數(shù)。通過引入熵鼓勵策略探索更多動作, 與PPO(Proximal Policy Optimization)[20], A3C(Asynchronous Advantage Actor-Critic)[21]等算法將動作熵作為正則項不同, SAC直接將最大化熵內(nèi)置于目標函數(shù)中。SAC算法分為2部分: 策略評估和策略提升。

    策略評估。SAC算法定義SoftQ值如下

    Qsoft(st,at)=r(st,at)+γE[Vsoft(st+1)]

    (5)

    Soft版本狀態(tài)值函數(shù)V定義如下

    Vsoft(st)=E[Q(st,at)]-logπ(at|st)

    (6)

    策略提升。使用KL散度(Kullback-Leibler Divergence)優(yōu)化策略

    (7)

    其中Zπold(st)是歸一化分布配分函數(shù)。策略πφ的輸出是一個概率分布, SAC算法中使用了重參數(shù)技巧(Reparameterization Trick), 將策略πφ重新定義為

    at=fφ(εt;st)

    (8)

    其中εt是重參數(shù)技巧中隨機變量。根據(jù)上述定義, 訓練過程中, Soft Q函數(shù)的更新梯度為

    (9)

    φJπ(φ)=φlogπφ(at,st)+(atlogπφ(at,st)-atQ(at,st))φfφ(εt;st)

    (10)

    SAC算法還支持自動調(diào)整熵的溫度系數(shù)α, 算法初始溫度系數(shù)較大, 鼓勵智能體進行探索, 隨著智能體慢慢收斂, 溫度系數(shù)能自適應衰減。

    1.3 優(yōu)先經(jīng)驗回放

    SAC算法訓練時, 隨機從經(jīng)驗池(Replay Buffer)中抽取一批樣本訓練, 不同樣本間被選中的概率相等。優(yōu)先經(jīng)驗回放通過賦予更重要的樣本較大的權重, 訓練采樣時權重較大的樣本能以更大的概率被抽取到, 因此, 如何確定樣本的權重是關鍵問題。強化學習算法通過TD誤差衡量算法修正幅度, TD誤差的絕對值越大, 說明該樣本對網(wǎng)絡的校正效果越大。另外, TD誤差較大的樣本, 可能是該狀態(tài)出現(xiàn)的次數(shù)較少, 智能體對該狀態(tài)不熟悉故而表現(xiàn)不佳, 提高此類樣本的出現(xiàn)概率能提高樣本利用率, 加快智能體的學習速度。在優(yōu)先級經(jīng)驗回放DQN[22]算法中, TD誤差δj定義為

    δj=r(st,at)+λQ′(st+1,at+1)-Q(st,at)

    (11)

    其中Q,Q′分別是Q網(wǎng)絡和targetQ網(wǎng)絡。樣本j的采樣概率

    (12)

    其中參數(shù)λ是優(yōu)先級控制系數(shù),δj是樣本j的權重系數(shù)。使用概率采樣機制能保證TD誤差較小的樣本仍然可以被采樣, 保證了算法訓練時樣本的多樣性。優(yōu)先級回放改變了樣本的采樣頻率, 因此需要引入重要性采樣更新樣本計算梯度時的誤差權重

    (13)

    2 基于優(yōu)先經(jīng)驗回放的SAC算法

    PER-SAC算法通過將優(yōu)先經(jīng)驗回放機制引入SAC算法提高算法的訓練速度和穩(wěn)定性。算法在訓練時, 不再以等概率隨機從經(jīng)驗池中抽取數(shù)據(jù), 而是給重要的樣本更大的權重, 增大其被采樣概率, 同時隨著訓練的進行, 動態(tài)調(diào)整不同樣本的權重, PER-SAC算法定義樣本權重為樣本訓練時的TD誤差。

    2.1 綜合全網(wǎng)絡誤差

    值得注意的是, 在優(yōu)先級經(jīng)驗回放DQN算法中只有一個Q網(wǎng)絡, 其TD誤差的計算方式也僅為單個Q網(wǎng)絡的誤差統(tǒng)計。而SAC算法為了減少值函數(shù)的估計偏差, 提高訓練穩(wěn)定性, 使用了兩個Q網(wǎng)絡, 訓練時使用較小的Q值用于梯度計算, 加上策略π網(wǎng)絡, SAC算法一共有3個網(wǎng)絡, 分別為Q1,Q2,π網(wǎng)絡。PER-SAC算法中的TD誤差因此需要同時考慮3個網(wǎng)絡的誤差, 一個簡單的方式是將3個誤差直接相加

    δj=abs(Td(Q1))+abs(Td(Q2))+abs(Td(π))

    (14)

    2.2 帶調(diào)整系數(shù)的綜合TD誤差

    直接將3個網(wǎng)絡各自的絕對誤差相加得到一個總誤差。但由于Q網(wǎng)絡與策略π網(wǎng)絡的輸出意義有著本質(zhì)區(qū)別:Q網(wǎng)絡的輸出是對當前狀態(tài)采取動作后得到累計回報的期望, 該值因不同環(huán)境差異很大, 通常遠大于1。而策略π網(wǎng)絡的輸出是當前環(huán)境Agent采取不同動作的概率, 概率值不超過1。直接將3個網(wǎng)絡的誤差絕對值相加將導致策略π網(wǎng)絡的誤差部分對總體誤差評估的影響較小, 降低算法的性能。PER-SAC算法通過在策略π網(wǎng)絡的誤差部分引入調(diào)整參數(shù)β將其適當放大, 解決了這個問題, 引入調(diào)整參數(shù)β后的總TD誤差計算方法為

    δj=abs(Td(Q1))+abs(Td(Q2))+βabs(Td(π))

    (15)

    在PER-SAC算法中, 前期探索階段時網(wǎng)絡還未訓練, 因此誤差信息未知, 默認設置所有樣本TD誤差為1, 此時算法退化為原始SAC算法。當網(wǎng)絡開始從經(jīng)驗池抽取樣本訓練時, 以TD誤差值統(tǒng)計每個樣本的被采樣概率。當某個批次樣本訓練完成后, 將其最新的TD誤差更新回經(jīng)驗池。隨著訓練進行, 整個經(jīng)驗池的樣本的TD誤差都將被替換為真實的TD誤差, 能最大程度發(fā)揮算法性能。圖1給出了PER-SAC算法的結構及訓練流程圖, 在探索階段Policy與環(huán)境交互得到樣本并存儲至經(jīng)驗池, 并將TD誤差設置為1。當經(jīng)驗池樣本滿足訓練要求后算法即可開始訓練; 以TD誤差統(tǒng)計各樣本的采樣概率進行采樣。Q1和Q2分別計算其TD誤差并更新梯度; 為降低訓練偏差, 使用較小的Q值計算策略網(wǎng)絡的誤差; 根據(jù)式(15)計算總的TD誤差, 并更新經(jīng)驗池中對應樣本的TD誤差。

    PER-SAC算法的結構如圖1所示。PER-SAC算法首先使用Actor與環(huán)境交互, 并通過重參數(shù)引入隨機噪聲加大網(wǎng)絡對新狀態(tài)和動作的探索力度, 然后將樣本存儲至經(jīng)驗池中。在訓練階段, 算法從經(jīng)驗池中根據(jù)權重進行概率采樣, 更新兩個Critic網(wǎng)絡的參數(shù), 同時選取輸出值較小的Q網(wǎng)絡指導Policy網(wǎng)絡更新。最終根據(jù)3個網(wǎng)絡的誤差重新計算TD誤差, 并將其更新至經(jīng)驗池中對應的樣本。

    圖1 PER-SAC算法網(wǎng)絡結構圖Fig.1 PER_SAC algorithm network structure diagram

    PER-SAC算法步驟如下。

    2) for each iteration do

    3) for each environment step do

    4) 根據(jù)狀態(tài)st, 策略πφ采樣得到動作at

    5) 執(zhí)行動作at, 獲得立即獎勵rt和下一狀態(tài)st+1

    6) 將經(jīng)驗樣本(st,at,rt,st+1)存入經(jīng)驗池B中, 樣本的TD誤差初始化為1

    7) 在經(jīng)驗池B, 根據(jù)樣本的TD誤差歸一化作為概率pj進行樣本采樣用于訓練

    8) end for

    9) for each gradient step do

    10) 更新Critic網(wǎng)絡參數(shù)

    θi←θi-λθiJQ(θi) fori∈{1,2}

    11) 更新Policy網(wǎng)絡參數(shù)

    φ←φ-λπφJπ(φ)

    12) 更新溫度系數(shù)α←α-λαJ(α)

    13) 計算各個樣本的TD誤差, 更新到經(jīng)驗池B

    14) 更新各個target網(wǎng)絡參數(shù)

    15) end For

    16) end For

    3 實 驗

    為驗證PER-SAC算法對比SAC算法的優(yōu)越性, 在2個不同的連續(xù)強化學習訓練環(huán)境分別進行訓練與測試, 并繪圖觀察兩種算法在訓練及測試中不同網(wǎng)絡的誤差更正情況。為了顯示算法對優(yōu)化算法的魯棒性及對比其他強化學習算法的優(yōu)越性, 在不同優(yōu)化算法和環(huán)境中, 將PER-SAC算法與雙延遲確定性策略算法(TD3: Twin Delayed Deep Deterministic policy), DDPG(Deep Deterministic Policy Gradient), SAC(Soft Actor Critic)算法進行了實驗比較。實驗證明PER-SAC算法在收斂速度, 訓練穩(wěn)定性, 智能體測試期間表現(xiàn)上均具有優(yōu)異的表現(xiàn)。

    3.1 實驗環(huán)境

    筆者分別選擇強化學習Gym的鐘擺環(huán)境(Pendulum-v0)和小車爬山環(huán)境(Mountain Car Continuous), 在不同的任務環(huán)境, 優(yōu)化算法下分別將PER-SAC算法與SAC算法進行對比。實驗使用的操作系統(tǒng)為Win10, 使用Python 3.7語言開發(fā), Pytorch1.3-CPU版本搭建神經(jīng)網(wǎng)絡及訓練。

    鐘擺環(huán)境(Pendulum-v0)是一個經(jīng)典的強化學習訓練和評估環(huán)境,圖2給出了鐘擺環(huán)境圖。 該環(huán)境的目標是將鐘擺保持垂直向上的姿態(tài), 智能體需要通過觀察鐘擺的角速度、 正弦、 余弦值, 同時輸出[-2, 2]間的連續(xù)值控制電機扭矩。

    小車爬山環(huán)境也是一個連續(xù)空間的強化學習環(huán)境,圖3給出了小車爬山環(huán)境圖。該環(huán)境是一個一維的山坡, 目標是控制一輛動力不足的小車爬山坡, 小車自身動力無法直接完成該任務, 因此需要控制小車反復助跑蓄力沖上山坡, 在到達山頂前環(huán)境每一步的獎勵反饋都是-1。該環(huán)境中智能體需要觀察小車的位置和速度, 并輸出[-1,1]間的連續(xù)值控制小車前進后退的力度。

    圖2 鐘擺環(huán)境 圖3 小車爬山環(huán)境Fig.2 Pendulum environment Fig.3 Mountain car environment

    3.2 實驗參數(shù)

    為對比PER-SAC算法的改進效果, PER-SAC算法的參數(shù)與SAC算法完全一致, 實驗部分環(huán)境將分別嘗試鐘擺環(huán)境和小車爬山環(huán)境; 優(yōu)化算法分別嘗試Adam和SGD。同時與TD3和DDPG算法進行了對比試驗, 其他實驗參數(shù)為SAC算法默認參數(shù)(見表1)。

    表1 實驗參數(shù)設置Tab.1 Experimental parameter setting

    3.3 實驗結果與分析

    與有監(jiān)督學習算法直接計算預測值與標簽值衡量模型效果的方法不同, 強化學習以自身與環(huán)境不斷探索試錯逐步迭代出更優(yōu)決策模型, 筆者將分別從Critic誤差, Actor的誤差及回合的累計獎勵等角度評價算法性能。

    圖4給出了在鐘擺環(huán)境下, 采用Adam優(yōu)化算法, 批次大小設置為32時PER-SAC算法(綠色)與SAC(橙色)在訓練及測試期間的表現(xiàn)情況。由圖4a可以看出, 在整個訓練過程中, PER-SAC的Q1網(wǎng)絡的估計誤差收斂比SAC算法更迅速, 更穩(wěn)定。在訓練至15 000次時PER-SAC算法的Q1誤差已經(jīng)接近1, 而SAC算法的Q1誤差表現(xiàn)得更為震蕩且紊亂, 在訓練至15 000次時誤差震蕩上升至接近10。造成Q1和Q2網(wǎng)絡訓練誤差先由小變大再由大變小的原因主要為網(wǎng)絡隨機初始化時神經(jīng)元參數(shù)都比較小。隨著訓練參數(shù)逐漸增大, 其輸出值也變大, 由于強化學習算法高方差和高偏差的特性, Critic的誤差也在逐漸增大; 隨著訓練的繼續(xù), Critic對環(huán)境的評估越來越精準, 誤差又逐漸下降, 值函數(shù)逐漸收斂。圖4b中Q2網(wǎng)絡的訓練估計誤差也表現(xiàn)出和Q1類似的特性, 這說明PER-SAC算法的兩個值網(wǎng)絡的訓練效率和穩(wěn)定性都得到了提高。圖4c代表策略網(wǎng)絡在訓練期間的誤差情況, 策略網(wǎng)絡的誤差描述的是策略網(wǎng)絡與值網(wǎng)絡分布的KL散度。在訓練初期由于值網(wǎng)絡和策略網(wǎng)絡參數(shù)都比較小, KL散度的值也比較小。隨著訓練的進行, 值網(wǎng)絡對狀態(tài)的評估更加準確, 此時值網(wǎng)絡與策略網(wǎng)絡的KL散度會逐漸增大, 然而隨著策略網(wǎng)絡在不斷根據(jù)KL散度的反饋迭代參數(shù), 策略網(wǎng)絡與值網(wǎng)絡之間的KL散度接著又會逐漸減小, 在總體訓練期間策略誤差表現(xiàn)出先增大后減小。由圖4c可觀察出PER-SAC算法的策略誤差收斂更加迅速, 加入優(yōu)先經(jīng)驗回放使策略網(wǎng)絡修正誤差更加迅速, 同時由于PER-SAC算法的2個Q網(wǎng)絡收斂比SAC算法更加快速穩(wěn)定, 其對策略網(wǎng)絡的梯度反饋在全局角度也更加精確, 能減少策略網(wǎng)絡無意義的更新次數(shù), 這使PER-SAC算法的策略的收斂效率相比于SAC算法有了較大提升。圖4d和圖4e分別代表了算法在訓練期間的回合累計獎勵, PER-SAC算法的表現(xiàn)優(yōu)于SAC算法, 不僅增長更快速而且更加穩(wěn)定。圖4f表示熵的權重(溫度系數(shù))在訓練期間的衰減情況, 總體兩個算法都能使溫度系數(shù)保持穩(wěn)定的衰減, 利于策略的收斂, 引入優(yōu)先經(jīng)驗回放并不會明顯影響該過程。

    圖4 PER-SAC與SAC在訓練及測試期間誤差收斂及獎勵增長情況Fig.4 Error convergence and reward growth of PER-SAC and SAC during training and testing

    表2給出了在兩個環(huán)境, 不同的優(yōu)化算法下, PER-SAC與其他3個比較算法在訓練15 000步的測試表現(xiàn), 采用的指標是指數(shù)平滑后的回合累計獎勵, 采用指數(shù)平滑的方式能綜合策略前面的回合的表現(xiàn), 降低隨機干擾。表格前兩行是鐘擺環(huán)境下的算法表現(xiàn), 在Adam優(yōu)化算法下, TD3,DDPG與SAC算法的表現(xiàn)較為接近, 在-700~-800范圍內(nèi)波動, 而PER-SAC算法表現(xiàn)明顯優(yōu)于前幾個算法, 達到了-259.2。而在SGD優(yōu)化算法中, SAC與PER-SAC算法較為接近, 而TD3與DDPG算法表現(xiàn)則差于Adam算法的結果。在小車爬山連續(xù)環(huán)境中, 無論在Adam還是SGD環(huán)境下, 4個算法均未能爬到山頂, 而選擇了降低油耗的策略, 但通過其獎勵仍然能反映出算法收斂的速度。TD3與DDPG算法在2種優(yōu)化算法下的獎勵均小于-2, 而SAC算法與PER-SAC算法均大于-1。在所有的試驗中, SAC類算法表現(xiàn)都優(yōu)于TD3和DDPG算法, 證明其最大熵策略的有效性。本次實驗設置的步數(shù)為15 000, 相對普通強化學習實驗的次數(shù)更低, 更能體現(xiàn)算法前期的收斂性能與學習速度, 而PER-SAC算法表現(xiàn)均優(yōu)于SAC算法, 說明引入優(yōu)先級回放機制能給SAC算法帶來穩(wěn)定的性能提升, 證明了PER-SAC算法的有效性。

    表2 算法在不同環(huán)境及配置下訓練最終回合平滑累計獎勵(平滑系數(shù)為0.8)Tab.2 Cumulative reward of algorithm training in different environments and configurations (smoothing coefficientis 0.8)

    4 結 語

    筆者提出了PER-SAC算法, 通過將優(yōu)先級經(jīng)驗回放機制引入SAC算法, 提升了算法的訓練速度和穩(wěn)定性, 并在不同環(huán)境, 不同優(yōu)化算法等情況下與其他強化學習算法做了對比實驗, 驗證了所提算法的有效性。PER-SAC算法在衡量樣本優(yōu)先級時, 直接將3個網(wǎng)絡的TD誤差的絕對值相加, 樣本重要性的評估方式較為簡單, 引入的訓練信息不夠充分, 下一步的研究方向可以考慮引入更多環(huán)境獎勵信息或訓練信息幫助更好地評估樣本優(yōu)先級, 進一步優(yōu)化算法訓練性能。

    猜你喜歡
    經(jīng)驗誤差樣本
    2021年第20期“最值得推廣的經(jīng)驗”評選
    黨課參考(2021年20期)2021-11-04 09:39:46
    用樣本估計總體復習點撥
    角接觸球軸承接觸角誤差控制
    哈爾濱軸承(2020年2期)2020-11-06 09:22:26
    Beidou, le système de navigation par satellite compatible et interopérable
    經(jīng)驗
    壓力容器制造誤差探究
    2018年第20期“最值得推廣的經(jīng)驗”評選
    黨課參考(2018年20期)2018-11-09 08:52:36
    推動醫(yī)改的“直銷樣本”
    隨機微分方程的樣本Lyapunov二次型估計
    九十億分之一的“生死”誤差
    山東青年(2016年2期)2016-02-28 14:25:41
    99久久中文字幕三级久久日本| 精品久久国产蜜桃| 男女国产视频网站| 国产精品嫩草影院av在线观看| 欧美 日韩 精品 国产| 在线观看一区二区三区激情| 全区人妻精品视频| 日韩制服骚丝袜av| 青青草视频在线视频观看| 狂野欧美白嫩少妇大欣赏| 丝瓜视频免费看黄片| 伊人久久精品亚洲午夜| 91aial.com中文字幕在线观看| 久久精品综合一区二区三区| 日本欧美国产在线视频| 精品视频人人做人人爽| 人妻夜夜爽99麻豆av| 免费不卡的大黄色大毛片视频在线观看| 丝袜美腿在线中文| 久久久久久久久久久丰满| 欧美激情久久久久久爽电影| 欧美bdsm另类| 欧美成人一区二区免费高清观看| 亚洲av在线观看美女高潮| 麻豆成人av视频| 蜜臀久久99精品久久宅男| 久久久精品94久久精品| a级毛色黄片| 亚洲精品一二三| 成人毛片a级毛片在线播放| eeuss影院久久| 久久影院123| 黄色视频在线播放观看不卡| 国产日韩欧美在线精品| 精品国产露脸久久av麻豆| 精品国产三级普通话版| 能在线免费看毛片的网站| 内地一区二区视频在线| 国产精品99久久久久久久久| 又大又黄又爽视频免费| 一二三四中文在线观看免费高清| 新久久久久国产一级毛片| 十八禁网站网址无遮挡 | 日韩成人av中文字幕在线观看| 亚洲色图综合在线观看| 久久久久久久午夜电影| 一级二级三级毛片免费看| 国产av国产精品国产| 性色av一级| 日韩成人伦理影院| 国产黄频视频在线观看| 亚洲aⅴ乱码一区二区在线播放| 国精品久久久久久国模美| 99热全是精品| www.av在线官网国产| 免费观看a级毛片全部| 亚洲av一区综合| 一级av片app| 久久精品国产亚洲av涩爱| 亚洲精品,欧美精品| 国产精品精品国产色婷婷| 免费黄色在线免费观看| 久久精品国产亚洲av涩爱| 免费观看a级毛片全部| 亚洲色图综合在线观看| 免费看av在线观看网站| 看十八女毛片水多多多| 我的女老师完整版在线观看| 春色校园在线视频观看| 亚洲人成网站在线观看播放| 亚洲天堂av无毛| 国产精品精品国产色婷婷| 色婷婷久久久亚洲欧美| 久久精品国产亚洲网站| 国产精品一二三区在线看| 狠狠精品人妻久久久久久综合| 丝瓜视频免费看黄片| 91狼人影院| 2021天堂中文幕一二区在线观| 免费大片18禁| 午夜精品国产一区二区电影 | 国产成年人精品一区二区| 毛片女人毛片| 国产午夜精品一二区理论片| 日韩伦理黄色片| 天天躁日日操中文字幕| 欧美+日韩+精品| 国产永久视频网站| 亚洲av一区综合| 欧美成人精品欧美一级黄| 岛国毛片在线播放| 少妇人妻 视频| 能在线免费看毛片的网站| 成人美女网站在线观看视频| 国产爽快片一区二区三区| 亚洲欧美日韩东京热| 又大又黄又爽视频免费| 国产片特级美女逼逼视频| 另类亚洲欧美激情| 99热国产这里只有精品6| 亚洲高清免费不卡视频| 亚洲丝袜综合中文字幕| 亚洲精品成人久久久久久| 亚洲aⅴ乱码一区二区在线播放| av线在线观看网站| 亚洲欧美一区二区三区黑人 | 黑人高潮一二区| av女优亚洲男人天堂| 亚洲国产精品国产精品| 在线观看av片永久免费下载| av国产精品久久久久影院| 高清毛片免费看| 人体艺术视频欧美日本| 丰满乱子伦码专区| 亚洲人成网站在线播| 亚洲经典国产精华液单| 久久久国产一区二区| 狂野欧美白嫩少妇大欣赏| 免费看不卡的av| 国产精品福利在线免费观看| 国产免费一区二区三区四区乱码| 国产成人a区在线观看| 色网站视频免费| 成人国产av品久久久| 99精国产麻豆久久婷婷| 激情五月婷婷亚洲| 欧美日韩亚洲高清精品| 永久网站在线| 欧美一区二区亚洲| 又爽又黄a免费视频| 国产免费福利视频在线观看| 久久人人爽av亚洲精品天堂 | 人人妻人人澡人人爽人人夜夜| 高清日韩中文字幕在线| 久久精品夜色国产| 网址你懂的国产日韩在线| 99久久中文字幕三级久久日本| 国产人妻一区二区三区在| 老司机影院毛片| 国产一区二区在线观看日韩| 久久久久精品性色| 看免费成人av毛片| 我的女老师完整版在线观看| 成年免费大片在线观看| 亚洲av二区三区四区| 各种免费的搞黄视频| 国产美女午夜福利| 国产欧美亚洲国产| 亚洲国产欧美人成| 亚洲人成网站在线播| 日本-黄色视频高清免费观看| 久久久精品94久久精品| av黄色大香蕉| 自拍偷自拍亚洲精品老妇| 在线观看免费高清a一片| 丝袜喷水一区| 2021天堂中文幕一二区在线观| 卡戴珊不雅视频在线播放| 国产 一区 欧美 日韩| 国内少妇人妻偷人精品xxx网站| 观看美女的网站| 国产在线一区二区三区精| 日韩欧美 国产精品| 欧美性猛交╳xxx乱大交人| 成年av动漫网址| 寂寞人妻少妇视频99o| 国产视频首页在线观看| 国产亚洲av片在线观看秒播厂| 边亲边吃奶的免费视频| 欧美成人a在线观看| 精品久久久噜噜| 午夜福利在线在线| 一区二区三区乱码不卡18| 久热这里只有精品99| 91aial.com中文字幕在线观看| 能在线免费看毛片的网站| 日韩欧美一区视频在线观看 | 欧美亚洲 丝袜 人妻 在线| 亚洲国产精品成人综合色| 男女那种视频在线观看| 日本色播在线视频| 国产 精品1| 黄色配什么色好看| 最近手机中文字幕大全| 日日摸夜夜添夜夜添av毛片| 亚州av有码| 国产精品国产三级国产专区5o| 一个人看的www免费观看视频| 久久人人爽人人爽人人片va| 欧美高清性xxxxhd video| 在线看a的网站| 观看美女的网站| av在线老鸭窝| 亚洲熟女精品中文字幕| 亚洲人与动物交配视频| 国产熟女欧美一区二区| 久久久久久久精品精品| 成人综合一区亚洲| 搡女人真爽免费视频火全软件| 国产片特级美女逼逼视频| 伊人久久精品亚洲午夜| av一本久久久久| 欧美成人午夜免费资源| 免费看a级黄色片| 能在线免费看毛片的网站| 18+在线观看网站| 九九久久精品国产亚洲av麻豆| 乱系列少妇在线播放| 女人久久www免费人成看片| 国产精品三级大全| 亚洲天堂国产精品一区在线| 欧美日韩精品成人综合77777| 午夜福利视频1000在线观看| 不卡视频在线观看欧美| 激情五月婷婷亚洲| 午夜精品一区二区三区免费看| 国产午夜精品久久久久久一区二区三区| 欧美zozozo另类| 久久精品熟女亚洲av麻豆精品| 美女主播在线视频| 亚洲精品成人av观看孕妇| 波野结衣二区三区在线| 国产亚洲最大av| 尤物成人国产欧美一区二区三区| 亚洲欧美日韩无卡精品| 日本欧美国产在线视频| 国产男女超爽视频在线观看| 校园人妻丝袜中文字幕| 国产在线男女| 亚洲自偷自拍三级| 国产在线一区二区三区精| 亚洲精品久久久久久婷婷小说| 性色avwww在线观看| 日日摸夜夜添夜夜添av毛片| 97精品久久久久久久久久精品| 草草在线视频免费看| 国内精品宾馆在线| 三级男女做爰猛烈吃奶摸视频| 久久久精品欧美日韩精品| 久久久a久久爽久久v久久| 成人黄色视频免费在线看| 五月天丁香电影| 色综合色国产| 久久人人爽av亚洲精品天堂 | 1000部很黄的大片| 男男h啪啪无遮挡| 国产午夜精品一二区理论片| 久久人人爽人人爽人人片va| 久久久a久久爽久久v久久| 亚洲精品成人久久久久久| 乱系列少妇在线播放| 国产高清不卡午夜福利| 欧美激情在线99| 亚洲人成网站在线观看播放| 亚洲av男天堂| 欧美极品一区二区三区四区| 国产精品成人在线| 久久久色成人| 国产熟女欧美一区二区| 王馨瑶露胸无遮挡在线观看| 天天一区二区日本电影三级| 一级二级三级毛片免费看| 大又大粗又爽又黄少妇毛片口| 一区二区av电影网| 久久久久久久国产电影| av免费观看日本| 久久久久国产精品人妻一区二区| 免费观看在线日韩| 国语对白做爰xxxⅹ性视频网站| 伊人久久精品亚洲午夜| 偷拍熟女少妇极品色| 免费人成在线观看视频色| 国产精品久久久久久精品电影| 国产精品伦人一区二区| 国产精品福利在线免费观看| 少妇 在线观看| 大话2 男鬼变身卡| 午夜福利视频1000在线观看| 99视频精品全部免费 在线| 亚洲av一区综合| 亚洲av中文字字幕乱码综合| 国产成人精品婷婷| 真实男女啪啪啪动态图| 美女国产视频在线观看| 丝瓜视频免费看黄片| 国产精品无大码| 51国产日韩欧美| 天堂中文最新版在线下载 | 国产有黄有色有爽视频| 成人无遮挡网站| 国产伦理片在线播放av一区| 一边亲一边摸免费视频| 日韩电影二区| 777米奇影视久久| av黄色大香蕉| 久久久久久久久大av| 特大巨黑吊av在线直播| 国产一区二区三区av在线| 97精品久久久久久久久久精品| 国产免费福利视频在线观看| 日本欧美国产在线视频| 午夜福利在线观看免费完整高清在| 欧美激情在线99| 欧美人与善性xxx| 亚洲精品国产成人久久av| 亚洲三级黄色毛片| 久久久国产一区二区| 丝袜喷水一区| 黑人高潮一二区| 亚洲精品一区蜜桃| 国产精品av视频在线免费观看| 美女高潮的动态| 精品人妻偷拍中文字幕| 亚洲欧美一区二区三区国产| 91午夜精品亚洲一区二区三区| 高清欧美精品videossex| 三级男女做爰猛烈吃奶摸视频| 日日摸夜夜添夜夜爱| 麻豆成人av视频| 少妇的逼好多水| 啦啦啦啦在线视频资源| 麻豆精品久久久久久蜜桃| 99久国产av精品国产电影| 国产精品国产av在线观看| 少妇人妻久久综合中文| 欧美xxxx性猛交bbbb| 大陆偷拍与自拍| 日韩强制内射视频| 日日啪夜夜爽| 亚洲天堂av无毛| 国产亚洲av嫩草精品影院| 国产乱人偷精品视频| 成人高潮视频无遮挡免费网站| 又大又黄又爽视频免费| 国产亚洲av嫩草精品影院| 久久久久久久亚洲中文字幕| 男插女下体视频免费在线播放| 国产精品久久久久久av不卡| 中文字幕久久专区| 国产一区二区三区av在线| 亚洲婷婷狠狠爱综合网| 波多野结衣巨乳人妻| 少妇人妻久久综合中文| 欧美丝袜亚洲另类| 九九在线视频观看精品| 亚洲内射少妇av| 女人被狂操c到高潮| 亚洲精华国产精华液的使用体验| 国产真实伦视频高清在线观看| 国模一区二区三区四区视频| 男女那种视频在线观看| 边亲边吃奶的免费视频| 18禁在线无遮挡免费观看视频| 在线观看人妻少妇| 中文在线观看免费www的网站| 国产精品久久久久久精品古装| 亚洲成色77777| av国产精品久久久久影院| 日韩成人伦理影院| 亚洲欧洲日产国产| 国产日韩欧美在线精品| 国产精品秋霞免费鲁丝片| 黄色视频在线播放观看不卡| 一个人看视频在线观看www免费| 亚洲欧美成人综合另类久久久| 好男人在线观看高清免费视频| 特级一级黄色大片| 99热网站在线观看| 麻豆乱淫一区二区| 国产高清不卡午夜福利| 久久久精品欧美日韩精品| 中文天堂在线官网| 亚洲,一卡二卡三卡| 成人一区二区视频在线观看| 99热国产这里只有精品6| 狂野欧美白嫩少妇大欣赏| 夫妻性生交免费视频一级片| 一级毛片电影观看| 高清在线视频一区二区三区| 亚洲精品久久久久久婷婷小说| 一级毛片我不卡| www.av在线官网国产| 亚洲欧美日韩卡通动漫| 日韩一区二区视频免费看| 国产成人91sexporn| 欧美成人午夜免费资源| 我的女老师完整版在线观看| 男人添女人高潮全过程视频| 亚洲国产欧美人成| 亚洲国产精品999| 成人漫画全彩无遮挡| 欧美+日韩+精品| 嫩草影院新地址| 久久精品国产亚洲av涩爱| 免费观看性生交大片5| 伊人久久精品亚洲午夜| 91久久精品国产一区二区成人| 亚洲色图av天堂| 欧美xxxx黑人xx丫x性爽| 人体艺术视频欧美日本| 中文乱码字字幕精品一区二区三区| 纵有疾风起免费观看全集完整版| 久久人人爽人人片av| 国产精品福利在线免费观看| 狠狠精品人妻久久久久久综合| 一区二区av电影网| 内地一区二区视频在线| 亚洲av男天堂| 成年女人在线观看亚洲视频 | 亚洲图色成人| 国产成年人精品一区二区| 精品视频人人做人人爽| 欧美性猛交╳xxx乱大交人| 亚洲无线观看免费| 一区二区三区四区激情视频| 夫妻性生交免费视频一级片| 老司机影院成人| 天天躁夜夜躁狠狠久久av| 久久人人爽人人片av| 亚洲自拍偷在线| 赤兔流量卡办理| 一级片'在线观看视频| 亚洲av成人精品一区久久| 一边亲一边摸免费视频| 国产毛片在线视频| av卡一久久| 在线天堂最新版资源| 久久久久网色| 自拍偷自拍亚洲精品老妇| 欧美成人精品欧美一级黄| 国产精品秋霞免费鲁丝片| 国产色爽女视频免费观看| 九色成人免费人妻av| 另类亚洲欧美激情| 国产av国产精品国产| 欧美日韩综合久久久久久| 午夜福利视频1000在线观看| 亚洲精品亚洲一区二区| 18禁动态无遮挡网站| 亚洲怡红院男人天堂| videos熟女内射| 国产成人精品婷婷| 91狼人影院| 午夜福利视频精品| 亚洲欧美一区二区三区黑人 | 男插女下体视频免费在线播放| 纵有疾风起免费观看全集完整版| 天堂俺去俺来也www色官网| 亚洲成人中文字幕在线播放| 又爽又黄a免费视频| 大片电影免费在线观看免费| 国产伦理片在线播放av一区| 性插视频无遮挡在线免费观看| 欧美三级亚洲精品| 亚洲人与动物交配视频| 精品久久久久久久久亚洲| 亚洲天堂国产精品一区在线| 国产一区二区亚洲精品在线观看| 伦精品一区二区三区| 天天躁日日操中文字幕| 两个人的视频大全免费| 干丝袜人妻中文字幕| 日韩精品有码人妻一区| 亚洲三级黄色毛片| 欧美日韩视频高清一区二区三区二| 丝袜脚勾引网站| 亚洲av日韩在线播放| 一级黄片播放器| 男女啪啪激烈高潮av片| 中文字幕制服av| 各种免费的搞黄视频| 国产午夜精品一二区理论片| 日日摸夜夜添夜夜爱| 亚洲电影在线观看av| 亚洲精品第二区| 亚洲成人中文字幕在线播放| 国产高清三级在线| 青春草亚洲视频在线观看| 久久久久国产网址| 国产亚洲精品久久久com| 久久久午夜欧美精品| 晚上一个人看的免费电影| 好男人视频免费观看在线| av在线蜜桃| 国产精品一二三区在线看| 26uuu在线亚洲综合色| 国产久久久一区二区三区| 午夜激情久久久久久久| 日日摸夜夜添夜夜添av毛片| 搡老乐熟女国产| 秋霞伦理黄片| 亚洲激情五月婷婷啪啪| 2021天堂中文幕一二区在线观| 国产成人aa在线观看| 亚洲第一区二区三区不卡| 精品99又大又爽又粗少妇毛片| 日日撸夜夜添| 在线播放无遮挡| 好男人视频免费观看在线| 交换朋友夫妻互换小说| 亚洲av不卡在线观看| 国产欧美另类精品又又久久亚洲欧美| 午夜免费观看性视频| 久久97久久精品| 亚洲国产高清在线一区二区三| 免费在线观看成人毛片| 亚洲怡红院男人天堂| 男女无遮挡免费网站观看| 亚洲精品久久午夜乱码| 日本免费在线观看一区| a级毛色黄片| 免费av毛片视频| 99热这里只有是精品50| 色视频在线一区二区三区| 99精国产麻豆久久婷婷| 一级黄片播放器| 日韩不卡一区二区三区视频在线| 日韩欧美一区视频在线观看 | 九九久久精品国产亚洲av麻豆| 国产探花在线观看一区二区| 黄色怎么调成土黄色| 全区人妻精品视频| 美女高潮的动态| 日日撸夜夜添| 国产毛片在线视频| 久久久久九九精品影院| 街头女战士在线观看网站| av在线app专区| 久久ye,这里只有精品| 久久久久久久久久久免费av| 少妇人妻精品综合一区二区| 日本wwww免费看| 久久久精品免费免费高清| 久久精品久久精品一区二区三区| 永久免费av网站大全| 免费看日本二区| 欧美精品国产亚洲| 亚洲最大成人中文| 日韩亚洲欧美综合| 国产一区二区三区av在线| 国产成人a区在线观看| 国产综合精华液| 寂寞人妻少妇视频99o| 国产亚洲av片在线观看秒播厂| 国产一区二区亚洲精品在线观看| 岛国毛片在线播放| 国产成人aa在线观看| 视频区图区小说| 亚洲人成网站在线观看播放| 18禁在线无遮挡免费观看视频| 婷婷色麻豆天堂久久| 蜜桃久久精品国产亚洲av| 国产亚洲午夜精品一区二区久久 | 在线 av 中文字幕| av国产免费在线观看| 久久精品熟女亚洲av麻豆精品| 久久97久久精品| 中文字幕av成人在线电影| 国产91av在线免费观看| 91久久精品国产一区二区三区| 波野结衣二区三区在线| 国产乱来视频区| 日韩大片免费观看网站| 色5月婷婷丁香| 午夜福利视频1000在线观看| 婷婷色综合大香蕉| 成人综合一区亚洲| 男男h啪啪无遮挡| 2022亚洲国产成人精品| 国产大屁股一区二区在线视频| 国产综合精华液| 国内精品美女久久久久久| 亚洲精品国产av蜜桃| 亚洲国产欧美人成| 国产老妇女一区| 性色av一级| 一级片'在线观看视频| 精品酒店卫生间| 51国产日韩欧美| 亚洲伊人久久精品综合| 亚洲,欧美,日韩| 婷婷色综合www| 男女无遮挡免费网站观看| 亚洲aⅴ乱码一区二区在线播放| 交换朋友夫妻互换小说| 久久精品国产鲁丝片午夜精品| 欧美性感艳星| 国产午夜福利久久久久久| 国产v大片淫在线免费观看| 少妇的逼好多水| 在线a可以看的网站| 麻豆成人午夜福利视频| 少妇被粗大猛烈的视频| 精品久久久久久久人妻蜜臀av| 亚洲综合精品二区| 国产亚洲5aaaaa淫片| 国产精品麻豆人妻色哟哟久久| 免费观看性生交大片5| 日韩一本色道免费dvd| 美女视频免费永久观看网站| 亚洲怡红院男人天堂| 中文字幕久久专区| 久久精品综合一区二区三区| 中文资源天堂在线| 国产成人免费无遮挡视频| 亚洲第一区二区三区不卡| 老司机影院成人| 99久久精品热视频| 中国美白少妇内射xxxbb| 男人和女人高潮做爰伦理| 日韩精品有码人妻一区| 人妻一区二区av| 日韩亚洲欧美综合| 菩萨蛮人人尽说江南好唐韦庄| kizo精华|