• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    應(yīng)用深度強(qiáng)化學(xué)習(xí)的壓邊力優(yōu)化控制

    2020-06-24 02:58:30張新艷余建波
    關(guān)鍵詞:壓邊成品步長(zhǎng)

    張新艷, 郭 鵬, 余建波

    (同濟(jì)大學(xué) 機(jī)械與能源工程學(xué)院, 上海 201804)

    板材拉深成形作為一種基礎(chǔ)零部件制造工藝,被廣泛應(yīng)用于汽車、機(jī)電、輕工和航空航天等諸多領(lǐng)域. 拉深成形通過(guò)壓邊力(blank holder force,BHF)來(lái)控制金屬材料的流動(dòng),從而影響最終成品的成形質(zhì)量. 在拉深過(guò)程中采用恒定的壓邊力容易導(dǎo)致起皺與破裂等質(zhì)量缺陷,因此在拉深過(guò)程中合理地控制壓邊力參數(shù)就成為防止起皺、破裂和提高成品質(zhì)量的重要手段之一.

    在壓邊力控制領(lǐng)域,最優(yōu)化理論與有限元模擬相結(jié)合是一類常用的方法. Ghouati等[1]提出了網(wǎng)格法與單純形法相結(jié)合的優(yōu)化方法,其計(jì)算效率高,能夠有效減少有限元仿真次數(shù),但無(wú)法保證所求的解在可行域內(nèi). 包友霞等[2]在Ghouati提出的優(yōu)化方法的基礎(chǔ)上進(jìn)行改進(jìn),使得優(yōu)化過(guò)程中各變量點(diǎn)始終保持在可行域內(nèi),保證了解的可行性. 孫成智等[3]提出了一種集成了有限元模擬與自適應(yīng)響應(yīng)面法(adaptive response surface method,ARSM)的優(yōu)化設(shè)計(jì)方法,并且應(yīng)用信賴域模型管理來(lái)調(diào)節(jié)設(shè)計(jì)空間的變化,保證優(yōu)化過(guò)程的收斂. Hillmann等[4]將成形極限圖上各點(diǎn)到成形極限和起皺極限距離的加權(quán)和作為目標(biāo)函數(shù),以壓邊力作為設(shè)計(jì)變量,在有限元仿真環(huán)境下采用BFGS優(yōu)化方法對(duì)壓邊力進(jìn)行優(yōu)化. Scott等[5]以極限應(yīng)變作為目標(biāo)函數(shù),以壓邊力作為設(shè)計(jì)變量,在ABAQUS仿真環(huán)境下利用靈敏度分析方法對(duì)盒形件進(jìn)行優(yōu)化. 以上方法準(zhǔn)確性較高,但數(shù)值模擬速度無(wú)法滿足優(yōu)化迭代要求,限制了方法的使用,并且最佳壓邊力搜索方向也難以確定.

    神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于處理壓邊力控制問(wèn)題中的非線性關(guān)系. Senn等[6]采用近似動(dòng)態(tài)規(guī)劃方法來(lái)進(jìn)行壓邊力控制,利用神經(jīng)網(wǎng)絡(luò)來(lái)擬合系統(tǒng)動(dòng)力學(xué)以及價(jià)值函數(shù). 黃玉萍等[7]通過(guò)建立徑向基網(wǎng)絡(luò),以應(yīng)力、應(yīng)變和減薄率作為輸入,壓邊力曲線作為輸出,構(gòu)建了壓邊力優(yōu)化模型. Qian等[8]和Manabe等[9]利用神經(jīng)網(wǎng)絡(luò)進(jìn)行材料參數(shù)和工藝參數(shù)的在線識(shí)別,并結(jié)合彈塑性理論預(yù)測(cè)壓邊力大小. 汪銳等[10]通過(guò)將模糊控制技術(shù)與神經(jīng)網(wǎng)絡(luò)相結(jié)合,構(gòu)建模糊神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)來(lái)進(jìn)行壓邊力的智能控制.

    傳統(tǒng)的壓邊力控制方法往往需要對(duì)拉深過(guò)程進(jìn)行建模或依賴一些先驗(yàn)知識(shí). Dornheim等[11]提出了一種無(wú)模型的壓邊力控制方法,避免了系統(tǒng)模型的擬合. 該方法將神經(jīng)擬合Q迭代(neural fittedQiteration, NFQ)算法與有限元仿真相結(jié)合,為每個(gè)控制步長(zhǎng)建立一個(gè)Q值網(wǎng)絡(luò). 然而NFQ是一種基于價(jià)值的強(qiáng)化學(xué)習(xí)算法,只能用于離散動(dòng)作空間的控制問(wèn)題,無(wú)法用于連續(xù)動(dòng)作空間的控制問(wèn)題. 綜合以上分析,目前壓邊力控制領(lǐng)域還存在難以獲得精確動(dòng)力學(xué)模型以及壓邊力控制效果無(wú)法達(dá)到最優(yōu)化的問(wèn)題.

    本文提出了一種基于深度強(qiáng)化學(xué)習(xí)的壓邊力優(yōu)化控制模型,提高了壓邊力的控制效果;引入一種新的策略網(wǎng)絡(luò)結(jié)構(gòu),進(jìn)一步提高了深度強(qiáng)化學(xué)習(xí)在壓邊力控制任務(wù)中的控制效果;將壓邊力理論知識(shí)引入網(wǎng)絡(luò)訓(xùn)練中,用理論壓邊力公式進(jìn)行回放經(jīng)驗(yàn)池的初始化,提高了壓邊力策略的學(xué)習(xí)效率;以一個(gè)圓筒件的拉深成形過(guò)程為分析對(duì)象,通過(guò)有限元仿真驗(yàn)證了本文提出的壓邊力優(yōu)化控制模型的有效性.

    1 理論背景

    1.1 馬爾科夫決策過(guò)程

    強(qiáng)化學(xué)習(xí)(reinforcement learning,RL)問(wèn)題一般由馬爾科夫決策過(guò)程(Markov decision process,MDP)進(jìn)行建模[12]. 通常將MDP定義成一個(gè)四元組(S,A,r,p),其中:1)S為所有系統(tǒng)狀態(tài)集合,st∈S表示智能體(agent)在時(shí)刻t的系統(tǒng)狀態(tài);2)A為動(dòng)作集合,at∈A表示agent在時(shí)刻t所采取的動(dòng)作;3)r為回報(bào)函數(shù),r(st,at)表示在狀態(tài)st下采取動(dòng)作at后的獎(jiǎng)勵(lì)值;4)p為狀態(tài)轉(zhuǎn)移概率分布函數(shù).p(st+1|st,at)表示在狀態(tài)st下采取動(dòng)作at后轉(zhuǎn)移到下一狀態(tài)st+1的概率.

    在強(qiáng)化學(xué)習(xí)中,定義策略π:S→A為狀態(tài)空間到動(dòng)作空間的一個(gè)映射. 在每個(gè)離散步長(zhǎng)t,agent在當(dāng)前狀態(tài)st下根據(jù)策略π采取動(dòng)作at,接收到回報(bào)值r(st,at)并轉(zhuǎn)移到下一狀態(tài)st+1. 定義Rt為從t時(shí)刻開(kāi)始到T時(shí)刻情節(jié)(episode)結(jié)束時(shí)的累積回報(bào)值:

    式中:γ∈[0,1]為折扣率,用來(lái)確定短期回報(bào)的優(yōu)先程度.

    1.2 強(qiáng)化學(xué)習(xí)

    強(qiáng)化學(xué)習(xí)的目標(biāo)是尋找到一個(gè)最優(yōu)策略πφ(參數(shù)為φ)來(lái)最大化期望回報(bào)值J(φ)=Esi~pπ,ai~π[R0][13]. 在行動(dòng)者-評(píng)論家(actor-critic)框架中,策略網(wǎng)絡(luò)(actor)通過(guò)確定性策略梯度[14](deterministic policy gradient,DPG)進(jìn)行網(wǎng)絡(luò)更新:

    φJ(rèn)(φ)=Es~pπ[aQπ(s,a)|a=π(s)φπφ(s)],

    式中:Qπ(s,a)=Esi~pπ,ai~π[Rt|s,a]為動(dòng)作值函數(shù)(critic),表示在遵循策略π情況下,在狀態(tài)s采取動(dòng)作a后的期望回報(bào)值.

    Q學(xué)習(xí)(Q-learning)使用時(shí)間差分算法進(jìn)行動(dòng)作值函數(shù)的學(xué)習(xí),通過(guò)迭代貝爾曼方程求解Q函數(shù):

    Qπ(st,at)=r(st,at)+γEst+1,at+1[Qπ(st+1,at+1)],at+1~π(st+1).

    對(duì)于巨大的狀態(tài)空間,通常使用一個(gè)可微的函數(shù)近似器Qθ(s,a)估計(jì)動(dòng)作值,其參數(shù)為θ. 深度Q學(xué)習(xí)[15](DeepQ-learning,DQN)算法采用了“目標(biāo)網(wǎng)絡(luò)”技術(shù),在更新過(guò)程中使用另一個(gè)網(wǎng)絡(luò)Qθ′(s,a)計(jì)算目標(biāo)值:

    yt=r(st,at)+γQθ′(st+1,at+1),at+1~πφ′(st+1).

    式中動(dòng)作at+1根據(jù)目標(biāo)策略網(wǎng)絡(luò)πφ′進(jìn)行選擇. 獲得目標(biāo)值后,DQN通過(guò)最小化損失函數(shù)L(θ)進(jìn)行動(dòng)作值網(wǎng)絡(luò)參數(shù)的更新:

    L(θ)=Est,at,r(st,at),st+1[(yt-Qθ(st,at))2].

    2 基于深度強(qiáng)化學(xué)習(xí)的壓邊力控制策略優(yōu)化算法

    通過(guò)將雙延遲深度確定性策略梯度[16](twin delayed deep deterministic policy gradient,TD3)與結(jié)構(gòu)化控制網(wǎng)絡(luò)[17](structured control network,SCN)相結(jié)合,本文提出了SCN-TD3算法用于壓邊力控制策略的學(xué)習(xí).

    2.1 雙延遲深度確定性策略梯度

    TD3是一種actor-critic框架的深度強(qiáng)化學(xué)習(xí)算法,在深度確定性策略梯度[18](deep deterministic policy gradient,DDPG)的基礎(chǔ)上拓展而來(lái). 為了解決actor-critic框架算法中的Q值過(guò)估計(jì)問(wèn)題,TD3采用3個(gè)關(guān)鍵技術(shù)提高算法的穩(wěn)定性和性能.

    1)actor-critic框架下的剪裁雙Q學(xué)習(xí).受深度雙Q學(xué)習(xí)[19](double deepQ-learning,DDQN)啟發(fā),TD3使用當(dāng)前actor網(wǎng)絡(luò)選擇最優(yōu)動(dòng)作,使用目標(biāo)critic網(wǎng)絡(luò)評(píng)估策略:

    yt=r(st,at)+γQθ′(st+1,πφ(st+1)).

    在actor-critic框架中,目標(biāo)actor與目標(biāo)critic網(wǎng)絡(luò)采用的“軟更新”[18]方式使得當(dāng)前網(wǎng)絡(luò)與目標(biāo)網(wǎng)絡(luò)過(guò)于相似,無(wú)法有效分離動(dòng)作選擇與策略評(píng)估. 因此,算法保持了一對(duì)actor網(wǎng)絡(luò)(πφ1,πφ2)和一對(duì)critic網(wǎng)絡(luò)(Qθ1,Qθ2). 其中,πφ1根據(jù)Qθ1進(jìn)行優(yōu)化,πφ2根據(jù)Qθ2進(jìn)行優(yōu)化:

    (1)

    如果critic網(wǎng)絡(luò)Qθ1與Qθ2相互獨(dú)立,那么根據(jù)式(1)能有效避免由于策略更新所導(dǎo)致的偏差. 然而Qθ1與Qθ2在計(jì)算目標(biāo)值時(shí)互相使用,并且基于相同的回放經(jīng)驗(yàn)進(jìn)行更新,因此兩者并不互相獨(dú)立. 為了進(jìn)一步減小偏差,TD3使用了剪裁雙Q學(xué)習(xí)(Clipped DoubleQ-learning)算法計(jì)算目標(biāo)值:

    2)策略延遲更新.在深度強(qiáng)化學(xué)習(xí)算法中,目標(biāo)網(wǎng)絡(luò)被用于提供一個(gè)穩(wěn)定學(xué)習(xí)目標(biāo). 通過(guò)多步更新,critic網(wǎng)絡(luò)能逐漸減小與目標(biāo)Q值之間的誤差;然而,在critic網(wǎng)絡(luò)高誤差情況下,進(jìn)行actor網(wǎng)絡(luò)的更新會(huì)導(dǎo)致策略的離散行為. 因此,actor網(wǎng)絡(luò)的更新頻率應(yīng)低于critic網(wǎng)絡(luò)的更新頻率,保證actor網(wǎng)絡(luò)能在Q值誤差較低的情況下進(jìn)行更新,提高actor網(wǎng)絡(luò)的更新效率. TD3在critic網(wǎng)絡(luò)每進(jìn)行d次更新后,進(jìn)行一次actor網(wǎng)絡(luò)的更新.

    3)目標(biāo)策略平滑正則化.由于TD3中采用的是確定性策略,進(jìn)行critic更新時(shí)目標(biāo)值很容易受函數(shù)近似誤差的影響,導(dǎo)致目標(biāo)值不準(zhǔn)確. 因此TD3引入了一個(gè)正則化方法來(lái)減少目標(biāo)值的方差,通過(guò)自舉相似狀態(tài)動(dòng)作對(duì)的估計(jì)值進(jìn)行Q值估計(jì)平滑化:

    yt=r(st,at)+Εε[Qθ′(st+1,πφ′(st+1)+ε)].

    TD3通過(guò)向目標(biāo)策略添加一個(gè)隨機(jī)噪聲,并且在mini-batches上取平均的方法實(shí)現(xiàn)平滑正則化:

    ε~clip(N(0,σ),-c,c).

    2.2 結(jié)構(gòu)化控制網(wǎng)絡(luò)

    受傳統(tǒng)非線性控制理論啟發(fā),文獻(xiàn)[17]提出了結(jié)構(gòu)化控制網(wǎng)絡(luò)(structured control network,SCN),將actor-critic框架中的策略網(wǎng)絡(luò)分為非線性部分與線性部分兩個(gè)部分. 將上述兩個(gè)部分的動(dòng)作值相加得到最終動(dòng)作:

    πφ(s)=πn(s)+πl(wèi)(s).

    式中:線性項(xiàng)πl(wèi)(s)=K·s+b,K與b為線性控制增益矩陣與偏置項(xiàng). 非線性項(xiàng)πn(s)為一個(gè)全連接多層神經(jīng)網(wǎng)絡(luò),并去除輸出層的偏置項(xiàng). 這種簡(jiǎn)單的結(jié)構(gòu)變化能夠有效地提升深度強(qiáng)化學(xué)習(xí)的性能,在機(jī)器人控制以及視頻游戲等領(lǐng)域均取得了比原網(wǎng)絡(luò)結(jié)構(gòu)更加優(yōu)異的表現(xiàn).

    2.3 理論壓邊力知識(shí)

    在壓邊力控制領(lǐng)域,研究人員通過(guò)板材成形理論以及對(duì)拉深過(guò)程的簡(jiǎn)化假設(shè),推導(dǎo)了圓筒件拉深過(guò)程的有效壓邊力區(qū)間. 通過(guò)預(yù)先確定有效壓邊力區(qū)間,能夠得到相對(duì)合理的壓邊力曲線.

    如圖1所示,板材拉深過(guò)程的有效壓邊力范圍由上限壓邊力Qrup與下限壓邊力Qfwr組成.Qrup表示在拉深過(guò)程中保證工件不產(chǎn)生破裂缺陷的最大壓邊力,Qfwr表示在拉深過(guò)程中保證工件法蘭邊不產(chǎn)生起皺缺陷的最小壓邊力. 其中,

    [1-μK1(α)]-2ωI(α)-J(α)}.

    式中:μ為拉深過(guò)程中毛坯與模具間的摩擦因數(shù),n為材料的硬化指數(shù),σb為材料的抗拉強(qiáng)度,r為材料的厚向異性系數(shù).RB、RC、F(α)、K1(α)、ω、I(α)與J(α)是隨著拉深過(guò)程變化的變量,具體物理意義與計(jì)算方式參見(jiàn)文獻(xiàn)[20].

    式中:t0為板材厚度,B為材料的強(qiáng)度系數(shù),y0為單波的最大撓度,r0為法蘭內(nèi)半徑,m為拉深系數(shù),F(xiàn)(n,m,ρ)與Fm(λm)為隨拉深過(guò)程變化的兩個(gè)變量,具體物理意義與計(jì)算方式參見(jiàn)文獻(xiàn)[21].

    圖1中位于上限壓邊力與下限壓邊力之間的3條壓邊力曲線是由3種深度強(qiáng)化學(xué)習(xí)算法優(yōu)化學(xué)習(xí)得到的. 可以看出,它們?cè)谡麄€(gè)拉深過(guò)程中始終保持在Qrup與Qfwr之間,保證了最終成品不產(chǎn)生質(zhì)量缺陷.

    圖1 有效壓邊力Fig.1 Effective blank holder force

    2.4 算法描述

    本文將SCN-TD3與有限元仿真相結(jié)合,構(gòu)建了基于深度強(qiáng)化學(xué)習(xí)的壓邊力控制策略優(yōu)化算法, 算法描述如下.

    輸入:有限元模型

    輸出:actor網(wǎng)絡(luò)πφ

    第1步:初始化critic網(wǎng)絡(luò)Qθ1與Qθ2的參數(shù)θ1與θ2,以及actor網(wǎng)絡(luò)的參數(shù)φ

    第2步:初始化目標(biāo)網(wǎng)絡(luò)參數(shù):θ1′←θ1,θ2′←θ2,φ′←φ

    第3步:初始化回放經(jīng)驗(yàn)B

    第4步:For episode = 1,Mdo

    第5步:初始化有限元模型狀態(tài)s1

    第6步:Fort= 1,Tdo

    第7步:選擇動(dòng)作at,

    at←πφ(st)+ε,ε~N(0,σ)

    第8步:在有限元模型中執(zhí)行at,輸出st+1與rt

    第9步:將轉(zhuǎn)移經(jīng)驗(yàn)存儲(chǔ)到回放經(jīng)驗(yàn)中,(st,at,r(st,at),st+1)→B

    第11步:利用目標(biāo)網(wǎng)絡(luò)得到動(dòng)作

    第13步:根據(jù)梯度

    第14步:Iftmoddthen

    第15步:根據(jù)梯度

    第16步:更新目標(biāo)網(wǎng)絡(luò)

    θi′←τθi+(1-τ)θi′,φ′←τφ+(1-τ)φ′

    第17步:End if

    第18步:End for

    第19步:End for

    3 基于深度強(qiáng)化學(xué)習(xí)的拉深控制模型

    3.1 問(wèn)題描述

    本文針對(duì)板材拉深過(guò)程進(jìn)行壓邊力控制優(yōu)化,得到成形質(zhì)量合格的成品件. 如圖2所示,板材拉深裝置主要由毛坯、沖頭、壓邊圈和凹模4部分組成. 毛坯被放置在壓邊圈與凹模法蘭之間,由壓邊圈夾緊. 整個(gè)加工過(guò)程被分為5個(gè)控制步長(zhǎng),每個(gè)控制步長(zhǎng)內(nèi)壓邊力的大小相等,沖頭以恒定速度向下沖壓,將毛坯壓入凹模腔體. 本文將板材拉深控制過(guò)程建模成離散時(shí)間的馬爾科夫決策過(guò)程,以板材內(nèi)部的Mises應(yīng)力分布作為系統(tǒng)狀態(tài)s,每個(gè)控制步長(zhǎng)內(nèi)的壓邊力大小作為系統(tǒng)動(dòng)作a. 由于本文所建立的有限元模型被劃分為527個(gè)單元,使用全體單元的Mises應(yīng)力分布作為系統(tǒng)狀態(tài)會(huì)使得狀態(tài)空間過(guò)于龐大,不利于問(wèn)題的有效求解. 因此,本文采用圖2標(biāo)記的部分有限元的Mises應(yīng)力作為系統(tǒng)狀態(tài),在反應(yīng)系統(tǒng)狀態(tài)特征的同時(shí)將系統(tǒng)狀態(tài)縮小為27維.

    圖2 拉深模型Fig.2 Deep drawing finite element model

    3.2 壓邊力控制模型

    壓邊力控制模型如圖3所示,主要由環(huán)境與智能體兩部分組成. 其中,環(huán)境由有限元模型與成本函數(shù)組成;智能體由兩個(gè)價(jià)值網(wǎng)絡(luò)以及一個(gè)策略網(wǎng)絡(luò)組成. 環(huán)境接受到動(dòng)作a,根據(jù)前一時(shí)刻環(huán)境狀態(tài)得到當(dāng)前的回報(bào)r與觀察值s并將其輸入智能體,智能體輸出下一步長(zhǎng)動(dòng)作,開(kāi)始下一次交互. 智能體在與環(huán)境進(jìn)行交互的過(guò)程中利用深度強(qiáng)化學(xué)習(xí)算法不斷地更新網(wǎng)絡(luò)參數(shù),最終學(xué)習(xí)到一個(gè)最優(yōu)的壓邊力控制策略.

    圖3 壓邊力控制模型Fig.3 Blank holder force control model

    3.2.1 有限元模型

    本文建立的板材拉深仿真模型如圖4所示. 通過(guò)假設(shè)模型對(duì)稱性與材料各向同性,建立了1/4的板材拉深三維模型,并將拉深過(guò)程劃分為6個(gè)離散的時(shí)間步長(zhǎng). 其中前5個(gè)為控制步長(zhǎng),完成向下拉深過(guò)程,最后1個(gè)步長(zhǎng)為卸載步長(zhǎng),沖頭恢復(fù)到原始位置同時(shí)將壓邊力卸載. 模型根據(jù)上一步長(zhǎng)的狀態(tài)與輸入的壓邊力值,計(jì)算出下一步長(zhǎng)的狀態(tài).

    圖4 有限元模型Fig.4 Finite element model

    有限元模型由3個(gè)剛體部件與1個(gè)可變形毛坯組成. 剛體部件分別為沖頭、凹模和壓邊圈. 沖頭半徑Rp為25 mm,沖頭圓角半徑rp為4 mm,凹模內(nèi)徑Rd為26.2 mm,凹模圓角半徑rd為6 mm. 圓形毛坯厚度H為1 mm,半徑R0為50 mm. 毛坯材料屬性為彈塑性材料,材料為08F低碳鋼[22]. 材料的彈性模型為線彈性模型,塑性模型為符合Mises屈服準(zhǔn)則的各向同性模型. 毛坯的有限元單元類型為可變形的4節(jié)點(diǎn)4邊形殼單元(S4R).

    沖頭以恒定速度4 mm/s向下沖壓,將毛坯壓入凹模腔中,拉深深度S為20 mm. 壓邊力在每個(gè)控制步長(zhǎng)開(kāi)始時(shí)給出,在每個(gè)控制步長(zhǎng)內(nèi)壓邊力保持不變,均勻施加在壓邊圈上. 壓邊力變化范圍為5 000~13 000 N.

    本文用ABAQUS進(jìn)行有限元模型的搭建. 在線優(yōu)化控制環(huán)境中,智能體基于當(dāng)前得到的系統(tǒng)狀態(tài)來(lái)設(shè)置動(dòng)作. 為了符合在線優(yōu)化控制環(huán)境的要求,保證有限元模型的有效性與可重用性,使用了ABAQUS腳本與分析重啟動(dòng)技術(shù).

    3.2.2 回報(bào)函數(shù)

    回報(bào)函數(shù)僅由終止?fàn)顟B(tài)產(chǎn)生的回報(bào)值組成. 控制目標(biāo)為生產(chǎn)出的工件內(nèi)部應(yīng)力低,材料厚度充足,并且材料利用率低. 針對(duì)以上3個(gè)目標(biāo),分別建立評(píng)價(jià)指標(biāo)函數(shù)并通過(guò)三者的加權(quán)和得出總的質(zhì)量評(píng)價(jià)函數(shù)[11].

    有限元模型由527個(gè)單元組成. 根據(jù)有限元仿真輸出的Mises應(yīng)力分布云圖、厚度分布云圖與U1位移分布云圖,可以得到最終成品每個(gè)單元的Mises應(yīng)力值mi(i=1,2,...,527)、單元厚度hi(i=1,2,...,527)以及毛坯邊在x軸方向上的位移d. 根據(jù)以上的數(shù)據(jù),建立成本函數(shù):

    Cb(sT)=-minhi,

    Cc(sT)=-d.

    最后,本文以加權(quán)調(diào)和平均的形式給出總的質(zhì)量評(píng)價(jià)函數(shù):

    式中權(quán)重值wi用于控制各個(gè)成本項(xiàng)的重要性,本文中權(quán)重wi均為1.

    4 實(shí)驗(yàn)與結(jié)果分析

    受硬件因素影響,實(shí)際實(shí)驗(yàn)驗(yàn)證十分困難. 本文參考文獻(xiàn)[11]的壓邊力控制仿真實(shí)驗(yàn)設(shè)計(jì),利用圓筒件拉深成形的有限元仿真進(jìn)行實(shí)驗(yàn).

    4.1 訓(xùn)練過(guò)程分析

    在SCN-TD3中,策略網(wǎng)絡(luò)與價(jià)值網(wǎng)絡(luò)的結(jié)構(gòu)均為4層神經(jīng)網(wǎng)絡(luò),隱藏層節(jié)點(diǎn)為300. DDPG與TD3的網(wǎng)絡(luò)結(jié)構(gòu)與SCN-TD3一致. SCN-TD3算法中,學(xué)習(xí)率為0.000 1,探索率σ為0.1,目標(biāo)動(dòng)作噪聲方差σ'為0.2,目標(biāo)動(dòng)作截?cái)嘀礳為0.2,策略網(wǎng)絡(luò)更新間隔d為2. DDPG和TD3的參數(shù)與SCN-TD3一致. 訓(xùn)練過(guò)程中,算法在每個(gè)訓(xùn)練步長(zhǎng)進(jìn)行10次網(wǎng)絡(luò)更新.

    圖5為不同算法回報(bào)值隨訓(xùn)練步長(zhǎng)數(shù)的變化情況. 本文將各控制步長(zhǎng)下壓邊力的相鄰訓(xùn)練步長(zhǎng)的差作為算法收斂的判斷依據(jù). 當(dāng)連續(xù)100個(gè)訓(xùn)練步長(zhǎng)下,各壓邊力相鄰訓(xùn)練步長(zhǎng)的差均<1 000 N時(shí),認(rèn)為算法收斂. 在SCN-TD3控制下,回報(bào)值大約在第1 500個(gè)步長(zhǎng)收斂,而在DDPG與TD3控制下,回報(bào)值大約在第1 800與第1 700個(gè)步長(zhǎng)收斂. 從回報(bào)值的整體變化趨勢(shì)上看,SCN-TD3控制下的回報(bào)值收斂最快,并且最終收斂到的回報(bào)值水平高于TD3. TD3控制下的回報(bào)值收斂略快于DDPG,并且最終收斂到的回報(bào)值水平高于DDPG. 這主要是由于1)TD3算法中采用的剪裁雙Q學(xué)習(xí)、延遲策略更新和目標(biāo)策略平滑正則化這3種技術(shù),有效地緩解了價(jià)值網(wǎng)絡(luò)的過(guò)估計(jì)問(wèn)題以及過(guò)估計(jì)問(wèn)題給策略網(wǎng)絡(luò)更新所帶來(lái)的影響; 2)策略網(wǎng)絡(luò)的非線性結(jié)構(gòu)與線性結(jié)構(gòu)能夠同時(shí)結(jié)合全局控制與局部控制的優(yōu)點(diǎn). 各算法的優(yōu)勢(shì)對(duì)比如表1所示.

    圖5 回報(bào)值隨訓(xùn)練步長(zhǎng)變化Fig.5 Variation of episode reward with step

    表1 算法優(yōu)勢(shì)對(duì)比Tab.1 Comparison of different algorithms

    在訓(xùn)練過(guò)程中,每5個(gè)訓(xùn)練episode結(jié)束后,利用當(dāng)前的策略網(wǎng)絡(luò)進(jìn)行10次拉深仿真控制,取平均值作為驗(yàn)證回報(bào)值. SCN-TD3得到的最優(yōu)驗(yàn)證回報(bào)值為1.928 8,而DDPG與TD3控制下的最優(yōu)驗(yàn)證回報(bào)值分別為1.602 9與1.690 8. 各算法最優(yōu)驗(yàn)證回報(bào)值所對(duì)應(yīng)的壓邊力控制策略如表2所示.

    表2 最優(yōu)控制策略Tab.2 Optimal control policy N

    4.2 訓(xùn)練過(guò)程壓邊力變化分析

    為了探究壓邊力在訓(xùn)練過(guò)程中的變化情況,本文給出了DDPG、TD3與SCN-TD3控制下各控制步長(zhǎng)的壓邊力隨訓(xùn)練步長(zhǎng)的變化情況(見(jiàn)圖6). 由圖6可知,在訓(xùn)練的早期,步長(zhǎng)2到步長(zhǎng)5的壓邊力聚集在最小值5 000附近,3種算法均陷入局部最優(yōu). 隨著訓(xùn)練的進(jìn)行,算法逐漸跳出局部最優(yōu)點(diǎn),最終收斂于一定的壓邊力水平. SCN-TD3控制下各步長(zhǎng)壓邊力收斂速度均快于其他兩者,體現(xiàn)了SCN-TD3在性能上的優(yōu)勢(shì).

    圖6 各控制步長(zhǎng)壓邊力變化Fig.6 Variation of blank holder force with each control step

    4.3 成品質(zhì)量分析

    根據(jù)DDPG、TD3以及SCN-TD3學(xué)習(xí)到的最優(yōu)壓邊力控制策略,在ABAQUS中分別進(jìn)行板材仿真拉深. 根據(jù)仿真結(jié)果輸出的Mises應(yīng)力分布云圖、厚度分布云圖與U1位移分布云圖,進(jìn)行成品質(zhì)量分析. Mises應(yīng)力分布云圖展示了成品各有限元單元的Mises應(yīng)力分布情況. 根據(jù)圖7~9,可以得到三者的內(nèi)部應(yīng)力項(xiàng)指標(biāo)分別為4 221、4 475以及3 708. 從總體分布上看,TD3控制下的成品的內(nèi)部應(yīng)力和最小,DDPG控制下的成品的內(nèi)部應(yīng)力和最大.

    圖7 SCN-TD3控制下的Mises應(yīng)力分布云圖Fig.7 Mises stress distribution under SCN-TD3

    圖8 DDPG控制下的Mises應(yīng)力分布云圖Fig.8 Mises stress distribution under DDPG

    圖9 TD3控制下的Mises應(yīng)力分布云圖Fig.9 Mises stress distribution under TD3

    厚度分布云圖體現(xiàn)了成品各處厚度的分布情況. 根據(jù)圖10~12,SCN-TD3控制下成品的最小厚度為0.858 4 mm,DDPG控制下成品的最小厚度為0.853 3 mm,TD3控制下成品的最小厚度為0.850 3 mm. SCN-TD3控制下的成品厚度最為充足,TD3控制下的成品厚度最薄.

    圖10 SCN-TD3控制下的厚度分布云圖Fig.10 Thickness distribution under SCN-TD3

    U1位移分布云圖表示成品的每個(gè)有限元單元在x軸向上的位移. 根據(jù)圖13~15可知,SCN-TD3控制下成品的法蘭邊位移為7.781 7 mm,DDPG控制下成品的法蘭邊位移為8.0837 mm,TD3控制下成品的法蘭邊位移為7.944 6 mm. 表明SCN-TD3控制下的材料消耗比DDPG與TD3都要小.

    圖11 DDPG控制下的厚度分布云圖Fig.11 Thickness distribution under DDPG

    圖12 TD3控制下的厚度分布云圖Fig.12 Thickness distribution under TD3

    圖14 DDPG控制下的U1位移分布云圖Fig.14 U1 displacement distribution under DDPG

    圖15 TD3控制下的U1位移分布云圖Fig.15 U1 displacement distribution under TD3

    由于成本函數(shù)的組成為內(nèi)部應(yīng)力項(xiàng)、最小厚度項(xiàng)與材料消耗項(xiàng)的調(diào)和平均,因此盡管SCN-TD3在內(nèi)部應(yīng)力和指標(biāo)上的表現(xiàn)不如TD3,但是其在3個(gè)成本項(xiàng)中的綜合表現(xiàn)最優(yōu). 綜合以上分析可知,相較于DDPG與TD3,SCN-TD3控制下成品的內(nèi)部應(yīng)力和較小,材料最小厚度充足,材料消耗程度最低,總體質(zhì)量最優(yōu).

    4.4 理論知識(shí)對(duì)于訓(xùn)練過(guò)程的影響

    根據(jù)圖1的理論有效壓邊力區(qū)間產(chǎn)生多條可行的壓邊力軌跡以及轉(zhuǎn)移經(jīng)驗(yàn). 將有效壓邊力產(chǎn)生的轉(zhuǎn)移經(jīng)驗(yàn)加入初始經(jīng)驗(yàn)回放池,達(dá)到將理論知識(shí)引入壓邊力策略優(yōu)化過(guò)程的目的.

    通過(guò)對(duì)各控制步長(zhǎng)所對(duì)應(yīng)拉深行程下的有效壓邊力區(qū)間進(jìn)行隨機(jī)采樣,得到了1 000條有效壓邊力軌跡及5 000個(gè)有效轉(zhuǎn)移經(jīng)驗(yàn). 為了探究理論知識(shí)對(duì)于訓(xùn)練過(guò)程的影響,控制初始轉(zhuǎn)移經(jīng)驗(yàn)中有效壓邊力轉(zhuǎn)移經(jīng)驗(yàn)所占比例分別為0%、25%、50%、75%和100%,輸出所對(duì)應(yīng)的回報(bào)值隨訓(xùn)練步長(zhǎng)的變化情況,如圖16所示.

    圖16 不同比例有效轉(zhuǎn)移經(jīng)驗(yàn)下的回報(bào)值變化

    Fig.16 Variation of episode reward with different percentages of efficient transition experience

    由圖16可知,隨著有效轉(zhuǎn)移經(jīng)驗(yàn)所占比例的增加,訓(xùn)練過(guò)程中回報(bào)值的收斂越來(lái)越迅速,在50%達(dá)到最快收斂速度,隨后收斂速度隨有效轉(zhuǎn)移經(jīng)驗(yàn)所占比例的增加開(kāi)始下降. 這表明,在初始經(jīng)驗(yàn)回放中添加適量的有效轉(zhuǎn)移經(jīng)驗(yàn)?zāi)軌驗(yàn)榫W(wǎng)絡(luò)的訓(xùn)練提供一個(gè)良好的初始訓(xùn)練數(shù)據(jù),讓策略網(wǎng)絡(luò)的參數(shù)更快地往回報(bào)值高的參數(shù)空間進(jìn)行梯度下降. 然而當(dāng)初始回放經(jīng)驗(yàn)中的有效轉(zhuǎn)移經(jīng)驗(yàn)過(guò)多時(shí),由于缺少低回報(bào)值的轉(zhuǎn)移經(jīng)驗(yàn),策略網(wǎng)絡(luò)的更新無(wú)法有效地遠(yuǎn)離低回報(bào)值的參數(shù)空間,反而使得回報(bào)值收斂速度下降. 根據(jù)以上分析可知,在初始經(jīng)驗(yàn)回放池中保持經(jīng)驗(yàn)樣本的多樣性有助于策略網(wǎng)絡(luò)的訓(xùn)練.

    5 結(jié) 論

    1)本文將深度強(qiáng)化學(xué)習(xí)與有限元仿真進(jìn)行集成,建立了板材拉深過(guò)程壓邊力控制模型,避免了系統(tǒng)動(dòng)態(tài)的擬合.

    2)對(duì)策略網(wǎng)絡(luò)的結(jié)構(gòu)進(jìn)行改進(jìn),并將壓邊力理論知識(shí)引入網(wǎng)絡(luò)訓(xùn)練中,建立了一個(gè)更加有效的深度強(qiáng)化學(xué)習(xí)算法,提高了成品的成形質(zhì)量.

    3)有限元仿真實(shí)驗(yàn)驗(yàn)證了本文所提出的SCN-TD3算法的有效性,并與DDPG與TD3算法進(jìn)行了壓邊力控制效果比較. 實(shí)驗(yàn)表明,SCN-TD3控制下成品的內(nèi)部應(yīng)力和較小,材料最小厚度充足,材料消耗程度最低,總體質(zhì)量最優(yōu).

    猜你喜歡
    壓邊成品步長(zhǎng)
    基于Armijo搜索步長(zhǎng)的BFGS與DFP擬牛頓法的比較研究
    薄板成形電磁壓邊技術(shù)研究進(jìn)展
    2017年1—4月熱帶作物及其成品進(jìn)出口情況
    柔性壓邊多點(diǎn)成形技術(shù)
    2017年1—3月熱帶作物及其成品進(jìn)出口情況
    2017年2月熱帶作物及其成品進(jìn)出口情況(續(xù))
    2017年1—2月熱帶作物及其成品進(jìn)出口情況(續(xù))
    基于逐維改進(jìn)的自適應(yīng)步長(zhǎng)布谷鳥(niǎo)搜索算法
    一種新型光伏系統(tǒng)MPPT變步長(zhǎng)滯環(huán)比較P&O法
    一種新穎的光伏自適應(yīng)變步長(zhǎng)最大功率點(diǎn)跟蹤算法
    精品国产国语对白av| 久久精品影院6| 国产精品一区二区免费欧美| tocl精华| 黄色视频,在线免费观看| 日本五十路高清| 老鸭窝网址在线观看| 国产av在哪里看| 精品国产国语对白av| 国产成人欧美在线观看| 18禁国产床啪视频网站| 国产免费男女视频| 久久久久国产一级毛片高清牌| 精品人妻1区二区| 亚洲欧美精品综合一区二区三区| 啦啦啦观看免费观看视频高清| 欧美日韩亚洲综合一区二区三区_| 香蕉av资源在线| av片东京热男人的天堂| 人人妻,人人澡人人爽秒播| 91大片在线观看| 两个人免费观看高清视频| 夜夜看夜夜爽夜夜摸| 日韩大尺度精品在线看网址| 久久久久国产一级毛片高清牌| 黑丝袜美女国产一区| 久久久国产欧美日韩av| 欧美国产精品va在线观看不卡| 成人18禁高潮啪啪吃奶动态图| 久99久视频精品免费| or卡值多少钱| 国产爱豆传媒在线观看 | 亚洲久久久国产精品| 日日爽夜夜爽网站| 成人手机av| 宅男免费午夜| 亚洲真实伦在线观看| 女同久久另类99精品国产91| 欧美性长视频在线观看| 午夜免费鲁丝| 免费人成视频x8x8入口观看| 久热这里只有精品99| 亚洲av中文字字幕乱码综合 | 久久性视频一级片| 国产91精品成人一区二区三区| 天天躁狠狠躁夜夜躁狠狠躁| 97碰自拍视频| 熟女电影av网| 国产视频一区二区在线看| 欧美不卡视频在线免费观看 | 91国产中文字幕| 亚洲精品中文字幕在线视频| 精品久久久久久久久久久久久 | 成人亚洲精品av一区二区| 精品国产乱码久久久久久男人| 亚洲真实伦在线观看| 欧美日韩黄片免| 桃色一区二区三区在线观看| 成在线人永久免费视频| 欧美黄色片欧美黄色片| 国产又色又爽无遮挡免费看| 国产成人欧美| 午夜两性在线视频| 中文字幕精品亚洲无线码一区 | 成人国产一区最新在线观看| 性欧美人与动物交配| 免费高清视频大片| 午夜福利高清视频| 一级黄色大片毛片| 国产亚洲精品av在线| 最新美女视频免费是黄的| 欧美中文日本在线观看视频| 18禁美女被吸乳视频| 两个人免费观看高清视频| 国内精品久久久久精免费| 亚洲精华国产精华精| 欧美午夜高清在线| 欧美日韩瑟瑟在线播放| 国产亚洲精品综合一区在线观看 | 午夜老司机福利片| 亚洲精华国产精华精| 一a级毛片在线观看| 正在播放国产对白刺激| 国产成人影院久久av| 免费女性裸体啪啪无遮挡网站| 色综合婷婷激情| 久久热在线av| 亚洲欧美日韩高清在线视频| 欧美一级a爱片免费观看看 | 无人区码免费观看不卡| 男人的好看免费观看在线视频 | 97碰自拍视频| 少妇熟女aⅴ在线视频| 校园春色视频在线观看| 久久久久九九精品影院| 成人三级黄色视频| 久久精品影院6| 亚洲成人精品中文字幕电影| 久久久国产欧美日韩av| 欧美绝顶高潮抽搐喷水| 日日干狠狠操夜夜爽| 啦啦啦免费观看视频1| 天天躁夜夜躁狠狠躁躁| 午夜视频精品福利| 午夜福利高清视频| 亚洲精品一区av在线观看| 大型黄色视频在线免费观看| 亚洲欧美日韩高清在线视频| 99久久综合精品五月天人人| 国产精品久久视频播放| 成人三级黄色视频| 99国产精品99久久久久| 色综合欧美亚洲国产小说| 久久午夜亚洲精品久久| cao死你这个sao货| 成人亚洲精品一区在线观看| 精品乱码久久久久久99久播| 久久久久久免费高清国产稀缺| xxx96com| 日本一区二区免费在线视频| 午夜福利免费观看在线| 一进一出抽搐gif免费好疼| 国产激情欧美一区二区| 狂野欧美激情性xxxx| 国产av又大| 久久性视频一级片| 免费在线观看亚洲国产| 制服丝袜大香蕉在线| 两个人免费观看高清视频| 亚洲午夜精品一区,二区,三区| 伦理电影免费视频| 亚洲欧美精品综合久久99| 日韩大码丰满熟妇| 国产成人精品久久二区二区91| 亚洲九九香蕉| 黄片小视频在线播放| 国产av一区二区精品久久| 一二三四社区在线视频社区8| 18禁美女被吸乳视频| 人成视频在线观看免费观看| 黑丝袜美女国产一区| 精品久久久久久,| 大型黄色视频在线免费观看| 色播在线永久视频| 女人爽到高潮嗷嗷叫在线视频| 国产伦在线观看视频一区| 精品无人区乱码1区二区| 少妇裸体淫交视频免费看高清 | 久久久久久久久中文| 精品欧美一区二区三区在线| 久9热在线精品视频| 99久久无色码亚洲精品果冻| 一进一出好大好爽视频| 日本五十路高清| 啦啦啦免费观看视频1| 一a级毛片在线观看| 精品国产美女av久久久久小说| 国产一卡二卡三卡精品| 精品乱码久久久久久99久播| 午夜福利在线在线| 亚洲精品中文字幕在线视频| 亚洲精品在线美女| 亚洲国产精品合色在线| 久久人妻av系列| 免费看十八禁软件| 免费高清在线观看日韩| 国产私拍福利视频在线观看| 国产欧美日韩一区二区三| 午夜a级毛片| 久久狼人影院| 免费在线观看影片大全网站| 欧美性长视频在线观看| 国产在线精品亚洲第一网站| 别揉我奶头~嗯~啊~动态视频| 成人免费观看视频高清| 亚洲真实伦在线观看| 欧美国产精品va在线观看不卡| 国产精品亚洲美女久久久| 亚洲自偷自拍图片 自拍| 搡老熟女国产l中国老女人| 啦啦啦韩国在线观看视频| 久久久久国内视频| 亚洲精品国产精品久久久不卡| 国内毛片毛片毛片毛片毛片| 97人妻精品一区二区三区麻豆 | 每晚都被弄得嗷嗷叫到高潮| 妹子高潮喷水视频| 波多野结衣av一区二区av| 亚洲精品美女久久久久99蜜臀| 国产三级黄色录像| 女性生殖器流出的白浆| 久久久久久久午夜电影| av在线天堂中文字幕| 精品乱码久久久久久99久播| 丰满的人妻完整版| 日韩三级视频一区二区三区| 黄频高清免费视频| 69av精品久久久久久| 69av精品久久久久久| 亚洲精华国产精华精| 1024视频免费在线观看| 久久午夜亚洲精品久久| 亚洲第一青青草原| 男女床上黄色一级片免费看| 日韩欧美一区视频在线观看| 欧美黑人欧美精品刺激| 国产主播在线观看一区二区| 国产一区在线观看成人免费| 久久天堂一区二区三区四区| 欧美在线黄色| 亚洲成av片中文字幕在线观看| 亚洲精品中文字幕在线视频| 国产亚洲av高清不卡| 午夜视频精品福利| 美女免费视频网站| 一区福利在线观看| АⅤ资源中文在线天堂| 两个人视频免费观看高清| 免费高清视频大片| 十八禁网站免费在线| 日韩欧美三级三区| 久久久水蜜桃国产精品网| 久久亚洲精品不卡| 久久精品91蜜桃| 国产精品免费视频内射| 亚洲熟女毛片儿| 国内少妇人妻偷人精品xxx网站 | 男女视频在线观看网站免费 | 久久久久国内视频| 十八禁人妻一区二区| 久久中文字幕一级| 精品国产乱码久久久久久男人| 性色av乱码一区二区三区2| 亚洲精品美女久久av网站| 91麻豆精品激情在线观看国产| 美女大奶头视频| 好男人电影高清在线观看| 婷婷精品国产亚洲av在线| 久久精品国产清高在天天线| 变态另类丝袜制服| 黄频高清免费视频| 午夜福利在线观看吧| 男女做爰动态图高潮gif福利片| 最好的美女福利视频网| 18禁观看日本| 国产99白浆流出| 国产三级在线视频| 国产亚洲av高清不卡| 国产黄片美女视频| 人人妻,人人澡人人爽秒播| 国内揄拍国产精品人妻在线 | 视频区欧美日本亚洲| 又大又爽又粗| 老司机午夜福利在线观看视频| 亚洲在线自拍视频| 老司机深夜福利视频在线观看| 午夜福利成人在线免费观看| 国产精品一区二区免费欧美| 亚洲在线自拍视频| 亚洲一区中文字幕在线| 欧美绝顶高潮抽搐喷水| 曰老女人黄片| 午夜两性在线视频| 国产午夜福利久久久久久| 男人舔奶头视频| 夜夜看夜夜爽夜夜摸| 好男人电影高清在线观看| 欧美午夜高清在线| 免费女性裸体啪啪无遮挡网站| 丝袜人妻中文字幕| 黄色片一级片一级黄色片| 91老司机精品| 欧美精品啪啪一区二区三区| 国产成人精品久久二区二区免费| www日本在线高清视频| 日韩国内少妇激情av| 免费观看精品视频网站| 亚洲免费av在线视频| 首页视频小说图片口味搜索| 色尼玛亚洲综合影院| 日日摸夜夜添夜夜添小说| 中文字幕精品亚洲无线码一区 | 精品午夜福利视频在线观看一区| 久久午夜综合久久蜜桃| 欧美精品亚洲一区二区| 美女免费视频网站| 久久久久久久午夜电影| 免费搜索国产男女视频| 国产色视频综合| 国产精品久久电影中文字幕| 亚洲精品av麻豆狂野| 欧美日韩瑟瑟在线播放| 精品一区二区三区视频在线观看免费| 一进一出抽搐gif免费好疼| 日韩欧美一区二区三区在线观看| 国产一区二区激情短视频| 久久亚洲真实| 成人亚洲精品av一区二区| 欧美 亚洲 国产 日韩一| 国产精品影院久久| 中文字幕人妻丝袜一区二区| 亚洲久久久国产精品| 久久人妻福利社区极品人妻图片| av视频在线观看入口| 99国产精品一区二区蜜桃av| 男人操女人黄网站| 亚洲天堂国产精品一区在线| 亚洲人成伊人成综合网2020| 亚洲男人的天堂狠狠| 日本熟妇午夜| 波多野结衣av一区二区av| 亚洲狠狠婷婷综合久久图片| 国产极品粉嫩免费观看在线| 日韩欧美国产在线观看| 国产精品国产高清国产av| 搡老岳熟女国产| 淫秽高清视频在线观看| bbb黄色大片| 国产成人av激情在线播放| av电影中文网址| 男人舔女人下体高潮全视频| 又大又爽又粗| 国产亚洲精品av在线| 丰满的人妻完整版| 国产亚洲av嫩草精品影院| 欧美日韩一级在线毛片| 精品国内亚洲2022精品成人| 搞女人的毛片| 村上凉子中文字幕在线| 亚洲成人国产一区在线观看| 午夜福利在线观看吧| 无人区码免费观看不卡| 一区二区三区国产精品乱码| 亚洲av五月六月丁香网| 嫩草影视91久久| 1024香蕉在线观看| 90打野战视频偷拍视频| 国产色视频综合| 日韩欧美国产在线观看| 曰老女人黄片| 国内揄拍国产精品人妻在线 | 国产成人影院久久av| 制服人妻中文乱码| 午夜两性在线视频| 日韩欧美三级三区| www.www免费av| www.熟女人妻精品国产| 精品高清国产在线一区| 妹子高潮喷水视频| 国产亚洲精品第一综合不卡| 十八禁网站免费在线| 欧美在线一区亚洲| 成年免费大片在线观看| 看片在线看免费视频| 亚洲成人久久性| 日本精品一区二区三区蜜桃| 久久性视频一级片| 亚洲人成网站高清观看| 国产精品亚洲一级av第二区| 少妇被粗大的猛进出69影院| 母亲3免费完整高清在线观看| 精品久久久久久成人av| www日本在线高清视频| 在线视频色国产色| 成在线人永久免费视频| av福利片在线| 日本一本二区三区精品| 国产精品乱码一区二三区的特点| 男女午夜视频在线观看| 美女午夜性视频免费| 叶爱在线成人免费视频播放| 国产欧美日韩一区二区精品| 怎么达到女性高潮| 天天躁夜夜躁狠狠躁躁| 黑丝袜美女国产一区| 国产v大片淫在线免费观看| 国产精品国产高清国产av| 日韩精品免费视频一区二区三区| 少妇裸体淫交视频免费看高清 | 国内少妇人妻偷人精品xxx网站 | 一卡2卡三卡四卡精品乱码亚洲| 亚洲人成伊人成综合网2020| 窝窝影院91人妻| 久久久久亚洲av毛片大全| 听说在线观看完整版免费高清| 亚洲成国产人片在线观看| 精品福利观看| 18禁国产床啪视频网站| 桃红色精品国产亚洲av| 制服人妻中文乱码| 12—13女人毛片做爰片一| 国产一区二区激情短视频| 日本一区二区免费在线视频| 午夜久久久在线观看| 国产熟女xx| 在线观看免费视频日本深夜| 午夜福利在线在线| 亚洲av电影在线进入| 香蕉国产在线看| 中文字幕av电影在线播放| 日本熟妇午夜| 亚洲真实伦在线观看| av有码第一页| 特大巨黑吊av在线直播 | 亚洲av美国av| 美女 人体艺术 gogo| 午夜日韩欧美国产| 男女午夜视频在线观看| 国产成人精品无人区| 午夜免费鲁丝| 最好的美女福利视频网| 免费人成视频x8x8入口观看| 久久久久久久久免费视频了| 嫩草影视91久久| 啪啪无遮挡十八禁网站| 91老司机精品| 精品久久久久久,| 欧美在线一区亚洲| 淫妇啪啪啪对白视频| 国产男靠女视频免费网站| av在线天堂中文字幕| 久久久国产成人精品二区| 亚洲专区字幕在线| 精华霜和精华液先用哪个| 亚洲狠狠婷婷综合久久图片| 久久久精品国产亚洲av高清涩受| 99久久99久久久精品蜜桃| 巨乳人妻的诱惑在线观看| 最近最新免费中文字幕在线| 精品第一国产精品| 嫩草影视91久久| 狠狠狠狠99中文字幕| 制服人妻中文乱码| 91字幕亚洲| 91av网站免费观看| 日本三级黄在线观看| 精品国产超薄肉色丝袜足j| 日韩视频一区二区在线观看| 成人三级做爰电影| 又紧又爽又黄一区二区| 成人免费观看视频高清| 女人被狂操c到高潮| 麻豆成人av在线观看| 久久久久久国产a免费观看| 国产成人一区二区三区免费视频网站| 不卡av一区二区三区| 一级a爱片免费观看的视频| 亚洲精品中文字幕一二三四区| 可以免费在线观看a视频的电影网站| 白带黄色成豆腐渣| 19禁男女啪啪无遮挡网站| 老司机午夜十八禁免费视频| 国产亚洲精品综合一区在线观看 | 1024手机看黄色片| 久久久久免费精品人妻一区二区 | 一级片免费观看大全| 国产激情偷乱视频一区二区| 一区福利在线观看| 人人妻人人澡人人看| 精品国产亚洲在线| 亚洲精品国产精品久久久不卡| 三级毛片av免费| 欧美精品亚洲一区二区| 国产精品,欧美在线| 免费在线观看成人毛片| 亚洲va日本ⅴa欧美va伊人久久| 在线观看一区二区三区| 国产av又大| 人人妻人人看人人澡| 免费在线观看完整版高清| 久久久国产成人免费| 99久久99久久久精品蜜桃| 色综合亚洲欧美另类图片| 欧美色欧美亚洲另类二区| 成人特级黄色片久久久久久久| 叶爱在线成人免费视频播放| 黑人欧美特级aaaaaa片| 欧美在线黄色| 黄色片一级片一级黄色片| 变态另类成人亚洲欧美熟女| 国内毛片毛片毛片毛片毛片| 精品久久久久久久久久免费视频| 一级a爱片免费观看的视频| 欧美日韩福利视频一区二区| av免费在线观看网站| 制服丝袜大香蕉在线| 怎么达到女性高潮| 亚洲成人国产一区在线观看| 国产亚洲欧美精品永久| 97碰自拍视频| 男人的好看免费观看在线视频 | 午夜免费鲁丝| 国产精品香港三级国产av潘金莲| 亚洲五月天丁香| 欧美日本视频| 美女高潮喷水抽搐中文字幕| 亚洲第一欧美日韩一区二区三区| 亚洲 欧美 日韩 在线 免费| 久久久精品欧美日韩精品| 最近最新中文字幕大全电影3 | 19禁男女啪啪无遮挡网站| √禁漫天堂资源中文www| 波多野结衣高清无吗| 丝袜人妻中文字幕| 两性午夜刺激爽爽歪歪视频在线观看 | 特大巨黑吊av在线直播 | 精品久久久久久久末码| 国产亚洲精品综合一区在线观看 | 97人妻精品一区二区三区麻豆 | 日韩一卡2卡3卡4卡2021年| 午夜两性在线视频| 久久精品国产亚洲av高清一级| 一级毛片女人18水好多| 一a级毛片在线观看| 国产区一区二久久| 在线观看www视频免费| 色播亚洲综合网| 91九色精品人成在线观看| 天堂√8在线中文| 国产aⅴ精品一区二区三区波| 久久精品夜夜夜夜夜久久蜜豆 | 人人妻人人澡人人看| 亚洲人成网站在线播放欧美日韩| 黄色视频,在线免费观看| 国产aⅴ精品一区二区三区波| 搡老岳熟女国产| 久久久久久亚洲精品国产蜜桃av| 亚洲av成人不卡在线观看播放网| 好男人在线观看高清免费视频 | 久久天堂一区二区三区四区| 老司机午夜十八禁免费视频| 一边摸一边做爽爽视频免费| 一夜夜www| 99精品在免费线老司机午夜| 亚洲精品久久成人aⅴ小说| 成年女人毛片免费观看观看9| 午夜福利高清视频| 十八禁人妻一区二区| 老熟妇乱子伦视频在线观看| 51午夜福利影视在线观看| 精品久久久久久久人妻蜜臀av| 波多野结衣高清作品| 制服人妻中文乱码| 日本 av在线| 老司机午夜福利在线观看视频| av中文乱码字幕在线| 亚洲一卡2卡3卡4卡5卡精品中文| 777久久人妻少妇嫩草av网站| а√天堂www在线а√下载| 热re99久久国产66热| 宅男免费午夜| 少妇的丰满在线观看| 99久久久亚洲精品蜜臀av| 免费人成视频x8x8入口观看| 欧美日本视频| 亚洲第一青青草原| 亚洲第一欧美日韩一区二区三区| 在线视频色国产色| 亚洲成人久久爱视频| 亚洲国产高清在线一区二区三 | 午夜免费激情av| 一二三四在线观看免费中文在| av超薄肉色丝袜交足视频| 国产激情欧美一区二区| 18禁国产床啪视频网站| 国产人伦9x9x在线观看| 少妇被粗大的猛进出69影院| 国产久久久一区二区三区| 精品国产一区二区三区四区第35| 国产v大片淫在线免费观看| 国产亚洲精品第一综合不卡| 最新在线观看一区二区三区| 国产亚洲精品第一综合不卡| 两人在一起打扑克的视频| 亚洲全国av大片| 99精品久久久久人妻精品| 亚洲 欧美 日韩 在线 免费| 啪啪无遮挡十八禁网站| 国产黄片美女视频| 99riav亚洲国产免费| 亚洲精品中文字幕在线视频| av福利片在线| 久久婷婷成人综合色麻豆| 午夜福利视频1000在线观看| 精品少妇一区二区三区视频日本电影| 亚洲一码二码三码区别大吗| 亚洲va日本ⅴa欧美va伊人久久| 制服丝袜大香蕉在线| 亚洲国产日韩欧美精品在线观看 | 久久精品国产清高在天天线| 伦理电影免费视频| 精品国产美女av久久久久小说| 色尼玛亚洲综合影院| 日韩欧美一区二区三区在线观看| 成人18禁在线播放| 欧美黑人精品巨大| 高清在线国产一区| 香蕉av资源在线| 亚洲天堂国产精品一区在线| 欧美激情 高清一区二区三区| 级片在线观看| 亚洲精品色激情综合| 久久国产精品人妻蜜桃| 亚洲男人天堂网一区| 黑人欧美特级aaaaaa片| 国产黄a三级三级三级人| 久久国产亚洲av麻豆专区| 嫩草影院精品99| 不卡av一区二区三区| 免费人成视频x8x8入口观看| 麻豆成人av在线观看| 一区二区三区精品91| 国产一级毛片七仙女欲春2 | 国产精品免费视频内射| 黄片大片在线免费观看|