• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    二自由度飛行姿態(tài)模擬器的模糊強(qiáng)化學(xué)習(xí)控制

    2019-01-22 04:39:46任立偉班曉軍吳奮黃顯林
    電機(jī)與控制學(xué)報(bào) 2019年11期
    關(guān)鍵詞:強(qiáng)化學(xué)習(xí)

    任立偉 班曉軍 吳奮 黃顯林

    摘?要:針對(duì)二自由度飛行姿態(tài)模擬器的姿態(tài)穩(wěn)定問(wèn)題,依據(jù)強(qiáng)化學(xué)習(xí)中的策略迭代算法設(shè)計(jì)姿態(tài)穩(wěn)定控制器。將策略迭代學(xué)習(xí)算法與多項(xiàng)式TS模糊系統(tǒng)相結(jié)合,對(duì)控制器參數(shù)進(jìn)行學(xué)習(xí)調(diào)整,實(shí)現(xiàn)對(duì)二自由度飛行姿態(tài)模擬器姿態(tài)穩(wěn)定控制性能的優(yōu)化。通過(guò)多項(xiàng)式TS模糊模型對(duì)執(zhí)行器的策略函數(shù)以及評(píng)價(jià)器的值函數(shù)進(jìn)行逼近,建立基于多項(xiàng)式TS模糊模型的執(zhí)行器-評(píng)價(jià)器結(jié)構(gòu),經(jīng)過(guò)策略迭代過(guò)程,學(xué)習(xí)得到最優(yōu)控制器參數(shù),使得值函數(shù)最小。通過(guò)仿真驗(yàn)證,證明了基于多項(xiàng)式TS模糊模型的執(zhí)行器—評(píng)價(jià)器結(jié)構(gòu)的策略迭代算法在飛行器姿態(tài)穩(wěn)定控制方面的有效性。

    關(guān)鍵詞:飛行器控制;姿態(tài)穩(wěn)定;強(qiáng)化學(xué)習(xí);策略迭代算法;多項(xiàng)式TS模糊系統(tǒng)

    DOI:10.15938/j.emc.2019.11.016

    中圖分類(lèi)號(hào):TP?273

    文獻(xiàn)標(biāo)志碼:A

    文章編號(hào):1007-449X(2019)11-0127-08

    收稿日期:?2019-03-15

    基金項(xiàng)目:國(guó)家自然科學(xué)基金(61304006,61273095)

    作者簡(jiǎn)介:任立偉(1989—),女,博士研究生,研究方向?yàn)槟:到y(tǒng)理論;

    班曉軍(1978—),男,博士,教授,博士生導(dǎo)師,研究方向?yàn)槟:刂评碚?、魯棒增益調(diào)度控制理論、機(jī)電伺服控制系統(tǒng)等;

    吳?奮(1964—),男,博士,教授,研究方向?yàn)轸敯糇儏?shù)控制、切換和混雜控制、非線(xiàn)性控制、先進(jìn)控制技術(shù)的工程應(yīng)用;

    黃顯林(1956—),男,博士,教授,博士生導(dǎo)師,研究方向?yàn)檠芯糠较驗(yàn)轱w行器制導(dǎo)、導(dǎo)航與控制、復(fù)雜系統(tǒng)非線(xiàn)性魯棒與自適應(yīng)控制等。

    通信作者:班曉軍

    Fuzzy?learning?controller?design?of?2DOF?flight?attitude?simulator

    REN?Liwei1,?BAN?Xiaojun1,?WU?Fen2,?HUANG?Xianlin1

    (1.?Center?for?Control?Theory?and?Guidance?Technology,?Harbin?Institute?of?Technology,?Harbin?150001,?China;

    2.Department?of?Mechanical?and?Aerospace?Engineering,?North?Carolina?State?University,Raleigh?27695-7910,USA)

    Abstract:

    Aiming?at?the?attitude?stabilization?problem?of?twodegreesoffreedom?flight?attitude?simulator,?an?attitude?stabilization?controller?was?designed?based?on?the?policy?iteration?algorithm?in?the?reinforcement?learning.The?policyiteration?learning?algorithm?and?the?polynomial?TS?fuzzy?systems?were?combined?together,?conducting?parameters′?adjustment?of?the?controller,?and?achievingthe?optimization?of?the?attitude?stability?control?performance?of?the?twodegreesoffreedom?flight?attitude?simulator.By?approximating?the?policy?function?of?the?actor?and?the?value?function?of?the?critic?with?the?polynomial?TS?fuzzy?models,?the?actorcritic?structure?based?on?the?polynomial?TS?fuzzy?models?was?established.?Through?the?policy?iteration?process,?the?optimal?parameters?of?the?controller?were?learned?to?minimize?the?value?function.The?simulation?results?show?that?the?policy?iteration?algorithm?based?on?polynomial?TS?fuzzy?models?is?effective?in?controlling?aircraft?attitude?stabilization.

    Keywords:aircraft?control;?attitude?stabilization;?reinforcement?learning;?policy?iteration?algorithm;?polynomial?TS?fuzzy?system

    0?引?言

    旋翼式飛行器因其結(jié)構(gòu)簡(jiǎn)單、成本低廉、使用便利等特點(diǎn),被廣泛應(yīng)用于諸多領(lǐng)域,因此對(duì)其姿態(tài)控制方法的研究是很有必要的。為了有效提高旋翼式飛行器姿態(tài)控制系統(tǒng)的研發(fā)效率并降低研發(fā)成本,旋翼式飛行姿態(tài)模擬器應(yīng)運(yùn)而生。

    文獻(xiàn)[1-2]提出了一種適合在實(shí)驗(yàn)室環(huán)境下研究旋翼式微小型飛行器姿態(tài)控制的小型二自由度飛行姿態(tài)模擬器。此套設(shè)備可以方便地改變整個(gè)系統(tǒng)的質(zhì)心位置,從而改變被控對(duì)象動(dòng)力學(xué)方程中的參數(shù),為研究強(qiáng)魯棒性、自適應(yīng)姿態(tài)穩(wěn)定以及大角度姿態(tài)調(diào)整控制問(wèn)題提供了一個(gè)良好的實(shí)驗(yàn)平臺(tái)。該二自由度飛行姿態(tài)模擬器具有自身不穩(wěn)定性、非線(xiàn)性等特性,采用可行又有效的控制策略才能保證其運(yùn)行的穩(wěn)定性。

    強(qiáng)化學(xué)習(xí)(reinforcement?learning,RL)是計(jì)算智能領(lǐng)域發(fā)展起來(lái)的一種機(jī)器學(xué)習(xí)方法[3-4],它通過(guò)智能體與環(huán)境的交互進(jìn)行探索,在采取動(dòng)作和環(huán)境的評(píng)價(jià)信息中獲得所需知識(shí),進(jìn)一步指導(dǎo)后續(xù)動(dòng)作,最終得到最優(yōu)的動(dòng)作策略,以適應(yīng)環(huán)境達(dá)到預(yù)期目的。強(qiáng)化學(xué)習(xí)與最優(yōu)控制和自適應(yīng)控制有著密切的聯(lián)系,F(xiàn)rank?L.?Lewis及其團(tuán)隊(duì)在把RL應(yīng)用到控制領(lǐng)域的過(guò)程中做出了大量重要的工作,得到了很多有價(jià)值的理論成果[5-8]。強(qiáng)化學(xué)習(xí)具有對(duì)環(huán)境先驗(yàn)知識(shí)要求低的優(yōu)點(diǎn),其主要學(xué)習(xí)任務(wù)是獲得“狀態(tài)—?jiǎng)幼鳌敝g的映射關(guān)系。函數(shù)逼近的本質(zhì)就是利用某一函數(shù)來(lái)逼近這一映射關(guān)系。對(duì)于控制領(lǐng)域,即強(qiáng)化學(xué)習(xí)不需要對(duì)象模型信息,主要目的是獲取控制策略,上述函數(shù)實(shí)際上就是控制器,對(duì)于參數(shù)化控制器而言,就是在交互過(guò)程中通過(guò)環(huán)境的評(píng)價(jià)信息對(duì)這個(gè)控制器的參數(shù)進(jìn)行優(yōu)化,從而達(dá)到改善控制效果的目的。強(qiáng)化學(xué)習(xí)控制方法目前作為一種基于人工智能的優(yōu)化控制方法,在求解復(fù)雜控制決策問(wèn)題過(guò)程中,極具潛力和優(yōu)勢(shì)[9-13]。

    一般所研究的強(qiáng)化學(xué)習(xí)系統(tǒng),其狀態(tài)和動(dòng)作空間都是離散且有限的,值函數(shù)可以用表格表示。而對(duì)于大的狀態(tài)、動(dòng)作空間甚至連續(xù)狀態(tài)、動(dòng)作空間,值函數(shù)的存儲(chǔ)將面臨“維數(shù)災(zāi)難”問(wèn)題。為了解決這個(gè)問(wèn)題,值函數(shù)逼近方法被引入到強(qiáng)化學(xué)習(xí)中,已經(jīng)成為一種有效方法。模糊邏輯推理作為控制理論中的一種重要方法,由于其具有萬(wàn)能逼近的特點(diǎn)而被用于強(qiáng)化學(xué)習(xí)中,用于逼近狀態(tài)值函數(shù)或狀態(tài)動(dòng)作值函數(shù),其中包括因逼近能力以及簡(jiǎn)單結(jié)構(gòu)而被廣泛研究的TakagiSugeno(TS)模糊模型[14-15]。

    近些年來(lái),多項(xiàng)式TS模糊模型受到越來(lái)越多的關(guān)注。實(shí)質(zhì)上,多項(xiàng)式TS模糊模型可看作是TS模糊模型的一種推廣。這兩種模型主要區(qū)別在于模糊規(guī)則的后件部分:TS模糊模型后件部分是線(xiàn)性模型,而多項(xiàng)式TS模糊模型后件部分是多項(xiàng)式模型。因此,相比于傳統(tǒng)的TS模糊模型,多項(xiàng)式TS模糊模型可以更好地描述非線(xiàn)性系統(tǒng)。具體來(lái)說(shuō),針對(duì)同一非線(xiàn)性動(dòng)態(tài)系統(tǒng)進(jìn)行描述,前件變量相同的前提下,多項(xiàng)式TS模糊模型能夠顯著減少模糊規(guī)則條數(shù),并且隨著模型前件變量的增加,優(yōu)勢(shì)會(huì)更為突出;或是在相同模糊規(guī)則條數(shù)下,多項(xiàng)式TS模糊模型可以更多地表征非線(xiàn)性系統(tǒng)工作點(diǎn)附近的信息。目前,已有一系列研究針對(duì)多項(xiàng)式TS模糊系統(tǒng)的系統(tǒng)分析與控制展開(kāi)[16-24],取得了很多研究成果。

    本文嘗試將強(qiáng)化學(xué)習(xí)中的策略迭代算法與一類(lèi)多項(xiàng)式TS模糊系統(tǒng)[24]相結(jié)合,利用多項(xiàng)式TS模糊模型分別對(duì)執(zhí)行器的策略函數(shù)以及評(píng)價(jià)器的值函數(shù)進(jìn)行逼近,建立基于多項(xiàng)式TS模糊模型的執(zhí)行器-評(píng)價(jià)器結(jié)構(gòu),對(duì)控制器參數(shù)進(jìn)行迭代優(yōu)化。此外,本文將所設(shè)計(jì)的強(qiáng)化學(xué)習(xí)控制方法應(yīng)用于二自由度飛行模擬器的控制系統(tǒng)設(shè)計(jì),優(yōu)化其控制器參數(shù),成功實(shí)現(xiàn)對(duì)二自由度飛行模擬器俯仰角姿態(tài)穩(wěn)定控制性能的優(yōu)化。

    1?飛行姿態(tài)模擬器動(dòng)力學(xué)模型

    1.1?非線(xiàn)性系統(tǒng)模型

    二自由度飛行姿態(tài)模擬器[1-2]的機(jī)械結(jié)構(gòu)主要有基座、U型架、擺動(dòng)臂和螺旋槳等部分,其簡(jiǎn)化結(jié)構(gòu)示意如圖1所示。擺動(dòng)臂兩端各有一個(gè)電機(jī),2個(gè)電機(jī)方向垂直,各裝有一個(gè)螺旋槳,用于驅(qū)動(dòng)擺動(dòng)臂,使其可以繞著基座進(jìn)行俯仰和偏航運(yùn)動(dòng)。F1為俯仰方向螺旋槳升力,垂直擺桿向上;F2為偏航方向螺旋槳升力,垂直指向紙面外。若只考慮俯仰方向運(yùn)動(dòng),則需保持偏航方向靜止。選豎直桿與擺動(dòng)臂的重合位置為運(yùn)動(dòng)坐標(biāo)系原點(diǎn)O,x軸方向?yàn)樗?,z軸方向?yàn)樨Q直,y軸方向通過(guò)右手定則來(lái)確定,并且將y軸方向定為俯仰方向的零位,俯仰角φ逆時(shí)針旋轉(zhuǎn)(圖中向上)為正方向。

    依據(jù)機(jī)械結(jié)構(gòu)圖上的受力分析,可以建立飛行姿態(tài)模擬器俯仰方向動(dòng)力學(xué)模型如下:

    Jφ··=-kφ·-Mglcosφ+F1L,(1)

    式中各變量的物理意義及其具體參數(shù)值如表1所示。

    選擇狀態(tài)變量x1=φ,x2=φ·及控制輸入變量u=F1L,即可得到飛行模擬器的仿射非線(xiàn)性模型如下:

    x·=f(x)+g(x)u,(2)

    其中:x=[x1,x2]T,f(x)=x21J(-kx2-Mglcos(x1)),

    g(x)=01J。

    1.2?連續(xù)系統(tǒng)的離散化

    針對(duì)非線(xiàn)性系統(tǒng)(2),時(shí)間軸上連續(xù)取相同時(shí)間間隔T=tk+1-tk>0,[tk,tk+1)=[kT,(k+1)T)稱(chēng)為采樣間隔,T為采樣周期。本文中每個(gè)采樣間隔內(nèi),輸入信號(hào)被零階保持,即

    u(t)≡u(píng)(kT)=u(k),kT≤t<(k+1)T。(3)

    采用四階龍格-庫(kù)塔法對(duì)系統(tǒng)(2)進(jìn)行近似離散化,其遞推方程如下(步長(zhǎng)h=T):

    x(k+1)=x(k)+h6(K1+2K2+2K3+K4),(4)

    其中,

    K1=f(x(k))+g(x(k))u(k),

    K2=fx(k)+h2K1+gx(k)+h2K1u(k),

    K3=fx(k)+h2K2+gx(k)+h2K2u(k),

    K4=f(x(k)+hK3)+g(x(k)+hK3)u(k)。

    2?強(qiáng)化學(xué)習(xí)策略迭代算法

    考慮如下單輸入離散時(shí)間非線(xiàn)性動(dòng)態(tài)系統(tǒng)[7]:

    x(k+1)=F(x(k))+G(x(k))u(k),(5)

    其中x(k)∈瘙 綆

    n表示系統(tǒng)k時(shí)刻的狀態(tài),u(k)∈瘙 綆

    表示系統(tǒng)k時(shí)刻的控制輸入。F(x(k))和G(x(k))均為光滑的非線(xiàn)性函數(shù)。

    定義回報(bào)函數(shù)r(x(k),u(k))如下:

    r(x(k),u(k))=Q(x(k))+uT(k)Ru(k),(6)

    其中Q(x(k))和R是正定的。特別地,二次型回報(bào)函數(shù)為

    r(x(k),u(k))=xT(k)Qx(k)+uT(k)Ru(k)。(7)

    控制目標(biāo)是尋求一個(gè)狀態(tài)空間到控制輸入空間的映射關(guān)系h(·)∶瘙 綆

    n→瘙 綆

    ,即策略

    u(k)=h(x(k))。(8)

    使得未來(lái)的累積回報(bào)最小,有

    Vh(x(k))=∑SymboleB@

    i=kγi-kr(x(i),u(i))。(9)

    其中,Vh(x(k))表示評(píng)價(jià)策略u(píng)(k)=h(x(k))的值函數(shù);x(i)(k≤i≤∞)表示滿(mǎn)足式(5)和式(8)的狀態(tài);γ∈[0,1]表示折扣因子,如果為0,則價(jià)值只由當(dāng)前回報(bào)決定;如果是1,則所有的后續(xù)回報(bào)和當(dāng)前回報(bào)一視同仁;如果是0到1之間的數(shù)字,即當(dāng)前回報(bào)的權(quán)重比后續(xù)回報(bào)的權(quán)重大。

    本文研究的前提在于系統(tǒng)是可鎮(zhèn)定的[7],且存在一個(gè)可行的控制策略u(píng)(k)=h(x(k))使得閉環(huán)系統(tǒng)是漸近穩(wěn)定的。此處,可行的控制策略是指該策略可以使系統(tǒng)鎮(zhèn)定并且產(chǎn)生有界代價(jià)函數(shù)的策略。只有對(duì)于可行的控制策略,值函數(shù)Vh(x(k))的值才有意義。

    最優(yōu)策略u(píng)(k)=h*(x(k))使得值函數(shù)(9)最小化,得到最優(yōu)價(jià)值

    V*(x(k))=minh(·)(∑SymboleB@

    i=kγi-kr(x(i),h(x(i)))),(10)

    然而這一優(yōu)化問(wèn)題很難求解。Bellman最優(yōu)原理,作為最優(yōu)控制的一個(gè)奠基石,由其可以得到如下離散時(shí)間HamiltonJacobiBellman(HJB)方程:

    V*(x(k))=minh(·)(r(x(k),h(x(k)))+

    γV*(x(k+1))),(11)

    進(jìn)一步,可得到最優(yōu)策略:

    h*(x(k))=argminh(·)(r(x(k),h(x(k)))+

    γV*(x(k+1)))。(12)

    上述連續(xù)狀態(tài)、動(dòng)作空間下的離散時(shí)間非線(xiàn)性動(dòng)態(tài)系統(tǒng)最優(yōu)控制問(wèn)題可以用強(qiáng)化學(xué)習(xí)方法求解,基本思路分為兩步:首先根據(jù)當(dāng)前的策略u(píng)(k)=h(x(k))估計(jì)值函數(shù)Vh(x(k));然后根據(jù)當(dāng)前估計(jì)的值函數(shù)改進(jìn)策略。基于上述機(jī)制,研究者們提出了很多強(qiáng)化學(xué)習(xí)算法,本文主要基于比較經(jīng)典的策略迭代算法展開(kāi)研究,其具體步驟如下:

    1)初始化:選擇任意容許控制策略h0(x(k));

    2)策略評(píng)估:利用Bellman方程確定當(dāng)前策略的價(jià)值,即

    Vj+1(x(k))=r(x(k),hj(x(k)))+

    γVj+1(x(k+1))。(13)

    3)策略更新:通過(guò)下式對(duì)策略進(jìn)行更新

    hj+1(x(k))=argminh(·)(r(x(k),h(x(k)))+

    γVj+1(x(k+1)))。(14)

    實(shí)現(xiàn)上述策略迭代算法的經(jīng)典強(qiáng)化學(xué)習(xí)結(jié)構(gòu)為執(zhí)行器-評(píng)價(jià)器結(jié)構(gòu)[7],如圖2所示。其中,評(píng)價(jià)器的任務(wù)是采用Bellman方程(13)對(duì)值函數(shù)進(jìn)行更新,執(zhí)行器的任務(wù)是采用式(14)對(duì)策略進(jìn)行更新。

    針對(duì)有限狀態(tài)和動(dòng)作空間,策略迭代可通過(guò)存儲(chǔ)和更新查找表實(shí)現(xiàn)。然而對(duì)于非線(xiàn)性系統(tǒng)(5),狀態(tài)空間和控制輸入空間是連續(xù)及無(wú)限的,此時(shí)使用Bellman方程(13)對(duì)當(dāng)前策略的價(jià)值評(píng)估意味著需要對(duì)所有狀態(tài)x(k)計(jì)算策略hj(x(k))的價(jià)值,即求解該Bellman方程是很困難的。解決該問(wèn)題的關(guān)鍵是通過(guò)函數(shù)逼近器對(duì)值函數(shù)進(jìn)行近似。

    3?基于多項(xiàng)式TS模糊模型的執(zhí)行器-評(píng)價(jià)器結(jié)構(gòu)

    本節(jié)將通過(guò)多項(xiàng)式TS模糊模型[24]對(duì)執(zhí)行器的策略函數(shù)以及評(píng)價(jià)器的值函數(shù)進(jìn)行逼近,建立基于多項(xiàng)式TS模糊模型的執(zhí)行器—評(píng)價(jià)器結(jié)構(gòu)。

    3.1?評(píng)價(jià)器實(shí)現(xiàn)—多項(xiàng)式TS模糊模型近似值函數(shù)

    由第2節(jié)可知道,實(shí)現(xiàn)具有無(wú)限狀態(tài)空間動(dòng)態(tài)系統(tǒng)的策略迭代的關(guān)鍵是近似值函數(shù)。本節(jié)將通過(guò)如下式所示的多項(xiàng)式TS模糊模型對(duì)值函數(shù)進(jìn)行近似,其第條規(guī)則如下:

    R:?IF?x1(k)?is?M1?AND?x2(k)?is?M2?AND?…?AND?xn(k)?is?Mn,THEN

    Vh(x(k))=∑ni=1alixi(k)+∑ni=1∑nj=ibli,jxi(k)xj(k)。(15)

    其中:xi(k),i=1,2,…,n為系統(tǒng)在k時(shí)刻的狀態(tài);n為輸入變量的個(gè)數(shù);Mi是前件變量xi(k)的模糊集,μMi(xi(k))表示其隸屬函數(shù);Vh(x(k))為第條模糊規(guī)則輸出;ali和bli,j分別表示后件參數(shù),經(jīng)強(qiáng)化學(xué)習(xí)可得到。此外,

    x(k)=[x1(k),x2(k),…,xn(k)]T。

    模糊規(guī)則中邏輯“與”運(yùn)算符選擇常用的“代數(shù)乘積”,得到第條規(guī)則的激活度為

    μ(x(k))=∏ni=1μMi(xi(k))。(16)

    采用一般化的解模糊方法得到解模糊化后的模型輸出,如下:

    Vh(x(k))=∑Ωl=1ξ(x(k))Vh(x(k)),(17)

    其中:Ω為模糊規(guī)則數(shù)量;ξ(x(k))為模糊權(quán)函數(shù);Vh(x(k))由第條模糊規(guī)則的后件方程式(15)計(jì)算,且

    ξ(x(k))=μ(x(k))∑Ωl=1μ(x(k))≥0,(18)

    以及

    ∑Ωl=1ξ(x(k))=1。(19)

    此外,在執(zhí)行器—評(píng)價(jià)器結(jié)構(gòu)中,評(píng)價(jià)器接收系統(tǒng)的狀態(tài)變量和式(6)定義的回報(bào)函數(shù),對(duì)強(qiáng)化學(xué)習(xí)的每次學(xué)習(xí)產(chǎn)生評(píng)判,產(chǎn)生如下時(shí)序差分誤差(Temporal?Difference?(TD)?Error):

    e(k)=r(x(k),h(x(k)))+

    γVh(x(k+1))-Vh(x(k))(20)

    以及值函數(shù)估計(jì)。因此,針對(duì)值函數(shù)近似方法,一般可將式(20)作為近似性能指標(biāo)。

    3.2?執(zhí)行器實(shí)現(xiàn)—多項(xiàng)式TS模糊控制器

    本節(jié)將通過(guò)如下式所示的多項(xiàng)式TS模糊模型[24]對(duì)執(zhí)行器的策略函數(shù)進(jìn)行近似,其第w條規(guī)則如下:

    Rw:IF?x1(k)?is?Nw1?AND?x2(k)?is?Nw2?AND?…?AND?xn(k)?is?Nwn,?THEN

    uw(x(k))=cw+∑ni=1qwixi(k)+

    ∑ni=1∑nj=iswi,jxi(k)xj(k),(21)

    其中:Nwi是前件變量xi(k)的模糊集;ηNwi(xi(k))表示其隸屬函數(shù);uw(x(k))為第w條模糊規(guī)則輸出;cw、qwi和swi,j分別表示后件參數(shù),經(jīng)強(qiáng)化學(xué)習(xí)可得到。

    模糊規(guī)則中邏輯“與”運(yùn)算符選擇常用的“代數(shù)乘積”,得到第w條規(guī)則的激活度為

    ηw(x(k))=∏ni=1ηNwi(xi(k))。(22)

    采用一般化的解模糊方法得到解模糊化后的模型輸出,如下:

    u(x(k))=∑ψw=1ζw(x(k))uw(x(k)),(23)

    其中,ψ為模糊規(guī)則數(shù)量,ζw(x(k))為模糊權(quán)函數(shù),uw(x(k))由第w條模糊規(guī)則的后件方程式(21)計(jì)算,且

    ζw(x(k))=ηw(x(k))∑ψw=1ηw(x(k))≥0,(24)

    以及

    ∑ψw=1ζw(x(k))=1。(25)

    4?仿真研究

    利用第3節(jié)中所提出的基于多項(xiàng)式TS模糊模型的執(zhí)行器-評(píng)價(jià)器結(jié)構(gòu)的策略迭代算法,?針對(duì)第1節(jié)中的飛行姿態(tài)模擬器俯仰方向動(dòng)力學(xué)模型進(jìn)行數(shù)值仿真研究。本文的強(qiáng)化學(xué)習(xí)控制算法并不需要對(duì)象模型,仿真中的模型只是用來(lái)模擬學(xué)習(xí)過(guò)程中與智能體進(jìn)行交互的外部環(huán)境,而不直接向智能體提供任何信息??刂颇繕?biāo)為設(shè)計(jì)多項(xiàng)式TS模糊控制器(23),使得給定系統(tǒng)一個(gè)初始角度,在控制器作用下最終可穩(wěn)定到0度,同時(shí)實(shí)現(xiàn)策略最優(yōu)化及值函數(shù)最優(yōu)化。具體為經(jīng)過(guò)策略迭代過(guò)程,學(xué)習(xí)得到最優(yōu)控制器參數(shù),使得值函數(shù)最小。

    針對(duì)飛行姿態(tài)模擬器俯仰方向連續(xù)狀態(tài)空間模型(2),選擇離散采樣時(shí)間T=0.005?s,經(jīng)四階龍格-庫(kù)塔法離散化得到其離散狀態(tài)空間模型。

    由式(1)和式(2)知,系統(tǒng)穩(wěn)定到0度時(shí),有

    u(k)=Mgl,(26)

    所以選擇回報(bào)函數(shù)如下:

    r(x(k),u(k))=xT(k)Qx(k)+

    (u(k)-Mgl)TR(u(k)-Mgl)。(27)

    其中,Q=1001,R=1。

    選定多項(xiàng)式TS模糊模型(17)對(duì)值函數(shù)進(jìn)行近似,模糊規(guī)則數(shù)為Ω=2,前件變量為x1(k),其第條規(guī)則如下:

    R:?IF?x1(k)?is?M1,THEN

    Vlh(x(k))=bl1,1x21(k)+bl1,2x1(k)x2(k)+

    bl2,2x22(k)。(28)

    模糊權(quán)函數(shù)分別選為如下式所示的高斯型(其形狀見(jiàn)圖3)。

    ξ1(x1(k))=e-x21(k)0.5,

    ξ2(x1(k))=1-ξ1(x1(k))。(29)

    選定多項(xiàng)式TS模糊控制器(23)模糊規(guī)則數(shù)ψ=2,前件變量為x1(k),其第w條規(guī)則如下:

    Rw:IF?x1(k)?is?Nw1,THEN

    uw(x(k))=cw+qw1x1(k)+qw2x2(k)+

    sw1,1x21(k)+sw1,2x1(k)x2(k)+

    sw2,2x22(k)。(30)

    模糊權(quán)函數(shù)分別選為如下高斯型(其形狀同圖3):

    ζ1(x1(k))=e-x21(k)0.360?7,

    ζ2(x1(k))=1-ζ1(x1(k))。(31)

    策略迭代算法中評(píng)價(jià)器和執(zhí)行器的參數(shù)初始值分別如表2和3所示。

    初始狀態(tài)為x(0)=[-0.990?20]T,折扣因子γ=1。經(jīng)過(guò)15步迭代得到的收斂策略迭代結(jié)果(即評(píng)價(jià)器和執(zhí)行器參數(shù)收斂值)分別如表4和表5所示。

    最優(yōu)策略(其參數(shù)如表5所示)下,系統(tǒng)在初始值為x(0)=[-0.990?20]T時(shí)的狀態(tài)響應(yīng)以及控制輸入分別如圖4和圖5所示。

    由式(26)可知,當(dāng)系統(tǒng)穩(wěn)定在0度時(shí),經(jīng)計(jì)算可得控制量u(k)=0.149?9,圖5所得控制量終值結(jié)果與該理論計(jì)算結(jié)果一致。

    進(jìn)一步,依據(jù)所得最優(yōu)策略(其參數(shù)如表5所示),改變系統(tǒng)初值為x(0)=[0.710?70]T,可得到該初始狀態(tài)下系統(tǒng)的狀態(tài)響應(yīng)以及控制輸入分別如圖6和圖7所示。

    評(píng)價(jià)器參數(shù)收斂過(guò)程以及多項(xiàng)式TS模糊模型近似值函數(shù)所得到的最優(yōu)策略對(duì)應(yīng)的TD誤差分別如下圖8和圖9所示。

    從圖4~圖7中可看出,經(jīng)過(guò)迭代學(xué)習(xí)過(guò)程,得到的具有最優(yōu)控制策略參數(shù)的控制器,能夠使得二自由度飛行模擬器的俯仰角和角速度均穩(wěn)定在0度。從圖8和圖9中,可以看到評(píng)價(jià)器參數(shù)收速度較快,且所得到的TD誤差為零,即實(shí)現(xiàn)了值函數(shù)最小化的性能指標(biāo)。該仿真結(jié)果不僅說(shuō)明多項(xiàng)式TS模糊模型近似值函數(shù)是可行的,此外,基于多項(xiàng)式T-S模糊模型的執(zhí)行器-評(píng)價(jià)器結(jié)構(gòu)的強(qiáng)化學(xué)習(xí)策略迭代算法在二自由度飛行模擬器上的應(yīng)用是成功且有效的。

    5?結(jié)?論

    本文基于強(qiáng)化學(xué)習(xí)中的策略迭代算法對(duì)一個(gè)自主研制的二自由度飛行姿態(tài)模擬器的姿態(tài)穩(wěn)定問(wèn)題進(jìn)行研究,該模擬器為實(shí)驗(yàn)室環(huán)境下研究旋翼式微小型飛行器姿態(tài)控制提供了一個(gè)很好的平臺(tái)。首次將策略迭代學(xué)習(xí)算法與多項(xiàng)式TS模糊系統(tǒng)相結(jié)合,建立基于多項(xiàng)式TS模糊模型的執(zhí)行器-評(píng)價(jià)器結(jié)構(gòu),對(duì)控制器參數(shù)進(jìn)行學(xué)習(xí)調(diào)整,實(shí)現(xiàn)對(duì)二自由度飛行姿態(tài)模擬器姿態(tài)穩(wěn)定控制性能的優(yōu)化,具有一定的應(yīng)用價(jià)值。實(shí)際上,該算法并不局限于某一策略形式,能夠參數(shù)化表達(dá)的控制策略形式都可以通過(guò)該算法進(jìn)行策略參數(shù)優(yōu)化,實(shí)際應(yīng)用中,可以根據(jù)需要進(jìn)行策略形式選擇。

    參?考?文?獻(xiàn):

    [1]?趙巖.?二自由度直升機(jī)模擬器控制系統(tǒng)設(shè)計(jì)[D].?哈爾濱:哈爾濱工業(yè)大學(xué),?2013.

    [2]?尹航,?楊燁峰,?趙巖,等.?二自由度飛行姿態(tài)模擬器自整定控制器設(shè)計(jì)[J].電機(jī)與控制學(xué)報(bào),2018,22(4):109-116.

    YIN?Hang,?YANG?Yefeng,?ZHAO?Yan,?et?al.?Selftuning?controller?design?for?a?2DOF?flight?attitude?simulator?[J].?Electric?Machines?and?Control,?2018,?22(4):109-116.

    [3]?SUTTON?R?S,?BARTO?A?G.?Reinforcement?LearningAn?Introduction[M].?Cambridge,?MT:?MIT?Press,?1998.

    [4]?Jerry?M.MENDEL.?Adaptive?learning?and?pattern?recognition?systems:?theory?and?applications[M].?Academic?Press,?1970.

    [5]?WEI?Q,?LEWIS?F?L,?LIU?D,?et?al.?Discretetime?local?value?iteration?adaptive?dynamic?programming:?Convergence?analysis[J].?IEEE?Transactions?on?Systems?Man?and?Cybernetics:?Systems,?2018,?48(6):?875-891.

    [6]?KIUMARSI?B,?LEWIS?F?L,?JIANG?Z?P.?H∞?control?of?linear?discretetime?systems:?Offpolicy?reinforcement?learning[J].?Automatica,?2017,?78(1):?144-152.

    [7]?LEWIS?F?L,?VRABIE?D.?Reinforcement?learning?and?adaptive?dynamic?programming?for?feedback?control[J].?IEEE?Circuits?and?Systems?Magazine,?2009,?9(3):?32-50.

    [8]?ZHAO?D,?LIU?D,?LEWIS?F?L,?et?al.?Special?issue?on?deep?reinforcement?learning?and?adaptive?dynamic?programming[J].?IEEE?Transactions?on?Neural?Networks?and?Learning?Systems,?2018,?29(6):?2038-2041.

    [9]?KHATERAA,?ELNAGAR?A?M,?ELBARDINIM,?et?al.?Adaptive?T–S?fuzzy?controller?using?reinforcement?learning?based?on?Lyapunov?stability[J].?Journal?of?the?Franklin?Institute,?2018,?355(14):?6390-6415.

    [10]?XIONG?Y,?HAIBO?H,?QINGLAI?W,?et?al.?Reinforcement?learning?for?robust?adaptive?control?of?partially?unknown?nonlinear?systems?subject?to?unmatched?uncertainties[J].?Information?Sciences,?2018,?463(1):307-322.

    [11]?ZHANG?C,?ZOU?W,?CHENG?N,?et?al.?Trajectory?tracking?control?for?rotary?steerable?systems?using?interval?type2?fuzzy?logic?and?reinforcement?learning[J].?Journal?of?the?Franklin?Institute,?2018,?355(2):?803-826.

    [12]?ZHU?Y,?ZHAO?D,?YANG?X,et?al.?Policy?iteration?for?H∞?optimal?control?of?polynomial?nonlinear?systems?via?sum?of?squares?programming[J].?IEEE?Transactions?on?Cybernetics,?2018,?48(2):?500-509.

    [13]?趙冬斌,?邵坤,?朱圓恒,等.深度強(qiáng)化學(xué)習(xí)綜述:兼論計(jì)算機(jī)圍棋的發(fā)展[J].?控制理論與應(yīng)用,?2016,?33(6):701-717.

    ZHAO?Dongbin,?SHAO?Kun,?ZHU?Yuanheng,?et?al.?Review?of?deep?reinforcement?learning?and?discussions?on?the?development?of?computer?go[J].?Control?Theory?&?Applications,?2016,?33(6):701-717.

    猜你喜歡
    強(qiáng)化學(xué)習(xí)
    基于強(qiáng)化學(xué)習(xí)的無(wú)線(xiàn)網(wǎng)絡(luò)智能接入控制技術(shù)
    機(jī)器學(xué)習(xí)發(fā)展現(xiàn)狀及應(yīng)用的研究
    未來(lái)人工智能自主學(xué)習(xí)網(wǎng)絡(luò)的構(gòu)建
    轉(zhuǎn)觀(guān)念 強(qiáng)服務(wù) 樹(shù)立用電檢查新價(jià)值
    智能車(chē)自主避障路徑規(guī)劃研究綜述
    一種記憶可修剪型仿生機(jī)器人的速度跟蹤算法研究
    基于強(qiáng)化學(xué)習(xí)的在線(xiàn)訂單配送時(shí)隙運(yùn)能分配
    論“以讀促寫(xiě)”在初中英語(yǔ)寫(xiě)作教學(xué)中的應(yīng)用
    智能交通車(chē)流自動(dòng)導(dǎo)引系統(tǒng)
    分布式系統(tǒng)中基于非合作博弈的調(diào)度算法
    99re6热这里在线精品视频| 黄色日韩在线| 国产精品偷伦视频观看了| 又粗又硬又长又爽又黄的视频| 女人十人毛片免费观看3o分钟| 亚洲欧美中文字幕日韩二区| 免费黄频网站在线观看国产| 免费观看av网站的网址| 国产精品久久久久久精品电影| 青春草亚洲视频在线观看| 久久久久九九精品影院| 日本一本二区三区精品| 国产成人精品久久久久久| 亚洲欧洲国产日韩| 亚洲,一卡二卡三卡| 国产69精品久久久久777片| 小蜜桃在线观看免费完整版高清| 国内精品美女久久久久久| 日日撸夜夜添| 欧美日韩国产mv在线观看视频 | 欧美3d第一页| 欧美激情国产日韩精品一区| 日本午夜av视频| 美女xxoo啪啪120秒动态图| 亚洲欧美一区二区三区国产| 中文资源天堂在线| 亚洲精品视频女| 亚洲欧洲日产国产| a级毛色黄片| 免费少妇av软件| 欧美三级亚洲精品| 国产亚洲91精品色在线| 精品久久久久久久久亚洲| 搡老乐熟女国产| 水蜜桃什么品种好| 国产精品麻豆人妻色哟哟久久| 人人妻人人澡人人爽人人夜夜| 亚洲一区二区三区欧美精品 | 亚洲在久久综合| 蜜臀久久99精品久久宅男| 欧美少妇被猛烈插入视频| av女优亚洲男人天堂| 黄色欧美视频在线观看| 亚洲精品乱码久久久久久按摩| 九色成人免费人妻av| 国产亚洲av嫩草精品影院| 久久久a久久爽久久v久久| 最近中文字幕2019免费版| 精品久久久久久电影网| 2021少妇久久久久久久久久久| 日日啪夜夜爽| 亚洲av二区三区四区| 日韩伦理黄色片| 亚洲,一卡二卡三卡| 18禁动态无遮挡网站| 免费大片黄手机在线观看| 成人黄色视频免费在线看| 18禁在线播放成人免费| 国产欧美日韩一区二区三区在线 | 99久久精品国产国产毛片| 中文字幕人妻熟人妻熟丝袜美| 波野结衣二区三区在线| 一区二区av电影网| 国产亚洲精品久久久com| 国产 一区 欧美 日韩| 波野结衣二区三区在线| 国产成人精品婷婷| 国产中年淑女户外野战色| 赤兔流量卡办理| 亚洲一区二区三区欧美精品 | av福利片在线观看| 高清日韩中文字幕在线| 黄色视频在线播放观看不卡| 波多野结衣巨乳人妻| 91午夜精品亚洲一区二区三区| 久久久精品94久久精品| 建设人人有责人人尽责人人享有的 | 女人十人毛片免费观看3o分钟| 国产精品国产三级国产专区5o| 欧美成人午夜免费资源| 在线播放无遮挡| 插逼视频在线观看| 一级a做视频免费观看| 97精品久久久久久久久久精品| 久久久精品免费免费高清| 亚洲精品aⅴ在线观看| 国产av不卡久久| 简卡轻食公司| 人妻一区二区av| 欧美日韩在线观看h| 久久人人爽av亚洲精品天堂 | 国产一区二区三区综合在线观看 | 一级毛片我不卡| 亚洲天堂国产精品一区在线| 人妻夜夜爽99麻豆av| 国产男女内射视频| 热re99久久精品国产66热6| 亚洲,欧美,日韩| 少妇人妻一区二区三区视频| 王馨瑶露胸无遮挡在线观看| 成人一区二区视频在线观看| 久久99蜜桃精品久久| 亚洲精品久久午夜乱码| 新久久久久国产一级毛片| 肉色欧美久久久久久久蜜桃 | 不卡视频在线观看欧美| 我的女老师完整版在线观看| 国产成人aa在线观看| 欧美日本视频| 久久99热这里只有精品18| 国语对白做爰xxxⅹ性视频网站| 久久久a久久爽久久v久久| av在线蜜桃| 久久久久久国产a免费观看| 99热全是精品| .国产精品久久| 丰满人妻一区二区三区视频av| 亚洲av免费高清在线观看| 男女无遮挡免费网站观看| 久久久久久九九精品二区国产| 亚洲最大成人av| 亚洲成人一二三区av| 女人久久www免费人成看片| 久久久成人免费电影| 99久国产av精品国产电影| 日韩一区二区视频免费看| 神马国产精品三级电影在线观看| 亚洲aⅴ乱码一区二区在线播放| 亚洲图色成人| 午夜日本视频在线| 嫩草影院入口| 久久精品熟女亚洲av麻豆精品| 91午夜精品亚洲一区二区三区| 在线观看美女被高潮喷水网站| 中文字幕亚洲精品专区| 在线看a的网站| 欧美国产精品一级二级三级 | 91午夜精品亚洲一区二区三区| 日韩大片免费观看网站| 在线观看免费高清a一片| 国产欧美日韩一区二区三区在线 | 日韩制服骚丝袜av| 国产精品精品国产色婷婷| 视频中文字幕在线观看| 六月丁香七月| 啦啦啦啦在线视频资源| 欧美潮喷喷水| 精品国产一区二区三区久久久樱花 | 日产精品乱码卡一卡2卡三| 天美传媒精品一区二区| 国产日韩欧美在线精品| 亚洲精品日韩av片在线观看| 毛片女人毛片| 特级一级黄色大片| 国产精品人妻久久久影院| 色婷婷久久久亚洲欧美| 国产伦理片在线播放av一区| 免费av毛片视频| 99久久精品国产国产毛片| 少妇的逼水好多| 日本色播在线视频| 国产亚洲精品久久久com| 久久精品熟女亚洲av麻豆精品| 自拍偷自拍亚洲精品老妇| 亚洲aⅴ乱码一区二区在线播放| 亚洲人成网站高清观看| 欧美日韩视频精品一区| 久久久久网色| 成年版毛片免费区| 嫩草影院精品99| 国产爽快片一区二区三区| 午夜福利在线观看免费完整高清在| 日韩强制内射视频| 国产久久久一区二区三区| av福利片在线观看| 成人漫画全彩无遮挡| 久久精品国产a三级三级三级| 永久免费av网站大全| 18禁在线播放成人免费| 国产精品麻豆人妻色哟哟久久| 日产精品乱码卡一卡2卡三| 久久韩国三级中文字幕| 午夜免费男女啪啪视频观看| 久久久久久久久大av| 午夜爱爱视频在线播放| 网址你懂的国产日韩在线| 自拍欧美九色日韩亚洲蝌蚪91 | 丝袜脚勾引网站| 亚洲国产日韩一区二区| 有码 亚洲区| 国产片特级美女逼逼视频| 欧美潮喷喷水| 男女边摸边吃奶| 噜噜噜噜噜久久久久久91| 欧美成人精品欧美一级黄| 欧美区成人在线视频| 一级片'在线观看视频| 欧美成人一区二区免费高清观看| 日韩欧美一区视频在线观看 | kizo精华| 中文精品一卡2卡3卡4更新| a级毛色黄片| 99视频精品全部免费 在线| 亚洲最大成人av| 亚洲国产精品国产精品| 亚洲自拍偷在线| 日韩免费高清中文字幕av| 欧美老熟妇乱子伦牲交| 国产亚洲91精品色在线| 高清毛片免费看| 欧美精品人与动牲交sv欧美| 精品久久久精品久久久| 高清视频免费观看一区二区| 国产国拍精品亚洲av在线观看| 国产精品伦人一区二区| 久久热精品热| 一本久久精品| 国产毛片a区久久久久| 九色成人免费人妻av| 亚洲精品国产av蜜桃| 永久免费av网站大全| 亚洲欧美日韩卡通动漫| 成年女人在线观看亚洲视频 | 午夜精品一区二区三区免费看| 国产一区二区三区av在线| 99久国产av精品国产电影| 亚洲在久久综合| 一级片'在线观看视频| 国产欧美日韩一区二区三区在线 | 午夜精品国产一区二区电影 | 男插女下体视频免费在线播放| 熟女av电影| 我的女老师完整版在线观看| 精品99又大又爽又粗少妇毛片| 在线观看av片永久免费下载| 亚洲欧美清纯卡通| 少妇高潮的动态图| 久久综合国产亚洲精品| 99久久精品一区二区三区| 免费播放大片免费观看视频在线观看| a级毛色黄片| 天堂中文最新版在线下载 | 欧美日本视频| 国产一区二区亚洲精品在线观看| 国产精品麻豆人妻色哟哟久久| 亚洲精品日韩av片在线观看| 国产精品国产三级国产专区5o| 精品熟女少妇av免费看| 王馨瑶露胸无遮挡在线观看| 大香蕉久久网| 视频中文字幕在线观看| 在线播放无遮挡| 大码成人一级视频| 蜜桃久久精品国产亚洲av| 亚洲激情五月婷婷啪啪| 成年人午夜在线观看视频| 网址你懂的国产日韩在线| 亚洲av电影在线观看一区二区三区 | 国产 一区精品| 国产片特级美女逼逼视频| h日本视频在线播放| 亚洲精品国产成人久久av| 久久久a久久爽久久v久久| av国产免费在线观看| 水蜜桃什么品种好| 纵有疾风起免费观看全集完整版| 毛片女人毛片| 高清午夜精品一区二区三区| 一个人观看的视频www高清免费观看| 18+在线观看网站| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 久久久久久九九精品二区国产| av国产久精品久网站免费入址| 特级一级黄色大片| 欧美一区二区亚洲| 国产精品国产av在线观看| 爱豆传媒免费全集在线观看| 中文字幕人妻熟人妻熟丝袜美| 亚洲精品日韩av片在线观看| 热re99久久精品国产66热6| 男的添女的下面高潮视频| 丰满少妇做爰视频| 国产精品.久久久| 搡老乐熟女国产| 青春草视频在线免费观看| 草草在线视频免费看| 国产视频内射| 亚洲精品日韩在线中文字幕| 日韩 亚洲 欧美在线| 免费观看在线日韩| 插阴视频在线观看视频| 波野结衣二区三区在线| 欧美激情在线99| 日韩在线高清观看一区二区三区| xxx大片免费视频| 久久精品国产鲁丝片午夜精品| 欧美日韩在线观看h| 免费黄色在线免费观看| av网站免费在线观看视频| 亚洲综合精品二区| 成年版毛片免费区| 一个人观看的视频www高清免费观看| 人妻一区二区av| 一级毛片电影观看| 成人欧美大片| 亚洲国产欧美人成| 久久久精品免费免费高清| 亚洲精品色激情综合| 九九爱精品视频在线观看| 国产精品无大码| 在线免费观看不下载黄p国产| 午夜福利在线观看免费完整高清在| 亚洲精品影视一区二区三区av| 麻豆成人av视频| 中国三级夫妇交换| 中文字幕人妻熟人妻熟丝袜美| 欧美bdsm另类| 18禁动态无遮挡网站| 黄片无遮挡物在线观看| 超碰97精品在线观看| 91午夜精品亚洲一区二区三区| 好男人在线观看高清免费视频| 夫妻性生交免费视频一级片| 国产精品久久久久久av不卡| 久久久精品免费免费高清| 在线观看一区二区三区| 久久99热这里只频精品6学生| 听说在线观看完整版免费高清| 尤物成人国产欧美一区二区三区| 身体一侧抽搐| 国产亚洲最大av| tube8黄色片| 91aial.com中文字幕在线观看| 亚洲精品国产av成人精品| 欧美高清成人免费视频www| 99热国产这里只有精品6| 最近2019中文字幕mv第一页| 成人亚洲精品一区在线观看 | 亚洲电影在线观看av| 国产精品久久久久久av不卡| 国产男女超爽视频在线观看| 王馨瑶露胸无遮挡在线观看| 美女脱内裤让男人舔精品视频| 国产成人a∨麻豆精品| 岛国毛片在线播放| 嫩草影院入口| 九九在线视频观看精品| 2021少妇久久久久久久久久久| 插逼视频在线观看| 日本欧美国产在线视频| 91久久精品电影网| 少妇人妻精品综合一区二区| 在线观看av片永久免费下载| 简卡轻食公司| 国产黄色免费在线视频| 天堂俺去俺来也www色官网| 亚洲一区二区三区欧美精品 | 免费播放大片免费观看视频在线观看| 亚洲精品国产av蜜桃| 少妇被粗大猛烈的视频| 亚洲人成网站在线播| 五月伊人婷婷丁香| 亚洲精品乱码久久久v下载方式| 男女下面进入的视频免费午夜| 亚洲国产成人一精品久久久| 久久精品久久久久久噜噜老黄| 女的被弄到高潮叫床怎么办| 一区二区av电影网| 99久久人妻综合| 亚洲怡红院男人天堂| 亚洲精品乱码久久久v下载方式| 精品国产三级普通话版| 亚洲av在线观看美女高潮| 少妇人妻 视频| 久久久久久久国产电影| 亚洲国产av新网站| 在线亚洲精品国产二区图片欧美 | 大片电影免费在线观看免费| 大又大粗又爽又黄少妇毛片口| 午夜激情久久久久久久| 成人欧美大片| 中国国产av一级| 欧美高清成人免费视频www| 狂野欧美激情性xxxx在线观看| 小蜜桃在线观看免费完整版高清| 免费大片18禁| 国产欧美亚洲国产| 精品久久久久久久末码| 亚洲第一区二区三区不卡| 高清欧美精品videossex| 全区人妻精品视频| 高清欧美精品videossex| 国产免费福利视频在线观看| av女优亚洲男人天堂| 日韩一本色道免费dvd| 狂野欧美白嫩少妇大欣赏| 日日啪夜夜撸| 欧美日韩亚洲高清精品| 国产精品秋霞免费鲁丝片| 久久精品国产亚洲av天美| 亚洲综合色惰| 天堂网av新在线| 高清av免费在线| 久久久精品免费免费高清| 日韩强制内射视频| 日韩,欧美,国产一区二区三区| 91在线精品国自产拍蜜月| www.av在线官网国产| 嫩草影院入口| 日本黄大片高清| 亚洲国产精品成人久久小说| 午夜福利在线在线| 亚洲av不卡在线观看| 国产精品秋霞免费鲁丝片| 国产大屁股一区二区在线视频| 日韩大片免费观看网站| 99久久精品一区二区三区| 搡老乐熟女国产| 亚洲在久久综合| 卡戴珊不雅视频在线播放| 成人亚洲精品一区在线观看 | 三级国产精品片| 亚洲熟女精品中文字幕| 精品亚洲乱码少妇综合久久| 国产亚洲91精品色在线| 在线播放无遮挡| 国产黄片视频在线免费观看| 欧美日韩综合久久久久久| 亚洲四区av| 久久久亚洲精品成人影院| 人妻夜夜爽99麻豆av| 91在线精品国自产拍蜜月| 午夜免费男女啪啪视频观看| 伊人久久精品亚洲午夜| 国产精品国产三级国产av玫瑰| 晚上一个人看的免费电影| 男人舔奶头视频| 热99国产精品久久久久久7| 亚洲成色77777| 最近中文字幕高清免费大全6| 色5月婷婷丁香| 久久精品久久精品一区二区三区| 精品国产露脸久久av麻豆| 国内精品宾馆在线| 日产精品乱码卡一卡2卡三| 香蕉精品网在线| 亚洲怡红院男人天堂| 一级爰片在线观看| 亚洲精品国产成人久久av| 一个人看视频在线观看www免费| 毛片一级片免费看久久久久| 在线看a的网站| 99热全是精品| 日韩精品有码人妻一区| 国产精品麻豆人妻色哟哟久久| 欧美国产精品一级二级三级 | 亚洲图色成人| 大片电影免费在线观看免费| 国产伦在线观看视频一区| 欧美激情在线99| 肉色欧美久久久久久久蜜桃 | 久久久久精品久久久久真实原创| 亚洲av成人精品一区久久| av一本久久久久| 久久久久久久久久成人| 久久午夜福利片| 亚洲精品aⅴ在线观看| 成年免费大片在线观看| 亚洲怡红院男人天堂| 成人综合一区亚洲| av在线天堂中文字幕| 国产精品.久久久| 99久国产av精品国产电影| 日日啪夜夜撸| 久久精品国产a三级三级三级| 国产亚洲91精品色在线| 特级一级黄色大片| 亚洲欧美清纯卡通| 久久99精品国语久久久| 蜜桃久久精品国产亚洲av| 777米奇影视久久| 亚洲无线观看免费| av在线播放精品| 免费观看在线日韩| 色视频www国产| 亚洲怡红院男人天堂| 日韩电影二区| 91在线精品国自产拍蜜月| 肉色欧美久久久久久久蜜桃 | 九九久久精品国产亚洲av麻豆| 国产免费又黄又爽又色| 青青草视频在线视频观看| 欧美日韩综合久久久久久| 水蜜桃什么品种好| 九色成人免费人妻av| 麻豆成人av视频| 能在线免费看毛片的网站| 天天躁夜夜躁狠狠久久av| 国产精品蜜桃在线观看| 啦啦啦在线观看免费高清www| 亚洲精品一二三| 91精品伊人久久大香线蕉| 午夜福利网站1000一区二区三区| 美女视频免费永久观看网站| 五月玫瑰六月丁香| 亚洲在久久综合| 美女cb高潮喷水在线观看| 免费高清在线观看视频在线观看| 内地一区二区视频在线| 欧美国产精品一级二级三级 | 国产伦理片在线播放av一区| 性色avwww在线观看| 久久久午夜欧美精品| av线在线观看网站| 九色成人免费人妻av| 久久鲁丝午夜福利片| 亚洲国产最新在线播放| 亚洲精品自拍成人| 久久精品国产a三级三级三级| 欧美国产精品一级二级三级 | 99re6热这里在线精品视频| 亚洲精品国产av成人精品| 一区二区三区精品91| 涩涩av久久男人的天堂| 搡老乐熟女国产| 大陆偷拍与自拍| 韩国av在线不卡| 亚洲综合色惰| 中文资源天堂在线| 美女cb高潮喷水在线观看| 亚洲欧美精品专区久久| 亚洲av成人精品一区久久| 少妇裸体淫交视频免费看高清| 老司机影院毛片| 最近的中文字幕免费完整| 99热国产这里只有精品6| 亚洲丝袜综合中文字幕| 国产成人免费无遮挡视频| 两个人的视频大全免费| 国产精品久久久久久久久免| 精品午夜福利在线看| 日本熟妇午夜| 丝袜脚勾引网站| 成人国产麻豆网| 秋霞伦理黄片| 国产成人a∨麻豆精品| 亚洲激情五月婷婷啪啪| 精品人妻一区二区三区麻豆| 搡老乐熟女国产| 高清午夜精品一区二区三区| 免费看av在线观看网站| 亚洲综合色惰| 青春草视频在线免费观看| 欧美少妇被猛烈插入视频| 亚洲,欧美,日韩| 国精品久久久久久国模美| 夫妻性生交免费视频一级片| 日韩免费高清中文字幕av| 中文天堂在线官网| 丝瓜视频免费看黄片| 亚洲最大成人av| 国产精品久久久久久久电影| 韩国高清视频一区二区三区| 亚洲伊人久久精品综合| 亚洲精品一二三| 禁无遮挡网站| 3wmmmm亚洲av在线观看| 一级爰片在线观看| 欧美激情在线99| 中文字幕av成人在线电影| 丝瓜视频免费看黄片| 我要看日韩黄色一级片| 在线天堂最新版资源| 嘟嘟电影网在线观看| 精品久久国产蜜桃| 欧美最新免费一区二区三区| 天堂俺去俺来也www色官网| 五月玫瑰六月丁香| 伦理电影大哥的女人| 秋霞在线观看毛片| 97超视频在线观看视频| 国产欧美亚洲国产| 免费黄色在线免费观看| 国产精品国产三级国产av玫瑰| 天天一区二区日本电影三级| 国产精品99久久99久久久不卡 | 亚洲精华国产精华液的使用体验| 亚洲综合精品二区| 美女主播在线视频| 国产精品国产av在线观看| 亚洲精品国产av成人精品| 欧美日韩精品成人综合77777| 国产在线男女| 美女cb高潮喷水在线观看| 欧美bdsm另类| 在线播放无遮挡| 老司机影院成人| 少妇人妻 视频| 国产毛片在线视频| 简卡轻食公司| 亚洲av男天堂| 亚洲国产日韩一区二区| 久久久久国产精品人妻一区二区| 国产精品国产三级国产av玫瑰| 免费大片黄手机在线观看| 国产黄色视频一区二区在线观看| 国产成人91sexporn| 日本熟妇午夜| 一级黄片播放器| 五月玫瑰六月丁香| 波野结衣二区三区在线| 国产精品久久久久久精品古装| 国产黄a三级三级三级人| 老司机影院毛片| 香蕉精品网在线|