• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于深度強(qiáng)化學(xué)習(xí)的農(nóng)田節(jié)點(diǎn)數(shù)據(jù)無人機(jī)采集方法

    2022-03-09 01:55:00張亞莉望夢成蘭玉彬張植勛
    關(guān)鍵詞:能耗深度傳感器

    胡 潔,張亞莉,王 團(tuán),望夢成,蘭玉彬,張植勛

    ·農(nóng)業(yè)航空工程·

    基于深度強(qiáng)化學(xué)習(xí)的農(nóng)田節(jié)點(diǎn)數(shù)據(jù)無人機(jī)采集方法

    胡 潔1,3,張亞莉2,3※,王 團(tuán)1,望夢成1,蘭玉彬1,3,張植勛2

    (1. 華南農(nóng)業(yè)大學(xué)電子工程學(xué)院,廣州 510642;2. 華南農(nóng)業(yè)大學(xué)工程學(xué)院,廣州 510642;3. 國家精準(zhǔn)農(nóng)業(yè)航空施藥技術(shù)國際聯(lián)合研究中心,廣州 510642)

    利用無人機(jī)采集農(nóng)田傳感器節(jié)點(diǎn)數(shù)據(jù),可避免網(wǎng)絡(luò)節(jié)點(diǎn)間多次轉(zhuǎn)發(fā)數(shù)據(jù)造成節(jié)點(diǎn)電量耗盡,近網(wǎng)關(guān)節(jié)點(diǎn)過早死亡及網(wǎng)絡(luò)生命周期縮短等問題。由于相鄰傳感器數(shù)據(jù)可能存在冗余、無人機(jī)可同時(shí)覆蓋多個(gè)節(jié)點(diǎn)進(jìn)行采集等特點(diǎn),該研究針對冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集和全節(jié)點(diǎn)數(shù)據(jù)采集,對無人機(jī)數(shù)據(jù)采集的路線及方案進(jìn)行優(yōu)化,以減輕無人機(jī)能耗,縮短任務(wù)完成時(shí)間。在冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集場景中,通過競爭雙重深度Q網(wǎng)絡(luò)算法(Dueling Double Deep Q Network,DDDQN)優(yōu)化無人機(jī)節(jié)點(diǎn)選擇及采集順序,使采集的數(shù)據(jù)滿足覆蓋率要求的同時(shí)無人機(jī)能效最優(yōu)。仿真結(jié)果表明,該算法在滿足相同感知覆蓋率要求下,較深度Q網(wǎng)絡(luò)(Deep Q Network,DQN)算法的飛行距離縮短了1.21 km,能耗減少27.9%。在全節(jié)點(diǎn)數(shù)據(jù)采集場景中,采用兩級深度強(qiáng)化學(xué)習(xí)聯(lián)合(Double Deep Reinforcement Learning,DDRL)方法對無人機(jī)的懸停位置和順序進(jìn)行優(yōu)化,使無人機(jī)完成數(shù)據(jù)采集任務(wù)時(shí)的總能耗最小。仿真結(jié)果表明,單節(jié)點(diǎn)數(shù)據(jù)量在160 kB以下時(shí),在不同節(jié)點(diǎn)個(gè)數(shù)及無人機(jī)飛行速度下,該方法比經(jīng)典基于粒子群優(yōu)化的旅行商問題(Particle Swarm Optimization-Traveling Salesman Problem,PSO-TSP)算法和最小化能量飛行控制(Minimized Energy Flight Control,MEFC)算法的總能耗最少節(jié)約6.3%。田間試驗(yàn)結(jié)果表明,相比PSO-TSP算法,基于DDRL的數(shù)據(jù)采集方法的無人機(jī)總能耗降低11.5%。研究結(jié)構(gòu)可為無人機(jī)大田無線傳感器節(jié)點(diǎn)數(shù)據(jù)采集提供參考。

    無人機(jī);數(shù)據(jù)采集;深度強(qiáng)化學(xué)習(xí);節(jié)點(diǎn)感知冗余;DQN;DRL

    0 引 言

    各種農(nóng)業(yè)傳感器在農(nóng)業(yè)生產(chǎn)中起著監(jiān)測作物生長環(huán)境、協(xié)助精準(zhǔn)灌溉和施肥及病蟲害防治等作用[1-2]。在網(wǎng)絡(luò)基礎(chǔ)設(shè)施缺乏的部分邊遠(yuǎn)地區(qū),農(nóng)田無線傳感器節(jié)點(diǎn)的數(shù)據(jù)采集存在困難[3-4]。因此,利用各種移動(dòng)設(shè)備采集田間無線傳感器節(jié)點(diǎn)數(shù)據(jù)成為一種解決措施[5-6]。相比地面移動(dòng)設(shè)備,無人機(jī)具有不受限于地面環(huán)境、不破壞地面作物、信號傳輸所受阻擋小等優(yōu)勢,是采集傳感器節(jié)點(diǎn)數(shù)據(jù)的有利途徑[7]。目前農(nóng)業(yè)無人機(jī)普遍采用牛耕法的方式進(jìn)行噴藥、撒播等作業(yè),然而當(dāng)采集隨機(jī)布置的傳感器節(jié)點(diǎn)數(shù)據(jù)時(shí),相鄰節(jié)點(diǎn)間的數(shù)據(jù)可能存在冗余[8-9],且無人機(jī)在一個(gè)懸停點(diǎn)可能覆蓋多個(gè)節(jié)點(diǎn)[10],因此需要對無人機(jī)數(shù)據(jù)采集的路線及方案進(jìn)行優(yōu)化,以減小無人機(jī)能耗、縮短任務(wù)完成時(shí)間。

    針對無人機(jī)采集傳感器節(jié)點(diǎn)數(shù)據(jù)的方法,國內(nèi)外學(xué)者開展了相關(guān)研究,大部分優(yōu)化方案主要集中在降低能耗[11-12]、任務(wù)完成時(shí)間最短[13]、軌跡距離最小[14-17]等。Luo等[11]提出了一種智慧農(nóng)場的數(shù)據(jù)采集方案,根據(jù)傳感器節(jié)點(diǎn)的接收信號強(qiáng)度(Received Signal Strength Indication,RSSI)確定簇和簇頭,采用改進(jìn)的Dijkstra和遺傳算法(Genetic algorithm,GA)尋求最佳軌跡。Ben等[12]提出了一種使用無人機(jī)從無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)采集數(shù)據(jù)的解決方案,可以同時(shí)減小通信與無人機(jī)飛行能耗。Just等[14]針對無人機(jī)采集大面積節(jié)點(diǎn)數(shù)據(jù),使用時(shí)隙概念結(jié)合飛行禁止列表,將無人機(jī)路徑與每個(gè)節(jié)點(diǎn)的激活周期進(jìn)行同步,大大縮短了飛行距離和飛行時(shí)間。Zhang等[15]提出了一種基于分層深度強(qiáng)化學(xué)習(xí)(Hierarchical Deep Reinforcement Learning,HDRL)算法解決可充電多無人機(jī)數(shù)據(jù)采集場景的路徑規(guī)劃問題,最大限度地縮短無人機(jī)的總飛行時(shí)間。蔣寶慶等[16]提出了一種基于Q學(xué)習(xí)的無人機(jī)輔助采集小規(guī)模無線傳感器節(jié)點(diǎn)數(shù)據(jù),減少了無人機(jī)的任務(wù)完成時(shí)間和有效數(shù)據(jù)量,提高了無人機(jī)能效。Yi等[17]研究了一種基于深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning,DRL)的無人機(jī)輔助物聯(lián)網(wǎng)采集最優(yōu)信息年齡(Age of Information,AoI)數(shù)據(jù),得到最優(yōu)的無人機(jī)飛行軌跡和傳感器節(jié)點(diǎn)的傳輸調(diào)度方案。文獻(xiàn)[15-18]采用強(qiáng)化學(xué)習(xí)算法研究無人機(jī)數(shù)據(jù)采集問題,無人機(jī)通過與環(huán)境進(jìn)行交互得到反饋,通過自主學(xué)習(xí)獲得最優(yōu)數(shù)據(jù)采集策略。上述研究大多針對無人機(jī)的飛行距離進(jìn)行優(yōu)化,忽略了節(jié)點(diǎn)數(shù)據(jù)量大小和通信范圍等因素。

    作者在無人機(jī)果樹噴藥的研究中發(fā)現(xiàn),懸停能耗對無人機(jī)整體能耗的影響更大,需綜合考慮懸停時(shí)間和飛行時(shí)間。因此,針對能量受限的農(nóng)業(yè)無人機(jī)不同數(shù)據(jù)采集場景,本文基于深度強(qiáng)化學(xué)習(xí)算法,在考慮傳感器節(jié)點(diǎn)冗余覆蓋的情況下,研究如何對無人機(jī)進(jìn)行調(diào)度,有選擇地采集部分節(jié)點(diǎn)數(shù)據(jù)及規(guī)劃采集順序,使數(shù)據(jù)采集在滿足覆蓋率要求的同時(shí)達(dá)到無人機(jī)能效最優(yōu),在需要采集全部傳感器節(jié)點(diǎn)數(shù)據(jù)的情況下優(yōu)化無人機(jī)的懸停位置和采集順序,使無人機(jī)能耗最小。

    1 作業(yè)場景及相關(guān)模型

    1.1 冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集場景

    在布設(shè)傳感器時(shí),為了對整個(gè)作業(yè)區(qū)域進(jìn)行全面覆蓋,傳感器之間往往存在感知范圍交叉重疊的情況,這種情況在隨機(jī)布設(shè)傳感器的環(huán)境中尤其明顯。無人機(jī)受限于自身能量和續(xù)航時(shí)間,在采集傳感器數(shù)據(jù)時(shí)需要對傳感器進(jìn)行甄選,對飛行路徑進(jìn)行優(yōu)化,以求在感知覆蓋率要求和無人機(jī)能耗之間獲得最佳平衡。

    假定農(nóng)田隨機(jī)分布的傳感器節(jié)點(diǎn)總數(shù)為,每個(gè)節(jié)點(diǎn)的感知范圍是以節(jié)點(diǎn)為中心的圓(本文假設(shè)所有節(jié)點(diǎn)的感知半徑相同),如圖1所示。在采集數(shù)據(jù)過程中無人機(jī)懸停在節(jié)點(diǎn)的正上方,在一個(gè)懸停位置只采集一個(gè)節(jié)點(diǎn)的數(shù)據(jù),傳感器節(jié)點(diǎn)在收到無人機(jī)的信標(biāo)信息后被喚醒并向無人機(jī)發(fā)送數(shù)據(jù),無人機(jī)采集完該節(jié)點(diǎn)數(shù)據(jù)后飛向下一個(gè)被選擇的節(jié)點(diǎn)。數(shù)據(jù)采集過程中,假設(shè)無人機(jī)可以獲知各節(jié)點(diǎn)的位置及當(dāng)前自身能量。無人機(jī)以固定高度飛行,為簡便表示,后續(xù)統(tǒng)一采用平面二維坐標(biāo)表示無人機(jī)的懸停位置。

    圖1 冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集場景

    1.2 全節(jié)點(diǎn)數(shù)據(jù)采集場景

    農(nóng)業(yè)生產(chǎn)中,有些情況下需要采集田間所有傳感器節(jié)點(diǎn)的數(shù)據(jù),若每采集一個(gè)節(jié)點(diǎn)數(shù)據(jù)都要懸停,懸停點(diǎn)過多,無人機(jī)會(huì)有巨大的能量消耗。由于無人機(jī)的通信區(qū)域是以懸停點(diǎn)在地面投影為中心的圓,在這個(gè)范圍內(nèi)的節(jié)點(diǎn)都可以與無人機(jī)進(jìn)行數(shù)據(jù)傳輸,通過合理選擇無人機(jī)的懸停點(diǎn)位置和采集順序,讓無人機(jī)在每個(gè)懸停點(diǎn)時(shí)采集其通信范圍內(nèi)的傳感器節(jié)點(diǎn)數(shù)據(jù),達(dá)到減少無人機(jī)懸停次數(shù)及能耗的目標(biāo),最終完成所有傳感器節(jié)點(diǎn)的數(shù)據(jù)采集。

    如圖2所示,假設(shè)田間有個(gè)無線傳感器節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)都有準(zhǔn)確定位(配備GPS或北斗天線),每個(gè)傳感器都具有相同的通信范圍和數(shù)據(jù)緩沖區(qū)大小。無人機(jī)在飛行高度固定為的情況下,在某個(gè)懸停點(diǎn)可正常通信的是圖2中圓形區(qū)域內(nèi)的傳感器節(jié)點(diǎn),設(shè)該區(qū)域的半徑為(通過信道傳輸模型計(jì)算得出),區(qū)域中的傳感器節(jié)點(diǎn)以單跳方式與無人機(jī)進(jìn)行通信。假設(shè)無人機(jī)勻速飛行,飛行高度固定,通過對懸停位置選擇及飛行路徑規(guī)劃,使無人機(jī)在采集完所有傳感器節(jié)點(diǎn)數(shù)據(jù)時(shí)總能耗最小。為簡便表示,后續(xù)統(tǒng)一用平面二維坐標(biāo)表示無人機(jī)的懸停位置。

    注:H為無人機(jī)飛行高度,m;R為無人機(jī)在某個(gè)懸停點(diǎn)可與傳感器正常通信的區(qū)域半徑,m。

    1.3 信道傳輸模型

    無人機(jī)懸停采集田間節(jié)點(diǎn)數(shù)據(jù),其懸停時(shí)間與數(shù)據(jù)傳輸速率相關(guān),而數(shù)據(jù)傳輸速率受信道損耗和衰落的影響。

    假設(shè)在通信過程中傳感器節(jié)點(diǎn)的發(fā)射功率為,根據(jù)香農(nóng)定理可得位置的無人機(jī)與節(jié)點(diǎn)間的數(shù)據(jù)傳輸速率R,i(bit/s)為

    從式(2)可以看出,在其他參數(shù)不變的情況下,無人機(jī)與節(jié)點(diǎn)的距離越遠(yuǎn),數(shù)據(jù)傳輸速率越慢,則無人機(jī)懸停時(shí)間越長。

    1.4 無人機(jī)能耗模型

    本文采用Zeng等[19]的旋翼無人機(jī)功率模型:

    由式(3)~(4)、式(6)~(7)可知,在冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集場景中,無人機(jī)從SN-1起飛到結(jié)束SN的數(shù)據(jù)采集所消耗的能量(kJ)為

    同理,在全節(jié)點(diǎn)數(shù)據(jù)采集場景中,從SN-1起飛到結(jié)束SN的數(shù)據(jù)采集所消耗的能量(kJ)為

    最終,無人機(jī)完成個(gè)懸停位置的數(shù)據(jù)采集任務(wù)所需要的總能耗E(kJ)為

    2 基于DRL的節(jié)點(diǎn)數(shù)據(jù)采集方法

    2.1 深度強(qiáng)化學(xué)習(xí)DRL

    強(qiáng)化學(xué)習(xí)是一類特定的機(jī)器學(xué)習(xí)方法,可解決關(guān)于序列決策的相關(guān)問題[20]。深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning,DRL)將深度學(xué)習(xí)的感知能力和強(qiáng)化學(xué)習(xí)的決策能力相結(jié)合[21-22],通過深度學(xué)習(xí)對環(huán)境狀態(tài)信息進(jìn)行特征提取,傳遞給智能體進(jìn)行決策并執(zhí)行動(dòng)作,執(zhí)行動(dòng)作后得到由環(huán)境反饋的獎(jiǎng)懲信號以及環(huán)境狀態(tài)的改變,促進(jìn)智能體進(jìn)行下一步的動(dòng)作。智能體通過與環(huán)境迭代交互選取一系列動(dòng)作以最大化累積獎(jiǎng)勵(lì),即在有限反饋中實(shí)現(xiàn)序列決策的優(yōu)化[23]。田間節(jié)點(diǎn)數(shù)據(jù)采集本質(zhì)上是在多種影響因素變化情況下對無人機(jī)懸停位置的選擇和采集時(shí)序的安排;每采集一個(gè)節(jié)點(diǎn)數(shù)據(jù),或會(huì)帶來相鄰節(jié)點(diǎn)數(shù)據(jù)的效用變化,或會(huì)帶來去往其余節(jié)點(diǎn)的距離成本變化,這可以轉(zhuǎn)化為序列決策問題。本文基于DRL方法,針對前述2個(gè)場景設(shè)計(jì)了競爭雙重深度Q網(wǎng)絡(luò)(Dueling Double Deep Q Network,DDDQN)及兩級深度強(qiáng)化學(xué)習(xí)(Double Deep Reinforcement Learning,DDRL)算法。

    2.2 冗余覆蓋下基于DDDQN的部分節(jié)點(diǎn)數(shù)據(jù)采集方法

    2.2.1 任務(wù)環(huán)境

    設(shè)農(nóng)田為一個(gè)矩形區(qū)域,如圖3所示,無人機(jī)按照虛線所示的路線采集節(jié)點(diǎn)數(shù)據(jù)。采集節(jié)點(diǎn)a數(shù)據(jù)時(shí),無人機(jī)獲取的數(shù)據(jù)覆蓋范圍增量是以a為中心的整個(gè)圓范圍;采集節(jié)點(diǎn)b數(shù)據(jù)時(shí),數(shù)據(jù)覆蓋范圍增量是以b為中心、去掉陰影區(qū)域1的剩余圓;采集節(jié)點(diǎn)c數(shù)據(jù)時(shí),數(shù)據(jù)覆蓋范圍增量是以c為中心、去掉陰影區(qū)域2的剩余圓;而采集節(jié)點(diǎn)d的數(shù)據(jù)覆蓋率增量只有陰影區(qū)域3的范圍,節(jié)點(diǎn)d與已采集的節(jié)點(diǎn)間數(shù)據(jù)冗余比例高,無人機(jī)根據(jù)獎(jiǎng)勵(lì)函數(shù)(公式(12))確定當(dāng)前動(dòng)作,可能會(huì)將節(jié)點(diǎn)d舍棄。

    注:a~e為傳感器節(jié)點(diǎn);1為節(jié)點(diǎn)a與節(jié)點(diǎn)b的冗余覆蓋部分;2為節(jié)點(diǎn)b與節(jié)點(diǎn)c的冗余覆蓋部分;3為節(jié)點(diǎn)d帶來的數(shù)據(jù)覆蓋率增量。

    2.2.2 DDDQN算法

    DDDQN算法將雙重深度Q網(wǎng)絡(luò)(Double DQN)[24]與競爭深度Q網(wǎng)絡(luò)(Dueling DQN)[25]相融合。圖4為DDDQN算法框架[26]。該算法結(jié)合了2種算法的優(yōu)勢,將DQN算法存在的網(wǎng)絡(luò)值估計(jì)過高的問題與網(wǎng)絡(luò)的結(jié)構(gòu)同時(shí)進(jìn)行優(yōu)化。

    注:s為無人機(jī)當(dāng)前狀態(tài);V(s)為在狀態(tài)s下通過神經(jīng)網(wǎng)絡(luò)得到的狀態(tài)值;A(s,a)為在狀態(tài)為s下執(zhí)行動(dòng)作a時(shí)通過神經(jīng)網(wǎng)絡(luò)得到的優(yōu)勢值;Q(s,a)為在狀態(tài)值V(s)和優(yōu)勢值A(chǔ)(s,a)的總和。

    在冗余覆蓋場景中,無人機(jī)強(qiáng)化學(xué)習(xí)模型中的狀態(tài)-動(dòng)作-獎(jiǎng)勵(lì)框架如下:

    3)獎(jiǎng)勵(lì)函數(shù):考慮到無人機(jī)續(xù)航能力有限,需要盡可能快地從分散的傳感器節(jié)點(diǎn)采集數(shù)據(jù),避免花費(fèi)大量時(shí)間和能耗采集冗余覆蓋部分?jǐn)?shù)據(jù)。因此,在建立獎(jiǎng)勵(lì)函數(shù)時(shí)需要兼顧正向和負(fù)向獎(jiǎng)勵(lì),定義如下:

    2.3 基于DDRL的全節(jié)點(diǎn)數(shù)據(jù)采集方法

    2.3.1 任務(wù)環(huán)境

    全節(jié)點(diǎn)數(shù)據(jù)采集與部分節(jié)點(diǎn)數(shù)據(jù)采集的區(qū)別是:(1)要求采集所有節(jié)點(diǎn)的數(shù)據(jù);(2)懸停位置不局限在節(jié)點(diǎn)的正上方;(3)在一個(gè)懸停位置可以采集多個(gè)在通信范圍內(nèi)的節(jié)點(diǎn)數(shù)據(jù)。

    全節(jié)點(diǎn)數(shù)據(jù)采集示意圖如圖5所示,設(shè)農(nóng)田為矩形區(qū)域,為定位無人機(jī)的懸停位置,將農(nóng)田區(qū)域離散為×個(gè)小柵格,每個(gè)小柵格中心是無人機(jī)可選的懸停點(diǎn)。柵格越小,對懸停位置的優(yōu)化程度越高,但算法復(fù)雜度越高。圖中三角形代表某個(gè)飛行策略確定的懸停采集點(diǎn),虛線代表飛行路徑。無人機(jī)在懸停點(diǎn)2采集傳感器b和c的數(shù)據(jù),在懸停點(diǎn)3采集傳感器d和e的數(shù)據(jù)。

    針對全節(jié)點(diǎn)數(shù)據(jù)采集場景,若直接采用DQN算法對系統(tǒng)進(jìn)行建模,會(huì)導(dǎo)致系統(tǒng)狀態(tài)空間維數(shù)爆炸、模型訓(xùn)練困難,無人機(jī)甚至難以完成數(shù)據(jù)采集任務(wù)。本文提出一種基于兩級深度強(qiáng)化學(xué)習(xí)(DDRL)的數(shù)據(jù)采集策略,將該問題分解為2個(gè)子問題進(jìn)行研究,以簡化模型,避免出現(xiàn)直接采用DQN算法產(chǎn)生的問題。分解后的2個(gè)子問題為:1)選擇無人機(jī)最優(yōu)采集區(qū)域,采用深度Q網(wǎng)絡(luò)(Deep Q Network,DQN)算法;2)在得到的最優(yōu)采集區(qū)域內(nèi),采用n步深度Q網(wǎng)絡(luò)(Option n-step Deep Q Network,OnDQN)算法選擇懸停位置以及確定遍歷順序。

    注:n0為矩形區(qū)域長度;k為小柵格長度;f為傳感器節(jié)點(diǎn);1~4為無人機(jī)懸停采集點(diǎn)。

    2.3.2 基于DQN的最優(yōu)采集區(qū)域選取

    3)獎(jiǎng)勵(lì)函數(shù):獎(jiǎng)勵(lì)函數(shù)由3個(gè)部分組成,其中能量效率表示當(dāng)前動(dòng)作執(zhí)行后采集的傳感器節(jié)點(diǎn)數(shù)增量與當(dāng)前動(dòng)作執(zhí)行所消耗的能量之比,如式(13)所示。

    注:1~7是根據(jù)傳感器節(jié)點(diǎn)通信范圍交疊情況劃分的子區(qū)域。

    Note:1-7is a sub-region divided by overlapping communication ranges of the sensor nodes.

    圖6 數(shù)據(jù)采集子區(qū)域的劃分示意圖

    Fig.6 Schematic diagram of data collection subarea division

    式中為負(fù)常數(shù)。

    另外,為避免無人機(jī)耗盡電量,在數(shù)據(jù)采集過程中,若無人機(jī)出現(xiàn)電量不足的情況也給出懲罰:

    式中為負(fù)常數(shù)。

    2.3.3 基于OnDQN的最優(yōu)航跡規(guī)劃

    無人機(jī)懸停點(diǎn)距離傳感器位置越遠(yuǎn),數(shù)據(jù)傳輸速率越低,懸停時(shí)間就越長。選定無人機(jī)的最優(yōu)采集子區(qū)域后,需對子區(qū)域的采集順序和懸停位置進(jìn)行決策,以平衡無人機(jī)的飛行距離與懸停時(shí)間,從而最大限度地減少無人機(jī)能耗。在該問題中,無人機(jī)動(dòng)作空間包括飛向某一子區(qū)域、懸停在子區(qū)域某個(gè)位置、數(shù)據(jù)采集3個(gè)動(dòng)作,本文采用基于選項(xiàng)(option)的分層強(qiáng)化學(xué)習(xí)思想來解決該問題[15,27],將狀態(tài)空間、動(dòng)作空間、獎(jiǎng)勵(lì)函數(shù)以及option建模如下:

    當(dāng)獎(jiǎng)勵(lì)函數(shù)為稀疏獎(jiǎng)勵(lì)時(shí),可能會(huì)導(dǎo)致算法學(xué)習(xí)效率低,甚至難以收斂[28]。本文采用n-step回報(bào)代替1-step回報(bào)來加快算法迭代速度[29]。定義n-step回報(bào)函數(shù)為

    需要說明的是,本文的研究基于一些假設(shè)前提:假定無人機(jī)勻速飛行,沒有考慮從懸停到起飛以及飛行到懸停的速度變化過程的能量消耗變化;假定無人機(jī)從一個(gè)位置到另一個(gè)位置是直線飛行,實(shí)際應(yīng)用中還需考慮無人機(jī)的轉(zhuǎn)向問題。

    3 仿真分析

    為驗(yàn)證節(jié)點(diǎn)數(shù)據(jù)采集算法的有效性,分別在冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集場景和全節(jié)點(diǎn)數(shù)據(jù)采集場景進(jìn)行仿真試驗(yàn),試驗(yàn)在windows10系統(tǒng)下進(jìn)行,處理器為AMD Ryzen 5 2500U,頻率為2.0 GHz。網(wǎng)絡(luò)架構(gòu)使用谷歌的開源Tensorflow模塊構(gòu)建,利用Python搭建深度強(qiáng)化學(xué)習(xí)仿真環(huán)境。表1為旋翼無人機(jī)的功率模型參數(shù)。

    表1 旋翼無人機(jī)參數(shù)

    3.1 冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集場景的仿真分析

    仿真假設(shè)在640 m×640 m的農(nóng)田隨機(jī)均勻部署20個(gè)無線傳感器節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)的感知覆蓋半徑均為80 m,無人機(jī)飛行速度為5 m/s,飛行高度為10 m,每個(gè)傳感器存儲(chǔ)的數(shù)據(jù)為160 kB。經(jīng)平衡運(yùn)算復(fù)雜度和優(yōu)化結(jié)果,將農(nóng)田離散為40 m×40 m的網(wǎng)格,共計(jì)256個(gè)網(wǎng)格單元。以覆蓋率和有效覆蓋平均能耗評估算法性能,定義如下:

    根據(jù)式(12)設(shè)置獎(jiǎng)勵(lì)函數(shù),在實(shí)際訓(xùn)練過程中發(fā)現(xiàn),負(fù)向獎(jiǎng)勵(lì)的取值范圍遠(yuǎn)大于正向獎(jiǎng)勵(lì),導(dǎo)致正向激勵(lì)幾乎不起作用。為此使用對數(shù)函數(shù)變換對原始獎(jiǎng)勵(lì)計(jì)算結(jié)果進(jìn)行歸一化處理:

    圖8為以最佳配置4作為獎(jiǎng)勵(lì)函數(shù)調(diào)節(jié)因子時(shí),DDDQN算法與DQN算法的學(xué)習(xí)差異。DDDQN的學(xué)習(xí)過程比DQN更穩(wěn)定,在學(xué)習(xí)結(jié)束時(shí)獲得更高的周期獎(jiǎng)勵(lì)。在調(diào)節(jié)因子配置4下DDDQN算法每個(gè)episode可獲得12的累積獎(jiǎng)勵(lì),而DQN最多只能獲得9的累積獎(jiǎng)勵(lì)。

    表2 調(diào)節(jié)因子配置

    注:,為獎(jiǎng)勵(lì)函數(shù)的調(diào)節(jié)因子,2為調(diào)節(jié)因子配置組編號。

    圖7 不同調(diào)節(jié)因子配置下的覆蓋率與有效覆蓋平均能耗

    圖8 DDQN和DQN算法的訓(xùn)練獎(jiǎng)勵(lì)值對比

    圖9為采集節(jié)點(diǎn)覆蓋率超過80%時(shí)DDDQN和DQN算法的無人機(jī)數(shù)據(jù)采集方案。經(jīng)計(jì)算,DDDQN算法的飛行距離為3.13 km,相比DQN算法的4.34 km,無人機(jī)能耗減少了27.9%,飛行距離縮短1.21 km。根據(jù)式(19)~(20)計(jì)算可得,DDDQN相比DQN的有效覆蓋平均能耗降低了26.3%。

    圖9 DDDQN和DQN算法的數(shù)據(jù)采集方案

    3.2 全節(jié)點(diǎn)數(shù)據(jù)采集場景的仿真與結(jié)果分析

    在仿真中,假設(shè)無線傳感器節(jié)點(diǎn)隨機(jī)分布在600 m×600 m的矩形區(qū)域內(nèi),將該矩形區(qū)域劃分為15 m×15 m的網(wǎng)格。設(shè)置矩形區(qū)域左下角為無人機(jī)的飛行起點(diǎn),飛行高度為10 m;無人機(jī)與傳感器節(jié)點(diǎn)間單位距離(1 m)的信噪比=34 dB;通信帶寬=10 kHz。

    圖10是不同條件下本文DDRL算法與經(jīng)典PSO-TSP算法的結(jié)果對比。PSO-TSP算法是在Chen[30]等提出的IGA方法的基礎(chǔ)上提出來的。PSO-TSP算法要求無人機(jī)遍歷每個(gè)節(jié)點(diǎn),在每個(gè)節(jié)點(diǎn)正上方懸停采集數(shù)據(jù)。

    圖10a是無人機(jī)的飛行速度對總能耗和總工作時(shí)間的影響。在仿真中設(shè)置20個(gè)傳感器,每個(gè)傳感器儲(chǔ)存的數(shù)據(jù)為160 kB,通信半徑為80 m。對于2種算法來說,飛行速度的增加都會(huì)減小無人機(jī)的總能耗和工作時(shí)間。在相同速度下,DDRL算法比PSO-TSP算法的能耗更低,當(dāng)速度較低時(shí)DDRL算法優(yōu)勢更明顯,無人機(jī)飛行速度為5 m/s時(shí),相比PSO-TSP,采用DDRL算法的無人機(jī)總能耗減少7.8%,工作時(shí)間減少9.2%。

    圖10b為節(jié)點(diǎn)數(shù)據(jù)負(fù)載量對無人機(jī)能耗的影響。仿真中傳感器節(jié)點(diǎn)數(shù)設(shè)置為20個(gè),傳感器的通信半徑分別設(shè)為60 和80 m。從圖10b中可以看出,本文DDRL算法在節(jié)點(diǎn)數(shù)據(jù)量較少(少于160 kB)的情況下比PSO-TSP算法的能耗低;通信半徑60 m時(shí)DDRL算法的優(yōu)勢較80 m更明顯。節(jié)點(diǎn)數(shù)據(jù)量變大后,相比PSO-TSP算法在節(jié)點(diǎn)正上方采集數(shù)據(jù)(距離近采集時(shí)間短),DDRL算法在每個(gè)懸停點(diǎn)采集多個(gè)節(jié)點(diǎn)數(shù)據(jù),由于有些節(jié)點(diǎn)的距離遠(yuǎn)導(dǎo)致采集時(shí)間延長,導(dǎo)致懸停時(shí)間和能耗加大,總能耗超過PSO-TSP算法,通信范圍大時(shí)更加明顯。隨著節(jié)點(diǎn)數(shù)據(jù)量增加,無人機(jī)飛行能耗占比減少,這是因?yàn)闊o人機(jī)懸停能耗增加。同等數(shù)據(jù)量前提下,DDRL算法的飛行能耗占比比PSO-TSP算法低,節(jié)點(diǎn)通信距離80 m時(shí)的飛行能耗占比比60 m時(shí)低,即懸停能耗占比高。

    圖10c是飛行速度對無人機(jī)懸停采集時(shí)間的影響。設(shè)置節(jié)點(diǎn)的水平通信距離為80 m,節(jié)點(diǎn)數(shù)據(jù)量為160 kB。由于PSO-TSP算法中無人機(jī)懸停在每個(gè)傳感器正上方采集數(shù)據(jù),數(shù)據(jù)傳輸距離近,故其懸停采集時(shí)間最低且不受飛行速度影響。而在DDRL算法中,懸停采集時(shí)間隨著飛行速度的增加而減少,這是因?yàn)镈DRL算法通過懸停點(diǎn)選擇和采集順序決策來優(yōu)化總能耗,飛行速度增加,飛行能耗變小,此時(shí)懸停能耗成為影響總能耗的主要因素。

    圖10d為水平通信距離60 m、節(jié)點(diǎn)數(shù)據(jù)量160 kB時(shí)傳感器節(jié)點(diǎn)個(gè)數(shù)對總能耗的影響。將本文DDRL算法與PSO-TSP及MEFC(Minimized Energy Flight Control)算法[31對比可知,MEFC算法考慮了無人機(jī)的飛行速度與轉(zhuǎn)彎角度對能耗的影響,找到最優(yōu)飛行速度并優(yōu)化了飛行軌跡,將懸停點(diǎn)規(guī)劃在傳感器傳輸范圍邊緣,使無人機(jī)以低能耗完成數(shù)據(jù)采集。從圖10d中可以看出,PSO-TSP的無人機(jī)總能耗最大,這是因?yàn)闊o人機(jī)需要飛到每個(gè)傳感器節(jié)點(diǎn)正上方采集數(shù)據(jù),由于飛行路徑增加使其飛行能耗大大增加。MEFC算法規(guī)劃的懸停點(diǎn)均在傳感器傳輸范圍邊緣,且未考慮傳輸范圍重疊的情況,雖然減少了飛行距離和飛行能耗,但增加了懸停點(diǎn)的數(shù)據(jù)傳輸時(shí)間,即增加了懸停時(shí)間和懸停能耗。隨著節(jié)點(diǎn)數(shù)量的增加,3種算法的總能耗都增加。因此在數(shù)據(jù)量不大的情況下,本文DDRL算法的總能耗較另兩種算法更具優(yōu)勢。

    DDRL: Double Deep Reinforcement Learning; PSO-TSP: Particle Swarm Optimization-Traveling Salesman Problem; MEFC: Minimized Energy Flight Control; 60,80: Horizontal communication distance, m.

    4 全節(jié)點(diǎn)數(shù)據(jù)采集算法的田間試驗(yàn)與結(jié)果分析

    針對全節(jié)點(diǎn)數(shù)據(jù)采集場景,本研究通過田間試驗(yàn)對所提方法進(jìn)行評估并驗(yàn)證其可行性。試驗(yàn)在廣州華南農(nóng)業(yè)大學(xué)增城教研基地開展,采用自制的四旋翼無人機(jī)在210 m×400 m的平坦農(nóng)田中進(jìn)行測試,無人機(jī)飛行高度為5 m。為了驗(yàn)證無人機(jī)接收數(shù)據(jù)的丟包率,同時(shí)對田間的通信路徑損耗進(jìn)行估測,以更精確地計(jì)算無人機(jī)懸停時(shí)間,利用2個(gè)DRF1609H型Zigbee模塊測試無人機(jī)接收模塊與地面數(shù)據(jù)發(fā)送模塊之間的丟包情況和接收信號強(qiáng)度值,其中地面數(shù)據(jù)發(fā)送模塊由Zigbee通信模塊與單片機(jī)STM32組成,DRF1609H型Zigbee模塊的發(fā)送功率為22 dbm。

    如圖11所示,無人機(jī)從地面節(jié)點(diǎn)正上方開始,每隔10 m水平距離,到與節(jié)點(diǎn)水平距離120m為止,當(dāng)?shù)孛婀?jié)點(diǎn)接收到無人機(jī)的數(shù)據(jù)請求后,發(fā)送200個(gè)數(shù)據(jù)包,每個(gè)數(shù)據(jù)包的長度為0.5 kB,丟包率測試結(jié)果如表3所示。接收信號強(qiáng)度值取每個(gè)位置采集10次數(shù)據(jù)的接收信號強(qiáng)度平均值。

    圖11 田間試驗(yàn)

    從表3中可以看出,在水平通信距離80 m以外,隨著測試距離的增加,丟包率增加,80 m以內(nèi)范圍滿足數(shù)據(jù)傳輸穩(wěn)定性要求。

    表3 水平通信距離對丟包率的影響

    采用MATLAB中的曲線擬合方法對路徑損耗模型進(jìn)行評估,確定水平通信距離與接收信號強(qiáng)度值之間的關(guān)系。如圖12所示,經(jīng)過多次試驗(yàn)發(fā)現(xiàn),指數(shù)函數(shù)的擬合效果最佳,田間ZigBee傳輸?shù)慕邮招盘枏?qiáng)度值RSSI與水平通信距離的關(guān)系為

    為了進(jìn)一步評估所提算法對無人機(jī)能耗優(yōu)化的效果,在無人機(jī)上配備電流計(jì)模塊獲取瞬時(shí)電流并計(jì)算無人機(jī)能耗。首先測試無人機(jī)的飛行功率和懸停功率,測試方案如下:無人機(jī)以5 m/s速度和5 m高度進(jìn)行勻速直線飛行100 m,利用每隔0.1 s獲取的瞬時(shí)電流和電壓計(jì)算無人機(jī)的飛行功率。同理,計(jì)算單位時(shí)間內(nèi)無人機(jī)的懸停能耗。經(jīng)過實(shí)際測試,本試驗(yàn)所采用的四旋翼無人機(jī)的平均飛行功率為746.38 W,平均懸停功率為771.86 W,無人機(jī)電池的最大容量為22 000 mAh。

    最后,在田間隨機(jī)布置11個(gè)Zigbee模塊模擬節(jié)點(diǎn),結(jié)合田間路徑損耗模型,運(yùn)行算法得到DDRL算法及PSO-TSP算法規(guī)劃的懸停點(diǎn)、懸停時(shí)間及采集順序,然后令無人機(jī)按照規(guī)劃方案進(jìn)行數(shù)據(jù)采集試驗(yàn)。設(shè)置節(jié)點(diǎn)數(shù)據(jù)量為160 kB,數(shù)據(jù)包長度為0.5 kB,無人機(jī)飛行高度5 m,飛行速度5 m/s。圖13a為PSO-TSP算法的飛行路徑;圖 13b為本文算法DDRL優(yōu)化的懸停點(diǎn)和飛行路徑。最終的試驗(yàn)結(jié)果表明,DDRL算法的無人機(jī)總能耗為354.56 kJ,飛行距離為1 189.23 m,丟包率為0.28%;PSO-TSP算法的總能耗為400.83 kJ,飛行距離為1 556.21 m,丟包率為0.15%。相比PSO-TSP,DDRL算法的總能耗減少了11.5%,飛行路徑減少了366.98 m;DDRL算法的丟包率略高于PSO-TSP算法,這是因?yàn)镈DRL算法的規(guī)劃方案中無人機(jī)懸停采集點(diǎn)不在節(jié)點(diǎn)正上方,且在一個(gè)懸停點(diǎn)采集多個(gè)節(jié)點(diǎn)數(shù)據(jù),而PSO-TSP算法的規(guī)劃方案中無人機(jī)懸停在節(jié)點(diǎn)正上方采集數(shù)據(jù),丟包概率降低。

    圖13 PSO-TSP和DDRL算法無人機(jī)懸停點(diǎn)及數(shù)據(jù)采集順序示意圖

    5 結(jié) 論

    利用無人機(jī)采集田間無線傳感器節(jié)點(diǎn)數(shù)據(jù),能克服農(nóng)田無網(wǎng)絡(luò)基礎(chǔ)設(shè)施及節(jié)點(diǎn)多跳轉(zhuǎn)發(fā)數(shù)據(jù)耗電快、網(wǎng)絡(luò)生命周期短的問題。本研究將節(jié)點(diǎn)采集的情況分為感知冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集及全節(jié)點(diǎn)數(shù)據(jù)采集兩個(gè)場景,基于深度強(qiáng)化學(xué)習(xí)規(guī)劃無人機(jī)的節(jié)點(diǎn)選擇、懸停位置及采集順序,以節(jié)省無人機(jī)能耗縮短任務(wù)完成時(shí)間。感知冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集方案適用于節(jié)點(diǎn)間冗余覆蓋面積比例比較高,無人機(jī)能量無法完成所有節(jié)點(diǎn)的數(shù)據(jù)采集任務(wù),以及對數(shù)據(jù)的完整性要求不高的應(yīng)用場景;全節(jié)點(diǎn)數(shù)據(jù)采集方案適用于對數(shù)據(jù)有完整性要求的應(yīng)用場景。通過對研究結(jié)果的分析,得到以下結(jié)論:

    1)在考慮感知冗余覆蓋下部分節(jié)點(diǎn)數(shù)據(jù)采集場景中,采用競爭雙重深度Q網(wǎng)絡(luò)(DDDQN)算法選擇采集節(jié)點(diǎn)及規(guī)劃采集順序,提高了無人機(jī)的能效和減少了冗余數(shù)據(jù)的采集。仿真驗(yàn)證了在相同配置下,DDDQN算法比DQN算法的覆蓋率和平均能耗更優(yōu),算法性能更加穩(wěn)定;在相同的覆蓋率要求下,DDDQN算法比DQN算法的飛行距離縮短了1.21 km,能耗減少了27.9%。

    2)在全節(jié)點(diǎn)數(shù)據(jù)采集場景中,提出了兩級深度強(qiáng)化學(xué)習(xí)(DDRL)算法對無人機(jī)的懸停位置及采集順序進(jìn)行優(yōu)化,減少了無人機(jī)完成任務(wù)時(shí)的總能耗。本文從傳感器不同數(shù)據(jù)負(fù)載量、無人機(jī)飛行速度、傳感器節(jié)點(diǎn)數(shù)量對DDRL與PSO-TSP及MEFC算法的總能耗、總時(shí)間、飛行能耗占比、懸停采集時(shí)間進(jìn)行仿真對比,結(jié)果證明無人機(jī)采用DDRL算法采集數(shù)據(jù)的總能耗最低。最后,通過田間試驗(yàn)測試了四旋翼無人機(jī)的飛行功率與懸停功率,并對DDRL算法及經(jīng)典PSO-TSP算法的采集方案進(jìn)行了實(shí)際田間飛行試驗(yàn)。結(jié)果表明,DDRL算法能同時(shí)考慮飛行距離與數(shù)據(jù)傳輸時(shí)間兩個(gè)因素,在采集相同的數(shù)據(jù)情況下較PSO-TSP算法能耗降低了11.5%。

    [1] García L, Parra L, Jimenez J M, et al. DronAway: A proposal on the use of remote sensing drones as mobile gateway for WSN in precision agriculture[J]. Applied Sciences, 2020, 10(19): 6668.

    [2] 宋成寶,柳平增,劉興華,等. 基于HSIC的日光溫室溫度傳感器優(yōu)化配置策略[J]. 農(nóng)業(yè)工程學(xué)報(bào),2022, 38(8):200-207.

    Song Chengbao, Liu Pingzeng, Liu Xinghua, et al. Optimal configuration strategy for temperature sensors in solar greenhouse based on HSIC[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2022, 38(8): 200-207. (in Chinese with English abstract)

    [3] Bandur D, Jaksic B, Bandur M, et al. An analysis of energy efficiency in Wireless Sensor Networks (WSNs) applied in smart agriculture[J]. Computers and Electronics in Agriculture, 2019, 156: 500-507.

    [4] Polo J, Hornero G, Duijneveld C, et al. Design of a low-cost wireless sensor network with UAV mobile node for agricultural applications[J]. Computers and Electronics in Agriculture, 2015, 119: 19-32.

    [5] Zhang B T, Meng L Y. Energy efficiency analysis of wireless sensor networks in precision agriculture economy[J]. Scientific Programming, 2021, 2021: 8346708.

    [6] Huang S C, Chang H Y. A farmland multimedia data collection method using mobile sink for wireless sensor networks[J]. Multimedia Tools and Applications, 2017, 76(19): 19463-19478.

    [7] Singh P K, Sharma A. An intelligent WSN-UAV-based IoT framework for precision agriculture application[J]. Computers and Electrical Engineering, 2022, 100: 107912.

    [8] Yemeni Z, Wang H, Ismael W M, et al. Reliable spatial and temporal data redundancy reduction approach for WSN[J]. Computer Networks, 2021, 185: 107701.

    [9] Kumar S, Chaurasiya V K. A strategy for elimination of data redundancy in internet of things (IoT) based wireless sensor network(WSN)[J]. IEEE Systems Journal, 2018, 13(2): 1650-1657.

    [10] Rezende J D V, da Silva R I, Souza M J F. Gathering big data in wireless sensor networks by drone(dagger)[J]. Sensors, 2020, 20(23): 6954.

    [11] Luo C W, Chen W P, Li D Y, et al. Optimizing flight trajectory of UAV for efficient data collection in wireless sensor networks[J]. Theoretical Computer Science, 2021, 853: 25-42.

    [12] Ben Ghorbel M, Rodríguez-Duarte D, Ghazzai H, et al. Joint position and travel path optimization for energy efficient wireless data gathering using unmanned aerial vehicles[J]. IEEE Transactions on Vehicular Technology, 2019, 68(3): 2165-2175.

    [13] Gong J, Chang T H, Shen C, et al. Flight time minimization of UAV for data collection over wireless sensor networks[J]. IEEE Journal on Selected Areas in Communications, 2018, 36(9): 1942-1954.

    [14] Just G E, Pellenz M E, Lima L A D, et al. UAV path optimization for precision agriculture wireless sensor networks[J]. Sensors, 2020, 20(21): 6098.

    [15] Zhang Y, Mou Z Y, Gao F F, et al. Hierarchical deep reinforcement learning for backscattering data collection with multiple UAVs[J]. IEEE Internet of Things Journal, 2021, 8(5): 3786-3800.

    [16] 蔣寶慶,陳宏濱. 基于Q學(xué)習(xí)的無人機(jī)輔助WSN數(shù)據(jù)采集軌跡規(guī)劃[J]. 計(jì)算機(jī)工程,2021,47(4):127-134.

    Jiang Baoqin, Chen Hongbin. Trajectory planning for unmanned aerial vehicle assisted WSN data collection based on Q-Learning[J]. Computer Engineering, 2021, 47(4): 127-134. (in Chinese with English abstract)

    [17] Yi M J, Wang X J, Liu J, et al. Deep reinforcement learning for fresh data collection in UAV-assisted IoT networks[C]//IEEE INFOCOM 2020-IEEE Conference on Computer Communications Workshops (INFOCOM WKSHPS). Toronto, ON, Canada: IEEE, 2020: 716-721.

    [18] 付澍,楊祥月,張海君,等. 物聯(lián)網(wǎng)數(shù)據(jù)收集中無人機(jī)路徑智能規(guī)劃[J]. 通信學(xué)報(bào),2021,42(2):124-133.

    Fu Shu, Yang Xiangyue, Zhang Haijun, et al. UAV path intelligent planning in IoT data collection[J]. Journal on Communications, 2021, 42(2): 124-133. (in Chinese with English abstract)

    [19] Zeng Y, Xu J, Zhang R. Energy minimization for wireless communication with Rotary-Wing UAV[J]. IEEE Transactions on Wireless Communications, 2019, 18(4): 2329-2345.

    [20] Padakandla S. A survey of reinforcement learning algorithms for dynamically varying environments[J]. ACM Computing Surveys, 2021, 54(6): 127.

    [21] 陳佳盼,鄭敏華. 基于深度強(qiáng)化學(xué)習(xí)的機(jī)器人操作行為研究綜述[J]. 機(jī)器人,2022,44(2):236-256.

    Chen Jiapan, Zheng Minhua. A survey of robot manipulation behavior research based on deep reinforcement learning[J]. Robet, 2022, 44(2): 236-256. (in Chinese with English abstract)

    [22] Fenjiro Y, Benbrahim H. Deep reinforcement learning overview of the state of the art[J]. Journal of Automation, Mobile Robotics and Intelligent Systems, 2018, 12: 20-39.

    [23] 張自東,邱才明,張東霞,等. 基于深度強(qiáng)化學(xué)習(xí)的微電網(wǎng)復(fù)合儲(chǔ)能協(xié)調(diào)控制方法[J]. 電網(wǎng)技術(shù),2019,43(6):1914-1921.

    Zhang Zidong, Qiu Caiming, Zhang Dongxia, et al. A coordinated control method for hybrid energy storage system in microgrid based on deep reinforcement learning[J]. Power System Technology, 2019, 43(6): 1914-1921. (in Chinese with English abstract)

    [24] Zhang W Y, Gai J Y, Zhang Z G, et al. Double-DQN based path smoothing and tracking control method for robotic vehicle navigation[J]. Computers and Electronics in Agriculture, 2019, 166: 104985.

    [25] Wang Z Y, Schaul T, Hessel M, et al. Dueling network architectures for deep reinforcement learning[C]. //In Proceedings of the 33rd International Conference on International Conference on Machine Learning. New York, NY, USA: ICML, 2016: 1995-2003.

    [26] Kumar H, Mammen P M, Ramamritham K. Explainable AI: deep reinforcement learning agents for residential demand side cost savings in smart grids[J]. arXiv e-prints, 2019: 1910. 08719.

    [27] 趙銘慧,張雪波,郭憲,等. 基于分層強(qiáng)化學(xué)習(xí)的通用裝配序列規(guī)劃算法[J]. 控制與決策,2022,37(4):861-870.

    Zhao Minghui, Zhang Xuebo, Guo Xian, et al. A general assembly sequence planning algorithm based on hierarchical reinforcement learning[J], Control and Decision, 2022, 37(4): 861-870. (in Chinese with English abstract)

    [28] 楊惟軼,白辰甲,蔡超,等. 深度強(qiáng)化學(xué)習(xí)中稀疏獎(jiǎng)勵(lì)問題研究綜述[J]. 計(jì)算機(jī)科學(xué),2020,47(3):182-191.

    Yang Weiyi, Bai Chenjia, Cai Chao, et al. Survey on sparse reward in deep reinforcement learning[J]. Computer Science. 2020, 47(3): 182-191. (in Chinese with English abstract)

    [29] Hernandez-Garcia J F, Sutton R S. Understanding multi-step deep reinforcement learning: A systematic study of the DQN target[J]. arXiv e-prints, 2019:1901. 07510.

    [30] Chen J, Ye F, Li Y B. Travelling salesman problem for UAV path planning with two parallel optimization algorithms[C]//2017 Progress in Electromagnetics Research Symposium-Fall(PIERS-FALL). Singapore, 2017: 832-837.

    [31] 吳媚. 工業(yè)物聯(lián)網(wǎng)環(huán)境下面向能耗優(yōu)化的無人機(jī)飛行規(guī)劃系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 南京:東南大學(xué),2019.

    Wu Mei. Energy Efficient UAV Flight Planning System for the Industrial IoT Environment[D]. Nanjing:Southeast University, 2019. (in Chinese with English abstract)

    UAV collection methods for the farmland nodes data based on deep reinforcement learning

    Hu Jie1,3, Zhang Yali2,3※, Wang Tuan1, Wang Mengcheng1, Lan Yubin1,3, Zhang Zhixun2

    (1.,,510642,; 2.,,510642,; 3.,510642,)

    Unmanned Aerial Vehicle (UAV) has been widely used to collect data from the wireless sensor node in fields. Some problems can be solved in this case, such as no network infrastructure in farmland, fast power consumption of multi-hop data forwarding, premature death of nodes near the gateway, and shortened network life cycle. However, the multiple nodes overlapping can often occur during UAVs collection at the same time, due to the possible redundancy of adjacent sensor data. In this study, a UAV data collection method was proposed to plan the node selection, hovering position, and collecting order using improved deep reinforcement learning. The UAV data collection from the sensor nodes was then divided into two scenarios: data collection from the partial nodes under perceptual redundancy coverage, and data collection from all nodes. The optimization was made to save the UAV energy consumption in less mission completion time. The data collection of partial nodes under perceived redundancy coverage was suitable for the relatively high proportion of redundant coverage area among nodes. The UAV energy also failed to complete the data collection tasks of all nodes, indicating the low requirements of data integrity. By contrast, the all-node data collection fully met the high requirement of data integrity. In the scenario of partial node data collection with perceived redundant coverage, the Dueling Double Deep Q Network (DDDQN) was used to select the collection nodes and then plan the collecting order, indicating the high energy efficiency of the UAV with the less redundant data. Simulation results show that the DDDQN presented greater data coverage and lower effective coverage average energy consumption than the Deep Q Network (DQN) under the same configuration. The training process of DDDQN was more stable than that of DQN, particularly for the higher returns at the end of learning. More importantly, the flight distance and energy consumption of the DDDQN were reduced by 1.21 km, and 27.9%, respectively, compared with the DQN. In the scenario of all-node data collection, a Double Deep Reinforcement Learning (DDRL) was proposed to optimize the hovering position and UAV collection sequence, in order to minimize the total energy consumption of the UAV during data collection. A comparison was made on the DDRL with the classical PSO-TSP and MEFC. A systematic evaluation was made to clarify the impact of the UAV flight speed on the total energy consumption and total working time, the impact of different node data loads on the UAV energy consumption, the impact of different flight speeds on the UAV hover collection time, and the impact of the number of sensor nodes on the total energy consumption. The simulation results show that the total energy consumption of the improved model was at least 6.3% less than that of the classical PSO-based Travel Salesman Problem (PSO-TSP), and the Minimized Energy Flight Control (MEFC) under different node numbers and UAV flight speeds, especially at the data load of a single node less than 160 kB. Finally, the flight and hover powers of the quadrotor UAV were tested to determine the packet loss rate and received signal strength of the UAV in the field experiments. The actual field flight experiments were carried out on the DDRL and the data collection of the classical PSO-TSP. Field experiment results show that the DDRL-based data collection was reduced by 11.5% for the total energy consumption of UAV, compared with the PSO-TSP. The DDDQN and DDRL approaches can be expected to provide the optimal energy consumption for the UAVs' data collection of wireless sensor nodes in the field.

    UAV; deep reinforcement learning; node data collection; perceptual redundancy; DQN; DRL

    10.11975/j.issn.1002-6819.2022.22.005

    S126;S-3

    A

    1002-6819(2022)-22-0041-11

    胡潔,張亞莉,王團(tuán),等. 基于深度強(qiáng)化學(xué)習(xí)的農(nóng)田節(jié)點(diǎn)數(shù)據(jù)無人機(jī)采集方法[J]. 農(nóng)業(yè)工程學(xué)報(bào),2022,38(22):41-51.doi:10.11975/j.issn.1002-6819.2022.22.005 http://www.tcsae.org

    Hu Jie, Zhang Yali, Wang Tuan, et al. UAV collection methods for the farmland nodes data based on deep reinforcement learning[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2022, 38(22): 41-51. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2022.22.005 http://www.tcsae.org

    2022-07-21

    2022-10-27

    高等學(xué)校學(xué)科創(chuàng)新引智計(jì)劃項(xiàng)目(D18019);國家自然科學(xué)基金項(xiàng)目(32271997);廣東省重點(diǎn)領(lǐng)域研發(fā)計(jì)劃項(xiàng)目(2019B020221001);廣東省科技計(jì)劃項(xiàng)目(2018A050506073)

    胡潔,博士,副教授,研究方向?yàn)檗r(nóng)業(yè)人工智能,農(nóng)業(yè)物聯(lián)網(wǎng)。Email:hjgz79@scau.edu.cn

    張亞莉,博士,副教授,研究方向?yàn)檗r(nóng)業(yè)航空傳感器技術(shù)與農(nóng)產(chǎn)品產(chǎn)地環(huán)境監(jiān)測。Email:ylzhang@scau.edu.cn

    猜你喜歡
    能耗深度傳感器
    120t轉(zhuǎn)爐降低工序能耗生產(chǎn)實(shí)踐
    昆鋼科技(2022年2期)2022-07-08 06:36:14
    能耗雙控下,漲價(jià)潮再度來襲!
    康奈爾大學(xué)制造出可拉伸傳感器
    探討如何設(shè)計(jì)零能耗住宅
    深度理解一元一次方程
    簡述傳感器在物聯(lián)網(wǎng)中的應(yīng)用
    電子制作(2019年22期)2020-01-14 03:16:52
    “傳感器新聞”會(huì)帶來什么
    傳媒評論(2019年5期)2019-08-30 03:50:18
    跟蹤導(dǎo)練(三)2
    深度觀察
    深度觀察
    成人无遮挡网站| 女生性感内裤真人,穿戴方法视频| 亚洲一区二区三区色噜噜| 又黄又爽又刺激的免费视频.| 欧美xxxx性猛交bbbb| 亚洲七黄色美女视频| 高清日韩中文字幕在线| 欧美日本亚洲视频在线播放| 黄色一级大片看看| 狂野欧美白嫩少妇大欣赏| 国产欧美日韩一区二区精品| 91在线精品国自产拍蜜月| 国产伦人伦偷精品视频| 亚洲精品粉嫩美女一区| 亚洲美女视频黄频| 精品久久久久久,| 又黄又爽又免费观看的视频| 99热精品在线国产| 国产色婷婷99| 级片在线观看| 亚洲第一欧美日韩一区二区三区| 51国产日韩欧美| 亚洲欧美清纯卡通| 欧美黑人巨大hd| 亚洲内射少妇av| 亚洲熟妇熟女久久| 亚洲 国产 在线| 亚洲中文字幕一区二区三区有码在线看| 欧美日韩国产亚洲二区| 久久久精品大字幕| 精品午夜福利视频在线观看一区| 国产美女午夜福利| 欧美zozozo另类| 十八禁网站免费在线| eeuss影院久久| 国产精品1区2区在线观看.| 窝窝影院91人妻| 国产人妻一区二区三区在| 久久久久九九精品影院| 听说在线观看完整版免费高清| 久久久久久国产a免费观看| 高清日韩中文字幕在线| 97人妻精品一区二区三区麻豆| 欧美+亚洲+日韩+国产| 男人舔奶头视频| 美女大奶头视频| 色噜噜av男人的天堂激情| 黄片小视频在线播放| 久久精品影院6| 久久久久久国产a免费观看| 天美传媒精品一区二区| 嫩草影院入口| 国产真实乱freesex| 成年免费大片在线观看| 色尼玛亚洲综合影院| 欧美色欧美亚洲另类二区| av女优亚洲男人天堂| 男女视频在线观看网站免费| 亚洲欧美日韩卡通动漫| 国产精品日韩av在线免费观看| 男女床上黄色一级片免费看| 最新中文字幕久久久久| 久久人人精品亚洲av| 三级国产精品欧美在线观看| 国产真实乱freesex| 两个人视频免费观看高清| 亚洲熟妇中文字幕五十中出| 亚州av有码| 国产免费av片在线观看野外av| 欧美bdsm另类| 18禁黄网站禁片免费观看直播| 久久欧美精品欧美久久欧美| 国产亚洲精品久久久久久毛片| 国产老妇女一区| 亚洲国产精品合色在线| 757午夜福利合集在线观看| 国产精品乱码一区二三区的特点| 欧美日韩国产亚洲二区| 亚洲一区二区三区不卡视频| 午夜日韩欧美国产| 午夜日韩欧美国产| 午夜视频国产福利| 久久国产精品人妻蜜桃| 男人和女人高潮做爰伦理| 亚洲18禁久久av| 丰满的人妻完整版| 亚洲精品日韩av片在线观看| 成人三级黄色视频| 国产野战对白在线观看| 国产乱人视频| 九九在线视频观看精品| 亚洲精品一卡2卡三卡4卡5卡| 日韩大尺度精品在线看网址| 日本一本二区三区精品| 国产黄色小视频在线观看| 精品久久久久久久久av| 男女床上黄色一级片免费看| 精品乱码久久久久久99久播| 深夜精品福利| 亚洲综合色惰| 热99在线观看视频| 日本与韩国留学比较| 永久网站在线| 亚洲成人久久性| 一区二区三区高清视频在线| 99视频精品全部免费 在线| 麻豆成人av在线观看| 国产精品不卡视频一区二区 | 精品99又大又爽又粗少妇毛片 | 观看美女的网站| 国内毛片毛片毛片毛片毛片| 床上黄色一级片| 亚洲熟妇中文字幕五十中出| 90打野战视频偷拍视频| 久久久久久国产a免费观看| 综合色av麻豆| 一夜夜www| 我要看日韩黄色一级片| 午夜亚洲福利在线播放| 偷拍熟女少妇极品色| 制服丝袜大香蕉在线| 90打野战视频偷拍视频| 淫秽高清视频在线观看| 18禁在线播放成人免费| 欧美激情在线99| 午夜福利在线观看吧| 99国产精品一区二区蜜桃av| 啪啪无遮挡十八禁网站| 两个人视频免费观看高清| 欧美激情在线99| 国产欧美日韩一区二区精品| 美女 人体艺术 gogo| 又爽又黄无遮挡网站| 99久国产av精品| 又爽又黄a免费视频| 国产av一区在线观看免费| 十八禁国产超污无遮挡网站| 久久伊人香网站| 国内精品久久久久久久电影| 国内毛片毛片毛片毛片毛片| 亚洲激情在线av| 亚洲美女黄片视频| 亚洲自拍偷在线| 日韩成人在线观看一区二区三区| 日韩欧美精品v在线| av国产免费在线观看| 久久中文看片网| 国产蜜桃级精品一区二区三区| 十八禁网站免费在线| a级毛片a级免费在线| 男女床上黄色一级片免费看| 久久人人爽人人爽人人片va | 波多野结衣高清无吗| 91久久精品电影网| av天堂在线播放| 一区二区三区高清视频在线| 少妇人妻一区二区三区视频| 久久婷婷人人爽人人干人人爱| www.999成人在线观看| 亚洲综合色惰| 人人妻人人澡欧美一区二区| 男人舔奶头视频| 91av网一区二区| 午夜a级毛片| 97超视频在线观看视频| 久久中文看片网| 久久久久久久午夜电影| 欧美成狂野欧美在线观看| 国产精品98久久久久久宅男小说| 小说图片视频综合网站| 国产真实伦视频高清在线观看 | 亚洲av.av天堂| 国产精品自产拍在线观看55亚洲| 午夜免费激情av| 免费看日本二区| 免费av观看视频| 成人毛片a级毛片在线播放| 美女黄网站色视频| 丝袜美腿在线中文| 色视频www国产| 少妇的逼水好多| 国产精品综合久久久久久久免费| 精品午夜福利在线看| 欧美色视频一区免费| 一本精品99久久精品77| 99视频精品全部免费 在线| 久久久久久久久大av| 午夜亚洲福利在线播放| 中文字幕精品亚洲无线码一区| 欧美潮喷喷水| ponron亚洲| 久久久久久久久久黄片| 97热精品久久久久久| 99久国产av精品| 两性午夜刺激爽爽歪歪视频在线观看| 此物有八面人人有两片| 国产精品精品国产色婷婷| xxxwww97欧美| 亚洲av中文字字幕乱码综合| 每晚都被弄得嗷嗷叫到高潮| 波多野结衣高清作品| 毛片女人毛片| 十八禁国产超污无遮挡网站| 日本黄色视频三级网站网址| 天堂√8在线中文| 午夜精品在线福利| 十八禁国产超污无遮挡网站| 亚洲成人免费电影在线观看| 搡女人真爽免费视频火全软件 | 午夜日韩欧美国产| 免费在线观看影片大全网站| 日本成人三级电影网站| 日日夜夜操网爽| 国产在线男女| 99国产精品一区二区三区| 不卡一级毛片| 欧美+亚洲+日韩+国产| 最新中文字幕久久久久| 少妇的逼好多水| 少妇的逼好多水| 国产成人福利小说| 丰满乱子伦码专区| 制服丝袜大香蕉在线| 久久午夜福利片| 久久99热6这里只有精品| 日韩欧美国产在线观看| 国产av麻豆久久久久久久| 黄色配什么色好看| 日本免费一区二区三区高清不卡| 少妇被粗大猛烈的视频| 丰满的人妻完整版| 成人午夜高清在线视频| 男人的好看免费观看在线视频| 免费在线观看亚洲国产| 国产色爽女视频免费观看| 亚洲国产高清在线一区二区三| 1000部很黄的大片| 亚洲成人中文字幕在线播放| 美女高潮喷水抽搐中文字幕| 1024手机看黄色片| 尤物成人国产欧美一区二区三区| 亚洲国产日韩欧美精品在线观看| 在线播放无遮挡| 99热精品在线国产| 国产熟女xx| 九九在线视频观看精品| 搡老岳熟女国产| 午夜亚洲福利在线播放| 可以在线观看的亚洲视频| 成年女人毛片免费观看观看9| 国产av一区在线观看免费| 一本综合久久免费| 两个人的视频大全免费| 热99在线观看视频| 超碰av人人做人人爽久久| 欧美黄色淫秽网站| 精品国内亚洲2022精品成人| 欧美绝顶高潮抽搐喷水| 国产一级毛片七仙女欲春2| 色在线成人网| 男女之事视频高清在线观看| 给我免费播放毛片高清在线观看| 欧美丝袜亚洲另类 | 国产精品久久视频播放| 国产中年淑女户外野战色| 日日摸夜夜添夜夜添小说| 丁香六月欧美| 九九在线视频观看精品| 久久久成人免费电影| 亚洲狠狠婷婷综合久久图片| 毛片一级片免费看久久久久 | 欧美又色又爽又黄视频| 成人国产一区最新在线观看| 少妇的逼好多水| 高清毛片免费观看视频网站| 日韩高清综合在线| 国产单亲对白刺激| av福利片在线观看| 自拍偷自拍亚洲精品老妇| 亚洲内射少妇av| 日韩欧美精品免费久久 | 成人国产一区最新在线观看| 搡女人真爽免费视频火全软件 | 国产av不卡久久| 中亚洲国语对白在线视频| 亚洲国产色片| 精品久久久久久成人av| 国产成+人综合+亚洲专区| 精品一区二区三区人妻视频| 色综合亚洲欧美另类图片| 99在线视频只有这里精品首页| 丰满人妻熟妇乱又伦精品不卡| 中文资源天堂在线| 国产视频一区二区在线看| 亚洲av美国av| 日韩av在线大香蕉| 国产中年淑女户外野战色| 亚洲在线观看片| 久久欧美精品欧美久久欧美| 变态另类丝袜制服| 午夜老司机福利剧场| 亚洲欧美激情综合另类| 国产在线精品亚洲第一网站| 波野结衣二区三区在线| 免费看a级黄色片| 免费电影在线观看免费观看| 女人十人毛片免费观看3o分钟| 欧美xxxx性猛交bbbb| 欧美+日韩+精品| 国产精品综合久久久久久久免费| 高清日韩中文字幕在线| 日韩av在线大香蕉| 亚洲欧美日韩高清在线视频| 伦理电影大哥的女人| 最好的美女福利视频网| 丰满乱子伦码专区| 老司机福利观看| 少妇的逼水好多| av在线蜜桃| 久久精品国产自在天天线| 91久久精品国产一区二区成人| 国产视频内射| a级一级毛片免费在线观看| 网址你懂的国产日韩在线| 美女高潮喷水抽搐中文字幕| 久久午夜福利片| 91麻豆av在线| 国产精品99久久久久久久久| 久久久久久久久大av| 老鸭窝网址在线观看| 成人亚洲精品av一区二区| 日韩欧美 国产精品| 十八禁网站免费在线| 18禁在线播放成人免费| 日韩av在线大香蕉| 久99久视频精品免费| 黄色丝袜av网址大全| 小蜜桃在线观看免费完整版高清| av福利片在线观看| 丰满人妻一区二区三区视频av| 非洲黑人性xxxx精品又粗又长| 亚洲人成网站高清观看| 欧美最新免费一区二区三区 | 亚洲经典国产精华液单 | 欧美性感艳星| 麻豆国产av国片精品| 高清在线国产一区| 亚洲av成人不卡在线观看播放网| 亚洲熟妇中文字幕五十中出| 国产真实乱freesex| 又爽又黄a免费视频| 91在线观看av| 动漫黄色视频在线观看| 久久精品综合一区二区三区| av女优亚洲男人天堂| 午夜视频国产福利| avwww免费| 免费看美女性在线毛片视频| 两人在一起打扑克的视频| 少妇的逼水好多| 亚洲美女视频黄频| 免费搜索国产男女视频| 一级av片app| 免费一级毛片在线播放高清视频| 国产伦一二天堂av在线观看| 大型黄色视频在线免费观看| 国产高清视频在线观看网站| 欧美成人a在线观看| 欧洲精品卡2卡3卡4卡5卡区| 在线观看舔阴道视频| 亚洲 欧美 日韩 在线 免费| 最好的美女福利视频网| 免费看美女性在线毛片视频| 免费在线观看成人毛片| 在线a可以看的网站| 一进一出好大好爽视频| 男插女下体视频免费在线播放| 看黄色毛片网站| 亚洲专区中文字幕在线| 国产精品精品国产色婷婷| 乱码一卡2卡4卡精品| 九九在线视频观看精品| 高清日韩中文字幕在线| 午夜福利高清视频| 天天躁日日操中文字幕| 99久久99久久久精品蜜桃| 婷婷六月久久综合丁香| 久久天躁狠狠躁夜夜2o2o| 婷婷丁香在线五月| 757午夜福利合集在线观看| 哪里可以看免费的av片| 亚洲精品色激情综合| a在线观看视频网站| 熟女人妻精品中文字幕| 熟妇人妻久久中文字幕3abv| 午夜福利在线观看免费完整高清在 | 欧美日韩中文字幕国产精品一区二区三区| 一级作爱视频免费观看| 人妻丰满熟妇av一区二区三区| 国产极品精品免费视频能看的| 搡老岳熟女国产| 亚洲成人久久爱视频| 窝窝影院91人妻| 成人国产一区最新在线观看| 在线观看午夜福利视频| 精品久久久久久久久久免费视频| 欧美+亚洲+日韩+国产| 日本一二三区视频观看| 亚洲欧美日韩高清在线视频| 精品人妻偷拍中文字幕| 天天躁日日操中文字幕| 久久国产精品人妻蜜桃| 老熟妇仑乱视频hdxx| 综合色av麻豆| 国产精品伦人一区二区| 在线a可以看的网站| 成人午夜高清在线视频| 亚洲天堂国产精品一区在线| 成人av一区二区三区在线看| 在线观看午夜福利视频| 久久人妻av系列| 一区二区三区高清视频在线| 久久精品影院6| 国产日本99.免费观看| 老熟妇乱子伦视频在线观看| 亚洲最大成人av| 99久国产av精品| 亚洲成人免费电影在线观看| 免费搜索国产男女视频| 乱码一卡2卡4卡精品| 午夜福利在线观看免费完整高清在 | 欧美丝袜亚洲另类 | 精品熟女少妇八av免费久了| 欧美国产日韩亚洲一区| 波多野结衣高清无吗| 国产精品自产拍在线观看55亚洲| 亚洲国产色片| 小说图片视频综合网站| 99在线人妻在线中文字幕| 美女 人体艺术 gogo| 三级国产精品欧美在线观看| 国产精品自产拍在线观看55亚洲| 老司机午夜福利在线观看视频| 日韩欧美 国产精品| 亚洲性夜色夜夜综合| 亚洲第一欧美日韩一区二区三区| 国产精品影院久久| 啪啪无遮挡十八禁网站| 国产成人a区在线观看| eeuss影院久久| 97热精品久久久久久| 麻豆一二三区av精品| 精品乱码久久久久久99久播| 成年人黄色毛片网站| a级一级毛片免费在线观看| 成人三级黄色视频| 亚洲人成电影免费在线| 国产探花极品一区二区| 日韩中字成人| 十八禁人妻一区二区| 免费观看精品视频网站| 男人舔奶头视频| 搡老妇女老女人老熟妇| 午夜精品久久久久久毛片777| 十八禁国产超污无遮挡网站| 一区二区三区激情视频| 久久这里只有精品中国| 日本一二三区视频观看| 亚洲精品一卡2卡三卡4卡5卡| 久久久久久久久久黄片| 欧美色欧美亚洲另类二区| 国产乱人视频| 免费大片18禁| 天堂影院成人在线观看| 欧美bdsm另类| 久9热在线精品视频| 亚洲午夜理论影院| 久久精品人妻少妇| 日日干狠狠操夜夜爽| 亚洲av成人精品一区久久| 国产精品av视频在线免费观看| 男人和女人高潮做爰伦理| 日韩国内少妇激情av| 听说在线观看完整版免费高清| 久久精品国产亚洲av天美| 在线观看av片永久免费下载| 成年人黄色毛片网站| 日日摸夜夜添夜夜添av毛片 | 一本综合久久免费| 热99在线观看视频| 男人和女人高潮做爰伦理| 91九色精品人成在线观看| 高清日韩中文字幕在线| 久久久久精品国产欧美久久久| 久久热精品热| 搡老妇女老女人老熟妇| 极品教师在线视频| 深夜a级毛片| 午夜老司机福利剧场| 久久伊人香网站| 亚洲一区二区三区不卡视频| .国产精品久久| 欧美黑人欧美精品刺激| 美女高潮的动态| 欧美+亚洲+日韩+国产| 我要搜黄色片| 亚洲久久久久久中文字幕| 18禁黄网站禁片免费观看直播| 亚洲五月婷婷丁香| 精品久久久久久久久久免费视频| 午夜亚洲福利在线播放| 亚洲av成人精品一区久久| 一进一出好大好爽视频| 别揉我奶头~嗯~啊~动态视频| 在线十欧美十亚洲十日本专区| 免费看美女性在线毛片视频| 日本三级黄在线观看| 国产三级中文精品| 黄色视频,在线免费观看| 精品久久久久久成人av| 99国产极品粉嫩在线观看| 国产美女午夜福利| 国产精品国产高清国产av| 亚洲自偷自拍三级| 欧美激情国产日韩精品一区| 日本免费a在线| 中文字幕高清在线视频| 国产精品久久视频播放| 日韩精品中文字幕看吧| 亚洲人成电影免费在线| 1000部很黄的大片| 国产一区二区在线观看日韩| 99久久成人亚洲精品观看| 欧美性猛交黑人性爽| 国产探花在线观看一区二区| www.色视频.com| av专区在线播放| 亚洲熟妇中文字幕五十中出| 丰满人妻熟妇乱又伦精品不卡| 久久国产乱子免费精品| 久久99热6这里只有精品| av天堂在线播放| 一本精品99久久精品77| 日韩欧美三级三区| 男插女下体视频免费在线播放| 又粗又爽又猛毛片免费看| 三级毛片av免费| 丰满的人妻完整版| 噜噜噜噜噜久久久久久91| 看免费av毛片| 90打野战视频偷拍视频| 成人欧美大片| 国产精品自产拍在线观看55亚洲| 国产av一区在线观看免费| 嫩草影院精品99| 欧美日韩福利视频一区二区| 国内精品久久久久精免费| 国产激情偷乱视频一区二区| 国产三级在线视频| 亚洲av免费高清在线观看| 一个人看视频在线观看www免费| 久久久久久久久久黄片| 国产精品伦人一区二区| 国产爱豆传媒在线观看| 久久久久久久精品吃奶| 国产精品伦人一区二区| 99视频精品全部免费 在线| 免费观看的影片在线观看| 特级一级黄色大片| 琪琪午夜伦伦电影理论片6080| 国产亚洲欧美98| 亚洲av成人不卡在线观看播放网| 性色avwww在线观看| 91狼人影院| 少妇的逼好多水| 最新在线观看一区二区三区| 美女免费视频网站| 熟女人妻精品中文字幕| 在线观看免费视频日本深夜| 偷拍熟女少妇极品色| 欧美最黄视频在线播放免费| 九九热线精品视视频播放| 欧美一级a爱片免费观看看| 午夜福利欧美成人| 久久久久性生活片| 在线国产一区二区在线| 亚洲电影在线观看av| 精品国产亚洲在线| 日韩欧美免费精品| 看免费av毛片| 国产主播在线观看一区二区| 免费在线观看亚洲国产| 757午夜福利合集在线观看| 久久久久久久久大av| 成人av在线播放网站| 欧美+亚洲+日韩+国产| 禁无遮挡网站| 婷婷精品国产亚洲av| 噜噜噜噜噜久久久久久91| 国内精品久久久久精免费| 亚洲国产精品sss在线观看| 精品人妻一区二区三区麻豆 | 国内毛片毛片毛片毛片毛片| 天堂影院成人在线观看| av在线观看视频网站免费| 久久久色成人| 国产白丝娇喘喷水9色精品| АⅤ资源中文在线天堂| 免费看日本二区| 国产精品一区二区性色av| 一区二区三区四区激情视频 | 日韩欧美 国产精品| 99精品久久久久人妻精品| 久久精品国产亚洲av香蕉五月| 国产aⅴ精品一区二区三区波|