• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于強(qiáng)化學(xué)習(xí)的變電站巡檢路徑規(guī)劃算法

    2022-02-09 02:18:28馬松玲陳起源康佳歡
    計(jì)算機(jī)仿真 2022年12期
    關(guān)鍵詞:檢測(cè)點(diǎn)神經(jīng)網(wǎng)絡(luò)距離

    馬松玲,陳起源,康佳歡

    (西安建筑科技大學(xué)機(jī)電工程學(xué)院,陜西 西安 710000)

    1 引言

    變電站是電力傳輸與分配的樞紐,電網(wǎng)的《變電站智能機(jī)器人巡檢系統(tǒng)運(yùn)維規(guī)范》中對(duì)油浸式變壓器、斷路器、隔離開關(guān)等 28 類設(shè)備的巡視點(diǎn)位以及巡檢項(xiàng)目進(jìn)行了詳細(xì)規(guī)定[1]。由于變電站運(yùn)維工作量大,工作風(fēng)險(xiǎn)高,出于安全和節(jié)省人力成本的考慮,巡檢機(jī)器人的應(yīng)用日益廣泛[2]。面向在不同變電站下多種電器的巡檢任務(wù),巡檢機(jī)器人的正常工作依賴于有效合理的路徑規(guī)劃[3]。現(xiàn)有的巡檢機(jī)器人路徑規(guī)劃方法大多依賴于環(huán)境建模[4],其優(yōu)點(diǎn)是機(jī)器人能夠理解環(huán)境,利用地圖對(duì)所有檢測(cè)點(diǎn)進(jìn)行遍歷,能夠?qū)崿F(xiàn)全局最優(yōu)的路徑規(guī)劃[5];其缺點(diǎn)是變電站一旦由于后期維護(hù)導(dǎo)致檢測(cè)點(diǎn)發(fā)生變化,需要對(duì)變電站環(huán)境和檢測(cè)點(diǎn)進(jìn)行重新建模與標(biāo)定,具有較高的維護(hù)成本[6]。巡檢機(jī)器人運(yùn)行過程中,由于累積誤差導(dǎo)致機(jī)器人對(duì)自身定位存在較大偏差,導(dǎo)致機(jī)器人實(shí)際巡檢路徑與規(guī)劃的最優(yōu)巡檢路徑存在偏離,不僅需要變電站工作人員進(jìn)行定期校準(zhǔn),而且存在較大的安全風(fēng)險(xiǎn)[7]。同時(shí),當(dāng)巡檢機(jī)器人需要在不同變電站進(jìn)行遷移和快速部署時(shí),基于環(huán)境建模的方法也導(dǎo)致巡檢機(jī)器人的遷移代價(jià)較高,不利于其推廣使用。針對(duì)于此,強(qiáng)化學(xué)習(xí)被用來實(shí)現(xiàn)無環(huán)境模型下的機(jī)器人路徑規(guī)劃。然而,傳統(tǒng)強(qiáng)化學(xué)習(xí)通過維護(hù)狀態(tài)-行為-期望回報(bào)映射的Q表來實(shí)現(xiàn)最佳決策的迭代尋優(yōu),存在維數(shù)災(zāi)難問題,難以應(yīng)用于大規(guī)模變電站環(huán)境。近年來,研究表明在未創(chuàng)建地圖情況下利用深度強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)移動(dòng)機(jī)器人的導(dǎo)航是完全可行的,且利用在柵格化地圖中初步實(shí)現(xiàn)了路徑規(guī)劃[8]。深度強(qiáng)化學(xué)習(xí)是一種結(jié)合了強(qiáng)化學(xué)習(xí)中的Q學(xué)習(xí)(Qlearning)[9]和深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)的算法。深度強(qiáng)化學(xué)習(xí)采用卷積神經(jīng)網(wǎng)絡(luò)作為學(xué)習(xí)模型,網(wǎng)絡(luò)參數(shù)需通過強(qiáng)化學(xué)習(xí)反復(fù)調(diào)整,達(dá)到神經(jīng)網(wǎng)絡(luò)對(duì)Q 表建模的目的。深度強(qiáng)化學(xué)習(xí)能夠?qū)?qiáng)化學(xué)習(xí)的決策能力和深度學(xué)習(xí)的感知能力相融合[10]。然而,基于深度強(qiáng)化學(xué)習(xí)的方法普遍以圖像作為輸入,使用較為復(fù)雜的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí),這對(duì)機(jī)器人平臺(tái)的計(jì)算能力提出了較高的要求。針對(duì)上述問題,本文提出了一種基于多層感知機(jī)的強(qiáng)化學(xué)習(xí)框架以及巡檢路徑規(guī)劃方法。該方法不需要對(duì)環(huán)境進(jìn)行事先建模,能夠使得巡檢機(jī)器人完成遍歷檢測(cè)點(diǎn)的巡檢任務(wù)。

    2 基于改進(jìn)強(qiáng)化學(xué)習(xí)的訓(xùn)練路徑規(guī)劃方法

    2.1 強(qiáng)化學(xué)習(xí)算法基本原理

    對(duì)Q表的學(xué)習(xí)是強(qiáng)化學(xué)習(xí)算法中的重要部分。Q表存儲(chǔ)某一個(gè)時(shí)刻的狀態(tài)下,采取動(dòng)作能夠獲得收益的期望,即環(huán)境會(huì)根據(jù)機(jī)器人的動(dòng)作反饋相應(yīng)的獎(jiǎng)賞。強(qiáng)化學(xué)習(xí)算法的主要思想是將狀態(tài)和動(dòng)作構(gòu)建成一張表來存儲(chǔ)Q值,然后根據(jù)Q值來選取能夠獲得最大收益的動(dòng)作。針對(duì)無環(huán)境模型的任務(wù)場(chǎng)景,Q學(xué)習(xí)一般使用融合了蒙特卡洛和動(dòng)態(tài)規(guī)劃的時(shí)間差分法進(jìn)行學(xué)習(xí),利用貝爾曼方程對(duì)馬爾科夫過程求解最優(yōu)策略:

    (1)

    式中,Qπ(s,a)為狀態(tài)-動(dòng)作值函數(shù),用來表示在策略π上,在狀態(tài)s下執(zhí)行動(dòng)作a后得到的累積獎(jiǎng)勵(lì)值,π*表示最優(yōu)策略,γ是折扣累積獎(jiǎng)賞值,T(s,a,s′)表示執(zhí)行動(dòng)作a后狀態(tài)s變?yōu)闋顟B(tài)s′的概率;R(s,a,s′)表示在狀態(tài)s下采取了動(dòng)作a后得到的獎(jiǎng)勵(lì),依照此策略行動(dòng)能獲得最佳預(yù)期獎(jiǎng)勵(lì)值。

    在強(qiáng)化學(xué)習(xí)算法在解空間進(jìn)行探索的過程中,根據(jù)(1)式,Q表的迭代過程為

    Q(s,a)←Q(s,a)+α(r+γmaxa′Q(s′,a′)-Q(s,a))

    (2)

    Q表即狀態(tài)—?jiǎng)幼髦岛瘮?shù)Q(s,a),α是學(xué)習(xí)率,γ是折扣因子,r和s′分別是在狀態(tài)s下選擇動(dòng)作a后得到的即時(shí)獎(jiǎng)勵(lì)和下一個(gè)狀態(tài),a′是在當(dāng)前策略下機(jī)器人處于狀態(tài)s′時(shí)選擇的動(dòng)作,max(s′,a′)是狀態(tài)s′對(duì)應(yīng)的最大累積獎(jiǎng)勵(lì)值。算法訓(xùn)練目標(biāo)是為了獲取到最優(yōu)化的Q值。通過對(duì)Q表的不斷更新能夠建立每個(gè)狀態(tài)下對(duì)應(yīng)的可選行為的回報(bào)值。根據(jù)更新后的Q表可以實(shí)現(xiàn)環(huán)境狀態(tài)和最優(yōu)行為的映射。

    2.2 機(jī)器人狀態(tài)-最優(yōu)行為映射模型

    當(dāng)解空間規(guī)模較大時(shí),傳統(tǒng)基于Q表維護(hù)的方法難以實(shí)現(xiàn)有效的狀態(tài)-行為映射建模。本文采用多層感知機(jī)(Multi-Layer Perception,MLP)實(shí)現(xiàn)對(duì)機(jī)器人狀態(tài)-最優(yōu)行為映射的學(xué)習(xí),以替代傳統(tǒng)的Q表模型。MLP神經(jīng)網(wǎng)絡(luò)以低維向量為輸入,具有計(jì)算效率高的特點(diǎn),能夠滿足巡檢機(jī)器人在環(huán)境探索過程中進(jìn)行更加高效訓(xùn)練的需求。與深度強(qiáng)化學(xué)習(xí)將地圖作為環(huán)境和機(jī)器人的狀態(tài)輸入到卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練不同,本文重新定義了低維度機(jī)器人實(shí)時(shí)狀態(tài)作為的輸入,以機(jī)器人的最優(yōu)運(yùn)動(dòng)控制量作為預(yù)測(cè)輸出,如圖1所示。

    圖1 機(jī)器人狀態(tài)-最優(yōu)行為映射的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)模型

    本文選用三層神經(jīng)網(wǎng)絡(luò),每層32個(gè)神經(jīng)元,MLP每個(gè)神經(jīng)元的值的前向傳遞公式為

    ni,j=f(∑jni-1,j*wj+bj)

    (3)

    其中:w為神經(jīng)網(wǎng)絡(luò)中每層的連接權(quán)重值,b是該神經(jīng)元的偏置值,f是激活函數(shù),nij是代表第i層第j個(gè)神經(jīng)元的值。

    激活函數(shù)采用雙曲正切函數(shù)

    (4)

    針對(duì)機(jī)器人巡檢任務(wù),本文設(shè)計(jì)的狀態(tài)輸入和行為輸出量如下:

    1)狀態(tài)輸入量一:機(jī)器人到巡檢目標(biāo)檢測(cè)點(diǎn)之間的距離。將檢測(cè)點(diǎn)設(shè)置為一個(gè)信號(hào)發(fā)射器,巡檢機(jī)器人在信號(hào)輻射范圍內(nèi)都可以接收到該信號(hào),障礙物對(duì)于信號(hào)的阻擋衰減和反射阻礙在仿真中忽略不計(jì),如圖2所示。

    圖2 巡檢目標(biāo)檢測(cè)點(diǎn)設(shè)計(jì)

    根據(jù)輻射信號(hào)衰減關(guān)系,輻射強(qiáng)弱和距離的平方分之一成正比,可以得到巡檢機(jī)器人與檢測(cè)點(diǎn)傳感器的距離為

    (5)

    式中,d為巡檢機(jī)器人與檢測(cè)點(diǎn)之間的距離,γ為信號(hào)的衰減程度。

    2) 狀態(tài)輸入量二:檢測(cè)點(diǎn)的遍歷標(biāo)志位。本文設(shè)置nc個(gè)檢測(cè)點(diǎn),標(biāo)記為nc1、nc2…nc3,機(jī)器人已知檢測(cè)點(diǎn)的數(shù)量,每個(gè)檢測(cè)點(diǎn)對(duì)應(yīng)的到達(dá)標(biāo)記值初始化為0。在仿真環(huán)境中模擬當(dāng)機(jī)器人與檢測(cè)點(diǎn)距離小于0.1時(shí),認(rèn)為機(jī)器人經(jīng)過了該檢測(cè)點(diǎn),則該目標(biāo)點(diǎn)對(duì)應(yīng)的到達(dá)標(biāo)記變?yōu)?。如果全部nc個(gè)點(diǎn)遍歷,則表明遍歷任務(wù)成功結(jié)束,本文將檢測(cè)點(diǎn)的經(jīng)歷信號(hào)做為神經(jīng)網(wǎng)絡(luò)的第二組輸入。

    3) 狀態(tài)輸入量三:機(jī)器人對(duì)環(huán)境障礙物的感知距離信息。仿真環(huán)境地圖設(shè)置為10×10個(gè)單位,超聲波傳感器檢測(cè)到的空間距離范圍設(shè)定為(0,20),機(jī)器人搭載12個(gè)環(huán)形設(shè)置的超聲波傳感器。它們檢測(cè)到的距離信息為神經(jīng)網(wǎng)絡(luò)的第三組輸入。

    圖3 超聲波傳感器搭載設(shè)計(jì)

    4) 狀態(tài)輸入量四:機(jī)器人歷史運(yùn)動(dòng)行為。機(jī)器人會(huì)存儲(chǔ)過去nstorage步的傳感器信息,不足以達(dá)到幫助機(jī)器人識(shí)別檢測(cè)點(diǎn)方向的目的,所以機(jī)器人還需要記錄過去nstorage步的歷史動(dòng)作。如圖4所示,歷史動(dòng)作的表達(dá)和計(jì)算方式如下:

    圖4 檢測(cè)點(diǎn)大致方向分析

    如圖所示,巡檢機(jī)器人由A點(diǎn)移動(dòng)到B點(diǎn),與檢測(cè)點(diǎn)的距離從b變化到a,b、a由檢測(cè)點(diǎn)傳感器得出,為已知量,機(jī)器人內(nèi)部存儲(chǔ)器能夠記錄前nstorage步動(dòng)作,所以距離c對(duì)于機(jī)器人來說也是已知量,根據(jù)公式

    (6)

    α角與機(jī)器人掌握的距離信息有著明確的邏輯關(guān)系,所以本文將機(jī)器人前兩次動(dòng)作輸出做為神經(jīng)網(wǎng)絡(luò)的第四組輸入。

    5) 狀態(tài)輸出量:機(jī)器人左右輪的角速度控制量。本文主要針對(duì)兩輪的巡檢機(jī)器人,因此通過左右輪的角速度變化實(shí)現(xiàn)對(duì)機(jī)器人狀態(tài)的轉(zhuǎn)移。

    2.3 獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)

    巡檢機(jī)器人必須到達(dá)每個(gè)檢測(cè)點(diǎn)并對(duì)重要設(shè)備進(jìn)行拍照和檢測(cè)任務(wù),在強(qiáng)化學(xué)習(xí)框架下,本文建立新的獎(jiǎng)勵(lì)函數(shù)來實(shí)現(xiàn)無碰撞的遍歷巡檢效果。

    利用獎(jiǎng)勵(lì)函數(shù)可以針對(duì)機(jī)器人的每步行為動(dòng)作進(jìn)行打分,是誘導(dǎo)機(jī)器人實(shí)現(xiàn)避障和遍歷檢測(cè)點(diǎn)的關(guān)鍵[8],本文設(shè)計(jì)了一種獎(jiǎng)勵(lì)函數(shù)

    (7)

    式中:rste為機(jī)器人行走步數(shù)的負(fù)獎(jiǎng)勵(lì),nste為機(jī)器人移動(dòng)的步數(shù);rmov為機(jī)器人移動(dòng)距離的負(fù)獎(jiǎng)勵(lì);Lstr為機(jī)器人從A點(diǎn)移動(dòng)到B點(diǎn)的直線距離;rnearcol為機(jī)器人接近碰撞時(shí)的負(fù)獎(jiǎng)勵(lì);dr-o(t)為t時(shí)刻機(jī)器人與最近障礙物間的距離;dnearcol為機(jī)器人接近碰撞時(shí)的距離;rapp為機(jī)器人靠近檢測(cè)點(diǎn)時(shí)的距離;dwin為機(jī)器人被認(rèn)為到達(dá)檢測(cè)點(diǎn)的距離;dr-t(t)為t時(shí)刻機(jī)器人與目標(biāo)檢測(cè)點(diǎn)間的距離;nnew為機(jī)器人新到達(dá)檢測(cè)點(diǎn)的個(gè)數(shù);rnew為機(jī)器人到達(dá)新檢測(cè)點(diǎn)的獎(jiǎng)勵(lì);rall為到達(dá)所有檢測(cè)點(diǎn)的獎(jiǎng)勵(lì);rcol為出現(xiàn)碰撞情況的負(fù)獎(jiǎng)勵(lì);rout為出現(xiàn)超時(shí)情況的負(fù)獎(jiǎng)勵(lì),具體參數(shù)如下

    表1 獎(jiǎng)勵(lì)函數(shù)具體參數(shù)值

    對(duì)機(jī)器人的移動(dòng)進(jìn)行負(fù)獎(jiǎng)勵(lì)是為了避免機(jī)器人無意義的移動(dòng)[9],巡檢需要有效率的遍歷檢測(cè)點(diǎn)的路線。對(duì)機(jī)器人的移動(dòng)進(jìn)行負(fù)獎(jiǎng)勵(lì)是為了避免機(jī)器人無意義的移動(dòng)[11],巡檢需要有效率的遍歷檢測(cè)點(diǎn)的路線。對(duì)于經(jīng)過新的檢測(cè)點(diǎn)和臨界靠近新的檢測(cè)點(diǎn)設(shè)置較大額度獎(jiǎng)勵(lì)是為了鼓勵(lì)機(jī)器人追求到達(dá)檢測(cè)點(diǎn),到達(dá)一個(gè)新的檢測(cè)點(diǎn)的正獎(jiǎng)勵(lì)和機(jī)器人移動(dòng)帶來的負(fù)獎(jiǎng)勵(lì)組合起來就可以鼓勵(lì)機(jī)器人不僅趨向于到達(dá)新的檢測(cè)點(diǎn),還要走最短路徑,以更快的獲得獎(jiǎng)勵(lì)。對(duì)于碰撞的負(fù)獎(jiǎng)勵(lì)和臨近碰撞的負(fù)獎(jiǎng)勵(lì)可以誘導(dǎo)出機(jī)器人的避障效果。對(duì)于超時(shí)的情況設(shè)置負(fù)獎(jiǎng)勵(lì)是為了使機(jī)器人工作更有效率,使機(jī)器人學(xué)習(xí)到能夠規(guī)劃出更有效率的的遍歷檢測(cè)點(diǎn)的運(yùn)動(dòng)路線。遍歷的最高額獎(jiǎng)勵(lì)設(shè)置明確了機(jī)器人的最終目標(biāo),如果單一設(shè)置這個(gè)獎(jiǎng)勵(lì)就會(huì)陷入稀疏獎(jiǎng)勵(lì)的誤區(qū)當(dāng)中,但本文的獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)方法對(duì)機(jī)器人靠近新的檢測(cè)點(diǎn),到達(dá)新的檢測(cè)點(diǎn)都設(shè)置了獎(jiǎng)勵(lì),使獎(jiǎng)勵(lì)設(shè)置的更為密集,幫助機(jī)器人能夠從易到難完成最終的目標(biāo)。基于前述定義的網(wǎng)絡(luò)模型和獎(jiǎng)勵(lì)函數(shù),利用較為成熟的近端策略優(yōu)化[12]對(duì)整個(gè)強(qiáng)化學(xué)習(xí)模型進(jìn)行訓(xùn)練。強(qiáng)化學(xué)習(xí)過程如下圖5 所示。其中,策略預(yù)測(cè)神經(jīng)網(wǎng)絡(luò)對(duì)應(yīng)于本文2.2節(jié)提出的網(wǎng)絡(luò)模型。值函數(shù)預(yù)測(cè)網(wǎng)絡(luò)為多層神經(jīng)網(wǎng)絡(luò)模型。

    圖5 本文強(qiáng)化學(xué)習(xí)模型

    PPO1參數(shù)如下表所示:

    表2 PPO1參數(shù)表

    3 實(shí)驗(yàn)結(jié)果與分析

    3.1 仿真環(huán)境

    為驗(yàn)證本文所提出方法的性能,本文在仿真環(huán)境中進(jìn)行巡檢路徑規(guī)劃實(shí)驗(yàn)。本文在OpenAI Gym[13]中建立了仿真環(huán)境,搭建了10×10的仿真場(chǎng)景。OpenAI Gym是一種較為通用的強(qiáng)化學(xué)習(xí)平臺(tái)。根據(jù)巡檢機(jī)器人兩輪運(yùn)動(dòng)學(xué)模型定義了機(jī)器人,以空心小圈表示。其搭載了超聲波傳感器,具有檢測(cè)距離的功能。在環(huán)境中定義了隨機(jī)障礙物,賦予其不能被機(jī)器人穿過,不能被超聲波穿透,機(jī)器人過度靠近會(huì)發(fā)生碰撞的規(guī)則,以實(shí)心矩形表示。進(jìn)一步定義了檢測(cè)點(diǎn)傳感器,用黑點(diǎn)表示,機(jī)器人靠近時(shí)會(huì)顯示其輻射范圍圈。仿真環(huán)境如圖6所示。

    圖6 仿真環(huán)境

    3.2 仿真結(jié)果分析

    在巡檢機(jī)器人起點(diǎn)、障礙物位置與大小、檢測(cè)點(diǎn)位置與個(gè)數(shù)不變的情況下,通過調(diào)整巡檢機(jī)器人的訓(xùn)練次數(shù),設(shè)置對(duì)比實(shí)驗(yàn)驗(yàn)證本文方法的效果。訓(xùn)練結(jié)果如圖7所示。

    圖7 仿真結(jié)果對(duì)比

    從圖7可以看出,在獎(jiǎng)勵(lì)函數(shù)的誘導(dǎo)下,隨著訓(xùn)練次數(shù)的增加,機(jī)器人經(jīng)歷的檢測(cè)點(diǎn)數(shù)量逐漸增加,路徑效率不斷提高。且因?yàn)楠?jiǎng)勵(lì)函數(shù)對(duì)于碰撞和臨界碰撞的有效負(fù)獎(jiǎng)勵(lì)設(shè)置,即使在訓(xùn)練次數(shù)較少的情況下,機(jī)器人依然具有避障的功能。進(jìn)一步對(duì)訓(xùn)練過程中機(jī)器人所獲得的獎(jiǎng)勵(lì)進(jìn)行可視化展示,如圖8所示。

    圖8 獎(jiǎng)勵(lì)隨步數(shù)變化曲線圖

    由上圖可以看出,訓(xùn)練前期因?yàn)闄C(jī)器人尚處于探索環(huán)境階段,無法判斷什么樣的動(dòng)作會(huì)取得高分,所以每次動(dòng)作獲得的獎(jiǎng)勵(lì)較低,甚至可能因?yàn)榕鲎伯a(chǎn)生負(fù)獎(jiǎng)勵(lì)。隨著訓(xùn)練的深入,神經(jīng)網(wǎng)絡(luò)的輸入有更多的先驗(yàn)知識(shí)進(jìn)入,到達(dá)檢測(cè)點(diǎn)的概率會(huì)提升,機(jī)器人每次動(dòng)作獲得的獎(jiǎng)勵(lì)不斷增加。在訓(xùn)練后期,機(jī)器人達(dá)到了一直保持收益高獎(jiǎng)勵(lì)的狀態(tài),證明了巡檢機(jī)器人通過MLP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)強(qiáng)化學(xué)習(xí)可以達(dá)到遍歷檢測(cè)點(diǎn)和避障的目標(biāo)。

    3.3 算法泛化性實(shí)驗(yàn)結(jié)果分析

    針對(duì)于變電站后期升級(jí)會(huì)產(chǎn)生的變化,現(xiàn)設(shè)置更改障礙物、改變檢測(cè)點(diǎn)位置、改變起點(diǎn)位置的對(duì)比實(shí)驗(yàn),驗(yàn)證本文方法是否能夠保證機(jī)器人的自適應(yīng)性:

    圖9 算法泛化性仿真結(jié)果對(duì)比

    其對(duì)應(yīng)的獎(jiǎng)勵(lì)隨步數(shù)變化曲線圖如下

    圖10 獎(jiǎng)勵(lì)隨步數(shù)變化曲線圖

    實(shí)驗(yàn)結(jié)果表明:在機(jī)器人起點(diǎn)、檢測(cè)點(diǎn)的位置以及障礙物大小、數(shù)量和方位發(fā)生一定范圍的改變時(shí),巡檢機(jī)器人依然可以通過自學(xué)習(xí),在不直接理解環(huán)境的情況下,完成遍歷檢測(cè)點(diǎn)且全程無碰撞的目標(biāo),證明了本文采用的方法能夠保證巡檢機(jī)器人的自適應(yīng)能力。

    4 總結(jié)

    本文提出了一種基于強(qiáng)化學(xué)習(xí)的機(jī)器人巡檢路徑規(guī)劃算法。在強(qiáng)化學(xué)習(xí)框架下,提出了有效的策略學(xué)習(xí)模型和獎(jiǎng)勵(lì)函數(shù)。將超聲波傳感器所獲取的與障礙物的距離信息、機(jī)器人與檢測(cè)點(diǎn)的距離和機(jī)器人的動(dòng)作歷史等作為多層感知器神經(jīng)網(wǎng)絡(luò)的輸入,提出了相適應(yīng)的連續(xù)獎(jiǎng)勵(lì)函數(shù),使用近端策略優(yōu)化對(duì)學(xué)習(xí)模型進(jìn)行訓(xùn)練,實(shí)現(xiàn)對(duì)巡檢機(jī)器人左右兩輪的在線角速度最優(yōu)控制量進(jìn)行決策。最后,在OpenAI Gym環(huán)境中建立算法仿真環(huán)境,對(duì)巡檢機(jī)器人進(jìn)行仿真學(xué)習(xí)訓(xùn)練,仿真結(jié)果驗(yàn)證了本文算法能夠使得巡檢機(jī)器人實(shí)現(xiàn)遍歷檢測(cè)點(diǎn)和全程無碰撞的目標(biāo),并且具有較高的可泛化性。

    猜你喜歡
    檢測(cè)點(diǎn)神經(jīng)網(wǎng)絡(luò)距離
    核酸檢測(cè)點(diǎn)上,有最可愛的平江人
    騎馬做核酸
    神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
    電子制作(2019年19期)2019-11-23 08:42:00
    算距離
    飛行器FPGA檢測(cè)點(diǎn)優(yōu)化設(shè)置方法
    基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
    每次失敗都會(huì)距離成功更近一步
    山東青年(2016年3期)2016-02-28 14:25:55
    復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
    江西省綠色通道車輛貨物檢測(cè)點(diǎn)布點(diǎn)方案探討
    愛的距離
    母子健康(2015年1期)2015-02-28 11:21:33
    波多野结衣高清无吗| 亚洲中文字幕日韩| 丁香六月欧美| 成人18禁在线播放| 黄色丝袜av网址大全| 色尼玛亚洲综合影院| 九色国产91popny在线| 欧美日韩亚洲国产一区二区在线观看| 精品欧美一区二区三区在线| www.精华液| 亚洲第一电影网av| 亚洲在线自拍视频| 精品一区二区三区av网在线观看| 亚洲第一电影网av| 黄色毛片三级朝国网站| 99久久99久久久精品蜜桃| 久久 成人 亚洲| av电影中文网址| 午夜两性在线视频| 韩国精品一区二区三区| 老熟妇仑乱视频hdxx| 18禁观看日本| 最好的美女福利视频网| 午夜影院日韩av| 亚洲第一av免费看| 国产av一区二区精品久久| 99re在线观看精品视频| 美女高潮喷水抽搐中文字幕| a在线观看视频网站| 老司机午夜十八禁免费视频| 欧美日本视频| 人人妻人人澡欧美一区二区 | 亚洲色图 男人天堂 中文字幕| 免费久久久久久久精品成人欧美视频| av电影中文网址| av中文乱码字幕在线| 变态另类丝袜制服| 国产成人av教育| 欧美最黄视频在线播放免费| 亚洲全国av大片| 亚洲精品美女久久久久99蜜臀| 高清黄色对白视频在线免费看| 女人被狂操c到高潮| netflix在线观看网站| 18禁观看日本| 91av网站免费观看| 午夜久久久在线观看| 女性被躁到高潮视频| 欧美日本亚洲视频在线播放| 日韩欧美免费精品| 欧美成人免费av一区二区三区| 美国免费a级毛片| 亚洲美女黄片视频| 亚洲欧美一区二区三区黑人| 少妇的丰满在线观看| 91九色精品人成在线观看| 婷婷精品国产亚洲av在线| 亚洲中文av在线| 波多野结衣一区麻豆| 久久久久久久久免费视频了| 午夜视频精品福利| 亚洲狠狠婷婷综合久久图片| 国产单亲对白刺激| 亚洲色图av天堂| 久热这里只有精品99| 欧美在线一区亚洲| 欧美另类亚洲清纯唯美| 手机成人av网站| 国产又色又爽无遮挡免费看| 中国美女看黄片| 久久午夜综合久久蜜桃| 免费在线观看影片大全网站| 一区二区三区高清视频在线| 变态另类丝袜制服| 性少妇av在线| 超碰成人久久| 黄色女人牲交| tocl精华| 精品卡一卡二卡四卡免费| 神马国产精品三级电影在线观看 | 国产成年人精品一区二区| 亚洲人成电影观看| 国产人伦9x9x在线观看| 亚洲人成网站在线播放欧美日韩| 午夜免费观看网址| 久久香蕉激情| 9191精品国产免费久久| 精品久久久久久,| 亚洲无线在线观看| 国产单亲对白刺激| 国产精品亚洲一级av第二区| 一二三四社区在线视频社区8| 真人一进一出gif抽搐免费| 亚洲在线自拍视频| 女人高潮潮喷娇喘18禁视频| 国内毛片毛片毛片毛片毛片| 欧美一级毛片孕妇| 国产精品1区2区在线观看.| 午夜影院日韩av| 两个人视频免费观看高清| 狂野欧美激情性xxxx| 亚洲av五月六月丁香网| 99国产精品免费福利视频| 高清黄色对白视频在线免费看| √禁漫天堂资源中文www| 国产精品98久久久久久宅男小说| 欧美老熟妇乱子伦牲交| 女警被强在线播放| 亚洲一区二区三区不卡视频| 国产av一区二区精品久久| 大香蕉久久成人网| 久久 成人 亚洲| 人人妻人人澡欧美一区二区 | 一二三四在线观看免费中文在| 亚洲国产毛片av蜜桃av| 国产亚洲欧美在线一区二区| 一边摸一边抽搐一进一小说| aaaaa片日本免费| 亚洲情色 制服丝袜| 99久久99久久久精品蜜桃| 国产一区二区三区视频了| 亚洲国产精品999在线| 99精品欧美一区二区三区四区| 久久久水蜜桃国产精品网| 男女之事视频高清在线观看| 69精品国产乱码久久久| 欧美中文综合在线视频| netflix在线观看网站| 不卡一级毛片| 国产主播在线观看一区二区| 久久人妻福利社区极品人妻图片| 国产色视频综合| 成人18禁在线播放| 免费无遮挡裸体视频| 日本五十路高清| 精品乱码久久久久久99久播| 性色av乱码一区二区三区2| 中国美女看黄片| 大码成人一级视频| 欧美最黄视频在线播放免费| 在线观看66精品国产| 神马国产精品三级电影在线观看 | 天天一区二区日本电影三级 | www.www免费av| 少妇的丰满在线观看| 精品高清国产在线一区| 久久国产精品影院| 99re在线观看精品视频| av在线天堂中文字幕| 久久九九热精品免费| 国产精品一区二区在线不卡| 欧美 亚洲 国产 日韩一| 久久久久亚洲av毛片大全| 制服丝袜大香蕉在线| 大码成人一级视频| 成人特级黄色片久久久久久久| 变态另类丝袜制服| 国产成人啪精品午夜网站| 一级黄色大片毛片| 精品久久久久久久毛片微露脸| 成熟少妇高潮喷水视频| 999久久久国产精品视频| 欧美激情高清一区二区三区| 国产精品一区二区在线不卡| 波多野结衣av一区二区av| 午夜福利在线观看吧| 多毛熟女@视频| 久久香蕉精品热| 欧美日本中文国产一区发布| 精品日产1卡2卡| 亚洲精品在线美女| 日日干狠狠操夜夜爽| 久久久久精品国产欧美久久久| 亚洲精品国产区一区二| 51午夜福利影视在线观看| 久久午夜综合久久蜜桃| 精品人妻1区二区| 一个人观看的视频www高清免费观看 | 久久久久久免费高清国产稀缺| 十八禁网站免费在线| 久久久久久亚洲精品国产蜜桃av| 超碰成人久久| 久久狼人影院| 亚洲av第一区精品v没综合| 久99久视频精品免费| 午夜福利成人在线免费观看| 国产熟女xx| 12—13女人毛片做爰片一| 亚洲第一av免费看| 精品免费久久久久久久清纯| 女人被狂操c到高潮| 超碰成人久久| 亚洲精品一区av在线观看| 欧美日本中文国产一区发布| 国产亚洲av嫩草精品影院| 级片在线观看| 国产精品免费视频内射| 男人舔女人下体高潮全视频| 欧美日韩乱码在线| 咕卡用的链子| 国产精品综合久久久久久久免费 | 欧美成狂野欧美在线观看| aaaaa片日本免费| 777久久人妻少妇嫩草av网站| 欧美日本中文国产一区发布| 国内久久婷婷六月综合欲色啪| 亚洲成人久久性| 国产精品av久久久久免费| 大码成人一级视频| 人人妻,人人澡人人爽秒播| 老鸭窝网址在线观看| 日日摸夜夜添夜夜添小说| 国产xxxxx性猛交| 给我免费播放毛片高清在线观看| 一边摸一边抽搐一进一出视频| 亚洲成av片中文字幕在线观看| 国产单亲对白刺激| 韩国精品一区二区三区| 国产午夜精品久久久久久| 青草久久国产| 国产亚洲精品av在线| 精品人妻在线不人妻| 18禁黄网站禁片午夜丰满| 国产精品99久久99久久久不卡| 天堂√8在线中文| 后天国语完整版免费观看| 国产精品乱码一区二三区的特点 | 国产1区2区3区精品| 日韩欧美一区视频在线观看| 久久久久久亚洲精品国产蜜桃av| 精品电影一区二区在线| 禁无遮挡网站| www日本在线高清视频| 国产男靠女视频免费网站| 亚洲性夜色夜夜综合| 亚洲人成伊人成综合网2020| 91九色精品人成在线观看| 亚洲成人久久性| 女性生殖器流出的白浆| a级毛片在线看网站| 美女扒开内裤让男人捅视频| 日韩国内少妇激情av| 此物有八面人人有两片| av欧美777| 视频在线观看一区二区三区| 午夜老司机福利片| 日韩大尺度精品在线看网址 | 香蕉国产在线看| 久久午夜综合久久蜜桃| 久久久久久免费高清国产稀缺| 黄色视频不卡| 国产亚洲av嫩草精品影院| 高潮久久久久久久久久久不卡| 老熟妇仑乱视频hdxx| 琪琪午夜伦伦电影理论片6080| 国产精品秋霞免费鲁丝片| 丝袜美足系列| 久久人人97超碰香蕉20202| 淫秽高清视频在线观看| 久久这里只有精品19| 一级毛片精品| 波多野结衣高清无吗| 男女之事视频高清在线观看| 女人被狂操c到高潮| 美女国产高潮福利片在线看| 免费少妇av软件| 亚洲av电影在线进入| e午夜精品久久久久久久| 国产伦一二天堂av在线观看| av中文乱码字幕在线| 日韩欧美免费精品| 欧美成人免费av一区二区三区| 曰老女人黄片| 国产精品,欧美在线| 老鸭窝网址在线观看| 91老司机精品| 免费在线观看影片大全网站| or卡值多少钱| 自拍欧美九色日韩亚洲蝌蚪91| 欧美不卡视频在线免费观看 | 九色国产91popny在线| 国产欧美日韩一区二区三区在线| 国产黄a三级三级三级人| 波多野结衣一区麻豆| 9191精品国产免费久久| 国产在线观看jvid| 久久人妻福利社区极品人妻图片| 一卡2卡三卡四卡精品乱码亚洲| av免费在线观看网站| 日韩欧美三级三区| 久久久国产成人免费| 亚洲国产欧美网| 国产精品久久久av美女十八| 最近最新免费中文字幕在线| 91老司机精品| 97人妻精品一区二区三区麻豆 | 亚洲成a人片在线一区二区| 中文亚洲av片在线观看爽| 国产一区二区三区在线臀色熟女| 亚洲 欧美一区二区三区| 久久狼人影院| 成人三级做爰电影| 在线视频色国产色| 两人在一起打扑克的视频| 麻豆久久精品国产亚洲av| av超薄肉色丝袜交足视频| 国产伦一二天堂av在线观看| 久久中文字幕一级| 一本综合久久免费| 免费看美女性在线毛片视频| 成人永久免费在线观看视频| 美女高潮喷水抽搐中文字幕| 精品久久久久久久久久免费视频| 美女高潮喷水抽搐中文字幕| 国产在线精品亚洲第一网站| 深夜精品福利| 国内精品久久久久精免费| 国产91精品成人一区二区三区| 亚洲精品国产一区二区精华液| 男女午夜视频在线观看| 最新在线观看一区二区三区| 亚洲美女黄片视频| 狂野欧美激情性xxxx| 女人高潮潮喷娇喘18禁视频| 女人精品久久久久毛片| 岛国在线观看网站| 亚洲第一青青草原| 夜夜夜夜夜久久久久| 中文亚洲av片在线观看爽| 中文字幕人妻丝袜一区二区| 99久久国产精品久久久| 欧美 亚洲 国产 日韩一| 在线免费观看的www视频| 69av精品久久久久久| 久久久久精品国产欧美久久久| 国产欧美日韩一区二区三区在线| 午夜亚洲福利在线播放| 久久人妻av系列| 国产欧美日韩一区二区精品| xxx96com| 伊人久久大香线蕉亚洲五| 人成视频在线观看免费观看| 国产在线精品亚洲第一网站| 亚洲自拍偷在线| 大香蕉久久成人网| 午夜福利影视在线免费观看| 国产av一区二区精品久久| 国产麻豆成人av免费视频| 777久久人妻少妇嫩草av网站| 99国产综合亚洲精品| 两个人看的免费小视频| 亚洲成人久久性| av天堂久久9| 9191精品国产免费久久| 美女免费视频网站| 国产精品av久久久久免费| 久久草成人影院| 国产亚洲av高清不卡| 一个人免费在线观看的高清视频| 国产精品 欧美亚洲| 久久婷婷成人综合色麻豆| 满18在线观看网站| 亚洲午夜理论影院| 午夜福利免费观看在线| 亚洲情色 制服丝袜| 99热只有精品国产| 操美女的视频在线观看| 少妇粗大呻吟视频| 中国美女看黄片| 久久国产精品影院| 给我免费播放毛片高清在线观看| 丝袜在线中文字幕| 国产成人av教育| 久久欧美精品欧美久久欧美| 女人精品久久久久毛片| 欧美在线黄色| 国内久久婷婷六月综合欲色啪| 国产免费av片在线观看野外av| 自拍欧美九色日韩亚洲蝌蚪91| 中文字幕人成人乱码亚洲影| 国产精品 欧美亚洲| 两个人免费观看高清视频| 免费久久久久久久精品成人欧美视频| 他把我摸到了高潮在线观看| 黄色a级毛片大全视频| 久久精品影院6| 日日摸夜夜添夜夜添小说| 国产精品日韩av在线免费观看 | 精品人妻在线不人妻| 丰满人妻熟妇乱又伦精品不卡| 涩涩av久久男人的天堂| 在线观看日韩欧美| 悠悠久久av| 男人操女人黄网站| av免费在线观看网站| 亚洲狠狠婷婷综合久久图片| 欧美 亚洲 国产 日韩一| av视频在线观看入口| 国产乱人伦免费视频| 在线观看午夜福利视频| 黄色 视频免费看| 日韩高清综合在线| 国产一级毛片七仙女欲春2 | 一级毛片高清免费大全| 久久中文字幕一级| 成年版毛片免费区| 桃红色精品国产亚洲av| 午夜精品国产一区二区电影| 很黄的视频免费| 亚洲成人精品中文字幕电影| 欧美中文综合在线视频| 美女高潮喷水抽搐中文字幕| 国产aⅴ精品一区二区三区波| 97人妻精品一区二区三区麻豆 | 看免费av毛片| 亚洲精品一区av在线观看| 桃红色精品国产亚洲av| 欧美日韩瑟瑟在线播放| 欧美日韩中文字幕国产精品一区二区三区 | 母亲3免费完整高清在线观看| 怎么达到女性高潮| АⅤ资源中文在线天堂| 久久久久久久久中文| or卡值多少钱| 亚洲一区中文字幕在线| 大香蕉久久成人网| 伊人久久大香线蕉亚洲五| 最新在线观看一区二区三区| 国产主播在线观看一区二区| 校园春色视频在线观看| 亚洲 国产 在线| 母亲3免费完整高清在线观看| 男男h啪啪无遮挡| 国产私拍福利视频在线观看| 国产单亲对白刺激| 久久久久亚洲av毛片大全| 免费在线观看黄色视频的| 妹子高潮喷水视频| 99国产精品一区二区蜜桃av| 欧美日本视频| 国产精品日韩av在线免费观看 | 18禁国产床啪视频网站| 日本撒尿小便嘘嘘汇集6| 99久久久亚洲精品蜜臀av| 母亲3免费完整高清在线观看| 精品日产1卡2卡| 国产av一区二区精品久久| 亚洲在线自拍视频| 国产精品自产拍在线观看55亚洲| 亚洲av五月六月丁香网| 香蕉国产在线看| 97碰自拍视频| 欧美日韩亚洲国产一区二区在线观看| 岛国视频午夜一区免费看| 国产1区2区3区精品| 日韩欧美免费精品| 又紧又爽又黄一区二区| 操出白浆在线播放| 在线观看免费视频网站a站| 成人三级做爰电影| 欧美在线黄色| 欧美中文综合在线视频| 波多野结衣巨乳人妻| 搡老岳熟女国产| 深夜精品福利| 久久人人爽av亚洲精品天堂| 精品第一国产精品| 岛国视频午夜一区免费看| 午夜精品久久久久久毛片777| 天天一区二区日本电影三级 | 国产人伦9x9x在线观看| 欧美老熟妇乱子伦牲交| 国内精品久久久久精免费| 亚洲男人天堂网一区| 亚洲欧洲精品一区二区精品久久久| 免费少妇av软件| 91麻豆av在线| 国产成人系列免费观看| 亚洲无线在线观看| 国内精品久久久久久久电影| 国产男靠女视频免费网站| 欧美成狂野欧美在线观看| 变态另类成人亚洲欧美熟女 | 亚洲一区二区三区不卡视频| 成在线人永久免费视频| 黑人操中国人逼视频| 国产精品精品国产色婷婷| netflix在线观看网站| 亚洲熟妇熟女久久| 午夜精品在线福利| 999精品在线视频| 如日韩欧美国产精品一区二区三区| 久久国产精品影院| 亚洲成a人片在线一区二区| 亚洲中文字幕日韩| a在线观看视频网站| 美女国产高潮福利片在线看| 国产高清有码在线观看视频 | 女人精品久久久久毛片| 欧美午夜高清在线| 国产亚洲精品综合一区在线观看 | 老司机靠b影院| 久久人妻福利社区极品人妻图片| а√天堂www在线а√下载| 一级毛片女人18水好多| 天天躁狠狠躁夜夜躁狠狠躁| 国产精品美女特级片免费视频播放器 | 亚洲av第一区精品v没综合| 9色porny在线观看| 欧美黄色片欧美黄色片| 欧美一级毛片孕妇| 两个人免费观看高清视频| 精品第一国产精品| 精品国产乱码久久久久久男人| 国产视频一区二区在线看| 国内精品久久久久久久电影| 在线永久观看黄色视频| 国产成人av激情在线播放| 日韩欧美免费精品| 国产99白浆流出| www国产在线视频色| 深夜精品福利| 老司机深夜福利视频在线观看| 国产精华一区二区三区| 在线视频色国产色| 欧美一级a爱片免费观看看 | 亚洲精品美女久久av网站| 亚洲最大成人中文| 中文字幕人妻熟女乱码| 国产不卡一卡二| 人人澡人人妻人| 制服丝袜大香蕉在线| 亚洲精品在线美女| 91麻豆av在线| 亚洲精品粉嫩美女一区| 久久久久国产精品人妻aⅴ院| 久久久国产成人免费| 国产不卡一卡二| 一级毛片精品| a级毛片在线看网站| 亚洲av成人不卡在线观看播放网| 国产国语露脸激情在线看| 久久精品国产亚洲av香蕉五月| 成人亚洲精品av一区二区| 国产一区二区在线av高清观看| 亚洲va日本ⅴa欧美va伊人久久| 国产欧美日韩一区二区精品| 一a级毛片在线观看| 丁香六月欧美| 18美女黄网站色大片免费观看| 亚洲伊人色综图| 国产aⅴ精品一区二区三区波| 久久人妻福利社区极品人妻图片| 国产99白浆流出| 99久久综合精品五月天人人| 亚洲精品国产精品久久久不卡| 欧美精品啪啪一区二区三区| 免费在线观看黄色视频的| 久久婷婷人人爽人人干人人爱 | 亚洲欧美一区二区三区黑人| 国产亚洲av高清不卡| 69精品国产乱码久久久| 亚洲精品在线观看二区| 色av中文字幕| 亚洲激情在线av| 精品久久久久久久人妻蜜臀av | 久久久久久亚洲精品国产蜜桃av| 一级a爱片免费观看的视频| 欧洲精品卡2卡3卡4卡5卡区| 国产成年人精品一区二区| 免费观看精品视频网站| 19禁男女啪啪无遮挡网站| 看片在线看免费视频| 免费看美女性在线毛片视频| 曰老女人黄片| 黄片大片在线免费观看| 18禁观看日本| 性欧美人与动物交配| 精品一品国产午夜福利视频| 欧美久久黑人一区二区| 亚洲精品中文字幕一二三四区| 妹子高潮喷水视频| 亚洲男人的天堂狠狠| 国产一区二区三区在线臀色熟女| 激情视频va一区二区三区| 国产成人欧美在线观看| 国产精品九九99| 亚洲午夜精品一区,二区,三区| 中文字幕人妻熟女乱码| 色综合亚洲欧美另类图片| 一本大道久久a久久精品| 中文字幕人妻熟女乱码| 欧美午夜高清在线| 欧美性长视频在线观看| 人人妻人人澡人人看| 一区福利在线观看| 天堂影院成人在线观看| 女性生殖器流出的白浆| 在线十欧美十亚洲十日本专区| 亚洲国产精品成人综合色| 黄色 视频免费看| 十分钟在线观看高清视频www| 国产免费av片在线观看野外av| 国产成人免费无遮挡视频| 国内毛片毛片毛片毛片毛片| 欧美日韩瑟瑟在线播放| 真人一进一出gif抽搐免费| 波多野结衣av一区二区av| 欧美国产日韩亚洲一区| 国产午夜精品久久久久久| 精品欧美国产一区二区三| 欧美绝顶高潮抽搐喷水| 亚洲欧美一区二区三区黑人| 精品少妇一区二区三区视频日本电影| 两性夫妻黄色片|