• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于深度強化學習帶時間窗的綠色車輛路徑問題研究

    2024-10-11 00:00:00
    物流科技 2024年19期

    摘 要:如何在客戶規(guī)定的時間內(nèi)合理安排車輛運輸路線,一直是物流領域亟待解決的問題?;诖耍恼绿岢鍪褂没谲浉虏呗缘臎Q斗雙重深度Q網(wǎng)絡(Dueling Double Deep Q-network, D3QN),設計動作空間、狀態(tài)空間與獎勵函數(shù),對帶時間窗的綠色車輛路徑問題進行建模與求解。選擇了小、中、大規(guī)模的總計18個算例,將三種算法的實驗結(jié)果在平均獎勵、平均調(diào)度車輛數(shù)、平均里程和運算時間四個維度進行比較。實驗結(jié)果表明:在大多數(shù)算例中,與Double DQN和Dueling DQN相比,D3QN能在可接受的增加時間范圍內(nèi),獲得更高的獎勵函數(shù),調(diào)度更少的車輛數(shù),運輸更短的里程,實現(xiàn)綠色調(diào)度的目標。

    關鍵詞:深度強化學習;路徑優(yōu)化;決斗雙重深度Q網(wǎng)絡;D3QN算法;車輛路徑問題

    中圖分類號:U116.2 文獻標志碼:A DOI:10.13714/j.cnki.1002-3100.2024.19.017

    Abstract: How to reasonably arrange vehicle transportation routes within the time specified by customers has always been an urgent problem in the field of logistics. Based on this, this paper proposes to use Dueling Double Deep Q-network(D3QN)based on soft update strategy to design action space, state space and reward function to model and solve the green vehicle routing problem with time window. A total of 18 small, medium and large scale examples are selected, and the experimental results of the three algorithms are compared in four dimensions: Average reward, average number of scheduled vehicles, average mileage and operation time. The experimental results show that, in most examples, compared with Double DQN and Dueling DQN, D3QN can obtain higher reward function, dispatch fewer vehicles, transport shorter mileage, and achieve the goal of green dispatch within the range of acceptable increase in time.

    Key words: deep reinforcement learning; path optimization; Dueling Double Deep Q network; D3QN algorithm; vehicle routing problem

    0 引 言

    帶時間窗的車輛路徑問題(Vehicle Routing Problems with Time Windows,VRPTW)是指在時間窗口約束下,將一定數(shù)量的配送或服務點分配給若干個車輛,使得所有配送或服務點被訪問一次,并滿足各車輛容量約束條件的配送路徑問題。VRPTW問題最早可以追溯到20世紀70年代末和80年代初,它通常基于圖論建立數(shù)學模型,是一個典型的NP-hard問題。

    隨著計算機算力的提升,深度學習算法逐步用于解決實際問題。2013年,Mnih et al.[1]首次提出了深度Q網(wǎng)絡(Deep Q

    -network)模型,該模型是一個卷積神經(jīng)網(wǎng)絡,用Q學習的變體訓練,成功地直接從高維感覺輸入中學習控制策略。2016年,Silver et al.[2]將深度強化學習算法運用到圍棋游戲中,并且引入了蒙特卡洛樹搜索法。在此算法的基礎上,他們編寫了程序AlphaGo。同年3月,AlphaGo以4比1的總比分戰(zhàn)勝了圍棋世界冠軍李世石,成為第一個直接擊敗人類選手的人工智能機器人。由于傳統(tǒng)的Q學習算法在某些情況下會高估動作值,從而使得整體的決策無法達到最優(yōu),Hasselt et al.[3]提出了深度雙Q網(wǎng)絡(Double DQN, DDQN)算法。Wang et al.[4]提出了對決深度Q網(wǎng)絡(Dueling DQN)算法,這種算法能夠更準確地估計狀態(tài)的價值,區(qū)分不同動作的重要性。

    強化學習的經(jīng)典算法包括深度Q網(wǎng)絡,在此基礎上又衍生出了深度雙Q網(wǎng)絡,決斗深度Q網(wǎng)絡和決斗雙重深度Q網(wǎng)絡等。決斗雙重深度Q網(wǎng)絡作為前兩者算法的演化與升級,在其他領域取得了優(yōu)于前二者算法的表現(xiàn)。袁帥等[5]借助帶經(jīng)驗回放機制的D3QN算法,實現(xiàn)移動機器人在未知環(huán)境中更好地獲取最優(yōu)路徑。在收斂速度方面,相比DQN提升了56%。韓磊等[6]使用改進的D3QN算法,提升了可變限速控制策略的靈活性。此外,也有學者將強化學習的方法運用到經(jīng)典的路徑優(yōu)化問題中。Kool et al.[7]使用借助基于注意力機制和指針網(wǎng)絡的強化學習解決旅行社問題,其結(jié)果接近其他專業(yè)算法。Nazari et al.[8]提出了一個端到端的強化學習框架來解決車輛路徑問題,該模型僅通過觀察獎勵信號并遵循可行性規(guī)則,就可以從給定分布中采樣問題實例找到接近最優(yōu)的解決方案。其計算質(zhì)量優(yōu)于經(jīng)典的啟發(fā)式方法和Google的OR-Tools,并且計算時間相當。Lin et al.[9]運用深度強化學習研究電動汽車車隊的路徑優(yōu)化問題,所提出的模型能夠有效解決現(xiàn)有方法難以求解的大規(guī)模調(diào)度問題。

    帶時間窗的車輛路徑問題作為一個經(jīng)典的物流領域調(diào)度規(guī)劃問題,不少學者使用精確式算法、近似算法對該問題及其變種問題進行建模和求解。隨著環(huán)保理念的深入,學者們對考慮環(huán)境影響、碳排放的車輛路徑優(yōu)化問題也逐漸深入,車輛路徑優(yōu)化問題逐漸向著綠色調(diào)度的方向發(fā)展。

    此外,隨著人工智能技術的發(fā)展,強化學習的方法逐步運用到路徑優(yōu)化問題的求解中,并且取得了一定的成效。以往的研究往往借助基礎的深度Q網(wǎng)絡,對VRPTW問題進行求解,該方法容易造成對Q值的高估,從而降低訓練的質(zhì)量。雙重深度Q網(wǎng)絡算法作為一種新興的算法,在解決此類問題上仍然有較大的潛力。傳統(tǒng)的深度Q網(wǎng)絡使用的是硬更新的方式對目標網(wǎng)絡進行更新。本文運用了基于策略的深度強化學習方法中的參數(shù)更新方式,使用基于軟更新策略的決斗雙重深度Q網(wǎng)絡算法,定義狀態(tài)空間、動作空間和獎勵函數(shù),借助算法的智能體決策解決帶時間窗的運輸問題,驗證了該算法在解決帶時間窗的綠色車輛路徑問題上的有效性。

    1 算法概述

    1.1 深度雙Q網(wǎng)絡與競爭深度Q網(wǎng)絡

    在原始的DQN算法中,由于原始算法采用的是新策略的方法,容易出現(xiàn)Q值估計偏高的情形。算法每次在學習時,不是使用下一次交互使用的真實動作,而是使用當前策略認為的價值最大的動作,產(chǎn)生最大化偏差,使得估計動作的Q值偏大。

    為了解決這個問題,將動作選擇和價值估計進行解耦,Hasselt等提出了深度雙Q網(wǎng)絡。DDQN算法相較于DQN算法,改變了目標值的計算方法,這使得訓練過程更加穩(wěn)定,能夠有效地解決后者對于動作價值的高估問題,提高了算法的收斂性和性能。

    DDQN基于經(jīng)驗回放機制與目標網(wǎng)絡技巧,構建兩個動作價值神經(jīng)網(wǎng)絡,一個用于估計動作,另外一個用于估計該動作的價值。DDQN算法不直接通過最大化的方式選取目標網(wǎng)絡計算的所有可能Q值,而是首先通過評估網(wǎng)絡選取最大Q值對應的動作。

    接著,再將評估網(wǎng)絡選擇出的動作a,輸入目標網(wǎng)絡計算目標值:

    式中:y表示目標值,w表示評估網(wǎng)絡參數(shù),w表示目標網(wǎng)絡參數(shù)。

    Dueling DQN算法是傳統(tǒng)DQN的一個拓展,它包含了一種新的神經(jīng)網(wǎng)絡結(jié)構——競爭網(wǎng)絡(Duel Network)。Dueling DQN通過引入一個基準網(wǎng)絡和一個優(yōu)勢網(wǎng)絡,將值函數(shù)的估計分解為狀態(tài)值和動作優(yōu)勢。狀態(tài)值表示在給定狀態(tài)下的期望回報,而動作優(yōu)勢表示每個動作相對于平均值的優(yōu)劣程度。通過這種分解,Dueling DQN可以將注意力集中在對狀態(tài)值的學習上,而無需為每個動作單獨計算值。這使得算法更加高效,并且能夠更好地處理動作空間較大的環(huán)境。Dueling DQN的評估網(wǎng)絡結(jié)構如下:

    式中:V為最優(yōu)狀態(tài)價值函數(shù),A為最優(yōu)優(yōu)勢函數(shù),第三項為在動作a平均取值情況下的優(yōu)勢函數(shù),一般為0。

    1.2 軟更新策略的決斗雙重深度Q網(wǎng)絡

    決斗雙重深度Q網(wǎng)絡(D3QN)結(jié)合了Double DQN和Dueling DQN算法的思想,進一步提升了算法的性能,是二者的演化與升級。它與Dueling DQN算法的唯一區(qū)別在于計算目標值的方式,其目標網(wǎng)絡計算方式借鑒了Double DQN的思想,即利用評估網(wǎng)絡獲取s狀態(tài)下最優(yōu)動作價值對應的動作,然后利用目標網(wǎng)絡計算該動作的動作價值,從而得到目標值。

    本文使用基于軟更新策略的D3QN來解決VRPTW問題。D3QN的目標網(wǎng)絡與評估網(wǎng)絡的模型和參數(shù)完全一致。這兩個網(wǎng)絡的更新方式包括硬更新和軟更新,本文采取軟更新的方式對評估網(wǎng)絡的參數(shù)進行更新。評估網(wǎng)絡的參數(shù)每更新迭代一次,目標網(wǎng)絡的參數(shù)也會隨之更新。軟更新通過在每次更新時將一小部分評估網(wǎng)絡的參數(shù)與目標網(wǎng)絡的參數(shù)進行混合,從而使目標網(wǎng)絡的更新過程平滑化。這種混合比例由超參數(shù)tau控制。具體更新公式如下:

    w=tau*w+1-tau*w (4)

    軟更新可以減輕強化學習算法中的不穩(wěn)定性問題。盡管相比于硬更新,其學習速度可能相對較慢,但如軟更新在訓練過程中提供了一種平滑的、逐漸更新的方式,更能增加算法的穩(wěn)定性。

    2 帶時間窗的綠色車輛路徑問題描述

    2.1 問題描述

    本文所研究的帶時間窗的綠色車輛路徑問題,在規(guī)劃路線過程中考慮了環(huán)境保護和可持續(xù)性的因素,旨在最小化運輸成本的同時,減少運輸過程中的碳排放。綠色車輛問題的優(yōu)化可以通過車輛調(diào)度和路徑規(guī)劃、車輛種類的選擇以及燃料消耗等方面實現(xiàn),降低對環(huán)境的影響[10]。在本文的模型中,所有的配送車輛被認為是相同的,因此,它們的排放量也相同。對于綠色車輛路徑問題,本文的攻克重點放在車輛的調(diào)度數(shù)量和路線的距離上。車輛啟動所排放的二氧化碳量是固定的,因此,調(diào)度越少的車輛,服務單位客戶的碳排放越低?;诖?,本文模型的優(yōu)化目標為:首先實現(xiàn)調(diào)度車輛數(shù)量最小化,其次實現(xiàn)運輸路線距離最小化,以期實現(xiàn)對環(huán)境的最小影響。獎勵與懲罰函數(shù)的設置也關系到模型的優(yōu)劣程度。本文對于車輛的調(diào)度成本設置為120個單位,而服務單個客戶的成本為90個單位。對于智能體而言,需要服務至少兩個客戶,才能實現(xiàn)正收益,進一步保證了運輸?shù)挠行院驼{(diào)度的綠色性。

    VRPTW問題的模型目標為:設計一組使總成本最小化的路線,首先最小化調(diào)度車輛數(shù),其次最小化總運輸距離。該問題的其他調(diào)度規(guī)則有:

    每一個顧客僅服務一次;

    每一條路線從0節(jié)點開始,到n+1節(jié)點結(jié)束;

    能夠?qū)崟r觀測到客戶的時間窗,車輛的容量限制;

    車輛在節(jié)點之間的移動距離在數(shù)值上等同于移動所花費的時間。

    VRPTW問題的模型如下:

    式(5)為目標函數(shù),表明模型的目標是最小化總運輸成本。式(6)確保每一個客戶僅被訪問一次。式(7)表明單一車輛的運輸上限為它的容量上限。式(8)、式(9)和式(10)表明單一運輸車輛必須從車庫0出發(fā),在服務客戶后,最終回到車庫節(jié)點n+1。式(11)建立了從上一個客戶到下一個客戶的車輛離開時間的關系。式(12)確保車輛服務時間在顧客的時間窗內(nèi)。式(13)表明x為一個決策變量,保證單個車輛服務對應的客戶。式(14)規(guī)定了多個變量的取值范圍。

    2.2 D3QN求解目標問題

    使用D3QN算法求解帶時間窗的綠色車輛路徑問題,需要對算法的狀態(tài)空間與動作空間、獎勵函數(shù)兩個方面進行重新設計。本節(jié)也從這兩各方面進行介紹。

    狀態(tài)空間與動作空間方面,本文的狀態(tài)空間指的是將車輛進行調(diào)度,服務顧客的過程中所處狀態(tài)的集合。在本文問題中,車輛的狀態(tài)為訪問顧客的序列,長度為n。本文定義:在一輛車出發(fā)后,服務顧客,最終回到倉庫時,車輛的坐標更新,容量重置為初始容量,調(diào)度時間歸零,調(diào)度車輛序號增加1。

    本文的動作空間定義為:將訪問序列輸入神經(jīng)網(wǎng)絡D60+iQ6532T6fe0KTWa+RohNF66HWZiwyOj1lIJa4os=,與環(huán)境進行交互所得到新的訪問序列。動作空間的維度也為n,它會隨著訓練集中顧客數(shù)量的增加而增加。神經(jīng)網(wǎng)絡輸出層輸出的是采取動作a的情況下,進入下一個狀態(tài)s可能選擇的各種動作所對應的Q值大小。車輛將持續(xù)選擇Q值最大的動作,更新位置與獎勵。神經(jīng)網(wǎng)絡結(jié)構如圖1所示。

    車輛狀態(tài)輸入神經(jīng)網(wǎng)絡后,通過ReLU函數(shù)激活(見圖2),傳遞給下一個隱藏層或輸出層。當車輛容量無法滿足下一個顧客的需求,或是獎勵過小時,車輛將直接返回倉庫(0號節(jié)點),并調(diào)度下一輛車進行服務。

    車輛每進行一次服務,將更新一次車輛移動的總距離,進行一次獎勵函數(shù)的計算和累計,更新一次車輛的服務順序序列,更新一次車內(nèi)的剩余容量。

    獎勵函數(shù)的設置方面,深度強化學習的目標是最大化累計獎勵。獎勵函數(shù)的設置會影響到模型的學習效果。本文模型的實現(xiàn)目標為:首先實現(xiàn)調(diào)度車輛數(shù)量最小化,其次實現(xiàn)總運輸距離最小化。前者的優(yōu)先級要高于后者。基于這個原則,智能體在訓練過程中調(diào)用的車輛越多,調(diào)度成本越高,懲罰應當越大;所有車輛運輸?shù)目偩嚯x越短,獎勵越大。這兩個部分作為公式的第一項和第二項,以負整數(shù)的形式表示。由于在本模型中,車輛行駛距離長短的數(shù)值等同于所花費的時間,因此,車輛的行駛距離越短,也意味著所花費的時間越少。在公式的第三項中,車輛每服務一個客戶,進行一次固定的獎勵。

    本文研究問題的時間窗為硬時間窗,即車輛只能在規(guī)定時間內(nèi)為客戶服務。因此,提前到達客戶地點的車輛,需要等待到客戶的服務時間窗,才能進行服務,對于這部分車輛,不進行懲罰。

    因此,將D3QN的累計獎勵函數(shù)設置為三部分之和,具體公式如下:

    R=-c-cx+nβ (15)

    式中:c為調(diào)用單位車輛的固定成本,對于所有車輛來說,它們的固定成本是一樣的。β為一個正整數(shù),根據(jù)本文的算例和不斷實驗調(diào)整得到。在本文的算例中,設置β為90。

    2.3 研究與算法流程

    本文的研究流程如圖3所示。

    本文算法的偽代碼如表1所示。

    3 算法訓練

    3.1 算法模型與參數(shù)設置

    本文應用算法為基于軟更新策略的決斗雙重深度Q網(wǎng)絡,基于Python3.9語言與Pytorch1.13框架實現(xiàn),配置12th Gen Intel(R)Core(TM)i9-12900H 2.50 GHz,RAM 16.0GB。VRPTW模型借助Python中的gym庫進行編譯。

    探索策略方面,本文使用ε-貪心策略(epsilon-greedy)來對目標問題進行求解。

    式中:ε為一個小于1的正數(shù),P=ε表示算法以ε的概率隨機選擇動作空間的動作,P=1-ε表示算法以1-ε的概率選擇當前時間步內(nèi)價值最大的動作作為下個時間步要執(zhí)行的動作。

    算法方面,D3QN的評估網(wǎng)絡共有四層網(wǎng)絡結(jié)構。算法的第一層為輸入層,共有四個輸入維度,分別是:當前車輛所在節(jié)點的序號、車內(nèi)的實時容量、當前的時間以及當前調(diào)度車輛的序號。算法的第二層、第三層和第四層為隱藏層,它們都是有128個神經(jīng)元結(jié)點的全連接層,使用ReLU函數(shù)進行激活。算法的第五層為輸出層,輸出層輸出的是對于各個動作的價值評估,輸出維度會隨著客戶數(shù)量的變化而變化。根據(jù)各個動作的價值,智能體選擇價值最高的動作采取下一步的行動。本文使用Adam優(yōu)化器進行梯度下降法的求解。

    D3QN算法的超參數(shù)設置如表2所示。

    模型方面,借助gym庫,構建了VRPTW模型的虛擬環(huán)境,以便接入強化學習算法中進行訓練。本文選擇了客戶數(shù)量分別為10、20和50的多個數(shù)據(jù)集,分別代表小規(guī)模,中規(guī)模和大規(guī)模調(diào)度問題,以便驗證算法在不同規(guī)模上的性能。越大規(guī)模的問題,智能體獲得獎勵的函數(shù)趨近收斂所需要的實驗迭代次數(shù)越多。因此,針對不同規(guī)模的調(diào)度問題,本文也設置了不同的約束和實驗的迭代次數(shù)。模型的部分超參數(shù)如表3所示。

    至此,本文的模型已經(jīng)構建完畢。

    3.2 實驗與分析

    本文選擇了Double DQN以及Dueling DQN算法,將它們與D3QN算法在不同問題規(guī)模的數(shù)據(jù)集上進行對比實驗,以檢驗D3QN算法在解決此類問題上的優(yōu)越性。

    在表4所展示的18個不同規(guī)模的實驗結(jié)果中,有14個實例中,D3QN取得了最高的獎勵,占總實驗次數(shù)的77.8%。由于本文實驗的研究目標為:首先最小化調(diào)度車輛數(shù)量,其次最小化運輸距離。因此,基于研究問題的綠色性原則,取得最高獎勵的實驗案例,運輸里程未必最短。將三種算法在不同規(guī)模實例下的實驗結(jié)果進行平均取值,具體結(jié)果如圖4所示:

    從圖4發(fā)現(xiàn):在平均最高獎勵方面,D3QN算法比Double DQN高5.45%,比Dueling DQN高11.27%;在平均車輛調(diào)度數(shù)方面,D3QN算法比Double DQN低3.34%,比Dueling DQN低6.17%;在平均里程方面,D3QN算法比Double DQN低2.93%,比Dueling DQN低5.38%。

    此外,本文還對實驗的總運算時間和收斂時的迭代次數(shù)兩個變量進行了統(tǒng)計,具體結(jié)果如表5所示:

    ?; 本文分別設置模型規(guī)模為10、20、50的算例的總迭代次數(shù)為100、200和300次??傮w而言,三種算法總運算時間較短,收斂時的迭代次數(shù)較快。將統(tǒng)計數(shù)據(jù)進行平均取值,具體結(jié)果展示如圖5所示。

    從圖5中發(fā)現(xiàn):在平均總運算時間方面,D3QN比Double DQN多7.71%,絕對值為0.13s,比Dueling DQN多4.35%,絕對值為0.08s;在平均收斂迭代次數(shù)方面,D3QN比Double DQN少36.17%,比Dueling DQN少35.16%。造成這種結(jié)果的原因可能是算法的結(jié)構不同。D3QN算法作為后兩者算法的組合,其計算復雜度要更高,因而會耗費更長的時間。但是,從絕對數(shù)值的角度分析,D3QN多增加的運算時間平均保持在0.15s內(nèi),在實際應用中處于可接受范圍內(nèi)。此外,由于D3QN算法比后兩者算法收斂速度要快,因此,在減少相同迭代次數(shù)的情況下,D3QN算法會比后兩者算法花費更少的時間收斂。

    圖6展示了在客戶為50個的問題下,以C204數(shù)據(jù)進行實驗的三種算法的獎勵變化、調(diào)度車輛變化以及里程的變化。為了更直觀地展示實驗效果,本文設置實驗次數(shù)為150輪。在前40輪中,D3QN算法最高獎勵的上升速度較快,并且最先收斂。在此實例的實驗中,三種算法所得到的最高獎勵值接近,且用時均在2s以內(nèi)。在圖6(c)中,里程變化是上下波動的,因為調(diào)度車輛的減少可能導致獎勵值和運輸里程的增加。這也印證了本文研究問題的綠色性。

    通過上述表格以及圖,得出結(jié)論:在可接受的增加運算時間的情況下,基于軟更新策略的D3QN算法相比于Double DQN和Dueling DQN算法能更快的收斂,得出更優(yōu)的解。在帶時間窗的綠色車輛路徑優(yōu)化問題中,D3QN算法相比于后兩者算法更具備優(yōu)越性。前者在算法層面結(jié)合了后者的優(yōu)點。由于強化學習算法的探索具有一定的隨機性,算法的表現(xiàn)基于不同的算例可能有差異。同時,算法的表現(xiàn)也受到實驗參數(shù)、獎勵函數(shù)、訓練次數(shù)和深度以及計算機性能等方面因素的影響。隨著這些因素的不斷調(diào)整與優(yōu)化,算法的表現(xiàn)也會越來越好。

    4 結(jié)論與展望

    本文使用基于軟更新策略的D3QN算法對帶時間窗的綠色車輛路徑問題進行研究,將車輛的調(diào)度問題轉(zhuǎn)化成顧客訪問的排序問題;通過設置獎勵函數(shù),優(yōu)先實現(xiàn)最小化調(diào)度車輛的目標,保證運輸?shù)木G色低碳;借助Python中的gym庫,使算法的智能體與環(huán)境進行交互,重新規(guī)劃序列。D3QN算法結(jié)合了Double DQN和Dueling DQN算法的技巧。在大部分算例中,D3QN算法在此類問題上的表現(xiàn)要優(yōu)于這二者,能更快地尋找到更優(yōu)質(zhì)量的解。

    本文的主要貢獻如下:

    (1)使用D3QN算法為帶時間窗的綠色車輛路徑問題設計了相應的動作空間與狀態(tài)空間和獎勵函數(shù),能夠較好地將問題轉(zhuǎn)化為強化學習中智能體的運算與迭代。

    (2)使用軟更新的策略對D3QN算法的評估網(wǎng)絡參數(shù)進行更新,能保證算法的穩(wěn)定性和收斂性。

    (3)在小、中、大的共18個數(shù)據(jù)集上進行了實驗,將Double DQN與Dueling DQN作為對比,驗證了D3QN算法的有效性。

    綜上所述,D3QN算法在解決VRPTW問題上仍然有較大的潛力。隨著模型的優(yōu)化和計算機算力的提升,該算法的性能也會進一步提升。

    參考文獻:

    [1] MNIH V, KAVUKCUOGLU K, SILVER D, et al. Playing atari with deep reinforcement learning[EB/OL]. (2021-12-19)[2023-09-20]. https://arXiv.org/pdf/1312.5602.pdf.

    [2] SILVER D, HUANG A, MADDISON C, et al. Mastering the game of go with deep neural networks and tree search[J]. Nature, 2016,529:484-489.

    [3] VAN HASSELT H, GUEZ A, SILVER D. Deep reinforcement learning with double q-learning[C] // Proceedings of the AAAI Conference on Artificial Lintelligence, 2016.

    [4] WANG Z, SCHAUL T, HESSEL M, et al. Dueling network architectures for deep reinforcement learning[C] // International Conference on Machine Learning PMLR, 2016:1995-2003.

    [5] 袁帥,張莉莉,顧琦然,等. 移動機器人優(yōu)先采樣D3QN路徑規(guī)劃方法研究[J]. 小型微型計算機系統(tǒng),2023,44(5):923-929.

    [6] 韓磊,張輪,郭為安. 混合交通流環(huán)境下基于改進強化學習的可變限速控制策略[J]. 交通運輸系統(tǒng)工程與信息,2023,23(3):110-122.

    [7] KOOL W, VAN HOOF H, WELLING M. Attention, learn to solve routing problems![EB/OL]. (2021-10-24)[2003-09-20]. https://github.com/wouterkool/attention-learn-to-route.

    [8] NAZARI M, OROOJLOOY A, SNYDER L, et al. Reinforcement learning for solving the vehicle routing problem[EB/OL]. (2023-09-08)[2023-09-20]. https://github.com/optML Group/VRP-RL.

    [9] LIN B, GHADDAR B, NATHWANI J. Deep reinforcement learning for the electric vehicle routing problem with time windows[J]. IEEE Transactions on Intelligent Transportation Systems, 2021,23(8):11528-11538.

    [10] ASGHARI M, AL-E S M J M. Green vehicle routing problem: A state-of-the-art review[J]. International Journal of Production Economics, 2021,231:107899.

    [11] SOLOMONMM. Vehicle routing and scheduling with time window constraints: Imodels and algorithms (heuris tics)[D]. University of Pennsylvania, 1984.

    [12] SAVELSBERGH M W P. The vehicle routing problem with time windows: Minimizing route duration[J]. ORSA Journal on Computing, 1992,4(2):146-154.

    [13] MARTIN DESROCHERS, JACQUES DESROSIERS, MARIUS SOLOMON. A new optimization algorithm for the vehicle routing problem with time windows[J]. Operations Research, 1992,40(2):342-354.

    [14] K C TAN, L H LEE, K OU. Artificial intelligence heuristics insolving vehicle routing problems with time window constraints[J]. Engineering Applications of Artificial Intelligence, 2001,14(6):825-837.

    [15] 劉虹慶,王世民. 基于強化學習的車輛路徑規(guī)劃問題研究[J]. 計算機應用與軟件,2021,38(8):303-308.

    [16] SAMUEL A L. Some studies in machine learning using the game of checkers[J]. IBM Journal of Research and Development, 1959,3(3):210-229.

    [17] WATKINS C J C H, DAYAN P. Q-learning[J]. Machine Learning, 1992(8):279-292.

    [18] HUANG Y, WEI G L, WANG Y X. VD D3QN: The variant of double deep q-learning network with dueling architecture

    [C] // 第37屆中國控制會議論文集(F),2018.

    [19] KALLEHAUGE B, LARSEN J, MADSEN O B G, et al. Vehicle routing problem with time windows[M]. Springer US, 2005.

    [20] 韓巖峰. 基于深度強化學習的無人物流車隊配送路徑規(guī)劃研究[D]. 大連:大連理工大學,2021.

    [21] 周瑤瑤,李燁. 基于排序優(yōu)先經(jīng)驗回放的競爭深度Q網(wǎng)絡學習[J]. 計算機應用研究,2020,37(2):486-488.

    [22] 馮超. 強化學習精要[M]. 北京:電子工業(yè)出版社,2018.

    [23] 劉馳,王占健,戴子彭. 深度強化學習學術前沿與實戰(zhàn)應用[M]. 北京:機械工業(yè)出版社,2020.

    [24] YANG S, XU Z, WANG J. Intelligent decision-making of scheduling for dynamic permutation flowshop via deep reinforcement learning[J]. Sensors, 2021,21(3):1019.

    [25] 孫滬增,李章維,秦子豪,等. 帶時間窗車輛路徑規(guī)劃算法研究與實現(xiàn)[J]. 小型微型計算機7a4019138b4b6d4f1e2855f6b56a0e9290d1caf14133d0fb1134951c9679e173系統(tǒng),2020(5):972-977.

    [26] TICHA H B, ABSI N, FEILLET D, et al. Multigraph modeling and adaptive large neighborhood search for the vehicle routing problem with time windows[J]. Computers & Operations Research, 2019,104:113-122.

    [27] 李茹楊,彭慧民,李仁剛,等. 強化學習算法與應用綜述[J]. 計算機系統(tǒng)應用,2020,29(12):17-29.

    [28] BURSUC A, GUETTIER C, et al. Optimal solving of constrained path-planning problemswith graph convolutional networks and optimized tree search[C] // 2019 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), IEEE, 2019:3519-3525.

    国产精品国产三级专区第一集| 天美传媒精品一区二区| 色网站视频免费| 特大巨黑吊av在线直播| 成人无遮挡网站| 一级片'在线观看视频| 国产亚洲5aaaaa淫片| 色网站视频免费| 80岁老熟妇乱子伦牲交| 午夜激情欧美在线| 建设人人有责人人尽责人人享有的 | 日韩av在线免费看完整版不卡| 人妻制服诱惑在线中文字幕| 精品久久久精品久久久| 九草在线视频观看| 免费黄频网站在线观看国产| 六月丁香七月| 国产成人免费观看mmmm| 人人妻人人澡欧美一区二区| 国产一区二区三区综合在线观看 | 久久久久久伊人网av| 白带黄色成豆腐渣| 亚洲av电影不卡..在线观看| 毛片一级片免费看久久久久| 精品久久久久久久久av| 久久久成人免费电影| 日韩av在线免费看完整版不卡| 国产午夜福利久久久久久| av在线亚洲专区| 国产乱人偷精品视频| 一级av片app| 一本一本综合久久| 精品午夜福利在线看| 亚洲av中文av极速乱| av天堂中文字幕网| 亚洲人成网站在线观看播放| 亚洲综合精品二区| 精品一区在线观看国产| 国产不卡一卡二| 国产乱人视频| 日韩,欧美,国产一区二区三区| 中文字幕人妻熟人妻熟丝袜美| 51国产日韩欧美| 精品久久久久久电影网| 精品国产露脸久久av麻豆 | 国产高清三级在线| 国产中年淑女户外野战色| 亚洲欧洲日产国产| 国产 一区精品| av天堂中文字幕网| 一个人看视频在线观看www免费| 女的被弄到高潮叫床怎么办| 男人和女人高潮做爰伦理| 丝袜美腿在线中文| 国产黄频视频在线观看| 人人妻人人看人人澡| 中文字幕人妻熟人妻熟丝袜美| 一夜夜www| 成人漫画全彩无遮挡| 色吧在线观看| 91aial.com中文字幕在线观看| 中文字幕久久专区| 久久草成人影院| 国内精品宾馆在线| 免费看美女性在线毛片视频| 菩萨蛮人人尽说江南好唐韦庄| 久久久久久九九精品二区国产| 亚洲在线观看片| 欧美成人精品欧美一级黄| 亚洲人与动物交配视频| 亚洲自偷自拍三级| 亚洲精品日韩在线中文字幕| 插逼视频在线观看| 伊人久久精品亚洲午夜| 国产亚洲精品av在线| 国产成人精品一,二区| 蜜桃亚洲精品一区二区三区| a级毛色黄片| 深爱激情五月婷婷| 天堂av国产一区二区熟女人妻| 精品人妻熟女av久视频| 成人无遮挡网站| 69人妻影院| 亚洲欧洲国产日韩| 大香蕉久久网| 色5月婷婷丁香| 久久精品国产亚洲av涩爱| 国产午夜精品一二区理论片| 啦啦啦韩国在线观看视频| 久久久久久久国产电影| 乱系列少妇在线播放| 天堂√8在线中文| 七月丁香在线播放| 精华霜和精华液先用哪个| 日韩人妻高清精品专区| 人妻夜夜爽99麻豆av| 熟妇人妻久久中文字幕3abv| 精品久久久噜噜| 欧美日韩亚洲高清精品| 久久精品久久精品一区二区三区| 日韩av免费高清视频| 亚洲av日韩在线播放| 黄色日韩在线| 亚洲丝袜综合中文字幕| 国产69精品久久久久777片| 国产免费视频播放在线视频 | 国语对白做爰xxxⅹ性视频网站| 床上黄色一级片| 亚洲av成人精品一二三区| 国产真实伦视频高清在线观看| 久久久久久九九精品二区国产| 波野结衣二区三区在线| 国内精品一区二区在线观看| 国产在线男女| av线在线观看网站| 欧美日韩亚洲高清精品| 大香蕉97超碰在线| 两个人视频免费观看高清| 亚洲综合色惰| 精品久久久久久久久亚洲| 99视频精品全部免费 在线| 免费无遮挡裸体视频| 免费不卡的大黄色大毛片视频在线观看 | 亚洲四区av| 天堂√8在线中文| 免费播放大片免费观看视频在线观看| 亚洲国产高清在线一区二区三| 秋霞伦理黄片| 国产精品麻豆人妻色哟哟久久 | 国产老妇伦熟女老妇高清| 蜜臀久久99精品久久宅男| 欧美日韩综合久久久久久| 欧美变态另类bdsm刘玥| 国产色婷婷99| 十八禁国产超污无遮挡网站| 免费看日本二区| 国产精品蜜桃在线观看| 成人av在线播放网站| 国产在视频线精品| 亚洲高清免费不卡视频| 日韩av在线大香蕉| 女人十人毛片免费观看3o分钟| 狂野欧美激情性xxxx在线观看| 久久久久久久久久黄片| 日韩一本色道免费dvd| 国产色婷婷99| 国产精品麻豆人妻色哟哟久久 | 国产69精品久久久久777片| 久久久久久久大尺度免费视频| 内地一区二区视频在线| 亚洲av不卡在线观看| 久久久久精品性色| 好男人在线观看高清免费视频| 最后的刺客免费高清国语| 亚洲国产色片| 国产老妇伦熟女老妇高清| 亚洲综合精品二区| 亚洲av免费在线观看| h日本视频在线播放| 少妇熟女欧美另类| eeuss影院久久| av播播在线观看一区| 自拍偷自拍亚洲精品老妇| 22中文网久久字幕| 精品少妇黑人巨大在线播放| 赤兔流量卡办理| 波多野结衣巨乳人妻| 超碰av人人做人人爽久久| 午夜福利高清视频| 日韩国内少妇激情av| 亚洲欧美成人精品一区二区| 欧美日本视频| 亚洲美女视频黄频| 国产免费一级a男人的天堂| 我的老师免费观看完整版| 亚洲精品久久久久久婷婷小说| 大话2 男鬼变身卡| 国产午夜精品一二区理论片| 久久人人爽人人片av| 亚洲人与动物交配视频| 韩国高清视频一区二区三区| 特大巨黑吊av在线直播| 亚洲图色成人| 久久久久久久久久久丰满| 亚洲精品乱码久久久v下载方式| 成人一区二区视频在线观看| 久久韩国三级中文字幕| 一区二区三区免费毛片| 99久国产av精品国产电影| 能在线免费观看的黄片| 三级国产精品片| 亚洲av不卡在线观看| 成人美女网站在线观看视频| 国产亚洲av片在线观看秒播厂 | 偷拍熟女少妇极品色| 女人十人毛片免费观看3o分钟| 亚洲av一区综合| av在线天堂中文字幕| 亚洲av电影在线观看一区二区三区 | 亚洲国产高清在线一区二区三| 免费看不卡的av| 亚洲精品国产av蜜桃| 九九爱精品视频在线观看| 日韩欧美精品免费久久| 好男人视频免费观看在线| 丰满少妇做爰视频| 久久午夜福利片| 精品欧美国产一区二区三| 少妇熟女欧美另类| 亚洲国产成人一精品久久久| 蜜桃亚洲精品一区二区三区| 最近2019中文字幕mv第一页| 欧美另类一区| 久久久精品欧美日韩精品| 色哟哟·www| 日韩精品青青久久久久久| 看十八女毛片水多多多| 80岁老熟妇乱子伦牲交| 亚洲精品一区蜜桃| 又爽又黄a免费视频| 国产日韩欧美在线精品| 亚洲精品一二三| 中文资源天堂在线| 一个人看的www免费观看视频| 成人一区二区视频在线观看| 欧美潮喷喷水| 天堂影院成人在线观看| 欧美 日韩 精品 国产| 国产精品一二三区在线看| 色综合站精品国产| 中文精品一卡2卡3卡4更新| 欧美性感艳星| 一级毛片电影观看| 天美传媒精品一区二区| 神马国产精品三级电影在线观看| 三级男女做爰猛烈吃奶摸视频| 久久久久久九九精品二区国产| 人体艺术视频欧美日本| 肉色欧美久久久久久久蜜桃 | 精品久久久久久电影网| 国产成人免费观看mmmm| 国产成人福利小说| 久久精品久久久久久噜噜老黄| 久久久成人免费电影| 亚洲自偷自拍三级| 有码 亚洲区| 亚洲精品,欧美精品| 2021天堂中文幕一二区在线观| 亚洲国产av新网站| 午夜福利在线在线| 女人久久www免费人成看片| 亚洲av二区三区四区| 美女脱内裤让男人舔精品视频| 国产探花极品一区二区| 精品不卡国产一区二区三区| 1000部很黄的大片| 国产高潮美女av| 久久热精品热| 免费看a级黄色片| 亚洲欧美成人综合另类久久久| 日韩大片免费观看网站| 国产成年人精品一区二区| a级毛片免费高清观看在线播放| 有码 亚洲区| 日韩成人av中文字幕在线观看| 欧美性感艳星| 欧美激情在线99| 日本av手机在线免费观看| 国模一区二区三区四区视频| 91在线精品国自产拍蜜月| 日韩av在线大香蕉| 久久精品久久精品一区二区三区| 最近手机中文字幕大全| 国产视频首页在线观看| 日本av手机在线免费观看| 国产精品日韩av在线免费观看| 青青草视频在线视频观看| av卡一久久| 日本猛色少妇xxxxx猛交久久| 噜噜噜噜噜久久久久久91| 久久久国产一区二区| 美女xxoo啪啪120秒动态图| 亚洲av电影在线观看一区二区三区 | 日韩精品青青久久久久久| 日韩伦理黄色片| 男人舔女人下体高潮全视频| 亚洲av.av天堂| 国产亚洲午夜精品一区二区久久 | 午夜久久久久精精品| videos熟女内射| 在线播放无遮挡| 人体艺术视频欧美日本| 欧美精品一区二区大全| av免费观看日本| 日韩大片免费观看网站| 热99在线观看视频| 97超视频在线观看视频| 亚洲av成人精品一二三区| 午夜福利在线在线| 免费看光身美女| 成人毛片60女人毛片免费| 亚洲欧美日韩东京热| 日本免费在线观看一区| 亚洲精品成人久久久久久| 日韩强制内射视频| 成人午夜高清在线视频| 国产精品蜜桃在线观看| 日韩视频在线欧美| 久久久久免费精品人妻一区二区| av天堂中文字幕网| 免费无遮挡裸体视频| 亚洲欧美精品专区久久| 午夜激情久久久久久久| 精品久久久久久久末码| 精品久久久精品久久久| 国产一级毛片在线| 日韩一区二区视频免费看| av福利片在线观看| 久久99蜜桃精品久久| 91aial.com中文字幕在线观看| av福利片在线观看| 少妇人妻一区二区三区视频| 久久久成人免费电影| 最近视频中文字幕2019在线8| 插阴视频在线观看视频| 色视频www国产| 国产在视频线在精品| 亚洲在久久综合| 色综合色国产| 夜夜看夜夜爽夜夜摸| eeuss影院久久| xxx大片免费视频| 少妇裸体淫交视频免费看高清| 亚洲av免费高清在线观看| videos熟女内射| 丝袜喷水一区| 成人午夜精彩视频在线观看| 久久久久免费精品人妻一区二区| 国产在线男女| 老司机影院毛片| 欧美日韩精品成人综合77777| 夜夜爽夜夜爽视频| 亚洲欧美成人精品一区二区| 国产成人午夜福利电影在线观看| 日韩,欧美,国产一区二区三区| 午夜福利在线在线| 亚洲av成人av| 日韩成人av中文字幕在线观看| 久久久久精品性色| 国产一级毛片在线| 高清在线视频一区二区三区| 久久久久国产网址| 亚洲国产高清在线一区二区三| 精品人妻视频免费看| 我的女老师完整版在线观看| 两个人的视频大全免费| 三级经典国产精品| 午夜福利在线观看免费完整高清在| 午夜福利在线观看免费完整高清在| www.色视频.com| 久久精品综合一区二区三区| 日本色播在线视频| 黑人高潮一二区| 国产精品女同一区二区软件| 人妻少妇偷人精品九色| 一级黄片播放器| 欧美97在线视频| 久久精品国产亚洲av涩爱| 午夜福利在线观看免费完整高清在| 国产精品无大码| 色哟哟·www| 噜噜噜噜噜久久久久久91| 美女cb高潮喷水在线观看| 超碰97精品在线观看| 熟妇人妻不卡中文字幕| 麻豆成人av视频| 日日摸夜夜添夜夜添av毛片| 国内精品一区二区在线观看| 只有这里有精品99| 国产精品综合久久久久久久免费| .国产精品久久| 80岁老熟妇乱子伦牲交| 九草在线视频观看| 国产永久视频网站| 草草在线视频免费看| 亚洲aⅴ乱码一区二区在线播放| 免费观看无遮挡的男女| 免费黄色在线免费观看| 国产色爽女视频免费观看| 国产色婷婷99| 欧美极品一区二区三区四区| 亚洲自偷自拍三级| 熟妇人妻不卡中文字幕| 亚洲高清免费不卡视频| 国产男女超爽视频在线观看| 国产日韩欧美在线精品| 成人欧美大片| 在线a可以看的网站| 亚洲av二区三区四区| 日韩精品有码人妻一区| 视频中文字幕在线观看| 人妻系列 视频| 国产黄片美女视频| 日韩一本色道免费dvd| 2021天堂中文幕一二区在线观| 色综合站精品国产| 久久久久网色| 午夜精品一区二区三区免费看| av在线亚洲专区| av天堂中文字幕网| 国产亚洲5aaaaa淫片| 亚洲国产精品专区欧美| 丰满少妇做爰视频| 午夜久久久久精精品| 蜜桃亚洲精品一区二区三区| 国产精品久久久久久精品电影小说 | 亚洲成人一二三区av| 亚洲精华国产精华液的使用体验| 欧美三级亚洲精品| 看非洲黑人一级黄片| 国产精品1区2区在线观看.| 男的添女的下面高潮视频| 精品一区二区免费观看| 国产高清国产精品国产三级 | 亚洲激情五月婷婷啪啪| 91久久精品电影网| 国产探花在线观看一区二区| 亚洲欧美精品自产自拍| 国产黄色免费在线视频| 又大又黄又爽视频免费| 99久久精品热视频| 69人妻影院| 一个人免费在线观看电影| 一级a做视频免费观看| 丰满少妇做爰视频| 日本三级黄在线观看| 看十八女毛片水多多多| 国产精品一区二区三区四区免费观看| 成人亚洲欧美一区二区av| 久久精品国产自在天天线| 亚洲av.av天堂| 岛国毛片在线播放| 深夜a级毛片| 最近中文字幕高清免费大全6| 国产人妻一区二区三区在| 精品人妻一区二区三区麻豆| 欧美区成人在线视频| 美女主播在线视频| 久久6这里有精品| 免费看av在线观看网站| 久久久久免费精品人妻一区二区| 黄片wwwwww| 激情五月婷婷亚洲| 国产精品美女特级片免费视频播放器| 精品久久久久久久人妻蜜臀av| 成人毛片a级毛片在线播放| 色哟哟·www| 91久久精品国产一区二区成人| 亚洲av不卡在线观看| 成年av动漫网址| 国产v大片淫在线免费观看| 国产精品久久久久久久电影| 一个人免费在线观看电影| 国产色婷婷99| 搡女人真爽免费视频火全软件| 最近的中文字幕免费完整| 国产午夜福利久久久久久| 亚洲欧美日韩卡通动漫| 欧美变态另类bdsm刘玥| 美女黄网站色视频| 亚洲av电影不卡..在线观看| 久久久午夜欧美精品| 最近手机中文字幕大全| 特级一级黄色大片| 久久久久久久久大av| 啦啦啦啦在线视频资源| 夜夜看夜夜爽夜夜摸| 免费观看性生交大片5| 免费人成在线观看视频色| 国产精品av视频在线免费观看| 免费看av在线观看网站| 久久热精品热| 最后的刺客免费高清国语| 不卡视频在线观看欧美| 国产成人福利小说| 亚洲精品一区蜜桃| 精华霜和精华液先用哪个| 高清欧美精品videossex| 天天一区二区日本电影三级| 日韩强制内射视频| 国产一区有黄有色的免费视频 | 男人舔女人下体高潮全视频| 韩国av在线不卡| av网站免费在线观看视频 | 精品亚洲乱码少妇综合久久| 国产不卡一卡二| 亚洲精品第二区| 九九在线视频观看精品| 欧美另类一区| 亚洲图色成人| 街头女战士在线观看网站| 99久久精品国产国产毛片| 波野结衣二区三区在线| 国产黄片视频在线免费观看| 成年女人在线观看亚洲视频 | 国产精品av视频在线免费观看| 午夜爱爱视频在线播放| 日本黄大片高清| 亚洲综合精品二区| 国产精品.久久久| 一区二区三区四区激情视频| 国产免费又黄又爽又色| 国产精品av视频在线免费观看| 国产精品国产三级国产专区5o| av网站免费在线观看视频 | 99久久人妻综合| 亚洲精品久久久久久婷婷小说| 精品欧美国产一区二区三| 一级毛片黄色毛片免费观看视频| 99九九线精品视频在线观看视频| 国产成人午夜福利电影在线观看| xxx大片免费视频| 十八禁国产超污无遮挡网站| 精品国产三级普通话版| 免费看日本二区| 亚洲精品自拍成人| 午夜激情欧美在线| 国产永久视频网站| 好男人在线观看高清免费视频| av天堂中文字幕网| 色播亚洲综合网| 欧美+日韩+精品| 国产综合精华液| 欧美人与善性xxx| 搡老乐熟女国产| 午夜视频国产福利| 亚洲av成人av| 久久这里有精品视频免费| 午夜激情福利司机影院| 日韩av不卡免费在线播放| 在线 av 中文字幕| 国产精品1区2区在线观看.| 毛片一级片免费看久久久久| 亚洲在久久综合| 国产高清有码在线观看视频| www.av在线官网国产| 亚洲欧美日韩卡通动漫| 色综合色国产| 色播亚洲综合网| 精品酒店卫生间| 午夜福利视频精品| 亚洲色图av天堂| 亚洲婷婷狠狠爱综合网| 搞女人的毛片| 一级二级三级毛片免费看| 亚洲欧美成人精品一区二区| 国产视频首页在线观看| 国产午夜精品一二区理论片| 91久久精品国产一区二区三区| 人人妻人人看人人澡| 91久久精品国产一区二区三区| 国产精品不卡视频一区二区| 久久久精品94久久精品| 波多野结衣巨乳人妻| 丰满乱子伦码专区| 精品久久久久久久人妻蜜臀av| 舔av片在线| 国产精品人妻久久久久久| 蜜臀久久99精品久久宅男| 婷婷色综合大香蕉| 久99久视频精品免费| 国产精品.久久久| 精品一区在线观看国产| 最近最新中文字幕大全电影3| 国产亚洲一区二区精品| 国产白丝娇喘喷水9色精品| 嫩草影院精品99| av在线老鸭窝| 久久这里只有精品中国| 日韩一区二区三区影片| 大陆偷拍与自拍| 性色avwww在线观看| 美女脱内裤让男人舔精品视频| 欧美xxxx黑人xx丫x性爽| 人体艺术视频欧美日本| 美女内射精品一级片tv| 肉色欧美久久久久久久蜜桃 | 激情五月婷婷亚洲| 人妻一区二区av| 少妇猛男粗大的猛烈进出视频 | 麻豆成人av视频| 69人妻影院| 网址你懂的国产日韩在线| 久久久久九九精品影院| 人妻夜夜爽99麻豆av| 熟女人妻精品中文字幕| 亚洲乱码一区二区免费版| 国产v大片淫在线免费观看| 草草在线视频免费看| 亚洲人成网站在线播| 99热网站在线观看| 中文字幕久久专区| 一级毛片电影观看| av在线亚洲专区| 亚洲国产精品成人综合色| 国产精品.久久久| 亚洲av免费高清在线观看| 久久久久久九九精品二区国产| 99热这里只有是精品在线观看| 3wmmmm亚洲av在线观看| 亚洲国产精品国产精品| 中文精品一卡2卡3卡4更新| 80岁老熟妇乱子伦牲交| 一级二级三级毛片免费看| 国产精品.久久久|