• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    誘導(dǎo)信息條件下車輛路徑選擇——基于有限理性模糊博弈

    2016-01-18 03:35:44周代平,李康奇,賀琳
    關(guān)鍵詞:有限理性

    誘導(dǎo)信息條件下車輛路徑選擇——基于有限理性模糊博弈

    周代平, 李康奇, 賀琳

    ( 重慶交通大學(xué) 交通運(yùn)輸學(xué)院,重慶 400074)

    摘要:誘導(dǎo)信息屬于建議性信息,當(dāng)誘導(dǎo)信息發(fā)布以后駕駛員并不一定接受誘導(dǎo)信息;在行為強(qiáng)化理論基礎(chǔ)上,建立了基于有限理性模糊博弈的誘導(dǎo)信息條件下車輛路徑選擇模型,并通過(guò)仿真得出了不同初始狀態(tài)下的博弈平衡結(jié)果;仿真結(jié)果表明:誘導(dǎo)信息的發(fā)布并不一定能改善路網(wǎng)交通流分布,它與路網(wǎng)總流量以及初始接受誘導(dǎo)的車輛比例密切相關(guān).

    關(guān)鍵詞:模糊博弈;有限理性;交通誘導(dǎo);自學(xué)習(xí)機(jī)制

    doi:10.16055/j.issn.1672-058X.2015.0012.007

    收稿日期:2015-06-10;修回日期:2015-08-07.

    作者簡(jiǎn)介:周代平(1990-),男,湖南人,碩士,從事交通運(yùn)輸規(guī)劃研究.E-mail: zhoudaiping2015@sina.com.

    中圖分類號(hào):U491.23文獻(xiàn)標(biāo)志碼:A

    交通誘導(dǎo)是智能交通(ITS)的一部分,它的主要作用是將路況實(shí)時(shí)信息反饋給駕駛員,以便駕駛員選擇合理的出行路徑.Roth and Erev[1],Erev[2]認(rèn)為出行者進(jìn)行路徑選擇同時(shí)也是在不斷地實(shí)踐,通過(guò)多次不同的選擇,出行者會(huì)總結(jié)出幾次選擇的路徑中最佳的路徑,并將其作為自己今后選擇路徑的依據(jù),所以路徑的選擇也是一個(gè)由學(xué)習(xí)過(guò)程轉(zhuǎn)化成自身經(jīng)驗(yàn)的過(guò)程.在交通領(lǐng)域逐漸發(fā)展的過(guò)程中,博弈論的應(yīng)用越來(lái)越廣泛.Michael G.H. Bell(2000)[3]將博弈論運(yùn)用到為了選擇最佳行駛路徑使自己花費(fèi)最小的出行者個(gè)體和為了使整個(gè)路網(wǎng)的收益最大的破壞者之間,建立非合作博弈模型,在保證路網(wǎng)安全性下,得到了Nash 混合策略均衡解;李振龍[4]采用演化博弈建立了駕駛員在誘導(dǎo)信息下的路徑選擇模型;魯叢林[5]討論了在誘導(dǎo)信息條件下駕駛員的反應(yīng)行為博弈模型,黃海軍[6]、秦進(jìn)[7]等通過(guò)解析的方法對(duì)誘導(dǎo)信息的有效性進(jìn)行了評(píng)價(jià);劉建美[8-10]提出了駕駛員在有限理性的條件下車輛的路徑選擇博弈模型.但是,由于駕駛員本身的局限性,在有限理性的前提下,駕駛員的選擇往往是根據(jù)自身上一次選擇所獲取的利益來(lái)決定自己下一次的選擇,即自學(xué)習(xí)機(jī)制.在行為強(qiáng)化理論[11]的基礎(chǔ)上,以模糊數(shù)學(xué)和博弈論為工具,討論了誘導(dǎo)信息條件下車輛的路徑選擇模型,分析給出了博弈平衡結(jié)果,以期為交通誘導(dǎo)提供理論依據(jù).

    1模型建立

    1.1模型基本假設(shè)

    出行時(shí)間的長(zhǎng)短是影響路徑選擇最重要的標(biāo)準(zhǔn)[12],美國(guó)聯(lián)邦總局(BPR)提出路段行程時(shí)間函數(shù)[13]:

    (1)

    其中:T表示自由行駛時(shí)(交通量為零)的路段行程時(shí)間,c為路段通行能力,q為路段實(shí)際交通量,α,γ為參數(shù),一般取α=0.15,γ=4.

    以駕駛員的實(shí)際行駛時(shí)間作為駕駛員選擇某條路徑所獲得的收益.考慮如圖1所示的簡(jiǎn)單路網(wǎng),A到B地有L1,L2兩條路徑,L1,L2的道路通行能力分別為C1,C2,表示駕駛員第k次通過(guò)L1,L2的實(shí)際交通量,t1,k,t2,k為車輛第k次通過(guò)L1,L2到達(dá)B點(diǎn)的實(shí)際通行時(shí)間,t0為駕駛員從A地開(kāi)往B地的期望時(shí)間.

    圖1 路網(wǎng)示意圖

    1.2滿意度隸屬函數(shù)

    滿意度是指駕駛員對(duì)從A地開(kāi)往B地所花實(shí)際時(shí)間的滿意程度,它是個(gè)模糊的概念.取論域U=(0,+∞),u∈U,模糊集A1,A2,A3分別表示“滿意”、“一般”、“差”,則它們的隸屬函數(shù)分別為[14]

    (2)

    (3)

    (4)

    若Max(A1(t),A2(t),A3(t)),A=A1(t),則t∈A1,駕駛員對(duì)實(shí)際駕駛時(shí)間t感覺(jué)“滿意”,若Max(A1(t),A2(t),A3(t))=A2(t),則t∈A2,駕駛員對(duì)實(shí)際駕駛時(shí)間t感覺(jué)“一般”,若Max(A1(t),A2(t),A3(t)),A=A3(t),則t∈A3,駕駛員對(duì)實(shí)際駕駛時(shí)間t感覺(jué)“差”.

    1.3模型建立

    Skinner的“操作條件反射”理論認(rèn)為,人或動(dòng)物為了達(dá)到某種目的,會(huì)采取一定的行為作用于環(huán)境,當(dāng)這種行為的后果對(duì)他有利時(shí),這種行為就會(huì)在以后重復(fù)出現(xiàn);不利時(shí),這種行為就減弱或消失.人們可以用這種正強(qiáng)化或負(fù)強(qiáng)化的辦法來(lái)影響行為的后果,從而修正其行為[15].在行為強(qiáng)化理論的自學(xué)習(xí)機(jī)制下,駕駛員的第k+1次是否接受誘導(dǎo)取決于駕駛員的第k次接受(或不接受)誘導(dǎo)所獲得的收益;當(dāng)駕駛員對(duì)第k次接受(不接受)誘導(dǎo)所獲得的收益t0為滿意時(shí),則第k+1次繼續(xù)選擇接受(不接受)誘導(dǎo),當(dāng)駕駛員對(duì)第k次接受(不接受)誘導(dǎo)所獲得的收益t0滿意度為差時(shí),則第k+1次選擇不接受(接受)誘導(dǎo),當(dāng)駕駛員第k次接受(不接受)誘導(dǎo)所獲得的收益t0滿意度為一般時(shí),則駕駛員第k+1次將會(huì)有ξ概率選擇不接受(接受)誘導(dǎo).設(shè)每次參與博弈的車輛總數(shù)一定,即qy,k+qn,k=Q,Q為參與博弈的車輛總數(shù).根據(jù)駕駛員路徑選擇的實(shí)際情況,可將駕駛員分為兩大類qy(接受誘導(dǎo)的車輛)和qn(不接受誘導(dǎo)的車輛),設(shè)qy,k為第k次接受誘導(dǎo)的車輛總數(shù),qn,k為第k次不接受誘導(dǎo)的車輛總數(shù),k=1,2,3,…,則此博弈模型的戰(zhàn)略式表達(dá)如下:

    1) 局中人:

    2) 局中人的策略集:

    3) 局中人的收益函數(shù):

    2模型求解算法

    Step 0:h=h+1,v=1,m=0.1,給C1,C2(C1>C2),T,ξ賦值(定值);

    Step 1:初始化,給出模型的初始狀態(tài),Q=q0,qy,1=m*Q,qn,1=Q-qy,1,fabu(1)=g,(fabu(i)=g表示第i次誘導(dǎo)信息建議車輛走路徑Lg,g=1,2,m表示初始接受誘導(dǎo)的車輛比例);

    Step 2:若fabu(i)=1,則q1,i=qy,i,q2,i=qn,i,若fabu(i)=2,則q1,i=qn,i,q2,i=qy,i;

    Step 3:根據(jù)時(shí)間行程函數(shù)(式1)求得選擇路徑L1,L2的通過(guò)時(shí)間t1,i,t2,i;

    Step 4:根據(jù)隸屬度函數(shù),求得t1,i,t2,i的時(shí)間感受隸屬度,判斷駕駛員對(duì)第i次選擇收益的滿意度;

    Step 5:由第i次的收益滿意度確定第i+1次的選擇是否接受誘導(dǎo);

    Step 6:比較qy,i+1和qn,i+1的大小,若qy,i+1>=qn,i+1,則fabu(i+1)=1;若qy,i+1

    Step7:根據(jù)fabu(i+1)的值確定q1,i+1,q2,i+1;若fabu(i+1)=1,則q1,i+1=qy,i+1、q2,i+1=qn,i+1;若fabu(i+1)=2,則q1,i+1=qn,i+1、q2,i+1=qy,i+1;

    Step 8:i=i+1,若i<100,轉(zhuǎn)Step 2;否則轉(zhuǎn)Step 9;

    Step9:若m<1 ,Z(h,v)=q1,100,m=m+0.1,v=v+1轉(zhuǎn)Step 1,否則轉(zhuǎn)Step 10;

    Step10:q0=q0+Δq,若q0<3*(C1+C2),轉(zhuǎn)Step 0,否則結(jié)束.

    3具體算例

    算例中,C1=1500,C2=1000,T=30,ξ=0.333[16],q0=1000,Δq=500;仿真結(jié)果如圖2所示。仿真結(jié)果表明:在誘導(dǎo)信息條件下,不同的路網(wǎng)車流總量經(jīng)過(guò)若干次博弈后都會(huì)達(dá)到穩(wěn)定平衡;即若干次博弈后,路徑L1,L2上的量都呈現(xiàn)穩(wěn)定狀態(tài);路網(wǎng)車流總流量越接近路網(wǎng)總通行能力,初始接受誘導(dǎo)的車輛比例m對(duì)博弈平衡結(jié)果影響越顯著;參與博弈車輛數(shù)遠(yuǎn)大于路網(wǎng)總通行能力時(shí),通行能力較大的路徑(L1)更為擁堵;在路網(wǎng)總流量一定時(shí),存在一個(gè)初始接受誘導(dǎo)的車輛比例m使得路網(wǎng)交通流分配達(dá)到最佳.

    圖2 仿真結(jié)果

    4結(jié)語(yǔ)

    在考慮駕駛員的有限理性的前提下,以行為強(qiáng)化理論為基礎(chǔ),建立了基于自學(xué)習(xí)機(jī)制的誘導(dǎo)信息條件下的車輛路徑選擇模型,并給出了算法和具體算例.仿真結(jié)果表明:誘導(dǎo)信息的發(fā)布并不一定能改善路網(wǎng)交通流分布,它與路網(wǎng)總流量以及初始接受誘導(dǎo)的車輛比例密切相關(guān).

    參考文獻(xiàn):

    [1] ROTH A E,EREV I.Learning in Extensive-form Games:Experimental Data and Simple Dynamic Models in Intermediate Term[J].Nobel Symposium.Games and Economic Behavior,1995(8):164-212

    [2] EREV I,BEREBY,ROTH A.The Effect of Adding a Constant to Allpayoffs:Experimental Investigation and Implications for Reinforcement Learning Models[J].Journal of Economic Behavior and Organization,1999,39:111-128

    [3] BELL M G.A Game Theory Approach to Measuring the Performance Reliability of Transport Networks[J].Transportation Research Part B,2000,34(6):533-545

    [4] 李振龍.誘導(dǎo)條件下駕駛員路徑選擇行為的演化博弈分析[J].交通運(yùn)輸系統(tǒng)工程與信息,2003,3(2):23-27

    [5] 魯叢林.誘導(dǎo)條件下的駕駛員反應(yīng)行為的博弈模型[J].交通運(yùn)輸系統(tǒng)工程與信息,2005,5(1):58-61

    [6] 黃海軍,吳文洋.交通信息對(duì)交通行為影響的評(píng)價(jià)模型[J].系統(tǒng)工程理論與實(shí)踐,2002,22(10):81-83

    [7] 秦進(jìn),黎新華.交通信息的有效性研究[J].公路交通科技,2005,22(2):104-107

    [8] 劉建美,馬壽峰.基于有限理性的個(gè)體出行路徑選擇進(jìn)化博弈分析[J].控制與決策,2009,24(10):1450-1454

    [9] LIU J M,MA S F.A Dimension-reduced Method of Sensitivity Analysis for Stochastic User Equilibrium Assignment Model[J].Applied Mathematical Modelling,2010(34):325-333

    [10] LIU J M,MA S F.Algorithms of Game Models on Individual Travel Behavior[C]∥The 8th International IEEE Conference of Chinese logistics and transportation professionals,Chengdu,China,2008

    [11] SKINNER.The Behavior of Organisms An Experimental Analysis[M].New Yoro Appleton Century Company,1938:110-150

    [12] OUTRAM V.E,THOMPSON.Driver Route Choice[C].Proceedings-PTRC Annual Meeting,London,1977

    [13] 楊佩坤,錢(qián)林波.交通分配中路段行程時(shí)間函數(shù)研究[J].同濟(jì)大學(xué)學(xué)報(bào):自然科學(xué)版,1994,22(1):41-44

    [14] 楊綸標(biāo),高英儀,凌衛(wèi)新.模糊數(shù)學(xué)原理及應(yīng)用[M].廣州:華南理工大學(xué)出版社,2011

    [15] SKINNER B F.The Behavior of Organisms:An Experimental Analysis[M].New York:Appleton-Century Company,1938

    [16] 周元峰.基于信息的駕駛員路徑選擇行為及動(dòng)態(tài)誘導(dǎo)模型研究[D].北京:北京交通大學(xué),2007

    Research on the Model of Vehicle Routing Choice Based on the Condition ofthe Bounded Rationality Fuzzy Game with Inducing Information

    ZHOU Dai-ping, LI Kang-qi, HE Lin

    (School of Transportation and Traffic,Chongqing Jiaotong University,Chongqing 400074,china)

    Abstract:The inducing information belongs to recommended information,so drivers do not necessarily accept the induction after the inducing information released.This paper,based on the theory of reinforcement ,establishes the model of vehicle routing choice based on the condition of fuzzy game with inducing information and obtains the result of balance of the game under the different initial state through simulation.The simulation results show that the release of the induction information does not necessarily improve the road network traffic flow distribution,which is closely related to the proportion of the total flow of the road network and the initial acceptance of the induction vehicles.

    Key words: fuzzy game; bounded rationality; traffic induction; self-learning mechanism

    猜你喜歡
    有限理性
    重慶市排污權(quán)交易機(jī)制下斯坦科爾伯格有限理性動(dòng)態(tài)雙寡頭博弈的復(fù)雜性
    基于RIPPER的有限理性下出行路徑選擇行為
    地方政府不當(dāng)干預(yù)對(duì)產(chǎn)能過(guò)剩的影響分析
    法律家長(zhǎng)主義的合理性及其限度
    商(2016年21期)2016-07-06 08:32:13
    審計(jì)判斷偏誤的形成原因及匡正策略
    商(2016年10期)2016-04-25 10:16:30
    行為審計(jì)需求論:理論框架和例證分析
    重大工程關(guān)鍵部件供應(yīng)商合作機(jī)制研究
    當(dāng)代大學(xué)生網(wǎng)絡(luò)抱怨行為低效的問(wèn)題與對(duì)策研究
    完全理性到有限理性:博弈論理性基礎(chǔ)的變更
    科技視界(2015年27期)2015-10-08 13:19:50
    國(guó)有資源經(jīng)管責(zé)任、人性缺陷和政府審計(jì)
    资源县| 噶尔县| 娱乐| 嘉鱼县| 南宁市| 巴彦县| 和顺县| 井陉县| 聊城市| 大厂| 鄂伦春自治旗| 江陵县| 济阳县| 连平县| 辽中县| 泾川县| 尼玛县| 乐平市| 庆安县| 金华市| 洛隆县| 左云县| 阜新市| 安宁市| 兴安盟| 烟台市| 余姚市| 静安区| 九寨沟县| 建水县| 潼关县| 阳信县| 隆林| 来宾市| 晋宁县| 牙克石市| 高清| 茂名市| 吉水县| 铁力市| 旬邑县|