史國(guó)強(qiáng),周代平,聶化東,閆廣聰(重慶交通大學(xué)交通運(yùn)輸學(xué)院,重慶 400074)
?
無(wú)誘導(dǎo)信息條件下基于有限理性模糊博弈的車(chē)輛路徑選擇
史國(guó)強(qiáng),周代平,聶化東,閆廣聰
(重慶交通大學(xué)交通運(yùn)輸學(xué)院,重慶400074)
摘要:以模糊數(shù)學(xué)為工具、行為強(qiáng)化理論為基礎(chǔ),建立有限理性模糊博弈的無(wú)誘導(dǎo)信息車(chē)輛路徑選擇模型,通過(guò)Matlab仿真得出不同初始狀態(tài)下的博弈平衡結(jié)果。結(jié)果表明:初始路網(wǎng)交通量的分配比例對(duì)路網(wǎng)的平衡狀態(tài)無(wú)顯著影響,且當(dāng)路網(wǎng)交通總量接近路網(wǎng)的通行能力時(shí),博弈結(jié)果會(huì)達(dá)到穩(wěn)定平衡,當(dāng)交通量遠(yuǎn)大于路網(wǎng)通行能力時(shí),博弈結(jié)果則呈現(xiàn)峰谷平衡。
關(guān)鍵詞:無(wú)誘導(dǎo)信息;駕駛員路徑選擇;模糊數(shù)學(xué);博弈論
交通誘導(dǎo)信息作為交通信息的一部分,利用信息對(duì)車(chē)輛進(jìn)行誘導(dǎo),在時(shí)間和空間上均衡路網(wǎng)上的交通流,提高路網(wǎng)使用效率[1]。文獻(xiàn)[2]在分析系統(tǒng)最優(yōu)與用戶(hù)最優(yōu)各自特點(diǎn)的基礎(chǔ)上,建立交通誘導(dǎo)中系統(tǒng)最優(yōu)與用戶(hù)最優(yōu)的博弈協(xié)調(diào)模型。為提高路網(wǎng)的交通誘導(dǎo)率和通行質(zhì)量,文獻(xiàn)[3]提出基于Stackelberg-Logit博弈的交通誘導(dǎo)模型。文獻(xiàn)[4]應(yīng)用演化博弈論建立誘導(dǎo)條件下駕駛員路徑選擇行為的演化模型,為制定交通誘導(dǎo)策略提供了理論支持。文獻(xiàn)[5]根據(jù)誘導(dǎo)系統(tǒng)提供的不同駕駛員的反應(yīng)行為,建立誘導(dǎo)條件下駕駛員反應(yīng)行為的博弈模型。以上博弈模型的建立,是以駕駛員完全理性為前提,這與實(shí)際并不相符,而且在實(shí)際路網(wǎng)中,許多道路上并沒(méi)有安裝交通誘導(dǎo)系統(tǒng),為此,有必要分析在無(wú)誘導(dǎo)信息條件下駕駛員非完全理性的道路交通流的分布情況,以此來(lái)指導(dǎo)路網(wǎng)系統(tǒng)發(fā)布誘導(dǎo)信息。文獻(xiàn)[6-8]提出基于有限理性出行的博弈模型,重點(diǎn)研究最優(yōu)反應(yīng)動(dòng)態(tài)學(xué)習(xí)機(jī)制條件下的博弈模型,得出在無(wú)誘導(dǎo)信息條件下,有限理性的博弈模型平衡鞍點(diǎn)。最優(yōu)動(dòng)態(tài)學(xué)習(xí)機(jī)制的基本策略是:駕駛員根據(jù)第k次的出行策略來(lái)確定自己第k+1次的出行選擇。在實(shí)際出行中,對(duì)駕駛員路徑選擇影響最大的是近期經(jīng)驗(yàn)[9],最優(yōu)反應(yīng)動(dòng)態(tài)學(xué)習(xí)機(jī)制以參與博弈的其他局中人策略為學(xué)習(xí)基礎(chǔ),沒(méi)有考慮駕駛員自身的駕駛經(jīng)驗(yàn)和駕駛時(shí)間感受。
本文在以駕駛員為有限理性的前提下,綜合考慮駕駛員的自身駕駛經(jīng)驗(yàn)和駕駛時(shí)間感受對(duì)駕駛員路徑選擇的影響,利用模糊數(shù)學(xué)建立有限理性模糊博弈模型,利用Matlab對(duì)不同初始狀態(tài)下的模型博弈平衡結(jié)果進(jìn)行仿真分析。
1.1隸屬度函數(shù)構(gòu)造
出行時(shí)間是影響路徑選擇最重要的因素[10]。選擇車(chē)輛路徑時(shí),要考慮到某一路段的時(shí)間阻抗,可以根據(jù)路阻函數(shù)對(duì)路段行駛時(shí)間進(jìn)行修正,最常見(jiàn)的路阻函數(shù)是美國(guó)聯(lián)邦公路局函數(shù)( BPR函數(shù))[11],其表達(dá)式為:式中: t為駕駛員實(shí)際駕駛時(shí)間; T為自由行駛時(shí)(交通量為零)的路段行程時(shí)間; c為路段通行能力; q為路段實(shí)際交通量;?、β為路阻函數(shù)參數(shù),一般取?=0.15,β=4。
本文以駕駛員的實(shí)際行駛時(shí)間來(lái)衡量駕駛員選擇某條路徑所獲得的滿(mǎn)意程度。如圖1所示的簡(jiǎn)單路網(wǎng),假設(shè)A到B地有L1、L2兩條路徑,當(dāng)駕駛員第k+1次選擇路徑時(shí),則根據(jù)第k次的滿(mǎn)意度進(jìn)行選擇。滿(mǎn)意度是指駕駛員對(duì)從A地開(kāi)往B地所花實(shí)際時(shí)間的滿(mǎn)意程度,是個(gè)模糊概念。取論域U=( 0,+∞),模糊集A1、A2、A3分別表示“滿(mǎn)意”、“一般”、“差”(令“滿(mǎn)意”=1,“一般”=0,“不滿(mǎn)意”=-1,a1為L(zhǎng)1路上的滿(mǎn)意程度,a2為L(zhǎng)2路上的滿(mǎn)意程度),則A1、A2、A3的隸屬函數(shù)[12]分別為:
圖1簡(jiǎn)單路網(wǎng)示意圖
式中: t為駕駛員第k次通過(guò)路網(wǎng)L1或L2的行駛時(shí)間; t0為駕駛員從A地開(kāi)往B地的期望時(shí)間。
若Max( A1( t),A2( t),A3( t) ) = A1( t),則t∈A1,駕駛員對(duì)實(shí)際駕駛時(shí)間t感覺(jué)“滿(mǎn)意”;若Max( A1( t),A2( t),A3( t) ) = A2( t),則t∈A2,駕駛員對(duì)實(shí)際駕駛時(shí)間t感覺(jué)“一般”;若Max( A1( t1),A2( t1),A3( t1) ) = A3( t1),則t∈A3,駕駛員對(duì)實(shí)際駕駛時(shí)間t感覺(jué)“差”。
1.2模型的初始狀態(tài)
如圖1所示,令L1、L2的道路通行能力分別為C1、C2,駕駛員第k次通過(guò)L1、L2時(shí)的實(shí)際交通量為q1,k、q2,k,車(chē)輛第k次通過(guò)L1、L2到達(dá)B地的實(shí)際通行時(shí)間為t1,k、t2,k。設(shè)每次博弈參與的車(chē)輛總數(shù)Q(假設(shè)為標(biāo)準(zhǔn)小汽車(chē))為定值,即q1,k+q2,k=Q,假設(shè)博弈時(shí)L1、L2路段上均有Q個(gè)位置,每輛車(chē)在每條路徑上都對(duì)應(yīng)1個(gè)固定的位置,在L1上占用位置的車(chē)輛表示該位置上的車(chē)輛上次經(jīng)過(guò)該路段,對(duì)應(yīng)在L2上的位置就空著。每次博弈路徑選擇按照路段車(chē)輛排好的順序進(jìn)行,當(dāng)?shù)趉次滿(mǎn)意度為滿(mǎn)意時(shí),則第k+1次第j位置(忽略L1、L2路段的差異性)上的車(chē)輛將會(huì)繼續(xù)選擇原路徑,即第j位置上的車(chē)輛不會(huì)跳轉(zhuǎn)到另外一條路徑對(duì)應(yīng)的位置上;當(dāng)?shù)趉次滿(mǎn)意度為差時(shí),則第k+1次第j位置上的車(chē)輛將會(huì)選擇另外一條路徑,即第j位置上的車(chē)輛將會(huì)跳轉(zhuǎn)到另外一條路徑對(duì)應(yīng)的位置上;當(dāng)?shù)趉次滿(mǎn)意度為一般時(shí),則第k+1次第j位置上的車(chē)輛將會(huì)有βj的概率跳轉(zhuǎn)到另外一條路徑對(duì)應(yīng)的空位置上( 0≤βj≤1)。
1) h=h+1,v=1,m=0.1,給C1>C2、βj∈[0,1],其中m為路徑L1上的初始分配比例,h、v為存儲(chǔ)記憶的代碼。
2)初始化,給出模型的初始狀態(tài),Q=q0,q1,0=mQ,q2,0=Q-q1,0。
3)根據(jù)式( 1)求得第k次選擇路徑L1、L2的通過(guò)時(shí)間t1,k、t2,k。
4)根據(jù)式( 2)~( 4)求得t1,k、t2,k的時(shí)間感受隸屬度,判斷駕駛員對(duì)第k次路徑選擇的滿(mǎn)意度。
5)由第k次選擇的滿(mǎn)意度確定第k+1次的選擇是否選擇其他路徑。
①I(mǎi)f a1=1,a2=1
L1路徑上的車(chē)輛繼續(xù)選擇L1,L2路徑上的車(chē)輛繼續(xù)選擇L2,有: q1,k+1= q1,k,q2,k+1=q2,k。
②If a1=1,a2=0
確定由路徑L2上轉(zhuǎn)到L1的車(chē)輛,找出路徑L1上的所有空位置;將路徑L2轉(zhuǎn)出的車(chē)輛q2'隨機(jī)分配到L1的空位置上,確定路徑L2的車(chē)輛轉(zhuǎn)入到路徑L1上的位置。有: q1,k+1=q1,k+ q2',q2,k+1= q0-q1,k+1。
③If a1=0,a2=1
確定路徑L1上轉(zhuǎn)到L2的車(chē)輛,找出路徑L2上的所有空位置;將路徑L1轉(zhuǎn)出的車(chē)輛q1'隨機(jī)分配到L2的空位置上,確定路徑L1的車(chē)輛轉(zhuǎn)入到路徑L2上的位置。有: q2,k+1= q2,k+ q'1,q1,k+1= q0-q2,k+1。
④If a1=0,a2=0
分別確定路徑L1轉(zhuǎn)到L2的車(chē)輛、L2轉(zhuǎn)到L1的車(chē)輛,找出路徑L1、L2所有空位置;將路徑L1轉(zhuǎn)出的車(chē)輛q1″隨機(jī)分配到L2的空位置上,確定路徑L1的車(chē)輛轉(zhuǎn)入到路徑L2上的位置;將路徑L2轉(zhuǎn)出的車(chē)輛q2″隨機(jī)分配到L1的空位置上,確定路徑L2的車(chē)輛轉(zhuǎn)入到路徑L1上的位置。有: q1,k+1=q1,k-q1″+ q2″,q2,k+1=q0-q1,k+1。
⑤If a1=0,a2=-1
確定路徑L1轉(zhuǎn)到L2的車(chē)輛,找出路徑L2上的所有空位置;將L2上的車(chē)輛全部轉(zhuǎn)入到L1上,確定路徑L2的車(chē)輛轉(zhuǎn)入到路徑L1上的位置;將路徑L1轉(zhuǎn)出的車(chē)輛q1'''隨機(jī)分配到L2的空位置上,確定路徑L1的車(chē)輛轉(zhuǎn)入到路徑L2上的位置。有: q2,k+1=q1''',q1,k+1= q0-q2,k+1。
⑥If a1=-1,a2=0
確定路徑L2上轉(zhuǎn)到L1的車(chē)輛,找出路徑L1上的所有空位置;將L1上的車(chē)輛全部轉(zhuǎn)入到L2上,確定路徑L1的車(chē)輛轉(zhuǎn)入到路徑L2上的位置;將路徑L2轉(zhuǎn)出的車(chē)輛q2'''隨機(jī)分配到L1的空位置上,確定路徑L2的車(chē)輛轉(zhuǎn)入到路徑L1上的位置。有: q1,k+1=q2''',q2,k+1= q0-q1,k+1。
⑦If a1=-1,a2=1
找出路徑L2上的所有空位置,將L1上的車(chē)輛全部轉(zhuǎn)入到L2上,確定路徑L1的車(chē)輛轉(zhuǎn)入到路徑L2上的位置。有: q1,k+1= 0,q2,k+1=q0。
⑧If a1=1,a2=-1
找出路徑L1上的所有空位置,將L2上的車(chē)輛全部轉(zhuǎn)入到L1上,確定路徑L2的車(chē)輛轉(zhuǎn)入到路徑L1上的位置。有: q1,k+1= q0,q2,k+1=0。
⑨If a1=-1,a2=-1
找出路徑L1、L2上的所有空位置;將L1上的車(chē)輛全部轉(zhuǎn)入到L2上,確定路徑L1的車(chē)輛轉(zhuǎn)入到路徑L2上的位置;將L2上的車(chē)輛全部轉(zhuǎn)入到L1上,確定L2的車(chē)輛轉(zhuǎn)入到路徑L1上的位置。有: q1,k+1= q2,k,q2,k+1= q1,k。
6) sumq1,k+1,sumq2,k+1。
7) k=k+1,若k<100,轉(zhuǎn)3) ;否則,轉(zhuǎn)8)。
8)若m<1,Z( h,v) = q1,100,m=m+0.1,v=v+1,轉(zhuǎn)2),否則轉(zhuǎn)9)。
9) q0=q0+Δq,若q0<2( C1+C2),轉(zhuǎn)1),否則結(jié)束。
算例中,取C1=1 500 pcu/h,C2=1 000 pcu/h,t0=30 s,q0=1 000輛,βj∈[0,1],Δq=500輛,路徑L1的初始比例m從0依次增加至1。
第99次和第100次的博弈結(jié)果如圖2所示。
圖2不同初始狀態(tài)下的博弈結(jié)果
1)仿真結(jié)果表明:
當(dāng)參與博弈的車(chē)輛數(shù)Q<2 500(路網(wǎng)的總通行能力)時(shí),路徑L1、L2會(huì)達(dá)到穩(wěn)定平衡的狀態(tài),路徑L1、L2的擁擠程度接近,路網(wǎng)的利用率較高,該狀態(tài)下路網(wǎng)不需要發(fā)布誘導(dǎo)信息。
2)當(dāng)Q>2 500,隨著Q的增大,路徑L1、L2上會(huì)呈現(xiàn)峰谷平衡的狀態(tài),路網(wǎng)的利用率較低,即參與博弈的車(chē)輛數(shù)大于路網(wǎng)的通行能力時(shí),要采取相應(yīng)的管理措施或根據(jù)實(shí)時(shí)路況發(fā)布誘導(dǎo)信息,以降低集聚擁堵的現(xiàn)象。
3)當(dāng)Q一定時(shí),車(chē)輛在路徑L1、L2不同的初始分配比例,對(duì)博弈結(jié)果影響不顯著。
以行為強(qiáng)化理論為基礎(chǔ),利用模糊數(shù)學(xué)建立有限理性模糊博弈模型,得出各種不同初始狀態(tài)下的博弈平衡結(jié)果。無(wú)交通誘導(dǎo)信息的博弈演化過(guò)程反映了在自學(xué)習(xí)機(jī)制下,交通量接近路網(wǎng)通行能力時(shí),無(wú)誘導(dǎo)也能夠達(dá)到交通管理者所期望的良好狀態(tài)。該模型在一定程度上反映了無(wú)誘導(dǎo)信息條件下,駕駛員的路徑選擇規(guī)律,對(duì)誘導(dǎo)策略制定及其如何制定誘導(dǎo)策略有著一定的指導(dǎo)意義。文章只討論了在駕駛員期望時(shí)間相等時(shí),無(wú)誘導(dǎo)信息條件下路網(wǎng)的博弈結(jié)果,今后可進(jìn)一步研究駕駛員期望時(shí)間變化時(shí)路網(wǎng)的博弈狀態(tài),借以指導(dǎo)發(fā)布誘導(dǎo)信息。
參考文獻(xiàn):
[1]魏赟,范炳全,韓印,等.交通誘導(dǎo)信息對(duì)路網(wǎng)中車(chē)輛行為的影響[J].交通運(yùn)輸工程學(xué)報(bào),2009,9( 6) : 114-120.
[2]馬壽峰,卜軍峰,張安訓(xùn).交通誘導(dǎo)中系統(tǒng)最優(yōu)與用戶(hù)最優(yōu)的博弈協(xié)調(diào)[J].系統(tǒng)工程學(xué)報(bào),2005,20( 1) : 30-37.
[3]林娜,王純.基于Stackelberg-Logit博弈的交通誘導(dǎo)模型[J].計(jì)算機(jī)工程與設(shè)計(jì),2014,35( 8) : 2841-2845.
[4]李振龍.誘導(dǎo)條件下駕駛員路徑選擇行為的演化博弈分析[J].交通運(yùn)輸系統(tǒng)工程與信息,2003,3( 2) : 23-27.
[5]魯叢林.誘導(dǎo)條件下的駕駛員反應(yīng)行為的博弈模型[J].交通運(yùn)輸系統(tǒng)工程與信息,2005,5( 1) : 58-61.
[6]劉建美,馬壽峰.基于有限理性的個(gè)體出行路徑選擇進(jìn)化博弈分析[J].控制與決策,2009,24( 10) : 1450-1454.
[7]LIU Jianmei,MA Shoufeng.A dimension-reduced method of sensitivity analysis for stochastic user equilibrium assignment model[J].Applied Mathematical Modelling,2010,34: 325-333.
[8]LIU Jianmei,MA Shoufeng.Algorithms of game models on individual travel behavior[C].Chengdu: The 8th International IEEE Conference of Chinese logistics and transportation professionals,2008.
[9]劉建美.誘導(dǎo)條件下的路徑選擇行為及協(xié)調(diào)方法研究[D].天津:天津大學(xué),2010.
[10]張楊.不確定環(huán)境下城市交通中車(chē)輛路徑選擇研究[D].成都:西南交通大學(xué),2006.
[11]楊佩坤,錢(qián)林波.交通分配中路段行程時(shí)間函數(shù)研究[J].同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版),1994,22( 1) : 41-44.
[12]EREV I,BEREBY-MEYER Y,ROTH A.The effect of adding a constant to allpayoffs: experimental investigation and implications for reinforcement learning models[J].Journal of Economic Behavior and Organization,1999( 39) : 111-128.
(責(zé)任編輯:楊秀紅)
Vehicle Routing Choice Based on Bounded Rationality of Fuzzy Game Under No Guide Information
SHI Guoqiang,ZHOU Daiping,NIE Huadong,YAN Guangcong
( School of Transportation,Chongqing Jiaotong University,Chongqing 400074,China)
Abstract:In this paper,fuzzy mathematics is used as the tool and reinforcement theory as the foundation to establish a model of vehicle routing choice with no guide information based on the bounded rational fuzzy game theory and simulate the game equilibrium through matlab under different initial states.The result shows that the initial allocation proportion of the road network traffic has no obvious effect on its balance status.At the same time,when the total network traffic reaches the traffic capacity of road network,the game result will achieve stable equilibrium.When the traffic is far greater than the road network capacity,the game result will reach the peak valley balance.
Key words:no guide information; driver's route choice; fuzzy mathematics; game theory
作者簡(jiǎn)介:史國(guó)強(qiáng)( 1989—),男,安徽阜陽(yáng)人,碩士研究生,主要研究方向?yàn)榻煌ㄟ\(yùn)輸規(guī)劃與管理.
收稿日期:2015-03-25
DOI:10.3969/j.issn.1672-0032.2015.02.006
文章編號(hào):1672-0032( 2015) 02-0031-05
文獻(xiàn)標(biāo)志碼:A
中圖分類(lèi)號(hào):U491.25