張翠平,于瑞康,趙 暉
(1.北京信息科技大學(xué) 計(jì)算機(jī)學(xué)院,北京 100192;2.山東高速物流集團(tuán)有限公司 安全管理部,濟(jì)南 250098;3.北京交通大學(xué) 交通運(yùn)輸學(xué)院,北京 100044)
作為改善路段安全性的重要手段,城市道路交通安全評價(jià)逐漸成為人們關(guān)注的熱點(diǎn)。城市道路網(wǎng)絡(luò)中的節(jié)點(diǎn),信號交叉口是城市道路網(wǎng)絡(luò)通行能力的關(guān)鍵所在。各方向車流之間的沖突錯(cuò)綜復(fù)雜,使得交叉口成為城市交通事故的多發(fā)地帶。其中,右轉(zhuǎn)機(jī)動(dòng)車與相鄰車道直行非機(jī)動(dòng)車有明顯沖突,它們在進(jìn)入沖突點(diǎn)時(shí)會(huì)有博弈行為出現(xiàn)。因而,可以采用博弈論的思想來研究機(jī)動(dòng)車與非機(jī)動(dòng)車的沖突決策行為。
交通沖突是不安全交通行為的外在表現(xiàn)形式,與交通擁堵、交通事故風(fēng)險(xiǎn)高度關(guān)聯(lián)[1]。參與人、策略和收益是博弈論綜合考慮的3個(gè)必備因素,是從收益和結(jié)果來綜合分析和衡量參與人沖突及內(nèi)在風(fēng)險(xiǎn)的科學(xué)。由于城市交通環(huán)境復(fù)雜,無法直觀對其進(jìn)行較全面的認(rèn)識。交通參與人之間的沖突可以采用博弈論方法進(jìn)行分析。Mesterton-Gibbons[2]通過研究交叉口處的機(jī)動(dòng)車博弈行為,將問題建模為對稱非合作博弈,得到了混合策略的最優(yōu)解。Arslanyilmaz等[3]基于博弈的多用戶在線駕駛訓(xùn)練系統(tǒng),研究了新手駕駛員的危險(xiǎn)感知能力特征。Feldmann[4]研究了具有自利性的出行者在共享網(wǎng)絡(luò)中的出行行為,假設(shè)用戶通過極小化其潛在利益來選擇其出行路徑,并與其它交通參與者進(jìn)行博弈,則有穩(wěn)定的納什均衡點(diǎn)存在。Liu等[5]以我國無信號交叉口駕駛員的風(fēng)險(xiǎn)感知為研究對象,結(jié)合風(fēng)險(xiǎn)感知對無信號交叉口駕駛員的博弈交互行為進(jìn)行了分析。邵祖峰[6]建立了交通管理方和交通參與者的博弈模型,研究表明兩者的博弈是一個(gè)混合戰(zhàn)略均衡,且管理方的檢查行為與參與方的違章行為具有概率意義上的依存性。董甜甜等[7]對政府和出行者2個(gè)博弈主體進(jìn)行分析,利用博弈論方法從政府角度對出行者的出行行為選擇進(jìn)行研究,通過運(yùn)用混合戰(zhàn)略模型中的效用函數(shù)公式綜合分析政府和出行者的期望效用,探討政府用來緩解交通擁堵的經(jīng)濟(jì)政策。牟秋[8]對普遍存在的交叉口左轉(zhuǎn)機(jī)動(dòng)車強(qiáng)制變道行為,運(yùn)用博弈論思想從變道特性、變道模型、變道延誤、變道安全及管理策略等方面展開研究,并提出了對危險(xiǎn)變道行為的監(jiān)控與處罰方法。
國內(nèi)外學(xué)者主要針對機(jī)動(dòng)車和行人交通沖突進(jìn)行了研究,而很少針對機(jī)動(dòng)車與非機(jī)動(dòng)車的沖突進(jìn)行分析。本文針對交叉口右轉(zhuǎn)機(jī)動(dòng)車與非機(jī)動(dòng)車的沖突行為,采用博弈論的方法展開研究。
右轉(zhuǎn)機(jī)動(dòng)車一般不受信號燈控制,其與相對靈活的非機(jī)動(dòng)車在接近交叉口的時(shí)候會(huì)發(fā)生博弈行為,博弈雙方的決策會(huì)對沖突的嚴(yán)重性產(chǎn)生影響。當(dāng)右轉(zhuǎn)機(jī)動(dòng)車與非機(jī)動(dòng)車到達(dá)交叉口時(shí),兩類局中人開始博弈。右轉(zhuǎn)機(jī)動(dòng)車與非機(jī)動(dòng)車在通過沖突區(qū)域的過程中,若機(jī)動(dòng)車或非機(jī)動(dòng)車未改變原有運(yùn)動(dòng)狀態(tài)且未發(fā)生沖突,則此時(shí)雙方的收益均為0;若機(jī)動(dòng)車或非機(jī)動(dòng)車通過沖突區(qū)域時(shí)需要等待,或發(fā)生了交通沖突,則此時(shí)收益為負(fù)。因此,機(jī)動(dòng)車和非機(jī)動(dòng)車的收益主要包括延誤和沖突風(fēng)險(xiǎn)2個(gè)部分。對于延誤帶來的收益,設(shè)機(jī)動(dòng)車的延誤損失為d1 d,非機(jī)動(dòng)車的延誤損失為d2 d;對于沖突帶來的收益,設(shè)機(jī)動(dòng)車因發(fā)生沖突產(chǎn)生的風(fēng)險(xiǎn)損失為d1c,且d1 d遠(yuǎn)小于d1c,對于任一嚴(yán)重等級的沖突,其發(fā)生概率值用Pc表示,那么對于機(jī)動(dòng)車,其沖突損失的期望可以表示為Pc·d1c。同樣地,設(shè)非機(jī)動(dòng)車發(fā)生沖突產(chǎn)生的風(fēng)險(xiǎn)損失為d2c,且d2 d遠(yuǎn)小于d2c,則非機(jī)動(dòng)車承擔(dān)沖突發(fā)生后的損失期望為Pc·d2c。
根據(jù)沖突特征,對于機(jī)動(dòng)車與非機(jī)動(dòng)車手雙方必須考慮采取不同決策時(shí)的延誤和風(fēng)險(xiǎn)方法,機(jī)動(dòng)車決策行為的收益函數(shù)為:
搶行決策:
d1=Pc·d1c
(1)
等待決策:
d1=Pc(d1c+d1 d)
(2)
非機(jī)動(dòng)車決策行為收益函數(shù)為:
搶行決策:
d2=Pc·d2c
(3)
等待決策:
d2=Pc(d2c+d2 d)
(4)
經(jīng)過實(shí)地考察,本文作者選取車公莊大街-車公莊南街信號交叉口進(jìn)行交通實(shí)測。根據(jù)觀測數(shù)據(jù),計(jì)算得到機(jī)動(dòng)車與非機(jī)動(dòng)車的決策沖突概率Pc如表1所示。
表1 不同決策行為對應(yīng)的不同等級沖突風(fēng)險(xiǎn)概率 %
一般情況下,無論是機(jī)動(dòng)車還是非機(jī)動(dòng)車,速度越快,其通過交叉口的時(shí)間就越短,延誤損失也就越小。因而當(dāng)發(fā)生的沖突嚴(yán)重程度較高時(shí),對于機(jī)動(dòng)車而言,其延誤損失d2 d比非機(jī)動(dòng)車的延誤損失d1 d小得多;而另一方面,無論是機(jī)動(dòng)車還是非機(jī)動(dòng)車,其速度越快,其安全風(fēng)險(xiǎn)越高,損失越大。當(dāng)發(fā)生的沖突嚴(yán)重程度較高時(shí),非機(jī)動(dòng)車的風(fēng)險(xiǎn)損失d1c遠(yuǎn)小于機(jī)動(dòng)車風(fēng)險(xiǎn)損失d2c。機(jī)動(dòng)車和非機(jī)動(dòng)車不同沖突風(fēng)險(xiǎn)等級下的風(fēng)險(xiǎn)與損失如表2所示。一般情況下,沖突風(fēng)險(xiǎn)損失值取值區(qū)間為[-9,-1],損失值越小則沖突發(fā)生的風(fēng)險(xiǎn)越大。
表2 機(jī)動(dòng)車與非機(jī)動(dòng)車沖突風(fēng)險(xiǎn)損失值
根據(jù)機(jī)動(dòng)車與非機(jī)動(dòng)車的決策行為收益函數(shù),可計(jì)算出機(jī)動(dòng)車與非機(jī)動(dòng)車的決策行為收益值,如表3所示。
表3 機(jī)動(dòng)車駕駛員決策行為收益值
構(gòu)建完整的沖突博弈模型需要對參與人及其策略進(jìn)行分析。根據(jù)機(jī)動(dòng)車與非機(jī)動(dòng)車沖突的時(shí)空規(guī)律,其博弈過程可看作是一個(gè)序貫博弈。
設(shè)機(jī)動(dòng)車的策略集為{搶行,等待},用{C1,W1}來表示;非機(jī)動(dòng)車的策略集同樣為{搶行,等待},用{C2,W2}來表示。一般來說,可以將這個(gè)序貫博弈從機(jī)動(dòng)車首先決策和非機(jī)動(dòng)車首先決策2個(gè)方面進(jìn)行分析。
假設(shè)機(jī)動(dòng)車首先決策,在博弈開始時(shí),機(jī)動(dòng)車就會(huì)首先對可能發(fā)生的沖突進(jìn)行預(yù)判,設(shè)其概率為P1、P2、P3,然后根據(jù)收益值進(jìn)行決策,此時(shí)機(jī)動(dòng)車的策略為C1、W1,緊接著非機(jī)動(dòng)車根據(jù)機(jī)動(dòng)車的決策狀態(tài)進(jìn)行決策,其策略為C2、W2。
在第一階段,機(jī)動(dòng)車的策略集可表示為{C1C1C1,C1C1W1,C1W1C1,C1W1W1,W1C1C1,W1C1W1,W1W1C1,W1W1W1},用來描述機(jī)動(dòng)車在第一層信息節(jié)點(diǎn)上采取的策略。在第二階段,非機(jī)動(dòng)車的策略集合可表示為{C2C2,C2W2,W2C2,W2W2},用來描述非機(jī)動(dòng)車在第二層信息節(jié)點(diǎn)上采取的策略。通過上述分析,可得到雙方的效用支付為d1(Pk;(s1,s2)),d2(Pk;(s1,s2)),如圖1所示。
圖1 機(jī)動(dòng)車駕駛員首先決策情況下的博弈展開式
假設(shè)在博弈過程中,非機(jī)動(dòng)車首先做出決策,且有C2、W2兩種策略,機(jī)動(dòng)車有C1、W1兩種策略可以選擇。
在第一階段,非機(jī)動(dòng)車的決策集合可表示為{C2C2C2,C2C2W2,C2W2C2,C2W2W2,W2C2C2,W2C2W2,W2W2C2,W2W2W2},用來描述機(jī)動(dòng)車在第一層信息節(jié)點(diǎn)上采取的策略。在第二階段,機(jī)動(dòng)車的策略集合可表示為{C1C1,C1W1,W1C1,W1W1},用來描述機(jī)動(dòng)車在第二層信息節(jié)點(diǎn)上采取的策略。通過上述分析,可得到局中人雙方在博弈過程中的支付效用d1(Pk;(s2,s1)),d2(Pk;(s2,s1)),如圖2所示。
圖2 非機(jī)動(dòng)車首先決策情況下的博弈展開式
根據(jù)2種情況下的博弈展開式,能夠構(gòu)建機(jī)動(dòng)車與非機(jī)動(dòng)車的收益矩陣。
當(dāng)機(jī)動(dòng)車首先決策時(shí),如果機(jī)動(dòng)車和非機(jī)動(dòng)車都采取搶行策略,勢必增加發(fā)生嚴(yán)重沖突的可能性,非機(jī)動(dòng)車在這個(gè)博弈過程中承擔(dān)了巨大的風(fēng)險(xiǎn);反之,如果機(jī)動(dòng)車和非機(jī)動(dòng)車都采取等待的策略,則會(huì)同時(shí)減小沖突風(fēng)險(xiǎn),增加等待時(shí)間,出現(xiàn)沖突風(fēng)險(xiǎn)與延誤相互抵消的結(jié)果。因此,可以重新博弈雙方局中人各自的收益值,如表4所示。
當(dāng)非機(jī)動(dòng)車首先決策時(shí),如果機(jī)動(dòng)車和非機(jī)動(dòng)車都采取搶行策略,則發(fā)生嚴(yán)重沖突的概率必然增大,此時(shí),非機(jī)動(dòng)車將承擔(dān)更高的風(fēng)險(xiǎn);反之,如果機(jī)動(dòng)車和非機(jī)動(dòng)車無論何方首先決策,都采取等待策略,則必然會(huì)降低沖突風(fēng)險(xiǎn)。但與此同時(shí),由于機(jī)動(dòng)車非機(jī)動(dòng)車均增加了等待時(shí)間,故可能發(fā)生風(fēng)險(xiǎn)與延誤相互抵消的情況。沖突風(fēng)險(xiǎn)與博弈局中人雙方的收益值如表5所示。
表4 機(jī)動(dòng)車駕駛員首先決策的收益
表5 非機(jī)動(dòng)車首先決策的收益
已知機(jī)動(dòng)車和非機(jī)動(dòng)車其中一方首先決策時(shí)的博弈展開式及決策收益,就可以構(gòu)建基于動(dòng)態(tài)非合作博弈的機(jī)動(dòng)車和非機(jī)動(dòng)車的沖突決策模型。
當(dāng)機(jī)動(dòng)車首先決策,根據(jù)表2得到的收益矩陣得到博弈展開式如圖3所示。
當(dāng)觀察到機(jī)動(dòng)車首先進(jìn)行決策時(shí),由于機(jī)動(dòng)車速度較快,非機(jī)動(dòng)車無法預(yù)判沖突的嚴(yán)重程度。對于機(jī)動(dòng)車來講,在第一層信息節(jié)點(diǎn)上,在發(fā)生中等沖突和輕微沖突的情況下采取搶行(C1)都將是其最優(yōu)策略;對非機(jī)動(dòng)車來講,機(jī)動(dòng)車首先決策且優(yōu)先選擇搶行(C1),那么在第二層信息節(jié)點(diǎn)上,其選擇等待(W2)都是最好選擇。
圖3 機(jī)動(dòng)車駕駛員首先決策情況下的博弈展開式
根據(jù)以上分析,能夠計(jì)算出均衡解的收益,根據(jù)調(diào)查數(shù)據(jù)標(biāo)定的風(fēng)險(xiǎn)等級概率值P1、P2和P3分別為:
P1=0.40,P2=0.34,P=0.26
(5)
因此,機(jī)動(dòng)車和非機(jī)動(dòng)車的期望收益(EX1,EX2)為:
EX1=P1·d1(P1;(C1,W2))+P2·d1
(P2;(C1,W2))+P3·d1(P3;(C1,W2))=
0.4×(-0.3)+0.34×(-1.5)+
0.26×(-3)=-1.41
(6)
EX2=P1·d2(P1;(C1,W2))+P2·
d2(P2;(C1,W2))+P3·d2(P3;(C1,W2))=
0.4×(-1.3)+0.34×(-2.7)+
0.26×(-2.9)=-2.19
(7)
當(dāng)非機(jī)動(dòng)車首先決策,根據(jù)表2的收益矩陣得到博弈展開式如圖4所示。博弈過程開始時(shí),非機(jī)動(dòng)車首先決策,隨后機(jī)動(dòng)車作出決策。在第一層信息節(jié)點(diǎn)上,在發(fā)生中等沖突和輕微沖突的情況下,其采取搶行(C2)都是其最優(yōu)策略。無論非機(jī)動(dòng)車如何決策,對于機(jī)動(dòng)車來講,除了在信息節(jié)點(diǎn)1.3上,其都會(huì)優(yōu)先選擇搶行以獲得最大收益。但實(shí)際上,機(jī)動(dòng)車與非機(jī)動(dòng)車在交通系統(tǒng)中所處的地位差異懸殊,非機(jī)動(dòng)車對沖突的嚴(yán)重程度感知并不明確,在信息節(jié)點(diǎn)1.1、1.2上,無論是選擇搶行還是等待策略,其發(fā)生輕微沖突的收益差和發(fā)生中等沖突的收益差遠(yuǎn)小于發(fā)生嚴(yán)重沖突時(shí)的收益差。由此可以看出,非機(jī)動(dòng)車選擇等待是最佳決策。當(dāng)非機(jī)動(dòng)車選擇等待決策(W2)時(shí),機(jī)動(dòng)車選擇搶行決策(C1)仍是最好選擇。
圖4 非機(jī)動(dòng)車首先決策情況下的博弈展開式
d1(P2;(W2,C1))+P3·
d1(P3;(W2,C1))=
0.4×(-1.3)+0.34×(-2.7)+
0.26×(-2.9)=-2.19
(8)
P2·d2(P2;(W2,C1))+P3·d2
(P3;(W2,C1))=0.4×0+0.34×
(-0.7)+0.26×(-2)=-0.76
(9)
綜合以上結(jié)果,能夠看出不管機(jī)動(dòng)車或者非機(jī)動(dòng)車哪一個(gè)局中人先行決策,機(jī)動(dòng)車搶行(C1)、非機(jī)動(dòng)車等待(W2)都是其各自的最優(yōu)策略。理論分析結(jié)果雖然如此,但實(shí)際上,非機(jī)動(dòng)車在交叉口處選擇搶行策略而發(fā)生的交通事故屢見不鮮,所以還應(yīng)該將繼續(xù)重視交叉口處非機(jī)動(dòng)車的安全問題。
本文運(yùn)用博弈論分析了機(jī)動(dòng)車和非機(jī)動(dòng)車的決策行為。通過對右轉(zhuǎn)機(jī)動(dòng)車與直行非機(jī)動(dòng)車沖突行為的建模分析,對機(jī)動(dòng)車與非機(jī)動(dòng)車的沖突行為進(jìn)行了研究。結(jié)果表明,機(jī)動(dòng)車選擇搶行,非機(jī)動(dòng)車選擇等待是其各自的最優(yōu)策略。
在信號控制交叉口,其每一種控制狀態(tài)稱為一個(gè)信號燈相位,即對各種進(jìn)口道不同方向所顯示的不同燈色的組合。通過調(diào)查發(fā)現(xiàn),在交叉口等待的非機(jī)動(dòng)車在相位變換初期更易于做出搶行策略,從而造成安全隱患;而在變換以后的相位中后期不易做出搶行策略,不易發(fā)生交通事故和擁堵現(xiàn)象。基于這種觀察,可以采用機(jī)動(dòng)車非機(jī)動(dòng)車相位不同步的控制策略對交叉口處的交通流進(jìn)行管理,以提高運(yùn)行效率,降低交通安全風(fēng)險(xiǎn)。
除此之外,在早晚高峰期非機(jī)動(dòng)車流量較大,可以在早晚高峰時(shí)段禁止右轉(zhuǎn)機(jī)動(dòng)車通行,同樣也能達(dá)到提高效率,提高安全水平的目的。