趙文強(qiáng) 蔣菡
Game Analysis of College Students Selecting Seats in Class Based on Replicator Dynamic Game
摘要: 運(yùn)用大規(guī)模有限理性群體復(fù)制動(dòng)態(tài)博弈模型,結(jié)合了大學(xué)生在上課時(shí)坐在教室前排和坐在教室后排時(shí)的收益情況,分析了大學(xué)生上課選座位的動(dòng)態(tài)演化過(guò)程。結(jié)果表明:在教室座位有空缺的條件下,大學(xué)生會(huì)傾向于坐在教室后排而不是教室前排,最終全部坐在后排導(dǎo)致前排無(wú)人坐,即使少數(shù)學(xué)生偏離了該穩(wěn)定狀態(tài),復(fù)制動(dòng)態(tài)最終依然會(huì)收斂于上述穩(wěn)定狀態(tài)。
Abstract: This paper uses a large-scale finite rational group copy dynamic game model, combined with the income of college students sitting in the front row of the classroom and sitting in the back row of the classroom during the class, analyzes the dynamic evolution process of college students' seat selection. The results show that under the condition that there are vacancies in the classroom, college students tend to sit in the back row of the classroom rather than in front of the classroom. Eventually all sitting in the back row leads to no one sitting in the front row, even a small number of students from the steady state, dynamic replication will still converge to the final steady state.
關(guān)鍵詞: 有限理性;復(fù)制動(dòng)態(tài)博弈;選座位;穩(wěn)定狀態(tài)
Key words: bounded rationality;replicator dynamic game;seat selection;steady state
中圖分類(lèi)號(hào):F224.9 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-4311(2018)15-0014-03
0 引言
大學(xué)教室里經(jīng)常出現(xiàn)這樣一種現(xiàn)象,代課老師在講臺(tái)上激情蓬勃地講課,但學(xué)生卻盡可能地遠(yuǎn)離老師的視線,例如,教室里一共有八排座位,座位的數(shù)量大于來(lái)上課的學(xué)生數(shù)量,上課時(shí)學(xué)生坐滿了后六排座位,最前面的兩排卻沒(méi)人坐,尤其是最后一排的座位“一票難求”,搶不到后排座位的學(xué)生,才會(huì)無(wú)奈的坐在靠前一些的座位。這樣的例子在如今的大學(xué)校園里比比皆是,無(wú)不讓人痛心。這種現(xiàn)象的出現(xiàn)與中小學(xué)生托關(guān)系坐到前排形成鮮明的對(duì)比,折射出老師和學(xué)校乃至大學(xué)教育的無(wú)奈[1]。
國(guó)內(nèi)社會(huì)對(duì)大學(xué)生選擇坐后排的現(xiàn)象進(jìn)行過(guò)一系列討論,討論的結(jié)果都是基于教育學(xué)和社會(huì)學(xué)的角度而對(duì)如今大學(xué)生的學(xué)習(xí)態(tài)度和人生觀進(jìn)行批評(píng),并沒(méi)有從演化博弈論的角度出發(fā)而去論證這種現(xiàn)象產(chǎn)生的必然性。
演化博弈論以博弈方具有有限理性為基礎(chǔ),研究博弈方組成的群體成員采用特定策略比例的變化趨勢(shì)和穩(wěn)定性,它對(duì)分析預(yù)測(cè)經(jīng)濟(jì)關(guān)系的長(zhǎng)期趨勢(shì)和解釋各種普遍性社會(huì)現(xiàn)象有重要的作用[2]。謝識(shí)予對(duì)進(jìn)化博弈論的思想、方法、意義和發(fā)展前景進(jìn)行了討論[3],王先甲等探討了演化博弈論中的各種學(xué)習(xí)模型,提出了有限理性的實(shí)質(zhì)是怎么去學(xué)習(xí)[4],吳昊等探討了合作競(jìng)爭(zhēng)博弈的演化模型,用“進(jìn)化穩(wěn)定策略”來(lái)描述合作競(jìng)爭(zhēng)博弈的長(zhǎng)期演化趨勢(shì)[5],孫慶文等基于不完全信息假設(shè),借鑒生物進(jìn)化過(guò)程中“復(fù)制動(dòng)態(tài)”的思想,對(duì)非對(duì)稱(chēng)2×2演化博弈均衡進(jìn)行漸近穩(wěn)定性分析,完整地給出了其定性行為的拓?fù)涞葍r(jià)分類(lèi)[6],劉德海等運(yùn)用演化博弈理論建立了重大突發(fā)事件的疫情傳播方程[7],王玉燕等采用演化博弈方法研究逆向供應(yīng)鏈在企業(yè)供應(yīng)鏈中的推廣應(yīng)用[8]。
本文運(yùn)用演化博弈論,建立坐后排者和坐前排者的有限理性群體復(fù)制動(dòng)態(tài)博弈模型,分析出均衡結(jié)果,給出一系列的結(jié)論。
1 有限理性和復(fù)制動(dòng)態(tài)模型
1.1 有限理性
靜態(tài)博弈和動(dòng)態(tài)博弈基本上是以博弈方的完全理性為基礎(chǔ),但在現(xiàn)實(shí)中對(duì)決策者的完全理性假設(shè)是很難滿足的[9]。如果博弈的參與人不滿足完全理性假設(shè),稱(chēng)為“有限理性博弈方”,這時(shí)博弈可稱(chēng)之為“有限理性博弈”[10]。有限理性意味著博弈方往往不會(huì)一開(kāi)始就找到最優(yōu)策略,會(huì)在博弈過(guò)程中學(xué)習(xí)博弈,通過(guò)試錯(cuò)尋找較好的策略。
1.2 演化博弈和復(fù)制動(dòng)態(tài)模型
有限理性博弈方有不同的理性層次,學(xué)習(xí)速度差別很大。參與人的學(xué)習(xí)速度慢表現(xiàn)為向優(yōu)勢(shì)策略轉(zhuǎn)變是一個(gè)漸進(jìn)的過(guò)程,稱(chēng)之為演化博弈。演化博弈的復(fù)制動(dòng)態(tài)模型最早在1978年由Taylor和Jonker提出,復(fù)制動(dòng)態(tài)模型來(lái)源于生物學(xué)中的進(jìn)化動(dòng)態(tài)方程?!昂灢┺膮f(xié)議”的例子很好的說(shuō)明了復(fù)制動(dòng)態(tài)模型。
參與人A和參與人B要簽訂一個(gè)協(xié)議,兩個(gè)參與人都有“同意”和“不同意”兩種可選策略,他們的支付矩陣如表1所示。
帕累托最優(yōu)的納什均衡是(同意,同意)。
參與人往往不可能一開(kāi)始就能找到最優(yōu)的策略[11],有參與人會(huì)選擇“不同意”。假設(shè)“同意”類(lèi)型的參與人占比為x,“不同意”類(lèi)型的參與人占比為1-x(大群體中忽略參與人本身對(duì)其他類(lèi)型參與人占比的影響),“同意”和“不同意”兩種類(lèi)型的參與人各自的期望收益uy和un分別為:
uy=x·1+(1-x)·0=x un=x·0+(1-x)·0=0
群體成員的平均收益為:
只要“不同意”類(lèi)型的參與人有基本的直覺(jué)和判斷能力,遲早會(huì)發(fā)現(xiàn)改變策略對(duì)自己是有利的,即x和1-x是隨時(shí)間變化的。博奔方策略類(lèi)型比例動(dòng)態(tài)變化是有限理性博奔分析的核心,動(dòng)態(tài)變化的速度取決于兩個(gè)因素,一是模仿對(duì)象的數(shù)量大小,二是模仿對(duì)象的成功程度(可用模仿對(duì)象策略收益超過(guò)平均收益的幅度表示)。
以“同意”類(lèi)型參與人比例為例,其動(dòng)態(tài)變化速度可用微分方程(1)表示:
上述動(dòng)態(tài)微分方程與生物進(jìn)化中描述特定性狀個(gè)體頻數(shù)自然變化選擇過(guò)程的“復(fù)制動(dòng)態(tài)”方程是一致的,所以把它稱(chēng)作“復(fù)制動(dòng)態(tài)方程”。
當(dāng)x=0時(shí),即初始時(shí)刻沒(méi)有參與人采用“同意”策略,變化速率為0,所有參與人都不會(huì)改變策略;
當(dāng)0 當(dāng)x=1時(shí),變化速率為0,參與人全部采用“同意”策略。 復(fù)制動(dòng)態(tài)過(guò)程收斂到x*=1時(shí),學(xué)習(xí)過(guò)程停止,有限理性參與人找到了本博弈中效率較高的納什均衡,即x*=1是一個(gè)穩(wěn)定狀態(tài)。 2 大學(xué)生上課選座位的演化博弈分析 2.1 問(wèn)題描述 研一的時(shí)候要上英語(yǔ)課,上課的教室一共有八排座位,來(lái)上課的學(xué)生一共只能坐滿六排座位,老師為了保證課堂教學(xué)質(zhì)量,鼓勵(lì)大家盡量坐在教室的前排,結(jié)果卻事與愿違,前兩周上課時(shí)還有學(xué)生坐在前兩排,后來(lái)大家就心照不宣的從第三排開(kāi)始往后坐,前兩排徹底無(wú)人坐。老師發(fā)現(xiàn)了這種現(xiàn)象后對(duì)全班學(xué)生進(jìn)行了批評(píng),并且強(qiáng)制大家坐滿前兩排座位,但隨著時(shí)間推移,大家又一次心照不宣的從第三排開(kāi)始往后坐,一直到課程結(jié)束,前兩排座位都處于閑置狀態(tài)。 根據(jù)本人的切身體會(huì)以及與同學(xué)之間的交流,發(fā)現(xiàn)大家不愿意坐前排有以下幾個(gè)原因: ①避免被老師提問(wèn)。老師一般會(huì)讓前排的同學(xué)來(lái)回答課堂問(wèn)題,但大多數(shù)同學(xué)都不想被老師提問(wèn),所以選擇坐后排。 ②方便做自己的事情。很多同學(xué)上課不認(rèn)真聽(tīng)講卻在做其他的事情,例如:玩手機(jī)、看小說(shuō)等等,他們認(rèn)為坐在后排不容易被老師發(fā)現(xiàn)。 ③坐在后排比較有安全感。很多同學(xué)認(rèn)為,不管怎樣,有人坐在自己前排會(huì)讓自己覺(jué)得更有安全感,有一種被保護(hù)的感覺(jué),所以他們希望更多的人坐在自己前排,而自己坐在后排。 2.2 模型建立與分析 我們假設(shè)教室里只有兩名學(xué)生:學(xué)生A和學(xué)生B,對(duì)他們之間的博弈做出如下假設(shè): ①如果A和B都坐在教室的前排,兩人的收益都是1。這時(shí)兩人都認(rèn)真聽(tīng)課,但很可能會(huì)被老師提問(wèn),并且不能在上課時(shí)做其他的事情。 ②如果A坐在教室前排,B坐在教室后排,A只能選擇認(rèn)真聽(tīng)課,不能做其他事情,而B(niǎo)可以認(rèn)真聽(tīng)課,還可以做自己喜歡的其他事情,這時(shí)A的收益為0,B的收益為2。反之如果B坐在教室前排,A坐在教室后排,A的收益為2,B的收益為0。 ③如果A和B都坐在教室的后排,兩人雖然都可以選擇聽(tīng)課或者做其他的事情,但沒(méi)有人坐到前排,兩人都會(huì)遭到老師的批評(píng),這時(shí)兩人的收益都為1。 在博弈中,A、B兩人的支付矩陣如表2所示。 根據(jù)該博奔的支付矩陣不難看出,它的純策略納什均衡是(后排,后排)。如果是在兩個(gè)滿足完全理性假設(shè)的博弈方之間進(jìn)行博弈,那么這個(gè)博弈的結(jié)果是A、B兩人都會(huì)選擇坐后排,但存在有博弈參與人理性層次很低的情況下,必然會(huì)有參與人選擇坐前排,這時(shí)就需要利用理性層次較低的大規(guī)模有限理性群體復(fù)制動(dòng)態(tài)博弈模型來(lái)分析該博弈。 假設(shè)坐前排學(xué)生的比例是x,坐后排學(xué)生的比例是1-x,所有學(xué)生中隨機(jī)配對(duì)進(jìn)行該博弈時(shí),每個(gè)參與人可能遇到“前排”的對(duì)手,也可能遇到“后排”的對(duì)手,前者的概率是x,后者的概率是1-x?!扒芭拧焙汀昂笈拧眱煞N類(lèi)型參與人各自的期望收益uf和ub分別為: uf=x·1+(1-x)·0=x ub=x·2+(1-x)·1=x+1 教室內(nèi)所有學(xué)生的平均收益為: u=x·x+(1-x)·(x+1)=1 根據(jù)上述結(jié)果可以看出,“后排”類(lèi)型參與人的期望收益高于“前排”類(lèi)型參與人的期望收益,也高于教室內(nèi)所有學(xué)生的平均收益。當(dāng)收益較差的參與人,即“前排”類(lèi)型參與人發(fā)現(xiàn)坐在“后排”對(duì)自己更有利時(shí),他們就會(huì)改變策略,從而坐到教室“后排”。這種動(dòng)態(tài)變化的速度可用微分方程(2)表示: =(1-x)(ub-u)=(1-x)x=x-x2(0?燮x?燮1)(2) 當(dāng)x=0時(shí),變化速度為0。即初始時(shí)刻沒(méi)有選擇坐前排的學(xué)生,那么選擇坐前排的學(xué)生就不會(huì)出現(xiàn)。 當(dāng)0 當(dāng)x=1時(shí),變化速度為0,即所有學(xué)生都選擇坐后排,“后排”的學(xué)生數(shù)量不再變化。 微分方程(2)的相位圖如圖1所示。 根據(jù)微分方程(2)和相位圖1可知,除了x=0以外,該博弈從其他初始情況出發(fā)的復(fù)制動(dòng)態(tài)過(guò)程,最終都會(huì)使所有博弈方趨向于選擇坐后排,即x=1。x*=0和x*=1是上述復(fù)制動(dòng)態(tài)的兩個(gè)穩(wěn)定狀態(tài),x*=1是現(xiàn)實(shí)中出現(xiàn)的穩(wěn)定狀態(tài)。 當(dāng)x*=1時(shí),所有學(xué)生全部選擇坐在后排,有限理性參與人的學(xué)習(xí)過(guò)程停止,所有參與人都通過(guò)學(xué)習(xí)找到了最好的策略。 當(dāng)代課老師發(fā)現(xiàn)教室前兩排無(wú)人坐時(shí),對(duì)全班同學(xué)進(jìn)行了批評(píng)教育,這時(shí)少數(shù)聽(tīng)話的學(xué)生就按照老師的要求坐在了前兩排,我們假設(shè)比例為?著的學(xué)生坐在了前兩排(記為前排),比例為1-?著的學(xué)生依舊坐在后排。這時(shí),選擇“前排”學(xué)生的期望收益為: 對(duì)比(3)(4)兩式可知,選擇坐前排學(xué)生的收益小于選擇坐后排學(xué)生的收益,同時(shí)也低于教室內(nèi)所有學(xué)生的平均收益,因此坐前排的學(xué)生會(huì)轉(zhuǎn)變策略,最終仍然會(huì)趨向于x*=1,即所有學(xué)生都選擇坐在后排,復(fù)制動(dòng)態(tài)博弈最后依然收斂到x*=1,即x*=1是一個(gè)穩(wěn)定狀態(tài)。
對(duì)比可知,x*=1不是穩(wěn)定狀態(tài)。當(dāng)有少數(shù)學(xué)生選擇后排,即偏離0時(shí),選擇后排的學(xué)生會(huì)越來(lái)越多,最終導(dǎo)致趨向于1。
3 結(jié)論
本文運(yùn)用大規(guī)模有限理性群體復(fù)制動(dòng)態(tài)博弈模型,結(jié)合了大學(xué)生在上課時(shí)坐在教室前排和坐在教室后排時(shí)的收益情況,分析了大學(xué)生上課選座位的動(dòng)態(tài)演化過(guò)程。結(jié)果表明:在教室座位有空缺的條件下,大學(xué)生會(huì)傾向于坐在教室后排而不是教室前排,最終全部坐在后排導(dǎo)致前排無(wú)人坐,即使少數(shù)學(xué)生偏離了該穩(wěn)定狀態(tài),復(fù)制動(dòng)態(tài)最終依然會(huì)收斂于上述穩(wěn)定狀態(tài)。因此,要糾正大學(xué)生選擇坐后排而不坐前排的問(wèn)題,僅僅依靠老師在課堂上的監(jiān)督與叮囑是遠(yuǎn)遠(yuǎn)不夠的,學(xué)校應(yīng)該考慮從教學(xué)方式、教學(xué)內(nèi)容和課程安排等角度另謀良策,才有可能根治這一問(wèn)題。
參考文獻(xiàn):
[1]閆建章,劉凌燕.大學(xué)生上課為何愛(ài)坐后排[J].中國(guó)教育報(bào),2011-05-23(006):23.
[2]盧方元.環(huán)境污染問(wèn)題的演化博弈分析[J].系統(tǒng)工程理論與實(shí)踐,2011,9(9):148-149.
[3]謝識(shí)予.有限理性條件下的進(jìn)化博弈理論[J].上海財(cái)經(jīng)大學(xué)學(xué)報(bào),2001,3(5):2-3.
[4]王先甲,全吉,劉偉兵.有限理性下的演化博弈與合作機(jī)制研究[J].系統(tǒng)工程理論與實(shí)踐,2011,31(1):83-84.
[5]吳昊,楊梅英,陳良猷.合作競(jìng)爭(zhēng)博弈中的復(fù)雜性與演化均衡的穩(wěn)定性分析[J].系統(tǒng)工程理論與實(shí)踐,2004,2(2):91.
[6]孫慶文,陸柳,嚴(yán)廣樂(lè),車(chē)宏安.不完全信息條件下演化博弈均衡的穩(wěn)定性分析[J].系統(tǒng)工程理論與實(shí)踐,2003,7(7):11.
[7]劉德海,王維國(guó),孫康.基于演化博弈的重大突發(fā)公共衛(wèi)生事件情景預(yù)測(cè)模型與防控措施[J].系統(tǒng)工程理論與實(shí)踐,2012,5(32):937.
[8]王玉燕,李幫義,申亮.兩個(gè)生產(chǎn)商的逆向供應(yīng)鏈演化博弈分析[J].系統(tǒng)工程理論與實(shí)踐,2008,4(4):43.
[9] 李樹(shù)祥,梁巧轉(zhuǎn),伍勇.海關(guān)走私監(jiān)管的演化博弈分析[J].系統(tǒng)工程理論與實(shí)踐,2009,5(18):29-30.
[10][11]謝識(shí)予.經(jīng)濟(jì)博弈論[M].上海:復(fù)旦大學(xué)出版社,2007.01.