王利明
(內(nèi)蒙古財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與數(shù)學(xué)學(xué)院,呼和浩特 010070)
Gambit 軟件在《對(duì)策論》教學(xué)中的應(yīng)用
王利明
(內(nèi)蒙古財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與數(shù)學(xué)學(xué)院,呼和浩特 010070)
Gambit是求解對(duì)策問(wèn)題的專用軟件,具有操作方便,界面直觀,運(yùn)算速度快等特點(diǎn)。在《對(duì)策論》的課堂教學(xué)中引入Gambit軟件,可以迅速直觀地得到計(jì)算結(jié)果,提高課堂效率,豐富課堂教學(xué)內(nèi)容。
Gambit;對(duì)策論;教學(xué)研究
對(duì)策論(Game Theory),也稱博弈論,是研究理性局中人在利益相互影響的局勢(shì)下競(jìng)爭(zhēng)和合作的理論,在經(jīng)濟(jì)、管理、社會(huì)、政治、軍事、生物等領(lǐng)域都有廣泛應(yīng)用。因此,對(duì)策論已成為經(jīng)濟(jì)管理類專業(yè)學(xué)生需要學(xué)習(xí)的一門(mén)專業(yè)基礎(chǔ)課程。各高等學(xué)校的經(jīng)濟(jì)學(xué)、管理學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)等專業(yè)都會(huì)開(kāi)設(shè)此門(mén)課程。對(duì)策論通常分為非合作對(duì)策和合作對(duì)策,在本科教學(xué)階段主要學(xué)習(xí)非合作對(duì)策。非合作對(duì)策中最基本的解概念是納什均衡,通常需要通過(guò)求解不等式組、線性方程組或線性規(guī)劃來(lái)得到計(jì)算結(jié)果。隨著局中人人數(shù)的增多,策略個(gè)數(shù)的增加,運(yùn)算量可能會(huì)非常大。在《對(duì)策論》的教學(xué)課堂上,引入Gambit軟件輔助教學(xué),可以迅速直觀地得到問(wèn)題結(jié)果。在學(xué)生掌握基本計(jì)算方法后,省去重復(fù)繁瑣的計(jì)算,提高課堂效率。
Gambit軟件是求解對(duì)策論的專用軟件,可以用來(lái)建立對(duì)策模型,分析對(duì)策結(jié)果。最初的版本是1980年代由加州理工學(xué)院的McKelvey開(kāi)發(fā)的,經(jīng)過(guò)不斷地開(kāi)發(fā)完善,如今已經(jīng)成為功能強(qiáng)大的對(duì)策論計(jì)算軟件。它擁有直觀的圖形界面,操作簡(jiǎn)單方便,包含了所有的非合作對(duì)策求解算法。最新的穩(wěn)定版本是Gambit 15,可以在其官方網(wǎng)站免費(fèi)下載使用[1]。下面通過(guò)兩個(gè)例子說(shuō)明Gambit軟件在《對(duì)策論》教學(xué)中的應(yīng)用。
1.1 策略型對(duì)策
例1求解田忌賽馬對(duì)策的納什均衡,支付矩陣見(jiàn)表1。
表1 田忌賽馬的支付矩陣
第一步:在計(jì)算機(jī)桌面點(diǎn)擊開(kāi)始→程序→Gambit,打開(kāi)Gambit軟件。
第二步:在軟件操作窗口點(diǎn)擊File→New→Strategic game或者點(diǎn)擊工具欄的Create a new strategic(table)game圖標(biāo),新建一個(gè)策略型對(duì)策。
第三步:默認(rèn)新建的策略型對(duì)策中有兩個(gè)局中人,每個(gè)人有兩個(gè)策略??梢渣c(diǎn)擊窗口左側(cè)局中人姓名左邊的Add a strategy for this player圖標(biāo)為每個(gè)局中人增加策略。還可以直接點(diǎn)擊修改局中人姓名和策略名稱。本例中輸入數(shù)據(jù)后界面見(jiàn)圖1。
第四步:點(diǎn)擊Tools→Equilibrium或工具欄上的Compute Nash equilibria for this game圖標(biāo),出現(xiàn)求解界面,見(jiàn)圖2。
圖1 田忌賽馬支付矩陣輸入界面
圖2 策略型對(duì)策求解界面
第五步:在求解界面第一個(gè)下拉菜單選擇計(jì)算納什均衡的個(gè)數(shù),第二個(gè)下拉菜單選擇求解方法。此處選擇求解一個(gè)納什均衡,采用Gambit的推薦算法,得到求解結(jié)果,見(jiàn)圖3。
圖3 例1的求解結(jié)果
可以看到得到一個(gè)納什均衡為((1/3,0,0,1/3,1/3,0),(1/3,0,0,1/3,1/3,0))齊王得到的支付為1,田忌為-1。
1.2 擴(kuò)展型對(duì)策
例2在下面的貝葉斯博弈中,求出所有的貝葉斯納什均衡。該博弈的具體情況為:
(1)“自然”以相等的概率選擇博弈1和博弈2;
(2)局中人1了解自然的選擇,但局中人2不了解;
(3)局中人1的策略為T(mén)或B,局中人的策略為L(zhǎng)或R;
(4)博弈的支付矩陣如下:
表2 博弈1
表3 博弈2
第一步:在計(jì)算機(jī)桌面點(diǎn)擊開(kāi)始→程序→Gambit,打開(kāi)Gambit軟件。
第二步:在軟件操作窗口點(diǎn)擊File→New→Extensive game或者點(diǎn)擊工具欄的Create a new extensive(tree)game圖標(biāo),新建一個(gè)擴(kuò)展型對(duì)策。
第三步:默認(rèn)新建的策略型對(duì)策中有兩個(gè)局中人,一個(gè)初始結(jié)點(diǎn)??梢酝ㄟ^(guò)拖拽局中人左邊人像圖標(biāo)到某個(gè)結(jié)點(diǎn)為局中人增加行動(dòng),或者選中某個(gè)結(jié)點(diǎn)后,點(diǎn)擊Edit→Insert move為局中人增加行動(dòng)。同時(shí)設(shè)置各個(gè)結(jié)點(diǎn)所在的信息集,最后輸入在需要的結(jié)點(diǎn)處輸入各個(gè)局中人的支付。輸入完成后的界面見(jiàn)圖4。
圖4 例2的博弈樹(shù)
第四步:點(diǎn)擊Tools→Equilibrium或工具欄上的Compute Nash equilibria for this game圖標(biāo),出現(xiàn)求解界面,見(jiàn)圖5。
圖5 擴(kuò)展型博弈的求解界面
第五步:與策略型相比,多了一個(gè)下拉菜單選擇用擴(kuò)展型博弈還是其對(duì)應(yīng)的策略型博弈求解。此處選擇求解盡可能多的納什均衡,對(duì)擴(kuò)展型博弈尋找純策略均衡,得到求解結(jié)果,見(jiàn)圖6。
可以看到得到三個(gè)純策略納什均衡,分別為((T,T),L),((T,B),R),((B,B),R)。
對(duì)擴(kuò)展性博弈來(lái)說(shuō),還可以通過(guò)View→Strategic game命令得到與其對(duì)應(yīng)的策略型博弈,里對(duì)應(yīng)的策略型博弈,見(jiàn)圖7。
圖7 例2對(duì)應(yīng)的策略型博弈
對(duì)于納什均衡的求解來(lái)說(shuō),隨著問(wèn)題規(guī)模的增加計(jì)算量可能會(huì)非常巨大。因此,在《對(duì)策論》課堂教學(xué)中引入Gambit軟件,可以讓學(xué)生迅速直觀地得到求解結(jié)果,還可以探索分析一些規(guī)模稍大的對(duì)策問(wèn)題,提高學(xué)生的學(xué)習(xí)興趣和學(xué)習(xí)積極性。Gambit軟件只能求解非合作對(duì)策,如果需要求解合作對(duì)策的解,如核心、核仁、Shapley值等,還需配合其他數(shù)學(xué)軟件的使用。
[1]McKelvey,Richard D.,McLennan,Andrew M.,Turocy,Theodore L.(2015).Gambit:Software Tools for Game Theory,Version 15.1.0. http://www.gambit-project.org.
[2]謝政.對(duì)策論[M].國(guó)防科技大學(xué)出版社,2004.
[3]王文舉.經(jīng)濟(jì)博弈論基礎(chǔ)[M].高等教育出版社,2010.
The Application of Gambit in the Teaching of Game Theory
WANG Li-ming
(School of Statistics and Mathematics,Inner Mongolia University of Finance and Economics,Hohhot 010070)
Gambit is a specialized software for game theory which has the characteristics of convenient operation,intuitive interface and fast speed of calculation.By introducing Gambit in game theory teaching,the results can be calculated fast,the teaching efficiency can be improved and the teaching contents can be enriched.
Gambit;Game Theory;Teaching Research
1007-1423(2017)07-0018-04
10.3969/j.issn.1007-1423.2017.07.005
王利明(1983-),男,內(nèi)蒙古財(cái)經(jīng)大學(xué)教師,博士生,研究方向?yàn)閷?duì)策論、多目標(biāo)優(yōu)化
2017-02-06
2017-03-01