楊偉松
(江西科技師范大學通信與電子學院, 南昌330013 )
?
間諜經(jīng)紀人的最優(yōu)偵查規(guī)模和決策閾值
楊偉松
(江西科技師范大學通信與電子學院, 南昌330013 )
摘要:為了考察爭當少數(shù)者博弈模型中引入間諜經(jīng)紀人后,間諜的偵查規(guī)模和決策閾值分布情況,考察了在不同比例間諜數(shù)目的情況下,間諜采取優(yōu)勝劣汰的原則調(diào)整更換他們的偵查規(guī)?;驔Q策閾值,發(fā)現(xiàn)當間諜數(shù)目較少時,間諜偵查規(guī)模取大數(shù)的數(shù)目比例居多;而當間諜數(shù)目較多時,間諜偵查規(guī)模取小數(shù)的比例居多。當偵查規(guī)模較小時,間諜傾向于取一半的決策閾值;而當偵查規(guī)模較大時,不同間諜的決策閾值分布比較廣泛。
關鍵詞:爭當少數(shù)者博弈;間諜;偵查規(guī)模;決策閾值
0引言
D.Challet和Y.C.Zhang提出的爭當少數(shù)者博弈模型[1-2]假設有N(奇數(shù))個經(jīng)紀人,在某時步必須選擇A方或B方(如表示股票的買賣或開車選擇道路A或道路B等),當每個人獨立地作出選擇后,進入少數(shù)者方的人獲勝(供大于求時,買方獲利;供不應求時,賣方獲利)。每個經(jīng)紀人依據(jù)過去記錄的公共信息作出決定。假定記錄僅包含A方或B方是否為獲勝方,而不告知實際的參與人數(shù),這一系統(tǒng)的公共信息(即取勝方的記錄)可以用二進制序列表示,當A方為獲勝方時用”1”表示,否則用”0”表示。還進一步假定每個經(jīng)紀人的記憶容量有限并且相同,只能記住最近m次的獲勝方記錄,并依賴他們作出當前時刻的決定。一個記憶容量為m的策略是在給定某種獲勝方記錄(m比特歷史)下對下一時刻獲勝方的預測。經(jīng)紀人根據(jù)策略的預測選擇去A方或B方,對給定m,有2m種不同的歷史,22m種不同的策略。
博弈開始時,每人隨機地從這22m個策略中抽出S個(允許相同)作為自己的策略。每過一時刻,每人對作出正確預測獲勝方的策略加一虛分,否則扣一分。這樣各人每次決策時,就依據(jù)這些策略的虛分,選擇虛分最高者進行決策 (如有多個相同虛分最高策略,則從中任選一個進行決策)。經(jīng)紀人共同享有的信息,即m位的二進制獲勝方歷史記錄則去掉左邊一位,而在右端加上一位當前時刻的獲勝方記錄。
自從爭當少數(shù)者博弈模型提出以后,由于它揭示刻畫了大量社會,經(jīng)濟,生態(tài)系統(tǒng)中的普遍現(xiàn)象,立即成為熱門的研究課題,出現(xiàn)了大量的研究工作。我本人以前也對這個模型做過若干個研究工作[3-6]。例如,將模型中經(jīng)紀人的二進制串策略看成不同歷史條件下子策略的集合體,對子策略按成功率從大到小排序,替換成功率小的子策略,或者對表現(xiàn)好的策略按遺傳算法產(chǎn)生子代策略用來替換表現(xiàn)差的策略,能夠使模型系統(tǒng)功能和資源利用效率得到優(yōu)化。
You-Yang Yu 等[7]設想在基本爭當少數(shù)者博弈模型引入間諜經(jīng)紀人,間諜經(jīng)紀人不具有普通經(jīng)紀人的對應于各種公共信息歷史條件的二進制串策略,而是偵查一小組普通經(jīng)紀人的決策,然后再采用該小組普通經(jīng)紀人的少數(shù)方的決策。他們發(fā)現(xiàn)一定比例的間諜經(jīng)紀人能夠使正常經(jīng)紀人的成功率變大。
本文考察了特定間諜經(jīng)紀人數(shù)目比例條件下間諜的最優(yōu)偵查規(guī)模和決策閾值。
1演化模型I
假設爭當少數(shù)者博弈模型系統(tǒng)包含101個普通經(jīng)紀人,采用模型的標準策略進行決策。然后假設在模型系統(tǒng)中加入間諜經(jīng)紀人,間諜經(jīng)紀人的數(shù)目分10,20,40,60四種情況。間諜經(jīng)紀人的偵查規(guī)模,也就是偵查的范圍所包含的普通經(jīng)紀人的數(shù)目分少(11個),中(51),多(91)3個檔次。
當間諜數(shù)目為10時,讓模型系統(tǒng)演化1 000代,每代演化1 000時步。演化開始時普通經(jīng)紀人的策略虛分和間諜的實分都置零,讓每個間諜隨機選擇他的偵查規(guī)模,即在11,51,91三個數(shù)目的偵查數(shù)中任意選擇一個作為他的偵查規(guī)模。每時刻間諜采納他所偵查的人群中少數(shù)方的決策,每時刻統(tǒng)計所有普通經(jīng)紀人和間諜經(jīng)紀人的決策,總共人數(shù)少的一方為獲勝方。普通經(jīng)紀人給他的每個策略打虛分并根據(jù)虛分進行決策的機制同于爭當少數(shù)者博弈基本模型。間諜經(jīng)紀人根據(jù)偵查做出的決策如果和最后整個系統(tǒng)的獲勝方相同,則該間諜加一實分;如果相反,則減一實分。每代結束時,實分最低的5個間諜將隨機替換他的偵查規(guī)模。然后新一代開始時所有普通經(jīng)紀人的策略虛分和間諜實分都重新置零。經(jīng)過1 000代的演化后,間諜的偵查規(guī)模人數(shù)分布如圖1,圖1中橫坐標1代表偵查規(guī)模為11,橫坐標2代表偵查規(guī)模為51,橫坐標3代表偵查規(guī)模為91。
當間諜數(shù)目為20時,假設每代結束時5個實分最低的間諜隨機更換偵查規(guī)模,然后新一代開始時所有普通經(jīng)紀人的策略虛分和間諜的實分都重新置零。經(jīng)過5 000代演化后間諜的偵查規(guī)模人數(shù)分布如圖2所示,從圖1,圖2可以發(fā)現(xiàn)當間諜數(shù)目比較少時,擁有最大偵查規(guī)模的間諜數(shù)目比例最大,這說明當間諜數(shù)目較少時,偵查規(guī)模越大或偵查范圍越廣,越對間諜的收益有利。
當間諜數(shù)目分別為40或60時,假設每代結束時10個實分最低的間諜隨機更換偵查規(guī)模,然后新一代開始時所有普通經(jīng)紀人的策略虛分和間諜的實分都重新置零。經(jīng)過1 000代演化后間諜的偵查規(guī)模人數(shù)分布分別如圖3和圖4所示。
圖1 間諜數(shù)目為10時經(jīng)過演化后間諜的偵查規(guī)模人數(shù)分布
圖2 間諜數(shù)目為20時經(jīng)過演化后間諜的偵查規(guī)模人數(shù)分布
圖3 間諜數(shù)目為40時經(jīng)過演化后間諜的偵查規(guī)模人數(shù)分布
從圖3,圖4可以發(fā)現(xiàn)當間諜數(shù)目比較多時,擁有最小偵查規(guī)模的間諜數(shù)目比例最大,這說明當間諜數(shù)目較多時,偵查規(guī)?;騻刹榉秶叫?,越對間諜的收益有利。
2演化模型II
假設爭當少數(shù)者博弈模型系統(tǒng)包含101個普通經(jīng)紀人和40個間諜經(jīng)紀人,間諜經(jīng)紀人的偵查規(guī)模,仍然分少(11個),中(51),多(91)3個檔次。原始間諜經(jīng)紀人采用偵查范圍少數(shù)方的決策,即小于偵查小組人數(shù)一半的那方的決策。我們假設間諜經(jīng)紀人可以采用不同的決策閾值,即不一定采納人數(shù)小于偵查小組人數(shù)一半的那方?jīng)Q策,而可能取其他的閾值。閾值比例p可以取10%,20%,…,90%,100%等10個數(shù)中的任一個,因而采用不同決策閾值的間諜也就分成了10個小組。某間諜偵查小組中若A方的人數(shù)小于偵查小組的總人數(shù)即偵查規(guī)模乘以閾值比例p,則該間諜就決定去A方,否則去B方。
假設模型系統(tǒng)每代演化1 000時步,第一代開始前讓每個間諜隨機選擇他的決策閾值,并且普通經(jīng)紀人的策略虛分和間諜的實分都置零。每時刻間諜決策的方式如上段所述。每代結束時,實分最低的10個間諜將隨機替換他的決策閾值。然后新一代開始時所有普通經(jīng)紀人的策略虛分和間諜的實分都重新置零。
當間諜的偵查規(guī)模為11時,讓系統(tǒng)演化5 000代,演化后間諜的不同決策閾值人數(shù)分布如圖5所示。
當間諜的偵查規(guī)模為51時,讓系統(tǒng)演化1 000代,演化后間諜的不同決策閾值人數(shù)分布如圖6所示。
圖4 間諜數(shù)目為60時經(jīng)過演化后間諜的偵查規(guī)模人數(shù)分布
圖5 間諜偵查規(guī)模為11時經(jīng)過演化后間諜的決策閾值人數(shù)分布
圖6 間諜偵查規(guī)模為51時經(jīng)過演化后間諜的決策閾值人數(shù)分布
當間諜的偵查規(guī)模為91時,讓系統(tǒng)演化1 000代,演化后間諜的不同決策閾值人數(shù)分布如圖7所示。
從數(shù)值模擬結果可以看出當間諜的偵查規(guī)模較小(11,51)時,間諜的決策閾值以中間值(0.5,0.6)居多,同普通情形類似。而當間諜的偵查規(guī)模較大(91)時,間諜的決策閾值分布則比較廣泛,與普通情形不同。
圖7 間諜偵查規(guī)模為91時經(jīng)過演化后間諜的決策閾值人數(shù)分布
3討論
從演化模型I的數(shù)值模擬結果看,間諜與普通經(jīng)紀人之間明顯存在信息相互作用。當間諜數(shù)量較少時,間諜的偵查規(guī)模越大,越能給間諜帶來有利的收益;而當間諜數(shù)量較多時,則變成偵查規(guī)模越小,越對間諜有利,這同我們的直覺推理是相符的。
當間諜數(shù)量較少時,模型系統(tǒng)每時刻的獲勝方基本上就是普通經(jīng)紀人人數(shù)少的那方,這時間諜偵查普通經(jīng)紀人的范圍越大,選擇偵查小組中的少數(shù)方就越可能同該時刻系統(tǒng)的獲勝方相符,從而越可能帶來收益。而當間諜數(shù)量較多時,較多間諜都選擇進入普通經(jīng)紀人人數(shù)少的一方最后反而會使這方變成總人數(shù)多的一方,所以間諜偵查普通經(jīng)紀人的范圍越小反而越有利。
從演化模型II的數(shù)值模擬結果看,當間諜的偵查規(guī)模較小時,間諜傾向于普通情形,即選擇偵查小組中普通經(jīng)紀人數(shù)較少一方;而當間諜的偵查規(guī)模較大時,不同間諜的決策閾值則分布比較廣泛。
我們認為,隨著間諜偵查規(guī)模的增大,如果間諜仍然繼續(xù)保持普通情形,選擇偵查小組中普通經(jīng)紀人人數(shù)少的一方,由于此時偵查小組中的普通經(jīng)紀人數(shù)目已經(jīng)接近整個系統(tǒng)的普通經(jīng)紀人的總數(shù)目,因此大多數(shù)間諜會進入到普通經(jīng)紀人人數(shù)較少的一方,結果最后反而使該方成為總人數(shù)較多的一方。所以在偵查規(guī)模很大的情況下,間諜的決策閾值趨向于廣泛分布。
根據(jù)我們經(jīng)過數(shù)值模擬計算的結果,可得出結論,當間諜數(shù)目比例較小時,偵查規(guī)模越大對間諜越有利;反之,當間諜數(shù)目比例較大時,則偵查規(guī)模越小越對間諜有利。對于第二種演化模型,間諜數(shù)量固定,當間諜的偵查規(guī)模較小時,間諜的決策閾值接近于普通情形;而當間諜的偵查規(guī)模較大時,間諜的決策閾值趨向于廣泛分布。我們認為這些結果或結論對于包含間諜經(jīng)紀人和普通經(jīng)紀人的社會系統(tǒng)的控制和管理有一定的參考借鑒意義。
參考文獻:
[1]Challet D, Zhang Y C. Emergence of cooperation and organization in an evolutionary game[J]. Physica A, 1997, 246(3/4): 407-418.
[2]Challet D, Zhang Y C. On the minority game: analytical and numerical studies[J]. Physica A, 1998, 256: 514-532.
[3]Yang W S, Wang B H, He P, et al, Sub-strategy updating evolution in minority game[J]. Chin Phys, 2003, 12: 931-935.
[4]Yang W S, Wang B H, Quan H J, et al. Strategy uniform crossover adaptation evolution in a minority game[J]. Chin Phys Lett, 2003, 20: 1659-1661.
[5]Yang W S, Wang B H, Wu Y L, et al. Searching good strategies in evolutionary minority game using variable length genetic algorithm[J]. Physica A, 2004, 339: 583-590.
[6]Yang W S, Li P,Zou S S, et al. Local minority game with evolutionary strategies[J]. China Phys Lett, 2006, 23: 1961-1964.
[7]Yu Y Y, Xu C, Gu G Q, et al. Spies in the minority game[J]. Phys Rev E, 2008, 77(1): 011106.
(責任編輯耿金花)
The Best Investigation Scope and Decision Threshold of Spy Brokers
YANG Weisong
(Jiang Xi Normal University of Science and Technology, Communication and electronic, Nanchang, 330013,China)
Abstract:In order to investigate the distribution pattern of investigation scope and decision threshold of spies when introduce spy agents into the minority game model, we investigate different situations with different spy number proportions. Spies take the principle "win stay, lose move" to adapt their investigation scope or decision threshold. It was found that when spy number is small, the proportion of large investigation scope is in the majority; yet when spy number is large, the proportion of small investigation scope is in the majority. When investigation scope is small, spy prefer to adopt half decision threshold; yet when investigation scope is large, the distribution scope of decision threshold of different spies is widespread.
Key words:minority game; spy; investigation scope; decision threshold
文章編號:16723813(2016)01010704;
DOI:10.13306/j.1672-3813.2016.01.012
收稿日期:2015-09-23
作者簡介:楊偉松(1977-), 男, 江西南昌人,講師,主要研究方向為經(jīng)濟物理、復雜性科學。
中圖分類號:N93;N94;C935;C94
文獻標識碼:A