蘇 雪,徐 勇,樊旭嬌
(河北工業(yè)大學(xué)理學(xué)院,天津 300401)
企業(yè)合作創(chuàng)新是企業(yè)間的一種聯(lián)合創(chuàng)新行為,能夠?yàn)槠髽I(yè)的技術(shù)學(xué)習(xí)、知識(shí)創(chuàng)造提供有效途徑[1]。合作創(chuàng)新行為作為一種重要的技術(shù)創(chuàng)新模式,已受到學(xué)術(shù)界和企業(yè)界的廣泛關(guān)注[2-4]。
創(chuàng)新是企業(yè)家的根本職能,企業(yè)創(chuàng)新活動(dòng)的動(dòng)力來源于對(duì)壟斷利潤及超額利潤的追逐。企業(yè)合作創(chuàng)新追求的目標(biāo)是純收益最大化,有些企業(yè)為達(dá)目的,往往會(huì)采取投機(jī)行為,即利用合作企業(yè)的創(chuàng)新成果,但不把自己的成果分享給別人。這一行為將導(dǎo)致博弈演化過程中出現(xiàn)囚徒困境現(xiàn)象。若想跳出囚徒困境,讓所有企業(yè)全部參與合作創(chuàng)新,就需要施加控制,如:政府實(shí)施獎(jiǎng)勵(lì)政策[5]、通過控制一個(gè)企業(yè)的行為而影響整個(gè)創(chuàng)新網(wǎng)絡(luò)博弈的演化。
將企業(yè)視為節(jié)點(diǎn),企業(yè)之間的博弈關(guān)系用邊的連接表示,形成一個(gè)企業(yè)創(chuàng)新網(wǎng)絡(luò)。那么,企業(yè)創(chuàng)新演化博弈問題就轉(zhuǎn)化成創(chuàng)新網(wǎng)絡(luò)演化博弈問題。企業(yè)的策略選擇,取決于企業(yè)對(duì)合作創(chuàng)新帶來的純收益的預(yù)期。每個(gè)時(shí)刻,企業(yè)對(duì)比自身及鄰居的收益情況,決定下一時(shí)刻應(yīng)對(duì)其它企業(yè)的最優(yōu)策略以及最優(yōu)博弈網(wǎng)絡(luò)結(jié)構(gòu)。在實(shí)際應(yīng)用中,博弈企業(yè)往往結(jié)合其他企業(yè)以往時(shí)刻的策略和收益進(jìn)行策略選擇,為實(shí)現(xiàn)收益最大化,可能選擇不同的博弈對(duì)手或拋棄部分博弈對(duì)手,導(dǎo)致網(wǎng)絡(luò)結(jié)構(gòu)發(fā)生改變。本文假設(shè)企業(yè)在切換網(wǎng)絡(luò)結(jié)構(gòu)的情況下根據(jù)博弈企業(yè)前τ個(gè)時(shí)刻的信息更新策略。
網(wǎng)絡(luò)圖上的演化博弈稱為網(wǎng)絡(luò)演化博弈[6],圖中的點(diǎn)表示博弈參與人,圖的邊表示博弈關(guān)系。近年來,網(wǎng)絡(luò)演化博弈受到廣泛關(guān)注。但由于網(wǎng)絡(luò)演化博弈的復(fù)雜性以及可利用工具的局限性,有關(guān)企業(yè)創(chuàng)新網(wǎng)絡(luò)演化博弈的文獻(xiàn)鳳毛麟角。程代展教授將普通矩陣乘積推廣到任意維數(shù)兩個(gè)矩陣乘積,并保留普通矩陣乘積的性質(zhì),提出了矩陣半張量積理論[7]。半張量積作為有效工具,可將博弈動(dòng)態(tài)系統(tǒng)轉(zhuǎn)化為相應(yīng)的代數(shù)形式[8-9]。這種方法已成功應(yīng)用到了布爾網(wǎng)絡(luò)[10-12]、多值邏輯網(wǎng)絡(luò)[13-15]、多層網(wǎng)絡(luò)演化博弈[16]、電網(wǎng)的需求和控制[17-18]以及帶有破產(chǎn)機(jī)制的網(wǎng)絡(luò)演化博弈中[19-20]。
通過企業(yè)合作創(chuàng)新博弈,企業(yè)能夠做出最大化自身利益的決策:參與合作創(chuàng)新或不參與合作創(chuàng)新、與哪個(gè)企業(yè)進(jìn)行合作創(chuàng)新等。與傳統(tǒng)地利用計(jì)算機(jī)實(shí)驗(yàn)?zāi)M和微分方程分析企業(yè)創(chuàng)新博弈演化相比[21-22],通過半張量積理論將博弈過程代數(shù)化,企業(yè)可更加直觀、簡捷地觀察自身在博弈中的處境,并根據(jù)博弈局勢及時(shí)決定下一時(shí)刻的最佳博弈策略。同時(shí)政府可通過分析博弈演化趨勢,設(shè)計(jì)合適的控制,從而使得所有企業(yè)實(shí)現(xiàn)合作創(chuàng)新。
基于以上分析,本文通過半張量積方法研究切換拓?fù)淦髽I(yè)創(chuàng)新時(shí)滯演化博弈。首先,建立切換網(wǎng)絡(luò)企業(yè)創(chuàng)新時(shí)滯演化博弈模型,利用半張量積將博弈中的企業(yè)收益、策略演化以及網(wǎng)絡(luò)的切換分別代數(shù)公式化,得到切換拓?fù)淦髽I(yè)局勢演化過程的代數(shù)表達(dá)式,基于代數(shù)表達(dá)式分析博弈的局勢演化特征;其次,設(shè)計(jì)控制輸入,給出企業(yè)全部參與合作創(chuàng)新的充要條件,得到自由控制序列;最后,舉例驗(yàn)證以上方法和結(jié)論在切換拓?fù)淦髽I(yè)創(chuàng)新時(shí)滯演化博弈分析中的可行性。
首先列出本文用到的相關(guān)符號(hào)、定義及基本性質(zhì)。
1)Mm×n表示m×n實(shí)矩陣集合;
3)Coli(M)表示矩陣M的第i列,Col(M)表示矩陣M的列集合;
5)Vr(A)=(a1,1,a1,2,…,a1,n,…,am,1,am,2,…,am,n)T表示矩陣A的行展開。
定義1[7]設(shè)A∈Mm×n,B∈Mp×q,l=lcm{n,p}為n與p的最小公倍數(shù),那么,A與B的半張量積定義為
定義2[6]設(shè)M∈Mp×s,N∈Mq×s,它們的Khatri-Rao積記為M*N,定義為
命題1[7]設(shè)X∈Rm,Y∈Rn是兩個(gè)列向量,那么有
W[m,n]XY=YX
其中,W[m,n]=δmn[1,m+1,2m+1,…,(n-1)m+1,2,m+2,…,(n-1)m+2,…,m,2m,…,nm]稱為mn×mn換位矩陣。
命題2[23]定義恢復(fù)因子
命題3[6]設(shè)X∈Δp,Y∈Δq,定義兩個(gè)啞矩陣分別稱為“前保持操作”和“后保持操作”:
則
命題4[6]1)設(shè)列向量X∈Rt×1,A∈Rm×n,則有
2)設(shè)X∈Δk,有
X2=Mr,kX
(1)
式(1)中
稱為降冪矩陣。
(2)
式(2)中xi∈Δk,i=1,2,…,n。
引理2[11]考慮一個(gè)k值邏輯網(wǎng)絡(luò)
x(t+1)=Lx(t)
(3)
Ne=Trace(L)
2)長度為s的極限環(huán)的個(gè)數(shù)記為Cs,有
其中,ρ(s)代表s的真因子的集合,s的真因子是正整數(shù)且k
下面給出博弈論的相關(guān)定義。
定義3[6]一個(gè)正規(guī)有限博弈由以下3個(gè)要素組成:
1)n個(gè)玩家N={1,2,…,n};
3)玩家i的支付函數(shù)pi,i=1,2,…,n。
如果博弈在確定的策略更新規(guī)則下重復(fù)進(jìn)行,就稱其為演化博弈。
定義4[6]一個(gè)網(wǎng)絡(luò)演化博弈由3個(gè)要素組成,記為((N,E),G,Π):
1)(N,E)代表一個(gè)網(wǎng)絡(luò)圖;
2)G稱為基本網(wǎng)絡(luò)博弈,當(dāng)(i,j)∈E是網(wǎng)絡(luò)的一條邊時(shí),i與j重復(fù)進(jìn)行基本博弈;
3)Π稱為策略更新規(guī)則。
本文主要考慮切換拓?fù)淦髽I(yè)創(chuàng)新時(shí)滯演化博弈。其中,切換拓?fù)涫侵覆煌瑫r(shí)間點(diǎn)企業(yè)之間的博弈關(guān)系網(wǎng)不同,企業(yè)根據(jù)收益和策略的選擇調(diào)整參與博弈的網(wǎng)絡(luò)。時(shí)滯是指企業(yè)會(huì)根據(jù)鄰居及自身前τ個(gè)時(shí)刻的策略和收益信息來選擇下一時(shí)刻的博弈策略。
切換拓?fù)淦髽I(yè)創(chuàng)新時(shí)滯演化博弈,包含以下4個(gè)部分:
1)企業(yè)創(chuàng)新網(wǎng)絡(luò)集M:={1,2,…,m},每個(gè)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)都是一個(gè)連通無向圖 (N,εz),其中N:={1,2,…,n}為企業(yè)集,εz:={(i,j),i,j∈N}是邊集,表示企業(yè)i和j在網(wǎng)絡(luò)z上存在博弈關(guān)系,z∈M;
2)企業(yè)創(chuàng)新基本網(wǎng)絡(luò)演化博弈:如果(i,j)∈εz,那么t時(shí)刻,在網(wǎng)絡(luò)z上企業(yè)i和企業(yè)j分別以策略xi(t)和xj(t)進(jìn)行基本網(wǎng)絡(luò)演化博弈,xi(t),xj(t)∈S0={1,2};
3)企業(yè)的策略更新:假設(shè)t時(shí)刻所有企業(yè)在網(wǎng)絡(luò)z上進(jìn)行博弈,策略更新表示為
xi(t+1)=fi,z(xi(t-τ+1),xi(t-τ+2),…,xi(t),xj(t-τ+1),xj(t-τ+2),…,xj(t)|j∈Ni,z)
(4)
式(4)中xj(t)∈S0是玩家j在t,t=0,1,2,…時(shí)刻的策略,Ni,z是企業(yè)i在網(wǎng)絡(luò)z上的鄰居集合,j∈Ni,z當(dāng)且僅當(dāng) (i,j)∈εz,i∈N,z∈M;
4)企業(yè)創(chuàng)新博弈網(wǎng)絡(luò)的切換:設(shè)所有企業(yè)t時(shí)刻博弈的網(wǎng)絡(luò)記為z(t),網(wǎng)絡(luò)的切換為
z(t)=g(x(0),x(1),…,x(t))
(5)
表1 企業(yè)創(chuàng)新博弈的基本收益矩陣Tab.1 The basic benefit matrix of enterprise innovation game
由表1看出收益矩陣是對(duì)稱的。
本文計(jì)算博弈網(wǎng)絡(luò)上企業(yè)的總收益, 那么t時(shí)刻在網(wǎng)絡(luò)z上企業(yè)i的收益函數(shù)為
(6)
式(6)中pij(xi(t),xj(t))是t時(shí)刻在網(wǎng)絡(luò)z上,企業(yè)i與企業(yè)j分別以策略xi(t)和xj(t)博弈的收益,Ni,z表示網(wǎng)絡(luò)z上企業(yè)i的鄰居企業(yè)集合。
考慮到企業(yè)進(jìn)行博弈時(shí),都期望自身收益最高,所以本文采用時(shí)間并聯(lián)型短視最優(yōu)響應(yīng)的策略更新規(guī)則:站在企業(yè)i的立場上,企業(yè)i認(rèn)為其他企業(yè)下一時(shí)刻的策略選擇和上一時(shí)刻一樣,企業(yè)下一時(shí)刻的策略選擇是對(duì)付其他企業(yè)上一時(shí)刻最好的策略。設(shè)其他企業(yè)在t時(shí)刻的策略局勢為S-i(t),有
xi(t+1):=argmaxxi(t)∈S0pi(xi(t),S-i(t))
(7)
當(dāng)企業(yè)有超過一個(gè)最優(yōu)響應(yīng)策略時(shí),選擇下標(biāo)最小的策略作為下一時(shí)刻的策略。比如策略si,sj∈S0滿足式(7),如果有i>j,那么企業(yè)i選擇策略sj作為下一時(shí)刻的策略, 即xi(t+1)=sj。
企業(yè)的合作創(chuàng)新博弈是一個(gè)持續(xù)演化的動(dòng)態(tài)過程,下面將切換拓?fù)淦髽I(yè)創(chuàng)新時(shí)滯演化博弈過程代數(shù)公式化。
為了方便表示,定義如下符號(hào)表示向量
(8)
式(8)中yi(t)∈Δ2τ,y(t)∈Δ2nτ,y-i(t)∈Δ2(n-1)τ。
2.2.1 博弈收益代數(shù)公式化
由表1得收益矩陣
在網(wǎng)絡(luò)z上企業(yè)i的收益函數(shù)就可表示為
(9)
2.2.2 最優(yōu)策略演化的代數(shù)公式化
將Mpi,z分成 2(n-1)τ塊
Mpi,z=[Blk1(Mpi,z),Blk2(Mpi,z),…,Blk2(n-1)τ(Mpi,z)]
Colξi,l,z(Blkl(Mpi,z))≥Colξ(Blkl(Mpi,z)),?ξ=1,2
令Li=[Li,1,Li,2,…,Li,m],有
xi(t+1)=Liz(t)y(t)
(10)
2.2.3 網(wǎng)絡(luò)切換的代數(shù)公式化
企業(yè)已選出在每種網(wǎng)絡(luò)結(jié)構(gòu)下對(duì)付其他企業(yè)最好的策略,這時(shí)企業(yè)需要根據(jù)所選策略預(yù)估同樣的策略在不同博弈網(wǎng)絡(luò)上的收益,然后決定下一時(shí)刻想要參加的博弈網(wǎng)絡(luò)。基于企業(yè)采用的短視最優(yōu)響應(yīng)的策略更新規(guī)則,企業(yè)在t+1時(shí)刻的預(yù)估收益為
(11)
設(shè)行指標(biāo)ζj滿足
Rowζj(V)≥Rowζ(V),?ζ=1,2,…,m
令Lz=δm[ζ1,ζ2,…,ζ2nτ],得到企業(yè)博弈網(wǎng)絡(luò)切換的代數(shù)表達(dá)形式
z(t)=Lzy(t)
(12)
2.2.4 博弈過程的代數(shù)公式化
綜合以上幾步,得到切換拓?fù)洇訒r(shí)滯企業(yè)創(chuàng)新網(wǎng)絡(luò)演化博弈的代數(shù)表達(dá)式
(13)
(14)
y(t+1)=Lyz(t)y(t)
(15)
y(t+1)=Lyz(t)y(t)=LyLzy(t)y(t)=LyLzMr,2nτy(t)=Ly(t)
(16)
式(16)中L=LyLzMr,2nτ。
企業(yè)博弈的演化特征可通過式(16)體現(xiàn),L是企業(yè)策略局勢演化的狀態(tài)轉(zhuǎn)移矩陣,蘊(yùn)含了企業(yè)策略演化的信息。因此,博弈的演化過程與式(16)所示的代數(shù)形式等價(jià)。基于此,本文通過研究L的性質(zhì)來分析博弈的演化特征,例如:博弈局勢演化的均衡,包括不動(dòng)點(diǎn)和極限環(huán)。如果博弈過程收斂到一個(gè)不動(dòng)點(diǎn),表示所有企業(yè)都采取同樣的策略并保持不變,極限環(huán)表示企業(yè)的策略選擇是呈周期性改變的。
在這一部分,研究切換拓?fù)淦髽I(yè)創(chuàng)新時(shí)滯演化博弈的策略優(yōu)化問題。目標(biāo)是設(shè)計(jì)合理的自由控制序列使得所有企業(yè)全部參與合作創(chuàng)新。不失一般性,把第一個(gè)企業(yè)視為偽玩家作為控制輸入。 通過式(10)得到網(wǎng)絡(luò)z上帶有控制的最優(yōu)策略演化的代數(shù)表達(dá)
(17)
yj(t+1)=xj(t-τ+2)xj(t-τ+3)…xj(t+1)
(18)
h(t+1)=y2(t+1)y3(t+1)…yn(t+1)=(Ly2*Ly3*…*Lyn)u(t)h(t)=Luu(t)h(t)
(19)
式(19)中Lu=(Ly2*Ly3*…*Lyn)。
對(duì)式(19)變形,得h(t+1)=LuW[2(n-1)τ,2τ]h(t)u(t)=Lhh(t)u(t),其中Lh=LuW[2(n-1)τ,2τ]。則對(duì)?t∈Z+,有
h(t+1)=Lhh(t)u(t)=LhLhh(t-1)u(t-1)u(t)=(Lh)th(1)u(1)u(2)…u(t)
(20)
基于式(20),得到下面的定理。
(21)
如果式(21)成立,使得所有企業(yè)全部參與合作創(chuàng)新的自由控制序列可設(shè)計(jì)為
(22)
那么式(21)成立。
同時(shí)對(duì)?t>T有
這一部分,以產(chǎn)品零部件生產(chǎn)企業(yè)創(chuàng)新網(wǎng)絡(luò)演化博弈為例,來展示如何應(yīng)用上述方法和結(jié)論研究其博弈過程。
考慮如下切換拓?fù)淦髽I(yè)創(chuàng)新時(shí)滯演化博弈:
1)產(chǎn)品零部件生產(chǎn)企業(yè)創(chuàng)新博弈網(wǎng)絡(luò)集M={1,2,3},每個(gè)網(wǎng)絡(luò)圖都是一個(gè)連通無向圖 (N,εz),其中N={1,2,3}是3種產(chǎn)品零部件生產(chǎn)企業(yè),εz是網(wǎng)絡(luò)z上的邊集,其中ε1={(1,2),(2,3)},ε2={(1,2),(1,3)},ε3={(1,2),(1,3),(2,3)};
2)基本收益矩陣如表2所示:
3)企業(yè)遵循短視最優(yōu)響應(yīng)的策略更新規(guī)則;
4)博弈網(wǎng)絡(luò)的切換依賴于當(dāng)前時(shí)刻每種局勢下最優(yōu)策略在每個(gè)網(wǎng)絡(luò)上的收益。
圖1 企業(yè)創(chuàng)新博弈結(jié)構(gòu)圖Fig.1 The structure of enterprise innovation game
表2 基本收益矩陣Tab.2 Fundamental return matrix
假設(shè)3種企業(yè)規(guī)模相當(dāng),且τ=2。首先解決博弈動(dòng)態(tài)的代數(shù)表達(dá)式問題。
第1步:計(jì)算每個(gè)創(chuàng)新網(wǎng)絡(luò)上各企業(yè)博弈收益結(jié)構(gòu)矩陣,得
Mp1,1=Mp2,2=Mp3,2= [2 2.5 2 2.5 2 2.5 2 2.5 1 0 1 0 1 0 1 0 2 2.5 2 2.5 2 2.5 2 2.5 1 0 1 0 1 0 1 0];
Mp1,2=Mp1,3=Mp2,1=Mp2,3=Mp3,3
=[4 5 3 2.5 4 5 3 2.5 3 2.5 2 0 3 2.5 2 0 4 5 3 2.5 4 5 3 2.5 3 2.5 2 0 3 2.5 2 0];
Mp3,1= [2 2.5 1 0 2 2.5 1 0 2 2.5 1 0 2 2.5 1 0 2 2.5 1 0 2 2.5 1 0 2 2.5 1 0 2 2.5 1 0]。
第2步:在企業(yè)所有可能的策略局勢下選取使得自身收益最大的策略作為下一時(shí)刻的策略。計(jì)算得
第3步:在同樣的策略下,選擇收益最大的博弈網(wǎng)絡(luò)作為下一時(shí)刻參與博弈的網(wǎng)絡(luò)。計(jì)算得Lz=δ3[3 3 3…3 3 3],即所有的企業(yè)最后將會(huì)在網(wǎng)絡(luò)3上進(jìn)行博弈。
第4步:得到切換拓?fù)湎娄?2時(shí)滯的企業(yè)創(chuàng)新演化博弈的代數(shù)表達(dá):y(t+1)=Ly(t),其中
L=δ64[22 4 22 4 13 11 13 11 22 4 22 4 13 11 13 11 49 35 49 35 41 43 41 43 49 35 49 35 41 43 41 43
22 4 22 4 13 11 13 11 22 4 22 4 13 11 13 11 49 35 49 35 41 43 41 43 49 35 49 35 41 43 41 43]。
為了觀察博弈的演化特征,當(dāng)k≥1時(shí),計(jì)算得
L2k=δ64[43 4 43 4 13 22 13 22 43 4 43 4 13 22 13 22 49 22 49 22 22 22 22 22 49 22 49 22 22 22 22 22
22 4 22 4 13 11 13 11 22 4 22 4 13 11 13 11 49 22 49 22 22 22 22 22 49 22 49 22 22 22 22 22]
L2k+1=δ64[22 4 22 4 13 43 13 43 22 4 22 4 13 43 13 43 49 43 49 43 43 43 43 43 49 43 49 43 43 43 43 43
43 44 34 13 11 13 11 43 44 34 13 11 13 11 49 22 49 43 43 43 43 43 49 43 49 43 43 43 43 43]
對(duì)比兩個(gè)矩陣,可以看出博弈局勢的演化有3個(gè)不動(dòng)點(diǎn)和1個(gè)極限環(huán):
實(shí)際上,(1)中的不動(dòng)點(diǎn)是博弈的一個(gè)納什均衡,在此局勢下任何人都不愿意改變自己的策略,因?yàn)槿魏稳烁淖儾呗远紩?huì)導(dǎo)致收益減少,然而,這個(gè)納什均衡不是一個(gè)最優(yōu)的狀態(tài)。下面我們研究如何通過控制使得所有企業(yè)全部參與合作創(chuàng)新,即博弈演化收斂到最優(yōu)狀態(tài)。把第一個(gè)企業(yè)視為控制輸入,得到帶有控制的時(shí)滯演化博弈代數(shù)表達(dá)式
h(t+1)=Luu(t)h(t)
(23)
其中
Lu=δ16[6 4 6 4 13 11 13 11 6 4 6 4 13 11 13 11 13 13 9 11 9 11 13 13 9 11 9 11
6 4 6 4 13 11 13 11 6 4 6 4 13 11 13 11 13 13 9 11 9 11 13 13 9 11 9 11]
變形h(t+1)=Lhh(t)u(t),計(jì)算
Lh=δ16[6 1 6 1 4 3 4 3 6 1 6 1 4 3 4 3 13 9 13 9 11 11 11 11 13 9 13 9 11 11 11 11
6 1 6 1 4 3 4 3 6 1 6 1 4 3 4 3 13 9 13 9 11 11 11 11 13 9 13 9 11 11 11 11]
上述分析表示,如果偽玩家選擇策略2并保持不變,博弈從任意局勢開始都將收斂到參與合作創(chuàng)新狀態(tài),并保持此局勢不變。
本文首先建立了企業(yè)合作創(chuàng)新網(wǎng)絡(luò)演化博弈模型,并考慮切換拓?fù)浜蜁r(shí)滯兩個(gè)因素,使得博弈過程更加直觀,切合實(shí)際。其次,利用半張量積方法,將切換拓?fù)湎缕髽I(yè)創(chuàng)新時(shí)滯演化博弈過程轉(zhuǎn)化為代數(shù)演化方程,得到能夠反映出每一次博弈演化特征的局勢轉(zhuǎn)移矩陣。然后選擇偽玩家,將其視為控制輸入,通過博弈控制系統(tǒng)的代數(shù)空間表達(dá)式給出了所有企業(yè)全部參與合作創(chuàng)新的充要條件,得到合適的自由控制序列。最后,仿真分析驗(yàn)證了方法和結(jié)論的有效性。
本文給出的方法和結(jié)果可以廣泛應(yīng)用于實(shí)際生活中,如:人工智能與硬件終端的合作、螞蟻金服和銀行之間的互聯(lián)網(wǎng)金融的合作升級(jí)改造、華為和英特爾合作完善物聯(lián)網(wǎng)連接功能等。