易 濤,栗繼祖
(太原理工大學經(jīng)濟管理學院,山西 太原 030024)
根據(jù)總體設計,分步實施的原則,煤炭企業(yè)礦山建設分為三個階段,分別是數(shù)字礦山、智慧礦山和無人礦山[1]。智慧礦山又稱智能礦山和“物聯(lián)網(wǎng)”礦山,是以深度互聯(lián)、高度共享、透徹感知、智能服務和可視化展現(xiàn)為基本特征,旨在通過對信息系統(tǒng)采集到的數(shù)據(jù)進行深度挖掘分析,實現(xiàn)煤炭企業(yè)生產(chǎn)經(jīng)營管理的智能決策[2]。智慧礦山以安全生產(chǎn)為首要原則、減員增效為主要目的,其建設狀況直接影響到煤炭產(chǎn)業(yè)生產(chǎn)管理變革的推進。智慧礦山建設不僅是煤炭企業(yè)發(fā)展規(guī)劃中的重要一步,也是政府構(gòu)建安全高效煤炭工業(yè)生態(tài)中的關(guān)鍵一環(huán)。因此,以政府為主體制定合理政策推動煤炭企業(yè)智慧礦山建設,對避免煤炭企業(yè)發(fā)展掉隊、保障煤礦生產(chǎn)安全、促進煤炭生產(chǎn)管理信息化和推動煤炭產(chǎn)業(yè)轉(zhuǎn)型升級具有重要意義。
目前,國內(nèi)外學者圍繞智慧礦山理論及發(fā)展路徑展開了豐富的研究。智慧礦山理論研究拓寬和加深了學界對智慧礦山的認識,學者譚章祿等[3]指出智慧礦山是在數(shù)字礦山和感知礦山基礎(chǔ)上,應用云計算、人工智能等科學技術(shù)發(fā)展的礦山信息化建設新階段,而完整的理論體系是智慧礦山落地的基礎(chǔ);呂鵬飛等[4]認為智慧礦山是基于物聯(lián)網(wǎng)、人工智能等先進技術(shù)的完整智慧體系,可以實現(xiàn)礦山生產(chǎn)經(jīng)營管理各環(huán)節(jié)的最優(yōu)調(diào)控;盧新明等[5]則認為智慧礦山是建立在礦山數(shù)字化基礎(chǔ)上,能夠完成礦山企業(yè)所有信息的精準適時采集、網(wǎng)絡化傳輸、規(guī)范化集成、可視化展現(xiàn)、自動化操作和智能化服務的數(shù)字化智慧體;李小四等[6]認為智慧礦山建設的真正內(nèi)涵是能在礦山物聯(lián)網(wǎng)上提供各種各樣礦山所需要的智慧化服務。此外,部分學者以理論框架為基礎(chǔ),對智慧礦山發(fā)展路徑展開了研究。LYNAS等[7]分析了智慧礦山建設過程中產(chǎn)生的技術(shù)變革及其不規(guī)范發(fā)展將帶來的潛在問題,并指出了智慧礦山的發(fā)展方向;RALSTON等[8]則從技術(shù)的角度討論了系統(tǒng)兼容性和開放通信標準對促進企業(yè)智慧礦山建設的意義,強調(diào)將智慧礦山技術(shù)從獨立、封閉的系統(tǒng)轉(zhuǎn)換為開放、共享的技術(shù)體系;徐靜等[9]從價值鏈的角度研究分析了礦山物聯(lián)化和智能化設計的關(guān)鍵技術(shù)及其實現(xiàn)路徑,構(gòu)建了符合中國實際的智慧礦山理論框架和方法體系;王莉[10]則從數(shù)字礦山、物聯(lián)網(wǎng)和云計算的角度構(gòu)建了智慧礦山藍圖,并指出政府和礦山企業(yè)的通力合作是實現(xiàn)礦山智能化的必要條件之一;王國法等[11-13]基于當前的數(shù)字礦山發(fā)展現(xiàn)狀,為中國智慧礦山建設提出了情景目標和發(fā)展路徑。由文獻分析可知,學者們對智慧礦山的技術(shù)體系、發(fā)展路徑以及建設目標等方面進行了深入研究,為中國智慧礦山發(fā)展建設奠定了堅實基礎(chǔ),但是同時也存在一定的局限性:已有研究主要集中于智慧礦山的理論與發(fā)展路徑問題,而較少考慮區(qū)域內(nèi)煤炭企業(yè)的智慧礦山建設問題;有學者指出政府參與是智慧礦山建設的重要因素,但鮮有學者考慮到政府和煤炭企業(yè)之間的決策博弈問題;在煤炭企業(yè)追求生存和變革的過程中地方政府推動智慧礦山建設,二者的策略交互受何種因素影響。
基于此,本文將采用演化博弈與系統(tǒng)動力學(system dynamics,SD)仿真的綜合研究方法,構(gòu)建起以智慧礦山建設為焦點,以地方政府和煤炭企業(yè)為主體的博弈模型,從而對政企雙方的策略選擇進行演化穩(wěn)定分析,在剖析政企雙方策略互動機制的同時,改變政府的靜態(tài)獎懲措施,提出動態(tài)的獎懲方案。最后通過演化博弈均衡分析與SD仿真揭示動態(tài)獎懲方案如何抑制原系統(tǒng)的振蕩特性,從而得到演化穩(wěn)定策略(evolutionary stability strategy,ESS)。本文建立的演化博弈與SD模型為分析政府和煤炭企業(yè)智慧礦山建設的動態(tài)博弈過程提供了一個理論和實證相結(jié)合的仿真平臺,對于政府調(diào)動煤炭企業(yè)群體智慧礦山建設積極性,保障煤炭行業(yè)健康可持續(xù)發(fā)展具有現(xiàn)實意義。
1.1.1 博弈中的參與者
現(xiàn)假定演化博弈模型中只包括政府和煤炭企業(yè)兩個利益主體,博弈雙方都是有限理性。其中,政府是指由煤炭工業(yè)局、經(jīng)濟和信息化委員會及相關(guān)部門抽調(diào)成員后組成的監(jiān)管部門,該部門有能力確認煤炭企業(yè)智慧礦山建設的合規(guī)性與先進性;煤炭企業(yè)是指仍處于機械礦山或數(shù)字礦山階段需要進行智慧礦山建設的煤炭生產(chǎn)企業(yè),其井下生產(chǎn)需要較多的作業(yè)人員,智慧礦山建設需要煤炭企業(yè)短期內(nèi)在信息系統(tǒng)升級方面投入資金。
1.1.2 政府和煤炭企業(yè)的行為策略
假設政府以概率α(0≤α≤1)對轄區(qū)內(nèi)煤炭企業(yè)的智慧礦山建設進行監(jiān)管,Cg為政府每次監(jiān)管轄區(qū)內(nèi)煤炭企業(yè)所要耗費的成本,比如巡查轄區(qū)內(nèi)煤炭企業(yè)智慧礦山建設時所耗費的人力資源、物力資源和財力資源。同時,政府將在監(jiān)管過程中將對煤炭企業(yè)采取激勵或懲罰措施,如果監(jiān)管過程中發(fā)現(xiàn)轄區(qū)內(nèi)煤炭企業(yè)智慧礦山建設情況良好,則政府將給予一定的補貼Am;反之,若政府監(jiān)管過程中發(fā)現(xiàn)煤炭企業(yè)在智慧礦山建設過程中出現(xiàn)消極應付和維持現(xiàn)狀的情況,則將對煤炭企業(yè)予以懲罰Fm。煤炭企業(yè)完成智慧礦山建設,政府將因煤炭企業(yè)減少危險崗位人員數(shù)量、提高區(qū)域煤炭生產(chǎn)安全性等獲得間接效益Bg;若煤炭企業(yè)選擇維持現(xiàn)狀生產(chǎn),則政府將為煤炭企業(yè)生產(chǎn)監(jiān)管及保障等方面多支付政府成本Lg。
假設煤炭企業(yè)以概率β(0≤β≤1)進行智慧礦山建設,煤炭企業(yè)選擇智慧礦山建設過程中會產(chǎn)生設備購入、礦井停工和員工培訓等直接投入成本Cm,但會帶來節(jié)約人力成本、減少安全事故及提升生產(chǎn)效率等預期效益Bm。煤炭企業(yè)選擇維持現(xiàn)狀生產(chǎn)時,可以不因智慧礦山建設停工影響繼續(xù)生產(chǎn)獲得正常生產(chǎn)收益Pm。根據(jù)上述分析和假設,構(gòu)建政府、煤炭企業(yè)之間關(guān)于建設智慧礦山的關(guān)系機理圖,如圖1所示。同時政府、煤炭企業(yè)雙方之間的收益矩陣見表1。
圖1 政府和煤炭企業(yè)智慧礦山建設的關(guān)系機理圖Fig.1 Relationship mechanism diagram of smart mines construction betweengovernment and coal enterprises
表1 政府和煤炭企業(yè)雙方博弈的收益矩陣Table 1 Return matrix of the game between governmentand coal enterprise
根據(jù)假設可知,政府的策略選擇為{監(jiān)管,不監(jiān)管},煤炭企業(yè)的策略選擇為{智慧礦山建設,維持現(xiàn)狀};令每個博弈方的收益函數(shù)為:U=(Ui,U1-i)(i=α,β),根據(jù)收益矩陣可以得到博弈雙方的期望收益Eg與Em,進而得到雙方演化博弈的復制動態(tài)方程組[14],見式(1)~式(3)。
Eg=αUα+(1-α)U1-α=αβ(-Am-Fm)+
α(-Cg+Fm)+β(Bg+Lg)-Lg
(1)
Em=βUβ+(1-β)U1-β=αβ(Am+Fm)-
αFm+β(-Cm+Bm-Pm)+Pm
(2)
(3)
由式(3)可知,政府策略的復制動態(tài)方程為S(α)=α(1-α)(-βAm-βFm-Cg+Fm),對S(α)求導得式(4)。
(1-2α)(-βAm-βFm-Cg+Fm)
(4)
表2 政府單方面策略演化穩(wěn)定性分析Table 2 Stability analysis of the evolution of government’s unilateral strategy
圖2 政府的復制動態(tài)相位圖Fig.2 Replication dynamic phase diagrams of government
由式(3)可知,煤炭企業(yè)策略的復制動態(tài)方程為S(β)=β(1-β)(αAm-Cm+Bm+αFm-Pm),對其求導得式(5)。
(1-2β)(αAm-Cm+Bm+αFm-Pm)
(5)
表3 煤炭企業(yè)單方面策略演化穩(wěn)定性分析Table 3 Stability analysis of the evolution of coal enterprises’ unilateral strategy
圖3 煤炭企業(yè)的復制動態(tài)相位圖Fig.3 Replication dynamic phase diagrams of coal enterprise
由上述分析可知,政府和煤炭企業(yè)單方面的策略選擇都具有三種不同的ESS。 但從實際出發(fā),煤炭企業(yè)進行智慧礦山建設所投入的實際成本與維持現(xiàn)狀的生產(chǎn)收益之和會高于改造建設所帶來的收益,這主要源于智慧礦山建設所產(chǎn)生的智慧生產(chǎn)系統(tǒng)改造、智慧職業(yè)健康與安全系統(tǒng)升級以及智慧技術(shù)支持與后勤保障系統(tǒng)建設的高昂成本。同時政府的監(jiān)管成本很難超過政府制定的罰金,單方面的要求煤炭企業(yè)主動開展智慧礦山建設的幾率較低,所以需要著重討論政府和煤炭企業(yè)雙方混合策略的穩(wěn)定性。
演化穩(wěn)定均衡點的穩(wěn)定性可由該系統(tǒng)的雅可比矩陣的穩(wěn)定性分析得到,則根據(jù)復制動態(tài)方程(3),得出雅克比矩陣見式(6)。
表4 Nash均衡點穩(wěn)定性分析Table 4 Stability analysis of Nash equilibrium points
顯然,均衡點(X0,Y0)對應的特征根λ1,2為一對純虛根。 因此,(X0,Y0)是穩(wěn)定的平衡點,但并不是ESS,其系統(tǒng)演化軌跡是圍著中心點(X0,Y0)循環(huán)運動的閉軌線環(huán)[16],此情況反應了政府監(jiān)管下煤炭企業(yè)采取智慧礦山建設的過程具有反復性、長期性和艱巨性。
根據(jù)以上演化博弈模型分析,利用Vensim PLE軟件建立政府監(jiān)督下煤炭企業(yè)智慧礦山建設的演化博弈SD模型,該模型包含2個狀態(tài)變量、2個速率變量、8個外部變量、6個輔助變量以及2個影子變量,如圖4所示。設置SD模型初始值為:仿真起始時間INITIAL TIME=0,仿真結(jié)束時間FINAL TIME=100,本仿真中的數(shù)據(jù)為模擬數(shù)據(jù),Time泛指一般時間單位。同時根據(jù)山西焦煤集團晉興能源公司斜溝礦井智慧礦山系統(tǒng)建設案例部分實際數(shù)據(jù)和仿真模擬的需要設定模型初始值,見表5。
表5 政府和煤炭企業(yè)SD模型的變量含義及初值Table 5 Variable meanings and initial values ofSD model for government and coal enterprise
圖4 政府和煤炭企業(yè)演化博弈的SD模型Fig.4 SD model of evolutionary game between government and coal enterprise
圖5(b)給出了政企雙方均以Initial3(α,β)=(0.35,0.4)為初始概率下系統(tǒng)的博弈演化趨勢曲線。結(jié)果顯示,政企雙方參與的智慧礦山建設博弈系統(tǒng)演化過程是一個圍繞起始點進行周期運動的閉軌線環(huán),這表明了在智慧礦山建設的演化博弈中政府和煤炭企業(yè)的博弈過程表現(xiàn)出一種周期行為模式。因此,為使博弈雙方混合策略演化過程有效收斂,需進一步調(diào)整方案研究。
圖5 政府和煤炭企業(yè)系統(tǒng)演化過程Fig.5 System evolution process of government and coal enterprise
政府對煤炭企業(yè)智慧礦山建設補貼和懲罰的合理程度不僅會影響政府自身的監(jiān)管積極性,還會影響煤炭企業(yè)智慧礦山建設的投入積極性。相關(guān)研究表明[17-19],政府對煤炭企業(yè)實施動態(tài)懲罰或獎勵機制,可以顯著改善政府和煤炭企業(yè)演化博弈均衡點的穩(wěn)定性。因此,在借鑒已有研究思路和成果的基礎(chǔ)上,根據(jù)智慧礦山建設實際狀況,構(gòu)建起動態(tài)懲罰模型和動態(tài)獎勵模型,并對其納什均衡點穩(wěn)定性進行理論與SD仿真分析。
煤炭企業(yè)傳統(tǒng)礦山生產(chǎn)比例越高,礦山生產(chǎn)的潛在風險性便越高。而政府對煤炭企業(yè)采取動態(tài)懲罰政策是為了降低傳統(tǒng)礦山生產(chǎn)比例,提高煤炭企業(yè)智慧礦山建設率。在政府推動區(qū)域內(nèi)煤炭企業(yè)智慧礦山建設初期,因轄區(qū)內(nèi)煤炭企業(yè)智慧礦山建設完成率偏低,礦山生產(chǎn)所造成的負外部效應較高,政府會提高懲戒力度督促煤炭企業(yè)開展智慧礦山建設。隨著煤炭企業(yè)智慧礦山建設比例提高,煤炭企業(yè)生產(chǎn)所造成的負外部效應也隨之降低,政府會相應降低對煤炭企業(yè)維持現(xiàn)狀的懲罰力度。據(jù)此,假設當政府實行監(jiān)管策略且煤炭企業(yè)選擇維持現(xiàn)狀時,令政府對煤炭企業(yè)收取的罰沒金額由固定常數(shù)Fm變?yōu)閔(β)=(1-β)f,且f>Am+Cg,其中,f為政府的最高懲罰力度,表示政府最高懲罰力度以政府補貼與監(jiān)管成本之和為下限。
4.1.1 動態(tài)懲罰策略系統(tǒng)穩(wěn)定性分析
將h(β)=(1-β)f代替式(3)中的Fm得到系統(tǒng)復制動態(tài)方程組,見式(7)。
(7)
從而解得:
4.1.2 動態(tài)懲罰政策下系統(tǒng)博弈均衡點分析
已知0
(9)
(10)
(11)
(12)
同理,對β*的各個參數(shù)分別求導,得到式(13)~式(15)。
(13)
(14)
(15)
因此,政府補貼力度Am、政府監(jiān)管成本Cg以及最高懲罰力度f會同時影響α*與β*的大小。提高政府補貼力度Am會使α*與β*同時減?。粶p小政府監(jiān)管成本Cg能使α*和β*同時增大;而當政府最高懲罰力度f增大時,α*減小,而β*增大,表明政府在動態(tài)懲罰措施下可以提高最高懲罰力度f使自身監(jiān)管概率α*降低并提高煤炭企業(yè)的智慧礦山建設率β*。同時,對政府而言,幫助煤炭企業(yè)降低智慧礦山建設成本Cm、降低其維持現(xiàn)狀的生產(chǎn)收益Pm,與提升煤炭企業(yè)智慧礦山建設效益Bm都可以有效降低政府監(jiān)管概率。
4.1.3 動態(tài)懲罰政策SD仿真分析
使用Vensim PLE軟件分別仿真靜態(tài)懲罰策略和動態(tài)懲罰策略下政府和煤炭企業(yè)策略的演化過程,如圖6(a)所示。由圖6(a)可知,以相同的初始值α=0.35,β=0.4,在靜態(tài)懲罰政策下,政府和煤炭企業(yè)的策略選擇不斷波動,振幅隨著博弈次數(shù)與時間的增加有擴大之勢,且政府選擇監(jiān)管率普遍高于煤炭企業(yè)選擇智慧礦山建設率;而在動態(tài)懲罰政策下,政府和煤炭企業(yè)的策略波動隨著時間與博弈次數(shù)的增加而逐漸趨于穩(wěn)定,且煤炭企業(yè)選擇智慧礦山建設率普遍高于政府選擇監(jiān)管率。這表明,政府動態(tài)懲罰策略有利于提高煤炭企業(yè)的智慧礦山建設率,且使博弈雙方較快達到系統(tǒng)的演化穩(wěn)定均衡點。
圖6 政府和煤炭企業(yè)在懲罰政策下的演化過程Fig.6 Evolution process of government and coal enterprise under punishment policy
政府采用補貼激勵策略是為了促進智慧礦山在煤炭企業(yè)的建設應用。在此策略的實施初期,進行智慧礦山建設的煤炭企業(yè)比例相對較低時,政府為降低礦山生產(chǎn)的潛在風險,提高區(qū)域內(nèi)煤炭企業(yè)礦山生產(chǎn)的安全性,政府會具有較強的意愿去激勵煤炭企業(yè),所以會給實施智慧礦山建設的煤炭企業(yè)提供較高的補貼;反之,當選擇智慧礦山建設的煤炭企業(yè)比例提升時,轄區(qū)內(nèi)煤炭企業(yè)生產(chǎn)的潛在風險便會大幅降低,政府對煤炭企業(yè)的補貼意愿將隨之降低,從而對實施智慧礦山建設的煤炭企業(yè)提供較低的補貼。據(jù)此,假設政府的補貼金額與煤炭企業(yè)智慧礦山建設率成反比,即當政府選擇監(jiān)管且煤炭企業(yè)選擇智慧礦山建設時,令煤炭企業(yè)智慧礦山建設得到政府的獎勵補貼費用由固定值A(chǔ)m變?yōu)楹瘮?shù)g(β)=(1-β)r,并且0 4.2.1 動態(tài)補貼政策系統(tǒng)博弈穩(wěn)定性分析 根據(jù)上述分析,將g(β)=(1-β)r代替式(3)中的Am得系統(tǒng)復制動態(tài)方程組見式(16)。 (16) (17) 從而解得: 4.2.2 動態(tài)補貼政策下系統(tǒng)博弈均衡點分析 已知0 (18) (19) (20) (21) 其次對β**各個參數(shù)分別求導,得到式(22)。 (22) 由此可得,政府的補貼上限r(nóng)、政府對煤炭企業(yè)的懲罰Fm以及政府的監(jiān)管成本Cg會同時影響α**和β**的大小。提高補貼上限r(nóng)時,α**與β**會同時減?。辉龃髴土PFm時,α**會減小而β**會增大;減少Cg時,α**和β**同時增大。另外,當煤炭企業(yè)智慧礦山建設成本Cm增加、維持現(xiàn)狀的生產(chǎn)收益Pm增加如煤炭價格短期內(nèi)大幅上漲,以及煤炭企業(yè)智慧礦山建設收益Bm降低時,會造成政府監(jiān)管概率α**的上升而增加政府工作量。 4.2.3 政府動態(tài)補貼政策SD仿真分析 利用SD模型分別對靜態(tài)補貼政策和動態(tài)補貼政策下的政府和煤炭企業(yè)策略的演化過程進行仿真,如圖7(a)所示。由圖7(a)可知,以相同的初始值α=0.35,β=0.4為前提,在靜態(tài)補貼政策下,政府和煤炭企業(yè)策略選擇反復波動,并且隨著時間與博弈次數(shù)的增加波動幅度有擴大趨勢;但在動態(tài)補貼政策下,隨著時間和博弈次數(shù)的增加,政府和煤炭企業(yè)的策略選擇逐漸趨于穩(wěn)定,波動也得到顯著的抑制。這表明相對于靜態(tài)補貼政策,政府的動態(tài)補貼政策有利于政企雙方選擇的混合策略達到演化穩(wěn)定的均衡點。 圖7 政府和煤炭企業(yè)在補償政策下的演化過程Fig.7 Evolution process of government and coal enterprise under subsidy policy 1) 政府實施靜態(tài)獎懲措施無法有力推動煤炭企業(yè)開展智慧礦山建設,兩者之間的演化路徑呈現(xiàn)周期性的循環(huán)波動,此情況反映了當下政府和煤炭企業(yè)兩群體博弈過程的長久性和周期性。因此,當?shù)卣枰槍γ禾科髽I(yè)智慧礦山建設行為策略積極調(diào)整監(jiān)管獎懲措施,為提高煤炭企業(yè)智慧礦山建設率采取最佳獎懲手段。 2) 政府實施動態(tài)獎勵或懲罰措施可以有效抑制政府和煤炭企業(yè)博弈過程的波動性,系統(tǒng)仿真顯示演化軌跡螺旋地內(nèi)趨于穩(wěn)定焦點,說明相應措施下存在演化穩(wěn)定均衡點。因此,當?shù)卣ㄟ^事先了解煤炭企業(yè)智慧礦山建設概率來調(diào)整自身的監(jiān)管策略,并制定動態(tài)獎勵或懲罰措施,合理確定獎懲力度,煤炭企業(yè)的智慧礦山建設策略會朝著積極且穩(wěn)定的方向發(fā)展。 3) 政府在動態(tài)獎勵或懲罰措施下提高懲罰力度對降低自身監(jiān)管概率和提高煤炭企業(yè)智慧礦山建設率具有顯著正向影響。因此,當?shù)卣梢酝ㄟ^定期監(jiān)管與提高煤炭企業(yè)維持現(xiàn)狀或建設不達標等問題的罰款,降低自身監(jiān)管率的同時提升煤礦企業(yè)群體的智慧礦山建設率。 4) 政府在動態(tài)獎勵或懲罰措施下降低監(jiān)管成本能有效提高政府監(jiān)管率和煤炭企業(yè)智慧礦山建設率。因此,當?shù)卣ㄟ^完善監(jiān)管手段如建立智慧礦山系統(tǒng)平臺實現(xiàn)遠程監(jiān)管,或多部門聯(lián)動開展協(xié)同監(jiān)管等,在降低政府監(jiān)管成本提升監(jiān)管效率的同時也能有效提高煤炭企業(yè)智慧礦山建設積極性。 5) 政府在動態(tài)獎勵或懲罰措施下降低煤炭企業(yè)智慧礦山建設成本、提高智慧礦山建設效益或者減少企業(yè)維持現(xiàn)狀的生產(chǎn)收益,能有效降低政府監(jiān)管率,從而降低監(jiān)管成本。 因此,當?shù)卣梢酝ㄟ^人才引進、技術(shù)扶持以及開展專題培訓等手段降低煤炭企業(yè)的智慧礦山建設門檻,同時也可采取智慧礦山生產(chǎn)稅收減免、礦產(chǎn)資源優(yōu)先配置以及推動建立智慧礦山聯(lián)盟等手段提高企業(yè)智慧礦山建設的預期收益,從而以支撐手段代替監(jiān)管手段推動煤礦企業(yè)智慧礦山建設,實現(xiàn)煤炭企業(yè)生產(chǎn)轉(zhuǎn)型升級。5 結(jié) 論