薛禹勝,吳巨愛,2,謝東亮,黃 杰,蔡 斌
(1.國(guó)網(wǎng)電力科學(xué)研究院有限公司(南瑞集團(tuán)有限公司),江蘇省南京市 211106;2.南京郵電大學(xué)自動(dòng)化學(xué)院、人工智能學(xué)院,江蘇省南京市 210023)
現(xiàn)實(shí)世界是由許多有人參與的復(fù)雜巨系統(tǒng)[1]構(gòu)成的,例如,經(jīng)濟(jì)系統(tǒng)、能源系統(tǒng)、交通系統(tǒng)、社會(huì)系統(tǒng)等。隨著社會(huì)文明進(jìn)程的演化,人類社會(huì)個(gè)體行為的多元化、多樣化得到全面的發(fā)展。目前,包括能源行業(yè)在內(nèi),多學(xué)科領(lǐng)域的研究已將目光聚焦到?jīng)Q策行為研究的視角上[2]。在能源系統(tǒng)中,智能電網(wǎng)是利用智能監(jiān)測(cè)技術(shù)、控制技術(shù)、通信技術(shù)以及自愈技術(shù)裝備起來的電力網(wǎng)絡(luò),它可以為電力產(chǎn)消者(prosumers)提供更便捷的服務(wù)和更靈活的選擇,同時(shí)提高供電的可靠性和安全性[3]。究其本質(zhì)而言,智能電網(wǎng)被認(rèn)為是典型的信息物理系統(tǒng)(cyberphysical system,CPS),呈現(xiàn)出信息系統(tǒng)與物理系統(tǒng)的深度融合[4-5]。在市場(chǎng)開放環(huán)境下,隨著系統(tǒng)中參與者重要性的提高,原先CPS 的分析框架中需要納入社會(huì)因素[6],“CPS+社會(huì)因素”即構(gòu)成了信息物理社會(huì)系統(tǒng)(cyber-physical-social system,CPSS)。CPSS 強(qiáng)調(diào)CPS 向外部領(lǐng)域的拓展,順應(yīng)能源轉(zhuǎn)型的本質(zhì)需要,能源的信息物理社會(huì)系統(tǒng)(CPSS in energy,CPSSE)概念的提出為實(shí)現(xiàn)“雙碳”目標(biāo)提供了路徑優(yōu)化的分析框架[7-9]。
針對(duì)CPSS 的研究中,研究對(duì)象除CPS 外,涉及了更為復(fù)雜的人與社會(huì)系統(tǒng)的認(rèn)知、建模與分析,而對(duì)決策行為的精確刻畫是其中的關(guān)鍵科學(xué)難題。區(qū)別于自然科學(xué),在機(jī)理上,決策行為的“輸入-輸出”并非可以通過解析方式精確描述的各類物理、力學(xué)、化學(xué)、生物等傳統(tǒng)意義的科學(xué)定律或公式,并形成在物理、數(shù)學(xué)上的因果關(guān)系,而是心理學(xué)上的因果驅(qū)動(dòng)關(guān)系[10]。這也導(dǎo)致決策行為難以通過經(jīng)典的可以直接控制系統(tǒng)行為的“牛頓定律”建模與分析。
文獻(xiàn)[11-12]指出經(jīng)典的研究范式包括實(shí)驗(yàn)研究、理論研究、計(jì)算科學(xué)等3 種,大數(shù)據(jù)時(shí)代又催生了被認(rèn)為是第4 種研究范式的基于數(shù)據(jù)驅(qū)動(dòng)的大數(shù)據(jù)范式。前3 種研究范式被普遍認(rèn)為是針對(duì)因果型數(shù)據(jù)的研究范式;大數(shù)據(jù)是指具有復(fù)雜結(jié)構(gòu),包括不具有或尚未掌握其因果關(guān)系的數(shù)據(jù)集,大數(shù)據(jù)范式以統(tǒng)計(jì)型數(shù)據(jù)為主要研究對(duì)象;CPSS 中由于包含參與者決策行為的博弈型數(shù)據(jù)(行為型數(shù)據(jù))的加入,導(dǎo)致上述研究范式的適用性與有效性的降低。
本文探討了針對(duì)CPSS 的研究中參與者的決策博弈行為如何接入仿真,分析了傳統(tǒng)仿真方法與決策行為建模的適用性與不足,進(jìn)而總結(jié)了融合真實(shí)實(shí)驗(yàn)人、多代理模型以及數(shù)學(xué)模型的混合仿真研究范式。同時(shí),用作者團(tuán)隊(duì)已有的研究案例分別從數(shù)據(jù)采集、知識(shí)提取、仿真分析等方面解析決策支持中計(jì)入博弈行為的研究,以此說明混合仿真方法是解決并實(shí)現(xiàn)多決策場(chǎng)景中參與者決策博弈行為的復(fù)現(xiàn)、推演與預(yù)測(cè)的有效研究范式。
從瞬間的靈感到持久的思維方式、從個(gè)體行為到群體行為的“涌現(xiàn)”,人的決策行為由內(nèi)生驅(qū)動(dòng),既不是隨機(jī)發(fā)生的,也不全部遵循固定的程式,并隨著外部環(huán)境的變化而演變。
如圖1 所示,參與者決策行為主要受決策時(shí)的博弈環(huán)境、用戶的感知能力和行為偏好影響。其中,博弈環(huán)境為外生因素,主要指其他決策主體的決策,各決策主體間的交互關(guān)系,以及決策時(shí)的外部信息。感知能力和行為偏好為內(nèi)生因素,感知能力反映了決策主體的個(gè)體差異,包括不同參與者信息不完全或不對(duì)稱的記憶狀態(tài)(已掌握的歷史信息)、對(duì)歷史信息的處理和推理能力、對(duì)新信息感知的學(xué)習(xí)能力,以及包括情緒、疲勞程度、心理波動(dòng)在內(nèi)的決策時(shí)的狀態(tài)。行為偏好分為自制力與自利性兩方面,缺乏自制力表現(xiàn)為決策主體因缺乏自我控制而無法堅(jiān)持所制定的計(jì)劃;自利性決定了決策的目標(biāo),即使是完全相同的場(chǎng)景下參與者仍可能具有不同的自利性程度。
圖1 影響決策行為的因素Fig.1 Influencing factors of decision behavior
仿真是掌握復(fù)雜系統(tǒng)行為的有效手段,仿真能夠處理復(fù)雜的數(shù)學(xué)問題,同時(shí)又能模擬大規(guī)模決策主體互動(dòng)的“涌現(xiàn)”現(xiàn)象。研究中可以根據(jù)實(shí)際需求設(shè)定觀測(cè)的變量,開展針對(duì)性的仿真實(shí)驗(yàn)。對(duì)于決策行為研究而言,借由仿真可以研究決策行為在不同輸入下的響應(yīng),分析決策的動(dòng)態(tài)特性以及預(yù)測(cè)未來的決策行為。
計(jì)算仿真也即完全基于模型的仿真活動(dòng),其對(duì)實(shí)證分析的價(jià)值取決于模型的準(zhǔn)確性。因此,在獲取系統(tǒng)結(jié)構(gòu)模型的同時(shí),對(duì)復(fù)雜系統(tǒng)的仿真繞不開對(duì)參與者行為的建模。
2.1.1 動(dòng)力學(xué)模型與多代理模型
參與者的決策行為模型一般分為系統(tǒng)動(dòng)力學(xué)模型(system dynamic model)或 多 代 理 模 型(agentbased model)[13-14]。系 統(tǒng) 動(dòng) 力 學(xué) 模 型 采 用“自 上 而下”的設(shè)計(jì)思路,將參與者行為聚合為少數(shù)類別,并認(rèn)為同一類別內(nèi)的參與者行為是同質(zhì)的,通過改變個(gè)體數(shù)量、行為特征參數(shù)、系統(tǒng)信息傳遞能力等,研究系統(tǒng)隨時(shí)間演變的長(zhǎng)期行為,此建模方法的核心在于掌握該類參與者的整體行為模式。多代理模型則是“自下而上”的建模,側(cè)重于對(duì)個(gè)體行為以及個(gè)體之間的相互關(guān)系建模,個(gè)體代理的行為通常是異質(zhì)的,由該代理行為及其與其他代理的交互關(guān)系構(gòu)成,并通過個(gè)體代理間的相互作用涌現(xiàn)出參與者群體的行為模式。
2.1.2 建模方法
具體的決策行為建模方法分為解析法和數(shù)據(jù)驅(qū)動(dòng)法。對(duì)于解析法,無論是優(yōu)化模型[15]還是博弈模型[16],均需確定參與者的效用函數(shù)(例如收益最大化[17-18]、預(yù) 期 后 悔 最 小 化[19-20]、價(jià) 格 需 求 彈 性[21-22]等)。數(shù)據(jù)驅(qū)動(dòng)法的核心在于通過分析大量數(shù)據(jù)獲取知識(shí),可用于辨識(shí)模型參數(shù)或建立通用模型,雖然知識(shí)模型存在由人工構(gòu)建還是數(shù)據(jù)自動(dòng)導(dǎo)出的差別,但兩者并不對(duì)立且可互為補(bǔ)充[23-24]。在完全依靠數(shù)據(jù)統(tǒng)計(jì)分析的過程中加入人工構(gòu)建的數(shù)學(xué)模型作為指導(dǎo),有助于提高統(tǒng)計(jì)分析的適用性與精度;在完全依靠數(shù)學(xué)模型分析的過程中加入數(shù)據(jù)統(tǒng)計(jì)分析,有助于提高數(shù)學(xué)模型分析的效率[11-12]。
數(shù)據(jù)驅(qū)動(dòng)中常用的數(shù)據(jù)分析方法有:分類、聚類、關(guān)聯(lián)(相關(guān)、回歸等)、判別、主成分分析、統(tǒng)計(jì)推斷等[25]。近年來,利用機(jī)器學(xué)習(xí)等人工智能算法的數(shù)據(jù)挖掘方法已成為研究的熱點(diǎn),而其中典型的模型 結(jié) 構(gòu) 包 括:強(qiáng) 化 學(xué) 習(xí)[26-27]、深 度 學(xué) 習(xí)[28]、神 經(jīng) 網(wǎng)絡(luò)[29]、決策樹[30]、貝葉斯網(wǎng)絡(luò)[31]、支持向量機(jī)[32]、正則化[33]等;例如文獻(xiàn)[26]基于Q-learning 構(gòu)建金融市場(chǎng)的交易決策;文獻(xiàn)[28]通過深度學(xué)習(xí)利用神經(jīng)網(wǎng)絡(luò)的非線性擬合能力,構(gòu)建用戶的需求側(cè)響應(yīng)行為模型;文獻(xiàn)[30]則采用決策樹分析了人駕車在交叉路口車輛合流時(shí)的避讓決策問題等。
借助決策行為模型群體規(guī)模可變的優(yōu)勢(shì),計(jì)算仿真可開展大規(guī)模重復(fù)仿真研究,進(jìn)而實(shí)現(xiàn)因素閾值變化對(duì)決策結(jié)果影響的靈敏度分析,或通過多次仿真探尋重復(fù)決策中的信息反饋與學(xué)習(xí)效應(yīng)對(duì)決策結(jié)果的影響。
實(shí)驗(yàn)仿真借鑒自然科學(xué)實(shí)驗(yàn)的方法,通過真實(shí)人參與的實(shí)驗(yàn)來探究在一定的社會(huì)環(huán)境中支配行為的內(nèi)在規(guī)律。實(shí)驗(yàn)仿真方法最具代表性的是將其應(yīng)用于經(jīng)濟(jì)學(xué)領(lǐng)域的實(shí)驗(yàn)經(jīng)濟(jì)學(xué)方法,弗農(nóng)·洛馬克斯·史密斯(Vernon Lomax Smith)因?yàn)槠鋵?duì)實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的開創(chuàng)性研究分享了2002 年度的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)[34];實(shí)驗(yàn)經(jīng)濟(jì)學(xué)方法克服了以往市場(chǎng)經(jīng)濟(jì)與社會(huì)科學(xué)的研究無法計(jì)及人們主觀意愿及博弈行為的影響,為機(jī)理研究及決策優(yōu)化提供了有力支持。
實(shí)驗(yàn)仿真與計(jì)算仿真的本質(zhì)區(qū)別在于主觀行為(人的經(jīng)濟(jì)活動(dòng)或決策)是否可用客觀模型準(zhǔn)確描述。前者認(rèn)為無法準(zhǔn)確描述,因此在實(shí)驗(yàn)仿真過程中有人參與,在能源經(jīng)濟(jì)研究領(lǐng)域中具有代表性的仿真應(yīng)用有PowerWeb[35];后者認(rèn)為可以準(zhǔn)確描述,所以計(jì)算仿真過程中沒有人的參與,典型的仿真應(yīng)用包括MASCEM[36]、AMES[37]、EMCAS[38]等。
基于解析法建模的效用函數(shù)以理性人作為基本的建模依據(jù)。然而,通過唯象觀察并不能得出決策人是利他還是利己的結(jié)論,將演化生物學(xué)中生物行為的最優(yōu)化理論套用到參與者的決策中亦缺乏理論與實(shí)踐的說服力[39]。諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者赫伯特·西蒙(Herbert Simon)首次提出有限理性經(jīng)濟(jì)人的概念[40],有限理性或非理性行為的不確定性體現(xiàn)為不同參與者的決策行為存在差異,以及同一參與者的決策行為無法保持一致性(即使兩次面對(duì)同一問題也可能作出不同的決策)。理查德·塞勒(Richard Thaler)將現(xiàn)實(shí)中人在決策過程中存在的非理性特征歸納為有限認(rèn)知、有限自利和有限自制力[41-42]。
對(duì)于有限理性或非理性行為,由于行為偏好的不確定性導(dǎo)致難以確定其效用函數(shù);即便是基于演化博弈論(結(jié)合博弈論分析與動(dòng)態(tài)演化過程分析)或模糊理論[43-44]的方法,雖然個(gè)體行為的動(dòng)作策略可以以固定或隨機(jī)的方式更新,但其更新的規(guī)則仍是固定的。
雖然基于數(shù)據(jù)驅(qū)動(dòng)方法可以直接通過已有數(shù)據(jù)建立通用模型,側(cè)重于數(shù)據(jù)中的相關(guān)性研究,這同樣適用于由心理學(xué)因果驅(qū)動(dòng)的決策行為建模。但其建模方法一方面存在高質(zhì)量數(shù)據(jù)難以獲取的問題;另一方面無法探究其構(gòu)建的模型內(nèi)在機(jī)理,對(duì)微觀決策行為的解析存在欠缺。
實(shí)驗(yàn)仿真方法對(duì)于復(fù)雜系統(tǒng)中參與者決策行為的分析,一方面需要系統(tǒng)完整的動(dòng)力學(xué)模型,另一方面則受到系統(tǒng)、場(chǎng)地、合格人員規(guī)模及研究時(shí)間的限制。另外,在靈敏度分析時(shí)難以保證實(shí)驗(yàn)人的決策思維過程在多次重復(fù)實(shí)驗(yàn)中保持不變。
基于上述原因,急需探尋新的參與者決策行為研究范式。通過融合真實(shí)實(shí)驗(yàn)人、多代理、數(shù)學(xué)模型的動(dòng)態(tài)交互仿真,筆者團(tuán)隊(duì)提出基于混合仿真研究參與者決策行為的方法[45]。仿真中構(gòu)建多數(shù)理性參與者的多代理模型,利用多代理在仿真實(shí)驗(yàn)中決策的可重復(fù)性;并同時(shí)將關(guān)鍵少數(shù)參與者通過人機(jī)接口接入多代理仿真環(huán)境,用以反映非理性的主觀意愿或博弈行為。圖2 反映了混合仿真方法的結(jié)構(gòu)流程,其本質(zhì)是融合統(tǒng)計(jì)分析、因果分析與行為分析的數(shù)據(jù)驅(qū)動(dòng)方法與實(shí)驗(yàn)研究、理論研究、計(jì)算科學(xué)等研究范式相結(jié)合的沙盤推演方法[13]。仿真中需處理不同類型數(shù)據(jù)(統(tǒng)計(jì)型數(shù)據(jù)、因果型數(shù)據(jù)、行為型數(shù)據(jù))的融合,其中,構(gòu)建數(shù)學(xué)模型的數(shù)據(jù)類型除了統(tǒng)計(jì)型數(shù)據(jù)外,還隱含了網(wǎng)絡(luò)拓?fù)?、結(jié)構(gòu)等確定性數(shù)據(jù)。
圖2 混合仿真中不同類型數(shù)據(jù)的融合Fig.2 Integration of different types of data in hybrid simulation
混合仿真支持真實(shí)實(shí)驗(yàn)人、計(jì)算機(jī)代理、數(shù)學(xué)模型同時(shí)進(jìn)行動(dòng)態(tài)交互仿真,將包括問卷采集信息在內(nèi)的統(tǒng)計(jì)型數(shù)據(jù)建立完整反映答卷人群的計(jì)算機(jī)多代理。同時(shí),真實(shí)實(shí)驗(yàn)人將已有信息用于輔助決策,實(shí)驗(yàn)人對(duì)已有歷史信息的認(rèn)知程度與處理能力反映了其決策博弈的能力。通過對(duì)動(dòng)態(tài)交互仿真結(jié)果的分析,以及系統(tǒng)推演運(yùn)行情況的知識(shí)提取可持續(xù)修正數(shù)據(jù)模型的準(zhǔn)確性,輔助問答卷的設(shè)計(jì)并改進(jìn)多代理模型的準(zhǔn)確性。同時(shí),可進(jìn)一步補(bǔ)充用于輔助真實(shí)實(shí)驗(yàn)人決策的信息量。
對(duì)于CPSS 這類包含社會(huì)行為的復(fù)雜系統(tǒng)而言,其中涉及人與社會(huì)的動(dòng)態(tài)變化,一方面行為模型的準(zhǔn)確性難以利用實(shí)證與統(tǒng)計(jì)數(shù)據(jù)進(jìn)行校核。另外,研究的問題本身也是不斷發(fā)展變化的。因此,針對(duì)CPSS 的研究無法通過令人信服的整體解析模型對(duì)系統(tǒng)行為進(jìn)行預(yù)測(cè)、推演與分析?;旌戏抡娣椒梢酝ㄟ^精心設(shè)計(jì)的人工實(shí)驗(yàn),實(shí)驗(yàn)中借助真實(shí)社會(huì)試驗(yàn)無法實(shí)施的決策的可重復(fù)性,實(shí)現(xiàn)外部環(huán)境動(dòng)態(tài)適應(yīng)下的滾動(dòng)迭代決策,從而形成控制上的閉環(huán)反饋研究范式。
過去數(shù)年里,基于混合仿真方法,以及自主開發(fā)的CPSS 仿真平臺(tái)(simulation platform for cyberphysical-social system,Sim-CPSS)[9,46-48],作 者 團(tuán) 隊(duì)通過實(shí)驗(yàn)仿真進(jìn)行數(shù)據(jù)采集,提出融合多類型數(shù)據(jù)的數(shù)據(jù)分析方法,構(gòu)建符合采樣人群博弈行為高維聯(lián)合概率分布的多代理模型,并陸續(xù)開展了電動(dòng)汽車(electric vehicle,EV)用戶購(gòu)置意愿[45,49]、出行意愿[50-51]與參與電網(wǎng)輔助服務(wù)行為的沙盤推演,以及碳市場(chǎng)交易決策行為的沙盤推演[52-54],以輔助交叉領(lǐng)域的決策支持與系統(tǒng)態(tài)勢(shì)分析。其中,涉及多類型數(shù)據(jù)的融合分析,從統(tǒng)計(jì)型數(shù)據(jù)中發(fā)現(xiàn)因果,以及基于知識(shí)提取的多代理建模與仿真。
做好“自己”就是首先要將自己的工作和問題解決好。畢竟打鐵還需自身硬。所以練好自己的本領(lǐng)可以做到具體以下兩個(gè)措施:
以下將分別圍繞代理模型的外在輸入、輸入到輸出的映射、模型參與混合仿真三方面對(duì)已有研究案例展開論述。
混合仿真中代理模型輸入特征量的獲取,可基于決策博弈行為的機(jī)理分析,或依據(jù)大量歷史數(shù)據(jù)的相關(guān)性分析。構(gòu)建多代理模型的數(shù)據(jù)來源包括調(diào)查咨詢、專用采集設(shè)備、文獻(xiàn)文檔、專家知識(shí)、模型仿真、實(shí)驗(yàn)仿真等。
EV 用戶意愿(購(gòu)置、出行)研究采用基于問卷調(diào)查的數(shù)據(jù)采集方式,碳市場(chǎng)交易行為研究的數(shù)據(jù)來源于交易仿真進(jìn)程中記錄的交易決策數(shù)據(jù)。由于特征量獲取與數(shù)據(jù)采集的先、后關(guān)系,上述兩者數(shù)據(jù)采集的區(qū)別在于:問卷數(shù)據(jù)為指定特征量的給定特征空間數(shù)據(jù)(特征量的獲取先于數(shù)據(jù)采集),而仿真交易記錄的數(shù)據(jù)為未指定特征量的全特征空間數(shù)據(jù)(數(shù)據(jù)采集先于特征量的獲?。?/p>
問卷調(diào)查是一種靜態(tài)斷面數(shù)據(jù)采集方式,通過分析給定場(chǎng)景下一組實(shí)驗(yàn)人對(duì)決策選項(xiàng)的選擇(對(duì)于開放式提問,實(shí)驗(yàn)人也可以自由編寫用于應(yīng)答的決策),以獲取一組實(shí)驗(yàn)人的行為或意愿的統(tǒng)計(jì)數(shù)據(jù)。問卷調(diào)查所收集的數(shù)據(jù)一般有6 種類型:當(dāng)前的行為、過去的行為、對(duì)承擔(dān)義務(wù)較大問題的態(tài)度、對(duì)承擔(dān)義務(wù)較小問題的態(tài)度、未來的行為、未來的態(tài)度[55]。用問卷調(diào)查進(jìn)行定性研究一直是社會(huì)科學(xué)研究領(lǐng)域中比較傳統(tǒng)的研究方法,但目前在定量研究中也得到了廣泛的應(yīng)用,尤其是模型分析中定量分析在缺失值處理、非線性關(guān)系、測(cè)量層次、測(cè)量模型、潛變量模型、分析單元的層序性、社會(huì)網(wǎng)絡(luò)模型、系統(tǒng)動(dòng)力學(xué)、預(yù)測(cè)模型、計(jì)算機(jī)模擬等方向已經(jīng)有了突破性發(fā)展[56]。
設(shè)計(jì)問卷前需要對(duì)問題本身進(jìn)行評(píng)估,在調(diào)查之前應(yīng)該盡可能地讓受訪者理解問題。因此,問卷設(shè)計(jì)需要仔細(xì)、反復(fù)地推敲問題的措辭,盡量讓問題足夠明晰和簡(jiǎn)潔,并與所設(shè)定的研究目標(biāo)相一致。
采用問卷調(diào)查采集用戶行為數(shù)據(jù)的難點(diǎn)在于:1)獲取影響用戶行為的全部因素;2)在權(quán)衡問卷中問題數(shù)量的同時(shí),通過問卷設(shè)計(jì)實(shí)現(xiàn)調(diào)查場(chǎng)景的全覆蓋。EV 的購(gòu)置意愿與出行意愿研究中,區(qū)別于影響用戶購(gòu)置意愿的5 個(gè)因素互相獨(dú)立(按各因素分別設(shè)計(jì)問卷問題即可),出行意愿研究中影響出行決策各因素之間的因果邏輯性更強(qiáng),且高度關(guān)聯(lián)。另外,由于用戶面臨的具體出行場(chǎng)景眾多,為了避免引起答卷人的反感與應(yīng)答疲勞,在問題設(shè)置時(shí)不僅不能依靠對(duì)場(chǎng)景的窮舉,反而要盡可能壓縮問題數(shù)量,這勢(shì)必要在問卷設(shè)計(jì)階段將影響因素間的因果邏輯關(guān)系解構(gòu)。這也表明,調(diào)查場(chǎng)景數(shù)目較多時(shí),通過問卷的方法獲取高質(zhì)量的數(shù)據(jù)依賴于能否在問卷設(shè)計(jì)階段解析出影響因素的因果機(jī)理或因果關(guān)系。此外,針對(duì)不同因素對(duì)用戶決策判斷影響的內(nèi)在機(jī)理難以解析的問題,問卷方法可以通過人工干預(yù)的方式(設(shè)置影響因素重要性排序問題)探究決策行為機(jī)理,從而獲取影響因素對(duì)用戶決策影響的內(nèi)在邏輯順序。
由于交易的場(chǎng)景眾多,同時(shí)在影響交易行為的因素尚不明確,以及對(duì)因素間影響機(jī)理認(rèn)知不足的情況下,碳市場(chǎng)交易決策行為初始數(shù)據(jù)的采集難以通過指定特征量的方式完成。因此,研究中在多個(gè)時(shí)間斷面進(jìn)行碳市場(chǎng)仿真交易,通過全特征空間數(shù)據(jù)采集方式記錄用戶的碳交易決策行為。通過對(duì)動(dòng)態(tài)交易數(shù)據(jù)的知識(shí)提取可有效改善影響因素及其因果關(guān)系不明確的問題,解決該問題后,后續(xù)的數(shù)據(jù)采集可進(jìn)一步聚焦指定特征量進(jìn)行。
EV 用戶意愿與碳市場(chǎng)交易決策行為研究采集的數(shù)據(jù)均包含典型的統(tǒng)計(jì)型數(shù)據(jù)與行為型數(shù)據(jù)。然而,EV 用戶意愿的研究中,由于在問卷設(shè)計(jì)階段對(duì)影響因素間邏輯關(guān)系進(jìn)行解構(gòu),其本質(zhì)即融入因果分析,這使得原本單純的問卷統(tǒng)計(jì)數(shù)據(jù)中具備了因果相關(guān)性信息。影響因素重要性排序的提出也進(jìn)一步強(qiáng)化了這一過程,這為統(tǒng)計(jì)型數(shù)據(jù)中挖掘因果提供了可行的方法,提升了統(tǒng)計(jì)型數(shù)據(jù)的知識(shí)提取價(jià)值與便捷性。
第2 章指出除了采用優(yōu)化模型、博弈模型描述代理的行為模型外,常用的還有數(shù)據(jù)驅(qū)動(dòng)方法,或融合解析與數(shù)據(jù)驅(qū)動(dòng)的方法。
利用獲取的數(shù)據(jù)構(gòu)建相應(yīng)的計(jì)算機(jī)多代理模型是混合仿真的關(guān)鍵一環(huán),尤其是面臨專業(yè)的真實(shí)實(shí)驗(yàn)人稀缺的情況,生成符合條件的多代理則顯得愈發(fā)重要。多代理模型需滿足與指定人群決策/意愿在統(tǒng)計(jì)分布上的一致性,這將直接影響混合仿真結(jié)果的有效性。基于統(tǒng)計(jì)型數(shù)據(jù)、因果型數(shù)據(jù)、博弈型數(shù)據(jù)中的一種或多種均可以生成模擬用戶決策行為的多代理模型。圖3 分別反映了利用采集的數(shù)據(jù)構(gòu)建EV 購(gòu)買意愿以及碳市場(chǎng)交易決策多代理的流程圖。
圖3 基于數(shù)據(jù)知識(shí)提取的多代理生成流程圖Fig.3 Flow chart of multi-agent generation based on data knowledge extraction
傳統(tǒng)的問卷數(shù)據(jù)一般為統(tǒng)計(jì)型數(shù)據(jù),涉及問卷數(shù)據(jù)的研究時(shí),利用統(tǒng)計(jì)的方法易得單一特征量閾值與用戶決策結(jié)果的相互關(guān)系。但是,用戶的決策過程往往表現(xiàn)為受多個(gè)特征量的共同影響,考察其中一個(gè)特征量與決策結(jié)果之間的相互關(guān)系時(shí),同一份答卷中往往隱含了答卷人對(duì)其他特征量的確定性看法,因而答卷人群對(duì)所有影響因素心理閾值的聯(lián)合概率信息也就必然隱含在答卷的全集之中。因此,在EV 購(gòu)買意愿多代理建模的過程中,必須按答卷人群意愿的高維聯(lián)合概率分布來抽樣選擇各影響因素的心理閾值,其中包括因素重要性排序的條件概率分布與各因素閾值取值的條件概率分布。基于上述數(shù)據(jù)結(jié)構(gòu)反映的分布權(quán)重,通過蒙特卡洛方法完成意愿的隨機(jī)抽取,最終構(gòu)建重現(xiàn)答卷人群EV購(gòu)置意愿分布的多代理模型。
碳市場(chǎng)交易決策多代理建模的過程中,首先基于歷史數(shù)據(jù)挖掘驅(qū)動(dòng)碳市場(chǎng)交易決策行為的關(guān)鍵因素;然后,引入先驗(yàn)因果關(guān)系知識(shí),以此構(gòu)建不同因素間的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu);接著,基于實(shí)驗(yàn)經(jīng)濟(jì)學(xué)仿真實(shí)驗(yàn)獲得的樣本數(shù)據(jù),挖掘擬合不同因素間的條件概率分布;最后,構(gòu)建重現(xiàn)碳市場(chǎng)參與者交易決策行為的多代理模型。
多代理建模的過程中,遇到樣本不足或數(shù)據(jù)不完整是其中的常見現(xiàn)象,通常的處理方法有:1)直接拋棄不完整的樣本;2)基于專家知識(shí)手工補(bǔ)充缺失的特征值;3)用訓(xùn)練數(shù)據(jù)集中的某種可信統(tǒng)計(jì)量(如均值、中位數(shù)、回歸值等)填補(bǔ)缺失的特征值;4)應(yīng)用機(jī)器學(xué)習(xí)方法補(bǔ)充缺失的特征值;5)將特征量的閾值范圍重新分類。
針對(duì)EV 購(gòu)置意愿的研究中,分別利用多因素閾值半開區(qū)間的兼容性以及采用單因素閾值的獨(dú)立概率分布的近似提取方法,也即采用全局或部分全局常量近似代替局部缺失的特征值。另外,由于重要性排序方法的使用,確保了在構(gòu)建高重要性因素閾值的概率分布時(shí)能夠盡可能利用到更多的樣本,對(duì)于低重要性的因素在必要時(shí)則采用近似方法。
由于研究對(duì)象與決策目標(biāo)的不同,上述兩種代理模型的決策判據(jù)也存在一定的差異。
EV 購(gòu)買意愿代理為按影響因素重要性依次判斷的決策樹模型,研究中設(shè)置5 個(gè)因素(續(xù)駛里程、充電時(shí)間、購(gòu)買價(jià)差、購(gòu)買價(jià)格、燃料價(jià)格)的閾值均滿足時(shí)輸出代理有購(gòu)置EV 的意愿。針對(duì)此類問題的研究,也可依據(jù)數(shù)據(jù)分析或?qū)<抑R(shí)調(diào)整需滿足閾值的因素個(gè)數(shù)(例如,設(shè)置重要性排前3 的因素閾值滿足即輸出代理有購(gòu)置EV 的意愿)。
碳市場(chǎng)交易代理的決策過程如圖4 所示。通過對(duì)驅(qū)動(dòng)交易決策的客觀因素與主觀因素的因果分析,將影響交易決策的因素提煉為“市場(chǎng)態(tài)勢(shì)判斷”與“交易迫切性”兩類。決策過程中,代理采集市場(chǎng)信息及自有信息,計(jì)算特征變量rft、rpt、和rut的取值(rft為碳價(jià)的長(zhǎng)期價(jià)格趨勢(shì),rpt為碳價(jià)的短期價(jià)格趨勢(shì),rut反映了碳排放不平衡量及當(dāng)前時(shí)刻與履約時(shí)刻的遠(yuǎn)近),基于交易決策行為與特征變量的聯(lián)合概率分布進(jìn)行隨機(jī)抽樣,確定交易行為(平均交易量dq為正值表示購(gòu)買,為負(fù)值表示出售)。
圖4 碳市場(chǎng)交易代理的決策過程Fig.4 Decision-making process of carbon market trading agents
EV 用戶意愿和碳市場(chǎng)交易代理建模完成后,分別采用與問卷群體統(tǒng)計(jì)結(jié)果對(duì)比,以及與實(shí)際碳市場(chǎng)走勢(shì)對(duì)比的方法進(jìn)行了代理的有效性驗(yàn)證。除此以外,輔助決策支持的大規(guī)?;旌戏抡嫱蒲莘治鲞€面臨確定接入仿真中的代理群體與真實(shí)實(shí)驗(yàn)人數(shù)量這一關(guān)鍵問題。
混合仿真中,接入實(shí)驗(yàn)的代理與實(shí)驗(yàn)人的數(shù)量與各自的行為偏好密切相關(guān)。由于采用真實(shí)實(shí)驗(yàn)人反映用戶的非理性行為,有必要在仿真實(shí)驗(yàn)開始前,在基于訓(xùn)練樣本集構(gòu)建的多代理群體(既存在理性行為,又存在非理性行為的代理個(gè)體)中篩除存在非理性行為的代理。代理行為的非理性大致可表現(xiàn)為兩類,一類是其決策行為與群體決策行為有較大偏離的,另一類則是同一場(chǎng)景下其決策行為有較大偏離。
對(duì)代理非理性行為的準(zhǔn)確識(shí)別,除了在決策行為的仿真預(yù)測(cè)中彰顯了必要性,在靈敏度分析時(shí),通過攝動(dòng)不同偏好的多代理個(gè)體數(shù)量(或真實(shí)實(shí)驗(yàn)人個(gè)體數(shù)量)參與仿真,對(duì)于發(fā)現(xiàn)影響系統(tǒng)整體行為復(fù)雜性的關(guān)鍵個(gè)體以及其影響系統(tǒng)行為的內(nèi)在機(jī)理同樣也至關(guān)重要。
CPSS 除了涉及自然學(xué)科,還涉及行為學(xué)、心理學(xué)、經(jīng)濟(jì)學(xué)等社會(huì)學(xué)科,需要相應(yīng)研究范式的融合。由于以計(jì)算仿真和實(shí)驗(yàn)仿真為代表的傳統(tǒng)仿真方法孤立地使用模型或真實(shí)實(shí)驗(yàn)人表達(dá)其中的決策博弈行為,導(dǎo)致對(duì)復(fù)雜社會(huì)系統(tǒng)的研究存在適應(yīng)性不足的問題?;旌戏抡娣椒ㄓ糜行则?yàn)證過的多代理模型代替理性行為,用真實(shí)實(shí)驗(yàn)人參與仿真實(shí)驗(yàn)反映非理性行為,有效克服了傳統(tǒng)方法難以支撐對(duì)參與者規(guī)模、非理性行為、靈敏度分析的可比性等方面的要求。
在給出的案例中,EV 用戶意愿的統(tǒng)計(jì)建模過程反映了影響因素的重要性排序,針對(duì)高維空間中學(xué)習(xí)樣本不足及分布不均勻的困難,紓解了多級(jí)分類順序及各級(jí)分類閾值優(yōu)化中遇到的困難;在碳交易決策行為的建模中引入了不同因素間的貝葉斯結(jié)構(gòu),以更好地歸納學(xué)習(xí)樣本集所包含的信息。
混合仿真方法為探索CPSS 中的決策行為研究指明了方向,已有案例在數(shù)據(jù)采集、知識(shí)提取和決策支持的分析鏈中逐漸形成了各自的理論與實(shí)踐創(chuàng)新。隨著更多社會(huì)元素的融入,研究對(duì)象將進(jìn)一步多元化與復(fù)雜化,使得混合仿真方法仍有大量的提升改進(jìn)空間,包括:借助Sim-CPSS 搭建更為逼真的仿真環(huán)境、協(xié)同處理不同類型數(shù)據(jù)、模型分析與數(shù)據(jù)驅(qū)動(dòng)的有機(jī)結(jié)合等,并需要更多實(shí)際案例的驗(yàn)證。