敬 超,李?yuàn)櫳?/p>
(1.桂林理工大學(xué) 信息科學(xué)與工程學(xué)院,廣西 桂林 541004;2.桂林理工大學(xué) 廣西嵌入式技術(shù)與智能系統(tǒng)重點(diǎn)實(shí)驗(yàn)室,廣西 桂林 541004; 3.桂林電子科技大學(xué) 可信軟件重點(diǎn)實(shí)驗(yàn)室,廣西 桂林 541004)
需求響應(yīng)(demand response,DR)是指電力用戶通過(guò)供電方發(fā)出的價(jià)格信號(hào)或者激勵(lì)政策,調(diào)整固有習(xí)慣用電模式,減少或者推移某個(gè)時(shí)段的用電負(fù)荷而響應(yīng)電力供應(yīng),從而保證電網(wǎng)穩(wěn)定,抑制電價(jià)上升的短期行為[1]。數(shù)據(jù)中心巨大的電力消耗和內(nèi)部工作負(fù)載的靈活性及內(nèi)部設(shè)備高度可調(diào)控能力,使其成為了需求響應(yīng)的重要參與者[2]??紤]到數(shù)據(jù)中心在建造和維護(hù)上的龐大開銷,為節(jié)約成本和保證服務(wù)質(zhì)量,很多公司和企業(yè)(如Twitter、Akama等)通過(guò)租賃數(shù)據(jù)中心安置服務(wù)器來(lái)實(shí)施和運(yùn)營(yíng)業(yè)務(wù),即多租戶托管型數(shù)據(jù)中心(multi-tenant colocation data center)。然而與傳統(tǒng)的數(shù)據(jù)中心參與需求響應(yīng)研究相比,多租戶數(shù)據(jù)中心參與需求響應(yīng)面臨的首要問(wèn)題是激勵(lì)分離問(wèn)題(split-incentive problem):由于用電合同的局限性和激勵(lì)方法的缺乏以及服務(wù)器的私有性,租戶不會(huì)主動(dòng)參與需求響應(yīng)。并且受到權(quán)限的制約,數(shù)據(jù)中心運(yùn)營(yíng)商也無(wú)法對(duì)該數(shù)據(jù)中心內(nèi)部署的服務(wù)器進(jìn)行電能調(diào)控。因此,研究如何設(shè)計(jì)激勵(lì)方法鼓勵(lì)租戶參與需求響應(yīng)對(duì)電力市場(chǎng)的宏觀調(diào)控和保證電網(wǎng)的穩(wěn)定運(yùn)行都有著重要的意義。為解決上述問(wèn)題,本文重點(diǎn)研究了多租戶數(shù)據(jù)中心的需求響應(yīng)問(wèn)題,以最大化需求方和響應(yīng)方利益為目的,提出了一種基于Stackelberg博弈模型的交互式電力定價(jià)激勵(lì)方法,建立需求響應(yīng)模型及相關(guān)的成本函數(shù),并證明了納什均衡點(diǎn)的存在性,基于非線性規(guī)劃的思想,提出了一種高效的激勵(lì)定價(jià)方法(EIPM:efficient incentive pricing method based on non-linear programming)。實(shí)驗(yàn)結(jié)果表明,EIPM算法可以獲得最佳的激勵(lì)定價(jià),同時(shí)最大化需求方和響應(yīng)方的收益。與典型的梯度法[3]及外罰函數(shù)[4]相比,EIPM效率高且具有較好的收斂性。
在激勵(lì)方法中電力定價(jià)是最為核心的內(nèi)容,因?yàn)楹侠淼碾娏Χ▋r(jià)可以激勵(lì)更多的租戶參與需求響應(yīng)。傳統(tǒng)的電力定價(jià)方法主要包括分時(shí)定價(jià)、尖峰定價(jià)、實(shí)時(shí)定價(jià)和基于合約的定價(jià)方法[5]。文獻(xiàn)[6]主要對(duì)分時(shí)定價(jià)方法進(jìn)行了優(yōu)化,討論了一種一般性的用戶電力需求隨機(jī)建??蚣?,結(jié)合分時(shí)電價(jià)合約特征,在建模過(guò)程考慮均值波動(dòng)并建模為分?jǐn)?shù)布朗運(yùn)動(dòng),相比于傳統(tǒng)的分時(shí)定價(jià),該方法可以更好地均衡電價(jià)并減少誤差。文獻(xiàn)[7]的工作不僅考慮了時(shí)間,而且還將位置因素考慮在內(nèi)來(lái)進(jìn)行電力定價(jià)。然而當(dāng)遇到因突發(fā)事件造成的緊急需求響應(yīng)時(shí)(emergency demand response,EDR),無(wú)論是基于時(shí)間段的定價(jià)方法,還是根據(jù)租戶簽訂的合約來(lái)制定價(jià)格的方法,都無(wú)法解決可用電量不足的問(wèn)題。
針對(duì)這一問(wèn)題有的研究提出了基于負(fù)載均衡和調(diào)度的方法。Wang等[8]智能電網(wǎng)(smart grid,SG)引入,實(shí)現(xiàn)了一種SG和數(shù)據(jù)中心之間電力負(fù)載均衡的方法,在該方法中為了達(dá)到降低數(shù)據(jù)中心成本的目的,考慮了能源成本對(duì)定價(jià)的影響。文獻(xiàn)[9,10]是通過(guò)優(yōu)化調(diào)度和負(fù)載轉(zhuǎn)移來(lái)滿足需求響應(yīng)的電力需求,其中Xingjian Lu等[9]將分布式數(shù)據(jù)中心間批量數(shù)據(jù)傳輸?shù)穆酚珊驼{(diào)度問(wèn)題建模為一個(gè)最小化成本的多商品流動(dòng)問(wèn)題,并提出了一種兩階段優(yōu)化方法,該方法先將需求進(jìn)行最優(yōu)化劃分,然后再計(jì)算最優(yōu)劃分中各部分的最佳路由和調(diào)度方案。該方法中考慮的成本支出包括網(wǎng)絡(luò)寬帶以及數(shù)據(jù)傳輸成本。考慮地理分布式數(shù)據(jù)中心電力價(jià)格產(chǎn)生的影響,文獻(xiàn)[10]提出了一種價(jià)格敏感的地理負(fù)載均衡方案,利用不同位置數(shù)據(jù)中心間的交互信息定義價(jià)格敏感系數(shù),利用該系數(shù)決定負(fù)載的遷移。雖然通過(guò)負(fù)載均衡和調(diào)度方法可以在一定程度上解決需求響應(yīng)時(shí)用電不足的情況。但是對(duì)于多租戶數(shù)據(jù)中心,由于激勵(lì)分離,缺乏激勵(lì)機(jī)制,當(dāng)需求響應(yīng)發(fā)生時(shí),租戶不會(huì)主動(dòng)參與。
面對(duì)這類問(wèn)題,為了激勵(lì)租戶參與需求響應(yīng),有的研究基于博弈論的激勵(lì)方法,主要是通過(guò)拍賣方法支付報(bào)酬獎(jiǎng)勵(lì)的方式,激勵(lì)租戶參與需求響應(yīng)既可以滿足響應(yīng)需求,又能最大化參與者的收益。云服務(wù)提供商(cloud service provider,CSP)為了激勵(lì)智能電網(wǎng)參與需求響應(yīng),文獻(xiàn)[11]提出了一種拍賣方法,使智能電網(wǎng)能夠自愿向CSP提交投標(biāo),從而使得CSP可以以不同的付款獲得不同數(shù)量的需求響應(yīng),以此來(lái)最大化社會(huì)福利。文獻(xiàn)[12]在托管數(shù)據(jù)中心的需求響應(yīng)中提出了一種反向拍賣的近似比率MEDR機(jī)制,并采用動(dòng)態(tài)規(guī)劃解決此問(wèn)題,設(shè)計(jì)了一種融合高效FPTAS算法的拍賣系統(tǒng)最大化社會(huì)福利。文獻(xiàn)[13]提出了一種保證真實(shí)性的激勵(lì)機(jī)制Truth-DR滿足需求響應(yīng)。它利用反向拍賣選擇租戶的投標(biāo),并根據(jù)租戶商定的能源減少量給予激勵(lì)報(bào)酬。雖然通過(guò)拍賣方法可以激勵(lì)租戶參與滿足需求響應(yīng),并保證需求方和響應(yīng)方的收益,但是在這些方法中只是給定了激勵(lì)的定價(jià)參數(shù)并沒(méi)有考慮影響定價(jià)的因素,以及需求方和響應(yīng)方博弈的互動(dòng)過(guò)程。
具有主從結(jié)構(gòu)的Stackelberg模型是一種經(jīng)典的博弈模型可以反映實(shí)時(shí)供需互動(dòng)[14],文獻(xiàn)[15]將數(shù)據(jù)中心能源消耗問(wèn)題建模為一個(gè)Stackelberg博弈,為了實(shí)現(xiàn)雙方博弈的利益最大化,在此系統(tǒng),監(jiān)視器作為領(lǐng)導(dǎo)者通過(guò)動(dòng)態(tài)調(diào)整資源的供應(yīng)來(lái)實(shí)現(xiàn)利益最大化,而作為跟隨者調(diào)度代理則可以通過(guò)選擇不同的資源數(shù)量來(lái)獲得最佳性能。文獻(xiàn)[16]則是基于Stackelberg博弈提出了一種綠色能源感知分配方案,主要是將用戶、云控制器、數(shù)據(jù)中心三者之間的交互建模為一個(gè)Stackelberg三層模型,其中云控制器作為中間層,接受來(lái)自用戶的請(qǐng)求,然后將請(qǐng)求分配給數(shù)據(jù)中心。通過(guò)該方法來(lái)維持?jǐn)?shù)據(jù)中心的可持續(xù)發(fā)展,以達(dá)到最大化社會(huì)福利的目的。應(yīng)用Stackelberg博弈模型的原理,為了最大化運(yùn)營(yíng)商和訂閱者的利益,Zhang等在工作[3]中提出了層次博弈模型來(lái)應(yīng)對(duì)多個(gè)數(shù)據(jù)中心運(yùn)營(yíng)商同時(shí)服務(wù)多個(gè)服務(wù)訂閱者時(shí)的資源分配問(wèn)題。文獻(xiàn)[17]則提出了一種兩階段Stackelberg博弈的定價(jià)方法來(lái)應(yīng)對(duì)電力需求響應(yīng),該方法中主要結(jié)合了定價(jià)和負(fù)載轉(zhuǎn)移的方法,實(shí)現(xiàn)需求方和響應(yīng)方利益最大化的目的,同時(shí)他們的工作還證明了該博弈納什均衡的存在性和唯一性。雖然這些方法基于博弈的思想實(shí)現(xiàn)了社會(huì)福利或者利益最大化,但是在尋找納什均衡點(diǎn)時(shí)還存在收斂性不夠好的問(wèn)題。
綜上所述可知,過(guò)去的研究沒(méi)有考慮激勵(lì)分離進(jìn)行電力定價(jià),雖然有的研究采用了博弈論設(shè)計(jì)激勵(lì)方法但是沒(méi)有考慮需求響應(yīng)的博弈互動(dòng),并且所提出的算法收斂性不夠好。
假設(shè)在某個(gè)區(qū)域內(nèi)有M個(gè)數(shù)據(jù)中心C={C1,C2,…,CM}, 所對(duì)應(yīng)的租戶數(shù)量為N,T={T1,T2,…,TN}。 這些數(shù)據(jù)中心都由數(shù)據(jù)中心運(yùn)營(yíng)商(data center operator,DCO)管理,但是由于受到合同的限制運(yùn)營(yíng)商不能隨意對(duì)數(shù)據(jù)中心內(nèi)部租戶服務(wù)器進(jìn)行調(diào)控,所以當(dāng)在時(shí)刻t,運(yùn)營(yíng)商收到了電力需求響應(yīng)請(qǐng)求后,綜合考慮自身利益制定激勵(lì)定價(jià),并向租戶發(fā)起需求響應(yīng)信號(hào),租戶自愿參與需求響應(yīng)。
為了反映需求方和響應(yīng)方的互動(dòng),本文采用了Stackelberg博弈模型,通過(guò)博弈需求方和響應(yīng)方都會(huì)達(dá)到一個(gè)均衡狀態(tài),并最大化自身效益。在Stackelberg博弈模型中主要的角色包括領(lǐng)導(dǎo)者和跟隨者,領(lǐng)導(dǎo)者首先行動(dòng),跟隨者根據(jù)領(lǐng)導(dǎo)者的行動(dòng)來(lái)選擇自己的策略。
本文將需求方和響應(yīng)方建模為兩階段Stackelberg博弈問(wèn)題,如圖1所示,需求方數(shù)據(jù)中心運(yùn)營(yíng)商作為領(lǐng)導(dǎo)者首先行動(dòng),根據(jù)請(qǐng)求給出電力總需求,并初始化激勵(lì)定價(jià)集合P,定義成本函數(shù),需求方根據(jù)響應(yīng)方的動(dòng)態(tài)策略變化,不斷動(dòng)態(tài)調(diào)整定價(jià)并最小化自己的成本。
圖1 電力需求響應(yīng)下基于Stackelberg博弈交互
接著,作為跟隨者的響應(yīng)方租戶則是根據(jù)需求以及自身能夠響應(yīng)的最大電力數(shù)量和激勵(lì)定價(jià)集合,初始化自己響應(yīng)的電力并根據(jù)領(lǐng)導(dǎo)者給出的激勵(lì)定價(jià),動(dòng)態(tài)調(diào)整自身的需求供應(yīng)策略,由此,雙方完成第一輪博弈。在每一輪博弈中,跟隨者在得到領(lǐng)導(dǎo)者的電力需求和激勵(lì)定價(jià)集合后,根據(jù)上一輪其它租戶提供的電力供應(yīng)量之和和收益公式計(jì)算出自己的最佳收益,計(jì)算完后進(jìn)入下一輪博弈,如此重復(fù),在經(jīng)過(guò)多次博弈之后,直到響應(yīng)方的租戶中沒(méi)有人愿意改變自己的策略,則供需雙方達(dá)到了納什均衡。
根據(jù)上述系統(tǒng)模型描述,本小節(jié)主要是對(duì)于需求方(運(yùn)營(yíng)商)和響應(yīng)方(租戶)進(jìn)行建模,具體的包括需求方成本模型和響應(yīng)方收益模型。
2.3.1 需求方成本模型
在t時(shí)刻,影響需求方的成本主要包括激勵(lì)支出和成本節(jié)約兩種。其中激勵(lì)支出PIt為電力成本和激勵(lì)成本之和,而成本節(jié)約SIt則是指需求方直接采用后備電力系統(tǒng)供電的開銷與借助需求響應(yīng)后帶來(lái)的開銷之差,具體的數(shù)學(xué)表達(dá)式如下
(1)
(2)
(3)
式(2)表示租戶提供的電力xi、電價(jià)成本pi,激勵(lì)增量Rt均需大于0;式(3)表示響應(yīng)方提供的電量應(yīng)該不小于需求電量et。
2.3.2 響應(yīng)方收益模型
在t時(shí)刻作為響應(yīng)方的租戶,其目的在滿足需求響應(yīng)的前提下,最小化開銷以此來(lái)獲得最大收益。對(duì)于響應(yīng)方租戶i,收益模型計(jì)算分為兩個(gè)部分:激勵(lì)收入TIt和損耗開銷TLt,響應(yīng)方的收益計(jì)算函數(shù)如式(4)所示
(4)
(5)
假設(shè)在t時(shí)刻需求響應(yīng)事件發(fā)生,根據(jù)以往電力成本初始化電力成本價(jià)格集合為p1=p2=p3=…=pn。然而在本系統(tǒng)中,由于每個(gè)響應(yīng)方的響應(yīng)電力數(shù)量不同,因此相應(yīng)的電力成本和激勵(lì)也是各不相同的,這樣做的目的是為了保證參與者之間的公平性。所以,在這樣的前提下,為了保證準(zhǔn)確及時(shí)定價(jià),分別建立了系統(tǒng)模型、需求方模型、響應(yīng)方模型,以及基于Stackelberg博弈的電力定價(jià)模型,目的在于降低需求方的成本和最大化響應(yīng)方的收益,對(duì)于需求方的成本最小化可以形式化表述為
(6)
(7)
(8)
式(6)是求需求方成本的最小值函數(shù),其中式(7)中的各參數(shù)含義同式(1)。
響應(yīng)方的收益最大化可以表述為
(9)
(10)
(11)
式(9)是求響應(yīng)方收益的最大值函數(shù),式中的各參數(shù)含義同式(4),約束(10)的含義同式(5),約束(11)是其它參數(shù)的正數(shù)約束。
(12)
(13)
在本研究中需求方和響應(yīng)方之間存在著唯一的納什均衡。由于響應(yīng)方之間是相互獨(dú)立的且他們的目的都是最大化自身的收益,因此他們之間是屬于非合作博弈,另外為了保證真實(shí)性,我們會(huì)根據(jù)租戶以往的響應(yīng)情況判斷他們的行為是否真實(shí),以便保證響應(yīng)的真實(shí)性。
證明:響應(yīng)方收益最大化
在博弈中,每個(gè)響應(yīng)方租戶都獨(dú)立的選擇自己的最優(yōu)資源策略。因此對(duì)響應(yīng)方的收益函數(shù)分別求一階導(dǎo)(14)和二階導(dǎo)(15)有
(14)
(15)
由上式可得二階導(dǎo)小于0,因此該成本函數(shù)是嚴(yán)格凹的,存在最大值,在需求方給定電力定價(jià)的情況下,響應(yīng)方總是能夠找到對(duì)自己最有利的定價(jià),使得自己的收益最大,因此博弈存在著唯一的納什均衡點(diǎn)。
針對(duì)以上式子,令一階導(dǎo)(14)為0可得
(16)
Bi-pi>0
(17)
(18)
可得
(19)
證明:需求方成本最小化
(20)
對(duì)其求二階導(dǎo)為
(21)
(22)
得
pi<4Bi-3w1·vi(li,ρi,Ai)
(23)
因此可以得到pi的范圍為
(24)
當(dāng)pi滿足以上約束條件時(shí),二者即達(dá)成納什均衡。
由以上問(wèn)題描述和模型可以發(fā)現(xiàn),本文所研究的問(wèn)題可以規(guī)約為一個(gè)非線性優(yōu)化問(wèn)題,解決該問(wèn)題可以通過(guò)非線性規(guī)劃的方法,設(shè)計(jì)一種求解目標(biāo)函數(shù)或通過(guò)約束條件中有一個(gè)或幾個(gè)非線性函數(shù)對(duì)問(wèn)題進(jìn)行最優(yōu)化求解。
因此,本文將求解Stackelberg博弈的納什均衡點(diǎn)建模為一個(gè)多目標(biāo)的非線性規(guī)劃問(wèn)題,采用非線性規(guī)劃法求解。首先,需求方初始化自己的各個(gè)參數(shù)以及定價(jià)集合,響應(yīng)方租戶初始化自己響應(yīng)的電力數(shù)量,進(jìn)入第一輪博弈;根據(jù)相關(guān)約束條件,在每一輪博弈中,每個(gè)響應(yīng)方租戶得到定價(jià)后,根據(jù)自身?xiàng)l件計(jì)算自身收益得到最佳策略,需求方計(jì)算自身的成本;不斷重復(fù)上述博弈過(guò)程,直到需求方和響應(yīng)方都不再改變自身的策略時(shí),則雙方達(dá)到博弈均衡點(diǎn),即輸出最佳定價(jià)結(jié)果和需求-響應(yīng)方的最優(yōu)目標(biāo)值。
算法1:基于非線性規(guī)劃的高效激勵(lì)定價(jià)方法
Input:et,Rt,mi,q,w1,li,ri,Ai
(2) After receiving the demand request, give the demandetto Tenant;
(3) Initializepifor Tenant;
(4) Repeat:
(5) Start from each tenant
(8) Givexito DCO according topi;
(11) End For tenant
(13) Initializemt,qt,w1;
(15) Giving thepi,RttoTi;
(16)I++;
(18) DCO and Tenant reach Nash equilibrium
(19) Break;
(20) End If
(21)End Repeat
借鑒前人的工作[3,16,18],本文主要通過(guò)仿真的方式進(jìn)行實(shí)驗(yàn)對(duì)比,實(shí)驗(yàn)主要通過(guò)MATLAB編程實(shí)現(xiàn),數(shù)據(jù)中心、租戶和數(shù)據(jù)中心運(yùn)營(yíng)商限定在某個(gè)區(qū)域,最大租戶數(shù)量為30,每個(gè)租戶相關(guān)的參數(shù)見表1,每個(gè)值在給定的范圍內(nèi)隨機(jī)產(chǎn)生。
表1 仿真參數(shù)
5.2.1 不同優(yōu)化算法對(duì)比及分析
為了體現(xiàn)所提優(yōu)化算法EIPM的有效性和優(yōu)越性,分別對(duì)比梯度法及外罰函數(shù)在解決非線性問(wèn)題時(shí)的結(jié)果,其中:
梯度法:是一種優(yōu)化迭代算法,從某個(gè)初始點(diǎn)出發(fā),不斷向著函數(shù)值減小的方向調(diào)整,直到函數(shù)值穩(wěn)定在某個(gè)值。
外罰函數(shù):是指根據(jù)約束函數(shù)和目標(biāo)函數(shù),構(gòu)建出一種懲罰函數(shù),然后將對(duì)有約束非線性規(guī)劃問(wèn)題的求解轉(zhuǎn)化為無(wú)約束問(wèn)題求解。
圖2主要展示了3種算法的對(duì)比結(jié)果,當(dāng)參與需求響應(yīng)的租戶數(shù)量分別為4、6、20時(shí),需求方為了滿足需求響應(yīng)所得到的成本開銷,從圖中可以發(fā)現(xiàn)所提出的EIPM的算法成本最少,優(yōu)于其它兩種方法。主要的原因是采用梯度法的步長(zhǎng)不太容易確定,容易導(dǎo)致所得解陷入局部最優(yōu);而外罰函數(shù)的罰因子會(huì)影響迭代次數(shù),當(dāng)計(jì)算量較大時(shí),不一定會(huì)得到一個(gè)近似的最優(yōu)解。由此可見,通過(guò)EIPM算法可以使得需求方進(jìn)行合理定價(jià)減少成本支出,同時(shí)響應(yīng)方也能最大化其收益滿足電力需求響應(yīng)。
圖2 租戶數(shù)量不同時(shí)3種算法下需求方成本
表2、表3及表4主要展示了當(dāng)租戶數(shù)量分別為4、6、20時(shí),不同算法下租戶的收益。從以上3個(gè)表格我們可以看出,當(dāng)租戶數(shù)量為4和6時(shí),通過(guò)EIPM算法得到租戶的收益要比同等條件下,梯度法和外罰函數(shù)得到的收益高一些;當(dāng)租戶數(shù)量為20時(shí),通過(guò)EIPM算法得到的租戶收益中,存在小部分的租戶的收益小于梯度法和外罰函數(shù)獲得的收益。原因在于,當(dāng)租戶數(shù)量增多時(shí),梯度法和外罰函數(shù)求得的運(yùn)營(yíng)商成本要比EIPM法,因此存在個(gè)別租戶收益高稍高情況。綜上所述本文提出的EIPM算法從總體上來(lái)看具有更好的效果滿足租戶的收益最大化的目的。
表2 當(dāng)租戶數(shù)量為4時(shí)不同算法下租戶的收益
表3 當(dāng)租戶數(shù)量為6時(shí)不同算法下租戶的收益
表5展示了在最大迭代次數(shù)為3000時(shí),3種算法運(yùn)行結(jié)束后的時(shí)間開銷。由表可以發(fā)現(xiàn),當(dāng)響應(yīng)方租戶數(shù)量分別為4、6和20時(shí),本文所提算法的時(shí)間開銷最低,外罰函數(shù)稍高,而梯度法最高,這是因?yàn)樘荻确ǖ牟介L(zhǎng)會(huì)影響收斂的速度,太大的話可能會(huì)發(fā)散,太小收斂速度又太慢,因此時(shí)間開銷較大;為了保證外罰函數(shù)解的可行性,初始時(shí)迭代因子較小,增加了計(jì)算量,時(shí)間相對(duì)長(zhǎng)一點(diǎn)。由實(shí)驗(yàn)結(jié)果可以知道,所提算法時(shí)間開銷較小。
5.2.2 參與需求響應(yīng)的租戶數(shù)量不同對(duì)租戶的定價(jià)、電力響應(yīng)數(shù)量、收益及時(shí)間復(fù)雜度的影響
本小節(jié)主要考察不同數(shù)量租戶參與需求響應(yīng)對(duì)電力定價(jià)、電力響應(yīng)數(shù)量、收益及時(shí)間復(fù)雜度的影響。表6主要列出了通過(guò)EIPM計(jì)算達(dá)到納什均衡得到的最優(yōu)定價(jià)情況,分別對(duì)應(yīng)參與的租戶數(shù)量為4、6和20的最優(yōu)電力定價(jià)。表7則表示當(dāng)參與響應(yīng)的租戶的數(shù)量為分別4、6和20時(shí),通過(guò)EIPM算法需求方和響應(yīng)方達(dá)到納什均衡時(shí),每個(gè)租戶響應(yīng)的電力數(shù)量。表8統(tǒng)計(jì)了當(dāng)響應(yīng)方分別為4、6和20時(shí),每個(gè)租戶的收益情況。表9給出了當(dāng)響應(yīng)方租戶為4、6和20時(shí)需求方的成本支出。通過(guò)以下4個(gè)表格可以觀察到,在不斷改變響應(yīng)方租戶的數(shù)量時(shí),通過(guò)EIPM計(jì)算能夠達(dá)到納什均衡,并且可以獲得最佳的電力定價(jià)及電力響應(yīng)數(shù)量,滿足需求方成本最低和響應(yīng)方收益最大化的目的。
表4 當(dāng)租戶數(shù)量為20時(shí)不同算法下租戶的收益
表5 3種算法下的時(shí)間開銷,單位:秒/s
表6 不同數(shù)量租戶參與需求響應(yīng)時(shí)的最優(yōu)電力定價(jià)
表7 不同數(shù)量租戶參與需求響應(yīng)時(shí)租戶的電力數(shù)量
圖3展示了參與需求響應(yīng)的租戶分別為4、6和20時(shí),通過(guò)提出算法計(jì)算博弈達(dá)到納什均衡時(shí),所花費(fèi)的時(shí)間分別為0.2 s,0.28 s,0.43 s。
圖4主要考察了不同數(shù)量租戶參與需求響應(yīng)時(shí)需求方成本變化情況,其中參與需求響應(yīng)的租戶數(shù)量分別為4、6和20時(shí),當(dāng)算法迭代次數(shù)大于35后,需求方的成本值趨于穩(wěn)定,說(shuō)明經(jīng)過(guò)了35輪迭代后達(dá)到納什均衡,需求方得到最優(yōu)成本。由此可得,隨著響應(yīng)人數(shù)的變化通過(guò)EIPM計(jì)算均能達(dá)到納什均衡,并且迭代次數(shù)也相對(duì)比較穩(wěn)定,因此具有較低的時(shí)間復(fù)雜度。
表8 不同數(shù)量租戶參與需求響應(yīng)時(shí)租戶的收益
表9 不同數(shù)量租戶參與需求響應(yīng)時(shí)需求方成本
圖3 不同數(shù)量租戶參與需求響應(yīng)時(shí)的算法運(yùn)行時(shí)間
圖4 租戶數(shù)量不同對(duì)EIPM迭代次數(shù)的影響
本文主要研究了多租戶數(shù)據(jù)中心下的電力需求響應(yīng)問(wèn)題,提出了一種基于Stackelberg博弈模型的電力定價(jià)激勵(lì)方法。首先為租戶和需求方建立了需求響應(yīng)模型,并建立了相關(guān)的效益函數(shù)和模型。同時(shí),為了反映需求方與響應(yīng)方的定價(jià)交互,本文基于Stackelberg博弈模型形成了一種擁有領(lǐng)導(dǎo)者和跟隨者兩種角色的動(dòng)態(tài)博弈,并在該模型下證明了其納什均衡點(diǎn)的存在;之后,為得到響應(yīng)方和需求方雙方利益最大化的激勵(lì)定價(jià),本文基于非線性規(guī)劃方法,提出了一種高效的激勵(lì)定價(jià)方法來(lái)求解。仿真實(shí)驗(yàn)結(jié)果表明了所提方法的優(yōu)越性,不僅能獲得最佳的電力定價(jià)滿足需求響應(yīng),而且與經(jīng)典的優(yōu)化方法--梯度法和外罰函數(shù)法相比,具有最低的時(shí)間開銷。