基于多學(xué)習(xí)多目標(biāo)鴿群優(yōu)化的動(dòng)態(tài)環(huán)境經(jīng)濟(jì)調(diào)度

2019-07-19 09:55:48柴旭朝瞿博陽(yáng)

鄭州大學(xué)學(xué)報(bào)(工學(xué)版) 2019年4期

閆李，李超，柴旭朝，瞿博陽(yáng)

(中原工學(xué)院電子信息學(xué)院，河南鄭州 450007)

0 引言

近年來，為綜合考慮電力系統(tǒng)運(yùn)行的經(jīng)濟(jì)效益和污染排放問題，并同時(shí)兼顧不同調(diào)度周期之間的相互影響，動(dòng)態(tài)環(huán)境經(jīng)濟(jì)調(diào)度(dynamic economic emission dispatch，DEED)得到了眾多研究者的青睞[1-4]. DEED兼顧了總調(diào)度周期內(nèi)污染排放和發(fā)電成本這兩個(gè)相互競(jìng)爭(zhēng)的目標(biāo)，在滿足包括機(jī)組平衡約束、爬坡速率約束等多個(gè)等式和不等式約束的前提下，通過分時(shí)段調(diào)配各個(gè)機(jī)組的出力大小，實(shí)現(xiàn)這兩個(gè)目標(biāo)的同時(shí)最小化. 顯然，DEED是一種更實(shí)用、更符合實(shí)際短期調(diào)度需求的模型，但這也使得DEED問題更加難以求解. 在綜合考慮上述因素的前提下，DEED問題成為一個(gè)典型的高維度、強(qiáng)耦合、非線性和非凸的多目標(biāo)優(yōu)化問題(multi-objective optimization problem，MOP).

目前，依據(jù)所用優(yōu)化算法的不同，對(duì)于多目標(biāo)DEED問題的求解，大致可分為兩類：基于單目標(biāo)優(yōu)化算法的求解方法和基于多目標(biāo)優(yōu)化算法的求解方法. 基于單目標(biāo)優(yōu)化算法的求解利用約束條件法[5]或權(quán)重系數(shù)法[6-7]等將多目標(biāo)DEED問題轉(zhuǎn)化為單目標(biāo)問題，以降低求解難度. 但該方法無法在單次運(yùn)行中為決策者提供多而優(yōu)的選擇方案. 基于多目標(biāo)優(yōu)化算法的求解將DEED問題當(dāng)作一個(gè)真正的MOP，應(yīng)用啟發(fā)式算法對(duì)兩個(gè)目標(biāo)進(jìn)行同時(shí)優(yōu)化. 目前已經(jīng)有文獻(xiàn)報(bào)道的該類算法包括NSGA-Ⅱ[3]、改進(jìn)的NSGA-Ⅱ[8]、改進(jìn)的自適應(yīng)多目標(biāo)差分算法 (MAMODE)[4]、改進(jìn)的基于差分進(jìn)化的混合化學(xué)反應(yīng)算法(HCRO)[9]、改進(jìn)的細(xì)菌覓食算法[10]以及群搜索優(yōu)化算法[11]等. 然而，針對(duì)復(fù)雜的DEED問題，設(shè)計(jì)出更優(yōu)的優(yōu)化算法進(jìn)一步改進(jìn)其調(diào)度性能，將會(huì)是DEED領(lǐng)域一個(gè)持續(xù)的研究重點(diǎn).

鴿群優(yōu)化(pigeon-inspired optimization，PIO)[12]算法是Duan等提出的一種新型仿生群體智能優(yōu)化算法，通過模擬鴿群歸巢過程的特殊導(dǎo)航行為，設(shè)計(jì)出地圖和指南針?biāo)阕右约暗貥?biāo)算子來分階段指導(dǎo)鴿群個(gè)體的飛行. 目前，PIO已成功應(yīng)用于無人機(jī)緊密編隊(duì)協(xié)同控制[13]、艦載機(jī)控制器設(shè)計(jì)[14]、直流無刷電機(jī)參數(shù)設(shè)計(jì)[15]等單目標(biāo)優(yōu)化問題的求解. 然而，對(duì)于MOP的求解，PIO還很少涉及. 2015年，Qiu等[16]提出了基于帕累托排序機(jī)制和合并算子的多目標(biāo)鴿群優(yōu)化算法(multi-objective pigeon-inspired optimization，MPIO). 但是，MPIO在解決較為復(fù)雜的MOP時(shí)，容易出現(xiàn)早熟收斂，陷入局部最優(yōu)區(qū)域而無法獲得全局最優(yōu)解集.

筆者提出了一種基于多學(xué)習(xí)策略的多目標(biāo)鴿群優(yōu)化算法(multiple learning multi-objective pigeon-inspired optimization，MLMPIO)對(duì)DEED問題進(jìn)行求解. 在多學(xué)習(xí)策略中，鴿群個(gè)體向多個(gè)全局最優(yōu)位置進(jìn)行學(xué)習(xí)，加強(qiáng)種群的社會(huì)學(xué)習(xí)能力，從而增強(qiáng)種群的全局探索能力；多學(xué)習(xí)策略還引入個(gè)體對(duì)歷史最優(yōu)位置的認(rèn)知學(xué)習(xí)，以增強(qiáng)種群的局部搜索能力. 此外，MLMPIO采用容量自適應(yīng)調(diào)整的外部存檔集來存儲(chǔ)當(dāng)前帕累托最優(yōu)解集，以提升算法的運(yùn)行效率，并引入小概率變異擾動(dòng)機(jī)制，進(jìn)一步增強(qiáng)種群的多樣性. 為驗(yàn)證所提算法求解DEED問題的有效性，筆者采用10機(jī)組電力系統(tǒng)進(jìn)行算例研究.

1 DEED數(shù)學(xué)模型

本節(jié)首先對(duì)DEED的目標(biāo)和約束進(jìn)行描述，從而建立起多目標(biāo)DEED的數(shù)學(xué)模型.

1.1 目標(biāo)函數(shù)

(1)燃料費(fèi)用.在考慮發(fā)電機(jī)組閥點(diǎn)效應(yīng)的前提下，每臺(tái)機(jī)組的燃料成本函數(shù)可由一個(gè)正弦函數(shù)和一個(gè)二次函數(shù)之和構(gòu)成. 因此，在所有調(diào)度周期內(nèi)，N臺(tái)機(jī)組的總?cè)剂腺M(fèi)用可表達(dá)為：

|disin[ei(Pimin-Pit)]|}.

(1)

(2)污染排放.系統(tǒng)污染排放量的目標(biāo)函數(shù)可表達(dá)為：

(2)

式中：αi、βi、γi、ηi、δi是機(jī)組i的污染氣體排放系數(shù).

1.2 約束

(1)功率平衡約束.功率平衡約束為等式約束:

(3)

式中：PDt和PLt分別代表第t個(gè)調(diào)度周期內(nèi)的負(fù)荷和網(wǎng)損大小. 網(wǎng)損PLt可通過B系數(shù)法求得：

(4)

式中：Bij、Bi0、B00是網(wǎng)損計(jì)算的B系數(shù).

(2)機(jī)組出力約束.

(5)

(3)機(jī)組出力爬坡約束.

(6)

式中：URi和DRi分別代表機(jī)組i出力的上升及下降爬坡速率.

1.3 數(shù)學(xué)模型

基于以上分析，DEED問題可轉(zhuǎn)換為帶有約束的多目標(biāo)優(yōu)化問題，其數(shù)學(xué)模型為：

(7)

式中：p和q分別為等式和不等式約束的數(shù)量.

對(duì)于多目標(biāo)DEED問題而言，在滿足所有等式和不等式約束的條件下，使得燃料費(fèi)用f1和污染排放f2這兩個(gè)相互矛盾的目標(biāo)同時(shí)實(shí)現(xiàn)最小化，進(jìn)而得到全部發(fā)電機(jī)組在所有調(diào)度周期內(nèi)的最優(yōu)調(diào)度方案.

2 MLMPIO算法

2.1 MPIO算法

PIO[12]是一種模擬自然界中鴿群歸巢行為的新型群體智能優(yōu)化算法.在初始進(jìn)化階段，鴿群依賴于地圖和指南針?biāo)阕舆M(jìn)行導(dǎo)航；在旅程中期，導(dǎo)航工具切換為地標(biāo)算子，重新評(píng)估飛行路線并進(jìn)行修正. 該算法具有理論簡(jiǎn)單、收斂速度快等特點(diǎn)，但標(biāo)準(zhǔn)PIO主要適用于單目標(biāo)問題. 因此，為解決多目標(biāo)優(yōu)化問題，Qiu等[16]提出了基于Pareto排序機(jī)制和合并算子的多目標(biāo)鴿群優(yōu)化算法(MPIO).

(1)Pareto排序機(jī)制.Pareto排序機(jī)制由非支配排序算子和擁擠距離算子兩部分構(gòu)成. 首先，依據(jù)個(gè)體間的支配關(guān)系，利用快速非支配排序[17]將鴿群個(gè)體劃分為不等的非支配等級(jí)，其中位于第一等級(jí)的個(gè)體構(gòu)成了當(dāng)前種群的非支配解集. 然后，利用擁擠距離算子計(jì)算不同非支配等級(jí)中個(gè)體間的擁擠距離，并依據(jù)擁擠距離的大小對(duì)個(gè)體再次進(jìn)行排序. 在兩個(gè)算子的操作完成后，鴿群個(gè)體依據(jù)其非支配等級(jí)的不同被劃入不同的集合，同時(shí)集合中的個(gè)體依據(jù)擁擠距離的大小按降序排列. Pareto排序機(jī)制的流程如圖1所示.

圖1 Pareto排序過程Fig.1 Process of Pareto sorting

如圖1所示，Pareto排序完成后，當(dāng)前種群的非支配解集被存入外部存檔集；同時(shí)，具有最大非支配等級(jí)且擁擠距離最小的后Ndec個(gè)個(gè)體被當(dāng)作劣等鴿剔除.

(2)合并算子.MPIO將地圖和指南針?biāo)阕右约暗貥?biāo)算子進(jìn)行融合，得到一個(gè)新的合并算子，進(jìn)而利用該算子對(duì)鴿群個(gè)體進(jìn)行速度和位置更新. 合并算子的具體形式如下:

(8)

式中：Np和Ndec分別代表t次迭代后的種群數(shù)量和每代需剔除的個(gè)體數(shù)量；gm代表最大迭代次數(shù)；Vi代表xi的速度；R是地圖和指南針因子；tr表示過渡因子；xg表示當(dāng)前種群的全局最優(yōu)位置；xc代表上一代非支配解集的中心位置，其計(jì)算公式如下:

(9)

2.2 基于多學(xué)習(xí)策略的多目標(biāo)鴿群優(yōu)化算法(MLMPIO)

(1)多學(xué)習(xí)策略.如式(8)所示，在MPIO的種群搜索過程中，鴿群個(gè)體同時(shí)向全局最優(yōu)個(gè)體xg和非支配解集的中心位置xc學(xué)習(xí). 在社會(huì)學(xué)習(xí)方面，MPIO通過隨機(jī)選擇的方式從外部存檔集中選擇一個(gè)個(gè)體作為全局最優(yōu)個(gè)體xg，進(jìn)而利用該個(gè)體引導(dǎo)所有個(gè)體的移動(dòng)搜索. 該方法雖然能夠增強(qiáng)MPIO的收斂速度，但是，若所選擇的全局最優(yōu)個(gè)體處于局部最優(yōu)區(qū)域或遠(yuǎn)離全局最優(yōu)區(qū)域，就可能導(dǎo)致種群陷入局部最優(yōu)，停止向全局最優(yōu)解進(jìn)化. 此外，MPIO的引導(dǎo)個(gè)體xg和xc均是從全局角度考慮而設(shè)計(jì)的引導(dǎo)個(gè)體，種群個(gè)體缺乏對(duì)自身的認(rèn)知學(xué)習(xí)以及對(duì)局部區(qū)域的搜索和開發(fā).

為解決上述問題，筆者在MPIO中引入多學(xué)習(xí)策略，對(duì)個(gè)體的速度與位置更新公式進(jìn)行改進(jìn). 改進(jìn)后的更新公式為：

(10)

式中：xg_i是個(gè)體xi對(duì)應(yīng)的全局最優(yōu)個(gè)體. 在對(duì)個(gè)體xi進(jìn)行位置更新前，首先從外部存檔集中隨機(jī)選擇兩個(gè)非支配個(gè)體作為該個(gè)體所對(duì)應(yīng)的全局最優(yōu)個(gè)體的備選集，然后選擇其中擁擠距離較大的個(gè)體作為xi的全局最優(yōu)個(gè)體xg_i. 在該策略作用下，整個(gè)種群的進(jìn)化由多個(gè)全局最優(yōu)個(gè)體進(jìn)行引導(dǎo)，種群中的個(gè)體可以向不同的全局最優(yōu)位置進(jìn)行學(xué)習(xí). 該策略能夠保持種群的多樣性和全局探索能力，避免早熟收斂. 式(10)中，xp_i表示個(gè)體xi的歷史最優(yōu)位置.xp_i的引入能夠增強(qiáng)鴿群個(gè)體對(duì)自身歷史信息的認(rèn)知學(xué)習(xí)，從而改善種群的局部搜索能力，幫助算法跳出局部最優(yōu). 因此，個(gè)體認(rèn)知學(xué)習(xí)的引入能夠增強(qiáng)算法的局部開發(fā)能力，改進(jìn)PIO求解復(fù)雜優(yōu)化問題的性能. 對(duì)于xp_i的更新，筆者采用如下方法：

步驟1 使用xi的初始值來初始化xp_i；

步驟2 根據(jù)式(10)更新xi；

步驟3 如果xi

(2)小概率變異擾動(dòng).為進(jìn)一步增強(qiáng)種群的多樣性，種群個(gè)體位置更新完成后對(duì)個(gè)體進(jìn)行小概率變異擾動(dòng). 該機(jī)制使得個(gè)體xi以一定概率Pm在以xi為中心，半徑為r的區(qū)域內(nèi)進(jìn)行隨機(jī)變異.變異形式如下所示：

(11)

(3)容量自適應(yīng)變化的外部存檔集.在MPIO算法中，采用外部存檔集的方式來存儲(chǔ)已經(jīng)找到的Pareto最優(yōu)解，并隨機(jī)從該外部存檔集中選取全局最優(yōu)位置. 但隨著迭代次數(shù)的增加，外部存檔集中最優(yōu)解的數(shù)量也會(huì)越來越多，這會(huì)降低算法的運(yùn)行速度，影響算法的運(yùn)行效率. 因此，筆者采用自適應(yīng)變化機(jī)制來動(dòng)態(tài)調(diào)整每次迭代中外部存檔集的容量，該動(dòng)態(tài)調(diào)整機(jī)制為：

EA(t)=EAmin+[EAmax-EAmin·(t/gm)],

(12)

式中:EA(t)表示第t代的外部存檔集大小;EAmin和EAmax分別表示外部存檔集的最小容量和最大容量.

3 MLMPIO在DEED中的應(yīng)用

3.1 種群初始化

對(duì)于多目標(biāo)DEED問題，每個(gè)機(jī)組在每個(gè)調(diào)度周期內(nèi)的功率輸出都應(yīng)該作為種群個(gè)體的決策變量，因此，在MLMPIO中，種群大小為Np，其中每個(gè)個(gè)體包含NT維決策變量，表達(dá)形式如下：

X={x1x2…xNp}.

(13)

(14)

式中：N是發(fā)電機(jī)組的數(shù)量；T是調(diào)度周期的個(gè)數(shù)；Pij根據(jù)式(5)在其出力上下限之間隨機(jī)產(chǎn)生.

3.2 算法流程

MLMPIO求解多目標(biāo)DEED問題的流程如下所示：

步驟1 初始化種群，包括種群大小Np，位置xi，速度Vi，個(gè)體歷史最優(yōu)xp_i，迭代次數(shù)t.

步驟2 初始化一個(gè)外部存檔集A=?，利用Pareto排序機(jī)制找到初始種群的非支配解集，并存入A.

步驟3 從A中分別為每個(gè)個(gè)體選擇合適的全局最優(yōu)xg_i，并根據(jù)式(10)更新其速度Vi和位置xi.

步驟4 依據(jù)式(11)對(duì)更新后的個(gè)體進(jìn)行小概率變異擾動(dòng).

步驟5 更新xp_i.

步驟6 找到當(dāng)前種群的非支配解集，并將其合并存入外部存檔集A；利用帕累托排序機(jī)制對(duì)外部檔案集A進(jìn)行排序，保留前EA(t)[大小由式(12)求解]個(gè)個(gè)體作為當(dāng)前代的Pareto最優(yōu)解集.

步驟7 令t=t+1，如果t

需要注意的是，筆者對(duì)于DEED中等式和不等式約束的處理采用動(dòng)態(tài)啟發(fā)式約束處理方法；此外，對(duì)于最優(yōu)折中解的計(jì)算采用基于模糊集理論的折中解求解方法，具體可見文獻(xiàn)[18].

4 實(shí)驗(yàn)結(jié)果與分析

4.1 系統(tǒng)描述與參數(shù)設(shè)置

筆者采用10機(jī)組電力系統(tǒng)驗(yàn)證MLMPIO算法的有效性，調(diào)度周期為24 h，以1 h為間隔分為24個(gè)調(diào)度時(shí)段. 機(jī)組參數(shù)、分時(shí)段負(fù)荷以及網(wǎng)損系數(shù)見文獻(xiàn)[3].所有仿真實(shí)驗(yàn)均采用Matlab R2014b 編程實(shí)現(xiàn)，測(cè)試環(huán)境為i7-6 700 K處理器(4.00 GHz)，16 GB內(nèi)存,Windows 64位Windows 7操作系統(tǒng).

MLMPIO算法的參數(shù)設(shè)置如表1所示. 需要說明的是，由于算法在每次迭代更新后均會(huì)剔除Ndec個(gè)劣等個(gè)體，所以MLMPIO的種群大小和最大迭代次數(shù)設(shè)置為298和100,其他參數(shù)均可依據(jù)算法性能進(jìn)行調(diào)整，表1中所列參數(shù)為多次試驗(yàn)后得到的最優(yōu)選擇. 此外，MPIO算法所選參數(shù)與MLMPIO一致.

表1 本文算法參數(shù)Tab.1 Optimal parameters for MLMPIO

4.2 結(jié)果分析

圖2 MLMPIO與MPIO所獲得的帕累托前沿Fig.2 The Pareto optimal fronts obtained by MLMPIO and MPIO

圖2是MLMPIO與MPIO所獲得的Pareto前沿對(duì)比圖，從圖2中可以看出，MPIO所求得的帕累托前沿分布密集且局限于較窄的區(qū)域，這表明MPIO算法在求解時(shí)可能陷入局部最優(yōu)區(qū)域. 而MLMPIO所求得的帕累托前沿分布更加廣泛也更加均勻，且各目標(biāo)的極端解也更好，可為決策者提供更優(yōu)的調(diào)度方案. 此外，圖2的結(jié)果對(duì)比也驗(yàn)證了MLMPIO算法中多學(xué)習(xí)策略及小概率變異擾動(dòng)的有效性.

表2列出了MLMPIO與MPIO所獲得的最優(yōu)目標(biāo)值和最優(yōu)折中解. 從表2中可以看出，MLMPIO所求得的經(jīng)濟(jì)目標(biāo)最優(yōu)值和環(huán)境目標(biāo)最優(yōu)值均優(yōu)于MPIO. 在最優(yōu)折中解方面，MPIO的燃料費(fèi)用目標(biāo)值(2.509 541×106$)僅比MLMPIO(2.516 345×106$)低0.27%，而在污染排放方面，MPIO(3.280 98×105lb)卻比MLMPIO(3.003 67×105lb)要多8.45%. 綜上可知，筆者提出的MLMPIO算法相比于基本MPIO來說，表現(xiàn)出更優(yōu)的全局搜索能力和計(jì)算精度，同時(shí)也展現(xiàn)出更好的調(diào)度性能.

表2 MLMPIO與MPIO實(shí)驗(yàn)結(jié)果對(duì)比Tab.2 Comparison of experiment results between MLMPIO and MPIO

表3將MLMPIO的調(diào)度結(jié)果與近年來文獻(xiàn)中采用相同機(jī)組模型的其他5種算法的結(jié)果進(jìn)行對(duì)比.分析表3中的結(jié)果可知，在經(jīng)濟(jì)目標(biāo)和環(huán)境目標(biāo)的最優(yōu)解(極端解)方面，相比于IBFA、RCGA/NSGA-Ⅱ、MAMODE以及CRO 4種算法，MLMPIO的結(jié)果(2.481 502×106$和2.942 17×105lb)都是最優(yōu)的；與HCRO算法相比，其經(jīng)濟(jì)目標(biāo)最優(yōu)值(2.479 931×106$)僅比MLMPIO(2.481 502×106$)低0.06%，但在環(huán)境目標(biāo)方面，HCRO(2.984 56×105lb)卻比MLMPIO(2.942 17×105lb)要高1.42%. 綜合兩個(gè)目標(biāo)的最優(yōu)解情況可知，MLMPIO的性能要優(yōu)于HCRO. 在最優(yōu)折中解方面，MLMPIO要優(yōu)于RCGA/NSGA-Ⅱ和CRO；IBFA的污染排放目標(biāo)值最小，但其燃料費(fèi)用(2.517 117×106$)要高于MLMPIO(2.516 345×106$)；MAMODE得到的燃料費(fèi)用目標(biāo)值最小，但其污染排放目標(biāo)值比MLMPIO高2.375×103lb. 綜上，與其他5種算法相比，MLMPIO無論在極端解還是折中解方面均表現(xiàn)出較好的優(yōu)化性能.

表3 不同算法的結(jié)果對(duì)比Tab.3 Results comparison of different methods

表4給出了MLMPIO所求得的最優(yōu)折中解，涵蓋了每個(gè)機(jī)組在全部調(diào)度時(shí)段的出力大小，同時(shí)給出了不同時(shí)段內(nèi)系統(tǒng)的網(wǎng)損和負(fù)荷大小. 通過計(jì)算可得，機(jī)組在各調(diào)度時(shí)段的總出力均等于該時(shí)段系統(tǒng)的網(wǎng)損與負(fù)荷之和，這表明MLMPIO求得的最優(yōu)折中解滿足式(3)所示的功率平衡約束，同時(shí)，各機(jī)組調(diào)度出力大小也滿足機(jī)組出力約束和爬坡約束. 這進(jìn)一步驗(yàn)證了筆者所提出MLMPIO算法在求解DEED問題時(shí)的可行性和有效性.

表4 MLMPIO的最優(yōu)折中解Tab.4 Best compromise solution obtained by MLMPIO

5 結(jié)論

筆者以電力系統(tǒng)在一定調(diào)度周期內(nèi)的總?cè)剂腺M(fèi)用和污染排放為目標(biāo)，建立了電力系統(tǒng)多目標(biāo)DEED模型，并在模型中計(jì)及了火電機(jī)組的閾點(diǎn)效應(yīng)、機(jī)組爬坡速率約束、網(wǎng)絡(luò)損耗以及負(fù)荷變化.為求解復(fù)雜的多目標(biāo)DEED問題，提出了一種基于多學(xué)習(xí)策略的多目標(biāo)鴿群優(yōu)化算法，該算法通過一種新的多學(xué)習(xí)策略來增強(qiáng)種群的多樣性和全局搜索能力，避免陷入局部最優(yōu)；同時(shí)，引入小概率變異擾動(dòng)機(jī)制來進(jìn)一步增強(qiáng)種群的多樣性；采用容量自適應(yīng)變化的外部存檔集來存儲(chǔ)當(dāng)前Pareto最優(yōu)解集，提升算法的運(yùn)行效率. 為驗(yàn)證所提算法的有效性，以10機(jī)組電力系統(tǒng)的DEED問題為算例進(jìn)行求解，并與MPIO及其他調(diào)度方案進(jìn)行對(duì)比分析.實(shí)驗(yàn)結(jié)果表明，MLMPIO是一種可行且有效的多目標(biāo)DEED問題求解算法,同其他算法相比，表現(xiàn)出更優(yōu)的全局搜索能力及尋優(yōu)能力，能夠?yàn)闆Q策者提供更多更優(yōu)的選擇.