閆 李, 李 超, 柴旭朝, 瞿博陽(yáng)
(中原工學(xué)院 電子信息學(xué)院,河南 鄭州 450007)
近年來,為綜合考慮電力系統(tǒng)運(yùn)行的經(jīng)濟(jì)效益和污染排放問題,并同時(shí)兼顧不同調(diào)度周期之間的相互影響,動(dòng)態(tài)環(huán)境經(jīng)濟(jì)調(diào)度(dynamic economic emission dispatch,DEED)得到了眾多研究者的青睞[1-4]. DEED兼顧了總調(diào)度周期內(nèi)污染排放和發(fā)電成本這兩個(gè)相互競(jìng)爭(zhēng)的目標(biāo),在滿足包括機(jī)組平衡約束、爬坡速率約束等多個(gè)等式和不等式約束的前提下,通過分時(shí)段調(diào)配各個(gè)機(jī)組的出力大小,實(shí)現(xiàn)這兩個(gè)目標(biāo)的同時(shí)最小化. 顯然,DEED是一種更實(shí)用、更符合實(shí)際短期調(diào)度需求的模型,但這也使得DEED問題更加難以求解. 在綜合考慮上述因素的前提下,DEED問題成為一個(gè)典型的高維度、強(qiáng)耦合、非線性和非凸的多目標(biāo)優(yōu)化問題(multi-objective optimization problem,MOP).
目前,依據(jù)所用優(yōu)化算法的不同,對(duì)于多目標(biāo)DEED問題的求解,大致可分為兩類:基于單目標(biāo)優(yōu)化算法的求解方法和基于多目標(biāo)優(yōu)化算法的求解方法. 基于單目標(biāo)優(yōu)化算法的求解利用約束條件法[5]或權(quán)重系數(shù)法[6-7]等將多目標(biāo)DEED問題轉(zhuǎn)化為單目標(biāo)問題,以降低求解難度. 但該方法無法在單次運(yùn)行中為決策者提供多而優(yōu)的選擇方案. 基于多目標(biāo)優(yōu)化算法的求解將DEED問題當(dāng)作一個(gè)真正的MOP,應(yīng)用啟發(fā)式算法對(duì)兩個(gè)目標(biāo)進(jìn)行同時(shí)優(yōu)化. 目前已經(jīng)有文獻(xiàn)報(bào)道的該類算法包括NSGA-Ⅱ[3]、改進(jìn)的NSGA-Ⅱ[8]、改進(jìn)的自適應(yīng)多目標(biāo)差分算法 (MAMODE)[4]、改進(jìn)的基于差分進(jìn)化的混合化學(xué)反應(yīng)算法(HCRO)[9]、改進(jìn)的細(xì)菌覓食算法[10]以及群搜索優(yōu)化算法[11]等. 然而,針對(duì)復(fù)雜的DEED問題,設(shè)計(jì)出更優(yōu)的優(yōu)化算法進(jìn)一步改進(jìn)其調(diào)度性能,將會(huì)是DEED領(lǐng)域一個(gè)持續(xù)的研究重點(diǎn).
鴿群優(yōu)化(pigeon-inspired optimization,PIO)[12]算法是Duan等提出的一種新型仿生群體智能優(yōu)化算法,通過模擬鴿群歸巢過程的特殊導(dǎo)航行為,設(shè)計(jì)出地圖和指南針?biāo)阕右约暗貥?biāo)算子來分階段指導(dǎo)鴿群個(gè)體的飛行. 目前,PIO已成功應(yīng)用于無人機(jī)緊密編隊(duì)協(xié)同控制[13]、艦載機(jī)控制器設(shè)計(jì)[14]、直流無刷電機(jī)參數(shù)設(shè)計(jì)[15]等單目標(biāo)優(yōu)化問題的求解. 然而,對(duì)于MOP的求解,PIO還很少涉及. 2015年,Qiu等[16]提出了基于帕累托排序機(jī)制和合并算子的多目標(biāo)鴿群優(yōu)化算法(multi-objective pigeon-inspired optimization,MPIO). 但是,MPIO在解決較為復(fù)雜的MOP時(shí),容易出現(xiàn)早熟收斂,陷入局部最優(yōu)區(qū)域而無法獲得全局最優(yōu)解集.
筆者提出了一種基于多學(xué)習(xí)策略的多目標(biāo)鴿群優(yōu)化算法(multiple learning multi-objective pigeon-inspired optimization,MLMPIO)對(duì)DEED問題進(jìn)行求解. 在多學(xué)習(xí)策略中,鴿群個(gè)體向多個(gè)全局最優(yōu)位置進(jìn)行學(xué)習(xí),加強(qiáng)種群的社會(huì)學(xué)習(xí)能力,從而增強(qiáng)種群的全局探索能力;多學(xué)習(xí)策略還引入個(gè)體對(duì)歷史最優(yōu)位置的認(rèn)知學(xué)習(xí),以增強(qiáng)種群的局部搜索能力. 此外,MLMPIO采用容量自適應(yīng)調(diào)整的外部存檔集來存儲(chǔ)當(dāng)前帕累托最優(yōu)解集,以提升算法的運(yùn)行效率,并引入小概率變異擾動(dòng)機(jī)制,進(jìn)一步增強(qiáng)種群的多樣性. 為驗(yàn)證所提算法求解DEED問題的有效性,筆者采用10機(jī)組電力系統(tǒng)進(jìn)行算例研究.
本節(jié)首先對(duì)DEED的目標(biāo)和約束進(jìn)行描述,從而建立起多目標(biāo)DEED的數(shù)學(xué)模型.
(1)燃料費(fèi)用.在考慮發(fā)電機(jī)組閥點(diǎn)效應(yīng)的前提下,每臺(tái)機(jī)組的燃料成本函數(shù)可由一個(gè)正弦函數(shù)和一個(gè)二次函數(shù)之和構(gòu)成. 因此,在所有調(diào)度周期內(nèi),N臺(tái)機(jī)組的總?cè)剂腺M(fèi)用可表達(dá)為:
|disin[ei(Pimin-Pit)]|}.
(1)
(2)污染排放.系統(tǒng)污染排放量的目標(biāo)函數(shù)可表達(dá)為:
(2)
式中:αi、βi、γi、ηi、δi是機(jī)組i的污染氣體排放系數(shù).
(1)功率平衡約束.功率平衡約束為等式約束:
(3)
式中:PDt和PLt分別代表第t個(gè)調(diào)度周期內(nèi)的負(fù)荷和網(wǎng)損大小. 網(wǎng)損PLt可通過B系數(shù)法求得:
(4)
式中:Bij、Bi0、B00是網(wǎng)損計(jì)算的B系數(shù).
(2)機(jī)組出力約束.
(5)
(3)機(jī)組出力爬坡約束.
(6)
式中:URi和DRi分別代表機(jī)組i出力的上升及下降爬坡速率.
基于以上分析,DEED問題可轉(zhuǎn)換為帶有約束的多目標(biāo)優(yōu)化問題,其數(shù)學(xué)模型為:
(7)
式中:p和q分別為等式和不等式約束的數(shù)量.
對(duì)于多目標(biāo)DEED問題而言,在滿足所有等式和不等式約束的條件下,使得燃料費(fèi)用f1和污染排放f2這兩個(gè)相互矛盾的目標(biāo)同時(shí)實(shí)現(xiàn)最小化,進(jìn)而得到全部發(fā)電機(jī)組在所有調(diào)度周期內(nèi)的最優(yōu)調(diào)度方案.
PIO[12]是一種模擬自然界中鴿群歸巢行為的新型群體智能優(yōu)化算法.在初始進(jìn)化階段,鴿群依賴于地圖和指南針?biāo)阕舆M(jìn)行導(dǎo)航;在旅程中期,導(dǎo)航工具切換為地標(biāo)算子,重新評(píng)估飛行路線并進(jìn)行修正. 該算法具有理論簡(jiǎn)單、收斂速度快等特點(diǎn),但標(biāo)準(zhǔn)PIO主要適用于單目標(biāo)問題. 因此,為解決多目標(biāo)優(yōu)化問題,Qiu等[16]提出了基于Pareto排序機(jī)制和合并算子的多目標(biāo)鴿群優(yōu)化算法(MPIO).
(1)Pareto排序機(jī)制.Pareto排序機(jī)制由非支配排序算子和擁擠距離算子兩部分構(gòu)成. 首先,依據(jù)個(gè)體間的支配關(guān)系,利用快速非支配排序[17]將鴿群個(gè)體劃分為不等的非支配等級(jí),其中位于第一等級(jí)的個(gè)體構(gòu)成了當(dāng)前種群的非支配解集. 然后,利用擁擠距離算子計(jì)算不同非支配等級(jí)中個(gè)體間的擁擠距離,并依據(jù)擁擠距離的大小對(duì)個(gè)體再次進(jìn)行排序. 在兩個(gè)算子的操作完成后,鴿群個(gè)體依據(jù)其非支配等級(jí)的不同被劃入不同的集合,同時(shí)集合中的個(gè)體依據(jù)擁擠距離的大小按降序排列. Pareto排序機(jī)制的流程如圖1所示.
圖1 Pareto排序過程Fig.1 Process of Pareto sorting
如圖1所示,Pareto排序完成后,當(dāng)前種群的非支配解集被存入外部存檔集;同時(shí),具有最大非支配等級(jí)且擁擠距離最小的后Ndec個(gè)個(gè)體被當(dāng)作劣等鴿剔除.
(2)合并算子.MPIO將地圖和指南針?biāo)阕右约暗貥?biāo)算子進(jìn)行融合,得到一個(gè)新的合并算子,進(jìn)而利用該算子對(duì)鴿群個(gè)體進(jìn)行速度和位置更新. 合并算子的具體形式如下:
(8)
式中:Np和Ndec分別代表t次迭代后的種群數(shù)量和每代需剔除的個(gè)體數(shù)量;gm代表最大迭代次數(shù);Vi代表xi的速度;R是地圖和指南針因子;tr表示過渡因子;xg表示當(dāng)前種群的全局最優(yōu)位置;xc代表上一代非支配解集的中心位置,其計(jì)算公式如下:
(9)
(1)多學(xué)習(xí)策略.如式(8)所示,在MPIO的種群搜索過程中,鴿群個(gè)體同時(shí)向全局最優(yōu)個(gè)體xg和非支配解集的中心位置xc學(xué)習(xí). 在社會(huì)學(xué)習(xí)方面,MPIO通過隨機(jī)選擇的方式從外部存檔集中選擇一個(gè)個(gè)體作為全局最優(yōu)個(gè)體xg,進(jìn)而利用該個(gè)體引導(dǎo)所有個(gè)體的移動(dòng)搜索. 該方法雖然能夠增強(qiáng)MPIO的收斂速度,但是,若所選擇的全局最優(yōu)個(gè)體處于局部最優(yōu)區(qū)域或遠(yuǎn)離全局最優(yōu)區(qū)域,就可能導(dǎo)致種群陷入局部最優(yōu),停止向全局最優(yōu)解進(jìn)化. 此外,MPIO的引導(dǎo)個(gè)體xg和xc均是從全局角度考慮而設(shè)計(jì)的引導(dǎo)個(gè)體,種群個(gè)體缺乏對(duì)自身的認(rèn)知學(xué)習(xí)以及對(duì)局部區(qū)域的搜索和開發(fā).
為解決上述問題,筆者在MPIO中引入多學(xué)習(xí)策略,對(duì)個(gè)體的速度與位置更新公式進(jìn)行改進(jìn). 改進(jìn)后的更新公式為:
(10)
式中:xg_i是個(gè)體xi對(duì)應(yīng)的全局最優(yōu)個(gè)體. 在對(duì)個(gè)體xi進(jìn)行位置更新前,首先從外部存檔集中隨機(jī)選擇兩個(gè)非支配個(gè)體作為該個(gè)體所對(duì)應(yīng)的全局最優(yōu)個(gè)體的備選集,然后選擇其中擁擠距離較大的個(gè)體作為xi的全局最優(yōu)個(gè)體xg_i. 在該策略作用下,整個(gè)種群的進(jìn)化由多個(gè)全局最優(yōu)個(gè)體進(jìn)行引導(dǎo),種群中的個(gè)體可以向不同的全局最優(yōu)位置進(jìn)行學(xué)習(xí). 該策略能夠保持種群的多樣性和全局探索能力,避免早熟收斂. 式(10)中,xp_i表示個(gè)體xi的歷史最優(yōu)位置.xp_i的引入能夠增強(qiáng)鴿群個(gè)體對(duì)自身歷史信息的認(rèn)知學(xué)習(xí),從而改善種群的局部搜索能力,幫助算法跳出局部最優(yōu). 因此,個(gè)體認(rèn)知學(xué)習(xí)的引入能夠增強(qiáng)算法的局部開發(fā)能力,改進(jìn)PIO求解復(fù)雜優(yōu)化問題的性能. 對(duì)于xp_i的更新,筆者采用如下方法:
步驟1 使用xi的初始值來初始化xp_i;
步驟2 根據(jù)式(10)更新xi;
步驟3 如果xi (2)小概率變異擾動(dòng).為進(jìn)一步增強(qiáng)種群的多樣性,種群個(gè)體位置更新完成后對(duì)個(gè)體進(jìn)行小概率變異擾動(dòng). 該機(jī)制使得個(gè)體xi以一定概率Pm在以xi為中心,半徑為r的區(qū)域內(nèi)進(jìn)行隨機(jī)變異.變異形式如下所示: (11) (3)容量自適應(yīng)變化的外部存檔集.在MPIO算法中,采用外部存檔集的方式來存儲(chǔ)已經(jīng)找到的Pareto最優(yōu)解,并隨機(jī)從該外部存檔集中選取全局最優(yōu)位置. 但隨著迭代次數(shù)的增加,外部存檔集中最優(yōu)解的數(shù)量也會(huì)越來越多,這會(huì)降低算法的運(yùn)行速度,影響算法的運(yùn)行效率. 因此,筆者采用自適應(yīng)變化機(jī)制來動(dòng)態(tài)調(diào)整每次迭代中外部存檔集的容量,該動(dòng)態(tài)調(diào)整機(jī)制為: EA(t)=EAmin+[EAmax-EAmin·(t/gm)], (12) 式中:EA(t)表示第t代的外部存檔集大小;EAmin和EAmax分別表示外部存檔集的最小容量和最大容量. 對(duì)于多目標(biāo)DEED問題,每個(gè)機(jī)組在每個(gè)調(diào)度周期內(nèi)的功率輸出都應(yīng)該作為種群個(gè)體的決策變量,因此,在MLMPIO中,種群大小為Np,其中每個(gè)個(gè)體包含NT維決策變量,表達(dá)形式如下: X={x1x2…xNp}. (13) (14) 式中:N是發(fā)電機(jī)組的數(shù)量;T是調(diào)度周期的個(gè)數(shù);Pij根據(jù)式(5)在其出力上下限之間隨機(jī)產(chǎn)生. MLMPIO求解多目標(biāo)DEED問題的流程如下所示: 步驟1 初始化種群,包括種群大小Np,位置xi,速度Vi,個(gè)體歷史最優(yōu)xp_i,迭代次數(shù)t. 步驟2 初始化一個(gè)外部存檔集A=?,利用Pareto排序機(jī)制找到初始種群的非支配解集,并存入A. 步驟3 從A中分別為每個(gè)個(gè)體選擇合適的全局最優(yōu)xg_i,并根據(jù)式(10)更新其速度Vi和位置xi. 步驟4 依據(jù)式(11)對(duì)更新后的個(gè)體進(jìn)行小概率變異擾動(dòng). 步驟5 更新xp_i. 步驟6 找到當(dāng)前種群的非支配解集,并將其合并存入外部存檔集A;利用帕累托排序機(jī)制對(duì)外部檔案集A進(jìn)行排序,保留前EA(t)[大小由式(12)求解]個(gè)個(gè)體作為當(dāng)前代的Pareto最優(yōu)解集. 步驟7 令t=t+1,如果t 需要注意的是,筆者對(duì)于DEED中等式和不等式約束的處理采用動(dòng)態(tài)啟發(fā)式約束處理方法;此外,對(duì)于最優(yōu)折中解的計(jì)算采用基于模糊集理論的折中解求解方法,具體可見文獻(xiàn)[18]. 筆者采用10機(jī)組電力系統(tǒng)驗(yàn)證MLMPIO算法的有效性,調(diào)度周期為24 h,以1 h為間隔分為24個(gè)調(diào)度時(shí)段. 機(jī)組參數(shù)、分時(shí)段負(fù)荷以及網(wǎng)損系數(shù)見文獻(xiàn)[3].所有仿真實(shí)驗(yàn)均采用Matlab R2014b 編程實(shí)現(xiàn),測(cè)試環(huán)境為i7-6 700 K處理器(4.00 GHz),16 GB內(nèi)存,Windows 64位Windows 7操作系統(tǒng). MLMPIO算法的參數(shù)設(shè)置如表1所示. 需要說明的是,由于算法在每次迭代更新后均會(huì)剔除Ndec個(gè)劣等個(gè)體,所以MLMPIO的種群大小和最大迭代次數(shù)設(shè)置為298和100,其他參數(shù)均可依據(jù)算法性能進(jìn)行調(diào)整,表1中所列參數(shù)為多次試驗(yàn)后得到的最優(yōu)選擇. 此外,MPIO算法所選參數(shù)與MLMPIO一致. 表1 本文算法參數(shù)Tab.1 Optimal parameters for MLMPIO 圖2 MLMPIO與MPIO所獲得的帕累托前沿Fig.2 The Pareto optimal fronts obtained by MLMPIO and MPIO 圖2是MLMPIO與MPIO所獲得的Pareto前沿對(duì)比圖,從圖2中可以看出,MPIO所求得的帕累托前沿分布密集且局限于較窄的區(qū)域,這表明MPIO算法在求解時(shí)可能陷入局部最優(yōu)區(qū)域. 而MLMPIO所求得的帕累托前沿分布更加廣泛也更加均勻,且各目標(biāo)的極端解也更好,可為決策者提供更優(yōu)的調(diào)度方案. 此外,圖2的結(jié)果對(duì)比也驗(yàn)證了MLMPIO算法中多學(xué)習(xí)策略及小概率變異擾動(dòng)的有效性. 表2列出了MLMPIO與MPIO所獲得的最優(yōu)目標(biāo)值和最優(yōu)折中解. 從表2中可以看出,MLMPIO所求得的經(jīng)濟(jì)目標(biāo)最優(yōu)值和環(huán)境目標(biāo)最優(yōu)值均優(yōu)于MPIO. 在最優(yōu)折中解方面,MPIO的燃料費(fèi)用目標(biāo)值(2.509 541×106$)僅比MLMPIO(2.516 345×106$)低0.27%,而在污染排放方面,MPIO(3.280 98×105lb)卻比MLMPIO(3.003 67×105lb)要多8.45%. 綜上可知,筆者提出的MLMPIO算法相比于基本MPIO來說,表現(xiàn)出更優(yōu)的全局搜索能力和計(jì)算精度,同時(shí)也展現(xiàn)出更好的調(diào)度性能. 表2 MLMPIO與MPIO實(shí)驗(yàn)結(jié)果對(duì)比Tab.2 Comparison of experiment results between MLMPIO and MPIO 表3將MLMPIO的調(diào)度結(jié)果與近年來文獻(xiàn)中采用相同機(jī)組模型的其他5種算法的結(jié)果進(jìn)行對(duì)比.分析表3中的結(jié)果可知,在經(jīng)濟(jì)目標(biāo)和環(huán)境目標(biāo)的最優(yōu)解(極端解)方面,相比于IBFA、RCGA/NSGA-Ⅱ、MAMODE以及CRO 4種算法,MLMPIO的結(jié)果(2.481 502×106$和2.942 17×105lb)都是最優(yōu)的;與HCRO算法相比,其經(jīng)濟(jì)目標(biāo)最優(yōu)值(2.479 931×106$)僅比MLMPIO(2.481 502×106$)低0.06%,但在環(huán)境目標(biāo)方面,HCRO(2.984 56×105lb)卻比MLMPIO(2.942 17×105lb)要高1.42%. 綜合兩個(gè)目標(biāo)的最優(yōu)解情況可知,MLMPIO的性能要優(yōu)于HCRO. 在最優(yōu)折中解方面,MLMPIO要優(yōu)于RCGA/NSGA-Ⅱ和CRO;IBFA的污染排放目標(biāo)值最小,但其燃料費(fèi)用(2.517 117×106$)要高于MLMPIO(2.516 345×106$);MAMODE得到的燃料費(fèi)用目標(biāo)值最小,但其污染排放目標(biāo)值比MLMPIO高2.375×103lb. 綜上,與其他5種算法相比,MLMPIO無論在極端解還是折中解方面均表現(xiàn)出較好的優(yōu)化性能. 表3 不同算法的結(jié)果對(duì)比Tab.3 Results comparison of different methods 表4給出了MLMPIO所求得的最優(yōu)折中解,涵蓋了每個(gè)機(jī)組在全部調(diào)度時(shí)段的出力大小,同時(shí)給出了不同時(shí)段內(nèi)系統(tǒng)的網(wǎng)損和負(fù)荷大小. 通過計(jì)算可得,機(jī)組在各調(diào)度時(shí)段的總出力均等于該時(shí)段系統(tǒng)的網(wǎng)損與負(fù)荷之和,這表明MLMPIO求得的最優(yōu)折中解滿足式(3)所示的功率平衡約束,同時(shí),各機(jī)組調(diào)度出力大小也滿足機(jī)組出力約束和爬坡約束. 這進(jìn)一步驗(yàn)證了筆者所提出MLMPIO算法在求解DEED問題時(shí)的可行性和有效性. 表4 MLMPIO的最優(yōu)折中解Tab.4 Best compromise solution obtained by MLMPIO 筆者以電力系統(tǒng)在一定調(diào)度周期內(nèi)的總?cè)剂腺M(fèi)用和污染排放為目標(biāo),建立了電力系統(tǒng)多目標(biāo)DEED模型,并在模型中計(jì)及了火電機(jī)組的閾點(diǎn)效應(yīng)、機(jī)組爬坡速率約束、網(wǎng)絡(luò)損耗以及負(fù)荷變化.為求解復(fù)雜的多目標(biāo)DEED問題,提出了一種基于多學(xué)習(xí)策略的多目標(biāo)鴿群優(yōu)化算法,該算法通過一種新的多學(xué)習(xí)策略來增強(qiáng)種群的多樣性和全局搜索能力,避免陷入局部最優(yōu);同時(shí),引入小概率變異擾動(dòng)機(jī)制來進(jìn)一步增強(qiáng)種群的多樣性;采用容量自適應(yīng)變化的外部存檔集來存儲(chǔ)當(dāng)前Pareto最優(yōu)解集,提升算法的運(yùn)行效率. 為驗(yàn)證所提算法的有效性,以10機(jī)組電力系統(tǒng)的DEED問題為算例進(jìn)行求解,并與MPIO及其他調(diào)度方案進(jìn)行對(duì)比分析.實(shí)驗(yàn)結(jié)果表明,MLMPIO是一種可行且有效的多目標(biāo)DEED問題求解算法,同其他算法相比,表現(xiàn)出更優(yōu)的全局搜索能力及尋優(yōu)能力,能夠?yàn)闆Q策者提供更多更優(yōu)的選擇.3 MLMPIO在DEED中的應(yīng)用
3.1 種群初始化
3.2 算法流程
4 實(shí)驗(yàn)結(jié)果與分析
4.1 系統(tǒng)描述與參數(shù)設(shè)置
4.2 結(jié)果分析
5 結(jié)論