張 華,陳 淼,孫 博,趙成斌
(國網(wǎng)上海浦東供電公司,上海 200122)
線損是電網(wǎng)經(jīng)濟(jì)運(yùn)行水平的關(guān)鍵指標(biāo),同時(shí)也是反映供電公司管理水平的重要考核指標(biāo)[1]。尤其是對(duì)于一些偏遠(yuǎn)地區(qū),存在著諸如供電設(shè)備老化、電網(wǎng)結(jié)構(gòu)不合理、竊電等問題,會(huì)使得該地區(qū)出現(xiàn)很高的電能損耗[2],而通過配電網(wǎng)線損計(jì)算可為該地區(qū)電網(wǎng)結(jié)構(gòu)及運(yùn)行方式的優(yōu)化提供很好的技術(shù)指導(dǎo)[3]。因此,對(duì)配電網(wǎng)線損計(jì)算進(jìn)行研究對(duì)于降損節(jié)能和電網(wǎng)公司的綜合管理水平及經(jīng)濟(jì)效益的提高具有重要的意義。
配電網(wǎng)線損傳統(tǒng)計(jì)算方法主要有均方根電流法、回路電流法和等值電阻法等[4],這些方法雖然具有理論成熟和準(zhǔn)確度高等優(yōu)勢,但其需要眾多的電氣運(yùn)行信息及參數(shù),且對(duì)數(shù)據(jù)的精確度要求很高[5]。目前我國各地的配電網(wǎng)自動(dòng)化程度差異很大,傳統(tǒng)線損計(jì)算方法的計(jì)算實(shí)施難于有效開展[6]。近年來,人工智能方法被廣泛應(yīng)用于配電網(wǎng)線損計(jì)算,取得了較好的效果,不僅能保證較高的精度,而且還能極大地簡化線損計(jì)算過程[7]。文獻(xiàn)[8]將支持向量機(jī)法應(yīng)用配電網(wǎng)線損計(jì)算,但其對(duì)特征量的要求較高。文獻(xiàn)[9]采用BP神經(jīng)網(wǎng)絡(luò)法進(jìn)行線損計(jì)算,但其收斂速度較慢,且易陷入局部最優(yōu)的問題。以上線損計(jì)算方法均未進(jìn)行特征量處理,且存在著線損計(jì)算結(jié)果精確度不高的問題。
本文提出了一種融合核主成分與隨機(jī)森林的配電網(wǎng)線損計(jì)算方法,通過線損計(jì)算實(shí)例的分析,對(duì)本文方法的實(shí)用性和優(yōu)越性進(jìn)行了驗(yàn)證。
核主成分分析主要指抽取主成分時(shí)使用非線性映射的方法,原始向量由映射函數(shù)映射到高維空間,然后再進(jìn)行線性主成分分析[10]。核主成分分析通過核技巧能夠有效避免傳統(tǒng)主成分分析中非線性變換的未確知性,所提取的主成分貢獻(xiàn)率更加集中,核主成分分析法的優(yōu)越性已在工程實(shí)踐中獲得廣泛的認(rèn)證[11]。在配電網(wǎng)運(yùn)行信息不全的條件下,能夠獲取的特征量較少,而通過核主成分分析后,可進(jìn)一步挖掘特征量之間的相關(guān)性,提供更多且更高質(zhì)量的特征量,從而為特征量與線損非線性映射關(guān)系的建立提供更好的基礎(chǔ)。
隨機(jī)森林算法是一種集成學(xué)習(xí)的強(qiáng)分類預(yù)測器,其對(duì)單棵決策樹的分類能力要求并不高,魯棒性和抗干擾能力很強(qiáng)[12]。隨機(jī)森林算法核心原理是bootstrap重抽樣法,生成的決策樹是互不相關(guān)的,并獨(dú)立地訓(xùn)練樣本和投票,避免了決策樹算法識(shí)別中過擬合問題的影響[13]。隨機(jī)森林算法無需獨(dú)立的測試樣本便可實(shí)現(xiàn)分類誤差的無偏估計(jì),從而有效提高了對(duì)待評(píng)估樣本的預(yù)測正確率,隨機(jī)森林算法在數(shù)據(jù)挖掘和故障診斷方面,其高效性和實(shí)用性的優(yōu)勢獲得了廣泛的認(rèn)證[14]。
隨機(jī)森林算法的各決策樹的獨(dú)立性能有效減少特征量與線損之間出現(xiàn)過擬合的問題,隨機(jī)森林算法更不易陷入局部最優(yōu),能有效提高線損計(jì)算的速度[15]。隨機(jī)森林算法的高干擾性能有效應(yīng)對(duì)配電網(wǎng)運(yùn)行信息采集時(shí)存在干擾的問題,降低對(duì)特征量的要求,且隨機(jī)森林算法具有更強(qiáng)的非線性映射能力,能使線損計(jì)算取得更高的精度。
隨機(jī)森林算法構(gòu)建如圖1所示。過程如下:①導(dǎo)入所有原始樣本數(shù)據(jù),生成訓(xùn)練集X;②對(duì)訓(xùn)練集采用bootstrap重抽樣法進(jìn)行抽樣,獲得K個(gè)訓(xùn)練集,并使每個(gè)子集合與訓(xùn)練集X的抽樣數(shù)一致;③對(duì)K個(gè)訓(xùn)練集做分類回歸樹建模處理,尋找各訓(xùn)練集袋外數(shù)據(jù)的最優(yōu)分類精度,獲得相應(yīng)數(shù)量的決策結(jié)果;④對(duì)K個(gè)決策結(jié)果再進(jìn)行投票表決處理,獲得最終結(jié)果。
圖1 隨機(jī)森林構(gòu)建示意Fig.1 Random forest construction schematic diagram
自變量X訓(xùn)練后獲得的決策樹群為{J1(X),J2(X),…,Jh(X)},則最終輸出結(jié)果J(X)為:
(1)
式中,h為訓(xùn)練輪數(shù);N(·)為示性函數(shù);Y為輸出變量。
當(dāng)隨機(jī)森林算法中的決策樹的數(shù)量達(dá)到一定程度時(shí),其泛化誤差將趨于一上界值PE*:
(2)
袋外數(shù)據(jù)為抽取訓(xùn)練集時(shí)未被抽中的原始訓(xùn)練集樣本,它能夠?qū)﹄S機(jī)森林算法的性能進(jìn)行評(píng)估[16]。決策樹Ji的OOB準(zhǔn)確率OOBCorr(i)為
(3)
式中,OOB(i)為決策樹Ji對(duì)應(yīng)的袋外數(shù)據(jù)樣本;OOBSize(i)為袋外數(shù)據(jù)樣本的規(guī)模;OOBCorrectiNum(i)為診斷后診斷正確的分類結(jié)果的數(shù)量。
配電網(wǎng)線損的傳統(tǒng)計(jì)算方法主要有等值電阻法等,該方法雖然準(zhǔn)確性高,應(yīng)用廣泛,但等值電阻法需要眾多的電氣參數(shù),且計(jì)算過程復(fù)雜[17]。由于配電網(wǎng)線損的特征量較少,尤其在配電網(wǎng)運(yùn)行信息不全的條件下,配電網(wǎng)線損的特征量會(huì)更少,較少的特征量會(huì)使得算法訓(xùn)練后得到的分類器差異不大,造成線損計(jì)算結(jié)果精度較差。因此,本文引入核主成分分析,將線損特征量從低維的狀態(tài)空間映射到高維的核空間,更好地挖掘特征量互相之間存在的聯(lián)系。在核空間用隨機(jī)森林方法訓(xùn)練得到差異性符合要求的分類器群,從而提高線損計(jì)算的精度,而經(jīng)核主成分法處理后的特征量相關(guān)性更弱,可減少隨機(jī)森林算法訓(xùn)練時(shí)的復(fù)雜度,從而提高訓(xùn)練的速度。隨機(jī)森林算法在構(gòu)建分類體系時(shí),每棵決策樹均是隨機(jī)生成的,且投票也是獨(dú)立的,因此能夠完全避免過擬合的問題,有效避免算法陷入局部最優(yōu)的問題。隨機(jī)森林算法對(duì)樣本數(shù)據(jù)適應(yīng)力強(qiáng)、抗干擾性能強(qiáng),在進(jìn)行全局搜索時(shí)準(zhǔn)確性更為優(yōu)異,能以更快的速度獲得全局最優(yōu)解[18]。
本文以等值電阻法的線損計(jì)算結(jié)果以及影響配電網(wǎng)線損的電氣特征量作為隨機(jī)森林訓(xùn)練和測試的樣本數(shù)據(jù),選取的線損相關(guān)特征量有:線路總長度、主干線路長度、分支線路長度、導(dǎo)線單位長度電阻、月有功供電量、月無功供電量、配電變壓器容量、配電網(wǎng)三相不平衡度和配電網(wǎng)負(fù)載系數(shù)[19]。本文以這9個(gè)配電網(wǎng)線損相關(guān)電氣特征量來估計(jì)配電網(wǎng)的線損,首先采用核主成分進(jìn)行分析,然后再用隨機(jī)森林算法實(shí)現(xiàn)特征參量與配電網(wǎng)線損之間的非線性映射。本文配電網(wǎng)線損主要計(jì)算流程如圖2所示。
主要過程為:①對(duì)配電網(wǎng)的供電信息進(jìn)行分析,提取需要的相應(yīng)電氣特征量,并對(duì)獲得的特征量樣本進(jìn)行歸一化處理,然后對(duì)歸一后的樣本矩陣Xi進(jìn)行核主成分,獲得變換矩陣Ti及其變換后的矩陣Yi。②對(duì)Yi做重采樣處理,為對(duì)隨機(jī)森林進(jìn)行訓(xùn)練,對(duì)特征量進(jìn)行隨機(jī)抽取后得到樣本矩陣Zi,選取核主元后得到測試樣本矩陣Di。③選取合適的隨機(jī)森林模型參數(shù),模型的輸出為配電網(wǎng)線損,采用訓(xùn)練樣本矩陣Zi對(duì)隨機(jī)森林進(jìn)行訓(xùn)練,并對(duì)隨機(jī)森林的參數(shù)做改進(jìn)處理。④采用測試樣本矩陣Di測試本文的配電網(wǎng)線損計(jì)算模型的準(zhǔn)確性和穩(wěn)定性。
圖2 配電網(wǎng)線損計(jì)算模型Fig.2 Distribution network line loss calculation model
以某城市的10 kV配電網(wǎng)為例進(jìn)行線損計(jì)算分析,挑選具有代表性的20條線路的歷史數(shù)據(jù)作為建立本文融合核主成分和隨機(jī)森林算法的配電網(wǎng)線損計(jì)算模型的樣本,其中一條線路的拓?fù)浣Y(jié)構(gòu)如圖3所示。
圖3 10 kV線路網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 10 kV line network structure diagram
本文核主成分的核函數(shù)選擇為高斯核函數(shù),隨機(jī)森林算法的最佳分裂的變量數(shù)mtry和最小節(jié)點(diǎn)尺寸取值均為3,OOB誤差估計(jì)已被證明可無偏估計(jì)隨機(jī)森林算法的性能,本文隨機(jī)森林OOB錯(cuò)誤率與隨機(jī)森林中樹的數(shù)量變化情況如圖4所示。
圖4 隨機(jī)森林的OOB錯(cuò)誤率變化Fig.4 Variation of OOB error rate in random forest
由圖4可知,隨著決策樹數(shù)量的增加,隨機(jī)森林的OOB錯(cuò)誤率呈現(xiàn)逐漸下降的趨勢,當(dāng)決策樹的數(shù)量大于33時(shí),OOB錯(cuò)誤率已穩(wěn)定為0。為保證算法具有一定的裕度,本文取隨機(jī)森林決策樹的數(shù)目為40。
為體現(xiàn)本文所提融合核主成分和隨機(jī)森林方法的實(shí)用性,采用本文方法進(jìn)行多次線損計(jì)算,結(jié)果如圖5所示,具體情況見表1。
圖5 線損計(jì)算結(jié)果對(duì)比Fig.5 Comparison diagram of line loss calculation results
表1 計(jì)算結(jié)果誤差情況Tab.1 Error of calculation results
其中等值電阻法的線損計(jì)算結(jié)果作為參考,計(jì)算結(jié)果的比較采用均方根誤差(RMSE)和平均絕對(duì)誤差百分比(MAPE),RMSE和MAPE值越小[20],表明結(jié)果與預(yù)參考值越接近,RMSE和MAPE的計(jì)算公式為:
(4)
(5)
根據(jù)圖5可知,本文融合核主成分與隨機(jī)森林的配電網(wǎng)線損計(jì)算方法的計(jì)算結(jié)果與線損參考值非常接近。表1的計(jì)算誤差也表明,采用核主成分進(jìn)行特征量優(yōu)化處理能提升配電網(wǎng)的線損計(jì)算效果,本文線損計(jì)算結(jié)果的MAPE和RMSE分別為2.53和1.65,線損計(jì)算結(jié)果誤差很小,本文方法能在配電網(wǎng)線損計(jì)算中獲得很好的精度。
本文提出了融合核主成分和隨機(jī)森林的配電網(wǎng)線損計(jì)算方法,利用核主成分對(duì)線損特征量處理后再由隨機(jī)森林進(jìn)行線損的非線性映射計(jì)算,通過配電網(wǎng)線損計(jì)算實(shí)例的分析,結(jié)果表明隨機(jī)森林算法具有更加強(qiáng)大的非線性擬合能力,而本文采用核主成分進(jìn)行特征量優(yōu)化處理后能進(jìn)一步提升配電網(wǎng)的線損計(jì)算效果,計(jì)算后的誤差MAPE和RMSE非常小,準(zhǔn)確度很高。本文融合計(jì)算方法能獲得優(yōu)良的計(jì)算效果,可為配電網(wǎng)的線損管理及節(jié)能降損提供有效的理論參考和技術(shù)指導(dǎo),從而更好地提高配電網(wǎng)的經(jīng)濟(jì)性和管理水平。