王健,易姝慧,劉俊杰,劉儉
(中國(guó)電力科學(xué)研究院有限公司,湖北 武漢 430070)
隨著智能電網(wǎng)不斷發(fā)展,在大數(shù)據(jù)和節(jié)約型社會(huì)概念的引導(dǎo)下,電力行業(yè)各種負(fù)荷用電數(shù)據(jù)收集和電能優(yōu)化管理變得越來(lái)越重要,非介入式負(fù)荷辨識(shí)方法研究十分必要[1]。傳統(tǒng)負(fù)荷監(jiān)測(cè)一般安裝在設(shè)備側(cè),不需要進(jìn)行負(fù)荷辨識(shí)就可以收集設(shè)備運(yùn)行情況,但是成本高、安裝不方便[2]。同時(shí)工業(yè)負(fù)荷又要求持續(xù)生產(chǎn)和高的安全系數(shù)[3]。所以非介入式工業(yè)負(fù)荷辨識(shí)成本低,安裝方便,易推廣的優(yōu)勢(shì)就發(fā)揮了重要作用,既可以為電網(wǎng)精細(xì)化管理提供重要依據(jù),同時(shí)也會(huì)為用戶合理用電提供參考[4-5]。非介入式工業(yè)負(fù)荷辨識(shí)可以提高工廠及相關(guān)產(chǎn)業(yè)系統(tǒng)的整體可靠性和收益率[6]。
目前非介入式負(fù)荷監(jiān)測(cè)的重點(diǎn)難點(diǎn)集中于負(fù)荷辨識(shí),其中家庭負(fù)荷辨識(shí)相關(guān)研究較多[7-8]。非侵入式負(fù)荷辨識(shí)方法集中在聚類算法[9-10]、V-I軌跡[11]、人工智能算法[12-13]等。在電氣特征選擇方面,又分成暫態(tài)[14-16]和穩(wěn)態(tài)[17]2方面進(jìn)行研究。但是目前算法大部分電氣特征提取過(guò)程復(fù)雜,識(shí)別速度慢,適用范圍有一定的局限。而工業(yè)負(fù)荷辨識(shí)研究相對(duì)較少,工業(yè)負(fù)荷因?yàn)樯a(chǎn)需求不方便采集暫態(tài)特征進(jìn)行建模,所以怎樣在不影響工業(yè)負(fù)荷運(yùn)行前提下提取數(shù)據(jù)建模辨識(shí)變得十分關(guān)鍵[18-19]。文獻(xiàn)[20]建立了一個(gè)應(yīng)用深度置信網(wǎng)絡(luò)方法,利用多個(gè)受限玻爾茲曼機(jī)和一層后向傳播神經(jīng)網(wǎng)絡(luò)組成進(jìn)行負(fù)荷辨識(shí);文獻(xiàn)[21]提出在低壓總用電計(jì)量端監(jiān)測(cè),研究一種在事件邊緣側(cè)進(jìn)行波形解析辨識(shí)方法。但是這兩種算法需要大量的樣本數(shù)據(jù),而工業(yè)生產(chǎn)中重復(fù)采樣獲取樣本數(shù)據(jù)困難。
工業(yè)負(fù)荷因行業(yè)不同具有不同特性,應(yīng)對(duì)工業(yè)負(fù)荷研究提出一種通用的負(fù)荷辨識(shí)方法。因此,本文以隨機(jī)森林算法為核心,以穩(wěn)態(tài)電流波形作為負(fù)荷特征,不需要大量的樣本數(shù)據(jù),同時(shí)可以高效精確識(shí)別各種工業(yè)負(fù)荷。本文以恒河DL850型號(hào)采集設(shè)備得到需求側(cè)電力信息數(shù)據(jù),根據(jù)工業(yè)負(fù)荷運(yùn)行和投切特性,研究了穩(wěn)態(tài)波形提取方法,并結(jié)合不同負(fù)荷的特性及實(shí)際操作數(shù)據(jù),對(duì)工業(yè)負(fù)荷進(jìn)行辨識(shí)。本實(shí)驗(yàn)以實(shí)際工廠的運(yùn)行負(fù)荷數(shù)據(jù)為依據(jù),進(jìn)行訓(xùn)練和測(cè)試并通過(guò)仿真驗(yàn)證本文辨識(shí)算法的有效性和快速性。
非介入式工業(yè)負(fù)荷辨識(shí)可以通過(guò)低壓側(cè)智能電表獲取工業(yè)生產(chǎn)中設(shè)備儀器的電氣特征信息,進(jìn)一步通過(guò)算法訓(xùn)練測(cè)試辨別設(shè)備種類,獲得工業(yè)生產(chǎn)中的運(yùn)行數(shù)據(jù)情況。目前非介入式工業(yè)負(fù)荷辨識(shí)基本包括數(shù)據(jù)采集、數(shù)據(jù)處理、狀態(tài)變化、特征選擇和負(fù)荷辨識(shí)5個(gè)環(huán)節(jié)[17],如圖1所示。
圖1 非介入式工業(yè)負(fù)荷辨識(shí)Fig. 1 Non-intrusive industrial load identification
數(shù)據(jù)采集和處理:對(duì)于工業(yè)負(fù)荷特征采集,由于工業(yè)負(fù)荷電壓過(guò)高,電氣數(shù)據(jù)信息主要是智能電表或者專業(yè)采集設(shè)備通過(guò)低壓側(cè)獲取,采集的數(shù)據(jù)包括有功、無(wú)功、電壓和電流等。
數(shù)據(jù)預(yù)處理:采集后的數(shù)據(jù)都需要預(yù)處理,滿足算法程序參數(shù)輸入的要求。數(shù)據(jù)采集過(guò)程中可能會(huì)有缺值或者異常點(diǎn),本文通過(guò)選擇中值濾波的方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。
狀態(tài)變化:在進(jìn)行負(fù)荷類型判斷之前,需要預(yù)先判斷是否有負(fù)荷啟停的狀態(tài)變化或者同一負(fù)荷多狀態(tài)變化。負(fù)荷的狀態(tài)變化期間,負(fù)荷的功率變化較為明顯。一般通過(guò)觀察規(guī)定時(shí)間內(nèi)變化的功率值和閾值比較,進(jìn)一步來(lái)判斷是否有負(fù)荷投切事件發(fā)生。
特征選擇:本文在狀態(tài)變化時(shí)以負(fù)荷功率作為負(fù)荷特征提取進(jìn)行比對(duì),在負(fù)荷識(shí)別過(guò)程中以穩(wěn)態(tài)電流數(shù)據(jù)作為負(fù)荷特征進(jìn)行運(yùn)算。
負(fù)荷辨識(shí):判斷負(fù)荷發(fā)生狀態(tài)變化以后,本文采集穩(wěn)態(tài)電流波形數(shù)據(jù),運(yùn)用隨機(jī)森林算法進(jìn)行負(fù)荷辨識(shí),判斷負(fù)荷類型和負(fù)荷狀態(tài)。
本文工業(yè)負(fù)荷特征提取是根據(jù)事件監(jiān)測(cè)工業(yè)負(fù)荷功率狀態(tài)變化,然后再提取電流穩(wěn)態(tài)波形。
工業(yè)負(fù)荷在正常運(yùn)行時(shí),一般不能重復(fù)啟停操作,采集負(fù)荷穩(wěn)定工作時(shí)候的數(shù)據(jù)較為方便,負(fù)荷的電壓電流波形一般都是正弦波,因此負(fù)荷狀態(tài)發(fā)生變化主要反映在功率和電流的變化上,通常對(duì)有功數(shù)據(jù)采用變點(diǎn)檢測(cè)算法捕捉用電負(fù)荷狀態(tài)發(fā)生變化的時(shí)刻,再提取相關(guān)的事件特征。
假設(shè)在時(shí)段ts(ts是采樣周期T的整數(shù)倍)里用電負(fù)荷狀態(tài)由某一個(gè)穩(wěn)定狀態(tài)過(guò)渡到另一個(gè)穩(wěn)定狀態(tài),因?yàn)樨?fù)荷狀態(tài)變化伴隨著功率的變化,所以可以通過(guò)有功功率具有的階躍特征辨識(shí)負(fù)荷狀態(tài)的變化,設(shè)置狀態(tài)變化的突變量Ps和閾值H,P(t)表示時(shí)刻t的功率值,即
當(dāng)Ps超過(guò)閾值H時(shí),可認(rèn)為時(shí)刻t有負(fù)荷事件產(chǎn)生。由于采集工業(yè)負(fù)荷功率變化,可以采用低頻采樣設(shè)備收集。首先通過(guò)專業(yè)采集設(shè)備讀取有功功率數(shù)據(jù)到數(shù)據(jù)庫(kù)中,然后實(shí)時(shí)監(jiān)測(cè)有功功率變化情況,最后當(dāng)有功功率變化滿足式(2)時(shí),則負(fù)荷狀態(tài)發(fā)生變化。同時(shí)可以采用穩(wěn)態(tài)電氣量差分方法提取電氣特征。如圖2所示,負(fù)荷狀態(tài)發(fā)生變化后電流和有功功率的變化情況。
圖2 負(fù)荷階躍變化Fig. 2 Load step change
當(dāng)負(fù)荷1發(fā)生狀態(tài)變化后,本文假設(shè)事件A發(fā)生。事件A發(fā)生后,等負(fù)荷1的波形穩(wěn)定后,本文提取負(fù)荷1的穩(wěn)態(tài)波形。穩(wěn)態(tài)波形表現(xiàn)了負(fù)荷1正常運(yùn)行的一種常態(tài),提取穩(wěn)態(tài)波形具有標(biāo)志性特征,方便進(jìn)一步分析處理識(shí)別。當(dāng)然,識(shí)別負(fù)荷何時(shí)發(fā)生狀態(tài)變化十分重要。目前本文通過(guò)采集多個(gè)周期的有功功率,根據(jù)有功功率是否有明顯變化來(lái)判斷是否有事件發(fā)生,當(dāng)事件發(fā)生后有功功率無(wú)明顯變化后則認(rèn)為處于穩(wěn)態(tài)。穩(wěn)態(tài)電氣量差分方法是采用差量特征提取方法,獲取任意時(shí)刻特征值的變化量。
由于穩(wěn)態(tài)電流的基波相角和測(cè)量的電壓有直接關(guān)系,電壓的起始相位角決定了電流的基波相角。本文在電壓起始相位角相同情況下開(kāi)始測(cè)穩(wěn)態(tài)電流,這樣滿足電流疊加性。因此,當(dāng)判斷電流處于穩(wěn)態(tài)后,檢測(cè)相應(yīng)電壓的過(guò)零點(diǎn)即可進(jìn)行波形提取。事件發(fā)生前的穩(wěn)態(tài)電流Im-1對(duì)應(yīng)的電壓為Um-1,當(dāng)Um-1的采樣點(diǎn)j所對(duì)應(yīng)的值Um-1,j滿足式(3)時(shí),則認(rèn)為該點(diǎn)為事件發(fā)生前的穩(wěn)態(tài)電壓波形Um-1的電壓過(guò)零點(diǎn)。
式中:j為呈上升趨勢(shì)的電壓過(guò)零點(diǎn)對(duì)應(yīng)的采樣點(diǎn)序號(hào)。從過(guò)零點(diǎn)所對(duì)應(yīng)的時(shí)刻開(kāi)始,截取一個(gè)周期即可提取事件A發(fā)生前的穩(wěn)態(tài)電流Im-1。
同以上方法,本文提取檢測(cè)事件A發(fā)生后的電壓波形,當(dāng)Us的電壓過(guò)零點(diǎn)后,提取相應(yīng)的穩(wěn)態(tài)電流Is。依據(jù)電流疊加原理,事件A的電流波形Iv和電壓波形Uv為
詳細(xì)的穩(wěn)態(tài)電流波形特征的描述可以為負(fù)荷識(shí)別提供重要的依據(jù)。因此,本文負(fù)荷穩(wěn)態(tài)電流的特征提取包括穩(wěn)態(tài)電流的峰值、峰谷、均方根和標(biāo)準(zhǔn)差。同時(shí)結(jié)合穩(wěn)態(tài)電流波形作為工業(yè)負(fù)荷印記,對(duì)各種負(fù)荷進(jìn)行識(shí)別。圖3給出工業(yè)負(fù)荷穩(wěn)態(tài)波形特征。
圖3 負(fù)荷電流特征Fig. 3 Current characteristics of load
隨機(jī)森林[22]特點(diǎn)是抗噪性強(qiáng)、具有隨機(jī)性,是一個(gè)集成學(xué)習(xí)模型,具有不錯(cuò)的預(yù)測(cè)能力。隨機(jī)森林是一種組合分類器,它以決策樹(shù)當(dāng)作是基本分類器,這在一定程度上減少單分類器的限制,可以達(dá)到更高的預(yù)測(cè)準(zhǔn)確率。同時(shí),隨機(jī)森林自身的隨機(jī)性,可以在較大限度上包容異常點(diǎn)和噪聲的影響,從而在一定限度上減少了決策樹(shù)算法存在的過(guò)擬合現(xiàn)象,提升了泛化能力。本文基于隨機(jī)森林實(shí)現(xiàn)工業(yè)負(fù)荷辨識(shí)過(guò)程的具體流程如圖4所示。
圖4 基于隨機(jī)森林工業(yè)負(fù)荷辨識(shí)流程Fig. 4 Flow chart of industrial load identification based on random forest
采集后的穩(wěn)態(tài)電流波形數(shù)據(jù)經(jīng)過(guò)線性回歸算法進(jìn)行數(shù)據(jù)預(yù)處理,去除異常值和無(wú)關(guān)數(shù)據(jù)。然后將電流波形按k個(gè)一組形成樣本數(shù)據(jù)集。
Bootstrap sampling method(自助抽樣方法)是一種有放回的抽樣方法。首先需要收集一定數(shù)量的樣本數(shù)據(jù),然后每次抽樣后的樣本都需要再放回樣本數(shù)據(jù)集中,下次抽樣還可以再被抽中。最后對(duì)樣本數(shù)據(jù)進(jìn)行n次抽樣后,得到N個(gè)訓(xùn)練集,每個(gè)訓(xùn)練集都可以形成一個(gè)決策樹(shù),如圖5所示。
圖5 Bootstrap重采樣方法Fig. 5 Resampling method based on bootstrap
隨機(jī)森林是一種將決策樹(shù)作為基分類器的組合分類器,如圖6所示。決策樹(shù)由根節(jié)點(diǎn)不斷分裂生成葉子節(jié)點(diǎn)的過(guò)程,葉子節(jié)點(diǎn)代表了分類結(jié)果,不用繼續(xù)分裂[23]。每組訓(xùn)練集根據(jù)CART算法生成決策樹(shù),在生產(chǎn)決策樹(shù)的過(guò)程中,從數(shù)據(jù)樣本集中總共的M個(gè)屬性中隨機(jī)抽取m(m≤M)個(gè)特征變量,采用CART算法計(jì)算從m個(gè)特征中得到一個(gè)最優(yōu)屬性,進(jìn)行下一步分裂屬性,對(duì)應(yīng)構(gòu)建N棵決策樹(shù)[24]。
圖6 決策樹(shù)Fig. 6 Decision tree
本文采用CART算法,基于基尼(Gini)系數(shù)最小原則選擇屬性進(jìn)行節(jié)點(diǎn)二叉樹(shù)分裂。分布的指數(shù)公式[25]為
式中:K為節(jié)點(diǎn)中特征樣本的總種類數(shù);Pk為節(jié)點(diǎn)中第k類特征樣本的概率。
樣本集合D中Gini指數(shù)計(jì)算公式為
式中:Dk為樣本集合D中屬于第k類的樣本子集。
基尼指數(shù)涉及不同屬性的二元?jiǎng)澐謫?wèn)題,假若某個(gè)屬性A是離散值時(shí)候,需要將A分為D1和D2兩部分,每個(gè)節(jié)點(diǎn)劃分的Gini指數(shù)計(jì)算公式為
D1和D2為樣本集合D分割成的兩個(gè)子集。因此A的不純度降低量為
可以看出每個(gè)二元?jiǎng)澐謺r(shí)候,當(dāng)基尼指數(shù)最小時(shí)候,這個(gè)屬性才會(huì)被選擇。因此要降低其不純度, ?G(D,A)越大,G(D,A)越小,這樣屬性A的分裂效果才會(huì)最好。
將需要測(cè)試的數(shù)據(jù)集,輸入給已經(jīng)訓(xùn)練好的N個(gè)決策樹(shù)模型中,決策樹(shù)模型根據(jù)樣本數(shù)據(jù)集中訓(xùn)練得到的參數(shù),計(jì)算出每個(gè)類型。將N個(gè)決策樹(shù)得出的結(jié)果采用投票法得出最終結(jié)果,決策樹(shù)中結(jié)果比例最高的就是工業(yè)負(fù)荷辨識(shí)的結(jié)果。
本實(shí)驗(yàn)采用恒河DL850型號(hào)采集設(shè)備在總線側(cè)低壓端實(shí)地采集工業(yè)負(fù)荷運(yùn)行數(shù)據(jù),用于負(fù)荷的分析以及辨識(shí)研究。在Inter Core i5-3470、4 GB 內(nèi)存、CPU 主頻為 3.2 GHz、64位操作系統(tǒng)的計(jì)算機(jī)上運(yùn)行算法,采用的運(yùn)行環(huán)境是Matlab2019a。通過(guò)設(shè)置不同的決策樹(shù)進(jìn)行對(duì)比,記錄程序運(yùn)行時(shí)間,每種決策樹(shù)測(cè)試20次取平均結(jié)果。
等設(shè)備啟動(dòng)穩(wěn)定后,通過(guò)穩(wěn)態(tài)波形提取的方法開(kāi)始采集電壓和電流數(shù)據(jù),采樣頻率設(shè)置為10 kHz,采集時(shí)間設(shè)置為20 min。國(guó)內(nèi)負(fù)荷基波頻率為50 Hz(周期長(zhǎng)為0.02 s),一個(gè)周期內(nèi)采樣 200點(diǎn),20 min采樣 60000周期。采樣負(fù)荷類型包括:電機(jī)A、電機(jī)B、暖風(fēng)機(jī)、電燈,基本包括了包括恒阻抗、恒電壓、恒功率以及感應(yīng)電動(dòng)機(jī)負(fù)荷。具體采集負(fù)荷組合類型和標(biāo)號(hào)如表1所示,采集到的波形如圖7所示。
表1 負(fù)荷類型Table 1 Load types
圖7 不同型號(hào)設(shè)備的穩(wěn)態(tài)電流波形Fig. 7 Steady state current waveform of different types of equipment
為了提高樣本數(shù)據(jù)的質(zhì)量,將采集到的數(shù)據(jù)使用X-View軟件導(dǎo)成Matlab數(shù)據(jù),經(jīng)過(guò)預(yù)處理得到樣本數(shù)據(jù)。主要步驟為:(1)由X-View軟件對(duì)采樣數(shù)據(jù)進(jìn)行分解,得到包含電流、電壓、功率等信息的數(shù)據(jù),作為原始數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理;(2)在Matlab軟件進(jìn)行處理,截取10000個(gè)穩(wěn)態(tài)周期數(shù)據(jù),把它變換成1000行的數(shù)據(jù),每行10周期;(3)對(duì)預(yù)處理后的單相電流波形進(jìn)行負(fù)荷識(shí)別判斷。提取每種負(fù)荷的樣本數(shù)據(jù)一行為10 周期,共計(jì) 2 000 點(diǎn),大小為 1000×2 000 的矩陣;(4)選擇其中300組數(shù)據(jù)當(dāng)成測(cè)試數(shù)據(jù),其余的700組信號(hào)作為訓(xùn)練數(shù)據(jù);(5)組合得到訓(xùn)練數(shù)據(jù)為5600組,測(cè)試數(shù)據(jù)為2400組,使用隨機(jī)森林算法對(duì)樣本數(shù)據(jù)進(jìn)行訓(xùn)練以及測(cè)試。(6)每組測(cè)試的識(shí)別率為每種類型負(fù)荷正確識(shí)別的數(shù)量與每組負(fù)荷測(cè)試的總數(shù)量的比值。
利用隨機(jī)森林模型算法通過(guò)增加決策樹(shù)數(shù)量的方式,得到實(shí)驗(yàn)結(jié)果如表2和圖8所示,當(dāng)決策樹(shù)數(shù)目為15棵以上時(shí)候負(fù)荷辨識(shí)準(zhǔn)確率已經(jīng)達(dá)到100%,平均運(yùn)行時(shí)間也只有3.36 s。
表2 運(yùn)行結(jié)果Table 2 Load types
圖8 不同決策樹(shù)運(yùn)行時(shí)間Fig. 8 Running time of different decision trees
以決策樹(shù)數(shù)量為15的隨機(jī)森林算法和傳統(tǒng)貝葉斯算法比較,采用相同的樣本集,每種算法運(yùn)行20次取平均值,運(yùn)行結(jié)果如表3所示。以隨機(jī)森林模型計(jì)算的識(shí)別率和運(yùn)行時(shí)間都已經(jīng)超過(guò)貝葉斯算法,適合工業(yè)負(fù)荷辨識(shí)的需求。
表3 不同模型辨識(shí)結(jié)果對(duì)比Table 3 Comparison of identification results of different models
從表2和表3可以看出,基于隨機(jī)森林的工業(yè)負(fù)荷辨識(shí)有很好的效果,采樣的8種電力負(fù)荷的平均識(shí)別率達(dá)到100%,對(duì)比其他算法,基于隨機(jī)森林的工業(yè)負(fù)荷識(shí)別率具有一定優(yōu)越性。
本文提出的基于隨機(jī)森林和穩(wěn)態(tài)波形的工業(yè)負(fù)荷辨識(shí)算法,整體提高了工業(yè)負(fù)荷的識(shí)別的準(zhǔn)確率和效率。本文算法主要以電流波形作為識(shí)別條件,以非介入方式進(jìn)行工業(yè)負(fù)荷用電信息的分類辨識(shí),電氣特征信息明顯,提取過(guò)程簡(jiǎn)單。采用隨機(jī)森林算法,具有很好的隨機(jī)性和分類效果,同時(shí)分類效率高。仿真實(shí)驗(yàn)結(jié)果表明:基于隨機(jī)森林模型對(duì)工業(yè)負(fù)荷的識(shí)別可以克服工業(yè)負(fù)荷信息采集的困難,并且識(shí)別率達(dá)到100%,準(zhǔn)確率和運(yùn)行時(shí)間方面都優(yōu)于其他的分類算法。基于隨機(jī)森林和穩(wěn)態(tài)波形的非介入式工業(yè)負(fù)荷辨識(shí)可為進(jìn)一步分析電能消耗情況、提高負(fù)荷管理能力等提供支撐,還可為工業(yè)以及居民用戶提供負(fù)荷運(yùn)行狀況報(bào)告、節(jié)能建議等多項(xiàng)合理措施。