謝曉華
(廣東電網(wǎng)有限責(zé)任公司湛江供電局)
近年來,在電力用戶分類方面已經(jīng)有一部分學(xué)者展開了相關(guān)的研究,馮曉蒲[1]等基于傳統(tǒng)行業(yè)劃分,對用戶進(jìn)行聚類分析研究,但其不足之處在于忽略了用戶間不同的用電方式;王璨[2]等主要從用戶價值體現(xiàn)方面進(jìn)行分類,不足之處在于劃分方式過于宏觀;李培強[3]等從變電站負(fù)荷出發(fā),采用均值聚類方法進(jìn)行用戶用電的分類,該方法效果較好;阮文駿[4]等也針對電價進(jìn)行研究,但并未把用戶分類差別考慮 在內(nèi)。
本文首先分析和整合了用戶用電量的相關(guān)數(shù)據(jù),然后基于云計算的聚類算法進(jìn)行用戶個性化分類研究;并在此基礎(chǔ)上設(shè)計模型進(jìn)行非介入式用電負(fù)荷分解與識別研究,以期挖掘出用戶類型,幫助電網(wǎng)公司制定相應(yīng)的需求相應(yīng),達(dá)到節(jié)能減排的目的。
以現(xiàn)在的小區(qū)為例,用戶的用電信息歷史數(shù)據(jù)主要包含以下類型:家庭地址、單元門號等家庭基本數(shù)據(jù)信息;電表序號、居民用電量以及電量抄記日期等用戶用電信息采集數(shù)據(jù);天氣、溫度等相關(guān)環(huán)境數(shù)據(jù);家電類別、用電量與用電時長等家居數(shù)據(jù)。假設(shè)有100萬戶家庭,僅僅一天產(chǎn)生的數(shù)據(jù)量就高達(dá)將近60GB的數(shù)據(jù)。本文希望能采用數(shù)據(jù)挖掘技術(shù),從這些存儲的海量數(shù)據(jù)中把其中更高價值的知識挖掘 出來。
在整合用戶電量信息數(shù)據(jù)時,本文以用電量為指標(biāo),建立了用電基本數(shù)據(jù)表、用電設(shè)備表以及用戶信息表,分別從用電時長、用電家居信息以及用戶數(shù)據(jù)方面存儲并整合采集到的用戶電量信息數(shù)據(jù),為數(shù)據(jù)挖掘的開展提供數(shù)據(jù)基礎(chǔ)[6]。用電基本數(shù)據(jù)表包括電表序號、設(shè)備ID、用電時長以及總用電量,據(jù)此可以建立數(shù)據(jù)倉庫模型;用電設(shè)備表內(nèi)容主要由設(shè)備ID、設(shè)備類型以及生產(chǎn)廠家等,便于對用戶需求的進(jìn)一步分析;用戶信息表主要用來存儲用戶基本信息,其中的用戶ID號與用電基本數(shù)據(jù)表中的電表序號相對應(yīng)。
本文在對用戶用電信息數(shù)據(jù)進(jìn)行個性化分類時,采用的是云計算與聚類算法并行的技術(shù)。在聚類算法中,本文選自了非常經(jīng)典的K-means劃分方法,在大規(guī)模數(shù)據(jù)聚類中,該算法具有高效的特點[5]。本文在對用戶用電行為進(jìn)行分析時,主要采用下圖所示的框架圖,包含以下三個模塊的內(nèi)容:數(shù)據(jù)采集、數(shù)據(jù)處理以及行為分析。數(shù)據(jù)采集主要是采集不同地點用戶不同設(shè)備的用電信息數(shù)據(jù);數(shù)據(jù)采集結(jié)束之后集中傳輸?shù)皆茢?shù)據(jù)處理,進(jìn)行數(shù)據(jù)的存儲和管理,奠定最后分析用戶用電行為的數(shù)據(jù)基礎(chǔ)。
傳統(tǒng)的K-means算法步驟為:選取數(shù)據(jù)集中的數(shù)據(jù)賦給初始的聚類中心;計算樣本點與聚類中心之間的歐式距離,進(jìn)行獲取該樣本點的所屬類別;重新計算聚類中心;重復(fù)上述兩個步驟,直至準(zhǔn)則函數(shù)收斂。而基于云計算的K-means算法更有助于大規(guī)模數(shù)據(jù)的開發(fā)和并行處理,不僅更可靠,而且還具備高效和擴容能力強的特點。其中的云計算平臺是由分布式文件系統(tǒng)以及計算模型組成,通過前者可以把海量的信息數(shù)據(jù)存儲在數(shù)據(jù)庫中,后者可以提供類SQL接口對數(shù)據(jù)進(jìn)行高效分析。重新標(biāo)記階段是新中心店坐標(biāo)的獲得階段,并在云計算平臺的文件系統(tǒng)中更新階段,并繼續(xù)迭代至算法收斂。
圖 用戶用電分析結(jié)構(gòu)示意圖
本文設(shè)計的非介入式電力負(fù)荷分解模型主要用來完成兩項任務(wù):用電設(shè)備工作狀態(tài)的檢測和辨識;按照設(shè)備或設(shè)備類分解負(fù)荷總耗電量。根據(jù)以上需求,設(shè)計用電負(fù)荷分解模型如下:
其中,式(1)和(2)分別是在t時刻的用電總負(fù)荷的有功總功率以及無功總功率,式(3)中變量表示電器的工作狀態(tài),是布爾型變量。值得注意的是,在該模型中,式(1)和(2)的PL(t)和QL(t)都是已知量,是由實際中實測得到的;用電負(fù)荷分解的目標(biāo)是每個用電設(shè)備的有功功率和無功功率;工作狀態(tài)監(jiān)測和辨識的目標(biāo)是用戶每個用電設(shè)備的工作狀態(tài)標(biāo)志;用電負(fù)荷分解的目標(biāo)以及工作狀態(tài)監(jiān)測和辨識的標(biāo)志均為未知量;用電設(shè)備在t時刻僅能表現(xiàn)出一種工作狀態(tài),還有總負(fù)荷不存在用電設(shè)備的情況,所以式(3)的約束條件必須要滿足該模型才能成立。
對模型求解是為了估計用電設(shè)備功率和辨識用電設(shè)備工作狀態(tài)。當(dāng)已知用電設(shè)備工作狀態(tài)時,常用分解法和差量估計法估計用電設(shè)備的用電功率,其中分解法是由公式直接估計每種用電設(shè)備的用電功率,差量估計法是在滿足一定條件的基礎(chǔ)上,由單位時間內(nèi)的負(fù)荷功率變化量對用電設(shè)備的用電估計進(jìn)行估計。辨識用電設(shè)備工作狀態(tài)時,要明確LS是由何種工作狀態(tài)產(chǎn)生的,還要確定在當(dāng)前的用電總負(fù)荷中確實有LS集合的一個子集存在。對于不同類型的LS,其處理思路和方法往往有所不同,本文暫不贅述。
在對檢測性能進(jìn)行評價時,本文選用了以下指標(biāo):在估計用電設(shè)備的用電功率時,用到了功率檢測絕對誤差、功率監(jiān)測相對誤差以及功率監(jiān)測絕對值,這些每一項指標(biāo)都分為有功功率誤差以及無功功率誤差;在辨識用電設(shè)備工作狀態(tài)時,用到了用電設(shè)備的準(zhǔn)確辨識率、漏檢率、錯檢率以及用電設(shè)備工作狀態(tài)賺準(zhǔn)確辨識率。
本文選定某小區(qū)的600戶用戶作為實驗數(shù)據(jù)來源,首先采集了用戶的用電信息數(shù)據(jù),然后運用并行K-means算法完成用戶的分類。根據(jù)用電規(guī)律來看,共可分為五類如下表所示,分別命名為空置房用戶(A類)、老人家庭(B類)、上班族家庭(C類)、老人+上班族家庭(D類)以及商業(yè)用戶(E類),其中A類用戶的特點是用電量較低,波動不明顯;B類用戶的特點是白天用電量穩(wěn)定,用電量下降趨勢出現(xiàn)時段較早;C類用戶的特點是有明顯的波峰和波谷的用電量,夜晚用電量較多而且用電量下降趨勢出現(xiàn)時段較晚;D類用戶的特點是B、C兩類用戶特點的綜合;E類用戶全天都處在較高用電量的狀態(tài)。
表 用戶分類及用電特征
在云計算平臺基礎(chǔ)上探討了并行K-means算法,綜合提出多個電力特征,通過特征權(quán)重的計算,對用電用戶進(jìn)行分類,發(fā)現(xiàn)所用聚類算法達(dá)到了90%以上的準(zhǔn)確率。從模型出發(fā)分析了模擬結(jié)果,能很好地把不同用電設(shè)備處在何種工作狀態(tài)辨識出來,適用于用戶電力負(fù)荷的分解,證明基于云計算的聚類算法的用戶用電行為分析模型是行之有效的。
[1]馮曉蒲, 張鐵峰. 基于實際負(fù)荷曲線的電力用戶分類技術(shù)研究[J]. 電力科學(xué)與工程, 2010, 26(9): 18-22.
[2]王璨, 馮勤超. 基于價值評價的電力用戶分類研究[J]. 價值工程, 2009(5): 64-66.
[3]李培強, 李欣然, 陳輝華, 等. 基于模糊聚類的電力負(fù)荷特性的分類與綜合[J]. 中國電機工程學(xué)報, 2005, 25(24): 73-78.
[4]阮文駿, 王蓓蓓, 李揚, 等. 峰谷分時電價下的用戶響應(yīng)行為研究[J]. 電網(wǎng)技術(shù), 2012, 36(7): 86-92.
[5]孫燕花, 李杰, 李建. 基于CURE算法的網(wǎng)絡(luò)用戶行為分析[J]. 計算機技術(shù)與發(fā)展, 2011, 21(9): 35-38.